Dispense - Università del Salento

Università del Salento
FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di Laurea in Fisica
INTRODUZIONE ALLA FISICA MODERNA
ROSARIO ANTONIO LEO
Anno Accademico 2010/2011
INDICE
nozioni elementari. richiami
vii
1
Punto materiale
vii
1.1
Esempio: pendolo semplice
2
Sistemi di particelle
xi
viii
i meccanica analitica
1
1 principio di d’alembert ed equazioni di lagrange
3
1.1 Vincoli
3
1.1.1 Definizioni
3
1.1.2 Classificazione dei vincoli
3
1.2 Gradi di libertà e coordinate lagrangiane
4
1.3 Principio di d’Alembert ed equazioni di Lagrange
4
1.3.1 Esempi nel caso statico
8
1.3.2 Esempio nel caso dinamico
9
1.4 Potenziali generalizzati e funzioni di dissipazione
10
1.4.1 Potenziali generalizzati
10
1.4.2 Equazioni di Lagrange in presenza di forze non derivabili
da un potenziale
11
1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo elettromagnetico
12
2 principio variazionale di hamilton ed equazioni di lagrange
17
2.1 Principio di Hamilton
17
2.2 Applicazioni del calcolo delle variazioni
21
2.2.1 Cammino più breve fra due punti in un piano
21
2.2.2 Il problema della brachistòcrona
23
2.3 Leggi di conservazione
26
2.3.1 Coordinate cicliche
26
2.3.2 Funzione energia
28
3 applicazioni delle equazioni di lagrange
31
3.1 Problema dei due corpi
31
3.1.1 Movimento in un campo centrale
32
3.1.2 Il problema di Keplero
36
3.2 Piccole oscillazioni
40
3.2.1 Impostazione del problema
40
3.2.2 Riepilogo
44
3.2.3 Osservazioni
44
3.2.4 Un particolare problema
45
4 formalismo hamiltoniano
51
4.1 Equazioni di Hamilton
51
iii
Indice
4.1.1 Un esempio
56
Notazione simplettica
57
Coordinate cicliche e metodo di Routh
58
Principio variazionale di Hamilton modificato
61
Parentesi di Poisson
62
Trasformazioni canoniche
64
Equazioni di Hamilton-Jacobi
73
Variabili angolo-azione nel caso unidimensionale
76
4.8.1 Esempio: l’oscillatore armonico unidimensionale
Riferimenti bibliografici della parte i
79
4.2
4.3
4.4
4.5
4.6
4.7
4.8
ii
76
relatività ristretta e introduzione alla meccanica quantistica
81
5 relatività speciale
83
5.1 Trasformazioni di Lorentz
83
5.1.1 Premessa
83
5.1.2 Concetto di evento
83
5.1.3 Principio di inerzia
84
5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz
84
5.2 Alcune conseguenze delle trasformazioni di Lorentz
90
5.2.1 Legge di trasformazione delle velocità
90
5.2.2 Contrazione delle lunghezze
92
5.2.3 Dilatazione dei tempi
93
5.3 Lo spazio di Minkowski
94
5.4 Quadrivelocità e quadriaccelerazione
98
5.5 Dinamica relativistica 100
5.6 Energia cinetica e momenti 101
5.7 Quadrimomento, tensore momento angolare 103
5.8 Equazioni del moto 104
5.9 Meccanica analitica relativistica (cenni) 105
5.9.1 Carica in moto in un campo elettromagnetico 108
5.10 *L’interferometro di Michelson e Morley 110
6 introduzione alla meccanica quantistica
113
6.1 *Il corpo nero 113
6.2 Effetto fotoelettrico 116
6.3 Effetto Compton 118
6.4 Onde di materia di de Broglie 119
Riferimenti bibliografici della parte ii
123
iii appendici
125
a la successione di fibonacci
b la trasformata di legendre
b.1 Definizione 129
c simbolo di levi-civita
133
iv
127
129
Indice
d calcolo della costante di radiazione
e note sulle unità di misura
137
f costanti fisiche fondamentali
139
Riferimenti bibliografici delle appendici 141
Indice analitico
143
135
v
N O Z I O N I E L E M E N TA R I . R I C H I A M I
1
punto materiale
L’idea di punto materiale è uno dei concetti di base della meccanica analitica. Il
punto materiale è caratterizzato dalla sua massa. La posizione di un punto materiale in un sistema di riferimento Oxyz, supposto inerziale salvo avviso contrario,
è determinata dal raggio vettore r = x x̂ + yŷ + zẑ. Definiamo velocità
v=
dr
= ẋ x̂ + ẏŷ + żẑ,
dt
quantità di moto
p = mv,
e accelerazione
a=
d2 r
dv
= 2.
dt
dt
Sappiamo che, in un sistema di riferimento inerziale, valgono i principi della
dinamica. Se F è la forza risultante agente sulla particella di massa m si ha che,
per il secondo principio della dinamica,
F=
dp
dv
=m
= ma,
dt
dt
(1)
con m supposta costante rispetto al tempo.
Supponiamo che la particella sia libera. Allora x (t), y(t), z(t) sono tra loro
indipendenti. Se F = F (r, v, t) = F ( x, y, z; ẋ, ẏ, ż; t) dalle (1) otteniamo:
m ẍ (t) = Fx ( x, y, z; ẋ, ẏ, ż; t) ,
mÿ(t) = Fy ( x, y, z; ẋ, ẏ, ż; t) ,
(2)
mz̈(t) = Fz ( x, y, z; ẋ, ẏ, ż; t) .
Assegnate le condizioni iniziali r (0) = r0 e v(0) = v0 , se in un intorno di (r0 , v0 , 0)
le funzioni Fx , Fy e Fz sono “buone” (per esempio sono lisce, cioè sono di classe
C ∞ ), allora il sistema di equazioni (2) per t > 0 ammette, almeno in un intorno
di (r0 , v0 , 0), un’unica soluzione. Viene così soddisfatto, almeno localmente, il
principio deterministico newtoniano. Le equazioni (2) sono dette equazioni del
moto.
Osservazione. La quantità di moto si conserva, cioè p è costante, se F = 0 identicamente.
vii
nozioni elementari. richiami
Definiamo momento angolare della particella rispetto a O
LO = r × p = mr × v.
(3)
Definiamo momento della forza F (o momento torcente) rispetto al punto O
dLO
dp
=r×
= r × F ≡ NO .
dt
dt
(4)
Dalla (4) si vede che il momento angolare si conserva, cioè LO è costante, se
NO = 0 identicamente. Per esempio se consideriamo F forza centrale tale che
il centro della forza è O, allora NO = 0 e quindi LO è costante. Il momento
angolare della particella rispetto a un punto O0 individuato rispetto a O dal vettore
posizione rO0 è dato da
LO0 = (r − rO0 ) × p.
Si vede facilmente che
dLO0
dr 0
dr 0
= (r − rO0 ) × F − O × p = NO0 − O × p ,
dt
dt
dt
dove NO0 è il momento delle forze rispetto a O0 .
Se F è una forza conservativa allora F = −∇U (r ), dove U (r ) è l’energia
potenziale.
Indichiamo con T = mv2 /2 l’energia cinetica della particella. Sappiamo che se F è
una forza conservativa vale il principio di conservazione dell’energia meccanica:
T + U = costante.
Ricordiamo che vale, anche se la forza non è conservativa, il teorema dell’energia
cinetica:
L=
Z B
A
F · dr =
1 2 1 2
mv − mv = TB − TA .
2 B 2 A
1.1 Esempio: pendolo semplice
Studiamo il moto del pendolo in figura 1. Le forze agenti su m sono
T + P = ma.
La componente radiale della risultante è uguale a
T − mg cos θ = m
v2
,
l
mentre la componente trasversa è
−mg sin θ = maT
viii
1 punto materiale
y
l
θ
T
m
U=0
P
x
Figura 1: Il pendolo semplice.
dove aT è la componente trasversa dell’accelerazione. In generale, per un moto
nel piano abbiamo, in coordinate polari:
r = rr̂,
d r̂
dr
= ṙr̂ + r
= ṙr̂ + r θ̇ n̂,
v=
dt
dt
dv
d
a=
= (ṙr̂ + r θ̇ n̂) = r̈r̂ + ṙ θ̇ n̂ + ṙ θ̇ n̂ + r θ̈ n̂ − r θ̇ 2 r̂ =
dt
dt
= (r̈ − r θ̇ 2 )r̂ + (r θ̈ + 2ṙ θ̇ )n̂.
Nel caso particolare del pendolo semplice r = l = costante, quindi l’accelerazione
trasversa è data da:
aT = l θ̈ n̂ = − g sin θ n̂,
da cui ricaviamo
g
θ̈ + sin θ = 0.
l
(5)
Questa è una equazione differenziale non lineare e la soluzione è una funzione ellittica. L’equazione diventa lineare se supponiamo che le oscillazioni siano piccole
in modo da poter porre sin θ ≈ θ. In questo caso risulta:
g
θ̈ + θ = 0.
l
La soluzione di questa equazione è
θ = θ0 cos(ωt − ϕ0 )
dove θ0 e ϕ0 sono determinati dalle condizioni iniziali, mentre ω =
pendolo oscilla con periodo
s
l
2π
= 2π
.
T=
ω
g
p
g/l. Il
ix
nozioni elementari. richiami
Nel caso in cui le oscillazioni non siano piccole, si dimostra che il periodo del
pendolo è dato da
s l
32
1
2 θm
4 θm
+ 2 2 sin
+··· ,
1 + 2 sin
T = 2π
g
2
2
2 4
2
dove θm è l’ampiezza angolare delle oscillazioni.
L’equazione del moto del pendolo può essere ricavata anche nel modo seguente:
x = l cos θ
=⇒
y = l sin θ
ẋ (t) = −l θ̇ sin θ
.
ẏ(t) = l θ̇ cos θ
(6)
Allora v2 (t) = ẋ2 (t) + ẏ2 (t) = l 2 θ̇ 2 . Applicando il principio di conservazione
dell’energia abbiamo:
E=
1 2
1
mv (t) + mgl (1 − cos θ (t)) = ml 2 θ̇ 2 + mgl (1 − cos θ (t)).
2
2
Poiché E = costante deve risultare
dE
g
= ml 2 θ̇ θ̈ + mgl θ̇ sin θ = ml 2 θ̇ θ̈ + sin θ = 0
dt
l
da cui
θ̈ +
g
sin θ = 0,
l
cioè la (5). In generale θ̈ 6= 0.
Il moto del pendolo può ancora essere dedotto in questo modo. Abbiamo
LO = r × mv = m(l cos θ x̂ + l sin θ ŷ) × (−l θ̇ sin θ x̂ + l θ̇ cos θ ŷ) =
= ml 2 θ̇ ẑ.
L’unico contributo al momento torcente è quello della forza peso, quindi
NO = r × P = (l cos θ x̂ + l sin θ ŷ) × (mg x̂) = −lmg sin θ ẑ.
Dunque, ricordando la (4), abbiamo:
dL0
dml 2 θ̇
dLO
=
ẑ =
ẑ = ml 2 θ̈ ẑ = −lmg sin θ ẑ
dt
dt
dt
da cui
θ̈ +
g
sin θ = 0,
l
cioè di nuovo la (5).
x
2 sistemi di particelle
Esercizi
1. Studiare il moto di una particella di massa m soggetta alla forza
F = −kr − αv
(k, α > 0)
dove r vettore posizione della particella e v velocità, con le condizioni iniziali
r (0) = r0 6= 0 e v(0) = v0 k r0 .
2. Studiare il moto di una particella di massa m e carica q in un campo magnetico B uniforme e costante. Siano r (0) = r0 e v(0) = v0 6= 0.
3. Studiare il moto di una particella di massa m e carica q in un campo elettrico
E e in un campo magnetico B, uniformi e costanti e tra loro ortogonali.
2
sistemi di particelle
Supponiamo di avere un sistema di N particelle puntiformi. Sia Oxyz il sistema di
riferimento (inerziale). Siano mi e ri rispettivamente la massa e il vettore posizione
dell’i-esima particella. Definiamo centro di massa
rCM =
∑iN=1 mi ri
,
M
con M = ∑iN=1 mi . Detta inoltre vi = dri /dt la velocità dell’i-esima particella, la
velocità del centro di massa sarà:
vCM =
∑iN=1 mi vi
.
M
Definiamo infine la quantità di moto
pCM =
N
∑ mi vi = MvCM .
i =1
Osserviamo che la quantità di moto è una grandezza additiva. Ogni particella del
sistema interagisce con le altre particelle e con il mondo esterno. Sia Fji la forza
che la j-esima particella ( j 6= i ) esercita sulla i-esima. Se vale la forma debole del
principio di azione e reazione allora
Fij + Fji = 0.
Per la seconda legge della dinamica
N
d pi
(e)
= Fi = Fi + ∑ Fji ,
dt
j =1
j 6 =i
xi
nozioni elementari. richiami
(e)
dove Fi è la forza totale agente sulla i-esima particella, Fi è la forza totale esterna
agente sulla i-esima particella e ∑ N
j=1,j6=i Fji è la forza totale interna agente sulla
N
N
i-esima particella. Poiché ∑i=1 ∑ j=1,j6=i Fji = 0 allora
N
N
d pCM
d pi
(e)
=∑
= ∑ Fi = F (e) ,
dt
dt
i =1
i =1
dove F (e) è la risultante delle forze esterne. Se F (e) = 0 allora pCM è costante e
quindi il centro di massa si muove di moto rettilineo uniforme, assumendo che la
massa M sia costante. Definiamo momento angolare del sistema di N particelle
puntiformi rispetto a O
LO =
N
∑ ri × pi .
i =1
Si ricava banalmente che
N
dLO
= ∑ ri × Fi = NO .
dt
i =1
Osserviamo
che se vale la forma forte del principio di azione e reazione, cioè se
ri − r j × Fji = 0 ∀i, j 6= i, allora
NO =
N
(e)
∑ ri × Fi
i =1
(e)
= NO .
(e)
Se NO = 0 allora LO è costante.
Sia ri0 il vettore posizione dell’i-esima particella rispetto al centro di massa, cioè
si ha ri0 = ri − rCM . Allora
LO =
N
∑ (rCM + ri − rCM ) × pi = rCM × pCM + LCM .
i =1
Definiamo energia cinetica del sistema di N particelle
T=
N
1
∑ 2 mi v2i .
i =1
Vale ancora il teorema dell’energia cinetica:
L=
N
∑
Z 2
i =1 1
Fi · dri = T2 − T1 ,
dove 1 e 2 sono rispettivamente le configurazioni iniziale e finale del sistema.
Osserviamo che
N
∑
Z 2
i =1 1
xii
Fi · dri =
N
∑
Z 2
(e)
i =1 1
Fi
N
N
· dri + ∑ ∑
Z 2
i =1 j =1 1
j 6 =i
Fji · dri
2 sistemi di particelle
e inoltre
Fji · dri + Fij · dr j = Fji · dri − dr j = Fji · dr ji
con Fji · dr ji 6= 0 in generale.
Se tutte le forze sono conservative allora
L=
N
∑
i =1
(e)
Ui
(e)
(1) − Ui
(2)
+
1 N Uij (1) − Uij (2) .
∑
2 i,j=1
j 6 =i
Vale il principio di conservazione dell’energia meccanica:
N
(e)
T + U = T + ∑ Ui
+
i =1
1 N
Uji = costante.
2 i,j∑
=1
i6= j
Esercizi
1. Dimostrare che
dLCM
= NCM ,
dt
con LCM = ∑iN=1 (ri − rCM ) × pi e NCM = ∑iN=1 (ri − rCM ) × Fi .
2. Dimostrare che
LCM =
N
∑ (ri − rCM ) × pi0 ,
i =1
con pi0 = mi (vi − vCM ).
xiii
Parte I
MECCANICA ANALITICA
1
P R I N C I P I O D I D ’ A L E M B E RT E D E Q U A Z I O N I D I L A G R A N G E
1.1
vincoli
1.1.1 Definizioni
Fissato un sistema di riferimento inerziale, la posizione di una particella puntiforme è, a ogni istante, individuata dal vettore r (t). La particella è libera se non
è soggetta ad alcuna condizione che ne limiti la traiettoria; in caso contrario si
dice che essa è vincolata. Allo stesso modo per un sistema di N particelle, se
tutte le particelle che costituiscono il sistema sono libere, il sistema è detto libero;
altrimenti si dice che è vincolato.
La presenza di vincoli comporta l’introduzione di forze che agiscono sulle particelle limitandone la mobilità. Queste forze sono dette forze vincolari o reazioni
vincolari. Chiameremo attive le forze che non sono dovute a vincoli.
1.1.2 Classificazione dei vincoli
Classifichiamo i vincoli:
• In base alla forma delle relazioni che legano le coordinate delle particelle:
– vincoli olònomi: possono essere espressi da relazioni del tipo
f (r1 , r2 , . . . , r N , t) = 0.
(1.1)
Il sistema si dirà, in tal caso, olonomo. Per esempio:
∗ una particella che si muove nel piano xy lungo la retta y = mx + q;
2
∗ il corpo rigido: le reazioni vincolari sono del tipo kri − r j k − c2ij = 0
(la distanza tra due punti generici del corpo rigido è costante);
– vincoli anolònomi: non possono essere espressi da relazioni del tipo (1.1). Tali vincoli possono essere espressi da vincoli di diseguaglianza o equivalentemente da vincoli di uguaglianza in cui compaiono
anche le velocità. Esempio:
∗ particella vincolata a stare all’interno di una sfera di centro O e
raggio a. In tal caso il vincolo si esprime con kr k2 − a2 < 0.
• In base alla dipendenza dal tempo:
– vincoli scleronomi: non dipendono dal tempo;
– vincoli reonomi: dipendono dal tempo. Per esempio:
3
principio di d’alembert ed equazioni di lagrange
∗ una particella che si muove su una retta che ruota con velocità
angolare ω avrà un’equazione del tipo y = tan(ωt) x + q.
• In base al tipo di reazione vincolare
– vincoli lisci: la reazione vincolare è sempre normale al vincolo. Per
esempio:
∗ se il vincolo olonomo è una superficie di equazione f (r, t), la reazione vincolare ϕ sarà parallela al gradiente di f : ϕ = µ(t)∇ f ;
– vincoli scabri: la reazione vincolare ha una componente tangenziale al
vincolo (sono presenti forze di attrito).
1.2
gradi di libertà e coordinate lagrangiane
La configurazione di un sistema libero formato da N particelle è definita dagli N
vettori posizione ri (t), con i = 1, . . . , N, ed è quindi individuata, in uno spazio
tridimensionale, da 3N quantità scalari o coordinate indipendenti.
Definiamo numero di gradi di libertà del sistema il minimo numero di coordinate indipendenti in grado di individuare la configurazione. Secondo questa
definizione un sistema libero di N particelle in uno spazio tridimensionale ha 3N
gradi di libertà. In un sistema vincolato le coordinate non sono tra loro indipendenti. Se i vincoli sono olonomi e sono espressi mediante k equazioni del tipo (1.1),
allora il numero di coordinate indipendenti sarà n = 3N − k e quindi si avranno
n gradi di libertà. Possiamo pertanto introdurre n coordinate indipendenti che
tengano conto dei vincoli. Siano q1 , q2 , . . . , qn tali coordinate. Esse non hanno in
generale le dimensioni di una lunghezza e non possono essere raggruppate per
formare le tre componenti di un vettore.
Per esempio, si consideri un pendolo nel piano. Il sistema avrebbe due gradi
di libertà se non fosse vincolato; dato che la distanza tra la particella e l’origine è
fissata uguale a l si ha invece un solo grado di libertà. Si può allora individuare
lo stato del sistema in ogni istante utilizzando una sola coordinata quale, per
esempio, l’angolo θ.
È possibile esprimere i vettori posizione mediante le nuove coordinate tramite
le trasformazioni
r i = r i ( q1 , q2 , . . . , q n , t )
(i = 1, . . . , N ).
Le coordinate qi , con i = 1, . . . , n, sono dette coordinate lagrangiane o generalizzate
del sistema. Esse, ovviamente, non sono uniche.
1.3
principio di d’alembert ed equazioni di lagrange
Definiamo spostamento virtuale infinitesimo di un sistema un cambiamento di configurazione relativo a una variazione δri delle coordinate, compatibile con le forze
4
1.3 principio di d’alembert ed equazioni di lagrange
e i vincoli a cui il sistema è sottoposto a un dato istante t. Chiamiamo tale spostamento virtuale per distinguerlo da uno spostamento reale dri in cui si considera
un intervallo dt nel quale variano forze e vincoli.
Consideriamo un sistema di N particelle. Supponiamo che il sistema sia in
equilibrio, cioè che ogni particella del sistema è in equilibrio. Allora
Fi = 0 =⇒ Fi · δri = 0 =⇒
N
δL =
∑ Fi · δri = 0,
(1.2)
i =1
con i = 1, . . . , N, dove δL è il lavoro virtuale infinitesimo. Le Fi sono le risultanti
di tutte le forze agenti sull’i-esima particella (interazione con l’Universo, con le
(a)
(a)
altre particelle, forza vincolare). Se poniamo Fi = Fi + Φi , dove Fi e Φi sono rispettivamente la forza attiva totale e la forza vincolare agenti sulla i-esima
particella, la (1.2) diventa:
N
δL =
(a)
∑ Fi
i =1
N
· δri + ∑ Φi · δri = 0.
(1.3)
i =1
Assumeremo d’ora in avanti che il lavoro virtuale delle forze vincolari sia nullo, cioè ∑iN=1 Φi · δri = 0, e che i vincoli siano olonomi bilaterali e lisci. Allora
possiamo scrivere la (1.3) come
N
(a)
∑ Fi
i =1
· δri = 0,
(1.4)
che è il principio dei lavori virtuali. Osserviamo che i δri , con i = 1, . . . , N, non sono
(a)
in generale linearmente indipendenti e quindi i Fi non sono automaticamente
nulli.
Siano q1 , q2 , . . . , qn le coordinate lagrangiane del sistema scelte. Allora
r i = r i ( q1 , q2 , . . . , q n , t ) ,
n
δri =
∂ri
∑ ∂qk δqk ,
(1.5a)
(1.5b)
k =1
con i = 1, . . . , N. Supponendo che il lavoro virtuale delle forze vincolari sia nullo
si ha
!
N
N
n
n
N
∂r
∂r
(a)
(a)
(a)
i
i
δL = ∑ Fi · δri = ∑ Fi · ∑
δqk = ∑ ∑ Fi ·
δqk =
∂q
∂q
k
k
i =1
i =1
k =1
k =1 i =1
n
=
( a)
∑ Qk
k =1
δqk ,
dove
(a)
Qk =
N
(a)
∑ Fi
i =1
·
∂ri
∂qk
(k = 1, . . . , n)
(1.6)
5
principio di d’alembert ed equazioni di lagrange
sono dette forze generalizzate (attive). Poiché le δqk sono indipendenti si ha
(a)
δL = 0 =⇒ Qk = 0
(k = 1, . . . , n).
(a)
Si può dimostrare che Qk = 0 con k = 1, . . . , n è condizione necessaria e
sufficiente per l’equilibrio, in presenza di vincoli olonomi bilaterali lisci.
La relazione (1.4) è applicabile solo al caso statico. Se si vuole applicare il
principio dei lavori virtuali anche al caso di moto del sistema, bisogna partire
dalle N equazioni del moto d pi /dt = Fi ⇐⇒ Fi − d pi /dt = 0 per i = 1, . . . , N.
Se continuiamo ad assumere che le forze vincolari non compiono lavoro virtuale,
la (1.4) diventa:
N
∑
i =1
(a)
Fi
d pi
−
dt
· δri = 0.
(Principio di d’Alembert) (1.7)
Osserviamo che le forze vincolari non compaiono esplicitamente.
Indichiamo d’ora in poi con Fi la forza attiva totale agente sull’i-esima particella,
togliendo l’apice (a). Come nel caso statico occorre ottenere un’espressione che
contenga solo gli spostamenti virtuali delle coordinate generalizzate (che sono
indipendenti). Partiamo, come nel caso statico, dalle trasformazioni
r i = r i ( q1 , . . . , q n , t )
n
δri =
vi =
(i = 1, . . . , N )
∂ri
∑ ∂qk δqk
k =1
n
dri
∂r
∂r
= ∑ i q̇k + i .
dt
∂q
∂t
k
k =1
(1.8)
Come prima abbiamo
N
n
i =1
k =1
∑ Fi · δri = ∑ Qk δqk ,
dove Qk = ∑iN=1 Fi · ∂ri /∂qk . Osserviamo che le qk non hanno necessariamente le dimensioni di una lunghezza, così come le Qk non hanno in generale le
dimensioni di una forza. Consideriamo ora
!
N
n
N
dvi ∂ri
d pi
∑ dt · δri = ∑ ∑ mi dt · ∂qk δqk =
i =1
k =1 i =1
( (1.9)
)
n
N
d
∂ri
d ∂ri
mi vi ·
=∑ ∑
− mi vi ·
δqk .
dt
∂qk
dt ∂qk
k =1 i =1
Osserviamo che dalla (1.8) si ricava
∂vi
∂ dri
∂r
=
= i.
∂q̇k
∂q̇k dt
∂qk
6
(1.10)
1.3 principio di d’alembert ed equazioni di lagrange
Inoltre, in analogia con la (1.8) si ha
n
∂2 r i
∂2 r i
∑ ∂qk ∂q j q̇ j + ∂qk ∂t =
j =1
d ∂ri
.
=
dt ∂qk
∂vi
=
∂qk
n
∂
∑ ∂q j
j =1
∂ri
∂qk
∂
q̇ j +
∂t
∂ri
∂qk
=
(1.11)
In base a queste osservazioni possiamo scrivere:
( )
N
n
N
d pi
∂vi
∂vi
d
∑ dt · δri = ∑ ∑ dt mi vi · ∂q̇k − mi vi · ∂qk δqk =
i =1
k =1 i =1
( "
#
)
n
∂ N 1
∂ N 1
d
2
2
mi vi
−
mi vi
δqk =
=∑
dt ∂q̇k i∑
2
∂qk i∑
2
=1
=1
k =1
n d ∂T
∂T
=∑
−
δqk ,
dt ∂q̇k
∂qk
k =1
dove T = ∑iN=1 mi v2i /2. Allora il principio di d’Alembert è nel nostro caso equivalente alla relazione
n ∂T
d ∂T
∑ dt ∂q̇k − ∂qk − Qk δqk = 0.
k =1
Dato che gli spostamenti virtuali infinitesimi δqk , con k = 1, . . . , n, sono indipendenti, possiamo scrivere n equazioni del moto
d ∂T
∂T
−
= Qk .
(1.12)
dt ∂q̇k
∂qk
Se supponiamo che le forze attive siano tutte conservative e derivino da un unico
potenziale U, si ha Fi = −∇i U (con ∇i = (∂/∂xi , ∂/∂yi , ∂/∂zi )) e quindi
Qk =
N
∂ri
∑ Fi · ∂qk
i =1
N
= − ∑ ∇i U ·
i =1
∂ri
∂U
=−
.
∂qk
∂qk
Tenendo presente che U dipende solo da q e non da q̇ (cioè ∂U/∂q̇k = 0; k =
1, . . . , n), le n equazioni del moto (1.12) possono essere scritte nel modo seguente:
d
∂
∂
(T − U ) −
( T − U ) = 0.
dt ∂q̇k
∂qk
Definendo
L = T−U
lagrangiana del sistema, possiamo scrivere le equazioni di Lagrange:
d
∂
∂L
L −
= 0.
dt ∂q̇k
∂qk
(1.13)
(1.14)
7
principio di d’alembert ed equazioni di lagrange
Osservazione. Se consideriamo F = F (q, t) funzione di classe opportuna, si può
dimostrare che L0 (q, q̇, t) = L(q, q̇, t) + dF/dt è un’altra funzione lagrangiana che
porta alle stesse equazioni del moto.1
Osservazione. Le equazioni di Lagrange possono essere ancora scritte nella forma
usuale se U = U (q, q̇, t) e
∂U
d ∂U
Qk = −
+
.
(1.15)
∂qk
dt ∂q̇k
La funzione U è detta potenziale generalizzato, o potenziale dipendente anche
dalle velocità e dal tempo. La funzione lagrangiana può ancora essere definita
come L = T − U.
1.3.1 Esempi nel caso statico
Determiniamo le condizioni di equilibrio del pendolo semplice (vedi figura 1 a
pagina ix). Il sistema ha un solo grado di libertà e l’unica forza attiva è la forza
peso P, quindi
r = l cos θ x̂ + l sin θ ŷ,
∂
∂
δL = P · δr = P ·
(l cos θ ) x̂ + (l sin θ )ŷ δθ =
∂θ
∂θ
= mg x̂ · (−l sin θ x̂ + l cos θ ŷ)δθ = −mgl sin θδθ
Q = −mgl sin θ = 0 =⇒ sin θ = 0 =⇒ θ = 0
oppure
θ = π.
Consideriamo ora il punto materiale P di massa m in figura 1.1 vincolato senza
attrito su una circonferenza di raggio R e centro O, posto in un piano verticale.
La particella è connessa al punto più alto mediante una molla di costante elastica
k e lunghezza a riposo nulla. Anche questo sistema ha un solo grado di libertà.
Abbiamo
x P = R sin θ
,
y P = R cos θ
∂x p
∂y p
δr P =
x̂ +
ŷ δθ = R(cos θ x̂ − sin θ ŷ).
∂θ
∂θ
La forza peso è data da P = mgŷ. Inoltre r A = − Rŷ, quindi r P − r A = R sin θ x̂ +
R(1 + cos θ )ŷ. Pertanto la forza elastica agente sulla particella è Fel = −k (r P −
r A ) = −kR[sin θ x̂ + (1 + cos θ )ŷ]. Dunque:
P · δr P = −mgR sin θδθ,
Fel · δr P = −kR2 [sin θ cos θ − sin θ (1 + cos θ )]δθ = kR2 sin θδθ.
1 Si è qui utilizzata la notazione, che ricorrerà per brevità in seguito, q = (q1 , q2 , . . . , qn ) per indicare
l’ennupla delle coordinate generalizzate; tuttavia bisogna tenere sempre presente che tale ennupla
non è, in generale, un vettore (basti pensare che, come già osservato, le qi possono avere anche
dimensioni diverse).
8
1.3 principio di d’alembert ed equazioni di lagrange
A
k
x
O
θ
R
P
y
Figura 1.1: Pendolo collegato a una molla.
La forza generalizzata attiva è:
Q = −mgR sin θ + kR2 sin θ = R sin θ (kR − mg).
La condizione di equilibrio si ha per Q = 0 cioè:
1. sin θ = 0, vale a dire θ = 0 oppure θ = π;
2. ∀θ ∈ [0, 2π ] se mg = kR.
1.3.2 Esempio nel caso dinamico
Riprendiamo in considerazione il pendolo semplice (vedi figura 1 a pagina ix). Il
sistema ha un grado di libertà, quindi sarà sufficiente scrivere una sola equazione
di Lagrange. Valgono sempre le (6), dunque l’energia cinetica è data da
T=
1 2
1
1
mv = m( ẋ2 + ẏ2 ) = ml 2 θ̇ 2 ,
2
2
2
mentre l’energia potenziale è (fissando come punto a potenziale gravitazionale
nullo il punto più basso del pendolo, come mostrato in figura)
U = mgl (1 − cos θ ).
Pertanto la lagrangiana del sistema è
L = T−U =
1 2 2
ml θ̇ − mgl (1 − cos θ )
2
e l’equazione di Lagrange
ml 2 θ̈ + mgl sin θ = 0
che è equivalente alla (5).
9
principio di d’alembert ed equazioni di lagrange
1.4
potenziali generalizzati e funzioni di dissipazione
1.4.1 Potenziali generalizzati
Consideriamo una particella puntiforme di massa m e carica q in un campo
elettromagnetico E, B. Su di essa agisce la forza di Lorentz:
v
F = q E+ ×B .
(1.16)
c
Le equazioni del moto sono perciò
v
d2 r
dv
= m 2 = q E+ ×B .
m
dt
dt
c
Siano ora ϕ = ϕ( x, y, z, t) e A = A( x, y, z, t) i potenziali scalare e vettoriale
rispettivamente in modo che
E = −∇ ϕ −
1 ∂A
,
c ∂t
(1.17)
(1.18)
B = ∇ × A.
Riscriviamo la forza di Lorentz mediante le precedenti:
1 ∂A v
F = q −∇ ϕ −
+ × (∇ × A) =
c ∂t
c
1 ∂A 1
1
= q −∇ ϕ −
+ ∇( A · v) − (v · ∇) A
c ∂t
c
c
(1.19)
dove si è tenuto conto del fatto che ∇ · v = 0 e quindi v × (∇ × A) = ∇( A ·
v) − (v · ∇) A. Osserviamo ora che d A/dt = ∂ A/∂t + (v · ∇) A; inoltre dad ∇v ( A·v)
to che A non dipende da v,
= d A/dt; infine ∇v ϕ = 0 (dove ∇v =
dt
(∂/∂ ẋi , ∂/∂ẏi , ∂/∂żi )). Allora
1
1 dA
F = q −∇ ϕ − A · v −
=
c
c dt
1
d
1
(1.20)
= q −∇ ϕ − A · v +
∇v ϕ − A · v
=
c
dt
c
d ∇v U
= −∇U +
,
dt
dove U = qϕ − qA · v/c è un esempio di potenziale generalizzato, ovvero potenziale
dipendente dalle derivate rispetto al tempo delle coordinate generalizzate (che
qui corrispondono con le solite coordinate cartesiane). La funzione lagrangiana è,
allora, la seguente:
L = T−U =
1 2
q
mv − qϕ + A · v =
2
c
1
= m( ẋ2 + ẏ2 + ż2 ) − qϕ( x, y, z, t)+
2
q
+ ( ẋA x ( x, y, z, t) + ẏAy ( x, y, z, t) + żAz ( x, y, z, t)).
c
10
1.4 potenziali generalizzati e funzioni di dissipazione
Esercizi
1. Scrivere le equazioni di Lagrange di una carica puntiforme in un campo
elettromagnetico. Dimostrare che esse coincidono con le equazioni del moto
di partenza.
2. Scrivere la lagrangiana e le equazioni di Lagrange per i seguenti sistemi:
a) pendolo piano semplice;
b) pendolo piano doppio;
c) pendolo piano il cui punto di sospensione è libero di muoversi orizzontalmente su una retta liscia .
3. Due punti materiali, uno di massa m1 e l’altro di massa m2 , sono collegati
da una fune (inestensibile e di massa trascurabile) che passa attraverso un
foro in un tavolo perfettamente liscio, in modo che m1 , per t = 0, abbia un
moto circolare uniforme sulla superficie del tavolo ed m2 rimanga sospesa.
Nell’ipotesi che m2 possa muoversi solo in direzione verticale, si scriva la
lagrangiana e si ricavino le equazioni di Lagrange. Discutere la presenza di
integrali primi del moto .
Figura 1.2: Da sinistra: problema 2b, problema 2c, problema 3.
1.4.2 Equazioni di Lagrange in presenza di forze non derivabili da un potenziale
Supponiamo che su una particella puntiforme agisca anche la seguente forza
viscosa:
Fa = −(α x v x ı̂ + αy vy ̂ + αz vz k̂)
dove i coefficienti α x , αy , αz sono caratteristici del mezzo2 e ı̂, ̂, k̂ sono i versori
degli assi coordinati. Osserviamo che, se introduciamo la cosiddetta funzione di
dissipazione di Rayleigh
F=
1
(α x v2x + αy v2y + αz v2z ),
2
2 In realtà questi coefficienti dipendono oltre che dal mezzo anche dalla forma e dalle dimensioni del
corpo immerso nel fluido.
11
principio di d’alembert ed equazioni di lagrange
abbiamo che Fa = −∇v F. Più in generale se il sistema è formato da N particelle,
la forza viscosa totale è data da:
Fa = −
N
∑ (αx vkx ı̂ + αy vky ̂ + αz vkz k̂),
k =1
dove si intende vk = (vkx , vky , vkz ) è la velocità della k-esima particella. La funzione di dissipazione in questo caso è data da:
F=
1 N
(α x v2kx + αy v2ky + αz v2kz ).
2 k∑
=1
La forza viscosa agente sulla k-esima particella può ovviamente essere scritta come Fa,k = −∇vk F. Se il sistema ha n gradi di libertà e q j con j = 1, . . . , n sono le
coordinate generalizzate, le equazioni di Lagrange sono le seguenti:
d
∂L
∂L
−
= Qj
(1.21)
dt ∂q˙j
∂q j
dove le Q j sono le forze generalizzate associate alle forze viscose e non derivabili
da un potenziale, e L è la lagrangiana, scritta tenendo conto di tutte le forze
conservative. Sappiamo che:
Qj =
N
∑
k =1
Fa,k ·
N
N
∂rk
∂r
= − ∑ ∇vk F · k =
∂q j
∂q j
k =1
= − ∑ ∇vk F ·
k =1
∂F
∂vk
=− .
∂q˙j
∂q˙j
Allora in conclusione possiamo scrivere le equazioni di Lagrange (1.21) nel modo
seguente:
d
∂L
∂L
∂F
−
+
= 0.
dt ∂q˙j
∂q j
∂q˙j
Evidentemente siamo in grado di scrivere esplicitamente le equazioni del moto
conoscendo le due funzioni scalari L e F.
1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo
elettromagnetico
Siano ϕ e A i potenziali scalare e vettoriale nel campo elettromagnetico. Sappiamo
che la lagrangiana assume la forma: L = mv2 /2 − qϕ + qA · v/c. Il sistema ha tre
gradi di libertà. Operiamo le seguenti trasformazioni di gauge:
1 ∂χ(r, t)
;
c ∂t
A → A0 = A + ∇χ(r, t).
ϕ → ϕ0 = ϕ −
12
1.4 potenziali generalizzati e funzioni di dissipazione
Il campo elettromagnetico è invariante per trasformazioni di gauge. Sia ora L0 =
mv2 /2 − qϕ0 + qA0 · v/c la nuova lagrangiana. Allora:
mv2
q ∂χ q
q
− qϕ +
+ A · v + ∇χ · v =
2
c ∂t
c
c
q ∂χ q
= L+
+ ∇χ · v =
c ∂t
c
q dχ
= L+
.
c dt
L0 =
Concludendo, L0 ed L differiscono per la derivata totale rispetto al tempo di una
funzione scalare di r e di t. Le equazioni di Lagrange sono, di conseguenza,
invarianti per trasformazioni di gauge.
Problemi
1. Se L = L(q, q̇, t) è una lagrangiana per un sistema a n gradi di libertà che
verifica le equazioni di Lagrange, dimostrare che L0 = L + dF (q, t)/dt, con
F funzione arbitraria di classe opportuna, verifica anch’essa le equazioni di
Lagrange.
Dimostrazione. Osserviamo che
n
∂F (q, t)
∂F (q, t)
dF (q, t)
=∑
q̇k +
.
dt
∂q
∂t
k
k =1
Allora per j = 1, . . . , n
∂L0 (q, q̇, t)
∂L(q, q̇, t) ∂F (q, t)
=
+
∂q˙j
∂q̇ j
∂q j
∂L0 (q, q̇, t)
∂L(q, q̇, t)
∂ dF (q, t)
=
+
.
∂q j
∂q j
∂q j
dt
Supponendo che
d ∂F (q, t)
∂ dF (q, t)
=
∂q j
dt
dt ∂q j
abbiamo dunque, sempre per j = 1, . . . , n, che
d
dt
d
dt
d
dt
∂L
∂q̇ j
∂L0
∂q̇ j
∂L0
∂q̇ j
−
∂L
= 0 ⇐⇒
∂q j
−
∂ dF (q, t)
d ∂F (q, t) ∂L0
−
+
= 0 ⇐⇒
dt ∂q j
∂q j
∂q j
dt
−
∂L0
= 0.
∂q j
13
principio di d’alembert ed equazioni di lagrange
2. Siano q1 , . . . , qn un insieme di coordinate generalizzate indipendenti di un
sistema a n gradi di libertà con lagrangiana L(q, q̇, t), dove q = (q1 , . . . , qn )
e q̇ = (q̇1 , . . . , q̇n ). Si supponga di passare a un altro sistema di coordinate
generalizzate indipendenti s1 , . . . , sn per mezzo di una trasformazione puntuale qk = qk (s, t) con k = 1, . . . , n ed s = (s1 , . . . , sn ). Dimostrare che la
forma delle equazioni di Lagrange è invariante rispetto alle trasformazioni
puntuali.
Dimostrazione. Per j, k = 1, . . . , n abbiamo
q̇ j =
n
∂q j
∑ ∂si ṡi +
i =1
∂q̇ j
∂q j
∂q j
=⇒
=
∂t
∂ṡi
∂si
Ora, L = L(q(s, t), q̇(s, ṡ, t), t), dunque
∂L
=
∂sk
n
n
∂L ∂q j
∂L ∂q̇ j
+
∑ ∂q j ∂sk ∑ ∂q̇ j ∂sk
j =1
j =1
n
∂L ∂q̇ j
∂L ∂q j
=
∑ ∂q̇ j ∂ṡk ∑ ∂q̇ j ∂sk
j =1
j =1
n n
d ∂L ∂q j
∂L d ∂q j
∑ dt ∂q̇ j ∂sk + ∑ ∂q̇ j dt ∂sk =
j =1
j =1
n
n ∂L ∂q̇ j
d ∂L ∂q j
+∑
.
=∑
dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk
j =1
∂L
=
∂ṡk
d
∂L
=
dt ∂ṡk
n
In conclusione, per k = 1, . . . , n, ricordando che
d
∂L
∂L
−
=0
dt ∂q̇ j
∂q j
per j = 1, . . . , n,
d
∂L
∂L
−
=
dt ∂ṡk
∂sk
n n
n
∂L ∂q̇ j
∂L ∂q j
d ∂L ∂q j
=∑
+∑
−∑
+
dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk j=1 ∂q j ∂sk
j =1
n
n ∂L ∂q̇ j
d ∂L
∂L ∂q j
−∑
=∑
−
= 0.
∂q̇ j ∂sk
dt ∂q̇ j
∂q j ∂sk
j =1
j =1
3. Dimostrare che vale la seguente forma di Nielsen delle equazioni di Lagrange:
∂T
∂ Ṫ
−2
= Qj
∂q̇ j
∂q j
( j = 1, . . . , n)
dove T = T (q, q̇, t) è l’energia cinetica, Ṫ ≡ dT/dt e Q j è la j-esima forza
generalizzata.
14
1.4 potenziali generalizzati e funzioni di dissipazione
Dimostrazione. Partiamo dalle equazioni di Lagrange (1.12), valide anche in
presenza di forze attive generalizzate non conservative. Osserviamo che:
dT (q, q̇, t)
=
dt
n
∑
j =1
∂ Ṫ
∂T
=
∂q̇k
∂qk
=
∂T
∂qk
=
∂T
∂qk
∂T
∂T
∂T
=⇒
q̇ j +
q̈ j +
∂q j
∂q̇ j
∂t
n ∂2 T
∂2 T
∂2 T
+∑
q̇ j +
q̈ j +
=
∂q̇k ∂q j
∂q̇k ∂q̇ j
∂q̇k ∂t
j =1
n ∂
∂T
∂
∂T
∂ ∂T
+∑
q̇ j +
q̈ j +
=
∂q j ∂q̇k
∂q̇ j ∂q̇k
∂t ∂q̇k
j =1
d ∂T
+
.
dt ∂q̇k
Allora
∂ Ṫ
∂T
−2
= Qk ⇐⇒
∂q̇k
∂qk
d ∂T
∂T
∂T
+
−2
= Qk ⇐⇒
∂qk
dt ∂q̇k
∂qk
∂T
d ∂T
−
= Qk .
dt ∂q̇k
∂qk
15
P R I N C I P I O VA R I A Z I O N A L E D I H A M I LT O N E D E Q U A Z I O N I
DI LAGRANGE
2.1
principio di hamilton
Prenderemo ora in considerazione solo quei sistemi di N particelle puntiformi,
con vincoli olonomi lisci, per i quali tutte le forze attive sono derivabili da un
solo potenziale scalare generalizzato (questa richiesta è fatta solo per semplicità e
senza perdere in generalità), funzione cioè delle coordinate e delle velocità delle
particelle e del tempo. Questi sistemi sono detti monogenici. In particolare, se il
potenziale è funzione esplicita solo delle coordinate di posizione delle particelle
il sistema è detto conservativo. Vedremo fra poco, come sia possibile ottenere le
equazioni di Lagrange relative a un sistema monogenico a partire da un principio
integrale (il principio variazionale di Hamilton), il quale prende in considerazione
l’intero moto del sistema tra due istanti t0 e t1 e le “piccole” variazioni di questo
moto rispetto a quello reale. Per fare questo avremo bisogno di elementi di calcolo
delle variazioni, che cercheremo di esporre nel modo più elementare possibile,
utilizzando soltanto le tecniche familiari del calcolo differenziale.
La configurazione del sistema (olonomo e monogenico), oggetto di studio, è
supposta descritta dai valori di n coordinate generalizzate q1 , q2 , . . . , qn e corrisponde alla posizione di un punto q = (q1 , . . . , qn ) in uno spazio n-dimensionale
che, come sappiamo, è detto spazio delle configurazioni. Al variare del tempo il
punto q(t), che rappresenta il sistema, si muove nello spazio delle configurazioni
descrivendo una curva che è, ovviamente, la traiettoria del moto del sistema. Come abbiamo già accennato, il principio variazionale prende in considerazione solo
quelle traiettorie che costituiscono un insieme di traiettorie variate sincrone. In altre parole, si considerano tutti quei movimenti q = q(t) del sistema con t ∈ [t0 , t1 ],
intervallo base, tali che q(t0 ) = q(0) e q(t1 ) = q(1) . Chiameremo ammissibile un
movimento q(t) che gode di questa proprietà. Noi supporremo sempre, salvo
avviso contrario, che le funzioni siano di classe C ∞ .
In figura 2.1 sono riportate, in uno spazio delle configurazioni bidimensionale,
alcune traiettorie ammissibili, che partono dalla configurazione iniziale q(0) al
tempo t0 e arrivano alla configurazione finale q(1) al tempo t1 . Sappiamo che è
possibile introdurre per il nostro sistema (olonomo e monogenico) la funzione
lagrangiana
L = T − V,
(2.1)
dove T è l’energia cinetica del sistema e V è il potenziale generalizzato. Naturalmente si avrà
L = L (q, q̇, t) .
(2.2)
17
2
principio variazionale di hamilton ed equazioni di lagrange
q2
(1)
q2
(0)
q2
(0)
q1
(0)
q1
q1
Figura 2.1: Alcune traiettorie ammissibili in uno spazio delle configurazioni bidimensionale
Consideriamo il funzionale azione
S [q(t)] =
Z t1
t0
L (q(t), q̇(t), t) dt,
(2.3)
dove q(t) è un moto ammissibile (cioè q(t0 ) = q(0) e q(t1 ) = q(1) ). Osserviamo
che S [q(t)] ha valori in R e non è una funzione di funzione (non è una funzione
del tempo), ma un integrale di linea che dipende dal moto q(t). Il valore che
S [q(t)] assume dipende ovviamente dal moto ammissibile q(t) scelto.
Introduciamo il
Principio (variazionale di Hamilton) - Tra i moti ammissibili del sistema compresi
tra gli istanti t0 e t1 , il moto reale è quello che rende stazionaria l’azione.
Ricordiamo cosa si intende per punto stazionario di una funzione f : R → R di
classe opportuna. Si dice che x0 ∈ R è un punto stazionario di f se f 0 ( x0 ) = 0.
Un punto stazionario (o critico) di una funzione può allora essere un estremante
relativo (di massimo o di minimo) o di flesso orizzontale oppure né estremante
relativo né flesso orizzontale. Inoltre se x0 è un punto stazionario si ha
f ( x0 + ε) − f ( x0 ) = f 0 ( x0 )ε + O(ε2 ) = O(ε2 ).
In modo analogo diremo che l’azione è stazionaria lungo una certa traiettoria
se su di essa assume, a meno di infinitesimi di ordine superiore al primo, lo
stesso valore corrispondente a traiettorie che differiscono da quella considerata
per uno spostamento infinitesimo. Più precisamente se indichiamo con q(t) un
moto ammissibile che rende stazionaria l’azione e con q(t, ε) = q(t) + εh(t) una
traiettoria diversa, dipendente dal parametro ε ∈ R (assumiamo |ε| 1) e dalla
funzione vettoriale h(t) = (h1 (t), . . . , hn (t)) soggetta alla condizione
h ( t0 ) = h ( t1 ) = 0
18
(2.4)
2.1 principio di hamilton
(infatti q(t, ε) deve essere un moto ammissibile e pertanto q(t0 , ε) = q(0) e q(t1 , ε) =
q(1) ), abbiamo che
S [q(t, ε)] − S [q(t)] = O(ε2 ).
(2.5)
Vogliamo ora provare che una traiettoria ammissibile q(t) che rende stazionaria
l’azione soddisfa le equazioni di Lagrange
∂L(q, q̇, t)
d ∂L(q, q̇, t)
−
=0
(k = 1, . . . , n).
(2.6)
dt
∂q̇k
∂qk
Abbiamo infatti:
S [q(t, ε)] − S [q(t)] =
Z t1 =
L q(t) + εh(t), q̇(t) + εḣ(t), t − L (q(t), q̇(t), t) dt =
(2.7)
t0
Z t1 n ∂L (q(t), q̇(t), t)
∂L (q(t), q̇(t), t)
=
hi ( t ) +
ḣi (t) ε dt + O(ε2 ).
∑
∂qi
∂q̇i
t0 i =1
Osserviamo che
d ∂L
∂L
d ∂L
h i ( t );
ḣi (t) =
hi ( t ) −
∂q̇i
dt ∂q̇i
dt ∂q̇i
t1
Z t1
d ∂L
∂L
hi (t) dt =
hi ( t ) = 0
∂q̇i
∂q̇i
t0 dt
t0
perché valgono le (2.4). Allora la (2.7) può essere riscritta come
S [q(t, ε)] − S [q(t)] =
n Z t1 d ∂L (q(t), q̇(t), t)
∂L (q(t), q̇(t), t)
=∑
−
hi (t)ε dt + O(ε2 ).
∂q
dt
∂
q̇
t
i
i
i =1 0
(2.8)
Se imponiamo la condizione che l’azione sia stazionaria lungo q(t), valga cioè
la (2.5), e teniamo presente che hi (t), con i = 1, . . . , n, sono funzioni di classe C ∞
arbitrarie, soggette soltanto alla condizione hi (t0 ) = hi (t1 ) = 0, abbiamo
Z t1 ∂L (q(t), q̇(t), t)
d ∂L (q(t), q̇(t), t)
−
hi (t) dt = 0
(i = 1, . . . , n). (2.9)
∂qi
dt
∂q̇i
t0
Vogliamo ora provare che queste equazioni implicano che
d ∂L (q(t), q̇(t), t)
∂L (q(t), q̇(t), t)
−
=0
(i = 1, . . . , n),
∂qi
dt
∂q̇i
cioè sono soddisfatte le equazioni di Lagrange. Vale il seguente
Lemma (fondamentale del calcolo variazionale) - Se una funzione liscia f : [t0 , t1 ] →
R verifica la proprietà
Z t1
t0
f (t) g(t) dt = 0
(2.10)
per ogni funzione liscia g : [t0 , t1 ] → R, soggetta alla condizione g(t0 ) = g(t1 ) = 0,
allora f (t) = 0 ∀t ∈ [t0 , t1 ].
19
principio variazionale di hamilton ed equazioni di lagrange
Dimostrazione. Ragioniamo per assurdo e supponiamo che ∃t∗ ∈ (t0 , t1 ) in cui
f non si annulli. Senza perdere in generalità possiamo supporre f (t∗ ) > 0.
Per continuità ∃ I (t∗ ) ⊂ (t0 , t1 ), intorno di t∗ , in cui f è sempre positiva, avendo indicato con I (t∗ ) un intorno aperto di t∗ . Possiamo sempre prendere una
funzione liscia g, stante la sua arbitrarietà,
che sia positiva in I1 (t∗ ) ⊂ I (t∗ ) e
R
t
nulla altrove.1 Ne consegue che t01 f (t) g(t) dt > 0. Questo è assurdo. Allora
f (t) = 0 ∀t ∈ (t0 , t1 ) =⇒ f (t) = 0 ∀t ∈ [t0 , t1 ].
Se chiamiamo δqi (t) = εhi (t) la variazione dell’i-esima componente di q(t) e
con δS la corrispondente variazione dell’azione, relativa all’infinitesimo δq, la
relazione (2.8) può essere scritta nella forma:
n
δS =
∑
Z t1 ∂L
i =1 t0
d ∂L
−
∂qi
dt ∂q̇i
δqi (t) dt.
Questo risultato ci dice, anche per il lemma precedente, che se l’azione è stazionaria lungo q(t), cioè se δS = 0, allora valgono le equazioni di Lagrange. In modo
sintetico possiamo scrivere:
∂L(q, q̇, t)
d
δS = 0 ⇐⇒
−
∂qi
dt
∂L(q, q̇, t)
∂q̇i
=0
(i = 1, . . . , n).
Osservazione. Abbiamo visto che le equazioni di Lagrange (o di Eulero-Lagrange)
nelle ipotesi fatte (sistemi, cioè, olonomi e monogenici) discendono da una legge
generale, il principio variazionale di Hamilton. Non possiamo stabilire, a priori,
se il moto reale q(t), che soddisfa le equazioni di Lagrange, ha la proprietà di
minimizzare l’azione, anche se il principio di Hamilton è spesso detto principio
della minima azione.
Osservazione. Nel Capitolo 1 abbiamo visto che le equazioni di Lagrange sono
invarianti per la trasformazione
L0 = L +
dF
.
dt
Anche il principio variazionale di Hamilton è ancora valido se alla lagrangiana
aggiungiamo la derivata totale rispetto al tempo di un’arbitraria funzione scalare
F (q(t), t) di classe opportuna, infatti:
Z t1 dF (q(t), t)
S [q(t)] =
L(q(t), q̇(t), t) +
dt =
dt
t0
t
= S + F ( q ( t ), t ) t1 = S + F ( q ( t 1 ), t 1 ) − F ( q ( t 0 ), t 0 ),
0
0
cioè S ed S0 differiscono per un termine supplementare che si annulla quando
varia l’azione. Dunque la condizione δS0 = 0 coincide con la condizione δS = 0 e
la forma delle equazioni del moto resta immutata.
1 Osserviamo che la funzione g scelta si annulla, ovviamente, in t0 e t1 .
20
2.2 applicazioni del calcolo delle variazioni
2.2
applicazioni del calcolo delle variazioni
Possiamo utilizzare il principio variazionale per studiare le proprietà di stazionarietà o estremali di funzionali diversi dall’azione.
Supponiamo in particolare di avere una famiglia di curve in uno spazio ndimensionale, ognuna descritta da una funzione vettoriale liscia y( x ) con x ∈
[ x0 , x1 ], tutte soggette alle condizioni y( x0 ) = y(0) e y( x1 ) = y(1) , e una funzione scalare liscia U = U (y( x ), ẏ( x ), x ). Vogliamo determinare y( x ) che rende
stazionario il funzionale
J [y( x )] =
Z x1
x0
u (y( x ), ẏ( x ), x ) dx.
Notiamo che possono esserci casi più complessi, in cui per esempio U è funzione anche di derivate di ordine superiore al primo di y( x ), oppure x ∈ Rm con
m ≥ 2. La trattazione del problema può anche essere portata avanti esattamente
come nel caso dell’azione: si ricerca y( x ) che rende stazionario il funzionale J.
Non sempre è semplice stabilire poi se la funzione trovata abbia la proprietà di
minimizzare o di massimizzare J. Ricordiamo che condizione necessaria perché
y( x ) sia un minimo o un massimo locale per J è che esso sia un punto stazionario. Si arriverà ovviamente a n equazioni scalari che continueremo a chiamare di
Lagrange o di Eulero-Lagrange:
d
dx
∂u
∂ẏk
−
∂u
=0
∂yk
(k = 1, . . . , n).
2.2.1 Cammino più breve fra due punti in un piano
Siano dati A( x0 , y0 ) e B( x1 , y1 ) in un piano (vedi figura 2.2). Supponiamo che
x0 < x1 . Se indichiamo2 una generica curva regolare3 con y = y( x ) di estremi A
e B e con s l’ascissa curvilinea, abbiamo che:
q
q
ds = (dx )2 + (dy)2 = 1 + ẏ2 ( x ) dx.
In questo caso allora
J [y( x )] =
Z x1 q
x0
1 + ẏ2 ( x ) dx.
p
Ovviamente u = u(ẏ) = 1 + ẏ2 ( x ) e y( x ) è nel nostro caso una funzione scalare.
Adoperando le equazioni di Eulero-Lagrange:
d
dx
∂u
∂ẏ
−
∂u
= 0.
∂y
2 Se x0 = x1 possiamo considerare funzioni del tipo x = x (y).
3 In realtà possiamo sempre supporre che y sia liscia.
21
principio variazionale di hamilton ed equazioni di lagrange
y
B
y1
y0
A
x0
x1
x
Figura 2.2: Cammini ammessi tra due punti nel piano.
Essendo ∂u/∂y = 0 risulta
∂u
ẏ
=p
= c,
∂ẏ
1 + ẏ2
dove c è una costante
√ rispetto a x. Di conseguenza ẏ( x ) = a, con a costante
legata a c da a = c/ 1 − c2 . Quindi y( x ) = ax + b, cioè la curva che minimizza
il funzionale J è il segmento di estremi A e B. Imponendo in particolare che
y( x0 ) = y0 e y( x1 ) = y1 otteniamo le costanti di integrazione
y1 − y0
x1 − x0
x1 y0 − x0 y1
b=
.
x1 − x0
a=
Si prova facilmente, in questo caso, che y( x ), che rende stazionario J, minimizza il
funzionale. In altre parole possiamo dire che la curva che nel piano xy congiunge
A e B e ha lunghezza minima è il segmento di estremi A e B.
ε 2 x1
uẏẏ (ẏ( x ))ḣ2 ( x ) dx + O(ε3 ).
2 x0
p
Nel nostro caso uẏẏ (ẏ( x )) = 1/ (1 + ẏ2 ( x ))3 > 0. Perciò, per |ε| 1, J [y( x ) +
εh( x )] ≥ J [y( x )], cioè la funzione trovata minimizza il funzionale (se ḣ( x ) non è
identicamente nulla).
J [y( x ) + εh( x )] − J [y( x )] =
Z
Esercizi
1. Verificare che il moto reale di una particella libera e isolata rende minima
l’azione.
2. Una particella è soggetta al potenziale U ( x ) = Fx, con F costante. La particella si muove dal punto x = 0 al punto x = a nell’intervallo di tempo
[t0 , t1 ]. Si assuma che il moto della particella si possa esprimere nella forma
x (t) = A + Bt + Ct2 . Trovare i valori di A, B, C che rendono minima l’azione.
22
2.2 applicazioni del calcolo delle variazioni
A
y1
x1
x
U=0
B
y
Figura 2.3: Schema del problema della brachistocrona.
2.2.2 Il problema della brachistòcrona
Il problema della brachistòcrona può essere espresso nel modo seguente:
Problema (della brachistòcrona) - Dati due punti A e B in un piano verticale, con
A ad altezza maggiore di B, trovare tra tutti gli archi di curva che li congiungono, la
traiettoria che una particella puntiforme di massa m, con velocità iniziale nulla, deve
percorrere per andare da A a B in modo che il tempo di percorrenza sia il minimo possibile.
Per risolvere il problema poniamo l’origine degli assi in A ≡ (0, 0) e orientiamo
l’asse delle ordinate verso il basso (vedi figura 2.3). Supponiamo B ≡ ( x1 , y1 )
con x1 > 0 e y1 > 0 (se x1 = 0, cioè se B appartiene all’asse delle y il problema
è banale: la soluzione è data dal segmento AB). Le equazioni della traiettoria
(passante per i punti assegnati):
y = y( x )
y (0) = 0
( x ∈ [0, x1 ])
y ( x1 ) = y1
Consideriamo la solita ascissa curvilinea s a partire da A:
q
q
ds = (dx )2 + (dy)2 = 1 + ẏ2 ( x ) dx.
Supponiamo i vincoli olonomi e lisci. Fissiamo in y = 0 il livello 0 dell’energia
potenziale (relativa alla forza peso). Allora:
p
1 2
mv − mgy = 0 =⇒ v = 2gy,
2
dove g è l’accelerazione di gravità e v la velocità in y (notare che y > 0, v > 0 se
x ∈ (0, x1 ]).
s
ds
1 + ẏ2 ( x )
dt =
=
dx
( x ∈ (0, x1 ]).
v
2gy( x )
Poniamo
s
u(y( x ), ẏ( x )) =
1 + ẏ2 ( x )
y( x )
23
principio variazionale di hamilton ed equazioni di lagrange
quindi
p
2g
Z T
0
dt ≡ J [y( x )] =
Z x1
0
u(y( x ), ẏ( x )) dx.
Fra tutte le traiettorie, passanti per A e B, quella che rende stazionario il funzionale J (condizione necessaria per il minimo) soddisfa le equazioni di Lagrange con
x ∈ (0, x1 ]:
d
dx
∂u(y, ẏ)
∂ẏ
−
∂u(y, ẏ)
= 0.
∂y
(2.11)
Ora,
ẏ
∂u
=√ p
∂ẏ
y 1 + ẏ2
e dunque
ÿ
∂u(y, ẏ)
ẏ2
+√ p
=− √ p
2
∂ẏ
2y y 1 + ẏ
y (1 + ẏ2 )3
p
1 + ẏ2
∂u
=−
√ .
∂y
2y y
d
dx
(2.12)
(2.13)
L’equazione (2.11), per le relazioni (2.12) e (2.13), diventa, ∀ x ∈ (0, x1 ]:
p
1 + ẏ2
ẏ2
ÿ
− √ p
+√ p
+
√ = 0 ⇐⇒
2y y
2y y 1 + ẏ2
y (1 + ẏ2 )3
ÿ( x )
1
+
=0
2
1 + ẏ ( x ) 2y( x )
Moltiplicando ambo i membri per ẏ( x ) abbiamo
1 d
ẏ( x )
1 d
ẏ( x )ÿ( x )
+
= 0 ⇐⇒
ln 1 + ẏ2 ( x ) +
ln y( x ) = 0 ⇐⇒
2
1 + ẏ ( x ) 2y( x )
2 dx
2 dx
1 d
(ln(1 + ẏ2 ( x )) + ln y( x )) = 0 ⇐⇒ (1 + ẏ2 ( x ))y( x ) = c ⇐⇒
2
dx
s
s
y( x )
ẏ( x ) = 1 =⇒
c − y( x )
Z
y( x )
dy =
c − y( x )
Posto
y=
24
c
c
(1 − cos τ ) =⇒ dy = sin τ dτ
2
2
Z
dx.
(2.14)
2.2 applicazioni del calcolo delle variazioni
dove τ è un parametro (con y(τ = 0) = 0), dalla (2.14) abbiamo
s
s
0
Z τ
Z τ
c
0) c
c sin2 τ2
(
1
−
cos
τ
c
0
0
2
x=
sin
τ
dτ
=
sin τ 0 dτ 0 =
c
c
0) 2
0) 2
c
−
(
1
−
cos
τ
(
1
+
cos
τ
0
0
2
2
v
u
0
0
Z τu
Z τ
c sin2 τ2 c
sin τ2 c
0
0
t
=
sin τ dτ =
sin τ 0 dτ 0 =
τ0 2
τ0 2
2
0
0 cos
c cos 2
2
=
Z τ
0
τ0
c sin
dτ 0 =
2
2
Z τ
c
c
= (τ − sin τ ).
2
2
0
(1 − cos τ 0 ) dτ 0 =
Nota che x (0) = 0. Concludendo, le equazioni parametriche della traiettoria sono
date da:
c
x (τ ) = (τ − sin τ )
2
c
y(τ ) = (1 − cos τ )
2
con τ ∈ [0, τ1 ]. Le equazioni trovate sono quelle di una cicloide. Sostituendo i
valori delle coordinate di B si trovano dalle precedenti c e τ1 . Il sistema siffatto
ammette sempre soluzione. Rimane da provare (cosa non banale) che la soluzione
trovata minimizza il funzionale.
Possiamo tentare una soluzione del problema cambiando semplicemente punto
di vista e cercando un’espressione del tipo x = x (y). In tal caso
s
ds
1 + ẋ2
dt =
=
dy.
v
2gy
Posto
s
ϕ=
1 + ẋ2
y
risulta
p
2g
Z T
0
dt = F [ x (y)] =
Z y1
0
ϕ( x (y), ẋ (y), y) dy.
Le equazioni di Lagrange sono
d ∂ϕ
∂ϕ
−
= 0.
dy ∂ ẋ
∂x
Poiché ∂ ϕ/∂x = 0, ∂ ϕ/∂ ẋ = costante, abbiamo
ẋ
1
= √ ⇐⇒
√ √
a
y 1 + ẋ2
2
ẋ2
y
dx
a−y
=
=⇒
=1
2
1 + ẋ
a
dy
y
25
principio variazionale di hamilton ed equazioni di lagrange
da cui si prosegue come in
p precedenza. Osserviamo però che in questo caso ϕ xx =
ϕ x ẋ = 0 e che ϕ ẋ ẋ = 1/ y(1 + ẋ2 (y))3 > 0. Allora, se x (y) rende stazionario il
funzionale, abbiamo che
F [ x (y) + εh(y)] − F [ x (y)] =
ε2
2
Z y1
0
ϕ ẋ ẋ ḣ2 (y) dy + O(ε3 ) ≥ 0
ovvero F [ x (y) + εh(y)] ≥ F [ x (y)], se ḣ(y) non identicamente nulla, cioè x (y) è un
minimo.
2.3
2.3.1
leggi di conservazione
Coordinate cicliche
Abbiamo visto che il moto di un sistema di particelle olonomo e monogenico con
n gradi di libertà è governato dalle equazioni di Lagrange
d ∂L (q, q̇, t) ∂L (q, q̇, t)
−
=0
dt
∂q̇
∂qk
(k = 1, . . . , n)
dove L = T − U e qk sono le coordinate generalizzate. Apriamo una piccola
parentesi. Introdotto un sistema di assi cartesiani solidale con un sistema di riferimento inerziale, nel caso di un punto materiale soggetto a una forza conservativa
abbiamo:
L=
1
m ẋ2 + ẏ2 + ż2 − U ( x, y, z).
2
Si vede che
∂L
= m ẋ ≡ p x ,
∂ ẋ
∂L
= mẏ ≡ py ,
∂ẏ
∂L
= mż ≡ pz ,
∂ż
dove p x , py e pz sono le componenti rispettivamente lungo x, y e z della quantità
di moto. In analogia nel caso più generale possiamo chiamare
pk =
∂L (q, q̇, t)
∂q̇k
il momento canonico o momento coniugato alla coordinata generalizzata qk . Osserviamo che se ∂L/∂qk = 0, cioè se la lagrangiana non dipende esplicitamente da qk , si
ha
d ∂L
d pk
=
= 0.
dt ∂q̇k
dt
Allora pk è costante rispetto al tempo. Diamo allora la seguente
26
2.3 leggi di conservazione
Definizione - Una coordinata generalizzata si dice ciclica o ignorabile se la lagrangiana L, pur essendo funzione esplicita di q̇k , non dipende esplicitamente da
qk .
Possiamo pertanto enunciare la seguente proprietà: il momento coniugato a una
coordinata generalizzata ciclica si conserva. In modo equivalente possiamo dire che
il momento coniugato a una coordinata ciclica è un integrale primo del moto, in
quanto si traduce in una relazione del tipo f (q1 , . . . , qn , q̇1 , . . . , q̇n , t) = costante.
Se qk è una coordinata ciclica, allora L è invariante rispetto a una trasformazione
qk → qk + α, con α costante. Ora, se qk , coordinata ciclica, è uno spostamento, si
ha che una traslazione rigida lungo tale direzione non ha effetto alcuno sul moto
del sistema e il corrispondente momento coniugato, che è una quantità di moto,
si conserva. Se invece la coordinata ciclica qk è un angolo il sistema è invariante
per rotazioni intorno all’asse corrispondente e il relativo momento coniugato, che
è un momento angolare, si conserva.
Troviamo per esempio i momenti generalizzati nel caso di una particella in
moto in un campo elettromagnetico. Abbiamo visto che la lagrangiana di una
particella di massa m e carica4 q in un campo elettromagnetico è data da:
L=
1
q
m( ẋ2 + ẏ2 + ż2 ) − qϕ + A · v
2
c
dove v = ẋ x̂ + ẏŷ + żẑ è la velocità della particella, c è la velocità della luce nel
vuoto, ϕ, A sono il potenziale scalare e vettoriale rispettivamente. Il momento
coniugato a x è dato da
q
q
Px = m ẋ + A x = p x + A x
c
c
dove p x = m ẋ è la componente lungo x dell’usuale quantità di moto della particella. In maniera analoga i momenti coniugati a y e z sono rispettivamente:
q
Py = py + Ay ,
c
q
Pz = pz + Az .
c
Possiamo scrivere allora in forma vettoriale il momento generalizzato come
q
P = p + A.
c
Ora, se per ipotesi ϕ, A non dipendono esplicitamente da x, cioè x è una variabile
ciclica, allora il momento coniugato rispetto a x, cioè Px , è una costante del moto.
Esercizi
• Verificare l’esistenza di una coordinata ciclica nell’esercizio 2c di pagina 11.
Dare un’interpretazione fisica del corrispondente momento coniugato.
4 Qui con il simbolo q non indichiamo una coordinata generalizzata!
27
principio variazionale di hamilton ed equazioni di lagrange
• Verificare l’esistenza di una coordinata ciclica nell’esercizio 3 di pagina 11.
Dare un’interpretazione fisica del corrispondente momento coniugato.
• Si scriva in coordinate cilindriche la lagrangiana di una particella di massa
m e carica q in un campo magnetico (costante) generato da un filo rettilineo
percorso da corrente stazionaria I. Esistono coordinate cicliche? (Piccolo
suggerimento: scrivere il potenziale vettore A imponendo che valga la gauge di
Coulomb, div A = 0.)
Funzione energia
2.3.2
Sia L = L (q, q̇, t) la lagrangiana di un sistema con n gradi di libertà, dove q =
(q1 , . . . , qn ). Si ha che
n dL
∂L
∂L
∂L
q̇k +
q̈k + .
=∑
dt
∂q
∂
q̇
∂t
k
k
k =1
Poiché per k = 1, . . . , n si ha, dalle equazioni di Lagrange,
d ∂L
∂L
=
∂qk
dt ∂q̇k
allora:
n
dL
=∑
dt
k =1
d
⇐⇒
dt
"
d ∂L
dt ∂q̇k
q̇k +
n
∂L
d
∂L
∂L
∂L
=∑
⇐⇒
q̈k +
q̇k +
∂q̇k
∂t
dt
∂
q̇
∂t
k
k =1
n
#
∂L
∂L
∑ ∂q̇k q̇k − L + ∂t = 0.
k =1
(2.15)
Chiamiamo funzione energia la quantità
h (q, q̇, t) =
n
∂L
∑ ∂q̇k q̇k − L.
k =1
Allora la relazione (2.15) si scrive anche:
dh
∂L
=− .
dt
∂t
Se L = L(q, q̇), cioè se ∂L/∂t = 0, h è una costante del moto. Sotto opportune
ipotesi h è proprio l’energia totale del sistema. Se l’energia cinetica è una funzione
omogenea di secondo grado delle q̇k , cioè
T=
n
∑
k,j=1
A jk (q, t)q̇k q̇ j
con Akj = A jk , e se il potenziale V non dipende da q̇, allora
n
∂L
= 2 ∑ Aik q̇k
∂q̇i
k =1
28
2.3 leggi di conservazione
e quindi
n
∂L
∑ ∂q̇i q̇i = 2T.
i =1
Allora
h=
n
∂L
∑ ∂q̇i q̇i − L = 2T − T + V = T + V
i =1
che è l’energia totale del sistema. Se la lagrangiana non dipende esplicitamente
dal tempo abbiamo allora che l’energia del sistema è una costante del moto.
29
3
APPLICAZIONI DELLE EQUAZIONI DI LAGRANGE
3.1
problema dei due corpi
Supponiamo di avere un sistema isolato di due particelle di massa m1 ed m2 ,
soggette alla mutua interazione di natura conservativa. Rispetto a un osservatore
O inerziale indichiamo con r1 ed r2 i vettori posizione delle due particelle. Il
vettore posizione del centro di massa è:
R=
m1 r1 + m2 r2
,
m1 + m2
(3.1)
mentre il vettore posizione relativa è dato da
r = r2 − r1 .
(3.2)
Possiamo esprimere r1 ed r2 mediante i vettori appena introdotti:
m2
r,
m1 + m2
m1
r2 = R +
r.
m1 + m2
r1 = R −
(3.3)
Assumiamo che l’energia potenziale (relativa alla mutua interazione) abbia la
seguente proprietà:
U = U (r ).
(3.4)
La forza agente sulla particella 2 è data da F2 = −∇r2 U (r ) = −∇r U (r ), mentre
la forza agente sulla particella 1 è F1 = −∇r1 U (r ) = ∇r U (r ). Abbiamo pertanto
F1 + F2 = 0 (forma debole del principio di azione e reazione). Notiamo che se
U = U (r ) allora F2 = −dU/dr r̂ = − F1 (forma forte del principio di azione e
reazione). La lagrangiana del sistema delle due particelle è
L=
1
1
m1 kṙ1 k2 + m2 kṙ2 k2 − U (r ).
2
2
(3.5)
Sulla base delle relazioni (3.3), la (3.5) si può scrivere come
L=
m1 + m2
1 m1 m2
k Ṙk2 +
kṙ k2 − U (r )
2
2 m1 + m2
(3.6)
La quantità µ = m1 m2 /(m1 + m2 ) è detta massa ridotta (si noti che 1/µ = 1/m1 +
1/m2 e che se m2 m1 , allora r1 ≈ R e µ ≈ m2 ).
Dall’espressione (3.6) si deduce che Ṙ = V è costante, essendo R ciclica. Il centro di massa perciò è in quiete o si muove di moto rettilineo uniforme. Possiamo
31
applicazioni delle equazioni di lagrange
prendere in ogni caso come sistema di riferimento proprio quello del centro di
massa e avremo:
m1 r1 + m2 r2 = 0
m2
r1 = −
r
m1 + m2
m1
r2 =
r.
m1 + m2
Dunque la lagrangiana sarà nella forma:
L=
1
2
µkṙ k − U (r ).
2
È interessante notare come il problema dei due corpi si riconduca al problema di
una particella di massa pari alla massa ridotta immersa in un campo esterno.
3.1.1 Movimento in un campo centrale
Si abbia una particella P di massa m (che possiamo riguardare anche come la
massa ridotta di due particelle puntiformi) in un campo esterno. Assumiamo che
tale campo sia conservativo e che l’energia potenziale (o potenziale) dipenda solo
dalla distanza della particella P da un punto O, fisso rispetto a un sistema di
riferimento inerziale. Chiamiamo come al solito vettore posizione della particella
−→
r = OP e v = ṙ il vettore velocità. Abbiamo allora:
L=
1 2
mv − U (r ),
2
dove r = kr k, v2 = v · v e U (r ) è l’energia potenziale. La forza agente sulla
particella è
F = −∇U (r ) = −
dU
r̂.
dr
Essa è centrale e il centro della forza è il punto O.
Notiamo che l’energia potenziale ha simmetria sferica, dunque ogni soluzione
delle equazioni del moto deve essere invariante per rotazioni attorno a un asse
arbitrario passante per O. Il momento angolare della particella P rispetto a O,
cioè l = mr × v = r × p (con p quantità di moto della particella), si conserva. Si
dimostra facilmente che il moto si svolge in un piano (piano dell’orbita) ortogonale alla direzione (costante) di l, sempre che l 6= 0. Se l = 0, r è parallelo a p e il
moto è unidimensionale.
Supponiamo che l = l0 6= 0 (l0 costante). Il sistema ha due gradi di libertà,
considerato che il moto avviene in un piano. Possiamo, pertanto, esprimere la
lagrangiana in coordinate polari:
L=
32
1
m(ṙ2 + r2 θ̇ 2 ) − U (r ).
2
(3.7)
3.1 problema dei due corpi
Si vede subito che θ è ciclica e dunque il suo momento coniugato pθ = ∂L/∂θ̇ =
mr2 θ̇ è costante. Osserviamo che
pθ = mr2 θ̇ = l0
(3.8)
che è costante. Notiamo, per inciso, che
1 l0
1
= r2 θ̇
2m
2
è la cosiddetta velocità areolare ed è una costante del moto. Abbiamo così ottenuto,
in modo semplice, la
Legge (Seconda legge di Keplero) - Il vettore posizione della particella (o di un pianeta
considerato puntiforme) rispetto al centro dell’orbita (o centro della forza) spazza aree
uguali in intervalli di tempo uguali.
Osservazione. Questa legge è stata ottenuta semplicemente supponendo che la forza agente sulle particelle sia centrale (senza assegnare la dipendenza esplicita da
r di U).
Utilizzando le equazioni di Lagrange
d
dt
∂L
∂ṙ
∂L
= 0 ⇐⇒
∂r
∂U (r )
mr̈ − mr θ̇ 2 +
= 0.
∂r
−
(3.9)
Per la (3.8) abbiamo
mr θ̇ 2 =
l02
.
mr3
Allora la (3.9) può essere riscritta nel modo seguente:
mr̈ −
l02
∂U (r )
+
= 0.
3
mr
∂r
Osserviamo che nel nostro caso la lagrangiana non dipende esplicitamente dal
tempo e che l’energia cinetica è una funzione omogenea di secondo grado rispetto
a ṙ e θ̇. Ne consegue che la funzione energia h è una costante del moto ed è proprio
l’energia totale della particella E. Possiamo, allora, scrivere:
∂L
∂L
ṙ + θ̇ − L =
∂ṙ
∂θ̇
1
1
1 l02
= m(ṙ2 + r2 θ̇ 2 ) + U (r ) = mṙ2 +
+ U (r )
2
2
2 mr2
E=
(3.10)
dove abbiamo tenuto conto della (3.8).
33
applicazioni delle equazioni di lagrange
Osservazione. Grazie alla conservazione del momento angolare, il moto è come
unidimensionale con un potenziale efficace
Ueff (r ) =
1 l02
+ U (r ).
2 mr2
(3.11)
Se r (0) = r0 , supposto che nell’intervallo di tempo considerato r = r (t) è
crescente,
r
dr
2
=
( E − Ueff (r ))
dt
m
e, quindi,
t=
Z r (t)
dr 0
q
r0
2
m (E
− Ueff (r 0 ))
.
(3.12)
Si può ricavare anche l’anomalia θ in funzione di r. Infatti dalla (3.8) otteniamo:
dθ =
l0 1
l0 1
dr
q
dt =
2
2
mr
mr
2
m ( E − Ueff (r ))
(abbiamo qui considerato un intervallo di tempo in cui r = r (t) è crescente) e, di
conseguenza,
l0
θ (r ) − θ (r0 ) =
m
Z r (t)
1
r
r0
dr 0
q
02
2
m (E
− Ueff (r 0 ))
.
Se il dominio di variazione di r ha due limiti, rmin ed rmax , il movimento è limitato
e tutta l’orbita è contenuta nella corona circolare centrata in O, con raggio interno
rmin e raggio esterno rmax . Questo discorso non vuol dire affatto che l’orbita, nel
caso di moto limitato, è chiusa. Perché ciò accada, è necessario e sufficiente che
∆θ =
2l0
m
Z rmax
1
rmin
r
dr 0
q
02
2
m (E
− Ueff (r 0 ))
= 2π
j
n
(3.13)
con j, n ∈ N. Ricordiamo, per inciso, che l’anomalia θ è definita sempre a meno di
multipli di 2π. Ora, se indichiamo con
T0 = 2
Z rmax
rmin
dr 0
q
2
m (E
− Ueff
(r 0 ))
(3.14)
il periodo della funzione r = r (t) (stiamo supponendo che il moto sia limitato e
che r ∈ [rmin , rmax ]), dopo un tempo pari a nT0 , si avrà una variazione di θ pari
a 2πj (multiplo di 2π) e, pertanto, il vettore posizione ritornerà a essere quello
iniziale, cioè r (nT0 ) = r (0).
In generale, per un potenziale generico U (r ), supponendo l’esistenza di moti
limitati, la traiettoria non è un’orbita chiusa.
34
3.1 problema dei due corpi
Ueff
E2
O
rmin r0
rmax
r
E1
E0
Figura 3.1: Andamento del potenziale efficace nel problema dei due corpi.
Teorema (di Bertrand) - Le uniche forze centrali che danno luogo a orbite chiuse per
ogni condizione iniziale corrispondente a moti limitati sono:
• quella proporzionale all’inverso del quadrato di r (come la forza gravitazionale);
• quella corrispondente alla legge di Hooke (dipendenza lineare da r).
Supponiamo ora che F = −k/r2 r̂ o, in modo equivalente, U (r ) = −k/r, con
k > 0. Per il teorema di Bertrand, le orbite relative a moti limitati sono chiuse. Il
potenziale efficace, in questo caso, è:
Ueff =
k
1 l02
− .
2
2 mr
r
Per r = r0 = l02 /(mk ), Ueff ha il valore minimo, esattamente pari a −mk2 / 2l02 .
Dal grafico di Ueff (vedi figura 3.1) possiamo ricavare le seguenti informazioni:
• E = E0 = −mk2 / 2l02 , ṙ (t) = 0 =⇒ r (t) = r0 costante. In questo
caso l’orbita della particella è circolare. Il moto è circolare uniforme con
frequenza ω = l0 /(mr02 ) (questa espressione discende in modo immediato
dalla (3.8)).
• Se E = E1 ∈ −mk2 / 2l02 , 0 , il moto è limitato con r ∈ [rmin , rmax ]. Si può
dimostrare che la traiettoria è un’ellisse.
• Se E = E2 ≥ 0, r (t) è inferiormente limitato e superiormente non limitato.
Si può dimostrare che la traiettoria è per E2 = 0 una parabola e per E2 > 0
un’iperbole.
35
applicazioni delle equazioni di lagrange
y
b
Q( x, y)
θ
a
c
O
F2
a
a
F1
x
Figura 3.2: Ellisse in coordinate cartesiane.
Esercizio
1. Nell’ipotesi che la forza centrale sia F = −k/r2 r̂ dimostrare che il vettore
A = p × l − mkr̂
è una costante del moto. A è detto vettore di Laplace-Runge-Lenz. Calcolare
inoltre A · l.
3.1.2 Il problema di Keplero
Ricordiamo l’espressione dell’ellisse in coordinate polari e alcune sue proprietà.
Detti a il semiasse maggiore e b il semiasse minore, l’equazione dell’ellisse in
coordinate cartesiane è
x2
y2
+
= 1.
a2
b2
Siano F1 = (c, 0) e F2 = (−c, 0) (con c ≥ 0) i due fuochi e Q = ( x, y) un punto
generico dell’ellisse (vedi figura 3.2). Allora, per definizione di ellisse abbiamo
che
QF1 + QF2 = 2a.
Inoltre vale la relazione
c2 = a2 − b2 .
Il quadrato della distanza del punto Q dal fuoco F1 è dato da:
2
2
2
2
2
2
2
2
2
QF1 = ( x − c) + y = x − 2xc + c + y = x − 2xc + a − b + b
b2 2
b2
2
2
= x − 2xc + a − 2 x = 1 − 2 x2 − 2xc + a2 .
a
a
36
2
x2
1− 2
a
=
3.1 problema dei due corpi
Q( x, y)
r
F2
O
θ
F1
Figura 3.3: Ellisse in coordinate polari.
Introduciamo l’eccentricità e = c/a. Notiamo che e ∈ (0, 1) e che per e = 0 l’ellisse
diventa una circonferenza. Inoltre c = ea. Abbiamo quindi
2
a2 − b2 2
c2
x − 2xc + a2 = 2 x2 − 2xc + a2 = e2 x2 − 2eax + a2 =
2
a
a
2
= ( a − ex )
QF1 =
da cui
QF1 = a − ex.
Analogamente si trova che
2
QF2 = ( a + ex )2 =⇒ QF2 = a + ex
ed è quindi soddisfatta la condizione QF1 + QF2 = 2a. In coordinate polari fissiamo come polo uno dei fuochi, per esempio F1 (vedi figura 3.3), quindi QF1 = r.
Le coordinate ( x, y) di Q sono date da
x = ea + r cos θ
y = r sin θ
pertanto
QF1 = r = a − e(ea + r cos θ ) = a(1 − e2 ) − er cos θ =⇒
r (1 + e cos θ ) = a(1 − e2 ) =⇒ r (θ ) =
a (1 − e2 )
.
1 + e cos θ
Ponendo P = a(1 − e2 ), detto parametro dell’ellisse, otteniamo l’equazione dell’ellisse in coordinate polari:
r (θ ) =
P
.
1 + e cos θ
37
applicazioni delle equazioni di lagrange
Inoltre
b2 = a2 − c2 = a2 − e2 a2 = a2 (1 − e2 ) =⇒ b = a
p
1 − e2 = √
P
1 − e2
.
Il perielio si ha per θ = 0 quindi
rmin =
P
= a (1 − e )
1+e
mentre l’afelio è raggiunto in θ = π:
rmax =
P
= a (1 + e ).
1−e
Osserviamo infine che r (π/2) = P.
Ci proponiamo di dimostrare la
Legge (Prima legge di Keplero) - I pianeti (considerati puntiformi) descrivono orbite
ellittiche di cui il Sole occupa uno dei fuoci.
A tal fine, consideriamo un corpo puntiforme di massa m in moto in un campo
centrale F = −k/r2 r̂ e soggetto al potenziale
k
k>0
r
1 l02
k
Ueff (r ) =
− .
2
2 mr
r
U (r ) = −
Come visto precedentemente, dalla (3.8) si ottiene
l0 1
r m r2
2
dθ =
m
dr
E−
2
1 l0
2 mr2
+
k
r
.
Introducendo la variabile
w=
1
1
=⇒ dw = − 2 dr
r
r
abbiamo
dθ = − q
dw
2mE
l02
+
2km
w
l02
− w2
= −r
con E ∈ (−mk2 /(2l02 ), 0). Notiamo che
A2 =
38
2mE k2 m2
+ 4 ≥0
l02
l0
dw
2mE
l02
+
k 2 m2
l04
− w−
km
l02
2
3.1 problema dei due corpi
con il segno di uguaglianza che vale quando E assume il valore minimo. Ponendo
x = w − km/l02 e integrando abbiamo
Z
θ=−
w − km
x
l02
√
= arccos + costante = arccos q
+ costante =
k 2 m2
2mE
A
A2 − x 2
+
2
4
l
l
dx
0
= arccos
l02
w
km
q
−1
1+
2El02
mk2
0
+ costante.
Quindi risulta
l02 1
−1 =
mk r
s
2El02
cos(θ + θ0 )
mk2
1+
dove θ0 è la costante di integrazione. Senza perdita di generalità possiamo ruotare
il sistema di riferimento in modo che θ0 = 0 per cui


s
2
2El0
1
mk
cos θ  .
= 2 1 + 1 +
r
mk2
l0
Ponendo inoltre
s
1+
e=
2El02
∈ (0, 1)
mk2
abbiamo
l02
mk
r=
1 + e cos θ
=
P
1 + e cos θ
con P = l02 /(mk ). Questa è l’equazione polare di una conica con eccentricità
e ∈ (0, 1), pertanto la prima legge di Keplero è stata dimostrata.
Infine ricaviamo la
Legge (Terza legge di Keplero) - Il quadrato del periodo di rivoluzione di un pianeta è
proporzionale al cubo del semiasse maggiore dell’orbita.
Ricordiamo che la velocità areolare è data da
Ṡ =
1 l0
1 l0
=⇒ dS =
dt =⇒ l0 dt = 2m dS.
2m
2m
L’area di un’ellisse vale πab, quindi integrando abbiamo:
Z T
0
l0 dt = l0 T = 2πmab
dove T è il periodo di rivoluzione del corpo. Ora osserviamo che
P
a=
=
1 − e2
l02
mk
2| E|l02
mk2
=
k
,
2| E |
39
applicazioni delle equazioni di lagrange
quindi
2πmab
2πm 2
T=
=
a
l0
l0
r
m
3/2
= 2πa
.
k
3.2
p
2πm 2
1 − e2 =
a
l0
s
2| E|l02
= 2πa2
mk2
r
2m| E|
=
k2
piccole oscillazioni
3.2.1 Impostazione del problema
Supponiamo di avere un sistema di N particelle con vincoli olonomi e scleronomi
con n gradi di libertà, soggette a forze conservative. Indichiamo con q1 , q2 , . . . , qn
le coordinate generalizzate e con V = V (q1 , . . . , qn ) l’energia potenziale. Il sistema
si dice in equilibrio nella configurazione q0 = (q01 , . . . , q0n ) se le forze generalizzate
che agiscono su di esso sono nulle, ossia:
∂V (q) Qj = −
=0
(∀ j = 1, . . . , n).
∂q j q=q
0
L’energia potenziale nella configurazione di equilibrio q0 ha un valore estremale
o in generale stazionario. Se tutte le velocità generalizzate nella configurazione di
equilibrio sono nulle, il sistema rimarrà nella posizione di equilibrio per un tempo
indefinito. Una configurazione di equilibrio si dice stabile se una piccola perturbazione del sistema provoca un moto che raggiunge configurazioni vicine; al contrario si dirà instabile se una perturbazione infinitesima provoca un allontanamento
indefinito da tale configurazione.
Noi intendiamo studiare il moto del sistema nelle immediate vicinanze di una
configurazione di equilibrio stabile, dove l’energia potenziale ha un minimo. Indichiamo con ηi gli spostamenti delle coordinate generalizzate dall’equilibrio;
ovvero:
qi = q0i + ηi
∀i = 1, . . . , n.
Consideriamo lo sviluppo dell’energia potenziale1 attorno alla configurazione di
equilibrio stabile q0 :
n
V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) + ∑
j =1
Poiché per ipotesi
∂V (q) =0
∂q j q=q
0
∂V 1
ηj +
∂q j q=q
2
0
n
∑
j,k =1
∀ j = 1, . . . , n
1 Supponiamo sempre le funzioni che trattiamo di grado opportuno.
40
∂2 V η j ηk + · · · .
∂q j ∂qk q=q
0
3.2 piccole oscillazioni
e V (q01 , . . . , q0n ) è una costante che può essere posta uguale a zero senza perdere in generalità,2 abbiamo in definitiva, fermandoci al termine quadratico dello
sviluppo:
1 n
∂2 V 1 n
V ( q1 , . . . , q n ) =
η
η
=
V jk η j ηk .
(3.15)
j
k
∑
2 j,k=1 ∂q j ∂qk q=q
2 j,k∑
=1
0
La matrice n × n V = (V jk ) è una matrice simmetrica e reale. La condizione che
q0 sia una configurazione di minimo implica che ∀η = (η1 , . . . , ηn ) ∈ Rn si abbia
ηT V η =
n
∑
j,k =1
V jk η j ηk ≥ 0,
ovvero V è semidefinita positiva.
Anche l’energia cinetica può essere sviluppata in modo simile. Mostriamo prima che in presenza di vincoli olonomi e scleronomi l’energia cinetica è una forma
quadratica omogenea delle velocità generalizzate. Infatti, detta mk la massa della
k-esima particella e vk la sua velocità:3
!
n n
1 N
1 N
1 N
∂rk ∂rk
2
T = ∑ mk vk = ∑ mk vk · vk = ∑ mk ∑ ∑
q̇i q̇ j
·
2 k =1
2 k =1
2 k =1
∂qi ∂q j
i =1 j =1
dove si è ricordato che
vk =
n
n n
∂rk
∂r ∂r
2
q̇
=⇒
v
=
∑ ∂q j j
∑ ∑ ∂qki · ∂qkj q̇i q̇ j .
k
j =1
i =1 j =1
Ne consegue:
1 n n
T= ∑∑
2 i =1 j =1
N
∂r ∂r
∑ mk ∂qki · ∂qkj
k =1
!
q̇i q̇ j
che è quanto era nostra intenzione dimostrare.
Considerando ora spostamenti ηi rispetto alla configurazione di equilibrio e
fermandoci al primo termine (quadratico) nelle η̇i , abbiamo:
"
#
N
1 n
∂rk ∂rk 1 n
T = ∑ ∑ mk
·
η̇
η̇
=
Tij η̇i η̇ j .
(3.16)
i j
2 i,j=1 k=1
∂qi ∂q j q=q
2 i,j∑
=1
0
La matrice (costante) T = (Tij ) è simmetrica, reale ed è definita positiva in senso
stretto, cioè
n
∑
i,j=1
Tij ai a j > 0
∀ a = ( a 1 , . . . , a n ) ∈ Rn \ { 0 } .
2 Ricordiamo infatti che l’energia potenziale è definita a meno di una costante additiva.
3 Indichiamo con rk il vettore posizione della k-esima particella rispetto a un punto O solidale con un
sistema di riferimento inerziale
41
applicazioni delle equazioni di lagrange
Pertanto i suoi autovalori sono reali e strettamente positivi e quindi T è senz’altro
diagonalizzabile.
La lagrangiana del sistema nelle approssimazioni fatte può scriversi:
L=
1 n
1 n
Tkj η̇k η̇ j − ∑ Vkj ηk η j .
∑
2 k,j=1
2 k,j=1
(3.17)
Si vede che le ηi assumono de facto il ruolo di nuove coordinate generalizzate. La
k-esima equazione di Lagrange assume la forma:
d
∂L
∂L
=0
−
dt ∂η̇k
∂ηk
e cioè
1
2
n
∑ Tkj η̈j +
j =1
1
2
n
∑ Vkj ηj = 0.
(3.18)
j =1
Posto η(t) = (η1 (t), . . . , ηn (t)), l’insieme delle equazioni può essere sintetizzato
nella scrittura
T η̈(t) + V η(t) = 0.
(3.19)
Le equazioni (3.18) (o l’equazione matriciale (3.19)) sono equazioni differenziali
del secondo ordine lineari a coefficienti costanti omogenee. Vedremo, ora, come
sia possibile scrivere un sistema di n equazioni differenziali del secondo ordine
lineari disaccoppiate perfettamente equivalente al sistema trovato.
Cerchiamo soluzioni delle (3.19) del tipo:
η = a eiωt
(3.20)
con ω ∈ R e a ∈ Rn \ {0} costante.4 Richiedendo che la (3.20) sia soluzione
della (3.19) otteniamo:
(−ω 2 T + V ) a eiωt = 0 ⇐⇒ (V − ω 2 T ) a = 0
dove ω 2 = λ ha il significato di autovalore e a 6= 0 di autovettore corrispondente.
Non si tratta però di un classico problema agli autovalori: infatti si tratta qui
di determinare gli autovalori della matrice V rispetto alla matrice T .5 Sarà importante far vedere che tutti i nostri autovalori sono maggiori o uguali a zero,
perché altrimenti ω non sarebbe reale.6 Gli autovalori di V rispetto a T sono dati
dall’equazione:
det(V − λT ) = 0.
(3.21)
4 Una soluzione fisicamente accettabile deve essere reale; naturalmente è la parte reale della (3.20)
che descrive il sistema.
5 Avremmo ancora il classico problema agli autovalori se T fosse proporzionale alla matrice identità
In .
6 Se ciò avvenisse avremmo un moto con andamento esponenziale (crescente o decrescente) con
conseguente allontanamento dalla posizione di equilibrio.
42
3.2 piccole oscillazioni
Osservazione. Un autovalore λ deve rendere non invertibile V − λT ; inoltre la
somma delle molteplicità delle radici della (3.21) è uguale a n.
Ora, come detto T è diagonalizzabile, ovvero detta M = Diag(µ1 , . . . , µn ), dove
µk > 0 ∀k = 1, . . . , n sono gli autovalori di T non tutti necessariamente distinti,
esiste una trasformazione di similitudine U matrice ortogonale a valori reali, cioè
U −1 = U T , tale che:
T = U T MU.
(3.22)
Ovviamente se T è già diagonale, allora T = M e U = In . Definiamo inoltre
√
√
M1 = Diag( µ1 , . . . , µn ). Si vede immediatamente che M1 è simmetrica a valori
reali positivi e che M = M12 . La (3.22) può essere riscritta:
T = U T M1 M1 U = ( M1 U )T M1 U.
(3.23)
Sia Ṽ la matrice simmetrica a valori reali definita positiva non in senso stretto,
che soddisfa la seguente relazione:
V = ( M1 U )T Ṽ M1 U.
(3.24)
Pertanto Ṽ e V sono legate da una trasformazione di congruenza. In base alle (3.23) e alle (3.24), l’equazione (3.21) diventa
det[( M1 U )T Ṽ M1 U − λ( M1 U )T M1 U ] = 0 ⇐⇒
det[( M1 U )T ] det[Ṽ − λI ] det[ M1 U ] = 0 ⇐⇒
det[Ṽ − λI ] = 0.
ovvero trovare gli autovalori di V rispetto a T vuol dire trovare gli autovalori
(nel senso usuale) di Ṽ . I suoi autovalori saranno necessariamente, in virtù delle
proprietà già citate, maggiori o uguali a zero.
Ritorniamo ora all’equazione di Lagrange (3.19), che può essere riscritta per
la (3.23) e la (3.24):
( M1 U )T M1 U η̈(t) + ( M1 U )T Ṽ M1 Uη(t) = 0 =⇒
( M1 U )T [ M1 U η̈(t) + Ṽ M1 Uη(t)] = 0 =⇒
M1 U η̈(t) + Ṽ M1 Uη(t) = 0
Se poniamo M1 Uη(t) = Ψ(t), otteniamo (ricordando che M1 U è una matrice
costante)
Ψ̈(t) + Ṽ Ψ(t) = 0.
(3.25)
Sappiamo che la matrice Ṽ , simmetrica e a valori reali, definita positiva non in
senso stretto, è diagonalizzabile. I suoi autovalori λi ≥ 0 non sono tutti necessariamente distinti. Sia Λ = Diag(λ1 , . . . , λn ) la matrice diagonale degli autovalori
di Ṽ . Esiste (essendo Ṽ diagonalizzabile) una matrice ortogonale S tale che
Ṽ = ST ΛS.
43
applicazioni delle equazioni di lagrange
L’equazione (3.25) diventa perciò:
Ψ̈(t) + S T ΛSΨ(t) = 0 ⇐⇒ SΨ̈(t) + ΛSΨ(t) = 0.
Posto SΨ(t) = Q(t) = ( Q1 (t), . . . , Qn (t)) (ricordiamo che S è una matrice costante) abbiamo in definitiva
Q̈(t) + ΛQ(t) = 0
(3.26)
ovvero ∀k, ricordando che λk = ωk2 :
Q̈k (t) + ωk2 Qk (t) = 0
(k = 1, . . . , n)
(3.27)
cioè n oscillatori armonici disaccoppiati; ciascuno di essi vibra con una propria frequenza (modo normale). Le Qk vengono dette coordinate normali o principali. Osserviamo che le ωk2 non sono tutte necessariamente distinte e che se λk = 0, la k-esima
equazione è del tipo Q̈k = 0, quindi non si tratta di un oscillatore armonico.
3.2.2
Riepilogo
Q(t) = SΨ(t) = (SM1 U )η(t).
Osserviamo che se T = αIn , con α > 0, allora M1 =
√
αSη(t).
Se sono noti η(0), η̇(0), stato iniziale, si ha:
(3.28)
√
αIn , U = In e Q(t) =
Q(0) = (SM1 U )η(0),
Q̇(0) = (SM1 U )η̇(0).
Possiamo allora risolvere il sistema (3.26) con queste condizioni iniziali. Determinato Q = Q(t), abbiamo poi:
η(t) = SΨ(t) = (SM1 U )−1 Q(t).
3.2.3 Osservazioni
Abbiamo ottenuto, in concreto, nelle pagine precedenti il seguente risultato, noto
in algebra lineare:
Teorema - Siano date due matrici n × n simmetriche a valori reali, la prima T definita
positiva e la seconda V semidefinita positiva. Allora esiste una matrice invertibile a valori
reali C tale che
CT T C = I
T
C V C = Diag(λ1 , . . . λn ) = Λ
dove i λ j ≥ 0 sono le radici dell’equazione caratteristica det(V − λT ) = 0.
44
(3.29)
(3.30)
3.2 piccole oscillazioni
Possiamo ovviamente scrivere λ j = ω 2j , con ω j ≥ 0. È facile far vedere, usando
le notazioni precedenti, che C −1 = SM1 U. In base alle relazioni (3.29) e (3.30) si
ottengono in modo agevolo e immediato i modi normali di vibrazione. Infatti:
T η̈(t) + V η(t) = 0 =⇒
C T T η̈(t) + C T V η(t) = 0 =⇒
C T T CC −1 η̈(t) + C T V CC −1 η(t) = 0 =⇒
(3.31)
Q = C −1 η
C −1 η̈(t) + ΛC −1 η(t) = 0 =⇒
Q̈(t) + ΛQ(t) = 0.
3.2.4 Un particolare problema
Siano dati N + 1 oscillatori di costante k vincolati agli estremi come in figura 3.4.
Siano gli N oggetti a essi vincolati di massa m. La lunghezza a riposo di ciascuna
molla sia l0 cosicché la distanza tra le pareti sia ( N + 1)l0 . Indichiamo con x j (t) la
posizione della j-esima particella all’istante t e con la x0,j la sua posizione iniziale.
A riposo risulta x0,j − x0,j−1 = l0 . L’energia potenziale elastica associata al sistema
è
V=
1 N +1
k
( x j − x j −1 − l0 ) 2 .
2 j∑
=1
Se ora indichiamo con q j la deviazione dalla posizione di equilibrio della j-esima
particella, cioè q j = x j − x0,j , posto q0 = q N +1 = 0, l’energia diventa
V=
1 N +1
1 N +1
2
k ∑ (q j + x0,j − q j−1 − x0,j−1 − l0 )2 = k ∑ (q j − q j−1 ) .
2 j =1
2 j =1
Osservando che q̇ j = ẋ j possiamo scrivere la lagrangiana del sistema:
L=
1 N 2 1 N +1
m
q̇ j − k ∑ (q j − q j−1 )2 .
2 j∑
2 j =1
=1
L’equazione del moto della j-esima particella è:
mq̈ j + k (2q j − q j−1 − q j+1 ) = 0.
Figura 3.4: Schema del problema.
45
applicazioni delle equazioni di lagrange
D’ora in poi poniamo per semplicità nella trattazione m = 1. Indichiamo ora:


2 −1 0 · · · 0
0


 −1 2 −1 . . . 0

 
0


q1


 q2 
 0 −1 2 . . . 0

0

 = kV 0 = ω2 V 0 .
q=
V = k
0
 ..

. . .
.
.
.
.
.
.
.
.
.
.
 .
.
.
.
.
. 


qN


..
 0
. 2 −1
0
0
0
0
0 · · · −1 2
La matrice V 0 (e quindi anche V ) è simmetrica definita positiva. Infatti sia
assegnato un vettore x di dimensioni opportune,
xT V 0 x =
N −1
∑ V0,ij xi x j = x12 + ∑ (xi − xi+1 )2 + x2N ≥ 0.
i =1
i,j
La quantità sopra è nulla solo se x è il vettore nullo. Le equazioni del moto
possono sintetizzarsi nella relazione:
q̈ + V q = 0.
Per risolvere il nostro problema occorre trovare gli autovalori della matrice V 0 .
Essendo la matrice simmetrica definita positiva gli autovalori saranno tutti reali e
positivi. Abbiamo visto che l’energia potenziale è data da
V (q) =
1
1 N
1
1
(q, V q) = kq21 + k ∑ (q j − q j−1 )2 + kq2N .
2
2
2 j =2
2
(3.32)
Se x = ( x1 , x2 , . . . , x N ) è un autovettore associato all’autovalore λ abbiamo
N
( x, V 0 x) = ( x, λx) = λ( x, x) = λ ∑ x2j = λk xk2 .
j =1
D’altra parte dalla (3.32) risulta
N
( x, V 0 x) = x12 + ∑ ( x j − x j−1 )2 + x2N .
j =2
Inoltre
( x j − x j−1 )2 = x2j − 2x j x j−1 + x2j−1 ≤ 2x2j + 2x2j−1
e
N
N −1
j =2
j =2
∑ x2j = ∑
N
N −1
j =2
i =1
∑ x2j−1 =
46
x2j + x2N ,
∑
xi2 = x12 +
N −1
∑
j =2
x2j
(3.33)
3.2 piccole oscillazioni
quindi
N
N
N
j =2
j =2
j =2
∑ (x j − x j−1 )2 ≤ 2 ∑ x2j + 2 ∑ x2j−1 =
= 2x2N + 2
N −1
∑
j =2
N −1
∑
x2j + 2
= 2x12 + 2x2N + 4
N −1
∑
j =2
j =2
x2j + 2x12 =
x2j .
Pertanto
( x, V 0 x) ≤ 3x12 + 3x2N + 4
N −1
∑
j =2
N
2
x2j < 4 ∑ x2j = 4k xk .
(3.34)
j =1
L’ultima maggiorazione è stretta perché, dovendo essere x 6= 0 in quanto autovettore deve risultare necessariamente x1 , x N 6= 0. Infatti, partendo dall’equazione
(V 0 − λI ) x = 0 abbiamo che la prima componente è
(2 − λ) x1 − x2 = 0.
Ma se x1 = 0 allora x2 = 0. La seconda componente del vettore è
− x1 + (2 − λ ) x2 − x3 = 0
che implica x3 = 0. Procedendo in questo modo si troverebbe quindi che x = 0.
Confrontando la (3.33) con la (3.34) ricaviamo che 0 < λ < 4.
Per trovare gli autovalori procediamo ora nel modo solito. Indichiamo con
D N (λ) = det(V 0 − λIN ). Osserviamo che
D1 = 2 − λ,
2 − λ −1 = (2 − λ)2 − 1.
D2 = −1 2 − λ In generale, vista la struttura della matrice si vede che D N (λ) = (2 − λ) D N −1 (λ) −
D N −2 (λ). Per risolvere questo problema alle differenze finite adottiamo un sistema simile a quello che si può utilizzare per trovare la forma chiusa della
successione di Fibonacci (vedi l’appendice A), cerchiamo cioè soluzioni del tipo
D N (λ) = µ N , con µ 6= 0. L’equazione diventa:
µ N − (2 − λ)µ N −1 + µ N −2 = 0 ⇐⇒ µ2 − (2 − λ)µ + 1 = 0 =⇒
p
2 − λ ± (2 − λ )2 − 4
= cos θ ± i sin θ = e± i θ
µ1,2 =
2
dove si è effettuata l’opportuna sostituzione 2 cos θ = 2 − λ (in virtù del fatto
che λ ∈ ]0, 4[) e si è tenuto conto delle relazioni di Eulero. Ora occorre trovare
a, ã ∈ C tali che D N (λ) = a(λ) ei Nθ + ã(λ) e− i Nθ e affinché la soluzione sia reale ã
47
applicazioni delle equazioni di lagrange
deve essere il complesso coniugato di a. Imponiamo come “condizioni iniziali” i
due determinanti già noti:
D2 (λ) = a e2 i θ + ā e−2 i θ = (2 − λ)2 − 1 = 4 cos2 θ − 1 = e2 i θ + e−2 i θ +1
D1 (λ) = a ei θ + ā e− i θ = 2 − λ = 2 cos θ = ei θ + e− i θ
2iθ
( a − 1) e2 i θ +( ā − 1) e2 i θ = 1
b e +b̄ e2 i θ = 1
⇐⇒
( a − 1) ei θ +( ā − 1) e−iθ = 0
b ei θ +b̄ e− i θ = 0
ove si è posto b = a − 1. Risolvendo il sistema si ha
b(λ) =
Perciò:
e− i θ
ei θ
=⇒
a
=
,
ei θ − e− i θ
ei θ − e− i θ
D N (λ) =
ā = −
e− i θ
.
ei θ − e− i θ
sin [( N + 1)θ ]
ei( N +1)θ − e− i( N +1)θ
2 i sin [( N + 1)θ ]
=
=
i
θ
−
i
θ
2 i sin θ
sin θ
e −e
Poiché siamo alla ricerca degli zeri della funzione, occorre che sia
sin[θ ( N + 1)] = 0,
cioè
θm =
mπ
N+1
m = 1, . . . , N.
Ricordando la relazione che lega θ a λ, è necessario che
λm = 4 sin2
mπ
.
2( N + 1)
Gli autovalori sono tutti distinti. Le frequenze del sistema sono
2
ωm
= ω02 λm = 4ω02 sin2
mπ
.
2( N + 1)
Sia ora Λ = (δij λi )i,j=1,...,N . Cerchiamo la matrice S tale che V 0 = S T ΛS. È noto
che per costruire la matrice S occorre disporre degli autovettori. Perciò in generale,
per m = 1, . . . , N, da (V 0 − λm I ) xm = 0, ponendo come al solito 2 − λm = 2 cos θm
e xm,1 = γm sin θm


(
2
−
λ
)
x
−
x
=
0
xm,1 = γm sin θm
m
m,2
m,1






− xm,1 + (2 − λm ) xm,2 − xm,3 = 0
xm,2 = 2γm sin θm cos θm = γm sin(2θm )
=⇒
.


...
...




− xm,N −1 + (2 − λm ) xm,N = 0
xm,N = γm sin( Nθm )
Possiamo perciò scrivere:

mπ 
sin
N + 1




2mπ 

sin
x m = γm 

N
+
1




...

Nmπ 
sin
N+1
48
3.2 piccole oscillazioni
dove γm è una costante da scegliere opportunamente. Per esempio, volendo
normalizzare l’autovettore:
N
N
1 − cos(2jθm )
=
2
j =1
2
1 = k x m k 2 = γm
∑ sin2 ( jθm ) = γm2 ∑
j =1
N
γ2
= m
2
N − ∑ cos(2jθm )
!
=
j =1
2
γm
( N + 1).
2
L’ultima uguaglianza deriva dal fatto che
N
N
∑ cos(2jθm ) = ∑ Re ei 2jθ
j =1
j =1
N
m
= Re ∑ ei 2jθm .
j =1
Questa è una progressione geometrica di ragione ei 2θm quindi:
N
N
j =1
j =1
∑ cos(2jθm ) = Re ∑ ei 2jθm = Re
Perciò γm =
autovettore è
p
ei 2 ( N + 1 ) θ m − e2 i θ m
= −1.
e2 i θ m − 1
2/( N + 1) (osserviamo che γm non dipende da m) e l’m-esimo
mπ 
N + 1



r
2mπ 
2 
sin

xm =

.
N
+
1

N+1 


...

Nmπ 
sin
N+1

sin
La matrice S ha per righe gli autovettori xm ed è quindi definita da
r
2
mjπ
Smj = xm,j =
sin
.
N+1
N+1
Poiché xm,j = x j,m la matrice S è simmetrica, cioè S = S T . Inoltre, avendo normalizzato gli autovettori xm , risulta ( xm , xn ) = δmn pertanto si ha anche S = S−1 da
cui S2 = IN . Ricordando poi che
Qm =
N
∑ Smj q j
j =1
è possibile individuare mediante queste trasformazioni come stimolare il sistema
(ovvero come agire sulle q j ) per ottenere il modo normale associato alla coordinata
Qm .
49
4
F O R M A L I S M O H A M I LT O N I A N O
4.1
equazioni di hamilton
Vedremo ora una formulazione diversa della meccanica, nota come formulazione
hamiltoniana. La sua rilevanza risiede nel fatto che è in grado di fornire un’impostazione teorica adatta a essere estesa ad altre aree della fisica. Così, per esempio
l’approccio hamiltoniano costituisce il linguaggio con cui è formulata la meccanica
quantistica.
Nella formulazione hamiltoniana della meccanica si descrive il moto di un sistema di particelle con un insieme di equazioni differenziali del primo ordine (ricordiamo che le equazioni di Lagrange, tipiche della formulazione lagrangiana, sono
equazioni differenziali del secondo ordine). Il numero complessivo di condizioni iniziali in grado di determinare in modo univoco il moto dovrà sempre essere
uguale a 2n, dove n è il numero di gradi di libertà del sistema di particelle. Di conseguenza nell’approccio hamiltoniano dovranno esserci 2n equazioni differenziali
del primo ordine, le quali descriveranno l’evoluzione del punto rappresentativo
del sistema in uno spazio 2n-dimensionale, detto spazio delle fasi. Avremo allora
2n coordinate indipendenti in grado di definire lo stato del sistema. Un modo
naturale, anche se non unico, per introdurle è, nota la lagrangiana del sistema,
associare a ogni coordinata generalizzata qk , con k = 1, . . . , n, un’altra coordinata
data dal momento coniugato a essa, cioè pk = ∂L/∂q̇k . Le variabili (q, p) sono
dette canoniche. Si passa, in ultima analisi, dal sistema di variabili (q, q̇, t), proprio della formulazione lagrangiana, al sistema di nuove variabili (q, p, t), con il
quale possiamo formulare la meccanica hamiltoniana. Il metodo che ci permette
di passare da un sistema all’altro è fornito dalle trasformazioni di Legendre (per
un approfondimento sulle trasformazioni di Legendre vedi l’appendice B). Studieremo prima un caso semplice, cioè un sistema a un solo grado di libertà. Sia
L = L(q, q̇, t) la lagrangiana del sistema. Abbiamo:
dL =
∂L
∂L
∂L
∂L
dq +
dq̇ +
dt = ṗ dq + p dq̇ +
dt
∂q
∂q̇
∂t
∂t
(4.1)
dove abbiamo utilizzato la definizione di momento coniugato p = ∂L/∂q̇ e l’ed ∂L
quazione di Lagrange ∂L/∂q = dt
∂q̇ = ṗ. L’hamiltoniana del sistema H( q, p, t ) è
definita mediante la seguente trasformazione detta di Legendre:
H(q, p, t) = q̇p − L(q, q̇, t).
(4.2)
Notiamo che l’hamiltoniana risulta in realtà funzione di (q, p, t) solo dopo aver
51
formalismo hamiltoniano
espresso q̇ in funzione di (q, p, t) utilizzando la relazione p = ∂L(q, q̇, t)/∂q̇. Valgono le seguenti relazioni:
dH =
∂H
∂H
∂H
dq +
dp +
dt
∂q
∂p
∂t
(4.3)
Inoltre, per la (4.1) e la (4.2), si ha
dH = q̇ dp + p dq̇ − ṗ dq − p dq̇ −
∂L
∂L
dt = q̇ dp − ṗ dq −
dt
∂t
∂t
(4.4)
Dal confronto tra la (4.3) e la (4.4) emerge che

∂H(q, p, t)


= q̇

∂p
(4.5)

∂H(q, p, t)


= − ṗ
∂q
e
∂L
∂H
=− .
∂t
∂t
(4.6)
Le relazioni (4.5) sono dette equazioni di Hamilton e costituiscono un sistema di due
equazioni differenziali del primo ordine nelle due variabili indipendenti (coordinate canoniche) q e p. Queste nuove variabili definiscono lo stato del sistema nel
cosiddetto spazio delle fasi, che è ovviamente di dimensione 2.
La procedura precedente si può generalizzare al caso di un sistema avente n
gradi di libertà. Sia L = L (q, q̇, t) la lagrangiana del sistema, con q = (q1 , . . . , qn )
e q̇ = (q̇1 , . . . , q̇n ). Si ha:
dL =
n
n
∂L
j =1
n
=
∂L
∑ ∂q j dq j + ∑ ∂q̇ j dq̇ j +
∑
j =1
j =1
∂L
dt =
∂t
∂L
dt
ṗ j dq j + p j dq̇ j +
∂t
(4.7)
(si è utilizzato ∂L/∂q̇ j = p j e ∂L/∂q j =
d ∂L
dt ∂q̇ j
= ṗ j ). Posto p = ( p1 , . . . , pn ),
possiamo come prima definire l’hamiltoniana del sistema in funzione di (q, p, t)
mediante la trasformazione di Legendre
H(q, p, t) =
n
∑ q̇ j p j − L(q, q̇, t).
(4.8)
j =1
Avremo allora
dH =
n
∑
j =1
52
∂H
∂H
dq j +
dp j
∂q j
∂p j
+
∂H
dt
∂t
(4.9)
4.1 equazioni di hamilton
e, per la (4.7) e la (4.8),
dH =
n
n
j =1
j =1
∑ (q̇ j dp j + p j dq̇ j ) − ∑ ( ṗ j dq j + p j dq̇ j ) −
∂L
dt =
∂t
n
∂L
dt.
= ∑ (q̇ j dp j − ṗ j dq j ) −
∂t
j =1
(4.10)
Dalla (4.9) e dalla (4.10) si deduce che per i = 1, . . . , n

∂H(q, p, t)


= q̇i

∂pi

∂H(q, p, t)


= − ṗi
∂qi
(4.11)
∂L
∂H
=− .
∂t
∂t
(4.12)
e
Le equazioni (4.11) vengono chiamate, come nel caso di un solo grado di libertà,
equazioni di Hamilton e costituiscono 2n equazioni differenziali nelle variabili
canoniche q e p.
In conclusione, la costruzione dell’hamiltoniana avviene attraverso i seguenti
passaggi:
• si costruisce la lagrangiana L in funzione delle coordinate generalizzate q,
delle velocità generalizzate q̇ ed eventualmente del tempo t attraverso la
relazione L = T − V (supponendo le forze derivanti da un unico potenziale
o potenziale generalizzato);
• si definiscono i momenti coniugati pi attraverso la relazione
pi =
∂L(q, q̇, t)
∂q̇i
(i = 1, . . . , n);
(4.13)
• si scrive l’hamiltoniana del sistema utilizzando la trasformazione di Legendre (4.8) (ovviamente in questa scrittura intervengono q, q̇, p e t);
• a partire dalle (4.13) si cerca di ottenere q̇ in funzione di q, p e t;
• con l’ausilio del risultato precedente si può, infine, esprimere l’hamiltoniana
H in funzione di q, p e t.
Esercizi
1. Si consideri una particella di massa m in un campo conservativo. Sia U =
U (r ) l’energia potenziale. Scrivere l’hamiltoniana del sistema
a) in coordinate cartesiane;
b) in coordinate sferiche;
53
formalismo hamiltoniano
c) in coordinate cilindriche.
Soluzione. In coordinate cartesiane x, y, z la lagrangiana della particella è
L=
1
m( ẋ2 + ẏ2 + ż2 ) − U ( x, y, z).
2
Abbiamo:
px
∂L
= m ẋ =⇒ ẋ =
∂ ẋ
m
py
∂L
py =
= mẏ =⇒ ẏ =
∂ẏ
m
∂L
pz
pz =
= mż =⇒ ż = .
∂ż
m
px =
Quindi, per la (4.8) e tenendo presenti le relazioni fra le velocità generalizzate e i momenti coniugati appena determinate, l’hamiltoniana è
H = ẋp x + ẏpy + żpz − L =
1
1
( p2 + p2y + p2z ) + U ( x, y, z) =
= ( p2x + p2y + p2z ) −
m
2m x
1
=
( p2 + p2y + p2z ) + U ( x, y, z).
2m x
In coordinate sferiche r, θ, ϕ la lagrangiana della particella è
L=
1
m(ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 ) − U (r, θ, ϕ).
2
Calcoliamo i momenti coniugati e le relazioni fra le velocità generalizzate e
questi:
∂L
pr
= mṙ =⇒ ṙ =
∂ṙ
m
∂L
p
pθ =
= mr2 θ̇ =⇒ θ̇ = θ2
mr
∂θ̇
pϕ
∂L
pϕ =
= mr2 sin2 θ ϕ̇ =⇒ ϕ̇ =
.
2
∂ ϕ̇
mr sin2 θ
pr =
Dunque l’hamiltoniana è
H = ṙpr + θ̇ pθ + ϕ̇p ϕ − L =
p2ϕ
p2
p2r + 2θ +
r
r2 sin2 θ
1
=
m
=
1
2m
p2r +
!
p2ϕ
p2θ
+
r2
r2 sin2 θ
1
−
2m
!
p2ϕ
p2
p2r + 2θ +
r
r2 sin2 θ
!
+ U (r, θ, ϕ) =
+ U (r, θ, ϕ).
Infine, nelle coordinate cilindriche r, ϕ, z la lagrangiana della particella si
scrive:
L=
54
1
m(ṙ2 + r2 ϕ̇2 + ż2 ) − U (r, ϕ, z).
2
4.1 equazioni di hamilton
Come al solito troviamo i momenti coniugati e poi esprimiamo le velocità
generalizzate in funzione dei momenti:
∂L
pr
= mṙ =⇒ ṙ =
∂ṙ
m
pϕ
∂L
2
= mr ϕ̇ =⇒ ϕ̇ =
pϕ =
∂ ϕ̇
mr2
∂L
pz
pz =
= mż =⇒ ż = .
∂ż
m
pr =
Abbiamo che l’hamiltoniana è data da:
H = ṙpr + ϕ̇p ϕ + żpz − L =
!
!
p2ϕ
p2ϕ
1
1
2
2
2
2
=
pr + 2 + p z −
pr + 2 + pz + U (r, ϕ, z) =
m
r
2m
r
!
p2ϕ
1
=
p2r + 2 + p2z + U (r, ϕ, z).
2m
r
2. Scrivere l’hamiltoniana di una particella di massa m e carica q in un campo
elettromagnetico, i cui potenziali sono rispettivamente ϕ e A.
Soluzione. Nel capitolo 1 abbiamo visto che la lagrangiana della particella
carica nel campo elettromagnetico è data da
L=
q
1 2
mv − qϕ + A · v.
2
c
I momenti coniugati sono allora
q
p = ∇v L = mv + A.
c
Da qui ricaviamo la velocità in funzione dei momenti coniugati:
v=
q 1 p− A .
m
c
Allora l’hamiltoniana è:
H = v· p−L =
1 1 1 2 q
q 2
q
q =
p − A · p − m 2 p − A + qϕ −
A· p− A =
m
c
2 m
c
mc
c
2
2
1
q
q
1
q
=
p2 − 2 A · p + 2 A2 −
p − A + qϕ =
m
c
c
2m
c
1 q 2
=
p − A + qϕ.
2m
c
55
formalismo hamiltoniano
Possiamo anche scrivere le sei equazioni di Hamilton che descrivono il moto
della particella:
∂H
1 q ∂ϕ
ẋ =
=
px − Ax + q
∂p x
m
c
∂p x
∂H
1
q
∂ϕ
ẏ =
=
py − Ay + q
∂py
m
c
∂py
∂H
1 ∂ϕ
q ż =
=
pz − Az + q
∂pz
m
c
∂pz
∂H
1
q ∂A x
∂ϕ
q
ṗ x = −
=
−q
px − Ax
∂x
m
c
c ∂x
∂x
∂H
1 q q ∂Ay
∂ϕ
ṗy = −
=
py − Ay
−q
∂y
m
c
c ∂y
∂y
1 ∂ϕ
∂H
q q ∂Az
=
−q .
ṗz = −
pz − Az
∂z
m
c
c ∂z
∂z
Se i potenziali ϕ e A non dipendono esplicitamente dalle coordinate allora
il momento coniugato p risulta costante.
4.1.1 Un esempio
Supponiamo che le equazioni che definiscono le coordinate generalizzate non
dipendano esplicitamente dal tempo e che le forze in gioco derivino da un potenziale V funzione solo delle coordinate generalizzate. Vogliamo vedere come
possiamo scrivere l’hamiltoniana del sistema. Siano n i gradi di libertà e siano
q1 , . . . , qn le coordinate generalizzate. È semplice dimostrare che l’energia cinetica
si può scrivere
T=
1 n
τij (q)q̇i q̇ j
2 i,j∑
=1
dove q = (q1 , . . . , qn ). La lagrangiana è data da
L = T − V ( q ).
Il momento coniugato a qi è
pi =
∂L
=
∂q̇i
n
∑ τij (q)q̇ j .
j =1
La matrice simmetrica τ = τij è definita positiva ed è quindi invertibile. Allora
q̇ j =
n
∑
i =1
τ −1
ij
pi .
Si può dimostrare che nel nostro caso l’hamiltoniana è uguale all’energia totale,
cioè
n
H=
∑ q̇i pi − L(q, q̇) = T + V.
i =1
56
4.2 notazione simplettica
Osserviamo che
n 1 n
−1
−1
τ
(
q
)
pk pl =
τ
τ
ij
∑
2 i,j∑
ik
jl
=1
k,l =1
1 n −1 =
∑ τ ik δil pk pl =
2 i,k,l
=1
n 1
= ∑ τ −1 p i p k .
2 i,k=1
ik
T=
In definitiva otteniamo che:
H=
1 n −1 p i p k + V ( q ).
τ
2 i,k∑
ik
=1
Se τ è diagonale, lo sarà anche la sua inversa e dunque
H=
4.2
1 n −1 τ
p i 2 + V ( q ).
2 i∑
ii
=1
notazione simplettica
Le equazioni di Hamilton non trattano le coordinate generalizzate e i momenti
coniugati in modo simmetrico, come si evince immediatamente dalle (4.5). Accenniamo qui brevemente a un modo elegante di scrivere queste equazioni in forma
unitaria attraverso la cosiddetta notazione simplettica.
Se il sistema ha n gradi di libertà, possiamo costruire un vettore colonna formato
da 2n elementi (righe), e cioè:
ηi = q i ,
ηi + n = p i
(i = 1, . . . , n).
Il vettore colonna così costruito è dato da
 
q1
 .. 
 . 
 
 qn 

η=
 p1  .
 
 . 
 .. 
pn
Si ha ovviamente
∂H
∂H
=
,
∂ηi
∂qi
∂H
∂H
=
∂ηi+n
∂pi
(i = 1, . . . , n).
57
formalismo hamiltoniano
Definiamo la seguente matrice 2n × 2n formata da quattro matrici n × n:
J=
0n In
− In 0n
dove In è la matrice identità n × n e 0n è la matrice nulla n × n. Notiamo che
0n − In
T
−1
J =J =
.
In 0n
Si vede che J −1 = − J. Allora J 2 = − I2n e det J = 1. La matrice J è detta
matrice simplettica standard. Possiamo scrivere le equazioni di Hamilton nel modo
seguente
2n
η̇k =
∂H
∑ Jkj ∂ηj
(k = 1, . . . , 2n)
j =1
o in maniera sintetica
η̇ = J
∂H
.
∂η
Per maggiore chiarezza esplicitiamo il caso bidimensionale:
 
0
0
q̇1
 q̇2   0
0
 =
 ṗ1  −1 0
0 −1
ṗ2

1
0
0
0


− ṗ1
0


1
 − ṗ2  .


q̇1 
0
q̇2
0
Questa notazione è detta simplettica.
4.3
coordinate cicliche e metodo di routh
Sia H = H(q, p, t) l’hamiltoniana del sistema di particelle con n gradi di libertà, dove q = (q1 , . . . , qn ) e p = ( p1 , . . . , pn ) sono le coordinate canoniche (indipendenti).
Si ha:
dH
=
dt
n
n
∂H
∂H
∂H
q̇
+
j
∑ ∂q j
∑ ∂p j ṗ j + ∂t .
j =1
j =1
(4.14)
Per le equazioni di Hamilton (4.5) e per la (4.12), la (4.14) diventa:
n
n
dH
∂H
∂H
∂L
= − ∑ ṗ j q̇ j + ∑ q̇ j ṗ j +
=
=−
dt
∂t
∂t
∂t
j =1
j =1
(4.15)
dove L è la lagrangiana del nostro sistema. Si vede, allora, che l’hamiltoniana è
una costante del moto se non dipende in modo esplicito dal tempo (o, in maniera
equivalente, se la lagrangiana non dipende esplicitamente dal tempo).
58
4.3 coordinate cicliche e metodo di routh
Abbiamo avuto già modo di osservare che, se le equazioni di trasformazione che definiscono le coordinate generalizzate non dipendono esplicitamente dal
tempo e se il potenziale dipende solo dalle coordinate generalizzate, allora H coincide con l’energia totale ed è una costante del moto. Il fatto che H coincida con
l’energia totale e sia una costante del moto sono due risultati in qualche modo indipendenti. Possono cioè verificarsi situazioni in cui l’hamiltoniana è una costante
del moto ma non è uguale all’energia totale, e viceversa.1
Se qn è una coordinata ciclica, allora pn = ∂L/∂q̇n è una costante del moto. In
questo caso l’hamiltoniana del sistema sarà funzione della costante pn e non, ovviamente, di qn . Ponendo pn = α, abbiamo H = H(q1 , . . . , qn−1 ; p1 , . . . , pn−1 ; α; t),
cioè l’hamiltoniana è di fatto funzione di sole 2(n − 1) coordinate, essendo α
costante. Possiamo poi studiare l’evoluzione temporale delle coordinate generalizzate qn attraverso l’equazione canonica q̇n = ∂H/∂α.
Si possono combinare i vantaggi della formulazione hamiltoniana nel trattare le
coordinate cicliche con quelli della formulazione lagrangiana per lo studio delle
coordinate non cicliche con un metodo dovuto a Routh. In sostanza si effettua
una trasformazione di Legendre per passare dal sistema (q, q̇) al sistema (q, p)
solo per le coordinate cicliche, ricavando per esse le equazioni del moto in forma hamiltoniana mentre le rimanenti equazioni del moto rimangono espresse in
forma lagrangiana.
Supponiamo che qs+1 , . . . , qn siano coordinate cicliche. Introduciamo la seguente funzione di Routh (o routhiana):
R(q1 , . . . , qn ; q̇1 , . . . , q̇s ; ps+1 , . . . , pn ; t) =
n
∑
j = s +1
q̇ j p j − L(q1 , . . . , qn ; q̇1 , . . . , q̇n ; t) (4.16)
dove L è, ovviamente, la lagrangiana del sistema (notare che nella (4.16) non è
stata ancora inserita l’informazione che qs+1 , . . . , qn sono cicliche). Dalla (4.16)
otteniamo:
n
s ∂L
∂L
dR = ∑ (dq̇ j p j + q̇ j dp j ) − ∑
dq j +
dq̇ j +
∂q j
∂q̇ j
j = s +1
j =1
(4.17)
n ∂L
∂L
∂L
− ∑
dq j +
dq̇ j −
dt.
∂q j
∂q̇ j
∂t
j = s +1
Tenendo presente che per j = s + 1, . . . , n
∂L
= pj
∂q̇ j
∂L
=0
∂q j
la (4.17) diventa:
dR =
n
∑
j = s +1
s
q̇ j dp j − ∑
j =1
∂L
∂L
dq j +
dq̇ j
∂q j
∂q̇ j
−
∂L
dt.
∂t
(4.18)
1 Per una discussione articolata, arricchita da esempi, rimandiamo alla lettura di Goldstein, Poole e
Safko [7, pagine 328–332].
59
formalismo hamiltoniano
Dalla (4.18) si deduce che

∂L
∂R


 ∂q = − ∂q
j
j
per j = 1, . . . , s
∂R
∂L



=−
∂q̇ j
∂q̇ j

∂R


 ∂q = 0
j
per j = s + 1, . . . , n
∂R



= q̇ j
∂p j
Allora le equazioni di Lagrange per j = 1, . . . , s si possono scrivere mediante la
funzione di Routh:
d ∂R
∂R
−
= 0.
dt ∂q̇ j
∂q j
In conclusione la funzione di Routh è una funzione di Hamilton in rapporto alle coordinate cicliche qs+1 , . . . , qn e una funzione di Lagrange in rapporto alle
coordinate non cicliche q1 , . . . , qs . Osserviamo ad abundantiam che le coordinate
cicliche non compaiono esplicitamente nella lagrangiana e, quindi, nella funzione
di Routh, cioè:
R = R(q1 , . . . , qs ; q̇1 , . . . , q̇s ; ps+1 , . . . , pn ; t)
dove, per j = s + 1, . . . , n, i p j sono integrali primi del moto.
Vediamo un piccolo esempio. Una particella di massa m si muove in un campo
di forze centrali il cui potenziale è U = U (r ) con r distanza della particella dal
centro di forza. Sappiamo che il moto avviene in un piano (sempre che il momento
angolare rispetto al centro di forza, che è costante, sia diverso da zero). Possiamo
esprimere la lagrangiana della particella in tale piano in coordinate polari. Si ha:
L=
1
m(ṙ2 + r2 θ̇ 2 ) − U (r ).
2
Chiaramente θ è una coordinata ciclica. La funzione di Routh è definita nel modo
seguente:
R = θ̇ pθ − L,
dove pθ = ∂L/∂θ̇ = mr2 θ̇ è il momento coniugato a θ. Con semplici calcoli si
ricava che:
R=
1 p2θ
1
− mṙ2 + U (r ).
2
2m r
2
Osserviamo che ∂R/∂θ = 0 (e dunque pθ è una costante del moto), mentre
∂R/∂pθ = θ̇ = pθ /(mr2 ). Inoltre
d ∂R
∂R
−
= 0,
dt ∂ṙ
∂r
60
4.4 principio variazionale di hamilton modificato
cioè
mr̈ −
p2θ
+ U 0 (r ) = 0
mr3
(ricordiamo che −U 0 (r )r̂ è la forza centrale agente sulla particella).
Il metodo di Routh, che, in certi casi, può tornare utile ai fini del calcolo, non
è, in definitiva, altro che un ibrido concettuale tra la formulazione lagrangiana e
quella hamiltoniana, senza nulla aggiungere di sostanziale all’analisi e allo studio
di un sistema meccanico.
4.4
principio variazionale di hamilton modificato
Abbiamo visto che le equazioni di
R tLagrange possono essere ottenute dal principio
di Hamilton imponendo δS = δ t01 L(q, q̇, t) dt = 0, richiedendo cioè che il moto
reale, fra tutti i moti ammissibili nello spazio delle configurazioni, sia quello che
rende stazionaria l’azione. Se vogliamo dedurre le equazioni di Hamilton da un
principio variazionale occorre, in qualche modo, modificare il precedente principio, perché l’integrale possa essere valutato su percorsi del punto rappresentativo
del sistema nello spazio delle fasi. Nell’approccio hamiltoniano le coordinate
canoniche q e p sono considerate indipendenti nello spazio delle fasi; di conseguenza devono essere considerate indipendenti anche le loro variazioni. L’idea è
di considerare l’azione scritta nel modo seguente:
!
Z
S[q(t), p(t)] =
t1
t0
n
∑ p j q̇ j − H(q, p, t)
dt
(4.19)
j =1
con (q(t0 ) = q0 , p(t0 ) = p0 ) e (q(t1 ) = q1 , p(t1 ) = p1 ). Un moto nello spazio delle
fasi (q̃(t), p̃(t)) è ammissibile se (q̃(t0 ) = q0 , p̃(t0 ) = p0 ) e (q̃(t1 ) = q1 , p̃(t1 ) =
p1 ). Il moto reale nello spazio delle fasi è quello tra i moti ammissibili che rende
stazionaria l’azione (4.19), cioè
!
Z
δS = δ
t1
t0
n
∑ p j q̇ j − H(q, p, t)
dt = 0.
j =1
Questo principio variazionale di Hamilton modificato ha esattamente la stessa forma variazionale tipica in uno spazio delle configurazioni di dimensione 2n. Ripetendo i ragionamenti fatti nel capitolo 2, otteniamo 2n equazioni di tipo Lagrange
(o di Eulero-Lagrange), cioè
(
"
#)
"
#
n
n
d
∂
∂
p j q̇ j − H(q, p, t)
−
p j q̇ j − H(q, p, t) = 0 ⇐⇒
dt ∂q̇k j∑
∂qk j∑
=1
=1
∂H
⇐⇒ ṗk +
= 0,
∂qk
(
"
#)
"
#
n
n
d
∂
∂
p j q̇ j − H(q, p, t)
−
p j q̇ j − H(q, p, t) = 0 ⇐⇒
dt ∂ ṗk j∑
∂pk j∑
=1
=1
61
formalismo hamiltoniano
⇐⇒ q̇k −
∂H
=0
∂pk
che sono nell’ordine la seconda e la prima equazione di Hamilton. Osserviamo
infine che il principio variazionale di Hamilton modificato è formulato in modo
tale che agli estremi per i = 1, . . . , n non solo δqi = 0 ma anche δpi = 0. Una conseguenza immediata di questa considerazione è che, se F (q, p, t) è una funzione
di classe opportuna (liscia), allora
n
∑ p j q̇ j − H(q, p, t) +
j =1
dF (q, p, t)
dt
(4.20)
dà luogo alle stesse equazioni di Hamilton.
4.5
parentesi di poisson
Supponiamo di avere un sistema lagrangiano con n gradi di libertà. Indichiamo come al solito con q = (q1 , . . . , qn ) le coordinate generalizzate e con p =
( p1 , . . . , pn ) i momenti coniugati individuando così il nostro sistema (q, p) di coordinate canoniche. Sia H(q, p, t) l’hamiltoniana del sistema. Supponiamo di avere
una funzione f (q, p, t) : F × R → R di classe opportuna, indicato con F lo spazio
delle fasi. Una funzione siffatta è detta anche variabile dinamica. Tenendo conto
delle equazioni di Hamilton si ha:
n df
∂f
∂f
∂f
=∑
q̇ j +
ṗ j +
=
dt
∂q
∂p
∂t
j
j
j =1
n ∂ f ∂H
∂f
∂f
∂ f ∂H
−
+
= { f , H}q,p +
=∑
∂q
∂p
∂p
∂q
∂t
∂t
j
j
j
j
j =1
dove
{ f , H}q,p =
n
∑
j =1
∂ f ∂H
∂ f ∂H
−
∂q j ∂p j
∂p j ∂q j
è detta parentesi di Poisson2 di f e H rispetto al sistema di coordinate canoniche
(q, p). Si noti che l’ordine delle variabili (q, p) non è indifferente. Si vede subito
che f è una costante del moto se { f , H}q,p + ∂ f /∂t = 0. In particolare se la
variabile dinamica f non dipende esplicitamente dal tempo,
df
= 0 ⇐⇒ { f , H}q,p = 0.
dt
Più in generale, se abbiamo due variabili dinamiche f (q, p, t) e g(q, p, t), si definisce parentesi di Poisson di f e g rispetto alle coordinate canoniche (q, p) la quantità:
{ f , g} =
n
∑
j =1
∂ f ∂g
∂ f ∂g
−
.
∂q j ∂p j
∂p j ∂q j
(4.21)
2 Talvolta per semplicità di notazione quando ciò non comporta equivoci il pedice alle parentesi è
omesso. Inoltre la parentesi di Poisson è talvolta indicata in letteratura con il simbolo [·, ·] o [·, ·] PB .
62
4.5 parentesi di poisson
Le parentesi di Poisson godono delle seguenti proprietà (siano f , g, f 1 , f 2 , g1 , g2
variabili dinamiche arbitrarie):
1. { f , g} = −{ g, f }, da cui ovviamente { f , f } = 0;
2. se c è costante rispetto alle coordinate canoniche, allora { f , c} = 0;
3. { f 1 + f 2 , g} = { f 1 , g} + { f 2 , g} e { f , g1 + g2 } = { f , g1 } + { f , g2 }, ovvero le
parentesi sono operatori lineari;
4. { f 1 · f 2 , g} = f 1 { f 2 , g} + f 2 { f 1 , g};
5. si dimostra la seguente identità, per nulla banale, detta di Jacobi:
{ f , { g, h}} + { g, {h, f }} + {h, { f , g}} = 0
Valgono inoltre le seguenti relazioni:
∂f
∂g
∂
{ f , g} =
, g + f,
;
•
∂t
∂t
∂t
• { f , qj } = −
∂f
∂f
e { f , pj } =
∂p j
∂q j
• {qi , q j } = 0, { pi , p j } = 0, {qi , p j } = δij (parentesi di Poisson fondamentali).
Notiamo per inciso che le equazioni di Hamilton possono essere scritte anche nel
modo seguente:
∂H
= { q k , H},
∂pk
∂H
ṗk = −
= { p k , H}.
∂qk
q̇k =
(4.22)
Osserviamo come l’asimmetria delle equazioni di Hamilton “scompaia” utilizzando le parentesi di Poisson.
Esercizi
1. Dimostrare l’identità di Jacobi nel caso in cui n = 1.
2. Dimostrare che se due variabili dinamiche f e g, che non dipendono esplicitamente dal tempo, sono entrambe integrali primi del moto, allora anche
{ f , g} è un integrale primo del moto (Suggerimento: utilizzare l’identità di
Jacobi e il fatto che d f /dt = 0 ⇐⇒ { f , H} = 0, dove H è l’hamiltoniana).
3. Dimostrare che, se due variabili dinamiche f e g (in generale dipendenti
dal tempo) sono entrambe integrali primi del moto, allora anche { f , g} è un
integrale primo del moto (questo è il teorema di Poisson).
63
formalismo hamiltoniano
4. Sia dato un punto materiale di massa m e sia l’hamiltoniana del nostro sistema H( x1 , x2 , x3 , p1 , p2 , p3 , t), in coordinate cartesiane. Dimostrare, utilizzando le parentesi di Poisson fondamentali, che { L j , pk } = ε jkl pl , dove ε jkl è
il simbolo di Levi-Civita, o delle permutazioni di 1, 2, 3.3 Analogamente si
può vedere che { L j , Lk } = ε jkl Ll e { L j , L2 } = 0.
5. Supponiamo di avere un punto materiale in un potenziale a simmetria sferica. Si scriva in coordinate sferiche l’hamiltoniana e il momento angolare
della particella rispetto al centro della forza. Calcolare { L2 , H}, { L, H}.
4.6
trasformazioni canoniche
Le equazioni differenziali del moto, nel formalismo hamiltoniano, benché del primo ordine, non semplificano, in generale, i calcoli rispetto a quelle del formalismo
lagrangiano. La novità nell’approccio hamiltoniano risiede nel fatto che le coordinate e i momenti coniugati hanno la stessa rilevanza. Esistono casi in cui tutte
le n coordinate generalizzate sono cicliche; in tale circostanza tutti i momenti coniugati sono costanti del moto. Se poniamo per semplicità pi = αi (costante) per
i = 1, . . . , n, allora q̇i = ∂H(α1 , . . . , αn )/∂αi = ωi , valore costante, e quindi integrando si ha qi (t) = ωi t + qi (0). Abbiamo visto come sia possibile, in questo caso,
integrare banalmente le equazioni del moto.
Il fatto rilevante è che esistono problemi meccanici (quelli cosiddetti integrabili)
per i quali è possibile avere n coordinate generalizzate cicliche. Naturalmente punto fondamentale è saper passare da un sistema di coordinate canoniche (q, p) a
un altro sistema di coordinate canoniche ( Q, P ), anche per ricercare, ove esistano,
coordinate generalizzate cicliche.
Un modo, potremmo dire naturale, per ottenere nuove coordinate canoniche relative a un sistema meccanico lagrangiano (e quindi hamiltoniano) è di partire da
trasformazioni nello spazio delle configurazioni Q = Q(q, t), esprimere la lagrangiana in termini di Q e Q̇, ottenere i momenti coniugati corrispondenti tramite
la relazione Pi = ∂L/∂ Q̇i e infine riscrivere l’hamiltoniana in funzione di ( Q, P ),
nuove coordinate canoniche, ed eventualmente del tempo in modo esplicito. Si
può avere una trasformazione da un sistema di coordinate canoniche (q, p) a un
altro ( Q, P ) in maniera più generale, considerando (nello spazio delle fasi) come
indipendenti le coordinate generalizzate e i momenti coniugati (ricordiamo che
questo assunto è tipico della formulazione hamiltoniana). Si può, in altre parole, avere nello spazio delle fasi una trasformazione simultanea delle coordinate
generalizzate e dei momenti coniugati, cioè:
Q = Q(q, p, t)
(4.23)
P = P (q, p, t)
con (q, p) e ( Q, P ) vecchie e nuove, rispettivamente, coordinate canoniche. Trasformazioni di questo tipo, nello spazio delle fasi, sono dette canoniche e permettono, in termini delle nuove coordinate canoniche ( Q, P ), una nuova descrizione
3 Per la definizione di tale simbolo vedi l’appendice C.
64
4.6 trasformazioni canoniche
equivalente della dinamica del nostro sistema meccanico, se, ovviamente, esiste
una nuova hamiltoniana funzione di ( Q, P, t), che dia luogo alle equazioni di
Hamilton. Possiamo in definitiva dare la seguente
Definizione (di trasformazione canonica) - Se (q, p) è un sistema di coordinate
canoniche con hamiltoniana H(q, p, t),
Q = Q(q, p, t)
P = P (q, p, t)
è una trasformazione canonica se esiste una nuova hamiltoniana K( Q, P, t) che
permette di scrivere le equazioni del moto nella forma

∂K


 Q̇i = ∂P
i
,

∂K

 Ṗi = −
∂Qi
con i = 1, . . . , n.
Sottolineiamo una proprietà rilevante delle trasformazioni canoniche (proprietà
che sarà evidente in seguito): le trasformazioni canoniche sono indipendenti dal
problema fisico specifico. In altre parole la trasformazione (q, p, t) → ( Q, P, t),
se è canonica per un particolare sistema meccanico, è canonica per tutti i sistemi
meccanici con lo stesso numero di gradi di libertà.
Abbiamo visto che le equazioni di Hamilton possono essere ottenute dal principio di Hamilton modificato, cioè
!
Z
δS = δ
t1
t0
n
∑ pi q̇i − H(q, p, t)
dt = 0.
i =1
Analogamente, se Q e P sono le nuove coordinate canoniche e K( Q, P, t) è la
nuova hamiltoniana, il principio di Hamilton modificato diventa:
!
Z
δS = δ
t1
t0
n
∑ Pi Q̇i − K(Q, P, t)
dt = 0.
i =1
Poiché le variazioni delle coordinate canoniche (relative a tutti i moti ammissibili
nello spazio delle fasi) devono essere nulle agli estremi, deve valere (vedi la (4.20))
la seguente relazione (trasformazione canonica):
n
n
i =1
i =1
∑ pi q̇i − H(q, p, t) = ∑ Pi Q̇i − K(Q, P, t) +
dF
dt
(4.24)
dove F (q, p, t), che supponiamo liscia, è detta funzione generatrice della trasformazione canonica (4.24). La relazione (4.24) può essere scritta:
n
n
i =1
i =1
∑ pi dqi − ∑ Pi dQi − (H − K) dt = dF.
(4.25)
65
formalismo hamiltoniano
La struttura della (4.25) induce a prendere in considerazione la sottoclasse di
trasformazioni in cui è possibile scegliere (q, Q) come variabili indipendenti in
∂p
luogo di (q, p). Richiediamo allora che p = p(q, Q, t) abbia4 det ∂Q 6= 0 e P =
P (q, Q, t). La funzione generatrice è detta, in questo caso, di tipo 1. Si ha:
F (q, p, t) = F (q, p(q, Q, t), t) = F1 (q, Q, t).
La relazione (4.25) può, allora, essere scritta in questo caso:
n
n
i =1
i =1
n
∑ pi dqi − ∑ Pi dQi − (H − K) dt =
=
n
∂F1
∂F1
∂F1
dqi + ∑
dQi +
dt
∂qi
∂Qi
∂t
i =1
i =1
∑
Di conseguenza, per i = 1, . . . , n:
∂F1
(4.26)
∂qi
∂F1
Pi = −
(4.27)
∂Qi
∂F1
.
(4.28)
K = H+
∂t
Una volta nota la funzione generatrice di tipo 1, tramite la (4.26) si ottiene
pi =
p = p(q, Q, t)
(4.29)
e tramite la (4.28)
P = P (q, Q, t).
Invertendo poi la (4.29), si ottiene Q = Q(q, p, t); si può pertanto esprimere anche
P in funzione di (q, p, t). Osserviamo che l’inversione è garantita dalla proprietà
di non degenerazione
det
∂p
∂2 F1
= det
6= 0.
∂Q
∂q ∂Q
Possiamo riassumere il discorso appena fatto nel modo seguente:
Per ogni funzione F1 (q, Q, t) liscia, soggetta alle proprietà di non
degenerazione, la trasformazione (q, p, t) → ( Q, P, t), definita, per i =
1, . . . , n, da

∂F1


 pi = ∂q
i

∂F

 Pi = − 1
∂Qi
e dalla formula inversa Q = Q(q, p, t), è canonica; a ogni hamiltoniana
H(q, p, t) corrisponde l’hamiltoniana K = H + ∂F1 /∂t. In particolare,
se ∂F1 /∂t = 0, K = H.
4 Ovvero la matrice jacobiana ∂ p/∂Q = ∂ pk /∂Q j è assunta non singolare.
66
4.6 trasformazioni canoniche
Vediamo alcuni esempi di trasformazioni di tipo 1 per sistemi a un grado di
libertà:
• Sia F1 = qQ la funzione generatrice di tipo 1 (n = 1). Allora p = Q e P = −q.
Vale a dire, (q, p) → ( p, −q) è una trasformazione canonica. Inoltre K = H.
Notare che la trasformazione canonica è indipendente dal sistema fisico in
esame.
p
• F1 = q2 Q2 /2. Allora: p = ∂F1 /∂q = qQ2 =⇒ Q =
p/q e P =
√
2
−∂F1 /∂Q p= −q Q =⇒ P = −q pq. La trasformazione canonica è
√
(q, p) → ( q/p, −q qp) con K = H.
• F1 = etq Q. Abbiamo: p = ∂F1 /∂q = t etq Q =⇒ Q = e−tq p/t e P =
−∂F1 /∂Q = − etq =⇒ P = − etq . La trasformazione canonica è (q, p) →
(e−tq p/t, − etq ) con K = H + ∂F1 /∂t = H − QP ln(− P)/t.5
Può capitare che non sia possibile avere una funzione generatrice di tipo 1.
Questo accade se p può essere funzione di (q, P, t) e non di (q, Q, t). Allora si
può porre:
n
F = F2 (q, P, t) − ∑ Qi Pi .
i =1
La relazione (4.25) diventa in questo caso
n
n
i =1
i =1
n
n
i =1
i =1
i dQi − (H − K) dt = dF2 − ∑ Qi dPi − ∑ P
i dQi
∑ pi dqi − ∑P
ovvero
n
n
i =1
i =1
∑ pi dqi + ∑ Qi dPi − (H − K) dt = dF2 .
(4.30)
F2 è detta funzione generatrice di tipo 2. Dalla (4.30) otteniamo
∂F2
,
∂qi
∂F2
Qi =
,
∂Pi
(4.31)
pi =
K = H+
(4.32)
∂F2
∂t
(i = 1, . . . , n).
Notiamo che bisogna imporre la condizione di non degenerazione det ∂ p/∂P =
∂2 F2
det ∂q
∂P 6 = 0. Invertendo la (4.31) otteniamo P = P ( q, p, t ) e, quindi, nella (4.32)
Q in funzione (q, p, t).
Facciamo ora alcuni esempi per sistemi a un grado di libertà:
5 Come in tutti gli altri casi, nell’analisi di un problema fisico, dopo aver effettuato la trasformazione
canonica bisognerà esprimere anche H in funzione delle nuove coordinate canoniche Q e P.
67
formalismo hamiltoniano
• F2 = qP; allora p = ∂F2 /∂q = P e Q = ∂F2 /∂P = q. Otteniamo cioè la
trasformazione canonica identica, con K = H.
• F2 = (q + αP)2 /2, con α > 0. Allora p = ∂F2 /∂q = q + αP =⇒ P =
( p − q)/α, mentre Q = ∂F2 /∂P = α(q + αP) = α(q + p − q) = αp. La
trasformazione canonica è dunque (q, p) → (αp, ( p − q)/α), con K = H.
Può accadere che siano scelte come variabili indipendenti p e Q. In tal caso
∂q
q = q( p, Q, t), con la condizione det ∂Q 6= 0. Allora
n
F = F3 ( p, Q, t) + ∑ qi pi .
(4.33)
i =1
La funzione generatrice si dice in tal caso di tipo 3. La relazione (4.25) diventa per
la (4.33)
n
n
n
i =1
i =1
n
i dqi − ∑ Pi dQi − (H − K) dt = dF3 + ∑ qi dpi + ∑ p
i dqi =⇒
∑ p
i =1
n
n
i =1
i =1
i =1
− ∑ qi dpi − ∑ Pi dQi − (H − K) dt = dF3
da cui
∂F3
,
∂pi
∂F3
Pi = −
,
∂Qi
∂F3
K = H+
∂t
(4.34)
qi = −
(4.35)
(i = 1, . . . , n).
∂q
La condizione det ∂Q 6= 0 può pertanto essere scritta, in base alla (4.34) co2
∂ F3
me det ∂p
∂Q (condizione di non degenerazione). Proponiamo alcuni esempi di
funzioni generatrici siffatte sempre nel caso di sistemi a un grado di libertà:
• F3 = − pQ. Allora q = −∂F3 /∂p = Q e P = −∂F2 /∂Q = p. In questo caso
la trasformazione canonica è la trasformazione identica, cioè (q, p) → (q, p),
con K = H.
• F3 = − e p+Q . Allora q = −∂F3 /∂p = e p+Q > 0 =⇒ Q = ln q − p e
P = −∂F2 /∂Q = e p+Q = q e p e− p = q. La trasformazione canonica è, allora,
la seguente: (q, p) → (ln q − p, q), con q > 0 e K = H.
Se sono scelte come variabili indipendenti p e P, abbiamo q = q( p, P, t) con la
condizione
det
∂q
6= 0
∂P
(4.36)
e
n
n
i =1
i =1
F = F4 ( p, P, t) + ∑ qi pi − ∑ Qi Pi .
68
(4.37)
4.6 trasformazioni canoniche
La funzione generatrice è detta di tipo 4. La relazione (4.25) diventa per la (4.37):
n
n
i dqi − ∑ P
i dQi − (H − K) dt =
∑p
i =1
n
i =1
n
n
n
= dF4 + ∑ qi dpi + ∑ p
i dqi − ∑ Qi dPi − ∑ P
i dQi =⇒
i =1
n
n
i =1
i =1
i =1
i =1
i =
1
− ∑ qi dpi + ∑ Qi dPi − (H − K) dt = dF4
da cui
∂F4
,
∂pi
∂F4
,
Qi =
∂Pi
∂F4
K = H+
∂t
(4.38)
qi = −
(4.39)
(i = 1, . . . , n).
2
∂ F4
La condizione det ∂P 6= 0 può essere scritta in base alla (4.38) come det ∂P
∂p 6 = 0.
Per esempio, se, per n = 1, F4 = pP, allora q = −∂F4 /∂p = − P ⇐⇒ P = −q
e Q = ∂F4 /∂P = p. La trasformazione canonica è, pertanto, la seguente: (q, p) →
( p, −q), con K = H.
Osserviamo, infine, che una funzione generatrice non deve essere necessariamente una dei quattro tipi per tutti i gradi di libertà. Si può usare una funzione
generatrice che mescoli i quattro tipi. Così per n = 2
∂q
F = F23 (q1 , p2 ; P1 , Q2 ; t) − Q1 P1 + q2 p2
rappresenta una funzione generatrice di tipo 2 per il primo grado di libertà e di
tipo 3 per il secondo.
Accenniamo infine (senza dimostrazioni) a una bella proprietà riguardante le
parentesi di Poisson e le trasformazioni canoniche.6 Sia data una trasformazione
canonica:
Q = Q(q, p, t)
.
(4.40)
P = P (q, p, t)
Se f ( Q, P, t) e g( Q, P, t) sono due variabili dinamiche, si può dimostrare che:
{ f ( Q, P, t), g( Q, P, t)}Q,P =
= { f ( Q(q, p, t), P(q, p, t), t), g( Q(q, p, t), P(q, p, t), t)}q,p ,
ovvero le parentesi di Poisson sono invarianti per trasformazioni canoniche. In particolare abbiamo
{ Q j , Qk }Q,P = { Q j , Qk }q,p = 0
{ Pj , Pk }Q,P = { Pj , Pk }q,p = 0
{ Q j , Pk }Q,P = { Q j , Pk }q,p = δjk .
(4.41a)
(4.41b)
(4.41c)
6 Per una dimostrazione di questa proprietà vedi Landau e Lifšits [11, pagina 211].
69
formalismo hamiltoniano
Inoltre si può far vedere che, se (q, p) sono coordinate canoniche, le trasformazioni (4.40) sono canoniche solo se sono soddisfatte le (4.41). In definitiva, assegnate
le trasformazioni, il test basato sulle parentesi di Poisson è conclusivo per stabilire se esse sono canoniche senza passare per le funzioni generatrici o precisare
specifici problemi fisici.
Esempi
1. Si consideri un oscillatore armonico monodimensionale. Usando la funzione
generatrice di tipo 1
1
mωq2 cot Q
2
con m, ω costanti positive, determinare la trasformazione canonica e integrare le equazioni del moto.
F1 (q, Q) =
Soluzione. Dalla funzione generatrice abbiamo:
∂F1
= mωq cot Q
∂q
∂F1
1
1
P=−
= mωq2 2 .
∂Q
2
sin Q
p=
Ricaviamo q e p in funzione di Q e P:
r
2P
sin Q
q=
mω
√
p = 2Pmω cos Q.
Se k = mω 2 è la costante elastica, l’hamiltoniana rispetto alle usuali coordinate è:
1 p2 1
+ mω 2 q2 ,
2m
2
quindi nelle nuove coordinate:
H=
K( Q, P) = H(q( Q, P), p( Q, P)) =
1 2Pmω
1
2P
cos2 Q + mω 2
sin2 Q =
2 m
2
mω
= ωP.
Dunque Q è una coordinate ciclica e il suo momento coniugato P è costante, inoltre l’energia coincide con l’hamiltoniana e quindi si conserva.
Dall’equazione di Hamilton risulta:
∂K
=ω
∂P
e l’equazione del moto si riduce a
Q̇ =
Q = ωt + Q0 ,
dove Q0 è una costante di integrazione da determinare dalle condizioni
iniziali.
70
4.6 trasformazioni canoniche
2. Data la trasformazione del secondo tipo a un grado di libertà
3/2
2√
P
F2 (q, P) =
2am
+q
,
3
ma
con m, a costanti positive, determinare le trasformazioni canoniche Q =
Q(q, p), P = P(q, p). Scrivere l’hamiltoniana H(q, p) di una particella di
massa m in moto unidimensionale con accelerazione costante a. Effettuare inoltre la trasformazione canonica su questa hamiltoniana: K( Q, P) =
H(q( Q, P), p( Q, P)) e integrare le equazioni del moto.
Soluzione. Dalla trasformazione abbiamo:
1/2
√ P
∂F2
p=
= m 2a
+q
∂q
ma
√ 1/2
∂F2
P
2a
Q=
.
=
+q
∂P
a
ma
Dividendo membro a membro:
Q
1
p
=
=⇒ Q =
p
ma
ma
e, dalla prima equazione:
P=
p2
− maq.
2m
Nel problema fisico proposto, l’hamiltoniana coincide con l’energia totale
del sistema quindi:
H=
1 p2
− maq = P.
2m
La funzione generatrice della trasformazione non dipende esplicitamente
dal tempo, pertanto K = H = P. Le equazioni di Hamilton sono allora:
∂K
=1
∂P
∂K
Ṗ =
= 0,
∂Q
Q̇ =
cioè P è costante, quindi anche l’energia del sistema si conserva. Si poteva
giungere a questo risultato anche osservando che la coordinata Q è ciclica.
Integrando la prima delle equazioni di Hamilton abbiamo
Q ( t ) = t + Q0 =
p(t)
,
ma
dove Q0 è una costante di integrazione. Scegliendo l’origine dei tempi in
modo che risulti Q0 = 0 abbiamo
p(t) = mat.
71
formalismo hamiltoniano
3. Siano (q, p) le coordinate canoniche. La trasformazione
Q=p
P=q
è canonica?
Soluzione. Risulta
{ Q, P}q,p = { p, q}q,p = −1
quindi la trasformazione non è canonica.
4. Siano (q, p) le coordinate canoniche. Determinare se la trasformazione
(
Q = 2q + p2
p
P=
2
è canonica.
Soluzione. Risulta:
{ Q, P}q,p = {2q + p2 , p/2}q,p = {2q, p/2} + { p2 , p/2} = {2q, p/2} =
2
= {q, p} = 1
2
dunque la trasformazione è canonica. Troviamo la funzione generatrice di
tipo 2:

∂F2


= 2P
p =
∂q


 Q = ∂F2 = 2q + 4P2
∂P
Integrando la prima equazione del sistema abbiamo:
F2 = 2qP + g( P)
dove g( P) è una costante di integrazione dipendente da P. Sostituendo nella
seconda equazione ricaviamo:
∂F2
4
= 2q + g0 ( P) = 2q + 4P2 =⇒ g0 ( P) = 4P2 =⇒ g( P) = P3 + c,
∂P
3
in cui c è una costante di integrazione. Facendo in modo che risulti c = 0, la
funzione generatrice diventa:
4
F2 = 2qP + P3 .
3
72
4.7 equazioni di hamilton-jacobi
5. Data la trasformazione
Q = α ln p
P = −q β p
determinare per quali valori delle costanti α e β è canonica. Scrivere inoltre
la funzione generatrice di tipo 1 associata.
Soluzione. Affinché la trasformazione sia canonica deve risultare
1 = { Q, P}q,p = {α ln p, −q β p}q,p =
=
∂α ln p ∂(−q β p) ∂α ln p ∂(−q β p)
−
= αβq β−1 .
∂q
∂p
∂p
∂q
Poiché α e β sono costanti abbiamo β − 1 = 0 =⇒ β = 1 e quindi α = 1. La
trasformazione è allora:
Q = ln p
P = −qp
Troviamo la funzione generatrice di tipo 1:

∂F1
Q


 p = ∂q = e

∂F

 P = − 1 = −qp
∂Q
Integrando la prima equazione si ottiene:
F1 = q eQ + g( Q)
con g( Q) costante di integrazione dipendente da Q. Sostituendo nella seconda abbiamo:
∂F1
= q eQ + g0 ( Q) = q eQ =⇒ g( Q) = c
∂Q
dove c è una costante di integrazione. Posto c = 0 la funzione generatrice è:
F1 = q eQ .
4.7
equazioni di hamilton-jacobi
Abbiamo visto che nell’approccio hamiltoniano il moto di un sistema meccanico
nello spazio delle fasi con n gradi di libertà è determinato dalla soluzione di 2n
equazioni differenziali ordinarie del primo ordine rispetto al tempo, che coinvolgono 2n variabili dipendenti dal tempo (le coordinate canoniche) e una variabile
indipendente (il tempo appunto).
73
formalismo hamiltoniano
Vogliamo ora far vedere che lo stesso problema fisico può essere risolto in
un modo completamente diverso: attraverso la determinazione di una funzione7 S(q1 , . . . , qn ; t) soluzione di un’equazione differenziale alle derivate parziali,
contenente n + 1 derivate parziali del primo ordine rispetto a q1 , . . . , qn e a t.
Supposta nota l’hamiltoniana del sistema in esame H(q, p, t), con q = (q1 , . . . , qn )
e p = ( p1 , . . . , pn ) coordinate canoniche, assumiamo che esista una trasformazione
canonica Q = Q(q, p, t) e P = P (q, p, t) che dia luogo a una nuova hamiltoniana
K nulla. In questo caso, per i = 1, . . . , n:
∂K
=0
∂Pi
∂K
=0
Ṗi = −
∂Qi
Q̇i =
cioè Q e P sono costanti nel tempo. Se F è la funzione generatrice, abbiamo la
condizione
H(q, p, t) +
∂F
= 0.
∂t
(4.42)
Se facciamo l’ipotesi che la funzione generatrice sia del secondo tipo, abbiamo
che:
pi =
∂F2 (q, P, t)
∂qi
(i = 1, . . . , n).
L’equazione (4.42) può essere pertanto riscritta:
∂F2
∂F2
H q,
,t +
= 0.
∂q
∂t
(4.43)
La (4.43) è nota come equazione di Hamilton-Jacobi ed è, per la funzione generatrice, un’equazione differenziale alle derivate parziali prime nelle n + 1 variabili
(q1 , . . . , qn , t). F2 è, in letteratura, indicata usualmente col simbolo S. La funzione
S è detta funzione principale di Hamilton. Supponiamo che esista una soluzione
completa del tipo S = S(q1 , . . . , qn ; α1 , . . . , αn+1 ; t) dove α1 , . . . , αn+1 sono costanti
di integrazione indipendenti. L’equazione di Hamilton-Jacobi non dà informazioni sui nuovi momenti Pi da cui dovrebbe dipendere S. Sappiamo che questi nuovi
momenti sono tutti costanti. Osserviamo che nella (4.43) la funzione S non compare direttamente ma solo mediante le derivate parziali rispetto a qi e a t. Allora,
se S è soluzione dell’equazione di Hamilton-Jacobi, anche S+costante è soluzione.
Questa proprietà implica che una delle n + 1 costanti di integrazione deve comparire come costante additiva. Si può, allora, scegliere una soluzione completa che
dipende da n costanti indipendenti, cioè:
S = S ( q1 , . . . , q n ; α1 , . . . , α n ; t ).
(4.44)
Possiamo benissimo scegliere queste costanti esattamente uguali ai nuovi momenti: Pi = αi . Questa scelta non contraddice l’ipotesi iniziale che la funzione generatrice della trasformazione canonica sia di tipo 2 e quindi che p = p(q, P, t). Si
7 In realtà, come vedremo, S dipende in generale anche da n + 1 costanti arbitrarie
74
4.7 equazioni di hamilton-jacobi
possono scegliere i nuovi momenti, essendo costanti, assegnando al tempo t = 0
q e p. In particolare, sappiamo che
pi =
∂S
(q; α; t)
∂qi
(4.45)
con α = (α1 , . . . , αn ); invertendo la (4.45) possiamo ottenere α al tempo t = 0 in
funzione di q e p. Le nuove coordinate generalizzate sono date da:
Qi =
∂S
= βi
∂αi
(costanti).
(4.46)
Le costanti β i possono essere calcolate conoscendo i valori al tempo t = 0 delle coordinate canoniche. Possiamo poi, invertendo le trasformazione canoniche,
esprimere le vecchie coordinate canoniche (q, p) in funzione delle nuove ( β, α):8
q = q( β, α, t)
(4.47)
p = p( β, α, t)
Queste relazioni ci dicono che possiamo ottenere, mediante una trasformazione
canonica, le coordinate canoniche (q, p) in funzione del tempo, cioè di determinare il moto del sistema nello spazio delle fasi una volta che siano assegnate le
condizioni iniziali. Le relazioni (4.47) ci danno, in altre parole, la soluzione delle
equazioni di Hamilton, noti q(0) e p(0).
Da un punto di vista matematico abbiamo ottenuto un’equivalenza tra un’equazione differenziale alle derivate parziali in n + 1 variabili del primo ordine e
2n equazioni differenziali ordinarie del primo ordine. Questa equivalenza può
essere, nel nostro caso, imputata al fatto che sia l’equazione di Hamilton-Jacobi
sia le equazioni di Hamilton derivano dal medesimo principio di Hamilton modificato. Possiamo ora cercare di comprendere il significato fisico della funzione
generatrice del secondo tipo S. Osserviamo che, essendo α quantità costanti,
dS(q, α, t)
=
dt
∂S
∑ ∂qi q̇i +
i
∂S
.
∂t
(4.48)
Se teniamo presenti le (4.45), la (4.48) diventa:
dS(q, α, t)
=
dt
∑ pi q̇i +
i
∂S
=
∂t
∑ pi q̇i − H
(4.49)
i
dove abbiamo tenuto conto della (4.42). Balza evidente dalla (4.49) e da quanto
detto sul principio di Hamilton modificato che S rappresenti (a meno di costanti
additive) l’azione.
Vediamo un caso particolare.9 Supponiamo che H non dipenda esplicitamente
dal tempo. Allora la funzione principale di Hamilton deve avere la seguente
struttura:
S(q, α, t) = W (q, α) − at
(4.50)
8 β = ( β 1 , . . . , β n ), α = ( α1 , . . . , α n ).
9 Vi invito a leggere e a studiare anche gli esempi riportati in Goldstein, Poole e Safko [7, pagine 413418].
75
formalismo hamiltoniano
dove W (q, α) è detta funzione caratteristica di Hamilton. Osserviamo che
pi =
∂S
∂W
=
.
∂qi
∂qi
Allora
dW
=
dt
∑
i
∂W
q̇i =
∂qi
∑ pi q̇i
i
e quindi
W=
∑
i
4.8
Z
pi dqi .
variabili angolo-azione nel caso unidimensionale
Sia H(q, p) l’hamiltoniana nel nostro sistema a un solo grado di libertà, con (q, p)
coordinate canoniche.
Supponiamo che il sistema abbia un moto periodico e che esista una trasformazione canonica (indipendente dal tempo) (q, p) → (ψ, J ), indotta da una funzione
generatrice di tipo 1 F1 (q, ψ) indipendente dal tempo, in modo tale che ψ sia ciclica.10 Ovviamente il nuovo momento coniugato J è una costante del moto e
H = H( J ). Abbiamo, per la prima equazione di Hamilton, ψ̇ = ∂ H ( J )/∂J = ω
(costante), da cui ψ(t) = ωt + ψ0 .
Poiché, per ipotesi, il moto è periodico, le coordiante canoniche q e p saranno
funzioni periodiche. Avremo come conseguenza che il moto deve essere periodico
in ψ. Assumiamo che il periodo sia 2π. La nuova coordinata generalizzata ψ è
detta variabile angolo, mentre J è detta variabile azione e assume il ruolo di momento
angolare. Per quanto detto, F1 (q, ψ) deve essere periodica rispetto a ψ di periodo
2π:
dF1 =
∂F1
∂F1
dq +
dψ = p dq − J dψ.
∂q
∂ψ
Dopo un periodo, F1 torna al valore iniziale e ψ consegue una variazione di 2π.
0=
I
dF1 =
I
p dq − J
Z 2π
0
dψ =
I
1
p dq − 2π J =⇒ J =
2π
I
p dq.
Questa relazione può essere presa proprio come definizione della variabile azione.
4.8.1 Esempio: l’oscillatore armonico unidimensionale
L’oscillatore armonico unidimensionale ha hamiltoniana
H=
1 2 1 2
p + kq ,
2m
2
10 Ricordiamo che l’hamiltoniana non cambia, cioè K = H.
76
4.8 variabili angolo-azione nel caso unidimensionale
dove m è la massa della particella e k > 0 è una costante. Possiamo porre ω 2 =
k/m e riscrivere l’hamiltoniana:
1 2 1 2 2
p + ω mq = E.
2m
2
H=
E, l’energia totale, è costante e il suo valore è fissato dalle condizioni iniziali.
Pertanto:
q
p = 2mE − m2 ω 2 q2
F1 (q, ψ) =
=
Z
Per calcolare I =
√
dF1 =
Z q
Z
p dq − J
Z
dψ =
2mE − m2 ω 2 q2 dq − J
Rp
Z
dψ.
2mE − m2 ω 2 q2 dq, poniamo sin θ =
p
m/(2E)ωq. Allora
Z r
Z
E
mω 2 q2
2E
sin 2θ
2
cos θ dθ =
I = 2mE
1−
dq =
θ+
,
2E
ω
ω
2
p
dove ovviamente θ = arcsin( m/(2E)ωq). Osserviamo che in questi casi abbiamo
J=
1
2π
I
p dq =
E
,
ω
cioè
E = Jω.
In base poi al calcolo di I possiamo scrivere esplicitamente F1 (q, ψ) in funzione di
θ e ψ, cioè:
E
sin 2θ
F1 =
θ+
− Jψ.
ω
2
Poiché F1 deve essere una funzione periodica, Eθ/ω − Jψ = J (θ − ψ) = 0 cioè
θ = ψ. In base a quest’ultimo risultato,
E
sin ψ cos ψ.
ω
p
Poiché sin θ = sin ψ = m/(2E)ωq,
F1 =
E=
mω 2 q2
sin ψ
e, in definitiva,
F1 (q, ψ) =
1
mωq2 cot ψ.
2
77
formalismo hamiltoniano
Allora
p=
∂F1
= mωq cot ψ
∂q
J=−
∂F1
1 ωq2
= m 2
∂ψ
2 sin ψ
1
= mωq2 (1 + cot2 ψ)
2
1 p2
E
1
= .
= mωq2 +
2
2 mω
ω
In conclusione


ψ = arccot
p
mωq
2
1

 J = mωq2 + 1 p
2
2 mω
78
.
R I F E R I M E N T I B I B L I O G R A F I C I D E L L A PA R T E I
[1]
Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica
moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli
argomenti del corso.
[2]
Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma:
Editori Riuniti, 2010 (citato a pagina 129).
[3]
Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri,
2007 (citato a pagina 112).
[4]
Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976.
[5]
Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli,
1993 (citato alle pagine 127, 135).
[6]
Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002.
[7]
Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna:
Zanichelli, 2005 (citato alle pagine 59, 75).
[8]
David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica
moderna. Milano: CEA, 2002.
[9]
Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica
di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100).
[10]
Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995.
[11]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69).
[12]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004.
[13]
P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database
è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg,
Maryland 20899: National Institute of Standards and Technology, 25 ott.
2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a
pagina 139).
[14]
Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000.
[15]
Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996.
[16]
Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973.
79
Parte II
R E L AT I V I TÀ R I S T R E T TA E I N T R O D U Z I O N E A L L A
MECCANICA QUANTISTICA
5
R E L AT I V I TÀ S P E C I A L E
Avvertenza! In questo capitolo indicheremo i tensori in neretto, v, mentre i vettori saranno indicati
secondo la notazione ~v.
5.1
trasformazioni di lorentz
5.1.1 Premessa
Le equazioni di Maxwell, che hanno permesso di unificare sia i campi elettrici e magnetici sia l’ottica geometrica, non sono invarianti per trasformazioni di
Galileo. Premettiamo due semplici considerazioni.
• Nelle equazioni compare esplicitamente la velocità di propagazione dei se√
gnali elettromagnetici: c = 1/ ε 0 µ0 . Secondo il principio di relatività di
Galileo passando da un sistema di riferimento inerziale a un altro le velocità
si sommano come vettori, dunque la velocità di un segnale luminoso dipende dal sistema di riferimento inerziale e sarà diversa al cambiare del sistema.
La spiegazione che si dette sulla comparsa del modulo della velocità di un
segnale elettromagnetico nelle equazioni si basò sull’esistenza di un mezzo
(estremamente rigido e rarefatto) le cui deformazioni dovrebbero corrispondere ai campi elettromagnetici. Il mezzo come sappiamo fu chiamato etere
e si pose il problema di individuare il sistema di riferimento a esso solidale.
Le equazioni di Maxwell, così come formulate, dovevano essere valide in
tale sistema di riferimento.
• La presenza di asimmetrie in alcuni fenomeni elettromagnetici, quando si
passa da un sistema di riferimento inerziale a un altro, non trova una spiegazione nell’ambito della teoria della relatività di Galileo. Per esempio, una
carica puntiforme q ferma in un sistema di riferimento inerziale genera un
campo elettrostatico, ma la stessa carica per un altro sistema di riferimento
inerziale è in moto e genera anche un campo magnetico.
Inoltre l’esperimento di Michelson e Morley dimostrò, senza ombra di dubbio,
che l’etere non esiste e che la velocità della luce (nel vuoto) non dipende dalla
velocità della sorgente.
5.1.2 Concetto di evento
L’idea che è alla base della teoria della relatività è di decomporre tutto ciò che
accade in eventi. Un evento rappresenta la minima determinazione possibile, individuata dall’assegnazione di tre coordinate spaziali e una temporale. In altre
83
relatività speciale
parole, un evento è un qualcosa che accade in un dato punto dello spazio in un
particolare istante di tempo. Se abbiamo un sistema di assi cartesiani Oxyz, un
evento è una quaterna di numeri ( x, y, z, t). Tutto ciò che accade deve ammettere
una descrizione in termini di relazioni o coincidenze tra eventi. L’insieme degli
eventi costituisce lo spaziotempo.
5.1.3
Principio di inerzia
Postuliamo l’esistenza di una particolare classe di sistemi di riferimento, rispetto
a ognuno dei quali tutti i punti materiali isolati o sono fermi o si muovono con
velocità vettoriale costante. Questi sistemi di riferimento sono detti, come ben
sappiamo, inerziali.
Dobbiamo altresì assumere (per misurare lunghezze e intervalli di tempo) che
si abbia una classe di regoli rigidi ideali e una classe di orologi ideali. Due regoli
ideali hanno la proprietà di essere della medesima lunghezza se sono in quiete,
indipendentemente dalla loro storia passata. Analogamente, due orologi ideali
battono il tempo nello stesso modo se sono in quiete, a prescindere dalla loro
storia passata. Noi supporremo che in ogni luogo di un sistema di riferimento vi
sia un orologio in quiete. Il grosso problema è quello di sincronizzare tutti questi
orologi ideali. Un modo per sincronizzare due orologi, uno posto in A e l’altro
posto in B 6≡ A, solidali con il nostro sistema di riferimento inerziale, può essere
il seguente: lanciamo da A verso B un segnale elettromagnetico (supposta nota la
velocità della luce1 ), sincronizziamo l’orologio in B con quello in A tenendo conto
della distanza tra A e B e del tempo impiegato dal segnale a raggiungere B.
Noi affrontiamo lo studio della cosiddetta Relatività Ristretta o Speciale, che si
occupa del rapporto esistente fra la descrizione dei fenomeni fisici compiute da
osservatori solidali con sistemi di riferimento inerziali. La Relatività Generale avrà
lo scopo di estendere lo studio a osservatori non inerziali.
5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz
Oltre al principio d’inerzia, alla base della relatività ristretta vi sono due postulati:
Primo postulato: principio di relatività - Le leggi della Fisica sono le stesse in
tutti i riferimenti inerziali.
Secondo postulato: costanza della velocità della luce - La velocità della luce
nel vuoto assume lo stesso valore, indipendentemente dalla direzione, in tutti i sistemi di
riferimento inerziali.
Vediamo, ora, come ottenere le trasformazioni di Lorentz utilizzando i postulati
della relatività ristretta, supponendo che il tempo sia omogeneo e che lo spazio sia
omogeneo e isotropo. Supponiamo di avere due sistemi di riferimento inerziali
1 Per misurare la velocità del segnale può essere usato un solo orologio, sempre che il percorso
seguito dal segnale sia chiuso.
84
5.1 trasformazioni di lorentz
y0
y
S
S0
~v
O
O0
x ≡ x0
z0
z
Figura 5.1: Rappresentazione dei sistemi di riferimento in esame.
S(Oxyz) e S0 (O0 x 0 y0 z0 ), il quale si muove rispetto al primo con velocità costante v
diretta lungo la direzione positiva delle x in modo che x ≡ x 0 (vedi figura 5.1). Un
evento è caratterizzato in S dalle coordinate spaziotemporali ( x, y, z, t). Lo stesso
evento avrà in S0 coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ). Cerchiamo le relazioni
 0
x = x 0 ( x, y, z, t)


 0
y = y0 ( x, y, z, t)
z0 = z0 ( x, y, z, t)

0
t = t0 ( x, y, z, t)
(5.1)
sulla base dei due postulati. Supponiamo che si sia proceduto a sincronizzare gli
orologi in ognuno dei due sistemi di riferimento inerziali e che quando O0 ≡ O,
t = t0 = 0 (è il modo più semplice di sincronizzare due orologi,2 uno solidale con
S, l’altro solidale con S0 ). Osserviamo che poiché lo spazio è isotropo abbiamo potuto scegliere, assolutamente in generalità, i due sistemi inerziali come precisato
sopra. Una prima osservazione: l’ipotesi di omogeneità dello spazio e del tempo
richiede che le (5.1) siano lineari. Altre osservazioni:
1. Poiché continuamente l’asse x coincide con l’asse x 0 , o in modo equivalente
y=0
⇐⇒
z=0
y0 = 0
,
z0 = 0
y0 e z0 sono espressi mediante una combinazione lineare di y e z.
2. Il piano x − y (caratterizzato dall’equazione z = 0) si deve trasformare nel
piano x 0 − y0 (cioè z0 = 0); analogamente il piano x − z (caratterizzato dall’equazione y = 0) si deve trasformare nel piano x 0 − z0 (cioè y0 = 0). Allora y0
dev’essere proporzionale solo a y e z0 deve essere proporzionale solo a z.
2 Non è assolutamente detto che due orologi, uno solidale con S e l’altro con S0 , battano il tempo allo
stesso modo.
85
relatività speciale
3. Si può far vedere che un’asta posta lungo l’asse y solidale con S deve avere
la stessa lunghezza in S0 ; ciò comporta che y0 = y. Analogamente si prova
che z0 = z.
4. Per ragioni di simmetria t0 non può dipendere linearmente né da y né da z.
Altrimenti, per esempio, due orologi, fermi in S, uno posto sull’asse delle y
in y = +1 e l’altro posto sullo stesso asse in y = −1, sarebbero in disaccordo
osservati da S0 . Questo fatto sarebbe in contrasto con l’ipotesi di isotropia
dello spazio.
5. Poiché il punto O0 e ogni altro punto del piano y0 − z0 ha rispetto a S equazione oraria x = vt, allora x 0 , nella trasformazione cercata, deve essere
proporzionale a x − vt.
Le considerazioni precedenti portano a dire che le trasformazioni (5.1) devono
essere, in particolare, del tipo:
x 0 = γ(v)( x − vt),
(5.2a)
0
(5.2b)
0
(5.2c)
0
(5.2d)
y = y,
z = z,
t = a(v) x + b(v)t.
con le condizioni iniziali γ(0) = b(0) = 1 e a(0) = 0. Il nostro scopo è ora
quello di determinare le costanti γ, a e b utilizzando il secondo postulato della
relatività. Supponiamo che, quando O ≡ O0 , cioè al tempo t = t0 = 0, un’onda
elettromagnetica sferica venga emessa da O ≡ O0 . In base al secondo postulato
della relatività l’onda elettromagnetica si propaga in tutte le direzioni con velocità
c (velocità della luce nel vuoto) sia in S sia in S0 . Consideriamo allora un punto
del fronte d’onda ( x, y, z) al tempo t in S. Le coordinate spaziotemporali ( x, y, z, t),
che definiscono l’evento in S, dovranno soddisfare la seguente relazione:
x 2 + y2 + z2 = c2 t2 .
(5.3)
Lo stesso evento in S0 avrà coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ), che, per quanto detto, dovranno essere legate dalla relazione:
x 02 + y 02 + z 02 = c 2 t 02 .
(5.4)
Ponendo le (5.2) nella (5.4), otteniamo:
γ2 ( x − vt)2 + y2 + z2 = c2 ( ax + bt)2
(γ2 − c2 a2 ) x2 + y2 + z2 − 2xt(γ2 v + c2 ab) = (c2 b2 − γ2 v2 )t2 .
(5.5)
La relazione (5.5) deve coincidere con la (5.3) per ogni x, y, z, t. Si ha, allora,
 2
2 2
γ − c a = 1
(5.6)
γ2 v + c2 ab = 0 .
 2 2
c b − γ2 v2 = c2
86
5.1 trasformazioni di lorentz
Tenendo presente che se v = 0, b = 1 dalle (5.6) otteniamo:

1


γ= √



1 − v2 /c2

v
.
a = − 2γ


c



b = γ
(5.7)
In conclusione le trasformazioni di Lorentz sono le seguenti:
x 0 = γ( x − vt),
(5.8a)
y0 = y,
(5.8b)
0
(5.8c)
z = z,
v t0 = γ t − 2 x ,
c
(5.8d)
con
γ= √
1
1 − v2 /c2
.
(5.9)
Dalle (5.8) è facile ricavare le trasformazioni inverse
x = γ( x 0 + vt0 ),
(5.10a)
0
(5.10b)
0
(5.10c)
y=y,
z=z,
v t = γ t0 + 2 x 0 .
c
(5.10d)
Notiamo che se v c, allora γ ≈ 1 e inoltre dalle (5.10) si riottengono le trasformazioni di Galileo. Siano ( x, y, z, t) le coordinate spaziotemporali in S di un
evento e siano ( x 0 , y0 , z0 , t0 ) le coordinate spaziotemporali in S0 dello stesso evento.
Notiamo che:
v 2
c2 t02 − x 02 − y02 − z02 = c2 γ2 t − 2 x − γ2 ( x − vt)2 − y2 − z2 =
c
2 2
2
= c t − x − y2 − z2 .
Allora c2 t2 − x2 − y2 − z2 (che, come vedremo tra poco, può essere riguardato
come la distanza al quadrato nello spaziotempo fra il nostro evento e l’evento
di coordinate (0, 0, 0, 0)) è una quantità scalare invariante per trasformazioni di
Lorentz.
Poniamo x0 = ct e sinh χ = √ v/c2 2 = βγ, con β = v/c. Si ha ovviamente
1−v /c
q
2
cosh χ = 1 + sinh χ = γ. Allora le trasformazioni di Lorentz (relativamente
alle due coordinate che cambiano) posson essere scritte anche nel modo seguente:
x00 = x0 cosh χ − x sinh χ,
x 0 = x cosh χ − x0 sinh χ.
(5.11a)
(5.11b)
87
relatività speciale
Da queste relazioni si evidenzia una certa analogia con le rotazioni in due dimensioni:
x 0 = x cos θ − y sin θ,
y0 = x sin θ + y cos θ.
Questa analogia si estende al fatto che, mentre le rotazioni conservano le lunghezze x2 + y2 , le (5.11) conservano la quantità x02 − x2 , che, come abbiamo accennato,
rappresenta ancora una “distanza al quadrato” nello spaziotempo. Le trasformazioni di Lorentz, come si evince dalla (5.11), possono allora esere considerate come
“rotazioni generalizzate” nello spaziotempo. Supponiamo di avere un evento A
definito da ( x A , y A , z A , t A ) e un evento B definito da ( x B , y B , z B , t B ) nel sistema
di riferimento inerziale S. Possiamo definire il quadrato della distanza tra i due
eventi nel modo seguente:
∆s2 = c2 (t B − t A )2 − ( x B − x A )2 − (y B − y A )2 − (z B − z A )2
= c2 ∆t2 − ∆x2 − ∆y2 − ∆z2
(5.12)
dove, ovviamente, ∆t2 rappresenta l’intervallo temporale tra i due eventi al quadrato e ∆x2 + ∆y2 + ∆z2 l’intervallo spaziale al quadrato. Nel sistema S0 la distanza al quadrato tra i due eventi è data da ∆s02 = c2 ∆t02 − ∆x 02 − ∆y02 − ∆z02 , con
∆t0 = t0B − t0A , ∆x 0 = x 0B − x 0A , ∆y0 = y0B − y0A , ∆z0 = z0B − z0A . Si può agevolmente
dimostrare che ∆s2 = ∆s02 . Possiamo riscrivere la (5.12) in forma differenziale
ds2 = c2 dt2 − dx2 − dy2 − dz2 .
Il fatto che le coordinate spaziali e quelle temporali abbiano segni opposti nella
definizione di distanza al quadrato tra due eventi è una caratteristica dello spaziotempo. Osserviamo che per un segnale luminoso ds2 = 0. Se una particella
si muove con velocità inferiore alla velocità della luce, si ha ds2 > 0 e, quindi ds
è reale. In tal caso si dice che l’intervallo è di genere tempo. Se invece ds2 < 0
l’intervallo è detto di genere spazio. Gli intervalli per i quali ds2 = 0 si dicono di
tipo luce.
Tardioni si dicono i punti materiali che si muovono con velocità inferiore a quella
della luce, tachioni i corpi (immaginari) che si muovono con velocità superiore a
quella della luce. I corpi che si muovono alla velocità della luce si dicono di tipo
luce.
Osserviamo che due eventi separati da un intervallo di tipo tempo non possono
mai essere simultanei, cioè non esiste un sistema di riferimento in cui tali eventi
risultino simultanei. Invece è possibile trovare un sistema di riferimento in cui
i due eventi si verifichino nello stesso luogo, cioè l’intervallo spaziale tra i due
eventi sia nullo.
In relazione a un determinato sistema di riferimento inerziale S, possiamo rappresentare gli eventi associando agli assi cartesiani x, y, z un quarto asse, quello
del tempo. Per facilitare la visualizzazione consideriamo un solo asse spaziale,
quello delle x (figura 5.2). Gli assi x e ct sono assunti ortogonali; si tratta di una
88
5.1 trasformazioni di lorentz
ct
a
c
Futuro assoluto
Altrove
π
4
O
Altrove
x
Passato assoluto
d
b
tempo futuro
io
spaz
no
iperpeiasente
r
p
osservatore
spa
zio
tempo passato
Figura 5.2: Diagramma di Minkowski: a sinistra considerando una sola dimensione
spaziale, a destra considerate due dimensioni spaziali.
scelta di pura convenienza. Fatta questa scelta, in un altro sistema di riferimento inerziale S0 , che si muove rispetto a S con velocità costante diretta lungo la
direzione positiva dell’asse x, x 0 e ct0 non sono più ortogonali. Il punto O rappresenta l’evento (0, 0). Il moto rettilineo uniforme di una particella con velocità
V < c, passante per x = 0 al tempo t = 0, è rappresentato da una retta passante per O e formante con l’asse ct un angolo inferiore a π/4. Le due rette limite
rappresentano la propagazione di segnali che viaggiano alla velocità della luce.
All’interno della regione (cono) aOc abbiamo c2 t2 − x2 > 0, cioè l’intervallo tra
l’evento ( x, t) e l’evento (0, 0) è di tipo tempo. In tale regione t > 0, cioè ogni
evento ha luogo dopo l’evento O. Poiché due eventi, separati da un intervallo di
tipo tempo, non possono mai essere simultanei in alcun riferimento inerziale, non
è possibile scegliere un sistema di riferimento in cui un arbitrario evento, posto
all’interno della regione aOc, abbia luogo prima di O, cioè avvenga al tempo t < 0.
Tutti gli eventi all’interno di aOc sono, allora, posteriori a O, fanno cioè parte della
regione del futuro assoluto (la quale, nel caso si consideri più di una dimensione
spaziale, è un cono o un ipercono, detto appunto cono del futuro).
Nello stesso modo si può far vedere che ogni evento posto in dOb avviene prima
dell’evento O, e questo è vero in qualunque riferimento inerziale. La regione dOb
89
relatività speciale
è detta appunto del passato assoluto (cono del passato).
Sottolineiamo che gli eventi posti nel passato e nel futuro possono essere messi
in relazione causale con l’evento O.
Gli eventi all’interno delle regioni aOd e cOb sono separati dall’evento O da un
intervallo di tipo spazio. Se D è un evento in tali regioni, si può sempre trovare
un riferimento inerziale in cui D e O sono simultanei, anche se non possono mai
avvenire nello stesso luogo per alcun riferimento. Esistono sistemi di riferimento
in cui D avviene prima di O e altri in cui avviene dopo. La regione tra il cono del
futuro e il cono del passato è indicata come il presente di O (o anche come l’altrove
assoluto di O, perché, come abbiamo detto, in nessun sistema di riferimento un
evento, che appartiene a questa regione, e l’evento O possono verificarsi nello
stesso luogo).
Gli eventi posti lungo le bisettrici appartengono al cono-luce e sono connessi
per l’appunto all’evento O da segnali luminosi.
Riassumendo in relatività
• il futuro è individuato dagli eventi che soddisfano la relazione ct > | x |;
• il presente è individuato dagli eventi che soddisfano la relazione |ct| < | x |;
• il passato è individuato dagli eventi che soddisfano la relazione −ct > | x |.
Notiamo che nell’ambito della fisica non relativistica (o newtoniana) rispetto a O
• il futuro si ha per t > 0;
• il presente si ha per t = 0;
• il passato si ha per t < 0.
Infine osserviamo che il ragionamento svolto per l’evento O si può ripetere per
ogni altro evento. Questo vuol dire che a ogni evento possiamo associare un cono
del futuro e un cono del passato.
5.2
alcune conseguenze delle trasformazioni di lorentz
5.2.1 Legge di trasformazione delle velocità
Tra le conseguenze principali delle trasformazioni di Lorentz vi è una diversa legge di trasformazione della velocità rispetto a quella prevista dalle trasformazioni
galileiane. Dovremo, ovviamente, ritrovare che la velocità della luce (nel vuoto)
è un invariante relativistico, cioè ha lo stesso valore in tutti i sistemi di riferimento inerziali. Consideriamo i sistemi di riferimento inerziali S ed S0 già visti. Le
componenti3 del vettore velocità di una particella rispetto a S sono:
Vx =
dx (t)
dt
Vy =
dy(t)
dt
Vz =
dz(t)
.
dt
3 Supponiamo assegnata in S la legge oraria della particella ( x (t), y(t), z(t)) e la corrispondente legge
oraria in S0 ( x 0 (t0 ), y0 (t0 ), z0 (t0 )).
90
5.2 alcune conseguenze delle trasformazioni di lorentz
Le corrispondenti componenti rispetto a S0 saranno
Vx0 =
dx 0 (t0 )
dt0
Vy0 =
dy0 (t0 )
dt0
Vz0 =
dz0 (t0 )
.
dt0
Dalle trasformazioni di Lorentz si ottiene:
dx = γ(dx 0 + v dt0 ) = γ(Vx0 + v) dt0 ,
dy = dy0 = Vy0 dt0 ,
dz = dz0 = Vz0 dt0 ,
v
v dt = γ dt0 + 2 dx 0 = γ 1 + 2 Vx0 dt0 .
c
c
Da queste relazioni ricaviamo:
Vx =
dx
V0 + v
= x v 0,
dt
1 + c2 Vx
(5.13a)
Vy0
1
dy
=
,
Vy =
dt
γ 1 + cv2 Vx0
(5.13b)
Vz =
(5.13c)
dz
Vz0
1
.
=
dt
γ 1 + cv2 Vx0
Osserviamo che se c → +∞, allora γ = 1 (o anche se v/c 1, allora γ ≈ 1) e
Vx = Vx0 + v
Vy = Vy0
Vz = Vz0 .
cioè otteniamo la trasformazione galileiana della velocità. Facilmente si ottiene
dalle (5.13) la trasformazione inversa:
Vx − v
,
1 − cv2 Vx
Vy
1
Vy0 =
,
γ 1 − cv2 Vx
1
Vz
Vz0 =
.
γ 1 − cv2 Vx
Vx0 =
(5.14a)
(5.14b)
(5.14c)
p
√
Ricordiamo che γ = 1/ 1 − v2 /c2 = 1/ 1 − β2 , dove β = v/c. Osserviamo che
lim γ( β) = 1,
β → 0+
lim γ( β) = +∞.
β → 1−
Se Vy0 = Vz0 = 0 e Vx0 = V 0 , allora dalle (5.13) otteniamo
Vx = V =
V0 + v
,
1 + cv2 V 0
Vy = 0,
Vz = 0.
(5.15)
Se V 0 = c (velocità della luce nel vuoto) allora dalla precedente si ha V = c.
Inoltre sempre dalla precedente se 0 < V 0 < c, allora 0 < V < c (e viceversa).4
4 Noi supponiamo che v ∈ (0, c).
91
relatività speciale
8
7
6
γ
5
4
3
2
1
0
0
0.2
0.4
0.6
0.8
1
β
Figura 5.3: Andamento del fattore di Lorentz γ in funzione di β.
Esercizio
2
2
2
Dimostrare che, se v0 x + v0 y + v0 z = c2 , allora v2x + v2y + v2z = c2 e viceversa.
5.2.2 Contrazione delle lunghezze
Si chiama lunghezza propria di un’asta la sua lunghezza in un sistema di riferimento in cui è in quiete. Supponiamo di avere un’asta rigida in quiete in S e posta
lungo l’asse x. Se le sue estremità sono nei punti di coordinata x1 e x2 > x1 , la
sua lunghezza propria è ovviamente data da:
l0 = x 2 − x 1 .
Per misurare la lunghezza dell’asta nel sistema di riferimento S0 , che si muove
rispetto a S con una velocità v diretta lungo la direzione positiva dell’asse x, basta
avere le coordinate degli estremi dell’asta nello stesso istante di tempo e dunque
valutare gli eventi ( x10 , t10 ) e ( x20 , t20 ) con t10 = t20 . I due eventi sono simultanei in
S0 ma non in S. Naturalmente, per misurare la lunghezza propria in S possiamo
determinare gli estremi dell’asta in tempi diversi e abitrari. Sappiamo che
x = γ( x 0 + vt0 )
e, quindi,
x1 = γ( x10 + vt10 )
x2 =
γ( x20
+ vt10 )
=⇒
x2 − x1 = γ( x20 − x10 ).
Chiamata l = x20 − x10 la lunghezza dell’asta in S0 , avremo allora
r
v2
l0 = γl ⇐⇒ l = 1 − 2 l0 < l0 .
c
92
(5.16)
5.2 alcune conseguenze delle trasformazioni di lorentz
Il sistema S0 , che è in moto rispetto all’asta, misura, pertanto, una lunghezza minore della lunghezza propria dell’asta. Questo fenomeno è noto come contrazione
delle lunghezze.
Esercizio
La lunghezza dell’asta rispetto al sistema di riferimento S0 può essere determinata considerando i suoi estremi nella stessa posizione in tempi diversi? In caso
affermativo, qual è la relazione tra questa lunghezza dell’asta e la sua lunghezza
a riposo?
5.2.3 Dilatazione dei tempi
La dilatazione dei tempi è una delle conseguenze più straordinarie della relatività
ristretta. Consideriamo due sistemi di riferimento inerziali S e S0 come in figura 5.1 e supponiamo che un orologio, a riposo nel sistema di riferimento inerziale
S0 , misuri in uno stesso punto dello spazio x00 un intervallo temporale tra due
eventi A : ( x00 , t0A ) e B : ( x00 , t0B ), con t0B > t0A . L’intervallo temporale tra i due eventi
∆τ = t0B − t0A è detto tempo proprio. La loro distanza è ovviamente di tipo tempo.
Nel sistema S i due eventi A e B hanno le seguenti coordinate spaziotemporali:
x A = γ( x00 + vt0A ),
v t A = γ t0A + 2 x00 ,
c
x B = γ( x00 + vt0B ),
v t B = γ t0B + 2 x00 .
c
Allora
∆t = t B − t A = γ∆τ > ∆τ,
(5.17)
cioè l’intervallo di tempo tra i due eventi, misurato in S, risulta maggiore dell’intervallo di tempo proprio. Questo risultato ci dice che l’orologio mobile rispetto a
S ha una frequenza minore. Possiamo, in altre parole, affermare che la frequenza
di un orologio mobile rallenta rispetto a quella di un orologio fermo. Notiamo
che in S0 i due eventi avvengono nello stesso luogo e il loro intervallo temporale
è misurato da un solo orologio posto in quel punto (intervallo di tempo proprio),
mentre nell’altro sistema di riferimento S i due eventi si verificano in punti diversi
dello spazio e occorrono due orologi per misurare il loro intervallo di tempo (non
proprio).
Vediamo di capire meglio con un esempio. Supponiamo che in S0 una sorgente
luminosa posta nell’origine emetta al tempo t0 = 0 un raggio di luce in direzione dell’asse y0 e che uno specchio, posto a distanza L, rifletta il raggio di luce
facendolo tornare in O0 (figura 5.4a). Ovviamente avremo ∆τ = 2L/c. Questo è
il tempo complessivo che il raggio di luce impiega per tornare in O0 nel sistema
S0 . L’intervallo di tempo trovato è, naturalmente, proprio. Vediamo ora quale
ragionamento fa il sistema S, supponendo che al tempo t = t0 = 0 (quando viene
emesso il raggio di luce) O ≡ O0 . Lo specchio è solidale con S0 che si muove con
velocità v nella direzione positiva dell’asse delle x. Il raggio luminoso avrà in S
93
relatività speciale
y
y0
S
S0
c∆t
2
L
L
O
O0
x
(a)
0
M
R
x
(b)
Figura 5.4: La traiettoria di un raggio luminoso riflesso da uno specchio in due sistemi di
riferimento inerziali in moto relativo.
una traiettoria come quella in figura 5.4b. Il sistema S ha bisogno di due orologi,
uno in O l’altro in R (ovviamente sincronizzati) per valutare l’intervallo temporale
∆t, che il raggio luminoso impiega per tornare sull’asse delle x. Tenendo presente
la figura 5.4b si ottiene facilmente:
c∆t
2
2
=
v∆t
2
2
+ L2 ,
c2 ∆t2 = v2 ∆t2 + 4L2 ,
2L/c
= γ∆τ.
∆t = √
1 − v2 /c2
Ritroviamo, cioè, nell’esempio specifico, la formula (5.17) relativa alla dilatazione
dei tempi.
5.3
lo spazio di minkowski
In maniera molto sintetica possiamo dire che lo spazio vettoriale di Minkowski,
M, è lo spaziotempo. Un punto di tale spazio è, come abbiamo già avuto modo
di dire, un evento.
Le coordinate di un punto-evento, in un sistema di riferimento S, possono essere definite come ( x0 , x1 , x2 , x3 ) = (ct, x, y, z) (notare che tutte le componenti hanno
le dimensioni di una lunghezza). Le coordinate x µ (µ = 0, 1, 2, 3),5 con la conven-
5 Da qui in poi, nello spazio di Minkowski, useremo la convenzione che gli indici greci (α, β, . . . , µ,
ν, . . . ) assumono valori 0, 1, 2, 3, invece gli indici latini (i, j, k, . . . ) assumeranno i valori 1, 2, 3.
94
5.3 lo spazio di minkowski
zione dell’indice in alto, sono dette controvarianti e si trasformano passando da un
sistema S a uno S0 nel solito modo:
x 00 = γ( x0 − βx1 ),
x 01 = γ( x1 − βx0 ),
(5.18)
x 02 = x 2 ,
x 03 = x 3 .
Le precedenti possono essere scritte anche in forma matriciale, adoperando la
notazione di Einstein:
µ
x 0µ = Λν x ν
(5.19)
dove
γ
− βγ

− βγ
γ
µ
Λ = (Λν ) = 
 0
0
0
0

0
0
1
0

0
0
.
0
1
Il punto evento { x µ } è anche detto quadrivettore controvariante perché obbedisce
µ
alle (5.19). Ricordiamo che in Λν si indica l’elemento alla µ-esima riga e ν-esima
colonna.
Abbiamo già visto che la distanza al quadrato tra l’evento { x µ } e l’evento
O(0, 0, 0, 0) è definita come s2 = ( x0 )2 − ( x1 )2 − ( x2 )2 − ( x3 )2 . Tale quantità, come ben sappiamo, è un invariante relativistico: assume lo stesso valore in tutti
i riferimenti inerziali. Se introduciamo la seguente matrice, detta tensore metrico
covariante

1 0
0
0
0 −1 0
0 

g = ( gµν ) = 
0 0 −1 0  .
0 0
0 −1

allora s2 = gµν x µ x ν (con la convenzione degli indici ripetuti). Tramite il tensore
metrico gµν viene introdotta una distanza al quadrato s2 tra l’evento { x µ } e l’evento O(0, 0, 0, 0), la quale è una forma quadratica maggiore, uguale o minore di 0.
Lo spazio di Minkowski viene dotato di una metrica pseudoeuclidea. Notiamo che la
quantità gµν x µ x ν può essere riguardata anche come un prodotto scalare, con l’avvertenza che gµν x µ x ν = 0 ; x µ = 0 per µ = 0, 1, 2, 3. Il nostro tensore metrico è
come si vede lo stesso in ogni punto dello spazio di Minkowski, proprietà che non
sarà valida in relatività generale. Possiamo introdurre le coordinate covarianti di
un punto evento
xµ = gµν x ν
(5.20)
95
relatività speciale
cioè ( x0 , x1 , x2 , x3 ) = ( x0 , − x1 , − x2 , − x3 ). Allora s2 = gµν x µ x ν = xν x ν . Dalle
relazioni (5.18) si ottiene facilmente:
x00 = γ( x0 + βx1 ),
x10 = γ( x1 + βx0 ),
x20 = x2 ,
(5.21)
x30 = x3 .
Queste relazioni possono essere scritte in forma matriciale nel modo seguente:
xµ0 = (Λ−1 )νµ xν
(5.22)
dove

γ βγ 0 0
 βγ γ 0 0
.
=
0
0 1 0
0
0 0 1

Λ −1
Si dice che { xµ } è un quadrivettore covariante se obbedisce alle (5.22). Il tensore
metrico controvariante è definito nel modo seguente: ( gµν ) = g −1 . Osserviamo che
in M abbiamo g = g −1 . Chiaramente vale la relazione:
gµν gνλ = δµλ .
(simbolo di Kronecker)
Se con ∆x µ indichiamo la variazione tra le coordinate omologhe controvarianti di
due eventi, la distanza al quadrato tra questi due eventi è naturalmente data da:
∆s2 = gµν ∆x µ ∆x ν .
Possiamo dare una versione infinitesima della metrica se prendiamo due eventi
“molto vicini tra loro”:
ds2 = gµν dx µ dx ν = dxν dx ν .
Questa forma quadratica differenziale dà ovviamente la metrica6 di M. Notiamo
µ
che dalla (5.19) dx 0µ = Λν dx ν ed essendo
dx 0µ =
∂x 0µ
dx ν
∂x ν
si ha:
µ
Λν =
∂x 0µ
.
∂x ν
Una quaterna ( A0 , A1 , A2 , A3 ) si dice che è un quadrivettore controvariante se
ogni componente Aµ si trasforma per effetto di una trasformazione di Lorentz
µ
x 0µ = Λν x ν nel modo seguente:
µ
A0µ = Λν Aν
6 Prendendo la forma quadratica differenziale per definire la metrica includiamo anche il caso in cui
il tensore metrico dipende dal punto.
96
5.3 lo spazio di minkowski
cioè nello stesso modo delle coordinate controvarianti di un punto evento. Osserviamo che, se Aν = Aν ( x),7 allora
A 0 ν = A 0 ν ( x 0 ).
Un quadrivettore covariante { Aµ } è un insieme di quattro quantità ( A0 , A1 , A2 , A3 )
che, per effetto di una trasformazione di Lorentz, si trasformano come le coordinate covarianti di un punto evento:
A0µ = Aν (Λ−1 )νµ .
Osserviamo che possiamo ottenere Aµ moltiplicando il corrispondente quadrivettore controvariante per il tensore metrico covariante, ovvero:
Aµ = gµν Aν .
Inversamente si ha
Aµ = gµν Aν ,
dove gµν è il tensore metrico controvariante.
Un quadritensore di rango n completamente controvariante ha la forma T µ1 ,...,µn e si
trasforma nel modo seguente:
T 0µ1 ,...,µn = Λν11 Λν22 · · · Λνnn T ν1 ,...,νn .
µ
µ
µ
Un quadritensore di rango n completamente covariante ha la forma Tµ1 ,...,µn e si trasforma nel modo seguente:
Tµ0 1 ,...,µn = Tν1 ,...,νn (Λ−1 )νµ11 (Λ−1 )µν22 · · · (Λ−1 )νµnn .
Un quadritensore di rango n p volte controvariante e q volte covariante ha la forma
µ ,...,µ
Tν11,...,νq p e si trasforma nel modo seguente:
0µ ,...,µ
µ
σ
λ ,...,λ
p
1
Tν1 ,...,ν
= Λλ11 · · · Λλpp (Λ−1 )σν11 · · · (Λ−1 )νqq Tσ11,...,σq p .
q
µ
Osserviamo che:
• un quadritensore di rango 1 è un quadrivettore;
• un quadritensore di rango 0 è uno scalare ed è invariante per trasformazioni
di Lorentz (è detto anche scalare di Lorentz).
I quadritensori di rango 2, che hanno, ovviamente, 16 componenti, si trasformano
nel modo seguente:
µ
• tensori completamente controvarianti: T 0µν = Λα Λνβ T αβ ;
β
0 = ( Λ −1 ) α ( Λ −1 ) T ;
• tensori completamente covarianti: Tµν
ν αβ
µ
7 Con x intendiamo ( x0 , x1 , x2 , x3 ).
97
relatività speciale
0µ
µ
β
• tensori misti: Tν = Λα (Λ−1 )ν Tβα .
In generale si dice che il tensore metrico covariante abbassa gli indici, il tensore metrico controvariante li innalza. Un quadritensore di rango 2 T µν si dice
simmetrico se T µν = T νµ ; si dice antisimmetrico se T µν = − T νµ . Un generico
quadritensore può essere sempre scomposto in una parte simmetrica e una antiµν
simmetrica. Infatti Ts = ( T µν + T νµ ) /2 è un quadritensore simmetrico, mentre
µν
µν
µν
Ta = ( T µν − T νµ ) /2 è antisimmetrico; infine T µν = Ta + Ts .
Il prodotto scalare tra due quadrivettori A = { Aµ } e B = { Bν } è definito come
A · B = gµν Aµ Bν = A0 B0 − A1 B1 − A2 B2 − A3 B3 . Il modulo quadro A · A = A2
di un quadrivettore A è un invariante relativistico. Un quadrivettore A = { Aµ }
si dice di tipo tempo se A · A > 0, di tipo spazio se A · A < 0, di tipo luce se
A · A = 0.
Esercizi
1. Dimostrare che, se S( x ) è uno scalare di Lorentz ed è di classe opportuna, allora ∂S( x )/∂x µ è un quadrivettore covariante, mentre ∂S( x )/∂xµ è un
quadrivettore controvariante.
µ ,...,µ
2. Dimostrare che, se Tν11,...,νq p ( x ) è un tensore p volte controvariante e q volte
µ ,...,µ
covariante (di classe opportuna) allora ∂Tν11,...,νq p ( x )/∂x α è un tensore p volte
µ ,...,µ
controvariante e q + 1 volte covariante, mentre ∂Tν11,...,νq p ( x )/∂xα è un tensore
p + 1 volte controvariante e q volte covariante.
3. Dimostrare che gµν è un tensore covariante di rango 2.
4. Dimostrare che gµν è un tensore controvariante di rango 2.
5.4
quadrivelocità e quadriaccelerazione
Nella meccanica newtoniana se il moto di una particella è descritto dalla legge
oraria ~r = ~r (t) (di classe opportuna), la velocità è definita come ~v(t) = d~r (t)/dt.
In relatività ristretta il tempo è una componente di un quadrivettore e non uno
scalare di Lorentz. Poiché è utile scrivere le equazioni della fisica in modo tale
che risultino manifestamente valide in ogni sistema di riferimento inerziale (formulazione covariante delle leggi della fisica), conviene parametrizzare il moto
di una particella massiva, nello spazio di Minkowski, rispetto a una grandezza
che sia uno scalare di Lorentz. La scelta naturale è l’invariante s, definito da
ds2 = gµν dx µ dx ν , che può essere chiamato cammino proprio. Avremo allora, in M,
la cosiddetta linea d’universo x µ = x µ (s), che non è altro che una curva (successione di eventi propri della particella in moto). Se, come abbiamo detto, la particella
ha massa, allora ds2 = c2 (1 − v2 /c2 ) dt2 > 0 essendo |v(t)| < c la velocità del-
98
5.4 quadrivelocità e quadriaccelerazione
la particella al tempo8 t. Possiamo scrivere, indicato con τ il tempo proprio e
assumendo la convenzione che s sia crescente al variare del tempo:
r
v2
ds = 1 − 2 c dt = c dτ.
c
Il quadrivettore velocità (o semplicemente quadrivelocità) controvariante di una
particella massiva, il cui moto in M è descritto dalla linea d’universo x µ = x µ (s),
è definito come9
dx µ
dx µ
dx µ
=
=γ
(5.23)
uµ =
ds
c dτ
c dt
dove
1
γ= √
1 − v2 /c2
è il fattore di Lorentz della particella, non di un sistema di riferimento. Chiaramente u = {uµ } è un quadrivettore controvariante perché si trasforma come
µ
u0µ = Λν uν . Osserviamo che:
• le componenti della quadrivelocità sono
v
vy vz x
u = γ, γ, γ, γ ;
c
c
c
• sussiste la relazione
µ ν
u · u = gµν u u = γ
2
v2
1− 2
c
= 1.
(5.24)
Definiamo la quadriaccelerazione controvariante come:
duµ
d2 x µ
.
=
ds
ds2
In base alla (5.24) otteniamo
wµ =
duν
= 0 ⇐⇒ gµν uµ wν = 0 ⇐⇒ u · w = 0.
ds
Ovvero quadrivelocità e quadriaccelerazione sono ortogonali.
gµν uµ
Esercizio
Dimostrare che le componenti della quadriaccelerazione sono
γ4
~v ·~a,
c3
γ2
γ2
wi = 2 ai + 2 (~v ·~a)vi
c
c
w0 =
con i = 1, 2, 3, ( a1 , a2 , a3 ) = ( a x , ay , az ) e (v1 , v2 , v3 ) = (v x , vy , vz ).
8 Nel caso di una particella di massa nulla o di un raggio luminoso, poiché ds2 = 0 occorre introdurre
un parametro scalare diverso dal tempo proprio.
9 Alcuni definiscono la quadrivelocità come uµ = cdx µ /ds. In tal caso uµ ha le dimensioni di una
velocità, mentre nel nostro caso è adimensionale.
99
relatività speciale
5.5
dinamica relativistica
Si può facilmente constatare che in relatività ristretta, a causa della legge di composizione delle velocità, se il momento di una particella avente massa a riposo
m0 è definito come ~p = m0~v, allora la conservazione del momento di sistemi di
particelle isolati non è più valida in ogni sistema di riferimento inerziale.10 Se richiediamo che la conservazione del momento in sistemi isolati sia una legge della
Fisica, bisogna allora definire in relatività il momento come:
~p = √
dove
m0
1 − v2 /c2
m(v) = √
~v = m(v)~v
(5.25)
= γm0
(5.26)
m0
1 − v2 /c2
può essere riguardata come la massa relativistica della particella. Osserviamo che
se v/c 1, allora m(v) ≈ m0 e ~p ≈ m0~v, come in meccanica newtoniana.
Studi sperimentali hanno mostrato che la ii legge della dinamica continua
ancora a valere, cioè nel caso di una particella:
d~p ~
=F
dt
(5.27)
dove ~p è il momento relativistico ed ~F è la forza totale agente sulla particella.
La (5.27), in base alla (5.25), può essere scritta come
dm0 γ(v)~v ~
= F.
dt
(5.28)
Se v/c 1 si ottiene la relazione non relativistica. Due osservazioni sulla (5.28):
1. se il modulo della velocità della particella aumenta e si approssima a c, il
termine γ tende a smorzare tale incremento;
2. se richiediamo che la (5.28) sia una legge della Fisica, quando si passa da un
sistema di riferimento inerziale a un altro, a differenza di quanto avviene
nella meccanica newtoniana, la forza ~F deve cambiare esattamente come
cambia dm0 γ~v/dt.
Dalla (5.28) otteniamo
m0 γ~a + m0
dγ
~v = ~F
dt
(5.29)
dove ~a = d~v/dt è l’ordinaria accelerazione. Poiché dγ/dt = γ3~v ·~a/c2 , la (5.29)
diventa
m0 γ~a + m0
γ3
(~v ·~a)~v = ~F.
c2
10 Vedi Kittel, Knight e Ruderman [9, pagine 411–416].
100
(5.30)
5.6 energia cinetica e momenti
Moltiplicando scalarmente per ~v ambo i membri della precedente si ha:
γ3
m0 γ~v ·~a + m0 2 v2 (~v ·~a) = ~F · ~v
c
γ2
m0 γ(~v ·~a) 1 + 2 v2 = ~F · ~v
c
3
m0 γ ~v ·~a = ~F · ~v
(5.31)
essendo 1 + γ2 v2 /c2 = γ2 . Inserendo la (5.31) nella (5.30) otteniamo:
~v
= ~F
c2
!
~F · ~v
~F −
~v .
c2
m0 γ~a + (~F · ~v)
m0~a =
1
γ
(5.32)
Notiamo che se ~F, ~v,~a sono vettori paralleli, allora la (5.32) diventa
m0 γ3~a = ~F
(basta tener conto che in questo caso ~F − (~F · ~v)~v/c2 = ~F/γ2 ).
5.6
energia cinetica e momenti
Sia ~F la forza totale agente su una particella di massa a riposo m0 . Vogliamo ora
vedere come determinare l’energia cinetica della particella. L’idea è di partire, in
analogia a quanto avviene in meccanica newtoniana, dalla relazione dT = ~F · d~r,
cioè la variazione infinitesima di energia cinetica, dT, è supposta uguale al lavoro
elementare della forza totale. Teniamo presente che ~F · d~r = ~F · ~v dt = m0 γ3~v ·~a dt
in base alla (5.31). Possiamo pertanto scrivere
dT = m0 γ3~v ·~a dt = m0 γ3~v · d~v =
Poiché
1
2
R v2
0
T= √
1
m0 γ3 dv2 .
2
γ3 (v0 ) dv02 = c2 γ − c2 , abbiamo
m0 c2
1 − v2 /c2
− m0 c2
(5.33)
(notare che nel ricavare la precedente abbiamo supposto nulla la velocità iniziale).
Per v/c 1, allora
4
1
v
2
T = m0 v + O
,
2
c4
cioè ritroviamo, al secondo ordine, il valore non relativistico dell’energia cinetica. Dalle (5.33) si deduce che l’energia non è proporzionale a v2 (come nel caso
non relativistico) e inoltre che limv→c− T = +∞. Si definisce energia totale della
particella la quantità:
E = T + m0 c2 = m0 c2 γ.
101
relatività speciale
Il termine m0 c2 è detto energia a riposo della particella (cioè, se v = 0, E = m0 c2 )
e rappresenta una novità sorprendente ed eccezionale rispetto al caso non relativistico. Esso, in qualche modo, stabilisce un’equivalenza tra massa ed energia
e asserisce che la massa può essere convertita in energia e viceversa l’energia in
massa. Questa equivalenza non ha riscontro alcuno nella fisica newtoniana. Osserviamo che in relatività non vale la conservazione della massa. In un processo
fisico, cui prendono parte diverse particelle, ciò che si conserva non è la massa
totale ma l’energia totale. Notiamo per inciso che dE/dt = ~F · ~v. Poiché m0 c2 ha
le dimensioni di un’energia, la massa a riposo può essere misurata in eV/c2 .
Tra l’energia e il momento di una particella libera esiste una relazione particolare. Infatti
m20 c4 γ2
E2
2
−
p
=
− m20 v2 γ2 = m20 c2 .
c2
c2
(5.34)
Questa relazione può essere riscritta come
E2 = p2 c2 + m20 c4
(5.35)
da cui11
E=
q
p2 c2 + m20 c4 .
(5.36)
Osserviamo che la (5.36) prende il posto della relazione non relativistica E =
p2 /(2m0 ) (intendendo qui con E l’energia cinetica della particella libera). La (5.35)
ha enorme importanza in quanto, come vedremo fra poco, la quantità E2 − c2 p2
è un invariante relativistico (scalare di Lorentz). Dalla (5.34) si vede subito che il
momento può essere misurato in eV/c e suoi multipli.
Una particolarità notevole della relatività è la possibilità di considerare particelle con massa nulla. Infatti dalla (5.35) deduciamo che se m0 = 0
E = pc.
(5.37)
Ovviamente le espressioni E = m0 c2 γ e ~p = m0~vγ in cui compare la massa perdono di significato per una particella di massa nulla. Se m0 = 0 l’energia rimane
finita senza annullarsi, in quanto v = c. Notiamo che bisogna fare il doppio limite
m0 → 0+ e v → c− : ciò rende finita e non nulla l’energia.
Stesso discorso vale per il momento. Sottolineiamo che, nel caso di particelle
con massa nulla, vale certamente la (5.37), che stabilisce un preciso legame tra
energia e momento. In natura esistono, effettivamente, particelle di massa nulla,
come per esempio i fotoni. In base alla relazione di Planck-Einstein, l’energia di
un fotone di frequenza ν è data da
E = hν
(5.38)
11 Nello scrivere la (5.36) abbiamo considerato solo la soluzione positiva e scartato quella negativa. Si
può far vedere nell’ambito della fisica classica che non vi sono motivi per ammettere stati di energia
negativi. Discorso diverso va fatto per la meccanica quantistica, dove non è possibile ignorare, a
priori, stati di energia negativa.
102
5.7 quadrimomento, tensore momento angolare
dove h = 6.626 · 10−34 J · s è la costante di Planck e ha le dimensioni di un’azione.
Se indichiamo con ω = 2πν la pulsazione della radiazione, la (5.38) può scriversi
come E = hω/(2π ) = }ω. Allora il momento di un fotone di frequenza ν è dato
da
p=
E
hν
h
ω
=
= = } = }k
c
c
λ
c
dove λ è la lunghezza d’onda della radiazione e k = ω/c è il numero d’onda.
5.7
quadrimomento, tensore momento angolare
La relazione (5.35) ci induce a pensare che energia e momento di una particella
possano essere componenti di uno stesso quadrivettore. Effettivamente è così;
infatti il quadrivettore (controvariante)
pµ = m0 cuµ
(5.39)
dove m0 è la massa a riposo della particella e uµ la sua quadrivelocità, ha come
componenti
E
,
c
p2 = m0 γvy ≡ py ,
p0 = m0 γc ≡
p1 = m0 γv x ≡ p x ,
p3 = m0 γvz ≡ pz .
Il quadrivettore definito dalla (5.39) è, allora, detto quadrimomento. Si ha come
conseguenza che gµν pµ pν = E2 /c2 − p2 = m20 c2 è certamente un invariante relativistico, come avevamo annunciato. Inoltre passando dal sistema di riferimento
inerziale S al sistema S0 le componenti del quadrimomento si trasformano nel
modo seguente:
 00
p = γ( p0 − βp1 )


 01
p = γ( p1 − βp0 )
.
(5.40)

p 02 = p 2

 03
p = p3
Le precedenti possono essere scritte in termini di E, p x , py , pz come:
 0
E
E


=γ
− βp x



c
c



E
0
.
px = γ px − β

c




p0y = py


 0
pz = pz
Nel caso in cui m0 = 0 (particella di massa nulla) si ha gµν pµ pν = 0: il quadrimomento è ovviamente di tipo luce. Possiamo definire il tensore del momento
angolare (controvariante di rango 2 e antisimmetrico) come
Lµν = x µ pν − x ν pµ .
(5.41)
103
relatività speciale
µ
µ
Notiamo che L0µν = x 0µ p0ν − x 0ν p0µ = Λα Λνβ ( x α p β − x β pα ) = Λα Λνβ Lαβ . Si verifica
facilmente che, detto ~L = ~r × ~p l’ordinario vettore momento angolare rispetto
all’origine degli assi cartesiani ortogonali, L12 = Lz , L31 = Ly , L23 = L x .
5.8
equazioni del moto
Nel caso di una particella libera di massa m0 sappiamo che d~p/dt = ~0 e dE/dt =
0, dove ~p = m0 γ~v e E = m0 c2 γ. Poiché le componenti del quadrimomento sono
date da p = ( E/c, ~p) è evidente che le precedenti equivalgono alla condizione
dp
= 0.
ds
(5.42)
La (5.42) costituisce, allora, l’equazione covariante del moto di una particella libera e può essere anche scritta, tenendo presente che pµ = m0 cuµ = m0 cdx µ /ds
come
d2 x µ
= 0.
ds2
Questa è la forma covariante dell’equazione di una particella libera e corrisponde
all’espressione non covariante d2~r/dt2 = 0. Se la particella non è libera, ma soggetta a interazioni, la derivata rispetto a s del quadrimomento è diversa da zero,
in generale. Possiamo definire come quadriforza il quadrivettore controvariante:
F=
dp
.
ds
(5.43)
La (5.43) può essere scritta in modo equivalente:
m0 c
du
= m0 cw = F.
ds
Questa equazione, detta di Minkowski, rappresenta l’equazione del moto della
particella in forma covariante. Le componenti della quadriforza F sono
γ dE γ d~p
,
.
F=
c2 dt c dt
Dal momento che ~F = d~p/dt e dE/dt = ~F · ~v, le componenti della quadriforza
possono essere scritte anche come:
γ
γ F = 2 ~F · ~v, ~F .
c
c
Come conseguenza dell’ortogonalità tra quadrivelocità e quadriaccelerazione abbiamo che la quadrivelocità è ortogonale alla quadriforza, cioè F · u = 0. Possiamo
anche definire il momento relativistico della quadriforza come il tensore controvariante di rango 2 antisimmetrico N µν = x µ F ν − x ν F µ . Si verifica immediatamente
che
dLµν
= N µν .
ds
104
5.9 meccanica analitica relativistica (cenni)
5.9
meccanica analitica relativistica (cenni)
Si può enunciare anche in meccanica relativistica il principio variazionale di Hamilton, dal quale poi ricavare le equazioni del moto delle particelle materiali.
Consideriamo, prima, il caso di una particella materiale libera. Come possiamo
esprimere l’azione? Ovviamente dobbiamo richiedere che l’integrale, che esprime
l’azione, sia invariante per trasformazioni di Lorentz e, quindi, sia uno scalare di
Lorentz. Per una particella libera viene naturale pensare, come scalare di Lorentz, all’intervallo infinitesimo ds o più in generale ad α ds con α costante. L’idea,
allora, è di considerare l’azione data da:
S=α
Z b
a
ds
(5.44)
dove a e b rappresentano due punti eventi dello spazio di Minkowski M. Come
già sappiamo, devono essere considerati tutti i moti ammissibili (linee d’universo) che partono dall’evento a e giungono all’evento b. Il moto reale è ottenuto
imponendo δS = 0 fra tutte le linee d’universo ammissibili. Per determinare,
poi, la costante α dobbiamo richiedere che nell’approssimazione non relativistica
la (5.44) diventi, a meno di costanti additive, uguale all’azione di una particella
non relativistica libera di massa nota.
√
Se ora teniamo conto che per una particella materiale ds = c 1 − v2 /c2 dt,
la (5.44) può essere scritta
S[ x (t), y(t), z(t)] = αc
Z t1 r
t0
1−
v2
dt ,
c2
(5.45)
dove v2 (t) = ẋ2 (t) + ẏ2 (t) + ż2 (t). Dalla (5.45) si deduce che la lagrangiana è data
da:
r
v2
L = αc 1 − 2 .
(5.46)
c
Se procediamo esattamente come nel caso non relativistico, per il principio variazionale di Hamilton abbiamo:
d ∂L ~
=0
dt ∂~v
(5.47)
perché L non dipende esplicitamente da ~x = ( x, y, z). Dalle relazioni (5.46) e (5.47)
si ottiene:
∂L
αc
vx
= −√
= costante
∂v x
1 − v2 /c2 c2
vy
αc
∂L
= −√
= costante
∂vy
1 − v2 /c2 c2
∂L
αc
vz
= −√
= costante
∂vz
1 − v2 /c2 c2
105
relatività speciale
quindi
2
2
α
v2
√ ~v
= α
= costante
c 1 − v2 /c2 c2 1 − v2 /c2
da cui discende che v2 è una quantità costante. Inoltre dalla (5.47) abbiamo anche
d ∂L
d
=
dt ∂~v
dt
~v
α
− √
c 1 − v2 /c2
= ~0
quindi
d~v ~
= 0 ⇐⇒ ~v(t) = costante,
dt
cioè il moto della particella libera che rende stazionaria l’azione è quello rettilineo
uniforme.
Sia m0 la massa a riposo della particella. La sua lagrangiana è data dalla (5.46).
Per v/c 1 questa diventa:
1 v2
L = αc − αc 2 + O
2 c
v4
c4
,
dove αc è una costante che non influenza le equazioni del moto. Nel caso non
relativistico invece (a meno di costanti additive):
L=
1
m0 v2 .
2
Per il principio di corrispondenza queste due espressioni devono essere uguali,
quindi trascurando i termini di ordine superiore a v4 /c4 e la costante additiva αc
abbiamo α = −m0 c. In conclusione la lagrangiana della particella relativistica di
massa m0 è data da:
r
v2
2
L = − m0 c 1 − 2 .
c
Il momento della particella è definito come
~p =
∂L
m0~v
=√
∂~v
1 − v2 /c2
(esattamente il valore che, come abbiamo detto, permette che la conservazione del
momento di sistemi isolati sia una legge della Fisica). Notiamo, solo per inciso,
che nel caso esaminato (particella libera) d~p/dt = 0. Possiamo chiamare energia
la quantità:
E = ~p · ~v − L = √
106
m0 c2
1 − v2 /c2
= m0 c2 γ
5.9 meccanica analitica relativistica (cenni)
(esattamente il valore ottenuto per altra via). Poiché L non dipende esplicitamente
dal tempo, l’energia è una costante del moto (vedi (5.47)). Osserviamo che ~p =
E~v/c2 e che E2 − p2 c2 = m20 c4 . L’hamiltoniana è data da
q
H = c p2 + m20 c2 .
Se v/c 1, H ≈ m0 c2 + p2 /(2m0 ). Possiamo anche enunciare il principio
variazionale con il formalismo quadridimensionale
Z b
Z bq
Z bq
S = − m0 c
ds = −m0 c
dx µ dxµ = −m0 c
gµν dx µ dx ν .
a
a
a
In maniera analoga a quanto fatto nel capitolo 2, poniamo
x µ (ε) = x µ + εη µ
e
µ
S[ x (ε)] = −m0 c
Z bq
a
gµν dx µ (ε) dx ν (ε).
Per una particella libera:
µ
Z b q
µ
dx µ (ε) dx ν (ε) −
q
dx µ
dx ν
gµν
gµν
S[ x (ε)] − S[ x ] = −m0 c
a
Z b q
q
(5.48)
µ
µ
µ
ν
ν
ν
gµν (dx + ε dη )(dx + ε dη ) − gµν dx dx .
= − m0 c
a
Sviluppando la funzione integranda in serie di potenze di ε intorno a 0 il primo
termine è nullo, per il secondo risulta:
∂q
µ
µ
ν
ν
gµν (dx + ε dη )(dx + ε dη )
=
∂ε
ε =0
µ
µ
ν
ν
ν
µ
1 gµν (dx + ε dη ) dη + gµν (dx + ε dη ) dη q
=
=
2
gµν (dx µ + ε dη µ )(dx ν + ε dη ν )
ε =0
gµν (dx µ + ε dη µ ) dη ν
gµν dx µ dη ν
p
= q
=
=
gµν dx µ dx ν
gµν (dx µ + ε dη µ )(dx ν + ε dη ν ) dx µ dηµ
=
.
ds
Dalla (5.23) abbiamo dx µ = uµ ds, quindi
ε =0
dx µ dηµ
uµ ds dηµ
=
= uµ dηµ .
ds
ds
Allora la (5.48) diventa
δS = S[ x µ (ε)] − S[ x µ ] =
Z b
∂q
µ
µ
ν
ν
= −m0 cε
gµν (dx + ε dη )(dx + ε dη )
+ O(ε2 ) =
a ∂ε
ε =0
= −m0 cε
Z b
a
uµ dηµ
107
relatività speciale
con la condizione ηµ | a = ηµ |b = 0 affinché il moto sia ammissibile. Poiché,
integrando per parti
Z b
a
µ
u dηµ =
Z b
a
µ
d( u ηµ ) −
Z b
a
µ
du ηµ = −
Z b
a
µ
du ηµ = −
Z b
duµ
a
ds
dsηµ
risulta
δS = m0 cε
Z b
duµ
a
ds
dsηµ .
Ponendo εηµ = δxµ l’equazione precedente può essere scritta nella forma
δS = m0 c
Z b
duµ
a
ds
δxµ ds
e dalla condizione δS = 0 deriva che duµ /ds = 0 (forma covariante del moto di
una particella), cioè la quadriaccelerazione è nulla.
5.9.1 Carica in moto in un campo elettromagnetico
Vogliamo ora scrivere, sempre con il formalismo quadridimensionale, l’azione di
una particella di massa m0 e carica q in un campo elettromagnetico. Abbiamo
visto a suo tempo che il potenziale generalizzato del campo elettromagnetico è
dato da
q~
V = qϕ − A
· ~v
c
~ Ora
noti il potenziale scalare ϕ e il potenziale vettore A.
V dt =
q
q~
q
ϕ(c dt) − A
· d~r = Aµ dxµ
c
c
c
~ ) è ipotizzadove xµ è la coordinata covariante di un punto evento e A = ( ϕ, A
to essere un quadrivettore controvariante, il quadripotenziale. Assumiamo che la
carica sia uno scalare di Lorentz. Allora
Z b
q
S=−
m0 c ds + Aν dxν ,
(5.49)
c
a
δS = S[ x µ (ε)] − S[ x µ ] =
Z b
q
q
=−
m0 c dx µ (ε) dxµ (ε) − m0 c dx µ dxµ +
(5.50)
a
−
Z
q b
c
a
Aν ( xµ (ε)) dxν (ε) − Aν ( xµ ) dxν .
Il primo integrale si calcola come visto nel caso della particella libera, per il
secondo integrale abbiamo, sviluppando in serie di potenze di ε:
Aν ( xµ (ε)) dxν (ε) − Aν ( xµ ) dxν = Aν ( xµ + εηµ ) d( xν + εην ) − Aν ( xµ ) dxν =
∂Aν
= ε Aν ( xµ ) dην +
ηµ dxν + O ε2 .
∂xµ
108
5.9 meccanica analitica relativistica (cenni)
Inoltre, con la solita condizione ην | a = ην |b = 0 risulta:
Z b
∂Aν
ν
ηµ dxν =
ε
A ( xµ ) dην +
∂xµ
a
Z b
∂Aν
ν
ν
=ε
ηµ dxν =
d( A ( xµ )ην ) − dA ( xµ )ην +
∂xµ
a
Z b
∂Aν
ν
=ε
ηµ dxν =
− dA ( xµ )ην +
∂xµ
a
Z b
∂Aν
∂Aν
dxµ ην +
ηµ dxν =
=ε
−
∂xµ
∂xµ
a
Z b
µ
∂Aν
∂A
ηµ dxν +
ηµ dxν .
=ε
−
∂xν
∂xµ
a
Nell’ultima uguaglianza abbiamo potuto invertire gli indici µ e ν del primo termine poiché si tratta di una somma su µ e ν. Dunque, ponendo εηµ = δxµ , la (5.50)
diventa
Z b
duµ
q ∂Aµ
q ∂Aν
δS =
m0 c
dsδxµ +
δxµ dxν −
δxµ dxν =
ds
c ∂xν
c ∂xµ
a
Z b
q ∂Aν
∂Aµ dxν
duµ
−
−
dsδxµ =
=
m0 c
ds
c ∂xµ
∂xν
ds
a
Z b
duµ
q ∂Aν
∂Aµ
=
m0 c
−
−
uν dsδxµ .
ds
c ∂xµ
∂xν
a
In definitiva abbiamo
duµ
q
δS = 0 =⇒ m0 c
=
ds
c
∂Aµ
∂Aν
−
∂xµ
∂xν
uν =
q µν
F uν .
c
(5.51)
dove F µν = ∂ Aν /∂xµ − ∂ Aµ /∂xν , detto tensore elettromagnetico, è un quadritensore controvariante di rango 2 antisimmetrico.
La (5.51) rappresenta la forma controvariante della equazione del moto di una
particella di massa m0 e carica q in un campo elettromagnetico. Esplicitando si
vede che


0 − Ex − Ey − Ez
 Ex
0
− Bz By 
.
F =
 Ey Bz
0
− Bx 
Ez
− By
Bx
0
Si può dimostrare che E2 − B2 e ~E · ~B sono invarianti per trasformazioni di Lorentz.
Si può altresì far vedere che F è invariante per trasformazioni di gauge. La gauge
di Lorentz è
∂Aµ
= 0.
∂x µ
L’azione (5.49) può essere scritta nel formalismo ordinario:
!
r
Z b
2
v
q
~ · ~v dt.
S=
−m0 c2 1 − 2 − qϕ + A
(5.52)
c
c
a
109
relatività speciale
La funzione sotto il segno di integrale è, naturalmente, la lagrangiana:
r
v2
q~
2
L = −m0 c 1 − 2 − qϕ + A
· ~v.
c
c
(5.53)
Il momento generalizzato ~
P è dato da
q~
~P = ∂L = √ m0~v
+ A
= ~p +
2
2
∂~v
c
1 − v /c
q~
A
c
~
da cui ~p = ~
P − q A/c.
Ora
H = ~v ·
da cui
r
H=
∂L
m0 c2
q ~ 2
−L = √
+ qϕ =⇒ (H − qϕ)2 = m20 c4 + c2 ~P − A
∂~v
c
1 − v2 /c2
q ~ 2
P− A
m20 c4 + c2 ~
+ qϕ
c
che è l’hamiltoniana di una particella con massa a riposo m0 e carica q in un
~
campo elettromagnetico con potenziale scalare ϕ e potenziale vettore A.
5.10
*l’interferometro di michelson e morley
L’elettromagnetismo prerelativistico superava in modo piuttosto goffo la presenza della costante c nelle equazioni dei campi elettrico e magnetico ipotizzando
l’esistenza di un mezzo, l’etere, che permeasse l’intero universo e rispetto al quale
la luce si muoveva appunto con velocità c. L’etere era pensato come un mezzo del
tutto singolare, sottile e capace di permeare completamente il cosmo, dotato dell’unica proprietà di essere il mezzo attraverso il quale la radiazione si propagava.
Per avere una qualche stima della velocità della Terra rispetto a tale mezzo Albert
Abraham Michelson, singolarmente nel 1881 e poi assieme a Edward Morley nel
1887, mise a punto un esperimento in cui si intendeva rilevare il “vento d’etere”
mediante tecniche interferometriche. Il dispositivo messo a punto dai due sperimentatori è schematizzato in figura 5.5 ed era montato su una lastra di pietra
fatta galleggiare su mercurio liquido: questo permetteva di mantenere la lastra
orizzontale e di farla girare attorno a un perno centrale.
Supponiamo ora che la Terra si muova rispetto all’etere con velocità v. Il fascio
luminoso che parte dalla sorgente S viene scomposto dallo specchio semiargentato in due raggi normali tra loro; il raggio 1 si propaga verso lo specchio R1 ,
viene da questo riflesso, subisce una deviazione di π/2 a causa dello specchio
semiargentato e perviene al cannocchiale C; il raggio 2 invece si dirige verso lo
specchio R2 e dopo la riflesione attraversa pressocché indisturbato lo specchietto
semiargentato per poi giungere anch’esso nel cannocchiale. Ciò che si dovrebbe
osservare nel cannocchiale è una serie di frange di interferenza dovute al fatto che
il tratto AR1 dovrebbe essere percorso dalla luce in un arco di tempo diverso rispetto al tratto AR2 , a causa della composizione delle velocità che consegue dalla
110
5.10 *l’interferometro di michelson e morley
presenza del mezzo luminifero. La differenza di fase tra i due raggi nel momento
in cui si ricongiungono in A genera l’interferenza.
Il tempo impiegato dal raggio 1 per percorrere AR1 (andata e ritorno) è
T1 =
1
L1
L
2L
.
+ 1 = 1
c+v c−v
c 1 − v2 /c2
(5.54)
Per il raggio 2 bisognerà tener conto del fatto che, nel sistema dell’etere, la luce si
propaga sempre e comunque a velocità c. Dunque la velocità vy con cui viene per√
corsa la distanza deve soddisfare la relazione c2 = v2y + v2 , ovvero vy = c2 − v2 .
Di conseguenza
T2 = 2
L2
L2
1
=2 √
.
vy
c 1 − v2 /c2
(5.55)
La differenza tra i tempi è dunque
2
L2
L1
√
∆T = T2 − T1 =
−
.
c
1 − v2 /c2 1 − v2 /c2
(5.56)
Se ora ruotiamo di π/2 l’intero apparato, la relazione che si trova (essendo i bracci
invertiti) è
2
L1
L2
0
∆T =
−√
.
(5.57)
c 1 − v2 /c2
1 − v2 /c2
Perciò
L1 + L2
∆T − ∆T = 2
c
0
1
1
√
−
1 − v2 /c2 1 − v2 /c2
.
(5.58)
Sviluppando in potenze di v/c e ignorando termini di ordine superiore al secondo,
otteniamo che
∆T 0 − ∆T ≈ v2
L1 + L2
.
c3
(5.59)
Dunque ruotando lo strumento dovrebbe osservarsi uno spostamento di ∆n =
v2 λc L1 c+3 L2 frange attraverso il centro del cannocchiale. Il dispositivo di Michelson
e Morley aveva L1 = L2 = 11 m, mentre la lunghezza d’onda della luce usata
era λ = 5.5 · 10−7 m. All’epoca dell’esperimento si riteneva che il Sole fosse essenzialmente solidale con il riferimento dell’etere, mentre la Terra orbitava con
una velocità di v = 30 000 m/s (che dunque era in modulo proprio la v dell’esperimento esaminato). Si disponeva inoltre di varie stime della velocità della luce
e tutte suggerivano che la luce avesse una velocità c ≈ 3 · 108 m/s. Dunque si
ricava v/c ≈ 10−4 . Da questi dati si ricava uno spostamento teorico di ∆n = 0.4
frange. Nel secondo esperimento Michelson e Morley riuscirono a rendere lo strumento sensibile a uno spostamento di appena 0.01 frange. L’esperimento, nato
per dare una stima di v, fu un fallimento, in quanto non venne osservato alcuno spostamento dell’entità prevista e dunque il “vento d’etere” non fu rilevato.
111
relatività speciale
Figura 5.5: Schema dell’interferometro di Michelson e Morley.
Ovviamente, alla luce dei risultati di Einstein, questo risultato si spiega immediatamente, poiché la velocità della luce è la medesima in tutte le direzioni in ogni
sistema di riferimento. Lo sfasamento, assunta vera questa ipotesi, non poteva
che essere nullo.
L’esperimento ebbe, soprattutto negli anni seguenti, grande risonanza tra i fisici
in quanto fu una delle prove sperimentali più lucide dell’infondatezza della teoria
dell’etere, perlomeno come elaborata nel secolo XIX. Tuttavia occorre sottolineare
che l’esperimento non è di per sé una prova della teoria di Einstein; in effetti,
come poi si vide con esperimenti analoghi eseguiti con interferometri a bracci
disuguali, l’esperimento permetteva di concludere semplicemente che la velocità
della luce lungo percorsi diversi non dipende dalla velocita del sistema inerziale
in esame rispetto a un qualsiasi altro sistema inerziale, e dunque non vi erano
sistemi di riferimento privilegiati. La costanza della velocità della luce di per sé
non è un risultato dell’esperimento in quanto non abbiamo informazioni sulla
differenza di velocità della radiazione tra andata e ritorno. Basti pensare che
si possono ricavare trasformazioni differenti da quelle di Lorentz che spieghino
correttamente l’esperimento.12 L’ipotesi che l’esperimento abbia spinto Einstein a
formulare i suoi postulati nella precisa forma in cui li conosciamo sembra dunque
infondata sia da un punto di vista logico che storico.13 Semmai essa manifestò in
modo quanto mai palese che occorreva necessariamente andare oltre il modello
dell’etere.
12 Vedi a proposito Barone [3, pagine 103–105].
13 Si ricordi il pensiero di Einstein a riguardo:
«L’esito dell’esperimento di Michelson non ebbe una grande influenza sull’evoluzione delle mie idee [...]. La spiegazione di ciò sta nel fatto che ero, per ragioni di carattere generale, fermamente convinto che non esista il moto assoluto, e
il mio unico problema era come ciò potesse conciliarsi con quello che sapevamo
dell’elettrodinamica.»
112
6
INTRODUZIONE ALLA MECCANICA QUANTISTICA
6.1
*il corpo nero
Un corpo nero è un oggetto che assorbe tutta la radiazione elettromagnetica incidente (e quindi non ne riflette). Se introduciamo il concetto di potere assorbente
come la frazione di energia raggiante incidente che viene assorbita dal corpo, si
conclude che un corpo nero è un oggetto che ha potere assorbente 1. Kirchhoff è
riuscito a dimostrare nel 1859 che il potere assorbente di un corpo dipende solo
dalla temperatura del corpo e non dalla sua natura. Kirchhoff stesso, per esempio,
ha provato che un ottimo esempio di corpo nero è un contenitore a temperatura
costante sulle cui pareti è praticato un piccolissimo foro, di modo che la radiazione che entra attraverso di esso abbia probabilità praticamente nulla di uscirvi e
venga assorbita dal corpo in seguito alle numerose riflessioni interne.
Sia dunque u la densità volumetrica di energia all’interno del contenitore e indichiamo con uν dν la densità di energia delle componenti che cadono nell’intervallo
(ν, ν + dν). Il risultato di Kirchhoff cui si è accennato può esprimersi nel seguente
modo: fissata ν, uν = uν ( T ). Stefan aveva dimostrato che
u=
Z +∞
0
uν dν = aT 4
(Legge di Stefan-Boltzmann)
dove a = 7.5657 · 10−16 J/(m3 · K4 ) è detta costante di radiazione.1 Ricordando che
la pressione esercitata sulle pareti del corpo è data da p = u/3, indichiamo con
U l’energia totale irradiata e consideriamo una trasformazione termodinamica
infinitesima:
δQ = T dS = dU + p dV =
4
1
= V du + u dV + u dV = V du + u dV ⇐⇒
3
3
V du
4u
dS =
dT +
dV.
T dT
3T
Ovvero
∂S
4u
=
∂V
3T
∂S
V du
=
.
∂T
T dT
(6.1)
(6.2)
Imponendo l’uguaglianza delle derivate miste si ottiene
4 1 du
u
1 du
du
u
− 2 =
⇐⇒
=4 .
3 T dT
T
T dT
dT
T
1 Per vedere come si calcola la costante di radiazione vedi l’appendice D.
113
introduzione alla meccanica quantistica
Integrando l’equazione differenziale si ottiene che u = aT 4 , con a costante di
integrazione.
Nel 1893 Wien dimostrò che
ν
u ν = ν3 F
(Legge dello spostamento)
T
che contiene la legge di Stefan. Infatti
Z +∞
ν
ν
dν =
pongo α =
u=
ν3 F
T
T
0
=
Z +∞
0
= T4
T 3 α3 F (α) T dα =
Z +∞
0
α3 F (α) dα.
La relazione di Wien si può anche esprimere in funzione delle lunghezze d’onda
λ; infatti, indicata con uλ la densità di energia nell’intervallo di lunghezza d’onda,
richiediamo che uν dν = uλ dλ. Da λν = c, differenziando si ha
|dλ|
|dν|
ν
=
⇐⇒ |dν| = dλ.
λ
ν
λ
Perciò
ν
uλ dλ = uν dν = uν |dλ|
λ
da cui
uλ =
c4 c F
.
λ5
λT
Per trovare tali massimi come solito
c duλ
c 0 c = 0 ⇐⇒
F
+ 5F
= 0.
dλ
λT
λT
λT
Poiché F è una funzione universale, detta λ̄ la soluzione, dalla forma dell’equazione abbiamo che
λ̄T = costante = b.
Pertanto λ̄ = b/T, ovvero all’aumentare della temperatura, il massimo della
funzione si sposta verso lunghezze d’onda più piccole (legge dello spostamento di
Wien).2
Nel 1896 Wien stesso propone una forma possibile di F: Fν ( T ) = a1 e−a2 ν/T .
Si mostra mediante analisi di Fourier che il campo elettromagnetico si comporta
come se fosse generato da molti oscillatori armonici indipendenti. Noto il numero
N di oscillatori di una determinata frequenza si può ricavare uν ; si prova che la
densità di oscillatori armonici fra ν e ν + dν è:
dN (ν)
8π
= 3 ν2 dν.
V
c
2 La costante b = 2.897 768 5 · 10−3 m · K prende il nome di costante dello spostamento di Wien.
114
6.1 *il corpo nero
0.6
5000 K
uλ (MJ/m4 )
0.5
Teoria classica (5000 K)
0.4
0.3
0.2
4000 K
0.1
0
3000 K
0
0.5
1
1.5
2
2.5
3
λ (µm)
Figura 6.1: Curve di Planck per diversi valori della temperatura a confronto con i risultati
previsti dalla teoria classica di Rayleigh-Jeans. Sulle ordinate è riportata la
densità di energia per unità di volume per unità di lunghezza d’onda, quindi
l’integrale delle curve rappresenta la densità volumetrica di energia.
Nota l’energia media dei detti oscillatori ū, allora uν dν = ū dN (ν)/V.
Poiché vale il principio di equipartizione dell’energia e per ogni oscillatore,
avendo esso due modi possibili, ū = 2(kB T/2) = kB T, ricorrendo alla distribuzione di Boltzmann si ha:
P(u) = c e
− k uT
B
e
= R +∞
0
− k uT
B
e
− k uT
B
du
,
R +∞ − u
dove c = 1/ 0 e kB T du è una costante che soddisfa la condizione di norR +∞
malizzazione 0 P(u) du = 1. Pertanto il valore medio può essere ottenuto
da
R +∞ − u
Z +∞
u e kB T du
ū =
uP(u) du = R0 +∞ − u
= kB T.
kB T
0
e
du
0
Perciò
8π
dN (ν)
= kB T 3 ν2 dν.
(Relazione di Rayleigh-Jeans)
V
c
Si vede subito che integrando tra 0 e +∞ l’integrale diverge (poiché tale fatto è
legato al contributo delle alte frequenze si parla di catastrofe ultravioletta o catastrofe
di Rayleigh-Jeans). La relazione è ottenuta ammettendo che gli scambi energetici
avvengano con continuità.
Nel 1901 Planck propose invece che l’energia potesse essere scambiata solo secondo quantità multiple di hν. In questo caso, detto un = nhν l’energia scambiata,
uν ( T ) dν = ū
P(un ) = c e
− knhνT
B
=
e
− knhνT
B
∑∞
n =0 e
−n khνT
B
= (1 − e
− khνT
B
)e
−n khνT
B
,
115
introduzione alla meccanica quantistica
−
hν
dove c = 1 − e kB T è una costante che soddisfa la condizione di normalizzazione
∞
∑+
n=0 P ( un ) = 1. Dunque
∞
ū =
∑
n =0
un P(un ) = hν(1 − e
ovvero
uν =
h
8π 3
ν hν
.
3
c
e kB T −1
− khνT
B
∞
)
∑ ne
n =0
−n khνT
B
=
hν
e
hν
kB T
−1
(Legge della radiazione di Planck)
La legge di Planck è perfettamente in accordo con i dati sperimentali, elimina
il problema della “catastrofe ultravioletta” e restituisce la legge di Rayleigh-Jeans
come primo termine dello sviluppo in serie (vedi la figura 6.1).
6.2
effetto fotoelettrico
L’esperienza mostra che, in certe condizioni, un metallo colpito da un fascio di
luce monocromatica emette elettroni. L’apparato sperimentale può essere, grosso
modo, schematizzato come segue: all’interno di un involucro trasparente, in cui
è praticato il vuoto, è posto un catodo su cui è fatta incidere radiazione elettromagnetica monocromatica (nello spettro del visibile o superiore) e un anodo che
raccoglie i fotoelettroni emessi dal catodo. L’anodo si trova, rispetto al catodo, a
un potenziale inferiore, il cui valore può essere variato mediante un potenziometro (vedi figura 6.2). Gli aspetti rilevanti dell’effetto fotoelettrico possono essere
così riassunti:
1. esiste, in funzione del tipo di metallo di cui è costituito il catodo, una frequenza di soglia ν0 della radiazione incidente, al di sotto della quale non
si verifica nessuna emissione di fotoelettroni, qualunque sia l’intensità della
radiazione;
Figura 6.2: Apparato per la rivelazione dell’effetto fotoelettrico.
116
6.2 effetto fotoelettrico
2. esiste un potenziale d’arresto V0 , indipendente dall’intensità della radiazione incidente, in corrispondenza del quale nessun elettrone raggiunge l’anodo; questa proprietà sta a significare che l’energia cinetica massima dei
fotoelettroni appena emessi dal catodo verifica l’equazione Tmax = eV0 dove
e è la carica dell’elettrone in modulo;
3. l’emissione dei fotoelettroni è istantanea qualunque sia l’intensità della radiazione, purché ν > ν0 ;
4. la corrente fotoelettrica i, ovvero il numero di elettroni emessi nell’unità di
tempo, dipende dall’intensità I della radiazione incidente.
La teoria classica della radiazione prevede
a. l’esistenza di una intensità di radiazione di soglia I0 al di sotto della quale
l’effetto non avviene, in contrasto col punto 1;
b. la dipendenza di Tmax , e quindi del potenziale d’arresto V0 , dall’intensità
della radiazione I in contrasto col punto 2;
c. che l’emissione debba avvenire dopo che un elettrone ha assorbito, a spese
della radiazione incidente, abbastanza energia da superare il potenziale, detto di estrazione, che, in condizioni normali impedisce all’elettrone di uscire
dal metallo: per tale ragione l’emissione può verificarsi solo dopo un certo
intervallo di tempo dall’arrivo della radiazione incidente, intervallo ovviamente tanto maggiore quanto più bassa è l’intensità I, in contrasto col punto
3;
d. che la corrente, dovuta ai fotoelettroni, debba aumentare al crescere di I, in
accordo col punto 4 (sempre che ν > ν0 ).
Allora, almeno tre delle caratteristiche principali dell’effetto fotoelettrico non sono
spiegabili mediante la teoria classica della radiazione. Nel 1905 Einstein propose una spiegazione dell’effetto assumendo che la radiazione fosse costituita da
pacchetti, o quanti di energia, detti fotoni: una radiazione elettromagnetica monocromatica di frequenza ν consiste di fotoni di energia hν, dove h = 6.6 · 10−34 J · s
è la costante di Planck. Abbiamo visto che, per spiegare l’emissione del corpo
nero, Planck aveva ipotizzato un simile comportamento per l’energia della radiazione elettromagnetica all’interno di una cavità. Vediamo ora come, con l’ipotesi
di Einstein, è possibile fornire una spiegazione esauriente dell’effetto.
Possiamo assumere, per semplicità, che l’elettrone sia a riposo all’interno del
metallo.3 Un elettrone, dopo aver assorbito un fotone di energia hν, è emesso
dal catodo con un’energia cinetica T = hν − W, dove W è il lavoro di estrazione
dal metallo. Se W0 è il lavoro minimo di estrazione caratteristico del metallo
(per esempio: per il sodio è 2.7 eV, per il ferro 3.2 eV), l’energia cinetica massima
dell’elettrone (quando questo è emesso dal catodo) è data da Tmax = hν − W0 .
3 Osserviamo che l’energia termica è circa 10−2 eV mentre i fotoni, nel visibile e nell’ultravioletto,
hanno un’energia di circa 1 − 10 eV.
117
introduzione alla meccanica quantistica
Figura 6.3: Effetto Compton
Esiste di conseguenza una frequenza di soglia ν0 = W0 /h tale che, se ν < ν0 ,
l’effetto non ha luogo. Vi è altresì un valore V0 del potenziale in corrispondenza
del quale anche gli elettroni più veloci non sono in grado di raggiungere l’anodo.
Abbiamo in particolare V0 = (hν − W0 )/e. Dopo che un elettrone ha acquistato,
mediante assorbimento di un fotone, energia pari ad hν, la sua emissione dal
metallo, se ν > ν0 , è immediata (il ritardo è inferiore a 10−9 s) e non dipende
dall’intensità della radiazione. Se l’effetto ha luogo, all’aumentare dell’intensità di
radiazione cresce anche il numero di fotoelettroni e quindi la corrente nel circuito.
In conclusione, possiamo dire che l’effetto fotoelettrico, al pari della radiazione
del corpo nero, fornisce una prova che la radiazione elettromagnetica di frequenza
ν è costituita da fotoni di energia hν.
Esercizio
Dimostrare che un elettrone libero non può assorbire un fotone di energia hν in
base alla conservazione del quadrimomento.
6.3
effetto compton
Se facciamo incidere un fascio di raggi X con λ0 = 0.7 Å ( =⇒ hν0 = hc/λ0 =
18 keV) su una sostanza (come per esempio il molibdeno) si osserva, sperimentalmente, che i raggi X diffusi a un angolo θ rispetto alla direzione della radiazione
incidente hanno lunghezza d’onda lievemente maggiore di λ0 ; in particolare si
trova
∆λ =
h
(1 − cos θ )
me c
dove me è la massa a riposo dell’elettrone.4 La grandezza h/(me c) ha (ovviamente)
le dimensioni di una lunghezza e vale 0.024 Å: è detta lunghezza d’onda Compton
dell’elettrone. Questo effetto (di diffusione), detto Compton, può essere spiegato
come un urto tra un fotone di energia hν0 e momento hν0 /c e un elettrone libero,
che possiamo considerare fermo (notiamo che l’energia di legame degli elettroni
4 Ricordiamo che la massa a riposo di un elettrone è pari a me = 9.11 · 10−31 kg = 0.511 MeV/c2
118
6.4 onde di materia di de broglie
periferici è di qualche eV, mentre l’energia dei fotoni è molto maggiore). Nell’urto
fotone-elettrone si conserva il quadrimomento. Chiamiamo ~p0 e ~p i momenti
fotonici prima e dopo l’urto e ~pe il momento dell’elettrone dopo l’urto; ricordiamo
che, prima dell’urto, l’elettrone è fermo. Dalla conservazione dell’energia:
q
2
(6.3)
me c + cp0 = m2e c4 + c2 p2e + cp.
Dalla conservazione del momento:
~p0 = ~p + ~pe ⇐⇒ ~pe = ~p0 − ~p ⇐⇒ p2e = p20 + p2 − 2p0 p cos θ.
(6.4)
(me c2 + cp0 − cp)2 = m2e c4 + c2 p2e ⇐⇒
(6.5)
La (6.3) può anche scriversi come:
4
4
m2e
c
+ c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 pp0 = m2e
c
+ c2 p2e .
Sostituendo nella (6.5) la (6.4) otteniamo:
c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 p0 p = c2 p20 + c2 p2 − 2c2 p0 p cos θ =⇒
me c( p0 − p) = p0 p(1 − cos θ ).
(6.6)
Ora, p0 = hν0 /c = h/λ0 , mentre p = hν/c = h/λ, perciò la precedente diventa
1
h2
1
−
=
(1 − cos θ ) =⇒
me ch
λ0
λ
λ0 λ
h
λ − λ0 =
(1 − cos θ ).
(6.7)
me c
In conclusione, nell’effetto Compton i fotoni si comportano proprio come dei corpuscoli cui compete energia hν e momento hν/c. La diffusione Compton può
essere considerata come un assorbimento di radiazione elettromagnetica seguito
da emissione, mentre l’effetto fotoelettrico è un assorbimento puro e semplice.
6.4
onde di materia di de broglie
La radiazione elettromagnetica ha manifestazioni ondulatorie e presenta, nel contempo, comportamenti corpuscolari come nella radiazione del corpo nero, nell’effetto fotoelettrico e nell’effetto Compton. Il legame tra questi due aspetti è
rappresentato dalla costante di Planck h. Sappiamo infatti che, se ν è la frequenza
di un’onda elettromagnetica monocromatica, questa può essere pensata in certi contesti come formata da quanti, fotoni (particelle di massa nulla), a ognuno
dei quali compete un’energia hν e un momento hν/c. Poiché h interviene anche nella condizione di quantizzazione di Bohr-Sommerfeld, Louis de Broglie nel
1923 si chiese se non fosse possibile, per così dire, un percorso inverso, cioè che
oggetti (come gli elettroni) pensati sempre come particelle potessero presentare,
in particolari situazioni, un comportamento ondulatorio. Consideriamo nel modello atomico di Bohr un elettrone in orbita attorno al nucleo; la condizione di
quantizzazione è la seguente:
I
p dq = nh
n ∈ N.
119
introduzione alla meccanica quantistica
Ora, se l è la lunghezza dell’orbita, la precedente relazione può anche essere
scritta:
l p = nh ⇐⇒ l =
nh
.
p
Qui il termine h/p ricorda la lunghezza d’onda λ di un fotone. Questa analogia
ha suggerito a de Broglie la seguente ipotesi: a ogni particella, avente massa a riposo
non nulla, è associata un’onda, la cui lunghezza d’onda, noto il momento p, è data da
λ = h/p.
Alla luce di questa ipotesi, le orbite permesse nella teoria di Bohr sono quelle
che contengono un numero intero di lunghezze d’onda. Vediamo con quali lunghezze d’onda abbiamo a che fare nello schema di de Broglie. Prendiamo delle
particelle libere (non relativistiche):
λ=
h
h
=√
.
p
2mE
(6.8)
Questa è la lunghezza d’onda di de Broglie di una particella di massa m avente
un’energia cinetica E.
Nel caso di un elettrone, se E = 1 eV,
λ= √
h
2mE
=√
6.626 · 10−34
2 · 9.11 · 10−31
· 1.6 · 10−19
m = 1.24 · 10−9 m = 12.4 Å
(come nei raggi X), pari alle dimensioni atomiche. Per un oggetto di 1 kg ed energia di 1 J gli effetti quantistici si avrebbero a distanze pari a 10−34 m, del tutto
trascurabili rispetto alle oscillazioni termiche degli atomi. Notiamo che, mentre
per i fotoni λ è inversamente proporzionale
a E, per le particelle (non relativisti√
che) λ è inversamente proporzionale a E. Inoltre maggiore è la massa, minore è,
a parità di energia, la lunghezza d’onda. Nel 1927 Davisson e Germer hanno provato che gli elettroni presentano effettivamente un comportamento ondulatorio e
sono caratterizzati da una lunghezza d’onda data proprio dalla (6.8). Analoghi
comportamenti ondulatori sono, poi, stati provati per protoni, neutroni, atomi di
He, ecc. Stabilito il carattere ondulatorio delle particelle materiali, bisogna vedere
a quale grandezza fisica si riferisce il fenomeno, cioè quale sia il significato fisico
della grandezza o delle grandezze oscillanti che chiamiamo funzioni d’onda e per
la quale ipotizziamo un’equazione lineare in analogia con le onde meccaniche e
quelle elettromagnetiche.
Normalmente quando si è in presenza di una propagazione ondulatoria, si
pone il problema di quale sia il mezzo che porta l’onda e quale la grandezza
che ne misuri l’ampiezza. Nel caso elettromagnetico alla prima domanda non
c’è risposta, o meglio è il vuoto, mentre le grandezze che misurano l’ampiezza
sono il campo elettrico e il campo magnetico. Ci chiediamo nel caso delle onde di
materia di de Broglie chi sostituisce questi campi (assodato che esse si propagano
nel vuoto). L’esperimento di Davisson e Germer fornisce una risposta a questo
quesito. Nell’esperimento, mediante rivelatori, viene testata la presenza o meno
di elettroni a un particolare angolo. Alla fine, pensando di ripetere più volte
120
6.4 onde di materia di de broglie
le misure, ogni volta con un solo elettrone nel fascio, viene di fatto misurata
la frequenza con cui l’elettrone è rivelato ai diversi angoli, cioè è misurata una
probabilità di presenza dell’elettrone.
Le idee di de Broglie sulle onde di materia avranno uno sviluppo fondamentale
con la Meccanica Ondulatoria di Schrödinger.
121
R I F E R I M E N T I B I B L I O G R A F I C I D E L L A PA R T E I I
[1]
Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica
moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli
argomenti del corso.
[2]
Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma:
Editori Riuniti, 2010 (citato a pagina 129).
[3]
Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri,
2007 (citato a pagina 112).
[4]
Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976.
[5]
Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli,
1993 (citato alle pagine 127, 135).
[6]
Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002.
[7]
Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna:
Zanichelli, 2005 (citato alle pagine 59, 75).
[8]
David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica
moderna. Milano: CEA, 2002.
[9]
Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica
di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100).
[10]
Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995.
[11]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69).
[12]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004.
[13]
P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database
è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg,
Maryland 20899: National Institute of Standards and Technology, 25 ott.
2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a
pagina 139).
[14]
Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000.
[15]
Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996.
[16]
Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973.
123
Parte III
APPENDICI
A
LA SUCCESSIONE DI FIBONACCI
Un’equazione alle differenze finite (lineare omogenea di ordine n, a coefficienti costanti) è il problema seguente: assegnati i primi n valori x0 , . . . , xn−1 di una
successione numerica e una relazione ricorrente quale
x j+n = −
n −1
∑ ak x j+k ,
k =0
determinare la successione numerica, la quale è chiaramente individuata così in
modo unico. Si tratta di trovare una “forma chiusa” per l’espressione dei termini,
cioè una formula che fornisca il valore dell’n-esimo termine senza dover calcolare
tutti i precedenti n − 1 termini della successione. Le equazioni alle differenze
possono essere ricondotte alle equazioni differenziali.1
La successione di Fibonacci (sequenza A000045 della On-Line Encyclopedia of Integer Sequences: http://www.research.att.com/~njas/sequences/A000045), descritta dal matematico pisano Leonardo Fibonacci (1170 - 1250) nell’opera Liber
abaci del 1202, è una successione di numeri interi definita per ricorrenza da

 Fn+2 = Fn+1 + Fn
.
F =0
 0
F1 = 1
La determinazione di una forma chiusa per la successione di Fibonacci è un classico esempio di problema alle differenze finite. Si cercano soluzioni del tipo Fn = µn ,
con µ 6= 0. Dalla definizione della successione abbiamo:
µn+2 = µn+1 + µn ⇐⇒ µ2 = µ + 1,
da cui si ricava
µ1,2
√
1± 5
=
.
2
La soluzione sarà una combinazione lineare delle due radici:
Fn = aµ1n + bµ2n .
(A.1)
Imponendo le “condizioni iniziali” si ha:

 a = −b
a+b = 0
⇐⇒
b =
aµ1 + bµ2 = 1
1
µ2 − µ1

1


a = √
5
⇐⇒
.
1


b = − √
5
1 Vedi De Marco [5, pagina 815].
127
la successione di fibonacci
Sostituendo nella (A.1) otteniamo
√ !n
√ !n !
1
1+ 5
1− 5
Fn = √
−
.
2
2
5
La relazione trovata è nota con il nome di formula di Binet.
128
B
L A T R A S F O R M ATA D I L E G E N D R E
b.1
definizione
Sia data una funzione f : R → R, liscia e convessa ( f 00 ( x ) > 0 ∀ x ∈ R). La sua
trasformata di Legendre1 è una funzione g di una nuova variabile p data da
g( p) = max{ px − f ( x )}.
x
(B.1)
Il significato geometrico della trasformata può essere inteso nel modo seguente.
Consideriamo nel piano xy il grafico della funzione f ( x ) e sia data la retta y = px
passante per l’origine con p inteso fissato. Allora è possibile individuare un punto
x̃ = x̃ ( p) tale che px − f ( x ) = F ( p, x ) sia massima. La trasformata di Legendre è
dunque F ( p, x̃ ( p)) = g( p). Se esiste, il punto x̃ ( p) è univocamente determinato,
essendo individuato dalla condizione ∂F/∂x = p − f 0 ( x̃ ) = 0 (grazie al teorema
del Dini è possibile esprimere x̃ in funzione di p), cioè
f 0 ( x̃ ) = p.
(B.2)
Questa condizione ha senso solo se p appartiene al codominio della derivata di
f ( x ). Il punto stazionario così trovato è un massimo in quanto per ipotesi
∂2 F ( x, p) = − f 00 ( x̃ ) < 0.
∂x2 x= x̃
In base a quanto visto finora la (B.1) può essere anche scritta nel seguente modo:
g( p) = x̃ ( p) p − f ( x̃ ( p)).
Osserviamo che
dg( p)
= x̃ 0 ( p) p + x̃ ( p) − f 0 ( x̃ ( p)) x̃ 0 ( p) = x̃ 0 ( p)( p − f 0 ( x̃ ( p))) + x̃ ( p) =
dp
= x̃ ( p).
La trasformata di Legendre gode di una proprietà molto importante: essa è involutiva, ovvero se g( p) è la trasformata di Legendre di f ( x ), allora la trasformata
di Legendre di g( p) è ancora f ( x ). Le due funzioni f e g si dicono dunque duali
secondo Young. Inoltre essendo per definizione px − f ( x ) ≤ g( p) allora vale la
cosiddetta disuguaglianza di Young:
px ≤ f ( x ) + g( p).
(B.3)
1 Per un approfondimento sulla trasformata di Legendre puoi vedere Arnol’d [2].
129
la trasformata di legendre
y
y = f (x)
y = px
g( p)
x
x ( p)
Figura B.1: Trasformata di Legendre.
Le precedenti considerazioni si generalizzano facilmente al caso di funzioni a
più variabili. Sia f : Rn → R una funzione liscia e x, p ∈ Rn . Anche in questo
caso
la funzione deve essere convessa, cioè si richiede che la matrice hessiana
sia definita positiva. La trasformata di Legendre è
∂2 f
∂xi ∂x j
g( p) = max{( p, x) − f ( x)},
x
dove
( p, x) =
n
∑ pi xi .
i =1
Allora deve risultare
∂f
( x ) = pi
∂xi
i = 1, . . . , n
(B.4)
o, equivalentemente, ∇ f ( x) = p. Quindi x̃ = x̃( p) e la trasformata si può anche
scrivere come
g( p) =
n
∑ x̃i ( p) pi − f (x̃( p)).
(B.5)
i =1
Come abbiamo visto,2 la trasformazione di Legendre permette di passare dalla lagrangiana L(q, q̇, t) (intesa come funzione delle variabili q̇) all’hamiltoniana
2 Si veda pagina 51. Nel caso dell’applicazione della trasformazione di Legendre alla funzione L
le ipotesi di convessità sono in genere soddisfatte. La lagrangiana di un sistema fisico ha infatti
solitamente la forma L = 21 ∑i mi q̇2i − V (q): evidentemente la matrice
!
∂2 L
= (mi δij )
∂q̇i ∂q̇ j
è definita positiva.
130
B.1 definizione
H(q, p, t). La trasformazione di Legendre trova applicazione in svariati ambiti
della Fisica (per esempio, in termodinamica la funzione entalpia è definita come
trasformata di Legendre della funzione energia rispetto al volume).
La trasformazione di Legendre non è un semplice cambiamento di variabili:
essa consente di passare da funzioni definite su uno spazio lineare a funzioni
definite sul corrispondente spazio duale.
Esercizi
1. Si consideri la funzione f : R → R definita da f ( x ) = x2 . Determinare la
trasformata di Legendre della funzione.
Soluzione. Osserviamo che f 00 ( x ) = 2 > 0
ne (B.2):
f 0 ( x ) = p =⇒ 2x = p =⇒ x =
∀ x ∈ R. Imponiamo la condizio-
p
,
2
p ∈ R.
La trasformata è dunque:
g( p) = x ( p) p − f ( x ( p)) =
p2
p2
p2
−
= .
2
4
4
2. Calcolare la trasformata di Legendre della funzione f : R → R definita da
f ( x ) = x2 /4.
Soluzione. Abbiamo f 00 ( x ) = 1/2 > 0
ne (B.2) abbiamo:
f 0 (x) =
∀ x ∈ R. Imponendo la condizio-
x
= p =⇒ x ( p) = 2p
2
da cui otteniamo che la trasformata di Legendre della funzione è
g( p) = x ( p) p − f ( x ( p)) = 2p2 − p2 = p2 .
In questi due esercizi possiamo ossservare la proprietà di involuzione della
trasformazione di Legendre: la trasformata della trasformata della funzione
f ( x ) = x2 è proprio la funzione stessa.
3. Sia f : R+ → R+ la funzione definita da f ( x ) = x α /α, con α > 1 ( f 00 ( x ) > 0).
Trovare la trasformata di Legendre di f ( x ).
Soluzione. Dalla (B.2) abbiamo:
1
f 0 ( x ) = p ⇐⇒ x α−1 = p ⇐⇒ x = p α−1 .
Allora
α
1
g( p) = x ( p) p − f ( x ( p)) = p α−1 p −
p α −1
α−1 α
=
p α −1 .
α
α
131
la trasformata di legendre
È tradizione porre
α
α−1
1
1
1
= β ⇐⇒
=
⇐⇒ + = 1
α−1
α
β
α β
per cui
g( p) =
pβ
.
β
In questo caso la disuguaglianza di Young assume la forma
xp ≤
xα
pβ
+ .
α
β
4. Data la funzione f : R → R definita da f ( x ) = ex calcolarne la trasformata
di Legendre.
Soluzione. La funzione è convessa. Come al solito imponiamo la condizione (B.2):
f 0 ( x ) = p ⇐⇒ ex = p ⇐⇒ x ( p) = ln p
Quindi la trasformata di Legendre della funzione è
p ∈ R+ .
g( p) = x ( p) p − f ( x ( p)) = p ln p − p.
Notiamo che
g0 ( p) = ln p = x ( p)
1
g00 ( p) = = x 0 ( p) > 0.
p
Questo è un risultato di carattere generale: la trasformata di Legendre
trasforma funzioni convesse in funzioni convesse.
5. Si consideri la funzione f : R2 → R definita da f ( x1 , x2 ) = 2x12 − 2x1 x2 +
x22 = x12 + ( x1 − x2 )2 . Determinare la trasformata di Legendre di f ( x1 , x2 ).
Soluzione. Dalla (B.4) abbiamo:

∂f


 ∂x = 4x1 − 2x2 = p1
1
⇐⇒

∂
f


= 2x2 − 2x1 = p2
∂x2

p1 + p2


 x1 ( p1 , p2 ) =
2
.

p
+
2p2
1

 x2 ( p1 , p2 ) =
2
Allora per la (B.5) la trasformata di Legendre di f ( x1 , x2 ) è
g( p) = x1 ( p1 , p2 ) p1 + x2 ( p1 , p2 ) p2 − f ( x1 ( p1 , p2 ), x2 ( p1 , p2 )) =
p1 + p2
p1 + 2p2
p1 + p2 2
p1 + p2
=
p1 +
p2 −
−
+
2
2
2
2
2
p2 + 2p1 p2 + 2p22
p1 + 2p2
−
= 1
.
2
4
132
C
S I M B O L O D I L E V I - C I V I TA
Il simbolo di Levi-Civita ε ijk è così definito:



+1 se (i, j, k ) è una permutazione pari di (1, 2, 3),
ε ijk =
−1


0
se (i, j, k ) è una permutazione dispari di (1, 2, 3),
altrimenti (cioè almeno due indici sono uguali).
Ricordiamo che con permutazione pari si intende una permutazione ottenuta con
un numero pari di trasposizioni a partire da quella di partenza; è una permutazione
dispari, invece, una permutazione ottenuta con un numero dispari di trasposizioni.
Così, (1, 2, 3), (2, 3, 1) e (3, 1, 2) sono permutazioni pari di (1, 2, 3), mentre (1, 3, 2),
(3, 2, 1) e (2, 1, 3) sono permutazioni dispari.
Il simbolo di Levi-Civita permette di scrivere in maniera compatta alcune relazioni di algebra lineare. Per esempio, indicando con x̂1 , x̂2 e x̂3 i versori di R3 , il
prodotto vettoriale di due vettori a = ( a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) è:
x̂1 x̂2 x̂3 3
a × b = a1 a2 a3 = ∑ ε ijk x̂i a j bk .
b b b i,j,k=1
2
3
1
La i-esima componente è
( a × b )i =
3
∑
j,k =1
ε ijk a j bk .
(C.1)
Si vede dunque che ε ijk può anche essere definito nel modo seguente:
ε ijk = x̂i · ( x j × xk ).
La (C.1) può essere scritta in maniera più concisa adoperando la notazione di
Einstein: se in un termine ci sono degli indici ripetuti, si sottintende l’operazione
di somma sui valori che tali indici possono assumere e si omette il simbolo di
sommatoria. Nel secondo membro della (C.1) gli indici ripetuti sono j e k (ma
non i) e possono variare da 1 a 3, quindi con questa notazione abbiamo:
( a × b)i = ε ijk a j bk .
Calcoliamo
3
∑ ε kij ε klm
k =1
con i 6= j e l 6= m. I termini non nulli sono quelli con k 6= i, j e k 6= l, m. Allora,
affinché la somma non sia nulla dobbiamo avere
133
simbolo di levi-civita
• i = l e j = m;
• i = m e j = l.
La prima condizione è esplicitata da δil δjm , la seconda da δim δjl , quindi
3
3
k =1
k =1
∑ ε kij ε klm = ∑ ε kij ε klm
3
=
∑
k =1
3
!
δil δjm +
3
!
ε2kij
δil δjm +
∑ ε kij ε klm
k =1
∑ ε kij ε kji
k =1
!
δim δjl =
!
δim δjl =
= δil δjm − δim δjl .
Con la notazione di Einstein abbiamo:
ε kij ε klm = δil δjm − δim δjl .
A primo membro si somma su k poiché questo è l’unico indice ripetuto, a secondo
membro non c’è alcuna somma in quanto non ci sono indici ripetuti in ciascuno
dei due termini δil δjm e δim δjl .
Il simbolo di Levi-Civita può anche essere esteso a più di 3 indici nel modo
seguente:



+1 se (i, j, k, l, . . . ) è una permutazione pari di (1, 2, 3, 4, . . . ),
ε ijkl... =
134
−1


0
se (i, j, k, l, . . . ) è una permutazione dispari di (1, 2, 3, 4, . . . ),
se almeno due indici sono uguali.
D
C A L C O L O D E L L A C O S TA N T E D I R A D I A Z I O N E
Nel capitolo 6 abbiamo visto che la densità di energia irradiata da un corpo nero
per unità di frequenza uν è data dalla Legge della radiazione di Planck
uν =
8π 3
h
,
ν
c3 e khν
B T −1
quindi la densità di energia u è
u=
Z +∞
0
uν dν =
Z +∞
8π 3
ν
0
c3
Effettuiamo la sostituzione
x=
h
e
hν
kB T
−1
dν =
8π
h
c3
ν3
Z +∞
0
e
hν
kB T
−1
dν.
hν
k T
⇐⇒ dν = B dx.
kB T
h
Gli estremi di integrazione rimangono gli stessi poiché ν → 0 =⇒ x → 0 e
ν → +∞ =⇒ x → +∞. Poiché se Re(s) > 1 sussiste la relazione1
Z + ∞ s −1
x
e x −1
0
dx = Γ(s)ζ (s),
in cui Γ indica la funzione gamma di Eulero e ζ la funzione zeta di Riemann,
abbiamo
+∞ ( xk T/h )3 k T
8π
B
B
dν = 3 h
dx =
hν
x
c
e −1
h
0
0
e kB T −1
Z
8π
k B T 4 +∞ x3
kB T 4
8π
dx = 3 h
Γ (4) ζ (4).
= 3h
c
h
e x −1
c
h
0
8π
u= 3h
c
Z +∞
ν3
Z
Ora, Γ(4) = 3! = 6 e ζ (4) = π 4 /90, dunque
5 4
8π kB
T 4 = aT 4 ,
u=
15c3 h3
dove
a=
8π 5 k4B
8π 5 (1.380 650 4 · 10−23 J/K)4
=
=
15c3 h3
15(299 792 458 m/s)3 (6.626 068 96 · 10−34 J · s)3
= 7.5657 · 10−16 J/(m3 · K4 )
è la costante di radiazione. La legge di Stefan-Boltzmann è spesso scritta nella forma
P
= σT 4
A
1 Per una dimostrazione di questa relazione puoi vedere, per esempio, De Marco [5, pagina 575].
135
calcolo della costante di radiazione
in cui P/A è il rapporto fra potenza irradiata dal corpo nero e area (questo rapporto è chiamato irradianza) e σ è la costante di Stefan-Boltzmann legata alla costante
di radiazione dalla relazione
a=
4σ
,
c
pertanto la costante di Stefan-Boltzmann vale
σ=
2π 5 k4B
π 2 k4B
ac
π 2 (1.380 650 4 · 10−23 J/K)4
=
=
=
=
4
15h3 c3
60}3 c3
60(1.054 571 62 · 10−34 J · s)3 (299 792 458 m/s)3
= 5.6704 · 10−8 W/(m2 · K4 ).
136
E
N O T E S U L L E U N I TÀ D I M I S U R A
Nel sistema internazionale (SI) l’unità di misura dell’energia è il joule (simbolo J):
1 J = 1 kg · m2 /s2 .
Nel sistema di Gauss (SG o CGS) l’unità di misura è l’erg:
1 erg = 1 g · cm2 /s2 .
Ovviamente 1 J = 107 erg.
Altra unità di misura, usata in chimica e in termodinamica, è la caloria (cal),
insieme al suo multiplo, la chilocaloria (kcal):
1 kcal = 4.184 · 103 J.
In diversi settori della Fisica l’unità di misura usata è l’elettronvolt (eV); ricordiamo che 1 eV è l’energia di un elettrone sottoposto a una differenza di potenziale
di 1 V. Dunque, con riferimento alla tabella seguente:
1 eV = 1.6 · 10−19 J = 1.6 · 10−12 erg
e inversamente
1 J = 0.625 · 1019 eV.
Multipli dell’elettronvolt sono:
1 keV = 103 eV
1 MeV = 106 eV
1 GeV = 109 eV
1 TeV = 1012 eV.
Poiché m0 c2 ha le dimensioni di un’energia, la massa a riposo può essere misurata
in eV/c2 . In Fisica atomica si usa spesso come unità di massa l’unità di massa
atomica (uma), definita come la dodicesima parte della massa del 12 C:
1 uma = 1.661 · 10−27 kg = 931.5 MeV/c2 .
137
F
C O S TA N T I F I S I C H E F O N D A M E N TA L I
Riportiamo di seguito alcune costanti fisiche fondamentali, alcune delle quali sono
di interesse per la trattazione corrente. I dati, forniti in unità SI, sono presi da
Mohr, Taylor e Newell [13].
Nome della costante
Velocità della luce (esatto)
Costante di Planck
Costante di Boltzmann
Costante di Stefan-Boltzmann
Costante di gravitazione
Carica dell’elettrone
Massa a riposo dell’elettrone
Massa a riposo del protone
Massa a riposo del neutrone
Massa a riposo del muone
Raggio di Bohr
Costante di Rydberg
Permeabilità del vuoto (esatto)
Permittività del vuoto (esatto)
Magnetone di Bohr
Costante di struttura fine
Costante di Avagadro
Costante di Faraday
Costante molare dei gas
Simbolo
Valore
c
h
kB
π 2 k4B
σ=
60}3 c2
G
−e
me
mp
mn
mµ
4πε 0 h̄2
a0 =
me e2
α2 me c
R∞ =
2h
µ0 = 4π · 10−7 N/A2
1
ε0 =
µ0 c2
e}
µB =
2me
e2
α=
4πε 0 }c
NA
F = eNA
R = kB NA
299 792 458 m/s
6.626 068 96(33) · 10−34 J · s
1.380 650 4(24) · 10−23 J/K
5.670 400(40) · 10−8 W/(m2 · K4 )
6.674 28(67) · 10−23 m3 /(kg · s)
−1.602 176 487(40) · 10−19 C
9.109 382 15(45) · 10−31 kg
1.672 621 637(83) · 10−27 kg
1.674 927 211(84) · 10−27 kg
1.883 531 30(11) · 10−28 kg
0.529 177 208 59(36) · 10−11 m
10 973 731.568 527(73)/m
12.566 370 614 . . . · 10−7 N/A2
8.854 187 817 . . . · 10−12 F/m
927.400 915(23) · 10−26 J/T
7.297 352 537 6(50) · 10−3
6.022 141 79(30) · 1023 /mol
96 485.3399(24) C/mol
8.314 472(15) J/(K · mol)
Riportiamo inoltre il valore delle masse di alcune particelle espresse in MeV/c2 .
Nome della costante
Massa a riposo dell’elettrone
Massa a riposo del protone
Massa a riposo del neutrone
Massa a riposo del muone
Simbolo
me
mp
mn
mµ
Valore
0.510 998 910(13) MeV/c2
938.272 013(23) MeV/c2
939.565 346(23) MeV/c2
105.658 366 8(38) MeV/c2
139
RIFERIMENTI BIBLIOGRAFICI DELLE APPENDICI
[1]
Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica
moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli
argomenti del corso.
[2]
Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma:
Editori Riuniti, 2010 (citato a pagina 129).
[3]
Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri,
2007 (citato a pagina 112).
[4]
Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976.
[5]
Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli,
1993 (citato alle pagine 127, 135).
[6]
Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002.
[7]
Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna:
Zanichelli, 2005 (citato alle pagine 59, 75).
[8]
David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica
moderna. Milano: CEA, 2002.
[9]
Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica
di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100).
[10]
Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995.
[11]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69).
[12]
Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004.
[13]
P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database
è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg,
Maryland 20899: National Institute of Standards and Technology, 25 ott.
2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a
pagina 139).
[14]
Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000.
[15]
Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996.
[16]
Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973.
141
INDICE ANALITICO
accelerazione, vii
angolare, momento
conservazione, viii, 27
meccanico, viii
parentesi di Poisson, 64
problema delle forze centrali, 32
relativistico, 103
simmetria sferica, 32
tensore, 103
totale, xii
variabile azione, 76
velocità areolare, 33
angolo
variabile, 76
anolonomo, vincolo, 3
areolare, velocità, 33
attrito
vincoli scabri, 4
autovalori
di una matrice rispetto a un’altra,
42
piccole oscillazioni, 42, 46
azione
e reazione
forma debole, xi, 31
forma forte, xii, 31
funzionale, 18
integrale sull’orbita, 76
oscillatore armonico unidimensionale, 76
variabile, 76
Bertrand, teorema di, 35
Bohr
atomo di, 119
condizione di quantizzazione di
Bohr-Sommerfeld, 119
Boltzmann
costante di Stefan-Boltzmann, 136
distribuzione di, 115
legge di Stefan-Boltzmann, 113, 135
brachistocrona, 23
calcolo delle variazioni, 17
applicazioni del, 21
equazioni di Eulero-Lagrange, 20
lemma fondamentale del, 20
canonica, trasformazione, 65
canoniche
equazioni di Hamilton, 52
variabili, 51
catastrofe ultravioletta, 115
centro
di forza, 32, 33
di massa, xi, 31, 32
ciclica
coordinata, 27
problema di Keplero, 33
cinetica, energia
classica
di un sistema di particelle, xii
di una particella, viii
relativistica, 101
teorema della, xii
Compton, effetto, 118
configurazioni, spazio delle, 17
trasformazioni puntuali, 64
cono luce, 89
cono del futuro, 89
cono del passato, 90
conservazione
del momento angolare, viii
dell’energia meccanica, xiii
della quantità di moto
relativistica, 106
leggi di, 26
controvariante, 95
coordinate
canoniche, 52
cicliche, 26
143
Indice analitico
controvarianti, 95
covarianti, 95
lagrangiane, 4
normali, 44
polari, 32
principali, 44
corpo nero, 113
legge dello spostamento di Wien,
114
legge di Planck, 116
legge di Stefan-Boltzmann, 113, 135
relazione di Rayleigh-Jeans, 115
costante
dello spostamento di Wien, 114
di radiazione, 113, 135
di Stefan-Boltzmann, 136
Coulomb
gauge di, 28
covariante
equazione, 104
formulazione, 98
hamiltoniana, 107
quadrivettore, 96
d’Alembert, principio di, 6
Davisson e Germer, esperimento di,
120
de Broglie, 119
onde di materia di, 120
relazione di, 120
diagonalizzazione, 43
diffusione
Compton, 118
dilatazione dei tempi, 93
dissipazione, funzione di
di Rayleigh, 11
Einstein, 112
notazione di, 95, 133
relazione di, 102
elettromagnetico
campo
lagrangiana, 10
lagrangiana covariante, 106
tensore, 109
144
ellisse
eccentricità della, 37
equazione in coordinate polari della, 37
parametro della, 37
energia
a riposo, 102
equivalenza massa-energia, 102
conservazione, viii
forze centrali, 33
densità di, 113
funzione, 28
conservazione, 28
in un campo centrale, 33
meccanica, principio di conservazione, xiii
potenziale, viii
principio di equipartizione, 115
relativistica, 101, 107
relazione di Planck-Einstein, 102
equazione del moto
di Minkowski, 104
particella carica in campo elettromagnetico, 109
equilibrio, 5
forze generalizzate, 6
instabile, 40
piccole oscillazioni, 40
stabile, 40
etere, 83, 110
eV, definizione, 137
evento, 83
forza, vii
attiva, 6
centrale, viii, 32
centro di, 32
conservativa, viii
di Lorentz, 10
generalizzata, 6
legge dell’inverso del quadrato, 35
lineare di richiamo, 35
momento di una, viii
non derivabile da un potenziale,
11
Indice analitico
vincolare, 3
fotoelettrico, effetto, 116
fotone, 102
frequenza
di soglia, 116
modo normale, 44
funzione
caratteristica di Hamilton, 76
generatrice, 65
funzione principale di Hamilton, 74
mista, 69
parentesi di Poisson, 69
variabili angolo-azione, 76
Galileo
principio di, 83
trasformazioni di, 83, 87, 91
gauge
di Coulomb, 28
di Lorentz, 109
trasformazioni di, 12
generalizzata
coordinata, 4
forza, 6
generalizzato
potenziale, 10
gradi di libertà, 4, 12
N particelle, 4
piccole oscillazioni, 40
Hamilton
equazioni di, 52
notazione simplettica, 58
funzione caratteristica di, 76
funzione principale di, 74
principio variazionale di, 18
principio variazionale modificato,
61
Hamilton-Jacobi, equazione di, 74
hamiltoniana
covariante, 107
notazione simplettica, 57
particella carica in campo elettromagnetico, 110
Hooke, legge di, 35
identica, trasformazione, 68
inerzia, principio di, 84
invarianza
di Lorentz, 87, 90, 105
parentesi di Poisson, 69
per rotazioni, 27
per traslazioni, 27
irradianza, 136
Jacobi, identità di, 63
Keplero
prima legge di, 38
problema di, 36
seconda legge di, 33
terza legge di, 39
Kirchhoff, 113
Lagrange
equazioni di, 7
derivazione dal principio di Hamilton, 19
forze non derivabili da un potenziale, 12
lagrangiana, 7
campo elettromagnetico, 12
potenziali generalizzati, 8
Laplace-Runge-Lenz, vettore di, 36
Legendre, trasformazione di, 51, 129
Levi-Civita, ε ijk simbolo di, 64, 133
liscio, vincolo, 4
Lorentz
forza di, 10
gauge di, 109
scalare di, 97
trasformazioni di, 84, 87
lunghezza propria, 92
massa ridotta, 31
matrice
autovalori, 42
definita positiva, 41
diagonale, 43
identità, 42
145
Indice analitico
ortogonale, 43
piccole oscillazioni
energia cinetica, 41
energia potenziale, 41
simmetrica, 41
simplettica standard, 58
Maxwell, equazioni di, 83
Michelson e Morley, esperimento di,
83, 111
minima azione
principio di, 20
Minkowski
diagramma di, 89
equazione di, 104
spazio di, 94
modo normale, 44
momento
angolare, viii
totale, xii
canonico, o coniugato, 26
generalizzato, 27
torcente, viii
monogenico, sistema, 17
olonomo, vincolo, 3
omogenea, funzione
energia cinetica, 28, 33, 41
orbita
chiusa, 34
circolare, 35
ellittica, 35
iperbolica, 35
limitata, 34
piano dell’orbita, 32
oscillatore armonico, 70, 76
corpo nero, 114
oscillatori accoppiati, 45
piccole oscillazioni, 40
particella carica in campo elettromagnetico, 10, 109
pendolo piano, viii, 4, 8, 9
Planck, 115
legge di, 116
Poisson
146
parentesi di, 62
equazioni di Hamilton, 63
fondamentali, 63
proprietà, 63
teorema di, 63
potenziale
centrale, 31, 32
efficace, 34
d’arresto, 117
di estrazione, 117
energia, 7
generalizzato, 8, 10
elettromagnetico, 10
scalare ϕ, 10
vettoriale A, 10
potere assorbente, 113
prodotto scalare
nello spazio di Minkowski, 95, 98
punto materiale, vii
quadritensore
p volte controvariante e q volte
covariante, 97
completamente controvariante, 97
completamente covariante, 97
elettromagnetico, 109
quadrivettore
controvariante, 95
covariante, 96
quadriaccelerazione, 99
quadriforza, 104
quadrimomento, 103
quadrivelocità, 99
quantità di moto
conservazione della, vii
di un sistema di particelle, xi
di una particella, vii
Rayleigh, funzione di dissipazione di,
11
Rayleigh-Jeans
catastrofe di, 115
relazione di, 115
relatività
galileiana, 83
Indice analitico
ristretta, 84
postulati, 84
quadrivettore, 95
tensore metrico, 95
reonomo, vincolo, 3
Routh
funzione di, 59
Routh, metodo di, 59
scabro, vincolo, 4
scleronomo, vincolo, 3
simmetria sferica, 32
simplettica, notazione, 57
spazio
delle configurazioni, 17
delle fasi, 51
spaziotempo, 84
spostamento
legge dello, 114
Stefan
costante di Stefan-Boltzmann, 136
legge di Stefan-Boltzmann, 113, 135
successione di Fibonacci, 127
principio di Hamilton modificato, 61
velocità, vii
vincolo
anolomono, 3
liscio, 4
olonomo, 3
corpo rigido, 3
reonomo, 3
scabro, 4
scleronomo, 3
virtuali
principio dei lavori, 5
spostamenti, 4
viscosa, forza, 11
Wien, 114
costante di, 114
legge dello postamento di, 114
tachione, 88
tardione, 88
tempo proprio, 93
tensore metrico
controvariante, 96
covariante, 95
tipo luce, 88
trasformazione
canonica, 65
funzione generatrice, 65
identica, 68
parentesi di Poisson, 69
di Galileo, 87
di gauge, 12
di Legendre, 51, 129
di Lorentz, 87
variabili
canoniche, 51
dinamiche, 62
variazionale
principio di Hamilton, 18
147