Università del Salento FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea in Fisica INTRODUZIONE ALLA FISICA MODERNA ROSARIO ANTONIO LEO Anno Accademico 2010/2011 INDICE nozioni elementari. richiami vii 1 Punto materiale vii 1.1 Esempio: pendolo semplice 2 Sistemi di particelle xi viii i meccanica analitica 1 1 principio di d’alembert ed equazioni di lagrange 3 1.1 Vincoli 3 1.1.1 Definizioni 3 1.1.2 Classificazione dei vincoli 3 1.2 Gradi di libertà e coordinate lagrangiane 4 1.3 Principio di d’Alembert ed equazioni di Lagrange 4 1.3.1 Esempi nel caso statico 8 1.3.2 Esempio nel caso dinamico 9 1.4 Potenziali generalizzati e funzioni di dissipazione 10 1.4.1 Potenziali generalizzati 10 1.4.2 Equazioni di Lagrange in presenza di forze non derivabili da un potenziale 11 1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo elettromagnetico 12 2 principio variazionale di hamilton ed equazioni di lagrange 17 2.1 Principio di Hamilton 17 2.2 Applicazioni del calcolo delle variazioni 21 2.2.1 Cammino più breve fra due punti in un piano 21 2.2.2 Il problema della brachistòcrona 23 2.3 Leggi di conservazione 26 2.3.1 Coordinate cicliche 26 2.3.2 Funzione energia 28 3 applicazioni delle equazioni di lagrange 31 3.1 Problema dei due corpi 31 3.1.1 Movimento in un campo centrale 32 3.1.2 Il problema di Keplero 36 3.2 Piccole oscillazioni 40 3.2.1 Impostazione del problema 40 3.2.2 Riepilogo 44 3.2.3 Osservazioni 44 3.2.4 Un particolare problema 45 4 formalismo hamiltoniano 51 4.1 Equazioni di Hamilton 51 iii Indice 4.1.1 Un esempio 56 Notazione simplettica 57 Coordinate cicliche e metodo di Routh 58 Principio variazionale di Hamilton modificato 61 Parentesi di Poisson 62 Trasformazioni canoniche 64 Equazioni di Hamilton-Jacobi 73 Variabili angolo-azione nel caso unidimensionale 76 4.8.1 Esempio: l’oscillatore armonico unidimensionale Riferimenti bibliografici della parte i 79 4.2 4.3 4.4 4.5 4.6 4.7 4.8 ii 76 relatività ristretta e introduzione alla meccanica quantistica 81 5 relatività speciale 83 5.1 Trasformazioni di Lorentz 83 5.1.1 Premessa 83 5.1.2 Concetto di evento 83 5.1.3 Principio di inerzia 84 5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz 84 5.2 Alcune conseguenze delle trasformazioni di Lorentz 90 5.2.1 Legge di trasformazione delle velocità 90 5.2.2 Contrazione delle lunghezze 92 5.2.3 Dilatazione dei tempi 93 5.3 Lo spazio di Minkowski 94 5.4 Quadrivelocità e quadriaccelerazione 98 5.5 Dinamica relativistica 100 5.6 Energia cinetica e momenti 101 5.7 Quadrimomento, tensore momento angolare 103 5.8 Equazioni del moto 104 5.9 Meccanica analitica relativistica (cenni) 105 5.9.1 Carica in moto in un campo elettromagnetico 108 5.10 *L’interferometro di Michelson e Morley 110 6 introduzione alla meccanica quantistica 113 6.1 *Il corpo nero 113 6.2 Effetto fotoelettrico 116 6.3 Effetto Compton 118 6.4 Onde di materia di de Broglie 119 Riferimenti bibliografici della parte ii 123 iii appendici 125 a la successione di fibonacci b la trasformata di legendre b.1 Definizione 129 c simbolo di levi-civita 133 iv 127 129 Indice d calcolo della costante di radiazione e note sulle unità di misura 137 f costanti fisiche fondamentali 139 Riferimenti bibliografici delle appendici 141 Indice analitico 143 135 v N O Z I O N I E L E M E N TA R I . R I C H I A M I 1 punto materiale L’idea di punto materiale è uno dei concetti di base della meccanica analitica. Il punto materiale è caratterizzato dalla sua massa. La posizione di un punto materiale in un sistema di riferimento Oxyz, supposto inerziale salvo avviso contrario, è determinata dal raggio vettore r = x x̂ + yŷ + zẑ. Definiamo velocità v= dr = ẋ x̂ + ẏŷ + żẑ, dt quantità di moto p = mv, e accelerazione a= d2 r dv = 2. dt dt Sappiamo che, in un sistema di riferimento inerziale, valgono i principi della dinamica. Se F è la forza risultante agente sulla particella di massa m si ha che, per il secondo principio della dinamica, F= dp dv =m = ma, dt dt (1) con m supposta costante rispetto al tempo. Supponiamo che la particella sia libera. Allora x (t), y(t), z(t) sono tra loro indipendenti. Se F = F (r, v, t) = F ( x, y, z; ẋ, ẏ, ż; t) dalle (1) otteniamo: m ẍ (t) = Fx ( x, y, z; ẋ, ẏ, ż; t) , mÿ(t) = Fy ( x, y, z; ẋ, ẏ, ż; t) , (2) mz̈(t) = Fz ( x, y, z; ẋ, ẏ, ż; t) . Assegnate le condizioni iniziali r (0) = r0 e v(0) = v0 , se in un intorno di (r0 , v0 , 0) le funzioni Fx , Fy e Fz sono “buone” (per esempio sono lisce, cioè sono di classe C ∞ ), allora il sistema di equazioni (2) per t > 0 ammette, almeno in un intorno di (r0 , v0 , 0), un’unica soluzione. Viene così soddisfatto, almeno localmente, il principio deterministico newtoniano. Le equazioni (2) sono dette equazioni del moto. Osservazione. La quantità di moto si conserva, cioè p è costante, se F = 0 identicamente. vii nozioni elementari. richiami Definiamo momento angolare della particella rispetto a O LO = r × p = mr × v. (3) Definiamo momento della forza F (o momento torcente) rispetto al punto O dLO dp =r× = r × F ≡ NO . dt dt (4) Dalla (4) si vede che il momento angolare si conserva, cioè LO è costante, se NO = 0 identicamente. Per esempio se consideriamo F forza centrale tale che il centro della forza è O, allora NO = 0 e quindi LO è costante. Il momento angolare della particella rispetto a un punto O0 individuato rispetto a O dal vettore posizione rO0 è dato da LO0 = (r − rO0 ) × p. Si vede facilmente che dLO0 dr 0 dr 0 = (r − rO0 ) × F − O × p = NO0 − O × p , dt dt dt dove NO0 è il momento delle forze rispetto a O0 . Se F è una forza conservativa allora F = −∇U (r ), dove U (r ) è l’energia potenziale. Indichiamo con T = mv2 /2 l’energia cinetica della particella. Sappiamo che se F è una forza conservativa vale il principio di conservazione dell’energia meccanica: T + U = costante. Ricordiamo che vale, anche se la forza non è conservativa, il teorema dell’energia cinetica: L= Z B A F · dr = 1 2 1 2 mv − mv = TB − TA . 2 B 2 A 1.1 Esempio: pendolo semplice Studiamo il moto del pendolo in figura 1. Le forze agenti su m sono T + P = ma. La componente radiale della risultante è uguale a T − mg cos θ = m v2 , l mentre la componente trasversa è −mg sin θ = maT viii 1 punto materiale y l θ T m U=0 P x Figura 1: Il pendolo semplice. dove aT è la componente trasversa dell’accelerazione. In generale, per un moto nel piano abbiamo, in coordinate polari: r = rr̂, d r̂ dr = ṙr̂ + r = ṙr̂ + r θ̇ n̂, v= dt dt dv d a= = (ṙr̂ + r θ̇ n̂) = r̈r̂ + ṙ θ̇ n̂ + ṙ θ̇ n̂ + r θ̈ n̂ − r θ̇ 2 r̂ = dt dt = (r̈ − r θ̇ 2 )r̂ + (r θ̈ + 2ṙ θ̇ )n̂. Nel caso particolare del pendolo semplice r = l = costante, quindi l’accelerazione trasversa è data da: aT = l θ̈ n̂ = − g sin θ n̂, da cui ricaviamo g θ̈ + sin θ = 0. l (5) Questa è una equazione differenziale non lineare e la soluzione è una funzione ellittica. L’equazione diventa lineare se supponiamo che le oscillazioni siano piccole in modo da poter porre sin θ ≈ θ. In questo caso risulta: g θ̈ + θ = 0. l La soluzione di questa equazione è θ = θ0 cos(ωt − ϕ0 ) dove θ0 e ϕ0 sono determinati dalle condizioni iniziali, mentre ω = pendolo oscilla con periodo s l 2π = 2π . T= ω g p g/l. Il ix nozioni elementari. richiami Nel caso in cui le oscillazioni non siano piccole, si dimostra che il periodo del pendolo è dato da s l 32 1 2 θm 4 θm + 2 2 sin +··· , 1 + 2 sin T = 2π g 2 2 2 4 2 dove θm è l’ampiezza angolare delle oscillazioni. L’equazione del moto del pendolo può essere ricavata anche nel modo seguente: x = l cos θ =⇒ y = l sin θ ẋ (t) = −l θ̇ sin θ . ẏ(t) = l θ̇ cos θ (6) Allora v2 (t) = ẋ2 (t) + ẏ2 (t) = l 2 θ̇ 2 . Applicando il principio di conservazione dell’energia abbiamo: E= 1 2 1 mv (t) + mgl (1 − cos θ (t)) = ml 2 θ̇ 2 + mgl (1 − cos θ (t)). 2 2 Poiché E = costante deve risultare dE g = ml 2 θ̇ θ̈ + mgl θ̇ sin θ = ml 2 θ̇ θ̈ + sin θ = 0 dt l da cui θ̈ + g sin θ = 0, l cioè la (5). In generale θ̈ 6= 0. Il moto del pendolo può ancora essere dedotto in questo modo. Abbiamo LO = r × mv = m(l cos θ x̂ + l sin θ ŷ) × (−l θ̇ sin θ x̂ + l θ̇ cos θ ŷ) = = ml 2 θ̇ ẑ. L’unico contributo al momento torcente è quello della forza peso, quindi NO = r × P = (l cos θ x̂ + l sin θ ŷ) × (mg x̂) = −lmg sin θ ẑ. Dunque, ricordando la (4), abbiamo: dL0 dml 2 θ̇ dLO = ẑ = ẑ = ml 2 θ̈ ẑ = −lmg sin θ ẑ dt dt dt da cui θ̈ + g sin θ = 0, l cioè di nuovo la (5). x 2 sistemi di particelle Esercizi 1. Studiare il moto di una particella di massa m soggetta alla forza F = −kr − αv (k, α > 0) dove r vettore posizione della particella e v velocità, con le condizioni iniziali r (0) = r0 6= 0 e v(0) = v0 k r0 . 2. Studiare il moto di una particella di massa m e carica q in un campo magnetico B uniforme e costante. Siano r (0) = r0 e v(0) = v0 6= 0. 3. Studiare il moto di una particella di massa m e carica q in un campo elettrico E e in un campo magnetico B, uniformi e costanti e tra loro ortogonali. 2 sistemi di particelle Supponiamo di avere un sistema di N particelle puntiformi. Sia Oxyz il sistema di riferimento (inerziale). Siano mi e ri rispettivamente la massa e il vettore posizione dell’i-esima particella. Definiamo centro di massa rCM = ∑iN=1 mi ri , M con M = ∑iN=1 mi . Detta inoltre vi = dri /dt la velocità dell’i-esima particella, la velocità del centro di massa sarà: vCM = ∑iN=1 mi vi . M Definiamo infine la quantità di moto pCM = N ∑ mi vi = MvCM . i =1 Osserviamo che la quantità di moto è una grandezza additiva. Ogni particella del sistema interagisce con le altre particelle e con il mondo esterno. Sia Fji la forza che la j-esima particella ( j 6= i ) esercita sulla i-esima. Se vale la forma debole del principio di azione e reazione allora Fij + Fji = 0. Per la seconda legge della dinamica N d pi (e) = Fi = Fi + ∑ Fji , dt j =1 j 6 =i xi nozioni elementari. richiami (e) dove Fi è la forza totale agente sulla i-esima particella, Fi è la forza totale esterna agente sulla i-esima particella e ∑ N j=1,j6=i Fji è la forza totale interna agente sulla N N i-esima particella. Poiché ∑i=1 ∑ j=1,j6=i Fji = 0 allora N N d pCM d pi (e) =∑ = ∑ Fi = F (e) , dt dt i =1 i =1 dove F (e) è la risultante delle forze esterne. Se F (e) = 0 allora pCM è costante e quindi il centro di massa si muove di moto rettilineo uniforme, assumendo che la massa M sia costante. Definiamo momento angolare del sistema di N particelle puntiformi rispetto a O LO = N ∑ ri × pi . i =1 Si ricava banalmente che N dLO = ∑ ri × Fi = NO . dt i =1 Osserviamo che se vale la forma forte del principio di azione e reazione, cioè se ri − r j × Fji = 0 ∀i, j 6= i, allora NO = N (e) ∑ ri × Fi i =1 (e) = NO . (e) Se NO = 0 allora LO è costante. Sia ri0 il vettore posizione dell’i-esima particella rispetto al centro di massa, cioè si ha ri0 = ri − rCM . Allora LO = N ∑ (rCM + ri − rCM ) × pi = rCM × pCM + LCM . i =1 Definiamo energia cinetica del sistema di N particelle T= N 1 ∑ 2 mi v2i . i =1 Vale ancora il teorema dell’energia cinetica: L= N ∑ Z 2 i =1 1 Fi · dri = T2 − T1 , dove 1 e 2 sono rispettivamente le configurazioni iniziale e finale del sistema. Osserviamo che N ∑ Z 2 i =1 1 xii Fi · dri = N ∑ Z 2 (e) i =1 1 Fi N N · dri + ∑ ∑ Z 2 i =1 j =1 1 j 6 =i Fji · dri 2 sistemi di particelle e inoltre Fji · dri + Fij · dr j = Fji · dri − dr j = Fji · dr ji con Fji · dr ji 6= 0 in generale. Se tutte le forze sono conservative allora L= N ∑ i =1 (e) Ui (e) (1) − Ui (2) + 1 N Uij (1) − Uij (2) . ∑ 2 i,j=1 j 6 =i Vale il principio di conservazione dell’energia meccanica: N (e) T + U = T + ∑ Ui + i =1 1 N Uji = costante. 2 i,j∑ =1 i6= j Esercizi 1. Dimostrare che dLCM = NCM , dt con LCM = ∑iN=1 (ri − rCM ) × pi e NCM = ∑iN=1 (ri − rCM ) × Fi . 2. Dimostrare che LCM = N ∑ (ri − rCM ) × pi0 , i =1 con pi0 = mi (vi − vCM ). xiii Parte I MECCANICA ANALITICA 1 P R I N C I P I O D I D ’ A L E M B E RT E D E Q U A Z I O N I D I L A G R A N G E 1.1 vincoli 1.1.1 Definizioni Fissato un sistema di riferimento inerziale, la posizione di una particella puntiforme è, a ogni istante, individuata dal vettore r (t). La particella è libera se non è soggetta ad alcuna condizione che ne limiti la traiettoria; in caso contrario si dice che essa è vincolata. Allo stesso modo per un sistema di N particelle, se tutte le particelle che costituiscono il sistema sono libere, il sistema è detto libero; altrimenti si dice che è vincolato. La presenza di vincoli comporta l’introduzione di forze che agiscono sulle particelle limitandone la mobilità. Queste forze sono dette forze vincolari o reazioni vincolari. Chiameremo attive le forze che non sono dovute a vincoli. 1.1.2 Classificazione dei vincoli Classifichiamo i vincoli: • In base alla forma delle relazioni che legano le coordinate delle particelle: – vincoli olònomi: possono essere espressi da relazioni del tipo f (r1 , r2 , . . . , r N , t) = 0. (1.1) Il sistema si dirà, in tal caso, olonomo. Per esempio: ∗ una particella che si muove nel piano xy lungo la retta y = mx + q; 2 ∗ il corpo rigido: le reazioni vincolari sono del tipo kri − r j k − c2ij = 0 (la distanza tra due punti generici del corpo rigido è costante); – vincoli anolònomi: non possono essere espressi da relazioni del tipo (1.1). Tali vincoli possono essere espressi da vincoli di diseguaglianza o equivalentemente da vincoli di uguaglianza in cui compaiono anche le velocità. Esempio: ∗ particella vincolata a stare all’interno di una sfera di centro O e raggio a. In tal caso il vincolo si esprime con kr k2 − a2 < 0. • In base alla dipendenza dal tempo: – vincoli scleronomi: non dipendono dal tempo; – vincoli reonomi: dipendono dal tempo. Per esempio: 3 principio di d’alembert ed equazioni di lagrange ∗ una particella che si muove su una retta che ruota con velocità angolare ω avrà un’equazione del tipo y = tan(ωt) x + q. • In base al tipo di reazione vincolare – vincoli lisci: la reazione vincolare è sempre normale al vincolo. Per esempio: ∗ se il vincolo olonomo è una superficie di equazione f (r, t), la reazione vincolare ϕ sarà parallela al gradiente di f : ϕ = µ(t)∇ f ; – vincoli scabri: la reazione vincolare ha una componente tangenziale al vincolo (sono presenti forze di attrito). 1.2 gradi di libertà e coordinate lagrangiane La configurazione di un sistema libero formato da N particelle è definita dagli N vettori posizione ri (t), con i = 1, . . . , N, ed è quindi individuata, in uno spazio tridimensionale, da 3N quantità scalari o coordinate indipendenti. Definiamo numero di gradi di libertà del sistema il minimo numero di coordinate indipendenti in grado di individuare la configurazione. Secondo questa definizione un sistema libero di N particelle in uno spazio tridimensionale ha 3N gradi di libertà. In un sistema vincolato le coordinate non sono tra loro indipendenti. Se i vincoli sono olonomi e sono espressi mediante k equazioni del tipo (1.1), allora il numero di coordinate indipendenti sarà n = 3N − k e quindi si avranno n gradi di libertà. Possiamo pertanto introdurre n coordinate indipendenti che tengano conto dei vincoli. Siano q1 , q2 , . . . , qn tali coordinate. Esse non hanno in generale le dimensioni di una lunghezza e non possono essere raggruppate per formare le tre componenti di un vettore. Per esempio, si consideri un pendolo nel piano. Il sistema avrebbe due gradi di libertà se non fosse vincolato; dato che la distanza tra la particella e l’origine è fissata uguale a l si ha invece un solo grado di libertà. Si può allora individuare lo stato del sistema in ogni istante utilizzando una sola coordinata quale, per esempio, l’angolo θ. È possibile esprimere i vettori posizione mediante le nuove coordinate tramite le trasformazioni r i = r i ( q1 , q2 , . . . , q n , t ) (i = 1, . . . , N ). Le coordinate qi , con i = 1, . . . , n, sono dette coordinate lagrangiane o generalizzate del sistema. Esse, ovviamente, non sono uniche. 1.3 principio di d’alembert ed equazioni di lagrange Definiamo spostamento virtuale infinitesimo di un sistema un cambiamento di configurazione relativo a una variazione δri delle coordinate, compatibile con le forze 4 1.3 principio di d’alembert ed equazioni di lagrange e i vincoli a cui il sistema è sottoposto a un dato istante t. Chiamiamo tale spostamento virtuale per distinguerlo da uno spostamento reale dri in cui si considera un intervallo dt nel quale variano forze e vincoli. Consideriamo un sistema di N particelle. Supponiamo che il sistema sia in equilibrio, cioè che ogni particella del sistema è in equilibrio. Allora Fi = 0 =⇒ Fi · δri = 0 =⇒ N δL = ∑ Fi · δri = 0, (1.2) i =1 con i = 1, . . . , N, dove δL è il lavoro virtuale infinitesimo. Le Fi sono le risultanti di tutte le forze agenti sull’i-esima particella (interazione con l’Universo, con le (a) (a) altre particelle, forza vincolare). Se poniamo Fi = Fi + Φi , dove Fi e Φi sono rispettivamente la forza attiva totale e la forza vincolare agenti sulla i-esima particella, la (1.2) diventa: N δL = (a) ∑ Fi i =1 N · δri + ∑ Φi · δri = 0. (1.3) i =1 Assumeremo d’ora in avanti che il lavoro virtuale delle forze vincolari sia nullo, cioè ∑iN=1 Φi · δri = 0, e che i vincoli siano olonomi bilaterali e lisci. Allora possiamo scrivere la (1.3) come N (a) ∑ Fi i =1 · δri = 0, (1.4) che è il principio dei lavori virtuali. Osserviamo che i δri , con i = 1, . . . , N, non sono (a) in generale linearmente indipendenti e quindi i Fi non sono automaticamente nulli. Siano q1 , q2 , . . . , qn le coordinate lagrangiane del sistema scelte. Allora r i = r i ( q1 , q2 , . . . , q n , t ) , n δri = ∂ri ∑ ∂qk δqk , (1.5a) (1.5b) k =1 con i = 1, . . . , N. Supponendo che il lavoro virtuale delle forze vincolari sia nullo si ha ! N N n n N ∂r ∂r (a) (a) (a) i i δL = ∑ Fi · δri = ∑ Fi · ∑ δqk = ∑ ∑ Fi · δqk = ∂q ∂q k k i =1 i =1 k =1 k =1 i =1 n = ( a) ∑ Qk k =1 δqk , dove (a) Qk = N (a) ∑ Fi i =1 · ∂ri ∂qk (k = 1, . . . , n) (1.6) 5 principio di d’alembert ed equazioni di lagrange sono dette forze generalizzate (attive). Poiché le δqk sono indipendenti si ha (a) δL = 0 =⇒ Qk = 0 (k = 1, . . . , n). (a) Si può dimostrare che Qk = 0 con k = 1, . . . , n è condizione necessaria e sufficiente per l’equilibrio, in presenza di vincoli olonomi bilaterali lisci. La relazione (1.4) è applicabile solo al caso statico. Se si vuole applicare il principio dei lavori virtuali anche al caso di moto del sistema, bisogna partire dalle N equazioni del moto d pi /dt = Fi ⇐⇒ Fi − d pi /dt = 0 per i = 1, . . . , N. Se continuiamo ad assumere che le forze vincolari non compiono lavoro virtuale, la (1.4) diventa: N ∑ i =1 (a) Fi d pi − dt · δri = 0. (Principio di d’Alembert) (1.7) Osserviamo che le forze vincolari non compaiono esplicitamente. Indichiamo d’ora in poi con Fi la forza attiva totale agente sull’i-esima particella, togliendo l’apice (a). Come nel caso statico occorre ottenere un’espressione che contenga solo gli spostamenti virtuali delle coordinate generalizzate (che sono indipendenti). Partiamo, come nel caso statico, dalle trasformazioni r i = r i ( q1 , . . . , q n , t ) n δri = vi = (i = 1, . . . , N ) ∂ri ∑ ∂qk δqk k =1 n dri ∂r ∂r = ∑ i q̇k + i . dt ∂q ∂t k k =1 (1.8) Come prima abbiamo N n i =1 k =1 ∑ Fi · δri = ∑ Qk δqk , dove Qk = ∑iN=1 Fi · ∂ri /∂qk . Osserviamo che le qk non hanno necessariamente le dimensioni di una lunghezza, così come le Qk non hanno in generale le dimensioni di una forza. Consideriamo ora ! N n N dvi ∂ri d pi ∑ dt · δri = ∑ ∑ mi dt · ∂qk δqk = i =1 k =1 i =1 ( (1.9) ) n N d ∂ri d ∂ri mi vi · =∑ ∑ − mi vi · δqk . dt ∂qk dt ∂qk k =1 i =1 Osserviamo che dalla (1.8) si ricava ∂vi ∂ dri ∂r = = i. ∂q̇k ∂q̇k dt ∂qk 6 (1.10) 1.3 principio di d’alembert ed equazioni di lagrange Inoltre, in analogia con la (1.8) si ha n ∂2 r i ∂2 r i ∑ ∂qk ∂q j q̇ j + ∂qk ∂t = j =1 d ∂ri . = dt ∂qk ∂vi = ∂qk n ∂ ∑ ∂q j j =1 ∂ri ∂qk ∂ q̇ j + ∂t ∂ri ∂qk = (1.11) In base a queste osservazioni possiamo scrivere: ( ) N n N d pi ∂vi ∂vi d ∑ dt · δri = ∑ ∑ dt mi vi · ∂q̇k − mi vi · ∂qk δqk = i =1 k =1 i =1 ( " # ) n ∂ N 1 ∂ N 1 d 2 2 mi vi − mi vi δqk = =∑ dt ∂q̇k i∑ 2 ∂qk i∑ 2 =1 =1 k =1 n d ∂T ∂T =∑ − δqk , dt ∂q̇k ∂qk k =1 dove T = ∑iN=1 mi v2i /2. Allora il principio di d’Alembert è nel nostro caso equivalente alla relazione n ∂T d ∂T ∑ dt ∂q̇k − ∂qk − Qk δqk = 0. k =1 Dato che gli spostamenti virtuali infinitesimi δqk , con k = 1, . . . , n, sono indipendenti, possiamo scrivere n equazioni del moto d ∂T ∂T − = Qk . (1.12) dt ∂q̇k ∂qk Se supponiamo che le forze attive siano tutte conservative e derivino da un unico potenziale U, si ha Fi = −∇i U (con ∇i = (∂/∂xi , ∂/∂yi , ∂/∂zi )) e quindi Qk = N ∂ri ∑ Fi · ∂qk i =1 N = − ∑ ∇i U · i =1 ∂ri ∂U =− . ∂qk ∂qk Tenendo presente che U dipende solo da q e non da q̇ (cioè ∂U/∂q̇k = 0; k = 1, . . . , n), le n equazioni del moto (1.12) possono essere scritte nel modo seguente: d ∂ ∂ (T − U ) − ( T − U ) = 0. dt ∂q̇k ∂qk Definendo L = T−U lagrangiana del sistema, possiamo scrivere le equazioni di Lagrange: d ∂ ∂L L − = 0. dt ∂q̇k ∂qk (1.13) (1.14) 7 principio di d’alembert ed equazioni di lagrange Osservazione. Se consideriamo F = F (q, t) funzione di classe opportuna, si può dimostrare che L0 (q, q̇, t) = L(q, q̇, t) + dF/dt è un’altra funzione lagrangiana che porta alle stesse equazioni del moto.1 Osservazione. Le equazioni di Lagrange possono essere ancora scritte nella forma usuale se U = U (q, q̇, t) e ∂U d ∂U Qk = − + . (1.15) ∂qk dt ∂q̇k La funzione U è detta potenziale generalizzato, o potenziale dipendente anche dalle velocità e dal tempo. La funzione lagrangiana può ancora essere definita come L = T − U. 1.3.1 Esempi nel caso statico Determiniamo le condizioni di equilibrio del pendolo semplice (vedi figura 1 a pagina ix). Il sistema ha un solo grado di libertà e l’unica forza attiva è la forza peso P, quindi r = l cos θ x̂ + l sin θ ŷ, ∂ ∂ δL = P · δr = P · (l cos θ ) x̂ + (l sin θ )ŷ δθ = ∂θ ∂θ = mg x̂ · (−l sin θ x̂ + l cos θ ŷ)δθ = −mgl sin θδθ Q = −mgl sin θ = 0 =⇒ sin θ = 0 =⇒ θ = 0 oppure θ = π. Consideriamo ora il punto materiale P di massa m in figura 1.1 vincolato senza attrito su una circonferenza di raggio R e centro O, posto in un piano verticale. La particella è connessa al punto più alto mediante una molla di costante elastica k e lunghezza a riposo nulla. Anche questo sistema ha un solo grado di libertà. Abbiamo x P = R sin θ , y P = R cos θ ∂x p ∂y p δr P = x̂ + ŷ δθ = R(cos θ x̂ − sin θ ŷ). ∂θ ∂θ La forza peso è data da P = mgŷ. Inoltre r A = − Rŷ, quindi r P − r A = R sin θ x̂ + R(1 + cos θ )ŷ. Pertanto la forza elastica agente sulla particella è Fel = −k (r P − r A ) = −kR[sin θ x̂ + (1 + cos θ )ŷ]. Dunque: P · δr P = −mgR sin θδθ, Fel · δr P = −kR2 [sin θ cos θ − sin θ (1 + cos θ )]δθ = kR2 sin θδθ. 1 Si è qui utilizzata la notazione, che ricorrerà per brevità in seguito, q = (q1 , q2 , . . . , qn ) per indicare l’ennupla delle coordinate generalizzate; tuttavia bisogna tenere sempre presente che tale ennupla non è, in generale, un vettore (basti pensare che, come già osservato, le qi possono avere anche dimensioni diverse). 8 1.3 principio di d’alembert ed equazioni di lagrange A k x O θ R P y Figura 1.1: Pendolo collegato a una molla. La forza generalizzata attiva è: Q = −mgR sin θ + kR2 sin θ = R sin θ (kR − mg). La condizione di equilibrio si ha per Q = 0 cioè: 1. sin θ = 0, vale a dire θ = 0 oppure θ = π; 2. ∀θ ∈ [0, 2π ] se mg = kR. 1.3.2 Esempio nel caso dinamico Riprendiamo in considerazione il pendolo semplice (vedi figura 1 a pagina ix). Il sistema ha un grado di libertà, quindi sarà sufficiente scrivere una sola equazione di Lagrange. Valgono sempre le (6), dunque l’energia cinetica è data da T= 1 2 1 1 mv = m( ẋ2 + ẏ2 ) = ml 2 θ̇ 2 , 2 2 2 mentre l’energia potenziale è (fissando come punto a potenziale gravitazionale nullo il punto più basso del pendolo, come mostrato in figura) U = mgl (1 − cos θ ). Pertanto la lagrangiana del sistema è L = T−U = 1 2 2 ml θ̇ − mgl (1 − cos θ ) 2 e l’equazione di Lagrange ml 2 θ̈ + mgl sin θ = 0 che è equivalente alla (5). 9 principio di d’alembert ed equazioni di lagrange 1.4 potenziali generalizzati e funzioni di dissipazione 1.4.1 Potenziali generalizzati Consideriamo una particella puntiforme di massa m e carica q in un campo elettromagnetico E, B. Su di essa agisce la forza di Lorentz: v F = q E+ ×B . (1.16) c Le equazioni del moto sono perciò v d2 r dv = m 2 = q E+ ×B . m dt dt c Siano ora ϕ = ϕ( x, y, z, t) e A = A( x, y, z, t) i potenziali scalare e vettoriale rispettivamente in modo che E = −∇ ϕ − 1 ∂A , c ∂t (1.17) (1.18) B = ∇ × A. Riscriviamo la forza di Lorentz mediante le precedenti: 1 ∂A v F = q −∇ ϕ − + × (∇ × A) = c ∂t c 1 ∂A 1 1 = q −∇ ϕ − + ∇( A · v) − (v · ∇) A c ∂t c c (1.19) dove si è tenuto conto del fatto che ∇ · v = 0 e quindi v × (∇ × A) = ∇( A · v) − (v · ∇) A. Osserviamo ora che d A/dt = ∂ A/∂t + (v · ∇) A; inoltre dad ∇v ( A·v) to che A non dipende da v, = d A/dt; infine ∇v ϕ = 0 (dove ∇v = dt (∂/∂ ẋi , ∂/∂ẏi , ∂/∂żi )). Allora 1 1 dA F = q −∇ ϕ − A · v − = c c dt 1 d 1 (1.20) = q −∇ ϕ − A · v + ∇v ϕ − A · v = c dt c d ∇v U = −∇U + , dt dove U = qϕ − qA · v/c è un esempio di potenziale generalizzato, ovvero potenziale dipendente dalle derivate rispetto al tempo delle coordinate generalizzate (che qui corrispondono con le solite coordinate cartesiane). La funzione lagrangiana è, allora, la seguente: L = T−U = 1 2 q mv − qϕ + A · v = 2 c 1 = m( ẋ2 + ẏ2 + ż2 ) − qϕ( x, y, z, t)+ 2 q + ( ẋA x ( x, y, z, t) + ẏAy ( x, y, z, t) + żAz ( x, y, z, t)). c 10 1.4 potenziali generalizzati e funzioni di dissipazione Esercizi 1. Scrivere le equazioni di Lagrange di una carica puntiforme in un campo elettromagnetico. Dimostrare che esse coincidono con le equazioni del moto di partenza. 2. Scrivere la lagrangiana e le equazioni di Lagrange per i seguenti sistemi: a) pendolo piano semplice; b) pendolo piano doppio; c) pendolo piano il cui punto di sospensione è libero di muoversi orizzontalmente su una retta liscia . 3. Due punti materiali, uno di massa m1 e l’altro di massa m2 , sono collegati da una fune (inestensibile e di massa trascurabile) che passa attraverso un foro in un tavolo perfettamente liscio, in modo che m1 , per t = 0, abbia un moto circolare uniforme sulla superficie del tavolo ed m2 rimanga sospesa. Nell’ipotesi che m2 possa muoversi solo in direzione verticale, si scriva la lagrangiana e si ricavino le equazioni di Lagrange. Discutere la presenza di integrali primi del moto . Figura 1.2: Da sinistra: problema 2b, problema 2c, problema 3. 1.4.2 Equazioni di Lagrange in presenza di forze non derivabili da un potenziale Supponiamo che su una particella puntiforme agisca anche la seguente forza viscosa: Fa = −(α x v x ı̂ + αy vy ̂ + αz vz k̂) dove i coefficienti α x , αy , αz sono caratteristici del mezzo2 e ı̂, ̂, k̂ sono i versori degli assi coordinati. Osserviamo che, se introduciamo la cosiddetta funzione di dissipazione di Rayleigh F= 1 (α x v2x + αy v2y + αz v2z ), 2 2 In realtà questi coefficienti dipendono oltre che dal mezzo anche dalla forma e dalle dimensioni del corpo immerso nel fluido. 11 principio di d’alembert ed equazioni di lagrange abbiamo che Fa = −∇v F. Più in generale se il sistema è formato da N particelle, la forza viscosa totale è data da: Fa = − N ∑ (αx vkx ı̂ + αy vky ̂ + αz vkz k̂), k =1 dove si intende vk = (vkx , vky , vkz ) è la velocità della k-esima particella. La funzione di dissipazione in questo caso è data da: F= 1 N (α x v2kx + αy v2ky + αz v2kz ). 2 k∑ =1 La forza viscosa agente sulla k-esima particella può ovviamente essere scritta come Fa,k = −∇vk F. Se il sistema ha n gradi di libertà e q j con j = 1, . . . , n sono le coordinate generalizzate, le equazioni di Lagrange sono le seguenti: d ∂L ∂L − = Qj (1.21) dt ∂q˙j ∂q j dove le Q j sono le forze generalizzate associate alle forze viscose e non derivabili da un potenziale, e L è la lagrangiana, scritta tenendo conto di tutte le forze conservative. Sappiamo che: Qj = N ∑ k =1 Fa,k · N N ∂rk ∂r = − ∑ ∇vk F · k = ∂q j ∂q j k =1 = − ∑ ∇vk F · k =1 ∂F ∂vk =− . ∂q˙j ∂q˙j Allora in conclusione possiamo scrivere le equazioni di Lagrange (1.21) nel modo seguente: d ∂L ∂L ∂F − + = 0. dt ∂q˙j ∂q j ∂q˙j Evidentemente siamo in grado di scrivere esplicitamente le equazioni del moto conoscendo le due funzioni scalari L e F. 1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo elettromagnetico Siano ϕ e A i potenziali scalare e vettoriale nel campo elettromagnetico. Sappiamo che la lagrangiana assume la forma: L = mv2 /2 − qϕ + qA · v/c. Il sistema ha tre gradi di libertà. Operiamo le seguenti trasformazioni di gauge: 1 ∂χ(r, t) ; c ∂t A → A0 = A + ∇χ(r, t). ϕ → ϕ0 = ϕ − 12 1.4 potenziali generalizzati e funzioni di dissipazione Il campo elettromagnetico è invariante per trasformazioni di gauge. Sia ora L0 = mv2 /2 − qϕ0 + qA0 · v/c la nuova lagrangiana. Allora: mv2 q ∂χ q q − qϕ + + A · v + ∇χ · v = 2 c ∂t c c q ∂χ q = L+ + ∇χ · v = c ∂t c q dχ = L+ . c dt L0 = Concludendo, L0 ed L differiscono per la derivata totale rispetto al tempo di una funzione scalare di r e di t. Le equazioni di Lagrange sono, di conseguenza, invarianti per trasformazioni di gauge. Problemi 1. Se L = L(q, q̇, t) è una lagrangiana per un sistema a n gradi di libertà che verifica le equazioni di Lagrange, dimostrare che L0 = L + dF (q, t)/dt, con F funzione arbitraria di classe opportuna, verifica anch’essa le equazioni di Lagrange. Dimostrazione. Osserviamo che n ∂F (q, t) ∂F (q, t) dF (q, t) =∑ q̇k + . dt ∂q ∂t k k =1 Allora per j = 1, . . . , n ∂L0 (q, q̇, t) ∂L(q, q̇, t) ∂F (q, t) = + ∂q˙j ∂q̇ j ∂q j ∂L0 (q, q̇, t) ∂L(q, q̇, t) ∂ dF (q, t) = + . ∂q j ∂q j ∂q j dt Supponendo che d ∂F (q, t) ∂ dF (q, t) = ∂q j dt dt ∂q j abbiamo dunque, sempre per j = 1, . . . , n, che d dt d dt d dt ∂L ∂q̇ j ∂L0 ∂q̇ j ∂L0 ∂q̇ j − ∂L = 0 ⇐⇒ ∂q j − ∂ dF (q, t) d ∂F (q, t) ∂L0 − + = 0 ⇐⇒ dt ∂q j ∂q j ∂q j dt − ∂L0 = 0. ∂q j 13 principio di d’alembert ed equazioni di lagrange 2. Siano q1 , . . . , qn un insieme di coordinate generalizzate indipendenti di un sistema a n gradi di libertà con lagrangiana L(q, q̇, t), dove q = (q1 , . . . , qn ) e q̇ = (q̇1 , . . . , q̇n ). Si supponga di passare a un altro sistema di coordinate generalizzate indipendenti s1 , . . . , sn per mezzo di una trasformazione puntuale qk = qk (s, t) con k = 1, . . . , n ed s = (s1 , . . . , sn ). Dimostrare che la forma delle equazioni di Lagrange è invariante rispetto alle trasformazioni puntuali. Dimostrazione. Per j, k = 1, . . . , n abbiamo q̇ j = n ∂q j ∑ ∂si ṡi + i =1 ∂q̇ j ∂q j ∂q j =⇒ = ∂t ∂ṡi ∂si Ora, L = L(q(s, t), q̇(s, ṡ, t), t), dunque ∂L = ∂sk n n ∂L ∂q j ∂L ∂q̇ j + ∑ ∂q j ∂sk ∑ ∂q̇ j ∂sk j =1 j =1 n ∂L ∂q̇ j ∂L ∂q j = ∑ ∂q̇ j ∂ṡk ∑ ∂q̇ j ∂sk j =1 j =1 n n d ∂L ∂q j ∂L d ∂q j ∑ dt ∂q̇ j ∂sk + ∑ ∂q̇ j dt ∂sk = j =1 j =1 n n ∂L ∂q̇ j d ∂L ∂q j +∑ . =∑ dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk j =1 ∂L = ∂ṡk d ∂L = dt ∂ṡk n In conclusione, per k = 1, . . . , n, ricordando che d ∂L ∂L − =0 dt ∂q̇ j ∂q j per j = 1, . . . , n, d ∂L ∂L − = dt ∂ṡk ∂sk n n n ∂L ∂q̇ j ∂L ∂q j d ∂L ∂q j =∑ +∑ −∑ + dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk j=1 ∂q j ∂sk j =1 n n ∂L ∂q̇ j d ∂L ∂L ∂q j −∑ =∑ − = 0. ∂q̇ j ∂sk dt ∂q̇ j ∂q j ∂sk j =1 j =1 3. Dimostrare che vale la seguente forma di Nielsen delle equazioni di Lagrange: ∂T ∂ Ṫ −2 = Qj ∂q̇ j ∂q j ( j = 1, . . . , n) dove T = T (q, q̇, t) è l’energia cinetica, Ṫ ≡ dT/dt e Q j è la j-esima forza generalizzata. 14 1.4 potenziali generalizzati e funzioni di dissipazione Dimostrazione. Partiamo dalle equazioni di Lagrange (1.12), valide anche in presenza di forze attive generalizzate non conservative. Osserviamo che: dT (q, q̇, t) = dt n ∑ j =1 ∂ Ṫ ∂T = ∂q̇k ∂qk = ∂T ∂qk = ∂T ∂qk ∂T ∂T ∂T =⇒ q̇ j + q̈ j + ∂q j ∂q̇ j ∂t n ∂2 T ∂2 T ∂2 T +∑ q̇ j + q̈ j + = ∂q̇k ∂q j ∂q̇k ∂q̇ j ∂q̇k ∂t j =1 n ∂ ∂T ∂ ∂T ∂ ∂T +∑ q̇ j + q̈ j + = ∂q j ∂q̇k ∂q̇ j ∂q̇k ∂t ∂q̇k j =1 d ∂T + . dt ∂q̇k Allora ∂ Ṫ ∂T −2 = Qk ⇐⇒ ∂q̇k ∂qk d ∂T ∂T ∂T + −2 = Qk ⇐⇒ ∂qk dt ∂q̇k ∂qk ∂T d ∂T − = Qk . dt ∂q̇k ∂qk 15 P R I N C I P I O VA R I A Z I O N A L E D I H A M I LT O N E D E Q U A Z I O N I DI LAGRANGE 2.1 principio di hamilton Prenderemo ora in considerazione solo quei sistemi di N particelle puntiformi, con vincoli olonomi lisci, per i quali tutte le forze attive sono derivabili da un solo potenziale scalare generalizzato (questa richiesta è fatta solo per semplicità e senza perdere in generalità), funzione cioè delle coordinate e delle velocità delle particelle e del tempo. Questi sistemi sono detti monogenici. In particolare, se il potenziale è funzione esplicita solo delle coordinate di posizione delle particelle il sistema è detto conservativo. Vedremo fra poco, come sia possibile ottenere le equazioni di Lagrange relative a un sistema monogenico a partire da un principio integrale (il principio variazionale di Hamilton), il quale prende in considerazione l’intero moto del sistema tra due istanti t0 e t1 e le “piccole” variazioni di questo moto rispetto a quello reale. Per fare questo avremo bisogno di elementi di calcolo delle variazioni, che cercheremo di esporre nel modo più elementare possibile, utilizzando soltanto le tecniche familiari del calcolo differenziale. La configurazione del sistema (olonomo e monogenico), oggetto di studio, è supposta descritta dai valori di n coordinate generalizzate q1 , q2 , . . . , qn e corrisponde alla posizione di un punto q = (q1 , . . . , qn ) in uno spazio n-dimensionale che, come sappiamo, è detto spazio delle configurazioni. Al variare del tempo il punto q(t), che rappresenta il sistema, si muove nello spazio delle configurazioni descrivendo una curva che è, ovviamente, la traiettoria del moto del sistema. Come abbiamo già accennato, il principio variazionale prende in considerazione solo quelle traiettorie che costituiscono un insieme di traiettorie variate sincrone. In altre parole, si considerano tutti quei movimenti q = q(t) del sistema con t ∈ [t0 , t1 ], intervallo base, tali che q(t0 ) = q(0) e q(t1 ) = q(1) . Chiameremo ammissibile un movimento q(t) che gode di questa proprietà. Noi supporremo sempre, salvo avviso contrario, che le funzioni siano di classe C ∞ . In figura 2.1 sono riportate, in uno spazio delle configurazioni bidimensionale, alcune traiettorie ammissibili, che partono dalla configurazione iniziale q(0) al tempo t0 e arrivano alla configurazione finale q(1) al tempo t1 . Sappiamo che è possibile introdurre per il nostro sistema (olonomo e monogenico) la funzione lagrangiana L = T − V, (2.1) dove T è l’energia cinetica del sistema e V è il potenziale generalizzato. Naturalmente si avrà L = L (q, q̇, t) . (2.2) 17 2 principio variazionale di hamilton ed equazioni di lagrange q2 (1) q2 (0) q2 (0) q1 (0) q1 q1 Figura 2.1: Alcune traiettorie ammissibili in uno spazio delle configurazioni bidimensionale Consideriamo il funzionale azione S [q(t)] = Z t1 t0 L (q(t), q̇(t), t) dt, (2.3) dove q(t) è un moto ammissibile (cioè q(t0 ) = q(0) e q(t1 ) = q(1) ). Osserviamo che S [q(t)] ha valori in R e non è una funzione di funzione (non è una funzione del tempo), ma un integrale di linea che dipende dal moto q(t). Il valore che S [q(t)] assume dipende ovviamente dal moto ammissibile q(t) scelto. Introduciamo il Principio (variazionale di Hamilton) - Tra i moti ammissibili del sistema compresi tra gli istanti t0 e t1 , il moto reale è quello che rende stazionaria l’azione. Ricordiamo cosa si intende per punto stazionario di una funzione f : R → R di classe opportuna. Si dice che x0 ∈ R è un punto stazionario di f se f 0 ( x0 ) = 0. Un punto stazionario (o critico) di una funzione può allora essere un estremante relativo (di massimo o di minimo) o di flesso orizzontale oppure né estremante relativo né flesso orizzontale. Inoltre se x0 è un punto stazionario si ha f ( x0 + ε) − f ( x0 ) = f 0 ( x0 )ε + O(ε2 ) = O(ε2 ). In modo analogo diremo che l’azione è stazionaria lungo una certa traiettoria se su di essa assume, a meno di infinitesimi di ordine superiore al primo, lo stesso valore corrispondente a traiettorie che differiscono da quella considerata per uno spostamento infinitesimo. Più precisamente se indichiamo con q(t) un moto ammissibile che rende stazionaria l’azione e con q(t, ε) = q(t) + εh(t) una traiettoria diversa, dipendente dal parametro ε ∈ R (assumiamo |ε| 1) e dalla funzione vettoriale h(t) = (h1 (t), . . . , hn (t)) soggetta alla condizione h ( t0 ) = h ( t1 ) = 0 18 (2.4) 2.1 principio di hamilton (infatti q(t, ε) deve essere un moto ammissibile e pertanto q(t0 , ε) = q(0) e q(t1 , ε) = q(1) ), abbiamo che S [q(t, ε)] − S [q(t)] = O(ε2 ). (2.5) Vogliamo ora provare che una traiettoria ammissibile q(t) che rende stazionaria l’azione soddisfa le equazioni di Lagrange ∂L(q, q̇, t) d ∂L(q, q̇, t) − =0 (k = 1, . . . , n). (2.6) dt ∂q̇k ∂qk Abbiamo infatti: S [q(t, ε)] − S [q(t)] = Z t1 = L q(t) + εh(t), q̇(t) + εḣ(t), t − L (q(t), q̇(t), t) dt = (2.7) t0 Z t1 n ∂L (q(t), q̇(t), t) ∂L (q(t), q̇(t), t) = hi ( t ) + ḣi (t) ε dt + O(ε2 ). ∑ ∂qi ∂q̇i t0 i =1 Osserviamo che d ∂L ∂L d ∂L h i ( t ); ḣi (t) = hi ( t ) − ∂q̇i dt ∂q̇i dt ∂q̇i t1 Z t1 d ∂L ∂L hi (t) dt = hi ( t ) = 0 ∂q̇i ∂q̇i t0 dt t0 perché valgono le (2.4). Allora la (2.7) può essere riscritta come S [q(t, ε)] − S [q(t)] = n Z t1 d ∂L (q(t), q̇(t), t) ∂L (q(t), q̇(t), t) =∑ − hi (t)ε dt + O(ε2 ). ∂q dt ∂ q̇ t i i i =1 0 (2.8) Se imponiamo la condizione che l’azione sia stazionaria lungo q(t), valga cioè la (2.5), e teniamo presente che hi (t), con i = 1, . . . , n, sono funzioni di classe C ∞ arbitrarie, soggette soltanto alla condizione hi (t0 ) = hi (t1 ) = 0, abbiamo Z t1 ∂L (q(t), q̇(t), t) d ∂L (q(t), q̇(t), t) − hi (t) dt = 0 (i = 1, . . . , n). (2.9) ∂qi dt ∂q̇i t0 Vogliamo ora provare che queste equazioni implicano che d ∂L (q(t), q̇(t), t) ∂L (q(t), q̇(t), t) − =0 (i = 1, . . . , n), ∂qi dt ∂q̇i cioè sono soddisfatte le equazioni di Lagrange. Vale il seguente Lemma (fondamentale del calcolo variazionale) - Se una funzione liscia f : [t0 , t1 ] → R verifica la proprietà Z t1 t0 f (t) g(t) dt = 0 (2.10) per ogni funzione liscia g : [t0 , t1 ] → R, soggetta alla condizione g(t0 ) = g(t1 ) = 0, allora f (t) = 0 ∀t ∈ [t0 , t1 ]. 19 principio variazionale di hamilton ed equazioni di lagrange Dimostrazione. Ragioniamo per assurdo e supponiamo che ∃t∗ ∈ (t0 , t1 ) in cui f non si annulli. Senza perdere in generalità possiamo supporre f (t∗ ) > 0. Per continuità ∃ I (t∗ ) ⊂ (t0 , t1 ), intorno di t∗ , in cui f è sempre positiva, avendo indicato con I (t∗ ) un intorno aperto di t∗ . Possiamo sempre prendere una funzione liscia g, stante la sua arbitrarietà, che sia positiva in I1 (t∗ ) ⊂ I (t∗ ) e R t nulla altrove.1 Ne consegue che t01 f (t) g(t) dt > 0. Questo è assurdo. Allora f (t) = 0 ∀t ∈ (t0 , t1 ) =⇒ f (t) = 0 ∀t ∈ [t0 , t1 ]. Se chiamiamo δqi (t) = εhi (t) la variazione dell’i-esima componente di q(t) e con δS la corrispondente variazione dell’azione, relativa all’infinitesimo δq, la relazione (2.8) può essere scritta nella forma: n δS = ∑ Z t1 ∂L i =1 t0 d ∂L − ∂qi dt ∂q̇i δqi (t) dt. Questo risultato ci dice, anche per il lemma precedente, che se l’azione è stazionaria lungo q(t), cioè se δS = 0, allora valgono le equazioni di Lagrange. In modo sintetico possiamo scrivere: ∂L(q, q̇, t) d δS = 0 ⇐⇒ − ∂qi dt ∂L(q, q̇, t) ∂q̇i =0 (i = 1, . . . , n). Osservazione. Abbiamo visto che le equazioni di Lagrange (o di Eulero-Lagrange) nelle ipotesi fatte (sistemi, cioè, olonomi e monogenici) discendono da una legge generale, il principio variazionale di Hamilton. Non possiamo stabilire, a priori, se il moto reale q(t), che soddisfa le equazioni di Lagrange, ha la proprietà di minimizzare l’azione, anche se il principio di Hamilton è spesso detto principio della minima azione. Osservazione. Nel Capitolo 1 abbiamo visto che le equazioni di Lagrange sono invarianti per la trasformazione L0 = L + dF . dt Anche il principio variazionale di Hamilton è ancora valido se alla lagrangiana aggiungiamo la derivata totale rispetto al tempo di un’arbitraria funzione scalare F (q(t), t) di classe opportuna, infatti: Z t1 dF (q(t), t) S [q(t)] = L(q(t), q̇(t), t) + dt = dt t0 t = S + F ( q ( t ), t ) t1 = S + F ( q ( t 1 ), t 1 ) − F ( q ( t 0 ), t 0 ), 0 0 cioè S ed S0 differiscono per un termine supplementare che si annulla quando varia l’azione. Dunque la condizione δS0 = 0 coincide con la condizione δS = 0 e la forma delle equazioni del moto resta immutata. 1 Osserviamo che la funzione g scelta si annulla, ovviamente, in t0 e t1 . 20 2.2 applicazioni del calcolo delle variazioni 2.2 applicazioni del calcolo delle variazioni Possiamo utilizzare il principio variazionale per studiare le proprietà di stazionarietà o estremali di funzionali diversi dall’azione. Supponiamo in particolare di avere una famiglia di curve in uno spazio ndimensionale, ognuna descritta da una funzione vettoriale liscia y( x ) con x ∈ [ x0 , x1 ], tutte soggette alle condizioni y( x0 ) = y(0) e y( x1 ) = y(1) , e una funzione scalare liscia U = U (y( x ), ẏ( x ), x ). Vogliamo determinare y( x ) che rende stazionario il funzionale J [y( x )] = Z x1 x0 u (y( x ), ẏ( x ), x ) dx. Notiamo che possono esserci casi più complessi, in cui per esempio U è funzione anche di derivate di ordine superiore al primo di y( x ), oppure x ∈ Rm con m ≥ 2. La trattazione del problema può anche essere portata avanti esattamente come nel caso dell’azione: si ricerca y( x ) che rende stazionario il funzionale J. Non sempre è semplice stabilire poi se la funzione trovata abbia la proprietà di minimizzare o di massimizzare J. Ricordiamo che condizione necessaria perché y( x ) sia un minimo o un massimo locale per J è che esso sia un punto stazionario. Si arriverà ovviamente a n equazioni scalari che continueremo a chiamare di Lagrange o di Eulero-Lagrange: d dx ∂u ∂ẏk − ∂u =0 ∂yk (k = 1, . . . , n). 2.2.1 Cammino più breve fra due punti in un piano Siano dati A( x0 , y0 ) e B( x1 , y1 ) in un piano (vedi figura 2.2). Supponiamo che x0 < x1 . Se indichiamo2 una generica curva regolare3 con y = y( x ) di estremi A e B e con s l’ascissa curvilinea, abbiamo che: q q ds = (dx )2 + (dy)2 = 1 + ẏ2 ( x ) dx. In questo caso allora J [y( x )] = Z x1 q x0 1 + ẏ2 ( x ) dx. p Ovviamente u = u(ẏ) = 1 + ẏ2 ( x ) e y( x ) è nel nostro caso una funzione scalare. Adoperando le equazioni di Eulero-Lagrange: d dx ∂u ∂ẏ − ∂u = 0. ∂y 2 Se x0 = x1 possiamo considerare funzioni del tipo x = x (y). 3 In realtà possiamo sempre supporre che y sia liscia. 21 principio variazionale di hamilton ed equazioni di lagrange y B y1 y0 A x0 x1 x Figura 2.2: Cammini ammessi tra due punti nel piano. Essendo ∂u/∂y = 0 risulta ∂u ẏ =p = c, ∂ẏ 1 + ẏ2 dove c è una costante √ rispetto a x. Di conseguenza ẏ( x ) = a, con a costante legata a c da a = c/ 1 − c2 . Quindi y( x ) = ax + b, cioè la curva che minimizza il funzionale J è il segmento di estremi A e B. Imponendo in particolare che y( x0 ) = y0 e y( x1 ) = y1 otteniamo le costanti di integrazione y1 − y0 x1 − x0 x1 y0 − x0 y1 b= . x1 − x0 a= Si prova facilmente, in questo caso, che y( x ), che rende stazionario J, minimizza il funzionale. In altre parole possiamo dire che la curva che nel piano xy congiunge A e B e ha lunghezza minima è il segmento di estremi A e B. ε 2 x1 uẏẏ (ẏ( x ))ḣ2 ( x ) dx + O(ε3 ). 2 x0 p Nel nostro caso uẏẏ (ẏ( x )) = 1/ (1 + ẏ2 ( x ))3 > 0. Perciò, per |ε| 1, J [y( x ) + εh( x )] ≥ J [y( x )], cioè la funzione trovata minimizza il funzionale (se ḣ( x ) non è identicamente nulla). J [y( x ) + εh( x )] − J [y( x )] = Z Esercizi 1. Verificare che il moto reale di una particella libera e isolata rende minima l’azione. 2. Una particella è soggetta al potenziale U ( x ) = Fx, con F costante. La particella si muove dal punto x = 0 al punto x = a nell’intervallo di tempo [t0 , t1 ]. Si assuma che il moto della particella si possa esprimere nella forma x (t) = A + Bt + Ct2 . Trovare i valori di A, B, C che rendono minima l’azione. 22 2.2 applicazioni del calcolo delle variazioni A y1 x1 x U=0 B y Figura 2.3: Schema del problema della brachistocrona. 2.2.2 Il problema della brachistòcrona Il problema della brachistòcrona può essere espresso nel modo seguente: Problema (della brachistòcrona) - Dati due punti A e B in un piano verticale, con A ad altezza maggiore di B, trovare tra tutti gli archi di curva che li congiungono, la traiettoria che una particella puntiforme di massa m, con velocità iniziale nulla, deve percorrere per andare da A a B in modo che il tempo di percorrenza sia il minimo possibile. Per risolvere il problema poniamo l’origine degli assi in A ≡ (0, 0) e orientiamo l’asse delle ordinate verso il basso (vedi figura 2.3). Supponiamo B ≡ ( x1 , y1 ) con x1 > 0 e y1 > 0 (se x1 = 0, cioè se B appartiene all’asse delle y il problema è banale: la soluzione è data dal segmento AB). Le equazioni della traiettoria (passante per i punti assegnati): y = y( x ) y (0) = 0 ( x ∈ [0, x1 ]) y ( x1 ) = y1 Consideriamo la solita ascissa curvilinea s a partire da A: q q ds = (dx )2 + (dy)2 = 1 + ẏ2 ( x ) dx. Supponiamo i vincoli olonomi e lisci. Fissiamo in y = 0 il livello 0 dell’energia potenziale (relativa alla forza peso). Allora: p 1 2 mv − mgy = 0 =⇒ v = 2gy, 2 dove g è l’accelerazione di gravità e v la velocità in y (notare che y > 0, v > 0 se x ∈ (0, x1 ]). s ds 1 + ẏ2 ( x ) dt = = dx ( x ∈ (0, x1 ]). v 2gy( x ) Poniamo s u(y( x ), ẏ( x )) = 1 + ẏ2 ( x ) y( x ) 23 principio variazionale di hamilton ed equazioni di lagrange quindi p 2g Z T 0 dt ≡ J [y( x )] = Z x1 0 u(y( x ), ẏ( x )) dx. Fra tutte le traiettorie, passanti per A e B, quella che rende stazionario il funzionale J (condizione necessaria per il minimo) soddisfa le equazioni di Lagrange con x ∈ (0, x1 ]: d dx ∂u(y, ẏ) ∂ẏ − ∂u(y, ẏ) = 0. ∂y (2.11) Ora, ẏ ∂u =√ p ∂ẏ y 1 + ẏ2 e dunque ÿ ∂u(y, ẏ) ẏ2 +√ p =− √ p 2 ∂ẏ 2y y 1 + ẏ y (1 + ẏ2 )3 p 1 + ẏ2 ∂u =− √ . ∂y 2y y d dx (2.12) (2.13) L’equazione (2.11), per le relazioni (2.12) e (2.13), diventa, ∀ x ∈ (0, x1 ]: p 1 + ẏ2 ẏ2 ÿ − √ p +√ p + √ = 0 ⇐⇒ 2y y 2y y 1 + ẏ2 y (1 + ẏ2 )3 ÿ( x ) 1 + =0 2 1 + ẏ ( x ) 2y( x ) Moltiplicando ambo i membri per ẏ( x ) abbiamo 1 d ẏ( x ) 1 d ẏ( x )ÿ( x ) + = 0 ⇐⇒ ln 1 + ẏ2 ( x ) + ln y( x ) = 0 ⇐⇒ 2 1 + ẏ ( x ) 2y( x ) 2 dx 2 dx 1 d (ln(1 + ẏ2 ( x )) + ln y( x )) = 0 ⇐⇒ (1 + ẏ2 ( x ))y( x ) = c ⇐⇒ 2 dx s s y( x ) ẏ( x ) = 1 =⇒ c − y( x ) Z y( x ) dy = c − y( x ) Posto y= 24 c c (1 − cos τ ) =⇒ dy = sin τ dτ 2 2 Z dx. (2.14) 2.2 applicazioni del calcolo delle variazioni dove τ è un parametro (con y(τ = 0) = 0), dalla (2.14) abbiamo s s 0 Z τ Z τ c 0) c c sin2 τ2 ( 1 − cos τ c 0 0 2 x= sin τ dτ = sin τ 0 dτ 0 = c c 0) 2 0) 2 c − ( 1 − cos τ ( 1 + cos τ 0 0 2 2 v u 0 0 Z τu Z τ c sin2 τ2 c sin τ2 c 0 0 t = sin τ dτ = sin τ 0 dτ 0 = τ0 2 τ0 2 2 0 0 cos c cos 2 2 = Z τ 0 τ0 c sin dτ 0 = 2 2 Z τ c c = (τ − sin τ ). 2 2 0 (1 − cos τ 0 ) dτ 0 = Nota che x (0) = 0. Concludendo, le equazioni parametriche della traiettoria sono date da: c x (τ ) = (τ − sin τ ) 2 c y(τ ) = (1 − cos τ ) 2 con τ ∈ [0, τ1 ]. Le equazioni trovate sono quelle di una cicloide. Sostituendo i valori delle coordinate di B si trovano dalle precedenti c e τ1 . Il sistema siffatto ammette sempre soluzione. Rimane da provare (cosa non banale) che la soluzione trovata minimizza il funzionale. Possiamo tentare una soluzione del problema cambiando semplicemente punto di vista e cercando un’espressione del tipo x = x (y). In tal caso s ds 1 + ẋ2 dt = = dy. v 2gy Posto s ϕ= 1 + ẋ2 y risulta p 2g Z T 0 dt = F [ x (y)] = Z y1 0 ϕ( x (y), ẋ (y), y) dy. Le equazioni di Lagrange sono d ∂ϕ ∂ϕ − = 0. dy ∂ ẋ ∂x Poiché ∂ ϕ/∂x = 0, ∂ ϕ/∂ ẋ = costante, abbiamo ẋ 1 = √ ⇐⇒ √ √ a y 1 + ẋ2 2 ẋ2 y dx a−y = =⇒ =1 2 1 + ẋ a dy y 25 principio variazionale di hamilton ed equazioni di lagrange da cui si prosegue come in p precedenza. Osserviamo però che in questo caso ϕ xx = ϕ x ẋ = 0 e che ϕ ẋ ẋ = 1/ y(1 + ẋ2 (y))3 > 0. Allora, se x (y) rende stazionario il funzionale, abbiamo che F [ x (y) + εh(y)] − F [ x (y)] = ε2 2 Z y1 0 ϕ ẋ ẋ ḣ2 (y) dy + O(ε3 ) ≥ 0 ovvero F [ x (y) + εh(y)] ≥ F [ x (y)], se ḣ(y) non identicamente nulla, cioè x (y) è un minimo. 2.3 2.3.1 leggi di conservazione Coordinate cicliche Abbiamo visto che il moto di un sistema di particelle olonomo e monogenico con n gradi di libertà è governato dalle equazioni di Lagrange d ∂L (q, q̇, t) ∂L (q, q̇, t) − =0 dt ∂q̇ ∂qk (k = 1, . . . , n) dove L = T − U e qk sono le coordinate generalizzate. Apriamo una piccola parentesi. Introdotto un sistema di assi cartesiani solidale con un sistema di riferimento inerziale, nel caso di un punto materiale soggetto a una forza conservativa abbiamo: L= 1 m ẋ2 + ẏ2 + ż2 − U ( x, y, z). 2 Si vede che ∂L = m ẋ ≡ p x , ∂ ẋ ∂L = mẏ ≡ py , ∂ẏ ∂L = mż ≡ pz , ∂ż dove p x , py e pz sono le componenti rispettivamente lungo x, y e z della quantità di moto. In analogia nel caso più generale possiamo chiamare pk = ∂L (q, q̇, t) ∂q̇k il momento canonico o momento coniugato alla coordinata generalizzata qk . Osserviamo che se ∂L/∂qk = 0, cioè se la lagrangiana non dipende esplicitamente da qk , si ha d ∂L d pk = = 0. dt ∂q̇k dt Allora pk è costante rispetto al tempo. Diamo allora la seguente 26 2.3 leggi di conservazione Definizione - Una coordinata generalizzata si dice ciclica o ignorabile se la lagrangiana L, pur essendo funzione esplicita di q̇k , non dipende esplicitamente da qk . Possiamo pertanto enunciare la seguente proprietà: il momento coniugato a una coordinata generalizzata ciclica si conserva. In modo equivalente possiamo dire che il momento coniugato a una coordinata ciclica è un integrale primo del moto, in quanto si traduce in una relazione del tipo f (q1 , . . . , qn , q̇1 , . . . , q̇n , t) = costante. Se qk è una coordinata ciclica, allora L è invariante rispetto a una trasformazione qk → qk + α, con α costante. Ora, se qk , coordinata ciclica, è uno spostamento, si ha che una traslazione rigida lungo tale direzione non ha effetto alcuno sul moto del sistema e il corrispondente momento coniugato, che è una quantità di moto, si conserva. Se invece la coordinata ciclica qk è un angolo il sistema è invariante per rotazioni intorno all’asse corrispondente e il relativo momento coniugato, che è un momento angolare, si conserva. Troviamo per esempio i momenti generalizzati nel caso di una particella in moto in un campo elettromagnetico. Abbiamo visto che la lagrangiana di una particella di massa m e carica4 q in un campo elettromagnetico è data da: L= 1 q m( ẋ2 + ẏ2 + ż2 ) − qϕ + A · v 2 c dove v = ẋ x̂ + ẏŷ + żẑ è la velocità della particella, c è la velocità della luce nel vuoto, ϕ, A sono il potenziale scalare e vettoriale rispettivamente. Il momento coniugato a x è dato da q q Px = m ẋ + A x = p x + A x c c dove p x = m ẋ è la componente lungo x dell’usuale quantità di moto della particella. In maniera analoga i momenti coniugati a y e z sono rispettivamente: q Py = py + Ay , c q Pz = pz + Az . c Possiamo scrivere allora in forma vettoriale il momento generalizzato come q P = p + A. c Ora, se per ipotesi ϕ, A non dipendono esplicitamente da x, cioè x è una variabile ciclica, allora il momento coniugato rispetto a x, cioè Px , è una costante del moto. Esercizi • Verificare l’esistenza di una coordinata ciclica nell’esercizio 2c di pagina 11. Dare un’interpretazione fisica del corrispondente momento coniugato. 4 Qui con il simbolo q non indichiamo una coordinata generalizzata! 27 principio variazionale di hamilton ed equazioni di lagrange • Verificare l’esistenza di una coordinata ciclica nell’esercizio 3 di pagina 11. Dare un’interpretazione fisica del corrispondente momento coniugato. • Si scriva in coordinate cilindriche la lagrangiana di una particella di massa m e carica q in un campo magnetico (costante) generato da un filo rettilineo percorso da corrente stazionaria I. Esistono coordinate cicliche? (Piccolo suggerimento: scrivere il potenziale vettore A imponendo che valga la gauge di Coulomb, div A = 0.) Funzione energia 2.3.2 Sia L = L (q, q̇, t) la lagrangiana di un sistema con n gradi di libertà, dove q = (q1 , . . . , qn ). Si ha che n dL ∂L ∂L ∂L q̇k + q̈k + . =∑ dt ∂q ∂ q̇ ∂t k k k =1 Poiché per k = 1, . . . , n si ha, dalle equazioni di Lagrange, d ∂L ∂L = ∂qk dt ∂q̇k allora: n dL =∑ dt k =1 d ⇐⇒ dt " d ∂L dt ∂q̇k q̇k + n ∂L d ∂L ∂L ∂L =∑ ⇐⇒ q̈k + q̇k + ∂q̇k ∂t dt ∂ q̇ ∂t k k =1 n # ∂L ∂L ∑ ∂q̇k q̇k − L + ∂t = 0. k =1 (2.15) Chiamiamo funzione energia la quantità h (q, q̇, t) = n ∂L ∑ ∂q̇k q̇k − L. k =1 Allora la relazione (2.15) si scrive anche: dh ∂L =− . dt ∂t Se L = L(q, q̇), cioè se ∂L/∂t = 0, h è una costante del moto. Sotto opportune ipotesi h è proprio l’energia totale del sistema. Se l’energia cinetica è una funzione omogenea di secondo grado delle q̇k , cioè T= n ∑ k,j=1 A jk (q, t)q̇k q̇ j con Akj = A jk , e se il potenziale V non dipende da q̇, allora n ∂L = 2 ∑ Aik q̇k ∂q̇i k =1 28 2.3 leggi di conservazione e quindi n ∂L ∑ ∂q̇i q̇i = 2T. i =1 Allora h= n ∂L ∑ ∂q̇i q̇i − L = 2T − T + V = T + V i =1 che è l’energia totale del sistema. Se la lagrangiana non dipende esplicitamente dal tempo abbiamo allora che l’energia del sistema è una costante del moto. 29 3 APPLICAZIONI DELLE EQUAZIONI DI LAGRANGE 3.1 problema dei due corpi Supponiamo di avere un sistema isolato di due particelle di massa m1 ed m2 , soggette alla mutua interazione di natura conservativa. Rispetto a un osservatore O inerziale indichiamo con r1 ed r2 i vettori posizione delle due particelle. Il vettore posizione del centro di massa è: R= m1 r1 + m2 r2 , m1 + m2 (3.1) mentre il vettore posizione relativa è dato da r = r2 − r1 . (3.2) Possiamo esprimere r1 ed r2 mediante i vettori appena introdotti: m2 r, m1 + m2 m1 r2 = R + r. m1 + m2 r1 = R − (3.3) Assumiamo che l’energia potenziale (relativa alla mutua interazione) abbia la seguente proprietà: U = U (r ). (3.4) La forza agente sulla particella 2 è data da F2 = −∇r2 U (r ) = −∇r U (r ), mentre la forza agente sulla particella 1 è F1 = −∇r1 U (r ) = ∇r U (r ). Abbiamo pertanto F1 + F2 = 0 (forma debole del principio di azione e reazione). Notiamo che se U = U (r ) allora F2 = −dU/dr r̂ = − F1 (forma forte del principio di azione e reazione). La lagrangiana del sistema delle due particelle è L= 1 1 m1 kṙ1 k2 + m2 kṙ2 k2 − U (r ). 2 2 (3.5) Sulla base delle relazioni (3.3), la (3.5) si può scrivere come L= m1 + m2 1 m1 m2 k Ṙk2 + kṙ k2 − U (r ) 2 2 m1 + m2 (3.6) La quantità µ = m1 m2 /(m1 + m2 ) è detta massa ridotta (si noti che 1/µ = 1/m1 + 1/m2 e che se m2 m1 , allora r1 ≈ R e µ ≈ m2 ). Dall’espressione (3.6) si deduce che Ṙ = V è costante, essendo R ciclica. Il centro di massa perciò è in quiete o si muove di moto rettilineo uniforme. Possiamo 31 applicazioni delle equazioni di lagrange prendere in ogni caso come sistema di riferimento proprio quello del centro di massa e avremo: m1 r1 + m2 r2 = 0 m2 r1 = − r m1 + m2 m1 r2 = r. m1 + m2 Dunque la lagrangiana sarà nella forma: L= 1 2 µkṙ k − U (r ). 2 È interessante notare come il problema dei due corpi si riconduca al problema di una particella di massa pari alla massa ridotta immersa in un campo esterno. 3.1.1 Movimento in un campo centrale Si abbia una particella P di massa m (che possiamo riguardare anche come la massa ridotta di due particelle puntiformi) in un campo esterno. Assumiamo che tale campo sia conservativo e che l’energia potenziale (o potenziale) dipenda solo dalla distanza della particella P da un punto O, fisso rispetto a un sistema di riferimento inerziale. Chiamiamo come al solito vettore posizione della particella −→ r = OP e v = ṙ il vettore velocità. Abbiamo allora: L= 1 2 mv − U (r ), 2 dove r = kr k, v2 = v · v e U (r ) è l’energia potenziale. La forza agente sulla particella è F = −∇U (r ) = − dU r̂. dr Essa è centrale e il centro della forza è il punto O. Notiamo che l’energia potenziale ha simmetria sferica, dunque ogni soluzione delle equazioni del moto deve essere invariante per rotazioni attorno a un asse arbitrario passante per O. Il momento angolare della particella P rispetto a O, cioè l = mr × v = r × p (con p quantità di moto della particella), si conserva. Si dimostra facilmente che il moto si svolge in un piano (piano dell’orbita) ortogonale alla direzione (costante) di l, sempre che l 6= 0. Se l = 0, r è parallelo a p e il moto è unidimensionale. Supponiamo che l = l0 6= 0 (l0 costante). Il sistema ha due gradi di libertà, considerato che il moto avviene in un piano. Possiamo, pertanto, esprimere la lagrangiana in coordinate polari: L= 32 1 m(ṙ2 + r2 θ̇ 2 ) − U (r ). 2 (3.7) 3.1 problema dei due corpi Si vede subito che θ è ciclica e dunque il suo momento coniugato pθ = ∂L/∂θ̇ = mr2 θ̇ è costante. Osserviamo che pθ = mr2 θ̇ = l0 (3.8) che è costante. Notiamo, per inciso, che 1 l0 1 = r2 θ̇ 2m 2 è la cosiddetta velocità areolare ed è una costante del moto. Abbiamo così ottenuto, in modo semplice, la Legge (Seconda legge di Keplero) - Il vettore posizione della particella (o di un pianeta considerato puntiforme) rispetto al centro dell’orbita (o centro della forza) spazza aree uguali in intervalli di tempo uguali. Osservazione. Questa legge è stata ottenuta semplicemente supponendo che la forza agente sulle particelle sia centrale (senza assegnare la dipendenza esplicita da r di U). Utilizzando le equazioni di Lagrange d dt ∂L ∂ṙ ∂L = 0 ⇐⇒ ∂r ∂U (r ) mr̈ − mr θ̇ 2 + = 0. ∂r − (3.9) Per la (3.8) abbiamo mr θ̇ 2 = l02 . mr3 Allora la (3.9) può essere riscritta nel modo seguente: mr̈ − l02 ∂U (r ) + = 0. 3 mr ∂r Osserviamo che nel nostro caso la lagrangiana non dipende esplicitamente dal tempo e che l’energia cinetica è una funzione omogenea di secondo grado rispetto a ṙ e θ̇. Ne consegue che la funzione energia h è una costante del moto ed è proprio l’energia totale della particella E. Possiamo, allora, scrivere: ∂L ∂L ṙ + θ̇ − L = ∂ṙ ∂θ̇ 1 1 1 l02 = m(ṙ2 + r2 θ̇ 2 ) + U (r ) = mṙ2 + + U (r ) 2 2 2 mr2 E= (3.10) dove abbiamo tenuto conto della (3.8). 33 applicazioni delle equazioni di lagrange Osservazione. Grazie alla conservazione del momento angolare, il moto è come unidimensionale con un potenziale efficace Ueff (r ) = 1 l02 + U (r ). 2 mr2 (3.11) Se r (0) = r0 , supposto che nell’intervallo di tempo considerato r = r (t) è crescente, r dr 2 = ( E − Ueff (r )) dt m e, quindi, t= Z r (t) dr 0 q r0 2 m (E − Ueff (r 0 )) . (3.12) Si può ricavare anche l’anomalia θ in funzione di r. Infatti dalla (3.8) otteniamo: dθ = l0 1 l0 1 dr q dt = 2 2 mr mr 2 m ( E − Ueff (r )) (abbiamo qui considerato un intervallo di tempo in cui r = r (t) è crescente) e, di conseguenza, l0 θ (r ) − θ (r0 ) = m Z r (t) 1 r r0 dr 0 q 02 2 m (E − Ueff (r 0 )) . Se il dominio di variazione di r ha due limiti, rmin ed rmax , il movimento è limitato e tutta l’orbita è contenuta nella corona circolare centrata in O, con raggio interno rmin e raggio esterno rmax . Questo discorso non vuol dire affatto che l’orbita, nel caso di moto limitato, è chiusa. Perché ciò accada, è necessario e sufficiente che ∆θ = 2l0 m Z rmax 1 rmin r dr 0 q 02 2 m (E − Ueff (r 0 )) = 2π j n (3.13) con j, n ∈ N. Ricordiamo, per inciso, che l’anomalia θ è definita sempre a meno di multipli di 2π. Ora, se indichiamo con T0 = 2 Z rmax rmin dr 0 q 2 m (E − Ueff (r 0 )) (3.14) il periodo della funzione r = r (t) (stiamo supponendo che il moto sia limitato e che r ∈ [rmin , rmax ]), dopo un tempo pari a nT0 , si avrà una variazione di θ pari a 2πj (multiplo di 2π) e, pertanto, il vettore posizione ritornerà a essere quello iniziale, cioè r (nT0 ) = r (0). In generale, per un potenziale generico U (r ), supponendo l’esistenza di moti limitati, la traiettoria non è un’orbita chiusa. 34 3.1 problema dei due corpi Ueff E2 O rmin r0 rmax r E1 E0 Figura 3.1: Andamento del potenziale efficace nel problema dei due corpi. Teorema (di Bertrand) - Le uniche forze centrali che danno luogo a orbite chiuse per ogni condizione iniziale corrispondente a moti limitati sono: • quella proporzionale all’inverso del quadrato di r (come la forza gravitazionale); • quella corrispondente alla legge di Hooke (dipendenza lineare da r). Supponiamo ora che F = −k/r2 r̂ o, in modo equivalente, U (r ) = −k/r, con k > 0. Per il teorema di Bertrand, le orbite relative a moti limitati sono chiuse. Il potenziale efficace, in questo caso, è: Ueff = k 1 l02 − . 2 2 mr r Per r = r0 = l02 /(mk ), Ueff ha il valore minimo, esattamente pari a −mk2 / 2l02 . Dal grafico di Ueff (vedi figura 3.1) possiamo ricavare le seguenti informazioni: • E = E0 = −mk2 / 2l02 , ṙ (t) = 0 =⇒ r (t) = r0 costante. In questo caso l’orbita della particella è circolare. Il moto è circolare uniforme con frequenza ω = l0 /(mr02 ) (questa espressione discende in modo immediato dalla (3.8)). • Se E = E1 ∈ −mk2 / 2l02 , 0 , il moto è limitato con r ∈ [rmin , rmax ]. Si può dimostrare che la traiettoria è un’ellisse. • Se E = E2 ≥ 0, r (t) è inferiormente limitato e superiormente non limitato. Si può dimostrare che la traiettoria è per E2 = 0 una parabola e per E2 > 0 un’iperbole. 35 applicazioni delle equazioni di lagrange y b Q( x, y) θ a c O F2 a a F1 x Figura 3.2: Ellisse in coordinate cartesiane. Esercizio 1. Nell’ipotesi che la forza centrale sia F = −k/r2 r̂ dimostrare che il vettore A = p × l − mkr̂ è una costante del moto. A è detto vettore di Laplace-Runge-Lenz. Calcolare inoltre A · l. 3.1.2 Il problema di Keplero Ricordiamo l’espressione dell’ellisse in coordinate polari e alcune sue proprietà. Detti a il semiasse maggiore e b il semiasse minore, l’equazione dell’ellisse in coordinate cartesiane è x2 y2 + = 1. a2 b2 Siano F1 = (c, 0) e F2 = (−c, 0) (con c ≥ 0) i due fuochi e Q = ( x, y) un punto generico dell’ellisse (vedi figura 3.2). Allora, per definizione di ellisse abbiamo che QF1 + QF2 = 2a. Inoltre vale la relazione c2 = a2 − b2 . Il quadrato della distanza del punto Q dal fuoco F1 è dato da: 2 2 2 2 2 2 2 2 2 QF1 = ( x − c) + y = x − 2xc + c + y = x − 2xc + a − b + b b2 2 b2 2 2 = x − 2xc + a − 2 x = 1 − 2 x2 − 2xc + a2 . a a 36 2 x2 1− 2 a = 3.1 problema dei due corpi Q( x, y) r F2 O θ F1 Figura 3.3: Ellisse in coordinate polari. Introduciamo l’eccentricità e = c/a. Notiamo che e ∈ (0, 1) e che per e = 0 l’ellisse diventa una circonferenza. Inoltre c = ea. Abbiamo quindi 2 a2 − b2 2 c2 x − 2xc + a2 = 2 x2 − 2xc + a2 = e2 x2 − 2eax + a2 = 2 a a 2 = ( a − ex ) QF1 = da cui QF1 = a − ex. Analogamente si trova che 2 QF2 = ( a + ex )2 =⇒ QF2 = a + ex ed è quindi soddisfatta la condizione QF1 + QF2 = 2a. In coordinate polari fissiamo come polo uno dei fuochi, per esempio F1 (vedi figura 3.3), quindi QF1 = r. Le coordinate ( x, y) di Q sono date da x = ea + r cos θ y = r sin θ pertanto QF1 = r = a − e(ea + r cos θ ) = a(1 − e2 ) − er cos θ =⇒ r (1 + e cos θ ) = a(1 − e2 ) =⇒ r (θ ) = a (1 − e2 ) . 1 + e cos θ Ponendo P = a(1 − e2 ), detto parametro dell’ellisse, otteniamo l’equazione dell’ellisse in coordinate polari: r (θ ) = P . 1 + e cos θ 37 applicazioni delle equazioni di lagrange Inoltre b2 = a2 − c2 = a2 − e2 a2 = a2 (1 − e2 ) =⇒ b = a p 1 − e2 = √ P 1 − e2 . Il perielio si ha per θ = 0 quindi rmin = P = a (1 − e ) 1+e mentre l’afelio è raggiunto in θ = π: rmax = P = a (1 + e ). 1−e Osserviamo infine che r (π/2) = P. Ci proponiamo di dimostrare la Legge (Prima legge di Keplero) - I pianeti (considerati puntiformi) descrivono orbite ellittiche di cui il Sole occupa uno dei fuoci. A tal fine, consideriamo un corpo puntiforme di massa m in moto in un campo centrale F = −k/r2 r̂ e soggetto al potenziale k k>0 r 1 l02 k Ueff (r ) = − . 2 2 mr r U (r ) = − Come visto precedentemente, dalla (3.8) si ottiene l0 1 r m r2 2 dθ = m dr E− 2 1 l0 2 mr2 + k r . Introducendo la variabile w= 1 1 =⇒ dw = − 2 dr r r abbiamo dθ = − q dw 2mE l02 + 2km w l02 − w2 = −r con E ∈ (−mk2 /(2l02 ), 0). Notiamo che A2 = 38 2mE k2 m2 + 4 ≥0 l02 l0 dw 2mE l02 + k 2 m2 l04 − w− km l02 2 3.1 problema dei due corpi con il segno di uguaglianza che vale quando E assume il valore minimo. Ponendo x = w − km/l02 e integrando abbiamo Z θ=− w − km x l02 √ = arccos + costante = arccos q + costante = k 2 m2 2mE A A2 − x 2 + 2 4 l l dx 0 = arccos l02 w km q −1 1+ 2El02 mk2 0 + costante. Quindi risulta l02 1 −1 = mk r s 2El02 cos(θ + θ0 ) mk2 1+ dove θ0 è la costante di integrazione. Senza perdita di generalità possiamo ruotare il sistema di riferimento in modo che θ0 = 0 per cui s 2 2El0 1 mk cos θ . = 2 1 + 1 + r mk2 l0 Ponendo inoltre s 1+ e= 2El02 ∈ (0, 1) mk2 abbiamo l02 mk r= 1 + e cos θ = P 1 + e cos θ con P = l02 /(mk ). Questa è l’equazione polare di una conica con eccentricità e ∈ (0, 1), pertanto la prima legge di Keplero è stata dimostrata. Infine ricaviamo la Legge (Terza legge di Keplero) - Il quadrato del periodo di rivoluzione di un pianeta è proporzionale al cubo del semiasse maggiore dell’orbita. Ricordiamo che la velocità areolare è data da Ṡ = 1 l0 1 l0 =⇒ dS = dt =⇒ l0 dt = 2m dS. 2m 2m L’area di un’ellisse vale πab, quindi integrando abbiamo: Z T 0 l0 dt = l0 T = 2πmab dove T è il periodo di rivoluzione del corpo. Ora osserviamo che P a= = 1 − e2 l02 mk 2| E|l02 mk2 = k , 2| E | 39 applicazioni delle equazioni di lagrange quindi 2πmab 2πm 2 T= = a l0 l0 r m 3/2 = 2πa . k 3.2 p 2πm 2 1 − e2 = a l0 s 2| E|l02 = 2πa2 mk2 r 2m| E| = k2 piccole oscillazioni 3.2.1 Impostazione del problema Supponiamo di avere un sistema di N particelle con vincoli olonomi e scleronomi con n gradi di libertà, soggette a forze conservative. Indichiamo con q1 , q2 , . . . , qn le coordinate generalizzate e con V = V (q1 , . . . , qn ) l’energia potenziale. Il sistema si dice in equilibrio nella configurazione q0 = (q01 , . . . , q0n ) se le forze generalizzate che agiscono su di esso sono nulle, ossia: ∂V (q) Qj = − =0 (∀ j = 1, . . . , n). ∂q j q=q 0 L’energia potenziale nella configurazione di equilibrio q0 ha un valore estremale o in generale stazionario. Se tutte le velocità generalizzate nella configurazione di equilibrio sono nulle, il sistema rimarrà nella posizione di equilibrio per un tempo indefinito. Una configurazione di equilibrio si dice stabile se una piccola perturbazione del sistema provoca un moto che raggiunge configurazioni vicine; al contrario si dirà instabile se una perturbazione infinitesima provoca un allontanamento indefinito da tale configurazione. Noi intendiamo studiare il moto del sistema nelle immediate vicinanze di una configurazione di equilibrio stabile, dove l’energia potenziale ha un minimo. Indichiamo con ηi gli spostamenti delle coordinate generalizzate dall’equilibrio; ovvero: qi = q0i + ηi ∀i = 1, . . . , n. Consideriamo lo sviluppo dell’energia potenziale1 attorno alla configurazione di equilibrio stabile q0 : n V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) + ∑ j =1 Poiché per ipotesi ∂V (q) =0 ∂q j q=q 0 ∂V 1 ηj + ∂q j q=q 2 0 n ∑ j,k =1 ∀ j = 1, . . . , n 1 Supponiamo sempre le funzioni che trattiamo di grado opportuno. 40 ∂2 V η j ηk + · · · . ∂q j ∂qk q=q 0 3.2 piccole oscillazioni e V (q01 , . . . , q0n ) è una costante che può essere posta uguale a zero senza perdere in generalità,2 abbiamo in definitiva, fermandoci al termine quadratico dello sviluppo: 1 n ∂2 V 1 n V ( q1 , . . . , q n ) = η η = V jk η j ηk . (3.15) j k ∑ 2 j,k=1 ∂q j ∂qk q=q 2 j,k∑ =1 0 La matrice n × n V = (V jk ) è una matrice simmetrica e reale. La condizione che q0 sia una configurazione di minimo implica che ∀η = (η1 , . . . , ηn ) ∈ Rn si abbia ηT V η = n ∑ j,k =1 V jk η j ηk ≥ 0, ovvero V è semidefinita positiva. Anche l’energia cinetica può essere sviluppata in modo simile. Mostriamo prima che in presenza di vincoli olonomi e scleronomi l’energia cinetica è una forma quadratica omogenea delle velocità generalizzate. Infatti, detta mk la massa della k-esima particella e vk la sua velocità:3 ! n n 1 N 1 N 1 N ∂rk ∂rk 2 T = ∑ mk vk = ∑ mk vk · vk = ∑ mk ∑ ∑ q̇i q̇ j · 2 k =1 2 k =1 2 k =1 ∂qi ∂q j i =1 j =1 dove si è ricordato che vk = n n n ∂rk ∂r ∂r 2 q̇ =⇒ v = ∑ ∂q j j ∑ ∑ ∂qki · ∂qkj q̇i q̇ j . k j =1 i =1 j =1 Ne consegue: 1 n n T= ∑∑ 2 i =1 j =1 N ∂r ∂r ∑ mk ∂qki · ∂qkj k =1 ! q̇i q̇ j che è quanto era nostra intenzione dimostrare. Considerando ora spostamenti ηi rispetto alla configurazione di equilibrio e fermandoci al primo termine (quadratico) nelle η̇i , abbiamo: " # N 1 n ∂rk ∂rk 1 n T = ∑ ∑ mk · η̇ η̇ = Tij η̇i η̇ j . (3.16) i j 2 i,j=1 k=1 ∂qi ∂q j q=q 2 i,j∑ =1 0 La matrice (costante) T = (Tij ) è simmetrica, reale ed è definita positiva in senso stretto, cioè n ∑ i,j=1 Tij ai a j > 0 ∀ a = ( a 1 , . . . , a n ) ∈ Rn \ { 0 } . 2 Ricordiamo infatti che l’energia potenziale è definita a meno di una costante additiva. 3 Indichiamo con rk il vettore posizione della k-esima particella rispetto a un punto O solidale con un sistema di riferimento inerziale 41 applicazioni delle equazioni di lagrange Pertanto i suoi autovalori sono reali e strettamente positivi e quindi T è senz’altro diagonalizzabile. La lagrangiana del sistema nelle approssimazioni fatte può scriversi: L= 1 n 1 n Tkj η̇k η̇ j − ∑ Vkj ηk η j . ∑ 2 k,j=1 2 k,j=1 (3.17) Si vede che le ηi assumono de facto il ruolo di nuove coordinate generalizzate. La k-esima equazione di Lagrange assume la forma: d ∂L ∂L =0 − dt ∂η̇k ∂ηk e cioè 1 2 n ∑ Tkj η̈j + j =1 1 2 n ∑ Vkj ηj = 0. (3.18) j =1 Posto η(t) = (η1 (t), . . . , ηn (t)), l’insieme delle equazioni può essere sintetizzato nella scrittura T η̈(t) + V η(t) = 0. (3.19) Le equazioni (3.18) (o l’equazione matriciale (3.19)) sono equazioni differenziali del secondo ordine lineari a coefficienti costanti omogenee. Vedremo, ora, come sia possibile scrivere un sistema di n equazioni differenziali del secondo ordine lineari disaccoppiate perfettamente equivalente al sistema trovato. Cerchiamo soluzioni delle (3.19) del tipo: η = a eiωt (3.20) con ω ∈ R e a ∈ Rn \ {0} costante.4 Richiedendo che la (3.20) sia soluzione della (3.19) otteniamo: (−ω 2 T + V ) a eiωt = 0 ⇐⇒ (V − ω 2 T ) a = 0 dove ω 2 = λ ha il significato di autovalore e a 6= 0 di autovettore corrispondente. Non si tratta però di un classico problema agli autovalori: infatti si tratta qui di determinare gli autovalori della matrice V rispetto alla matrice T .5 Sarà importante far vedere che tutti i nostri autovalori sono maggiori o uguali a zero, perché altrimenti ω non sarebbe reale.6 Gli autovalori di V rispetto a T sono dati dall’equazione: det(V − λT ) = 0. (3.21) 4 Una soluzione fisicamente accettabile deve essere reale; naturalmente è la parte reale della (3.20) che descrive il sistema. 5 Avremmo ancora il classico problema agli autovalori se T fosse proporzionale alla matrice identità In . 6 Se ciò avvenisse avremmo un moto con andamento esponenziale (crescente o decrescente) con conseguente allontanamento dalla posizione di equilibrio. 42 3.2 piccole oscillazioni Osservazione. Un autovalore λ deve rendere non invertibile V − λT ; inoltre la somma delle molteplicità delle radici della (3.21) è uguale a n. Ora, come detto T è diagonalizzabile, ovvero detta M = Diag(µ1 , . . . , µn ), dove µk > 0 ∀k = 1, . . . , n sono gli autovalori di T non tutti necessariamente distinti, esiste una trasformazione di similitudine U matrice ortogonale a valori reali, cioè U −1 = U T , tale che: T = U T MU. (3.22) Ovviamente se T è già diagonale, allora T = M e U = In . Definiamo inoltre √ √ M1 = Diag( µ1 , . . . , µn ). Si vede immediatamente che M1 è simmetrica a valori reali positivi e che M = M12 . La (3.22) può essere riscritta: T = U T M1 M1 U = ( M1 U )T M1 U. (3.23) Sia Ṽ la matrice simmetrica a valori reali definita positiva non in senso stretto, che soddisfa la seguente relazione: V = ( M1 U )T Ṽ M1 U. (3.24) Pertanto Ṽ e V sono legate da una trasformazione di congruenza. In base alle (3.23) e alle (3.24), l’equazione (3.21) diventa det[( M1 U )T Ṽ M1 U − λ( M1 U )T M1 U ] = 0 ⇐⇒ det[( M1 U )T ] det[Ṽ − λI ] det[ M1 U ] = 0 ⇐⇒ det[Ṽ − λI ] = 0. ovvero trovare gli autovalori di V rispetto a T vuol dire trovare gli autovalori (nel senso usuale) di Ṽ . I suoi autovalori saranno necessariamente, in virtù delle proprietà già citate, maggiori o uguali a zero. Ritorniamo ora all’equazione di Lagrange (3.19), che può essere riscritta per la (3.23) e la (3.24): ( M1 U )T M1 U η̈(t) + ( M1 U )T Ṽ M1 Uη(t) = 0 =⇒ ( M1 U )T [ M1 U η̈(t) + Ṽ M1 Uη(t)] = 0 =⇒ M1 U η̈(t) + Ṽ M1 Uη(t) = 0 Se poniamo M1 Uη(t) = Ψ(t), otteniamo (ricordando che M1 U è una matrice costante) Ψ̈(t) + Ṽ Ψ(t) = 0. (3.25) Sappiamo che la matrice Ṽ , simmetrica e a valori reali, definita positiva non in senso stretto, è diagonalizzabile. I suoi autovalori λi ≥ 0 non sono tutti necessariamente distinti. Sia Λ = Diag(λ1 , . . . , λn ) la matrice diagonale degli autovalori di Ṽ . Esiste (essendo Ṽ diagonalizzabile) una matrice ortogonale S tale che Ṽ = ST ΛS. 43 applicazioni delle equazioni di lagrange L’equazione (3.25) diventa perciò: Ψ̈(t) + S T ΛSΨ(t) = 0 ⇐⇒ SΨ̈(t) + ΛSΨ(t) = 0. Posto SΨ(t) = Q(t) = ( Q1 (t), . . . , Qn (t)) (ricordiamo che S è una matrice costante) abbiamo in definitiva Q̈(t) + ΛQ(t) = 0 (3.26) ovvero ∀k, ricordando che λk = ωk2 : Q̈k (t) + ωk2 Qk (t) = 0 (k = 1, . . . , n) (3.27) cioè n oscillatori armonici disaccoppiati; ciascuno di essi vibra con una propria frequenza (modo normale). Le Qk vengono dette coordinate normali o principali. Osserviamo che le ωk2 non sono tutte necessariamente distinte e che se λk = 0, la k-esima equazione è del tipo Q̈k = 0, quindi non si tratta di un oscillatore armonico. 3.2.2 Riepilogo Q(t) = SΨ(t) = (SM1 U )η(t). Osserviamo che se T = αIn , con α > 0, allora M1 = √ αSη(t). Se sono noti η(0), η̇(0), stato iniziale, si ha: (3.28) √ αIn , U = In e Q(t) = Q(0) = (SM1 U )η(0), Q̇(0) = (SM1 U )η̇(0). Possiamo allora risolvere il sistema (3.26) con queste condizioni iniziali. Determinato Q = Q(t), abbiamo poi: η(t) = SΨ(t) = (SM1 U )−1 Q(t). 3.2.3 Osservazioni Abbiamo ottenuto, in concreto, nelle pagine precedenti il seguente risultato, noto in algebra lineare: Teorema - Siano date due matrici n × n simmetriche a valori reali, la prima T definita positiva e la seconda V semidefinita positiva. Allora esiste una matrice invertibile a valori reali C tale che CT T C = I T C V C = Diag(λ1 , . . . λn ) = Λ dove i λ j ≥ 0 sono le radici dell’equazione caratteristica det(V − λT ) = 0. 44 (3.29) (3.30) 3.2 piccole oscillazioni Possiamo ovviamente scrivere λ j = ω 2j , con ω j ≥ 0. È facile far vedere, usando le notazioni precedenti, che C −1 = SM1 U. In base alle relazioni (3.29) e (3.30) si ottengono in modo agevolo e immediato i modi normali di vibrazione. Infatti: T η̈(t) + V η(t) = 0 =⇒ C T T η̈(t) + C T V η(t) = 0 =⇒ C T T CC −1 η̈(t) + C T V CC −1 η(t) = 0 =⇒ (3.31) Q = C −1 η C −1 η̈(t) + ΛC −1 η(t) = 0 =⇒ Q̈(t) + ΛQ(t) = 0. 3.2.4 Un particolare problema Siano dati N + 1 oscillatori di costante k vincolati agli estremi come in figura 3.4. Siano gli N oggetti a essi vincolati di massa m. La lunghezza a riposo di ciascuna molla sia l0 cosicché la distanza tra le pareti sia ( N + 1)l0 . Indichiamo con x j (t) la posizione della j-esima particella all’istante t e con la x0,j la sua posizione iniziale. A riposo risulta x0,j − x0,j−1 = l0 . L’energia potenziale elastica associata al sistema è V= 1 N +1 k ( x j − x j −1 − l0 ) 2 . 2 j∑ =1 Se ora indichiamo con q j la deviazione dalla posizione di equilibrio della j-esima particella, cioè q j = x j − x0,j , posto q0 = q N +1 = 0, l’energia diventa V= 1 N +1 1 N +1 2 k ∑ (q j + x0,j − q j−1 − x0,j−1 − l0 )2 = k ∑ (q j − q j−1 ) . 2 j =1 2 j =1 Osservando che q̇ j = ẋ j possiamo scrivere la lagrangiana del sistema: L= 1 N 2 1 N +1 m q̇ j − k ∑ (q j − q j−1 )2 . 2 j∑ 2 j =1 =1 L’equazione del moto della j-esima particella è: mq̈ j + k (2q j − q j−1 − q j+1 ) = 0. Figura 3.4: Schema del problema. 45 applicazioni delle equazioni di lagrange D’ora in poi poniamo per semplicità nella trattazione m = 1. Indichiamo ora: 2 −1 0 · · · 0 0 −1 2 −1 . . . 0 0 q1 q2 0 −1 2 . . . 0 0 = kV 0 = ω2 V 0 . q= V = k 0 .. . . . . . . . . . . . . . . . . . . . qN .. 0 . 2 −1 0 0 0 0 0 · · · −1 2 La matrice V 0 (e quindi anche V ) è simmetrica definita positiva. Infatti sia assegnato un vettore x di dimensioni opportune, xT V 0 x = N −1 ∑ V0,ij xi x j = x12 + ∑ (xi − xi+1 )2 + x2N ≥ 0. i =1 i,j La quantità sopra è nulla solo se x è il vettore nullo. Le equazioni del moto possono sintetizzarsi nella relazione: q̈ + V q = 0. Per risolvere il nostro problema occorre trovare gli autovalori della matrice V 0 . Essendo la matrice simmetrica definita positiva gli autovalori saranno tutti reali e positivi. Abbiamo visto che l’energia potenziale è data da V (q) = 1 1 N 1 1 (q, V q) = kq21 + k ∑ (q j − q j−1 )2 + kq2N . 2 2 2 j =2 2 (3.32) Se x = ( x1 , x2 , . . . , x N ) è un autovettore associato all’autovalore λ abbiamo N ( x, V 0 x) = ( x, λx) = λ( x, x) = λ ∑ x2j = λk xk2 . j =1 D’altra parte dalla (3.32) risulta N ( x, V 0 x) = x12 + ∑ ( x j − x j−1 )2 + x2N . j =2 Inoltre ( x j − x j−1 )2 = x2j − 2x j x j−1 + x2j−1 ≤ 2x2j + 2x2j−1 e N N −1 j =2 j =2 ∑ x2j = ∑ N N −1 j =2 i =1 ∑ x2j−1 = 46 x2j + x2N , ∑ xi2 = x12 + N −1 ∑ j =2 x2j (3.33) 3.2 piccole oscillazioni quindi N N N j =2 j =2 j =2 ∑ (x j − x j−1 )2 ≤ 2 ∑ x2j + 2 ∑ x2j−1 = = 2x2N + 2 N −1 ∑ j =2 N −1 ∑ x2j + 2 = 2x12 + 2x2N + 4 N −1 ∑ j =2 j =2 x2j + 2x12 = x2j . Pertanto ( x, V 0 x) ≤ 3x12 + 3x2N + 4 N −1 ∑ j =2 N 2 x2j < 4 ∑ x2j = 4k xk . (3.34) j =1 L’ultima maggiorazione è stretta perché, dovendo essere x 6= 0 in quanto autovettore deve risultare necessariamente x1 , x N 6= 0. Infatti, partendo dall’equazione (V 0 − λI ) x = 0 abbiamo che la prima componente è (2 − λ) x1 − x2 = 0. Ma se x1 = 0 allora x2 = 0. La seconda componente del vettore è − x1 + (2 − λ ) x2 − x3 = 0 che implica x3 = 0. Procedendo in questo modo si troverebbe quindi che x = 0. Confrontando la (3.33) con la (3.34) ricaviamo che 0 < λ < 4. Per trovare gli autovalori procediamo ora nel modo solito. Indichiamo con D N (λ) = det(V 0 − λIN ). Osserviamo che D1 = 2 − λ, 2 − λ −1 = (2 − λ)2 − 1. D2 = −1 2 − λ In generale, vista la struttura della matrice si vede che D N (λ) = (2 − λ) D N −1 (λ) − D N −2 (λ). Per risolvere questo problema alle differenze finite adottiamo un sistema simile a quello che si può utilizzare per trovare la forma chiusa della successione di Fibonacci (vedi l’appendice A), cerchiamo cioè soluzioni del tipo D N (λ) = µ N , con µ 6= 0. L’equazione diventa: µ N − (2 − λ)µ N −1 + µ N −2 = 0 ⇐⇒ µ2 − (2 − λ)µ + 1 = 0 =⇒ p 2 − λ ± (2 − λ )2 − 4 = cos θ ± i sin θ = e± i θ µ1,2 = 2 dove si è effettuata l’opportuna sostituzione 2 cos θ = 2 − λ (in virtù del fatto che λ ∈ ]0, 4[) e si è tenuto conto delle relazioni di Eulero. Ora occorre trovare a, ã ∈ C tali che D N (λ) = a(λ) ei Nθ + ã(λ) e− i Nθ e affinché la soluzione sia reale ã 47 applicazioni delle equazioni di lagrange deve essere il complesso coniugato di a. Imponiamo come “condizioni iniziali” i due determinanti già noti: D2 (λ) = a e2 i θ + ā e−2 i θ = (2 − λ)2 − 1 = 4 cos2 θ − 1 = e2 i θ + e−2 i θ +1 D1 (λ) = a ei θ + ā e− i θ = 2 − λ = 2 cos θ = ei θ + e− i θ 2iθ ( a − 1) e2 i θ +( ā − 1) e2 i θ = 1 b e +b̄ e2 i θ = 1 ⇐⇒ ( a − 1) ei θ +( ā − 1) e−iθ = 0 b ei θ +b̄ e− i θ = 0 ove si è posto b = a − 1. Risolvendo il sistema si ha b(λ) = Perciò: e− i θ ei θ =⇒ a = , ei θ − e− i θ ei θ − e− i θ D N (λ) = ā = − e− i θ . ei θ − e− i θ sin [( N + 1)θ ] ei( N +1)θ − e− i( N +1)θ 2 i sin [( N + 1)θ ] = = i θ − i θ 2 i sin θ sin θ e −e Poiché siamo alla ricerca degli zeri della funzione, occorre che sia sin[θ ( N + 1)] = 0, cioè θm = mπ N+1 m = 1, . . . , N. Ricordando la relazione che lega θ a λ, è necessario che λm = 4 sin2 mπ . 2( N + 1) Gli autovalori sono tutti distinti. Le frequenze del sistema sono 2 ωm = ω02 λm = 4ω02 sin2 mπ . 2( N + 1) Sia ora Λ = (δij λi )i,j=1,...,N . Cerchiamo la matrice S tale che V 0 = S T ΛS. È noto che per costruire la matrice S occorre disporre degli autovettori. Perciò in generale, per m = 1, . . . , N, da (V 0 − λm I ) xm = 0, ponendo come al solito 2 − λm = 2 cos θm e xm,1 = γm sin θm ( 2 − λ ) x − x = 0 xm,1 = γm sin θm m m,2 m,1 − xm,1 + (2 − λm ) xm,2 − xm,3 = 0 xm,2 = 2γm sin θm cos θm = γm sin(2θm ) =⇒ . ... ... − xm,N −1 + (2 − λm ) xm,N = 0 xm,N = γm sin( Nθm ) Possiamo perciò scrivere: mπ sin N + 1 2mπ sin x m = γm N + 1 ... Nmπ sin N+1 48 3.2 piccole oscillazioni dove γm è una costante da scegliere opportunamente. Per esempio, volendo normalizzare l’autovettore: N N 1 − cos(2jθm ) = 2 j =1 2 1 = k x m k 2 = γm ∑ sin2 ( jθm ) = γm2 ∑ j =1 N γ2 = m 2 N − ∑ cos(2jθm ) ! = j =1 2 γm ( N + 1). 2 L’ultima uguaglianza deriva dal fatto che N N ∑ cos(2jθm ) = ∑ Re ei 2jθ j =1 j =1 N m = Re ∑ ei 2jθm . j =1 Questa è una progressione geometrica di ragione ei 2θm quindi: N N j =1 j =1 ∑ cos(2jθm ) = Re ∑ ei 2jθm = Re Perciò γm = autovettore è p ei 2 ( N + 1 ) θ m − e2 i θ m = −1. e2 i θ m − 1 2/( N + 1) (osserviamo che γm non dipende da m) e l’m-esimo mπ N + 1 r 2mπ 2 sin xm = . N + 1 N+1 ... Nmπ sin N+1 sin La matrice S ha per righe gli autovettori xm ed è quindi definita da r 2 mjπ Smj = xm,j = sin . N+1 N+1 Poiché xm,j = x j,m la matrice S è simmetrica, cioè S = S T . Inoltre, avendo normalizzato gli autovettori xm , risulta ( xm , xn ) = δmn pertanto si ha anche S = S−1 da cui S2 = IN . Ricordando poi che Qm = N ∑ Smj q j j =1 è possibile individuare mediante queste trasformazioni come stimolare il sistema (ovvero come agire sulle q j ) per ottenere il modo normale associato alla coordinata Qm . 49 4 F O R M A L I S M O H A M I LT O N I A N O 4.1 equazioni di hamilton Vedremo ora una formulazione diversa della meccanica, nota come formulazione hamiltoniana. La sua rilevanza risiede nel fatto che è in grado di fornire un’impostazione teorica adatta a essere estesa ad altre aree della fisica. Così, per esempio l’approccio hamiltoniano costituisce il linguaggio con cui è formulata la meccanica quantistica. Nella formulazione hamiltoniana della meccanica si descrive il moto di un sistema di particelle con un insieme di equazioni differenziali del primo ordine (ricordiamo che le equazioni di Lagrange, tipiche della formulazione lagrangiana, sono equazioni differenziali del secondo ordine). Il numero complessivo di condizioni iniziali in grado di determinare in modo univoco il moto dovrà sempre essere uguale a 2n, dove n è il numero di gradi di libertà del sistema di particelle. Di conseguenza nell’approccio hamiltoniano dovranno esserci 2n equazioni differenziali del primo ordine, le quali descriveranno l’evoluzione del punto rappresentativo del sistema in uno spazio 2n-dimensionale, detto spazio delle fasi. Avremo allora 2n coordinate indipendenti in grado di definire lo stato del sistema. Un modo naturale, anche se non unico, per introdurle è, nota la lagrangiana del sistema, associare a ogni coordinata generalizzata qk , con k = 1, . . . , n, un’altra coordinata data dal momento coniugato a essa, cioè pk = ∂L/∂q̇k . Le variabili (q, p) sono dette canoniche. Si passa, in ultima analisi, dal sistema di variabili (q, q̇, t), proprio della formulazione lagrangiana, al sistema di nuove variabili (q, p, t), con il quale possiamo formulare la meccanica hamiltoniana. Il metodo che ci permette di passare da un sistema all’altro è fornito dalle trasformazioni di Legendre (per un approfondimento sulle trasformazioni di Legendre vedi l’appendice B). Studieremo prima un caso semplice, cioè un sistema a un solo grado di libertà. Sia L = L(q, q̇, t) la lagrangiana del sistema. Abbiamo: dL = ∂L ∂L ∂L ∂L dq + dq̇ + dt = ṗ dq + p dq̇ + dt ∂q ∂q̇ ∂t ∂t (4.1) dove abbiamo utilizzato la definizione di momento coniugato p = ∂L/∂q̇ e l’ed ∂L quazione di Lagrange ∂L/∂q = dt ∂q̇ = ṗ. L’hamiltoniana del sistema H( q, p, t ) è definita mediante la seguente trasformazione detta di Legendre: H(q, p, t) = q̇p − L(q, q̇, t). (4.2) Notiamo che l’hamiltoniana risulta in realtà funzione di (q, p, t) solo dopo aver 51 formalismo hamiltoniano espresso q̇ in funzione di (q, p, t) utilizzando la relazione p = ∂L(q, q̇, t)/∂q̇. Valgono le seguenti relazioni: dH = ∂H ∂H ∂H dq + dp + dt ∂q ∂p ∂t (4.3) Inoltre, per la (4.1) e la (4.2), si ha dH = q̇ dp + p dq̇ − ṗ dq − p dq̇ − ∂L ∂L dt = q̇ dp − ṗ dq − dt ∂t ∂t (4.4) Dal confronto tra la (4.3) e la (4.4) emerge che ∂H(q, p, t) = q̇ ∂p (4.5) ∂H(q, p, t) = − ṗ ∂q e ∂L ∂H =− . ∂t ∂t (4.6) Le relazioni (4.5) sono dette equazioni di Hamilton e costituiscono un sistema di due equazioni differenziali del primo ordine nelle due variabili indipendenti (coordinate canoniche) q e p. Queste nuove variabili definiscono lo stato del sistema nel cosiddetto spazio delle fasi, che è ovviamente di dimensione 2. La procedura precedente si può generalizzare al caso di un sistema avente n gradi di libertà. Sia L = L (q, q̇, t) la lagrangiana del sistema, con q = (q1 , . . . , qn ) e q̇ = (q̇1 , . . . , q̇n ). Si ha: dL = n n ∂L j =1 n = ∂L ∑ ∂q j dq j + ∑ ∂q̇ j dq̇ j + ∑ j =1 j =1 ∂L dt = ∂t ∂L dt ṗ j dq j + p j dq̇ j + ∂t (4.7) (si è utilizzato ∂L/∂q̇ j = p j e ∂L/∂q j = d ∂L dt ∂q̇ j = ṗ j ). Posto p = ( p1 , . . . , pn ), possiamo come prima definire l’hamiltoniana del sistema in funzione di (q, p, t) mediante la trasformazione di Legendre H(q, p, t) = n ∑ q̇ j p j − L(q, q̇, t). (4.8) j =1 Avremo allora dH = n ∑ j =1 52 ∂H ∂H dq j + dp j ∂q j ∂p j + ∂H dt ∂t (4.9) 4.1 equazioni di hamilton e, per la (4.7) e la (4.8), dH = n n j =1 j =1 ∑ (q̇ j dp j + p j dq̇ j ) − ∑ ( ṗ j dq j + p j dq̇ j ) − ∂L dt = ∂t n ∂L dt. = ∑ (q̇ j dp j − ṗ j dq j ) − ∂t j =1 (4.10) Dalla (4.9) e dalla (4.10) si deduce che per i = 1, . . . , n ∂H(q, p, t) = q̇i ∂pi ∂H(q, p, t) = − ṗi ∂qi (4.11) ∂L ∂H =− . ∂t ∂t (4.12) e Le equazioni (4.11) vengono chiamate, come nel caso di un solo grado di libertà, equazioni di Hamilton e costituiscono 2n equazioni differenziali nelle variabili canoniche q e p. In conclusione, la costruzione dell’hamiltoniana avviene attraverso i seguenti passaggi: • si costruisce la lagrangiana L in funzione delle coordinate generalizzate q, delle velocità generalizzate q̇ ed eventualmente del tempo t attraverso la relazione L = T − V (supponendo le forze derivanti da un unico potenziale o potenziale generalizzato); • si definiscono i momenti coniugati pi attraverso la relazione pi = ∂L(q, q̇, t) ∂q̇i (i = 1, . . . , n); (4.13) • si scrive l’hamiltoniana del sistema utilizzando la trasformazione di Legendre (4.8) (ovviamente in questa scrittura intervengono q, q̇, p e t); • a partire dalle (4.13) si cerca di ottenere q̇ in funzione di q, p e t; • con l’ausilio del risultato precedente si può, infine, esprimere l’hamiltoniana H in funzione di q, p e t. Esercizi 1. Si consideri una particella di massa m in un campo conservativo. Sia U = U (r ) l’energia potenziale. Scrivere l’hamiltoniana del sistema a) in coordinate cartesiane; b) in coordinate sferiche; 53 formalismo hamiltoniano c) in coordinate cilindriche. Soluzione. In coordinate cartesiane x, y, z la lagrangiana della particella è L= 1 m( ẋ2 + ẏ2 + ż2 ) − U ( x, y, z). 2 Abbiamo: px ∂L = m ẋ =⇒ ẋ = ∂ ẋ m py ∂L py = = mẏ =⇒ ẏ = ∂ẏ m ∂L pz pz = = mż =⇒ ż = . ∂ż m px = Quindi, per la (4.8) e tenendo presenti le relazioni fra le velocità generalizzate e i momenti coniugati appena determinate, l’hamiltoniana è H = ẋp x + ẏpy + żpz − L = 1 1 ( p2 + p2y + p2z ) + U ( x, y, z) = = ( p2x + p2y + p2z ) − m 2m x 1 = ( p2 + p2y + p2z ) + U ( x, y, z). 2m x In coordinate sferiche r, θ, ϕ la lagrangiana della particella è L= 1 m(ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 ) − U (r, θ, ϕ). 2 Calcoliamo i momenti coniugati e le relazioni fra le velocità generalizzate e questi: ∂L pr = mṙ =⇒ ṙ = ∂ṙ m ∂L p pθ = = mr2 θ̇ =⇒ θ̇ = θ2 mr ∂θ̇ pϕ ∂L pϕ = = mr2 sin2 θ ϕ̇ =⇒ ϕ̇ = . 2 ∂ ϕ̇ mr sin2 θ pr = Dunque l’hamiltoniana è H = ṙpr + θ̇ pθ + ϕ̇p ϕ − L = p2ϕ p2 p2r + 2θ + r r2 sin2 θ 1 = m = 1 2m p2r + ! p2ϕ p2θ + r2 r2 sin2 θ 1 − 2m ! p2ϕ p2 p2r + 2θ + r r2 sin2 θ ! + U (r, θ, ϕ) = + U (r, θ, ϕ). Infine, nelle coordinate cilindriche r, ϕ, z la lagrangiana della particella si scrive: L= 54 1 m(ṙ2 + r2 ϕ̇2 + ż2 ) − U (r, ϕ, z). 2 4.1 equazioni di hamilton Come al solito troviamo i momenti coniugati e poi esprimiamo le velocità generalizzate in funzione dei momenti: ∂L pr = mṙ =⇒ ṙ = ∂ṙ m pϕ ∂L 2 = mr ϕ̇ =⇒ ϕ̇ = pϕ = ∂ ϕ̇ mr2 ∂L pz pz = = mż =⇒ ż = . ∂ż m pr = Abbiamo che l’hamiltoniana è data da: H = ṙpr + ϕ̇p ϕ + żpz − L = ! ! p2ϕ p2ϕ 1 1 2 2 2 2 = pr + 2 + p z − pr + 2 + pz + U (r, ϕ, z) = m r 2m r ! p2ϕ 1 = p2r + 2 + p2z + U (r, ϕ, z). 2m r 2. Scrivere l’hamiltoniana di una particella di massa m e carica q in un campo elettromagnetico, i cui potenziali sono rispettivamente ϕ e A. Soluzione. Nel capitolo 1 abbiamo visto che la lagrangiana della particella carica nel campo elettromagnetico è data da L= q 1 2 mv − qϕ + A · v. 2 c I momenti coniugati sono allora q p = ∇v L = mv + A. c Da qui ricaviamo la velocità in funzione dei momenti coniugati: v= q 1 p− A . m c Allora l’hamiltoniana è: H = v· p−L = 1 1 1 2 q q 2 q q = p − A · p − m 2 p − A + qϕ − A· p− A = m c 2 m c mc c 2 2 1 q q 1 q = p2 − 2 A · p + 2 A2 − p − A + qϕ = m c c 2m c 1 q 2 = p − A + qϕ. 2m c 55 formalismo hamiltoniano Possiamo anche scrivere le sei equazioni di Hamilton che descrivono il moto della particella: ∂H 1 q ∂ϕ ẋ = = px − Ax + q ∂p x m c ∂p x ∂H 1 q ∂ϕ ẏ = = py − Ay + q ∂py m c ∂py ∂H 1 ∂ϕ q ż = = pz − Az + q ∂pz m c ∂pz ∂H 1 q ∂A x ∂ϕ q ṗ x = − = −q px − Ax ∂x m c c ∂x ∂x ∂H 1 q q ∂Ay ∂ϕ ṗy = − = py − Ay −q ∂y m c c ∂y ∂y 1 ∂ϕ ∂H q q ∂Az = −q . ṗz = − pz − Az ∂z m c c ∂z ∂z Se i potenziali ϕ e A non dipendono esplicitamente dalle coordinate allora il momento coniugato p risulta costante. 4.1.1 Un esempio Supponiamo che le equazioni che definiscono le coordinate generalizzate non dipendano esplicitamente dal tempo e che le forze in gioco derivino da un potenziale V funzione solo delle coordinate generalizzate. Vogliamo vedere come possiamo scrivere l’hamiltoniana del sistema. Siano n i gradi di libertà e siano q1 , . . . , qn le coordinate generalizzate. È semplice dimostrare che l’energia cinetica si può scrivere T= 1 n τij (q)q̇i q̇ j 2 i,j∑ =1 dove q = (q1 , . . . , qn ). La lagrangiana è data da L = T − V ( q ). Il momento coniugato a qi è pi = ∂L = ∂q̇i n ∑ τij (q)q̇ j . j =1 La matrice simmetrica τ = τij è definita positiva ed è quindi invertibile. Allora q̇ j = n ∑ i =1 τ −1 ij pi . Si può dimostrare che nel nostro caso l’hamiltoniana è uguale all’energia totale, cioè n H= ∑ q̇i pi − L(q, q̇) = T + V. i =1 56 4.2 notazione simplettica Osserviamo che n 1 n −1 −1 τ ( q ) pk pl = τ τ ij ∑ 2 i,j∑ ik jl =1 k,l =1 1 n −1 = ∑ τ ik δil pk pl = 2 i,k,l =1 n 1 = ∑ τ −1 p i p k . 2 i,k=1 ik T= In definitiva otteniamo che: H= 1 n −1 p i p k + V ( q ). τ 2 i,k∑ ik =1 Se τ è diagonale, lo sarà anche la sua inversa e dunque H= 4.2 1 n −1 τ p i 2 + V ( q ). 2 i∑ ii =1 notazione simplettica Le equazioni di Hamilton non trattano le coordinate generalizzate e i momenti coniugati in modo simmetrico, come si evince immediatamente dalle (4.5). Accenniamo qui brevemente a un modo elegante di scrivere queste equazioni in forma unitaria attraverso la cosiddetta notazione simplettica. Se il sistema ha n gradi di libertà, possiamo costruire un vettore colonna formato da 2n elementi (righe), e cioè: ηi = q i , ηi + n = p i (i = 1, . . . , n). Il vettore colonna così costruito è dato da q1 .. . qn η= p1 . . .. pn Si ha ovviamente ∂H ∂H = , ∂ηi ∂qi ∂H ∂H = ∂ηi+n ∂pi (i = 1, . . . , n). 57 formalismo hamiltoniano Definiamo la seguente matrice 2n × 2n formata da quattro matrici n × n: J= 0n In − In 0n dove In è la matrice identità n × n e 0n è la matrice nulla n × n. Notiamo che 0n − In T −1 J =J = . In 0n Si vede che J −1 = − J. Allora J 2 = − I2n e det J = 1. La matrice J è detta matrice simplettica standard. Possiamo scrivere le equazioni di Hamilton nel modo seguente 2n η̇k = ∂H ∑ Jkj ∂ηj (k = 1, . . . , 2n) j =1 o in maniera sintetica η̇ = J ∂H . ∂η Per maggiore chiarezza esplicitiamo il caso bidimensionale: 0 0 q̇1 q̇2 0 0 = ṗ1 −1 0 0 −1 ṗ2 1 0 0 0 − ṗ1 0 1 − ṗ2 . q̇1 0 q̇2 0 Questa notazione è detta simplettica. 4.3 coordinate cicliche e metodo di routh Sia H = H(q, p, t) l’hamiltoniana del sistema di particelle con n gradi di libertà, dove q = (q1 , . . . , qn ) e p = ( p1 , . . . , pn ) sono le coordinate canoniche (indipendenti). Si ha: dH = dt n n ∂H ∂H ∂H q̇ + j ∑ ∂q j ∑ ∂p j ṗ j + ∂t . j =1 j =1 (4.14) Per le equazioni di Hamilton (4.5) e per la (4.12), la (4.14) diventa: n n dH ∂H ∂H ∂L = − ∑ ṗ j q̇ j + ∑ q̇ j ṗ j + = =− dt ∂t ∂t ∂t j =1 j =1 (4.15) dove L è la lagrangiana del nostro sistema. Si vede, allora, che l’hamiltoniana è una costante del moto se non dipende in modo esplicito dal tempo (o, in maniera equivalente, se la lagrangiana non dipende esplicitamente dal tempo). 58 4.3 coordinate cicliche e metodo di routh Abbiamo avuto già modo di osservare che, se le equazioni di trasformazione che definiscono le coordinate generalizzate non dipendono esplicitamente dal tempo e se il potenziale dipende solo dalle coordinate generalizzate, allora H coincide con l’energia totale ed è una costante del moto. Il fatto che H coincida con l’energia totale e sia una costante del moto sono due risultati in qualche modo indipendenti. Possono cioè verificarsi situazioni in cui l’hamiltoniana è una costante del moto ma non è uguale all’energia totale, e viceversa.1 Se qn è una coordinata ciclica, allora pn = ∂L/∂q̇n è una costante del moto. In questo caso l’hamiltoniana del sistema sarà funzione della costante pn e non, ovviamente, di qn . Ponendo pn = α, abbiamo H = H(q1 , . . . , qn−1 ; p1 , . . . , pn−1 ; α; t), cioè l’hamiltoniana è di fatto funzione di sole 2(n − 1) coordinate, essendo α costante. Possiamo poi studiare l’evoluzione temporale delle coordinate generalizzate qn attraverso l’equazione canonica q̇n = ∂H/∂α. Si possono combinare i vantaggi della formulazione hamiltoniana nel trattare le coordinate cicliche con quelli della formulazione lagrangiana per lo studio delle coordinate non cicliche con un metodo dovuto a Routh. In sostanza si effettua una trasformazione di Legendre per passare dal sistema (q, q̇) al sistema (q, p) solo per le coordinate cicliche, ricavando per esse le equazioni del moto in forma hamiltoniana mentre le rimanenti equazioni del moto rimangono espresse in forma lagrangiana. Supponiamo che qs+1 , . . . , qn siano coordinate cicliche. Introduciamo la seguente funzione di Routh (o routhiana): R(q1 , . . . , qn ; q̇1 , . . . , q̇s ; ps+1 , . . . , pn ; t) = n ∑ j = s +1 q̇ j p j − L(q1 , . . . , qn ; q̇1 , . . . , q̇n ; t) (4.16) dove L è, ovviamente, la lagrangiana del sistema (notare che nella (4.16) non è stata ancora inserita l’informazione che qs+1 , . . . , qn sono cicliche). Dalla (4.16) otteniamo: n s ∂L ∂L dR = ∑ (dq̇ j p j + q̇ j dp j ) − ∑ dq j + dq̇ j + ∂q j ∂q̇ j j = s +1 j =1 (4.17) n ∂L ∂L ∂L − ∑ dq j + dq̇ j − dt. ∂q j ∂q̇ j ∂t j = s +1 Tenendo presente che per j = s + 1, . . . , n ∂L = pj ∂q̇ j ∂L =0 ∂q j la (4.17) diventa: dR = n ∑ j = s +1 s q̇ j dp j − ∑ j =1 ∂L ∂L dq j + dq̇ j ∂q j ∂q̇ j − ∂L dt. ∂t (4.18) 1 Per una discussione articolata, arricchita da esempi, rimandiamo alla lettura di Goldstein, Poole e Safko [7, pagine 328–332]. 59 formalismo hamiltoniano Dalla (4.18) si deduce che ∂L ∂R ∂q = − ∂q j j per j = 1, . . . , s ∂R ∂L =− ∂q̇ j ∂q̇ j ∂R ∂q = 0 j per j = s + 1, . . . , n ∂R = q̇ j ∂p j Allora le equazioni di Lagrange per j = 1, . . . , s si possono scrivere mediante la funzione di Routh: d ∂R ∂R − = 0. dt ∂q̇ j ∂q j In conclusione la funzione di Routh è una funzione di Hamilton in rapporto alle coordinate cicliche qs+1 , . . . , qn e una funzione di Lagrange in rapporto alle coordinate non cicliche q1 , . . . , qs . Osserviamo ad abundantiam che le coordinate cicliche non compaiono esplicitamente nella lagrangiana e, quindi, nella funzione di Routh, cioè: R = R(q1 , . . . , qs ; q̇1 , . . . , q̇s ; ps+1 , . . . , pn ; t) dove, per j = s + 1, . . . , n, i p j sono integrali primi del moto. Vediamo un piccolo esempio. Una particella di massa m si muove in un campo di forze centrali il cui potenziale è U = U (r ) con r distanza della particella dal centro di forza. Sappiamo che il moto avviene in un piano (sempre che il momento angolare rispetto al centro di forza, che è costante, sia diverso da zero). Possiamo esprimere la lagrangiana della particella in tale piano in coordinate polari. Si ha: L= 1 m(ṙ2 + r2 θ̇ 2 ) − U (r ). 2 Chiaramente θ è una coordinata ciclica. La funzione di Routh è definita nel modo seguente: R = θ̇ pθ − L, dove pθ = ∂L/∂θ̇ = mr2 θ̇ è il momento coniugato a θ. Con semplici calcoli si ricava che: R= 1 p2θ 1 − mṙ2 + U (r ). 2 2m r 2 Osserviamo che ∂R/∂θ = 0 (e dunque pθ è una costante del moto), mentre ∂R/∂pθ = θ̇ = pθ /(mr2 ). Inoltre d ∂R ∂R − = 0, dt ∂ṙ ∂r 60 4.4 principio variazionale di hamilton modificato cioè mr̈ − p2θ + U 0 (r ) = 0 mr3 (ricordiamo che −U 0 (r )r̂ è la forza centrale agente sulla particella). Il metodo di Routh, che, in certi casi, può tornare utile ai fini del calcolo, non è, in definitiva, altro che un ibrido concettuale tra la formulazione lagrangiana e quella hamiltoniana, senza nulla aggiungere di sostanziale all’analisi e allo studio di un sistema meccanico. 4.4 principio variazionale di hamilton modificato Abbiamo visto che le equazioni di R tLagrange possono essere ottenute dal principio di Hamilton imponendo δS = δ t01 L(q, q̇, t) dt = 0, richiedendo cioè che il moto reale, fra tutti i moti ammissibili nello spazio delle configurazioni, sia quello che rende stazionaria l’azione. Se vogliamo dedurre le equazioni di Hamilton da un principio variazionale occorre, in qualche modo, modificare il precedente principio, perché l’integrale possa essere valutato su percorsi del punto rappresentativo del sistema nello spazio delle fasi. Nell’approccio hamiltoniano le coordinate canoniche q e p sono considerate indipendenti nello spazio delle fasi; di conseguenza devono essere considerate indipendenti anche le loro variazioni. L’idea è di considerare l’azione scritta nel modo seguente: ! Z S[q(t), p(t)] = t1 t0 n ∑ p j q̇ j − H(q, p, t) dt (4.19) j =1 con (q(t0 ) = q0 , p(t0 ) = p0 ) e (q(t1 ) = q1 , p(t1 ) = p1 ). Un moto nello spazio delle fasi (q̃(t), p̃(t)) è ammissibile se (q̃(t0 ) = q0 , p̃(t0 ) = p0 ) e (q̃(t1 ) = q1 , p̃(t1 ) = p1 ). Il moto reale nello spazio delle fasi è quello tra i moti ammissibili che rende stazionaria l’azione (4.19), cioè ! Z δS = δ t1 t0 n ∑ p j q̇ j − H(q, p, t) dt = 0. j =1 Questo principio variazionale di Hamilton modificato ha esattamente la stessa forma variazionale tipica in uno spazio delle configurazioni di dimensione 2n. Ripetendo i ragionamenti fatti nel capitolo 2, otteniamo 2n equazioni di tipo Lagrange (o di Eulero-Lagrange), cioè ( " #) " # n n d ∂ ∂ p j q̇ j − H(q, p, t) − p j q̇ j − H(q, p, t) = 0 ⇐⇒ dt ∂q̇k j∑ ∂qk j∑ =1 =1 ∂H ⇐⇒ ṗk + = 0, ∂qk ( " #) " # n n d ∂ ∂ p j q̇ j − H(q, p, t) − p j q̇ j − H(q, p, t) = 0 ⇐⇒ dt ∂ ṗk j∑ ∂pk j∑ =1 =1 61 formalismo hamiltoniano ⇐⇒ q̇k − ∂H =0 ∂pk che sono nell’ordine la seconda e la prima equazione di Hamilton. Osserviamo infine che il principio variazionale di Hamilton modificato è formulato in modo tale che agli estremi per i = 1, . . . , n non solo δqi = 0 ma anche δpi = 0. Una conseguenza immediata di questa considerazione è che, se F (q, p, t) è una funzione di classe opportuna (liscia), allora n ∑ p j q̇ j − H(q, p, t) + j =1 dF (q, p, t) dt (4.20) dà luogo alle stesse equazioni di Hamilton. 4.5 parentesi di poisson Supponiamo di avere un sistema lagrangiano con n gradi di libertà. Indichiamo come al solito con q = (q1 , . . . , qn ) le coordinate generalizzate e con p = ( p1 , . . . , pn ) i momenti coniugati individuando così il nostro sistema (q, p) di coordinate canoniche. Sia H(q, p, t) l’hamiltoniana del sistema. Supponiamo di avere una funzione f (q, p, t) : F × R → R di classe opportuna, indicato con F lo spazio delle fasi. Una funzione siffatta è detta anche variabile dinamica. Tenendo conto delle equazioni di Hamilton si ha: n df ∂f ∂f ∂f =∑ q̇ j + ṗ j + = dt ∂q ∂p ∂t j j j =1 n ∂ f ∂H ∂f ∂f ∂ f ∂H − + = { f , H}q,p + =∑ ∂q ∂p ∂p ∂q ∂t ∂t j j j j j =1 dove { f , H}q,p = n ∑ j =1 ∂ f ∂H ∂ f ∂H − ∂q j ∂p j ∂p j ∂q j è detta parentesi di Poisson2 di f e H rispetto al sistema di coordinate canoniche (q, p). Si noti che l’ordine delle variabili (q, p) non è indifferente. Si vede subito che f è una costante del moto se { f , H}q,p + ∂ f /∂t = 0. In particolare se la variabile dinamica f non dipende esplicitamente dal tempo, df = 0 ⇐⇒ { f , H}q,p = 0. dt Più in generale, se abbiamo due variabili dinamiche f (q, p, t) e g(q, p, t), si definisce parentesi di Poisson di f e g rispetto alle coordinate canoniche (q, p) la quantità: { f , g} = n ∑ j =1 ∂ f ∂g ∂ f ∂g − . ∂q j ∂p j ∂p j ∂q j (4.21) 2 Talvolta per semplicità di notazione quando ciò non comporta equivoci il pedice alle parentesi è omesso. Inoltre la parentesi di Poisson è talvolta indicata in letteratura con il simbolo [·, ·] o [·, ·] PB . 62 4.5 parentesi di poisson Le parentesi di Poisson godono delle seguenti proprietà (siano f , g, f 1 , f 2 , g1 , g2 variabili dinamiche arbitrarie): 1. { f , g} = −{ g, f }, da cui ovviamente { f , f } = 0; 2. se c è costante rispetto alle coordinate canoniche, allora { f , c} = 0; 3. { f 1 + f 2 , g} = { f 1 , g} + { f 2 , g} e { f , g1 + g2 } = { f , g1 } + { f , g2 }, ovvero le parentesi sono operatori lineari; 4. { f 1 · f 2 , g} = f 1 { f 2 , g} + f 2 { f 1 , g}; 5. si dimostra la seguente identità, per nulla banale, detta di Jacobi: { f , { g, h}} + { g, {h, f }} + {h, { f , g}} = 0 Valgono inoltre le seguenti relazioni: ∂f ∂g ∂ { f , g} = , g + f, ; • ∂t ∂t ∂t • { f , qj } = − ∂f ∂f e { f , pj } = ∂p j ∂q j • {qi , q j } = 0, { pi , p j } = 0, {qi , p j } = δij (parentesi di Poisson fondamentali). Notiamo per inciso che le equazioni di Hamilton possono essere scritte anche nel modo seguente: ∂H = { q k , H}, ∂pk ∂H ṗk = − = { p k , H}. ∂qk q̇k = (4.22) Osserviamo come l’asimmetria delle equazioni di Hamilton “scompaia” utilizzando le parentesi di Poisson. Esercizi 1. Dimostrare l’identità di Jacobi nel caso in cui n = 1. 2. Dimostrare che se due variabili dinamiche f e g, che non dipendono esplicitamente dal tempo, sono entrambe integrali primi del moto, allora anche { f , g} è un integrale primo del moto (Suggerimento: utilizzare l’identità di Jacobi e il fatto che d f /dt = 0 ⇐⇒ { f , H} = 0, dove H è l’hamiltoniana). 3. Dimostrare che, se due variabili dinamiche f e g (in generale dipendenti dal tempo) sono entrambe integrali primi del moto, allora anche { f , g} è un integrale primo del moto (questo è il teorema di Poisson). 63 formalismo hamiltoniano 4. Sia dato un punto materiale di massa m e sia l’hamiltoniana del nostro sistema H( x1 , x2 , x3 , p1 , p2 , p3 , t), in coordinate cartesiane. Dimostrare, utilizzando le parentesi di Poisson fondamentali, che { L j , pk } = ε jkl pl , dove ε jkl è il simbolo di Levi-Civita, o delle permutazioni di 1, 2, 3.3 Analogamente si può vedere che { L j , Lk } = ε jkl Ll e { L j , L2 } = 0. 5. Supponiamo di avere un punto materiale in un potenziale a simmetria sferica. Si scriva in coordinate sferiche l’hamiltoniana e il momento angolare della particella rispetto al centro della forza. Calcolare { L2 , H}, { L, H}. 4.6 trasformazioni canoniche Le equazioni differenziali del moto, nel formalismo hamiltoniano, benché del primo ordine, non semplificano, in generale, i calcoli rispetto a quelle del formalismo lagrangiano. La novità nell’approccio hamiltoniano risiede nel fatto che le coordinate e i momenti coniugati hanno la stessa rilevanza. Esistono casi in cui tutte le n coordinate generalizzate sono cicliche; in tale circostanza tutti i momenti coniugati sono costanti del moto. Se poniamo per semplicità pi = αi (costante) per i = 1, . . . , n, allora q̇i = ∂H(α1 , . . . , αn )/∂αi = ωi , valore costante, e quindi integrando si ha qi (t) = ωi t + qi (0). Abbiamo visto come sia possibile, in questo caso, integrare banalmente le equazioni del moto. Il fatto rilevante è che esistono problemi meccanici (quelli cosiddetti integrabili) per i quali è possibile avere n coordinate generalizzate cicliche. Naturalmente punto fondamentale è saper passare da un sistema di coordinate canoniche (q, p) a un altro sistema di coordinate canoniche ( Q, P ), anche per ricercare, ove esistano, coordinate generalizzate cicliche. Un modo, potremmo dire naturale, per ottenere nuove coordinate canoniche relative a un sistema meccanico lagrangiano (e quindi hamiltoniano) è di partire da trasformazioni nello spazio delle configurazioni Q = Q(q, t), esprimere la lagrangiana in termini di Q e Q̇, ottenere i momenti coniugati corrispondenti tramite la relazione Pi = ∂L/∂ Q̇i e infine riscrivere l’hamiltoniana in funzione di ( Q, P ), nuove coordinate canoniche, ed eventualmente del tempo in modo esplicito. Si può avere una trasformazione da un sistema di coordinate canoniche (q, p) a un altro ( Q, P ) in maniera più generale, considerando (nello spazio delle fasi) come indipendenti le coordinate generalizzate e i momenti coniugati (ricordiamo che questo assunto è tipico della formulazione hamiltoniana). Si può, in altre parole, avere nello spazio delle fasi una trasformazione simultanea delle coordinate generalizzate e dei momenti coniugati, cioè: Q = Q(q, p, t) (4.23) P = P (q, p, t) con (q, p) e ( Q, P ) vecchie e nuove, rispettivamente, coordinate canoniche. Trasformazioni di questo tipo, nello spazio delle fasi, sono dette canoniche e permettono, in termini delle nuove coordinate canoniche ( Q, P ), una nuova descrizione 3 Per la definizione di tale simbolo vedi l’appendice C. 64 4.6 trasformazioni canoniche equivalente della dinamica del nostro sistema meccanico, se, ovviamente, esiste una nuova hamiltoniana funzione di ( Q, P, t), che dia luogo alle equazioni di Hamilton. Possiamo in definitiva dare la seguente Definizione (di trasformazione canonica) - Se (q, p) è un sistema di coordinate canoniche con hamiltoniana H(q, p, t), Q = Q(q, p, t) P = P (q, p, t) è una trasformazione canonica se esiste una nuova hamiltoniana K( Q, P, t) che permette di scrivere le equazioni del moto nella forma ∂K Q̇i = ∂P i , ∂K Ṗi = − ∂Qi con i = 1, . . . , n. Sottolineiamo una proprietà rilevante delle trasformazioni canoniche (proprietà che sarà evidente in seguito): le trasformazioni canoniche sono indipendenti dal problema fisico specifico. In altre parole la trasformazione (q, p, t) → ( Q, P, t), se è canonica per un particolare sistema meccanico, è canonica per tutti i sistemi meccanici con lo stesso numero di gradi di libertà. Abbiamo visto che le equazioni di Hamilton possono essere ottenute dal principio di Hamilton modificato, cioè ! Z δS = δ t1 t0 n ∑ pi q̇i − H(q, p, t) dt = 0. i =1 Analogamente, se Q e P sono le nuove coordinate canoniche e K( Q, P, t) è la nuova hamiltoniana, il principio di Hamilton modificato diventa: ! Z δS = δ t1 t0 n ∑ Pi Q̇i − K(Q, P, t) dt = 0. i =1 Poiché le variazioni delle coordinate canoniche (relative a tutti i moti ammissibili nello spazio delle fasi) devono essere nulle agli estremi, deve valere (vedi la (4.20)) la seguente relazione (trasformazione canonica): n n i =1 i =1 ∑ pi q̇i − H(q, p, t) = ∑ Pi Q̇i − K(Q, P, t) + dF dt (4.24) dove F (q, p, t), che supponiamo liscia, è detta funzione generatrice della trasformazione canonica (4.24). La relazione (4.24) può essere scritta: n n i =1 i =1 ∑ pi dqi − ∑ Pi dQi − (H − K) dt = dF. (4.25) 65 formalismo hamiltoniano La struttura della (4.25) induce a prendere in considerazione la sottoclasse di trasformazioni in cui è possibile scegliere (q, Q) come variabili indipendenti in ∂p luogo di (q, p). Richiediamo allora che p = p(q, Q, t) abbia4 det ∂Q 6= 0 e P = P (q, Q, t). La funzione generatrice è detta, in questo caso, di tipo 1. Si ha: F (q, p, t) = F (q, p(q, Q, t), t) = F1 (q, Q, t). La relazione (4.25) può, allora, essere scritta in questo caso: n n i =1 i =1 n ∑ pi dqi − ∑ Pi dQi − (H − K) dt = = n ∂F1 ∂F1 ∂F1 dqi + ∑ dQi + dt ∂qi ∂Qi ∂t i =1 i =1 ∑ Di conseguenza, per i = 1, . . . , n: ∂F1 (4.26) ∂qi ∂F1 Pi = − (4.27) ∂Qi ∂F1 . (4.28) K = H+ ∂t Una volta nota la funzione generatrice di tipo 1, tramite la (4.26) si ottiene pi = p = p(q, Q, t) (4.29) e tramite la (4.28) P = P (q, Q, t). Invertendo poi la (4.29), si ottiene Q = Q(q, p, t); si può pertanto esprimere anche P in funzione di (q, p, t). Osserviamo che l’inversione è garantita dalla proprietà di non degenerazione det ∂p ∂2 F1 = det 6= 0. ∂Q ∂q ∂Q Possiamo riassumere il discorso appena fatto nel modo seguente: Per ogni funzione F1 (q, Q, t) liscia, soggetta alle proprietà di non degenerazione, la trasformazione (q, p, t) → ( Q, P, t), definita, per i = 1, . . . , n, da ∂F1 pi = ∂q i ∂F Pi = − 1 ∂Qi e dalla formula inversa Q = Q(q, p, t), è canonica; a ogni hamiltoniana H(q, p, t) corrisponde l’hamiltoniana K = H + ∂F1 /∂t. In particolare, se ∂F1 /∂t = 0, K = H. 4 Ovvero la matrice jacobiana ∂ p/∂Q = ∂ pk /∂Q j è assunta non singolare. 66 4.6 trasformazioni canoniche Vediamo alcuni esempi di trasformazioni di tipo 1 per sistemi a un grado di libertà: • Sia F1 = qQ la funzione generatrice di tipo 1 (n = 1). Allora p = Q e P = −q. Vale a dire, (q, p) → ( p, −q) è una trasformazione canonica. Inoltre K = H. Notare che la trasformazione canonica è indipendente dal sistema fisico in esame. p • F1 = q2 Q2 /2. Allora: p = ∂F1 /∂q = qQ2 =⇒ Q = p/q e P = √ 2 −∂F1 /∂Q p= −q Q =⇒ P = −q pq. La trasformazione canonica è √ (q, p) → ( q/p, −q qp) con K = H. • F1 = etq Q. Abbiamo: p = ∂F1 /∂q = t etq Q =⇒ Q = e−tq p/t e P = −∂F1 /∂Q = − etq =⇒ P = − etq . La trasformazione canonica è (q, p) → (e−tq p/t, − etq ) con K = H + ∂F1 /∂t = H − QP ln(− P)/t.5 Può capitare che non sia possibile avere una funzione generatrice di tipo 1. Questo accade se p può essere funzione di (q, P, t) e non di (q, Q, t). Allora si può porre: n F = F2 (q, P, t) − ∑ Qi Pi . i =1 La relazione (4.25) diventa in questo caso n n i =1 i =1 n n i =1 i =1 i dQi − (H − K) dt = dF2 − ∑ Qi dPi − ∑ P i dQi ∑ pi dqi − ∑P ovvero n n i =1 i =1 ∑ pi dqi + ∑ Qi dPi − (H − K) dt = dF2 . (4.30) F2 è detta funzione generatrice di tipo 2. Dalla (4.30) otteniamo ∂F2 , ∂qi ∂F2 Qi = , ∂Pi (4.31) pi = K = H+ (4.32) ∂F2 ∂t (i = 1, . . . , n). Notiamo che bisogna imporre la condizione di non degenerazione det ∂ p/∂P = ∂2 F2 det ∂q ∂P 6 = 0. Invertendo la (4.31) otteniamo P = P ( q, p, t ) e, quindi, nella (4.32) Q in funzione (q, p, t). Facciamo ora alcuni esempi per sistemi a un grado di libertà: 5 Come in tutti gli altri casi, nell’analisi di un problema fisico, dopo aver effettuato la trasformazione canonica bisognerà esprimere anche H in funzione delle nuove coordinate canoniche Q e P. 67 formalismo hamiltoniano • F2 = qP; allora p = ∂F2 /∂q = P e Q = ∂F2 /∂P = q. Otteniamo cioè la trasformazione canonica identica, con K = H. • F2 = (q + αP)2 /2, con α > 0. Allora p = ∂F2 /∂q = q + αP =⇒ P = ( p − q)/α, mentre Q = ∂F2 /∂P = α(q + αP) = α(q + p − q) = αp. La trasformazione canonica è dunque (q, p) → (αp, ( p − q)/α), con K = H. Può accadere che siano scelte come variabili indipendenti p e Q. In tal caso ∂q q = q( p, Q, t), con la condizione det ∂Q 6= 0. Allora n F = F3 ( p, Q, t) + ∑ qi pi . (4.33) i =1 La funzione generatrice si dice in tal caso di tipo 3. La relazione (4.25) diventa per la (4.33) n n n i =1 i =1 n i dqi − ∑ Pi dQi − (H − K) dt = dF3 + ∑ qi dpi + ∑ p i dqi =⇒ ∑ p i =1 n n i =1 i =1 i =1 − ∑ qi dpi − ∑ Pi dQi − (H − K) dt = dF3 da cui ∂F3 , ∂pi ∂F3 Pi = − , ∂Qi ∂F3 K = H+ ∂t (4.34) qi = − (4.35) (i = 1, . . . , n). ∂q La condizione det ∂Q 6= 0 può pertanto essere scritta, in base alla (4.34) co2 ∂ F3 me det ∂p ∂Q (condizione di non degenerazione). Proponiamo alcuni esempi di funzioni generatrici siffatte sempre nel caso di sistemi a un grado di libertà: • F3 = − pQ. Allora q = −∂F3 /∂p = Q e P = −∂F2 /∂Q = p. In questo caso la trasformazione canonica è la trasformazione identica, cioè (q, p) → (q, p), con K = H. • F3 = − e p+Q . Allora q = −∂F3 /∂p = e p+Q > 0 =⇒ Q = ln q − p e P = −∂F2 /∂Q = e p+Q = q e p e− p = q. La trasformazione canonica è, allora, la seguente: (q, p) → (ln q − p, q), con q > 0 e K = H. Se sono scelte come variabili indipendenti p e P, abbiamo q = q( p, P, t) con la condizione det ∂q 6= 0 ∂P (4.36) e n n i =1 i =1 F = F4 ( p, P, t) + ∑ qi pi − ∑ Qi Pi . 68 (4.37) 4.6 trasformazioni canoniche La funzione generatrice è detta di tipo 4. La relazione (4.25) diventa per la (4.37): n n i dqi − ∑ P i dQi − (H − K) dt = ∑p i =1 n i =1 n n n = dF4 + ∑ qi dpi + ∑ p i dqi − ∑ Qi dPi − ∑ P i dQi =⇒ i =1 n n i =1 i =1 i =1 i =1 i = 1 − ∑ qi dpi + ∑ Qi dPi − (H − K) dt = dF4 da cui ∂F4 , ∂pi ∂F4 , Qi = ∂Pi ∂F4 K = H+ ∂t (4.38) qi = − (4.39) (i = 1, . . . , n). 2 ∂ F4 La condizione det ∂P 6= 0 può essere scritta in base alla (4.38) come det ∂P ∂p 6 = 0. Per esempio, se, per n = 1, F4 = pP, allora q = −∂F4 /∂p = − P ⇐⇒ P = −q e Q = ∂F4 /∂P = p. La trasformazione canonica è, pertanto, la seguente: (q, p) → ( p, −q), con K = H. Osserviamo, infine, che una funzione generatrice non deve essere necessariamente una dei quattro tipi per tutti i gradi di libertà. Si può usare una funzione generatrice che mescoli i quattro tipi. Così per n = 2 ∂q F = F23 (q1 , p2 ; P1 , Q2 ; t) − Q1 P1 + q2 p2 rappresenta una funzione generatrice di tipo 2 per il primo grado di libertà e di tipo 3 per il secondo. Accenniamo infine (senza dimostrazioni) a una bella proprietà riguardante le parentesi di Poisson e le trasformazioni canoniche.6 Sia data una trasformazione canonica: Q = Q(q, p, t) . (4.40) P = P (q, p, t) Se f ( Q, P, t) e g( Q, P, t) sono due variabili dinamiche, si può dimostrare che: { f ( Q, P, t), g( Q, P, t)}Q,P = = { f ( Q(q, p, t), P(q, p, t), t), g( Q(q, p, t), P(q, p, t), t)}q,p , ovvero le parentesi di Poisson sono invarianti per trasformazioni canoniche. In particolare abbiamo { Q j , Qk }Q,P = { Q j , Qk }q,p = 0 { Pj , Pk }Q,P = { Pj , Pk }q,p = 0 { Q j , Pk }Q,P = { Q j , Pk }q,p = δjk . (4.41a) (4.41b) (4.41c) 6 Per una dimostrazione di questa proprietà vedi Landau e Lifšits [11, pagina 211]. 69 formalismo hamiltoniano Inoltre si può far vedere che, se (q, p) sono coordinate canoniche, le trasformazioni (4.40) sono canoniche solo se sono soddisfatte le (4.41). In definitiva, assegnate le trasformazioni, il test basato sulle parentesi di Poisson è conclusivo per stabilire se esse sono canoniche senza passare per le funzioni generatrici o precisare specifici problemi fisici. Esempi 1. Si consideri un oscillatore armonico monodimensionale. Usando la funzione generatrice di tipo 1 1 mωq2 cot Q 2 con m, ω costanti positive, determinare la trasformazione canonica e integrare le equazioni del moto. F1 (q, Q) = Soluzione. Dalla funzione generatrice abbiamo: ∂F1 = mωq cot Q ∂q ∂F1 1 1 P=− = mωq2 2 . ∂Q 2 sin Q p= Ricaviamo q e p in funzione di Q e P: r 2P sin Q q= mω √ p = 2Pmω cos Q. Se k = mω 2 è la costante elastica, l’hamiltoniana rispetto alle usuali coordinate è: 1 p2 1 + mω 2 q2 , 2m 2 quindi nelle nuove coordinate: H= K( Q, P) = H(q( Q, P), p( Q, P)) = 1 2Pmω 1 2P cos2 Q + mω 2 sin2 Q = 2 m 2 mω = ωP. Dunque Q è una coordinate ciclica e il suo momento coniugato P è costante, inoltre l’energia coincide con l’hamiltoniana e quindi si conserva. Dall’equazione di Hamilton risulta: ∂K =ω ∂P e l’equazione del moto si riduce a Q̇ = Q = ωt + Q0 , dove Q0 è una costante di integrazione da determinare dalle condizioni iniziali. 70 4.6 trasformazioni canoniche 2. Data la trasformazione del secondo tipo a un grado di libertà 3/2 2√ P F2 (q, P) = 2am +q , 3 ma con m, a costanti positive, determinare le trasformazioni canoniche Q = Q(q, p), P = P(q, p). Scrivere l’hamiltoniana H(q, p) di una particella di massa m in moto unidimensionale con accelerazione costante a. Effettuare inoltre la trasformazione canonica su questa hamiltoniana: K( Q, P) = H(q( Q, P), p( Q, P)) e integrare le equazioni del moto. Soluzione. Dalla trasformazione abbiamo: 1/2 √ P ∂F2 p= = m 2a +q ∂q ma √ 1/2 ∂F2 P 2a Q= . = +q ∂P a ma Dividendo membro a membro: Q 1 p = =⇒ Q = p ma ma e, dalla prima equazione: P= p2 − maq. 2m Nel problema fisico proposto, l’hamiltoniana coincide con l’energia totale del sistema quindi: H= 1 p2 − maq = P. 2m La funzione generatrice della trasformazione non dipende esplicitamente dal tempo, pertanto K = H = P. Le equazioni di Hamilton sono allora: ∂K =1 ∂P ∂K Ṗ = = 0, ∂Q Q̇ = cioè P è costante, quindi anche l’energia del sistema si conserva. Si poteva giungere a questo risultato anche osservando che la coordinata Q è ciclica. Integrando la prima delle equazioni di Hamilton abbiamo Q ( t ) = t + Q0 = p(t) , ma dove Q0 è una costante di integrazione. Scegliendo l’origine dei tempi in modo che risulti Q0 = 0 abbiamo p(t) = mat. 71 formalismo hamiltoniano 3. Siano (q, p) le coordinate canoniche. La trasformazione Q=p P=q è canonica? Soluzione. Risulta { Q, P}q,p = { p, q}q,p = −1 quindi la trasformazione non è canonica. 4. Siano (q, p) le coordinate canoniche. Determinare se la trasformazione ( Q = 2q + p2 p P= 2 è canonica. Soluzione. Risulta: { Q, P}q,p = {2q + p2 , p/2}q,p = {2q, p/2} + { p2 , p/2} = {2q, p/2} = 2 = {q, p} = 1 2 dunque la trasformazione è canonica. Troviamo la funzione generatrice di tipo 2: ∂F2 = 2P p = ∂q Q = ∂F2 = 2q + 4P2 ∂P Integrando la prima equazione del sistema abbiamo: F2 = 2qP + g( P) dove g( P) è una costante di integrazione dipendente da P. Sostituendo nella seconda equazione ricaviamo: ∂F2 4 = 2q + g0 ( P) = 2q + 4P2 =⇒ g0 ( P) = 4P2 =⇒ g( P) = P3 + c, ∂P 3 in cui c è una costante di integrazione. Facendo in modo che risulti c = 0, la funzione generatrice diventa: 4 F2 = 2qP + P3 . 3 72 4.7 equazioni di hamilton-jacobi 5. Data la trasformazione Q = α ln p P = −q β p determinare per quali valori delle costanti α e β è canonica. Scrivere inoltre la funzione generatrice di tipo 1 associata. Soluzione. Affinché la trasformazione sia canonica deve risultare 1 = { Q, P}q,p = {α ln p, −q β p}q,p = = ∂α ln p ∂(−q β p) ∂α ln p ∂(−q β p) − = αβq β−1 . ∂q ∂p ∂p ∂q Poiché α e β sono costanti abbiamo β − 1 = 0 =⇒ β = 1 e quindi α = 1. La trasformazione è allora: Q = ln p P = −qp Troviamo la funzione generatrice di tipo 1: ∂F1 Q p = ∂q = e ∂F P = − 1 = −qp ∂Q Integrando la prima equazione si ottiene: F1 = q eQ + g( Q) con g( Q) costante di integrazione dipendente da Q. Sostituendo nella seconda abbiamo: ∂F1 = q eQ + g0 ( Q) = q eQ =⇒ g( Q) = c ∂Q dove c è una costante di integrazione. Posto c = 0 la funzione generatrice è: F1 = q eQ . 4.7 equazioni di hamilton-jacobi Abbiamo visto che nell’approccio hamiltoniano il moto di un sistema meccanico nello spazio delle fasi con n gradi di libertà è determinato dalla soluzione di 2n equazioni differenziali ordinarie del primo ordine rispetto al tempo, che coinvolgono 2n variabili dipendenti dal tempo (le coordinate canoniche) e una variabile indipendente (il tempo appunto). 73 formalismo hamiltoniano Vogliamo ora far vedere che lo stesso problema fisico può essere risolto in un modo completamente diverso: attraverso la determinazione di una funzione7 S(q1 , . . . , qn ; t) soluzione di un’equazione differenziale alle derivate parziali, contenente n + 1 derivate parziali del primo ordine rispetto a q1 , . . . , qn e a t. Supposta nota l’hamiltoniana del sistema in esame H(q, p, t), con q = (q1 , . . . , qn ) e p = ( p1 , . . . , pn ) coordinate canoniche, assumiamo che esista una trasformazione canonica Q = Q(q, p, t) e P = P (q, p, t) che dia luogo a una nuova hamiltoniana K nulla. In questo caso, per i = 1, . . . , n: ∂K =0 ∂Pi ∂K =0 Ṗi = − ∂Qi Q̇i = cioè Q e P sono costanti nel tempo. Se F è la funzione generatrice, abbiamo la condizione H(q, p, t) + ∂F = 0. ∂t (4.42) Se facciamo l’ipotesi che la funzione generatrice sia del secondo tipo, abbiamo che: pi = ∂F2 (q, P, t) ∂qi (i = 1, . . . , n). L’equazione (4.42) può essere pertanto riscritta: ∂F2 ∂F2 H q, ,t + = 0. ∂q ∂t (4.43) La (4.43) è nota come equazione di Hamilton-Jacobi ed è, per la funzione generatrice, un’equazione differenziale alle derivate parziali prime nelle n + 1 variabili (q1 , . . . , qn , t). F2 è, in letteratura, indicata usualmente col simbolo S. La funzione S è detta funzione principale di Hamilton. Supponiamo che esista una soluzione completa del tipo S = S(q1 , . . . , qn ; α1 , . . . , αn+1 ; t) dove α1 , . . . , αn+1 sono costanti di integrazione indipendenti. L’equazione di Hamilton-Jacobi non dà informazioni sui nuovi momenti Pi da cui dovrebbe dipendere S. Sappiamo che questi nuovi momenti sono tutti costanti. Osserviamo che nella (4.43) la funzione S non compare direttamente ma solo mediante le derivate parziali rispetto a qi e a t. Allora, se S è soluzione dell’equazione di Hamilton-Jacobi, anche S+costante è soluzione. Questa proprietà implica che una delle n + 1 costanti di integrazione deve comparire come costante additiva. Si può, allora, scegliere una soluzione completa che dipende da n costanti indipendenti, cioè: S = S ( q1 , . . . , q n ; α1 , . . . , α n ; t ). (4.44) Possiamo benissimo scegliere queste costanti esattamente uguali ai nuovi momenti: Pi = αi . Questa scelta non contraddice l’ipotesi iniziale che la funzione generatrice della trasformazione canonica sia di tipo 2 e quindi che p = p(q, P, t). Si 7 In realtà, come vedremo, S dipende in generale anche da n + 1 costanti arbitrarie 74 4.7 equazioni di hamilton-jacobi possono scegliere i nuovi momenti, essendo costanti, assegnando al tempo t = 0 q e p. In particolare, sappiamo che pi = ∂S (q; α; t) ∂qi (4.45) con α = (α1 , . . . , αn ); invertendo la (4.45) possiamo ottenere α al tempo t = 0 in funzione di q e p. Le nuove coordinate generalizzate sono date da: Qi = ∂S = βi ∂αi (costanti). (4.46) Le costanti β i possono essere calcolate conoscendo i valori al tempo t = 0 delle coordinate canoniche. Possiamo poi, invertendo le trasformazione canoniche, esprimere le vecchie coordinate canoniche (q, p) in funzione delle nuove ( β, α):8 q = q( β, α, t) (4.47) p = p( β, α, t) Queste relazioni ci dicono che possiamo ottenere, mediante una trasformazione canonica, le coordinate canoniche (q, p) in funzione del tempo, cioè di determinare il moto del sistema nello spazio delle fasi una volta che siano assegnate le condizioni iniziali. Le relazioni (4.47) ci danno, in altre parole, la soluzione delle equazioni di Hamilton, noti q(0) e p(0). Da un punto di vista matematico abbiamo ottenuto un’equivalenza tra un’equazione differenziale alle derivate parziali in n + 1 variabili del primo ordine e 2n equazioni differenziali ordinarie del primo ordine. Questa equivalenza può essere, nel nostro caso, imputata al fatto che sia l’equazione di Hamilton-Jacobi sia le equazioni di Hamilton derivano dal medesimo principio di Hamilton modificato. Possiamo ora cercare di comprendere il significato fisico della funzione generatrice del secondo tipo S. Osserviamo che, essendo α quantità costanti, dS(q, α, t) = dt ∂S ∑ ∂qi q̇i + i ∂S . ∂t (4.48) Se teniamo presenti le (4.45), la (4.48) diventa: dS(q, α, t) = dt ∑ pi q̇i + i ∂S = ∂t ∑ pi q̇i − H (4.49) i dove abbiamo tenuto conto della (4.42). Balza evidente dalla (4.49) e da quanto detto sul principio di Hamilton modificato che S rappresenti (a meno di costanti additive) l’azione. Vediamo un caso particolare.9 Supponiamo che H non dipenda esplicitamente dal tempo. Allora la funzione principale di Hamilton deve avere la seguente struttura: S(q, α, t) = W (q, α) − at (4.50) 8 β = ( β 1 , . . . , β n ), α = ( α1 , . . . , α n ). 9 Vi invito a leggere e a studiare anche gli esempi riportati in Goldstein, Poole e Safko [7, pagine 413418]. 75 formalismo hamiltoniano dove W (q, α) è detta funzione caratteristica di Hamilton. Osserviamo che pi = ∂S ∂W = . ∂qi ∂qi Allora dW = dt ∑ i ∂W q̇i = ∂qi ∑ pi q̇i i e quindi W= ∑ i 4.8 Z pi dqi . variabili angolo-azione nel caso unidimensionale Sia H(q, p) l’hamiltoniana nel nostro sistema a un solo grado di libertà, con (q, p) coordinate canoniche. Supponiamo che il sistema abbia un moto periodico e che esista una trasformazione canonica (indipendente dal tempo) (q, p) → (ψ, J ), indotta da una funzione generatrice di tipo 1 F1 (q, ψ) indipendente dal tempo, in modo tale che ψ sia ciclica.10 Ovviamente il nuovo momento coniugato J è una costante del moto e H = H( J ). Abbiamo, per la prima equazione di Hamilton, ψ̇ = ∂ H ( J )/∂J = ω (costante), da cui ψ(t) = ωt + ψ0 . Poiché, per ipotesi, il moto è periodico, le coordiante canoniche q e p saranno funzioni periodiche. Avremo come conseguenza che il moto deve essere periodico in ψ. Assumiamo che il periodo sia 2π. La nuova coordinata generalizzata ψ è detta variabile angolo, mentre J è detta variabile azione e assume il ruolo di momento angolare. Per quanto detto, F1 (q, ψ) deve essere periodica rispetto a ψ di periodo 2π: dF1 = ∂F1 ∂F1 dq + dψ = p dq − J dψ. ∂q ∂ψ Dopo un periodo, F1 torna al valore iniziale e ψ consegue una variazione di 2π. 0= I dF1 = I p dq − J Z 2π 0 dψ = I 1 p dq − 2π J =⇒ J = 2π I p dq. Questa relazione può essere presa proprio come definizione della variabile azione. 4.8.1 Esempio: l’oscillatore armonico unidimensionale L’oscillatore armonico unidimensionale ha hamiltoniana H= 1 2 1 2 p + kq , 2m 2 10 Ricordiamo che l’hamiltoniana non cambia, cioè K = H. 76 4.8 variabili angolo-azione nel caso unidimensionale dove m è la massa della particella e k > 0 è una costante. Possiamo porre ω 2 = k/m e riscrivere l’hamiltoniana: 1 2 1 2 2 p + ω mq = E. 2m 2 H= E, l’energia totale, è costante e il suo valore è fissato dalle condizioni iniziali. Pertanto: q p = 2mE − m2 ω 2 q2 F1 (q, ψ) = = Z Per calcolare I = √ dF1 = Z q Z p dq − J Z dψ = 2mE − m2 ω 2 q2 dq − J Rp Z dψ. 2mE − m2 ω 2 q2 dq, poniamo sin θ = p m/(2E)ωq. Allora Z r Z E mω 2 q2 2E sin 2θ 2 cos θ dθ = I = 2mE 1− dq = θ+ , 2E ω ω 2 p dove ovviamente θ = arcsin( m/(2E)ωq). Osserviamo che in questi casi abbiamo J= 1 2π I p dq = E , ω cioè E = Jω. In base poi al calcolo di I possiamo scrivere esplicitamente F1 (q, ψ) in funzione di θ e ψ, cioè: E sin 2θ F1 = θ+ − Jψ. ω 2 Poiché F1 deve essere una funzione periodica, Eθ/ω − Jψ = J (θ − ψ) = 0 cioè θ = ψ. In base a quest’ultimo risultato, E sin ψ cos ψ. ω p Poiché sin θ = sin ψ = m/(2E)ωq, F1 = E= mω 2 q2 sin ψ e, in definitiva, F1 (q, ψ) = 1 mωq2 cot ψ. 2 77 formalismo hamiltoniano Allora p= ∂F1 = mωq cot ψ ∂q J=− ∂F1 1 ωq2 = m 2 ∂ψ 2 sin ψ 1 = mωq2 (1 + cot2 ψ) 2 1 p2 E 1 = . = mωq2 + 2 2 mω ω In conclusione ψ = arccot p mωq 2 1 J = mωq2 + 1 p 2 2 mω 78 . R I F E R I M E N T I B I B L I O G R A F I C I D E L L A PA R T E I [1] Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli argomenti del corso. [2] Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma: Editori Riuniti, 2010 (citato a pagina 129). [3] Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri, 2007 (citato a pagina 112). [4] Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976. [5] Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli, 1993 (citato alle pagine 127, 135). [6] Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002. [7] Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna: Zanichelli, 2005 (citato alle pagine 59, 75). [8] David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica moderna. Milano: CEA, 2002. [9] Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100). [10] Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995. [11] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69). [12] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004. [13] P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg, Maryland 20899: National Institute of Standards and Technology, 25 ott. 2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a pagina 139). [14] Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000. [15] Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996. [16] Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973. 79 Parte II R E L AT I V I TÀ R I S T R E T TA E I N T R O D U Z I O N E A L L A MECCANICA QUANTISTICA 5 R E L AT I V I TÀ S P E C I A L E Avvertenza! In questo capitolo indicheremo i tensori in neretto, v, mentre i vettori saranno indicati secondo la notazione ~v. 5.1 trasformazioni di lorentz 5.1.1 Premessa Le equazioni di Maxwell, che hanno permesso di unificare sia i campi elettrici e magnetici sia l’ottica geometrica, non sono invarianti per trasformazioni di Galileo. Premettiamo due semplici considerazioni. • Nelle equazioni compare esplicitamente la velocità di propagazione dei se√ gnali elettromagnetici: c = 1/ ε 0 µ0 . Secondo il principio di relatività di Galileo passando da un sistema di riferimento inerziale a un altro le velocità si sommano come vettori, dunque la velocità di un segnale luminoso dipende dal sistema di riferimento inerziale e sarà diversa al cambiare del sistema. La spiegazione che si dette sulla comparsa del modulo della velocità di un segnale elettromagnetico nelle equazioni si basò sull’esistenza di un mezzo (estremamente rigido e rarefatto) le cui deformazioni dovrebbero corrispondere ai campi elettromagnetici. Il mezzo come sappiamo fu chiamato etere e si pose il problema di individuare il sistema di riferimento a esso solidale. Le equazioni di Maxwell, così come formulate, dovevano essere valide in tale sistema di riferimento. • La presenza di asimmetrie in alcuni fenomeni elettromagnetici, quando si passa da un sistema di riferimento inerziale a un altro, non trova una spiegazione nell’ambito della teoria della relatività di Galileo. Per esempio, una carica puntiforme q ferma in un sistema di riferimento inerziale genera un campo elettrostatico, ma la stessa carica per un altro sistema di riferimento inerziale è in moto e genera anche un campo magnetico. Inoltre l’esperimento di Michelson e Morley dimostrò, senza ombra di dubbio, che l’etere non esiste e che la velocità della luce (nel vuoto) non dipende dalla velocità della sorgente. 5.1.2 Concetto di evento L’idea che è alla base della teoria della relatività è di decomporre tutto ciò che accade in eventi. Un evento rappresenta la minima determinazione possibile, individuata dall’assegnazione di tre coordinate spaziali e una temporale. In altre 83 relatività speciale parole, un evento è un qualcosa che accade in un dato punto dello spazio in un particolare istante di tempo. Se abbiamo un sistema di assi cartesiani Oxyz, un evento è una quaterna di numeri ( x, y, z, t). Tutto ciò che accade deve ammettere una descrizione in termini di relazioni o coincidenze tra eventi. L’insieme degli eventi costituisce lo spaziotempo. 5.1.3 Principio di inerzia Postuliamo l’esistenza di una particolare classe di sistemi di riferimento, rispetto a ognuno dei quali tutti i punti materiali isolati o sono fermi o si muovono con velocità vettoriale costante. Questi sistemi di riferimento sono detti, come ben sappiamo, inerziali. Dobbiamo altresì assumere (per misurare lunghezze e intervalli di tempo) che si abbia una classe di regoli rigidi ideali e una classe di orologi ideali. Due regoli ideali hanno la proprietà di essere della medesima lunghezza se sono in quiete, indipendentemente dalla loro storia passata. Analogamente, due orologi ideali battono il tempo nello stesso modo se sono in quiete, a prescindere dalla loro storia passata. Noi supporremo che in ogni luogo di un sistema di riferimento vi sia un orologio in quiete. Il grosso problema è quello di sincronizzare tutti questi orologi ideali. Un modo per sincronizzare due orologi, uno posto in A e l’altro posto in B 6≡ A, solidali con il nostro sistema di riferimento inerziale, può essere il seguente: lanciamo da A verso B un segnale elettromagnetico (supposta nota la velocità della luce1 ), sincronizziamo l’orologio in B con quello in A tenendo conto della distanza tra A e B e del tempo impiegato dal segnale a raggiungere B. Noi affrontiamo lo studio della cosiddetta Relatività Ristretta o Speciale, che si occupa del rapporto esistente fra la descrizione dei fenomeni fisici compiute da osservatori solidali con sistemi di riferimento inerziali. La Relatività Generale avrà lo scopo di estendere lo studio a osservatori non inerziali. 5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz Oltre al principio d’inerzia, alla base della relatività ristretta vi sono due postulati: Primo postulato: principio di relatività - Le leggi della Fisica sono le stesse in tutti i riferimenti inerziali. Secondo postulato: costanza della velocità della luce - La velocità della luce nel vuoto assume lo stesso valore, indipendentemente dalla direzione, in tutti i sistemi di riferimento inerziali. Vediamo, ora, come ottenere le trasformazioni di Lorentz utilizzando i postulati della relatività ristretta, supponendo che il tempo sia omogeneo e che lo spazio sia omogeneo e isotropo. Supponiamo di avere due sistemi di riferimento inerziali 1 Per misurare la velocità del segnale può essere usato un solo orologio, sempre che il percorso seguito dal segnale sia chiuso. 84 5.1 trasformazioni di lorentz y0 y S S0 ~v O O0 x ≡ x0 z0 z Figura 5.1: Rappresentazione dei sistemi di riferimento in esame. S(Oxyz) e S0 (O0 x 0 y0 z0 ), il quale si muove rispetto al primo con velocità costante v diretta lungo la direzione positiva delle x in modo che x ≡ x 0 (vedi figura 5.1). Un evento è caratterizzato in S dalle coordinate spaziotemporali ( x, y, z, t). Lo stesso evento avrà in S0 coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ). Cerchiamo le relazioni 0 x = x 0 ( x, y, z, t) 0 y = y0 ( x, y, z, t) z0 = z0 ( x, y, z, t) 0 t = t0 ( x, y, z, t) (5.1) sulla base dei due postulati. Supponiamo che si sia proceduto a sincronizzare gli orologi in ognuno dei due sistemi di riferimento inerziali e che quando O0 ≡ O, t = t0 = 0 (è il modo più semplice di sincronizzare due orologi,2 uno solidale con S, l’altro solidale con S0 ). Osserviamo che poiché lo spazio è isotropo abbiamo potuto scegliere, assolutamente in generalità, i due sistemi inerziali come precisato sopra. Una prima osservazione: l’ipotesi di omogeneità dello spazio e del tempo richiede che le (5.1) siano lineari. Altre osservazioni: 1. Poiché continuamente l’asse x coincide con l’asse x 0 , o in modo equivalente y=0 ⇐⇒ z=0 y0 = 0 , z0 = 0 y0 e z0 sono espressi mediante una combinazione lineare di y e z. 2. Il piano x − y (caratterizzato dall’equazione z = 0) si deve trasformare nel piano x 0 − y0 (cioè z0 = 0); analogamente il piano x − z (caratterizzato dall’equazione y = 0) si deve trasformare nel piano x 0 − z0 (cioè y0 = 0). Allora y0 dev’essere proporzionale solo a y e z0 deve essere proporzionale solo a z. 2 Non è assolutamente detto che due orologi, uno solidale con S e l’altro con S0 , battano il tempo allo stesso modo. 85 relatività speciale 3. Si può far vedere che un’asta posta lungo l’asse y solidale con S deve avere la stessa lunghezza in S0 ; ciò comporta che y0 = y. Analogamente si prova che z0 = z. 4. Per ragioni di simmetria t0 non può dipendere linearmente né da y né da z. Altrimenti, per esempio, due orologi, fermi in S, uno posto sull’asse delle y in y = +1 e l’altro posto sullo stesso asse in y = −1, sarebbero in disaccordo osservati da S0 . Questo fatto sarebbe in contrasto con l’ipotesi di isotropia dello spazio. 5. Poiché il punto O0 e ogni altro punto del piano y0 − z0 ha rispetto a S equazione oraria x = vt, allora x 0 , nella trasformazione cercata, deve essere proporzionale a x − vt. Le considerazioni precedenti portano a dire che le trasformazioni (5.1) devono essere, in particolare, del tipo: x 0 = γ(v)( x − vt), (5.2a) 0 (5.2b) 0 (5.2c) 0 (5.2d) y = y, z = z, t = a(v) x + b(v)t. con le condizioni iniziali γ(0) = b(0) = 1 e a(0) = 0. Il nostro scopo è ora quello di determinare le costanti γ, a e b utilizzando il secondo postulato della relatività. Supponiamo che, quando O ≡ O0 , cioè al tempo t = t0 = 0, un’onda elettromagnetica sferica venga emessa da O ≡ O0 . In base al secondo postulato della relatività l’onda elettromagnetica si propaga in tutte le direzioni con velocità c (velocità della luce nel vuoto) sia in S sia in S0 . Consideriamo allora un punto del fronte d’onda ( x, y, z) al tempo t in S. Le coordinate spaziotemporali ( x, y, z, t), che definiscono l’evento in S, dovranno soddisfare la seguente relazione: x 2 + y2 + z2 = c2 t2 . (5.3) Lo stesso evento in S0 avrà coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ), che, per quanto detto, dovranno essere legate dalla relazione: x 02 + y 02 + z 02 = c 2 t 02 . (5.4) Ponendo le (5.2) nella (5.4), otteniamo: γ2 ( x − vt)2 + y2 + z2 = c2 ( ax + bt)2 (γ2 − c2 a2 ) x2 + y2 + z2 − 2xt(γ2 v + c2 ab) = (c2 b2 − γ2 v2 )t2 . (5.5) La relazione (5.5) deve coincidere con la (5.3) per ogni x, y, z, t. Si ha, allora, 2 2 2 γ − c a = 1 (5.6) γ2 v + c2 ab = 0 . 2 2 c b − γ2 v2 = c2 86 5.1 trasformazioni di lorentz Tenendo presente che se v = 0, b = 1 dalle (5.6) otteniamo: 1 γ= √ 1 − v2 /c2 v . a = − 2γ c b = γ (5.7) In conclusione le trasformazioni di Lorentz sono le seguenti: x 0 = γ( x − vt), (5.8a) y0 = y, (5.8b) 0 (5.8c) z = z, v t0 = γ t − 2 x , c (5.8d) con γ= √ 1 1 − v2 /c2 . (5.9) Dalle (5.8) è facile ricavare le trasformazioni inverse x = γ( x 0 + vt0 ), (5.10a) 0 (5.10b) 0 (5.10c) y=y, z=z, v t = γ t0 + 2 x 0 . c (5.10d) Notiamo che se v c, allora γ ≈ 1 e inoltre dalle (5.10) si riottengono le trasformazioni di Galileo. Siano ( x, y, z, t) le coordinate spaziotemporali in S di un evento e siano ( x 0 , y0 , z0 , t0 ) le coordinate spaziotemporali in S0 dello stesso evento. Notiamo che: v 2 c2 t02 − x 02 − y02 − z02 = c2 γ2 t − 2 x − γ2 ( x − vt)2 − y2 − z2 = c 2 2 2 = c t − x − y2 − z2 . Allora c2 t2 − x2 − y2 − z2 (che, come vedremo tra poco, può essere riguardato come la distanza al quadrato nello spaziotempo fra il nostro evento e l’evento di coordinate (0, 0, 0, 0)) è una quantità scalare invariante per trasformazioni di Lorentz. Poniamo x0 = ct e sinh χ = √ v/c2 2 = βγ, con β = v/c. Si ha ovviamente 1−v /c q 2 cosh χ = 1 + sinh χ = γ. Allora le trasformazioni di Lorentz (relativamente alle due coordinate che cambiano) posson essere scritte anche nel modo seguente: x00 = x0 cosh χ − x sinh χ, x 0 = x cosh χ − x0 sinh χ. (5.11a) (5.11b) 87 relatività speciale Da queste relazioni si evidenzia una certa analogia con le rotazioni in due dimensioni: x 0 = x cos θ − y sin θ, y0 = x sin θ + y cos θ. Questa analogia si estende al fatto che, mentre le rotazioni conservano le lunghezze x2 + y2 , le (5.11) conservano la quantità x02 − x2 , che, come abbiamo accennato, rappresenta ancora una “distanza al quadrato” nello spaziotempo. Le trasformazioni di Lorentz, come si evince dalla (5.11), possono allora esere considerate come “rotazioni generalizzate” nello spaziotempo. Supponiamo di avere un evento A definito da ( x A , y A , z A , t A ) e un evento B definito da ( x B , y B , z B , t B ) nel sistema di riferimento inerziale S. Possiamo definire il quadrato della distanza tra i due eventi nel modo seguente: ∆s2 = c2 (t B − t A )2 − ( x B − x A )2 − (y B − y A )2 − (z B − z A )2 = c2 ∆t2 − ∆x2 − ∆y2 − ∆z2 (5.12) dove, ovviamente, ∆t2 rappresenta l’intervallo temporale tra i due eventi al quadrato e ∆x2 + ∆y2 + ∆z2 l’intervallo spaziale al quadrato. Nel sistema S0 la distanza al quadrato tra i due eventi è data da ∆s02 = c2 ∆t02 − ∆x 02 − ∆y02 − ∆z02 , con ∆t0 = t0B − t0A , ∆x 0 = x 0B − x 0A , ∆y0 = y0B − y0A , ∆z0 = z0B − z0A . Si può agevolmente dimostrare che ∆s2 = ∆s02 . Possiamo riscrivere la (5.12) in forma differenziale ds2 = c2 dt2 − dx2 − dy2 − dz2 . Il fatto che le coordinate spaziali e quelle temporali abbiano segni opposti nella definizione di distanza al quadrato tra due eventi è una caratteristica dello spaziotempo. Osserviamo che per un segnale luminoso ds2 = 0. Se una particella si muove con velocità inferiore alla velocità della luce, si ha ds2 > 0 e, quindi ds è reale. In tal caso si dice che l’intervallo è di genere tempo. Se invece ds2 < 0 l’intervallo è detto di genere spazio. Gli intervalli per i quali ds2 = 0 si dicono di tipo luce. Tardioni si dicono i punti materiali che si muovono con velocità inferiore a quella della luce, tachioni i corpi (immaginari) che si muovono con velocità superiore a quella della luce. I corpi che si muovono alla velocità della luce si dicono di tipo luce. Osserviamo che due eventi separati da un intervallo di tipo tempo non possono mai essere simultanei, cioè non esiste un sistema di riferimento in cui tali eventi risultino simultanei. Invece è possibile trovare un sistema di riferimento in cui i due eventi si verifichino nello stesso luogo, cioè l’intervallo spaziale tra i due eventi sia nullo. In relazione a un determinato sistema di riferimento inerziale S, possiamo rappresentare gli eventi associando agli assi cartesiani x, y, z un quarto asse, quello del tempo. Per facilitare la visualizzazione consideriamo un solo asse spaziale, quello delle x (figura 5.2). Gli assi x e ct sono assunti ortogonali; si tratta di una 88 5.1 trasformazioni di lorentz ct a c Futuro assoluto Altrove π 4 O Altrove x Passato assoluto d b tempo futuro io spaz no iperpeiasente r p osservatore spa zio tempo passato Figura 5.2: Diagramma di Minkowski: a sinistra considerando una sola dimensione spaziale, a destra considerate due dimensioni spaziali. scelta di pura convenienza. Fatta questa scelta, in un altro sistema di riferimento inerziale S0 , che si muove rispetto a S con velocità costante diretta lungo la direzione positiva dell’asse x, x 0 e ct0 non sono più ortogonali. Il punto O rappresenta l’evento (0, 0). Il moto rettilineo uniforme di una particella con velocità V < c, passante per x = 0 al tempo t = 0, è rappresentato da una retta passante per O e formante con l’asse ct un angolo inferiore a π/4. Le due rette limite rappresentano la propagazione di segnali che viaggiano alla velocità della luce. All’interno della regione (cono) aOc abbiamo c2 t2 − x2 > 0, cioè l’intervallo tra l’evento ( x, t) e l’evento (0, 0) è di tipo tempo. In tale regione t > 0, cioè ogni evento ha luogo dopo l’evento O. Poiché due eventi, separati da un intervallo di tipo tempo, non possono mai essere simultanei in alcun riferimento inerziale, non è possibile scegliere un sistema di riferimento in cui un arbitrario evento, posto all’interno della regione aOc, abbia luogo prima di O, cioè avvenga al tempo t < 0. Tutti gli eventi all’interno di aOc sono, allora, posteriori a O, fanno cioè parte della regione del futuro assoluto (la quale, nel caso si consideri più di una dimensione spaziale, è un cono o un ipercono, detto appunto cono del futuro). Nello stesso modo si può far vedere che ogni evento posto in dOb avviene prima dell’evento O, e questo è vero in qualunque riferimento inerziale. La regione dOb 89 relatività speciale è detta appunto del passato assoluto (cono del passato). Sottolineiamo che gli eventi posti nel passato e nel futuro possono essere messi in relazione causale con l’evento O. Gli eventi all’interno delle regioni aOd e cOb sono separati dall’evento O da un intervallo di tipo spazio. Se D è un evento in tali regioni, si può sempre trovare un riferimento inerziale in cui D e O sono simultanei, anche se non possono mai avvenire nello stesso luogo per alcun riferimento. Esistono sistemi di riferimento in cui D avviene prima di O e altri in cui avviene dopo. La regione tra il cono del futuro e il cono del passato è indicata come il presente di O (o anche come l’altrove assoluto di O, perché, come abbiamo detto, in nessun sistema di riferimento un evento, che appartiene a questa regione, e l’evento O possono verificarsi nello stesso luogo). Gli eventi posti lungo le bisettrici appartengono al cono-luce e sono connessi per l’appunto all’evento O da segnali luminosi. Riassumendo in relatività • il futuro è individuato dagli eventi che soddisfano la relazione ct > | x |; • il presente è individuato dagli eventi che soddisfano la relazione |ct| < | x |; • il passato è individuato dagli eventi che soddisfano la relazione −ct > | x |. Notiamo che nell’ambito della fisica non relativistica (o newtoniana) rispetto a O • il futuro si ha per t > 0; • il presente si ha per t = 0; • il passato si ha per t < 0. Infine osserviamo che il ragionamento svolto per l’evento O si può ripetere per ogni altro evento. Questo vuol dire che a ogni evento possiamo associare un cono del futuro e un cono del passato. 5.2 alcune conseguenze delle trasformazioni di lorentz 5.2.1 Legge di trasformazione delle velocità Tra le conseguenze principali delle trasformazioni di Lorentz vi è una diversa legge di trasformazione della velocità rispetto a quella prevista dalle trasformazioni galileiane. Dovremo, ovviamente, ritrovare che la velocità della luce (nel vuoto) è un invariante relativistico, cioè ha lo stesso valore in tutti i sistemi di riferimento inerziali. Consideriamo i sistemi di riferimento inerziali S ed S0 già visti. Le componenti3 del vettore velocità di una particella rispetto a S sono: Vx = dx (t) dt Vy = dy(t) dt Vz = dz(t) . dt 3 Supponiamo assegnata in S la legge oraria della particella ( x (t), y(t), z(t)) e la corrispondente legge oraria in S0 ( x 0 (t0 ), y0 (t0 ), z0 (t0 )). 90 5.2 alcune conseguenze delle trasformazioni di lorentz Le corrispondenti componenti rispetto a S0 saranno Vx0 = dx 0 (t0 ) dt0 Vy0 = dy0 (t0 ) dt0 Vz0 = dz0 (t0 ) . dt0 Dalle trasformazioni di Lorentz si ottiene: dx = γ(dx 0 + v dt0 ) = γ(Vx0 + v) dt0 , dy = dy0 = Vy0 dt0 , dz = dz0 = Vz0 dt0 , v v dt = γ dt0 + 2 dx 0 = γ 1 + 2 Vx0 dt0 . c c Da queste relazioni ricaviamo: Vx = dx V0 + v = x v 0, dt 1 + c2 Vx (5.13a) Vy0 1 dy = , Vy = dt γ 1 + cv2 Vx0 (5.13b) Vz = (5.13c) dz Vz0 1 . = dt γ 1 + cv2 Vx0 Osserviamo che se c → +∞, allora γ = 1 (o anche se v/c 1, allora γ ≈ 1) e Vx = Vx0 + v Vy = Vy0 Vz = Vz0 . cioè otteniamo la trasformazione galileiana della velocità. Facilmente si ottiene dalle (5.13) la trasformazione inversa: Vx − v , 1 − cv2 Vx Vy 1 Vy0 = , γ 1 − cv2 Vx 1 Vz Vz0 = . γ 1 − cv2 Vx Vx0 = (5.14a) (5.14b) (5.14c) p √ Ricordiamo che γ = 1/ 1 − v2 /c2 = 1/ 1 − β2 , dove β = v/c. Osserviamo che lim γ( β) = 1, β → 0+ lim γ( β) = +∞. β → 1− Se Vy0 = Vz0 = 0 e Vx0 = V 0 , allora dalle (5.13) otteniamo Vx = V = V0 + v , 1 + cv2 V 0 Vy = 0, Vz = 0. (5.15) Se V 0 = c (velocità della luce nel vuoto) allora dalla precedente si ha V = c. Inoltre sempre dalla precedente se 0 < V 0 < c, allora 0 < V < c (e viceversa).4 4 Noi supponiamo che v ∈ (0, c). 91 relatività speciale 8 7 6 γ 5 4 3 2 1 0 0 0.2 0.4 0.6 0.8 1 β Figura 5.3: Andamento del fattore di Lorentz γ in funzione di β. Esercizio 2 2 2 Dimostrare che, se v0 x + v0 y + v0 z = c2 , allora v2x + v2y + v2z = c2 e viceversa. 5.2.2 Contrazione delle lunghezze Si chiama lunghezza propria di un’asta la sua lunghezza in un sistema di riferimento in cui è in quiete. Supponiamo di avere un’asta rigida in quiete in S e posta lungo l’asse x. Se le sue estremità sono nei punti di coordinata x1 e x2 > x1 , la sua lunghezza propria è ovviamente data da: l0 = x 2 − x 1 . Per misurare la lunghezza dell’asta nel sistema di riferimento S0 , che si muove rispetto a S con una velocità v diretta lungo la direzione positiva dell’asse x, basta avere le coordinate degli estremi dell’asta nello stesso istante di tempo e dunque valutare gli eventi ( x10 , t10 ) e ( x20 , t20 ) con t10 = t20 . I due eventi sono simultanei in S0 ma non in S. Naturalmente, per misurare la lunghezza propria in S possiamo determinare gli estremi dell’asta in tempi diversi e abitrari. Sappiamo che x = γ( x 0 + vt0 ) e, quindi, x1 = γ( x10 + vt10 ) x2 = γ( x20 + vt10 ) =⇒ x2 − x1 = γ( x20 − x10 ). Chiamata l = x20 − x10 la lunghezza dell’asta in S0 , avremo allora r v2 l0 = γl ⇐⇒ l = 1 − 2 l0 < l0 . c 92 (5.16) 5.2 alcune conseguenze delle trasformazioni di lorentz Il sistema S0 , che è in moto rispetto all’asta, misura, pertanto, una lunghezza minore della lunghezza propria dell’asta. Questo fenomeno è noto come contrazione delle lunghezze. Esercizio La lunghezza dell’asta rispetto al sistema di riferimento S0 può essere determinata considerando i suoi estremi nella stessa posizione in tempi diversi? In caso affermativo, qual è la relazione tra questa lunghezza dell’asta e la sua lunghezza a riposo? 5.2.3 Dilatazione dei tempi La dilatazione dei tempi è una delle conseguenze più straordinarie della relatività ristretta. Consideriamo due sistemi di riferimento inerziali S e S0 come in figura 5.1 e supponiamo che un orologio, a riposo nel sistema di riferimento inerziale S0 , misuri in uno stesso punto dello spazio x00 un intervallo temporale tra due eventi A : ( x00 , t0A ) e B : ( x00 , t0B ), con t0B > t0A . L’intervallo temporale tra i due eventi ∆τ = t0B − t0A è detto tempo proprio. La loro distanza è ovviamente di tipo tempo. Nel sistema S i due eventi A e B hanno le seguenti coordinate spaziotemporali: x A = γ( x00 + vt0A ), v t A = γ t0A + 2 x00 , c x B = γ( x00 + vt0B ), v t B = γ t0B + 2 x00 . c Allora ∆t = t B − t A = γ∆τ > ∆τ, (5.17) cioè l’intervallo di tempo tra i due eventi, misurato in S, risulta maggiore dell’intervallo di tempo proprio. Questo risultato ci dice che l’orologio mobile rispetto a S ha una frequenza minore. Possiamo, in altre parole, affermare che la frequenza di un orologio mobile rallenta rispetto a quella di un orologio fermo. Notiamo che in S0 i due eventi avvengono nello stesso luogo e il loro intervallo temporale è misurato da un solo orologio posto in quel punto (intervallo di tempo proprio), mentre nell’altro sistema di riferimento S i due eventi si verificano in punti diversi dello spazio e occorrono due orologi per misurare il loro intervallo di tempo (non proprio). Vediamo di capire meglio con un esempio. Supponiamo che in S0 una sorgente luminosa posta nell’origine emetta al tempo t0 = 0 un raggio di luce in direzione dell’asse y0 e che uno specchio, posto a distanza L, rifletta il raggio di luce facendolo tornare in O0 (figura 5.4a). Ovviamente avremo ∆τ = 2L/c. Questo è il tempo complessivo che il raggio di luce impiega per tornare in O0 nel sistema S0 . L’intervallo di tempo trovato è, naturalmente, proprio. Vediamo ora quale ragionamento fa il sistema S, supponendo che al tempo t = t0 = 0 (quando viene emesso il raggio di luce) O ≡ O0 . Lo specchio è solidale con S0 che si muove con velocità v nella direzione positiva dell’asse delle x. Il raggio luminoso avrà in S 93 relatività speciale y y0 S S0 c∆t 2 L L O O0 x (a) 0 M R x (b) Figura 5.4: La traiettoria di un raggio luminoso riflesso da uno specchio in due sistemi di riferimento inerziali in moto relativo. una traiettoria come quella in figura 5.4b. Il sistema S ha bisogno di due orologi, uno in O l’altro in R (ovviamente sincronizzati) per valutare l’intervallo temporale ∆t, che il raggio luminoso impiega per tornare sull’asse delle x. Tenendo presente la figura 5.4b si ottiene facilmente: c∆t 2 2 = v∆t 2 2 + L2 , c2 ∆t2 = v2 ∆t2 + 4L2 , 2L/c = γ∆τ. ∆t = √ 1 − v2 /c2 Ritroviamo, cioè, nell’esempio specifico, la formula (5.17) relativa alla dilatazione dei tempi. 5.3 lo spazio di minkowski In maniera molto sintetica possiamo dire che lo spazio vettoriale di Minkowski, M, è lo spaziotempo. Un punto di tale spazio è, come abbiamo già avuto modo di dire, un evento. Le coordinate di un punto-evento, in un sistema di riferimento S, possono essere definite come ( x0 , x1 , x2 , x3 ) = (ct, x, y, z) (notare che tutte le componenti hanno le dimensioni di una lunghezza). Le coordinate x µ (µ = 0, 1, 2, 3),5 con la conven- 5 Da qui in poi, nello spazio di Minkowski, useremo la convenzione che gli indici greci (α, β, . . . , µ, ν, . . . ) assumono valori 0, 1, 2, 3, invece gli indici latini (i, j, k, . . . ) assumeranno i valori 1, 2, 3. 94 5.3 lo spazio di minkowski zione dell’indice in alto, sono dette controvarianti e si trasformano passando da un sistema S a uno S0 nel solito modo: x 00 = γ( x0 − βx1 ), x 01 = γ( x1 − βx0 ), (5.18) x 02 = x 2 , x 03 = x 3 . Le precedenti possono essere scritte anche in forma matriciale, adoperando la notazione di Einstein: µ x 0µ = Λν x ν (5.19) dove γ − βγ − βγ γ µ Λ = (Λν ) = 0 0 0 0 0 0 1 0 0 0 . 0 1 Il punto evento { x µ } è anche detto quadrivettore controvariante perché obbedisce µ alle (5.19). Ricordiamo che in Λν si indica l’elemento alla µ-esima riga e ν-esima colonna. Abbiamo già visto che la distanza al quadrato tra l’evento { x µ } e l’evento O(0, 0, 0, 0) è definita come s2 = ( x0 )2 − ( x1 )2 − ( x2 )2 − ( x3 )2 . Tale quantità, come ben sappiamo, è un invariante relativistico: assume lo stesso valore in tutti i riferimenti inerziali. Se introduciamo la seguente matrice, detta tensore metrico covariante 1 0 0 0 0 −1 0 0 g = ( gµν ) = 0 0 −1 0 . 0 0 0 −1 allora s2 = gµν x µ x ν (con la convenzione degli indici ripetuti). Tramite il tensore metrico gµν viene introdotta una distanza al quadrato s2 tra l’evento { x µ } e l’evento O(0, 0, 0, 0), la quale è una forma quadratica maggiore, uguale o minore di 0. Lo spazio di Minkowski viene dotato di una metrica pseudoeuclidea. Notiamo che la quantità gµν x µ x ν può essere riguardata anche come un prodotto scalare, con l’avvertenza che gµν x µ x ν = 0 ; x µ = 0 per µ = 0, 1, 2, 3. Il nostro tensore metrico è come si vede lo stesso in ogni punto dello spazio di Minkowski, proprietà che non sarà valida in relatività generale. Possiamo introdurre le coordinate covarianti di un punto evento xµ = gµν x ν (5.20) 95 relatività speciale cioè ( x0 , x1 , x2 , x3 ) = ( x0 , − x1 , − x2 , − x3 ). Allora s2 = gµν x µ x ν = xν x ν . Dalle relazioni (5.18) si ottiene facilmente: x00 = γ( x0 + βx1 ), x10 = γ( x1 + βx0 ), x20 = x2 , (5.21) x30 = x3 . Queste relazioni possono essere scritte in forma matriciale nel modo seguente: xµ0 = (Λ−1 )νµ xν (5.22) dove γ βγ 0 0 βγ γ 0 0 . = 0 0 1 0 0 0 0 1 Λ −1 Si dice che { xµ } è un quadrivettore covariante se obbedisce alle (5.22). Il tensore metrico controvariante è definito nel modo seguente: ( gµν ) = g −1 . Osserviamo che in M abbiamo g = g −1 . Chiaramente vale la relazione: gµν gνλ = δµλ . (simbolo di Kronecker) Se con ∆x µ indichiamo la variazione tra le coordinate omologhe controvarianti di due eventi, la distanza al quadrato tra questi due eventi è naturalmente data da: ∆s2 = gµν ∆x µ ∆x ν . Possiamo dare una versione infinitesima della metrica se prendiamo due eventi “molto vicini tra loro”: ds2 = gµν dx µ dx ν = dxν dx ν . Questa forma quadratica differenziale dà ovviamente la metrica6 di M. Notiamo µ che dalla (5.19) dx 0µ = Λν dx ν ed essendo dx 0µ = ∂x 0µ dx ν ∂x ν si ha: µ Λν = ∂x 0µ . ∂x ν Una quaterna ( A0 , A1 , A2 , A3 ) si dice che è un quadrivettore controvariante se ogni componente Aµ si trasforma per effetto di una trasformazione di Lorentz µ x 0µ = Λν x ν nel modo seguente: µ A0µ = Λν Aν 6 Prendendo la forma quadratica differenziale per definire la metrica includiamo anche il caso in cui il tensore metrico dipende dal punto. 96 5.3 lo spazio di minkowski cioè nello stesso modo delle coordinate controvarianti di un punto evento. Osserviamo che, se Aν = Aν ( x),7 allora A 0 ν = A 0 ν ( x 0 ). Un quadrivettore covariante { Aµ } è un insieme di quattro quantità ( A0 , A1 , A2 , A3 ) che, per effetto di una trasformazione di Lorentz, si trasformano come le coordinate covarianti di un punto evento: A0µ = Aν (Λ−1 )νµ . Osserviamo che possiamo ottenere Aµ moltiplicando il corrispondente quadrivettore controvariante per il tensore metrico covariante, ovvero: Aµ = gµν Aν . Inversamente si ha Aµ = gµν Aν , dove gµν è il tensore metrico controvariante. Un quadritensore di rango n completamente controvariante ha la forma T µ1 ,...,µn e si trasforma nel modo seguente: T 0µ1 ,...,µn = Λν11 Λν22 · · · Λνnn T ν1 ,...,νn . µ µ µ Un quadritensore di rango n completamente covariante ha la forma Tµ1 ,...,µn e si trasforma nel modo seguente: Tµ0 1 ,...,µn = Tν1 ,...,νn (Λ−1 )νµ11 (Λ−1 )µν22 · · · (Λ−1 )νµnn . Un quadritensore di rango n p volte controvariante e q volte covariante ha la forma µ ,...,µ Tν11,...,νq p e si trasforma nel modo seguente: 0µ ,...,µ µ σ λ ,...,λ p 1 Tν1 ,...,ν = Λλ11 · · · Λλpp (Λ−1 )σν11 · · · (Λ−1 )νqq Tσ11,...,σq p . q µ Osserviamo che: • un quadritensore di rango 1 è un quadrivettore; • un quadritensore di rango 0 è uno scalare ed è invariante per trasformazioni di Lorentz (è detto anche scalare di Lorentz). I quadritensori di rango 2, che hanno, ovviamente, 16 componenti, si trasformano nel modo seguente: µ • tensori completamente controvarianti: T 0µν = Λα Λνβ T αβ ; β 0 = ( Λ −1 ) α ( Λ −1 ) T ; • tensori completamente covarianti: Tµν ν αβ µ 7 Con x intendiamo ( x0 , x1 , x2 , x3 ). 97 relatività speciale 0µ µ β • tensori misti: Tν = Λα (Λ−1 )ν Tβα . In generale si dice che il tensore metrico covariante abbassa gli indici, il tensore metrico controvariante li innalza. Un quadritensore di rango 2 T µν si dice simmetrico se T µν = T νµ ; si dice antisimmetrico se T µν = − T νµ . Un generico quadritensore può essere sempre scomposto in una parte simmetrica e una antiµν simmetrica. Infatti Ts = ( T µν + T νµ ) /2 è un quadritensore simmetrico, mentre µν µν µν Ta = ( T µν − T νµ ) /2 è antisimmetrico; infine T µν = Ta + Ts . Il prodotto scalare tra due quadrivettori A = { Aµ } e B = { Bν } è definito come A · B = gµν Aµ Bν = A0 B0 − A1 B1 − A2 B2 − A3 B3 . Il modulo quadro A · A = A2 di un quadrivettore A è un invariante relativistico. Un quadrivettore A = { Aµ } si dice di tipo tempo se A · A > 0, di tipo spazio se A · A < 0, di tipo luce se A · A = 0. Esercizi 1. Dimostrare che, se S( x ) è uno scalare di Lorentz ed è di classe opportuna, allora ∂S( x )/∂x µ è un quadrivettore covariante, mentre ∂S( x )/∂xµ è un quadrivettore controvariante. µ ,...,µ 2. Dimostrare che, se Tν11,...,νq p ( x ) è un tensore p volte controvariante e q volte µ ,...,µ covariante (di classe opportuna) allora ∂Tν11,...,νq p ( x )/∂x α è un tensore p volte µ ,...,µ controvariante e q + 1 volte covariante, mentre ∂Tν11,...,νq p ( x )/∂xα è un tensore p + 1 volte controvariante e q volte covariante. 3. Dimostrare che gµν è un tensore covariante di rango 2. 4. Dimostrare che gµν è un tensore controvariante di rango 2. 5.4 quadrivelocità e quadriaccelerazione Nella meccanica newtoniana se il moto di una particella è descritto dalla legge oraria ~r = ~r (t) (di classe opportuna), la velocità è definita come ~v(t) = d~r (t)/dt. In relatività ristretta il tempo è una componente di un quadrivettore e non uno scalare di Lorentz. Poiché è utile scrivere le equazioni della fisica in modo tale che risultino manifestamente valide in ogni sistema di riferimento inerziale (formulazione covariante delle leggi della fisica), conviene parametrizzare il moto di una particella massiva, nello spazio di Minkowski, rispetto a una grandezza che sia uno scalare di Lorentz. La scelta naturale è l’invariante s, definito da ds2 = gµν dx µ dx ν , che può essere chiamato cammino proprio. Avremo allora, in M, la cosiddetta linea d’universo x µ = x µ (s), che non è altro che una curva (successione di eventi propri della particella in moto). Se, come abbiamo detto, la particella ha massa, allora ds2 = c2 (1 − v2 /c2 ) dt2 > 0 essendo |v(t)| < c la velocità del- 98 5.4 quadrivelocità e quadriaccelerazione la particella al tempo8 t. Possiamo scrivere, indicato con τ il tempo proprio e assumendo la convenzione che s sia crescente al variare del tempo: r v2 ds = 1 − 2 c dt = c dτ. c Il quadrivettore velocità (o semplicemente quadrivelocità) controvariante di una particella massiva, il cui moto in M è descritto dalla linea d’universo x µ = x µ (s), è definito come9 dx µ dx µ dx µ = =γ (5.23) uµ = ds c dτ c dt dove 1 γ= √ 1 − v2 /c2 è il fattore di Lorentz della particella, non di un sistema di riferimento. Chiaramente u = {uµ } è un quadrivettore controvariante perché si trasforma come µ u0µ = Λν uν . Osserviamo che: • le componenti della quadrivelocità sono v vy vz x u = γ, γ, γ, γ ; c c c • sussiste la relazione µ ν u · u = gµν u u = γ 2 v2 1− 2 c = 1. (5.24) Definiamo la quadriaccelerazione controvariante come: duµ d2 x µ . = ds ds2 In base alla (5.24) otteniamo wµ = duν = 0 ⇐⇒ gµν uµ wν = 0 ⇐⇒ u · w = 0. ds Ovvero quadrivelocità e quadriaccelerazione sono ortogonali. gµν uµ Esercizio Dimostrare che le componenti della quadriaccelerazione sono γ4 ~v ·~a, c3 γ2 γ2 wi = 2 ai + 2 (~v ·~a)vi c c w0 = con i = 1, 2, 3, ( a1 , a2 , a3 ) = ( a x , ay , az ) e (v1 , v2 , v3 ) = (v x , vy , vz ). 8 Nel caso di una particella di massa nulla o di un raggio luminoso, poiché ds2 = 0 occorre introdurre un parametro scalare diverso dal tempo proprio. 9 Alcuni definiscono la quadrivelocità come uµ = cdx µ /ds. In tal caso uµ ha le dimensioni di una velocità, mentre nel nostro caso è adimensionale. 99 relatività speciale 5.5 dinamica relativistica Si può facilmente constatare che in relatività ristretta, a causa della legge di composizione delle velocità, se il momento di una particella avente massa a riposo m0 è definito come ~p = m0~v, allora la conservazione del momento di sistemi di particelle isolati non è più valida in ogni sistema di riferimento inerziale.10 Se richiediamo che la conservazione del momento in sistemi isolati sia una legge della Fisica, bisogna allora definire in relatività il momento come: ~p = √ dove m0 1 − v2 /c2 m(v) = √ ~v = m(v)~v (5.25) = γm0 (5.26) m0 1 − v2 /c2 può essere riguardata come la massa relativistica della particella. Osserviamo che se v/c 1, allora m(v) ≈ m0 e ~p ≈ m0~v, come in meccanica newtoniana. Studi sperimentali hanno mostrato che la ii legge della dinamica continua ancora a valere, cioè nel caso di una particella: d~p ~ =F dt (5.27) dove ~p è il momento relativistico ed ~F è la forza totale agente sulla particella. La (5.27), in base alla (5.25), può essere scritta come dm0 γ(v)~v ~ = F. dt (5.28) Se v/c 1 si ottiene la relazione non relativistica. Due osservazioni sulla (5.28): 1. se il modulo della velocità della particella aumenta e si approssima a c, il termine γ tende a smorzare tale incremento; 2. se richiediamo che la (5.28) sia una legge della Fisica, quando si passa da un sistema di riferimento inerziale a un altro, a differenza di quanto avviene nella meccanica newtoniana, la forza ~F deve cambiare esattamente come cambia dm0 γ~v/dt. Dalla (5.28) otteniamo m0 γ~a + m0 dγ ~v = ~F dt (5.29) dove ~a = d~v/dt è l’ordinaria accelerazione. Poiché dγ/dt = γ3~v ·~a/c2 , la (5.29) diventa m0 γ~a + m0 γ3 (~v ·~a)~v = ~F. c2 10 Vedi Kittel, Knight e Ruderman [9, pagine 411–416]. 100 (5.30) 5.6 energia cinetica e momenti Moltiplicando scalarmente per ~v ambo i membri della precedente si ha: γ3 m0 γ~v ·~a + m0 2 v2 (~v ·~a) = ~F · ~v c γ2 m0 γ(~v ·~a) 1 + 2 v2 = ~F · ~v c 3 m0 γ ~v ·~a = ~F · ~v (5.31) essendo 1 + γ2 v2 /c2 = γ2 . Inserendo la (5.31) nella (5.30) otteniamo: ~v = ~F c2 ! ~F · ~v ~F − ~v . c2 m0 γ~a + (~F · ~v) m0~a = 1 γ (5.32) Notiamo che se ~F, ~v,~a sono vettori paralleli, allora la (5.32) diventa m0 γ3~a = ~F (basta tener conto che in questo caso ~F − (~F · ~v)~v/c2 = ~F/γ2 ). 5.6 energia cinetica e momenti Sia ~F la forza totale agente su una particella di massa a riposo m0 . Vogliamo ora vedere come determinare l’energia cinetica della particella. L’idea è di partire, in analogia a quanto avviene in meccanica newtoniana, dalla relazione dT = ~F · d~r, cioè la variazione infinitesima di energia cinetica, dT, è supposta uguale al lavoro elementare della forza totale. Teniamo presente che ~F · d~r = ~F · ~v dt = m0 γ3~v ·~a dt in base alla (5.31). Possiamo pertanto scrivere dT = m0 γ3~v ·~a dt = m0 γ3~v · d~v = Poiché 1 2 R v2 0 T= √ 1 m0 γ3 dv2 . 2 γ3 (v0 ) dv02 = c2 γ − c2 , abbiamo m0 c2 1 − v2 /c2 − m0 c2 (5.33) (notare che nel ricavare la precedente abbiamo supposto nulla la velocità iniziale). Per v/c 1, allora 4 1 v 2 T = m0 v + O , 2 c4 cioè ritroviamo, al secondo ordine, il valore non relativistico dell’energia cinetica. Dalle (5.33) si deduce che l’energia non è proporzionale a v2 (come nel caso non relativistico) e inoltre che limv→c− T = +∞. Si definisce energia totale della particella la quantità: E = T + m0 c2 = m0 c2 γ. 101 relatività speciale Il termine m0 c2 è detto energia a riposo della particella (cioè, se v = 0, E = m0 c2 ) e rappresenta una novità sorprendente ed eccezionale rispetto al caso non relativistico. Esso, in qualche modo, stabilisce un’equivalenza tra massa ed energia e asserisce che la massa può essere convertita in energia e viceversa l’energia in massa. Questa equivalenza non ha riscontro alcuno nella fisica newtoniana. Osserviamo che in relatività non vale la conservazione della massa. In un processo fisico, cui prendono parte diverse particelle, ciò che si conserva non è la massa totale ma l’energia totale. Notiamo per inciso che dE/dt = ~F · ~v. Poiché m0 c2 ha le dimensioni di un’energia, la massa a riposo può essere misurata in eV/c2 . Tra l’energia e il momento di una particella libera esiste una relazione particolare. Infatti m20 c4 γ2 E2 2 − p = − m20 v2 γ2 = m20 c2 . c2 c2 (5.34) Questa relazione può essere riscritta come E2 = p2 c2 + m20 c4 (5.35) da cui11 E= q p2 c2 + m20 c4 . (5.36) Osserviamo che la (5.36) prende il posto della relazione non relativistica E = p2 /(2m0 ) (intendendo qui con E l’energia cinetica della particella libera). La (5.35) ha enorme importanza in quanto, come vedremo fra poco, la quantità E2 − c2 p2 è un invariante relativistico (scalare di Lorentz). Dalla (5.34) si vede subito che il momento può essere misurato in eV/c e suoi multipli. Una particolarità notevole della relatività è la possibilità di considerare particelle con massa nulla. Infatti dalla (5.35) deduciamo che se m0 = 0 E = pc. (5.37) Ovviamente le espressioni E = m0 c2 γ e ~p = m0~vγ in cui compare la massa perdono di significato per una particella di massa nulla. Se m0 = 0 l’energia rimane finita senza annullarsi, in quanto v = c. Notiamo che bisogna fare il doppio limite m0 → 0+ e v → c− : ciò rende finita e non nulla l’energia. Stesso discorso vale per il momento. Sottolineiamo che, nel caso di particelle con massa nulla, vale certamente la (5.37), che stabilisce un preciso legame tra energia e momento. In natura esistono, effettivamente, particelle di massa nulla, come per esempio i fotoni. In base alla relazione di Planck-Einstein, l’energia di un fotone di frequenza ν è data da E = hν (5.38) 11 Nello scrivere la (5.36) abbiamo considerato solo la soluzione positiva e scartato quella negativa. Si può far vedere nell’ambito della fisica classica che non vi sono motivi per ammettere stati di energia negativi. Discorso diverso va fatto per la meccanica quantistica, dove non è possibile ignorare, a priori, stati di energia negativa. 102 5.7 quadrimomento, tensore momento angolare dove h = 6.626 · 10−34 J · s è la costante di Planck e ha le dimensioni di un’azione. Se indichiamo con ω = 2πν la pulsazione della radiazione, la (5.38) può scriversi come E = hω/(2π ) = }ω. Allora il momento di un fotone di frequenza ν è dato da p= E hν h ω = = = } = }k c c λ c dove λ è la lunghezza d’onda della radiazione e k = ω/c è il numero d’onda. 5.7 quadrimomento, tensore momento angolare La relazione (5.35) ci induce a pensare che energia e momento di una particella possano essere componenti di uno stesso quadrivettore. Effettivamente è così; infatti il quadrivettore (controvariante) pµ = m0 cuµ (5.39) dove m0 è la massa a riposo della particella e uµ la sua quadrivelocità, ha come componenti E , c p2 = m0 γvy ≡ py , p0 = m0 γc ≡ p1 = m0 γv x ≡ p x , p3 = m0 γvz ≡ pz . Il quadrivettore definito dalla (5.39) è, allora, detto quadrimomento. Si ha come conseguenza che gµν pµ pν = E2 /c2 − p2 = m20 c2 è certamente un invariante relativistico, come avevamo annunciato. Inoltre passando dal sistema di riferimento inerziale S al sistema S0 le componenti del quadrimomento si trasformano nel modo seguente: 00 p = γ( p0 − βp1 ) 01 p = γ( p1 − βp0 ) . (5.40) p 02 = p 2 03 p = p3 Le precedenti possono essere scritte in termini di E, p x , py , pz come: 0 E E =γ − βp x c c E 0 . px = γ px − β c p0y = py 0 pz = pz Nel caso in cui m0 = 0 (particella di massa nulla) si ha gµν pµ pν = 0: il quadrimomento è ovviamente di tipo luce. Possiamo definire il tensore del momento angolare (controvariante di rango 2 e antisimmetrico) come Lµν = x µ pν − x ν pµ . (5.41) 103 relatività speciale µ µ Notiamo che L0µν = x 0µ p0ν − x 0ν p0µ = Λα Λνβ ( x α p β − x β pα ) = Λα Λνβ Lαβ . Si verifica facilmente che, detto ~L = ~r × ~p l’ordinario vettore momento angolare rispetto all’origine degli assi cartesiani ortogonali, L12 = Lz , L31 = Ly , L23 = L x . 5.8 equazioni del moto Nel caso di una particella libera di massa m0 sappiamo che d~p/dt = ~0 e dE/dt = 0, dove ~p = m0 γ~v e E = m0 c2 γ. Poiché le componenti del quadrimomento sono date da p = ( E/c, ~p) è evidente che le precedenti equivalgono alla condizione dp = 0. ds (5.42) La (5.42) costituisce, allora, l’equazione covariante del moto di una particella libera e può essere anche scritta, tenendo presente che pµ = m0 cuµ = m0 cdx µ /ds come d2 x µ = 0. ds2 Questa è la forma covariante dell’equazione di una particella libera e corrisponde all’espressione non covariante d2~r/dt2 = 0. Se la particella non è libera, ma soggetta a interazioni, la derivata rispetto a s del quadrimomento è diversa da zero, in generale. Possiamo definire come quadriforza il quadrivettore controvariante: F= dp . ds (5.43) La (5.43) può essere scritta in modo equivalente: m0 c du = m0 cw = F. ds Questa equazione, detta di Minkowski, rappresenta l’equazione del moto della particella in forma covariante. Le componenti della quadriforza F sono γ dE γ d~p , . F= c2 dt c dt Dal momento che ~F = d~p/dt e dE/dt = ~F · ~v, le componenti della quadriforza possono essere scritte anche come: γ γ F = 2 ~F · ~v, ~F . c c Come conseguenza dell’ortogonalità tra quadrivelocità e quadriaccelerazione abbiamo che la quadrivelocità è ortogonale alla quadriforza, cioè F · u = 0. Possiamo anche definire il momento relativistico della quadriforza come il tensore controvariante di rango 2 antisimmetrico N µν = x µ F ν − x ν F µ . Si verifica immediatamente che dLµν = N µν . ds 104 5.9 meccanica analitica relativistica (cenni) 5.9 meccanica analitica relativistica (cenni) Si può enunciare anche in meccanica relativistica il principio variazionale di Hamilton, dal quale poi ricavare le equazioni del moto delle particelle materiali. Consideriamo, prima, il caso di una particella materiale libera. Come possiamo esprimere l’azione? Ovviamente dobbiamo richiedere che l’integrale, che esprime l’azione, sia invariante per trasformazioni di Lorentz e, quindi, sia uno scalare di Lorentz. Per una particella libera viene naturale pensare, come scalare di Lorentz, all’intervallo infinitesimo ds o più in generale ad α ds con α costante. L’idea, allora, è di considerare l’azione data da: S=α Z b a ds (5.44) dove a e b rappresentano due punti eventi dello spazio di Minkowski M. Come già sappiamo, devono essere considerati tutti i moti ammissibili (linee d’universo) che partono dall’evento a e giungono all’evento b. Il moto reale è ottenuto imponendo δS = 0 fra tutte le linee d’universo ammissibili. Per determinare, poi, la costante α dobbiamo richiedere che nell’approssimazione non relativistica la (5.44) diventi, a meno di costanti additive, uguale all’azione di una particella non relativistica libera di massa nota. √ Se ora teniamo conto che per una particella materiale ds = c 1 − v2 /c2 dt, la (5.44) può essere scritta S[ x (t), y(t), z(t)] = αc Z t1 r t0 1− v2 dt , c2 (5.45) dove v2 (t) = ẋ2 (t) + ẏ2 (t) + ż2 (t). Dalla (5.45) si deduce che la lagrangiana è data da: r v2 L = αc 1 − 2 . (5.46) c Se procediamo esattamente come nel caso non relativistico, per il principio variazionale di Hamilton abbiamo: d ∂L ~ =0 dt ∂~v (5.47) perché L non dipende esplicitamente da ~x = ( x, y, z). Dalle relazioni (5.46) e (5.47) si ottiene: ∂L αc vx = −√ = costante ∂v x 1 − v2 /c2 c2 vy αc ∂L = −√ = costante ∂vy 1 − v2 /c2 c2 ∂L αc vz = −√ = costante ∂vz 1 − v2 /c2 c2 105 relatività speciale quindi 2 2 α v2 √ ~v = α = costante c 1 − v2 /c2 c2 1 − v2 /c2 da cui discende che v2 è una quantità costante. Inoltre dalla (5.47) abbiamo anche d ∂L d = dt ∂~v dt ~v α − √ c 1 − v2 /c2 = ~0 quindi d~v ~ = 0 ⇐⇒ ~v(t) = costante, dt cioè il moto della particella libera che rende stazionaria l’azione è quello rettilineo uniforme. Sia m0 la massa a riposo della particella. La sua lagrangiana è data dalla (5.46). Per v/c 1 questa diventa: 1 v2 L = αc − αc 2 + O 2 c v4 c4 , dove αc è una costante che non influenza le equazioni del moto. Nel caso non relativistico invece (a meno di costanti additive): L= 1 m0 v2 . 2 Per il principio di corrispondenza queste due espressioni devono essere uguali, quindi trascurando i termini di ordine superiore a v4 /c4 e la costante additiva αc abbiamo α = −m0 c. In conclusione la lagrangiana della particella relativistica di massa m0 è data da: r v2 2 L = − m0 c 1 − 2 . c Il momento della particella è definito come ~p = ∂L m0~v =√ ∂~v 1 − v2 /c2 (esattamente il valore che, come abbiamo detto, permette che la conservazione del momento di sistemi isolati sia una legge della Fisica). Notiamo, solo per inciso, che nel caso esaminato (particella libera) d~p/dt = 0. Possiamo chiamare energia la quantità: E = ~p · ~v − L = √ 106 m0 c2 1 − v2 /c2 = m0 c2 γ 5.9 meccanica analitica relativistica (cenni) (esattamente il valore ottenuto per altra via). Poiché L non dipende esplicitamente dal tempo, l’energia è una costante del moto (vedi (5.47)). Osserviamo che ~p = E~v/c2 e che E2 − p2 c2 = m20 c4 . L’hamiltoniana è data da q H = c p2 + m20 c2 . Se v/c 1, H ≈ m0 c2 + p2 /(2m0 ). Possiamo anche enunciare il principio variazionale con il formalismo quadridimensionale Z b Z bq Z bq S = − m0 c ds = −m0 c dx µ dxµ = −m0 c gµν dx µ dx ν . a a a In maniera analoga a quanto fatto nel capitolo 2, poniamo x µ (ε) = x µ + εη µ e µ S[ x (ε)] = −m0 c Z bq a gµν dx µ (ε) dx ν (ε). Per una particella libera: µ Z b q µ dx µ (ε) dx ν (ε) − q dx µ dx ν gµν gµν S[ x (ε)] − S[ x ] = −m0 c a Z b q q (5.48) µ µ µ ν ν ν gµν (dx + ε dη )(dx + ε dη ) − gµν dx dx . = − m0 c a Sviluppando la funzione integranda in serie di potenze di ε intorno a 0 il primo termine è nullo, per il secondo risulta: ∂q µ µ ν ν gµν (dx + ε dη )(dx + ε dη ) = ∂ε ε =0 µ µ ν ν ν µ 1 gµν (dx + ε dη ) dη + gµν (dx + ε dη ) dη q = = 2 gµν (dx µ + ε dη µ )(dx ν + ε dη ν ) ε =0 gµν (dx µ + ε dη µ ) dη ν gµν dx µ dη ν p = q = = gµν dx µ dx ν gµν (dx µ + ε dη µ )(dx ν + ε dη ν ) dx µ dηµ = . ds Dalla (5.23) abbiamo dx µ = uµ ds, quindi ε =0 dx µ dηµ uµ ds dηµ = = uµ dηµ . ds ds Allora la (5.48) diventa δS = S[ x µ (ε)] − S[ x µ ] = Z b ∂q µ µ ν ν = −m0 cε gµν (dx + ε dη )(dx + ε dη ) + O(ε2 ) = a ∂ε ε =0 = −m0 cε Z b a uµ dηµ 107 relatività speciale con la condizione ηµ | a = ηµ |b = 0 affinché il moto sia ammissibile. Poiché, integrando per parti Z b a µ u dηµ = Z b a µ d( u ηµ ) − Z b a µ du ηµ = − Z b a µ du ηµ = − Z b duµ a ds dsηµ risulta δS = m0 cε Z b duµ a ds dsηµ . Ponendo εηµ = δxµ l’equazione precedente può essere scritta nella forma δS = m0 c Z b duµ a ds δxµ ds e dalla condizione δS = 0 deriva che duµ /ds = 0 (forma covariante del moto di una particella), cioè la quadriaccelerazione è nulla. 5.9.1 Carica in moto in un campo elettromagnetico Vogliamo ora scrivere, sempre con il formalismo quadridimensionale, l’azione di una particella di massa m0 e carica q in un campo elettromagnetico. Abbiamo visto a suo tempo che il potenziale generalizzato del campo elettromagnetico è dato da q~ V = qϕ − A · ~v c ~ Ora noti il potenziale scalare ϕ e il potenziale vettore A. V dt = q q~ q ϕ(c dt) − A · d~r = Aµ dxµ c c c ~ ) è ipotizzadove xµ è la coordinata covariante di un punto evento e A = ( ϕ, A to essere un quadrivettore controvariante, il quadripotenziale. Assumiamo che la carica sia uno scalare di Lorentz. Allora Z b q S=− m0 c ds + Aν dxν , (5.49) c a δS = S[ x µ (ε)] − S[ x µ ] = Z b q q =− m0 c dx µ (ε) dxµ (ε) − m0 c dx µ dxµ + (5.50) a − Z q b c a Aν ( xµ (ε)) dxν (ε) − Aν ( xµ ) dxν . Il primo integrale si calcola come visto nel caso della particella libera, per il secondo integrale abbiamo, sviluppando in serie di potenze di ε: Aν ( xµ (ε)) dxν (ε) − Aν ( xµ ) dxν = Aν ( xµ + εηµ ) d( xν + εην ) − Aν ( xµ ) dxν = ∂Aν = ε Aν ( xµ ) dην + ηµ dxν + O ε2 . ∂xµ 108 5.9 meccanica analitica relativistica (cenni) Inoltre, con la solita condizione ην | a = ην |b = 0 risulta: Z b ∂Aν ν ηµ dxν = ε A ( xµ ) dην + ∂xµ a Z b ∂Aν ν ν =ε ηµ dxν = d( A ( xµ )ην ) − dA ( xµ )ην + ∂xµ a Z b ∂Aν ν =ε ηµ dxν = − dA ( xµ )ην + ∂xµ a Z b ∂Aν ∂Aν dxµ ην + ηµ dxν = =ε − ∂xµ ∂xµ a Z b µ ∂Aν ∂A ηµ dxν + ηµ dxν . =ε − ∂xν ∂xµ a Nell’ultima uguaglianza abbiamo potuto invertire gli indici µ e ν del primo termine poiché si tratta di una somma su µ e ν. Dunque, ponendo εηµ = δxµ , la (5.50) diventa Z b duµ q ∂Aµ q ∂Aν δS = m0 c dsδxµ + δxµ dxν − δxµ dxν = ds c ∂xν c ∂xµ a Z b q ∂Aν ∂Aµ dxν duµ − − dsδxµ = = m0 c ds c ∂xµ ∂xν ds a Z b duµ q ∂Aν ∂Aµ = m0 c − − uν dsδxµ . ds c ∂xµ ∂xν a In definitiva abbiamo duµ q δS = 0 =⇒ m0 c = ds c ∂Aµ ∂Aν − ∂xµ ∂xν uν = q µν F uν . c (5.51) dove F µν = ∂ Aν /∂xµ − ∂ Aµ /∂xν , detto tensore elettromagnetico, è un quadritensore controvariante di rango 2 antisimmetrico. La (5.51) rappresenta la forma controvariante della equazione del moto di una particella di massa m0 e carica q in un campo elettromagnetico. Esplicitando si vede che 0 − Ex − Ey − Ez Ex 0 − Bz By . F = Ey Bz 0 − Bx Ez − By Bx 0 Si può dimostrare che E2 − B2 e ~E · ~B sono invarianti per trasformazioni di Lorentz. Si può altresì far vedere che F è invariante per trasformazioni di gauge. La gauge di Lorentz è ∂Aµ = 0. ∂x µ L’azione (5.49) può essere scritta nel formalismo ordinario: ! r Z b 2 v q ~ · ~v dt. S= −m0 c2 1 − 2 − qϕ + A (5.52) c c a 109 relatività speciale La funzione sotto il segno di integrale è, naturalmente, la lagrangiana: r v2 q~ 2 L = −m0 c 1 − 2 − qϕ + A · ~v. c c (5.53) Il momento generalizzato ~ P è dato da q~ ~P = ∂L = √ m0~v + A = ~p + 2 2 ∂~v c 1 − v /c q~ A c ~ da cui ~p = ~ P − q A/c. Ora H = ~v · da cui r H= ∂L m0 c2 q ~ 2 −L = √ + qϕ =⇒ (H − qϕ)2 = m20 c4 + c2 ~P − A ∂~v c 1 − v2 /c2 q ~ 2 P− A m20 c4 + c2 ~ + qϕ c che è l’hamiltoniana di una particella con massa a riposo m0 e carica q in un ~ campo elettromagnetico con potenziale scalare ϕ e potenziale vettore A. 5.10 *l’interferometro di michelson e morley L’elettromagnetismo prerelativistico superava in modo piuttosto goffo la presenza della costante c nelle equazioni dei campi elettrico e magnetico ipotizzando l’esistenza di un mezzo, l’etere, che permeasse l’intero universo e rispetto al quale la luce si muoveva appunto con velocità c. L’etere era pensato come un mezzo del tutto singolare, sottile e capace di permeare completamente il cosmo, dotato dell’unica proprietà di essere il mezzo attraverso il quale la radiazione si propagava. Per avere una qualche stima della velocità della Terra rispetto a tale mezzo Albert Abraham Michelson, singolarmente nel 1881 e poi assieme a Edward Morley nel 1887, mise a punto un esperimento in cui si intendeva rilevare il “vento d’etere” mediante tecniche interferometriche. Il dispositivo messo a punto dai due sperimentatori è schematizzato in figura 5.5 ed era montato su una lastra di pietra fatta galleggiare su mercurio liquido: questo permetteva di mantenere la lastra orizzontale e di farla girare attorno a un perno centrale. Supponiamo ora che la Terra si muova rispetto all’etere con velocità v. Il fascio luminoso che parte dalla sorgente S viene scomposto dallo specchio semiargentato in due raggi normali tra loro; il raggio 1 si propaga verso lo specchio R1 , viene da questo riflesso, subisce una deviazione di π/2 a causa dello specchio semiargentato e perviene al cannocchiale C; il raggio 2 invece si dirige verso lo specchio R2 e dopo la riflesione attraversa pressocché indisturbato lo specchietto semiargentato per poi giungere anch’esso nel cannocchiale. Ciò che si dovrebbe osservare nel cannocchiale è una serie di frange di interferenza dovute al fatto che il tratto AR1 dovrebbe essere percorso dalla luce in un arco di tempo diverso rispetto al tratto AR2 , a causa della composizione delle velocità che consegue dalla 110 5.10 *l’interferometro di michelson e morley presenza del mezzo luminifero. La differenza di fase tra i due raggi nel momento in cui si ricongiungono in A genera l’interferenza. Il tempo impiegato dal raggio 1 per percorrere AR1 (andata e ritorno) è T1 = 1 L1 L 2L . + 1 = 1 c+v c−v c 1 − v2 /c2 (5.54) Per il raggio 2 bisognerà tener conto del fatto che, nel sistema dell’etere, la luce si propaga sempre e comunque a velocità c. Dunque la velocità vy con cui viene per√ corsa la distanza deve soddisfare la relazione c2 = v2y + v2 , ovvero vy = c2 − v2 . Di conseguenza T2 = 2 L2 L2 1 =2 √ . vy c 1 − v2 /c2 (5.55) La differenza tra i tempi è dunque 2 L2 L1 √ ∆T = T2 − T1 = − . c 1 − v2 /c2 1 − v2 /c2 (5.56) Se ora ruotiamo di π/2 l’intero apparato, la relazione che si trova (essendo i bracci invertiti) è 2 L1 L2 0 ∆T = −√ . (5.57) c 1 − v2 /c2 1 − v2 /c2 Perciò L1 + L2 ∆T − ∆T = 2 c 0 1 1 √ − 1 − v2 /c2 1 − v2 /c2 . (5.58) Sviluppando in potenze di v/c e ignorando termini di ordine superiore al secondo, otteniamo che ∆T 0 − ∆T ≈ v2 L1 + L2 . c3 (5.59) Dunque ruotando lo strumento dovrebbe osservarsi uno spostamento di ∆n = v2 λc L1 c+3 L2 frange attraverso il centro del cannocchiale. Il dispositivo di Michelson e Morley aveva L1 = L2 = 11 m, mentre la lunghezza d’onda della luce usata era λ = 5.5 · 10−7 m. All’epoca dell’esperimento si riteneva che il Sole fosse essenzialmente solidale con il riferimento dell’etere, mentre la Terra orbitava con una velocità di v = 30 000 m/s (che dunque era in modulo proprio la v dell’esperimento esaminato). Si disponeva inoltre di varie stime della velocità della luce e tutte suggerivano che la luce avesse una velocità c ≈ 3 · 108 m/s. Dunque si ricava v/c ≈ 10−4 . Da questi dati si ricava uno spostamento teorico di ∆n = 0.4 frange. Nel secondo esperimento Michelson e Morley riuscirono a rendere lo strumento sensibile a uno spostamento di appena 0.01 frange. L’esperimento, nato per dare una stima di v, fu un fallimento, in quanto non venne osservato alcuno spostamento dell’entità prevista e dunque il “vento d’etere” non fu rilevato. 111 relatività speciale Figura 5.5: Schema dell’interferometro di Michelson e Morley. Ovviamente, alla luce dei risultati di Einstein, questo risultato si spiega immediatamente, poiché la velocità della luce è la medesima in tutte le direzioni in ogni sistema di riferimento. Lo sfasamento, assunta vera questa ipotesi, non poteva che essere nullo. L’esperimento ebbe, soprattutto negli anni seguenti, grande risonanza tra i fisici in quanto fu una delle prove sperimentali più lucide dell’infondatezza della teoria dell’etere, perlomeno come elaborata nel secolo XIX. Tuttavia occorre sottolineare che l’esperimento non è di per sé una prova della teoria di Einstein; in effetti, come poi si vide con esperimenti analoghi eseguiti con interferometri a bracci disuguali, l’esperimento permetteva di concludere semplicemente che la velocità della luce lungo percorsi diversi non dipende dalla velocita del sistema inerziale in esame rispetto a un qualsiasi altro sistema inerziale, e dunque non vi erano sistemi di riferimento privilegiati. La costanza della velocità della luce di per sé non è un risultato dell’esperimento in quanto non abbiamo informazioni sulla differenza di velocità della radiazione tra andata e ritorno. Basti pensare che si possono ricavare trasformazioni differenti da quelle di Lorentz che spieghino correttamente l’esperimento.12 L’ipotesi che l’esperimento abbia spinto Einstein a formulare i suoi postulati nella precisa forma in cui li conosciamo sembra dunque infondata sia da un punto di vista logico che storico.13 Semmai essa manifestò in modo quanto mai palese che occorreva necessariamente andare oltre il modello dell’etere. 12 Vedi a proposito Barone [3, pagine 103–105]. 13 Si ricordi il pensiero di Einstein a riguardo: «L’esito dell’esperimento di Michelson non ebbe una grande influenza sull’evoluzione delle mie idee [...]. La spiegazione di ciò sta nel fatto che ero, per ragioni di carattere generale, fermamente convinto che non esista il moto assoluto, e il mio unico problema era come ciò potesse conciliarsi con quello che sapevamo dell’elettrodinamica.» 112 6 INTRODUZIONE ALLA MECCANICA QUANTISTICA 6.1 *il corpo nero Un corpo nero è un oggetto che assorbe tutta la radiazione elettromagnetica incidente (e quindi non ne riflette). Se introduciamo il concetto di potere assorbente come la frazione di energia raggiante incidente che viene assorbita dal corpo, si conclude che un corpo nero è un oggetto che ha potere assorbente 1. Kirchhoff è riuscito a dimostrare nel 1859 che il potere assorbente di un corpo dipende solo dalla temperatura del corpo e non dalla sua natura. Kirchhoff stesso, per esempio, ha provato che un ottimo esempio di corpo nero è un contenitore a temperatura costante sulle cui pareti è praticato un piccolissimo foro, di modo che la radiazione che entra attraverso di esso abbia probabilità praticamente nulla di uscirvi e venga assorbita dal corpo in seguito alle numerose riflessioni interne. Sia dunque u la densità volumetrica di energia all’interno del contenitore e indichiamo con uν dν la densità di energia delle componenti che cadono nell’intervallo (ν, ν + dν). Il risultato di Kirchhoff cui si è accennato può esprimersi nel seguente modo: fissata ν, uν = uν ( T ). Stefan aveva dimostrato che u= Z +∞ 0 uν dν = aT 4 (Legge di Stefan-Boltzmann) dove a = 7.5657 · 10−16 J/(m3 · K4 ) è detta costante di radiazione.1 Ricordando che la pressione esercitata sulle pareti del corpo è data da p = u/3, indichiamo con U l’energia totale irradiata e consideriamo una trasformazione termodinamica infinitesima: δQ = T dS = dU + p dV = 4 1 = V du + u dV + u dV = V du + u dV ⇐⇒ 3 3 V du 4u dS = dT + dV. T dT 3T Ovvero ∂S 4u = ∂V 3T ∂S V du = . ∂T T dT (6.1) (6.2) Imponendo l’uguaglianza delle derivate miste si ottiene 4 1 du u 1 du du u − 2 = ⇐⇒ =4 . 3 T dT T T dT dT T 1 Per vedere come si calcola la costante di radiazione vedi l’appendice D. 113 introduzione alla meccanica quantistica Integrando l’equazione differenziale si ottiene che u = aT 4 , con a costante di integrazione. Nel 1893 Wien dimostrò che ν u ν = ν3 F (Legge dello spostamento) T che contiene la legge di Stefan. Infatti Z +∞ ν ν dν = pongo α = u= ν3 F T T 0 = Z +∞ 0 = T4 T 3 α3 F (α) T dα = Z +∞ 0 α3 F (α) dα. La relazione di Wien si può anche esprimere in funzione delle lunghezze d’onda λ; infatti, indicata con uλ la densità di energia nell’intervallo di lunghezza d’onda, richiediamo che uν dν = uλ dλ. Da λν = c, differenziando si ha |dλ| |dν| ν = ⇐⇒ |dν| = dλ. λ ν λ Perciò ν uλ dλ = uν dν = uν |dλ| λ da cui uλ = c4 c F . λ5 λT Per trovare tali massimi come solito c duλ c 0 c = 0 ⇐⇒ F + 5F = 0. dλ λT λT λT Poiché F è una funzione universale, detta λ̄ la soluzione, dalla forma dell’equazione abbiamo che λ̄T = costante = b. Pertanto λ̄ = b/T, ovvero all’aumentare della temperatura, il massimo della funzione si sposta verso lunghezze d’onda più piccole (legge dello spostamento di Wien).2 Nel 1896 Wien stesso propone una forma possibile di F: Fν ( T ) = a1 e−a2 ν/T . Si mostra mediante analisi di Fourier che il campo elettromagnetico si comporta come se fosse generato da molti oscillatori armonici indipendenti. Noto il numero N di oscillatori di una determinata frequenza si può ricavare uν ; si prova che la densità di oscillatori armonici fra ν e ν + dν è: dN (ν) 8π = 3 ν2 dν. V c 2 La costante b = 2.897 768 5 · 10−3 m · K prende il nome di costante dello spostamento di Wien. 114 6.1 *il corpo nero 0.6 5000 K uλ (MJ/m4 ) 0.5 Teoria classica (5000 K) 0.4 0.3 0.2 4000 K 0.1 0 3000 K 0 0.5 1 1.5 2 2.5 3 λ (µm) Figura 6.1: Curve di Planck per diversi valori della temperatura a confronto con i risultati previsti dalla teoria classica di Rayleigh-Jeans. Sulle ordinate è riportata la densità di energia per unità di volume per unità di lunghezza d’onda, quindi l’integrale delle curve rappresenta la densità volumetrica di energia. Nota l’energia media dei detti oscillatori ū, allora uν dν = ū dN (ν)/V. Poiché vale il principio di equipartizione dell’energia e per ogni oscillatore, avendo esso due modi possibili, ū = 2(kB T/2) = kB T, ricorrendo alla distribuzione di Boltzmann si ha: P(u) = c e − k uT B e = R +∞ 0 − k uT B e − k uT B du , R +∞ − u dove c = 1/ 0 e kB T du è una costante che soddisfa la condizione di norR +∞ malizzazione 0 P(u) du = 1. Pertanto il valore medio può essere ottenuto da R +∞ − u Z +∞ u e kB T du ū = uP(u) du = R0 +∞ − u = kB T. kB T 0 e du 0 Perciò 8π dN (ν) = kB T 3 ν2 dν. (Relazione di Rayleigh-Jeans) V c Si vede subito che integrando tra 0 e +∞ l’integrale diverge (poiché tale fatto è legato al contributo delle alte frequenze si parla di catastrofe ultravioletta o catastrofe di Rayleigh-Jeans). La relazione è ottenuta ammettendo che gli scambi energetici avvengano con continuità. Nel 1901 Planck propose invece che l’energia potesse essere scambiata solo secondo quantità multiple di hν. In questo caso, detto un = nhν l’energia scambiata, uν ( T ) dν = ū P(un ) = c e − knhνT B = e − knhνT B ∑∞ n =0 e −n khνT B = (1 − e − khνT B )e −n khνT B , 115 introduzione alla meccanica quantistica − hν dove c = 1 − e kB T è una costante che soddisfa la condizione di normalizzazione ∞ ∑+ n=0 P ( un ) = 1. Dunque ∞ ū = ∑ n =0 un P(un ) = hν(1 − e ovvero uν = h 8π 3 ν hν . 3 c e kB T −1 − khνT B ∞ ) ∑ ne n =0 −n khνT B = hν e hν kB T −1 (Legge della radiazione di Planck) La legge di Planck è perfettamente in accordo con i dati sperimentali, elimina il problema della “catastrofe ultravioletta” e restituisce la legge di Rayleigh-Jeans come primo termine dello sviluppo in serie (vedi la figura 6.1). 6.2 effetto fotoelettrico L’esperienza mostra che, in certe condizioni, un metallo colpito da un fascio di luce monocromatica emette elettroni. L’apparato sperimentale può essere, grosso modo, schematizzato come segue: all’interno di un involucro trasparente, in cui è praticato il vuoto, è posto un catodo su cui è fatta incidere radiazione elettromagnetica monocromatica (nello spettro del visibile o superiore) e un anodo che raccoglie i fotoelettroni emessi dal catodo. L’anodo si trova, rispetto al catodo, a un potenziale inferiore, il cui valore può essere variato mediante un potenziometro (vedi figura 6.2). Gli aspetti rilevanti dell’effetto fotoelettrico possono essere così riassunti: 1. esiste, in funzione del tipo di metallo di cui è costituito il catodo, una frequenza di soglia ν0 della radiazione incidente, al di sotto della quale non si verifica nessuna emissione di fotoelettroni, qualunque sia l’intensità della radiazione; Figura 6.2: Apparato per la rivelazione dell’effetto fotoelettrico. 116 6.2 effetto fotoelettrico 2. esiste un potenziale d’arresto V0 , indipendente dall’intensità della radiazione incidente, in corrispondenza del quale nessun elettrone raggiunge l’anodo; questa proprietà sta a significare che l’energia cinetica massima dei fotoelettroni appena emessi dal catodo verifica l’equazione Tmax = eV0 dove e è la carica dell’elettrone in modulo; 3. l’emissione dei fotoelettroni è istantanea qualunque sia l’intensità della radiazione, purché ν > ν0 ; 4. la corrente fotoelettrica i, ovvero il numero di elettroni emessi nell’unità di tempo, dipende dall’intensità I della radiazione incidente. La teoria classica della radiazione prevede a. l’esistenza di una intensità di radiazione di soglia I0 al di sotto della quale l’effetto non avviene, in contrasto col punto 1; b. la dipendenza di Tmax , e quindi del potenziale d’arresto V0 , dall’intensità della radiazione I in contrasto col punto 2; c. che l’emissione debba avvenire dopo che un elettrone ha assorbito, a spese della radiazione incidente, abbastanza energia da superare il potenziale, detto di estrazione, che, in condizioni normali impedisce all’elettrone di uscire dal metallo: per tale ragione l’emissione può verificarsi solo dopo un certo intervallo di tempo dall’arrivo della radiazione incidente, intervallo ovviamente tanto maggiore quanto più bassa è l’intensità I, in contrasto col punto 3; d. che la corrente, dovuta ai fotoelettroni, debba aumentare al crescere di I, in accordo col punto 4 (sempre che ν > ν0 ). Allora, almeno tre delle caratteristiche principali dell’effetto fotoelettrico non sono spiegabili mediante la teoria classica della radiazione. Nel 1905 Einstein propose una spiegazione dell’effetto assumendo che la radiazione fosse costituita da pacchetti, o quanti di energia, detti fotoni: una radiazione elettromagnetica monocromatica di frequenza ν consiste di fotoni di energia hν, dove h = 6.6 · 10−34 J · s è la costante di Planck. Abbiamo visto che, per spiegare l’emissione del corpo nero, Planck aveva ipotizzato un simile comportamento per l’energia della radiazione elettromagnetica all’interno di una cavità. Vediamo ora come, con l’ipotesi di Einstein, è possibile fornire una spiegazione esauriente dell’effetto. Possiamo assumere, per semplicità, che l’elettrone sia a riposo all’interno del metallo.3 Un elettrone, dopo aver assorbito un fotone di energia hν, è emesso dal catodo con un’energia cinetica T = hν − W, dove W è il lavoro di estrazione dal metallo. Se W0 è il lavoro minimo di estrazione caratteristico del metallo (per esempio: per il sodio è 2.7 eV, per il ferro 3.2 eV), l’energia cinetica massima dell’elettrone (quando questo è emesso dal catodo) è data da Tmax = hν − W0 . 3 Osserviamo che l’energia termica è circa 10−2 eV mentre i fotoni, nel visibile e nell’ultravioletto, hanno un’energia di circa 1 − 10 eV. 117 introduzione alla meccanica quantistica Figura 6.3: Effetto Compton Esiste di conseguenza una frequenza di soglia ν0 = W0 /h tale che, se ν < ν0 , l’effetto non ha luogo. Vi è altresì un valore V0 del potenziale in corrispondenza del quale anche gli elettroni più veloci non sono in grado di raggiungere l’anodo. Abbiamo in particolare V0 = (hν − W0 )/e. Dopo che un elettrone ha acquistato, mediante assorbimento di un fotone, energia pari ad hν, la sua emissione dal metallo, se ν > ν0 , è immediata (il ritardo è inferiore a 10−9 s) e non dipende dall’intensità della radiazione. Se l’effetto ha luogo, all’aumentare dell’intensità di radiazione cresce anche il numero di fotoelettroni e quindi la corrente nel circuito. In conclusione, possiamo dire che l’effetto fotoelettrico, al pari della radiazione del corpo nero, fornisce una prova che la radiazione elettromagnetica di frequenza ν è costituita da fotoni di energia hν. Esercizio Dimostrare che un elettrone libero non può assorbire un fotone di energia hν in base alla conservazione del quadrimomento. 6.3 effetto compton Se facciamo incidere un fascio di raggi X con λ0 = 0.7 Å ( =⇒ hν0 = hc/λ0 = 18 keV) su una sostanza (come per esempio il molibdeno) si osserva, sperimentalmente, che i raggi X diffusi a un angolo θ rispetto alla direzione della radiazione incidente hanno lunghezza d’onda lievemente maggiore di λ0 ; in particolare si trova ∆λ = h (1 − cos θ ) me c dove me è la massa a riposo dell’elettrone.4 La grandezza h/(me c) ha (ovviamente) le dimensioni di una lunghezza e vale 0.024 Å: è detta lunghezza d’onda Compton dell’elettrone. Questo effetto (di diffusione), detto Compton, può essere spiegato come un urto tra un fotone di energia hν0 e momento hν0 /c e un elettrone libero, che possiamo considerare fermo (notiamo che l’energia di legame degli elettroni 4 Ricordiamo che la massa a riposo di un elettrone è pari a me = 9.11 · 10−31 kg = 0.511 MeV/c2 118 6.4 onde di materia di de broglie periferici è di qualche eV, mentre l’energia dei fotoni è molto maggiore). Nell’urto fotone-elettrone si conserva il quadrimomento. Chiamiamo ~p0 e ~p i momenti fotonici prima e dopo l’urto e ~pe il momento dell’elettrone dopo l’urto; ricordiamo che, prima dell’urto, l’elettrone è fermo. Dalla conservazione dell’energia: q 2 (6.3) me c + cp0 = m2e c4 + c2 p2e + cp. Dalla conservazione del momento: ~p0 = ~p + ~pe ⇐⇒ ~pe = ~p0 − ~p ⇐⇒ p2e = p20 + p2 − 2p0 p cos θ. (6.4) (me c2 + cp0 − cp)2 = m2e c4 + c2 p2e ⇐⇒ (6.5) La (6.3) può anche scriversi come: 4 4 m2e c + c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 pp0 = m2e c + c2 p2e . Sostituendo nella (6.5) la (6.4) otteniamo: c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 p0 p = c2 p20 + c2 p2 − 2c2 p0 p cos θ =⇒ me c( p0 − p) = p0 p(1 − cos θ ). (6.6) Ora, p0 = hν0 /c = h/λ0 , mentre p = hν/c = h/λ, perciò la precedente diventa 1 h2 1 − = (1 − cos θ ) =⇒ me ch λ0 λ λ0 λ h λ − λ0 = (1 − cos θ ). (6.7) me c In conclusione, nell’effetto Compton i fotoni si comportano proprio come dei corpuscoli cui compete energia hν e momento hν/c. La diffusione Compton può essere considerata come un assorbimento di radiazione elettromagnetica seguito da emissione, mentre l’effetto fotoelettrico è un assorbimento puro e semplice. 6.4 onde di materia di de broglie La radiazione elettromagnetica ha manifestazioni ondulatorie e presenta, nel contempo, comportamenti corpuscolari come nella radiazione del corpo nero, nell’effetto fotoelettrico e nell’effetto Compton. Il legame tra questi due aspetti è rappresentato dalla costante di Planck h. Sappiamo infatti che, se ν è la frequenza di un’onda elettromagnetica monocromatica, questa può essere pensata in certi contesti come formata da quanti, fotoni (particelle di massa nulla), a ognuno dei quali compete un’energia hν e un momento hν/c. Poiché h interviene anche nella condizione di quantizzazione di Bohr-Sommerfeld, Louis de Broglie nel 1923 si chiese se non fosse possibile, per così dire, un percorso inverso, cioè che oggetti (come gli elettroni) pensati sempre come particelle potessero presentare, in particolari situazioni, un comportamento ondulatorio. Consideriamo nel modello atomico di Bohr un elettrone in orbita attorno al nucleo; la condizione di quantizzazione è la seguente: I p dq = nh n ∈ N. 119 introduzione alla meccanica quantistica Ora, se l è la lunghezza dell’orbita, la precedente relazione può anche essere scritta: l p = nh ⇐⇒ l = nh . p Qui il termine h/p ricorda la lunghezza d’onda λ di un fotone. Questa analogia ha suggerito a de Broglie la seguente ipotesi: a ogni particella, avente massa a riposo non nulla, è associata un’onda, la cui lunghezza d’onda, noto il momento p, è data da λ = h/p. Alla luce di questa ipotesi, le orbite permesse nella teoria di Bohr sono quelle che contengono un numero intero di lunghezze d’onda. Vediamo con quali lunghezze d’onda abbiamo a che fare nello schema di de Broglie. Prendiamo delle particelle libere (non relativistiche): λ= h h =√ . p 2mE (6.8) Questa è la lunghezza d’onda di de Broglie di una particella di massa m avente un’energia cinetica E. Nel caso di un elettrone, se E = 1 eV, λ= √ h 2mE =√ 6.626 · 10−34 2 · 9.11 · 10−31 · 1.6 · 10−19 m = 1.24 · 10−9 m = 12.4 Å (come nei raggi X), pari alle dimensioni atomiche. Per un oggetto di 1 kg ed energia di 1 J gli effetti quantistici si avrebbero a distanze pari a 10−34 m, del tutto trascurabili rispetto alle oscillazioni termiche degli atomi. Notiamo che, mentre per i fotoni λ è inversamente proporzionale a E, per le particelle (non relativisti√ che) λ è inversamente proporzionale a E. Inoltre maggiore è la massa, minore è, a parità di energia, la lunghezza d’onda. Nel 1927 Davisson e Germer hanno provato che gli elettroni presentano effettivamente un comportamento ondulatorio e sono caratterizzati da una lunghezza d’onda data proprio dalla (6.8). Analoghi comportamenti ondulatori sono, poi, stati provati per protoni, neutroni, atomi di He, ecc. Stabilito il carattere ondulatorio delle particelle materiali, bisogna vedere a quale grandezza fisica si riferisce il fenomeno, cioè quale sia il significato fisico della grandezza o delle grandezze oscillanti che chiamiamo funzioni d’onda e per la quale ipotizziamo un’equazione lineare in analogia con le onde meccaniche e quelle elettromagnetiche. Normalmente quando si è in presenza di una propagazione ondulatoria, si pone il problema di quale sia il mezzo che porta l’onda e quale la grandezza che ne misuri l’ampiezza. Nel caso elettromagnetico alla prima domanda non c’è risposta, o meglio è il vuoto, mentre le grandezze che misurano l’ampiezza sono il campo elettrico e il campo magnetico. Ci chiediamo nel caso delle onde di materia di de Broglie chi sostituisce questi campi (assodato che esse si propagano nel vuoto). L’esperimento di Davisson e Germer fornisce una risposta a questo quesito. Nell’esperimento, mediante rivelatori, viene testata la presenza o meno di elettroni a un particolare angolo. Alla fine, pensando di ripetere più volte 120 6.4 onde di materia di de broglie le misure, ogni volta con un solo elettrone nel fascio, viene di fatto misurata la frequenza con cui l’elettrone è rivelato ai diversi angoli, cioè è misurata una probabilità di presenza dell’elettrone. Le idee di de Broglie sulle onde di materia avranno uno sviluppo fondamentale con la Meccanica Ondulatoria di Schrödinger. 121 R I F E R I M E N T I B I B L I O G R A F I C I D E L L A PA R T E I I [1] Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli argomenti del corso. [2] Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma: Editori Riuniti, 2010 (citato a pagina 129). [3] Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri, 2007 (citato a pagina 112). [4] Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976. [5] Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli, 1993 (citato alle pagine 127, 135). [6] Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002. [7] Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna: Zanichelli, 2005 (citato alle pagine 59, 75). [8] David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica moderna. Milano: CEA, 2002. [9] Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100). [10] Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995. [11] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69). [12] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004. [13] P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg, Maryland 20899: National Institute of Standards and Technology, 25 ott. 2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a pagina 139). [14] Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000. [15] Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996. [16] Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973. 123 Parte III APPENDICI A LA SUCCESSIONE DI FIBONACCI Un’equazione alle differenze finite (lineare omogenea di ordine n, a coefficienti costanti) è il problema seguente: assegnati i primi n valori x0 , . . . , xn−1 di una successione numerica e una relazione ricorrente quale x j+n = − n −1 ∑ ak x j+k , k =0 determinare la successione numerica, la quale è chiaramente individuata così in modo unico. Si tratta di trovare una “forma chiusa” per l’espressione dei termini, cioè una formula che fornisca il valore dell’n-esimo termine senza dover calcolare tutti i precedenti n − 1 termini della successione. Le equazioni alle differenze possono essere ricondotte alle equazioni differenziali.1 La successione di Fibonacci (sequenza A000045 della On-Line Encyclopedia of Integer Sequences: http://www.research.att.com/~njas/sequences/A000045), descritta dal matematico pisano Leonardo Fibonacci (1170 - 1250) nell’opera Liber abaci del 1202, è una successione di numeri interi definita per ricorrenza da Fn+2 = Fn+1 + Fn . F =0 0 F1 = 1 La determinazione di una forma chiusa per la successione di Fibonacci è un classico esempio di problema alle differenze finite. Si cercano soluzioni del tipo Fn = µn , con µ 6= 0. Dalla definizione della successione abbiamo: µn+2 = µn+1 + µn ⇐⇒ µ2 = µ + 1, da cui si ricava µ1,2 √ 1± 5 = . 2 La soluzione sarà una combinazione lineare delle due radici: Fn = aµ1n + bµ2n . (A.1) Imponendo le “condizioni iniziali” si ha: a = −b a+b = 0 ⇐⇒ b = aµ1 + bµ2 = 1 1 µ2 − µ1 1 a = √ 5 ⇐⇒ . 1 b = − √ 5 1 Vedi De Marco [5, pagina 815]. 127 la successione di fibonacci Sostituendo nella (A.1) otteniamo √ !n √ !n ! 1 1+ 5 1− 5 Fn = √ − . 2 2 5 La relazione trovata è nota con il nome di formula di Binet. 128 B L A T R A S F O R M ATA D I L E G E N D R E b.1 definizione Sia data una funzione f : R → R, liscia e convessa ( f 00 ( x ) > 0 ∀ x ∈ R). La sua trasformata di Legendre1 è una funzione g di una nuova variabile p data da g( p) = max{ px − f ( x )}. x (B.1) Il significato geometrico della trasformata può essere inteso nel modo seguente. Consideriamo nel piano xy il grafico della funzione f ( x ) e sia data la retta y = px passante per l’origine con p inteso fissato. Allora è possibile individuare un punto x̃ = x̃ ( p) tale che px − f ( x ) = F ( p, x ) sia massima. La trasformata di Legendre è dunque F ( p, x̃ ( p)) = g( p). Se esiste, il punto x̃ ( p) è univocamente determinato, essendo individuato dalla condizione ∂F/∂x = p − f 0 ( x̃ ) = 0 (grazie al teorema del Dini è possibile esprimere x̃ in funzione di p), cioè f 0 ( x̃ ) = p. (B.2) Questa condizione ha senso solo se p appartiene al codominio della derivata di f ( x ). Il punto stazionario così trovato è un massimo in quanto per ipotesi ∂2 F ( x, p) = − f 00 ( x̃ ) < 0. ∂x2 x= x̃ In base a quanto visto finora la (B.1) può essere anche scritta nel seguente modo: g( p) = x̃ ( p) p − f ( x̃ ( p)). Osserviamo che dg( p) = x̃ 0 ( p) p + x̃ ( p) − f 0 ( x̃ ( p)) x̃ 0 ( p) = x̃ 0 ( p)( p − f 0 ( x̃ ( p))) + x̃ ( p) = dp = x̃ ( p). La trasformata di Legendre gode di una proprietà molto importante: essa è involutiva, ovvero se g( p) è la trasformata di Legendre di f ( x ), allora la trasformata di Legendre di g( p) è ancora f ( x ). Le due funzioni f e g si dicono dunque duali secondo Young. Inoltre essendo per definizione px − f ( x ) ≤ g( p) allora vale la cosiddetta disuguaglianza di Young: px ≤ f ( x ) + g( p). (B.3) 1 Per un approfondimento sulla trasformata di Legendre puoi vedere Arnol’d [2]. 129 la trasformata di legendre y y = f (x) y = px g( p) x x ( p) Figura B.1: Trasformata di Legendre. Le precedenti considerazioni si generalizzano facilmente al caso di funzioni a più variabili. Sia f : Rn → R una funzione liscia e x, p ∈ Rn . Anche in questo caso la funzione deve essere convessa, cioè si richiede che la matrice hessiana sia definita positiva. La trasformata di Legendre è ∂2 f ∂xi ∂x j g( p) = max{( p, x) − f ( x)}, x dove ( p, x) = n ∑ pi xi . i =1 Allora deve risultare ∂f ( x ) = pi ∂xi i = 1, . . . , n (B.4) o, equivalentemente, ∇ f ( x) = p. Quindi x̃ = x̃( p) e la trasformata si può anche scrivere come g( p) = n ∑ x̃i ( p) pi − f (x̃( p)). (B.5) i =1 Come abbiamo visto,2 la trasformazione di Legendre permette di passare dalla lagrangiana L(q, q̇, t) (intesa come funzione delle variabili q̇) all’hamiltoniana 2 Si veda pagina 51. Nel caso dell’applicazione della trasformazione di Legendre alla funzione L le ipotesi di convessità sono in genere soddisfatte. La lagrangiana di un sistema fisico ha infatti solitamente la forma L = 21 ∑i mi q̇2i − V (q): evidentemente la matrice ! ∂2 L = (mi δij ) ∂q̇i ∂q̇ j è definita positiva. 130 B.1 definizione H(q, p, t). La trasformazione di Legendre trova applicazione in svariati ambiti della Fisica (per esempio, in termodinamica la funzione entalpia è definita come trasformata di Legendre della funzione energia rispetto al volume). La trasformazione di Legendre non è un semplice cambiamento di variabili: essa consente di passare da funzioni definite su uno spazio lineare a funzioni definite sul corrispondente spazio duale. Esercizi 1. Si consideri la funzione f : R → R definita da f ( x ) = x2 . Determinare la trasformata di Legendre della funzione. Soluzione. Osserviamo che f 00 ( x ) = 2 > 0 ne (B.2): f 0 ( x ) = p =⇒ 2x = p =⇒ x = ∀ x ∈ R. Imponiamo la condizio- p , 2 p ∈ R. La trasformata è dunque: g( p) = x ( p) p − f ( x ( p)) = p2 p2 p2 − = . 2 4 4 2. Calcolare la trasformata di Legendre della funzione f : R → R definita da f ( x ) = x2 /4. Soluzione. Abbiamo f 00 ( x ) = 1/2 > 0 ne (B.2) abbiamo: f 0 (x) = ∀ x ∈ R. Imponendo la condizio- x = p =⇒ x ( p) = 2p 2 da cui otteniamo che la trasformata di Legendre della funzione è g( p) = x ( p) p − f ( x ( p)) = 2p2 − p2 = p2 . In questi due esercizi possiamo ossservare la proprietà di involuzione della trasformazione di Legendre: la trasformata della trasformata della funzione f ( x ) = x2 è proprio la funzione stessa. 3. Sia f : R+ → R+ la funzione definita da f ( x ) = x α /α, con α > 1 ( f 00 ( x ) > 0). Trovare la trasformata di Legendre di f ( x ). Soluzione. Dalla (B.2) abbiamo: 1 f 0 ( x ) = p ⇐⇒ x α−1 = p ⇐⇒ x = p α−1 . Allora α 1 g( p) = x ( p) p − f ( x ( p)) = p α−1 p − p α −1 α−1 α = p α −1 . α α 131 la trasformata di legendre È tradizione porre α α−1 1 1 1 = β ⇐⇒ = ⇐⇒ + = 1 α−1 α β α β per cui g( p) = pβ . β In questo caso la disuguaglianza di Young assume la forma xp ≤ xα pβ + . α β 4. Data la funzione f : R → R definita da f ( x ) = ex calcolarne la trasformata di Legendre. Soluzione. La funzione è convessa. Come al solito imponiamo la condizione (B.2): f 0 ( x ) = p ⇐⇒ ex = p ⇐⇒ x ( p) = ln p Quindi la trasformata di Legendre della funzione è p ∈ R+ . g( p) = x ( p) p − f ( x ( p)) = p ln p − p. Notiamo che g0 ( p) = ln p = x ( p) 1 g00 ( p) = = x 0 ( p) > 0. p Questo è un risultato di carattere generale: la trasformata di Legendre trasforma funzioni convesse in funzioni convesse. 5. Si consideri la funzione f : R2 → R definita da f ( x1 , x2 ) = 2x12 − 2x1 x2 + x22 = x12 + ( x1 − x2 )2 . Determinare la trasformata di Legendre di f ( x1 , x2 ). Soluzione. Dalla (B.4) abbiamo: ∂f ∂x = 4x1 − 2x2 = p1 1 ⇐⇒ ∂ f = 2x2 − 2x1 = p2 ∂x2 p1 + p2 x1 ( p1 , p2 ) = 2 . p + 2p2 1 x2 ( p1 , p2 ) = 2 Allora per la (B.5) la trasformata di Legendre di f ( x1 , x2 ) è g( p) = x1 ( p1 , p2 ) p1 + x2 ( p1 , p2 ) p2 − f ( x1 ( p1 , p2 ), x2 ( p1 , p2 )) = p1 + p2 p1 + 2p2 p1 + p2 2 p1 + p2 = p1 + p2 − − + 2 2 2 2 2 p2 + 2p1 p2 + 2p22 p1 + 2p2 − = 1 . 2 4 132 C S I M B O L O D I L E V I - C I V I TA Il simbolo di Levi-Civita ε ijk è così definito: +1 se (i, j, k ) è una permutazione pari di (1, 2, 3), ε ijk = −1 0 se (i, j, k ) è una permutazione dispari di (1, 2, 3), altrimenti (cioè almeno due indici sono uguali). Ricordiamo che con permutazione pari si intende una permutazione ottenuta con un numero pari di trasposizioni a partire da quella di partenza; è una permutazione dispari, invece, una permutazione ottenuta con un numero dispari di trasposizioni. Così, (1, 2, 3), (2, 3, 1) e (3, 1, 2) sono permutazioni pari di (1, 2, 3), mentre (1, 3, 2), (3, 2, 1) e (2, 1, 3) sono permutazioni dispari. Il simbolo di Levi-Civita permette di scrivere in maniera compatta alcune relazioni di algebra lineare. Per esempio, indicando con x̂1 , x̂2 e x̂3 i versori di R3 , il prodotto vettoriale di due vettori a = ( a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) è: x̂1 x̂2 x̂3 3 a × b = a1 a2 a3 = ∑ ε ijk x̂i a j bk . b b b i,j,k=1 2 3 1 La i-esima componente è ( a × b )i = 3 ∑ j,k =1 ε ijk a j bk . (C.1) Si vede dunque che ε ijk può anche essere definito nel modo seguente: ε ijk = x̂i · ( x j × xk ). La (C.1) può essere scritta in maniera più concisa adoperando la notazione di Einstein: se in un termine ci sono degli indici ripetuti, si sottintende l’operazione di somma sui valori che tali indici possono assumere e si omette il simbolo di sommatoria. Nel secondo membro della (C.1) gli indici ripetuti sono j e k (ma non i) e possono variare da 1 a 3, quindi con questa notazione abbiamo: ( a × b)i = ε ijk a j bk . Calcoliamo 3 ∑ ε kij ε klm k =1 con i 6= j e l 6= m. I termini non nulli sono quelli con k 6= i, j e k 6= l, m. Allora, affinché la somma non sia nulla dobbiamo avere 133 simbolo di levi-civita • i = l e j = m; • i = m e j = l. La prima condizione è esplicitata da δil δjm , la seconda da δim δjl , quindi 3 3 k =1 k =1 ∑ ε kij ε klm = ∑ ε kij ε klm 3 = ∑ k =1 3 ! δil δjm + 3 ! ε2kij δil δjm + ∑ ε kij ε klm k =1 ∑ ε kij ε kji k =1 ! δim δjl = ! δim δjl = = δil δjm − δim δjl . Con la notazione di Einstein abbiamo: ε kij ε klm = δil δjm − δim δjl . A primo membro si somma su k poiché questo è l’unico indice ripetuto, a secondo membro non c’è alcuna somma in quanto non ci sono indici ripetuti in ciascuno dei due termini δil δjm e δim δjl . Il simbolo di Levi-Civita può anche essere esteso a più di 3 indici nel modo seguente: +1 se (i, j, k, l, . . . ) è una permutazione pari di (1, 2, 3, 4, . . . ), ε ijkl... = 134 −1 0 se (i, j, k, l, . . . ) è una permutazione dispari di (1, 2, 3, 4, . . . ), se almeno due indici sono uguali. D C A L C O L O D E L L A C O S TA N T E D I R A D I A Z I O N E Nel capitolo 6 abbiamo visto che la densità di energia irradiata da un corpo nero per unità di frequenza uν è data dalla Legge della radiazione di Planck uν = 8π 3 h , ν c3 e khν B T −1 quindi la densità di energia u è u= Z +∞ 0 uν dν = Z +∞ 8π 3 ν 0 c3 Effettuiamo la sostituzione x= h e hν kB T −1 dν = 8π h c3 ν3 Z +∞ 0 e hν kB T −1 dν. hν k T ⇐⇒ dν = B dx. kB T h Gli estremi di integrazione rimangono gli stessi poiché ν → 0 =⇒ x → 0 e ν → +∞ =⇒ x → +∞. Poiché se Re(s) > 1 sussiste la relazione1 Z + ∞ s −1 x e x −1 0 dx = Γ(s)ζ (s), in cui Γ indica la funzione gamma di Eulero e ζ la funzione zeta di Riemann, abbiamo +∞ ( xk T/h )3 k T 8π B B dν = 3 h dx = hν x c e −1 h 0 0 e kB T −1 Z 8π k B T 4 +∞ x3 kB T 4 8π dx = 3 h Γ (4) ζ (4). = 3h c h e x −1 c h 0 8π u= 3h c Z +∞ ν3 Z Ora, Γ(4) = 3! = 6 e ζ (4) = π 4 /90, dunque 5 4 8π kB T 4 = aT 4 , u= 15c3 h3 dove a= 8π 5 k4B 8π 5 (1.380 650 4 · 10−23 J/K)4 = = 15c3 h3 15(299 792 458 m/s)3 (6.626 068 96 · 10−34 J · s)3 = 7.5657 · 10−16 J/(m3 · K4 ) è la costante di radiazione. La legge di Stefan-Boltzmann è spesso scritta nella forma P = σT 4 A 1 Per una dimostrazione di questa relazione puoi vedere, per esempio, De Marco [5, pagina 575]. 135 calcolo della costante di radiazione in cui P/A è il rapporto fra potenza irradiata dal corpo nero e area (questo rapporto è chiamato irradianza) e σ è la costante di Stefan-Boltzmann legata alla costante di radiazione dalla relazione a= 4σ , c pertanto la costante di Stefan-Boltzmann vale σ= 2π 5 k4B π 2 k4B ac π 2 (1.380 650 4 · 10−23 J/K)4 = = = = 4 15h3 c3 60}3 c3 60(1.054 571 62 · 10−34 J · s)3 (299 792 458 m/s)3 = 5.6704 · 10−8 W/(m2 · K4 ). 136 E N O T E S U L L E U N I TÀ D I M I S U R A Nel sistema internazionale (SI) l’unità di misura dell’energia è il joule (simbolo J): 1 J = 1 kg · m2 /s2 . Nel sistema di Gauss (SG o CGS) l’unità di misura è l’erg: 1 erg = 1 g · cm2 /s2 . Ovviamente 1 J = 107 erg. Altra unità di misura, usata in chimica e in termodinamica, è la caloria (cal), insieme al suo multiplo, la chilocaloria (kcal): 1 kcal = 4.184 · 103 J. In diversi settori della Fisica l’unità di misura usata è l’elettronvolt (eV); ricordiamo che 1 eV è l’energia di un elettrone sottoposto a una differenza di potenziale di 1 V. Dunque, con riferimento alla tabella seguente: 1 eV = 1.6 · 10−19 J = 1.6 · 10−12 erg e inversamente 1 J = 0.625 · 1019 eV. Multipli dell’elettronvolt sono: 1 keV = 103 eV 1 MeV = 106 eV 1 GeV = 109 eV 1 TeV = 1012 eV. Poiché m0 c2 ha le dimensioni di un’energia, la massa a riposo può essere misurata in eV/c2 . In Fisica atomica si usa spesso come unità di massa l’unità di massa atomica (uma), definita come la dodicesima parte della massa del 12 C: 1 uma = 1.661 · 10−27 kg = 931.5 MeV/c2 . 137 F C O S TA N T I F I S I C H E F O N D A M E N TA L I Riportiamo di seguito alcune costanti fisiche fondamentali, alcune delle quali sono di interesse per la trattazione corrente. I dati, forniti in unità SI, sono presi da Mohr, Taylor e Newell [13]. Nome della costante Velocità della luce (esatto) Costante di Planck Costante di Boltzmann Costante di Stefan-Boltzmann Costante di gravitazione Carica dell’elettrone Massa a riposo dell’elettrone Massa a riposo del protone Massa a riposo del neutrone Massa a riposo del muone Raggio di Bohr Costante di Rydberg Permeabilità del vuoto (esatto) Permittività del vuoto (esatto) Magnetone di Bohr Costante di struttura fine Costante di Avagadro Costante di Faraday Costante molare dei gas Simbolo Valore c h kB π 2 k4B σ= 60}3 c2 G −e me mp mn mµ 4πε 0 h̄2 a0 = me e2 α2 me c R∞ = 2h µ0 = 4π · 10−7 N/A2 1 ε0 = µ0 c2 e} µB = 2me e2 α= 4πε 0 }c NA F = eNA R = kB NA 299 792 458 m/s 6.626 068 96(33) · 10−34 J · s 1.380 650 4(24) · 10−23 J/K 5.670 400(40) · 10−8 W/(m2 · K4 ) 6.674 28(67) · 10−23 m3 /(kg · s) −1.602 176 487(40) · 10−19 C 9.109 382 15(45) · 10−31 kg 1.672 621 637(83) · 10−27 kg 1.674 927 211(84) · 10−27 kg 1.883 531 30(11) · 10−28 kg 0.529 177 208 59(36) · 10−11 m 10 973 731.568 527(73)/m 12.566 370 614 . . . · 10−7 N/A2 8.854 187 817 . . . · 10−12 F/m 927.400 915(23) · 10−26 J/T 7.297 352 537 6(50) · 10−3 6.022 141 79(30) · 1023 /mol 96 485.3399(24) C/mol 8.314 472(15) J/(K · mol) Riportiamo inoltre il valore delle masse di alcune particelle espresse in MeV/c2 . Nome della costante Massa a riposo dell’elettrone Massa a riposo del protone Massa a riposo del neutrone Massa a riposo del muone Simbolo me mp mn mµ Valore 0.510 998 910(13) MeV/c2 938.272 013(23) MeV/c2 939.565 346(23) MeV/c2 105.658 366 8(38) MeV/c2 139 RIFERIMENTI BIBLIOGRAFICI DELLE APPENDICI [1] Mauro Anselmino, Sergio Costa e Enrico Predazzi. Origine classica della fisica moderna. Torino: Levrotto & Bella, 1999. Contiene una trattazione su tutti gli argomenti del corso. [2] Vladimir Igorevič Arnol’d. Metodi matematici della meccanica classica. Roma: Editori Riuniti, 2010 (citato a pagina 129). [3] Vincenzo Barone. Relatività. Principi e applicazioni. Torino: Bollati Boringhieri, 2007 (citato a pagina 112). [4] Max Born. Fisica atomica. Torino: Bollati Boringhieri, 1976. [5] Giuseppe De Marco. Analisi due. Volume 2. Padova: Decibel e Zanichelli, 1993 (citato alle pagine 127, 135). [6] Antonio Fasano e Stefano Marmi. Meccanica analitica. Torino: Bollati Boringhieri, 2002. [7] Herbert Goldstein, Charles Poole e John Safko. Meccanica Classica. Bologna: Zanichelli, 2005 (citato alle pagine 59, 75). [8] David Halliday, Robert Resnick e Jearl Walker. Fondamenti di fisica. Fisica moderna. Milano: CEA, 2002. [9] Charles Kittel, Walter D. Knight e Malvin A. Ruderman. Meccanica. La fisica di Berkley. Bologna: Zanichelli, 1970 (citato a pagina 100). [10] Kenneth S. Krane. Modern Physics. John Wiley & Sons, 1995. [11] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Meccanica. Fisica teorica. Roma: Editori Riuniti university press, 2009 (citato a pagina 69). [12] Lev Davidovič Landau e Evgenij Mikhailovič Lifšits. Teoria dei campi. Volume 2. Fisica teorica. Roma: Editori Riuniti, 2004. [13] P. J. Mohr, B. N. Taylor e D. B. Newell. The 2006 CODATA Recommended Values of the Fundamental Physical Constants. Versione Web 5.2. Questo database è stato sviluppato da J. Baker, M. Douma e S. Kotochigova. Gaithersburg, Maryland 20899: National Institute of Standards and Technology, 25 ott. 2008. url: http://physics.nist.gov/cuu/Constants/index.html (citato a pagina 139). [14] Luigi Picasso. Lezioni di meccanica quantistica. Pisa: Edizioni ETS, 2000. [15] Robert Resnick. Introduzione alla relatività ristretta. Milano: Casa Editrice Ambrosiana, 1996. [16] Eyvind H. Wichmann. Fisica quantistica. Volume 4. La fisica di Berkley. Bologna: Zanichelli, 1973. 141 INDICE ANALITICO accelerazione, vii angolare, momento conservazione, viii, 27 meccanico, viii parentesi di Poisson, 64 problema delle forze centrali, 32 relativistico, 103 simmetria sferica, 32 tensore, 103 totale, xii variabile azione, 76 velocità areolare, 33 angolo variabile, 76 anolonomo, vincolo, 3 areolare, velocità, 33 attrito vincoli scabri, 4 autovalori di una matrice rispetto a un’altra, 42 piccole oscillazioni, 42, 46 azione e reazione forma debole, xi, 31 forma forte, xii, 31 funzionale, 18 integrale sull’orbita, 76 oscillatore armonico unidimensionale, 76 variabile, 76 Bertrand, teorema di, 35 Bohr atomo di, 119 condizione di quantizzazione di Bohr-Sommerfeld, 119 Boltzmann costante di Stefan-Boltzmann, 136 distribuzione di, 115 legge di Stefan-Boltzmann, 113, 135 brachistocrona, 23 calcolo delle variazioni, 17 applicazioni del, 21 equazioni di Eulero-Lagrange, 20 lemma fondamentale del, 20 canonica, trasformazione, 65 canoniche equazioni di Hamilton, 52 variabili, 51 catastrofe ultravioletta, 115 centro di forza, 32, 33 di massa, xi, 31, 32 ciclica coordinata, 27 problema di Keplero, 33 cinetica, energia classica di un sistema di particelle, xii di una particella, viii relativistica, 101 teorema della, xii Compton, effetto, 118 configurazioni, spazio delle, 17 trasformazioni puntuali, 64 cono luce, 89 cono del futuro, 89 cono del passato, 90 conservazione del momento angolare, viii dell’energia meccanica, xiii della quantità di moto relativistica, 106 leggi di, 26 controvariante, 95 coordinate canoniche, 52 cicliche, 26 143 Indice analitico controvarianti, 95 covarianti, 95 lagrangiane, 4 normali, 44 polari, 32 principali, 44 corpo nero, 113 legge dello spostamento di Wien, 114 legge di Planck, 116 legge di Stefan-Boltzmann, 113, 135 relazione di Rayleigh-Jeans, 115 costante dello spostamento di Wien, 114 di radiazione, 113, 135 di Stefan-Boltzmann, 136 Coulomb gauge di, 28 covariante equazione, 104 formulazione, 98 hamiltoniana, 107 quadrivettore, 96 d’Alembert, principio di, 6 Davisson e Germer, esperimento di, 120 de Broglie, 119 onde di materia di, 120 relazione di, 120 diagonalizzazione, 43 diffusione Compton, 118 dilatazione dei tempi, 93 dissipazione, funzione di di Rayleigh, 11 Einstein, 112 notazione di, 95, 133 relazione di, 102 elettromagnetico campo lagrangiana, 10 lagrangiana covariante, 106 tensore, 109 144 ellisse eccentricità della, 37 equazione in coordinate polari della, 37 parametro della, 37 energia a riposo, 102 equivalenza massa-energia, 102 conservazione, viii forze centrali, 33 densità di, 113 funzione, 28 conservazione, 28 in un campo centrale, 33 meccanica, principio di conservazione, xiii potenziale, viii principio di equipartizione, 115 relativistica, 101, 107 relazione di Planck-Einstein, 102 equazione del moto di Minkowski, 104 particella carica in campo elettromagnetico, 109 equilibrio, 5 forze generalizzate, 6 instabile, 40 piccole oscillazioni, 40 stabile, 40 etere, 83, 110 eV, definizione, 137 evento, 83 forza, vii attiva, 6 centrale, viii, 32 centro di, 32 conservativa, viii di Lorentz, 10 generalizzata, 6 legge dell’inverso del quadrato, 35 lineare di richiamo, 35 momento di una, viii non derivabile da un potenziale, 11 Indice analitico vincolare, 3 fotoelettrico, effetto, 116 fotone, 102 frequenza di soglia, 116 modo normale, 44 funzione caratteristica di Hamilton, 76 generatrice, 65 funzione principale di Hamilton, 74 mista, 69 parentesi di Poisson, 69 variabili angolo-azione, 76 Galileo principio di, 83 trasformazioni di, 83, 87, 91 gauge di Coulomb, 28 di Lorentz, 109 trasformazioni di, 12 generalizzata coordinata, 4 forza, 6 generalizzato potenziale, 10 gradi di libertà, 4, 12 N particelle, 4 piccole oscillazioni, 40 Hamilton equazioni di, 52 notazione simplettica, 58 funzione caratteristica di, 76 funzione principale di, 74 principio variazionale di, 18 principio variazionale modificato, 61 Hamilton-Jacobi, equazione di, 74 hamiltoniana covariante, 107 notazione simplettica, 57 particella carica in campo elettromagnetico, 110 Hooke, legge di, 35 identica, trasformazione, 68 inerzia, principio di, 84 invarianza di Lorentz, 87, 90, 105 parentesi di Poisson, 69 per rotazioni, 27 per traslazioni, 27 irradianza, 136 Jacobi, identità di, 63 Keplero prima legge di, 38 problema di, 36 seconda legge di, 33 terza legge di, 39 Kirchhoff, 113 Lagrange equazioni di, 7 derivazione dal principio di Hamilton, 19 forze non derivabili da un potenziale, 12 lagrangiana, 7 campo elettromagnetico, 12 potenziali generalizzati, 8 Laplace-Runge-Lenz, vettore di, 36 Legendre, trasformazione di, 51, 129 Levi-Civita, ε ijk simbolo di, 64, 133 liscio, vincolo, 4 Lorentz forza di, 10 gauge di, 109 scalare di, 97 trasformazioni di, 84, 87 lunghezza propria, 92 massa ridotta, 31 matrice autovalori, 42 definita positiva, 41 diagonale, 43 identità, 42 145 Indice analitico ortogonale, 43 piccole oscillazioni energia cinetica, 41 energia potenziale, 41 simmetrica, 41 simplettica standard, 58 Maxwell, equazioni di, 83 Michelson e Morley, esperimento di, 83, 111 minima azione principio di, 20 Minkowski diagramma di, 89 equazione di, 104 spazio di, 94 modo normale, 44 momento angolare, viii totale, xii canonico, o coniugato, 26 generalizzato, 27 torcente, viii monogenico, sistema, 17 olonomo, vincolo, 3 omogenea, funzione energia cinetica, 28, 33, 41 orbita chiusa, 34 circolare, 35 ellittica, 35 iperbolica, 35 limitata, 34 piano dell’orbita, 32 oscillatore armonico, 70, 76 corpo nero, 114 oscillatori accoppiati, 45 piccole oscillazioni, 40 particella carica in campo elettromagnetico, 10, 109 pendolo piano, viii, 4, 8, 9 Planck, 115 legge di, 116 Poisson 146 parentesi di, 62 equazioni di Hamilton, 63 fondamentali, 63 proprietà, 63 teorema di, 63 potenziale centrale, 31, 32 efficace, 34 d’arresto, 117 di estrazione, 117 energia, 7 generalizzato, 8, 10 elettromagnetico, 10 scalare ϕ, 10 vettoriale A, 10 potere assorbente, 113 prodotto scalare nello spazio di Minkowski, 95, 98 punto materiale, vii quadritensore p volte controvariante e q volte covariante, 97 completamente controvariante, 97 completamente covariante, 97 elettromagnetico, 109 quadrivettore controvariante, 95 covariante, 96 quadriaccelerazione, 99 quadriforza, 104 quadrimomento, 103 quadrivelocità, 99 quantità di moto conservazione della, vii di un sistema di particelle, xi di una particella, vii Rayleigh, funzione di dissipazione di, 11 Rayleigh-Jeans catastrofe di, 115 relazione di, 115 relatività galileiana, 83 Indice analitico ristretta, 84 postulati, 84 quadrivettore, 95 tensore metrico, 95 reonomo, vincolo, 3 Routh funzione di, 59 Routh, metodo di, 59 scabro, vincolo, 4 scleronomo, vincolo, 3 simmetria sferica, 32 simplettica, notazione, 57 spazio delle configurazioni, 17 delle fasi, 51 spaziotempo, 84 spostamento legge dello, 114 Stefan costante di Stefan-Boltzmann, 136 legge di Stefan-Boltzmann, 113, 135 successione di Fibonacci, 127 principio di Hamilton modificato, 61 velocità, vii vincolo anolomono, 3 liscio, 4 olonomo, 3 corpo rigido, 3 reonomo, 3 scabro, 4 scleronomo, 3 virtuali principio dei lavori, 5 spostamenti, 4 viscosa, forza, 11 Wien, 114 costante di, 114 legge dello postamento di, 114 tachione, 88 tardione, 88 tempo proprio, 93 tensore metrico controvariante, 96 covariante, 95 tipo luce, 88 trasformazione canonica, 65 funzione generatrice, 65 identica, 68 parentesi di Poisson, 69 di Galileo, 87 di gauge, 12 di Legendre, 51, 129 di Lorentz, 87 variabili canoniche, 51 dinamiche, 62 variazionale principio di Hamilton, 18 147