Appunti di Relatività ristretta Francesco Ravanini Corso di Laurea in Astrosica e Cosmologia Università di Bologna 28 dicembre 2007 2 Introduzione Nel 1905 Einstein pubblicò 3 articoli: 1. elettrodinamica dei corpi in movimento, cioè le basi della relatività ristretta 2. uno studio sul moto browniano, grazie al quale si dava un forte argomento a favore della natura particellare della materia 3. eetto fotoelettrico, cioè l'interpretazione di uno dei fenomeni più importanti che condussero alla formulazione della meccanica quantistica Qui ci occuperemo della prima di queste 3 linee di ricerca iniziate dal genio di Ulm, i cui frutti nella Fisica del XX secolo sono noti a tutti. In realtà la relatività nasce da una problematica già individuata in lavori precedenti di altri autori, in particolare di Lorentz (1904) e di Poincaré (1901). Al termine del 1905 Einstein uscì con un altro lavoro in cui 2 compare per la prima volta la celebre relazione E = mc e negli anni successivi Minkowski perfezionò la teoria dello spazio-tempo. Nel 1911 Einstein cominciò a lavorare alla relatività generale portata a termine nel 1916. Da allora non è più sorta alcuna nuova teoria della relatività. Il concetto di relatività dei movimenti risale in eetti a Galileo. Trovandosi su un treno che si muove di moto rettilineo uniforme senza scossoni, se non si guarda fuori dal nestrino non ci si può accorgere dello stato di moto o di quiete. Non si può quindi parlare di moto assoluto, ma solo di moto relativo tra due sistemi di riferimento inerziali. Tutto ciò concorda con la legge di gravitazione di Newton che non determina uno stato di moto assoluto. Cioè la legge di gravitazione ha la stessa forma in due sistemi in moto relativo uniforme. In altre parole, facendo misure sulla gravitazione non è possibile distinguere se un sistema sia in moto oppure no. La scoperta dell' elettromagentismo, culminata attorno al 1850 nei lavori di Max- well e nelle sue 4 celebri equazioni, pose per la prima volta problemi a questa visione galileiana della relatività dei movimenti. La teoria di Maxwell predice l'esistenza di vibrazioni del campo elettromagnetico e predice pure la velocità di propagazione di tali onde elettromagnetiche. Tale velocità vale c = 299.792.458 m/sec ≈ 3 · 108 m/sec e coincide con la velocità della luce nel vuoto, da cui Maxwell dedusse che la luce doveva essere un fenomeno elettromagnetico. 3 4 Già l'astronomo danese Rømer aveva misurato la velocità della luce in base ai ritardi delle eclissi dei satelliti di Giove. Misure più precise arrivarono con il ranarsi delle tecnologie nel XIX secolo. Dire che la luce viaggia alla velocità della luce non è una banalità. quale sistema di riferimento ciò avvenga. Ci si chiede in Alla ne dell'800 il ragionamento tipico era il seguente: esiste un etere luminifero che vibra producendo le onde elettromagnetiche, così come l'aria vibrando produce le onde sonore. La luce ha velocità c se riferita a un sistema di riferimento a riposo rispetto all'etere. Se però ci muoviamo rispetto all'etere con velocità garsi con velocità ~c, ma con velocità ~c + ~v , ~v , la luce non dovrebbe più propa- cioè la velocità della luce non è più la stessa in tutte le direzioni. Ciò implica che le leggi di Maxwell sono valide solo per un sistema di riferimento a riposo rispetto all'etere, che viene detto sistema di riferimento assoluto. L'elettromagnetismo ci permetterebbe pertanto di vericare lo stato di quiete o di moto assoluto di un sistema. Alla ne del XIX secolo Michelson riuscì a misurare la velocità della luce con una precisione tale da dover decidere se il suo sistema (la Terra) era in quiete o in moto rispetto all'etere. Nel giro di 6 mesi la Terra, che gira attorno al Sole a 30 Km/sec, cambia la sua velocità di 60 Km/sec e quindi se a un certo istante la Terra fosse in quiete rispetto all'etere, dopo 6 mesi essa si muoverebbe rispetto all'etere di 60 Km/sec. Quindi esiste almeno un giorno dell'anno in cui la Terra è in moto rispetto all'etere. La discrepanza tra Morley detto ~c e ~c + ~v interferometro. è valutabile con uno strumento costruito da Michelson e Ciò che l'interferometro misura è la dierenza di velocità della luce secondo la direzione. Ciò che si osservò fu l'assoluta costanza di c in ogni direzione e ad ogni epoca dell'anno. Non si poteva cioè misurare alcun vento di etere. Per dare risposta all'interrogativo aperto dall'esperimento di Michelson e Morley, Lorentz sviluppò una teoria basata sul fatto che se si considera un solido, esso è formato da atomi, costituiti da cariche elettriche positive e negative. La forza di attrazione tra cariche positive e negative, cioè la forza di Coulomb, rimane elettrostatica nchè le cariche sono ferme rispetto all'etere. Quando queste si muovono compaiono fenomeni magnetici che si espletano macroscopicamente come un accorciamento della lunghezza del solido nella direzione del moto. Tale accorciamento era tale, secondo Lorentz, da compensare le di- screpanze non osservate da Michelson e Morley e non era possibile rendersene conto perchè anche i metri con cui si misurava tale lunghezza si accorciavano. Einstein assunse invece la non isolabilità del moto assoluto come postulato e di- mostrò che la non riuscita dell'esperimento di Michelson e Morley era dovuta a proprietà intrinseche dello spazio. Riassumendo, nella teoria galileiana c'è un principio di relatività del moto che viene violato dalle leggi di propagazione della luce. Infatti, usando il teorema di addizione delle velocità, la velocità della luce non dovrebbe essere uguale per tutti i sistemi di riferimento e manterrebbe la sua costanza in tutte le direzioni solo per osservatori in quiete rispetto all'etere. Se si accetta quindi il teorema di addizione delle velocità, la velocità della luce deve essere diversa a seconda degli osservatori. 5 Se invece si vuole salvare il principio di relatività, occorre abbandonare il teorema di addizione delle velocità nella forma galileiana. Ciò porta a una nuova legge di composizione delle velocità per la quale la velocità della luce è c per tutti gli osservatori. Non è possibile inseguire la luce o andarle incontro perché comunque sia la velocità della luce è sempre c. Einstein salvò così il principio di relatività a costo di sacricare il teorema di addizione delle velocità. Sebbene nel 1906 una misura di velocità di elettroni sembrò porre dubbi sulla nuova teoria di Einstein, tutte le misure successive diedero ragione a quest'ultimo e oggi gli eetti della teoria della relatività einsteiniana sono testati giornalmente nei grandi acceleratori di particelle. Si noti che il cambiare il teorema della composizione delle velocità cambia tutta la meccanica, nonché i concetti stessi di spazio e tempo. Si ha infatti che eventi simultanei per un osservatore non lo sono più per un altro. Si consideri ad esempio un aereo che vola da Bologna a Roma e che giunto a metà del suo percorso riceve un segnale radio dalle due città. Per il personale di terra l'invio dei due segnali costituisce due eventi simultanei. Per il pilota Roma si sta avvicinando e Bologna si sta allontanando dal segnale, perciò il segnale arriva prima da Roma che da Bologna, perché si propaga sempre a velocità eventi simultanei per il personale di terra non lo sono per il pilota. La c. Due simultaneità non è un concetto assoluto. Per evento si intende un qualcosa che capita in un certo punto dello spazio a un certo istante. L'arrivo del segnale è un evento, un libro su un tavolo non è un evento, bensì una successione di eventi succedentesi con continuità. L'insieme di tutti gli eventi costituisce lo di coordinate (t, x, y, z). che sarà chiamata spazio-tempo cioè uno spazio a 4 dimensioni Un punto dello spazio ordinario è una curva nello spazio-tempo linea di mondo del punto materiale. Anche le unità di misura cambiano da un sistema di riferimento ad un altro in moto rispetto al primo. Le sbarre si contraggono nella direzione del moto, gli orologi battono il secondo più lentamente. Conseguentemente anche le leggi della dinamica subiscono delle modiche, che hanno come conseguenza una nuova visione della meccanica. I campi elettromagnetici possono essere inseriti in tale quadro in maniera molto elegante. 6 Capitolo 1 Meccanica newtoniana e relatività galileiana 1.1 Equazioni del moto Il mondo newtoniano è da intendersi costituito da punti materiali, ciascuno individuato da i 3 coordinate x , i = 1, 2, 3 che possiamo riunire in un vettore ~ x ∈ R3 e da un parametro m detto massa. Si denisce velocità la derivata ~v = d~x dt ~a = d2~x dt2 e accelerazione la derivata seconda La legge newtoniana del moto F~ = m~a è da interpretarsi come sistema di equazioni dierenziali per le traiettorie materiali ~xn (t) dei punti n = 1, ..., N soggetti al campo vettoriale di forze F~ (~x, ~v , t) d~x1 d~xN d2~xn ~ mn 2 = F ~x1 , ..., ~xN , , ..., ,t dt dt dt Abbiamo così un sistema di equazioni dierenziali ordinarie del secondo ordine che dà il moto dei punti materiali. 1.2 Sistemi di riferimento e osservatori Le coordinate ~x ≡ (x1 , x2 , x3 ) di un punto materiale sono date rispetto a un sistema di riferimento (per es. assi cartesiani). Cosa succede alle leggi del moto se si cambia sistema di riferimento? 7 8 CAPITOLO 1. MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA Qual è il sistema di riferimento (o i sistemi di riferimento) rispetto al quale le leggi del moto sono valide? Deniamo il concetto di osservatore: si dice osservatore O un sistema di riferimento con un pressato origine di assi coordinati (normalmente cartesiani, ma potremmo anche pensare ad altre coordinate: polari, ecc...) dotato di regoli per la misura di distanze (quindi 1 2 3 in grado di assegnare coordinate x , x , x ai punti materiali) e di un orologio (quindi in grado di misurare il tempo t). Deniamo anche il concetto di evento: si tratta di una entità denita da 4 coordinate: le 3 usuali coordinate spaziali identicanti un punto materiale e una coordinata temporale che ne ssa l'istante. Un evento è cioè un punto ~ x dello spazio R3 considerato a un certo tempo t. Osservatori diversi O, O0 , ... attribuiscono ad un evento delle coordinate (t, ~x), (t0 , ~x0 ) ecc... diverse l'uno dall'altro. Vogliamo correlare queste descrizioni dierenti per ottenere un'unica teoria invariante, cioè valida per tutti gli osservatori. 1.3 Trasformazioni di Galileo Un primo cambiamento possibile è il seguente t0 = t + τ ~x0 = ~x + ξ~ Questo cambiamento di coordiante è detto traslazione spaziale, mentre il parametro τ traslazione. Il vettore ξ implementa una descrive una dierenza nell'inizio del computo dei tempi per i due osservatori, lasciando per altro l'asse dei tempi del tutto identico sotto ogni altro aspetto per i due osservatori. Le traslazioni perciò dipendono da quattro costanti (3 nel vettore ξ~, una in τ) non dipendenti dal punto. Un altra trasformazione è la seguente t0 = t ~x0 = O~x in cui O è una matrice 3×3 ortogonale, cioè OOT = 1. Tali trasformazioni, come ben noto, lasciano invariata la lunghezza di un vettore e sono chiamate rotazioni. Ogni matrice ortogonale a 3 dimensioni ha 3 parametri indipendenti, che possono essere pensati per esempio come i 3 angoli di Eulero, e che descrivono completamente la rotazione. Il tipo di cambiamento di coordiante caratterizzante da un punto di vista sico è però t0 = t ~x0 = ~x + ~v t cioè la trasformazione tra due osservatori in moto relativo uniforme con velocità Si noti che abbiamo inserito in queste trasformazioni ben 10 parametri: ~v . 1.4. 9 TEOREMA DI ADDIZIONE DELLE VELOCITÀ 1. 1 relativo alla traslazione dell'origine dei tempi 2. 3 relativi alle traslazioni spaziali 3. 3 relativi alle rotazioni 4. 3 della velocità ~v di moto relativo dei sistemi di riferimento La più generica trasformazione di Galileo si ha operando contemporaneamente tutte e tre queste trasformazioni. chiama L'insieme di tutte le trasformazioni di Galileo forma gruppo e si gruppo di Galileo. La meccanica newtoniana è invariante sotto il gruppo di Galileo. 1.4 Teorema di addizione delle velocità Supponiamo di fare due successive trasformazioni di Galileo A : O → O0 e B : O0 → O00 ~x0 = ~x + ~vA t ~x00 = ~x0 + ~vB t eliminando la ~x0 otteniamo ~x00 = ~x + (~vA + ~vB )t che deve essere identica alla trasformazione diretta C : O → O00 ~x00 = ~x + ~vC t e quindi abbiamo il teorema di addizione delle velocità ~vC = ~vA + ~vB che è in un certo senso la legge di composizione del Gruppo di Galileo. Nelle trasformazioni di Galileo le velocità si sommano, come è accettabile anche dall'esperienza intuitiva. Sappiamo che la luce ha velocità c nei sistemi di riferimento in cui valgono le equazioni di Maxwell. Se vale il teorema di addizione delle velocità galileiano, allora le leggi di Maxwell non sono più invarianti per trasformazioni di Galileo. Se viceversa le equazioni di Maxwell sono valide in tutti i sistemi di riferimento inerziali, non vale più il teorema di addizione delle velocità, cioè le trasformazioni tra sistemi inerziali non possono più essere quelle di Galileo. Einstein scelse questa seconda ipotesi, cioè impose che c è un invariante e che le equazioni di Maxwell devono valere in tutti i sistemi di riferimento inerziali, restaurando il prinicipio di relatività ma rinunciando alle trasformazioni galileiane. 10 CAPITOLO 1. 1.5 Invarianza delle leggi della natura MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA Nella Fisica di Newton e Galileo, un qualunque corpo in moto con velocità ~ u rispetto 0 0 all'osservatore O avrà velocità ~ u = ~u + ~v rispetto all'osservatore O in moto rettilineo uniforme con velocità ~v rispetto al primo. Ciò si ottiene dalla denizione di velocità come derivata della coordinata. Poichè ~v è costante, la derivata seconda, cioè l'accelerazione, è invariante ~a0 = ~a e, assumendo che la massa m di un corpo sia una proprietà invariante per sistemi di riferimento, si ha che il primo membro delle leggi del moto è invariante di Galileo. Se il secondo membro sia invariante o meno dipende dalla forma delle forze. Gravitazione newtoniana tra due corpi 1 e 2 Gm1 m2 ~ F~12 = − k12 |~r12 |2 ~k12 = ~ r12 e ~ r12 = ~x1 − ~x2 dipende solo dalla distanza dei due corpi che è un |~ r12 | invariante per traslazioni e rotazioni, e anche per boosts a velocità costante. Perciò ove la gravità newtoniana è invariante di Galileo. Forze elettrostatiche la legge di Coulomb è pure invariante sotto trasformazioni di Ga- lileo se si ipotizza che la carica elettrica è una proprietà dei corpi invariante di Galileo. In generale ogni forza dipendente solo dalle distanze è invariante per trasformazioni di Galileo e quindi rende invarianti le equazioni newtoniane del moto. Tuttavia in natura sono note forze che dipendono non solo dalle posizioni ma anche dalle velocità, come capita nelle leggi di Maxwell per l'elettromagnetismo. Come abbiamo visto, è proprio sull'invarianza delle leggi di Maxwell che la relatività galileiana entra in crisi. Capitolo 2 Cinematica relativistica 2.1 Principi fondamentali La meccanica relativistica si basa su due principi fondamentali: Principio di inerzia Esiste almeno un sistema di riferimento inerziale in cui un corpo in quiete o in moto rettilineo uniforme perdura nel suo stato di quiete o di moto rettilineo uniforme se non è soggetto a forze esterne Si noti che se esiste un sistema di riferimento inerziale, ne esistono automaticamente inniti: tutti quelli in moto rettilineo uniforme rispetto al primo. Principio di Relatività ristretta Le leggi della sica sono le stesse (cioè hanno la stessa forma) in tutti i sistemi di riferimento inerziali. Dalle leggi di Maxwell si deduce che la velocità di propagazione delle onde elettromagnetiche è c. Poichè le leggi di Maxwell sono leggi universali della natura, ne si conclude che la velocità della luce c deve essere la stessa in tutti i sistemi di riferimento inerziali. Non esiste un etere o un sistema di riferimento assoluto. 2.2 Unità di misura naturali Poiché la velocità della luce deve essere uguale in tutti i sistemi di riferimento, viene naturale in relatività porla uguale a 1 e misurare tutte le altre velocità come frazioni della velocità della luce. Ciò corrisponde a introdurre nuove unità di misura, più convenienti per il tipo di problemi che andiamo a trattare, in cui i tempi e le lunghezze hanno la stessa unità di misura. Per esempio possiamo adottare il metro come unità di misura sia dello spazio che del tempo. Un metro di tempo corrisponde al tempo che impiega la luce a 1 percorrere un metro, cioè a secondi, ovvero circa 1/3 di nanosecondo. Conseguentemente, c tutte le velocità sono misurate da numeri puri. Quando diremo che un corpo ha velocità 2/3, intenderemo che si muove a una velocità pari a 2/3 della velocità della luce. 11 12 CAPITOLO 2. CINEMATICA RELATIVISTICA −1 Le accelerazioni saranno misurate in m , le masse continuano ad essere misurate in Kg, ma gli impulsi e le energie saranno pure misurati in Kg e le forze in Kg/m. Le formule si esprimono senza la ridondanza di fattori c, il che le rende più immediatamente signicanti dal punto di vista sico, ma per calcolare le grandezze nel tradizionale sistema metrico internazionale m, Kg, sec occorrerà tener conto dei fattori di conversione tra le unità di misura dei due sistemi. Alternativamente, si può scegliere il secondo come unità fondamentale. Allora le distanze saranno misurate in secondi-luce, cioè l'unità di misura delle lunghezze sarà la distanza percorsa dalla luce in un secondo, ovvero 300.000 Km circa. Una versione di questo sistema di misura più adatta alle distanze astronomiche è quella degli anni per i tempi e gli anni-luce per le distanze. 2.3 Trasformazioni di Lorentz 0 Consideriamo due sistemi di riferimento inerziali O e O , rispettivamente con coordinate x = (t, x, y, z) e x0 = (t0 , x0 , y 0 , z 0 ).1 La critica alla simultaneità implica che t 6= t0 , cioè che anche i tempi partecipano alle leggi di trasformazione tra sistemi di riferimento inerziali. 0 Cerchiamo delle trasformazioni x (x) che lascino invariante la velocità della luce. Le traslazioni e le rotazioni saranno uguali a quelle delle trasformazioni di Galileo, poichè mantengono invariante la lunghezza dei vettori (e perciò c in particolare). Una ovvia richiesta è che un corpo in moto rettilineo uniforme in O deve vedersi con O0 , altrimenti sarebbe violato il principio di inerzia, moto rettilineo uniforme anche in ovvero d~x = cost. in O dt x: Per esempio sull'asse vx0 ~v 0 = ⇔ ~v = dx0 dx0 dt = = 0 = dt dt dt0 0 ∂x0 dx + ∂x ∂x dt ∂y 0 ∂t0 dx + ∂t ∂x dt ∂y dy dt dy dt d~x0 = cost. in O0 dt0 + + ∂x0 dz ∂z dt ∂t0 dz ∂z dt + + ∂x0 ∂t ∂t0 ∂t dx = vx ecc... sono costanti per ipotesi. Perciò l'unico modo di garantire Ora, le derivate dt ∂x0 0 che vx sia costante è di richiedere che le derivate parziali ecc... siano anch'esse costanti. ∂x 0 Ma ciò implica che le funzioni x (x) siano funzioni lineari, cioè x0 = Ax dove A è una matrice 4×4 a elementi reali. Determiniamo gli elementi Aij ponendoci in una situazione sica che a prima vista può apparire semplicata, ma che in realtà non 1 Nel seguito indicheremo sempre i vettori tridimensionali in cui componenti saranno indicate con indici latini i x con R3 i = 1, 2, 3. ~x = (x1 , x2 , x3 ), le invece la notazione x a con la notazione Riserveremo vettori 4-dimensionali nello spazio-tempo. Dovendo enumerare le componenti di tali 4-vettori converremo di indicarle con indici greci xµ che corrono su 0,1,2,3 in cui 1,2,3 sono le coordinate spaziali e 0 quella temporale del 4-vettore. Useremo perciò le notazioni: x = (x0 , x1 , x2 , x3 ) = (x0 , ~x) 2.3. 13 TRASFORMAZIONI DI LORENTZ perde di generalità. Usando traslazioni e rotazioni, possiamo infatti sempre metterci nella situazione in cui il moto rettilineo uniforme relativo tra i due sistemi inerziali sia diretto 0 lungo l'asse x e stabilire l'origine dei tempi in modo tale che al tempo t = t = 0 le origini 0 e tutti gli assi dei due sistemi cartesiani coincidano. In istanti successivi, il sistema O , visto da O scorre y, z . lungo l'asse x a velocità costante v, mantenendo inalterata la direzione degli assi x deve coincidere, al tempo t = t0 = 0 con l'asse x0 , ciò signica che ogni 0 punto con coordinata y = 0 e z = 0 al tempo t = t = 0 deve avere forzatamente anche 0 0 nell'altro sistema y = 0 e z = 0. Ciò implica Se tutto l'asse A21 = A31 = 0 Lo stesso ragionamento applicato agli assi y e z comporta anche A12 = A32 = A13 = A23 = 0 Perciò le trasformazioni si riducono a t0 x0 y0 z0 L'origine O di O appare ad = = = = O0 A00 t + A01 x + A02 y + A03 z A10 t + A11 x A20 t + A22 y A30 t + A33 z muoversi di moto rettilineo uniforme lungo l'asse x0 , cioè ha le equazioni del moto x0 = A10 t y 0 = A20 t = 0 z 0 = A30 t = 0 e quindi A20 = A30 = 0 Invertendo le trasformazioni si ha t = x = y = z = in cui ∆ = A00 A11 − A10 A01 . A11 0 A02 0 A03 0 A01 0 t − y − z − x ∆ A22 A33 ∆ A00 0 A01 0 A02 0 A03 0 x − t − y − z ∆ ∆ A22 A33 (A22 )−1 y 0 (A33 )−1 z 0 Questa sono le trasformazioni inverse da O0 a O. Tuttavia queste devono ovviamente essere identiche in forma a quelle dirette scritte sopra con il 0 0 solo cambio v → −v . Perciò, nota l'assenza di y e z nelle trasformazioni di x e t dirette, 0 0 dovremo richiedere simmetricamente una assenza di y e z dalle trasformazioni di x e t inverse. Ciò conduce a A02 = A03 = 0 14 CAPITOLO 2. CINEMATICA RELATIVISTICA Pertanto le trasformazioni si semplicano nelle seguenti t0 x0 y0 z0 = = = = A00 t + A01 x A10 t + A11 x A22 y A33 z Finora abbiamo solo messo in opera considerazioni geometriche. Ma ora imponiamo che un fotone di luce che viaggia a velocità c = 1 in O , sia visto viaggiare alla stessa velocità c anche in O0 . Il fotone viaggerà in linea retta e perciò le sue equazioni del moto saranno x = n1 t in cui 2 ni c = 1. y = n2 t z = n3 t sono le componenti di un versore indicante la direzione del moto: Al tempo t + dt n21 + n22 + n23 = il fotone avrà incrementato la sua posizione di dx = n1 dt dy = n2 dt dz = n3 dt Ne consegue che la quantità dt2 − dx2 − dy 2 − dz 2 = 0 . Ragionando allo stesso modo nel sistema O0 (2.1) si avrà dt02 − dx02 − dy 02 − dz 02 = 0 (2.2) La versione innitesima delle trasformazioni ci permette di sostituire nella (2.2) i dieren0 0 ziali dx , dy , ... con gli analoghi dx, dy, ... ottenendo (A00 dt + A01 dx)2 − (A10 dt + A11 dx)2 − A222 dy 2 − A233 dz 2 = 0 Questa espressione deve essere proporzionale alla (2.1) poichè entrambe devono annullarsi. dt dx che sono assenti dalla (2.1) devono annullarsi, 2 uguagliati a meno di una quantità per ora arbitraria Q In particoalre i coecienti dei termini in mentre gli altri devono essere A00 A01 − A10 A11 = 0 (2.3) A211 − A201 = A222 = A233 = A210 − A200 = Q2 (2.4) La quantità arbitraria è indicata con Q2 in quanto, essendo tutti i coecienti Aij reali, è sicuramente positiva. La scelta della soluzione A22 = A33 = Q piuttosto che e z −Q, garantisce che nella trasformazione non ci sia un'inversione degli assi y (vedremo più avanti come sono trattate queste trasformazioni particolari). L'origine 2.3. 15 TRASFORMAZIONI DI LORENTZ degli assi O di O ha x = 0, perciò a un generico tempo t la trasformazione per questo particolare punto è x0 = A10 t (2.5) 0 0 procedere lungo l'asse x con velocità −v , quindi O gli 0 0 0 attribuisce l'equazione del moto x = −vt . Sostituendo t con t nella (2.5), ottenendo A10 0 0 x = A00 t si legano i parametri Aij alla velocità relativa dei due sistemi, che deve essere Questo punto O è visto da O0 l'unico parametro sico delle trasformazioni A10 = −vA00 e dalla (2.3) segue −vA11 = A01 Usando la (2.4) si ottiene A211 1 − v 2 = A200 1 − v 2 = Q2 da cui A11 = A00 = √ Come già commentato per A22 e A33 Q 1 − v2 Q. < 0 crescendo t anche qui scegliamo la soluzione positiva per Questa scelta è qui ancora più giusticata dal fatto che se fosse A00 t0 , cioè i due sistemi di riferimento avrebbero assi dei tempi rivolti in direzione diminuirebbe opposta, con nefaste conseguenze sulla causalità, ecc... Le trasformazioni di Lorentz diventano perciò con questa scelta √ t − vx t0 = Q √ L = −m 1 − v 2 1 − v2 x − vt x0 = Q √ 1 − v2 y 0 = Qy z 0 = Qz (2.6) A questo punto possiamo scrivere le traformazioni inverse, ricavandole dalla (2.6) t0 + vx0 t = Q−1 √ 1 − v2 0 x + vt0 x = Q−1 √ 1 − v2 y = Q−1 y 0 z = Q−1 z 0 (2.7) 16 CAPITOLO 2. oppure come trasformazioni con CINEMATICA RELATIVISTICA v → −v t0 + vx0 t = Q√ 1 − v2 x0 + vt0 x = Q√ 1 − v2 y = Qy 0 z = Qz 0 (2.8) Dal confronto della (2.7) e della (2.8) risulta evidente che la costante Q > 0 deve soddisfare Q = Q−1 , da cui Q = 1. Perciò in conclusione le trasformazioni di Lorentz sono t − vx t0 = √ 1 − v2 x − vt x0 = √ 1 − v2 0 y = y z0 = z (2.9) Spesso si introduce la notazione γ=√ 1 1 − v2 che semplica la forma delle trasformazioni di Lorentz t0 x0 y0 z0 La funzione γ(v), spesso detta fattore = = = = γ γ(t − vx) γ(x − vt) y z (2.10) relativistico di una trasformazione di Lorentz è tale che γ(v = 0) = 1 γ(v → 1) → ∞ e per velocità piccole (non relativistiche) ha lo sviluppo di Taylor 1 γ(v) ≈ 1 + v 2 + ... 2 2.4. 17 TRASFORMAZIONI DELLE VELOCITÀ 2.4 Trasformazioni delle velocità Supponiamo di avere un oggetto che viaggia con velocità ~ u = (ux , uy , uz ) nel sistema di 0 riferimento O . A quale velocità sarà visto viaggiare in O in moto rispetto a O a velocità v lungo l'asse x? Ovviamente, come abbiamo visto, non può valere un teorema di pure addizioni delle velocità, come avveniva con le trasformazioni di Galileo, in quanto sarebbe in contraddizione con l'invarianza della velocità della luce. Per dedurre la trasformazione delle velocità scriviamo le trasformazioni di Lorentz in forma innitesima dt0 dx0 dy 0 dz 0 = = = = γ(dt − v dx) γ(dx − v dt) dy dz da cui dx0 γ(dx − v dt) ux − v = = 0 dt γ(dt − v dx) 1 − ux v 0 dy dy uy = = = 0 dt γ(dt − v dx) γ(1 − ux v) 0 dz dz uz = = = 0 dt γ(dt − v dx) γ(1 − ux v) u0x = u0y u0z Questa è la formula relativistica di addizione delle velocità. Si noti come la modica rispetto alla pura addizione di Galileo si produca a causa del fatto che anche i tempi dt sono diversi nei due sistemi di riferimento. Ciò comporta leggi di trasformazione non banali uy , uz sebbene le coordinate y, z non subiscano variazioni. Inoltre, limitandoci x, se O vede un raggio di luce muoversi a velocità c = 1, O0 misurerà una velocità 1+v c0 = =1 1+v anche per le all'asse 18 CAPITOLO 2. CINEMATICA RELATIVISTICA cioè queste formule confermano l'invarianza della velocità della luce. Se un corpo si muove 1 1 0 a velocità ux = rispetto a O , e O si muove rispetto ad O a velocità v = , esso non sarà 2 2 0 visto da O muoversi a velocità 1, come erroneamente si potrebbe concludere applicando trasformazioni di Galileo, bensì a velocità u0x = 1 2 + 12 4 1 1 = 5 1+ 2 · 2 cioè a una velocità comunque inferiore a quella della luce. Per velocità relative tra i sitemi di riferimento piccole rispetto a quella della luce (v 1) le formule si riducono a quelle galileiane, come si può vedere facilmente espandendo le formule di trasformazione delle velocità per v → 0. Ciò spiega perché nell'esperienza comune l'addizione galileiana di velocità è assolutamente accettabile. Per esempio se due automobili si incrociano sull'autostrada a velocità ciascuna di 30 m/sec (circa 100 Km/h), ognuno dei due autisti dovrebbe giudicare, galileianamente, che l'altra auto gli viene incontro a 60 m/sec. Se invece applichiamo le formule relativistiche, −7 tenendo conto che in unità c = 1 la velocità di 30 m/sec è pari a circa 10 , avremo u0x = 2 · 10−7 = 2 · 10−7 (1 − 4 · 10−14 ) −14 1 + 4 · 10 ovvero la correzione è di 14 ordini di grandezza inferiore alla velocità stessa, assolutamente trascurabile. Se invece si incontrassero due astronavi vaiggianti ciascuna a velocità 0.99, cioè vicinissime alla velocità della luce, avremmo u0x = 0.99 + 0.99 1.98 = = 0.9995 < 1 2 1 + 0.99 1.981 comunque inferiore alla velocità della luce. 2.5 Diagrammi spazio-temporali Un modo utile per visualizzare la geometria dello spazio-tempo come emerge dalle trasformazioni di Lorentz è quello di ricorrere ai cosiddetti diagrammi spazio-temporali. Iniziamo con il semplicare il nostro problema pensando allo spazio come a una retta unidimensionale. Allora lo spazio-tempo sarà rappresentato da un piano bidimensionale con coordinate (x, t). 2.5. 19 DIAGRAMMI SPAZIO-TEMPORALI Le bisettrici x = ±t di questo graco rappresentano le linee lungo cui si propagano raggi di luce passanti per il qui e ora cioè l'origine degli assi x = vt lanciata dall'origine in moto rettilineo uniforme tan ϕ = 1/v , inclinazione x = t = 0. Una particella sarà rappresentata da una retta di come la linea verde in gura. Questa rappresentazione della sua traiettoria nello spazio-tempo viene detta linea di mondo. Una particella in moto non uniforme potrà percorrere linee di mondo curve più complicate, come per esempio la linea blu, la cui tangente punto per punto avrà inclinazione pari a 1/v in quell'istante. Tuttavia se la particella si mantiene sempre a velocità minore di quella della luce inclinazione dovrà essere sempre maggiore di minori di ◦ 45 ◦ 45 v < 1, la sua su questo graco. Linee con inclinazioni corrispondono a ipotetici corpi viaggianti a velocità maggiori di c (tachioni). Vedremo tra breve che tali oggetti non possono esistere, pena la violazione dell'ordinamento causale degli eventi. O, x e t sono visibilmente ortogonali. Le linee di eventi giudicati simultanei dall'osservatore O sono ovviamente rette parallele all'asse x, cioè aventi equazione t = cost. Analogamente corpi fermi rispetto ad O saranno rappresentati da linee di mondo parallele all'asse t, cioè da rette di equazione x = cost. Nel sistema di riferimento qui disegnato, che chiameremo gli assi Ci possiamo ora chiedere come possano essere rappresentati su questo diagramma gli O0 in moto rispetto ad O a velocità v . Le assi di un nuovo sistema di riferimento inerziale trasformazioni di Lorentz ci dicono che x0 = γ(x − vt) t0 = γ(t − vx) x0 , ovvero la retta di equazione t0 = 0, sarà dato sul nostro piano (x, t) 0 0 dalla retta t = vx e l'asse dei tempi t , ovvero la retta di equazione x = 0, sarà dato 1 0 dalla retta t = x. L'osservatore O giudica eventi simultanei quelli che giacciono su rette v t0 = cost., cioè t = vx + cost. . Prendiamo per esempio il luogo geometrico degli eventi che O γ Perciò l'asse delle giudica simultanei e vericantesi dopo 1 metro (ricordiamo che stiamo misurando il tempo 0 in metri!) dal qui ed ora. Questi saranno sulla retta t = 1. Ma per O gli eventi simultanei 1 0 dopo 1 metro saranno t = 1, cioè t = vx + . Non solo la retta degli eventi simultanei γ 20 per CAPITOLO 2. O0 è inclinata rispetto a quella di modicata di una quantità 1/γ , O, CINEMATICA RELATIVISTICA ma anche l'unità di misura del tempo ne risulta come vedremo meglio più avanti. La cosa più sorprendente è che apparentemente il sistema di riferimento più ortogonale. L'angolo tra gli assi non è uguale a ◦ 90 O0 non sembra !. Tuttavia questa non ortogonalità è solo apparente. Infatti ciò che determina l'ortogonalità non è l'angolo tra gli assi, ma l'annullarsi del prodotto scalare tra i vettori della base. Ora, il teorema che aerma che ~x · ~y = |~x||~y | cos ϑxy ove ϑxy è l'angolo compreso tra i due vettori, è vero solo in geometria euclidea. Cominciamo a capire che la geometria dello spazio-tempo non è di tipo strettamente euclideo. In geometria euclidea la distanza ta due punti, per esempio tra l'origine e un punto P 2 2 2 di coordinate (x, y) è data da s = x + y , come ben nota conseguenza del Teorema di Pitagora. La cosa importante è che, mentre un cambiamento di base nello spazio euclideo può far variare le coordinate del punto P, la sua distanza dall'origine rimane invariata. Passando infatti da una base ortogonale a un'altra, la trasformazione che opero è, nel caso 2 euclideo, una rotazione. Ora, qualunque rotazione lascia invariata la quantità s . Si dice infatti in geometria che le rotazioni sono isometrie, ovvero trasformazioni di coordinate che lasciano invariata la distanza tra punti. Le traslazioni e le rotazioni nello spazio euclideo sono isometrie. Vediamo se anche nel nostro spazio-tempo vale una simile relazione, cioè se la distanza 2 2 2 spazio-temporale tra due eventi si può scrivere come σ = x + t . Se così fosse, dovrei trovare che questa quantità è invariante per le trasformazioni che richiedo essere isometrie del mio spazio-tempo. Ciò che deve restare invariante per cambiamenti di coordinate nello spazio-tempo è la velocità della luce, che abbiamo visto condurre alle trasformazioni di Lorentz. Perciò le nostre isometrie sono le trasformazioni di Lorentz. Se applico tali 2 trasformazioni alla quantità σ sopra denita, mi accorgo subito che essa non è invariante: 02 2 σ 6= σ . Invece lo è la quantità τ 2 = t2 − x2 . Infatti τ 02 = t02 − x02 = γ 2 [(t − vx)2 − (x − vt)2 ] = γ 2 (1 − v 2 )(t2 − x2 ) = τ 2 2.6. PRODOTTO SCALARE IN MN 21 Dunque la geometria è drasticamente diversa nello spazio-tempo rispetto allo spazio 3 normale. Mentre il nostro spazio può essere assimilato allo spazio euclideo R , lo spazio4 4 tempo non è banalmente un R , o più precisamente, è isomorfo a R come spazio vettoriale, 4 ma non come spazio metrico. Chiameremo questo spazio M , la lettera M essendo scelta in onore del matematico Minkowski che, negli anni immediatamente seguenti al 1905, formalizzò questo tipo di spazi proprio pensando all'applicazione in relatività stimolata da Einstein. Dunque nello spazio-tempo di Minkowski non vale il teorema di Pitagora tradizionale, ma piuttosto un teorema di Pitagora alla rovescia con il segno meno e dove l'ipotenusa è sempre minore di uno dei due cateti! 2.6 Prodotto scalare in MN È chiaro che in una simile situazione geometrica anche il prodotto scalare va rivisto. Infatti la distanza di un punto dall'origine può essere pensata come la norma del vettore che 2 identica quel punto. Tornando al nostro esempio bidimensionale, in R tale norma è data 2 2 2 da |~ x| = x + y = ~x · ~x e risulta, per quanto detto, essere un invariante per trasformazioni 2 isometriche. Invece in M , ove un punto, o meglio un evento, è identicato dal vettore x = (t, x) la norma invariante sarà |x|2 = x · x = t2 − x2 . Vediamo subito che il prodotto 2 scalare è denito in modo diverso. In R esso era denito come ~a · ~b = a1 b1 + a2 b2 ma ciò porterebbe alla denizione di distanza s2 che non va bene in Minkowski. Qui dobbiamo assumere un prodotto scalare denito come a · b = a0 b0 − a1 b1 ove abbiamo indicato con l'indice 0 la coordinata temporale e con 1 quella spaziale dei nostri vettori. In questo modo la norma di un vettore e il prodotto scalare stesso risulta essere invariante di Lorentz. Tornando al caso 4-dimensionale sico, il prodotto scalare in M4 sarà dato da a · b = a0 b 0 − a1 b 1 − a2 b 2 − a3 b 3 Pensando al prodotto scalare come moltiplicazione riga per colonna di vettori, mentre nel 3 caso euclideo R si ha immediatamente 3 b1 X (a1 , a2 , a3 ) b2 = ai bi i=1 b3 nel caso minkowskiano occorre inserire una opportuna matrice 1 0 0 0 b0 0 −1 0 b1 0 (a0 , a1 , a2 , a3 ) 0 0 −1 0 b2 0 0 0 −1 b3 3 X = aµ ηµν bν µ,ν=0 22 CAPITOLO 2. CINEMATICA RELATIVISTICA Useremo in generale indici latini quando ci riferiremo a spazi euclidei e indici greci per spazi di tipo Minkowski. Gli spazi minkowskiani talvolta vengono anche detti spazi pseudoeuclidei. La matrice η di elementi ηµν metrica viene detta N sarebbe invece banalmente la matrice identità a dello spazio dimesioni 1N . M4 . La metrica di RN Talvolta la notazione dei 4-vettori ora introdotta viene abbreviata indicando solo due simboli nel vettore riga o colonna: la componente temporale a0 e il 3-vettore delle componenti spaziali ~a. In questo modo la formula per il prodotto scalare diventa (a0 , ~a) In M2 1 ~0 ~0 −13 b0 ~b = a0 b0 − ~a · ~b la metrica è semplicemente η= 1 0 0 −1 Verichiamo che con tale metrica anche il sistema apparenze. In O O0 risulta ortogonale, nonostante le i vettori della base sono e0 = 1 0 , e1 = 0 1 ed evidentemente il loro prodotto scalare da proprio gli elementi di η: eµ · eν = ηµν come facile vericare. Perciò i vettori della base sono ortogonali. Trasformiamo questi vet0 tori secondo Lorentz in una nuova base per O che si muove a velocità v . La trasformazione di Lorentz si può scrivere in forma matriciale come t0 x0 1−v 0 =γ 1 −v −v 1 t x perciò e00 =γ , e01 =γ 0 1−v ed è quindi immediato vericare che anche i loro prodotti scalari vericano e0µ · e0ν = ηµν Dunque, anche se a prima vista gracamente diremmo che i due assi di O0 non sono ortogonali, in realtà essi vericano le condizioni di ortogonalità come quelli di O. È il concetto di ortogonalità che si modica nello spazio di Minkowski poiché la metrica, che appunto determina i prodotti scalari, non è più 1 ma η. Si noti come i vettori della base ortonormale, che in uno spazio euclideo prenderemmo ±1. Infatti |e0 |2 = 1, ma |e1 |2 = −1. Equivalentemente, det η = −1 < 0. La metrica non è denita positiva e ciò ha come normalizzati a 1, qui sono in realtà normalizzati a conseguenza che possono esistere vettori a norma nulla che non sono nulli, mentre in uno spazio euclideo questo era garantito. 2.7. 2.7 23 CONO-LUCE, PASSATO, PRESENTE, FUTURO Cono-luce, passato, presente, futuro I vettori in MN , cioè in qualunque spazio con metrica non denita positiva, si possono dividere come segue 1. vettori di tipo tempo, aventi |x|2 > 0 2. vettori di tipo spazio, aventi |x|2 < 0 3. vettori di tipo luce, aventi |x|2 = 0. Questi ultimi deniscono un ipercono nello spazio cono-luce. M4 di equazione t2 − ~x2 = 0, detto I vettori di tipo tempo si trovano all'interno di questo cono e quelli di tipo spazio all'esterno. L'origine del cono coincide con il qui e ora composto da due falde: una di coordinate detta cono del passato. t>0 detta cono del O. Il cono è ovviamente futuro, In gura ne diamo una rappresentazione in M 3 l'altra con t<0 . L'asse dei tempi in gura è orientato verticalmente dal basso verso l'alto. Il vertice dei due coni è l'evento qui e ora O. La supercie del cono superiore è il luogo geometrico delle traiettorie di raggi di luce emessi in O. L'interno del cono superiore rappresenta gli O e viaggiando v > 1). eventi che potrò raggiungere in futuro partendo da breve che è impossibile viaggiare o comunicare a a v < 1. (vedremo tra Analogamente la supercie del cono inferiore è il luogo geometrico di eventi passati che possono aver emanato un raggio di luce che mi raggiunge qui e ora in O. Lo spazio, stelle, galassie, ecc... che vedo (cioè sto osseervando) ora tramite segnali luminosi (o radio, IR, 4 UV, X...) è dato proprio da questa supercie conica (che in M sarebbe di dimensione 3, 3 quindi uno spazio R ). L'interno del cono inferiore è l'insieme degli eventi di partenza di un mezzo di trasporto o un segnale viaggiante a v<1 che raggiunge O qui e ora. 24 CAPITOLO 2. Risulta perciò evidente che l'evento O può essere inuenzato causalmente solo dagli eventi appartenenti al cono inferiore, mentre eventi appartenenti al cono superiore. CINEMATICA RELATIVISTICA O stesso può inuenzare causalmente solo Ciò giustica la nomenclatura di passato data al cono inferiore e quella di futuro data al cono superiore. La regione esterna ai due coni non presenta alcuna possibile connessione causale con presente O e ad essa viene dato, forse con un certo abuso di termini, il nome di . Il piano (in 4 3 M sarebbe un iperpiano R ) perpendicolare all'asse dei tempi e passante per O costituisce l'insieme di tutti gli eventi simultanei a prende il nome di adesso. O nel sistema di riferimento in cui O è a riposo e I concetti di presente e adesso, che abitualmente consideriamo come equivalenti, sono distinti in relatività e tornano a coincidere solo nel limite in cui la velocità della luce diventa innita. In tale limite i coni si allargherebbero no a coincidere 3 con il piano dell'adesso. Si noti, equivalentemente, che abbiamo identicato due spazi R in quanto detto sopra, non coincidenti. Uno è lo spazio degli adesso, coiè denito dagli eventi simultanei. L'altro è lo spazio visibile che comprende eventi che vedo adesso, ma capitati nel passato. Se vedo oggi esplodere una supernova nella Grande Nube di Magellano, sto ossevando ora un evento capitato circa 160.000 anni fa. Ciò che si trova al posto di quella supernova ora, nel senso di simultaneamente a me adesso, mi è sconosciuto. Fa parte degli eventi del presente, di cui non posso avere informazione. Se decido ora di mandare una sonda per esplorare quella supernova, a velocità vicinissima a quella della luce, essa raggiungerà la supernova tra 160.000 anni, quando la sua linea di mondo incontrerà il mio cono del futuro. 2.8 Rapidità Continuiamo a restringerci per semplicità allo spazio-tempo bidimensinale M2 . Un altro modo di scrivere le trasformazioni di Lorentz fa uso delle funzioni iperboliche cosh θ = eθ + e−θ 2 , sinh θ = eθ − e−θ 2 per le quali vale l'identità cosh2 θ − sinh2 θ = 1 analoga a quella per funzioni trogonometriche ordinarie, ma con il segno meno, proprio ciò che distingue l'invariante di Lorentz da un comune invariante per rotazioni. Ricordiamo che cosh θ = cos iθ , sinh θ = i sin iθ e che, per denizione sinh θ cosh θ θ −θ Poiché e > 0 e e > 0, allora cosh θ > 0, per tutti i θ. Invece sinh θ può essere sia positivo che negativo (è una funzione dispari di θ , mentre cosh θ è pari). Tuttavia è sempre tanh θ = | sinh θ| < | cosh θ| 2.8. 25 RAPIDITÀ fe quindi | tanh θ| < 1, per tutti i θ. Valgono le espansioni in serie attorno a θ=0 1 sinh θ ≈ θ + θ3 + O(θ5 ) 6 1 cosh θ ≈ 1 + θ2 + O(θ4 ) 2 1 tanh θ ≈ θ − θ3 + O(θ5 ) 3 Poniamo il nome di v = tanh θ rapidità. √ nelle trasformazioni di Lorentz. Il parametro s 1 − v2 = 1− sinh2 θ 1 = 2 cosh θ cosh θ =⇒ γ = cosh θ e quindi t0 = t cosh θ − x sinh θ x0 = x cosh θ − t sinh θ ovvero θ così denito prende Avremo t0 x0 = cosh θ − sinh θ − sinh θ cosh θ t x , γv = sinh θ 26 CAPITOLO 2. CINEMATICA RELATIVISTICA Così scritte, le trasformate di Lorentz hanno una fortissima analogia con una rotazione di angolo θ degli assi in un piano euclideo, dove però qui θ → iθ. Possiamo allora pensare alle trasformazioni di Lorentz come a una sorta di speciali rotazioni (iperboliche) nello spazio-tempo. La legge di composizione delle velocità, in termini delle rapidità prende una forma particolarmente interessante. Essa infatti può essere scritta come tanh θB = per la trasformazione da un sistema a OA . tanh θA − tanh θAB 1 − tanh θA tanh θAB OA e uno OB viaggiante a velocità relativa vAB rispetto Questa risulta essere proprio la formula di addizione delle tangenti iperpoliche, da cui si deduce θB = θA − θAB ovvero, mentre in relatività le velocità non rispettano più una legge di somma, le rapidità seguono un principio di addizione. Per piccole velocità v = tanh θ ≈ θ + ... e quindi il teorema di addizione delle rapidità equivale in questo limite al teorema di addizione delle velocità galileiano. 2.9 Invarianza dell'ipervolume Ritorniamo ora al diagramma dello spazio M2 di coordinate (t, x). Un corpo che si muova alla velocità della luce viaggia lungo la prima o la seconda bisettrice. Posso pensare di riscrivere le trasformazioni di Lorentz usando le coordinate t ± x = ξ± dette coordinate di cono-luce. Avrò ξ 0± = e±θ ξ ± 2 2 2 2 + − L'invariante di Lorentz τ = t − x è ora dato semplicemente dal prodotto τ = ξ ξ . Le ± linee ξ = cost. sono le parallele alle bisettrici e segnano la propagazione di raggi di luce. 2.10. 27 IPERBOLI INVARIANTI, STABILITÀ DEL CONO-LUCE Se costruisco un quadrato e poi lo trasformo secondo Lorentz può succedere per esempio + − che la sua ξ sia dimezzata, ma allora la sua ξ sarà contemporaneamente raddoppiata, 4 sicchè l'area rimane costante. Applicando questo ragionamento a tutto lo spazio M e non solo al diagramma semplicato bidimensionale, possiamo aermare che l'ipervolume Ω di una gura geometrica 4-dimensionale è un invariante di Lorentz. d4 x = dt dx1 dx2 dx3 è un invariante. In particolare il volumetto innitesimo 2.10 Iperboli invarianti, stabilità del cono-luce Le rotazioni del piano euclideo mantengono invariate le circonferenze e ciò perché l'equazione della circonferenza si scrive x2 + y 2 = cost. Ciò che funge da analogo della circonferenza nello spazio-tempo di Minkowski sono le iperboli t2 − x2 = cost. Esse sono iperboli equilatere aventi come asintoti le bisettrici η = cost. e ξ = cost. La trasformazione di Lorentz non fa altro che far scorrere i punti del piano su queste iperboli (come ad esempio per i vertici del quadrato di cui sopra) che vengono perciò dette invarianti. iperboli 28 CAPITOLO 2. CINEMATICA RELATIVISTICA Se allora un punto è vincolato a scorrere su queste iperboli, esso si potrà trovare o su ± una iperbole del I-III quadrante rispetto a ξ , oppure su una del II-IV, oppure sugli assi ξ ± . Poichè le bisettrici sono mandate in se stesse dalle trasformazioni di Lorentz, non è possibile per un punto fuori di esse attraversarle. Esse dividono nettamente lo spazio-tempo in 3 regioni che vengono trasformate in se stesse. Si vede così che una trasformazione di Lorentz manda eventi del cono del futuro sempre in eventi dello stesso cono del futuro. Analogamente capita con passato e presente. Si dice che le tre regioni passato, presente e futuro sono sottoinsiemi stabili, cioè mappati in se stessi dalle trasformazioni di Lorentz. Le trasformazioni di Lorentz hanno quindi la piacevole caratterisitica di non cambiare la posizione di un evento: se esso, per esempio, O, apparterrà anche al futuro di qualunque sistema O e in moto relativo inerziale rispetto a quello in cui O è a riposo. appartiene al futuro di di riferimento centrato in Le trasforma- zioni di Lorentz, perciò, tendono a conservare la succesione causale degli eventi e questa è una proprietà cruciale per una struttura geometrica che voglia pretendere di rappresentare il mondo sico. 2.11 Ordinamento causale e velocità maggiori di c. in relatività ristretta non può esistere alcun agente sico che si propaghi a velocità maggiore di quella della luce. Le trasformazioni di Dimostriamo ora che Lorentz sono valide per diventa immaginario. v < 1, poiché per v =1 il denominatore si annulla e per v >1 Si potrebbe però obbiettare che ciò non dimostra aatto che non possano esistere velocità superiori a quella della luce. Infatti per v≥1 le trasformazioni potrebbero essere diverse. Tuttavia ora mostreremo che ciò porta ad un assurdo, usando solo trasformazioni di Lorentz per v < 1. ∆x nello spazio e ∆t nel tempo; siano (t1 , x1 ) le coordinate dell'evento 1 e (t2 , x2 )le coordinate dell'evento 2. ∆x = x1 − x2 ∆t = t1 − t2 > 0, cioè l'osservatore O vede l'evento 2 avvenire prima dell'evento 1. Dalle Supponiamo di avere due eventi che siano distanti cioè e 2.12. 29 CONTRAZIONE DELLE LUNGHEZZE trasformazioni di Lorentz abbiamo subito che per un altro osservatore ad O a velocità v O0 in moto rispetto questi intervalli saranno ∆x0 = γ(∆x − v∆t) ∆t0 = γ(∆t − v∆x) 0 E' possibile che O veda l'evento 1 avvenire prima di 2? ∆t0 < 0, ovvero ∆t < v∆x da cui Perchè ciò accada deve essere ∆t <v<1 ∆x Tali O con velocità v sodisfacente a queste v esistono se ∆t < ∆x, cioè se l'intervallo O è minore del tempo che impiega la luce per Quindi tutti i sistemi che traslano rispetto al sistema diseguaglianze vedono prima 1 e poi 2. temporale tra i due eventi per l'osservatore andare da 2 a 1. Supponiamo che l'evento 1 sia provocato dall'evento 2, cioè che esista una relazione di causa-eetto tra i due eventi nella sequenza 2 → 1. E' chiaro che se trovo un osservatore per il quale la sequenza di eventi è invertita ho violato la causalità. Se esiste tale causalità, allora essa sarà dovuta a un agente sico propagantesi da 2 a 1. Questo agente sico si propaga a una velocità u= ∆x ∆t Se u < 1 non ci sono velocità v tali da invertire la sequenza degli eventi 2 → 1, perché ∆t/∆x = 1/u > 1. Se invece supponiamo per assurdo che tale agente sico si propaghi con una velocità u > 1, potremo sempre trovare una velocità v < 1 alla quale si mouve un 0 osservatore O per il quale la sequenza di eventi appare invertita (1 → 2) e ciò è chiaramente impossibile in quanto violerebbe la causalità. Se ne conclude che nessun segnale, sia esso composto da corpi dotati di massa o meno, può propagarsi a velocità maggiore di quella della luce senza violare la causalità. La velocità della luce rappresenta quindi un limite massimo di propagazione di qualunque informazione nello spazio-tempo. 2.12 Contrazione delle lunghezze Immaginiamo di avere una sbarra nell'origine O e l'altra in un punto OA di lunghezza L ferma in O A lungo l'asse x, cioè tale che ∀t, e avente un'estremità x o = 0 xA = L Per le trasformazioni di Lorentz, lo stesso punto avrà in un sistema inerziale rispetto a O a velocità v lungo l'asse x le seguenti coordinate x0o = −γvto t0o = γto O0 in moto 30 CAPITOLO 2. e quindi O x0o = −vt0o , come è logico che sia, poiché allontanarsi a velocità −v . O0 CINEMATICA RELATIVISTICA vede questo punto sso nell'origine di Analogamente per il punto x0A = γ(L − vtA ) A t0A = γ(tA − vL) La misura di lunghezza della sbarra viene eettuata da entrambi gli osservatori misurando simultaneamente le coordinate dei punti estremi per per La condizione t0o = t0A O: L = xA − xo O0 : L0 = x0A − x0o D'altronde la dierenza x0A − x0o x0A lunghezza L A e calcolandone la dierenza, cioè a tempi uguali a tempi uguali O0 − x0o v L) c2 ⇒ to = tA t0o = t0A tA − to = v L c2 si trasforma come v2 = γ[L − v(tA − to )] = γL 1 − 2 c giudica che la lunghezza di una sbarra misurata da O essere di sia di lunghezza L0 = Poiché e si traduce in γto = γ(tA − da cui discende che O γ > 1, è sempre L γ L0 < L e si ha il fenomeno noto come contrazione relativistica delle lunghezze. Una sbarra a 30 m/sec (velocità tipica di un auto sull'autostrada) sarebbe contratta 10−14 volte la sua lunghezza a riposo. Ma a velocità vicine di una quantità dell'ordine di a quelle della luce la contrazione può arrivare a essere quasi totale. Si noti che questo modo di misurare la posizione degli estremi simultaneamente non tiene conto dei ritardi di segnale dovuti alla velocità nita della luce, e non è ad essi dovuto, ma alla particolare natura della geometria pseudoeuclidea dell spazio-tempo. 2.13 Dilatazione dei tempi Associata alla contrazione delle lunghezze si ha sempre anche una dilatazione dei tempi. Supponiamo di avere un orologio fermo nell'origine degli assi di O che possiamo schematiz- zare come una serie di eventi equidistanti (il battito dei secondi, per esempio) lungo l'asse t. Sia la distanza tra i primi due di questi eventi T . Cioè il primo evento O si trova in to = xo = 0 e il secondo A (l'altro estremo dell'intervallo temporale OA di lunghezza T ) in tA = T e xA = 0. O0 vede i due eventi a tempi t0o = 0 t0A = γtA 2.14. 31 PARADOSSO DEI GEMELLI e quindi giudica che l'intervallo temporale trascorso sia T 0 = t0A − t0o = γtA dunque con una dilatazione dei tempi T 0 = γT 2.14 Paradosso dei gemelli Supponiamo che si voglia fare un viaggio dalla Terra ad α-Centauri (distanza misurata 4 dalla Terra L = 4 anni-luce) a v = c = 240.000 Km/sec. La luce impiega 4 anni per 5 arrivare ad α-Centauri. I terrestri (sistema O ) vedono l'astronave impiegare 5 anni per raggingere la stella. Per questo problema conviene adottare come unità di misura aventi c=1 l'anno peer i tempi e l'anno-luce per le misure spaziali. Sull'astronave c'è un orologio che scandisce il tempo. Visto dagli astronauti, questo orologio è del tutto regolare, mentre da Terra lo si vede andare più lentamente e gli stessi astronauti invecchiano più lentamente dei loro gemelli terrestri. Per quanto visto, un intervallo di tempo dell'astronave sarà visto da Terra dilatato di un fattore γ=√ 5 1 = 3 1 − v2 Quindi mentre sulla Terra sono passati 5 anni, sull'astronave ne sono passati 3 e quindi gli astronauti dicono di impiegare 3 anni per fare il viaggio. Ma gli astronauti viaggiano 4 sempre alla velocità v = e dicono che il viaggio è più corto perché è più breve il percorso. 5 3 0 Infatti per la contrazione delle lunghezze per loro sarà L = L, cioè per gli astronauti 5 12 la distanza Terra α-Centauri è di = 2, 4 anni-luce. Dunque l'evento A di arrivo su 5 α-Centauri avrà coordinate x=4 t=5 x0 = 0 t0 = 3 nel sistema nel sistema O O0 della Terra dell'astronave Tuttavia questo calcolo fa sorgere un apparente paradosso. La perfetta relatività dei movimenti fa sì che gli astronauti possano assumere di essere fermi e che invece sia la Terra 4 a muoversi a v = e percio` essi vedono gli eventi terrestri svolgersi più lentamente di 5 5 un fattore di dilatazione . Allora dati due gemelli, uno dei quali rimane sulla Terra e 3 l'altro invece fa parte dell'equipaggio, il gemello terrestre vedrebbe il gemello astronauta invecchiare meno rapidamente di lui, mentre il gemello astronauta vedrebbe quello terrestre invecchiare meno di lui. Chi invecchia meno in realtà? 32 CAPITOLO 2. CINEMATICA RELATIVISTICA Il paradosso si risolve rendendosi conto che due sistemi di riferimento inerziali viaggiano necessariamente con moto rettilineo uniforme uno rispetto all'altro e che perciò nchè si rimane in questa situazione non vi sarà modo per i due gemelli di reincontrarsi e paragonare eettivamente le loro età. Per fare ciò, l'astronave deve invertire il suo moto e tornare verso la Terra. Ma questo equivale a dire che deve necessariamente rallentare e passare quindi per stati di moto accelerato per i quali non valgono più le trasformazioni di Lorentz. Tralasciando il problema della decelerazione e poi nuova accelerazione in senso opposto dell'astronave, immaginiamo che il gemello astronauta, una volta arrivato ad α-Centauri, 0 00 salti dal sistema di riferimento inerziale O di andata verso la stella a quello O di ritorno. 0 Eventi simultanei per il sistema di andata sono individuati da rette parallele all asse x del 00 sistema di andata, e queste rette sono ben diverse da quelle parallele all'asse x del sitema di ritorno. Il gemello astronauta, nell'evento A in cui arriva su α-Centuari ed è ancora solidale al O0 , descrive gli eventi che lui giudica simultanei al suo arrivo, come 0 il luogo geometrico dato dalla retta parallela all'asse x e passante per l'evento A cioè nel sistema di riferimento 2.14. 33 PARADOSSO DEI GEMELLI sistema di coordinate di O0 dalla retta t0 = 3 Questa viene trasformata nel sistema O della Terra nella retta di equazione 5 3= 3 ovvero 4 x+ t 5 9 4 t= x+ 5 5 9 = 1, 8 anni. Questo è 5 il tempo che il gemello astronauta giudica sia passato sulla Terra durante il suo viaggio di che intercetta l'asse x=0 su cui rimane la Terra a un tempo t= andata. Ora l'astronauta inverte bruscamente la rotta, cioè salta istantaneamente su un altro 00 sistema di riferimento O in cui la retta degli eventi simultanei con A è data dalla equazione 4 41 t=− x+ 5 5 che è la retta di inclinazione data dall'inverso della velocità (negativa) di ritorno che passa 0 00 per l'evento A. L'astronauta, durante il salto da O a O vede trascorrere istantaneamente 9 tutti gli eventi terrestri dal tempo = 1, 8 anni al tempo 41 = 8, 2 anni. Cioè un intervallo 5 5 di 6,4 passa istantaneamente sulla Terra per giudizio dell'astronauta. Ovviamente questo salto istantaneo non è sicamente possibile. La decelerazione e successiva accelerazione deve durare un certo tempo e i tempi terrestri vengono visti scorrere più velocemente ma non istantanemaente per eetti di trasformazioni tra sistemi di riferimento accelerati che tratteremo in relatività generale. Per ora basti sapere che al suo ritorno sulla Terra il gemello astronauta sarà invecchiato in totale di 6 anni, mentre il suo gemello terrestre sara` invecchiato di 10 anni. Questa asimmetria è dovuta proprio al fatto che l'astronauta ha dovuto cambiare sistema di riferimento inerziale mentre il gemello terrestre no. Si noti che anche in questa analisi del paradosso dei gemelli non si tiene conto della velocità di propagazione del segnale. Gli eetti di dilatazione dei tempi e contrazione delle lunghezze sono dati esclusivamente da considerazioni sul concetto di simultaneità come giudicato dai diversi sistemi di riferimento inerziali in gioco. Se invece volessimo tener conto della propagazione dei segnali alla velocità c, la descri- zione dei fenomeni sarebbe diversa. L'astronauta vedrebbe gli eventi terrestri dei primi 1,8 anni raggiungerlo molto lentamente, mentre i successivi lo raggingerebbero rapidamente durante il viaggio di ritorno, cosicchè al momento del rientro sulla Terra l'astronauta è aggiornato su tutti gli eventi accaduti sul pianeta nel decennio trascorso. Tuttavia egli è conscio che ciò che vede a un certo istante sulla Terra è in realtà avvenuto tempo prima ed è a lui arrivato tramite un segnale luminoso che ci ha messo un certo tempo, così come quando vediamo esplodere una supernova non diciamo ora è esplosa la supernova ma, 34 CAPITOLO 2. CINEMATICA RELATIVISTICA se questa si trova per esempio a 1000 anni-luce da noi, diciamo 1000 anni fa è esplosa una supernova nella costellazione tal dei tali, ecc.... Attribuiamo cioè all'evento esplosione della supernova una proprietà di simultaneità con gli eventi terrestri di 1000 anni fa, non con quelli di oggi. È questa simultaneità che viene distorta dalle trasformazioni di Lorentz. L'eetto non è dovuto solo al trasmettersi a velocità nita dei segnali. 2.15 Tempo proprio Si denisce tempo proprio τ di un sistema di riferimento il tempo misurato dagli orologi posti a riposo nel sistema di riferimento dato. Si ponga attenzione nel distinguere il tempo proprio dal tempo coordinata. Il tempo coordinata vuol dire semplicemente la dierenza tra la coordinata tempo di due eventi. L'evento partenza e l'evento arrivo su α-Cen dell'astronave, nell'esempio del paragrafo precedente, sono distanziati di 5 anni per l'osservatore terrestre O. Tempo proprio è quello sperimentato dall'astronave per chi è sopra l'astronave. Essa, nel sistema dell'astronave O0 è ferma. Ora, abbiamo visto che dt02 − d~x02 = dt2 − d~x2 è un invariante per trasformazioni di Lorentz. Nel sistema dell'astronave d~x0 = 0 e dt0 è il tempo segnato dagli orologi dell'astronave, cioè è contemporaneamente tempo proprio e tempo coordinata dell'astronave. dτ 2 = dt2 − d~x2 Ma d~ x dt = ~v e quindi, indicando con v = |~v | √ dτ = dt 1 − v 2 cioè si riottiene il tempo dilatato, cioè il tempo proprio dell'astronave è il tempo che la Terra ha visto passare sui suoi orologi moltiplicato per per il fattore di rallentamento √ 1 − v 2 = γ −1 . D'ora in poi useremo il tempo proprio come invariante spazio-temporale fondamentale dτ 2 = dt2 − dx21 − dx22 − dx23 Capitolo 3 Calcolo tensoriale piatto Vediamo ora di formalizzare in una veste matematica corretta le idee esposte nel capitolo precedente. Allo scopo iniziamo con alcuni richiami sugli spazi vettoriali e gli spazi metrici, per poi introdurre il calcolo tensoriale piatto. Le leggi della Fisica devono essere uguali in qualsiasi sistema di riferimento inerziale, cioè invarianti per trasformazioni di Lorentz. Per poter asserire ciò bisogna porre le leggi siche in una forma in cui l'invarianza appaia chiaramente e ciò viene fatto tramite il calcolo tensoriale. 3.1 Spazi vettoriali lineari reali Uno spazio vettoriale lineare detti vettori • 1 V una operazione di somma su un corpo commutativo +:V×V→V ~v commutativa ∀~v , ~u ∈ V associativa (~v + ~u) + w ~ = ~v + (~u + w) ~ è un insieme di elementi che goda delle proprietà ~v + ~u = ~u + ~v K nel quale siano denite ∀~v , ~u, w ~ ∈V esistenza del vettore nullo ∃~0 ∈ V : ~v + ~0 = ~v ∀~v ∈ V 1 In questa sezione useremo la convenzione di indicare vettori in uno spazio vettoriale generico di dimensione N con il simbolo ~x. Useremo invece la notazione con lettere grassette x quando penseremo a un vettore come a una matrice colonna. La corrispondente matrice riga sarà indicata dall'operazione di xT . Le matrici A, B, ecc... trasposizione come sempre, maiuscole quadrate saranno indicate con lettere grassette, usualmente, ma non I risultati di questo capitolo si potranno applicare sia allo spazio-tempo 4-dimensionale di Minkowski, i cui vettori sono indicati con x che allo spazio ordinario capitoli. 35 R3 i cui vettori sono indicati con ~x negli altri 36 CAPITOLO 3. esistenza dell'opposto ~v + (−~v ) ≡ ~v − ~v = ~0 ∀~v ∈ V ∃(−~v ) : • un prodotto per scalari K×V→V che goda delle proprietà distributiva I λ(~v + ~u) = λ~v + λ~u ∀λ ∈ K, ∀~v , ~u ∈ V (λ + µ)~v = λ~v + µ~v ∀λ, µ ∈ K, ∀~v ∈ V distributiva II associativa ∀λ, µ ∈ K, ∀~v ∈ V (λµ)~v = λ(µ~v ) CALCOLO TENSORIALE PIATTO invarianza per l'unità di K 1~v = ~v 1 ∈ K, ∀~v ∈ V Nel seguito ci occuperemo principalmente dei casi in cui K=R nel quale V è detto spazio vettoriale reale. Ricordiamo qui, senza ripeterne le dimostrazioni, alcune proprietà utili degli spazi vettoriali: • l'unicità del vettore nullo e dell'opposto di un elemento dato • le leggi di annullamento del prodotto per scalari 0~v = ~0 ∀~v ∈ V λ~0 = ~0 ∀λ ∈ R • la validità delle usuali regole algebriche di calcolo • l'esistenza una base che ogni {~eµ ; µ = 1, ..., N } di vettori vettore ~ a ∈ V si possa esprimere come2 ~a = aµ~eµ Il numero intero N si dice dimensione di componenti del vettore ~a 2 Qui e nel seguito aderiamo alla nella base linearmente indipendenti di V tale aµ ∈ R V e si scrive dim V = N . Le aµ sono dette {~eµ }. convenzione di Einstein sugli indici: indici ripetuti una volta in alto e una in basso si sottintendono sommati, cioè, per esempio, la notazione precedente sottintende una P µ a secondo membro. Quindi o un indice si contrae, cioè si somma con un altro indice con lo stesso nome ma che si trova in posizione (alto o basso) opposta, oppure è libero e allora deve comparire libero e nella stessa posizione anche nell'altro membro dell'equazione. possono essere ribattezzati a piacere. Si noti che gli indici ripetuti sono muti e che quindi 3.1. 37 SPAZI VETTORIALI LINEARI REALI Deniamo un operatore come un ente astratto produce come risultato un altro vettore d~ ∈ V, A cioè che, applicato a un generico ~a ∈ V A : V → V. A~a = d~ Consideriamo operatori lineari, cioè tali che A(λ~a + µ~b) = λA~a + µA~b Il vettore d~ sarà esprimibile come d~ = dµ~eµ , ma anche come d~ = A~a = A(aµ~eµ ) = aµ A~eµ = aµ Aν µ~eν cioè dµ = aν Aµν in cui Aµν indica la µ-sima componente del vettore A~eν . I numeri Aµν possono essere organizzati in una matrice A= A1 1 . . . . . . AN1 .. . ... A1 N . . . N AN Si noti che la posizione degli indici non è indierente. Il primo indice, che sia in alto o in basso, rappresenta comunque le righe, mentre il secondo rappresenta le colonne. Ecco µ µ µ perchè le notazioni A ν e Aν non sono equivalenti e la notazione Aν in realtà avrebbe senso solo per matrici simmetriche. Si può così dire che la matrice A costituisce una rappresentazione matriciale dell'operatore lineare A. Come conseguenza dell'algebra operatoriale si può immediatamente costruire l'algebra delle matrici 1. Somma: la matrice S=A+B 2. Prodotto: la matrice Un vettore ~a = aµ~eµ P = AB ha componenti ha componenti S µν = Aµν + B µν P µν = Aµρ B ρν sarà rappresentato dalla matrice colonna a1 a= . . . N a e ciò concorda con la denizione del prodotto righe per colonne dµ = Aµν aν cioè d = Aa 38 CAPITOLO 3. 3.2 CALCOLO TENSORIALE PIATTO Prodotto scalare, metrica Nello spazio con valori V deniamo un prodotto scalare, inteso come in R, cioè · : V × V → R avente le proprietà forma bilineare non degenere ~a · ~b = ~b · ~a (λ~a + µ~b) · ~c = λ~a · ~c + µ~b · ~c Il prodotto scalare permette di denire, per ogni vettore, una |~v | = norma √ ~v · ~v Uno spazio vettoriale dotato di prodotto scalare viene perciò detto spazio normato. Esprimendo i vettori tramite le componenti nella base ~a · ~b = aµ bν ~eµ · ~eν = gµν aµ bν ove si è denita la metrica gµν = ~eµ · ~eν La commutatività del prodotto scalare implica la simmetria della metrica Introduciamo anche la metrica inversa, denita dalla relazione gµν = gνµ . g µν gνρ = δρµ δρµ = 1 se µ = ρ e δρµ = 0 se µ 6= ρ è il cosiddetto simbolo di Krönecker, che descrive le componenti della matrice identità 1. Pensando a gµν come alle componenti di una matrice g, allora la relazione denitoria di g µν si rilegge come g−1 g = 1, e ciò giustica il nome µν di metrica inversa per g . Il fatto che il prodotto scalare sia non degenere assicura che det g 6= 0 e che quindi esiste l'inverso g−1 . Si noti invece che non richiederemo in generale dove che il prodotto scalare sia denito positivo, il che implicherebbe che tutti gli autovalori di g siano positivi. Qui invece possiamo permettere sia autovalori positivi che negativi, come appunto capita nel caso della metrica dello spazio-tempo minkowskiano. Il prodotto scalare in termini matriciali si può rappresentare come ~a · ~b = aT gb Uno spazio normato dotato di metrica invertibile e simmetrica si dice spazio metrico. Nella presente trattazione assumiamo che gli elementi della matrice metrica siano costanti indipendenti dalle coordinate. Vedremo che in Relatività generale occorrerà generalizzare questo punto a metriche dipendenti dalle coordinate, che introdurranno i cosiddetti spazi curvi. Nella trattazione della relaitività ristretta, tuttavia, si fa uso solo di metriche costanti e gli spazi metrici dotati di metriche costanti si dicono Possiamo poi denire i vettori della base duale di V ~eµ = g µν ~eν spazi piatti. 3.2. 39 PRODOTTO SCALARE, METRICA che sono pure linearmente indipendenti. Pertanto un vettore si può decomporre anche nella base duale ~a = aµ~eµ Confrontando questa decomposizione con quella nella base originaria si legano i due diversi tipi di componenti aµ g µν = aν e analogamente aµ gµν = aν Inoltre il prodotto scalare di due vettori si esprime come ~a · ~b = gµν aµ bν = aν bν Da tutto ciò si comprende l'importante ruolo della metrica gµν e della sua inversa g µν nell'alzare e abbassare gli indici. In qualunque situazione, da una quantità con un indice in alto si potrà ottenere la sua analoga con indice in basso moltiplicando per la metrica gµν . Viceversa un indice sarà abbassato dalla metrica inversa g µν . Due vettori si dicono ortogonali se il loro prodotto scalare è nullo. Una base in cui tutti i vettori siano ortogonali l'uno all'altro si dice base ortogonale. Ovviamente la metrica g di una base ortogonale è una matrice diagonale. Poichè ogni matrice con determinante non nullo si può diagonalizzare, e avrà come elementi diagonali i suoi autovalori, ne concludiamo che possiamo sempre trovare una base ortogonale per uno spazio piatto. La norma può essere riscritta in componenti, mostrando la sue relazione con la metrica |~v |2 = gµν v µ v ν In particolare per i vettori della base |~eµ |2 = gµµ (qui non vale la convenzione di Einstein) e perciò possiamo sempre ridenire nuovi vettori della base aventi norma quadrata 1: −1/2 ~eˆµ = gµµ ~eµ . In questa nuova la metrica risulta necessariamente base ortonormale diagonale e avente lungo la diagonale elementi gµµ = ±1. Gli spazi vettoriali reali normati piatti si possono perciò classicare dandone le dimensioni e la quantità di compaiono nella metrica di una loro base ortonormale. elementi diagonali di g +1 e −1 che Poiché il numero totale degli è la dimensione, in realtà basterà indicare quanti autovalori +1 (o coordinate temporali ) e quanti −1 (o coordinate spaziali ) compaiono nella metrica. N Come spazi vettoriali, tutti questi spazi sono isomor a R . Tuttavia solo se tutti gli autovalori hanno lo stesso segno, che in questo caso conviene prendere positivo, cioè indica la matrice identità a N dimensioni) N In questo caso potremo usare la notazione R p,q In tutti gli altri casi useremo la notazione R dove p è il numero di se in una base ortonormale essi sono isomor a uno per identicarli. g = 1N (dove spazio euclideo. 1N 40 CAPITOLO 3. CALCOLO TENSORIALE PIATTO q quello di coordinate temporali3 . Gli spazi di Minkowski saranno = RN −1,1 cioè spazi con N − 1 coordinate spaziali e 1 coordinata p,q p,q spazi R con entrambi p, q 6= 0 e dim R = p + q sono detti spazi coordinate spaziali e N classicati come M temporale. Gli pseudoeuclidei. In questa notazione lo spazio-tempo sico della Relatività ristretta, che 4 3,1 nora abbaimo chiamato M , è R . 2 Il segno di |~ v | dipende essenzialmente dagli autovalori della metrica. In RN questi sono tutti positivi, e perciò anche il determinante della metrica è positivo. La norma quadrata sarà sempre positiva e potrà annullarsi solo per il vettore nullo. Nel caso, invece, degli spazi pseudoeuclidei è possibile trovare un luogo geometrico di tutti i vettori che hanno norma nulla. A questo luogo viene dato il nome di cono-luce. I vettori saranno classicati a seconda che abbiano norma positiva, nulla o negativa in vettori di tipo tempo, di tipo luce o di tipo spazio, come già visto. 3.3 Cambiamenti di base aµ quando si fa un cambiamento di base. Supponiamo di trasformare i vettori della base {~ eµ } in un nuovo 0 insieme di vettori {~ eµ } attraverso l'applicazione di una trasformazione lineare L Un altro importante aspetto della questione è vedere cosa succede alle ~e0µ = L~eµ = Λν µ~eν L si può rappresentare come una matrice N × N Λ. Si può dimostrare facilmente che i vettori {~ e0µ } sono ancora linearmente indipendenti se e solo se det Λ 6= 0. In questo caso {~e0µ } è una nuova base di V ed esiste certamente la trasformazione −1 inversa Λ che manda le {~ e0µ } nelle {~eµ }. Sia dato un vettore ~ a e abbia componenti aµ nella vecchia base {~eµ } e a0µ nella nuova base {~ e0µ }. Sarà ~a = aµ~eµ = aµ (Λ−1 )ν µ~e0ν = a0ν ~e0ν Dunque la trasformazione cioè a0ν = (Λ−1 )ν µ aµ Si vede come le componenti con indice in alto di dette componenti controvarianti del vettore 3 Il scegliere +1 per le coordiante temporali e ~a si trasformano con Λ−1 . Perciò sono ~a. −1 per quelle spaziali è puramente una convenzione. Si potrebbe benissimo scegliere, come in eetti vienefatto in molti libri di relatività, anche di attribuire il nome di spaziali alle coordinate con metrica +1, (convenzione East-Coast) il che tra l'altro sarebbe compatibile con la scelta nel caso euclideo. Tuttavia per altri motivi realtivi a una scrittura più elegante della teoria die campi, molti scelgono la convenzione, cui aderiremo anche noi, di attribuire +1 alle coordinate temporali e −1 a quelle spaziali (convenzione West-Coast). I nomi delle convenzioni derivano dal fatto che mentre la scuola di Einstein (Princeton, ecc...) che si trova sulla costa atlantica degli USA (East-Coast) adottava la metrica con coordinate spaziali +1, nei grandi Istituti di ricerca californiani, seguendo soprattutto Feynman, si preferì la metrica con +1 per le coordinate temporali. Leggendo un libro di Relatività si invita sempre a fare molta attenzione a come si sono adottate le convenzioni, poiché diverse formule possono cambiare segno a causa di questa scelta. 3.4. 41 ISOMETRIE Ricordando che aµ = aν gµν = aν ~eµ · ~eν , avremo a0µ = a0ν ~e0µ · ~e0ν = (Λ−1 )ν ρ aρ Λσµ Λτ ν ~eσ · ~eτ Però (Λ−1 )ν ρ Λτ ν = δρτ e quindi a0µ = Λσµ gσρ aρ = Λσµ aσ Queste componenti si trasformano perciò con rianti di 3.4 Λ e vengono quindi dette componenti cova- ~a. Isometrie Tutte le possibili trasformazioni lineari invertibili e suriettive sui vettori di uno spazio metrico possono essere viste come cambiamenti di base. Tra esse, hanno particolare interesse isometrie. Dunque, se opero una trasformazione su un vettore ~ v , esso si trasformerà in un v' a causa quelle che lasciano invariato il prodotto scalare. di una isometria A queste si da il nome di L ~v 0 = L~v (3.1) Pensando ai vettori come matrici colonna, il prodotto scalare si realizza riga per colonna cioè occorre, tramite la metrica, denire il corrispondente vettore riga. Si noti, per quanto detto sopra, che il vettora riga ṽ di componenti covarianti vµ è dato da ṽ = vT g Il prodotto scalare sarà allora ~u · ~v = ũv = uT gv Il cambiamento di base (3.1) in termini matriciali si scrive v0 = Λv Se la trasformazione L u0T = uT ΛT deve lasciare invariato il prodotto scalare, si deve vericare che u0T gv0 = uT ΛT gΛv = uT gv da cui la condizione fondamentale che denisce l'insieme di matrici che possono rappresentare una isometria ΛT gΛ = g Nel caso di spazi euclidei in cui di matrici. g = 1 (3.2) questa si riduce alla condizione di ortogonalità Le isometrie degli spazi euclidei sono le rotazioni realizzate appunto da matrici ortogonali ΛT = Λ−1 N -dimensionali che sono 42 CAPITOLO 3. CALCOLO TENSORIALE PIATTO Queste matrici costituiscono un gruppo sotto l'operazione di prodotto di matrici, che si chiama gruppo ortogonale O(N ). Poichè per qualunque matrice con det AT = det A det A 6= 0 det(A−1 ) = (det A)−1 e per le matrici ortogonali si ha (det Λ)2 = 1 ⇒ det Λ = ±1 E' chiaro che due matrici ortogonali con determinante +1 hanno prodotto ancora con determinante +1. Le matrici con determinante +1 formano perciò un sottogruppo di detto sottogruppo delle rotazioni proprie SO(N ). Le matrici con determinante −1 O(N ) invece non formano gruppo. Tuttavia esse possono essere tutte ottenute moltiplicando le matrici di SO(N ) per un singolo elemento con determinante −1, per esempio la matrice −1 se N diag(1, −1, ..., −1) se N è pari. Esse quindi costituiscono un laterale SO(N ) e, detto Z2 il gruppo ciclico {1, −1} si ha O(N ) = SO(N ) × Z2 . p,q Passiamo ora ad esaminare il caso degli spazi pseudoeuclidei R . La relazione denitoria del gruppo di matrici è ora la (3.2) con g = diag(1, ..p volte..., 1, −1, ...q volte..., −1). Questo denisce un gruppo che è la generalizzazione del gruppo delle rotazioni O(N ) a spazi con metrica più generale. Indicheremo questi gruppi con O(p, q). Il gruppo delle trasformazioni di Lorentz è pertanto il gruppo O(3, 1). A questo gruppo vanno aggiunte le traslazioni p+q spaziali e temporali, che formano un gruppo abeliano isomorfo a R (inteso come gruppo p,q rispetto al prodotto), per avere tutte le isometrie psssibili di R . Il gruppo di tutte le p+q isometrie, sia Lorentz che traslazioni, si dice gruppo di Poincaré P(p, q) = O(p, q) × R . è dispari, o la matrice del sottogruppo Il determinante, con ragionamento del tutto analogo a quanto fatto per le matrici orto- ±1. Anche qui possiamo quindi identicare un sottogruppo di trasformazioni proprie SO(p, q). Tuttavia la struttura può presentare un ulteriore complessità, che analizzeremo in dettaglio nel coaso di nostro intertesse, cioè il gruppo O(3, 1). gonali, è sempre 3.5 Gruppo di Lorentz 0 Il gruppo di Poincaré P(3, 1) è il gruppo delle trasformazioni di coordinate x = Λx + a in R3,1 che lasciano invariato il prodotto scalare e perciò permettono di denire l'invariante 2 2 2 metrico dτ = |dx| = dt − |d~ x|2 . Le trasformazioni di Poincaré sono costituite dalle 4 traslazioni a ∈ R e dalle trasformazioni di Lorentz Λ ∈ O(3, 1). Queste ultime si possono dividere in proprie, cioè con determinate +1, e improprie con determinate −1. formano il sottogruppo SO(3, 1), può essere realizzato moltiplicando ogni elemento di diag(1, −1, −1, −1). Le prime come già visto. Le seconde invece sono un laterale che SO(3, 1) per la matrice g = η = Quest'ultima lascia invariata la coordinata temporale e manda le coordinate spaziali da ~x in −~x. Si tratta quindi di una trasformazione di parità. Ogni trasformazione impropria è il prodotto di una trasformazione propria e una di parità. + 0 Inoltre si può denire l'insieme O (3, 1) delle matrici Λ aventi l'elemento Λ 0 > 0. Queste trasformazioni hanno la proprietà di lasciare invariato l'ordine temporale degli 3.5. 43 GRUPPO DI LORENTZ ortocrone. Quelle invece con Λ00 < 0 invertono la direzione vengono dette anticrone. Il loro insieme viene spesso indicato con eventi, perciò sono dette dell'asse dei tempi e O− (3, 1). Chiameremo inoltre SO± (3, 1) = O± (3, 1) ∩ SO(3, 1). O+ (3, 1) l'elemento 1 Dimostriamo che è un sottogruppo di O(3, 1). Sapendo che il prodotto è associativo, che + appartiene a O (3, 1), ci basta mostrare che il prodotto di due matrici ortocrone è ancora una matrice ortocrona e che l'inversa di una trasformazione ortocrona è ortocrona. Per fare ciò cominciamo col notare che, dalla relazione (3.2) discende Λ−1 = η −1 ΛT η Ne segue (Λ−1 )00 = Λ00 Perciò se Λ è ortocrona con Λ00 > 0, (Λ−1 )k0 = Λ0k Λ−1 pure (3.3) lo è. Inoltre (Λ−1 )kl = Λlk , k, l = 1, 2, 3 (3.4) Inoltre, sempre dalla relazione denitoria (3.2), calcolandone esplicitamente il primo termine, si ha (Λ00 )2 − X (Λi0 )2 = 1 i Riscrivendo quest'ultima per Λ −1 e tenendo conto delle (3.3,3.4) abbamo anche (Λ00 )2 − X (Λ0i )2 = 1 i Da queste ultime due equazioni discende che (Λ00 )2 ≥ 1 e cioè Λ00 ≤ −1 Λ00 ≥ 1. che Λ, Σ ∈ oppure Chiaramente le metrici ortocrone si hanno nel secondo caso. Supponiamo O+ (3, 1). Vogliamo mostrare che P = ΛΣ ∈ O+ (3, 1). Calcoliamo pertanto il primo elemento di matrice di P P 00 = Λ00 Σ00 + X ~ ·Σ ~ Λ0i Σi0 = Λ00 Σ00 + Λ i dove con ~ Σ ~ indichiamo i vettori di componenti Λ0i e Σi0 rispettivamente. Λ, Il loro prodotto scalare gode della seguente proprietà ~ ·Σ ~ = |Λ|| ~ Σ| ~ cos θ Λ dove θ è l'angolo tra ~ Λ e ~ Σ e ovviamente | cos θ| ≤ 1. Perciò ~ · Σ| ~ ≤ |Λ|| ~ Σ| ~ |Λ Ora ~ 2 > |Λ| ~ 2 (Λ00 )2 = 1 + |Λ| e ~ 2 > |Σ| ~ 2, (Σ00 )2 = 1 + |Σ| per cui ~ Σ| ~ Λ00 Σ00 > |Λ|| e ~ ·Σ ~ ≥ Λ00 Σ00 − |Λ|| ~ Σ| ~ >0 P 00 = Λ00 Σ00 + Λ da cui risulta che P ∈ O+ (3, 1). Dunque le matrici ortocrone formano un sottogruppo di O(3, 1). La situazione dei sottogruppi del gruppo di Lorentz si può riassumere nella segnete tabella 44 CAPITOLO 3. 0 Λ0≥1 Λ00 ≤ −1 CALCOLO TENSORIALE PIATTO det Λ = +1 det Λ = −1 proprie ortocrone improprie ortocrone proprie anticrone improprie anticrone La prima casella in alto a destra, cioà le proprie ortocrone forma il sottogruppo SO+ (3, 1) delle trasformazioni di Lorentz ottenibili dall'identità con deformazioni continue dei parametri. Normalmente si richiede che una legge sica sia invariante rispetto a queste trasformazioni. Le trasformazioni della seconda casella, le improprie ortocorone, si ottengono dalle proprie ortocrone moltiplicandole per una inversione di parità coincide con la metrica η ). P = diag(1, −1, −1, −1) (che Tutte le leggi siche per le quali si desidera anche invarianza di parità devono essere invarianti almeno per tutte le ortocrone, siano esse proprie o im+ proprie, cioè per il sottogruppo O (3, 1) costituito da entrambe le caselle della prima riga della tabella. La prima casella della seconda riga, le trasformazioni proprie anticrone si ottengono dal- T = diag(−1, −1, 1, 1). le proprie ortocrone moltiplicandole per una inversione temporale Tutte le leggi siche che siano indierenti alla freccia del tempo devono essere invarianti per tutte le matrici proprie, siano esse ortocrone o anticrone, cioè per le matrici di tutto il sottogruppo SO(3, 1) costituito dalle due caselle della prima colonna della tabella. Le matrici della seconda colonna della seconda riga, cioè le improprie anticrone si ottengono dalle proprie ortocrone moltiplicandole per PT = diag(−1, 1, −1, −1). Esse vanno consi- derate se si vuole invarianza rispetto a tutto il gruppo di Lorentz, cioè anche per parità e inversione temporale. 3.6 Tensori Considerando ora un operatore rappresentato da una matrice A, i suoi elementi Aµν si trasformano come segue (A0 )µν = (Λ−1 )µρ Λσν Aρ σ Quindi, consistentemente, l'indice in alto si trasforma in maniera controvariante e quello in basso in maniera covariante. Più in generale, un oggetto che si trasforma come il prodotto di p componenti controvarianti e q covarianti di un vettore si dice tensore di rango (p, q). In altre parole, un tensore è un insieme di numeri Aµ1 ···µp ν···νq che, per una trasformazione di base, si trasforma come (A0 )µ1 ···µp ν1 ···νq = (Λ−1 )µ1 ρ1 · · · (Λ−1 )µp ρ1 Λσ1 ν1 · · · Λσq νq Aρ1 ···ρp σ1 ···σq In un tensore, qualunque indice può essere innalzato o abbassato usando la metrica o la metrica inversa. 3.7. 45 INVARIANTI 3.7 Invarianti Si dicono invarianti le quantità che non variano per un cambiamento di base. Il prodotto scalare di due vettori è un invariante a0µ b0µ = aσ Λσµ (Λ−1 )µρ bρ = aσ δρσ bρ = aσ bσ Gli invarianti sono molto importanti in relatività. Ad esempio, le trasformazioni di Lorentz devono lasciare invariata la quantità dτ 2 = dt2 − |d~x|2 = gµν dxµ dxν = dxµ dxµ 2 Poichè non abbiamo richiesto la positività della metrica, si può avere dτ < 0 e non è vero 2 µ che dτ = 0 implichi che dx = 0. Infatti tutti i vettori del cono-luce sono caratterizzati 2 proprio da dτ = 0. µ Un altro invariante importante è la traccia TrA = A µ di una matrice (A0 )µµ = (Λ−1 )µρ Λσµ Aρ σ = Aρ ρ Anche il determinante di una matrice è un invariante. Basta ricordare che il determinante di un prodotto è uguale al prodotto dei determinanti e che il determinante di una matrice inversa è uguale all'inverso del determinante della matrice originaria: det A0 = det(Λ−1 AΛ) = (det Λ)−1 det A det Λ = det A 3.8 Campi tensoriali Ci interessa ora studiare la trasformazione di un tensore dipendente dal punto, ovvero di quello che si denisce come un campo tensoriale. (T 0 )µν ρ (x0 ) = (Λ−1 )µα (Λ−1 )ν β Λγ ρ T αβγ (x) in cui xµ = Λµν x0ν Supponinamo di avere una grandezza W (P ), ove P è un punto di V di coordinate ~x. Se trasformandola secondo una isometria di V succede che W 0 (P ) = W (P ), ovvero W 0 (~x0 ) = W (~x), si dice che W è una funzione scalare. Se W 0 = W anche come forma funzionale, ovvero W (~ x0 ) = W (~x), si parla di invariante scalare. 3 Un esempio di invariante scalare in R è il potenziale coulombiano a a V (r) = = √ r ∆xi ∆xi Trasformandolo con l'isometria di V 0 (r0 ) = q R3 , cioè le rotazioni a (R−1 )ji ∆x0j Rki ∆x0k O(3), si ha infatti a =q ∆x0j ∆x0j = V (r0 ) 46 CAPITOLO 3. Quindi CALCOLO TENSORIALE PIATTO V (r) non solo ha lo stesso valore, ma mantiene anche la stessa forma nel nuovo sistema di coordinate ~ x0 che aveva nel vecchio ~x. Introduciamo ora il concetto di derivata di un tensore. Cominicamo col denire le derivate di una funzione scalare ∂W 0 ∂W ∂xν ∂W = = Λν µ ν 0µ ν 0µ ∂x ∂x ∂x ∂x La derivata di uno scalare rispetto alle componenti controvarianti di un 4-vettore si comporta quindi come un 4-vettore covariante. Analogamente la derivata rispetto alle componenti covarianti si comporta in modo controvariante ∂W ∂W ∂xν ∂W 0 = = (Λ−1 )µν 0 0 ∂xµ ∂xν ∂xµ ∂xν In maniera poco ortodossa, si può dire che indici in alto nel denominatore di una derivata si comportano come indici in basso e viceversa indici in basso si comportano come indici in alto. Ciò giustica l'introduzione del simbolo µ alla coordinata x ∂µ ≡ ∂µ ∂µ per indicare la derivata tensoriale rispetto ∂ ∂ ~ = ( , ∇) µ ∂x ∂t si comporta quindi come un 4-vettore covariante ∂µ0 = Λν µ ∂µ Si noti che l'analogo controvariante è dato da µ ∂ = Derivando un tensore di rango r ∂ ∂t ~ −∇ si ottiene un tensore di rango r + 1. Per esempio ∂µ0 T 0αβ (~x0 ) = Λν µ (Λ−1 )αγ (Λ−1 )βδ ∂ν T γδ Ad esempio in R3 il potenziale elettrostatico, come abbiamo visto, è un invariante scalare. xi del vettore posizione ~x si ottiene un 3-vettore (il Derivandolo rispetto alle componenti campo elettrico) Ei = −∂i V il che può essere scritto in notazione vettoriale ~ = ∇V ~ E come ben noto. La derivata di un vettore da un tensore di rango 2 ∂µ V ν = Tµ ν Facendone la contrazione si ottiene la divergenza del vettore la usuale divergenza ~ · V~ ∂i V i = ∇ V~ . A 3 dimensioni questa è 3.8. 47 CAMPI TENSORIALI che è infatti uno scalare. Nel caso 4-dimensionale di Minkowski si parla di 4-divergenza ∂µ V µ di un 4-vettore. Questa è uno scalare di Lorentz. Inne, il rotore è una operazione dierenziale che, applicata a un vettore, genera un altro vettore. In generale, per scrivere questa operazione in componenti conviene introdurre il N simbolo totalmente antisimmetrico di Levi-Civita. dimensioni questa è denita come un tensore di rango α1 ...αN +1 −1 = 0 per α1 ...αN per α1 ...αN = tutte = tutte In uno spazio vettoriale V a N le permutazioni pari di 1, ..., N le permutazioni dispari di 1, ..., N per almeno 2 indici uguali 3 Illustreremo questo a 3 dimensioni in R e a 4 dimensioni nello spazio-tempo di Minkowski 4 3 M . In R talvolta il simbolo di Levi-Civita viene anche chiamato simbolo di Ricci. Le componeti del rotore di un vettore saranno espresse da ~ × V~ )i = ijk ∂j Vk (∇ Infatti, per esempio ~ × V~ )1 = 123 ∂2 V3 + 132 ∂3 V2 = ∂2 V3 − ∂3 V2 (∇ come deve essere secondo la denizione tradizionale. Il lettore potrà agevolmente vericare le altre componenti. Il simbolo di Levi-Civita a 4 dimensioni ha 4 indici: un tensore antisimmetrico di rango tensore di rango 4−r r≤4 αβγδ = −αβγδ . La contrazione di con il simbolo di Levi-Civita produce un altro totalmente antisimmetrico nei suoi indici che viene detto duale del precedente αβγδ Vδ = Ṽ αβγ αβγδ Fγδ = F̃ αβ αβγδ Rβγδ = R̃α La contrazione, invece, con un tensore simmetrico produce 0, perché moltiplicare un oggetto simmetrico per uno antisimmetrico produce sempre zero. Poiché ogni tensore di rango 2 può essere pensato come la somma di una parte simmetrica e di una antisimmetrica negli indici, risulta che solo la parte antisimmetrica può avere un duale. Si noti che la proprietà che il duale di un tensore di rango 2 è pure di rango 2 è valida solo in 4 dimensioni. Il simbolo di Levi-Civita si trasforma come 0α1 ...αN = det Λ · α1 ...αN ed è quindi una densità tensoriale di rango N. Si dice densità scalare ogni oggetto che si trasformi come q 0 (x0 ) = det Λ · q(x) 48 CAPITOLO 3. CALCOLO TENSORIALE PIATTO e densità tensoriale ogni oggetto che, oltre alla trasformazione tipica dei tensori abbia anche un termine di tipo determinante nella trasformazione. Per esempio una densità tensoriale di rango 2 si trasforma come T 0µν (x0 ) = det Λ · (Λ−1 )µρ (Λ−1 )ν σ T ρσ Nel caso del simbolo di Levi-Civita, tutti i termini Λβiαi nella contrazione si elidono dando δ di Kroenecker e lasciando quindi sopravvivere solo il termine col determinate. Per le trasformazioni proprie det Λ = 1 perciò non c'è distinzione da un tensore usuale, e il simbolo delle di Levi-Civita è lo stesso in tutti i sistemi di riferimento. Ma se considero trasformazioni improprie, allora det Λ = −1 e i tensori sono quindi caratterizzati dalle loro trasformazioni di parità. I vettori che si trasformano con un segno meno sotto trasformazioni di parità vengono detti pseudovettori. Si possono avere anche pseudoscalari (le densità scalari) e pseudotensori. Una proprietà importante di ijk = ijk a 3 dimensioni è la seguente ijk ilm = δ jl δ km − δ jm δ kl molto utile per dimostare certe identità tra gradienti, divergenze e rotori di 3-vettori. Vedremo alcuni esempi di ciò nella trattazione del campo elettromagnetico. Capitolo 4 Dinamica relativistica 4.1 Particella libera relativistica Per sviluppare una dinamica relativistica procederemo qui da un punto di vista formale, e cioè da un prinicipio di minima azione. Come in meccanica newtoniana una particella libera percorre un cammino lungo il quale la traiettoria sia minima (linea retta in uno spazio euclideo) e questo può essere formalizzato chiedendo che la lunghezza della traiettoria Γ Z ds Γ sia minimo, cioè che Z δ ds = 0 Γ così anche in relatività richiederemo che la lunghezza della linea di mondo γ di una particella nello spazio-tempo sia la minima possibile se la particella è libera. Perciò richiederemo il principio di minima azione δS = 0 con Z dτ S=α γ ove α è una costante per ora arbitraria, che sseremo in seguito. L'azione scritta come l'integrale, tra l'istante iniziale tA delle coordinate e delle velocità nota come Lagrangiana Z tB L(~x, ~v ) e quello nale S può essere del moto, di una funzione tB S= dt L(~x, ~v ) tA Poichè il tempo proprio dτ è legato al tempo coordinata da dτ = √ assumere come lagrangiana di una singola particella libera la quantità √ L = α 1 − v2 49 1 − v 2 dt, possiamo 50 CAPITOLO 4. Determiniamo ora la costante α richiedendo che per DINAMICA RELATIVISTICA v→0 sia riprodotta la lagrangiana non relativistica di una particella libera, che notoriamente è pari alla sua energia cientica L = 12 mv 2 + cost. (a meno di una costante additiva arbitraria). Perciò espandiamo questa esperessione per v piccoli 1 L = α − αv 2 + ... 2 da cui è immediato identicare α = −m. Perciò la lagrangiana relativistica della particella libera di massa m è √ L = −m 1 − v 2 La massa m si intende misurata nel sistema di riferimento a riposo. Da questa lagrangiana è immediato ricavare, col metodo di Euler-Lagrange, le equazioni del moto d ∂L ∂L − =0 dt ∂~v ∂~x (4.1) cioè il moto rettilineo uniforme ~v = cost. Per ricavare una espressione per l'impulso p~ di questa particella, ricordiamo che in formalismo lagrangiano esso è visto come variabile canonicamente coniugata alla coordinata ~x p~ = ∂L m~v = mγ~v =√ ∂~v 1 − v2 p~ = m~v . Il fattore γ fa m quando questa viaggi a Si noti come questa espressione dierisca da quella newtoniana crescere vertiginosamente l'impulso di una particella di massa velocità relativistiche. Per accelerare una particella alla velocità della luce occorrerebbe fornirle un impulso innito, cosa chiaramente impossibile e per questo motivo nessun corpo materiale dotato di massa potrà mai raggiungere la velocità della luce. L'energia totale del sistema è data dall'hamiltoniana 2 √ E = H = p~ · ~v − L = mγv + m 1 − Si noti che quando la particella è a riposo, cioè v2 mv 2 + m − mv 2 √ = = mγ 1 − v2 γ = 1, l'energia del sistema non è nulla, bensì E0 = m cioè ogni corpo materiale è dotato di una energia a riposo pari alla sua massa. Questa è forse la relazione più famosa di tutta la relatività, ma quello che interessa qui è capirne il profondo signicato: ogni massa è una forma di energia e l'energia può essere sempre pensata come massa (questo sarà particolarmente importante per determinare i campi gravitazionali). La massa pu essere trasformata in energia e viceversa, come avviene notoriamente nelle reazioni nucleari. Per esempio nella fusione dell'idrogeno in elio, la massa totale dei corpi iniziali è più grande del 7 per mille di quella del nucleo di elio nale. La dierenza si è trasformata in energia termica e cinetica i cui eetti devastanti sono noti a tutti. 4.2. 51 4-VELOCITÀ L'energia di una particella libera può perciò essere pensata come somma di energia cinetica e energia a riposo E = mγ = m + (γ − 1)m perciò una espressione per l'emergia cinetica di una particella materiale in relatività è T = (γ − 1)m. È immediato vericare che, espandendo per piccole 1 2 usuale dell'energia cientica non-relativistica T = mv . 2 4.2 v si riottiene la formula 4-velocità Una volta compreso come scrivere l'energia e il momento relativistici, ci chiediamo come essi si trasformino sotto Lorentz. Allo scopo dobbiamo prima introdurre il concetto di 4-velocità. Essa è denita come uµ = dxµ dτ µ Essendo la derivata eettuata rispetto al tempo proprio, che è un invariante, u eredita µ le proprietà tensoriali di dx e quindi è un 4-vettore. Le componenti della 4-velocità si 2 2 possono ottenere osservando che dτ = dt − |d~ x|2 = dt2 (1 − v 2 ) da cui dt = γdτ e perciò dxµ =γ u =γ dt µ 1 ~v La 4-velocità ha sempre norma 1 µ 2 uµ u = γ (1, −~v ) 1 ~v = γ 2 (1 − v 2 ) = 1 E' utile denire in maniera simile anche la 4-accelerazione aµ = duµ dτ che risulta sempre ortogonale alla 4-velocità. Infatti derivando la uµ uµ = 1 rispetto a τ si ottiene aµ uµ = 0 4.3 4-impulso e equazione di mass-shell Una volta introdotta la 4-velocità la trattazione covariante dell'impulso e dell'energia può essere agevolmente trattata dimostrando che la quantità controvarianti µ p = E p~ p = (E, p~) di componenti 52 CAPITOLO 4. detta 4-impulso è un 4-vettore. DINAMICA RELATIVISTICA Infatti essa può essere scritta come pµ = muµ con uµ 4-velocità, come è immediato vericare µ p = Il 4-vettore p mγ mγ~v = mγ 1 ~v = mγuµ perciò ha componenti che si trasformano come un tensore controvariante di rango 1 p0µ = (Λ−1 )µν pν da cui si possono ricavare le trasformazioni di energia e impulso. In particolare, sistemi di riferimento diversi attribuiranno energia diversa a un corpo; le componenti energia e impulso si mescolano in una trasformazione di Lorentz, proprio come si mescolano spazio e tempo. La quantità |p|2 = pµ pµ è pertanto un invariante di Lorentz. Essa può essere espressa da un lato tramite la sua espressione generale |p|2 = E 2 − p2 (in cui si è usata la notazione p = |~p|) e dall'altro può essere calcolata in un sistema di riferimento particolare, poiché il suo valore non cambia passando da un sistema a un altro. Calcolandola quindi nel sistema di riferimento a riposo, in cui µ p = si ottiene l'equazione di mass-shell m ~0 o equazione di dispersione per una particella libera relativistica E 2 = p2 + m2 p2 . Si noti che 2m se si vuole calcolare l'energia da questa formula occorre estarre una radice quadrata che è l'analogo della formula newtoniana che lega impulso ed energia E= p E = ± p2 + m2 Le soluzioni con il segno meno vengono escluse dal fatto che si assume che una particella a riposo abbia energia pari alla sua massa positiva m, non −m. Tuttavia queste energie negative diventano importanti quando si cerca di introdurre una equazione quantisitica relativistica analoga all'equazione di Schrödinger, la cosiddeta equazione di Dirac, che prevede appunto accanto alle soluzioni di energia positiva anche quelle di energia negativa, portando di fatto al concetto di antiparticella. Non ci occupiamo qui per ora di questo problema, segnalando però che anche le soluzioni di energia negativa della relazione di mass-shell possono assumere signicato in certi capitoli della Fisica Teorica. Si noti inoltre che la relazione di mass-shell ci da anche la relazione energia-impulso nel caso di particelle prive di massa (per esempio il fotone) E=p 4.4. 53 PARTICELLA IN UN POTENZIALE ESTERNO Pensando a tali particelle prive di massa come caso limite di quelle massive per rendiamo conto che la relazione E=√ m → 0, ci m 1 − v2 si annullerebbe a meno che il denominatore pure si annulli, ovvero che v = 1, cioè che la particella viaggi alla velocità della luce. Viceversa, una particella che viaggia alla velocità della luce avrebbe energia divergente, a meno che il numeratore si annulli, cioè la particella sia di massa nulla. Le particelle esistenti in natura perciò si possono dividere in due grandi classi: • quelle con massa • quelle di massa nulla, che sono forzate a viaggiare costantemente alla velocità della m>0 che viaggiano sempre a velocità inferiore a quella della luce luce senza mai fermarsi o rallentare. Non possono invece esistere particelle che viaggino a velocità superiori a quelle della luce (tachioni). Esse potrebbero essere infatti veicolo di segnali superluminali che violerebbero la causalità. Per essere più precisi esse potrebbero esistere ma non avere alcuna interazione col mondo da noi conosciuto e perciò si possono totalmente ignorare in una teoria scientica perché non misurabili. 4.4 Particella in un potenziale esterno Supponiamo ora che la nostra particella sia immersa in un campo esterno statico descrivibile da un potenziale V (~x). La lagrangiana sarà ora √ L = −m 1 − v 2 − V (~x) e le equazioni di Euler-Lagrange (4.1) che minimizzano l'azione in questo caso sono d~p ∂V ~ =− = −∇V dt ∂~x Introdotto il concetto di forza ~ F~ = −∇V la legge fondamentale del moto può essere scritta come d~p F~ = dt che ha una forma analoga a quella newtoniana, ma in realtà è molto diversa. Infatti ora il momento non ha più la forma newtoniana p~ = m~v da cui sarebbe subito possibile inferire 54 CAPITOLO 4. la seconda legge di Newton F~ = m~a. DINAMICA RELATIVISTICA Essendo ora la forma dell'impulso p~ = mγ~v la sua derivata sarà più complicata d dγ F~ = m (γ~v ) = mγ~a + m ~v dt dt dγ d~v = mγ~a + m · ~v = mγ~a − mγ 3 (~v · ~a)~v d~v dt Questa legge mostra che la forza è parallela alla accelerazione solo nel caso in cui quest'ultima sia perpendicolare alla velocità o parallela ad essa. In tutti gli altri casi, ci sono componenti della forza non dirette come l'accelerazione. Inoltre la validità di questa forma della legge del moto è limitata ai casi in cui la massa rimane costante. Ora abbiamo visto che processi nucleari possono trasmutare massa in energia e perciò può esserci anche un termine dm/dt che complica ulteriormente le cose. In conclusione, sebbene la F~ = d~p/dt sia una corretta legge dinamica in relatività, essa ha un contenuto in generale molto più ricco che in meccanica newtoniana, prevedendo sia forze non parallele all'accelerazione, sia la possibilità che, con la transmutazione di massa in energia siano previsti nuovi metodi di inuire sulle traiettorie dei corpi materiali. 4.5 4-forza Un metodo più succinto di esprimere la legge della dinamica è quello di introdurre il concetto di 4-forza Fµ = Essendo dτ dpµ dτ pµ implica che la 4-forza è un 4-vettore. dE dt un invariante, la natura tensoriale di Le sue componenti sono dt dpµ F = =γ dτ dt µ F~ Come abbiamo visto, in relatività può capitare che la massa di un corpo si trasmuti in parte in energia, cambiando quindi le caratteristiche del moto, come avviene per esempio nelle reazioni nucleari. Se però ci restringiamo a moti in cui la massa a riposo del corpo rimane costante, dalla denizione di 4-forza segue Fµ = m duµ = maµ dτ cioè una specie di analogo 4-dimesionale della legge di Newton. Ricordando che la 4µ accelerazione è ortogonale alla 4-velocità, ne segue Fµ u = 0, da cui, esplicitando le componenti dE γ ( , −F~ ) dt 2 ovvero 1 ~v dE = F~ · ~v dt =0 4.6. 55 AZIONE A CONTATTO E A DISTANZA. CAMPI. e perciò possiamo riscrivere la 4-forza come µ F =γ Osservando inne che p~ = E~v F~ · ~v F~ si ha dE d~p F~ = = E~a + ~v dt dt e perciò la generalizzazione relativistica della legge di Newton F~ = mγ~a + (F~ · ~v )~v che torna a coincidere con quella classica per v 1. Questa equazione ci dice che la forza, in generale, non è più parallela all'accelerazione, cosa che invece succedeva sempre in meccanica newtoniana. Il parallelismo tra incipiente, oppure se F~ · ~v = 0, F~ e ~a sussiste solo se ~v = 0, ciè in caso di moto cioè per forze perpendicolari alla velocità (come nel moto circolare uniforme) o, inne, per il caso in cui il moto sia rettilineo (non necessariamente uniforme), cioè con 4.6 ~a parallela a ~v . Azione a contatto e a distanza. Campi. Se si vuole ora considerare la dinamica di un sistema chiuso (cioè non sottoposto a forze esterne, ma solo alle forze esercitate da uno sull'altro corpo appartenente al sistema), si incontra un punto fondamentale di dierenza con la meccanica newtoniana. Un sistema di particelle infatti può prevedere due tipi fondamentali di interazioni: • l' interazione a contatto in cui i corpi si comportano come liberi nchè non giungono a contatto l'uno dell'altro e allora avviene un urto durante il quale può esserci scambio di impulso e energia. Questa è la situazione tipica delle classiche palle da biliardo • l' interazione a distanza in cui i corpi si sentono l'un l'altro attraverso un poten- ziale, come avviene per esempio nella gravità newtoniana. Nessun segnale può propagarsi a velocità superiore a quella della luce. La visione newtoniana della forza di gravitazione universale presuppone una forza che dipenda solo dalle posizioni dei corpi che la generano e la subiscono. Poiché tali corpi si muovono, il dire che la forza dipende solo dalla posizione e non dalla velocità ha una conseguenza crucuale: si deve richiedere che la forza si propaghi a velocità innita. Se un corpo si muove la sua inuenza gravitazionale secondo Newton deve riaggiornarsi immediatamente in qualunque punto dello spazio. Ciò rende la graviatazione di Newton incompatibile con la relatività ristretta. Sarà da questo punto che prenderà le mosse l'altra grande rivoluzione Einsteiniana, la relatività generale. 56 CAPITOLO 4. DINAMICA RELATIVISTICA Qui ci basti commentare per ora che una interazione tra corpi distanti in relatività non può che avvenire a velocità minore o uguale a quella della luce. Il concetto di campo, che in meccanica newtoniana era nulla più che un espediente matematico, diventa ora invece centrale. Invece del concetto di azione a distanza tra due corpi, la visione relativistica preferisce parlare di corpo materiale che produce un campo (gravitazionale, elettromagnetico, ecc...) che si propaga nello spazio come un'onda a velocità minore o uguale a quella della luce e quando raggiunge l'altro corpo materiale è da questo percepito e ne inuenza il moto. Ciò che viene salvato della visione newtoniana è solo il prinicipio di azione e reazione. La forza prodotta dal campo sul corpo di arrivo è uguale e contraria a quella sul corpo di partenza. Tuttavia queste due forze non vengono in essere nello stesso istante, ma sono separate dal tempo di propagazione del segnale di campo da un corpo all'altro. Tuttavia il principio di azione e reazione garantisce, come in meccanica newtoniana, che l'impulso totale di un sistema chiuso si conserva. Nel caso di forze a contatto questo è F~AB agente dalla particella A sulla particella B F~BA agente dalla particella B sulla particella A, chiaramente intuitivo. Se la forza durante un urto è uguale e contraria alla allora d F~AB + F~BA = (~pA + p~B ) = 0 dt Perciò l'impulso totale P~ = p~in ~in ~out ~out B A +p B = p A +p si conserva nel processo di urto. Dall'eE = EAin + EBin = EAout + EBout . µ Perciò possiamo aermare che in ogni processo di urto il 4-impulso totale P del sistema quazione di mass-shell discende che anche l'energia totale si conserva. Nel caso di interazione a distanza ovviamente per avere ancora la conservazione del 4-impulso totale dobbiamo ammettere che parte di esso è data dal 4-impulso del campo che deve essere sommato a quello delle particelle. Dunque in relatività l'unico tipo di lagrangiama che possiamo immaginare di scrivere per particelle interagenti a distanza è per forza accoppiata alla lagrangiana di un campo φ(~x, t) (la cui natura tensoriale dipenderà dal tipo di interazione) che media le forze tra queste particelle L= X −mA q 1− vA2 − V (~xA , ~vA , φ(~xA , t), ∂µ φ(~xA , t)) + Lcampo (φ, ∂µ φ) A Vedremo in dettaglio un esempio di ciò trattando il campo elettromagnetico. In ultima analisi anche le interazioni a contatto sono in realtà delle interazioni a distanza (su distanze molto piccole). Due palle da biliardo che urtano sono composte da atomi che, avvicinandosi gli uni agli altri, si repellono per via di forze elettromagnetiche. Gli urti tra particelle elementari sono in realtà regolati dalle forze nucleari (deboli e forti), anch'esse descritte da un campo. Da ciò si vede come il concetto di campo prenda sempre più importanza man mano che si procede nell'analisi delle forze della natura e la relatività si dimostra perfettamente compatibile con questo tipo di visione. 4.7. 57 CRITICA AL CONCETTO DI CORPO RIGIDO 4.7 Critica al concetto di corpo rigido In meccanica classica è molto in uso il concetto di corpo rigido. Un corpo perfettamente rigido ha un moto del tutto solidale col suo centro di massa. Se imprimo una forza su un lato del corpo, tutti i punti del corpo devono risentire immediatamente di questa forza e spostarsi di conseguenza. In relatività, tuttavia, ciò è impossibile perché implicherebbe la trasmissione di una informazione a velocità innita. Detto in altro modo, la velocità del suono all'interno di un corpo rigido dovrebbe essere innita e perciò maggiore della velocità della luce. Il corpo perfettamente rigido è un concetto non valido in meccanica relativistica. La visione relativistica si sposa bene invece con una visione atomistica in cui un corpo materiale è costituito da moltissimi corpuscoli tenuti insieme da campi di interazione. Il problema si ripresenta però a livello dei corpuscoli: se questi hanno una qualunque estensione, non potendo essere rigidi, devono essere composti di qualcosa di ancora più piccolo. Dunque gli oggetti elementari in relatività devono essere puntiformi. In realtà questa visione viene modicata se si introducono considerazioni quantisitiche. Tuttavia qui non ci occuperemo di questo interessantissimo aspetto, che esula dalla trattazione strettamente classica della relatività ristretta e assumeremo come puntiformi gli oggetti elementari. 4.8 Densità e correnti Spesso, avendo a che fare con corpi macroscopici, conviene considerare la distribuzione di materia come approssimativamente continua e perciò introdurre i concetti di densità e 3 corrente di materia. Preso un cubetto innitesimo di lato dx e volume dV = d x di materiale, misuratane la massa-energia dE si denisce densità di materia-energia relativisitica la quantità µ(~x, t) = dE dV Questa può variare nel tempo perché ci può essere un usso di materia che esce o entra dalle pareti immaginarie del cubetto. Dunque una informazione completa non consta solo della densità ma anche dei movimenti di materia, cioè del movimento che la materia del cubetto compie in ogni istante, ovvero della corrente di materia ~π (~x, t) = µ(~x, t)~v (~x, t) Alternativamente possiamo pensare a un sistema di che costituiscono il nostro corpo materiale. N particelle puntiformi A = 1, ..., N In questo caso la denizione di densità e corrente può agevolmente essere data in termini di distribuzioni delta di Dirac centrate nei 58 CAPITOLO 4. punti in cui si trovano le particelle (si ricordi che µ(~x, t) = X ~π (~x, t) = X DINAMICA RELATIVISTICA p~A = EA~vA ) EA δ (3) (~x − ~xA ) (4.2) p~A δ (3) (~x − ~xA ) (4.3) A A in cui ~xA (t) δ (3) (~x) = δ(x1 )δ(x2 )δ(x3 ) è la distribuzione delta di Dirac tridimensionale e è la traiettoria della particella Naturalmente µ(x) ~xA = A. non è un invariante di Lorentz. Per rendersene conto facilmente, pensiamo a un gas di densità uniforme in una scatola cubica di lato L. Se M è la massa totale del gas, la sua densità nel sistema di riferimento in cui il cubo è a riposo, sarà µ= M L3 Tuttavia se osservo il cubo da un sistema di riferimento inerziale che si muova rispetto a quello a riposo con velocità v lungo uno dei lati del cubo, questo lato subirà una contrazione 0 di Lorentz e misurerà L = L/γ . Pertanto questo nuovo osservatore non vede più un cubo ma un parallelepipedo schiacciato di un fattore L3 /γ . Perciò egli attribuirà al gas una densità µ0 = γ nella direzione del moto e avente volume γM = γµ L3 Ci aspettiamo quindi che la densità si trasformi con un fattore γ e che non sia uno scalare invariante di Lorentz, ma si trasformi come una struttura più complicata. Allo stesso modo si possono introdurre altre densità. qualche proprietà che chiameremo genericamente carica qA Per particelle dotate di una potrò introdurre una densità di carica e una densità di corrente (~x, t) = X ~ x, t) = J(~ X qA δ (3) (~x − ~xA ) A qA~vA δ (3) (~x − ~xA ) A e lo stesso per qualunque altro tipo di carica una particella possa possedere. Nel seguito di questa sezione pensiamo a particella: la sua massa qA mA , come a una qualsiasi caratteristica Lorentz-invariante di una la sua carica elettrica eA oppure un'altro tipo di carica (per esempio di colore per i quarks, ecc...). L'invarianza di queste cariche elementari implica che possiamo scrivere le densità e le correnti in maniera covariante collezionandole in un 4.8. 59 DENSITÀ E CORRENTI 4-oggetto J µ dxµA (3) δ (~x − ~xA ) dt A A Z Z X dxµ dτ X dxµA (3) = dt qA δ(t − tA ) δ (~x − ~xA ) = dt qA A δ (4) (x − xA ) dt dτ dt A A Z X = dτ qA uµA δ (4) (x − xA (τ )) = ε J~ X = qA 1 ~vA δ (3) (~x − ~xA ) = X qA A µ µ In questa ultima forma è chiaro che J è un 4-vettore. Infatti dτ e qA sono invarianti, uA (4) sono 4-vettori e la δ , dovendo soddifare in qualunque sistema di riferimento la relazione denitoria Z d4 xδ (4) (x) = 1 deve pure essere un invariante. Per essere più precisi essa si trasforma inversamente a d4 x. Quest'ultimo si trasforma come det Λ−1 , perciò la delta di Dirac 4-dimensionale si µ trasforma come det Λ, cioè come una densità scalare. Perciò J si trasforma come uno pseudo-4-vettore. Calcoliamo ora, tornando alla notazione con la delta 3-dimensionale, la divergenza della densità di corrente ~ · J~ = ∇ X qA A = − X A Se le qA X d~xA ∂ d~xA ∂ (3) qA δ (~x − ~xA ) = − δ (3) (~x − ~xA ) dt ∂~x dt ∂~ x A A qA ∂ (3) ∂ε δ (~x − ~xA ) = − ∂t ∂t equazione di sono proprietà delle particelle indipenedenti dal tempo allora vale l' continuità ∂ε ~ ~ +∇·J =0 ∂t ovvero ancora più elegantemente in formalismo 4-dimensionale ∂µ J µ = 0 Questa equazione ha un profondo signicato sico, in quanto è alla base delle leggi di conservazione. Infatti in un sistema chiuso, la carica totale cariche volume Q sarà la somma di tutte le qA delle singole particelle, ovvero l'integrale della densità ad essa V sucientemente grande da includere tutto il sistema Z XZ X 3 Q(t) = d xε(x) = d3 x qA δ (3) (~x − ~xA ) = qA V A A associata su un 60 CAPITOLO 4. DINAMICA RELATIVISTICA Questa quantità globale potrebbe in linea di principio dipendere dal tempo t. Tuttavia l'equazione di continuità ci permette di calcolarne la derivata temporale dQ = dt Z V ∂ε =− dx ∂t 3 Z ~ · J~ d3 x∇ V Ora per il teorema di Stokes l'integrale su un volume della divergenza di un campo vettoriale ∂V di tale volume del campo Z Z 3 ~ ~ d x∇ · J = d~σ · J~ è pari all'integrale sulla frontiera V dove con d~σ vettoriale stesso ∂V si indica il vettore innitesimo normale a ∂V in un punto ~σ ∈ ∂V . Se questa supercie è presa molto lontana (matematicamente, innitamente lontana) dal sistema, tutte le densità e correnti saranno nulle su tale supercie. Perciò l'integrale di Stokes si annulla e dQ =0 dt ⇒ Q = costante Perciò a ogni equazione di continuità è associata una legge di conservazione della quantità Z d3 xJ 0 (x) Q= R3 Notando che d3 x si trasforma con un γ −1 e ε con un γ, si vede che Q è uno scalare se Jµ era un 4-vettore. 4.9 Tensore energia-impulso Ritorniamo alla denizione di densità di massa-energia e alla corrispondente corrente, date nelle eq.(4.2,4.3). La corrente corrisponde anche alla densità di impulso, perciò allo stesso modo della densità di materia possiamo pensare alla densità di impulso come un 3-vettore di componenti π i (x) = X piA δ (3) (~x − ~xA ) A i dove pA sono le componenti del 3-vettore impulso della particella A. La densità di corrente corrispondente a ogni componente della densità di impulso è data da un oggetto con 2 indici σ ij . Il primo denota a quale componente della densità di impulso ci stiamo riferendo, il secondo è l'indice della componente della velocità nella denizione di corrente σ ij (x) = X piA vAj δ (3) (~x − ~xA ) A Tutte queste nozioni possono essere riassunte in un unico oggetto 4-dimensionale con due indici µν T (x) = X A µ µ dxA (3) pA δ (~x dt − ~xA ) = X pµ pν A A (3) A EA δ (~x − ~xA ) 4.9. 61 TENSORE ENERGIA-IMPULSO da cui si evince che T µν = T νµ è un oggetto simmetrico. Inoltre esso può essere riscritto come T µν XZ = dτ pµA uνA δ (4) (x − xA (τ )) A in analogia con quanto fatto nel caso di una corrente generica nella sezione precedente. Con ciò si vede che si tratta di un tensore di rango 2, cui viene dato il nome di energia-impulso. tensore Le sue componenti in forma matriciale sono µ π1 π2 π3 π 1 σ 11 σ 12 σ 13 µ ~ π = π 2 σ 21 σ 22 σ 23 = ~π σ π 3 σ 31 σ 32 σ 33 T µν 3×3 σ è detta tensore degli sforzi (nome mutuato dalla teoria dell'elasticità dei solidi) e il suo elemento i, j -simo rappresenta il usso della componente i della densità di impulso lungo la direzione j . dove la matrice Questa denizione è stata data per particelle non interagenti o interganeti a contatto. Nel caso di particelle interagenti a distanza si dovrà considerare anche la densità di energia e di impulso distribuita nel campo di interazione, come vedremo nel caso del campo elettromagnetico. Il tensore energia impulso è una quantità fondamentale in tutta la relatività, ristretta o generale. Esso infatti codica nella maniera più completa la conservazione di 4 cariche che sono alla base di tutta la meccanica. ∂i T µi = X pµA A = − X = − X dxiA ∂ (3) δ (~x − ~xA ) dt ∂xi pµA dxiA ∂ (3) δ (~x − ~xA ) dt ∂xiA pµA ∂ (3) δ (~x − ~xA ) ∂t A A X dpµ ∂ X µ (3) A (3) = − δ (~x − ~xA ) pA δ (~x − ~xA ) + ∂t A dt A µ µ0 X ∂T dpA (3) + δ (~x − ~xA ) = − ∂t dt A ovvero ∂ν T µν = X dpµ A (3) A dt δ (~x − ~xA ) = X FAµ γ −1 (vA )δ (3) (~x − ~xA ) = g µ A A dierenza del caso generico della sezione precedente, qui il 4-impulso delle singole particelle non è necessariamente una quantità ssa nel tempo. Lo è ovviamente nchè una 62 CAPITOLO 4. DINAMICA RELATIVISTICA particella è libera. Nel momento in cui comincia a interagire essa subisce una forza, che µ crea appunto il termine g di cui sopra e a cui si da talvolta il nome di densità di forza. Se µν le particelle non interagiscono, ovviamente ∂ν T = 0. Lo stesso si verica se le particelle interagiscono solo a contatto. Infatti supponiamo che tutte le particelle si stiano muovendo liberamente tranne due B e l'energia si conservano, dunque di forza sono gµ = C che si urtano. Per tutte dpµA /dt = 0. Allora gli unici le particelle libere l'impulso e termini non nulli nella densità dpµB (3) dpµ δ (~x − ~xB ) + C δ (3) (~x − ~xC ) dt dt L'interazione avviene a contatto, cioè quando ~xB = ~xC e durante l'urto il 4-impulso si conserva d µ (pB + pµC ) = 0 dt In caso di azione a distanza la gµ ⇒ gµ = 0 non può essere annullata. Tuttavia, come vedremo esplicitamente nel caso del campo elettromagnetico, è possibile aggiungere un termine di µν campo al tensore energia-impulso in modo tale che la somma del T della materia più quello del campo sia ancora conservato. La legge di conservazione corrispondente all'equazione di continuità del tensore energiaimpulso ci dice che la quantità ν Z P = d3 xT 0ν R3 si conserva. Chiaramente questa quantità corrisponde al 4-impulso totale del sistema, cioè alla somma dei 4-impulsi di tutte le particelle in esso contenute. Come abbiamo detto ciò è strettamente vero solo per particelle con interazioni a contatto (per esempio in un gas perfetto relativistico). Per interazioni a distanza, come l'elettromagnetismo, la gravità o le altre forze fondamentali della natura, per mantenere l'equazione di continuità (e quindi la conservazione dell'energia-impulso) occorre aggiungere un termine di campo che ci mostra come una certa quantità dell'energia e dell'impulso totali del sistema chiuso sono distribuite nel campo di interazione. Il campo in relatività non è più solo un articio matematico, ma diventa una vera e propria entità sica dotata di energia e impulso come le particelle. 4.10 Momento angolare Si denisca la quantità M γαβ = xα T γβ − xβ T αγ = −M γβα che è chiaramente un 4-tensore di rango 3, essendo somma di prodotti di tensori di rango 1 e 2 rispettivamente. Si noti l'antisimmetria negli indici a una legge di continuità rispetto all'indice γ α, β . Questa quantità obbedisce se il sistema è isolato. Infatti ∂γ M γαβ = δγα T γβ + xα ∂γ T γβ − δγβ T αγ + xβ ∂γ T αγ 4.11. 63 CENTRO DI MASSA-ENERGIA La legge di continuità del tensore energia-impulso garantisce l'annullarsi del secondo e quarto termine, perciò ∂γ M γαβ = T αβ − T βα = 0 per simmetria del tensore energia-impulso. Corrispondentemente a questa equazione di continutà esiste una collezione di cariche conservate etichettate da due indici J αβ Z d3 xM 0αβ = −J βα = Si tratta quindi di di un tensore antisimmetrico di rango 2, perciò dotato di 6 componenti indipendenti, normalmente esprimibili in termini di 2 vettori tridimensionali. Vediamo di capire a cosa corrispondono sicamente queste componenti J Z 0i J ij 0 0i i 00 i Z d x(x T − x T ) = tP − d3 xxi T 00 = K i Z Z 3 i j0 j i0 = d x(x T − x T ) = d3 x(xi π j − xj π i ) = ijk Lk = 3 Queste espressioni diventano ancora più chiare se torniamo alle espressioni per un sistema L avremo X XZ 3 ~xA × p~A d3 x ~xA × p~A δ (3) (~x − ~xA ) = d x~x × ~π = di particelle. Per le componenti di ~ = L Z A A e perciò stiamo parlando delle componenti del momento angolare totale del sistema, che perciò è una quantità conservata anche in relatività. 4.11 Centro di massa-energia ~ K X EA~xA d3 xρ~x = tP~ − Più involuta è l'interpretazione delle componenti di ~ = tP~ − K Z A Dividendo ambo i membri per l'energia totale, che è pure una quantità conservata, si vede che il punto (centro di massa-energia) P xA A EA ~ ~ X= P A EA soddisfa l'equazione del moto ~ = V~ t + K ~ X ove sia ~ V~ = P~ /E e K sono costanti. Perciò tale punto si muove di moto rettilineo uniforme. Perciò il centro di massa-energia (CME) ha un moto non inuenzato dalle forze interne del sistema e ci si può porre in un sistema di riferimento inerziale in cui esso risulti fermo. Questo è il concetto che sostituisce il centro di massa della sica newtoniana. Nel sistema CME il vettore velocità V~ . ~ X è ovviamente nullo, per denizione, come pure la sua ~ = 0 e J αβ ha solo 3 componenti date dal momento K Perciò in questo sistema angolare intrinseco del sistema. 64 CAPITOLO 4. 4.12 DINAMICA RELATIVISTICA Spin Il 4-tensore J αβ ha una trasformazione alquanto peculiare per traslazioni. 0µ µ µ µ coordinate come x = x + a con a = costante, esso subirà una variazione Se cambio J 0αβ = J αβ + aα pβ − aβ pα Ciò non deve sorprendere più di tanto, poiché sappiamo che il momento angolare subisce una analoga variazione quando lo si denisca da origini degli assi diversi. Per isolare la parte intrinseca del momento angolare risulta conveninete denire un 4-vettore detto come segue dove U δ = P δ/ 1 Sα = αβγδ J βγ U δ 2 P n mn è la 4-velocità del CME. Nel sistema CME le sue componenti sono δ U = (poiché spin γ(0) = 1). 1 ~0 Perciò in tale sistema le componenti di Sα si possono facilemnte calcolare Sα = (0, J 23 , J 31 , J 12 ) cioè α S = 0 ~ L Le componenti dello spin sono proprio date dal momento angolare intrinseco, cioè calcolato nel sistema CME. Che Sα abbia sempre 3 componenti indipendenti, in qualunque sistema di riferimento si può vedere dalla relazione U α Sα = 0 facilmente deducibile dalla denizione di Sα in quanto si moltiplica un termine simmetrico α δ αβγδ in α, δ (U U ) per uno antisimmetrico . Questa relazione lega tra loro le 4 componenti di Sα in qualunque sistema di riferimento, lasciandone solo 3 linearmente indipendenti. Capitolo 5 Il campo elettromagnetico 5.1 Equazioni di Maxwell I fenomeni elettromagnetici, nella sintesi operata da Maxwell (1850) sono descritti da un campo elettrico ~ E e un campo magnetico descritte da una densità di carica ρ ~ B generati da distribuzioni di carica elettrica e una densità di corrente ~j = ρ~v , essendo ~v un campo di velocità che descrive i moti delle cariche elettriche nello spazio tridimensionale. Le equazioni di Maxwell, che regolano tutti i fenomeni elettromagnetici, si scrivono ~ ·E ~ =ρ ∇ ~ ~ =0 ∇·B ~ ×E ~ = − ∂ B~ ∇ ∂t ~ ∂E ~ ~ ∇×B = + ~j I II III IV ∂t La II e la III legano tra loro i campi due legano i campi densità ρ ~ B ~ E, Eq. di Gauss per l'elettricità Eq. di Gauss per il magetismo Legge di Faraday dell'induzione Legge di Ampère ~ E e ~ B e si dicono equazioni omogenee, le altre alle loro cause, cioè alla distribuzione di cariche descritta dalla e dalla densità di corrente ~j . Non esistono, per quanto sappiamo, in natura cariche e correnti magnetiche (monopoli ~ ↔ −B ~ E che le equazioni godono quando scritte in assenza di cariche elettriche (cioè per ρ = ~ j = 0). magnetici) anche se da un punto di vista teorico restaurerebbero la simmetria 5.2 Equazione di continuità La densità di carica ρ e la corrente ~j sono legate dall'equazione di continuità ∂ρ ~ ~ +∇·j =0 ∂t Quest'ultima è deducibile dalle equazioni di Maxwell stesse. Si prenda la IV equazione e se ne faccia la divergenza (cioè vi si applichi l'operatore ~ ∇· ~ ·∇ ~ ×B ~ = ∂∇ ~ ·E ~ +∇ ~ · ~j ∇ ∂t 65 ad ambo i membri) 66 CAPITOLO 5. e inne si ricordi che per qualunque vettore ~ ~ ·E ∇ V~ IL CAMPO ELETTROMAGNETICO vale l'identità ~ ·∇ ~ × V~ = 0. ∇ Riesprimendo tramite la equazione III, si ottiene l'equazione di continuità. Il signicato sico dell'equazione di continuità è quello di conservazione della carica elettrica totale del sistema, come può essere dimostrato seguendo le linee della sezione 4.8. Quest'ultima è denita come la somma su tutti i punti dello spazio della densità di carica distribuita in ciascun punto Z Q≡ ρ(~x, t)d3 x R3 Nel caso di un sistema di particelle cariche la densità e la densità di corrente saranno denite come ρ(~x, t) = X ~j(~x, t) = X eA δ (3) (~x − ~xA ) A eA~vA δ (3) (~x − ~xA ) A in cui eA sono le cariche elettriche delle singole particelle del sistema. discende che 5.3 Q= Ovviamente ne P A eA . Campi potenziali Dalla II equazione di Maxwell vediamo che ~ B è un campo vettoriale a divergenza nul- la. Tutti i vettori a divergenza nulla si possono scrivere come rotore di un altro vettore opportuno. Perciò introduciamo il potenziale vettore ~ A tale che ~ =∇ ~ ×A ~ B Sostituendo nella III cioè (5.1) ~ ~ ×E ~ = −∇ ~ × ∂A ∇ ∂t ! ~ ∂ A ~+ ~ × E ∇ =0 ∂t Ora, ogni vettore avente rotore nullo può essere scritto come il gradiente di un opportuno potenziale scalare. Esisterà dunque una funzione φ tale che ~ ~ + ∂ A = −∇φ ~ E ∂t φ è detto potenziale scalare. Quindi ~ ~ = −∇φ ~ − ∂A E ∂t (5.2) 5.4. 67 INVARIANZA DI GAUGE E GAUGE DI LORENTZ 5.4 Invarianza di gauge e gauge di Lorentz I potenziali ~ A e φ non sono in realtà deniti univocamente dalle relazioni (5.1,5.2). Quelli che contano da un punto di vista sico sono i campi ~ B ~ E, e qualunque variazione dei po- ~ φ che li lasci invariati è del tutto ininuente per la sica dell'elettromagnetismo. tenziali A, Mostriamo ora che una ridenizione dei potenziali come segue ~ → A ~0 = A ~ + ∇Λ ~ A ∂Λ 0 φ → φ = φ − ∂t con ~ B ~. Λ funzione arbitraria genera gli stessi campi E, (5.3) Infatti, tenendo conto della identità vettoriale ~ × ∇f ~ =0 , ∇ ∀f si ha ~0 = ∇ ~ ×A ~0 = ∇ ~ ×A ~+∇ ~ × ∇Λ ~ =∇ ~ ×A ~=B ~ B ~0 ~ ∂A ~ 0 = −∇φ ~ 0 − ∂ A = −∇φ ~ + ∇∂Λ ~ ~ ∂Λ = E ~ E − −∇ ∂t ∂t ∂t Le ridenizioni (5.3) dei potenziali, che lasciano invariata la sica, sono dette trasformazioni di gauge. Le equazioni di Maxwell sono invarianti per trasformazioni di gauge. Λ per semplicare certe formule relative ~ ai potenziali A, φ sapendo che queste non inceranno i risultati sici che riguardano i campi ~ B ~. E, Possiamo quindi scegliere opportunamente le Una scelta conveniente è il cosiddetto gauge di Lorentz in cui ~ ·A ~ + ∂φ = 0 ∇ ∂t Qualunque funzione Λ(x) (5.4) che soddis la condizione Λ = 0 realizza la condizione (5.4) del gauge di Lorentz. Infatti operando sul primo membro della (5.4) una trasformazione di gauge si ottiene 0 2 ~ ·A ~ 0 + ∂φ = ∇ ~ + ∂φ + ∇2 Λ − ∂ Λ = ∇ ~ ·A ~ ·A ~ + ∂φ − Λ ∇ 2 ∂t ∂t ∂t ∂t e perciò essa è realizzata da qualunque trasformazione di gauge che soddis 5.5 Equazioni soddisfatte da ~ A e φ; 4-potenziale Sostituendo le (5.1,5.2) nella IV equazione di Maxwell, si ha ~= ∂ ~ ×∇ ~ ×A ∇ ∂t ~ ~ − ∂A −∇φ ∂t Λ = 0. ! + ~j Aµ 68 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO e grazie alla nota identità tra vettori ~ ×∇ ~ × V~ = ∇( ~ ∇ ~ · V~ ) − ∇2 V~ ∇ si perviene alla ~ ∂φ ∂2A ~ ~ ~ ~ + ~j −∇ A + 2 = −∇ ∇ · A + ∂t ∂t 2 equazione che deve essere soddisfatta dai potenziali scalare e vettore anchè i campi ~ B ~ E, da loro generati soddisno le equazioni di Maxwell. Nel gauge di Lorentz questa equazione si semplica notevolmente ~ = ~j A Analogamente, sostituendo le (5.1,5.2) nella I equazione di Maxwell otteniamo ~ · −∇ Nel gauge di Lorentz, in cui ~ ~ + ∂A ∇φ ∂t ~ A ~ = − ∂φ ∇· ∂t ! = −∇2 φ − ∂ ~ ~ ∇·A=ρ ∂t anche questa equazione si semplica notevolmente φ = ρ Risulta quindi conveniente riunire i tre potenziali 4-dimensionale µ A = φ ~ A ~ A e il potenziale φ in un oggetto per il quale, nel gauge di Lorentz, le equazioni di campo si scrivono semplicemente Aµ = j µ ≡ ∂µ ∂ µ si Lorentz-trasforma come uno scalare e j µ come un 4-vettore controµ variante, anche A risulta essere un 4-vettore controvariante. Il corrispondente 4-vettore ν ~ . A questo oggetto Aµ o Aµ si covariante sarà ovviamente denito da Aµ = gµν A = (φ, −A) Poichè da il nome di 4-potenziale elettromagnetico. 5.6 Tensore elettromagnetico Per scrivere le equazioni di Maxwell in forma covariante dobbiamo innanzitutto trovare un oggetto tensoriale che codichi opportunamente le informazioni contenute nei campi ~ B ~. E, Questi due vettori corrispondono in totale a 6 componenti. Perciò l'oggetto che cerchiamo non può essere un 4-vettore, che ha solo 4 componenti. Un generico tensore di rango 2 avrebbe 16 componenti, ma se consideriamo un tensore antisimmetrico, esso ha le componenti diagonali nulle e quelle sotto la diagonale opposte a quelle sopra la diagonale, e 5.6. 69 TENSORE ELETTROMAGNETICO perciò non indipendenti. Tale tensore antisimmetrico ha perciò esattamente 6 componenti indipendenti, e viene quindi spontaneo pensare a un tale oggetto come il naturale candidato a descrivere il campo elettromagnetico. Deniamo il tensore elettromagnetico Fµν = ∂µ Aν − ∂ν Aµ Si verica subito che tale oggetto è antisimmetrico nello scambio degli indici µ e ν. Le sue componenti possono essere determinate con un calcolo diretto, per esempio: F0i = ∂0 Ai − ∂i A0 = − ∂Ai − ∂i φ = E i ∂t F12 = ∂1 A2 − ∂2 A1 = ∂2 A1 − ∂1 A2 = −B 3 Riassumendo F0i = E i Fij = −ijk B k ovvero in forma matriciale Fµν 0 E1 E2 E3 −E 1 0 −B 3 B 2 = 2 3 −E B 0 −B 1 −E 3 −B 2 B 1 0 Analogamente si può denire un tensore controvariante F µν = g µρ g νσ Fρσ La prima considerazione è che potenziale Aµ , 0 −E 1 −E 2 −E 3 E1 0 −B 3 B 2 = 2 3 E B 0 −B 1 E 3 −B 2 B 1 0 Fµν , anche se inizialmente denito attarverso il 4- dipende solo dai campi elettrico e magnetico, perciò come questi è un oggetto sico gauge invariante. Consideriamo ora le due equazioni di Maxwell disomogenee (I e IV) nella forma ~ ·E ~ =ρ ∇ ~ ×B ~ − ∂ E~ = ~j ∇ ∂t A secondo membro compare in modo evidente la 4-corrente j µ , perciò ci aspetteremmo che questa sia eguagliata da un 4-vettore. Abbiamo però a disposizione un tensore antisimmetrico Fµν di rango 2. Osserviamo che le componenti di questo tensore sono date dalle componenti di ~ E o ~. B Ora, nelle equazioni compaiono le derivate di tali vettori, perciò dovrebbe esserci anche una ∂µ nel primo membro dell'equazione. Viene spontaneo pensaµν re che la contrazione ∂µ F , che ha appunto un solo indice libero, possa essere il miglior candidato. Infatti le equazioni disomogenee si scrivono ∂µ F µν = j ν (5.5) 70 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO Possiamo vericare questo fatto componente per componente ~ ·E ~ = j0 = ρ ∂µ F µ0 = ∂i E i = ∇ ∂µ F µi = ∂0 F 0i + ∂k F ki = ∂0 E i + ∂k = − ∂E i ~ × B) ~ 1 + (∇ ∂t e analogamente per le altre componenti. Si noti che derivando il primo membro rispetto a ∂µ si ottiene 0, poichè si sta contraendo un oggetto totalmente simmetrico (∂µ ∂ν ) con uno totalmente antisimmetrico (F µν ). Perciò il secondo membro di tale uguaglianza dovrà pure essere 0. Abbiamo così ridedotto in un modo molto semplice, che illustra la potenza del caclolo covariante, l'equazione di continuità ∂µ j µ = 0. Esaminiamo ora le equazioni omogenee ~ ·B ~ =0 ∇ ~ ×E ~ + ∂ B~ = 0 ∇ ∂t Di nuovo queste sono 4 equazioni in tutto, ma la dierenza ora è che non possono più essere uguagliate a un 4-vettore: a secondo membro infatti c'è semplicemente 0. Dovendo usare Fµν e non potendo contrarlo in modo tale da ottenere comunque 4 equazioni, si può solo pensare a una combinazione di antisimmetrizzazione degli indici che possa eventualmente dare 4 equazioni indipendenti. Avendo a disposizione 2 indici ciò non è possibile: poichè ogni indice prende 4 valori le possibilità sarebbero le possibili liste di 4 oggetti presi a due a due, cioe` In eetti stiamo contando le 4! =6 2!2! compomenti di Fµν che sono appunto 6. Tuttavia notiamo che anche in queste equazioni come nelle precedenti entrano le derivate, perciò dovremo ∂µ da qualche parte. Vediamo allora cosa si riesce a fare con oggetti con 3 ∂µ Fνρ . Se antisimmetrizziamo completamente questo oggetto otteniamo tutti i mettere una indici, tipo modi di disporre 4 oggetti presi a 3 a 3 cioè 4! =4 3!1! abbiamo il giusto numero di equazioni. Per le equazioni omogenee di Maxwell si propone quindi la forma ∂µ Fνρ + ∂ρ Fµν + ∂ν Fρµ = 0 Una verica componente per componente conferma che la scelta è giusta e che questa equazione veramente è equivalente alle equazioni di Maxwell omogenee. Usando il simbolo di Levi-Civita è utile a questo punto introdurre il tensore elettromagnetico duale F̃µν = µνρσ F ρσ 5.7. 71 FORZA DI LORENTZ in modo da scrivere le equazioni omogenne di Maxwell nella semplice forma ∂µ F̃ µν = 0 (5.6) Le equazioni di Maxwell possono quindi essere scritte in maniera covariante tramite le (5.5) e le (5.6). Per studiare le trasformazioni di Lorentz dei potenziali scalare e vettore basta osservare che essi formano un 4-vettore e perciò si trasformano come A0µ = Λµν Aν Nel caso di due sistemi di riferimento in moto relativo a velocità φ0 A01 A02 A03 = = = = v lungo l'asse x1 si avrà γ(φ − vA1 ) γ(A1 − vφ) A2 A3 Analogamente per i campi elettrico e magnetico basta scrivere le trasformazioni del tensore elettromagnetico (F 0 )µν = Λρ µ Λσν Fρσ ed esplicitare le componenti. Un semplice prodotto di matrici fornisce, : E10 E20 E30 B10 B20 B30 = E1 = γ(E2 − vB3 ) = γ(E3 − vB2 ) = B1 = γ(B2 + vE3 ) = γ(B3 + vE2 ) Si noti come un campo puramente elettrico in un sistema di riferimento inerziale può mostrare sia componenti elettriche che magnetiche in un altro. I concetti di campo elettrico e di campo magnetico sono del tutto relativi. 5.7 Forza di Lorentz Le equazioni di Maxwell dicono come, data una distribuzione di cariche (descrtta da ρ) e dato il loro movimento (descritto da ~ j ) siano determinati il campo elettrico e il campo magnetico. Tuttavia non dicono nulla su come i campi ~ B ~ E, inuenzino il moto delle particelle cariche. Questo è descritto dalla cosiddetta forza di Lorentz, cioè da una espressione per la forza generata da un campo elettromagnetico che inserita nelle equazioni del moto (di Newton o relativistiche) determina le traiettorie dei punti materiali carichi elettricamente. 72 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO La forza di Lorentz è, nel caso più generale ~ + 1B ~ × ~v F~ = e E c In formalismo 4-dimensionale essa si può tradurre in una espressione che lega la derivata del 4-impulso rispetto al tempo proprio con il tensore elettromagnetico e la 4-velocità 1 dpµ = F µν uν dτ c 5.8 Formalismo lagrangiano Come già commentato nel capitolo sulla meccanica relativisitca l'interazione a distanza in relatività si deve pensare sempre come mediata da un campo avente una sua densità di energia-impulso e quindi assimilabile a un ente sico che partecipa alla dinamica del sistema assieme alle particelle che ne sono sorgenti. Una trattazione completa di un sistema comprendente le sue forze deve perciò passare attraverso la formulazione di un principio di minima azione, o equivalentemente di un formalismo lagrangiano, che comprenda sia le particelle materiali che i campi che ne trasmettono le interazioni. In questa sezione esporremo la formulazione lagrangiana di un sistema di particelle accoppiato al campo elettromagnetico. Scriviamo l'azione di particelle nel campo elettromagnetico come composta di tre parti S = Smat + Sint + Scampo in cui Smat è l'azione delle N particelle libere vista a suo tempo Smat = − N X Z q 1 − vA2 dt t0 A=1 Scampo t1 mA è il termine di puro campo in assenza di materia e dovrebbe riprodurre le equazioni di Maxwell in assenza di cariche elettriche e correnti. Esso deve essere sia invariante di Lorentz che invariante di gauge. Inoltre, poichè le equazioni di Maxwell in forma covariante involvono derivate prime di Fµν , ci aspettiamo che la corrispondente densità di Lagrangiana, da cui esse sono ottenute attraverso le equazioni di Eulero-Lagrange con una operazione di derivazione, sia un Lorentz-invariante quadratico nelle Fµν e senza derivate. Ci sono due invarianti di Lorentz e di gauge indipendenti con questi requisiti Fµν F µν e 1 Fµν F̃ µν Abbiamo però visto che di questi due invarianti il primo è anche invariante di parità, mentre il secondo non lo è. Poichè i fenomeni elettromagnetici, per quanto ne sappiamo 1 Ovviamente F̃µν F̃ µν = Fµν F µν , come è facile vericare 5.8. 73 FORMALISMO LAGRANGIANO sperimentalmente, non presentano violazioni della simmetria di parità, ne a livello classico e nemmeno a quello quantistico, escluderemo la possibilità che il secondo termine possa comparire nella densità di lagrangiana L. Z Scampo = ove d4 x = dx0 dx1 dx2 dx3 . Pertanto assumiamo che l'azione sia data da Z 4 d xL = λ La costante λ d4 xFµν F µν davanti all'integrale sarà determinata dalla ri- chiesta che eettivamente le equazioni del moto forniscano le equazioni di Maxwell, con le giuste costanti. Ricordando la denizione di Fµν in termini del 4-potenziale Aµ possiamo usare le equazioni di Eulero-Lagrange ∂ρ ∂L ∂L − =0 ∂∂ρ Aµ ∂Aµ per ricavare le equazioni del moto. Queste risultano avere la forma ∂ρ F ρµ = 0 complementate dall'identità di Bianchi ∂ρ F̃ ρµ = 0 Sappiamo che l'identità di Bianchi da origine alle equazioni omogenee di Maxwell, mentre l'altra equazione da origine a quelle disomogenee che sono accoppiate alla materia. Il fatto che qui esse a secondo membro siano nulle rispecchia l'assunto iniziale che stiamo µ trattando un campo in assenza di materia. Il termine proporzionale a j che abbiamo visto a secondo membro dare le equazioni di Maxwell disomogenee complete verrà dunque dal termine di interazione materia-campo Sint . Questo dovrà essere un Lorentz-invariante µ contenente appunto j accoppiata in qualche modo al campo Aµ . La maniera più semplice di accoppiare questi due campi in grado di fornire, attraverso Eulero-Lagrange, le equazioni di Maxwell disomogenee è quella di assumere Z Sint = ω Anche qui la costante ω d4 x j µ Aµ davanti all'integrale sarà determinata richiedendo che vengano riprodotte le corrette costanti nelle equazioni di Maxwell. Applicando Eulero-Lagrange a Sint + Scampo , a dierenza di prima, ove comparivano solo derivate della L ∂ρ Aµ , ora compare anche una derivata della densità di lagrangiana rispetto ad tutto il sistema rispetto a Aµ , portando alle equazioni ∂ρ F ρµ = j µ a patto che si scelga λ = −ω/4. La scelta di porre ω = 1 porta, come vedremo tra breve, al corretto accoppiamento materia-campo, cioè alla giusta espressione per la forza di Lorentz. L'azione totale del sistema materia-campo elettromagnetico sarà perciò S=− N X A=1 Z mA Z Z q 1 4 µ 2 d4 xFµν F µν dt 1 − vA + d xj Aµ − 4 74 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO Ricordando le espressioni della densità di carica e di corrente per un sistema di particelle ognuna avente carica eA ρ(~x, t) = ~j(~x, t) = N X A=1 N X eA δ (3) (~x − ~xA (t)) eA~vA (t)δ (3) (~x − ~xA (t)) A=1 perveniamo alla lagrangiana di un sistema di particelle materiali immerso in un campo elettromagnetico L=− X mA q 1 − vA2 + X eA φ(xA ) − A A X ~ A ) + Lcampo eA~vA · A(x A Prima di calcolare le equazioni del moto, ricaviamo il momento coniugato nate P~A delle coordi- ~xA ∂L ~ A) = p~A + eA A(x P~A ≡ ∂~vA ove p~A = mA γ(vA )~vA è il consueto impulso della particella materiale. Per applicare Eulero- Lagrange per le variabili ~x, ~v ∂L d ∂L = dt ∂~vA ∂~xA calcoliamo innanzitutto il termine ∂L/∂~xA ∂L ~ = eA ∇( ~ A ~ · ~vA ) − eA ∇φ ~ = ∇L ∂~xA ~vA =cost. Dimostriamo che vale l'identità ~ A ~ · ~v ) = (~v · ∇) ~ A ~ + ~v × (∇ ~ × A) ~ ∇( (5.7) Ciò può essere fatto in compnenti, tenendo conto della relazione δjl δkm = δjm δkl + ijk ilm (5.8) La componente j-sima del primo membro della (5.7) si può scrivere ~ · ~v ) = ∂j Ak v k = δjl δkm ∂l Am v k ∂j (A che equivale a moltiplicare il primo membro della (5.8) per ∂l Am v k . La (5.8) ci fornisce allora ~ × A) ~ i δjl δkm ∂l Am v k = (δjm δkl + ijk ilm )∂l Am v k = v k ∂k Aj + jki v k (∇ 5.9. TENSORE ENERGIA-IMPULSO DEL CAMPO ELETTROMAGNETICO 75 e cioè la (5.7). Pertanto ∂L ~ A ) + eA~vA × B(x ~ A ) − eA ∇φ(x ~ ~ A(x = eA (~vA · ∇) A) ∂~xA Da ciò, usando le equazioni di Eulero-Lagrange per le coordinate ~xA e le velocità ~vA delle particelle si ottiene l'espressione per la forza di Lorentz vista prima dpµ = F µν uν dτ Questa che abbiamo esposto è la lagrangiana generale dell'elettrodinamica classica di un sistema di particelle e sta alla base della generalizzazione quantistica nota come QED (quantoelettrodinamica), uno dei massimi successi della Teoria Quantistica dei Campi. Si noti che il calcolo del momento coniugato alle coordinate di accoppiamento con il campo elettromagnetico dato dalla ~xA Sint delle particelle, nel caso proposta sopra, porta a ∂L ~ A) P~A = = p~A + eA A(x ∂~xA con p~A impulso della particella libera, cioè la cosiddetta regola minimale di accoppiamento tra materia carica e un campo elettromagnetico esterno. Inne calcoliamo l'hamiltoniana che ci darà l'energia totale del sistema. Cominciamo da Smat + Sint (indichiamo per brevità H = X ~ A = A(x ~ A) A e φA = φ(xA ) ~vA · P~A − L A = X mA γA vA2 ~ A · ~vA + mA + eA A q 1− vA2 ~ A · ~vA + eA φA − eA A A = X (mA γA + eA φA ) A Si noti che il contributo all'energia dovuto alla presenza di campo elettromagnetico proviene tutto dal solo potenziale scalare. 5.9 Tensore energia-impulso del campo elettromagnetico Nel caso del campo elettromagnetico, descritto dalla densità di lagrangiana 1 L = − Fµν F µν 4 calcoliamo il tensore energia impulso T µν = ∂L ∂µ Aσ − δνµ L ∂∂µ Aσ 76 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO Essendo ∂L 1 ∂Fαβ 1 ∂(∂α Aβ − ∂β Aα ) = − F αβ = − F αβ ∂∂µ Aσ 2 ∂∂µ Aσ 2 ∂∂µ Aσ ∂∂α Aβ = −F αβ δαµ δβσ = −F µσ = −F αβ ∂∂µ Aσ si ha Alzando l'indice 1 T µν = −F µσ ∂ν Aσ + δνµ Fρτ F ρτ 4 ν 1 T µν = −F µσ ∂ ν Aσ + g µν Fρτ F ρτ 4 Questo tensore non è simmetrico. Costruiamoci allora un tensore T 0µν = T µν + ∂σ ψ µνσ che sia simmetrico. Allo scopo prendiamo ψ µνσ = Aµ F νσ cosicchè ∂σ ψ µνσ = (∂σ Aµ )F νσ + Aµ ∂σ F νσ In assenza di cariche il secondo termine scompare e quindi ∂σ ψ µνσ = F νσ ∂σ Aµ Perciò il nuovo tensore energia impulso sarà ora simmetrico e varrà µν Tcampo =− F µσ F σν 1 − g µν Fρτ F ρτ 4 Si vede subito che la traccia T µµ = 0 è nulla (il campo elettromagnetico classico è conformemente invariante) ed esplicitando le componenti T 00 = H = E2 + B2 2 T 0i = S i 1 2 (E + E32 − E12 + B22 + B32 − B12 ) T 11 = 2 2 1 2 T 22 = (E + E12 − E22 + B32 + B22 − B12 ) 2 3 1 2 T 33 = (E + E22 − E32 + B12 + B22 − B32 ) 2 1 T ij = −E i E j + B i B j i 6= j ij Le componenti T = σ ij si dicono tensore degli sforzi di Maxwell, mentre le componenti 0i T che devono fornire la densità di impulso del sistema, sono date dalle componenti del vettore di Poynting ~=E ~ ×B ~, S del quale si può così comprendere il signicato sico. 5.10. TENSORE ENERGIA-IMPULSO DI MATERIA ACCOPPIATA AL CAMPO ELETTROMAGNET 5.10 Tensore energia-impulso di materia accoppiata al campo elettromagnetico Ricordando le denizioni di densità e corrente di materia µ(x) = X ~π (x) = X 00 mn γ(vn )δ (3) (~x − ~xn (t)) = Tmat n i0 p~n δ (3) (~x − ~xn (t)) = Tmat n ovvero, usando il 4-vettore pµ µ0 Tmat (x) = X pµn δ (3) (~x − ~xn (t)) n possiamo vedere le componenti µ0 Tmat del tensore energia-impulso di un sistema di particelle libere come le densità di 4-impulso. Queste, assieme alle densità di correnti di 4-impulso formano come visto a suo tempo 4 equazioni di continuità µν ∂ν Tmat =0 Se le particelle non sono più libere, ma intergaenti elettromagneticamente, questa equazione di continuità non vale più e deve essere sostiutita da una più generale che comprende anche il contributo del tensore energia-impulso del campo elettromagnetico. Denendo infatti µν µν T µν = Tmat + Tcampo si ha l'equazione di continuità ∂µ T µν = 0 valida per tutto il sistema chiuso costituito da materia più campo elettromagnetico.