Corso di Relatività: prima parte Prof. L. Vanzo1 Dipartimento di Fisica, Università di Trento 9 maggio 2013 1 [email protected] Sommario Negli ultimi decenni dell’ottocento si pensava alle onde elettromagnetiche come a perturbazioni di un etere immobile, dotato anche di proprietà meccaniche. Questo pose per le discipline fisiche quello che era, forse, il principale problema scientifico dell’epoca: dimostrare sperimentalmente l’esistenza dell’etere e determinarne le proprietà meccaniche ed elettromagnetiche. Tuttavia, e in parte sorprendentemente1 , nessuno dei vari esperimenti tentati riuscı́ mai in quell’intento. Oggi si può dire che quegli esperimenti misero in luce essenzialmente i limiti dei concetti di spazio e tempo della fisica classica newtoniana, e la necessità di una loro revisione2 . Come tutti sanno, la forma definitiva di questa revisione è opera di A. Einstein e forma la base concettuale della teoria della relatività ristretta, o speciale. Questa teoria è basata sull’osservazione che in mancanza di segnali che si propagano immediatamente, non è possibile confrontare il tempo di eventi distanti se prima non si adotta una convenzione per sincronizzare (o regolare) gli orologi. Si vedrà che ciò ha condotto Einstein a un nuovo concetto di tempo. Questo argomento e le sue conseguenze nei campi della meccanica e dell’elettrodinamica formano il corpo principale del corso di relatività. La meccanica dei fluidi, la statistica e la termodinamica relativistica saranno considerate solo marginalmente. L’estensione del principio di relatività ai sistemi di riferimento accelerati, considerata da Einstein come epistemologicamente necessaria, condusse a una seconda, e più radicale, revisione dei concetti di spazio e tempo. L’osservazione (sempre di Einstein) che una trasformazione arbitraria delle coordinate spazio-temporali è indistinguibile da un cambiamento del campo gravitazionale è il fondamento della sua teoria relativistica della gravitazione, la relatività generale che è alla base della recente, intensa attività di ricerche nel campo cosmologico, e che sarà introdotta nella seconda parte di questo corso. I seguenti appunti raccolgono una sintesi dei temi trattati a lezione, e non devono in alcun modo essere considerati un sostituto dei testi. Per i necessari approfondimenti si rimanda allo studio dei libri indicati nella bibliografia. 1 La necessità dell’etere era sostenuta da alcuni fra i migliori scienziati dell’epoca. In appendice D sono citati i testi di W. Pauli, di C. Møller e di Panofski e Phillips, dove si trova una introduzione storica dettagliata al periodo pre-relativistico. 2 Indice 1 Simmetrie non relativistiche 1.1 Considerazioni generali . . . . . . . . . . . . . . . . . . . 1.2 Sistemi di riferimento e coordinate . . . . . . . . . . . . 1.3 Il gruppo di Galilei . . . . . . . . . . . . . . . . . . . . . 1.3.1 Sistemi inerziali . . . . . . . . . . . . . . . . . . . 1.3.2 Trasformazioni di Galilei . . . . . . . . . . . . . . 1.3.3 Struttura di gruppo . . . . . . . . . . . . . . . . . 1.4 Relatività e meccanica . . . . . . . . . . . . . . . . . . . 1.4.1 L’addizione delle velocità . . . . . . . . . . . . . . 1.4.2 Equazioni del moto di Newton . . . . . . . . . . . 1.4.3 Sistemi continui: il fluido perfetto e la conduzione 1.4.4 L’equazione di Schrödinger . . . . . . . . . . . . . 1.4.5 Il principio di relatività galileiano . . . . . . . . . 1.5 Ottica non relativistica . . . . . . . . . . . . . . . . . . . 1.5.1 onde piane e velocità di fase . . . . . . . . . . . . 1.5.2 la velocità di gruppo . . . . . . . . . . . . . . . . 1.5.3 La velocità della luce nei dielettrici trasparenti . . 1.5.4 L’aberrazione e l’effetto Doppler . . . . . . . . . . 1.6 Esperienze di fine secolo XIX . . . . . . . . . . . . . . . 1.6.1 Hoek . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Fizeau e Fresnel . . . . . . . . . . . . . . . . . . . 1.6.3 Michelson e Morley . . . . . . . . . . . . . . . . . 1.6.4 Interpretazioni . . . . . . . . . . . . . . . . . . . 1.7 Esperienze moderne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . del . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . calore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 5 5 6 7 8 8 9 10 12 14 14 15 16 17 19 20 21 22 22 23 25 2 Le basi della relatività speciale 2.1 Gli assiomi di Einstein . . . . . . . . . . . . . . . . 2.1.1 Osservazioni sui postulati . . . . . . . . . . 2.1.2 La definizione del tempo . . . . . . . . . . . 2.2 Le trasformazioni di Lorentz . . . . . . . . . . . . . 2.2.1 Condizioni sulle trasformazioni . . . . . . . 2.2.2 Trasformazioni di Lorentz speciali, o boosts 2.2.3 La più generale trasformazione di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 26 27 28 30 30 32 36 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 2.4 2.5 Lunghezze e intervalli di tempo . . . . . . . . . . . . . . L’addizione delle velocità . . . . . . . . . . . . . . . . . . La luce nei dielettrici trasparenti . . . . . . . . . . . . . 2.5.1 Effetto Doppler e aberrazione secondo la relatività 2.5.2 Onde di materia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 39 41 42 42 3 Formalismo quadridimensionale ed equazioni invarianti 3.1 Prodotto scalare . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Gruppo di Lorentz . . . . . . . . . . . . . . . . . . . . . . 3.3 Tensori e campi di tensori . . . . . . . . . . . . . . . . . . 3.3.1 tensori algebrici . . . . . . . . . . . . . . . . . . . . 3.3.2 campi tensoriali . . . . . . . . . . . . . . . . . . . . 3.4 Equazioni invarianti . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Equazione di Klein-gordon . . . . . . . . . . . . . . 3.4.2 Equazione di Proca . . . . . . . . . . . . . . . . . . 3.5 Il tempo proprio . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Il cono luce e le relazioni causali . . . . . . . . . . . . . . . 3.7 Curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 44 45 46 46 48 49 49 50 51 51 52 4 Meccanica relativistica 4.1 quantità di moto, energia e forza . . . . . . 4.2 formule di trasformazione . . . . . . . . . . 4.3 sistemi di particelle . . . . . . . . . . . . . . 4.4 Equazioni del moto . . . . . . . . . . . . . . 4.5 Moto uniformemente accelerato, o iperbolico 4.6 Il razzo relativistico . . . . . . . . . . . . . . 4.7 E = mc2 . . . . . . . . . . . . . . . . . . . . 4.8 Collisioni . . . . . . . . . . . . . . . . . . . . 4.8.1 L’effetto Compton . . . . . . . . . . 4.8.2 Energia di soglia . . . . . . . . . . . 4.8.3 Decadimento . . . . . . . . . . . . . 4.9 Moto dello spin e precessione di Thomas . . 4.10 Principio variazionale . . . . . . . . . . . . . 4.11 Momento angolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 54 55 56 57 58 59 62 64 64 66 68 69 71 73 5 Elettrodinamica covariante 5.1 Forma covariante delle equazioni . . . 5.2 Corrente elettrica . . . . . . . . . . . 5.3 Trasformazione dei campi . . . . . . 5.4 Elettrodinamica fenomenologica . . . 5.5 Campo di una carica in moto rapido 5.6 L’equazione di Lorentz-Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 74 75 78 79 81 85 2 . . . . . . . . . . . . . . . . . . . . . . . . 6 Principi variazionali 6.1 Equazioni di Eulero e Lagrange . . . 6.2 Azione per il campo elettromagnetico 6.3 Azione per le particelle . . . . . . . . 6.4 Il tensore energia-impulso . . . . . . 6.4.1 Caso generale . . . . . . . . . 6.4.2 Campo scalare . . . . . . . . 6.4.3 Campo elettromagnetico . . . 6.4.4 Fluido perfetto . . . . . . . . 6.4.5 Particelle libere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 89 90 92 93 93 95 96 97 100 7 Teoria della gravitazione 7.1 Il principio di equivalenza . . . . . . 7.2 Metrica e gravitazione . . . . . . . . 7.2.1 Moto di una particella . . . . 7.2.2 Distanze spaziali e intervalli di . . . . . . . . . . . . tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 102 105 107 110 8 Appendici A Invarianza della fase B La delta di Dirac . . C Testi di Riferimento . D Argomeni da studiare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 113 113 116 117 . . . . . . . . . . . . . . . . . . . . . per l’esame . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Capitolo 1 Simmetrie non relativistiche Dal punto di vista di un fisico moderno una teoria relativistica (in assenza di gravitazione) è innanzitutto una teoria in accordo con i postulati di Einstein e, dunque, una teoria invariante di Lorentz. Ma sarebbe errato pensare che il principio di relatività non esistesse prima di Einstein; la meccanica classica di Galileo-Huygens-Newton e le sue numerose ramificazioni soddisfa anch’essa a un principio di relatività, eccetto che il gruppo di simmetria è il gruppo di Galilei, diverso dal gruppo di Lorentz. Quest’ultimo ha la stessa dimensione del gruppo di Galilei e quindi il suo ruolo, propriamente, non è introdurre il principio di relatività, quanto ripristinare il principio già esistente in una forma che sia valida anche per l’elettrodinamica di Maxwell-Lorentz. In questo capitolo discuteremo brevemente le simmetrie non relativistiche soprattutto nel campo della meccanica e dell’ottica, allo scopo di identificare quelle assunzioni ingiustificate la cui rimozione ha portato infine al punto di rottura creato dalla teoria di Einstein. 1.1 Considerazioni generali Due osservatori aventi posizione, orientamento e velocità diverse descrivono lo stato di un sistema fisico in modo diverso. Per esempio, se si tratta di particelle gli assegnano coordinate e velocità diverse oppure, se si tratta di un sistema quantistico, gli assegnano vettori diversi del suo spazio di Hilbert. Ma come si calcolano le nuove coordinate e velocità, o i nuovi vettori? Questa è una materia delicata che riflette in larga misura le nostre opinioni sulla natura delle simmetrie spazio-temporali. In generale, esiste un gruppo di trasformazioni, operanti sullo spazio delle fasi o sullo spazio di Hilbert, le quali definiscono una legge di trasformazione degli stati e delle variabili dinamiche; la struttura di gruppo tiene conto dell’idea naturale che tali applicazioni si possano comporre e invertire. Per esempio, se si associa ad ogni rotazione nello spazio una matrice ortogonale 3 × 3, allora alla rotazione inversa sarà associata l’inversa della matrice e a due rotazioni eseguite in successione è associata la matrice che risulta dal prodotto delle due. L’insieme delle rotazioni, con questa corrispondenza, forma un gruppo continuo isomorfo al gruppo ortogonale SO(3) delle matrici ortogonali 3 × 3. 4 Si noti che le applicazioni di cui stiamo parlando non sono la stessa cosa delle operazioni fisiche con cui si cambiano effettivamente posizione, orientamento o velocità degli osservatori, tuttavia per comodità noi non faremo questa distinzione. Parleremo quindi di una rotazione sia per indicare una rotazione fisica dell’osservatore (o dello stato), sia come di un elemento del gruppo matematico delle matrici ortogonali 3 × 3. C’è un’interpretazione passiva delle trasformazioni, secondo la quale il cambiamento dello stato è attribuito al cambiamento dell’osservatore e allora si afferma, un pò vagamente, che il gruppo “trasforma” un osservatore nell’altro. Ma si può anche dare un’interpretazione attiva, secondo la quale l’osservatore resta lo stesso ma si ha un cambiamento reale dello stato. Ora, se le formule di trasformazione non hanno effetto sulle equazioni di una teoria nel senso che ne mantengono inalterata la forma, allora le predizioni della teoria non dipenderanno, per esempio, dalla velocità del sistema di riferimento. Si parla allora di trasformazioni di simmetria, e del gruppo corrispondente come di un gruppo di simmetria; per la precisione, poiché le trasformazioni connettono osservatori con diverso orientamento, posizione e velocità, si parla di simmetrie spazio-temporali. In questo caso si ha quindi un principio di relatività, cioè si afferma che le leggi della fisica sono le stesse per gli osservatori le cui posizioni, velocità e orientamento relativi sono connesse da elementi del gruppo di simmetria. Ovviamente, il tratto caratteristico di una teoria relativistica è soprattutto la relatività del moto, piuttosto che la relatività di orientamento o di posizione. La parola chiave è dunque velocità relativa, ed è essenziale che il gruppo di simmetria contenga elementi che corrispondono a osservatori in moto relativo, per parlare veramente di relatività. Se il gruppo include le traslazioni temporali, allora le leggi sono anche le stesse ad ogni tempo. Si noti che non si considerano osservatori accelerati, un problema che richiederebbe l’introduzione della relatività generale. D’altronde l’accelerazione ha effetti meccanici che si possono rivelare anche stando all’interno di una cassa chiusa, e dunque una simmetria che rendesse equivalenti due osservatori relativamente accelerati sembra, a prima vista, del tutto impossibile. Nel seguito studieremo i due principali esempi di simmetria spazio-temporale che si trovano in fisica e i corrispondenti principi di relatività: la simmetria galileiana che caratterizza la meccanica di Galileo e Newton, brevemente, e la simmetria di Lorentz che caratterizza la relatività ristretta, estensivamente. L’enfasi sarà posta evidentemente sulla relatività del moto, il concetto in cui le due simmetrie si differenziano maggiormente. 1.2 Sistemi di riferimento e coordinate Dato che i moti relativi sono i soli che si osservano, per una descrizione razionale del moto e degli altri fenomeni fisici è essenziale introdurre quello che in fisica si chiama un sistema di riferimento. Esso definisce uno standard convenzionale di quiete e le procedure 5 per la misura e la registrazione permanente delle coordinate di posizione e di tempo degli eventi1 . Si riconosce facilmente che i metodi usati allo scopo si basano tutti su due fatti fondamentali. Il primo è l’esistenza di corpi approssimativamente rigidi le cui proprietà sono in ottimo accordo con gli assiomi e le proposizioni della geometria euclidea. L’immagine scolastica del sistema di riferimento formato da tre piani rigidi ortogonali, poi idealizzato nei tre assi ortogonali orientati, ha infatti la sua origine nella geometria euclidea e nei corpi rigidi. Le coordinate cartesiane hanno infatti il semplice significato fisico di lunghezze misurate mediante regoli rigidi. In secondo luogo l’esistenza dei campi elettromagnetici (campi EM), con la loro enorme velocità di propagazione, è sufficientemente semplice e universale da rendere possibile il loro impiego per la misura delle coordinate spazio-temporali (cioè di tempo e luogo, anche qui localmente2 in accordo con gli assiomi e le proposizioni della geometria euclidea). Per esempio, il global positioning system[1] (GPS) è una tecnologia sofisticata per la determinazione delle coordinate che fa uso di satelliti e segnali EM di alta frequenza. Le coordinate sono qui determinate non mediante l’uso di regoli rigidi, ma da misure effettuate con segnali elettromagnetici e coinvolgono inevitabilmente la propagazione della radiazione EM. In entrambi i casi, le coordinate spaziali sono misurabili e possiedono un diretto significato fisico. La coordinata temporale è invece determinata dal fatto che possiamo attribuire a certi moti (la rotazione della terra o le oscillazioni di un pendolo), un carattere idealizzato e privilegiato. Cioè si assume che il moto degli oggetti privilegiati , che chiameremo orologi, non influenzi nè sia influenzato dagli oggetti che si vogliono indagare 3 Il carattere idealizzato degli orologi fornisce un concetto di tempo altrettanto idealizzato, essenzialmente equivalente al tempo assoluto di Newton, del quale egli affermava “che in sè e per sua natura, senza relazione ad alcunché di esterno, scorre uniformemente e con altro nome è chiamato durata.” Newton era estremamente consapevole del fatto che potrebbero non esistere moti rigorosamente uniformi con cui misurare il tempo, e forse proprio per questo introdusse la sua definizione di tempo assoluto. Il carattere idealizzato degli orologi è ancora più marcato nelle teorie quantistiche ma non può essere mantenuto, per esempio, in relatività generale perché secondo quella teoria il ritmo degli orologi è influenzato dal campo gravitazionale, e dunque dalla presenza delle masse astronomiche. Al contrario che del tempo, nelle teorie quantistiche non relativistiche le coordinate spaziali sono invece osservabili soggette a dispersione, e come tali si riferiscono sia all’oggetto osservato che allo strumento che le misura. Questo fa sı́ che in tali teorie lo spazio e il tempo siano trattati in maniera completamente differente. Nello svolgimento della relatività ristretta le problematiche legate alla teoria quantistica saranno comunque completamente ignorate. 1 Come avverte B. Schutz nel suo ottimo libro, un sistema di riferimento non è semplicemente una persona con il binoccolo, ma un sofisticato sistema di raccolta dati. 2 Sulle distanze cosmologiche le cose cambiano. 3 Ci sarebbe il problema importante di sapere in che misura queste ipotesi siano compatibili con le leggi della fisica, ma di questo non ci occupiamo. 6 Vi sono altre idealizzazioni, meno importanti, di cui faremo spesso uso; per esempio, in fisica classica si può generalmente parlare delle coordinate di un evento di emissione su di una stella lontana anche se di solito non è possible misurarle veramente. Un altra idealizzazione che useremo sarà riferirsi ai sistemi di riferimenti come se fossero sistemi di coordinate. 1.3 1.3.1 Il gruppo di Galilei Sistemi inerziali Si sa per esperienza che esistono sistemi di riferimento nei quali una particella libera (cioè non soggetta all’azione di forze esterne) si muove con velocità costante, un’affermazione importante vecchia di alcuni secoli e nota come legge di inerzia 4 . Questi sono i sistemi di riferimento inerziali (abbr. SRI), rispetto ai quali le equazioni del moto assumono la forma semplice descritta da Newton nei Principia (la legge F = ma e le sue applicazioni ai sistemi di particelle e ai corpi rigidi, al moto dei pianeti e delle comete e, più in generale alla meccanica celeste, e ancora, alla fisica statistica classica, al moto dei fluidi, all’aerodinamica, eccetera). Ovviamente l’accelerazione può essere zero solo rispetto a un tempo opportuno, cioè rispetto a un moto uniforme opportuno, e quindi la legge di inerzia implica una scelta del tempo. Assumeremo quindi, come parte della definizione di un sistema di riferimento inerziale, che sia possibile costruire e usare orologi idealizzati che siano consistenti con la legge di inerzia. Lo chiameremo il tempo universale. Con buona approssimazione, e per gli scopi pratici della vita quotidiana come ad esempio la definizione di un orario ferroviario, un tale orologio è la sfera celeste delle stelle fisse, che segna il tempo siderale. E1: Sia t il tempo universale e τ = f (t) una funzione monotona crescente di t. Si calcoli l’accelerazione di una particella considerando τ come il nuovo tempo. Si deduca che la legge di inerzia resta valida se e solo se τ = at + b, con a e b arbitrari ma a > 0. È appena il caso di sottolineare che siccome l’assenza di forze si può accertare solo con l’assenza di accelerazioni, un SRI non è esattamente definibile a meno che le sorgenti di forza non siano tutte esattamente note. Ma per quanto riguarda la legge di inerzia è altrettanto chiaro che ogni riferimento che si muove con moto traslatorio uniforme rispetto a un sistema inerziale è esso stesso inerziale, e dunque che esiste un’infinità di tali sistemi. Si pone il problema di trovare la formula di trasformazione delle coordinate associate a una coppia arbitraria di sistemi inerziali. Per le coordinate useremo la notazione vettoriale, con x = (x, y, z) e il significato usuale di x, y e z come di lunghezze misurate lungo i rispettivi assi orientati (le coordinate cartesiane). 4 Per una discussione approfondita si veda E. Mach, “La meccanica nel suo sviluppo storico critico”, Universale Scientifica Boringhieri, 1977. 7 1.3.2 Trasformazioni di Galilei ′ Se i sistemi inerziali F e F sono in moto relativo uniforme con velocità costante v, in meccanica classica si considerano evidenti le seguenti formule di trasformazione ′ x = R · x + vt + a (3.1) ′ t =t+τ (3.2) dove R è una matrice ortogonale (RRT = 1) che rappresenta una rotazione e la notazione R · x denota, come al solito, il prodotto righe per colonne di R con x. Queste sono le trasformazioni di Galilei. Una descrizione prosaica delle formule direbbe allora che ′ ′ l’osservatore O in F osserva l’origine di F muoversi con velocità v e transitare per il punto a nell’istante t′ = τ (o equivalentemente t = 0); osserva inoltre che i versori degli ′ assi orientati di F e F sono connessi dalla rotazione R ej = 3 ∑ ′ Rij ei (3.3) i=1 e che l’orologio di O appare in ritardo di τ secondi rispetto al proprio (se τ > 0, altrimenti ′ è O che ritarda rispetto ad O). L’operazione corrispondente descrive una traslazione temporale. E2: Si mostri che una rotazione e una traslazione spaziale commutano se e solo se la traslazione è diretta lungo l’asse di rotazione. Le formule scritte sono convenienti per studiare la struttura di gruppo delle trasformazioni ′ galileiane. Talvolta è più conveniente immaginare che F sia il sistema mobile e F il “sistema del laboratorio” considerato in quiete. Allora le coordinate dello stesso punto nei rispettivi SRI sono connesse dalle formule equivalenti ′ x = R−1 · (x − vt − a) (3.4) Se v = 0 la formula descrive l’azione combinata di rotazioni (x → R · x) e traslazioni (x → x − a), che però non hanno niente a che vedere con il moto relativo. Per scopi pratici possiamo eliminare il ricorso alle rotazioni e alle traslazioni richiedendo che i sistemi ′ coincidano esattamente per t = t = 0. Allora si ha la trasformazione di Galilei speciale ′ x = x − vt (boost, in inglese) o, per esteso, ′ x ′ y ′ z ′ t = = = = x − vx t y − vy t z − vz t t (3.5) (3.6) (3.7) (3.8) È importante rendersi conto che queste trasformazioni contengono, oltre al moto relativo, anche certe assunzioni sulla natura dello spazio e del tempo, o meglio, sul comportamento 8 ′ di regoli e orologi in movimento. Per esempio, adottando l’equazione t = t , si assume che si possano costruire orologi il cui ritmo non dipende dalla loro velocità. L’altra assunzione riguarda le distanze: le trasformazioni galileiane implicano immediatamente l’invarianza della distanza spaziale ′ ′ |x − y | = |R · (x − y)| = |x − y| dove |x| = (x2 + y 2 + z 2 )1/2 . In altre parole, si assume che si possano costruire regoli standard la cui lunghezza non dipende dallo stato di moto. Entrambe queste assunzioni sono ingiustificate. Di fatto, il tempo assoluto è l’assunzione che non si può mantenere in una teoria dove opera una velocità massima per la propagazione dei segnali, se le leggi sono locali. Oggi sappiamo che la massima velocità in natura è raggiunta dalla radiazione elettromagnetica nel vuoto (o dai fotoni), approssimativamente uguale a c = 2, 99792 · 1010 cm · sec−1 ≃ 300.000 Km/sec. e forse da qualche altra particella, come ad esempio certi tipi di neutrini. Per il resto, le formule di trasformazione corrispondono evidentemente all’idea di uno spazio vettoriale euclideo, dove le operazioni fondamentali sono quelle dell’algebra lineare o più generalmente dell’algebra affine (uno spazio vettoriale è uno spazio affine con la scelta di un’origine, v. figura). x x’ vt K’ K x’=x−vt ′ Figura 1.1: x = x − vt 1.3.3 Struttura di gruppo Le trasformazioni descritte dalle equazioni (3.1) e (3.2) formano un gruppo continuo a dieci dimensioni, G, denominato gruppo di Galilei. Per indicare un elemento del gruppo G usiamo la notazione g = (R, v, a, τ ) (3.9) 9 e per indicare l’azione dell’elemento g sulle coordinate (x, t) scriviamo ( ) ( ) x R · x + vt + a g· = t t+τ (3.10) Si noti che le coordinate definiscono formalmente un vettore in uno spazio cartesiano con quattro dimensioni e che G opera (non linearmente) in questo spazio. Analogamente sia ′ ′ ′ ′ ′ g = (R , v , a , τ ) Allora iterando la formula di trasformazione (3.10) si ottiene facilmente la seguente formula per il prodotto in G ′ ′ ′ ′ ′ ′ ′ ′ g g = (R · R, R · v + v , R · a + v τ + a , τ + τ ) (3.11) L’identità è l’elemento e = (1, 0, 0, 0), e si verifica facilmente che con queste operazioni l’insieme delle g forma un gruppo. Quanto alla dimensione, si noti che occorrono tre angoli per specificare R, tre numeri reali per v, tre per a e uno per τ , per un totale di dieci numeri reali indipendenti. Questo è tutto ciò che si intende dicendo che il gruppo ha dimensione dieci (anche se G non è uno spazio vettoriale). E3: (i) Si provi a realizzare G e la formula del prodotto (3.11) mediante un gruppo di trasformazioni lineari di uno spazio a 5 dimensioni (G è allora un gruppo di matrici 5 × 5 con l’usuale prodotto di matrici); (ii) dato g ∈ G si trovi il suo inverso, cioè l’elemento g −1 tale gg −1 = g −1 g = e; (iii) si mostri che si può ottenere una traslazione spaziale combinando un boost con una traslazione temporale. 1.4 Relatività e meccanica Occupiamoci della relazione del gruppo di Galilei con le equazioni del moto. Nella descrizione classica del moto, per ogni particella si hanno tre variabili di posizione funzioni del tempo, che è comune a tutte. Le leggi del moto eguagliano le forze per unità di massa con le accelerazioni e sono dunque, tecnicamente parlando, sistemi di equazioni differenziali ordinarie del secondo ordine. L’assegnazione delle forze e dei dati iniziali è allora tutto ciò che serve per trattare matematicamente il problema del moto (cioè il calcolo della traiettoria, per esempio le orbite dei pianeti). La teoria delle equazioni differenziali implica anche il determinismo della fisica classica, cioè il fatto che la traiettoria è localmente univocamente determinata dalle condizioni iniziali. 1.4.1 L’addizione delle velocità Due semplici conseguenze delle trasformazioni di Galilei sono la formula di addizione delle velocità ′ u =u−v (4.1) 10 ′ che si ottiene differenziando l’espressione x = x − vt, e il carattere assoluto dell’accelerazione ′ du du a = ′ = =a dt dt ′ ′ ′ Siano θ l’angolo tra u e v e θ quello tra u e v e poniamo anche u = |u|. Dal teorema di addizione si hanno le formule (verificare) ′ ′ ′ ′ tan θ = ′ ′ u cos θ = u cos θ − v u sin θ = u sin θ, sin θ cos θ − v/u ′ u = −v cos θ + √ (4.2) (4.3) v 2 cos2 θ′ + u2 − v 2 (4.4) Useremo questi risultati per verificare l’invarianza galileiana di alcune equazioni importanti che si incontrano nella fisica classica newtoniana. E4: Un forte nuotatore, capace di una velocità di 5 m/s in acqua ferma, procede in un fiume per 50 metri contro una corrente di 3 m/s e ritorna poi al punto di partenza con la corrente a favore. Un secondo nuotatore di pari abilità attraversa il fiume ortogonalmente, con andata e ritorno da riva a riva, distanti anche’esse 50 m. Chi termina per primo la gara? Si deducano formule generali nel caso che velocità e distanze del problema siano generiche; si denoti con c la velocità dei nuotatori e con v quella del fiume, la distanza sia L. 1.4.2 Equazioni del moto di Newton L’esempio paradigmatico di un sistema dinamico classico considera N punti materiali soggetti a forze centrali, per cui mi d2 xi = −∇i U (x1 , . . . , xN ) dt2 (4.5) dove ∇i indica il gradiente rispetto alla variabile xi e l’energia potenziale U descrive un’interazione a due particelle del tipo ∑ U (x1 , . . . , xN ) = V (|xi − xj |) = V (r12 ) + V (r13 ) + · · · + V (r32 ) + · · · (4.6) 1≤i<j≤N Qui rij = |xi − xj |. La terza legge del moto è allora automaticamente soddisfatta e l’invarianza per traslazioni spaziali e temporali è ovvia. Non vi è alcuna difficoltà di principio a introdurre potenziali che coinvolgono tre o più particelle alla volta. Classici esempi di interazione a due particelle sono l’interazione gravitazionale e l’interazione elettrostatica coulombiana tra cariche puntiformi. Incidentalmente, le equazioni godono anche delle simmetrie discrete (in opposizione a quelle continue) di riflessione: x → −x, t → −t, 11 che non si considerano parte del gruppo di Galilei ma che sono importanti per la teoria quantistica e forse anche per la fisica statistica. Nella dinamica newtoniana le masse sono assolute5 e dunque tali sono anche le forze. È allora immediato constatare che le equazioni del moto (4.5) sono covarianti per trasfor′ mazioni di Galilei, vale a dire che le variabili trasformate x = R · x + vt + a obbediscono anch’esse alle equazioni del moto (4.5). Ovviamente se R, v e a dipendessero dal tempo o dal punto (come per le rotazioni) questo non sarebbe più vero. Più in generale esistono infinite trasformazioni delle variabili dinamiche che non mantengono la forma delle equazioni del moto, un fatto che ha impressionato Newton, pare, più della covarianza galileiana appena descritta. E5: Verificare esplicitamente questo fatto, per esempio supponendo che v dipenda dal tempo. Come cambia la (4.1)? Si verifichi anche la proprietà di covarianza delle (4.5). Osservazione: Si potrebbe chiedersi quale sia il gruppo massimale di covarianza delle equazioni del moto (4.5) e se questo abbia un significato fisico, però si scopre che questo dipende essenzialmente dal tipo di forze applicate e dalla forma dell’energia potenziale. Per esempio, se due particelle interagiscono solamente con forze centrali la simmetria extra include formalmente il gruppo delle rotazioni in quattro dimensioni (SO(4) anziché SO(3)). Abbiamo anche visto che in generale sono presenti simmetrie discrete di riflessione. Per una particella libera il gruppo di covarianza è un’estensione del gruppo di Galilei a un gruppo di dimensione dodici, detto gruppo di Schrödinger. Anche questo gruppo cessa di rappresentare simmetrie non appena si introducono le interazioni. Queste simmetrie sembrano dunque accidentali e non le prenderemo in esame. Tuttavia non è mai opportuno dimenticarsene completamente. Se esistono buone ragioni per imporre simmetrie extra, oltre a quelle già richieste dal principio di relatività, queste possono diventare strumenti potenti per generalizzare le teorie della fisica. Gran parte degli sviluppi moderni nella fisica delle particelle elementari sono infatti derivati da argomenti di questo tipo. 1.4.3 Sistemi continui: il fluido perfetto e la conduzione del calore Nella meccanica dei continui, un altro esempio di teoria covariante galileiana è fornito dal moto isoentropico di un fluido perfetto. Le equazioni sono quelle di Eulero 1 ∂p ∂ui + u · ∇ui = − ∂t ρ ∂xi (4.7) 5 Il rapporto fra due accelerazioni, che è una grandezza assoluta, determina il rapporto inverso delle masse. Scelto dunque una volta per tutte un corpo standard che fornisca un’unità di massa, le altre masse possono essere determinate usando il principio di azione e reazione, per esempio mediante collisioni, e saranno conseguentemente invarianti. 12 dove u(t, x) è il campo di velocità del fluido, p è la pressione e ρ la densità di massa, vincolati a soddisfare l’equazione di continuità ∂ρ + div(ρu) = 0 ∂t (4.8) Per chiudere il sistema di equazioni deve anche essere assegnata un’equazione di stato, esprimente p in funzione di ρ, per esempio l’equazione barotropica p = (γ − 1)ρ. Le trasformazioni di Galilei devono ora tenere conto del fatto che le variabili sono campi, cioè grandezze che dipendono dalla posizione oltre che dal tempo. Tuttavia, le formule di ′ ′ trasformazione sono abbastanza evidenti: per l’osservatore inerziale in F poniamo (t = t è sottinteso, a = 0 e R = 1, in altri termini studiamo il boost) ′ ′ ′ ′ ′ u (t, x ) = u(t, x + vt) − v ′ ρ (t, x ) = ρ(t, x + vt), (4.9) ′ ′ ′ p (t, x ) = p(t, x + vt) (4.10) Queste formule ci dicono semplicemente che la densità e la pressione in ogni punto del fluido sono le stesse per entrambi gli osservatori, mentre i campi di velocità differiscono ′ solo per un moto collettivo di traslazione uniforme. Infatti, dato che x + vt = x, i secondi membri di queste equazioni sono realmente valutati in x. Con queste trasformazioni è facile mostrare che le equazioni del moto del fluido sono covarianti galileiane. E6: Provare l’affermazione appena fatta. Si usino le formule ′ ∂u ∂u = + v · ∇u, ∂t ∂t ′ ∂ρ ∂ρ = + v · ∇ρ ∂t ∂t Quale trasformazione rende le equazioni di Eulero invarianti per inversione temporale? Vale ancora per l’equazione di Navier-Stokes? In presenza di viscosità si deve aggiungere al secondo membro della (4.7) il termine η ∆u ρ dove η > 0 è il coefficiente di viscosità, e si hanno cosı́ le equazioni di Navier-Stokes. Il nuovo termine è invariante galileiano, come si vede usando la (4.9). La novità dei fluidi rispetto alle particelle puntiformi è stata la necessità di introdurre una legge di trasformazione di tipo nuovo. Nel prossimo esempio, il calore, vedremo come la richiesta di covarianza può anche suggerire la forma corretta di un’equazione fisica. L’equazione della propagazione del calore in un corpo solido immobile diventa, nel caso semplice di corpi omogenei e isotropi, la seguente equazione per la distribuzione della temperatura T nel corpo ∂T = χ∇2 T ∂t (4.11) 13 dove χ è la conducibilità termica (funzione della temperatura e della pressione). Assumeremo che T sia uno scalare, cioè che ′ ′ ′ T (x , t) = T (x + vt, t) (4.12) Allora si vede subito che la (4.11) non è invariante, in quanto ′ ∂T ∂T = + v · ∇T ∂t ∂t Il termine di trasporto, v · ∇T , può essere eliminato solo se nell’equazione originale vi è un termine di trasporto analogo. Deduciamo dunque che l’equazione del calore per un corpo in movimento con velocità u deve essere corretta con un termine analogo: ∂T + u · ∇T = χ∇2 T ∂t (4.13) ′ Poiché u = u + v, l’equazione è ora covariante. Si può quasi dire, in questo caso, che il principio di relatività definisce la fisica. Dal punto di vista della teoria delle rappresentazioni del gruppo di Galilei, le grandezze (Ṫ , ∇T ) si trasformano come una delle due possibili rappresentazioni quadri-vettoriali del gruppo: detto (η, χ) un quadri-vettore generico6 si ha (per trasformazioni di Galilei ′ speciali: x = x − vt) ′ I : η = η + v · χ, ′ χ =χ oppure in alternativa ′ II : η = η, ′ χ = χ + ηv Infatti T˙ ′ = Ṫ + v · ∇T, ′ ′ ∇ T = ∇T Un esempio di grandezze che seguono la seconda formula di trasformazione è la coppia densità di massa, corrente di massa: (ρ, ρu). Il prossimo esempio mostrerà che non sempre la formula di trasformazione è evidente. 1.4.4 L’equazione di Schrödinger Nel caso della particella libera, l’equazione di Schrödinger che sostituisce la legge classica E = p2 /2m, o v̇ = 0, è (con ℏ = 1) i 6 ∂Ψ 1 2 =− ∇Ψ ∂t 2m (4.14) Si ricordi che il gruppo agisce in uno spazio a quattro dimensioni. 14 L’invarianza per traslazioni e rotazioni è evidente se si definisce la trasformazione attiva della funzione d’onda nel seguente modo7 ′ Ψ (x, t) = Ψ(R−1 · (x − a), t − τ ) (4.15) ′ Si noti che l’applicazione Ψ → Ψ è unitaria rispetto al prodotto scalare ∫ (Ψ, Φ) = Ψ(x)Φ(x) d3 x R3 ′ Consideriamo il boost x = x + vt. Ora la formula di trasformazione è più complicata: con qualche calcolo si verifica facilmente che la nuova funzione d’onda ( ) mv 2 ′ Ψ (x, t) = exp −i t + imv · x Ψ(x − vt, t) (4.16) 2 ′ soddisfa ancora l’equazione di Schrödinger e che la trasformazione Ψ(x, t) → Ψ (x, t) ≡ [T (v)Ψ](x, t) è unitaria. La mappa T (v) è una rappresentazione: T (v1 +v2 ) = T (v1 )T (v2 ). E7: Si scriva la trasformazione passiva che corrisponde alla trasformazione attiva (4.16). Suggerimento: una trasformazione attiva seguita da una passiva (o viceversa) producono l’identità. E8: Si scriva l’equazione di Schrödinger per due particelle identiche interagenti con un potenziale del tipo (4.6) adattato a due particelle, e si verifichi la covarianza dell’equazione generalizzando opportunamente la (4.16) per Ψ(x1 , x2 , t). E9: Si aggiunga al secondo membro della (4.14) un termine di potenziale U (r)Ψ, r = |x|. L’equazione è ancora covariante galileiana? Qual’è il gruppo manifesto di simmetria? La formula di trasformazione (4.16) introduce una fase che dipende dalla velocità relativa. È quindi interessante osservare che se fosse possibile misurare la fase relativa di due particelle con masse diverse allora, effettuando un boost, si potrebbe misurare la velocità relativa dei due sistemi inerziali. Per salvare la simmetria galileiana, o equivalentemente il principio di relatività, si impone allora la regola di superselezione secondo la quale non sarebbe possibile preparare combinazioni lineari di stati descriventi particelle con masse diverse. Osservazioni. La formula di trasformazione (4.16) sembra scritta ad hoc per avere la covarianza dell’equazione di Schrödinger. Naturalmente il fatto notevole è che una tale formula esista, e possiamo chiederci allora se non vi sia un modo sistematico per trovare le formule di trasformazione in casi più complicati. La materia che si occupa di questi problemi è una teoria matematica nota come teoria della rappresentazione dei gruppi. Essa fornisce la classificazione delle formule di trasformazione possibili e determina il carattere delle grandezze che si trasformano o, come si suol dire, lo spazio della rappresentazione. 7 ′ ′ ′ La versione passiva è Ψ (x , t) = Ψ(x, t), dove x = R · x + a. 15 Gli esempi discussi sopra definiscono alcune rappresentazioni del gruppo di Galilei: la prima opera sullo spazio vettoriale dei vettori di posizione delle particelle, la seconda e la terza su campi vettoriali e scalari che dipendono dal tempo e la quarta sullo spazio di Hilbert di una particella libera. 1.4.5 Il principio di relatività galileiano Il fatto che le equazioni del moto siano identiche in tutti i sistemi di riferimento inerziali, se le formule di trasformazione sono quelle di Galilei, è la versione matematicamente precisa dell’affermazione euristica nota come principio di relatività galileiano, secondo il quale le leggi della meccanica sono a priori indipendenti dai sistemi di riferimento inerziali ai quali sono riferite. In particolare, non sarà possibile determinare la velocità di un laboratorio installato in un SRI compiendovi esperimenti meccanici su sistemi isolati (cioè disaccoppiati dal mondo esterno) e dunque non sarà nemmeno possibile, in questo senso, determinare la velocità assoluta della terra (la velocità riferita allo spazio assoluto). Il termine “a priori” significa “prima di ogni processo di misura”. È chiaro che la misura di qualche effetto fisico può essere usata per discriminare sistemi di riferimento diversi. ′ E10: Si supponga che F sia uniformemente accelerato rispetto a F : si dimostri che le ′ equazioni del moto in F sono identiche alle equazioni che si userebbero in F in presenza di un campo gravitazionale uniforme. Si può usare questa proprietà come argomento per estendere il principio di relatività ai sistemi uniformemente accelerati? 1.5 Ottica non relativistica Nuove opportunità e nuovi problemi sorgono in relazione ai fenomeni connessi con la propagazione della luce. Infatti le equazioni di Maxwell non hanno la proprietà di covarianza richiesta dal principio di relatività galileiano, cioè non sono invarianti per trasformazioni di Galilei. Per capirlo basta notare che la velocità di un impulso elettromagnetico dipende dal sistema di riferimento, se vale la (4.1), mentre le equazioni di Maxwell predicono che sia indipendente dal moto della sorgente e uguale alla costante universale c che compare nelle equazioni stesse. Lo stesso Maxwell pensava che le sue equazioni valessero in una classe limitata di sistemi di riferimento, quelli in quiete rispetto al cosiddetto etere, una sostanza imponderabile ed elastica presente nell’universo che si credeva propagasse la luce e rendesse possibili i fenomeni elettromagnetici, alla stessa maniera che un gas è necessario per la propagazione del suono. Ma se è cosı̀ allora dovrebbe essere possibile misurare la velocità assoluta della terra, perché il suo moto attraverso l’etere causerebbe un “drift” in grado di alterare la velocità della luce a seconda della sua direzione di propagazione. Ma se non sappiamo quali sono le equazioni elettromagnetiche in un riferimento mobile, come si possono trattare i fenomeni elettromagnetici in un riferimento terrestre, in mo- 16 vimento rispetto all’etere? La maniera più semplice e diretta è determinare l’effetto del gruppo di Galilei sulle caratteristiche di un’onda elettromagnetica piana. 1.5.1 onde piane e velocità di fase Si consideri un’onda piana che si propaga nel piano z = 0, cioè il versore di propagazione sia nel piano (x, y). Nel sistema di riferimento assoluto, F , dove l’etere è immobile, la fase dell’onda è ( ) ( x cos α + y sin α r) F(t, x, y) = ν t − =ν t− (5.1) c c c è la velocità di fase, uguale in F alla velocità della luce nel vuoto, ν è la frequenza e n = (cos α, sin α) è il versore che indica la direzione di propagazione. Espressa in funzione ′ ′ delle coordinate del sistema inerziale F in moto rispetto a F , che sono x = x − vt, ′ ′ y = y, t = t, la fase diventa ) ( ′ ′ ′ (x + vt ) cos α + y sin α ′ F(t, x, y) = ν t − c oppure, riordinando i termini, ( ′ ′ ′ ′) x cos α + y sin α ′ ′ F(t, x, y) = ν t − c′ dove ( ) ( v v · n) ′ ν = ν 1 − cos α = ν 1 − c c (5.3) ′ c = c − v cos α = c − v · n ′ ν ν ′ cos α = ′ cos α c c (5.2) (5.4) ′ ν ν ′ sin α = ′ sin α c c (5.5) Un semplice argomento mostra che la fase è invariante (v. appendice A) cosicché F(t, x, y) ′ ′ ′ ′ nella (5.2) è anche la fase in F . Questo significa semplicemente che ν , c e α sono ′ rispettivamente la frequenza, la velocità di fase e la direzione dell’onda in F . Dalle (5.5) ′ si ottiene subito α = α , mentre per la lunghezza d’onda si ha (diversamente che dal caso relativistico) ′ ′ ′ 1/λ = ν /c = ν/c = 1/λ (5.6) Introducendo il numero d’onde, k = (2π/λ)n, le (5.5) si compendiano nell’equazione ′ vettoriale k = k. Apparentemente, dunque, la teoria non predice aberrazione per la luce. Ritorneremo sulla questione in seguito. 17 ′ La (5.4) determina la velocità di fase nel sistema F , mentre la (5.3) mostra come si ′ trasforma la frequenza; entrambe dipendono dalla velocità assoluta di F , che può quin′ di essere determinata, in linea di principio, compiendo esperimenti ottici in F . Una precisazione necessaria è che la velocità dei segnali elettromagnetici misurata in questi esperimenti non è la velocità di fase, che è inosservabile, ma la velocità di gruppo. E11. La luce proveniente dalla galassia di Andromenda (M31) ha uno spostamento verso il blu (parte alta dello spettro) di una parte su 1000, cioè ∆ν/ν ≃ 0, 001. Con quale velocità radiale si sta muovendo Andromeda rispetto a noi? E si avvicina o si allontana? Un “gamma ray burst” recentemente osservato, il GRB090423, ha uno spostamento relativo verso il rosso pari a 8, cioè la frequenza ricevuta è 1/9 di quella emessa. Se interpretiamo lo spostamento come effetto Doppler con che velocità si allontana? 1.5.2 la velocità di gruppo La velocità di gruppo compare quando si ha a che fare con pacchetti d’onde, sovrapposizioni lineari di onde elettromagnetiche piane con vettori d’onda e frequenze leggermente diversi da un certo vettore d’onda medio. Si può determinare la velocità di gruppo con la nota formula8 u= ∂ω ∂k ω = 2πν dove k = 2πλ−1 n e le derivate sono calcolate nel vettore d’onda medio. Usando la (5.3) ′ e k = k, si ottiene subito il teorema di addizione ′ u =u−v u = |u| = c (5.7) che è identico al teorema di addizione delle velocità per le particelle di materia. Ponendo ′ ′ ′ u = u e , si ottiene il modulo in funzione della direzione ′ ′ ′ u = −v · e + {(v · e )2 + c2 − v 2 }1/2 ′ (5.8) ′ Dalla (5.7) si ha u ∧ v = u ∧ v e u · v = u · v − v 2 , ovvero9 ′ ′ u sin θ = u sin θ, ′ ′ u cos θ = u cos θ − v (5.9) da cui la formula ′ tan θ = sin θ cos θ − v/u (5.10) Vediamo dunque che la frequenza, la velocità di fase e la velocità di gruppo della radiazione elettromagnetica dipendono dalla velocità degli osservatori rispetto al sistema assoluto. 8 9 Un’abbreviazione per ux = ∂ω/∂kx , etc. Ricordarsi che |a ∧ b| = ab sin θ e a · b = ab cos θ. 18 La direzione di propagazione e la lunghezza d’onda, invece, rimangono invariate. Vale inoltre per la luce lo stesso teorema di addizione delle velocità che vale per le particelle di materia. In particolare le formule (5.10) e (4.3) sono identiche, con le opportune identificazioni (i.e. u al posto di c). E12: Si usi la formula (5.10) per determinare l’angolo di incidenza della pioggia vista dal finestrino di un treno in corsa, con un’assunzione ragionevole sul valore di θ. Cosa sono in questo caso v e u? Conviene assumere che v/u ≪ 1? E13: Per la luce stellare osservata dalla terra è probabile che v/c ≪ 1; dalla (5.10) si ′ ottenga una formula per θ − θ, valida al primo ordine in v/c. 1.5.3 La velocità della luce nei dielettrici trasparenti In un dielettrico trasparente fermo nel sistema assoluto, la velocità della luce è c/n, dove n > 1 è l’indice di rifrazione. Se però il dielettrico si muove rispetto all’etere, la velocità di fase e la velocità di gruppo sono in generale diverse da c/n, sia rispetto al dielettrico che rispetto al sistema assoluto. Questo pose un problema che provocò molto dibattito tra gli scienziati ottocenteschi, in parte perché la risposta dipende in modo essenziale dalle assunzioni che si possono fare sul comportamento dell’etere in un mezzo in movimento. Una semplice ipotesi era che l’interazione fra etere e materia fosse estremamente debole, se non nulla, e che l’etere passasse dunque indisturbato attraverso la materia. Un’altra, forse più ragionevole, era che il trascinamento fosse solo parziale (teoria di Fresnel). Conviene allora trattare tutti i casi simultaneamente e assumere che la velocità dell’etere rispetto al sistema assoluto F a causa del trascinamento sia 0≤f ≤1 w = f v, essendo v la velocità assoluta del mezzo, misurata in F . Il parametro f si chiama “il coefficiente di trascinamento” di Fresnel, il quale ne dava l’espressione f =1− 1 n2 espressione che egli derivò dalla sua teoria elastica dell’etere. Il caso f = 1 era quello che preferiva Stokes. Si noti però che f dipende dalla frequenza della luce, cosicché il trascinamento dell’etere dipenderebbe anche dal suo “colore”. Nel sistema Ff che si muove con velocità f v rispetto a F , l’etere è immobile e la velocità di fase è c/n. Per la velocità di fase in F avremo quindi (dall’eq. (5.4)) c c0 = + f v · n (5.11) n e per la velocità di gruppo (teorema di addizione) c u = uf + f v |uf | = (5.12) n 19 dove uf è la velocità di gruppo in Ff . Da qui si ricava { }1/2 c2 2 2 2 u = f v · e + (f v · e) + 2 − f v n (5.13) dove e denota il versore della direzione di propagazione della luce, misurato in F . La ′ ′ velocità di F rispetto a Ff è (1 − f )v, e dunque la velocità di fase in F è ′ c = c c v·n − (1 − f )v · n = − 2 n n n (5.14) La seconda eguaglianza vale se f ha il valore di Fresnel. Per la velocità di gruppo avremo, analogamente, ′ u = uf − v n2 (5.15) Le equazioni (5.12) e (5.15) riconfermano il teorema di addizione ′ u=u +v (5.16) ′ ′ Detto e il versore di propagazione in F , dalla (5.15) si ricava infine { }1/2 1 c2 v2 ′ ′ ′ 2 −4 u = − 2 v · e + n (v · e ) + 2 − 4 n n n (5.17) Le formule (5.11), (5.13), (5.14), (5.16) e (5.17) risolvono il problema posto. Applicazioni agli esperimenti saranno discusse più avanti. Al primo ordine nel parametro piccolo v/c si ottengono le formule utili ( ) c 1 u= + 1− 2 v·e (5.18) n n c v·e u = − 2 n n ′ ′ (5.19) E14: Un raggio di luce si propaga all’interno di un tubo di acqua corrente, nel verso della medesima. La velocità della corrente rispetto al sistema assoluto sia v: quanto vale la ′ velocità della luce nel sistema assoluto? E nel sistema F dove l’acqua è in quiete? E se il verso di propagazione è opposto alla corrente? Se è ortogonale? 20 1.5.4 L’aberrazione e l’effetto Doppler La formula (5.10) ′ tan θ = sin θ cos θ − v/c (5.20) ′ connette la direzione di un raggio di luce misurata in un laboratorio terrestre F , con la sua direzione assoluta (che in generale non si conosce). ′ La formula (5.3) connette invece la frequenza in F con la frequenza assoluta (che pure, in generale, non è nota). In entrambi i casi però, le formule predicono effetti osservabili di grande rilevanza pratica e concettuale. Aberrazione stellare Se la luce proviene da una stella lontana e se ciò che interessa è l’effetto di aberrazione al primo ordine in v/c, allora si può supporre che la stella sia in quiete rispetto all’etere. La direzione assoluta della stella è allora ϑ = π − θ e la direzione relativa (o apparente) ′ ′ è ϑ = π − θ . La (5.20) diventa la formula dell’aberrazione stellare, dove, espandendo in serie al primo ordine in v/c, si ha ′ tan ϑ = sin ϑ v tan ϑ ≃ tan ϑ − cos ϑ + v/c c cos ϑ (5.21) ′ Ponendo δϑ = ϑ − ϑ ≪ 1 radianti10 (angolo di aberrazione) si ottiene, con buona approssimazione, δϑ = − v ′ sin ϑ c in accordo con le prime osservazioni di Bradley (1727), e successive. Ora la velocità ′ della terra varia nel corso dell’anno, cioè ϑ dipende dal tempo, e dunque l’aberrazione è osservabile e si manifesta come un moto annuale apparente delle stelle lungo piccole ellissi ′ di estensione angolare ∼ v sin θ /c (per una stella allo zenit si tratta di circa 41′′ ), dovuto alla rivoluzione della terra intorno al sole. Si noti che l’aberrazione stellare non dipende dalla distanza delle stelle (a differenza della parallasse, che pure è dovuta alla rivoluzione terrestre) e che lo spostamento angolare della stella è nella direzione del moto della terra, come avviene per la direzione della pioggia vista attraverso il finestrino di un treno in corsa. L’importanza dell’aberrazione per la relatività è dovuta al fatto che l’angolo di aberrazione non cambia se il telescopio è riempito d’acqua (Airy, 1871-73), mentre nella teoria dell’etere secondo Lorentz questo è vero solamente al primo ordine in v/c (a causa del 10 1 rad = 57, 29o = 206.265′′ ; 1 arcsec = 0, 48 × 10−5 rad. 21 drift). In effetti il percorso della luce fra due punti dati è determinato dal principio di Fermat, secondo il quale l’integrale curvilineo sui cammini γ(p, q) da p a q ∫ T (p, q) = γ(p,q) dσ , u′ ′ v·e c u = − 2 n n ′ ′ assume un valore minimo sul cammino effettivamente percorso dalla luce. La velocità u è quella ricavata dalla (5.19), e si vede che dipende esplicitamente dalla direzione e dalla ′ velocità assoluta della terra. Dal punto di vista della teoria della relatività, u = c/n e le osservazioni di Airy sono la semplice conseguenza del fatto che un raggio incidente normalmente sulla superficie di separazione di due dielettrici diversi non subisce rifrazione. l’effetto Doppler L’equazione (5.3) dell’effetto Doppler ( v · n) ′ ν =ν 1− c non può essere sperimentalmente verificata se non si conosce la frequenza assoluta ν; quello che si può fare è allora calcolare il rapporto, νo /ν1 , della frequenza di una sorgente avente velocità assoluta vo con la frequenza rivelata da un detector avente velocità assoluta v1 , cosı́ da eliminare la frequenza incognita ν. Si ottiene νo 1 − vo · n/c (v1 − vo ) · n (v1 · n)(v1 − vo ) · n −1= −1= + + ··· ν1 1 − v1 · n/c c c2 (5.22) Si vede che al primo ordine in v/c questo rapporto dipende solo dalla proiezione della velocità relativa, vr = vo − v1 , lungo la linea di vista, in accordo con la teoria della relatività e con le osservazioni. Ma i termini successivi dello sviluppo in serie dipendono dalle velocità assolute, che sono quindi misurabili in linea di principio. Storicamente, le prime osservazioni di precisione furono eseguite da Ives e Stilwell (nel 1938, ma ad angolo zero) e non confermano la (5.22), bensı́ la formula fornita dalla teoria della relatività. Ironicamente, sembra che il reale intento dei due fisici fosse quello di screditare la teoria della relatività. 1.6 Esperienze di fine secolo XIX In base alle formule trovate, è possibile misurare la velocità della terra rispetto all’etere ′ se si riesce a misurare u in un laboratorio terrestre. Dei vari esperimenti di interferenza progettati discuteremo brevemente e schematicamente quelli storici di Hoek, Fizeau e di Michelson e Morley (MM), nonché gli effetti di aberrazione e lo spostamento Doppler delle frequenze. I primi due non avevano la sensibilità necessaria per misurare i termini quadratici in v/c (che è di ordine 10−4 per un esperimento terrestre), per cui è sufficiente 22 approssimare le (5.13) e (5.17) al primo ordine in v/c. Si ottengono facilmente le formule (5.18) e (5.19), che riscriviamo per comodità ( ) c 1 u= + 1− 2 v·e n n ′ c v·e u = − 2 n n Come vedremo, nella teoria della relatività la prima si ricava dalla cinematica relativistica senza bisogno di introdurre l’etere (come fu notato da M. von Laue), mentre la seconda ′ diventa semplicemente u = c/n. ′ 1.6.1 Hoek L’esperimento di interferenza di Hoek (1868) è schematicamente rappresentato in Fig. [1]: Figura 1.2: Esperimento di Hoek L 2 S 1 T F è una sorgente, T è l’interferometro e il tratto di lunghezza L contiene un dielettrico trasparente (per esempio acqua) con indice di rifrazione n. Il raggio di luce si divide in due raggi che percorrono il rettangolo in direzioni opposte e interferiscono in T . Si suppone che la velocità dell’apparato rispetto al sistema assoluto sia parallela al braccio orizzontale dell’interferometro raffigurato. Usando la (5.19) per calcolare i tempi t1 e t2 richiesti ai raggi per completare il giro dell’apparato, è facile ottenere t1 − t2 = L nL nL L − + − c − v c + v c + v/n c − v/n Al primo ordine in v/c si ottiene t1 − t2 = 0, in buon accordo con le osservazioni di Hoek. Se al posto del valore di f dato da Fresnel avessimo usato f = 0 oppure f = 1 (l’ipotesi 23 di Stokes), il risultato sarebbe stato non nullo. L’esperimento elimina dunque questi due casi e nello stesso tempo verifica la teoria di Fresnel. L’esperimento è anche in accordo con il punto di vista relativistico, perché se la velocità della luce è c in tutti i riferimenti inerziali e in ogni direzione (o c/n se è presente un dielettrico) allora il risultato nullo di Hoek diventa ovvio. Si noti comunque che l’indice di rifrazione dipende dalla frequenza (per il fenomeno della dispersione), un fatto che richiederebbe l’introduzione di un’etere per ogni colore della luce. Le misure di precisione degli effetti del secondo ordine in v/c hanno comunque confermato la teoria della relatività, e la teoria di Fresnel è stata definitivamente abbandonata. 1.6.2 Fizeau e Fresnel È interessante osservare che la formula di Fresnel fu confermata anche da un esperimento indipendente dovuto a Hyppolite Fizeau (1851, 1853). Questo esperimento è schematicamente rappresentato nella Fig. [2]: come sopra, F è una sorgente, T è l’interferometro e nel tratto di lunghezza L vi è una forte corrente d’acqua con velocità v. Il raggio di luce si divide in due raggi che percorrono il rettangolo in direzioni opposte e interferiscono in T . Si suppone che la velocità dell’apparato rispetto al sistema assoluto sia parallela al braccio orrizontale dell’interferometro. Rispetto alla figura di interferenza ottenuta con acqua immobile, si ottiene un marcato spostamento delle frange. Dall’esperienza di Hoek sappiamo che il moto dell’apparato rispetto all’etere non dà effetti osservabili al primo ordine in v/c, perciò possiamo supporre che l’apparato sia in quiete nel sistema assoluto. Possiamo usare in tal caso la (5.13), in cui v è semplicemente la velocità dell’acqua rispetto all’etere. Si ottiene, con le notazioni usate sopra, lo spostamento di fase δF = ν(t1 − t2 ) = 2νLv 2 (n − 1) ∼ 2 × 10−6 (n2 − 1)Lv radians c2 in accordo con le osservazioni di Fizeau. L’esperimento determina la velocità della luce in un dielettrico in movimento, in accordo con la (5.18), e dunque conferma la teoria di Fresnel se, come sopra, si ignorano i fenomeni dispersivi. Si noti che l’esperimento, con questa interpretazione, può essere usato per misurare la velocità assoluta dell’acqua, piuttosto che la velocità della terra rispetto all’etere, ma in realtà esso misura soltanto la velocità dell’acqua rispetto al laboratorio. 1.6.3 Michelson e Morley Questo è il primo esperimento (1887) che misura effetti del secondo ordine in v/c. L’interferometro usato è schematizzato nella figura Con la direzione indicata della velocità si ricava facilmente, usando la (5.8), il tempo totale di andata e ritorno dei due raggi lungo i bracci dell’interferometro. Per i raggi uno 24 Figura 1.3: Esperimento di Fizeau L 2 S 1 V T e due si ha, rispettivamente (si ricordi l’esercizio E4: qui i due nuotatori sono i raggi di luce e la corrente è il drift dell’etere), t∥ = 2Lv , − v2 c2 t⊥ = √ 2L − v2 c2 Da qui si deriva la differenza di fase δF = 2Lν v 2 ∼ 2 × 10−3 L rad = 0, 2 (L/1 m) rad c c2 (6.1) con precisione del secondo ordine in v/c. L’esperimento non ha rilevato spostamenti significativi delle frange di interferenza in seguito alla rotatione dell’apparato, nonostante Michelson e Morley fossero in grado di misurare spostamenti molto più piccoli di quello previsto dall’Eq. (6.1). Più precisamente, la velocità della luce in due direzioni ortogonali risultava identica entro un margine di ±5 Km/sec. In un esperimento del 1964 questo margine è stato ridotto a ±1 Km/sec e, in tempi più recenti, praticamente a zero (ma dipende dai punti di vista, v. più avanti). 1.6.4 Interpretazioni (i) Per salvare la teoria dell’etere Lorentz e, indipendentemente, Fitzgerald proposero allora che il braccio dell’interferometro parallelo alla velocità di traslazione della terra si √ 2 contraesse rispetto al braccio ortogonale del fattore 1 − v /c2 . Con questa ipotesi si ha ovviamente t1 = t2 , e δF = 0. Non discutiamo qui i tentativi fatti, specialmente da Lorentz, per derivare l’ipotesi della contrazione dalla teoria atomica della materia. La formula della contrazione è infatti una semplice conseguenza cinematica delle trasformazioni di Lorentz, e in quanto tale non richiede ipotesi particolari sulla struttura della 25 Figura 1.4: Esperimento di Michelson-Morley 2 S 1 V T materia. Era opinione di Pauli, tuttavia, che non si dovesse rinunciare del tutto a una tale spiegazione. (ii) Un’altra interpretazione del risultato nullo di MM è supporre che la velocità della luce sia uguale a c solo rispetto alla sorgente (come per i proiettili). Teorie di questo tipo, dette emissive, sono però in difficoltà con il fenomeno dell’aberrazione stellare. (iii) È anche interessante osservare come MM richieda la relatività del tempo. Si osservi infatti l’esperimento da un sistema F rispetto al quale l’apparato si muove con velocità v. Allora per i tempi di volo dei raggi si ottiene ct1 = 2l1 , 1 − v 2 /c2 ct2 = √ 2l2 1 − v 2 /c2 ′ Se l0 è la lunghezza dei bracci nel√sistema di quiete F dell’apparato, per la contrazione di Lorentz-Fitzgerald si ha l1 = l0 1 − v 2 /c2 , l2 = l0 ; dunque 2l2 ct1 = ct2 = √ 1 − v 2 /c2 e si ha l’accordo con l’esperienza. Se si assume però che il tempo sia assoluto, che era il punto di vista di Abraham11 , appare che un osservatore nel sistema di quiete misuri la velocità della luce √ ′ c = c 1 − v 2 /c2 Secondo Einstein tuttavia, si deve ancora tenere conto della dilatazione del tempo, in base ′ ′ alla quale per il tempo t in F si ha √ ′ t = t 1 − v 2 /c2 11 M. Abraham, Theorie der Elektrizität, Vol. 2, Leipzig 1908 26 ′ ′ cosicché infine ct1 = ct2 = 2l0 . Il punto di vista di Abraham è dunque in accordo con l’esperienza di MM ma è in contrasto con il principio di relatività, a meno che non si ammetta la dilatazione del tempo. 1.7 Esperienze moderne A parte l’esperimento del ’64 (T. S. Jaseja et al., Phys. Rev. 133, A1221 (1964)), la versione moderna dell’esperimento di MM usa frequenze di risonanza in cavità ottiche criogeniche. Le frequenze di risonanza sono della forma νcav = nc/L, dove L è la lunghezza della cavità risonante e n = 1, 2, 3, . . . . Dunque una violazione dell’isotropia di c, per esempio, può essere rivelata ruotando la cavità e misurando lo spostamento delle frequenze. In questo modo si è stabilito il bound più preciso oggi noto12 ∆cθ < 10−15 c dove 1 cθ /c = 1 + ( + δ − β)(v/c)2 sin2 θ + (β − α − 1)(v/c)2 2 parametrizza la dipendenza della velocità della luce dall’angolo tra la direzione di propagazione e la velocità dell’apparato rispetto al sistema assoluto (preferred ether frame), nello schema di Mansouri-Sexl13 . In esperimenti recenti di Hills, Hall e Lipa et al.14 i parametri α + 1/2, β − 1/2, δ risultano nulli a meno di una parte in 109 ! 12 H. Müller, S. Herrmann, C. Braxmaier, S. Schiller and A. Peters, Phys. Rev. Lett. 91, 020401 (2003). R. M. Mansouri and R. U. Sexl, Gen. Rel. Grav. 8, 515 (1977). 14 D. H. Hills and J. H. Hall, Phys. Rev. Lett. 64, 1697 (1990); J. A. Lipa, J. A. Nissen, S. Wang, D. A. Stricker, and D. Avaloff, Phys. Rev. Lett. 90, 060403 (2003). 13 27 Capitolo 2 Le basi della relatività speciale Il persistente fallimento dei tentativi di rilevare una qualsiasi influenza del moto della terra sulla propagazione della luce1 è ovviamente incompatibile con l’esistenza di un “etere imponderabile” e conduce alla conclusione “altamente probabile, se non certa” (W. Pauli), che tutte le leggi della fisica, inclusa l’elettrodinamica, obbediscano al principio di relatività. 2.1 Gli assiomi di Einstein Fu A. Einstein che introdusse questo punto di vista relativistico moderno come il primo di due assiomi, il secondo dei quali, “solo apparentemente incompatibile con il primo”, stabilisce inoltre che la velocità della luce sia la stessa in tutti i sistemi di riferimento inerziali. A questo proposito, si può osservare che le equazioni di Maxwell predicono che la velocità della radiazione elettromagnetica nel vuoto sia indipendente dal moto macroscopico della sorgente, e l’esperimento di Michelson e Morley è compatibile con questo fatto con una precisione del secondo ordine in v/c. L’astronomo de Sitter ha osservato che l’assenza di immagini stellari multiple nei sistemi binari è un’elegante conferma di questo fatto. Tuttavia essa potrebbe ancora dipendere da termini di ordine superiore in v/c, che sfuggono all’osservazione. È molto più semplice assumere, con Einstein, che la velocità della luce nel vuoto sia del tutto indipendente dal moto della sorgente e dell’osservatore. È interessante citare direttamente Einstein2 P1 Le leggi secondo le quali si modificano gli stati dei sistemi fisici sono indipendenti dal fatto che questi cambiamenti di stato vengano riferiti all’uno o all’altro di due sistemi di coordinate che si trovino in relativa reciproca traslazione uniforme. P2 ogni raggio di luce si muove nel sistema di coordinate “in quiete” con la determinata velocità V , indipendente dal fatto che quel raggio di luce sia 1 Si ricordi che la precisione delle misure era del secondo ordine in v/c. La traduzione è di P. Straneo, per il volume Cinquant’anni di Relatività, Ed. Giustine e Sansoni, Firenze, 1955. Si veda anche la collezione di articoli in [2]. 2 28 emesso da una sorgente in quiete, o da una sorgente in movimento (al giorno d’oggi la V di Einstein si indica con c). Da P1, nel sistema mobile in cui la sorgente è ferma la velocità è ancora c, cosicché si potrebbe enunciare P2 nella versione equivalente P3 la velocità della luce nel vuoto ha lo stesso valore in tutti i sistemi di riferimento inerziali, in ogni direzione, tempo e luogo. 2.1.1 Osservazioni sui postulati (i) Il principio di relatività P1 da solo non è sufficiente a determinare un gruppo univoco di trasformazioni delle coordinate spazio-temporali. Infatti la meccanica newtoniana è covariante rispetto al gruppo di Galilei, mentre la meccanica relativistica lo è rispetto al gruppo di Lorentz. Come ha mostrato Einstein però, gli assiomi P1 e P2 (o P3) sono sufficienti a determinare il gruppo di simmetria senza bisogno di assumere valida in tutti i sistemi inerziali l’intera teoria elettromagnetica di Maxwell, una semplificazione, questa, assai ragguardevole. Le equazioni della meccanica invece, invarianti galileiane, dovranno essere riformulate in modo tale da renderle compatibili con la nuova simmetria. La meccanica relativistica che ne risulta differisce molto poco da quella newtoniana3 ma è indispensabile, per esempio, a trattare le particelle veloci che viaggiano nei moderni acceleratori di particelle e alcuni fenomeni di astrofisica relativistica, e ha collezionato numerose verifiche sperimentali. (ii) Il carattere non ovvio del primo postulato, cioè del principio di relatività, si può apprezzare considerando il fatto che, in base ad esso, il moto uniforme del centro di massa dell’universo rispetto a un sistema qualunque non dovrebbe produrvi alcun effetto osservabile. Evidentemente nessuno è in grado di verificare una simile asserzione e dunque, se non vogliamo introdurre elementi metafisici nella meccanica, il principio di relatività ha un preciso significato fisico solo per i sistemi isolati. Il problema è quando si può dire che un sistema è isolato. L’esperienza mostra che per il moto uniforme è sufficiente assumere che tutte le masse siano sufficientemente distanti, ma che non può dirsi altrettanto per il moto accelerato. Nei sistemi accelerati appaiono infatti campi di forza apparentemente privi di cause4 , e che per tale motivo Newton ricondusse agli effetti dell’accelerazione assoluta, riferita cioè allo spazio assoluto. È assai probabile che i campi inerziali dipendano invece dall’accelerazione rispetto “alla massa della terra e degli altri corpi celesti” (espressione usata da Mach), la sola che ha significato fisico, secondo Mach, e in ogni caso la sola che si può osservare. (iii) Il ruolo principale dell’assioma P2, con il suo riferimento esplicito alla velocità della luce, non è tanto quello di suggerire un ruolo speciale o privilegiato del campo EM in natura, quanto quello di stabilire l’esistenza di una velocità limite insuperabile. Infatti dei Le correzioni sono tutte di ordine v 2 /c2 , che è indubbiamente il motivo per cui non state scoperte prima. 4 Quali, e dove, sarebbero le sorgenti? 3 29 due casi, che una velocità limite esista, o che non esista, solo il primo implica la simmetria di Lorentz. Ma il valore della velocità limite, che proprio in virtù di tale proprietà deve essere la stessa in tutti i sistemi di riferimento, non è fissato da questo argomento. Il secondo postulato fissa precisamente questo valore, riconducendolo alla velocità della luce nel vuoto. Nel seguito ci proponiamo di determinare il gruppo di trasformazioni delle coordinate spaziali e temporale che è in accordo con questo assioma, e di ripristinare cosı́ quel principio di relatività che nell’elettrodinamica di Maxwell-Lorentz sembrava perso. È un punto centrale dell’analisi di Einstein che per fare questo è innanzitutto necessario definire in maniera precisa come si determinano tali coordinate; si può infatti notare che le equazioni della fisica, quali le equazioni del moto di Newton o le equazioni differenziali del campo elettromagnetico, hanno un preciso significato fisico solo se le coordinate stesse sono precisamente definite. Ciò si ottiene dando alle coordinate spazio-temporali una definizione di tipo operazionale, cioè data in termini di operazioni eseguibili in un laboratorio. 2.1.2 La definizione del tempo Il problema spinoso è come confrontare il tempo di eventi che accadono in luoghi diversi. Il problema sorge perché se le leggi fisiche sono locali e la velocità dei segnali è limitata, la definizione del tempo comune a eventi in luoghi diversi necessita di una convenzione per sincronizzare gli orologi. Ad esempio, per stabilire se due orologi identici separati da una certa distanza indicano lo stesso tempo, si può inviare un raggio di luce dal primo verso il secondo e regolare quest’ultimo in base al ritardo dovuto alla velocità di propagazione finita del segnale. Ma questa procedura richiede ovviamente che si conosca il valore della velocità della luce5 ; in altri termini, la velocità della luce deve essere nota se vogliamo sincronizzare gli orologi, benché si richiedano orologi preventivamente sincronizzati per determinare la velocità della luce. Anche il trasporto di un orologio da un punto all’altro incontra la stessa difficoltà; per correggere i possibili effetti del trasporto, si deve disporre di orologi preventivamente sincronizzati. I tempi degli eventi, pertanto, non possono essere confrontati prima che si sia stabilita una procedura operativa per sincronizzare gli orologi, ossia prima che si sia stabilito che cosa si intende per tempo comune a eventi distanti. Secondo il metodo di Einstein, il tempo comune di due eventi A e B può essere definito quando si stabilisca, per definizione, che il tempo che la luce impiega per viaggiare da A a B è uguale al tempo che impiega per tornare da B ad A. Quindi se il raggio parte all’istante tA da A, giunge in B all’istante tB (misurato “vicino ” a B), e ritorna in A ′ all’istante tA (misurato vicino ad A), si avrà l’equazione6 ′ tA − tB = tB − tA (1.1) 5 Ricordiamo qui che la velocità della luce si può determinare con misure puramente elettromagnetiche. ′ ′ un caso più generale si ha ponendo tA − tB = tB − tA , dove si assume che la partenza del segnale da B non coincida necessariamente con il suo arrivo da A. 6 30 Diremo che i due orologi sono sincronizzati se questa relazione è valida. Con questo si è innanzitutto definito un criterio per decidere quando due orologi distanti sono sı́ncroni, ma non solo. Dall’uguaglianza dei tempi di andata e ritorno del segnale si deduce l’uguaglianza della velocità della luce all’andata con la velocità della luce al ritorno, cioè, detta LAB la distanza tra A e B, si ha c= LAB LAB = ′ tB − tA tA − tB (1.2) Questo fatto non è dunque oggetto di verifica sperimentale. Con questo si assume però che la velocità della luce sia la stessa per tutte le coppie di orologi sincronizzati, un dato che non segue logicamente dalla definizione di Einstein. Si noti anche che la definizione di Einstein non dipende dal valore numerico di c. Segue anche dalla (1.2) che c= 2LAB tA − tA (1.3) ′ anche se questa non è propriamente la definizione cinematica usuale della velocità. Tuttavia questa è la velocità della luce misurata in esperimenti a là Fizeau, e la (1.3) può considerarsi un’acquisizione sperimentale. Dalla (1.2) si vede che se un segnale elettromagnetico parte da un orologio nel punto A al tempo tA , e arriva in B al tempo tB di un orologio sincronizzato con A, si ha tB = tA + LAB c (1.4) Volendo, si può usare questa relazione per regolare gli orologi, purché si conosca il valore di c. Per questo la definizione originale di Einstein ci sembra quella logicamente più semplice. Se un raggio luminoso segue un percorso poligonale chiuso con lati li , si può misurare il tempo di volo con un unico orologio; se ∑ li c= (1.5) T allora si può mostrare che un orologio in A è sincronizzato con orologi identici posti in B e in C se e solo se questi sono sincronizzati tra loro. D’altronde la (1.5) può considerarsi un’acquisizione sperimentale sin dai tempi di Fizeau, e il metodo di Einstein è quindi libero da contraddizioni logiche. Il tempo comune di eventi distanti è adesso definito da orologi sincronizzati posti nelle immediate vicinanze degli eventi, trascurando l’inesattezza che deriva dal fatto che gli orologi non coincidono esattamente con gli eventi; in particolare gli eventi A e B si diranno simultanei (o contemporanei) se gli orologi suddetti indicano lo stesso tempo. La procedura descritta deve essere applicata a tutti i sistemi di riferimento inerziali, con gli orologi in quiete nei rispettivi sistemi. Ogni riferimento inerziale avrà quindi il suo proprio tempo, definito da orologi sincronizzati che occupano posizioni fisse, e in tali 31 sistemi la velocità della luce risulterà per definizione costante, isotropa e numericamente uguale a c. Non è detto, a priori, che questi tempi concordino per tutti gli osservatori inerziali. Osservazioni Sin dall’inizio la procedura di sincronizzazione di Einstein è stata oggetto di analisi teoriche dettagliate, perché si riconosce in essa un certo grado di convenzionalità. Per gli interessati, i lavori classici che analizzano questo grado di convenzionalità sono dovuti a Robertson[10] e ai già citati Mansouri e Sexl[11]. L’aspetto più interessante dei lavori di Robertson, Mansouri e Sexl è l’identificazione dei tre parametri delle trasformazioni di coordinate che descrivono le varie convenzioni di sincronizzazione degli orologi. Si è mostrato cosı̀ che esiste una sincronizzazione che mantiene il carattere assoluto della simultaneità, ma che tuttavia produce una teoria cinematicamente equivalente alla relatività ristretta. Ovviamente si tratta di una definizione operativa differente della simultaneità. In particolare, in quella teoria due raggi di luce emessi da eventi contemporanei secondo la nuova definizione non si incontreranno nel punto di mezzo. 2.2 Le trasformazioni di Lorentz Data la definizione del tempo in un sistema inerziale, passiamo ora a determinare il gruppo di trasformazioni delle coordinate spazio-temporali che è in accordo con questa definizione e con il principio di relatività. 2.2.1 Condizioni sulle trasformazioni È conveniente introdurre la notazione xa , a ∈ {0, 1, 2, 3}, per indicare le coordinate, con la corrispondenza x0 = ct, x1 = x, x2 = y, x3 = z. Le trasformazioni richieste devono avere la proprietà di conservare i moti uniformi e dunque hanno la forma ′a x = 3 ∑ Lab xb + β a (2.1) a=0 La parte non omogenea descrive evidentemente le traslazioni di tempo e spazio, xa → xa + β a , o anche, ′ t = t + β 0 /c, ′ x =x+β che non cambiano la velocità relativa e sono anche simmetrie galileiane. Nel seguito considereremo solo le trasformazioni omogenee, corrispondenti fisicamente a trasformazioni ′ fra riferimenti con origini coincidenti al tempo comune t = t = 0. L’assioma P 2 significa che l’equazione di un fronte d’onda sferico in F, cioè il cono di equazione −c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = 0 32 (2.2) ′ è la stessa che per il fronte d’onda in F , ′ ′ ′ ′ ′ ′ ′ ′ −c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = 0 (2.3) e il problema è ora quello di trovare le trasformazioni di coordinate che hanno questa proprietà. Ma con trasformazioni lineari, questo è possibile solo se (v. appendice) ′ ′ ′ ′ ′ ′ ′ ′ −c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 [ ] = λ2 −c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 (2.4) dove λ è in generale una funzione della matrice di trasformazione Lab . Applicando due trasformazioni in successione, si ottiene anche7 ′ ′ λ(L)λ(L ) = λ(LL ) (2.5) È conveniente scrivere la condizione di invarianza in forma concisa, nello spirito dell’Eq. (2.1). Introduciamo la matrice, detta metrica di Minkowski, −1 0 0 0 0 1 0 0 (2.6) ηab = 0 0 1 0 0 0 0 1 La (2.4) si può scrivere nella forma 3 ∑ ′ ′ ′ ′ ηab (x − x0 ) (x − x0 ) = λ a b 2 3 ∑ ηab (x − x0 )a (x − x0 )b (2.7) a,b=0 a,b=0 Chiameremo l’espressione ∆s2 = 3 ∑ ηab (x − x0 )a (x − x0 )b (2.8) a,b=0 l’intervallo spazio-temporale tra i due punti x e x0 ; diremo anche che ciascuno di essi definisce le coordinate spazio-temporali di un evento. Si può vedere che di tutte le trasformazioni lineari che soddisfano la (2.7), le dilatazioni, o trasformazioni di scala, ′ x a = λxa , λ > 0, sono le uniche per cui λ(L) ̸= 1. Per cominciare, la validità della (2.4) per tutti i punti è possibile solo se ∑ (2.9) ηab Lac Lbd = λ2 ηcd a,b 7 Dal punto di vista matematico questa condizione definisce una rappresentazione irriducibile unidimensionale del gruppo di simmetria. 33 Allora la matrice Λab = λ−1 Lab soddisfa la condizione di invarianza stretta, quella cioè con λ = 1. In definitiva:∑ogni trasformazione lineare delle coordinate che preserva la forma quadratica (x, y) = ab ηab xa y b a meno di un fattore di scala moltiplicativo, è della forma ′ x a = λΛab xb + β a (2.10) Le matrici Λab formano un gruppo di trasformazioni detto il gruppo di Lorentz; la sua caratteristica è di lasciare invariata la forma quadratica, e dunque in particolare il cono luce. ′ Oltre alle traslazioni spazio-temporali, x b = xb + ab , semplici trasformazioni che lasciano invariato il cono luce sono le trasformazioni ortogonali delle coordinate (le familiari rotazioni), definite dalla condizione che in almeno un sistema di riferimento esse assumano la forma ′i x = 3 ∑ Ri j xj , ′ ct = ct j=1 e le già citate trasformazioni di scala (dette anche dilatazioni), che come le rotazioni sono lineari e omogenee ma non cambiano la velocità relativa dei sistemi di riferimento. Le simmetrie di rotazione e traslazione corrispondono all’isotropia e omogeneità dello spazio, e sono associate a importanti leggi di conservazione, sperimentalmente verificate. Le trasformazioni di scala, invece, non sono simmetrie esatte delle leggi naturali8 . Se λ e Λ fossero indipendenti allora L’Eq. (2.10) descriverebbe una dilatazione seguita da una trasformazione di Lorentz (o viceversa). Resta aperta la possibilità che λ = λ(Λ), ′ ′ nel qual caso λ(Λ)λ(Λ ) = λ(ΛΛ ); se Λ = R è una rotazione, nel senso che R00 = 1, Ri0 = R0i = 0 e Rji è una matrice ortogonale, allora richiediamo senz’altro che λ(R) = 1: per esempio, nel caso di una rotazione di angolo ϕ attorno all’asse z, la funzione λ(ϕ) dovrebbe soddisfare λ(ϕ1 + ϕ2 ) = λ(ϕ1 ) + λ(ϕ2 ). L’unica possibilità è λ(ϕ) = exp(cϕ), che però non è periodica. In effetti l’unica funzione reale continua λ(R) sul gruppo delle rotazioni tale che λ(R1 R2 ) = λ(R1 )λ(R2 ) è il determinante, ma per le rotazioni det[R] = 1. Il caso più generale sarà discusso nella prossima sezione9 . 2.2.2 Trasformazioni di Lorentz speciali, o boosts Consideriamo il caso semplice di due riferimenti in moto relativo uniforme lungo l’asse ′ comune x, e coincidenti nell’istante iniziale t = t = 0. Usando la seguente proprietà delle funzioni iperboliche, (cosh ψ)2 − (sinh ψ)2 = 1 8 Occorre precisare che le dilatazioni non modificano le masse o le costanti di accoppiamento delle interazioni, e che quindi non corrispondono a cambiamenti nelle unità di misura. L’invarianza di scala è quindi possibile solo se tutte le masse sono nulle o formano uno spettro continuo, e le costanti di accoppiamento sono numeri puri. 9 Vale la pena ricordare che anche per il gruppo di Lorentz vale l’affermazione che l’unica rappresentazione reale unidimensionale è quella triviale: λ(Λ) = 1. Questo renderebbe superflua ogni altra discussione. 34 si verifica subito che la condizione di invarianza stretta (2.7) è soddisfatta da una “rotazione iperbolica” del tipo ′ ct = ct cosh ψ − x sinh ψ (2.11) ′ x = −ct sinh ψ + x cosh ψ ′ (2.12) ′ y =y z =z (2.13) ′ ′ La (2.13) significa che un moto lungo x in F viene trasformato in un moto lungo x in F e, viceversa, può essere derivata richiedendo tale proprietà. Per determinare ψ osserviamo ′ ′ che il punto x = 0, cioè l’origine di F , deve muoversi di moto uniforme con velocità v = (v, 0, 0); questo determina tanh ψ = v c (2.14) Il parametro ψ denota propriamente la rapidità della trasformazione, dato che ψ → ∞ per v → c. Inoltre tanh ψ ≤ 1 implica necessariamente v ≤ c. Che debba essere v < c si vedrà tra poco. Si noti anche l’analogia formale con le rotazioni. Siccome cosh2 ψ = 1 1 − tanh2 ψ si ha poi cosh ψ = √ 1 1− v 2 /c2 sinh ψ = √ , v 1 − v 2 /c2 A questo punto, le trasformazioni di Lorentz speciali prendono la forma ′ x =√ x − vt (2.15) 1 − v 2 /c2 t − vx/c2 ′ t =√ 1 − v 2 /c2 ′ y =y (2.16) ′ z =z (2.17) Il “fattore gamma” 1 γ=√ 1 − v 2 /c2 (2.18) 35 2n z }| { è onnipresente in relatività; una regola utile è che se v/c = 0, 99999...9 ... allora γ ≃ 10n . La matrice corrispondente10 è γ −vγ 0 0 −vγ γ 0 0 L(v) = (2.19) 0 0 1 0 0 0 0 1 Ponendo momentaneamente γ ≡ γ(v) per indicare la dipendenza da v, è facile verificare l’identità ( ′) vv ′ γ(v)γ(v ) 1 + 2 = γ(w) (2.20) c dove ′ v+v w= 1 + vv ′ /c2 (2.21) Questo significa che il prodotto di due trasformazioni di Lorentz collineari con velocità v ′ ′ e v è una trasformazione di Lorentz con velocità w, cioè che L(v) · L(v ) = L(w). ′ Poniamo per semplicità di notazione λ(L(v)) = λ(v). Allora la (2.5) diventa, se anche v è diretta secondo l’asse x, ′ λ(v)λ(v ) = λ(w) e dato che λ(0) = 1, si deve avere λ(v)λ(−v) = 1. Sia Rπ una rotazione che inverte v: Rπ v = −v. È facile vedere che L(−v) = Rπ L(v)Rπ (moltiplicate la matrice (2.19) per quella che rappresenta Rπ ), e dunque che λ(−v) = λ(Rπ )2 λ(v) = λ(v) In conclusione si ha λ(v) = 1. Le formule inverse sono ′ ′ x + vt x= √ 1 − v 2 /c2 y=y ′ ′ z=z (2.22) ′ (2.23) ′ t + vx /c2 t= √ 1 − v 2 /c2 10 (2.24) La numerazione di righe e colonne è nell’ordine 0, 1, 2, 3, ma certi autori usano invece 1, 2, 3, 0. 36 Figura 2.1: Sistemi in moto relativo uniforme y y’ v x x’ z z’ Si noti che le trasformazioni di Lorentz si riducono a quelle di Galilei nel limite c → ∞. Qui vediamo chiaramente la relatività della contemporaneità: in base a queste equazioni, ′ ′ ′ per due eventi simultanei (∆t = 0) ma separati spazialmente (∆x ̸= 0) in F , si ha ∆t = v ∆x c2 (2.25) in F . Come anche nella simmetria galileiana, la coincidenza spaziale di eventi separati nel tempo è relativa. Ma diversamente che dal caso galileiano, è relativa anche la coincidenza temporale di eventi separati nello spazio. In relatività ristretta, solo alla coincidenza spazio-temporale si può attribuire un carattere assoluto (cioè indipendente dal sistema di coordinate). Le trasformazioni di Lorentz speciali si possono scrivere in forma vettoriale ′ t = γ(t − v · x/c2 ), ′ x = x + (γ − 1) 1 γ=√ 1 − v 2 /c2 x·v v − γvt v2 (2.26) (2.27) e valgono anche se la velocità relativa non è diretta lungo un asse cartesiano. Dato che le formule dipendono solamente da v, si può pensare che definiscano una trasformazione di Lorentz pura, senza rotazione. Si noti che vale ancora λ(v) = 1. Se i riferimenti F ′ e F sono∑ connessi da una rotazione R, come nella (3.3), allora nell’Eq. (2.27) occorre ′ ′ sostituire 3j=1 Rij · xj al posto di xj . 37 2.2.3 La più generale trasformazione di Lorentz Allo scopo di descrivere trasformazioni più generali, riprendiamo la metrica di Minkowski11 (2.6) −1 0 0 0 0 1 0 0 ηab = 0 0 1 0 0 0 0 1 Come abbiamo visto, si può scrivere l’intervallo spazio-temporale nella forma 2 ∆s = 3 ∑ ηab ∆xa ∆xb , ∆xa = xa − xa0 (2.28) a=0 Possiamo pensare alle grandezze xa e xa0 come alle coordinate di punti in uno spazio vettoriale quadri-dimensionale detto spazio-tempo di Minkowski12 , o più semplicemente spazio-tempo, i cui punti rappresentano gli eventi. L’espressione (2.28) definisce l’intervallo spazio-temporale tra due eventi, invariante di Lorentz. La formula (2.28) definisce anche un prodotto scalare con metrica ηab , cioè la forma quadratica (x, y) = 3 ∑ ηab xa y b (2.29) a=0 è evidentemente bilineare e non degenere13 . Ma si noti che non è definita positiva. La condizione di invarianza dell’intervallo prende la forma 3 ∑ Λac Λbd ηcd = ηab (2.30) c,d=0 e identifica le trasformazioni di Lorentz come il gruppo delle isometrie della metrica ηab . Si noti che la (2.30) implica det[Λ] = ±1. Si osservi anche che dalla (2.30) segue l’invarianza del prodotto scalare (x, y) = −x0 y 0 + x1 y 1 + x2 y 2 + x3 y 3 (2.31) per ogni coppia di punti x, y. Vogliamo ora mostrare che le trasformazioni speciali discusse sopra essenzialmente esauriscono le trasformazioni di Lorentz. Consideriamo una trasformazione di Lorentz generica ′a x = 3 ∑ Λab xb a=0 11 Quanto segue è un piccola anticipazione del formalismo quadri-dimensionale. Hermann Minkowski (1864-1909), a cui si deve la formulazione quadri-dimensionale della teoria della relatività. 13 (x, y) = 0 per ogni y se e solo se x = 0. 12 38 e applichiamola al vettore14 ζ a = (1, 0, 0, 0), tale che (ζ, ζ) = −1. Si otterrà un vettore della forma Λ · ζ = (x, x) dove −x2 + |x|2 = −1 perché le trasformazioni di Lorentz preservano il prodotto scalare. Sia R una rotazione che riporta il vettore ottenuto lungo l’asse x, R · Λ · ζ = (x, |x|, 0, 0) Siccome |x| < x, possiamo porre u = c|x|/x < c e applicare il boost L(u); si trova L(u) · R · Λ · ζ = (1, 0, 0, 0) = ζ Segue da questo che L(u) · R · Λ ≡ R̄ è una rotazione spaziale. Dunque, poiché L(u)−1 = L(u), si ha Λ = R−1 · L(−u) · R̄ (2.32) Si noti che questa trasformazione ha determinante 1. Vediamo da qui che la più generale trasformazione di Lorentz propria (det Λ = 1) e ortocrona (Λ00 ≥ 1) è il prodotto di due rotazioni con una trasformazioni di Lorentz speciale. Possiamo ora completare la dimostrazione del fatto accennato che λ(Λ) = 1 è l’unico fattore di scala ammesso: sappiamo che λ(R) = 1 per le rotazioni, e abbiamo visto sopra che λ(L(u)) = 1 anche per i boosts. Dunque ′ ′ λ(Λ) = λ(R−1 · L(−u) · R ) = λ(R−1 )λ(L(−u))λ(R ) = 1 E15: Perché una trasformazione di Lorentz che preserva ζ deve essere una rotazione? 2.3 Lunghezze e intervalli di tempo Dalle trasformazioni di Lorentz (2.15), ((2.17)), ((2.16)), si ricava che un regolo (asta rigida) in moto con velocità v in un riferimento F , avente lunghezza propria L0 (la lunghezza ′ nel riferimento F nel quale il regolo è in quiete), ha lunghezza √ v2 L = L0 1 − 2 (3.1) c se misurata inF . Il risultato dipende dalle trasformazioni di Lorentz e dal fatto che la misura di L richiede che le posizioni degli estremi del regolo siano determinate simultaneamente in F . Allora dalla prima delle (2.15) segue che per eventi simultanei in F (∆t = 0) ′ si ha L0 = ∆x = γ∆x = γL. Si può anche calcolare direttamente ∆x: in questo caso ′ ′ ∆x = γ(∆x − v∆t ) 14 che rappresenta un secondo-luce trascorso nell’origine delle coordinate. 39 ′ Ma eventi simultanei in F non lo sono in F , e infatti si ha v ′ ′ ∆t = 2 ∆x c ′ Eliminando ∆t si riottiene la (3.1). Vediamo che la formula della contrazione dipende solo dalla simmetria di Lorentz e non richiede alcuna ipotesi sulla struttura della materia. Essa si deve considerare come una proprietà elementare del gruppo di Lorentz non deducibile da concetti più elementari. Per le applicazioni è necessario estendere la formula della contrazione ai moti accelerati, ma per questo serve la seguente assunzione addizionale: la lunghezza di un elemento dℓ di lunghezza è connesso all’elemento di lunghezza proprio dℓ √0 , misurato nel SI momentaneamente in quiete col regolo, dalla formula (3.1): dℓ = 1 − v 2 /c2 dℓ0 . Dunque, per esempio, dal punto di vista dell’equipaggio di un’astronave che viaggia dalla terra verso Vega (a 26 anni luce) in linea retta, con velocità v(x) misurata in anni-luce/anno, la distanza percorsa sarà ∫ 26 √ L (anni − luce) = 1 − v(x)2 dx 0 Se il moto è iperbolico (v. più avanti) si ha razione misurata15 in anni-luce/anni2 √ 1 − v(x)2 = (1 + gx)−1 , dove g è l’accele- E16: Si calcoli la distanza per raggiungere Vega se g è l’accelerazione di gravità terrestre, circa 9, 8 m/s2 . E17: Si mostri che la lunghezza di un regolo mobile posto “di traverso” alla direzione del moto è data dalla formula L= √ L0 γ −1 1 − β 2 sin2 θ dove θ è l’angolo del regolo con la direzione del moto. L’assunzione fatta poggia la ragione sul fatto che è sempre possibile, in linea di principio, correggere gli effetti dell’accelerazione sui regoli, e nessun esperimento noto la contraddice. Naturalmente, accelerazioni troppo elevate non possono essere applicate a oggetti macroscopici per ragioni strutturali. Simili considerazioni si possono fare riguardo al comportamento di orologi in movimento. In tal caso l’intervallo di tempo proprio τ (il tempo indicato dall’orologio nel suo sistema di quiete) è connesso all’intervallo T misurato in F dalla formula √ v2 τ =T 1− 2 (3.2) c dove v è la velocità dell’orologio in F . Infatti, dalla seconda delle (2.16), segue che per ′ eventi spazialmente coincidenti in F (le posizioni successive delle lancette dell’orologio 15 Per esempio, se g = 980 cm/sec2 è la gravità terrestre si ha g = 1, 028 anni − luce/anni2 . 40 ′ ′ fermo in F ), si ha T = γT ≡ τ . Si vede da qui che l’orologio in movimento ritarda rispetto agli orologi in quiete. Come per i regoli, anche per gli orologi faremo l’assunzione extra che gli effetti dell’accelerazione si possano correggere. Il tempo proprio di un orologio in movimento lungo una curva arbitraria si calcola allora con l’integrale ∫ T√ τ= 1 − v(t)2 /c2 dt (3.3) 0 I limiti di integrazione si possono ovviamente cambiare. Per esempio, nel moto iperbolico si ha gt v(t) = √ 1 + g 2 t2 /c2 E17: Si calcoli il τ per raggiungere Vega se g è l’accelerazione di gravità terrestre, circa 9, 8 m/s2 . Che valore si deve prendere per T ? Nota- Non discutiamo qui le verifiche sperimentali della formula importante (3.2), in quanto le innumerevoli verifiche sperimentali dell’invarianza di Lorentz oggi disponibili sono anche una verifica della dilatazione temporale e della contrazione delle lunghezze (che, peraltro, non è mai stata osservata direttamente, cioè mediante regoli in moto). Tuttavia la (3.2) ha un’applicazione immediata alla vita media delle particelle elementari instabili: la vita media di particelle veloci si allunga del fattore γ. Per questo i muoni prodotti negli strati alti dell’atmosfera dall’urto con i raggi cosmici arrivano a terra nonostante la breve vita media di circa 2, 2 µs. La formula relativistica è stata confermata osservando il decadimento di muoni ultra-relativistici, aventi γ ≃ 30 (con che velocità si spostano i muoni con tale γ?), negli anelli di accumulazione del CERN, con precisione di livello 10−3 . 2.4 L’addizione delle velocità La traiettoria di una particella in moto è descritta in F dalla funzione vettoriale x(t), e ′ ′ ′ in F da x (t ). Dalle trasformazioni di Lorentz si ricava facilmente √ √ 2 v2 u y 1 − c2 uz 1 − vc2 ux − v ′ ′ ′ , uy = , uz = (4.1) ux = 1 − ux v/c2 1 − ux v/c2 1 − ux v/c2 In forma vettoriale ′ u = u + (γ − 1)(u · v)v/v 2 − γv γ(1 − u · v/c2 ) ′ (4.2) ′ u + (γ − 1)(u · v)v/v 2 + γv u= γ(1 + u′ · v/c2 ) (4.3) 41 ′ Orientiamo l’asse z in modo tale che uz = 0. Allora anche uz = 0 e dalla (4.1) segue √ sin θ 1 − v 2 /c2 ′ tan θ = (4.4) cos θ − v/u Dalla (4.2) si trova ( )1/2 ( )−1 v v2 v2 uv 2 u = u 1 − 2 cos θ + 2 − 2 sin θ 1 − 2 cos θ u u c c ′ dove θ è l’angolo fra u e v. Introducendo il versore e nella direzione di u, e risolvendo rispetto ad u, si ottiene la formula √ [ ′ ′ ′ ′ ]1/2 ′ v · e(1 − u 2 /c2 ) + 1 − v 2 /u 2 + (1 − u 2 /c2 )(v · e)2 /u 2 u 1 − v 2 /c2 u= (4.5) 1 − v 2 /c2 + (1 − u′ 2 /c2 )(v · e/c)2 ′ Si noti che u = c se e solo se u = c, indipendentemente dalla direzione del moto. ′ Presentano interesse le formule di trasformazione dell’accelerazione nel caso che F sia un sistema momentaneamente in quiete con la particella; differenziando le (4.1) nelle ′ ′ ′ componenti della velocità e ponendo successivamente ux = uy = uz = 0 e v = u, si ottengono facilmente le formule volute ′ ax = (1 − β 2 )3/2 ax , ′ ay = (1 − β 2 )ay , ′ ′ ′ az = (1 − β 2 )az (4.6) ′ dove β = u/c, ax = dux /dt, ax = dux /dt , eccetera. In forma vettoriale (√ ) a′ · u 2 a = (1 − β )a + (1 − β ) 1−β −1 u u2 2 ′ 2 (4.7) Si possono scrivere le (4.6) nella forma suggestiva ( ) d u ′ √ =a dt 1 − u2 /c2 ′ Nel sistema istantaneamente in quiete vale la meccanica newtoniana cosicché a = F/m, dove F è la forza, e la formula suggerisce allora che la definizione appropriata della quantità di moto in relatività sia mu p= √ 1 − u2 /c2 dove m è la massa a riposo della particella; ritorneremo sulla questione in seguito. 42 2.5 La luce nei dielettrici trasparenti Usando le formule di trasformazione di Lorentz e la costanza di c nella condizione di invarianza della fase di un onda elettromagnetica piana, si trovano le formule di trasformazione delle caratteristiche dell’onda valide nella teoria della relatività 1 − v cos θ/c cos θ − v/c ′ ′ ′ ′ ′ ν =ν √ , ν cos θ = ν √ , ν sin θ = ν sin θ (5.1) 2 2 2 2 1 − v /c 1 − v /c ′ ′ dove θ e θ danno la direzione della normale all’onda in F e F rispettivamente. Si vede che √ sin θ 1 − v 2 /c2 ′ tan θ = (5.2) cos θ − v/c Questa formula è identica alla (4.4), dove si ponga u = c; cioè la direzione dei raggi di luce si trasforma nello stesso modo della normale ai fronti d’onda, diversamente che nella teoria dell’etere. Se si introduce il vettore numero d’onde, k = (2πν/c)n, e si pone k 0 = 2πν/c, le formule scritte indicano che le quattro grandezze (k 0 , kx , ky , kz ) si trasformano come le componenti del vettore posizione di un evento, (x0 , x, y, z), dove si è posto x0 = ct. Infatti si può scrivere la fase dell’onda nella forma F = −k 0 x0 + kx x + ky y + kz z da cui discende subito che F sarà invariante precisamente se le componenti k 0 e k si trasformano come le componenti del vettore posizione x0 , x. La velocità di gruppo, u, segue dalle formule scritte se si rammenta che u= ∂ω ∂k ω = 2πν Con un calcoletto un pò più lungo che nel caso non relativistico, si ottiene √ √ uy 1 − v 2 /c2 uz 1 − v 2 /c2 ux − v ′ ′ ′ ux = , uy = , uz = 1 − ux v/c2 1 − ux v/c2 1 − ux v/c2 cioè la stessa legge di composizione delle velocità che è valida per le particelle di massa ′ finita. Per un mezzo trasparente in quiete in F con indice di rifrazione n, la velocità ′ della luce in F è data dalla formula (4.5) con u = c/n, cioè √ 1/2 v · e(1 − 1/n2 ) + 1 − v 2 /c2 [1 − n2 v 2 /c2 + (1 − 1/n2 )(v · e)2 n2 /c2 ] c/n u= 1 − v 2 /c2 + (1 − 1/n2 )(v · e/c)2 Al primo ordine in v/c si ritrova la formula di Fresnel (5.18) ( ) c 1 u= + 1− 2 v·e n n qui ottenuta senza fare ricorso all’ipotesi dell’etere. 43 2.5.1 Effetto Doppler e aberrazione secondo la relatività ′ L’effetto Doppler è contenuto nella (5.1): se la sorgente è in F , allora θ è l’angolo tra la direzione del moto della sorgente e la direzione della luce in F e v cos θ = −vr , dove vr è considerata positiva se la sorgente si allontana dall’osservatore. Si ottiene allora la formula relativistica √ 1 − v 2 /c2 ′ ν=ν (5.3) 1 + vr /c Si noti che secondo questa formula c’è un effetto Doppler anche quando vr = 0, ossia per un puro moto trasverso. L’aberrazione è contenuta nella (5.2) ( o nella (4.4), con u = c), valida per ogni coppia ′ di riferimenti inerziali. In particolare, se F è il sistema di quiete della sorgente e F rappresenta un laboratorio terrestre nel suo moto attorno al sole, la direzione del raggio ′ ′ ′ in F è ϑ = π − θ, in F è ϑ = π − θ e dalla (5.2) si ottiene (A. Einstein, 1905) √ sin ϑ 1 − v 2 /c2 ′ tan ϑ = (5.4) cos ϑ + v/c ′ Introducendo l’angolo di aberrazione δϑ = ϑ − ϑ, al primo ordine in v/c si ha v δϑ = − sin ϑ c La discussione dell’aberrazione in relatività si è rivelata una questione assai delicata, nonostante l’apparente semplicità del fenomeno. Ad esempio, la formula (5.4) si può applicare ad una coppia qualsiasi di sistemi inerziali; si può allora notare che l’aberrazione ′ dipende solo dalla velocità relativa di F ed F , ed è quindi indipendente dalla velocità ′ della sorgente in F o in F . In ogni caso, se si riserva la designazione di aberrazione stellare allo spostamento angolare delle stelle osservato dalla terra (il fenomeno osservato e quantificato per la prima volta da Bradley) allora l’effetto si può certamente attribuire al moto della terra rispetto alle sorgenti. Da questo punto di vista si può osservare che l’aberrazione fornisce una prova diretta del moto della terra attorno al sole. L’aberrazione diventa ovviamente significativa per velocità prossime a quella della luce. Per esempio, in una ipotetica nave spaziale che viaggiasse attraverso la galassia con velocità prossima a c, tutte le stelle apparirebbero concentrate attorno alla direzione del moto dell’astronave, e il resto del cielo sarebbe buio; si avrebbe inoltre una grande intensità luminosa ultravioletta proveniente dalla direzione del moto, a causa dello spostamento verso il blu della radiazione. 2.5.2 Onde di materia È interessante ottenere il comportamento di onde diverse da quelle elettromagnetiche, come ad esempio le onde di materia della teoria quantistica. La fase si scrive ( ) x cos α + y sin α F (t, x, y) = ν t − w 44 dove w è la nuova velocità di fase. Dall’invarianza della fase si ottengono le formule di facile dimostrazione 1 − v cos α/w ′ ν =ν √ , 1 − v 2 /c2 ′ ν ν cos α − vw/c2 ′ √ cos α = , w′ w 1 − v 2 /c2 ′ ′ ν ν ′ sin α ′ sin α = w w ′ dove come al solito α e α danno la direzione della normale all’onda in F e F rispettivamente. Si vede che √ sin α 1 − v 2 /c2 ′ tan α = (5.5) cos α − vw/c2 ( )−1/2 v2 2vw v 2 w2 2 w = 1 − 2 sin α − 2 cos α + 4 (w − v cos α) c c c ′ (5.6) In base alla (5.5) una tale onda ha la stessa aberrazione di una particella con velocità u= c2 w (5.7) Questo fatto fu notato da De Broglie che ne diede la seguente semplice interpretazione fisica: se si vuole che E = ℏω e p = ℏk allora w= ω E c2 = = |k| |p| u perché in relatività (come vedremo) E = γmc2 e p = γmu. 45 Capitolo 3 Formalismo quadridimensionale ed equazioni invarianti Come abbiamo anticipato, le quattro coordinate di un evento in un sistema di riferimento ′ inerziale identificano un punto dello spazio-tempo. Ad ogni sistema F , F ,. . . , è associato ′ il proprio sistema di coordinate {xa }, {x a }, . . . , per mezzo del quale si possono identificare gli eventi, e le trasformazioni di Lorentz sono allora interpretabili come applicazioni lineari operanti sullo spazio di Minkowski. Si noti che i quattro numeri xa , a ∈ {0, 1, 2, 3}, definiscono ciò che in algebra si chiama un quadri-vettore, o più semplicemente un vettore. È tipico delle componenti dei vettori trasformarsi linearmente per effetto di una “rotazione” dei vettori di base. Nel seguito, useremo alcune lettere della parte centrale dell’alfabeto latino, quali i, k, j, l, m, n, . . . , per indicare le componenti spaziali dei vettori. Le lettere a, b, c, d, . . . denotano indici quadri-dimensionali. Sottolineiamo il fatto essenziale che le coordinate devono essere definite operativamente. Ad esempio, il tempo di ogni evento è indicato da un orologio “vicino” all’evento e sincronizzato agli altri orologi dalla procedura indicata precedentemente, mediante l’invio di segnali elettromagnetici. Non è affatto scontato che lo spazio-tempo, inteso come l’insieme di tutti gli eventi, abbia la struttura di spazio vettoriale caratteristica della relatività speciale, nè questa struttura deriva logicamente dalla sua definizione euristica di “insieme di tutti gli eventi”. Tuttavia questo è ciò che si osserva localmente. 3.1 Prodotto scalare Abbiamo anche visto che le trasformazioni di Lorentz non cambiano il valore della forma quadratica (x0 = ct) che rappresenta l’intervallo spazio-temporale tra due eventi Ds = −(x − y ) + 2 0 0 2 3 ∑ (xi − y i )2 (1.1) i=1 46 Indicheremo il secondo membro di questa equazione con la notazione propria delle forme bilineari, (x − y, x − y), dove (x, y) = (y, x) = −x0 y 0 + 3 ∑ xj y j j=1 Si ha allora (x − y, x − y) = (x, x) + (y, y) − 2(x, y) Usando la metrica diagonale ηab = ηba , tale che η00 = −1, ηik = δik , si può scrivere (x, y) = 3 ∑ ηab xa y b (1.2) a,b=0 Questa forma quadratica bilineare definisce nello spazio di Minkowski un prodotto scalare non degenere, che però non è definito positivo. Per analogia con il caso euclideo, ηab si chiama il tensore metrico o, più semplicemente, la metrica di Minkowski. Si noti che mentre l’indice di xa è (convenzionalmente) posto in alto, gli indici della metrica sono in basso; la ratio è nel fatto che la forma (x, y) è invariante di Lorentz, e diverrà chiara quando discuteremo gli invarianti. En passant, gli indici in alto si dicono “controvarianti”, quelli in basso “covarianti”. Nel seguito faremo uso della convenzione di Einstein degli indici ripetuti, secondo la quale in un prodotto in cui figurano coppie di indici uguali, uno controvariante e l’altro covariante, si sottintende che siano sommati sui loro valori 0, 1, 2, 3. Per esempio, la (1.2) si scriverà più semplicemente nella forma (x, y) = ηab xa xb Infine useremo unità di misura in cui c = 1 e adimensionale, salvo avviso contrario. Per esempio, la luce si sposta di 30 centimetri in un nanosecondo, quindi prendendo come unità di tempo il nanosecondo (ns), e di spazio 30 cm (chiamiamolo nanospazio, o nsp), si avrà che c = 1 nsp/ns, ma si noti che c non è adimensionale. Se invece stipuliamo che 1 sec = 2, 998 × 1010 cm si ha ancora c = 1, ma ora c è un numero puro. 3.2 Gruppo di Lorentz Come abbiamo ricordato sopra, le trasformazioni di Lorentz lasciano invariato l’intervallo spazio-temporale. Possiamo quindi definire queste trasformazioni come elementi del gruppo delle isometrie dello spazio di Minkowski, gruppo che indicheremo semplicemente con il simbolo L. In altri termini, si tratta di trasformazioni di coordinate lineari e omogenee ′ xa → x a = Λab xb (2.1) 47 che preservano il prodotto scalare (Λx, Λy) = (x, y) Essendo non degenere, questo è possibile se e solo se ηab Λac Λbd = ηcd (2.2) Valgono le seguenti proprietà elementari: • le trasformazioni di Lorentz formano un gruppo di dimensione sei: le (2.2) sono un sistema di 10 equazioni per 16 variabili. • det Λ = ±1 per ogni Λ ∈ L • gli elementi con determinante uguale a uno formano il sottogruppo proprio, indicato con L+ . Le inversioni, (x0 , x) → (x0 , −x), e (x0 , x) → (−x0 , x), non sono dunque in L+ , ma l’inversione completa (x0 , x) → (−x0 , −x) si. • la componente 00 della (2.2) implica |Λ00 | ≥ 1; le matrici con Λ00 ≥ 1 e det Λ = 1 formano il sottogruppo proprio ortocrono, indicato con L↑+ . Le trasformazioni con Λ00 ≤ −1 invertono l’ordinamento temporale degli eventi, le trasformazioni proprie ortocrone invece lo preservano1 . Quindi l’affermazione che un evento p è nel futuro di un altro evento q è invariante per trasformazioni di Lorentz proprie ortocrone. È questo un fatto molto importante, perché senza di esso non si potrebbe dare un significato invariante alla causalità. • (Λ−1 )ca ηbc = ηac Λcb , che è ovvia. 3.3 Tensori e campi di tensori Dal punto di vista matematico, la metrica è un esempio di tensore covariante simmetrico di rango due (per dire ha due indici posti in basso, o pedici), mentre le coordinate di un evento sono un esempio di tensore controvariante di rango uno (un solo indice posto in alto, o apice), detto più semplicemente quadrivettore. 3.3.1 tensori algebrici Più in generale, dato un sistema di coordinate inerziali (F , xa ), possiamo definire un tensore controvariante di rango n assegnando l’insieme delle sue 4n componenti K a1 ...an , ai ∈ {0, 1, 2, 3}, insieme con una “legge di trasformazione” che permetta di calcolare le nuove componenti se si passa a nuove coordinate con una trasformazione di Lorentz. La definizione è la seguente: ′ se x a = Λab xb 1 ′ allora K a1 ...an = Λab11 · · · Λabnn K b1 ...bn L’inversione dell’ordine temporale di eventi causalmente disgiunti è invece possibile. 48 (3.1) ′ Il significato fisico della trasformazione di K in K è evidente: la formula (3.1) permette di ′ calcolare le componenti del tensore nel sistema di riferimento inerziale F con le coordinate ′ x a = Λab xb se sono date le componenti dello stesso tensore in F . Nel contesto della relatività ristretta tali oggetti si chiamano anche tensori di universo. Si vede che i tensori si trasformano come il prodotto delle componenti di n vettori controvarianti. Per esempio, dati due vettori x e y, l’oggetto K = x ⊗ y, definito dalle componenti K ab = xa y b + xb y a , è un tensore di rango due con la proprietà aggiuntiva di essere simmetrico: K ab = K ba . In modo analogo si definiscono i tensori covarianti Ka1 ...am , caratterizzati dalle regole di trasformazione ′ Ka1 ...am = (Λ−1 )ba11 · · · (Λ−1 )bamm Kb1 ...bm (3.2) e i tensori misti di tipo [n, m], aventi n indici posizionati in alto e m posizionati in basso. Alcuni esempi sono: il tensore unità, con componenti δba uguali a uno se a = b e zero altrimenti, il tensore η ab definito dalla relazione (ricordarsi che è sottintesa la sommatoria sui valori dell’indice ripetuto b) η ab ηbc = δca e che si potrebbe chiamare la metrica inversa. Questi tensori hanno la proprietà speciale di ′ ′ essere invarianti sotto l’azione del gruppo di Lorentz, cioè δba = δba e η ab = η ab . Un altro tensore speciale è il tensore completamente antisimmetrico eabcd , uguale a +1 se {a, b, c, d} è un permutazione pari di {1, 2, 3, 0}, e a −1 se è una permutazione dispari. Infatti Λaα Λbβ Λcγ Λdδ eabcd = det Λ eαβγδ mostra che eabcd è un tensore invariante rispetto alle trasformazioni di Lorentz proprie (det Λ = 1). Da un punto di vista matematico moderno, uno spazio di tensori è uno spazio vettoriale che trasporta una rappresentazione lineare del gruppo di Lorentz. La metrica inversa stabilisce un isomorfismo tra i tensori covarianti e controvarianti, mediante l’operazione di “innalzamento e abbassamento degli indici”; ad esempio, per un quadrivettore si ha v a = η ab vb va = ηab v b La (2.2) e l’invarianza di ηab implicano subito la consistenza di queste formule con la definizione dei tensori covarianti e controvarianti. In particolare, è facile verificare che η ab = η ac η bd ηcd L’insieme dei tensori di un dato tipo (covariante, controvariante o misto) forma in modo naturale uno spazio vettoriale. Esistono però altre due operazioni importanti che si possono fare con i tensori: la contrazione su due indici mappa un tensore di rango [n, m] in uno di rango [n − 1, m − 1] mediante la formula ...ak ...an ...a...an Kba11...b → Kba11...a...b m j ...bm (3.3) 49 Per un tensore di rango due, la contrazione si chiama traccia Kba → Kaa = η ab Kab = ηab K ab e il risultato è un’invariante di Lorentz. L’altra operazione binaria è il prodotto tensoriale, che converte due tensori di rango [k, l] e [n, m] nel tensore di rango [k + n, l + m] dato dalla formula naturale ...ak c1 ...cn ...ak c1 ...cn (K · T )ab11...b = Kba11...b Td1 ...dm l d1 ...dm l (3.4) Si noti che il prodotto è associativo ma non commutativo. È anche utile osservare che i sottospazi dei tensori simmetrici con traccia zero, e dei tensori completamente antisimmetrici, sono invarianti per trasformazioni di Lorentz. Per i quadrivettori abbiamo anche il prodotto scalare (u, v) = ηab ua v b = ua v a = ua va (3.5) e il quadrato della norma u2 = ηab ua ub . Due quadrivettori u e v di diranno ortogonali se (u, v) = 0; si deve però notare che questo non significa affatto che formino un angolo di π/2, perché la metrica non è definita positiva. 3.3.2 campi tensoriali Dato che le equazioni importanti della fisica sono equazioni differenziali, la trattazione algebrica dei tensori offre solo limitate possibilità. Le funzioni differenziabili a valori tensoriali ...an xa → Kba11...b (x) m si chiamano genericamente campi di tensori, o campi tensoriali. La formula di trasformazione deve ora tenere conto che si trasformano anche gli argomenti dei campi ′ ′ ab... nm... Kcd... (x ) = Λan Λbm · · · (Λ−1 )uc (Λ−1 )vd · · · Kuv... (x), ′ x =Λ·x (3.6) ′ Se x a = Λab xb si ha ( −1 )b ∂ ∂ ′a = Λ a ∂xb ∂x Questo mostra che le derivate parziali si trasformano come se fossero quadrivettori covarianti: perciò poniamo ∂/∂xa = ∂a . È dunque chiaro che differenziando k volte un campo tensoriale di rango [n, m] si ottiene un campo tensoriale di rango [n, m + k]. Ad esempio, se ϕ(x) è un campo scalare, cioè se ′ ′ ′ ϕ (x ) = ϕ(x) ←→ ϕ (x) = ϕ(Λ−1 x) allora ϕa (x) = ∂a ϕ(x) è un campo vettoriale covariante. 50 3.4 Equazioni invarianti La regola per formare equazioni invarianti di Lorentz è assai semplice: è sufficiente equagliare a zero qualunque espressione formata con campi tensoriali e con le loro derivate parziali, che sia essa stessa un campo tensoriale per il gruppo di Lorentz. Naturalmente si deve avere l’accortezza di rispettare le regole per la moltiplicazione, la somma, la contrazione e la differenziazione dei tensori che vi compaiono. Il fondamento di questa prescrizione è il fatto ovvio che le espressioni tensoriali si trasformano linearmente. Il tensore nullo in un sistema di coordinate è allora automaticamente nullo in tutti gli altri. 3.4.1 Equazione di Klein-gordon Un famoso esempio di equazione invariante di Lorentz è l’equazione di Klein-Gordon per un campo scalare (o l’equazione delle onde se m = 0) η ab ∂a ∂b ϕ − m2 ϕ = 0 (4.1) Si noti il fatto interessante: il parametro m è chiaramente l’inverso di una lunghezza, ma se insistiamo che m rappresenti una massa allora il termine m2 ϕ andrebbe scritto nella forma (m2 c2 /ℏ2 )ϕ, per ragioni dimensionali. Le più semplici soluzioni sono le onde piane ϕk = a exp(ika xa ), k 2 + m2 = 0 √ e allora la frequenza k 0 = ± k2 + m2 : si riconosce la somiglianza, non casuale, con la relazione momento-energia di una particella relativistica. Un’applicazione di queste soluzioni si ha nella riflessione da uno specchio mobile. Supponiamo che lo specchio sia ortogonale all’asse x, lungo il quale si muove verso destra con velocità v. L’onda piana incida sullo specchio nel piano [x, y] con angolo di incidenza α e ampiezza a = 1, e sia m = 0: allora l’onda incidente è ϕin (t, x, y) = e−iωt+iω(x cos α+y sin α) e l’onda riflessa ′ ′ ′ ′ ϕout (t, x, y) = Re−iω t−iω (x cos α −y sin α ) Si noti che, a priori, sia l’ampiezza che la frequenza che l’angolo di riflessione sono diversi ′ ′ dai corrispondenti parametri dell’onda incidente. Se v = 0 allora α = α e ω = ω . L’azione dello specchio è descritta dalla condizione al contorno di Dirichlet ϕin (t, vt, y) + ϕout (t, vt, y) = 0 il cui significato è che il campo totale a sinistra dello specchio deve annullarsi sulla sua superficie, il piano di equazione x = vt. Si trovano allora le condizioni necessarie ′ ω sin α = ω sin α ′ 51 ′ ′ ω(1 − v cos α) = ω (1 + v cos α ) e R = −1. ′ ′ E18: Si risolvano le equazioni precedenti per α e ω . Si dovrebbe trovare (ricordarsi che c = 1) ′ cos α = (1 + v 2 ) cos α − 2v 1 − 2v cos α + v 2 ′ ω 1 − 2v cos α + v 2 = ω 1 − v2 che è la formula di Einstein per l’effetto Doppler da uno specchio mobile. E19: Si ripristini la velocità della luce nelle formule precedenti. E20: Si provi a ricavare la formula di Einstein dello specchio mobile applicando direttamente le trasformazioni di Lorentz, tenendo presente che nel sistema di quiete dello ′ ′ specchio α = α e ω = ω . 3.4.2 Equazione di Proca Sia ϕa un campo vettoriale: il tensore ϕab = ∂a ϕb − ∂b ϕa è antisimmetrico. Il sistema di equazioni ∂a ϕab + m2 ϕa = 0 è manifestamente covariante di Lorentz. Dalla definizione di ϕab seguono direttamente le equazioni eabcd ∂a ϕbc = 0 o anche ∂a ϕbc + ∂c ϕab + ∂b ϕca = 0 E21: Quante sono le equazioni scritte sopra? È il sistema determinato? Le equazioni scritte sopra per un tensore antisimmetrico ϕab sono le più semplici equazioni invarianti non banali2 . Come vedremo, con opportune identificazioni, e se m = 0, queste sono identiche alle equazioni di Maxwell per il campo elettromagnetico nel vuoto, con ϕa nel ruolo dei potenziali elettromagnetici. Si noti la conseguenza interessante ∂a ϕ a = 0 valida se m ̸= 0 (questione: perché?). 2 ∂a ϕbc = 0 è per noi un esempio di equazione invariante banale. 52 3.5 Il tempo proprio L’intervallo di tempo proprio fra due eventi con coordinate (x0 , xk ) e (x0 + dx0 , xk + dxk ) è definito dalla formula dτ 2 = −ηab dxa dxb = (dx0 )2 − dx · dx Se un orologio si muove lungo una curva x(x0 ), l’intervallo di tempo proprio (si assume che l’orologio abbia una risoluzione elevata affiché dτ e dx0 possano essere infinitesimi) è dτ = dx0 (1 − v2 /c2 )1/2 Dalla formula per la dilatazione del tempo si vede allora che dτ è il tempo indicato dall’orologio in movimento. Si deve però assumere quanto segue: il tempo indicato da un orologio in movimento non dipende dalla sua accelerazione, cosicché l’aumento di tempo proprio dell’orologio in ogni istante è lo stesso che si avrebbe nel sistema di quiete dell’orologio nel dato istante. Si noti che lungo una curva di tipo luce |v| = 1 e dτ = 0. 3.6 Il cono luce e le relazioni causali La metrica divide i quadrivettori in tre classi distinte: • se ηab V a V b < 0 si dice che V a è di tipo tempo, o time-like • se ηab V a V b > 0 allora V a è di tipo spazio, o space-like • se ηab V a V b = 0, V a è di tipo luce, o nullo, o causale, o light-like. L’insieme dei vettori nulli determina un cono con vertice nell’origine O3 , detto il cono luce e indicato con C. La falda superiore C+ , dove x0 > 0, è il cono luce degli eventi nel futuro di O, quella inferiore C− (x0 < 0) è il cono luce degli eventi nel passato di O. Ogni evento in C+ è caratterizzato da un vettore di tipo tempo con x0 > 0, ed è perciò nel futuro causale dell’origine. Se V a = xa − y a , essendo xa ed y a le coordinate di due eventi p e q, la classe di V a determina le possibili relazioni causali tra p e q. Se V 2 < 0 e V 0 > 0, si dirà che p è nel futuro cronologico di q, oppure che q è nel passato cronologico di p. Queste definizioni sono invarianti di Lorentz. Se V 2 > 0,si dirà che gli eventi p e q sono spazialmente separati. In questo caso non ci può essere una relazione causale tra p e q perché nessun segnale ha il tempo necessario per arrivare dall’uno all’altro, cioè “p accade” prima che il segnale da q lo raggiunga, o viceversa. Inoltre, la successione temporale di p e q può essere invertita con una opportuna trasformazione di Lorentz. Per finire, se V 2 = 0, un raggio di luce può connettere p e q, che appartengono dunque allo stesso cono luce. 3 L’evento con coordinate xa = 0. 53 E22: Sia p = (x0 , x, 0, 0), con x > x0 > 0, un evento nel futuro dell’origine (l’evento (0, 0, 0, 0)). Si trovi un’osservatore per il quale l’origine è nel futuro di p. Quanti ce ne sono? Si determini la velocità di un osservatore per il quale i due eventi sono simultanei. E23: Mostrare che la somma di due vettori timelike diretti nel futuro è un vettore timelike diretto nel fututo. Le relazioni causali si possono estendere ai sottoinsiemi dello spazio di Minkowski. Non è detto che il futuro causale di una regione spaziale, anche infinita, comprenda tutto lo spazio-tempo. 3.7 Curve Data una curva differenziabile parametrizzata xa (λ), λ ∈ R1 , sia ua = ẋa (λ) il quadrivettore tangente alla curva: se u è di tipo tempo e u0 > 0 diremo che la curva è del tipo temporale e diretta nel futuro. Una tale curva è sempre all’interno del cono luce futuro uscente da un qualunque evento sulla curva, e per la velocità, v = dx/dx0 , si ha |v| < 1: la curva è dunque la possibile linea di universo di una particella in moto, e si può scegliere per λ il tempo proprio τ . Se invece u è di tipo spazio diremo che la curva è di tipo spaziale. Nessuna particella può percorrere una tale curva, perché in tal caso dovrebbe muoversi più velocemente della luce.4 Infine può darsi che u2 = ηab ua ub = 0, nel qual caso la curva è detta di tipo luce, o curva nulla. Vedremo che le curve nulle rappresentano le linee di universo delle particelle con massa zero. Si noti che non possono essere parametrizzate con il tempo proprio, dato che dτ = 0 per eventi con separazione nulla. Usando il tempo proprio, le componenti della quadrivelocità sono 1 u0 = γ = √ , 1 − v2 uk = γv k , vk = dxk dt (7.1) Ricordiamo che abbiamo posto c = 1, e quindi x0 = t. Segue la formula u2 ≡ ηab ua ub = ua ua = −1 Si definisce quadriaccelerazione il quadrivettore wa = u˙a . Le sue componenti sono w0 = γ dγ = γ 4v · a dt (7.2) w = γa + w0 v (7.3) dove a = dv/dt = v̇ è l’accelerazione ordinaria. Vediamo che 4 L’impossibilità di questo fatto è indicata dalle trasformazioni di Lorentz, che diventano complesse se v > 1. 54 ′ ′ • wa = (0, a ) nel sistema F istantaneamente in quiete con la particella; da questo segue che w è un quadrivettore di tipo spaziale, w2 > 0. • derivando rispetto a τ la formula ηab ua ub = −1 si ottiene la condizione ηab ua wb = 0; si esprime questo dicendo che u e w sono quadrivettori ortogonali. Questo segue anche dal punto precedente, perché nel sistema di quiete si ha u = (1, 0) e w = (0, a). ′ • w2 ≡ ηab wa wb = |a |2 Possiamo adesso scrivere la condizione di simultaneità (2.25) in forma invariante ua ∆xa = 0 (7.4) Cioè un osservatore caratterizzato dalla velocità ua , giudica simultanei gli eventi che appartengono all’iperpiano ortogonale a ua . E24: Si consideri la famiglia di curve parametrizzate x0 = a sinh(bλ), x1 = cosh(bλ), x2 = x3 = 0 Qual’è l’espressione del tempo proprio lungo la curva? si calcoli la quadri-velocità in funzione del tempo. Stesso problema per la quadri-accelerazione. Sono le curve di tipo tempo, spazio o luce? 55 Capitolo 4 Meccanica relativistica [Ref.] L. D. Landau e E. M. Lifchitz, Teoria dei campi, Editori Riuniti (1976). ′ La meccanica relativistica parte con l’assunzione che in un sistema di coordinate F in cui una particella è momentaneamente in quiete, valgono le equazioni del moto della meccanica non relativistica ′ d2 r ′ m ′2 = f dt (0.1) Il principio di relatività permette allora di dedurre senza ambiguità le equazioni del moto in ogni altro sistema F , se solo si assoggetta la (0.1) a una trasformazione di Lorentz. Con ciò non si ha però una definizione della forza in F . 4.1 quantità di moto, energia e forza Sia m la massa propria della particella, la massa misurata nel sistema a riposo; definiamo l’impulso relativistico pa = mua , e la forza relativistica fa = dpa dua =m = mwa dτ dτ (1.1) Si hanno le relazioni importanti p 2 + m2 = 0 e inoltre p0 = √ m p 2 + m2 = √ , 1 − v2 (1.2) mv p = mγv = √ 1 − v2 (1.3) Dalla (1.1) segue fa ua = 0, da cui f 0 = f · v. L’Eq. (1.2) √definisce un iperboloide con 0 due componenti connesse, corrispondenti ai valori p = ± p2 + m2 . Il foglio fisico è la componente con p0 > 0. 56 Poiché 1 d d d =√ =γ 2 dτ dt 1 − v dt si può scrivere la (1.1) nella forma dp = γ −1 f , dt dp0 = γ −1 f · v dt (1.4) Nel sistema di riferimento dove la particella è istantaneamente in quiete, f coincide con la forza Newtoniana, che indichiamo con fN . Perciò identifichiamo p = γmv con la quantità di moto e p0 = γm con l’energia della particella; le formule esplicite, reintroducendo c, sono mv p= √ = mv + · · · 1 − v 2 /c2 E = cp0 = √ mc2 1 = mc2 + mv 2 + · · · 2 1 − v 2 /c2 Si ha anche √ E = m2 c4 + c2 p2 una forma che si può applicare anche a particelle di massa zero, nel qual caso E = c|p|. Il quadrimpulso di una tale particella è un vettore nullo, p2 = 0. Vediamo che l’impulso si riduce all’espressione Newtoniana a meno di termini di ordine v 2 /c2 , mentre nell’energia è presente la costante mc2 , detto energia propria, o di quiete, della particella. Il significato di questo fatto sarà discusso fra poco. 4.2 formule di trasformazione Dal carattere vettoriale delle grandezze meccaniche introdotte si ricavano subito le regole di trasformazione della forza ′ f ·v ′ f = f + (γ − 1) 2 v + γf 0 v/c, v ′ ′ ′ f 0 = γ(f 0 + f · v/c) (2.1) e del momento ′ p ·v ′ p = p + (γ − 1) 2 v + γp 0 v/c v ′ ′ (2.2) ′ p0 = c−1 E = γ(p 0 + v · p /c) (2.3) Come al solito, γ = (1 − v 2 /c2 )−1/2 . 57 4.3 sistemi di particelle Per un sistema di particelle il quadrimpulso è additivo ∑ Pa = pan , p2n = −Mn2 n dove la somma è definita sopra un piano di simultaneità dell’osservatore, cioè gli impulsi vanno sommati a un tempo dato del sistema inerziale rispetto al quale i momenti stessi sono riferiti. Tuttavia in assenza di collisioni ogni singolo pa è conservato e ha dunque lo stesso valore su ogni altro piano di simultaneità. Se un sottoinsieme di particelle collide, conservata sarà la somma dei quadri-momenti del sottoinsieme, che avrà dunque lo stesso valore su ogni altro piano di simultaneità. In entrambi i casi è indifferente su quale piano di simultaneità si calcola la somma, che risulterà cosı̀ composta dallo stesso numero di termini per tutti gli osservatori. È allora evidente che P a è un quadri-vettore. La massa invariante, definita dalla P 2 = −M 2 , è maggiore della somma dei quadrati delle masse ∑ ∑ ∑ M2 = Mn2 − 2 (pn , pm ) > Mn2 n n>m n perché i prodotti scalari (pn , pm ) di vettori di tipo tempo aventi p0n > 0 è sempre definito negativo. Ma si può dire di più: dato che −(pn , pm ) > Mn Mm si ha di fatto la diseguaglianza più forte ∑ M> Mn Questo mostra che l’energia interna (cinetica, ad esempio) del sistema contribuisce alla massa invariante, un aspetto della famosa equivalenza massa-energia. Le formule di ′ trasformazione (2.2), (2.3) mostrano che il sistema di riferimento nel quale P = 0 è fisicamente realizzabile se P 2 < 0. Infatti, dalle formule scritte si ricava (ripristinando c) V= cP E e dunque |V| < c se E > c|P|. Tale riferimento si chiama il sistema del centro di massa, e lo indichiamo con F0 . Dalle formule di trasformazione si ricava allora la quantità di moto totale nel laboratorio F E0 /c2 V P= √ 1 − V 2 /c2 (3.1) dove E0 è l’energia totale in F0 . Da qui si vede che la massa invariante del sistema è uguale a E0 /c2 . In ogni riferimento F si può definire un punto detto centroide ∑ n En Xn XC = ∑ n En 58 che è la generalizzazione relativistica del centro di massa. Si trova facilmente c2 P dXC = dt E Questo mostra che tutti i punti XC sono in quiete in F0 , ma non coincidono in generale con XC0 . Infatti il centro di massa definito sopra dipende da F . 4.4 Equazioni del moto Abbiamo notato sopra che la forza relativistica si riduce alla forza Newtonian a nel sistema di quiete istantaneo della particella. Per trovare la forza nel sistema del laboratorio F , usiamo il fatto che f a è un quadrivettore; allora f = fN + (γ − 1) fN · v v, v2 f 0 = γfN · v (4.1) Essendo f a ua = 0, si ha anche f 0 = f · v. Vediamo che la definizione (1.1) fornisce un sistema di quattro equazioni differenziali che possono essere usate per determinare il moto della particella (se la forza Newtoniana fN è nota) dp = γ −1 f ≡ F, dt m dγ =F·v dt (4.2) f si chiama la forza di Minkowski, mentre F è semplicemente la forza. Infatti, solo con questa definizione la forza è la derivata di una quantità di moto, che si conserva per sistemi chiusi. Dalla (4.2) si deduce facilmente (ripristinando c) mγ dv F·v =F− 2 v dt c (4.3) Si vede da qui che l’accelerazione non è proporzionale alla forza, un fatto che complica la descrizione delle traiettorie relativistiche. Se fN è dovuta alla presenza di un campo di forza, cioè se fN è una funzione del punto, è evidente che la forza va calcolata nel punto occupato dalla particella; la formula di trasformazione dei tensori (vedi Eq. (3.6)) mostra allora che gli argomenti di f e f 0 sono le coordinate xa della particella in moto. Ad esempio, ′ ′ ′ per una carica in un campo elettromagnetico si ha fN = eE (t , x ), quest’ultimo essendo ′ il campo elettrico nel sistema di quiete della particella all’istante t , con la particella nel ′ punto x ; allora ′ ′ ′ E (t , x ) · v dp ′ ′ ′ = eE (t , x ) + e(γ − 1) v γ dt v2 Come vedremo, dalla formula di trasformazione dei campi elettromagnetici (v. la (3.4)) si ha ′ ′ ′ ( ) E (t , x ) · v v ′ ′ ′ E (t , x ) + (γ − 1) v = γ E(t, x) + × B(t, x) v2 c 59 ′ ′ dove (t, x) e (t , x ) sono connessi dalle formule di trasformazione (2.26) e (2.27). Si ha quindi l’equazione del moto relativistica ( ) mv v d √ = eE(t, x) + e × B(t, x) (4.4) 2 2 dt c 1 − v /c in cui la forza di Lorentz viene ricavata dalla forza puramente elettrica come conseguenza necessaria della simmetria di Lorentz. Per riassumere, l’equazione del moto di una particella relativistica è la (4.3), o la (4.2) o anche la (1.1), dove il vettore f a si calcola in funzione della forza Newtoniana usando la formula di trasformazione dei quadrivettori (4.1). 4.5 Moto uniformemente accelerato, o iperbolico Supponiamo che la forza Newtoniana fN abbia sempre la direzione della velocità e sia costante, fN = mg; ciò equivale a dire che in ogni sistema in cui la particella è istantaneamente in quiete, l’accelerazione è costante e diretta come la velocità. Orientando quest’ultima lungo l’asse x, dalla (4.1) si ottiene la quadriforza per questo caso f a = (mgγv, mgγ, 0, 0) = mg(u1 , u0 , 0, 0) = m(du0 /dτ, du1 /dτ, 0, 0) (5.1) Dall’eq. (4.2) si ottiene dγv =g dt o, ripristinando c e scegliendo il dato iniziale v(0) = 0, v=√ gt 1 + g 2 t2 /c2 Si noti v → c per t → ∞; nemmeno una forza che agisce per un tempo infinito riesce a spingere la particella oltre la velocità limite. Integrando si ottiene (scegliendo x(0) = 0) (√ ) x(t) = c2 g −1 1 + g 2 t2 /c2 − 1 Osserviamo che (x + c2 /g)2 − c2 t2 = c4 g −2 la quale mostra che la linea di universo della particella è un ramo di iperbole. Dalla Fig. [5] si vede che la traiettoria è sempre esterna al cono luce passante per il punto (0, −c2 /g) (scelto come origine nella figura) Gli eventi al di là del piano x0 − c2 x/g = 0 non possono influenzare la particella, quelli al di là del piano x0 + c2 x/g = 0 non possono esserne influenzati. 60 Figura 4.1: Moto iperbolico t x Cerchiamo la curva parametrizzata dal tempo proprio; dalla (5.1) si ha du0 = u1 , dτ du1 = u0 dτ e dunque, con i dati iniziali usati sopra, u0 = cosh gτ , u1 = sinh gτ ; da qui seguono le formule (ripristinando c) x0 = c2 g −1 sinh(gτ /c) (5.2) x1 = c2 g −1 (cosh(gτ /c) − 1) (5.3) La (5.2) mostra drammaticamente gli effetti relativistici sul tempo. Il tempo a bordo di un veicolo spaziale uniformemente accelerato varia logaritmicamente con il tempo T⊕ di un osservatore terrestre. Infatti, se gT⊕ /c ≫ 1, dalla (5.2) si ottiene1 τ ≃ cg −1 ln (2gT⊕ /c) Ad esempio, un viaggio di 100 anni terrestri con g = 9, 81 m · sec−2 (l’accelerazione di gravità terrestre, per rendere confortevole il viaggio) si compie in soli 5, 3 anni secondo l’equipaggio della nave spaziale, e la distanza percorsa sarebbe di circa 96 anni luce. 4.6 Il razzo relativistico Come semplice modello di un razzo relativistico prendiamo un punto materiale che accelera non perché soggetto all’azione di una forza, ma perché emette parte della sua 1 Si ricordi che sinh−1 (x) = ln(x + √ x2 + 1). 61 massa propria, il propellente, in direzione opposta al moto, secondo il principio dei motori a reazione. Le equazioni del moto relativistiche si possono dedurre dal principio di conservazione del quadri-impulso. Il “rate of change” del quadri-impulso sia proporzionale al “rate of change” della massa propria e alla velocità di emissione del propellente, cioè (con un piccolo cavillo che discuteremo fra un momento) dP a dm a =f U dτ dτ (6.1) dove U a è la quadri-velocità del propellente ed f la “costante” di proporzionalità da determinare. Se V a indica la quadri-velocità del razzo si ha Ṗ a = ṁV a + mV̇ a (6.2) e naturalmente Va V̇ a = 0; pertanto Ṗ a Va = −ṁc2 (6.3) e dalla consistenza di questa relazione con la (6.1) otteniamo f = c2 (−U · V )−1 (6.4) In definitiva, le equazioni del moto del razzo relativistico assumono la forma Ua Ṗ = −ṁc U ·V a 2 (6.5) o anche ) c2 ṁ ( a mV̇ = − δ b + c−2 V a Vb U b U ·V a (6.6) Interpretazione fisica – L’invariante U · V ha un semplice significato: detta urel la velocità relativa del propellente al razzo, si ha −c−2 U · V = √ 1 dτ = dτp 1 − u2rel /c2 (6.7) dove gli elementi di tempo proprio si riferiscono rispettivamente al razzo (dτ ) e al propellente (dτp ). D’altronde nello scrivere la (6.1) è sottinteso che U b sia la derivata rispetto a τp mentre le altre sono derivate rispetto a τ (era questo il piccolo cavillo). Dunque il fattore c2 /(−U · V ) tiene conto del fatto che il propellente, muovendosi relativamente al razzo, ha un diverso tempo proprio. In altri termini, corregge l’equazione del moto tenendo conto della dilatazione relativistica del tempo esistente fra il propellente e il razzo. Potremmo dunque togliere il fattore U · V dall’equazione a patto di considerare U b come la derivata rispetto a τ anziché a τp , da calcolarsi comunque usando la (6.7). In pratica si risolve l’equazione del moto assumendo che urel sia una costante caratteristica del sistema. 62 Esempio: Supponiamo che il moto sia lineare e prendiamo la componente temporale della (6.6); si trova facilmente (c = 1 per semplicità) √ ( ) mγ˙v = ṁ 1 − u2rel γu − γv (1 − u2rel )−1/2 dove γv e γu sono i soliti fattori relativistici di razzo e propellente, rispettivamente, con le velocità indicate per distinguerli, e il punto denota la derivata nel tempo proprio. Ma dalla trasformazione di Lorentz al sistema di quiete si ha ′ ′ γu = γv (γu + vUx ) = γv (1 − u2rel )−1/2 (1 − vurel ) perché ovviamente 1 ′ , γu = √ 1 − u2rel ′ ′ Ux = −γu urel Sostituendo nella prima equazione si trova infine mγ˙v = −ṁγv vurel oppure, notando che γ˙v = γv3 v v̇, v̇ ṁ = − urel 2 1−v m Assumendo urel costante (fissata dal progettista del motore) l’integrazione è elementare e porta al risultato ( )c/2urel m(τ ) c−v = m0 c+v A questo semplice livello non è possibile dire molto di più: o si fissa una funzione m(τ ), proprietà del sistema di propulsione, e si ricava v(τ ), oppure si richiede una traiettoria e si progetta m(τ ). Per esempio, si potrebbe chiedere per quale m(τ ) si può ottenere un moto uniformemente accelerato con accelerazione propria g, usando come propellente la radiazione (urel = c). In tal caso v(τ ) = c tanh(gτ /c) e quindi m(τ ) = m0 √ 1 − tanh(gτ /c) 1 + tanh(gτ /c) Per raggiungere Vega (a 26 anni luce) con la g terrestre ci vogliono circa 6, 66 anni di tempo proprio2 , per cui secondo la formula la massa iniziale dell’astronave (m0 ) dovrebbe essere circa 782 volte la massa del veicolo all’arrivo (m(τ = 6, 66 anni)), ovvero contenere una quantità di propellente di gran lunga superiore alla massa del veicolo (il che impone la necessità di acquisire il propellente strada facendo, come per le automobili). 2 3, 33 anni di accelerazione più altrettanti di decelerazione. 63 E = mc2 4.7 Abbiamo già notato che la massa invariante di un sistema arbitrario è uguale a E0 /c2 (l’energia nel sistema di quiete F0 ), se valgono le trasformazioni di Lorentz. Ma possiamo andare oltre. Consideriamo un sistema fisico arbitrario coinvolto in un processo di emissione di due particelle identiche in direzioni opposte. Non si pensi alle particelle come a punti materiali, bensı́ come a sistemi composti, quali due particelle alfa, o due nuclei più complessi oppure due impulsi di onde elettromagnetiche. Consideriamo il processo nel riferimento del centro di massa F0 , dove P = 0. In tale riferimento il sistema rimane fermo se vale la legge di conservazione del momento, mentre la conservazione dell’energia richiede ′ ′ E0 − E1 = 2ϵ ′ ′ E0 ed E1 sono le energie prima e dopo il processo di emissione e 2ϵ è l’energia dei due frammenti. In un laboratorio rispetto al quale il sistema si muove con velocità V lungo l’asse x, l’energia dei frammenti è ε1 = γ(ε − V p cos α) ε1 = γ(ε + V p cos α) e dalla conservazione dell’energia 2ε E0 − E1 = ε1 + ε2 = √ 1 − V 2 /c2 o anche ( ′ ′ (E0 − E0 ) − (E1 − E1 ) = 2ε √ ) 1 1 − V 2 /c2 −1 (7.1) Il primo termine è la differenza fra l’energia del sistema quando la sua velocità è V e ′ l’energia quando è in quiete, e dunque per basse velocità E0 − E0 = M0 V 2 /2, dove M0 ′ è la massa iniziale. Analogamente, se M1 è la massa finale si ha E1 − E1 = M1 V 2 /2, e quindi la (7.1) diventa, al primo ordine in V 2 /c2 , ∆M = M0 − M1 = 2ε c2 (7.2) Si vede da qui l’equivalenza tra massa ed energia: in seguito all’emissione il sistema perde massa (e dunque inerzia) nella quantità indicata. Si può anche osservare che nel riferimento del laboratorio il sistema perde la quantità di moto 2ε/c2 V ∆P = √ 1 − V 2 /c2 come si ricava dalle formule di trasformazione (2.2). Siccome la velocità del sistema non cambia nel processo di emissione, questo è possibile solo se si ha una perdita di 64 massa inerziale pari a 2ε/c2 . Un caso ancora più generale è stato considerato da Lorentz (1911). Scriviamo il quadrimpulso di un sistema chiuso arbitrario Σ1 (che può consistere di particelle, molle in tensione, raggi di luce, etc...) nella forma P= √ m0 u 1− u2 /c2 = mu, P0 = √ m0 c 1 − u2 /c2 = mc dove u è la velocità del sistema di riferimento del centro di massa F0 ; considerando per semplicità una trasformazione di Lorentz lungo l’asse x, si ha (β = v/c) Px − mv ′ , Px = √ 1 − β2 ′ Py = Py , ′ Pz = P z Ora il sistema interagisca con un altro sistema Σ2 . Le leggi di conservazione danno ∆P1 + ∆P2 = 0, ′ ′ ∆P1 + ∆P2 = 0, ∆E1 + ∆E2 = 0 Quindi (γ = (1 − β 2 )−1/2 ) ′ ′ ∆P1x + ∆P2x = γ(∆P1x + ∆P2x − v∆m − v∆E2 /c2 ) = γv(∆E1 /c2 − ∆m) = 0 da cui ∆m = c−2 ∆E1 . In entrambi i casi possiamo concludere che se l’energia e la quantità di moto sono le componenti di un quadri-vettore P a che si conserva per tutti i processi fisici nei sistemi isolati, allora ad ogni trasferimento di energia ∆E, corrisponde un trasferimento di massa ∆m = ∆E/c2 . In generale l’interazione cambia sia la massa che la velocità del sistema, √ per cui con ∆m si deve intendere la variazione della massa relativistica: m = m0 / 1 − u2 /c2 . La relazione massa/energia è osservata soprattutto nelle reazioni nucleari. Ad esempio nel processo 3 7 Li + H → 24 He +24 He dalla conservazione dell’energia si ha (MLi + MH − 2MHe )c2 = 2KHe − KH Il difetto di massa nel primo membro è misurato e vale circa 17, 31 Mev, mentre le misure della variazione di energia cinetica nel secondo membro danno 17, 28 Mev. La notazione KX denota l’energia cinetica della specie X KX = √ M X c2 1− v 2 /c2 − M X c2 La trasformazione di massa in energia nelle reazioni nucleari è la principale fonte di energia nelle stelle. Nota: dal punto di vista di un fisico moderno non è forse molto sorprendente questa equivalenza di massa ed energia, almeno se si parla di energia elettromagnetica. La radiazione è infatti composta da uno streaming continuo di fotoni, particelle elementari 65 del tutto simili a molte altre particelle note, ma con l’eccezione di avere massa propria pari a zero, m = 0 (anche la carica elettrica è zero, ma questa è un’altra storia). Per il resto collidono, si propagano, possiedono momento (nel senso relativistico del termine) che può essere trasferito, possono essere emessi e assorbiti, e cosı̀ via. Dunque non sono considerati fondamentalmente diversi da altre particelle subatomiche. Altre forme di energia, come il calore, sono anch’esse associate al moto disordinato di grandi numeri di particelle microscopiche, che possono collidere e trasferire momento ed energia. Ma nel 1905, ai temi di Einstein, energia e materia erano veramente considerate “sostanze” diverse del mondo. La scoperta che l’energia trasferisce inerzia è dunque da considerarsi come un risultato profondo e fondamentale della teoria di Einstein, senza il quale nemmeno la sua teoria relativistica della gravitazione sarebbe stata possibile. 4.8 Collisioni La legge di conservazione del momento relativistico ha importanti applicazioni alla teoria delle collisioni di particelle altamente energetiche. Il soggetto diventa rapidamente complicato all’aumentare del numero di particelle coinvolte, ma per collisioni di due particelle o per il decadimento di una singola particella la trattazione matematica è fondamentalmente semplice e tuttavia molto significativa. 4.8.1 L’effetto Compton Figura 4.2: Effetto Compton χ’ χ θ Questo riguarda la collisione di un fotone, particella di massa propria uguale a zero, con un elettrone o un positrone. Il fotone (linea tratteggiata) e l’elettrone convergono verso il centro di collisione ad angolo χ e sono diffusi in altre direzioni. Sono riportati gli angoli ′ di diffusione del fotone (θ e χ ) rispettivamente rispetto al fotone o all’elettrone incidenti. 66 Indichiamo con P µ e k µ i momenti relativistici della carica e del fotone, rispettivamente. Alla collisione elastica e± + γ → e± + γ corrisponde la legge di conservazione P µ + kµ = P ′µ ′ +kµ (8.1) Se l’elettrone finale non si osserva, conviene scrivere ′ P µ + kµ − k µ = P ′µ e prendere la norma di entrambi i membri, ricordando che P 2 = P allora ′ ′2 ′ = −m2 e k 2 = k 2 = 0; ′ −m2 + 2P · (k − k ) − 2k · k = −m2 Si ha però ′ ′ k · k = −h2 νν (1 − cos θ), −P · k = hν(E − P cos χ), ′ ′ ′ −P · k = hν (E − P cos χ ) ′ dove θ, χ, χ sono rispettivamente l’angolo di diffusione del fotone rispetto al fotone incidente, l’angolo di incidenza tra il fotone e l’elettrone iniziali e l’angolo di diffusione del fotone rispetto all’elettrone diffuso (vedi figura), E l’energia dell’elettrone e P la sua quantità di moto. Si trova in definitiva ′ ′ ′ ′ Eh(ν − ν) = P (ν cos χ − ν cos χ) − 2h2 ν ν sin2 θ/2 ′ Distinguiamo i due casi (A): χ = 0, nel qual caso χ = θ, e (B): χ = π (collisione frontale) nel qual caso χ = π − θ. Nel caso (A), introducendo la lunghezza d’onda λ = c/ν e ′ ∆λ = λ − λ (si noti che abbiamo reintrodotto c), con un semplice conto si trova la formula ∆λ = 2λ (k + P )c sin2 θ/2 E − Pc (8.2) dove k = h/λ è il momento del fotone. Nel caso (B) (detto anche della “diffusione Compton inversa”) ∆λ = 2λ (k − P )c sin2 θ/2 E + Pc (8.3) Per P → 0 entrambe le formule si riducono alla classica formula di Compton ∆λ = h (1 − cos θ) mc (8.4) Se si ignora il momento del fotone (nel limite classico h → 0) si ha, per esempio ∆λ = 2λ Pc sin2 θ/2 E − Pc (8.5) che coincide con la formula classica per la diffusione elastica da una carica in moto. La formula esprime semplicemente il fatto che nel sistema a riposo della carica la radiazione 67 è diffusa con la stessa frequenza della radiazione incidente, per cui lo spostamento ∆λ è interamente dovuto all’effetto Doppler della carica in moto. ′ E: Mostrare che la frequenza ν della radiazione di una carica in moto è legata alla frequenza ν della radiazione incidente dalla formula ) ( ) ( V V ′ ′ ν 1 − cos χ = ν 1 − cos χ c c dove V è la velocità della carica. Usando ora V = P/E e λ = c/ν, si vede subito che questa formula diventa esattamente la (8.5) per il caso χ = 0. Se χ = π si ottiene il limite classico del caso (B).C.V.D. Le formule (8.2), (8.3) e (8.4) sono in ottimo accordo con i risultati sperimentali. Esse confermano simultaneamente la relatività, la meccanica quantistica e la natura corpuscolare della radiazione elettromagnetica (si ricordi che l’ipotesi dei fotoni è dovuta ad Einstein). 4.8.2 Energia di soglia Certi tipi di collisioni possono avvenire solo se l’energia delle particelle incidenti supera una certa soglia. Si tratta di processi con produzione di nuove particelle, per i quali è dunque richiesta una soglia di energia minima. Un esempio è la produzione di mesoni neutri per urto di protoni p+p→p+p+π Sia M ≃ 938 Gev la massa a riposo del protone e mπ ≃ 135 Mev quella del mesone. Si assuma un protone inizialmente in quiete; si ha allora P µ + M δ0µ = PTµ + pµπ dove PT è il momento totale dei protoni nello stato finale. Da qui 2EM = −PT2 + m2π − 2PT · pπ − 2M 2 Per trovare il minimo di questa espressione (l’energia di soglia, appunto) calcoliamo i due invarianti nel sistema del centro di massa dei protoni, dove PT = 0. Si ottiene subito l’espressione (Ecm + mπ )2 − 2M 2 2M L’energia nel centro di massa non può essere inferiore a 2M , e questo minimo valore può essere raggiunto se i protoni sono entrambi fermi nel sistema del centro di massa. Questo significa che la configurazione finale che realizza l’energia minima si ha con i protoni che si muovono insieme con la stessa velocità, uguale a quella del centro di massa. Allora la soglia richiesta è E= Emin = (2M + mπ )2 − 2M 2 2M (8.6) 68 e corrisponde al fattore relativistico di rapidità γmin = 1 + 2mπ m2 + π2 M 2M Si noti che la conservazione dell’energia da sola non fornisce la soglia corretta. Infatti si avrebbe E = ET + Eπ − M > M + mπ che suggerisce la soglia Emin = M + mπ ; ma questa è raggiunta solo se le velocità di tutte le particelle partecipanti sono nulle, il che è impossibile in una collisione. Si può misurare l’efficienza del processo di produzione chiedendosi quale frazione dell’energia cinetica del protone incidente contribuisce alla massa del mesone. L’energia cinetica del protone è (γ − 1)M , per cui il rapporto η= mπ M (γmin − 1) = 1 2(1 + mπ /4M ) Con i valori citati delle masse l’efficienza è circa del 48%. Un altro esempio è la produzione del mesone J/Ψ(3096) e− + e+ → J/ψ → hadrons che è rivelato come risonanza nel canale e+ + e− in adroni. Assumendo e+ in quiete (non come nell’esperimento!) si ha µ pµ + mδ0µ = PJ/ψ e da qui Emin M 2 − 2m2 = 2m Con la massa della particella J/Ψ pari a 3096 Mev e m = 0, 5 Mev, l’efficienza è quasi zero η= M m(γmin − 1) ≃ 2m 1 ≃ M 3100 e l’energia cinetica richiesta avrebbe il valore (astronomico per i tempi della scoperta, novembre 1976) di 9 × 103 Gev. Se invece i fasci di e± collidono frontalmente (come nell’esperimento reale) si ha più semplicemente 2E = 2mγ = EJ/ψ ≥ M per cui 1 Emin = M ∼ 1548 Mev 2 69 E: Mostrare che l’annichilazione di un fotone in una coppia elettrone positrone è impossibile. Si mostri che in presenza di un nucleone N la reazione γ + N → N + e+ + e− diventa possibile. Si mostri che l’energia di soglia del fotone è ( m) 2 hν = 2mc 1 + M Con M = 938 Mev e m = 0, 5 Mev si verifichi che l’efficienza alla soglia è praticamente del 100%. 4.8.3 Decadimento Una classe importante di problemi riguarda la disintegrazione di una particella in due o più frammenti. Nel caso di due frammenti il problema è interamente determinato. Sia la particella instabile inizialmente in quiete. La conservazione dell’impulso relativistico dà M = E1 + E2 , P1 + P2 = 0 Allora (M − E1 )2 − |P2 |2 = m22 oppure E1 = M 2 − m22 + m21 2M Analogamente E2 = M 2 − m21 + m22 2M Il problema inverso è la fusione di due particelle in una di massa M . L’energia richiesta, nel caso che una delle due sia inizialmente in quiete, si calcola dalla conservazione dell’impulso nella forma pµ1 + m2 δ0µ = P µ eguagliando la norma dei due membri. Dunque m21 + m22 + 2m2 E1 = M 2 da cui segue facilmente E1 . Nel caso del decadimento di una particella in volo si può scrivere, per esempio, pµ2 = P µ − pµ1 70 Da qui la relazione m22 2 =M + m21 √ − 2EE1 + 2P E12 − m21 cos θ (8.7) o anche (2EE1 − 2M E01 )2 = 4P 2 cos2 θ(E12 − m21 ) e infine usando V = P/E √ 2 (1 − V 2 cos2 θ)E12 − 2E01 1 − V 2 E1 + E01 (1 − V 2 ) + m21 V 2 cos2 θ = 0 (8.8) Le due radici per un valore dato di θ corrispondono al caso v0 < V , dove v0 è la velocità della particella 1 nel sistema c.m. (centro di massa) e V quella della particella instabile. Se invece v0 > V la radice è unica mentre nel caso degenere corrispondente a v0 = V si ha una radice doppia. La spiegazione grafica dell’esistenza di due radici è la seguente. Dalle formule di trasformazione si ha l’impulso della prima particella (per la seconda le formule sono analoghe) in funzione delle grandezze riferite al sistema c.m. px = γ(p0 cos α + V E0 ), py = p0y = p0 sin α da cui si ottiene l’equazione di un’ellisse (px − γV E0 )2 p2y + 2 =1 γ 2 p20 p0 Se il semiasse maggiore, a = γp0 , è minore della distanza del centro dell’ellisse dall’origine, distanza che è γV E0 , ossia se v0 < V , allora per un dato θ il vettore (px , py ) interseca l’ellisse i due punti, che corrispondono appunto ai due valori possibili dell’energia. In questo caso esiste anche un valore massimo per θ (quando il vettore (px , py ) è tangente all’ellisse) che si trova facilmente annullando il discriminante dell’equazione (8.8) √ p0 1 − V 2 sin θmax = m1 V 4.9 Moto dello spin e precessione di Thomas Consideriamo una particella dotata di momento angolare intrinseco, descritto nel sistema di quiete (momentaneo) della particella dal vettore J0 ; si può pensare a J0 come al valore medio dell’operatore del momento angolare nel sistema a riposo, oppure come al momento angolare orbitale di una trottola nel limite in cui il suo momento di inerzia tende a zero e la velocità angolare tende all’infinito, restando costante il loro prodotto. In entrambi i casi, ci riferiremo al vettore J0 semplicemente come allo “spin” della particella. Si noti che le conclusioni della relatività sul moto dello spin sono comunque indipendenti dal modello preciso che governa i suoi “gradi di libertà interni”. 71 Se nel sistema di quiete F0 il momento torcente si annulla, il vettore J0 non precede (rispetto a F0 ) dJ0 =0 dt′ (9.1) La descrizione relativistica dello spin introduce il quadri-vettore J a che in F0 si riduce a J0a = (0, J0 ); dunque si ha sempre J 2 > 0 e Ja ua = 0, dove ua = (γ, γv) è la quadri-velocità della particella. Qual’è ora l’equazione relativistica (cioè invariante di Lorentz) che descrive il moto dello ′ spin? Osservando che in F0 si ha dt = dτ , si potrebbe pensare che la corretta equazione relativistica sia l’equazione invariante dJ a /dτ = 0. Tuttavia si vede facilmente che non può essere cosı̀: la condizione di ortogonalità J a ua = 0 implicherebbe infatti la nuova condizione u̇b J b = 0, u̇b = dub /dτ , che in generale non è vera. Scriviamo allora l’equazione più generale che si riduce alla (9.1) nel sistema di quiete dJ a = ηua dτ (9.2) Contraendo con ua e usando l’ortogonalità J a ua = 0 si trova η = ab J b (9.3) Le formule (9.2) e (9.3) risolvono il problema posto. Si noti che si può anche scrivere la (9.2) nella forma dJ a = Ωab J b , dτ Ωab = ua u̇b − ub u̇a (9.4) La legge di trasporto di un vettore secondo questa equazione è detta trasporto di FermiWalker. Dalle trasformazioni di Lorentz si deducono le formule J = J0 + (γ − 1) (J0 · v) v, v2 J 0 = J · v = γ (J0 · v) (9.5) precessione dello spin La (9.5) mostra che la parte spaziale di J a non rappresenta lo spin della particella “visto” nel sistema del laboratorio, che è invece descritto dal vettore J0 . Dall’equazione del moto si ha ) ( dJ0 d (γ − 1) (γ − 1) dJ = + (J0 · v) v + (J0 · v)v̇ = ab J b v 2 dt dt dt v v2 Si vede facilmente che ab J b = −a0 J 0 + a · J = γ 2 v̇ · J, se si usano le formule esplicite per la quadri-accelerazione a=γ dγv = γ 4 (v · v̇)v + γ 2 v̇, dt a0 = γ 4 (v · v̇) 72 Inoltre J0 · v = γ −1 J · v = γ −1 J 0 e dJ 0 = ab J b = γ 2 v̇ · J dt Possiamo quindi scrivere ( ( )) dJ0 d (γ − 1) 0 (γ − 1) 2 = γ (v̇ · J) − J v− (J0 · v)v̇ 2 dt dt γv v2 Un calcoletto un pò lungo ma elementare porta al risultato semplice ( ) d (γ − 1) 0 γ−1 2 γ (v̇ · J) − J = (J0 · v̇) dt γv2 v2 Questo si ottiene usando: (a) la formula di trasformazione di J per eliminare J in favore di J0 , (b) l’equazione del moto per J 0 e (c) la relazione dγ = γ 3 v · v̇ dt In definitiva si ottiene l’equazione per la precessione dello spin dJ0 (γ − 1) = ((J0 · v̇)v − (J0 · v)v̇) = Ω ∧ J0 dt v2 dove la velocità angolare di precessione è Ω=− 4.10 (γ − 1) v ∧ v̇ v2 (9.6) (9.7) Principio variazionale Il moto della particella libera può essere ricavato da un principio variazionale cha ha un suo interesse particolare. Infatti l’azione di un sistema libero è il punto di partenza per l’introduzione delle interazioni. Si consideri la seguente azione per una particella di massa m ∫ ∫ f√ I = −m dτ = −m −dxa dxa (10.1) γ(i,f ) i dove γ(a, b) è una curva differenziabile timelike che unisce gli eventi i ed f . Si noti che l’azione è invariante di Lorentz. Variando le coordinate degli eventi si ottiene, al primo ordine in δxa , la formula ∫ f √ ∫ f ∫ f dxa dpa a a a f 2 δI = −m δ −dx = m dδx = pa δx |i − δx (10.2) dτ dτ i i i dove pa = mua = mẋa è il quadri-impulso della particella. Se le variazioni sono nulle negli estremi della curva, allora la condizione estremale δI = 0 equivale all’equazione del moto 73 ṗa = 0. Le soluzioni si chiamano curve estremali dell’azione. Considerando l’azione sull’estremale come una funzione delle coordinate del punto terminale dell’estremale, dalla formula appena scritta si ottiene P a = ∂a I (10.3) La “mass-shell condition”, p2 + m2 = 0, si traduce allora nella versione relativistica dell’equazione di Hamilton-Jacobi ∂a I∂ a I + m2 = 0 (10.4) Per un sistema di particelle libere scriveremo ∑ In I= n Lagrangiana Usando il tempo t di un sistema di riferimento inerziale l’azione può scriversi nella forma ∫ t2 √ I = −m 1 − v 2 dt (10.5) t1 Di qui leggiamo la lagrangiana √ 1 L = −m 1 − v 2 = −m + mv 2 + · · · 2 (10.6) Vediamo che per basse velocità dà la corretta lagrangiana non relativistica. L’esistenza della lagrangiana permette di riconfermare le espressioni ottenute per il momento lineare e l’energia. Infatti p= ∂L mv =√ , ∂v 1 − v2 m E =p·v−L= √ 1 − v2 (10.7) come volevasi dimostrare. Simmetrie L’equazione (10.2) si presta ad una importante applicazione. Consideriamo una o più trasformazioni infinitesime delle variabili dinamiche xa → x̄a = xa + δϵ xa con la proprietà di non cambiare l’azione I[x] = I[x̄] = I[x + δϵ x] (10.8) 74 Se questo è il caso diremo che abbiamo a che fare con trasformazioni di simmetria. Allora δϵ I = 0 anche indipendentemente dalla validità dalle equazioni del moto, e usando la (10.2) si avrà l’identità ∫ f dpa a f δϵ I = pa δϵ x |i − δϵ xa = 0 (10.9) dτ i L’azione possiede certamente le simmetrie di Lorentz e di traslazione spazio-temporale, ma possiede anche simmetrie meno evidenti e più complicate, come ad esempio la simmetria di invarianza per riparametrizzazione della traiettoria. Ora se le equazioni del moto sono soddisfatte, la (10.9) si riduce alla pa δϵ xa |i = pa δϵ xa |f (10.10) che è una legge di conservazione: l’equazione stipula che le grandezze pa δϵ xa sono le stesse per ogni coppia di eventi sulla linea di universo della particella. Facciamo due esempi. Se δϵ xa = ϵa allora si ha una simmetria di traslazione e la grandezza che si conserva è la componente di pa lungo ϵb , cioè pa ϵa . Dato che ϵ è arbitrario ciò equivale a dire che si conserva il quadri-impulso, come segue per altro direttamente dalle equazioni del moto. Se invece δϵ xa = ϵab xb , ϵab + ϵba = 0 E 25 Si dimostri che questa variazione rappresenta una trasformazione di Lorentz infinitesima. Si dimostri che I è invariante, cioè che vale la (10.8). La legge di conservazione dice allora che si conservano le grandezze Lab = xa pb − xb pa 4.11 (10.11) Momento angolare 75 Capitolo 5 Elettrodinamica covariante È ben noto che i campi elettromagnetici obbediscono alle equazioni di Maxwell. La prima coppia di queste equazioni rot E = − 1 ∂B , c ∂t 1a coppia div B = 0 (0.1) è equivalente al fatto che i campi derivano dai potenziali A e ϕ, secondo le formule standard E = −∇ϕ − 1 ∂A , c ∂t B = rot A (0.2) La seconda coppia introduce l’interazione con le sorgenti dei campi, che sono le cariche elettriche e le correnti, rot B = 1 ∂E 4π + J, c ∂t c div E = 4πρ 2a coppia (0.3) ρ è la densità di carica, J la densità di corrente, e sono entrambe vincolate dall’equazione di continuità ∂ρ + div J = 0 ∂t 5.1 (0.4) Forma covariante delle equazioni Per studiare la covarianza di queste equazioni rispetto al gruppo di Lorentz, introduciamo il potenziale Aa = (−ϕ, A), Aa = (ϕ, A) e il campo antisimmetrico Fab = ∂a Ab − ∂b Aa (1.1) 76 Allora il confronto con la (0.2) dà le componenti Fj0 = Ej , Fij = eijk Bk o in forma più esplicita 0 −Ex −Ey −Ez Ex 0 Bz −By Fab = Ey −Bz 0 Bx Ez By −Bx 0 (1.2) Da questo si verifica direttamente che le quattro equazioni ∂a Fbc + ∂b Fca + ∂c Fab = 0 (1.3) sono esattamente identiche alla 1a coppia delle equazioni di Maxwell, e dunque che la covarianza di queste equazioni è equivalente al fatto che Fab sia un tensore di universo covariante (cioè un tensore nello spazio di Minkowski). Per riscrivere la seconda coppia introduciamo formalmente la corrente quadri-dimensionale di componenti J a = (cρ, J) (1.4) L’equazione di continuità (0.4) assume la forma covariante ∂a J a = 0 (1.5) e tale veramente sarà se J a è un quadri-vettore. Come vedremo, questo segue dall’invarianza di Lorentz della carica elettrica. L’Eq. (0.4) prende il nome di condizione di conservazione della corrente. Si verifica direttamente dalla (1.2) che le quattro equazioni 4π b J , F ab = η ac η bd Fcd (1.6) c sono esattamente identiche alla 2a coppia delle equazioni di Maxwell. Ad esempio, se b = 0 si ha ∂k F k0 = −4πρ, perché F 00 = 0 e J 0 = cρ. Ma F k0 = −Ek , da cui si ottiene appunto l’equazione div E = 4πρ. Si noti che che la covarianza delle (1.6) richiede che J a sia un quadri-vettore. Mostriamo che questo fatto segue dall’invarianza di Lorentz della carica elettrica. ∂a F ab = − 5.2 Corrente elettrica Consideriamo una carica puntiforme di valore e, e sia z a (p) la sua linea di universo parametrizzata da p. Se la carica è invariante per trasformazioni di Lorentz allora l’integrale esteso alla linea di universo ∫ a J (x) = e δ (4) (x − z(p))dz a (2.1) 77 definisce un campo di quadri-vettori che chiameremo la quadri-corrente elettrica. Si noti che l’integrale non dipende dalla scelta del parametro p. Possiamo allora scegliere p = z 0 , cosı̀ che z 0 (p) = z 0 e l’integrale diventa J a (x0 , x) = e δ (3) (x − z(x0 )) v a , va = dz a dx0 (2.2) La definizione di J a come corrente elettrica è giustificata dalle seguenti proprietà • vale l’equazione di continuità ∂a J a = 0 (2.3) • J 0 rappresenta la densità di carica elettrica. Infatti ∫ J 0 dx = e (2.4) come segue immediatamente dalla (2.2). L’invarianza di Lorentz della carica è resa necessaria dal principio di relatività, perché la carica elettrica è la sorgente dei campi elettromagnetici e, dunque, misure dei campi potrebbero rivelare la velocità del sistema di riferimento. Più concretamente, una dipendenza della carica dell’elettrone dalla velocità è sicuramente inamissibile perché altrimenti non sarebbe possibile avere atomi elettricamente neutri. Inoltre gli spettri atomici sono indipendenti dalla velocità degli elettroni negli atomi e dipendono dalla velocità di questi ultimi solo attraverso l’effetto Doppler. Il carattere vettoriale della corrente implica subito il carattere tensoriale di F ab , e con esso la covarianza delle equazioni di Maxwell (1.3) e (1.6). Dato che la carica è additiva, la corrente di un sistema di particelle sarà ∑ ∫ a J (x) = en δ (4) (x − zn (p)) dzna (2.5) n oppure J a (x0 , x) = ∑ en δ (3) (x − zn (x0 )) vna (2.6) n La conservazione della corrente espressa dall’equazione ∂a J a = 0 ha una conseguenza molto importante che ritroveremo anche nel caso di correnti conservate più generali di J a . Si consideri la regione di spazio-tempo Ω racchiusa tra i due iperpiani x0 = ct1 e x0 = ct2 > ct1 . Allora ∫ ∫ ∫ ∫ ∫ a 4 0 3 0 3 0 0= ∂a J d x = J d x− d3 x div J (2.7) J d x + dx Ω x0 =ct2 x0 =ct1 78 Se J tende a zero all’infinito in maniera sufficientemente rapida l’ultimo integrale si annulla e si ha la legge di conservazione della carica elettrica ∫ dQ = 0, Q= J 0 (t, x)d3 x dt Σ dove Σ è l’iperpiano x0 = cte. Più in generale, ∫ Q = − J a Na (t, x)dV Σ dove Σ è l’iperpiano Na xa = cte e dV l’elemento di volume proprio sull’iperpiano, cioè, per chi conosce le forme differenziali, dV = N a eabcd dxb dxc dxd /6. ′ ′ Q è invariante di Lorentz: infatti, scegliendo l’iperpiano Σ definito da x 0 = cte, per la ′ conservazione della corrente Q non cambia e dV = d3 x . Ma allora ∫ ∫ ∫ ′a ′ ′ ′ ′ ′ ′ a Q=− J Na (t, x)dV = − J Na (t, x )dV = J 0 (t, x )d3 x = Q Σ′ Σ′ Σ′ ′ ′ perché la normale a Σ per l’osservatore in moto che usa le coordinate x a è precisamente ′ Na = (−1, 0, 0, 0). teorema di Gauss Possiamo scrivere la (2.7) nella forma di un teorema di Gauss in quattro dimensioni. A tale scopo indichiamo con ∂Ω il bordo orientato della regione Ω. Assumeremo che ∂Ω sia l’unione disgiunta di certe ipersuperfici, alcune delle quali sono spaziali (il vettore normale è di tipo tempo), altre temporali (il vettore normale è di tipo spazio), ma nessuna è nulla (il vettore normale è di tipo nullo). Sia na il vettore normale al bordo, orientato verso l’esterno di Ω sui tratti di ∂Ω che sono di tipo tempo, e verso l’interno sui tratti spaziali. Infine sia K Aa un tensore, dove A indica gli altri indici possibilmente presenti. Allora si ha ∫ ∫ Aa 4 ∂a K d x = K Aa na dV (2.8) Ω ∂Ω dove dV è l’elemento di volume sul bordo. La ricetta per dV è la seguente: scelte tre coordinate (y 1 , y 2 , y 3 ) sul bordo, la distanza che vi è indotta dalla metrica di Minkowski sarà ds2 = ηab dxa dxb = 3 ∑ hij (y)dy i dy j , hij (y) = ηab i,j=1 ∂xa ∂xb ∂y i ∂y j perché se xa (y j ) sono le coordinate inerziali di un punto sul bordo, si ha evidentemente a dx = 3 ∑ ∂xa j=1 ∂y j dy j 79 Se h = det(hij ), la formula per la misura è √ dV = h d3 y Si noti che dV , oltre a essere invariante per trasformazioni di Lorentz, lo è anche per ′ cambiamenti arbitrari di coordinate sul bordo, y i → y i (y). Si può interpretare dV come l’elemento di volume proprio, misurato in un sistema di coordinate ripetto al quale l’elemento è in quiete. La sua invarianza spiega l’invarianza di Lorentz della carica Q o, più in generale, del secondo membro della (2.8). invarianza di gauge La prescrizione Fab = ∂a Ab − ∂b Aa non determina i potenziali, perché la cosiddetta trasformazione di gauge ′ Aa (x) = Aa (x) + ∂a f (x) (2.9) lascia invariati i campi elettromagnetici, e dunque anche le equazioni di Maxwell. È questa la ben nota invarianza di gauge dell’elettrodinamica, che rende i potenziali non misurabili. Questa stessa simmetria impedisce anche che le equazioni per i potenziali non possano essere risolte univocamente. Tuttavia la seconda coppia diventa, sostituendovi la (1.1), 2Aa − ∂a ∂ b Ab = − 4π Ja c (2.10) Questo suggerisce di sfruttare l’invarianza di gauge per imporre la condizione di Lorenz (non Lorentz) ∂a A a = 0 (2.11) che ha il merito di semplificare grandemente le equazioni di campo e di essere invariante di Lorentz (non Lorenz). Si osservi che la trasformazione di gauge Aa → Aa + ∂a Ψ, dove 2Ψ = 0, preserva la condizione di Lorenz e la (2.10). 5.3 Trasformazione dei campi Consideriamo per prima una trasformazione di Lorentz speciale lungo x, con velocità v, e poniamo Λba = (Λ−1 )ab ; si ha γ γv 0 0 γv γ 0 0 (3.1) Λb a = 0 0 1 0 0 0 0 1 Dalla formula di trasformazione ′ ′ Fab (x ) = Λac Λbd Fcd (x) 80 si ricavano le formule ′ Ex = Ex , v ′ Ey = γ(Ey − Bz ), c v ′ Ez = γ(Ez + By ) c (3.2) v v ′ ′ By = γ(By + Ez ), Bz = γ(Bz − Ey ) (3.3) c c Si noti come il carattere elettrico o magnetico dei campi diventi un aspetto relativo. In forma vettoriale ( ) E·v 1 ′ E = (1 − γ) 2 v + γ E + v ∧ B (3.4) v c ′ Bx = Bx , ( ) B·v 1 B = (1 − γ) 2 v + γ B − v ∧ E v c ′ (3.5) Interessanti sono anche le regole di trasformazione delle correnti ′ ρ = γ(ρ − vJx /c2 ), ′ Jx = γ(Jx − vρ), ′ Jy = Jy , ′ Jz = Jz (3.6) Ad esempio, un filo percorso da corrente appare elettricamente carico a un osservatore in moto rispetto al filo. Ciò si accorda con il fatto che un tale osservatore osservebbe, secondo le (3.2), un campo elettrico direttamente proporzionale al campo magnetico del filo. Le formule (3.6) mostrano anche che la distinzione fra correnti di convezione (J = ρv) e correnti di conduzione dipende dal sistema di riferimento (ovvero è relativa). Per una semplice spiegazione microscopica della misteriosa apparizione di cariche nei conduttori in movimento si veda W. Pauli, Theory of Relativity, Dover Ed. (1958) oppure E. Purcell, Elettricità e magnetismo, Collana “La Fisica di Berkeley“, Zanichelli 1973. 5.4 Elettrodinamica fenomenologica Diamo qui un breve cenno alla formulazione relativistica delle più importanti equazioni costitutive dell’elettrodinamica macroscopica. Per un dielettrico omogeneo e isotropo queste sono D = εE, B = µH (4.1) mentre per i conduttori percorsi da corrente continua, o alternata con frequenza sufficientemente bassa1 , si ha la legge di Ohm per la corrente di conduzione Jc = σE (4.2) I campi macroscopici in queste equazioni sono campi medi all’interno dei materiali, ε è la costante dielettrica, µ la permeabilità magnetica2 e σ la conducibilità. Tutte le equazioni 1 Si veda, per esempio, il trattato di L. Landau, L. P. Pitaevskii e E. Lifschitz, Electrodynamics of Continuous Media, 2 edition (15 Oct 1984) √ 2 Cosicché n = εµ è l’indice di rifrazione. 81 si riferiscono naturalmente a dielettrici o conduttori immobili. Sorge dunque la questione di generalizzarle ai corpi in moto, e in questo la relatività è di grande aiuto. Innanzitutto postuliamo che la coppia (D, H) corrisponda al tensore Hab nello stesso modo in cui (E, B) corrispondono al tensore Fab . È facile convincersi che le uniche equazioni tensoriali lineari che si riducono alle (4.1) nel sistema di quiete sono, rispettivamente, Hab U b = εFab U b (4.3) Fab Uc + Fca Ub + Fbc Ua = 0 (4.4) dove U a è la quadri-velocità del dielettrico. Queste sono le equazioni costitutive di Minkowski. Per quanto riguarda la legge di Ohm è chiaro che deve aversi J a + U a U b Jb = σF ab Ub (4.5) in quanto il secondo membro è ortogonale a U . Dalle Eq. (4.3) si ottiene facilmente D + v × H = ε(E + v × B) Analogamente, dalle (4.4), B − v × E = µ(H − v × D) Eliminando B dalla prima e D dalla seconda si ottengono le formule seguenti di Minkowski (1911) D= ε(1 − v 2 )E − ε(εµ − 1)(v · E)v + (εµ − 1)v × H 1 − εµv 2 µ(1 − v 2 )H − (εµ − 1)v × E − µ(εµ − 1)(v · H)v 1 − εµv 2 √ Si noti che con le nostre unità 1/ εµ è la velocità della luce nel dielettrico. E25: Si ripristini la velocità della luce nelle formule precedenti. Si approssimino le formule tenendo conto solo dei termini di ordine zero e uno in v/c. Per la legge di Ohm si trova facilmente la formula B= J = σγ(E − (v · E)v + v × B) + ρv L’ultimo termine rappresenta la corrente di trasporto dovuta al fatto che il conduttore mobile appare elettricamente carico e dunque J − ρv = Jc rappresenta la vera corrente di conduzione, per la quale vale la formula Jc = σγ(E − (v · E)v + v × B) (4.6) Trascurando termini quadratici in v si ha il risultato più intuitivo Jc = σ(E + v × B) (4.7) 82 Infatti il vettore in parentesi è la forza di Lorentz per unità di carica. E26: Si ripristini la velocità della luce nella formula ottenuta. Si approssimi la formula tenendo conto solo dei termini di ordine zero e uno in v/c. E27: Si mostri che la carica acquisita dal conduttore in moto è ρ= 1 v · Jc c2 1 − v 2 /c2 L’effetto è dunque trascurabile. 5.5 Campo di una carica in moto rapido Per risolvere alcuni semplici problemi di radiazione elettromagnetica useremo il metodo delle funzioni di Green. Le soluzioni dell’equazione delle onde non omogenea ∂a ∂ a ϕ = −j(x) si ottengono se si conosce una distribuzione G(x, y) tale che ∂ 2 G(x, y) = −δ(x − y) (5.1) Allora una soluzione particolare dell’equazione è ∫ ϕ(x) = G(x, y)j(y)d4 y È facile determinare le possibili funzioni di Green; infatti la formula ∫ ik·(x−y) e −4 G(x, y) = (2π) d4 k k2 (5.2) (5.3) determina formalmente una soluzione della (5.1), se non fosse per le singolarità del denominatore nei vettori nulli, per cui k 2 = 0. Se consideriamo k 2 come una funzione di k 0 , il denominatore ha poli semplici nei punti k 0 = ±|k|, e per dare senso all’integrazione in k 0 bisogna dunque dare una regola di aggiramento dei poli. A ciascuna prescrizione corrisponde una diversa funzione di Green. Consideriamo allora la seguente prescrizione: si spostino i due poli leggermente al di sotto dell’asse reale nel piano complesso della variabile k 0 , cioè si consideri l’integrale ∫ ∫ eik·(x−y) eik·(x−y) 4 −4 4 −4 G− (x, y) = (2π) d k = (2π) dk (5.4) −(k 0 + iε)2 + |k|2 k 2 − 2iεk 0 dove il limite ε → 0 è sottinteso e l’integrazione in dk 0 è fatta per prima. Usando il teorema di Cauchy si trova facilmente [esercizio] ′ G− (x, x ) = 1 ′ ′ ′ ′ 2 ′ δ(t − t − |x − x |) = θ(t − t )δ((x − x ) ) 4π|x − x | 83 (5.5) dove l’ultima eguaglianza è conseguenza della nota formula ) 1 ( 0 δ(x − |x|) + δ(x0 + |x|) 2|x| δ(x2 ) = (5.6) che si studia nel corso di metodi matematici per la fisica. Ci sono due aspetti notevoli ′ nella formula (5.5). Il primo è l’annullarsi di G− quando l’evento x precede x (nel tempo). Per questo G− si chiama la funzione di Green ritardada. Il secondo è che il supporto della distribuzione è interamente contenuto nel cono luce; cioè il campo in x è completamente ′ determinato dal valore della sorgente nei punti x del suo supporto che si trovano sul cono luce passato uscente da x, in accordo con la richiesta di causalità e con la propagazione a velocità finita (c in questo caso) delle onde. Esiste anche una funzione di Green avanzata ′ G+ (x, x ) = 1 ′ ′ ′ ′ 2 ′ δ(t − t + |x − x |) = θ(t − t)δ((x − x ) ) 4π|x − x | (5.7) che si ottiene spostando i poli leggermente al di sopra dell’asse reale nel piano complesso della variabile k 0 , cioè operando la sostituzione k 2 − 2iεk 0 → k 2 + 2iεk 0 nell’integrale (5.4). campo di una carica veloce Le equazioni di Maxwell per i potenziali nella gauge di Lorenz sono 2Aa = −4πJ a , ∂ a Aa = 0 Per una sola carica la corrente è J a = eż a (t)δ (3) (x − z(t)) e dunque, in base alla (5.2), la soluzione ritardata dell’equazione assume la forma ∫ ( ) ′ 1 ′ ′ a a ′ A (x) = e ż (t )δ t − t − |x − z(t )| dt |x − z(t′ )| Il calcolo procede usando la formula (v. il punto (3) della lista in appendice A) )−1 ) ( (x − z(t− )) · ż(t− ) ′ δ t − t − |x − z(t )| = 1 − δ(t − t− ) |x − z(t− )| ( ′ ′ dove t− è l’unica soluzione dell’equazione t − t− − |x − z(t− )| = 0 Chiameremo t− il tempo ritardato; l’interpretazione fisica è ovvia: il campo al tempo t in x dipende solamente dalla posizione della carica al tempo t− , tale che t − t− sia esattamente il tempo richiesto alla radiazione elettromagnetica per percorrere la distanza |x − z(t− )|. Dunque l’evento di coordinate (t− , z(t− )) sta sull’intersezione del cono luce passato uscente da x = (t, x) (il cosiddetto punto campo) con la linea di universo della carica, dal che si capisce la ragione della sua univoca determinazione. 84 ′ Un’ultima integrazione in t fornisce il risultato finale Aa (t, x) = eva (t− ) , |x − z(t− )| − (x − z(t− )) · ż(t− ) va = dz a dt (5.8) Questi sono noti come i potenziali di Lienard-Wiechert. Introducendo il quadrivettore nullo Ra = xa − z a (t− ) = (t − t− , x − z(t− )), si può riscrivere la formula precedente nella forma covariante eU a Aa (x) = − (5.9) Rb U b dove U a è la quadri-velocità e si sottintende che tutto nel secondo membro va calcolato nel tempo ritardato t− , o equivalentemente al corrispondente tempo proprio ritardato τ− . È chiaro che τ− = τ− (x): le derivate parziali si calcolano differenziando l’identità Ra Ra = 0 0 = 2Ra ∂b Ra = 2Ra (δba − U a ∂b τ− ) da cui ∂b τ− = Rb Rc U c (5.10) Il calcolo del campo elettromagnetico procede usando la formula Fab (x) = ∂a Ab − ∂b Aa tenendo presente la dipendenza di τ− da x: dal risultato appena esposto, con un semplice conto si ottiene e e Fab (x) = (Ra Ub − Rb Ua ) − (Ra U̇b − Rb U̇a ) 3 (R · U ) (R · U )2 e + (R · U̇ )(Ra Ub − Rb Ua ) (5.11) (R · U )3 dove è sottinteso che tutti i termini scritti sono calcolati nel tempo ritardato τ− . Il primo termine, decrescente come R−2 a grandi distanze è il campo Coulombiano irriducibilmente associato ad ogni carica. La radiazione elettromagnetica propriamente detta è descritta dai termini successivi. Si noti che decrescono con il tipico andamento Fab ∼ R−1 . Nel seguito reintrodurremo c in tutte le formule scritte nella versione tridimensionale, lasciando c = 1 solo per le formule scritte in notazione quadri-dimensionale. Se il moto è uniforme solo il campo di Coulomb sopravvive: dalla (5.11) si ricava facilmente ( (1 − β 2 ) v ) EC = e R − R , B = n × EC (5.12) c (R − R · v/c)3 dove n = R/R. Si noti che il vettore R∗ = R − Rv/c connette la posizione della carica al tempo t con il punto campo x = (ct, x), e che √ R·v R− = R∗ 1 − β 2 sin2 θ c 85 dove θ è l’angolo tra R∗ e v (si consiglia di fare un disegno dei vettori coinvolti). Dunque si può scrivere e(1 − β 2 ) R∗ (5.13) 2 2 3/2 (1 − β sin θ) R∗3 che è il risultato che si otterrebbe con le trasformazioni di Lorentz dal rest system. Nel caso generale si ottiene la formula più complicata ] [( e v ) E = EC + 2 R × v̇ (5.14) R × R − c (R − R · v/c)3 c EC = B=n×E (5.15) dove n = R/R. radiazione Per discutere la radiazione emessa dalla carica omettiamo nel seguito il campo Coulombiano EC ; l’intensità emessa nell’angolo solido dΩ è, in accordo con le formule generali (si veda l’Eq. (4.10) nella Sezione §6.4), c 2 2 c 2 2 dI = E R dΩ = B R dΩ (5.16) 4π 4π Uno sguardo alla (5.14) mostra subito che la distribuzione angolare della radiazione deve essere assai complicata. Nel caso in cui v e v̇ siano vettori paralleli la formula si semplifica: si ha in tal caso (si consulti [6], §73) e v̇ × n B= 2 (5.17) c R (1 − v cos θ/c)6 e e2 a2 sin2 θ dI = dΩ (5.18) 4πc3 (1 − v cos θ/c)6 dove a = |v̇|. Il denominatore è la correzione relativistica, ma per il resto la formula coincide con il risultato standard della radiazione dipolare. L’intensità totale è l’integrale su θ con la misura 2π sin θdθ, e risulta essere I= 5 + β2 Idipole 5(1 − β 2 )4 (5.19) where 2e2 a2 3c3 è la radiazione dipolare. Se v e v̇ sono ortogonali si trova invece [ ] e2 a2 1 (1 − β 2 ) sin2 θ cos2 ϕ dI = − dΩ 4πc3 (1 − β cos θ)4 (1 − β cos θ)6 e 5 − 2β 2 I= Idipole 5(1 − β 2 )3 Idipole = 86 (5.20) (5.21) (5.22) 5.6 L’equazione di Lorentz-Dirac Si vuole considerare l’effetto delle forze di reazione sulla carica dovute all’emissione di radiazione. Nel sistema di riferimento dove la velocità della carica è piccola, il lavoro medio della forza per unità di tempo deve corrispondere alla potenza totale irradiata, cioè f ·v =− 2e2 2 |v̇| 3c3 (6.1) dove le quantità barrate sono medie temporali del tipo ∫ 1 T A = lim f (t)dt t→∞ T 0 Con una manipolazione “alla Landau-Lifschitz” scriviamo 2e2 d 2e2 f · v = − 3 (v · v̇) + 3 v · v̈ 3c dt 3c (6.2) Dobbiamo considerare una situazione in cui la funzione v · v̇ sia limitata, cosicché la media temporale della sua derivata si annulli. Resta allora il secondo termine, che è consistente con la presenza di una forza istantanea di reazione che dipende dalla derivata dell’accelerazione f= 2e2 v̈ 3c3 (6.3) La derivazione data qui di questa espressione non può che considerarsi euristica. Infatti le forze di reazione nascono dagli effetti della radiazione emessa all’ordine (v/c)3 , e dunque bisognerebbe mostrare che i contributi ai campi di radiazione dei termini di ordine (v/c)n , con n > 3, tendono tutti a zero in prossimità della carica elettrica nel sistema istantaneo di quiete. Poiché questo si verifica ( vedere [6], §75), l’espressione (6.3) per una singola carica è esatta nel sistema di quiete. Poniamo t0 = 2e2 3mc3 In elettrodinamica classica si introduce il raggio classico dell’elettrone con l’espressione r0 = e2 ≃ 10−13 cm mc2 Dato che la massa propria elettromagnetica di una carica puntiforme è infinita, cioè l’integrale che dà l’energia del suo campo elettrostatico diverge, si ritiene che r0 definisca il limite di applicabilità dell’elettrodinamica classica, in quanto l’energia propria osservata di una particella puntiforme è mc2 , non infinito. Allora t0 ∼ 10−24 s è il tempo che impiega la luce ad attraversare il raggio classico dell’elettrone e, come per r0 , definisce la scala temporale che limita l’applicabilità dell’elettrodinamica classica alle particelle elementari. 87 Si noti che per un protone queste scale sono duemila volte più piccole, ma va detto che un protone non è propriamente un oggetto elementare puntiforme. Ora l’equazione del moto di una carica libera a bassa velocità sarebbe t0 v̈ − v̇ = 0 (6.4) la quale, oltre alla soluzione standard v = costante, ammette anche la soluzione di fuga v = bet/t0 descrivente una particella che si auto-accelera per emissione di radiazione. Si potrebbe porre b = 0 arbitrariamente, ma questo non è possibile se la velocità iniziale è diversa da zero. Dunque una particella, dopo avere attraversato un campo, dovrebbe autoaccelerarsi indefinitamente. L’assurdità di questo risultato richiede ovviamente una discussione più approfondita, cui accenneremo più avanti. Qui notiamo solo che ancora una volta si trova che l’elettrodinamica classica non sembra essere una teoria del tutto priva di contraddizioni. Per includere questa forza nelle equazioni del moto relativistiche di una carica in un campo esterno si deve trovare l’espressione relativistica della forza di reazione. È facile vedere che l’unico quadri-vettore che nel sistema di quiete si riduce all’eq. (6.3) ed è ortogonale alla quadri-velocità (come tutte le forze relativistiche pure) è fa = ) 2e2 ( a δb + c−2 U a Ub Ü b 3 3c (6.5) Infatti nel rest system Ü b = (a2 , v̈). Si ha in questo modo l’equazione del moto di Lorentz-Dirac U̇ a = e a b 2e2 F bU + (δ a + U a Ub ) Ü b mc 3mc3 b (6.6) Notiamo che per un elettrone il coefficiente del secondo termine è t0 ∼ 10−24 s, e dunque che la forza di frenamento dovrebbe rappresentare una piccola perturbazione della forza esterna. In realtà occorrono altre due condizioni [6]: la prima è che la lunghezza d’onda del campo esterno sia λ ≫ r0 , la seconda che l’intensità dei campi sia piccola nel senso che E, B ≪ m2 c4 /e3 [6]. Se questa è soddisfatta, è talvolta conveniente esprimere le derivate Ü a in funzione dei campi esterni e2 a b c e F F U mÜ a = ∂c F ab U b U c + c mc2 b c (6.7) Sostituendo nella (6.6) si trova infine la formula mU̇ a = e a b 3 3 F b U + et0 (∂c F ab )U b U c + ct20 (F db F bc U c Ud )U a + ct20 F ab Fbc U c c 2 2 (6.8) dove si vede che la retro-azione del campo sulle cariche è quadratica nei campi, dunque trascurabile se le intensità dei campi sono sufficientemente piccole, come indicato 88 sopra. Con campi di ordine |Fab | ∼ m2 c4 /e3 l’elettrodinamica classica non è più applicabile. I campi limite sono d’altronde molto intensi, per un elettrone essendo dell’ordine di 1018 Volt/m! Notiamo che il secondo termine è trascurabile rispetto al primo se vt0 ≪ λ, e sarà soddisfatto per particelle relativistiche se ct0 ∼ r0 ≪ λ, che è la condizione scritta sopra. caso non relativistico Per comprendere alcune implicazioni dell’equazione di Lorentz-Dirac, consideriamola nel caso non relativistico, dove per una forza esterna generica essa prende la forma v̇ − t0 v̈ = m−1 Fext (6.9) Questa è l’equazione di Abraham-Lorentz. Con la condizione asintotica naturale, lim a(t) = 0, t→−∞ si ha l’accelerazione ] [ ∫ t 1 t/t0 −u/t0 a(t) = e Fext (u)e du b− mt0 −∞ (6.10) Il primo termine è la “runaway solution” vista sopra, che si può solo eliminare con la scelta ad hoc b = 0, in generale non permessa. Inoltre a(t) dipende dal valore della forza nei tempi precedenti a t, il prezzo che si paga se si vuole eliminare ȧ dall’equazione del moto. Infine, scritta com’è, la (6.10) non ammette il limite t0 → 0, nonostante t0 sia estremamente piccolo. Vogliamo vedere se si può imporre la condizione che il limite esista e fornisca la relazione newtoniana a(t) = Fext (t)/m: a tale scopo poniamo formalmente ∫ ∞ 1 Fext (u)e−u/t0 du b= mt0 −∞ nell’eq. (6.10). Si ottiene il risultato interessante ∫ et/t0 ∞ a(t) = Fext (u)e−u/t0 du mt0 t (6.11) Per eliminare il termine singolare in 1/t0 conviene passare alla variabile t0 s = u − t: allora ∫ ∞ ma(t) = Fext (t + t0 s)e−s ds (6.12) 0 Il limite t0 → 0 ora esiste e fornisce la formula di Newton; dunque la (6.12) può considerarsi come una ragionevole riformulazione del problema del frenamento per emissione di radiazione. Si noti però il carattere acausale dell’equazione: a(t) dipende dai valori della forza in tempi posteriori a t! 89 Capitolo 6 Principi variazionali L’elettrodinamica è un esempio concreto di teoria dei campi, ma non è il solo. Allo scopo di costruire teorie invarianti di Lorentz, è estremamente conveniente usare un principio variazionale di minima azione, in cui le equazioni del moto per i campi ϕ si deducono dalla condizione di stazionarietà di un funzionale della forma ∫ I[ϕ] = L[ϕ, x]d4 x (0.1) Terminologia: i campi ϕ hanno in generale molte componenti che indichiamo con ϕA (x), con la notazione ∂ϕ intendiamo il campo le cui componenti sono ∂a ϕA (x), I[ϕ] è l’azione ed L[ϕ, x] è la densità (cioè una quantità che si può integrare) lagrangiana. Per i nostri scopi la lagrangiana è una funzione dei campi e delle coordinate del tipo L[ϕ, x] = L(ϕ(x), ∂ϕ(x), x) ′ che possiede la proprietà di invarianza relativistica seguente: se indichiamo con ϕA (x) il campo che risulta da una trasformazione di Poincarè (Lorentz e traslazioni), si ha ( ′ ) ( ) ′ L ϕA (x), ∂a ϕA (x), x = L ϕA (Λ−1 (x − a)), ∂a ϕA (Λ−1 (x − a)), Λ−1 (x − a) (0.2) Ovvero L[ϕ, x] è invariante per trasformazioni di Lorentz. La richiesta serve naturalmente a garantire la covarianza delle equazioni del moto. Infatti dalla (0.2) discende subito che l’azione è invariante ′ I[ϕ ] = I[ϕ] in quanto la misura di integrazione d4 x è invariante di Lorentz. Nel seguito assumeremo che le formule di trasformazione dei campi siano lineari ∑ ′ B [Λ]ϕB (Λ−1 x) (0.3) ϕA (x) = DA B ′ Per le traslazioni pure si ha Λ = 1 e ϕ (x) = ϕ(x − a), cosicché la (0.2) sarà soddisfatta se L[ϕ, x] = L[ϕ], cioè se la lagrangiana non dipende dalle coordinate in maniera esplicita. 90 6.1 Equazioni di Eulero e Lagrange Se una “piccola” variazione, δϕA (x), di una data configurazione ϕA (x), non cambia il valore di I al primo ordine in δϕA (x), si dice che l’azione è stazionaria nel “punto” ϕA (x). In questo caso si ha ∫ δI δI = δϕA (x) d4 x = 0 δϕA (x) Se le variazioni δϕA (x) sono arbitrarie e tra loro indipendenti, si ottiene la condizione δI =0 (1.1) δϕA (x) Questa espressione si chiama la derivata variazionale di I. La derivata variazionale δF/δϕ(x) di un funzionale F [ϕ] è, per definizione, il coefficiente di δϕ(x) nell’espressione della variazione prima δF ∫ δF δF = δϕ(x) d4 x δϕ(x) Se F dipende dalle derivate di ϕ(x), come nel caso dell’azione, il calcolo della derivata variazionale comporta in generale una o più integrazioni per parti. Per calcolare la derivata variazionale di I[ϕ] si noti che ) ∫ ( ∂L ∂L δI = δϕA + ∂a δϕA d4 x (1.2) ∂ϕA ∂∂a ϕA Possiamo scegliere variazioni arbitrarie a supporto compatto (cioè nulle al di fuori di un insieme chiuso e limitato). In tal caso, integrando per parti il secondo termine e usando il teorema di Gauss per eliminare il termine di bordo, si ottiene facilmente ) ∫ ( ∂L ∂L δI = − ∂a δϕA d4 x (1.3) ∂ϕA ∂∂a ϕA La condizione di stazionarietà (1.1) prende allora la forma δI ∂L ∂L ≡ − ∂a =0 (1.4) δϕA (x) ∂ϕA (x) ∂∂a ϕA (x) Queste sono le equazioni di Eulero e Lagrange per i campi. Si noti che dall’invarianza dell’azione segue automaticamente la covarianza delle equazioni del moto, in quanto ∑ δI δI A DB [Λ] ′ = δϕA δϕB B La lagrangiana è determinata solo parzialmente dalle equazioni del moto di una teoria, perché il passaggio da L[ϕ] a L1 [ϕ] = L[ϕ] + ∂a F a (ϕ(x)) non modifica le equazioni del moto. Questo si può vedere direttamente sostituendo L1 nelle equazioni di Eulero-Lagrange, oppure notando che la divergenza non contribuisce alla variazione dell’azione se si usa il teorema di Gauss per eliminarla dal principio variazionale. 91 campo scalare Un semplice esempio del formalismo Lagrangiano è fornito dalla teoria del campo scalare. Una Lagrangiana invariante è 1 1 1 L(x) = − ∂a Φ∂ a Φ − U (Φ) = Φ̇2 − |∇Φ|2 − U (Φ) (1.5) 2 2 2 dove U (Φ) è una funzione potenziale. Nell’ultima espressione, il primo termine è l’analogo dell’energia cinetica e il secondo è richiesto dalla covarianza relativistica (il primo termine da solo non è invariante di Lorentz). Conviene isolare in U (Φ) il termine quadratico, 1 U (Φ) = m2 Φ2 + V (Φ) 2 La costante m è una massa nelle unità ℏ = c = 1; nelle unità comuni si dovrebbe fare la sostituzione m → mc/ℏ. Le equazioni di Eulero-Lagrange sono −∂a ∂ a Φ + m2 Φ = − ∂V (Φ) ∂Φ e si riducono all’equazione di Klein-Gordon se manca il potenziale. l’equazione ammette le onde piane In questo caso Φ = A exp(±ipa xa ) dove p2 + m2 = 0. Questa è la formula soddisfatta dal quadrimpulso di una particella, ed è in accordo con la teoria quantistica, secondo la quale l’onda piana è associata alle particelle con impulso ed energia determinati e che per tale motivo sono completamente de-localizzate. 6.2 Azione per il campo elettromagnetico Le equazioni di Maxwell sono del primo ordine nei campi elettromagnetici e del secondo ordine nei potenziali Aa , e quindi considereremo le componenti del campo Aa (x) come le variabili dinamiche della teoria (le sue coordinate generalizzate, come si direbbe nel linguaggio Lagrangiano). È dunque essenziale che l’azione sia invariante di gauge, oltre che invariante di Lorentz. Esistono due invarianti quadratici che si possono costruire con il tensore Fab . Essi sono F 2 ≡ Fab F ab = 2(B2 − E2 ) (2.1) e ∗ ab F Fab = 2E · B (2.2) dove ∗ ab F 1 = eabcd Fcd 2 92 è il cosiddetto tensore duale. Questo invariante è però una divergenza quadridimensionale ( ) ∗ ab F Fab = ∂a eabcd Fbc Ad e può quindi essere omesso. Il primo ha i requisiti necessari per essere usato come una Lagrangiana, e dunque scriviamo l’azione ∫ 1 Iem = − Fab F ab d4 x (2.3) 16π Il segno negativo si capisce guardando la (2.1), secondo la quale F 2 contiene le derivate temporali di A (cioè l’energia cinetica del campo) con segno negativo. Il fattore di normalizzazione è dovuto alla nostra scelta di usare le unità Gaussiane non razionalizzate. Dato che Iem non contiene le cariche elettriche, si può interpretare Iem come l’azione per il campo elettromagnetico libero. Dalle equazioni di Maxwell (1.6) segue che l’azione deve anche contenere il termine lineare in Aa 1 ∫ Iin = Aa J a d4 x (2.4) dove J a è la corrente elettrica, che assumeremo indipendente dal campo Aa (x). È Iin invariante di gauge? La sostituzione Aa → Aa + ∂a ψ trasforma Iin in ∫ ∫ a 4 Iin + ∂a ψJ d x = Iin − ψ∂a J a d4 x come segue dal teorema di Gauss se ψ si annulla all’infinito. Vediamo che l’azione è invariante di gauge se e solo se la corrente è conservata: ∂a J a = 0. Si può quindi considerare la conservazione della carica elettrica come una conseguenza dell’invarianza di gauge. Sia infine Im l’azione che descrive la materia elettricamente carica, che assumeremo indipendente dal campo Aa (x). L’azione completa è ∫ ∫ 1 ab 4 I=− Fab F d x + Aa J a d4 x + Im (2.5) 16π È adesso facile vedere che le equazioni di Eulero-Lagrange per il potenziale Aa (x) riproducono la seconda coppia delle equazioni di Maxwell (si ricordi che la prima coppia segue direttamente dalla definizione (1.1)). Forse, più semplicemente, si può verificare la formula ) ∫ ( 1 ab b δI = ∂a F + J δAb d4 x 4π da cui seguono le equazioni, purché si considerino le variazioni δAb come arbitrarie e indipendenti tra loro. 1 In certe teorie vi possono essere accoppiamenti quadratici nei potenziali, essenzialmente dovuti al fenomeno del diamagnetismo. 93 6.3 Azione per le particelle L’azione Im non è altrettanto univocamente determinata, perché ovviamente dipende dal modello di materia che si vuole adottare, e anche dal sistema fisico concreto che si vuole considerare. Ad esempio un fluido elettricamente carico, uno sciame di particelle puntiformi o un campo scalare complesso hanno tutti la propria azione particolare. Per gli scopi dell’elettrodinamica classica è giustificato considerare le particelle puntiformi come un modello sufficientemente adeguato. Vale allora la formula (2.5), che sostituita in Iin dà immediatamente ∑ ∫ Iin = en Aa (zn )dzn n ciascun integrale essendo esteso alla linea di universo della carica corrispondente. Per quanto riguarda l’azione libera (il termine Im della (2.5)), se le particelle hanno massa non nulla si può adottare l’azione2 ∫ √ ∑ ∑ ∫ ∑ ∫ √ Im = − mn −żn2 dp = − mn dτn = − mn dt 1 − vn2 (3.1) n n n Si passa dalla prima forma alla seconda ponendo p =√τn , nel qual caso żn2 = −1, e dalla seconda alla terza usando la nota espressione dτ = dt 1 − v 2 . Si noti che la Lagrangiana per una particella √ 1 L = −m 1 − v 2 = −m + mv2 + · · · 2 fornisce la quantità di moto p= mv ∂L =√ ∂v 1 − v2 e l’energia E =v· ∂L m −L= √ ∂v 1 − v2 in accordo con la definizione di queste grandezze adottata in meccanica relativistica. Limitandosi ad una sola particella, la variazione di Im rispetto a z a si può scrivere nella forma ∫ 2 a dz δza dτ (3.2) δIm = −m dτ 2 e ∫ dz b δIin = e F ab (z) δza dτ dτ 2 ż = dz/dp, ż 2 = ża ż a e mn sono le masse proprie. 94 Dal principio variazionale δI = 0, con il potenziale Aa tenuto fisso, si ottengono cosı̀ le equazioni del moto della carica nel campo elettromagnetico dpa dz a = eF ab (z)ub , ua = (3.3) dτ dτ dove, come al solito, pa = mua è il quadri-impulso della particella. Queste equazioni sono manifestamente covarianti. Riscrivendole per esteso si ha ( ) d mv √ = e(E + v ∧ B) (3.4) dt 1 − v2 d dt ( m √ 1 − v2 ) = eE · v (3.5) e ritroviamo le equazioni del moto (4.4). Vediamo che la trattazione relativistica conduce necessariamente alla formula della forza di Lorentz, che nelle vecchie trattazioni era invece semplicemente postulata. 6.4 Il tensore energia-impulso L’indipendenza della Lagrangiana dalle coordinate ha una importante conseguenza di principio, il teorema di conservazione del quadri-impulso. 6.4.1 Caso generale Se L(x) non dipende esplicitamente3 da xa , si ha ( ) ( ) ∂L ∂L ∂L ∂L ∂L ∂a L = ∂a ϕ A + ∂b ∂a ϕ A = − ∂b ∂a ϕ A + ∂b ∂a ϕA ∂ϕA ∂∂b ϕA ∂ϕA ∂∂b ϕA ∂∂b ϕA Se le equazioni di Eulero-Lagrange risultano soddisfatte, questa equazione si riduce alle quattro condizioni ∂a T ab = 0 (4.1) in cui T ab = δba L − ∂L ∂b ϕ A ∂∂a ϕA (4.2) T ab si chiama il tensore energia-impulso canonico, e l’Eq. (4.1) è la sua legge di conservazione. Dal teorema di Gauss (2.8) si ottengono le costanti del moto (ripristinando c) ∫ dPa 1 Pa = T 0a (x0 , x)d3 x, =0 (4.3) c dx0 3 ′ Cioè se vale la (0.2) con Λ = 1, tenendo conto che ϕ (x) = ϕ(x − a). 95 Queste rappresentano il quadrimpulso del campo sull’iperpiano a x0 fissato. Per esempio −T 00 = ∂0 ϕA ∂L −L ∂∂0 ϕA (4.4) è manifestamente la densità di energia4 , e dunque −cP0 è l’energia, in accordo con le proprietà generali del quadrimpulso. È molto importante osservare che le grandezze Pa sono non solo conservate, ma determinano anche le componenti di un quadrivettore (v. appendice). Per finire, notiamo che in generale il tensore canonico non è simmetrico, perciò definiamo T ab = T ac η cb ambiguità di Tab La non univocità della Lagrangiana si riflette ovviamente sulla forma del tensore T ab . Oltre a questo però, esiste anche un’ambiguità di carattere più profondo che vogliamo ora descrivere. Si consideri il nuovo tensore energia-impulso 1 T ab = T ab + ∂c Fbac , Fbac = −Fbca (4.5) dove Fbac è una funzione tensoriale dei campi, antisimmetrica in a e c. Allora la legge di conservazione (4.1) rimane valida. Dal teorema di Gauss segue che il quadrimpulso totale non cambia se Fbac (x) si annulla in maniera talmente rapida da annullare il suo flusso attraverso i bordi all’infinito. La possibilità di ridefinire il tensore energia-impulso in questo modo non è un fatto deprecabile, perché può utilmente essere usata per renderlo simmetrico: T ab = T ba , proprietà che assumeremo valida da ora in poi. In questo caso, il tensore del “momento angolare” M abc = T ab xc − T ac xb risulta anch’esso conservato ∂a M abc = T cb − T bc = 0 (4.6) Le costanti del moto ∫ ab J = M 0ab (x0 , x)d3 x = −M ba (4.7) rappresentano la versione relativistica del momento angolare. Un altro caso dove la non univocità del tensore energia-impulso risulta essenziale, si ha per il campo elettromagnetico, dove può essere impiegata per ripristinare l’invarianza di gauge, apparentemente violata dal tensore canonico. significato delle componenti di Tab 4 Si ricordi che L è una densità Lagrangiana, e che la formula per l’energia in una teoria con Lagrangiana L è E = q̇∂L/∂ q̇ − L. 96 Abbiamo già notato che T 00 è la densità di energia e c−1 T 0k ≡ Gk la densità della quantità di moto. Integrando la legge di conservazione ∂0 T 00 = −∂k T k0 su un volume spaziale V si ottiene (ripristinando c) ∫ ∫ dEV d 00 = T dx = −c T k0 nk da dt dt V ∂V dove EV è l’energia nel volume V . Quindi le componenti cT k0 ≡ S k rappresentano il flusso di energia nella direzione k (x, y oppure z). Analogamente, dalla legge di conservazione della quantità di moto in un volume V ∫ ∫ dPVk d1 0k = T dx = − T jk nj da dt dt c V ∂V vediamo che le componenti T jk rappresentano il flusso della k-esima componente dell’impulso nella j-esima direzione. Le T jk sono a volte chiamate le componenti del tensore degli sforzi, perché il flusso di impulso attraverso una superficie determina la forza agente sulla medesima. Come sopra, sia G il vettore (tridimensionale) di componenti c−1 T 0k e S quello di componenti cT k0 . Se il tensore energia-impulso è simmetrico si ha, dunque 1 G = 2S (4.8) c un risultato noto come teorema di Planck : ad ogni corrente di energia è associato un trasporto di quantità di moto. La (4.8) è una versione generalizzata del teorema di equivalenza massa-energia. Consideriamo ora il tensore energia-impulso di alcuni sistemi fisici importanti. 6.4.2 Campo scalare La Larangiana (1.5) e la (4.2) conducono subito alla formula Tab = ∂a Φ∂b Φ + ηab L Ad esempio, se il campo è spazialmente uniforme, cioè se Φ(x) = ϕ(t), il tensore degli sforzi è isotropo (includiamo il termine di massa in V (ϕ)) ) 1 ( 2 Tjk = δjk ϕ̇ − V (ϕ) = δjk p 2 Il coefficiente di δjk può essere interpretato come la pressione (v. sotto). Inoltre T0j = 0 e l’energia 1 T00 = ρ = ϕ̇2 + V (ϕ) 2 Si noti che il tensore è simmetrico, Tab = Tba . Nel caso generale la densità di impulso è G = −Φ̇∇Φ 97 6.4.3 Campo elettromagnetico La definizione (4.2) applicata alla Lagrangiana del campo elettromagnetico libero L=− 1 Fab F ab 16π determina il tensore canonico ( ) 1 1 a ac nm a Tb= F ∂b Ac − Fnm F δ b 4π 4 (4.9) che, come si può vedere, non è invariante di gauge. sommiamo la quadri-divergenza − Sfruttando l’arbitrarietà (4.5), 1 ∂c (F ac Ab ) 4π Usando le equazioni del moto ∂c F ac = 0 si ottiene il tensore invariante di gauge ( ) 1 1 a ac nm a Tb= F Fbc − Fnm F δ b 4π 4 (4.10) Esplicitandone le componenti troviamo la densità e il flusso di energia (anche uguale alla densità di impulso G) T 00 = 1 (E2 + B2 ), 8π S= 1 (E ∧ B) 4π (4.11) e il tensore degli sforzi di Maxwell ( ) 1 1 1 2 2 Tik = −Ei Ek + δik E − Bi Bk + δik B 4π 2 2 (4.12) Osserviamo che il quadrimpulso elettromagnetico ∫ Pa = T 0a (x0 , x)dx non può essere un vettore di tipo spaziale, perché in tal caso sarebbe possibile annullare P0 con una trasformazione di Lorentz. Ma questo comporta l’annullarsi dei campi. Dunque P 2 ≤ 0, ossia ∫ E 1 |P| ≤ P0 = , E= (E2 + B2 ) dx c 8π Valgono le formule di trasformazione ′ Px = Px − (v/c2 )E √ , 1 − β2 ′ P y = Py , ′ Pz = Pz , 98 E − vPx ′ E =√ 1 − β2 (4.13) Se P 2 = 0 e se α è l’angolo, misurato in F , tra la direzione di propagazione del raggio di ′ luce e la velocità di F rispetto a F , otteniamo dalla (4.13) la formula di Einstein 1 − β cos α ′ E E = √ 1 − β2 Se invece P a è di tipo tempo, P 2 < 0, esiste sempre un sistema di coordinate F0 in cui P0 = 0. Se E0 è il valore dell’energia totale in F0 , segue dalle (4.13) che in F E=√ E0 1− β2 , P= v E c2 dove v è la velocità di F0 rispetto ad F . Un esempio di questo caso è un’onda sferica di spessore finito. Se σ è la superficie di un dielettrico con normale esterna n, la forza esercitata dal campo sull’elemento di superficie dσ è dfi = −Tik nk dσ Per questo a volte è il tensore σik = −Tik ad essere chiamato tensore degli sforzi elettromagnetici. Si dovrebbe anche osservare che la traccia si annulla ηab T ab = 0 ma sul significato di questa equazione non ci addentriamo. Il tensore (4.10) soddisfa alla legge di conservazione (4.1) (o, come si usa dire, è conservato), solo in assenza di correnti e cariche. Calcolando la divergenza del tensore e usando le equazioni di Maxwell, si trova infatti la formula importante ∂a T ab = −F bc J c (4.14) La componente temporale è l’equazione del bilancio energetico ∂T 00 + div S = −E · J ∂t dove S = E ∧ B/4π è il vettore di Poynting, cioè le componenti T k0 del tensore energiaimpulso. Le rimanenti equazioni esprimono la densità della forza di Lorentz attraverso la divergenza di un tensore. 6.4.4 Fluido perfetto L’idrodinamica relativistica presenta un interesse di principio, perché dovrebbe essere applicata non solo quando è relativistica la velocità macroscopica del fluido, ma anche quando è tale la velocità microscopica delle particelle nel fluido. Sia µ = mn0 la densità di massa del fluido, dove n0 rappresenta il numero di particelle per unità di volume proprio 99 del fluido ed m è la massa propria delle particelle. Se epsilon è l’energia interna per unità di massa e s l’entropia per unità di massa, la ben nota relazione termodinamica (valida nel sistema di coordinate dove un elemento di volume del fluido è in quiete) p dϵ = T ds + 2 dµ (4.15) µ mostra che se il moto del fluido è isoentropico, ds = 0, si possono considerare epsilon e p come funzioni univoche di µ. L’energia interna e la pressione sono allora ρ = µ + µϵ(µ), p = µ2 dϵ dµ La condizione ds = 0 si può scrivere nella forma ( ) ρ+p 1 T ds = d − dp = 0 µ µ (4.16) Faremo uso di questa relazione in seguito. Determiniamo ora il tensore energia-impulso del fluido isoentropico (o perfetto). Nel sistema di coordinate dove un elemento di volume del fluido è in quiete, la forza per unità di superficie che il fluido esercita sul bordo dell’elemento vale pn, dove n è la normale esterna e p è la pressione idrostatica (legge di Pascal). Inoltre T 0j = 0, perciò il tensore energia-impulso ha la forma ρ 0 0 0 0 p 0 0 0 Tab = (4.17) 0 0 p 0 0 0 0 p L’unico tensore che nel sistema di quiete si riduce a 0 Tab e che dipende solamente dalla velocità del fluido ma non dalle sue derivate (come nel caso di fluidi viscosi) è Tab = (ρ + p)ua ub + pηab (4.18) dove ua è il campo di quadrivelocità del fluido. Per le componenti abbiamo (ripristinando c) T 00 = ρ + pv 2 /c2 , 1 − v 2 /c2 T 0i = (ρ + p)v i /c , 1 − v 2 /c2 T ij = ρ + p vivj + pδ ij 2 2 2 1 − v /c c Si noti l’identità ua T ab = −ρub . La traccia è T aa = 3p − ρ (4.19) Gli autovalori del tensore degli sforzi, cioè le pressioni principali, non sono necessariamente positivi. Ad esempio, per un campo magnetico lungo x, By = Bz = 0, si ha ρ 0 0 0 0 −ρ 0 0 Tab = 0 0 ρ 0 0 0 0 ρ dove ρ = B 2 /8π è la densità di energia. Una pressione negativa (tensione) agisce lungo x. 100 (a) limite non relativistico Nel trattare il limite non relativistico non è sufficiente ignorare i termini di ordine v/c o superiori. Bisogna infatti notare che ρ contiene l’energia di quiete µc2 , dove µ = mno è la densità di massa propria delle particelle del fluido, mentre la densità di massa non relativistica si riferisce all’unità di volume in movimento con il fluido. Si deve dunque porre µ0 µ= √ 1− v2 c2 = µ0 + µ0 v 2 + ··· 2c2 e poi passare al limite c → ∞, dove µ0 è la densità di massa non relativistica usuale. Inoltre sia la pressione che l’energia interna epsilon(µ) sono trascurabili rispetto all’energia di quiete µc2 . In questo modo si ottengono le formule 1 T 00 − µo c2 = µ0 v 2 + µ0 ϵ 2 c−1 T 0j = µ0 v j T jk = µ0 v j v k + pδ jk Il flusso di energia è cT j0 , e vale ) ( v2 p 2 S − µ0 c v = µ0 ϵ + + v µ0 2 Queste espressioni coincidono con i risultati della meccanica dei fluidi non relativistica (v. Cap. [1] del testo di L. D. Landau e E. M. Lifshitz, Fluid Mechanics: Volume 6 (Course of Theoretical Physics), Butterworth-Heinemann, Second Edition, (1987)) (b) equazioni del moto L’equazione di conservazione ∂a T ab = 0 contiene le equazioni del moto relativistiche del fluido. Infatti, derivando il tensore si ottiene (ρ + p)ub ∂(ρ + p)ub ∂p ∂ua + u =− a a b b ∂x ∂x ∂x (4.20) Contraendo con ua si ottiene la formula ∂a ((ρ + p)ua )) = ua ∂a p (4.21) 101 e quindi l’equazione del moto prende la forma ∂p ∂ua = − − ua ub ∂b p (4.22) ∂xb ∂xa e nel limite non relativistico si riduce alle ben note equazioni di Eulero. Dobbiamo ancora imporre la condizione che il moto sia isoentropico. Riscriviamo la (4.21) nella forma ( ) ρ+p ρ+p 1 a u ∂a − u a ∂a p + ∂a (µua ) = 0 (4.23) µ µ µ2 (ρ + p)ub Dalla (4.16) si vede che i primi due termini si elidono, e si ottiene l’equazione di continuità ∂(µua ) =0 ∂xa (4.24) Se invece assumiamo l’equazione di continuità la (4.23) diventa ( ) ρ+p 1 a u ∂a − u a ∂a p = 0 µ µ che è equivalente alla condizione T µua ∂a s = 0. Introducendo l’entropia per unità di volume, σ = µs, e usando nuovamente la (4.24) si ottiene l’equazione di continuità per la corrente di entropia ∂a σua =0 ∂xa 6.4.5 Particelle libere √ 0 1 − v 2 , e la quantità di moto è L’energia di una particella libera è p = mγ = m/ √ j j j 2 p = mγv = mv / 1 − v , quindi la densità di energia di un sistema di particelle è ∑ mn ∑∫ 00 (3) 0 √ T (x) = δ (x − zn (x )) = δ (4) (x − zn (p)) p0n dzn0 (4.25) 2 1 − v n n n e la densità della quantità di moto è ∑ mn v j ∑∫ n 0j (3) 0 √ T = δ (x − zn (x )) = δ (4) (x − zn (p)) pjn dzn0 2 1 − vn n n Come abbiamo spiegato, il flusso di energia è ∑ mn v j ∑∫ n j0 (3) 0 √ T = δ (x − zn (x )) = δ (4) (x − zn (p)) p0n dznj 2 1 − v n n n (4.26) (4.27) e siccome pjn dzn0 = p0n dznj , vediamo che T 0j = T j0 . Infine, dalla (4.26) segue la formula per il flusso di quantità di moto ∑∫ ∑ mn v j n (3) 0 k kj √ (4.28) δ (4) (x − zn (p)) pjn dznk δ (x − zn (x ))vn = T = 2 1 − v n n n 102 Le formule scritte sono le componenti del tensore ∑ T ab (x0 , x) = pan vnb δ (3) (x − zn (x0 )) (4.29) n dove vna = dzna /dx0 . Come sopra possiamo usare un parametro invariante e scrivere ∑∫ dz b ab T (x) = dp δ (4) (x − zn (p)) pan n (4.30) dp n dove pan è il quadrimpulso considerato come una funzione di p (e non mn dzna /dp). Per la traccia si ottiene, usando per esempio la (4.29) ∑ √ T =− mm 1 − vn2 δ (3) (x − zn (x0 )) (4.31) n La media spaziale sull’unità di volume è negativa ∫ ∑ √ T dx = − mm 1 − vn2 < 0 n Calcoliamo la divergenza del tensore energia-impulso nei due casi seguenti: (a) le particelle si muovono sotto l’azione di un campo elettromagnetico, (b) le particelle sono libere eccetto che per occasionali collisioni localizzate. Nel caso (a) si ha, usando per convenienza la (4.30) con p = τn , ∑∫ dpb ab ∂a T (x) = dτn δ (4) (x − zn (τn )) n = dτn n ∫ ∑ = en dτn δ (4) (x − zn (τn )) F bc (zn )ucn = F bc (x)J c (x) (4.32) n Se Fab = 0 il tensore è conservato e il quadrimpulso pn è costante. Nel caso (b) supponiamo che le particelle n e m abbiano una collisione a τn = τm = τc : allora dpn = ∆pn δ(τn − τc ), dτn dpm = ∆pm δ(τm − τc ) dτm dove ∆pn (∆pm ) è la variazione di quadrimpulso della particella n (m) nella collisione. Allora ∑∫ dpb ab ∂a T (x) = dτn δ (4) (x − zn (τn )) n = δ (4) (x − z(τc ))∆(pbn + pbm ) dτn n dove z(τc ) = zn (τc ) = zm (τc ) è il punto dove avviene la collisione. Vediamo che la conservazione di T ab è equivalente alla legge di conservazione del quadrimpulso nelle collisioni. Il caso con più collisioni si generalizza facilmente. Le equazioni (4.14) e (4.32) danno le leggi di conservazione per un sistema chiuso di cariche e campi ) ( ab ab =0 (4.33) + Tmat ∂a Tem 103 Capitolo 7 Teoria della gravitazione La relatività ristretta è basata sull’assunzione della completa equivalenza di tutti i sistemi di riferimento inerziali. È certamente insoddisfacente, anche da un punto di vista epistemologico, che solamente tali sistemi siano considerati equivalenti, o almeno che non sia data una ragione logica per escludere tutti gli altri. Questo difetto è rimosso dalla teoria della relatività generale, oggetto di questo corso. La relatività generale è la teoria di spazio, tempo e gravitazione formulata da Einstein nel 1915. Essa è largamente considerata come una teoria matematica astrusa, e infatti solitamente si insegna solo all’università. Il linguaggio matematico naturale della teoria è la geometria differenziale delle varietà lorentziane, varietà che ammettono una metrica con tre autovalori positivi e uno negativo, e che non possiedono, in generale, la struttura di spazio vettoriale comunemente associata allo spazio-tempo di Minkowski. La connessione di queste strutture matematiche con la fisica è dovuta al genio di Einstein, e afferma che ogni varietà del tipo indicato rappresenta il modello matematico di un possibile continuum spazio-temporale, con la metrica che ne descrive allo stesso tempo la struttura causale, la misura delle grandezze geometriche e il campo gravitazionale che, come sappiamo dai tempi di Newton, dipende dalla presenza della materia. Ne consegue che la geometria dello spazio-tempo non può essere assegnata a priori (come avviene in relatività ristretta o nella fisica classica, dove la geometria è quella di Euclide che si impara sui banchi di scuola), ma sarà determinata dalle sorgenti del campo. Insomma essa è dinamica, e si ricordi a questo proposito che il modello Euclideo dello spazio invariabile ha descritto le nostre esperienze geometriche con successo per oltre venti secoli! Il fondamento fisico di questa teoria è la proprietà fondamentale dei campi gravitazionali che va sotto il nome di principio di equivalenza forte il quale, quando venga formulato nella maniera appropriata scoperta da Einstein, si rivela per quello che veramente è, ossia un potente principio di simmetria di gauge. 7.1 Il principio di equivalenza Ref. [1] S. Weinberg, Gravitation and Cosmology: principles and applications of the general theory of relativity, John Wiley & sons, Inc. (1972), Cap. [3]. 104 Il principio di equivalenza coincide essenzialmente con l’osservazione che in una navicella spaziale sufficientemente piccola e in caduta libera gli effetti del campo gravitazionale sono trascurabili. Questo segue generalizzando ai campi arbitrari la scoperta di Galileo secondo la quale, nel debole campo di gravità terrestre, tutti i pesi cadono con la stessa accelerazione. Dalla seconda legge del moto si conclude allora che la forza gravitazionale è proporzionale alla massa inerziale del peso, e dalla terza legge che è anche proporzionale alla massa inerziale della sorgente (la terra, nel caso in esame). Non occorre dunque distinguere la massa gravitazionale passiva, che determina l’intensità della forza di gravità, dalla massa inerziale che compare nella seconda legge del moto. Se indichiamo quest’ultima con mI , e con mG la massa gravitazionale passiva tale che F = mG g⊕ , le osservazioni di Galileo comportano l’eguaglianza universale mG = mI . Se non fosse esattamente cosı̀, l’accelerazione impartita dal campo gravitazionale ( a= mP mI ) g⊕ ≃ 9.81 cm · sec−2 g⊕ , non sarebbe la stessa per tutti i pesi. Esperimenti mediante pendoli fabbricati con materiali diversi furono eseguiti da Newton, Bessel e Potter, senza rivelare differenze significative. Il primo esperimento di precisione è di Eötvös (1889, 1922), secondo il quale per molte coppie di sostanze (A, B) si ha il limite ( mI mP ( ) − A mI mP ) ≤ 10−9 (1.1) B Misure più recenti di Dicke, Roll, Krotkov (1964) e Braginsky (1972), hanno portato la precisione a 10−11 e un recente esperimento a Washington (1994, 1999) addirittura a 10−13 ! (si visiti il sito http://relativity.livingreviews.org/ per un aggiornamento scritto da C. Will1 ). All’uguaglianza mG = mI si può dare la seguente importante interpretazione, suggerita ′ dallo stesso Einstein. Sia K un sistema accelerato rispetto al sistema inerziale K, con ′ accelerazione g: in K è allora “presente” un campo gravitazionale uniforme con acce′ ′ ′ lerazione g = −g. Infatti l’osservatore in K osserva una forza inerziale mI g che è la ′ stessa per tutti gli oggetti materiali, e uguale alla “forza peso” mG g . Si può estendere allora il principio di relatività almeno ai sistemi non relativistici uniformemente accelerati, perché il moto delle particelle libere in tali sistemi non può essere usato per determinare l’accelerazione del riferimento: si può tranquillamente attribuire il moto accelerato delle particelle a un campo gravitazionale. Si può anche dire che il passaggio a un sistema di riferimento accelerato genera un campo di forze inerziali che, dal punto di vista meccanico, è del tutto indistinguibile da un campo gravitazionale2 . Più in generale, 1 Il più recente aggiornamento è in http://babbage.sissa.it al riferimento gr-qc/0510072 Quali siano le sorgenti di questo campo è un problema che ha grande importanza concettuale, ma nel quale preferiamo non addentrarci. 2 105 A. la transizione da un sistema di coordinate a un altro, arbitrariamente accelerato rispetto al primo, non può essere fisicamente distinta da un cambiamento del campo gravitazionale. Non si dovrebbe quindi assumere l’esistenza di sistemi di coordinate privilegiati. Abbiamo appena visto che un campo uniforme può essere generato passando a un opportuno sistema di riferimento, ma ovviamente questo campo può essere nuovamente eliminato semplicemente ritornando alle coordinate inerziali iniziali. Questa è anzi la proprietà di tutti i campi cosı̀ generati, siano essi uniformi o no: la trasformazione di coordinate inversa li elimina globalmente. È questa una proprietà del campo gravitazionale del nostro sole (per esempio) o della Terra? Certamente no. La scoperta di Galileo che tutti i pesi cadono con la stessa accelerazione implica immediatamente che in un sistema di riferimento sufficientemente piccolo e in caduta libera senza rotazione rispetto alla massa media dell’universo, il campo gravitazionale non può essere rivelato perché l’osservatore, i corpi di prova, gli strumenti e il sistema stesso accelerano tutti allo stesso modo. Essendo il campo gravitazionale non omogeneo, questa cancellazione della gravitazione per mezzo delle forze inerziali elimina il campo solo in una piccola regione spaziale e se non si aspetta troppo a lungo: per esempio, visto che le linee di forza del campo terrestre convergono verso il centro della terra, due palline in caduta libera avranno una piccola accelerazione relativa trasversale alla direzione radiale di caduta libera. Ma vale tutto ciò anche per gli altri fenomeni naturali? Per esempio, un’onda elettromagnetica che rimbalza fra due specchi in caduta libera si comporterà come in assenza di gravitazione? Un atomo in caduta libera avrà le stesse frequenze di transizione di un atomo in assenza di gravità? Cioè, in uno stato di caduta libera si potrà parlare veramente di “assenza di gravitazione”, o questo si potrà dire solo per le equazioni del moto? Einstein riteneva che si potesse affermare la cancellazione degli effetti gravitazionali nei sistemi locali in caduta libera da tutte le leggi della fisica, non solo dalle leggi del moto. Per lo spazio-tempo di un campo gravitazionale arbitrario, dunque, si assume valido il il principio di equivalenza forte 3 , secondo il quale: B. In un intorno sufficientemente piccolo di ogni evento p, esiste un sistema di coordinate X a , che chiameremo localmente inerziale in p, rispetto al quale le leggi fisiche assumono la forma che hanno nella teoria della relatività ristretta in assenza di gravitazione. In particolare, in ogni punto è definito un intervallo spazio-temporale che nelle coordinate X a assume con grande approssimazione (poiché in generale il campo non è uniforme nè costante) la forma canonica della relatività ristretta ds2 = ηab dX a dX b (1.2) dove ηab è la metrica di Minkowski. Le coordinate X a sono determinate a meno di trasformazioni di Lorentz, X a → Λab X b , perché queste formano il gruppo di simmetria della 3 Una formulazione maggiormente precisa sarà data più avanti. 106 metrica di Minkowski. Una teoria che si fonda su tale principio è dunque localmente invariante di Lorentz. Si noti che l’uguaglianza delle masse inerziale e gravitazionale implica il principio di equivalenza solamente per le equazioni del moto, mentre in [B] se ne afferma la validità per tutte le leggi naturali. Per questa ragione si distingue un principio di equivalenza forte da un principio di equivalenza debole, quest’ultimo valido solo per le leggi del moto. È facile capire che una teoria basata su questo principio deve abbandonare la relatività ristretta: due osservatori distanti in caduta libera accelerano l’uno rispetto all’altro, ciò nonostante osservano le stesse leggi. 7.2 Metrica e gravitazione L’asserzione [B] contiene due idee notevoli: • si afferma che lo spazio-tempo è localmente Euclideo, nel senso che ogni punto è in un intorno che è in corrispondenza biunivoca e continua (in una parola, omeomorfo) con un aperto di R4 (cioè ad ogni punto corrispondono quattro coordinate, e la corrispondenza è continua e invertibile). • Poi si dice che esiste una metrica Lorentziana4 , e che le coordinate in un intorno di p si possono scegliere localmente inerziali: il prodotto scalare fra due vettori5 con origine in p è (u, v) = ηab ua v b (ma solo in p), dove ua (v b ) sono le componenti di u (v) rispetto alle coordinate localmente inerziali. Il primo punto è uno degli assiomi che definiscono le varietà differenziabili, il secondo punto è nella definizione di varietà Riemanniana, se la metrica è definita positiva, o semiRiemanniana nel caso contrario, e l’esistenza delle coordinate localmente inerziali è un teorema di questa geometria (tranne che in un contesto matematico si chiamano coordinate normali di Riemann). Vediamo dunque che il linguaggio matematico atto a incorporare automaticamente il principio di equivalenza, è quello delle varietà differenziabili sulle quali è definita una metrica di Lorentz, cioè un campo di tensori simmetrici di rango due con tre autovalori positivi e un solo autovalore negativo (v. appendice [A]). Siccome la definizione di varietà è leggermente elaborata, e dato che tale rigore non è strettamente richiesto in una trattazione elementare della relatività generale, abbiamo posto la definizione di varietà differenziabile in appendice [A]. Ora vogliamo discutere più in dettaglio come le varietà metriche realizzano le idee di Einstein sul campo gravitazionale in modo naturale. Consideriamo la relatività ristretta dal punto di vista di un sistema di coordinate locali arbitrario, di cui sono funzione le coordinate cartesiane inerziali, X a = X a (xb ). Queste funzioni sono in generali definite in intorno aperto dello spazio-tempo e sono differenziabili e invertibili con inverse differenziabili. Le matrici Jacobiane ∂X a /∂xb sono allora invertibili, hanno per inverse le matrici ∂xa /∂X b , e determinano l’elemento di linea nella forma 4 Chiamasi Lorentziana una metrica con tre (o n − 1 in dimensione n) autovalori positivi e un solo autovalore negativo. 5 Il concetto di vettore tangente è definito in appendice. 107 ds2 = gab (x)dxa dxb (2.1) dove gab (x) = ηcd ∂X c ∂X d ∂xa ∂xb (2.2) Ricordiamo qui che vale la convenzione di Einstein, secondo la quale si somma sugli indici ripetuti. Si noti che det g < 0. La metrica inversa è ∂xa ∂xb g (x) = η ∂X c ∂X d ab cd (2.3) ′ Più in generale, passando alle coordinate x a si ha la formula di trasformazione ′ ′ gab (x ) = ∂xc ∂xd gcd (x) ∂x′ a ∂x′ b (2.4) come segue facilmente dalla (2.1). Non solo la metrica, ma anche i tensori si trasformano in modo analogo. Ad esempio, per il vettore tangente a una curva si ha6 ′ ′ dx a ∂x a dxb = dτ ∂xb dτ Per i vettori si hanno quindi le formule di trasformazione ′ ua = ′ ∂x a a u , ∂xb ′ ua = ∂xb ua ∂x′ a (2.5) dove ua = gab ub . Insomma, tutto procede come in relatività ristretta, eccetto che le ′ ′ matrici ∂x a /∂xb e le loro inverse ∂xa /∂x b prendono il posto delle matrici di Lorentz Λab . 6 Si usi la formula di derivazione delle funzioni composte. 108 7.2.1 Moto di una particella Come è noto dalla relatività ristretta, le equazioni del moto di una massa puntiforme libera seguono dal principio variazionale ∫ δ dτ = 0, ( )1/2 dτ = −gab dxa dxb in cui la massa è assente; si ha intanto ∫ δ ) ∫ ( 1 a b a c b gab ẋ dδx + ∂c gab ẋ δx dx dτ = − 2 ) ∫ ( 1 d a b c = (gab ẋ ) − ∂a gbc ẋ ẋ δxa dτ = 0 dτ 2 (2.6) dove ẋa = dxa dτ è il quadrivettore velocità, tangente alla curva e normalizzato: gab ẋa ẋb = −1. Dalla (2.6) otteniamo le equazioni del moto d 1 (gab ẋa ) − ∂a gbc ẋb ẋc = 0 dτ 2 Calcolando la derivata 1 gab ẍb + ∂c gab ẋc ẋb − ∂a gbc ẋb ẋc = 0 2 oppure, simmetrizzando il secondo termine e moltiplicando l’equazione per la metrica inversa, ẍa + Γabc (x)ẋb ẋc = 0 (2.7) Qui abbiamo introdotto i coefficienti di connessione affine, o simboli di Christoffel del secondo tipo, 1 Γabc (x) = g ad (∂b gdc + ∂c gbd − ∂d gbc ) (2.8) 2 Le eq. (2.7) esprimono semplicemente l’asserzione che rispetto alle coordinate inerziali il moto libero è dato dalle equazioni Ẍ a = 0, le cui soluzioni, le rette, sono le geodetiche dello spazio di Minkowski. Secondo l’asserzione [A], il passaggio alle coordinate xa ha introdotto un campo gravitazionale, e infatti le (2.7) descrivono un movimento accelerato in cui le forze sono determinate dai coefficienti Γabc . Le componenti della metrica gab (x) sono allora l’analogo dei potenziali. L’argomento che ha condotto alle (2.7) è valido anche in un campo gravitazionale, solamente che in questo caso sono locali le coordinate inerziali stesse7 . 7 Cosicché non si potrà eliminare il campo con un’unica trasformazione di coordinate. 109 C. Perciò interpretiamo le (2.7) come le equazioni del moto di una particella in un campo gravitazionale, e le componenti della metrica, le dieci funzioni ′ gab (x), come il campo gravitazionale stesso. Nel sistema x , esso sarà descritto ′ ′ dalle funzioni gab (x ) date dall’equazione (2.4). È importante ricordarsi che possiamo eliminare totalmente questo campo semplicemente ritornando alle coordinate inerziali X a . Proprio perché rappresentano le “forze” gravitazionali, i coefficienti di connessione non possono trasformarsi come tensori. Passando alle ′ coordinate x a si ha8 ′ ′ ′ Γ abc (x ) = ′ ∂x a ∂xβ ∂xγ α ∂x a ∂ 2 xα Γ (x) + ∂xα ∂x′ b ∂x′ c βγ ∂xα ∂x′ b ∂x′ c (2.9) ′ Solo in questo modo, infatti, le equazioni del moto nelle coordinate x assumono la stessa forma delle (2.7). coordinate localmente inerziali Usando la connessione è facile costruire in un intorno di ogni punto un sistema di coordinate locali in caduta libera. A tale scopo, sia p un evento e indichiamo con eaα la matrice invertibile che diagonalizza la metrica in p, eaα ebβ gab (xp ) = ηλβ , eaα ebβ η αβ (xp ) = gab La trasformazione x → X data da 1 xa = xap + ebα X α − Γabc (xp )ebα ecβ X α X β + F a (X) 2 (2.10) dove F è una funzione liscia che si annulla in p insieme con le derivate prime e seconde, è localmente invertibile in un intorno aperto di p, perché ( a) ∂x = eaα ∂X α |p e dunque definisce una trasformazione di coordinate; se indichiamo con ḡαβ e Γ̄αβγ la metrica e la connessione nelle nuove coordinate, in p (cioè per X α = 0) si ha Γ̄αβγ = 0 ḡαβ = ηαβ , ossia ( ∂ḡλβ ∂X γ ) =0 |p 8 Usando la (2.8) il conto è un pó tedioso, ma elementare. Un metodo più diretto è riscrivere le (2.7) nelle nuove coordinate. 110 Le coordinate X α sono dunque inerziali in p, e nell’intorno dove la (2.10) è invertibile la metrica è costante a meno di termini che contengono solo derivate seconde o di ordine superiore della metrica. Come vedremo, queste sono connesse alla curvatura dello spaziotempo attraverso il tensore di Riemann. Una geodetica uscente da p con vettore tangente uα e parametro affine s, nelle coordinate X α ha un’espansione del tipo α X α = uα s + Cβγδ uβ uγ uδ s3 + · · · α con coefficienti Cβγδ calcolabili; in matematica le X α si chiamano coordinate localmente geodetiche in p. I geometri mostrano che in un intorno di p (che si può prendere convesso), è possibile scegliere le funzioni F α (X) tali che le geodetiche uscenti da p siano descritte da funzioni lineari del parametro affine in tutto l’intorno; tali coordinate si chiamano coordinate normali di Riemann. metrica e gravitazione Nel seguito useremo i termini “campo metrico” e “campo gravitazionale” come sinonimi, e si noti che non si tratta solo di una questione terminologica. Studiare un campo gravitazionale o la geometria della metrica Lorentziana che lo rappresenta, sono veramente la stessa cosa. Si può anche fare la seguente analogia: esplorando lo spazio con cariche elettriche ed aghi magnetici si determina il campo elettromagnetico, esplorandolo con regoli graduati ed orologi si determina il campo metrico, che è anche il campo gravitazionale. Ad esempio, provate a studiare la metrica ds2 = −(1 + gx/c2 )2 c2 dt2 + dx2 + dy 2 + dz 2 dove g è una costante (se fosse g = 0 si avrebbe la metrica di Minkowski, ossia l’assenza di campo). Ecco alcune questioni rilevanti: 1. qual’è il dominio di definizione delle coordinate? Quale di esse rappresenta il tempo? e perché? 2. come si calcola la metrica inversa? e la connessione Γabc (x, y, z)? 3. quali sono le geodetiche nulle e temporali? 4. che proprietà hanno le curve coordinate x = x0 > 0, y = z = 0? sono geodetiche? possiedono accelerazione? 5. quanto vale l’intervallo di tempo proprio fra due eventi delle curve? 6. esiste una trasformazione di coordinate che converte il campo nella metrica di Minkowski: siete capaci di trovarla? 7. è la superficie x = −c2 /g una singolarità del campo? dello spazio-tempo? delle coordinate? 111 8. quanto “tempo” impiega una particella a raggiungere la detta superficie da un punto qualunque lungo una geodetica? e un raggio di luce? 9. un raggio di luce viaggia dal punto x = x0 , y = z = 0 al punto x = x1 , y = z = 0: quanto tempo coordinato impiega? 10. una sorgente nell’origine, x = y = z = 0, emette un raggio di luce di frequenza propria ν che viene rivelato nel punto x = x1 , y = z = 0: quanto vale la frequenza propria osservata? 11. una particella è ferma rispetto alle coordinate (t, x, y, z); come si muove rispetto a un osservatore inerziale? quanto vale l’accelerazione? Si noti il “sapore” marcatamente geometrico delle domande, nonostante tutte corrispondano, più o meno direttamente, a problemi di fisica gravitazionale. 7.2.2 Distanze spaziali e intervalli di tempo È interessante discutere certe restrizioni imposte al sistema di coordinate locali dal carattere Lorentziano della metrica. Fino ad ora non abbiamo specificato quale delle quattro coordinate debba rappresentare il tempo, perché infatti è la metrica che determina le relazioni causali, non le coordinate. Tuttavia è comodo fare la convenzione che x0 sia una coordinata temporale, nel senso che le linee corrispondenti a valori fissi delle rimanenti coordinate, xj = (x1 , x2 , x3 ), rappresentano curve temporali9 . I vettori tangenti a queste curve sono di tipo tempo e normalizzati gab ua ub = −1 e hanno componenti ua = δ0a (−g00 )−1/2 Infatti, dal carattere temporale delle curve xj = xj0 , segue che g00 < 0. Sulla superficie determinata localmente dalla condizione x0 costante, tutte le curve sono spaziali (perché la metrica ha tre autovalori positivi) e quindi la metrica indotta, di componenti gij , deve essere una matrice definita positiva. Tuttavia questa non determina le distanze spaziali perché gli eventi con lo stesso valore di x0 non sono, in generale, simultanei per gli osservatori che seguono le linee temporali (cioè che hanno quadrivelocità ua ). In relatività ristretta, la condizione che due eventi con separazione ∆X a siano simultanei per un osservatore con quadrivelocità ua , è ua ∆X a = 0. Poiché differenze finite di coordinate 9 Il fatto che la metrica abbia un autovalore negativo implica che almeno una delle quattro linee coordinate (una linea coordinata è una curva lungo la quale una sola coordinata varia) sia una curva temporale (in inglese, timelike). 112 curvilinee non definiscono un quadrivettore, mentre differenze infinitesime10 sı̀, scriveremo la condizione di simultaneità per eventi vicini ua δxa = (−g00 )−1/2 ga0 δxa = 0 (2.11) Da questa segue la differenza di tempo coordinato tra eventi simultanei √ √ −g00 δx0 = γj δxj , γj = g0j / −g00 La distanza è il valore dell’intervallo ds2 tra eventi simultanei: sostituendo δx0 nella metrica si ottiene la distanza spaziale ) ( g0i g0j 2 i j δxi δxj (2.12) ds = (gij − γi γj )δx δx = gij + g00 Questa metrica non è in generale Euclidea. Ad esempio, si consideri la trasformazione di coordinate (T, R, θ, Z) → (t, r, ϑ, z), dove ϑ = θ − ωT, r = R, z = Z, t=T e (T, R, θ, Z) sono coordinate cilindriche nello spazio di Minkowski. Un punto di coordinate (r, ϑ, z) si muove rispetto al riferimento inerziale di moto circolare uniforme, con velocità angolare ω. La semplicità della trasformazione t = T è ingannevole; a causa della dilatazione relativistica del tempo, gli orologi che segnano il tempo t devono marciare tanto più rapidamente quanto più sono lontani dall’asse di rotazione. La variabile t è un esempio di tempo coordinato. La metrica di Minkowski, ds2 = −c2 dT 2 +dR2 +R2 dθ2 +dZ 2 , si trasforma nella metrica di Langevin ds2 = −(c2 − ω 2 r2 )dt2 + 2ωr2 dt dϑ + dr2 + r2 dϑ2 + dz 2 Questo è il campo gravitazionale che si manifesta rispetto al disco rotante situato nel piano z = 0. Calcolando la metrica spaziale con la (2.12) si trova r2 dϑ2 ds = dr + + dz 2 2 2 2 1 − ω r /c 2 2 Da qui vediamo che la circonferenza del cerchio di raggio r, misurata con regoli in quiete sul disco, è 2πr L= √ > 2πr 1 − ω 2 r2 /c2 un risultato che viola la geometria Euclidea! Dal punto di vista dell’osservatore inerziale che vede il disco girare, il fenomeno si spiega osservando che i regoli disposti lungo la circonferenza appaiono contratti rispetto a quelli disposti lungo un diametro, perché i primi sono disposti nel senso della velocità, che vale ωr, mentre i secondi sono trasversali al moto. L’osservatore sul disco la pensa diversamente però, dato che vede i regoli in quiete. Tuttavia nota che esiste un campo gravitazionale, e potrà concludere che l’effetto sia dovuto al comportamento dei regoli nel campo di gravità. Seguendo Einstein, possiamo concludere: 10 ′ δx a = ′ ∂x a δxb ∂xb è la formula di trasformazione di un vettore. 113 D. la geometria fisica, o naturale, che si ottiene esplorando lo spazio-tempo mediante misure con regoli graduati ed orologi11 , non è a priori conforme agli enunciati della geometria Euclidea, nè di qualunque altro sistema assiomatico. Non è quindi corretto assumere a priori la validità di un sistema geometrico assiomatico indipendentemente dalle proprietà della materia (inclusa la radiazione). Per quanto riguarda il tempo, osserviamo soltanto che l’intervallo di tempo proprio tra eventi con identiche coordinate spaziali è, ovviamente, √ dτ = −g00 (x) dx0 (2.13) e dipende dal punto. Per esempio, sulla piattaforma rotante si ha √ dτ = 1 − ω 2 r2 /c2 dt la quale significa che un orologio standard (cosı̀ chiamato per distinguerlo dall’orologio fittizio che indica il tempo coordinato) posto in r ritarda rispetto a un orologio identico posto nel centro. Come prima, secondo l’osservatore inerziale il fenomeno è dovuto alla dilatazione relativistica del tempo, visto che l’orologio posto in r viaggia con velocità ωr rispetto al sistema inerziale. L’osservatore rotante, però, vede l’orologio in quiete e quindi interpreta il ritardo come un effetto dovuto al campo gravitazionale della piattaforma12 . Si può dunque avere un ritardo degli orologi anche indipendentemente dal loro moto relativo, un effetto dovuto al campo metrico/gravitazionale che va sotto il nome di “spostamento verso il rosso” (o effetto Einstein o anche red shift). 11 Naturalmente si usano anche particelle di prova e segnali elettromagnetici. Si deve assumere che gli effetti di stress sui materiali dei regoli e degli orologi siano stati preventivamente determinati e opportunamente corretti. 12 114 Capitolo 8 Appendici A Invarianza della fase Denotiamo con C la cresta d’onda che è nell’origine al tempo t = 0. La fase in F è ( ) ( x cos α + y sin α r) F(t, x, y) = ν t − =ν t− c c e si può interpretare come il numero di oscillazioni del campo che si osservano in X = (x, y) durante l’intervallo di tempo che intercorre tra l’arrivo in X di C e l’istante t (intervallo che ammonta a t − r/c secondi). ′ Sia F un sistema di riferimento in moto relativo uniforme rispetto al sistema assoluto F , ′ con velocità v nella direzione dell’asse x, e coincidente con F nell’istante t = t = 0. Sia ′ ′ ′ ′ ′ X = (x , y ) il punto di F che coincide con X = (x, y) al tempo t = t: evidentemente il ′ numero di oscillazioni del campo in X , contate a partire dal passaggio di C fino al tempo ′ ′ t = t, coincide con quello determinato in F e determina la fase dell’onda in F ( ′ ′ ′ ′) x cos α + y sin α ′ ′ ′ ′ ′ ′ F (t , x , y ) = ν t − c′ ′ ′ ′ ′ ′ ′ ′ Dunque si ha F(t, x, y) = F (t , x , y ). Inoltre (x , y ) coincide con (x, y) al tempo t = t, e quindi si ha la trasformazione di Galilei ′ x = x − vt ′ ′ y =y t =t ′ ′ ′ ′ L’affermazione F(t, x, y) = F (t , x , y ) per ogni trasformazione di Galilei è precisamente ciò che si intende quando si dice che F(t, x, y) è un invariante del gruppo di Galilei. B La delta di Dirac Sia hn (x, x0 ) una successione di funzioni tali che ∫ hn (x, x0 )dx = 1 115 ∫ lim n→0 hn (x, x0 )f (x)dx = f (x0 ) (B.1) dove gli integrali sono estesi alla retta reale. Esempio: √ 1 −(x−x0 )2 /n hn (x, x0 ) = e πn Si noti che limn→0 hn (x, x0 ) = 0 se x ̸= x0 , ma è infinito se x = x0 , e dunque non definisce una funzione. Tuttavia il limite (B.1) esiste e definisce un funzionale lineare sullo spazio delle funzioni f , chiamate in questo contesto funzioni di prova. Questi funzionali si chiamano distribuzioni, o anche funzioni generalizzate. In accordo con l’uso che ne fanno i fisici, noi scriveremo δ(x − x0 ) per indicare il funzionale definito dalla (B.1) δ(x − x0 ) = lim hn (x, x0 ) (B.2) n→0 e scriveremo anche ∫ δ(x − x0 )f (x)dx = f (x0 ) (B.3) Però bisogna ricordarsi che δ(x − x0 ) non è una funzione e che il significato preciso della (B.3) si trova nell’Eq. (B.1). La funzione generalizzata δ(x − x0 ) si chiama delta di Dirac. Conviene prendere le funzioni f di classe C ∞ e con supporto compatto (cioè nulle nel complementare di un insieme chiuso e limitato). Si può allora definire la derivata di δ(x − x0 ) integrando per parti ∫ ′ ′ δ (x − x0 )f (x)dx = −f (x0 ) (B.4) ′ La definizione si può applicare a qualsiasi funzione generalizzata T (x): la derivata T (x) è la funzione generalizzata tale che ∫ ∫ ′ ′ T (x)f (x)dx = − T (x)f (x)dx (B.5) per ogni funzione di prova f (x). Esempio: sia θ(x) la funzione scalino di Heaviside, θ(x) = 1 se x > 0 e θ(x) = 0 se x < 0. Si ha ∫ ∫ ∞ θ(x)f (x)dx = f (x)dx 0 e dunque per il teorema fondamentale del calcolo ∫ ′ θ (x)f (x)dx = f (0) ′ Questo significa che θ (x) = δ(x), un fatto piuttosto intuitivo. Se x = (x1 , . . . , xn ) ∈ Rn definiamo δ (n) (x) = δ(x1 ) · · · δ(xn ) (B.6) Nello spazio di Minkowski avremo δ (4) (x) = δ(x0 )δ(x1 )δ(x2 )δ(x3 ). Per i nostri scopi, le principali proprietà della delta di Dirac sono 116 1. δ(x) = δ(−x) 2. δ(ax) = |a|−1 δ(x) 3. f (x) abbia N zeri semplici xn : allora δ(f (x)) = ∑ 1 δ(x − xn ) |f (xn )| ′ n 4. sia A una matrice non singolare: allora δ (n) (Ax) = | det A|−1 δ (n) (x) 5. se Λ è nel gruppo di Lorentz proprio ortocrono δ (4) (Λx) = δ (4) (x) cioè δ (4) (x) è uno scalare, invariante per trasformazioni di Lorentz. Le proprietà sono tutte conseguenze della formula di trasformazione delle variabili di integrazione. Ad esempio ∫ ∫ (n) n −1 δ (Ax)f (x)d x = | det A| δ (n) (x)f (A−1 x)dn x = | det A|−1 f (0) da cui segue la quarta proprietà. Un caso particolare della terza proprietà è la formula δ(x2 − x20 ) = 1 (δ(x − x0 ) + δ(x + x0 )) 2|x0 | (B.7) Una importante rappresentazione integrale discende dalla trasformata di Fourier ∫ ˜ f (k) = eikx f (x)dx La formula di inversione ∫ 1 f (x) = f˜(k)e−ikx dk 2π implica (lo scambio degli integrali non sarebbe ammesso, ma si può giustificare) ∫ ∫ ∫ ∫ ∫ −ikx ikx dx f (x) dk e = dk e f (x)dx = dk f˜(k) = 2π f (0) L’ultimo passaggio segue dalla formula di inversione. Dunque si ha ∫ ∫ 1 1 −ikx δ(x) = dk e = dk eikx 2π 2π (B.8) L’ultimo passaggio è evidente, oppure segue dalla parità della delta, secondo cui δ(x) = δ(−x). 117 C Testi di Riferimento Abbreviazioni: RS e RG stanno per relatività speciale e generale, rispettivamente. I testi di base sono tutti altamente raccomandabili, ma ovviamente ciascuno può studiare dove gli pare e piace. Le abbreviazioni dei testi sotto indicati, Wei, Sch, LL, Rin, Law, Wil, PP, Mø, Pau e Ber, sperabilmente, si commentano da sole. testi di base * B. Schutz[3], A First Course in General Relativity. I Cap. [1,2,3,5,6,7,8] coprono materiale simile al corso, con metodi elementari ma approfonditi (difficili sono i concetti). * S. Weinberg[4], Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity. Il Cap. [2] offre una sintesi della RS. I Cap. [3,4,5,6,7] offrono le basi della RG. Il libro è considerato un classico, ed è eccellente sotto tutti gli aspetti. * W. Rindler[5], Introduction to Special Relativity. Trattato elementare ma brillante. * L. Landau e E. Lifsitz[6], The Classical Theory of Fields. Libro eccellente. I Cap. [1,2,3,4] discutono la RS e l’elettrodinamica, non richiede conoscenze matematiche sofisticate. testi complementari * D. F. Lawden[7], Introduction to Tensor Calculus, Relativity and Cosmology. * C. Will[8], Theory and Experiments in Gravitational Physics. * W. Panofski & M. Phillips[9], Classical Electricity and Magnetism, Cap. [15,16,17,18]. Il testo di Will si occupa di relatività generale. Il PP include un capitolo sulle basi sperimentali della relatività che vale la pena di leggere. testi datati Fra i testi datati, i più istruttivi mi sembrano i seguenti: * C. Møller, The Theory of Relativity, Oxford, 1972. * W. Pauli, Theory of Relativity, Dover New Ed., 1986. * P. G. Bergmann, Introduction to the Theory of Relativity, Dover, 1976. * M. Born, Einstein’s Theory of relativity, Dover New Ed., 1962. 118 Tutti offrono punti di vista alternativi e approfondimenti su varie questioni di principio e dunque possono anche essere considerati come testi complementari. Il libro di Møller ha una interessante introduzione al quadro storico entro cui si è sviluppata la teoria della relatività. I due seguenti offrono esposizioni molto brillanti della teoria, ma Pauli è forse troppo conciso per uno studente alle prime armi. Il libro di Max Born è indirizzato ai non esperti, ma offre discussioni interessanti e approfondite dei concetti fondamentali. D Argomeni da studiare per l’esame In linea di principio tutti gli argomenti discussi nel corso dovrebbero essere studiati. Ma in pratica, allo scopo di facilitare la preparazione dell’esame, si richiederà molto meno, come di seguito specificato. 1. Fisica pre-relativistica: il primo capitolo del libro di Møller offre una panoramica dei problemi che hanno condotto alla relatività. Gli studenti dovrebbero avere un’idea delle difficoltà poste alla teoria dell’etere dall’esperimento di Michelson e Morley. 2. Relatività speciale: Schutz, Rindler e/o Landau-Lifschitz vanno tutti bene. Gli studenti devono sapere la definizione del tempo secondo Einstein, i postulati della relatività, la derivazione delle trasformazioni di Lorentz, la dilatazione del tempo e la contrazione delle lunghezze, l’addizione delle velocità, l’effetto Doppler e la formula dell’aberrazione. Ma anche la definizione del tempo proprio, del moto iperbolico, dello spazio-tempo, la metrica di Minkowski e tutto l’apparato quadri-dimensionale, il cono luce, i quadri-vettori, ecc. Integrate i vostri appunti sui libri consigliati. 3. Tensori: i tensori si possono studiare sul Schutz, gli studenti devono sapere cosa sono i tensori e come si trasformano. 4. Dinamica Relativistica: le equazioni di Eulero-Lagrange per i sistemi continui (campi) sono in LL, Cap.[4], ¶[32], il principio variazionale per le particelle in LL Cap. [2-3]. Gli studenti devono sapere le equazioni di Eulero-Lagrange, le equazioni del moto relativistiche per le particelle, le formule per la quantità di moto e l’energia, le loro formule di trasformazione e il teorema di equivalenza massa-energia. La formulazione covariante delle equazioni di Maxwell, il campo elettromagnetico in relatività, le formule di trasformazione, la corrente elettrica, l’equazione di continuità, la forza di Lorentz e l’equazione del moto per le cariche, la loro derivazione da un principio variazionale, il tutto anche in forma covariante. Le equazioni fenomenologiche di Minkowski sono facoltative. 5. Tensore energia-impulso: su LL, Cap. [4], c’è tutto per l’elettrodinamica. Lo studente deve sapere la definizione del tensore energia-impulso canonico, il significato fisico delle sue componenti, la legge di conservazione, il tensore per i fluidi perfetti e le particelle e come trattare il caso elettromagnetico. Anche Wei, Cap. [2], offre agganci con l’argomento. 119 6. Relatività Generale: Wei, i Cap. [3,4,5,6,7] coprono tutto quel che si è detto a lezione (e molto di più), tranne la teoria di Nordstrøm, che non è richiesta per l’esame. Lo stesso dicasi di Sch. Quindi studiate. Le cose minime da sapere includono il principio di equivalenza, l’uguaglianza della massa inerziale e gravitazionale, la metrica dello spazio-tempo, le forze gravitazionali, cosa sono le geodetiche e il loro significato fisico, il red-shift e la sua verifica sperimentale, il principio di covarianza generale, qualche esempio di equazione covariante rispetto al gruppo generale di trasformazioni, il limite newtoniano delle equazioni geodetiche, un’idea del tensore di Riemann e delle equazioni di Einstein quale si può ottenere sul Sch. Se non sapete o non capirete granché, ma ve la cavate bene con la RS, sarò soddisfatto. Però provateci. 120 Bibliografia [1] Neil Ashby, Relativity in the Global Positioning System, Living Rev. Relativity 6, (2003), 1. URL (cited on ¡date¿): http://www.livingreviews.org/lrr-2003-1 [2] A. Einstein, The Principle of Relativity, Dover Publications (2000). [3] B. Schutz, A First Course in General Relativity, Cambridge University Press, 1985. [4] S. Weinberg, Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity, Wiley & Sons, 1972. [5] W. Rindler, Introduction to Special Relativity, Oxford 1981. [6] L. Landau e E. Lifsitz, The Classical Theory of Fields, IV Ed. 1987, oppure Teoria dei campi, Editori Riuniti, 1976. [7] D. F. Lawden, Introduction to Tensor Calculus, Relativity and Cosmology, Dover Ed. s 1982. [8] C. Will, Theory and Experiments in Gravitational Physics, Cambridge Revised Ed. 1993. [9] W. Panofski & M. Phillips, Classical Electricity and Magnetism, Dover 2nd Edition, 1962. [10] H. P. Robertson, Rev. Mod. Phys. 21, 379 (1949). [11] R. M. Mansouri and R. U. Sexl, Gen. Rel. Grav. 8, 497 (1977); Gen. Rel. Grav. 8, 515 (1977); Gen. Rel. Grav. 8, 809 (1977). 121