Impulso, energia e "massa" associati al campo elettromagnetico Rosa Pisano Indice 1 Le trasformazioni di Lorentz dei campi 1.1 Il quadripotenziale di una carica in moto . . . . 1.2 I campi di una carica a velocità costante . . . . 1.3 Trasformazione relativistica dei campi . . . . . . 1.4 Le equazioni del moto in notazione relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 7 10 17 2 Energia e impulso dei campi 2.1 Conservazione locale . . . . . . . . . . . . . . . . . . 2.2 Conservazione dell’energia ed elettromagnetismo . . . 2.3 Densità e flusso d’energia nel campo elettromagnetico 2.4 Esempi di flusso d’energia . . . . . . . . . . . . . . . 2.5 L’impulso del campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 22 24 26 29 33 3 La massa elettromagnetica 3.1 L’energia del campo di una carica puntiforme 3.2 L’impulso di una carica in moto . . . . . . . . 3.3 La massa elettromagnetica . . . . . . . . . . . 3.4 La forza di un elettrone su sé stesso . . . . . . 3.5 Tentativi di modificare la teoria di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 40 42 43 46 1 . . . . . . . . . . . . . . . . . . . . Introduzione Scopo della tesi è quello di mostrare che sulla base della teoria elettromagnetica, i campi elettromagnetici possiedono proprietà di natura tipicamente meccanica, quali energia e impulso. Inoltre è possibile derivare le relazioni quantitative che legano tali proprietà "meccaniche" ai campi stessi. Questo lavoro è stato sviluppato secondo l’approccio seguito da Feynman nel famoso libro "La Fisica di Feynman", [1], [2], [3], [4]. Nella presente trattazione si presume la conoscenza delle basi della Relatività speciale e delle equazioni di Maxwell. Il lavoro di tesi è suddiviso in tre capitoli. Il primo capitolo ha una funzione prettamente propedeutica. Nella prima parte del capitolo si è illustrato come ricavare i campi elettrico e magnetico generati da cariche in moto arbitrario, a partire dai potenziali scalare e vettore, introducendo il concetto di "quadri-posizione ritardata". Si è partiti dalla definizione di campo elettrico e magnetico e facendo delle osservazioni sull’operatore ∇ e sul prodotto vettoriale si è giunti al risultato che i campi fanno parte di un "oggetto a sei componenti" indicato con Fµν , che è un "tensore del secondo rango antisimmetrico". A fine capitolo si sono determinate le leggi di trasformazione di Lorentz della grandezza Fµν , che qualificano Fµν come tensore. Nel secondo capitolo si è trattato della conservazione "locale" dell’energia e dell’impulso dei campi. Si è introdotta la conservazione dell’energia del campo, mostrando l’analogia con la legge di conservazione della carica. Per descrivere quantitativamente la conservazione dell’energia si è dovuto definire quanta energia c’è in un qualunque elemento di volume dello spazio e l’entità del flusso d’energia. In realtà si è notato che la conservazione dell’energia è valida se si considera anche l’energia della materia. Quindi si è trovata una equazione che descrive come l’energia totale del campo in un dato volume può decrescere sia perché una certa energia totale del campo fluisce fuori dal volume considerato sia perché il campo cede energia alla materia. 2 Infine si è studiato il problema della conservazione dell’impulso del campo elettromagnetico. Per fare ciò si è determinata la relazione che intercorre tra energia ed impulso del campo. Si è mostrato che l’impulso non è altro che il prodotto di 1/c per l’energia assorbita. Nell’ultimo capitolo si è trattato il problema della "massa elettromagnetica" di una particella carica. 3 Capitolo 1 Le trasformazioni di Lorentz dei campi 4 1.1 Il quadripotenziale di una carica in moto Il quadripotenziale elettromagnetico Aµ = (φ, A) è un quadrivettore. La componente temporale è il potenziale scalare φ e le tre componenti spaziali sono quelle del potenziale vettore A. Utilizzando le trasformazioni di Lorentz è possibile ricavare i potenziali di una particella di carica q che si muove con velocità uniforme su una linea retta. In quanto segue le unità di misura sono scelte in maniera tale che la velocità della luce risulti c = 1. Consideriamo un carica puntiforme che all’istante di tempo t si trova nella posizione (vt, 0, 0). Adoperando le trasformazioni di Lorentz ricaviamo che i potenziali nel punto di coordinate (x, y, z) sono dati da: φ= 4πε0 √ Ax = 4πε0 q (x − vt)2 1 1 − v2[ + y2 + z2] 2 2 1−v √ qv (x − vt)2 1 1 − v2[ + y2 + z2] 2 2 1−v Ay = Az = 0 (1.1) (1.2) (1.3) Osserviamo che le equazioni sono espresse per mezzo di (x − vt) , y e z che rappresentano le coordinate misurate a partire dalla posizione attuale P (dove con il termine attuale si intende la posizione della carica all’istante t) 4 della carica in moto. Fig.(1.1) Campi dovuti a una carica q L’influenza effettiva della carica viaggia con la velocità della luce, perciò è il comportamento della carica nella posizione ritardata P 0 quello che realmente conta. Il punto P 0 si trova in x − vt0 (dove t0 = t − r0 /c é il tempo ritardato). Bisogna ricordare che la carica si muove con velocità uniforme, in linea retta: allora il comportamento in P 0 e la posizione attuale sono direttamente collegati. Aggiungendo l’ipotesi che i potenziali dipendono solamente dalla posizione e dalla velocità all’istante ritardato si ha nelle equazioni (1.1), (1.2), (1.3) una formula completa per i potenziali di una carica che si muove in modo qualunque. Si prenda in considerazione una carica che si muove in modo arbitrario secondo la traiettoria in Figura 1.2. Fig.(1.2) Carica che si muove su una traiettoria arbitraria Si vogliono determinare i potenziali nel punto (x, y, z). Inizialmente si trovano la posizione ritardata P 0 e la velocità v 0 . Si suppone 5 che la carica continui a muoversi con la stessa velocità durante l’intervallo di ritardo −∞ < (t0 − t) < +∞ , in modo tale che essa si trovi in una posizione immaginaria Pp (chiamata " posizione proiettata ") e che ci arrivi con la velocità v 0 . (Ovviamente la vera posizione della carica all’istante t è in P ). Allora i potenziali in (x, y, z) sono quelli che le equazioni (1.1), (1.2), (1.3) danno con la carica immaginaria che occupa la posizione Pp . Siccome i potenziali dipendono solo da ciò che la carica fa all’istante ritardato, essi saranno gli stessi sia che la carica continui a muoversi a velocità costante, sia che abbia cambiato velocità dopo l’istante t0 , ossia dopo che i potenziali si devono manifestare in (x, y, z) al tempo t erano già stati determinati. Grazie alla formula dei potenziali di una carica che si muove a velocità arbitraria abbiamo l’elettrodinamica; per sovrapposizioni si possono ottenere i potenziali di qualsiasi distribuzione di carica. Tutti i fenomeni dell’elettrodinamica possono essere riassunti o scrivendo le equazioni di Maxwell o facendo le seguenti osservazioni: (a) Aµ è un quadrivettore q ; (b) il potenziale di Coulomb di una carica stazionaria è 4πε0 r (c) i potenziali prodotti da una carica che si muove di moto qualunque dipendono solo dalla velocità e dalla posizione al tempo ritardato. Essendo Aµ un quadrivettore trasformando il potenziale di Coulomb si ottengono i potenziali nel caso di moto uniforme. Poiché i potenziali dipendono dalla velocità al tempo ritardato, si può pensare di utilizzare l’artificio della posizione proiettata per determinarli. Molte persone affermano che l’intera elettrodinamica può essere dedotta partendo solamente dalle trasformazioni di Lorentz e dalla legge di Coulomb. Ciò è completamente falso. Prima di ogni cosa bisogna supporre che c’è un potenziale scalare e un potenziale vettore (che assieme costituiscono un quadrivettore) che permettono di studiare come i potenziali si trasformano. Ci chiediamo: perché i potenziali dipendono dalla posizione e dalla velocità e non, per esempio, dall’accelerazione? I campi E e B dipendono dall’accelerazione. Se provassimo ad applicare ad essi lo stesso tipo di ragionamento, potremmo dire che dipendono solo dalla posizione e dalla velocità al tempo ritardato. Ma allora i campi prodotti da una carica in moto accelerato sarebbero gli stessi dei campi della carica nella posizione proiettata, il che è assolutamente falso. I campi non dipendono soltanto da velocità e posizione, ma anche dall’accelerazione. 6 1.2 I campi di una carica a velocità costante Una volta determinati i potenziali di una carica puntiforme che si muove a velocità costante, ricaviamo i campi. Vi sono molti casi in cui le particelle si muovono di moto uniforme, per esempio i raggi cosmici che attraversano una camera di Wilson, o anche elettroni che si muovono lentamente in un filo. Studiamo che aspetto hanno i campi per velocità qualunque, anche vicine a quella della luce, nella sola ipotesi che non vi sia accelerazione. I campi si ottengono dai potenziali (1.1), (1.2), (1.3) con le usuali regole ∂A e B=∇×A . E = −∇φ − ∂t Cominciamo con Ez : ∂φ ∂Az − . ∂z ∂t Ma Az è zero; perciò derivando nelle equazioni (1.1), (1.2), (1.3) si ottiene Ez = − Ez = q z √ 2 2 3 4πε0 1 − v (x − vt) [ +y 2 + z 2 ] 2 2 1−v (1.4) Analogamente per Ey si ha Ey = q y √ 2 2 3 4πε0 1 − v (x − vt) +y 2 + z 2 ] 2 [ 2 1−v (1.5) La componente x del campo non è semplice da calcolare, richiede piu lavoro. La derivata di φ è piu complicata e Ax non è zero. Come prima cosa si calcola − ∂φ q (x − vt)/(1 − v 2 ) √ = ∂x 3 4πε0 1 − v 2 (x − vt)2 2 [ +y + z 2 ] 2 2 1−v (1.6) Derivando Ax rispetto a t si ricava − ∂Ax q −v 2 (x − vt)/(1 − v 2 ) √ = ∂t 3 4πε0 1 − v 2 (x − vt)2 2 [ +y + z 2 ] 2 2 1−v (1.7) E infine sommando si ottiene Ex = q (x − vt) √ 3 4πε0 1 − v 2 (x − vt)2 2 2] 2 [ +y + z 1 − v2 7 (1.8) Prima di analizzare la fisica del campo elettrico E, determiniamo il campo magnetico B. Per la componente z si ha: Bz = ∂Ay ∂Ax − . ∂x ∂y Poiché Ay è nullo, non rimane che ricavare una sola derivata. Notiamo però che Ax non è altro che vφ , e ∂/∂y di vφ è semplicemente −vEy . Perciò si ha Bz = vEy . (1.9) By = −vEz (1.10) Similmente By = ∂φ ∂Ax ∂Az − = +v ∂z ∂x ∂z e quindi Infine Bx è nullo perché sia Ay che Az sono uguali a zero. Si può scrivere il campo magnetico B nella forma semplice B=v×E (1.11) Analizziamo ora che aspetto hanno i campi. Tracceremo un’immagine del campo in varie posizioni intorno alla posizione presente della carica. È vero che l’influenza della carica proviene, in un certo senso, dalla sua posizione ritardata, ma siccome il moto è specificato, la posizione ritardata è data univocamente in base alla sua posizione presente. Per velocità uniformi è più conveniente riferire i campi alla posizione presente, perché le componenti dei campi nel punto (x, y, z) dipendono solamente da (x − vt), y e z che sono le componenti dello spostamento rp dalla posizione presente al punto (x, y, z). Consideriamo un punto con z = 0. Allora il campo E ha solo componenti lungo x e y dalle equazioni (1.5) e (1.8) il rapporto di queste componenti risulta uguale al rapporto fra le componenti x e y dello spostamento: ciò sta a significare che E ha la stessa direzione di rp . Siccome Ez è anche proporzionale a z, è chiaro che il risultato vale in tre dimensioni. 8 Riassumendo, il campo elettrico è radiale rispetto alla carica e le linee di campo emanano radialmente da essa, proprio come fanno per una carica stazionaria. Ovviamente il campo non è esattamente lo stesso come per una carica stazionaria, a causa dei fattori extra in (1 − v 2 ). Si può fare un’interessante osservazione: la differenza è quella che si otterrebbe se si tracciasse il campo di Coulomb per mezzo di uno speciale √ sistema di coordinate in cui la scala dell’asse x fosse strizzata di un fattore 1 − v 2 . In questo modo le linee di campo si diraderanno avanti e dietro la carica e si stringeranno ai lati di essa. Collegando l’intensità di E alla densità delle linee di campo, si osserverà un campo più intenso ai lati e più debole davanti e dietro la carica, che è proprio ciò che affermano le equazioni. Se esaminiamo l’intensità del campo ad angolo retto con la linea di moto, cioè per (x − p vt) = 0, la distanza della 2 2 carica è (y + z ). L’intensità totale del campo è Ey2 + Ez2 che dà E= 1 q √ . 4πε0 1 − v 2 y 2 + z 2 (1.12) Il campo è proporzionale all’inverso del quadrato della distanza, come per il √ campo di Coulomb, eccetto per un aumento dovuto al fattore costante 1/ 1 − v 2 , che è sempre maggiore di uno. Per cui lateralmente a una carica in moto il campo elettrico è più intenso di quello che si ottiene dalla legge di Coulomb. Infatti il campo in direzione laterale è più grande del potenziale di Coulomb nel rapporto dell’energia della particella alla sua massa di quiete. Davanti alla carica (e dietro) y e z sono zero, quindi E = Ex = q(1 − v 2 ) . 4πε0 (x − vt)2 (1.13) Anche in questo caso il campo varia come l’inverso del quadrato della distanza della carica, però ridotto secondo il fattore (1−v 2 ). Se v/c è piccolo, v 2 /c2 è ancora più piccolo e l’effetto dei termini in (1−v 2 ) è molto piccolo: in poche parole siamo ritornati alla legge di Coulomb. Se una particella si muove con una velocità prossima a quella della luce, il campo nella direzione in avanti viene ridotto enormemente, mentre quello in direzione laterale è aumentato. Le linee di campo non sono reali ma sono solo un modo di rappresentare il campo. In questo caso però, se si commette l’errore di pensare che le linee di campo esistono in qualche modo realmente nello spazio e si applicano le trasformazioni di Lorentz, si ottiene il campo giusto. Ciò non rende le linee di campo più reali. Quello che occorre per ricordare che le linee di campo non sono reali è di pensare al campo elettrico prodotto da una carica associata ad 9 un magnete; quando il magnete si muove, si producono nuovi campi elettrici che distruggono il disegno delle linee di campo. Il campo magnetico è v × E. Considerando il prodotto vettoriale della velocità con un campo radiale si ottiene un campo B che circola attorno alla linea di moto. Se si rimettono i c al loro posto,otteniamo lo stesso risultato che si aveva per cariche a piccola velocità. Un metodo per stabilire dove sistemare i c è di ricondursi alla legge di forza F = q(E + v × B). Una velocità moltiplicata per un campo magnetico ha le stesse dimensioni di un campo elettrico; perciò il secondo membro dell’equazione (1.12) deve avere un fattore 1/c2 : B= v×E c2 (1.14) Per una carica che si muove molto lentamente (v c), si può scegliere E il campo di Coulomb; allora si ha B= 1.3 q v×r . 4πε0 r3 (1.15) Trasformazione relativistica dei campi Finora abbiamo calcolato i campi elettrici e magnetici a partire dai potenziali trasformati. Sarebbe più comodo, per diversi scopi, avere un modo di calcolare i campi in un sistema mobile quando già si conoscono in un sistema "in quiete". Le leggi di trasformazione per φ e A le conosciamo, in quanto Aµ è un quadrivettore. Ora desideriamo conoscere le leggi di trasformazione dei campi E e B. Ci chiediamo: dati i campi E e B in un riferimento, come si presentano in un altro riferimento in moto rispetto al primo? Si potrebbe tornare ai campi passando per i potenziali, ma in molti casi è conveniente saper trasformare i campi direttamente. Come si possono trovare le leggi di trasformazione dei campi? Conosciamo le leggi di trasformazione di φ e A e sappiamo che i campi si esprimono per mezzo di essi: allora dovrebbe risultare facile trovare le trasformazioni di E e B. Prendiamo in esame il campo magnetico B che è definito come ∇ × A. Sappiamo che il potenziale vettore, con le sue componenti secondo x, y e z è solamente un pezzo di una certa cosa: c’è anche una componente temporale. 10 Inoltre per le derivate, come ∇, oltre alle parti relative a x, y e z c’è anche una derivata rispetto a t. Proviamo ad immaginare cosa accade se si sostituisce un ”y” con un ”t”, o una ”z” con un ”t” o qualcosa di simile. Analizziamo la forma dei termini in ∇ × A quando si scrivono le componenti: Bx = ∂Az ∂Ay − , ∂y ∂z By = ∂Ax ∂Az − , ∂z ∂x Bz = ∂Ay ∂Ax − . ∂x ∂y (1.16) La componente x è uguale a una somma di termini in cui compaiono le componenti secondo y e z. Supponiamo di chiamare la combinazione di derivate e di componenti un ”oggetto zy” e dargli un nome stenografico:Fzy . In poche parole ∂Az ∂Ay − (1.17) Fzy ≡ ∂y ∂z Analogamente, By è uguale allo stesso tipo di ”oggetto”, ma in questo caso si tratta di un ”oggetto xz”. E ovviamente, Bz è il corrispondente ”oggetto yx”. Perciò abbiamo: B x = Fzy , By = Fxz , Bz = Fyx . (1.18) Cosa accade se si tenta di inventare un qualche oggetto di tipo ”t” come Fxt e Ftz (giacché la natura dovrebbe essere simmetrica in x, y e z)? Per esempio, ∂At ∂Az − . cos’è Ftz ? È naturalmente ∂z ∂t ∂φ ∂Az Ricordiamo che è At = φ, così che questo è anche − . È la componente ∂z ∂t z del campo elettrico E, ma c’è un segno sbagliato. Si è dimenticati che nel gradiente quadridimensionale la derivata rispetto a t è di segno opposto rispetto alle derivate rispetto a x, y e z. Perciò si sarebbe dovuto scegliere come generalizzazione per Ftz l’espressione Ftz = ∂At ∂Az + ∂z ∂t (1.19) Allora diventa esattamente −Ez . Studiando gli ”oggetti” Ftx e F ty si trova che le tre possibilità danno i seguenti risultati: Ftx = −Ex , Fty = −Ey , Ftz = −Ez . Cosa accade se entrambi gli indici sono t? Oppure se ambedue sono x? Si ∂At ∂At ∂Ax ∂Ax ottengono oggetti del tipo Ftt = − , e Fxx = − , che danno ∂t ∂t ∂x ∂x come risultato zero. Dunque abbiamo sei di questi oggetti F . Ve ne sono altri sei che si ottengono invertendo gli indici, ma studiando questi oggetti non si hanno nuovi risultati, poiché Fxy = −Fyx e così via. 11 Di sedici possibili combinazioni dei quattro indici presi a coppie, si ottengono soltanto sei oggetti fisici differenti ed essi sono le componenti di B e E. Per rappresentare il termine generale di F , verranno utilizzati gli indici generali µ e ν che possono simboleggiare 0, 1, 2 o 3, intendendo nella usuale notazione quadrivettoriale t, x, y, e z. Perciò tutto sarà coerente con la notazione quadrivettoriale se si definisce Fµν ponendo F µν = ∇µ Aν −∇ν Aµ , ricordando che ∇µ = (∂/∂t, −∂/∂x, −∂/∂y, −∂/∂z) e Aµ = (φ, Ax , Ay , Az ). Il risultato è che si sono trovate sei grandezze, in natura collegate tra di loro, che sono aspetti diversi della stessa cosa. I campi elettrico e magnetico considerati come vettori distinti nel mondo delle piccole velocità non sono vettori nello spazio quadridimensionali. Essi sono parte di un nuovo ”oggetto”. Il "campo" fisico è in realtà l’oggetto a sei componenti Fµν . Questo è il modo in cui bisogna considerare il campo secondo la Relatività. I risultati ottenuti per Fµν vengono riassunti nella seguente tabella: Le componenti di Fµν Fµν = −Fνµ Fµµ = 0 Fxy = −Bz Fxt = Ex Fyz = −Bx Fyt = Ey Fzx = −By Fzt = Ez Tabella 1 Ciò che abbiamo fatto è quello di generalizzare il prodotto vettoriale. Si è iniziato con l’operazione rotore e si sono utilizzate le proprietà di trasformazione del rotore che sono le stesse di due vettori. Vogliamo ora esaminare un prodotto vettoriale ordinario in tre dimensioni, per esempio il momento angolare di una particella. Quando un oggetto si muove in un piano, la grandezza (xvy − yvx ) è importante. Per il moto in tre dimensioni ci sono tre analoghe grandezze importanti, che prendono il nome di momento angolare: Lxy = m(xvy − yvx ), Lyz = m(yvz − zvy ), Lzx = m(zvx − xvz ). Delle nove grandezze possibili, ci sono soltanto tre numeri che sono indipendenti; e succede che quando si cambia sistema di coordinate questi tre oggetti si trasformano esattamente nello stesso modo delle componenti di un vettore. In tre dimensioni è un caso fortunato che dopo aver preso una combinazione di vettori, essa si possa rappresentare anche per mezzo di un altro vettore; questo perché ci sono tre termini che si trasformano come le componenti di un vettore. In quattro dimensioni questo è praticamente impossibile, perché ci sono sei termini indipendenti e non è possibile rappresentare sei cose per 12 mezzo di quattro. Anche in tre dimensioni è possibile avere delle combinazioni di vettori che non si possono rappresentare con dei vettori. Per esempio, prendiamo in considerazione due generici vettori a = (ax , ay , az ) e b = (bx , by , bz ) e costruiamo le varie possibili combinazioni di componenti, come ax bx , ax by , ecc. Sono nove le possibili grandezze. ax b x , ay b x , az b x , ax by , ay by , az by , ax bz ay bz az bz che potremmo chiamare, per semplicità Tij . Se si passa ad un sistema di coordinate ruotato le componenti di a e b sono variate. Nel nuovo sistema ax , per esempio, viene sostituito da 0 a x = ax cosθ + ay sinθ, e by viene sostituita da 0 b y = by cosθ − bx sinθ. E in modo analogo si ottengono le altre componenti. Le nove componenti della grandezza-prodotto T ij , ovviamente, sono anch’esse cambiate. Per esempio T xy = ax by si cambia in 0 Txy = ax by (cos2 θ) − ax bx (cosθsinθ) + ay by (sinθcosθ) − ay bx (sin2 θ) ossia 0 Txy = Txy cos2 θ − Txx cosθsinθ + Tyy sinθcosθ − Tyx sin2 θ. 0 Ciascuna componente di Tij è combinazione lineare delle componenti di Tij . Allora si è giunti a questo risultato: non soltanto è possibile avere un “prodotto vettoriale” come a × b, che ha tre componenti che si trasformano come un vettore, ma si può costruire un altro tipo di “prodotto” Tij di due vettori, con nove componenti che si trasformano per effetto di una rotazione secondo determinate regole, che si possono anche ricavare. Un simile oggetto che richiede due indici per descriverlo, prende il nome di tensore. Il punto fondamentale è che la grandezza elettromagnetica Fµν è un tensore del secondo rango, questo nome è dovuto al fatto che ha due indici. Però è un tensore in quattro dimensioni. Nel caso di Fµν se si scambiano gli indici esso cambia di segno. È un caso particolare: si tratta di un tensore antisimmetrico. Possiamo dire che i campi elettrico e magnetico sono entrambi parte di un tensore antisimmetrico del secondo rango in quattro dimensioni. Ora bisogna determinare la legge di trasformazione di Fµν , in particolare quello che si vuole fare è trovare le trasformazioni di Lorentz di ∇µ Aν − ∇ν Aµ . 13 Poiché ∇µ non è un caso speciale di vettore, ci riferiremo alla generica combinazione vettoriale antisimmetrica che, per semplicità, chiameremo Gµν : Gµν = aµ bν − aν bµ . (1.20) Le componenti di aµ e bµ si trasformano mediante le trasformazioni di Lorentz che sono: at − vax bt − vbx 0 0 at = √ bt = √ 1 − v2 1 − v2 a − va b 0 0 x t x − vbt ax = √ bx = √ 1 − v2 1 − v2 0 ay = ay 0 az = az 0 b y = by 0 b z = bz Proviamo a trasformare di Gµν . Iniziamo con Gtx : le componenti bx − vbt ax − vat at − vax 0 0 0 0 0 √ − √ = at b x − ax b t . Gtx = at bx − ax bt = √ 1 − v2 1 − v2 1 − v2 0 Questo non è altro che Gtx ; perciò si è giunti al seguente risultato Gtx = Gtx . Calcoliamo un’altra componente: (at by − ay bt ) − v (ax by − ay bx ) bt − vbx at − vax 0 √ b y − ay √ = . Gty = √ 2 2 1−v 1−v 1 − v2 Gty − vGxy 0 Otteniamo Gty = √ . 1 − v2 Gtz − vGxz 0 In modo analogo, troviamo Gtz = √ . 1 − v2 Costruiamo una tabella per tutti e sei i termini; che possiamo scriverli anche per Fµν : Le trasformazioni di Lorentz dei campi 0 Ex = Ex Ey − vBz 0 Ey = √ 1 − v2 Ey + vBy 0 Ez = √ 1 − v2 0 Bx = bx By + vEz 0 By = √ 1 − v2 Bz + vEy 0 Bz = √ 1 − v2 14 Tabella 2 Le equazioni della tabella 2 permettono di studiare come variano i campi E e B quando si passa da un sistema di riferimento inerziale ad un’altro. Se si conoscono E e B in un riferimento si può trovare cosa sono in un riferimento che è in moto rispetto al primo con velocità v. Queste equazioni si possono scrivere in una forma che risulta molto più semplice, facendo una piccola osservazione: poiché v è nella direzione x, tutti i termini contenenti v sono delle componenti dei prodotti vettoriali v × E e v × B. Fatta questa osservazione, le trasformazioni si possono riscrivere come in Tabella 3: Un’altra forma della trasformazione dei campi 0 Ex = Ex (E + v × B)y Ey = √ 1 − v2 (E + v × B)z 0 Ez = √ 1 − v2 0 0 Bx = bx (B − v × E)y By = √ 1 − v2 (B − v × E)z 0 Bz = √ 1 − v2 Tabella 3 0 Ricordiamo che c = 1. Le trasformazioni possono essere scritte in maniera molto più semplice, definendo le componenti del campo lungo x come componenti “parallele” Ek e Bk (in quanto parallele alla velocità relativa dei sistemi di riferimento); e come componenti “perpendicolari” E⊥ e B⊥ , le somme vettoriali delle componenti y e z. Allora si ottengono le equazioni della Tabella 4: Un’altra forma della trasformazione di Lorentz dei campi 0 Ek = E (E + v × B)⊥ 0 E⊥ = p 1 − v 2 /c2 0 Bk = B v×E B− c2 0 ⊥ B⊥ = p 2 2 1 − v /c 15 Tabella 4 Le trasformazioni dei campi permettono di risolvere problemi come: trovare i campi di una carica puntiforme in moto. Dapprima si sono ricavati i campi derivando i potenziali. Ora si possono ricavare trasformando il campo di Coulomb. La trasformazione della Tabella 2 fornisce una risposta riguardo a ciò che si vede se ci si muove rispetto a un qualunque sistema di cariche. Supponia0 mo di voler conoscere i campi nel nostro riferimento S se ci si muove tra le lastre di un condensatore, come in figura: Fig.(1.3) Sistema di coordinate in moto attraverso un campo elettrico Cosa si osserva? In questo caso la trasformazione è semplice, in quanto il campo B è nullo nel sistema originario. Supponiamo, inizialmente, che il p 0 moto sia perpendicolare ad E, allora si osserverà un E = E/ 1 − v2 /c2 che è una componente trasversale. Inoltre, si avrà un campo magnetico 0 0 B = −v × E /c2 . Perciò quando ci si muove perpendicolarmente a un campo elettrico statico, si osserva un campo E ridotto assieme ad un campo B 0 trasversale. La componente parallela rimane invariata, Ek = Ek e per la componete perpendicolare si procede come appena detto. Prendiamo ora il considerazione il caso opposto, ossia supponiamo di muoverci attraverso un campo magnetico statico puro. In questo caso, si osserverà 0 0 un campo elettrico pE uguale a v × B , mentre il campo magnetico cambia per un fattore 1/ 1 − v 2 /c2 . Fintanto che v è molto minore di c, si può trascurare il cambiamento del campo magnetico e l’effetto principale è che appare un campo elettrico. Come esempio di tale effetto, si consideri il problema di determinare la velocità di un aeroplano. Questo problema ai giorni d’oggi è facilmente risolvibile grazie ai radar in grado di determinare la velocità di un aeroplano in presenza di cattivo tempo. Prima non si poteva vedere il terreno, né conoscere la verticale. Tuttavia era importante sapere con che velocità ci si muoveva rispetto alla terra. Molti conoscevano le formule di trasformazione e sfruttarono il fatto che l’aeroplano si muove nel campo magnetico terrestre. Supponiamo che un aeroplano si muova in un campo magnetico a noi noto. Si prenda in considerazione il caso in cui il campo è verticale: se si vola attraverso di esso con una velocità orizzontale v, secondo la formula si do16 vrebbe vedere un campo elettrico v × B, che è perpendicolare alla linea di moto. Inoltre, se si tende un filo isolato attraverso l’aeroplano, questo campo indurrà delle cariche ai capi del filo. Non si osserva nulla di nuovo: dal punto di vista dell’osservatore a terra, stiamo semplicemente spostando un filo attraverso un campo e la forza v × B costringe delle cariche a spostarsi verso i capi del filo. Le equazioni di trasformazione dei campi affermano la stessa cosa , ma in modo diverso. Perciò per misurare v bisogna misurare il voltaggio ai capi del filo. Non si può fare utilizzando un voltmetro in quanto gli stessi campi agiranno sui fili del voltmetro, ma vi sono anche altri modi di misurare i campi. Di conseguenza dovrebbe risultare possibile misurare la velocità dell’aeroplano. Però questo problema non venne mai risolto, in ragione del fatto che il campo che si produce è dell’ordine dei millivolt per metro. È possibile misurare questi campi, ma il guaio è che essi non sono diversi da qualsiasi altro campo elettrico. Il campo prodotto dal moto attraverso il campo magnetico non si può distinguere dal campo elettrico che era già presente nell’aria per un’altra causa, dovuta, per esempio, a cariche elettro-statiche presenti nell’aria o nelle nuvole. Mentre l’aeroplano vola attraverso l’aria, esso vede delle fluttuazioni del campo elettrico atmosferico che sono enormi in confronto del piccolo campo prodotto dal termine v × B e il risultato è che per ragioni pratiche non è possibile misurare la velocità di un aeroplano per mezzo del suo moto attraverso al campo magnetico terrestre. 1.4 Le equazioni del moto in notazione relativistica I campi sono necessari per trovare le forze agenti sulle cariche e queste forze determinano il moto della carica. Perciò, parte della teoria dell’elettrodinamica riguarda la relazione tra il moto delle cariche e le forze. Per una singola carica, nei campi E e B, la forza è data da: F = q (E + v × B) . (1.21) Tale forza è uguale alla massa moltiplicata per l’accelerazione, per basse velocità, ma la legge corretta per p velocità qualunque è che la forza è uguale a d p/d t. Scrivendo p = mv/ 1 − v 2 /c 2 , si trova l’equazione del moto relativistica corretta è: ! d mv p = F = q (E + v × B) . (1.22) dt 1 − v 2 /c2 17 Discutiamo ora questa equazione dal punto di vista della Relatività. Considerando le equazioni di Maxwell in forma relativistica, è interessante vedere che aspetto assumono le equazioni del moto in forma relativistica. Prima di tutto, vediamo se è possibile riscrivere l’ equazione (1.22) in notazione quadrivettoriale. Ricordiamo che l’impulso fa pparte di un quadrivettore pµ la cui componente temporale è l’energia m0 / 1 − v 2 /c2 . Perciò potremmo pensare di sostituire il primo membro dell’equazione con dpµ /dt. Occorre trovare anche una quarta componente da associare a F . La quarta componente deve eguagliare la variazione d’energia per unità di tempo, che è F · v. Si cerca dunque di riscrivere il secondo membro dell’equazione (1.22) come un quadrivettore del tipo (F · v, Fx , Fy , Fz ). Ma questo non rappresenta affatto un quadrivettore. La derivata temporale di un quadrivettore non è un quadrivettore, perché d/dt richiede la scelta di in un riferimento particolare per misurare t. Bisogna adoperare delle congetture: dx dy dz 1. la componente temporale è cdt/dt = c. Ma le grandezze (c, , , ) = dt dt dt (c, v) non sono le componenti di un quadrivettore. p Possono diventarlo se si moltiplica ciascuna componente di d/dt per 1/ 1 − v 2 /c2 . La “quadrivelocità” uµ è il quadrivettore ! c v uµ = p ,p (1.23) 1 − v 2 /c2 1 − v 2 /c2 p Utilizzando l’artificio di "moltiplicare" d/dt per 1/ 1 − v 2 /c2 , vi è la possibilità che le derivate rappresentano un quadrivettore. 1 d (pµ ) rappresenta un quadrivettore. 2. p 1 − v 2 /c2 dt Ma cosa rappresenta v? È la velocità della particella, non quella di un sistema di coordinate! La grandezza definita da: ! F·v F fµ = p ,p (1.24) 1 − v 2 /c2 1 − v 2 /c2 è l’estensione a quattro dimensioni della forza, che per semplicità chiameremo “quadri-forza.” Rappresenta p realmente un quadrivettore e le sue componenti spaziali sono quelle di F/ 1 − v2 /c2 . Perché fµ èpun quadrivettore? È interessante capire il significato del fattore 1/ 1 − v 2 /c2 . È giunto il momento di capire del perché d/dt si può aggiustare sempre con lo stesso fattore. 18 La risposta è la seguente: quando si vuole calcolare la derivata temporale di una funzione x, si calcola l’incremento 4x in un intervallo 4t della variabile t; ma in un altro sistema di riferimento l’intervallo 4t potrebbe corrispondere a un cambiamento sia di t0 che di x0 , perciò se si varia soltanto t0 , la variazione di x sarà differente. Bisogna trovare una variabile per la derivazione che sia la misura di un “intervallo” nello spazio-tempo, che sarà lo stesso in tutti i sistemi di coordinate. Quando una particella si “muove” nel quadrispazio, si hanno le variazioni, 4t, 4x, 4y, 4z. Utilizzando queste variazioni, è possibile costruire un intervallo invariante? Esse rappresentano le componenti del quadrivettore xµ = (ct, x, y, z) , quindi se si definisce la grandezza 4s ponendo: (4s)2 = 1 1 4xµ 4xµ = 2 c2 4t2 − 4x2 − 4y 2 − 4z 2 2 c c (1.25) si ottiene un quadriscalare che si può utilizzare come misura di un intervallo R quadridimensionale. Mediante 4s si può definire un parametro s = ds. E la derivata rispetto a s, d/ds, è una corretta operazione quadridimensionale perché invariante rispetto a una trasformazione di Lorentz. È facile collegare ds a dt per una particella in moto. Per una particella puntiforme che si muove si ha: dx = vx dt, dy = vy dt, dz = vz dt, (1.26) e q p ds = (dt2 /c2 ) c2 − vx2 − vy2 − vz2 = dt 1 − v 2 /c2 (1.27) 1 d Perciò l’operatore p é un operatore invariante. 2 2 1 − v /c dt Se con esso si opera su un qualunque quadrivettore si ottiene un altro quadrivettore. Per esempio, se operiamo su (ct, x, y, z) otteniamo la quadrivelocità uµ : dxµ = uµ . ds p Da qui si capisce perché il termine 1 − v 2 /c2 sistema le cose. La variabile invariante s è un’ utile grandezza fisica. Essa è chiamata il “tempo proprio” lungo il percorso della particella, perché ds è sempre un intervallo di tempo in un riferimento che, a qualsiasi particolare istante, si muove con la particella. 19 Allora l’equazione di Newton può essere riscritta nella forma: dpµ = fµ ds (1.28) dove fµ è data dall’equazione (1.24). Inoltre l’impulso può essere scritto: pµ = muµ = m dxµ ds (1.29) dove le coordinate xµ = (ct, x, y, z) descrivono la traiettoria della particella. Infine la notazione quadridimensionale dà la seguente forma semplice delle equazioni del moto: d 2 xµ (1.30) fµ = m 2 ds Consideriamo nuovamente l’equazione (1.22) e vediamo come si può scrivere il membro di destra in notazione quadrivettoriale. Le tre componenti - quanp do divise per 1 − v 2 /c2 - non sono altro che le componenti di fµ ; dunque è " # q (E + v × B)x vy Bz vz By Ex =q p +p −p fx = p 1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2 (1.31) Ora non rimane che p dare a tutte le pgrandezze la loro pnotazione relativistica. 2 2 2 2 Prima di tutto c/ 1 − v /c , vy / 1 − v /c e vz / 1 − v 2 /c2 sono le componenti secondo t, y e z della quadrivelocità uµ . Le componenti di E e B sono le componenti del tensore del secondo ordine dei campi Fµν . Osservando la Tabella 1 le componenti di Fµν che corrispondono a Ex , Bz e By troviamo che: fx = q (ut Fxt − uy Fxy − uz Fxz ) Ogni termine in questa espressione presenta un indice x, giacché stiamo calcolando una componente x. Tutti gli altri indici appaiono in coppia: xt, xy, xz, eccetto il termine xx, che manca. Scriviamo il termine mancante: fx = q (ut Fxt − ux Fxx − uy Fxy − uz Fxz ) 20 (1.32) Nell’espressione di fx non abbiamo alterato nulla inserendo il termine in xx, in quanto Fµν è antisimmetrico, quindi Fxx = 0. Il motivo per cui si include il termine in xx è una pura questione steneografica, ossia riscrivere l’ equazione (1.32) nella forma: fµ = quν Fµν (1.33) Tale equazione è equivalente alla (1.32) se si pone la regola che ogni volta che un indice appare due volte si sommano i termini. L’ equazione (1.33) funziona anche se si pone µ = y e µ = z. Ma cosa accade se µ = t? Se µ = t otteniamo : ft = q (ut Ftt − ux Ftx − uy Fty − uz Ftz ). Ora bisogna tradurre questa espressione in termini delle componenti di E e B. Otteniamo: vx vy vz Ex + p Ey + p Ez ft = q 0 + p 1 − v 2 /c2 1 − v 2 /c2 1 − v 2 /c2 ! , (1.34) ossia qv · E ft = p . Ma secondo l’ equazione (1.24) si deve pensare che ft sia 1 − v 2 /c2 dato da: F·v q (E + v × B) · v p p = . 2 2 1 − v /c 1 − v 2 /c2 Questa equivale all’equazione (1.34), poiché (v × B) · v è uguale a zero. Riassumendo, l’equazione del moto può essere scritta nella forma: d 2 xµ = fµ = quν Fµν (1.35) ds2 Benché si è mostrato che le equazioni del moto possono essere scritte in questo modo, tale forma non è la più utile. È di solito conveniente risolvere i problemi di moto delle particelle utilizzando le equazioni originarie, ossia l’equazione (1.22). m 21 Capitolo 2 Energia e impulso dei campi 2.1 Conservazione locale L’energia della materia non si conserva: quando un oggetto irradia luce esso perde energia; però l’energia perduta è possibile descriverla in qualche altra forma, supponiamo luce. La teoria della conservazione dell’energia è incompleta se non si considera l’energia che è associata con la luce, o in generale con il campo elettromagnetico. Considereremo la legge della conservazione dell’energia, e anche dell’impulso, dei campi. Non si possono trattare questi argomenti l’uno senza l’altro, in quanto essi nella Relatività non sono che aspetti diversi dello stesso quadrivettore. Si è studiato che l’energia totale dell’Universo è costante. Ciò che vorremmo fare, è quello di estendere l’idea di conservazione dell’energia, in modo tale da poter dire qualcosa in dettaglio su come si conserva l’energia. La nuova legge affermerà che se l’energia se ne va da una regione, ciò avviene perché fluisce attraverso i confini di questa regione. Questa è una legge alquanto stringente rispetto a quella della conservazione dell’energia senza questa restrizione. Per capire il significato della precedente affermazione, studieremo come funziona la legge della conservazione della carica. Si è formulata la conservazione della carica affermando che c’è una densità di corrente j e una densità di carica ρ e che quando la carica in un certo punto diminuisce, ci deve essere un flusso di carica uscente da quel punto. La forma matematica della legge di conservazione è: ∇·j=− 22 ∂ρ ∂t (2.1) Conseguenza di questa legge è che la carica totale nell’Universo è sempre costante: non vi è mai un’acquisizione o una perdita complessiva di carica. Tuttavia la carica totale dell’Universo potrebbe rimanere costante in un altro modo. Supponiamo che vi sia una carica Q1 vicino a un certo punto (1), mentre non vi è carica in un certo punto (2) a una certa distanza dal primo, come mostra la figura: Fig.(2.1) Conservazione della carica Inoltre supponiamo che col procedere del tempo la carica Q1 svanisca e che simultaneamente una certa carica Q2 appaia vicino al punto (2) in modo tale che ad ogni istante la somma di Q1 e Q2 sia costante. In poche parole, in ogni stadio intermedio la carica perduta Q1 si aggiunge a Q2 . Allora, in questo modo, la quantità totale di carica nell’Universo si conserva. Questa è una conservazione “su scala universale”, ma non “locale”, in quanto la carica per trasferirsi da (1) a (2) non avrebbe bisogno di apparire in nessun luogo dello spazio che sta fra il punto (1) e il punto (2). Localmente la carica sarebbe “perduta”. Si riscontrano delle difficoltà ad introdurre una simile conservazione “su scala universale” nella teoria della Relatività. Il concetto di “istanti simultanei” in punti distanti è un concetto che non è equivalente in sistemi di riferimento diversi. Due eventi che sono simultanei in un sistema di riferimento non sono simultanei per un altro sistema che si muove rispetto al primo. Per una conservazione “su scala universale” del tipo descritto, è necessario che la carica perduta da Q1 appaia simultaneamente in Q2 . Altrimenti vi sarebbero dei momenti in cui la carica non sarebbe conservata. Sembrerebbe che non vi sia modo di rendere invariante la conservazione della carica in Relatività senza farla diventare una legge di conservazione “locale”. L’esigenza dell’invarianza relativistica di Lorentz sembra limitare in modi sorprendenti le leggi della natura. Nella moderna teoria quantistica dei campi, per esempio, qualcuno ha voluto alterare la teoria ammettendo quella che viene chiamata un’interazione “non locale”, in cui qualcosa che accade qui 23 ha un effetto diretto su qualcosa là; però ci si trova nei guai col principio di Relatività. La conservazione “locale” implica un’altra idea. Essa afferma che una carica può passare da un luogo ad un altro soltanto se c’è qualcosa che accade nello spazio interposto. Per formulare la legge non occorre soltanto la densità di carica ρ ma anche un altro tipo di grandezza, j, ossia un vettore che dà la rapidità di flusso della carica attraverso una superficie. Questo flusso viene, poi, messo in rapporto per mezzo dell’equazione (2.1) con la rapidità di variazione della densità. Questo è il tipo più drastico di legge di conservazione. Esso afferma che la carica si conserva in un modo speciale: si conserva “localmente”. Si trova che anche la conservazione dell’energia è un processo locale. C’è non soltanto una densità di energia in una data regione dello spazio, ma anche un vettore che rappresenta la rapidità del flusso dell’energia attraverso la superficie. Per esempio quando una sorgente di luce irradia, si può determinare l’energia luminosa che lascia la sorgente. Se s’immagina una superficie matematica che circonda la sorgente luminosa, l’energia perduta all’interno della superficie è uguale all’energia che fluisce all’esterno attraverso la superficie. 2.2 Conservazione dell’energia ed elettromagnetismo L’obiettivo è quello di scrivere quantitativamente la conservazione dell’energia per l’elettromagnetismo. Per fare ciò bisogna poter definire quanta energia c’è in un qualunque elemento di volume dello spazio e anche l’entità del flusso d’ energia. Supponiamo dapprima di pensare solamente all’energia del campo elettromagnetico. Con u indichiamo la densità d’energia nel campo (ossia la quantità d’energia per unità di volume dello spazio) e col vettore S indichiamo il flusso d’energia del campo (cioè il flusso d’energia per unità di tempo attraverso l’unità di superficie ortogonale al flusso). In analogia con la conservazione della carica (equazione (2.1)), si può scrivere la legge “locale” della conservazione dell’energia nel campo nella forma: ∂u = −∇ · S. (2.2) ∂t Però questa legge non è vera in generale: non è affatto vero che l’energia del campo si conserva. 24 Supponiamo di trovarci in una stanza buia e di girare l’interruttore della luce. Tutt’a un tratto la stanza è piena di luce, perciò c’è dell’energia nel campo, benché prima non ve ne fosse. L’equazione (2.2) non rappresenta la legge di conservazione completa, perché l’energia del campo da sola non si conserva, ma soltanto l’energia totale dell’Universo: c’è anche l’energia della materia. L’energia del campo cambierà se c’è del lavoro fatto dalla materia sul campo, o dal campo sulla materia. Se c’è della materia nell’interno del volume che ci interessa, sappiamo già p 2 2 quanta energia possiede: ciascuna particella ha energia pari a m0 c 1 − v /c2 . L’energia totale della materia non è altro che la somma delle energie di tutte le particelle e il flusso di questa energia attraverso una superficie è la somma delle energie trasportate da ciascuna particella che attraversa la superficie. Ora ci concentreremo sull’energia del campo elettromagnetico. Perciò dobbiamo scrivere un’equazione che affermi che l’energia totale del campo in un dato volume decresce sia perché una certa energia totale del campo fluisce fuori dal volume sia perché il campo cede energia alla materia. L’energia del campo all’interno di un volume V è dato da: R u dV , V e la sua diminuzione nell’unità di tempo è la derivata temporale dell’integrale cambiata di segno. Il flusso dell’energia del campo uscente dal volume V è l’integrale della componente normale di S sopra la superficie Σ che racchiude V , cioè R S · n da. Σ Perciò si ha Z Z ∂ udu = S · n da + (lavoro f atto sulla materia dentro V ). (2.3) ∂t V Σ Il campo compie su ciascuna unità di volume della materia il lavoro E · j per unità di tempo. Infatti la forza su una particella è F = q(E + v × B), e il lavoro per unità di tempo F · v = qE · v. Se ci sono N particelle per unità di volume, il lavoro per unità di tempo e di volume è N qE · v, ma è N qv = j. Perciò la grandezza E · j dev’essere uguale alla perdita d’energia per unità di tempo e di volume da parte del campo. L’equazione (2.3) diventa dunque Z Z Z ∂ − udV = S · nda + E · jdV. (2.4) ∂t V Σ V 25 Questa è la legge della conservazione dell’energia nel campo. La si può convertire in un’equazione differenziale simile all’equazione (2.2) se si può trasformare il secondo termine in un integrale di volume. Ciò è facile farlo per mezzo del teorema di Gauss. L’integrale di superficie della componente normale di S è l’integrale della sua divergenza esteso al volume interno. Perciò l’equazione (2.3) è equivalente a R R R du dV = V ∇ · SdV + V E · jdV , V dt dove si è portata sotto il segno di integrale la derivata temporale del primo termine. Dato che questa equazione è vera per qualsiasi volume, si può eliminare l’integrale e si trova l’equazione dell’energia per i campi elettromagnetici: − − ∂u = ∇ · S + E · j. ∂t (2.5) Però questa equazione non serve a nulla se non sappiamo cosa sono u ed S. Forse basterebbe esprimerli per mezzo dei campi E e B, perché ciò che interessa è il risultato finale. Verrà illustrato il tipo di ragionamento adoperato da Poynting nel 1884 per ottenere u ed S. 2.3 Densità e flusso d’energia nel campo elettromagnetico Vogliamo mostrare che vi è una densità u e un flusso S che dipendono solamente dai campi E e B. Le grandezzeu ed S potrebbero dipendere dai potenziali e da qualcos’altro, vediamo cosa si può ricavare. Si può cercare di riscrivere il termine E · j in modo tale che esso diventi la somma di due termini uno dei quali sia la derivata rispetto al tempo di una certa grandezza e l’altro sia la divergenza di un’altra grandezza. La prima grandezza rappresenterebbe u mentre la seconda S. In pratica ciò che vogliamo fare è scrivere la nostra grandezza nella forma E·j=− ∂u −∇·S ∂t 26 (2.6) Il primo membro deve essere espresso per mezzo dei soli campi. Come fare? Utilizzando le equazioni di Maxwell, ovviamente. Dall’equazione di Maxwell per il rotore di B ricaviamo j = 0 c2 ∇ × B − 0 ∂E . ∂t Sostituendo questa espressione nell’equazione (2.6), avremo soltanto termini in E e B: ∂E (2.7) ∂t 1 L’ultimo termine è una derivata temporale: è (∂/∂t) 0 E · E . Il termine 2 1 0 E · E può rappresentare almeno una parte di u. Ora bisogna trasformare 2 il termine rimasto nella divergenza di qualcosa. Osserviamo che è errato considerare E · (∇ × B) equivalente a ∇ · (B × E), questo per le proprietà del prodotto misto. Ricordiamo che l’operatore ∇, che è un operatore di derivazione, quando precede un prodotto, opera su tutto ciò che si trova alla sua destra. Quindi nell’equazione (2.7) il ∇ opera solo su B e non su E. Ma se si considera l’espressione ∇ · (B × E) osserviamo che l’operatore ∇ opera sia su B che su E. Illustreremo un metodo che consente di determinare i termini di ∇ · (B × E). Esso consiste nello scartare la regola di notazione del calcolo relativa a ciò su cui si opera l’operatore di derivazione. Inoltre supponiamo che la derivazione non dipende dall’ordine in cui sono scritti i termini. Indichiamo con un indice su che cosa opera un operatore differenziale, l’ordine di derivazione non ha importanza. Supponiamo che D rappresenti ∂/∂x. Allora Df vuol dire che bisogna considerare la derivata della grandezza varia∂f . Se invece si considera Df f g, ciò vuol dire bile f . Si ha quindi : Df f = ∂x ∂f Df f g = g. Secondo questa convenzione f Df g rappresenta la stessa ∂x cosa, in poche parole: E · j = 0 c2 E · (∇ × B) − 0 E · Df f g = gDf f = f Df g = f gDf Allora abbiamo ricavato una nuova espressione per ∇ · (B × E): 27 ∇ · (B × E) = ∇B · (B × E) + ∇E · (B × E) . (2.8) Quindi per le considerazioni fatte ∇B opera solo su B e ∇E opera solo su E. Nell’equazione (2.8) il termine centrale si può riscrivere come E · ∇B × B, e osserviamo che l’operatore ∇ opera solo su B. Analogamente l’ultimo termine dell’equazione si può riscrivere come B · E × ∇E , ma in questo caso ∇ non opera su nulla, invece dovrebbe operare su E. Affinché ciò accada basta fare una semplice osservazione sulle proprietà del prodotto vettoriale, ossia l’anticommutatività E × ∇E = −∇E × E. Fatte queste osservazioni possiamo riscrivere l’equazione (2.8) come segue: ∇ · (B × E) = E · (∇ × B) − B · (∇ × E) . (2.9) Perciò la legge della conservazione dell’energia si può scrivere come: ∂ E · j = 0 c ∇ · (B × E) + 0 c B · (∇ × E) − ∂t 2 2 1 0 E · E . 2 (2.10) In questa espressione abbiamo una derivata temporale da adoperare per ottenere u e un altro termine che è una divergenza per rappresentare S. Però il termine centrale non è né una derivata rispetto a t né la divergenza di qualcosa. Ma facendo riferimento alle equazioni di Maxwell si vede che ∇ × E è uguale a −∂B/∂t, quindi anche per il termine centrale abbiamo una derivata temporale. Allora ∂B ∂ B·B B · (∇ × E) = B · − =− . ∂t ∂t 2 Per concludere la legge diventa: ∂ E · j = ∇ · 0 c B × E − ∂t 2 0 c2 0 B·B+ E·E . 2 2 (2.11) che è simile all’equazione (2.6) se si pongono le definizioni: u= 0 0 c2 E·E+ B · B, 2 2 28 (2.12) e S = 0 c2 E × B. (2.13) Allora abbiamo trovato un’espressione per la densità d’energia che è la somma di una densità d’energia “elettrica” e di una densità d’energia magnetica; inoltre abbiamo trovato una formula per il vettore che esprime il flusso d’energia nel campo magnetico; questo vettore prende il nome di “vettore di Poynting ”. Esso fornisce una misura del moto dell’energia del campo attraverso lo spazio: l’energia che fluisce attraverso una areola da in un secondo è S · n da, dove n è il versore perpendicolare a da. 2.4 Esempi di flusso d’energia Trovata l’espressione del vettore flusso S, vogliamo ora illustrare come funziona in alcuni casi particolari. Il primo esempio trattato sarà la luce. In un’onda luminosa si hanno un vettore E e un vettore B ad angolo retto tra di loro e con la direzione di propagazione dell’onda. In un’onda elettromagnetica il modulo di B è uguale a 1/c per il modulo di E, e poiché sono disposti ad angolo retto, ne risulta che: E2 . | E × B |= c Perciò il flusso d’energia per unità d’area per secondo è S = 0 cE2 . (2.14) Per un’onda luminosa, nella quale si ha E = E0 cosω (t − x/c), il flusso medio d’energia per unità d’area S m -chiamato “intensità della luce”- è il valor medio del quadrato del campo elettrico moltiplicato per 0 c : Intensita0 =< S >m = 0 c < E 2 >m . (2.15) Quando si ha un fascio di luce, c’è nello spazio una densità d’energia data dall’equazione (2.12). Adoperando cB = E, come si ha per un’onda luminosa, otteniamo 29 0 0 c2 u = E2 + 2 2 E2 c2 = 0 E 2 . Ma E varia nello spazio, perciò la densità media d’energia è < u >m = 0 < E 2 >m (2.16) che è proprio l’equazione (2.15) che avevamo trovato prima. Riportiamo un altro esempio. Si considera il flusso d’energia in un capacitore che viene caricato lentamente. Supponiamo che si utilizzi un capacitore a lastre parallele circolari, come mostrato in Figura(2.2): Fig.(2.2) Capacitore in carica Dentro al capacitore vi è un campo elettrico quasi uniforme che varia col tempo. A un istante qualunque l’energia elettromagnetica totale nell’interno è u moltiplicata per il volume. Se le lastre hanno raggio a e separazione h, l’energia totale tra le lastre è: U= 0 2 E2 πa 2 h . (2.17) L’energia varia al variare di E. Quando il capacitore viene caricato, il volume tra le lastre riceve una energia per unità di tempo pari a: dU = 0 πa2 hE Ė. dt (2.18) Perciò in quel dato volume deve entrare da qualche parte un flusso d’energia. Osserviamo che il flusso d’energia non può fluire dai fili di collegamento, ossia 30 nella direzione nello spazio tra le lastre, perché il campo elettrico è ortogonale alle lastre: S = E × B deve essere parallelo ad esse. Inoltre vi è un campo magnetico che circola intorno all’asse quando il capacitore si sta caricando. Utilizzando le equazioni di Maxwell si ricava che il campo magnetico all’orlo del capacitore è dato da 2πac2 B = Ė · πa 2 , ossia B= a Ė 2c2 Quindi c’è un flusso d’energia proporzionale a E × B in arrivo attraverso tutto il perimetro. Come mostra la Figura(2.3): Fig.(2.3)Campo generato da un capacitore in carica Verifichiamo che il flusso totale attraverso l’intera superficie compresa fra gli orli delle lastre torna o meno con la variazione per unità di tempo dell’energia. L’area superficie è 2πah ed S = 0 c2 E × B ha il modulo pari a a della Ė così che il flusso totale d’energia è: πa2 h0 E Ė. 0 c2 E 2c2 Quando un condensatore si carica l’energia non entra dai fili; arriva passando fra gli orli delle lastre. Supponiamo che ci siano delle cariche sopra e sotto il capacitore, ma molto lontane. Quando le cariche sono lontane c’è un campo debole ma esteso che circonda il capacitore.(Figura(2.4)) 31 Fig.(2.4) Filo attraversato da corrente elettrica Mentre le cariche si avvicinano il campo diventa più forte vicino al capacitore; perciò l’energia del campo, che era in lontananza, si sposta verso il capacitore e va a finire tra le lastre di questo. Riportiamo un ultimo esempio. Ci chiediamo cosa accade in un pezzo di filo in una resistenza quando è attraversato da corrente. Siccome il filo ha resistenza, c’è un campo elettrico in esso che spinge la corrente. Poiché c’è una caduta di potenziale lungo il filo, c’è anche un campo elettrico anche appena fuori del filo, parallelo alla superficie, come mostra la Figura(2.5): Fig.(2.5)Vettore di Poynting generato da una carica e un magnete In più c’è anche un campo magnetico che circola intorno al filo, a causa della corrente. I vettori E e B sono perpendicolari tra di loro, perciò c’è un vettore di Poynting diretto radialmente all’interno. C’è un flusso entrante d’energia tutt’intorno al filo. È uguale all’energia che viene perduta nel filo sotto forma di calore. Quindi la “nostra teoria” afferma che gli elettroni ricevono l’energia con la quale generare calore, per via di quella che fluisce nel filo del campo esterno. Quindi gli elettroni ricevono la loro energia per il fatto di essere spinti nel senso del filo. In realtà gli elettroni sono spinti da un campo elettrico che proviene da cariche lontanissime e essi ricevono da questo campo l’energia che serve loro per generare calore. In 32 qualche modo, l’energia fluisce dalle cariche lontane in un’ampia regione dello spazio e poi va a finire nel filo. Consideriamo infine una carica elettrica e un magnete in quiete uno accanto all’altro. Supponiamo la carica puntiforme posta al centro di una sbarra magnetizzata, come nella Figura(2.5). Tutto il sistema è in quiete, perciò l’energia non cambia col passare del tempo; inoltre campi elettrico e magnetico sono statici. Il vettore di Poynting ci dice che c’è un flusso d’energia perché c’è E × B che non è nullo. Se si studia il flusso d’energia, si trova che esso si muove in circolo. Non vi è cambiamento di energia: tutto quello che fluisce dentro un certo volume ne esce fuori di nuovo. Dunque c’è una circolazione d’energia, in questo caso considerato. 2.5 L’impulso del campo Tratteremo ora l’impulso del campo elettromagnetico. Proprio perché il campo possiede energia, esso avrà anche un certo impulso per unità di volume. Indichiamo con g la densità dell’impulso. Poiché l’impulso è un vettore esso possiede direzione. Perciò studieremo una componente per volta; iniziamo con la componente x. Siccome ogni componete dell’impulso si conserva, si dovrebbe poter scrivere una legge del tipo: ∂gx ∂ (impulso della materia)x = + (f lusso uscente dell0 impulso)x ∂t ∂t La variazione per unità di tempo dell’impulso della materia non è altro che la forza agente su essa. Per una particella questa forza è F = q (E + v × B); per una distribuzione di cariche la forza per unità di volume è (ρE + j × B). Il flusso uscente dell’impulso, però, non può essere la divergenza di un vettore, perché non è uno scalare, è la componente x di un certo vettore. Comunque dovrebbe somigliare a qualcosa come − ∂a ∂b ∂c + + ∂x ∂y ∂z perché l’impulso secondo l’asse x potrebbe fluire in una qualunque delle tre direzioni. In ogni caso, qualunque cosa possano essere a, b, c, l’espressione appena scritta si suppone che eguagli il flusso uscente dell’impulso secondo l’asse x. Perciò potremmo scrivere ρE + j × B, soltanto per mezzo di E ed B - eliminando ρ e j utilizzando le equazioni di Maxwell - quindi possiamo manipolare i termini e fare sostituzioni sino ad arrivare a una forma del tipo ∂gx ∂a ∂b ∂c + + + . ∂t ∂x ∂y ∂z 33 Identificando i termini, si trovano le espressioni per gx , a, b e c. Ma ci limitiamo a trovare un’espressione per g, seguendo un’altra strada. In meccanica vale il seguente teorema: “ogni volta che c’è un flusso d’energia, in assolutamente qualsiasi circostanza, l’energia che fluisce attraverso l’unità di superficie nell’unità di tempo, moltiplicata per 1/c2 è uguale all’impulso per unità di volume nello spazio”. Nel caso particolare dell’elettrodinamica, tale teorema dà come risultato che g é 1/c2 per il vettore di Poynting: g= 1 S. c2 (2.19) Perciò il vettore di Poynting non dà soltanto il flusso d’energia, ma se diviso per la quantità c2 dà la densità d’impulso. Ora illustreremo degli esempi per mostrare la veridicità del teorema in generale. Supponiamo di avere N particelle per metro cubo in una scatola, e che esse si muovono con una certa velocità v. Consideriamo una superficie immaginaria piana perpendicolare a v. Il flusso d’energia per secondo attraverso l’unità d’area della superficie è pari a Nv, il numero di particelle che fluisce attraverso la superficie per secondo, moltiplicato per l’energia portata da ciascuna. p L’energia di ciascuna particella è pari a m0 c2 / 1 − v 2 /c2 . Perciò il flusso d’energia per secondo è m0 c2 Nv p . 1 − v 2 /c2 Ma l’impulso di ciascuna particella è dato dato m0 v densità d’impulso è p 1 − v 2 /c2 , perciò la m0 v Np 1 − v 2 /c2 che è proprio uguale a 1/c2 per il flusso d’energia, come affermato dal teorema precedente. Perciò il teorema è vero per un fascio di particelle. Ciò vale anche per la luce. Quando dell’energia viene assorbita da un fascio di luce, un certo impulso viene comunicato all’assorbitore. Come verificheremo a fine paragrafo, l’impulso non è altro che il prodotto di 1/c per l’energia assorbita. Se U 0 è l’energia che arriva sull’unità d’area per secondo, allora l’impulso in arrivo per unità d’area per secondo è U0 /c. Ma l’impulso si muove con 34 velocità c, perciò la sua densità nella zona davanti all’assorbitore deve essere U0 /c2 . Quindi anche in questo caso il teorema è valido. Infine vogliamo illustrare un ragionamento dovuto ad Einstein che dimostra lo stesso risultato esposto. Supponiamo di avere un vagone ferroviario su ruote (prive d’attrito), avente massa M . A un estremo del vagone c’è fissato un dispositivo che spara delle particelle (o della luce) che sono poi fermate all’estremo opposto. Originariamente c’era una energia U a un estremo e dopo un certo tempo questa energia si ritrova all’estremo opposto del vagone. L’energia U è stata spostata di un tratto L, che è la lunghezza del vagone. Ora, l’energia U possiede massa pari a U/c2 sicché, se il vagone non si muovesse, il suo centro di gravità ne risulterebbe spostato. Per Einstein il centro di gravità di un oggetto non può essere spostato agendo da dentro. Quando si è portata l’energia U da un estremo del vagone all’altro, tutto il vagone deve essere indietreggiato di un tratto x. Effettivamente si può osservare che la massa totale del vagone moltiplicata per x deve eguagliare la massa dell’energia che si è mossa, cioè U/c2 , moltiplicata per L (nell’ipotesi in cui U/c2 L): U L. c2 Mx = (2.20) Studiamo il caso particolare in cui l’energia è trasportata da uno sprazzo di luce. Cos’è che consente al vagone di mettersi in moto? Einstein fece il seguente ragionamento: quando la luce viene emessa, ci deve essere un contraccolpo, incognito, equivalente a un impulso p. Ed è proprio questo contraccolpo che fa indietreggiare il vagone. La velocità di indietreggiamento sarà data dal rapporto tra l’impulso e la massa del vagone: v= p . M Il vagone si muove con questa velocità fin quando l’energia luminosa U raggiunge l’estremo opposto; durante l’urto finale, questa velocità restituisce il suo impulso e arresta il vagone. Se x è piccolo, la durata del moto del vagone è quasi uguale a L/c; perciò si ha: x = vt = v L p L = . c M c Sostituendo nell’equazione (2.20), l’espressione di x trovata, otteniamo p= U . c 35 Si è ritrovata la relazione tra impulso ed energia per la luce. Dividendo questa espressione per c, in modo tale da ottenere la densità d’impulso si ha: g= U . c2 (2.21) Supponiamo, ora, che il vagone si stia muovendo su un binario con velocità v e che dell’energia luminosa venga sparata dall’alto verso il basso, da A verso B (come mostra la figura (2.6)). Fig.(2.6) Trasporto dell’impulso Consideriamo il momento angolare del sistema rispetto al punto P . 36 Fig.(2.6) Conservazione del momento angolare Prima che l’energia U abbandoni A essa ha massa m = U/c2 e velocità v, quindi momento angolare pari a mvra . Quando arriva in B, ha la stessa massa, e se l’impulso del vagone non deve cambiare, l’energia deve avere ancora velocità v. Il momento angolare rispetto a P è mvrb . Il momento angolare varierà, a meno che il giusto momento di rinculo sia stato dato al vagone quando è stata emessa la luce, cioè a meno che la luce trasporti l’ impulso U/c. Abbiamo trovato che il teorema del centro di gravità e la conservazione del momento angolare sono strettamente connessi nella teoria della Relatività. Riprendendo l’esempio della carica puntiforme e del magnete, sapendo che il flusso d’energia e l’impulso sono proporzionali, allora c’è dell’impulso che circola nello spazio. Ma un impulso che circola equivale a dire che c’è un momento angolare: perciò c’è un momento angolare del campo. Il flusso d’impulso c’è e serve per preservare la conservazione del momento angolare dell’Universo. Ora vogliamo mostrare, come detto prima, che l’impulso è uguale al prodotto di 1/c per l’energia assorbita. Faremo riferimento agli effetti del campo magnetico che è associato alla luce. Innanzitutto osserviamo che gli effetti del campo magnetico sono trascurabili, ma c’è un effetto che risulta interessante e importante, che è una conseguenza dovuta proprio al campo magnetico. Supponiamo che la luce arrivi da una sorgente e che agisca su una carica forzando il moto della carica. Per semplicità supponiamo che il campo elettrico sia in direzione x, in modo tale che il moto della carica abbia la stessa direzione del campo elettrico. La carica avrà una certa velocità v e una posizione x. Il campo magnetico è perpendicolare al campo elettrico. Quando il campo elettrico agisce sulla carica e la muove dall’alto verso il basso, cosa accade? Il campo magnetico agisce sulla carica (supponiamo un elettrone) soltanto quando è in movimento; ma l’elettrone è in movimento, è forzato dal campo elettrico, così i campi elettrico e magnetico lavorano 37 insieme: mentre l’elettrone si muove su e giù ha una velocità e c’è una forza che agisce su di esso (la forza è data dal prodotto di B per v per q). Ma che direzione avrà questa forza? È nella direzione della propagazione della luce. Perciò quando la luce colpisce una carica ed essa oscilla, come conseguenza del fatto che viene colpita, vi è una forza nella direzione del fascio di luce. Essa prende il nome di presssione di radiazione. Vogliamo determinare l’intensità della pressione di radiazione. Essa sarà data da F = qvB o dalla media temporale della forza, < F >. L’intensità del campo magnetico è data da B = E/c abbiamo però bisogno di determinare la media del campo elettrico, per la velocità, per la carica, per 1/c: < F >= q < vF > /c. Osserviamo che il prodotto di q per il campo elettrico E non è altro che la forza elettrica agente su una carica, e la forza sulla carica per la velocità è il lavoro dW/dt che viene eseguito sulla carica! Perciò la forza, la "quantità di moto di spinta", che è trasferita in un secondo dalla luce, è uguale a 1/c per l’ energia assorbita per secondo! Tale regola è generale: in qualsiasi circostanza in cui la luce viene assorbita, vi è una pressione. La quantità di moto che la luce cede è sempre uguale all’energia assorbita, divisa per c: < F >= dW/dt c che era ciò che volevamo mostrare. Perciò la luce trasporta energia e quantità di moto, e la quantità di moto trasportata è sempre 1/c per l’energia. 38 Capitolo 3 La massa elettromagnetica 3.1 L’energia del campo di una carica puntiforme Vogliamo ora discutere il fallimento della teoria elettromagnetica classica, dovuto agli effetti "quantistici". La meccanica classica è una teoria matematicamente coerente; solo che non va d’accordo con l’esperienza. Il fatto interessante è che la teoria classica dell’elettromagnetismo sia una teoria insoddisfacente proprio in sé stessa. Vi sono delle difficoltà connesse con le idee della teoria di Maxwell che non si riferiscono direttamente alla meccanica quantistica e non sono risolte da essa. Le difficoltà sono associate ai concetti di energia ed impulso elettromagnetici, quando si applicano all’elettrone o a qualunque particella carica. I concetti di particella semplice e quello di campo elettromagnetico sono in qualche modo incompatibili. Per evidenziare tale difficoltà verranno illustrati alcuni esercizi riguardanti i concetti di energia e impulso. Come prima cosa si valuta l’energia di una particella carica. Scegliamo come modello un elettrone in cui tutta la carica q è distribuita uniformemente sulla superficie di una sfera di raggio a. Si calcola l’energia del campo elettromagnetico. Se la carica è ferma, non c’è campo magnetico e l’energia per unità di volume è proporzionale al quadrato del campo elettrico. Il modulo del campo elettrico è pari a q/4π0 r2 , e la densità d’energia è u= q2 0 2 E = 2 32π 2 0 r4 Per ottenere l’energia totale bisogna integrare la densità ricavata in tutto lo spazio. Adoperando l’elemento di volume 4πr2 dr, l’energia totale Uel è data da: 39 Uel = R q2 dr 8π0 r2 L’espressione dell’energia totale trovata è facile da integrare. Il limite inferiore è a mentre quello superiore è ∞ , perciò si ha 1 q2 1 . Uel = 2 4π a (3.1) Se si adopera per q la carica elettronica qe e il simbolo e2 per la quantità q2e /4π0 , si ha Uel = 1 e2 2a (3.2) Tutto va bene fin quando non si pone a = 0 per una carica puntiforme: qui si incontra la prima difficoltà. Poiché l’energia del campo varia come l’inverso della potenza quarta della distanza dal centro, il suo integrale di volume è infinito. C’è una quantità infinita d’energia nel campo che circonda una carica puntiforme. Cos’é che non va se l’energia è infinita? Se l’energia non può uscire, si hanno delle difficoltà nel caso di un’energia infinita? Una grandezza che risulta infinita può disturbare, ma ciò che realmente conta è se ci sono degli effetti fisici osservabili. Per risolvere tale problema, si hanno bisogno di altri elementi oltre che all’energia. Come varia l’energia quando si muove la carica? Se le variazioni saranno infinite siamo nei guai! 3.2 L’impulso di una carica in moto Supponiamo che un elettrone si muova nello spazio a velocità uniforme, in modo tale che la velocità con la quale esso si muove non superi la velocità della luce. C’è un impulso associato all’elettrone in moto dovuto all’impulso del campo elettromagnetico. Si può mostrare che l’impulso del campo ha la direzione della velocità v della carica ed è proporzionale a v. Per un punto P alla distanza r dal centro della carica e in una direzione che forma un angolo θ con la linea di moto il campo elettrico è radiale e il campo magnetico è v × E/c2 . La densità d’impulso è g = 0 E × B. La densità d’impulso è diretta obliquamente verso la linea di moto e ha modulo 40 g= 0 v 2 E sin θ. c2 I campi elettrico e magnetico sono simmetrici intorno alla linea, perciò integrando nello spazio la somma delle componenti trasversali si ottiene come risultato zero, per cui l’impulso risultante sarà parallelo a v. La componente di g in tale direzione è g sin θ che bisogna integrare in tutto lo spazio. Come elemento di volume si consideri un anello il cui piano è perpendicolare a v. Il volume sarà 2πr2 sin θdθdr. L’impulso totale è R 0 v 2 2 E sin θ2π sin θdθdr. p= c2 Poiché E è indipendente da θ (perv c) si può direttamente integrare in dθ. L’integrale è R R cos3 θ . sin3 θdθ = − (1 − cos2 θ)d(cos θ) = − cos θ + 3 I limiti per θ sono 0 e π, perciò l’integrale in dθ dà un fattore 4/3 e si ottiene p= 8π 0 v R 2 2 E r dr 3 c2 L’integrale è quello che si ottiene calcolando l’energia; esso è q 2 /16π 2 20 a e quindi si ha p= 2 q2 v , 3 4π0 ac2 ossia p= 2 e2 v. 3 ac2 (3.3) Perciò l’impulso del campo è proporzionale a v. Lo stesso risultato si otterrebbe se si considerasse una particella con massa eguale al coefficiente di v. Tale coefficiente lo denominiamo massa elettromagnetica e si può scrivere mel = 2 e2 . 3 ac2 41 (3.4) 3.3 La massa elettromagnetica Da dove deriva la massa? Nelle leggi della meccanica si è supposto che ciascun oggetto "porti" con sé una proprietà chiamata massa, il che vuol dire che "porta" un impulso proporzionale alla sua velocità. Cercheremo di capire come una particella carica porti un impulso proporzionale alla sua velocità. Nella teoria dell’elettrodinamica grazie a Maxwell e Poynting si giunge alla nozione che qualunque particella carica ha un impulso proporzionale alla sua velocità come effetto di influenze elettromagnetiche. Per il momento assumeremo che vi siano due tipi di massa e che l’impulso totale di un oggetto sia la somma di un impulso meccanico e di un impulso elettromagnetico. L’impulso meccanico è dato dalla massa "meccanica" , mmecc moltiplicata per v. Nelle esperienze in cui si misura la massa di una particella andando a vedere quanto impulso possiede o come si deflette secondo una certa orbita, quella che viene misurata è la massa totale. In generale, l’impulso è dato dalla massa totale (mmecc + mel ) moltiplicata per la velocità. Quindi la massa osservata può consistere di due porzioni: una porzione meccanica, più una porzione elettromagnetica. Sicuramente ci sarà una porzione elettromagnetica ma vi è anche la sorprendente possibilità che la porzione meccanica non esista affatto: tutta la massa è elettromagnetica! Vediamo che caratteristiche dovrebbe avere l’elettrone nel caso in cui non vi sia massa meccanica. Per fare ciò poniamo la massa elettromagnetica data dall’equazione (3.4) uguale alla massa osservata me dell’elettrone. Svolgendo i calcoli ricaviamo 2 e2 . (3.5) a= 3 m e c2 La grandezza r0 = e2 me c2 (3.6) è chiamata "raggio classico dell’elettrone"; ha valore numerico pari a 2, 82 × 10−13 cm, circa un millesimo del diametro di un atomo. I risultati ottenuti sono validi per velocità basse rispetto alla velocità della luce. Cosa accade se la velocità è prossima a quella della luce? I primi tentativi di studio condussero a confusione, ma Lorentz capì che alle alte velocità la sfera carica doveva contrarsi per diventare un ellissoide e che i campi dovevano modificarsi in accordo con le formule (1.8) e (1.9) ricavate nel capitolo 1 nel caso relativistico. Eseguendo gli integrali per p si trova che per una velocità arbitraria v, l’impulso viene alterato secondo il fattore 42 p 1/ 1 − v 2 /c2 : p= 2 e2 v p . 2 3 ac 1 − v 2 /c2 (3.7) In pochep parole la massa elettromagnetica cresce con la velocità come l’inverso di 1 − v 2 /c2 , una scoperta fatta prima della teoria della Relatività. Prima si credeva che la parte elettrica della massa dovesse variare con la velocità, mentre quella meccanica non variava. Con l’avvento della teoria della Relatività si giunge al risultato p che qualunque sia l’origine della massa essa deve sempre variare come m0 1 − v 2 /c2 . L’equazione (3.7) è il principio della Relatività che fa dipendere la massa dalla velocità. Secondo la teoria della Relatività, l’energia U avrà massa U/c2 ; l’equazione (3.2) afferma che il campo dell’elettrone deve avere la massa 0 mel = 1 e2 Uel = , c2 2 ac2 (3.8) che non è la stessa della massa elettromagnetica mel . Combinando l’equazione (3.2) e (3.4) si ottiene 3 Uel = mel c2 . 4 Tale formula fu scoperta prima della Relatività e quando Einstein e altri studiosi iniziarono a capire che si deve sempre avere U = mc2 , ci fu una gran confusione. 3.4 La forza di un elettrone su sé stesso La discrepanza tra le due formule per la massa elettromagnetica è fastidiosa in quanto si è provato che la teoria dell’elettrodinamica è in perfetto accordo con il principio della Relatività. Per la teoria della Relatività l’impulso deve equivalere all’energia moltiplicata per il fattore v/c2 . Qui si incorre nei pasticci! Deducendo le equazioni per l’energia e per l’impulso si sono ammesse le leggi di conservazione. Inoltre si è ammesso di aver tenuto conto di tutte le forze e del fatto che il lavoro svolto o qualsiasi impulso impartito da altri meccanismi "non elettrici" fosse incluso. Però, se consideriamo una sfera di carica, tutte le forze sono repulsive e l’elettrone tenderebbe ad esplodere. Poiché nel sistema vi sono delle forze non 43 equilibrate, si può incorrere in errori formulando le leggi che mettono in rapporto l’energia e l’impulso. Per avere un quadro coerente bisogna immaginare che qualcosa tenga insieme l’elettrone. Le cariche devono essere trattenute sulla sfera da qualcosa che impedisca loro di schizzare via, da qualche sorta di elastici. Fu fatto notare da Poincarè che gli elastici devono essere inclusi nei calcoli dell’energia e dell’impulso. Le forze extra, non elettriche, sono conosciute anche col nome di "tensioni di Poincarè". Se le forze extra non vengono incluse nei calcoli, le masse ottenute nei due procedimenti cambiano. E i risultati sono coerenti con la teoria della relatività; cioè la massa ricavata eseguendo i calcoli per determinare l’impulso è la stessa di quella che si ottiene calcolando l’energia. Entrambe le masse contengono due contributi: una massa elettromagnetica e un contributo delle tensioni di Poincarè. Sommandole si ottiene una teoria coerente. Dal momento in cui bisogna introdurre delle forze all’interno dell’elettrone, le cose iniziano a complicarsi. Quanto sono forti queste tensioni? Come vibra un elettrone? È capace di oscillare? Quali sono tutte le sue proprietà interne? C’è la possibilità che un elettrone abbia delle proprietà interne complicate. Se si facesse una teoria dell’elettrone seguendo queste linee, essa prevederebbe delle strane proprietà, come dei modi oscillatori che a quanto pare non sono stati osservati. Cerchiamo di capire perché si dice che c’è una massa quando l’impulso del campo è proporzionale alle velocità. Facile! La massa è il coefficiente che lega l’impulso alla velocità. Si può considerare la massa in altro modo: una particella ha una massa se si deve esercitare una forza per farla accelerare. Cerchiamo di capire più da vicino da dove hanno origine le forze. Come facciamo a sapere che ci dev’essere una forza? Lo sappiamo perché abbiamo dimostrato le leggi di conservazione dell’impulso per i campi. Se si ha una particella carica e la si spinge per un po’, si produce un certo impulso nel campo elettromagnetico: in qualche modo, dell’impulso si è riversato nel campo; perciò ci deve essere stata una forza che ha spinto l’elettrone per metterlo in moto, una forza in più di quella richiesta dalla sua inerzia meccanica e dovuta alla sua interazione elettromagnetica. Ed una forza deve agire sul "propulsore". Ma da dove viene questa forza? 44 Fig.(3.1) L’auto-forza di un elettrone che accelera non è nulla. Possiamo immaginare l’elettrone come una sfera carica. Quando è in quiete„ ciascun elemento della carica respinge elettricamente ogni altro elemento, ma le forze si fanno equilibrio a coppie e così non c’è complessivamente nessuna forza. Però quando l’elettrone viene accelerato, le forze non rimangono in equilibrio, per il fatto che gli effetti elettromagnetici richiedono un cero tempo per trasmettersi da un elemento all’altro. Se prendiamo in considerazione la forza sull’elemento α (in Fig.(3.1)(b)) da parte di un elemento β che si trova dalla parte opposta, essa dipende dalla posizione di β a un istante anteriore. Se la carica sta accelerando, le forze sulle varie arti dell’elettrone potrebbero essere come illustrato in Figura(3.1)(c). Sommate, queste forse non si compensano. Si compenserebbero a velocità uniforme, sebbene sembri che il ritardo debba condurre a una forza non compensata anche per una velocità uniforme. Però risulta che non c’è una forza complessiva ameno che l’elettrone non venga accelerato. Quando c’è un’accelerazione, se si considerano le forze tra le varie pari dell’elettrone, si trova che azione e reazione non sono esattamente uguali e che l’elettrone esercita una forza su sé stesso che tende a fermare l’accelerazione. È possibile, ma risulta difficile, calcolare questa forza di auto-reazione. Ci limiteremo a fornire il risultato per un caso particolare: moto unidimensionale, supponiamo secondo l’asse x. Allora l’auto-forza si può scrivere come una serie. Il primo termine della serie dipende dall’accelerazione ẍ, il secondo è ... proporzionale a x e così via. Il risultato è F =α 2 e2 ... e2 a .... e2 x x + ....., ẍ − + γ ac2 3 c3 c4 (3.9) dove α e γ sono i coefficienti dell’ordine di 1. Il coefficiente α del termine in ẍ dipende da quale distribuzione di carica si postula; se la carica è distribuita uniformemente sulla sfera, allora è α = 2/3. C’è un termine proporzionale 45 all’accelerazione che varia come l’inverso del raggio a dell’elettrone ed è in accordo con il valore che si è ottenuto (nell’equazione (3.4)) per mel . Se si sceglie una diversa distribuzione di carica, in modo tale che α cambi, la frazione 2/3 nell’equazione (3.4) cambierebbe nello stesso modo. Il termine ... in x è indipendente dalla scelta del raggio a e anche dalla distribuzione di carica; in ogni caso il coefficiente è 2/3. Il termine successivo è proporzionale al raggio a ed il suo coefficiente γ dipende dalla distribuzione di carica. Se si fa tendere a zero il raggio a dell’elettrone l’ultimo termine va a zero; il secondo termine resta costante, mentre il primo termine -la massa elettromagneticava all’infinito. Si può osservare che l’infinito compare a causa della forza di una parte dell’elettrone su un’altra; questo perché abbiamo ammesso la possibilità che un elettrone "puntiforme" agisca su sé stesso. 3.5 Tentativi di modificare la teoria di Maxwell Vogliamo ora discutere della possibilità di modificare la teoria di Maxwell dell’elettrodinamica così che l’idea dell’elettrone come una semplice carica puntiforme possa essere conservata. Sono state ipotizzate alcune teorie in grado di "sistemare" le cose in modo tale che tutta la massa dell’elettrone fosse elettromagnetica; ma alla fine tutte queste teorie sono state fallimentari. Sono state proposte anche delle teorie nelle quali la possibilità che un elettrone interagisca con sé stesso viene esclusa. Allora non c’è più l’infinito dovuto all’auto-interazione. Inoltre non c’è più alcuna massa elettromagnetica associata alla particella, tutta la massa è meccanica. C’è da dire che si incorre in nuova difficoltà con questa teoria. Le teorie che negano la possibilità dell’auto-interazione di un elettrone richiedono la modifica dell’idea di campo elettromagnetico. La forza su una particella in un qualsiasi punto è determinata da due grandezze: E e B. Se si esclude l’idea di "auto-forza" ciò non può più essere vero, perché se c’è un elettrone in un certo punto, la forza non è data da E totale e B totale, ma soltanto da quelle parti di E e B dovute ad altre cariche. Bisogna sempre tener conto di quanta parte di E e B è dovuta alla carica sulla quale si sta calcolando la forza e quanta è dovuta alle altre cariche. Questa teoria permette di liberarsi dalle difficoltà dell’infinito. Se si vuole, si può dire che non esiste nulla di simile a un elettrone che agisce su sé stesso e non considerare il gruppo di forze espresse dall’equazione (3.9). ... Ma il secondo termine in x che appare nell’equazione serve. Questa forza fa qualcosa di molto preciso: scartandola si è nei guai. quando si accelera una carica, essa irradia onde elettromagnetiche e perde 46 energia. Perciò per accelerare una carica si deve esigere che la forza sia piu grande che per accelerare un oggetto neutro avente la stessa massa; altrimenti l’energia non sarebbe conservata. Il lavoro svolto per unità di tempo per accelerare una carica, deve essere uguale alla corrispondente perdita d’energia per irradiazione. La forza-extra, contro la quale si deve compiere lavoro, da dove viene? Per un elettrone singolo che irradia in uno spazio altrimenti vuoto, sembra esserci un’origine da dove la forza possa venire: l’azione di una parte dell’elettrone su un’altra parte. Una carica oscillante irradia un’energia per unità di tempo pari a 2 e2 (ẍ)2 dW = dt 3 c3 (3.10) Cosa si ottiene per il lavoro per unità di tempo fatto su un elettrone contro la forza auto-frenante? Il lavoro per unità di tempo è la forza per la velocità, ossia F ẍ: e2 2 e2 ... dW = α 2 ẍẋ − 3 x ẋ + ..... dt ac 3c (3.11) Il primo termine è proporzionale a dẋ2 /dt e corrisponde all’aumento per unità di tempo dell’energia cinetica 12 mv 2 associata alla massa elettromagnetica. Il secondo termine dovrebbe corrispondere alla potenza irradiata data dall’equazione (3.10); ma è diverso? La discrepanza nasce dal fatto che il termine nell’equazione (3.11) è vero in generale, mentre l’equazione (3.11) è corretta solo per una carica oscillante. Si può mostrare che entrambi i termini sono equivalenti se il moto della carica è periodico. Riscrivendo il secondo termine dell’equazione (3.11) nella seguente forma − 2 e2 2 2 e2 d ( ẋẍ) + (ẍ) 3 c3 dt 3 c3 otteniamo una pura trasformazione algebrica. Se il moto dell’elettrone è periodico, la grandezza ẋẍ torna periodicamente allo stesso valore e considerando la media della sua derivata temporale otteniamo come risultato zero. Il secondo termine è sempre positivo, quindi la sua media sarà positiva. Questo termine fornisce il lavoro complessivo svolto ed è uguale al lato destro dell’equazione (3.10). Il termine in ẍ dell’auto-forza non può essere scartato in quanto abbiamo ammesso la conservazione dell’energia. È stato uno dei trionfi di Lorentz il 47 mostrare che esiste una tale forza e che essa proviene dall’azione dell’elettrone su sé stesso. Ci sono stati altri diversi tentativi di modificare le leggi dell’elettrodinamica. Una strada, proposta da Born e Infeld, fu quella di cambiare le leggi di Maxwell in modo tale che esse non risultassero più lineari. Un’altra teoria fu suggerita da Dirac: si suppone che l’elettrone agisca su sé stesso per via del secondo termine dell’equazione (3.9) e non del primo. Per considerare solo il secondo termine dell’equazione avanzò un’ipotesi particolare nel momento in cui si accettarono le onde ritardate come soluzioni dell’equazione di Maxwell, se si considerano le onde anticipate si ottiene un risultato completamente diverso. In questo caso la formula per l’auto.forza diventa e2 a .... 2 e2 ... e2 (3.12) F = α 2 ẍ + 3 x + γ 4 x . ac 3c c Osserviamo che tale equazione è simile all’equazione (3.9) eccetto per il segno del secondo termine della serie, e di alcuni termini di ordine superiore. La differenza dell’equazione (3.9) e l’equazione (3.12) divisa per due è 2 e2 ... x + termini di grado superiore. 3 c3 In tutti i termini di grado superiore il raggio a compare al numeratore elevato un certo esponente positivo. Quando di passa al limite per una carica puntiforme si ottiene soltanto il primo termine, quello di cui si ha bisogno. In tal modo Dirac aveva ottenuto la forza dovuta alla resistenza di radiazione, non accompagnata da forza d’inerzia. Non si ha massa elettromagnetica e la teoria classica è salva, grazie ad un’ipotesi arbitraria riguardante l’auto-forza. L’arbitrarietà di tale ipotesi venne più tardi risolta da Wheeler e Feynman, i quali proposero una teoria ancora più strana. Tale teoria proponeva l’idea che le cariche puntiformi interagiscono soltanto con altre cariche, ma l’interazione avviene per metà per mezzo di onde anticipate e per metà per mezzo di onde ritardate. Nella maggior parte dei casi non si vede alcun effetto da parte delle onde ritardate: ma esse hanno l’effetto di produrre la forza di reazione della radiazione. La resistenza di radiazione non è dovuto all’azione dell’elettrone su sé stesso, ma ad un effetto caratteristico. L’effetto caratteristico è dovuto al fatto che quando un elettrone viene accelerato all’istante t, esso agisce su tutte le altre cariche dell’Universo a un istante futuro t0 = t + r/c per effetto delle onde ritardate. Però le altre cariche reagiscono sull’elettrone originario per mezzo delle loro onde anticipate che arriveranno al tempo t00 = t0 − r/c che coincide con c. La combinazione delle onde ritardate con quelle anticipate sta a significare che all’istante in cui viene accelerata, una carica oscillante risente una F =− 48 forza da parte di tutte le cariche che "dovranno" assorbire le onde da esse irradiate. Un’altra teoria, che porta alla modifica delle leggi dell’elettrodinamica, venne proposta da Bopp. Supponiamo di voler cambiare le formule dei potenziali in funzione delle cariche e delle correnti. I potenziali in un punto sono determinati dalla densità di corrente (o di carica) in ogni altro punto a un istante anteriore. Utilizzando la notazione quadrivettoriale per i potenziali otteniamo Z jµ (2, t − r12/c ) 1 dV2 . (3.13) Aµ (1, t) = 4π0 c2 r12 Essenzialmente l’idea di Bopp è questa: l’intoppo forse sta nel termine 1/r che compare nell’integrale. Supponiamo che il potenziale in un punto dipenda dalla densità di carica in ogni altro punto secondo una certa funzione-f (r12 )della distanza fra i punti. Il potenziale nel punto (1) sarà dato dall’integrale su tutto lo spazio di jµ moltiplicata per tale funzione: R Aµ (1) = jµ (2)f (r12 )dV2 . Richiediamo che il risultato sia relativisticamente invariante. Come "distanza" bisogna scegliere la "distanza" invariante tra due punti dello spaziotempo. Il quadrato di tale distanza è 2 s212 = c2 (t1 −t2 )2 −r12 = c2 (t1 −t2 )2 −(x1 −x2 )2 −(y1 −y2 )2 −(z1 −z2 )2 . (3.14) Per avere una teoria relativisticamente invariante bisogna prendere una funzione del valore assoluto di s12 o una funzione di s212 . Allora la teoria di Bopp si basa sul fatto che Z Aµ (1, t1 ) = jµ (2, t2 )F (s212 )dV2 dt2 . (3.15) Rimane da scegliere un’adatta funzione per F . Si suppone che F sia molto piccola eccetto quando l’argomento è quasi nullo; così che il grafico di tale funzione assomigli a una punta stretta con area finita, centrata nel punto s2 = 0 e con larghezza all’incirca a2 . Quando si calcola il potenziale nel punto (1), solo quei punti (2) per i quali 2 s212 = c2 (t1 −t2 )2 −r12 differisce da zero di meno che ±a2 producono un effetto apprezzabile. Si può riassumere affermando che la funzione F è importante solo quando 2 s212 = c2 (t1 − t2 )2 − r12 ≈ ±a2 . (3.16) 49 Supponiamo ora che a sia sufficientemente piccolo in modo tale che si abbia r12 a. Allora l’equazione (3.16) afferma che le cariche contribuiscono all’integrale dell’equazione (3.15) soltanto quando la quantità t1 − t2 cade nell’intervallo s p a2 2 2 ≈ r12 1 ± 2 . c(t1 − t2 ) ≈ r12 r12 Fig(3.2) Funzione F (s2 ) 2 1, la radice quadrata può essere approssimata con 1 ± Siccome a2 /r12 2 2 a /2r12 , perciò si ha r12 a2 r12 a2 t1 − t2 = 1± 2 = ± . c 2r12 c 2r12 c Da questo risultato notiamo che nell’integrale di Aµ i soli tempi t2 che contano sono quelli che differiscono da t1 , cioè da tempo al quale si vuole il potenziale, per il ritardo r12 /c. In poche parole la teoria di Bopp tende alla teoria di Maxwell, nel senso che essa dà effetti di onda ritardata. Se integriamo l’integrale dell’equazione (3.15) rispetto a t2 da −∞ a +∞, tenendo fisso r12 , allora anche s212 va da −∞ a +∞. L’integrale verrà da valori di t2 che cadono nell’intervallo ∆t2 = 2 × a2 /2r12 c, centrato nel punto t1 − r12 /c. Supponiamo che la funzione F (s2 ) assuma valore K nel punto s2 = 0; allora l’integrale rispetto a t2 darà approssimativamente come risultato Kjµ ∆t2 , ossia 50 Ka2 jµ . c r12 Si deve scegliere il valore di jµ all’istante t2 = t1 − r12 /c, perciò l’equazione (3.15) diventa Aµ (1, t1 ) = ka2 R jµ (2, t − r12/c ) dV2 c r12 Se si pone K = q 2 c/4π0 a2 , si ottiene proprio la soluzione delle equazioni di Maxwell corrispondente al potenziale ritardato, inclusa la dipendenza da 1/r. La teoria di Bopp prevede una massa elettromagnetica finita dell’elettrone, mentre energia e massa mostrano la giusta relazione secondo la teoria della relatività. C’è un’obiezione in questa teoria, come in tutte le altre teorie che sono state esposte: tutte le particelle obbediscono alle leggi della meccanica quantistica, perciò si deve fare una modifica quantistica all’elettrodinamica. Gli effetti quantistici portano dei cambiamenti: la formula per la massa risulta modificata e la costante } appare, ma il risultato è infinito, a meno di non escludere in qualche modo una certa integrazione. Inoltre, il risultato dipende da come si troncano gli integrali. Nessuno ha avuto successo nel costruire una teoria quantistica coerente a partire da nessuna delle teorie modificate. Le idee di Born e Infeld non sono mai state convertite in una teoria quantistica soddisfacente e lo stesso lo si può affermare per le onde anticipate e ritardate di Dirac o di Wheeler e Feynman e della teoria di Bopp. Non si sa come costruire una teoria coerente, che includa la meccanica quantistica, la quale non dia un risultato infinito per l’energia intrinseca dell’elettrone o di qualsiasi carica puntiforme. Nello stesso tempo non esiste una teoria soddisfacente che descriva una carica non puntiforme. Un problema insoluto. Riassumendo: -la teoria elettromagnetica prevede l’esistenza di una massa elettromagnetica, ma al tempo stesso fallisce perché non si ha una teoria coerente; -l’idea di una massa elettromagnetica trova conferma nell’esperienza; -le masse elettromagnetiche delle particelle sono all’incirca le stesse di quella dell’elettrone. Per esempio, il protone e il neutrone sono due particelle identiche dal punto di vista delle interazioni ma diverse elettricamente. Esse presentano una piccola differenza delle masse. Tale differenza, espressa come la differenza delle energie di quiete mc2 misurate in Mev, è circa 1,3 Mev, cioè circa 2,6 volte la massa in quiete dell’elettrone. La teoria classica prevederebbe un raggio che è circa 13 e 12 del raggio classico dell’elettrone, ossia circa 10−13 cm. In realtà si dovrebbe adoperare la teoria quantistica, ma per un caso 51 strano, tutte le costanti (2π, }, ecc..) risultano combinate in modo tale che la teoria quantistica dia all’incirca lo stesso raggio della teoria classica. L’unica elemento di discrepanza è il segno sbagliato! Il neutrone è più pesante del protone. Ci sono diverse altre coppi , o triplette di particele che sembrano essere le stesse eccetto per la carica elettrica. Esse interagiscono con i protoni e neutroni per mezzo delle interazioni forti caratteristiche delle forze nucleari. 52