ELETTROMAGNETISMO PARTE II PIERO CALDIROLA MARCELLO FONTANESI ELIO SINDONI MASSON Milano • Parigi • Barcellona • Bonn 1993 PREFAZIONE È questa la seconda parte del volume di «Elettromagnetismo» che gli autori hanno tratto dal contenuto dei corsi di Fisica Generale II da essi tenuti negli ultimi anni presso l'Università di Milano. La prima parte del volume, dedicata essenzialmente all'elettrostatica e alla corrente stazionaria, era stata pubblicata nel 1974. Il nuovo volume inizia con la trattazione della magnetostatica nel vuoto e nei mezzi materiali: se ne espongono le leggi fenomenologiche mostrando poi come le proprietà magnetiche di un corpo macroscopico traggano origine dalle proprietà degli atomi che lo costituiscono. Segue la trattazione del fenomeno dell'induzione elettromagnetica e quella dei circuiti in corrente continua ed alternata. Infine, partendo dalle leggi fenomenologiche già studiate, si espone la teoria del campo elettromagnetico compendiata nelle equazioni di Maxwell illustrandone alcuni aspetti importanti quali le proprietà delle onde elettromagnetiche in dipendenza anche delle caratteristiche del mezzo in cui esse si propagano. Un particolare accento viene dato, anche per l'interesse tecnico che l'argomento presenta, alla propagazione di tali onde in cavi coassiali e in guide. L'ultimo capitolo contiene un'esposizione sommaria ma autosufficiente della teoria della relatività ristretta (meccanica ed elettromagnetismo), il cui algoritmo viene semplificato al massimo (evitando fra l'altro l'uso del calcolo tensoriale) ed applicato a problemi concreti di interesse diretto per la fìsica sperimentale. GLI AUTORI Milano, aprile 1976 INDICE CAPITOLO 8 MAGNETOSTATICA NEL VUOTO 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 8.10 8.11 8.12 8.13 8.14 Introduzione Il vettore induzione magnetica B Forza agente su un circuito percorso da corrente Coppia agente su un circuito chiuso percorso da corrente Comportamento di un ago magnetico in un campo magnetico Moto di un elettrone in un campo magnetico uniforme Campo generato da un filo rettilineo indefinito percorso da corrente. Legge di Biot e Savart Prima formula di Laplace e sue applicazioni Forze agenti tra due circuiti percorsi da corrente Potenziale scalare magnetico Legge della circuitazione di Ampère II flusso di B Potenziale vettore magnetico Potenziale vettore magnetico generato da una spira percorsa da corrente 1 3 5 7 10 13 15 17 24 26 29 33 34 35 CAPITOLO 9 MAGNETOSTATICA NEI MEZZI MATERIALI 9.1 9.2 9.3 9.4 9.5 9.6 9.7 Introduzione Correnti atomiche e vettore di magnetizzazione Correrie di magnetizzazione Campo magnetico generato da un materiale magnetizzato. Rappresenta zione mediante correnti di magnetizzazione Il vettore H. La legge della circuitazione di Ampère in presenza dei materiali magnetizzati Le equazioni del campo. Le condizioni al contorno di B ed H Campo magnetico esterno ad un materiale magnetizzato. Rappresentazione mediante poli magnetici 39 39 41 46 48 49 51 VII 9.8 9.9 9.10 9.11 9.12 Campo magnetico interno ad un materiale magnetizzato La suscettività e la permeabilità magnetica Materiali ferromagnetici. Ciclo di isteresi Circuiti magnetici Magneti permanenti 53 56 58 62 66 CAPITOLO 10 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE DI UN MATERIALE 10.1 10.2 10.3 10.4 10.5 Introduzione Campo magnetico molecolare Origine del diamagnetismo L'origine del paramagnetismo Il ferromagnetismo e la legge di Curie-Weiss 71 72 74 80 82 CAPITOLO 11 L'INDUZIONE ELETTROMAGNETICA 11.1 11.2 11.3 11.4 11.5 11.6 Introduzione La legge dell'induzione elettromagnetica Flusso tagliato e flusso concatenato Autoinduttanza Mutua induttanza L'energia magnetica 89 89 92 94 96 97 CAPITOLO 12 CIRCUITI IN CORRENTE CONTINUA ED ALTERNATA 12.1 Introduzione 12.2 Generatori di tensione e di correnti costanti 12.3 Le leggi di Kirchhoff 12.4 Il metodo delle correnti dei rami 12.5 Il metodo delle correnti di maglia 12.6 Metodo dei nodi 12.7 Il teorema di Thevenin 12.8 Fenomeni transitori 12.9 Correnti alternate 12.10 Rappresentazioni mediante vettori ruotanti 12.11 Rappresentazione mediante numeri complessi 12.12 L'impendenza 12.13 Circuito R-L-C in serie 12.14 Potenza dissipata nei circuiti a corrente alternata 101 102 103 106 109 110 112 123 126 129 131 135 143 IX CAPITOLO 13 TEORIA DEL CAMPO ELETTROMAGNETICO 13.1 Equazioni differenziali di Maxwell 13.2 Conservazione dell'energia e vettore di Poynting 13.3 Quantità di moto elettromagnetica 13.4 Potenziali del campo elettromagnetico 13.5 Equazione generale delle onde 13.6 Onde piane in un mezzo omogeneo isolante 13.7 Onde sinusoidali 13.8 Rappresentazione complessa delle onde 13.9 Onde piane monocromatiche in un mezzo conduttore 13.10 Quantità di moto, energia, intensità di un'onda elettromagnetica 13.11 Condizioni al contorno per campi variabili 13.12 Riflessione e rifrazione delle onde elettromagnetiche 13.13 Cenno alle onde emergenti o convergenti in un punto 13.14 Radiazione di una carica in moto accelerato 147 152 153 155 158 160 165 168 169 170 174 176 179 181 CAPITOLO 14 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI E GUIDE D'ONDA 14.1 14.2 14.3 14.4 Introduzione Onde in un cavo coassiale Il cavo coassiale rappresentato mediante elementi concentrati Guida d'onda rettangolare 187 187 191 196 CAPITOLO 15 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA 15.1 15.2 15.3 15.4 15.5 Relatività della meccanica galileiana I fenomeni elettromagnetici e l'ipotesi dell'etere I principi della relatività ristretta Elettrodinamica Relativistica Dinamica Relativistica 201 210 218 244 251 INDICE ANALITICO 263 8 Magnetostatica nel vuoto 8.1 Introduzione Risulta certamente difficile poter dire quando e da chi per primo fu osservato il fenomeno dell'attrazione tra due pezzi di materiale ferroso spontaneamente magnetizzati. Possiamo tuttavia ritenere che questo evento si sia verificato in tempi piuttosto remoti e che abbia senz'altro costituito motivo di sorpresa e fonte di riflessione per gli occasionali sperimentatori, tanto più se consideriamo che su questo argomento anche in epoche recenti le nostre conoscenze erano rimaste estremamente approssimative e pervase più di occultismo che di spirito scientifico. Già in testi di scrittori greci e latini si rintracciano frequenti accenni alle proprietà presentate da un particolare materiale, da noi attualmente denominato magnetite, e che sappiamo costituito da un ossido ferrico ferroso (Fe3O4), di attrarre oggetti di ferro e di trasmettere ad essi, una volta venuti in contatto, lo stesso potere. Il termine magnete, con il quale questo materiale veniva indicato, secondo la leggenda deriverebbe dal nome di un pastore greco, Mχγης, il quale per caso scopri che la punta di ferro del suo bastone veniva attirata da alcune rocce. Più probabilmente l'origine di questo nome dovrebbe derivare dal nome di una località. Magnesia, presso la quale furono rinvenuti nell'antichità giacimenti di magnetite. Benché, come abbiamo accennato, la conoscenza dei fenomeni più appariscenti connessi con i materiali magnetizzati risalga ad epoche lontane nel tempo, tuttavia i primi accenni ad una applicazione pratica del magnetismo si possono ritrovare in Cina, in scritti del XI secolo, ed in Europa in scritti del XII secolo. 2 MAGNETOSTATICA NEL VUOTO [CAP. 8 Fu infatti proprio nel periodo di poco antecedente alla stesura di queste cronache che la capacità di un ago di materiale magnetizzato ad assumere la direzione sudnord cominciò a venir utilizzata nella costruzione della bussola ai fini dell'orientamento, soprattutto durante la navigazione. Solo verso la fine del XVI secolo e all'inizio del XVII secolo lo studio dei fenomeni magnetici ha assunto un aspetto sistematico basato su dati sperimentali attendibili. Nel 1600 in particolare William Gilbert riassunse, nel trattato «De Magnete», le conoscenze disponibili al suo tempo sulle interazioni tra magneti. Gilbert, oltre ad offrire con il suo trattato un valido punto di partenza per le speculazioni successive, contribuì in maniera originale allo sviluppo delle teorie sul magnetismo con alcune esperienze da lui condotte su piccole sferette di magnetite che egli chiamò terrule. Mostrò come sottili aghi magnetici, disposti nelle vicinanze di una sfera di materiale magnetico, subissero delle azioni torcenti disponendosi lungo delle linee che partendo da un polo terminavano nel polo opposto. Estrapolando i risultati così ottenuti, egli affermò che la terra altro non era che un grosso magnete, i poli magnetici del quale erano situati in vicinanza dei poli geografici: come sappiamo questo concetto è oggi alla base della moderna teoria del magnetismo terrestre. Nel 1777 C. A. Coulomb, per mezzo della stessa bilancia di torsione da lui impiegata per ricavare la legge sulle forze esercitantesi tra cariche elettriche, stabilì una legge analoga per le attrazioni magnetiche. La dimostrazione che anche la forza attrattiva o repulsiva tra due piccoli corpi magnetizzati presentava un andamento proporzionale all'inverso del quadrato dalla loro distanza impresse un notevole vigore alle ricerche inerenti i corpi magnetici. Si arriva così ai primi dell'ottocento con l'opinione diffusa tra i ricercatori che i fenomeni elettrici ed i fenomeni magnetici dovessero avere qualcosa in comune anche se non era stato possibile mettere in evidenza alcuna influenza reciproca tra corpi elettricamente carichi e calamite naturali. Fu il fisico danese Hans Christian Oersted che nel 1820 scoprì l'esistenza di una interazione tra magneti naturali e cariche in moto. Per primo infatti egli si accorse che una corrente elettrica produceva una azione rotante su un ago di materiale magnetizzato posto in vicinanza del filo percorso da corrente. Tale scoperta segnò l'inizio della moderna teoria del magnetismo. La comunicazione di questi risultati data nel settembre 1820 da Arago alla Accademia delle Scienze Francesi spinsero A. M. Ampère a ripetere ed ampliare le esperienze di Oersted. Il fisico francese non solo riuscì a riottenere in breve tempo i risultati di Oersted ma dimostrò anche che due fili percorsi nello stesso verso da corrente elettrica si attraggono mentre quando vengono percorsi dalla corrente in verso opposto si respingono. Trovò inoltre che una spira mobile percorsa da corrente in presenza di un corpo magnetizzato o di un'altra spira percorsa da corrente si orienta in una determinata direzione in maniera analoga e quanto avviene per l'ago di una bussola. L'intuizione più famosa di Ampère resta comunque quella sull'origine elettrica delle forze magnetiche: essa è basata sull'ipotesi che attorno ad ogni molecola di un corpo magnetico possa circolare una corrente elettrica microscopica. Tutte queste scoperte, unite a quella compiuta intorno al 1832 da M. Faraday sull'induzione elettromagnetica, vennero infine riprese, rielaborate e 8.2] IL VETTORE INDUZIONE MAGNETICA B 3 poste nella forma matematica definitiva, che è quella che ancor oggi utilizziamo, da Clark Maxwell. Scopo di questo e dei tre successivi capitoli è quello di esporre le principali leggi che regolano i fenomeni del magnetismo, di dare qualche breve cenno sulla loro interpretazione microscopica e di ricavare le corrispondenti equazioni di Maxwell nel vuoto e nella materia. Al fine di introdurre alcuni concetti elementari cominciamo col ricordare una semplice esperienza, che fu anche una delle più significative compiute da Ampère. Precisamente quella relativa all'azione reciproca fra due circuiti A e B nei quali siano inseriti dei generatori, che consentono di fare circolare in essi delle correnti elettriche. Supponiamo che il circuito A sia tenuto fisso, mentre quello B sia libero di ruotare attorno ad un asse. È immediato constatare che quando si faccia fluire corrente nei due circuiti, il circuito mobile B si mette in moto ruotando fino ad assumere una determinata posizione, dipendente da quella di A. Si può così concludere che fra i due circuiti si esercitano delle forze che, per il fatto di trarre origine dalla corrente elettrica, si sogliono chiamare elettrodinamiche. E come l'azione elettrica fra due cariche si ritiene dovuta al fatto che ognuna di esse è immersa nel campo elettrico generato dall'altra, così l'azione elettrodinamica fra correnti (che, come sappiamo, non sono altro che cariche in moto) può essere interpretata come dovuta al fatto che ciascuna di esse viene a trovarsi immersa in un particolare campo (distinto da quello elettrico) generato dall'altra. A tale campo si dà il nome di campo magnetico. Più precisamente, dunque, una carica in moto esercita su un'altra carica oltre alla forza di natura elettrica, un'altra forza denominata magnetica. In base a quanto detto è anche chiaro che effetti analoghi si avranno sostituendo al filo percorso da corrente del circuito B un fascetto di elettroni quale è quello che si ha in un tubo a raggi catodici. Si osserva infatti che, sotto l'azione del campo magnetico creato dal circuito A, il fascetto di elettroni subisce una deflessione. In questo capitolo ci limiteremo allo studio del campo magnetico generato da circuiti, disposti nel vuoto, percorsi da correnti stazionarie: studieremo cioè la cosiddetta magnetostatica nel vuoto. Campi magnetici sono anche quelli generati dai magneti naturali (calamite) e dai magneti permanenti, di acciaio, sui quali torneremo in seguito; vedremo allora che il comportamento delle calamite e dei magneti artificiali può essere compreso alla luce dei risultati relativi ai campi magnetici generati dalle correnti in conformità a quanto intuito da Ampère. 8.2 Il vettore induzione magnetica B Come per esplorare il campo elettrico si adopera una carica puntiforme di piccolo valore (in modo che essa non alteri per influenza o per polarizzazione elettrostatiche la distribuzione delle cariche generanti il campo che si vuole studiare), così per esplorare il campo magnetico si può ricorrere a una carica analoga in moto. 4 MAGNETOSTATICA NEL VUOTO [CAP. 8 Ricordiamo che il campo elettrico E viene definito come il rapporto : (8.1) essendo q la carica esploratrice ed F la forza a cui essa è soggetta. Nell'assumere questa definizione si suppone che la carica q sia tenuta ferma in un punto dello spazio e che su di essa non agisca altra forza se non quella di natura elettrica. In modo analogo, nel definire il vettore B, che caratterizza il campo magnetico e prende il nome di vettore induzione magnetica, (1) si suppone che sulla carica q, in moto con la velocità u, non operino altre forze (di natura ad esempio elettrica o meccanica) all'infuori di quella dovuta alla esistenza di un campo magnetico. Misurando allora il valore della forza F, dovuta alle azioni magnetiche nelle varie direzioni, si osserva che nella direzione di u tale forza è nulla mentre essa risulta massima in direzione perpendicolare ad u ; inoltre il modulo della forza è proporzionale alla carica q e al modulo u della velocità. Assumeremo come direzione e verso del vettore induzione magnetica B in un certo punto la direzione e il verso che risulta dalla relazione sperimentale: F = qu × B . (8.2) Si può poi verificare che questa relazione è effettivamente valida per tutte le velocità u. La (8.2) è comunemente denominata forza di Lorentz. È importante notare come non sia sufficiente una sola operazione di misura per determinare B. Infatti non è possibile, con una semplice operazione, ricavare B dalla relazione vettoriale (8.2) e questo è messo bene in evidenza dalle relazioni (1.18) e (1.19) riportate nel primo capitolo. Eseguendo due misure di F, che denoteremo F1 ed F2, in corrispondenza a due velocità u1 ed u2 tra loro normali, in virtù della (8.2) si ha: (8.3) Moltiplicando scalarmente per u1 queste relazioni, ricordando che u1 ed u2 (1) Secondo la concezione moderna del magnetismo, da noi seguita in questo libro, risulterebbe più appropriato attribuire al vettore B il nome di intensità del campo magnetico, dato che esso è l'analogo magnetico del vettore E, intensità di campo elettrico. Nella concezione antica del campo magnetico, la quale metteva in primo piano il campo magnetico generato dalle calamite, al vettore B era stato riservato il nome di vettore induzione magnetica. Si è tuttavia convenuto, al fine di evitare noiosi cambiamenti di nomenclatura, di conservare tale nome anche nelle esposizioni moderne del magnetismo, sebbene esso appaia evidentemente improprio. 8.3] FORZA AGENTE SU UN CIRCUITO PERCORSO DA CORRENTE 5 sono tra loro perpendicolari, e sottraendo la seconda dalla prima, otteniamo: (8.4) espressione che permette di determinare la costante c1. La prima delle (8.3) può pertanto scriversi: (8.5) da cui si vede esplicitamente come per la determinazione del vettore B siano necessarie e sufficienti due distinte misure. Dalla (8.2) è possibile ricavare le dimensioni e le unità di misura dell'induzione magnetica B. Si ha infatti per le dimensioni: mentre l'unità di misura nel sistema MKS è: (8.7) avendo denominato weber il volt ⋅ secondo; un weber/m2 è il valore dell'induzione magnetica che esercita su una carica di un coulomb, che si muova perpendicolarmente al campo magnetico con la velocità di 1 m/s, la forza di un newton. Vogliamo osservare che la definizione di B per mezzo della forza di Lorentz non è la sola possibile. Nella letteratura si trovano frequentemente altre due definizioni, ovviamente equivalenti a quella da noi adottata. La prima di queste è basata sulla forza a cui è sottoposto, in un campo magnetico, un elemento di conduttore metallico in cui fluisca una corrente di intensità I; la seconda sul momento meccanico della coppia di forze che il campo magnetico esercita su un circuito attraversato da corrente. Nei paragrafi successivi tratteremo brevemente questi due argomenti cogliendo l'occasione per introdurre alcuni concetti fondamentali per l'esposizione della teoria della magnetostatica. 8.3 Forza agente su un circuito percorso da corrente Consideriamo un filo metallico rettilineo di lunghezza l e sezione costante S, percorso da una corrente stazionaria di intensità I, posto in una regione dello spazio ove esista un campo magnetico uniforme. Si può provare sperimentalmente che sul conduttore agisce una forza, dovuta solo alle azioni magnetiche, data dalla relazione: F=I l×B (8.8) 6 MAGNETOSTATICA NEL VUOTO [CAP. 8 dove B è il vettore induzione magnetica introdotto nel paragrafo precedente ed l è un vettore che ha modulo uguale alla lunghezza del filo e direzione e verso coincidenti con quelli in cui fluisce la corrente I. Appare evidente come quest'ultima relazione possa essere utilizzata in luogo della (8.2) per la definizione del vettore B. Vogliamo ora dimostrare che la relazione (8.8) può essere ricavata partendo da un punto di vista microscopico utilizzando l'espressione della forza di Lorentz agente su una carica in moto. La corrente I che percorre il filo è uguale a JS dove J è la densità di corrente che, come sappiamo, è data da: J = -e N u (8.9) con N numero di elettroni liberi per unità di volume, e modulo della carica dell'elettrone ed u velocità di deriva degli elettroni. Essendo il conduttore immerso in un campo magnetico uniforme, su ognuno degli elettroni liberi si esercita la forza di Lorentz F= - e u × B e sul filo agisce quindi una forza risultante uguale a: F = - e NSl u × B (8.10) avendo tenuto conto che il numero totale di elettroni liberi nel conduttore è uguale ad NSl. Questa espressione, utilizzando la (8.9), diviene: F = Sl J × B. (8.11) Attribuendo un'orientazione al filo e precisamente quella della densità di corrente J, si può scrivere F=Il×B (8.12) che è appunto la relazione macroscopica sperimentale introdotta all'inizio di questo paragrafo. Nel caso di un circuito di forma qualsiasi, percorso da corrente stazionaria I e posto in un campo magnetico in generale non uniforme, è possibile calcolare la forza agente su di esso applicando una formula, dovuta a Laplace, secondo la quale ogni elemento infinitesimo dl di circuito è sottoposto ad una forza: dF = I dl × B (8.13) avendo indicato con B il valore dell'induzione magnetica nel punto ove è posto l'elemento dl, orientale nella direzione e verso di percorrenza della corrente. Integrando la (8.13) lungo la linea C del circuito otteniamo: (8.14) 8.4] COPPIA AGENTE SU UN CIRCUITO CHIUSO 7 che rappresenta la forza risultante esercitata dal campo magnetico sul circuito stesso. L'espressione (8.13) prende il nome di seconda formula di Laplace. È importante notare come tra le espressioni (8.12) e (8.13) esista una differenza fondamentale. Infatti mentre la prima rappresenta una relazione sperimentale ricavabile in pratica mediante un circuito di prova di dimensioni piccole rispetto alla distanza su cui il campo magnetico si mantiene uniforme, la seconda consiste in una formula matematica di natura puramente teorica, riguardante quantità infinitesime, la cui validità è verificata solo a posteriori confrontando il valore della forza F determinata sperimentalmente con il valore dato dalla (8.14). Poiché valgono le relazioni I dl = J S dl = J dυ è possibile ottenere dalla (8.13) la relazione: (8.15) estendendo l'integrale al volume V occupato dal conduttore percorso da corrente. 8.4 Coppia agente su un circuito chiuso percorso da corrente Sia dato un circuito C, piano e di forma qualsiasi, percorso da una corrente I, posto in una regione dello spazio ove esista un campo magnetico che supporremo uniforme nella regione in cui è posta la spira di corrente. Sulla spira agisce una forza nulla; infatti per la (8.14) abbiamo che: (8.16) essendo ovviamente l'integrale entro parentesi uguale a zero. A causa dell'uniformità del campo magnetico è dunque F = 0; è però possibile dimostrare che in generale sulla spira percorsa da corrente agisce una coppia di forze. A tale scopo scegliamo una terna di assi cartesiani in modo che l'asse z sia perpendicolare al piano contenente la spira ed orientato in modo che la corrente I fluisca in verso antiorario rispetto ad esso. Il vettore induzione magnetica B, uniforme su tutta la superficie delimitata dalla spira, formi un angolo ϑ con l'asse z, il piano z = 0 coincida con il piano contenente la spira e l'asse x della terna cartesiana sia parallelo alla proiezione del vettore B su questo piano. Immaginiamo di suddividere il nostro circuito in tante piccole strisce, il contorno di ognuna delle quali rappresenti una spira di altezza infinitesima percorsa dalla corrente I, sempre in verso antiorario. Due spire adiacenti qualsiasi, hanno un tratto in comune in cui fluisce una corrente di intensità uguale ma di verso opposto; se riuniamo tutte le spire elementari in modo da riottenere il circuito iniziale, l'unica corrente che risulta in definitiva diversa da zero (cioè non compensata da altre in senso opposto) è quella che circola lungo il contorno del circuito. Consideriamo in particolare la spira elementare A1 A2 A3 A4 di 8 MAGNETOSTATICA NEL VUOTO [CAP. 8 Fig. 8.1. Valutiamo anzitutto l'effetto delle forze cui è sottoposta la spira a causa della presenza della componente del vettore B lungo la direzione z. Tali forze, come indicato dalla (8.14), agiranno nel piano della spira. Date le dimensioni elementari della spira, le lunghezze dei suoi lati opposti possono essere considerate uguali ; poiché le forze agenti su di essi sono proporzionali alla lunghezza dei lati esse risultano a due a due uguali in modulo e dirette in verso opposto, formando così un sistema in equilibrio. Seguendo un procedimento diverso abbiamo ritrovato pertanto per un caso particolare il risultato espresso in forma generale dalla equazione (8.16). FIG. 8.1 - Coppia agente su un circuito percorso da corrente in presenza di un campo magnetico. Per quanto riguarda le forze esercitate dalla componente del vettore induzione magnetica lungo l'asse x, B sen ϑ, abbiamo che due di esse, e precisamente quelle applicate ai lati Al A2 ed A3 A4 sono nulle perché la componente di B è rispettivamente parallela e antiparallela alla direzione della corrente. Le altre due forze, applicate ai lati A2 A3 e A4 A1, risultano uguali in modulo, dirette perpendicolarmente al piano contenente la spira ma con verso opposto: esse formano perciò una coppia di forze. Entrambe le forze sono proporzionali alla lunghezza dy della proiezione del lato dl in questione sull'asse y, e sono date dalla relazione dF = IB sen ϑ dy. Il modulo del momento meccanico della coppia è allora: (8.17) dove l è la distanza tra i punti di applicazione delle due forze. Indicando con da l'area l dy della spira elementare, introduciamo la seguente grandezza vettoriale: dm = I da n (8.18) con n che rappresenta il versore normale alla superficie della spira orientato in modo da veder scorrere la corrente in verso antiorario (nel nostro caso perciò 8.4] COPPIA AGENTE SU UN CIRCUITO CHIUSO 9 n è parallelo all'asse z). La grandezza (8.17) prende il nome di momento magnetico della spira elementare. Per la (8.18) il momento meccanico della coppia di forze applicata alla spira elementare di superficie da assume la forma: (8.19) e, per l'uniformità del vettore B, il momento meccanico della coppia agente su tutto il circuito C risulta dato da: (8.20) dove: m = IS n (8.21) è il momento magnetico del circuito C, racchiudente una superficie S, percorso dalla corrente I. L'azione della coppia di forze dovuta al campo magnetico tende a far ruotare il piano in cui giace la spira fino a che esso non risulti perpendicolare al vettore B. In questa condizione, come appare evidente dalla (8,20), il momento meccanico r risulta nullo poiché m e B sono paralleli. È anche interessante ricavare l'espressione (8.20) seguendo un procedimento diverso da quello ora descritto. A questo scopo consideriamo nuovamente il circuito C. Su un tratto di esso agisce una forza dF = I dl × B, ed il momento d di questa forza rispetto all'origine O degli assi cartesiani vale: (8.22) con r che rappresenta la distanza orientata tra O ed il tratto dl. Integrando la (8.22) lungo la linea chiusa C otteniamo: (8.23) Sostituendo nell'integrale (8.23) B= Bx i + Bz k, dl = dx i + dy j ed r = xi + yj si ha: (8.24) I primi tre integrali a destra della (8.24) sono nulli, come può essere visto (vedi Fig. 8.2) spezzando l'integrale lungo C in due parti, una da P1, a P2 e l'altra da P2 a P1 . 10 MAGNETOSTATICA NEL VUOTO [CAP. 8 Il quarto integrale è invece diverso da zero e fornisce l'area racchiusa dal circuito C. Infatti l'integrale esteso da P1 a P2, come può vedersi in Fig. 8.2, dà come risultato l'area della zona tratteggiata in figura più quella racchiusa dalla linea C, mentre l'integrale esteso da P2 a P1 rappresenta l'area della sola zona tratteggiata con il segno negativo. FiG. 8.2 - Calcolo degli integrali della relazione (8.24). In definitiva troviamo che, avendo preso m = mk: (8.25) risultato che coincide con la (8.20). Mediante ragionamenti analoghi è inoltre facile dimostrare che vale la relazione: (8.26) dove S = Sn. Il momento di dipolo magnetico della spira può essere così espresso anche nella forma: (8.27) 8.5 Comportamento di un ago magnetico in un campo magnetico Un ago di materiale magnetico, libero di ruotare intorno ad un asse, sottoposto all'azione di un campo magnetico, quale ad esempio quello generato da una distribuzione di correnti, si comporta in maniera analoga al circuito elementare descritto nel paragrafo precedente. E precisamente: esso si dispone 8.5] COMPORTAMENTO DI UN AGO MAGNETICO 11 parallelamente alla direzione del vettore B in modo tale che il suo polo nord si rivolge nel verso di B (1). Se l'ago viene scostato dalla sua posizione di equilibrio, è possibile constatare che esso viene richiamato in tale posizione da una coppia di forze, il cui momento meccanico dipende dal vettore B secondo una espressione del tipo : (8.28) ove K è un vettore caratteristico del particolare ago considerato, dipendente cioè dalle sue dimensioni e dalla sua magnetizzazione, orientato nel senso polo Sud polo Nord dell'ago (asse dell'ago). La relazione (8.28) mostra che il momento della coppia che si esercita sull'ago è perpendicolare al piano contenente l'ago e il vettore B, ed ha modulo: (8.29) essendo ϑ l'angolo tra l'asse dell'ago ed il vettore B. Osserviamo che un comportamento simile a quello di un ago magnetico immerso in un campo magnetico descritto dall'equazione (8.28) è quello, trattato nel paragrafo 4.3, di un dipolo elettrico posto in un campo elettrostatico E. Avendo definito il momento di dipolo elettrico con p = qδ eravamo stati in grado di mostrare che, sotto l'azione di un campo elettrostatico E, il dipolo era soggetto ad una coppia di momento = p × E. L'analogia formale tra questa espressione e la (8.28), suggerisce di immaginare l'ago magnetico come costituito da due cariche magnetiche, o come si suol dire masse magnetiche, + qm e - qm, una positiva e l'altra negativa, concentrate rispettivamente nel polo Nord e nel polo Sud dell'ago. (2) Introducendo allora un vettore m= qm δ, che denomineremo momento magnetico dell'ago, tale che: K = m=qm δ (8.30) (1) Una immediata applicazione di quanto detto è la bussola: quando l'ago magnetico è sottoposto alla sola azione del campo magnetico terrestre, esso si orienta in modo da indicare la direzione del Nord. (2) Come risulta chiaro dalla nostra espressione, il concetto di massa magnetica è del tutto fittizio; nella primitiva concezione del magnetismo, ormai superata, si attribuiva invece ad esso un significato fisico effettivo analogo a quello attribuito alle cariche elettriche. Fu Weiss che introdusse nella teoria moderna la parola magnetone per rappresentare una massa magnetica elementare analoga all'elettrone. Questo magnetone o monopolo magnetico, che fino ad oggi non ha potuto trovare conferma sperimentale, è sempre risultato per i fisici estremamente allettante in quanto l'esistenza di una tale carica renderebbe simmetriche le equazioni di Maxwell. Ricerche volte ad isolare un monopolo magnetico sono in corso in molti laboratori; alcune di queste erano state precedentemente condotte cercando la presenza di monopoli nella radiazione cosmica. In particolare si è esaminata la tensione indotta in una spira superconduttrice quando ad esempio attraverso di essa viene fatto passare del materiale, quale un meteorite, che è stato soggetto ad un lungo bombardamento da parte di raggi cosmici. 12 MAGNETOSTATICA NEL VUOTO [CAP. 8 la (8.28) si scrive: = m × B. (8.31) Si noti che la (8.30) costituisce, a tutto rigore, la definizione stessa della massa magnetica qm associata a un dipolo magnetico di momento magnetico K. Il confronto tra la (8.31) e la (8.20) mostra immediatamente che l'azione meccanica che si esercita rispettivamente su di un ago magnetico e su di un circuito percorso da corrente immersi in un campo magnetico è la stessa se il momento magnetico dell'ago e quello del circuito, definito secondo la (8.21) come IS n, hanno lo stesso valore. In altri termini, sempre che sia verificata l'eguaglianza tra i rispettivi momenti magnetici, ago magnetico e circuito percorso da corrente risultano equivalenti agli effetti dell'azione meccanica esercitata su di essi da parte di un campo magnetico esterno che tende ad orientare il momento magnetico m parallelamente al suo vettore B. Ma come fu dimostrato da Ampère l'equivalenza tra ago magnetico e circuito è ancora più stretta, in quanto si può provare (come vedremo in seguito) che essi sono equivalenti non solo per quanto riguarda le azioni meccaniche subite da parte di un campo magnetico in cui si trovino immersi, ma anche per quanto riguarda il campo magnetico da essi generato. Le precedenti considerazioni sull'analogia tra dipolo elettrico e dipolo magnetico e tra spira percorsa da corrente ad ago magnetico suggeriscono la possibilità di considerare un circuito percorso da una corrente I sotto un nuovo aspetto, particolarmente interessante. Prendiamo in esame un circuito C percorso da una corrente I e suddividiamo una superficie qualsiasi S, che si appoggi su tale circuito e venga quindi da esso delimitata, in tante piccole areole elementari da. Secondo lo schema utilizzato nel paragrafo precedente si può pensare che il bordo di ciascuna di queste areole sia percorso dalla corrente I sempre nello stesso verso e che la sovrapposizione di tutte queste areole fornisca, come già detto, il circuito C iniziale. Ad ognuna delle superficie elementari da è associato un momento magnetico dm = I da n. Per l'equivalenza tra spira ed ago magnetico caratterizzati da un eguale momento magnetico possiamo considerare la spira elementare come una superficie fisica da sulle cui due faccie esistono due distribuzioni di poli magnetici di segno opposto separate da una piccola distanza δ orientata come la normale esterna n. La densità superficiale σm di queste distribuzioni è data dalla relazione: dm =I da n = σm da δ (8.32) e quindi: σm = I δ (8.33) Sommando tutte le areole da otteniamo una superficie sulle cui due faccie esistono due distribuzioni superficiali di poli magnetici ± σm con modulo dato 8.6] MOTO DI UN ELETTRONE IN UN CAMPO MAGNETICO UNIFORME 13 dalla (8.33) separate da una distanza δ. Tale superficie prende il nome di lamina magnetica, ed ai fini degli effetti magnetici a grande distanza è equivalente al circuito C percorso dalla corrente I. 8.6 Moto di un elettrone in un campo magnetico uniforme Prendiamo in esame una regione dello spazio nella quale sia presente un campo magnetico uniforme e scegliamo una terna di assi cartesiani in modo tale che il vettore induzione magnetica risulti parallelo all'asse z, cioè B = Bk (essendo k il versore dell'asse z). Consideriamo un elettrone in moto nella regione di campo magnetico uniforme con velocità iniziale v0 = v0x i + v0y j + v0z k. L'elettrone di carica - e è soggetto alla forza di Lorentz : F = -e v × B (8.34) pertanto, tenendo conto delle sole azioni magnetiche, l'equazione del moto dell'elettrone, di massa m, è: (8.35) e proiettando sugli assi cartesiani : (8.36). Dall'ultima delle (8.36) si ricava immediatamente che: (8.37) Poiché inoltre la forza di Lorentz risulta essere perpendicolare allo spostamento e quindi non compie lavoro, l'energia cinetica Wk dell'elettrone si mantiene costante, come si può anche direttamente verificare moltiplicando scalarmente per v ambo i membri della (8.35); pertanto: (8.38) Avendo dimostrato che vz è costante, dalla (8.38) deriva che: (8.39) 14 MAGNETOSTATICA NEL VUOTO [CAP. 8 Le prime due equazioni del sistema (8.36) possono essere scritte in maniera compatta nella forma: (8.40) con ωc = eB/m. Queste due espressioni possono essere disaccoppiate per quanto riguarda le incognite vx e vy. Infatti derivando entrambe rispetto al tempo, si ottiene: (8.41) Assumiamo per la prima della (8.41) la soluzione: vx = A sen (ωc t +ϕ ) (8.42) dove A e ϕ sono due costanti positive da determinare mediante le condizioni iniziali. Sostituendo la (8.42) nella prima delle (8.40) ricaviamo che: vy = - A cos (ωc t + ϕ ) . ( Ponendo inoltre v1 = v0 x + v0 y che A = v⊥ per cui : 2 2 ) 1/ 2 (8.43) ed utilizzando la condizione (8.39) si deduce vx = v⊥ sen (ωc t +ϕ ) (8.44) vy = - v⊥ cos (ωc t + ϕ ) Dovendo poi essere all'istante t = 0: vx (0) = v0x e vy (0) = v0y, dalla (8.44) si trova che: (8.45) Integrando le equazioni (8.44) e (8.37) si trova che: (8.46) 8.7] CAMPO GENERATO DA UN FILO RETTILINEO 15 dove x0, y0 e z0 devono essere determinate mediante le condizioni iniziali. Prendendo l'origine delle coordinate nel punto ove l'elettrone si trova all'istante t = 0, si ha (essendo vx0 = v⊥ sen ϕ, vy0 = - v⊥ cos ϕ) che x0 = - v0y/ωc, y0 = v0x/ωc e z0 = 0. Dalla (8.46) è possibile vedere come l'elettrone si muova descrivendo un'elica il cui asse è parallelo alla direzione del vettore B. La proiezione del moto dell'elettrone su un piano perpendicolare all'asse z consiste in una orbita circolare con centro nel punto x0, y0 e raggio: (8.46a) La misura sperimentale del raggio dell'orbita e la conoscenza della velocità iniziale dell'elettrone nella direzione perpendicolare al vettore B permettono quindi, tramite la (8.46a) di determinare l'intensità del campo magnetico nella regione presa in esame. In un campo magnetico con un valore di B di 1 weber/m2 (1) un elettrone dotato di una velocità perpendicolare a B di 108 m/s compirebbe un'orbita circolare con un raggio di circa 0,5 mm. 8.7 Campo generato da un filo rettilineo indefinito percorso da corrente. Legge di Biot e Savart Ogni circuito percorso da corrente stazionaria deve ovviamente essere un circuito chiuso. Tuttavia se ci poniamo ad una distanza r dal circuito molto minore rispetto alle sue dimensioni lineari, potremo considerare in prima approssimazione il conduttore percorso da corrente come un filo rettilineo indefinito. Consideriamo quindi un filo indefinito percorso da una corrente elettrica stazionaria I. Per esplorare il campo magnetico da esso generato nella regione circostante il filo stesso potremo ricorrere, come fecero i primi sperimentatori, alla osservazione della deviazione di un ago magnetico disposto nei vari punti della regione in esame. Il risultato di questa esperienza ci permetterebbe di stabilire che un filo rettilineo percorso da una corrente costante produce attorno a sé un campo magnetico caratterizzato da un vettore B le cui linee di forza sono circonferenze che giacciono in un piano normale al conduttore e aventi i centri su di esso; il verso delle linee di forza è quello antiorario per un osservatore posto in piedi sul piano contenente la linea di forza e orientato secondo il verso di percorrenza della corrente (2). come mostrato in Fig. 8.3. La misura del valore di B nei vari punti dello spazio fu fatta in una serie di celebri esperienze (1) Un campo magnetico di questo tipo può essere ritenuto sufficientemente intenso tenendo conto che il valore di B per il campo magnetico terrestre è di 5 ⋅ 10-5 weber⋅m2. (2) Il verso delle linee di forza può essere determinato, secondo la definizione stessa data da Ampère, rircondando il conduttore con le dita della mano destra tenendo il pollice diretto nella direzione di percorrenza della corrente I: il verso indicato dalle restanti quattro dita e quello delle linee di forza. 16 MAGNETOSTATICA NEL VUOTO FIG. 8.3 [CAP. 8 - Linee di forza del vettore B generato da un filo indefinito percorso da corrente. da Biot e Savart osservando le oscillazioni compiute da un ago magnetico sotto l'azione del campo. La legge che essi derivarono, e che da loro prende nome, è la seguente: (8.47) essendo I l'intensità di corrente, r la distanza dal filo del punto in cui si misura il campo e K una costante di proporzionalità, dipendente dal particolare sistema di unità di misura scelto. Nel sistema M. K. S. si pone K= μ0/2π e la quantità μ0, chiamata permeabilità magnetica del vuoto, risulta avere il valore numerico : μ0 = 4π ⋅10-7 . (8.48) In realtà, per ragioni che almeno in parte risulteranno chiare in seguito, oggigiorno si preferisce assumere il valore μ0 = 4π ⋅10-7 come una definizione; in tal caso la (8.47) serve a determinare, con notevole precisione, l'unità di intensità di corrente, cioè l'ampere. Le dimensioni di μ0 sono: (8.49) Poiché si definisce: 1 henry = 1 ohm ⋅ 1 secondo (8.50) la permeabilità magnetica del vuoto si misura anche in henry/metro. Per la (8.47) e per quanto detto precedentemente sull'andamento delle linee di forza, il vettore B generato da un filo rettilineo percorso da una corrente I, è dato da: (8.51) 8.8 I PRIMA FORMULA DI LAPLACE E SUE APPLICAZIONI 17 dove s è un versore orientato secondo il verso della corrente e r è un vettore di modulo pari alla distanza tra il filo ed il punto in cui si considera il campo, orientato nel verso che va dal filo al punto (Fig. 8.4). Le tre direzioni r, B, s individuano una terna cartesiana. FIG. 8.4 - Campo magnetico creato da un filo indefinito percorso da corrente. 8.8 Prima formula di Laplace e sue applicazioni La legge sperimentale (8.51) di Biot e Savart vale solamente nel caso in cui sia possibile ritenere verificata l'approssimazione di filo rettilineo indefinito. In tutti gli altri casi, quando cioè tale approssimazione non sia più valida o il circuito abbia una forma complicata o si sia in presenza di più circuiti percorsi da corrente, la determinazione analitica del vettore induzione magnetica B nei vari punti dello spazio può essere fatta utilizzando il principio di sovrapposizione ed una "formula elementare, dovuta a Laplace. Tale legge elementare, chiamata prima formula di Laplace, stabilisce che un elemento dl di circuito percorso da una corrente I produce in un punto P, distante r da esso, un vettore induzione magnetica: (8.52) avendo scelto come orientamento di dl quello del verso di percorrenza della corrente e come orientamento di r quello dall'elemento dl al punto P in considerazione. Se, rispetto all'origine O delle coordinate di una terna di riferimento cartesiana l'elemento dl è caratterizzato dal vettore r' ed il punto P dal vettore r. FIG. 8.5 - Applicazione della prima formula di Laplace ad un circuito generico. 18 MAGNETOSTATICA NEL VUOTO [CAP. 8 come mostrato in Fig. 8.5, l'espressione (8.52) assume la forma: (8.53) Poiché l'esperienza mostra che il principio di sovrapposizione vale per i fenomeni magnetici in maniera analoga a quanto si verifica per i fenomeni elettrici, possiamo ritenere che il vettore B, generato da un circuito C percorso da corrente I, in un punto P distante r dall'origine delle coordinate, sia uguale alla somma di tanti contributi dB, del tipo (8.53), dovuti ai singoli elementi infinitesimi dl in cui possiamo immaginare suddiviso il circuito C. Il valore dell'induzione magnetica in un punto distante r dall'origine si ottiene allora integrando la (8.53) lungo il circuito C: (8.54) dove r', come abbiamo già detto, rappresenta la distanza del generico elemento dl dall'origine O. Nel caso si abbia a che fare con più circuiti percorsi da corrente, il valore di B in un punto è dato dalla somma di integrali simili a quello che compare nella (8.54). Se in luogo di fili percorsi da corrente, il problema riguarda più in generale distribuzioni di correnti è possibile considerare al posto della (8.54) l'espressione: (8.55) sfruttando la relazione I dl = J dυ. L'integrale è ora esteso a tutto lo spazio in cui la densità di corrente J è diversa da zero. La (8.53) è una formula puramente teorica e, dato che non è possibile isolare un singolo elemento di corrente dl di un circuito, la sua validità non è suscettibile di verifica sperimentale diretta. Tale validità è tuttavia garantita dal fatto che sono possibili innumerevoli prove tendenti a confrontare il valore di B, prodotto da distribuzioni di corrente estremamente differenti tra loro e misurato sperimentalmente, con il valore calcolabile dalle espressioni (8.54) e (8.55): in tutti i casi l'accordo risulta più che soddisfacente. a) Campo magnetico generato da un filo rettilineo indefinito Una semplice applicazione della prima formula di Laplace è quella relativa ad un filo rettilineo indefinito percorso da una corrente stazionaria I. Per semplicità assumiamo che il filo coincida con l'asse z di un sistema di assi cartesiani 8.8] PRIMA FORMULA DI LAPLACE E SUE APPLICAZIONI 19 e che la corrente fluisca parallelamente alla direzione dell'asse z. Sia P il punto, distante r dal filo, nel quale vogliamo determinare il valore di B generato dalla corrente I, e indichiamo con d la distanza tra un elemento generico dz del filo ed il punto P, come mostrato in Fig. 8.6. FIG. 8.6 - Applicazione della prima formula di Laplace ad un filo rettilineo percorso da corrente. Per la relazione (8.53), nella quale dobbiamo sostituire d a (r - r'), un elemento dz del circuito fornisce nel punto P un contributo al vettore induzione magnetica uguale a: (8.56) dove ϑ è l'angolo formato tra l'elemento dz ed il vettore d. Integrando la (8.56) lungo il filo si ricava il modulo dell'induzione magnetica in P, cioè: (8.57) Tenendo poi conto delle relazioni: l'integrale che compare nella (8.57) può essere trasformato in un integrale rispetto alla variabile ϑ esteso da 0 a π; si ha così: (8.58) 20 MAGNETOSTATICA NEL VUOTO [CAP. 5 Questo valore di B calcolato tramite la formula di Laplace coincide con quello fornito dalla legge sperimentale di Biot e Savart introdotta nel paragrafo precedente. Per quanto riguarda poi la direzione ed il verso del vettore B nel punto P è facile rendersi conto tramite la (8.53) che esso è perpendicolare al piano contenente l'asse z ed il punto P. In Fig. 8.6 pertanto il vettore B risulta perpendicolare al foglio con il verso entrante. b) Campo magnetico generato da una spira Consideriamo una spira piana circolare di raggio R percorsa da una corrente continua I. Ci proponiamo di calcolare il valore del vettore B in un punto qualsiasi dell'asse della spira che assumeremo coincidente con l'asse z di una terna cartesiana, come mostrato in Fig. 8.7. FIG. 8.7 - Campo assiale di una spira circolare percorsa da corrente. Innanzitutto è immediato provare, considerando due elementi dl del circuito simmetrici rispetto all'origine, che il vettore B in ogni punto P dell'asse z risulta diretto parallelamente all'asse stesso. È sufficiente quindi considerare di ogni vettore infinitesimo dB dovuto ad un elemento dl della spira solamente la componente dBz. Indicando con r la distanza tra un generico elemento dl ed il punto P in questione e tenendo conto che l'angolo formato dal vettore r e da dl è un angolo retto, applicando la formula (8.52) abbiamo che: (8.59) dove α rappresenta l'angolo tra dB e l'asse z. Poiché inoltre valgono le relazioni: 8.8] PRIMA FORMULA DI LAPLACE E SUE APPLICAZIONI 21 (8.60) la (8.59) può essere scritta nel modo seguente: (8.61) Integrando lungo il percorso della spira si ottiene il risultato: (8.62) In particolare al centro della spira il valore dell'induzione magnetica risulta essere : (8.63) In Fig. 8.8 sono riportate in modo schematico le linee di forza del vettore B generato da una spira percorsa da corrente. Lungo l'asse della spira il vettore B risulta perpendicolare al piano contenente la spira ed orientato nella stessa direzione lungo la quale un osservatore, in piedi in questo piano, vedrebbe la corrente fluire in verso antiorario. FIG. 8.8 - Linee di forza del vettore B di una spira circolare. Il punto indica la direzione della corrente uscente dalla pagina, la croce la direzione entrante nella pagina. c) Campo magnetico generato da un solenoide Si definisce solenoide un avvolgimento cilindrico di filo conduttore come quello mostrato in Fig. 8.9. Consideriamo un solenoide per il quale l'avvolgimento del filo sia uniforme in modo che il numero N di spire per unità di lunghezza sia costante; inoltre in prima approssimazione non teniamo conto del fatto che l'avvolgimento del solenoide ha un andamento a spirale ma immaginiamo che ciascuna spira del 22 MAGNETOSTATICA NEL VUOTO [CAP. 8 solenoide sia piana ; ciò ci permette di trattare il solenoide come formato da una successione di spire piane tra loro parallele tutte percorse dalla stessa corrente. Quest'ultima ipotesi rende possibile il calcolo del valore della induzione magnetica B generata lungo l'asse da un solenoide percorso da corrente utilizzando l'espressione (8.63). FIG. 8.9 - Solenoide. Prendiamo in esame in particolare un solenoide di lunghezza l, formato da N spire per unità di lunghezza, di raggio R, percorse da una corrente stazionaria l. L'asse del solenoide sia orientato parallelamente all'asse z di un sistema di riferimento cartesiano avente l'origine ad una estremità dell'avvolgimento. Indichiamo con z la posizione del punto P, nel quale vogliamo calcolare il vettore B e con z′ la posizione, variabile tra O ed l, di una generica spira del solenoide. Supponiamo di scomporre il solenoide in tratti di lunghezza infinitesima dz' ognuno dei quali contenente un numero di spire pari a N dz'. Il contributo al vettore B dato nel punto P dalle spire contenute nell'elemento dz', caratterizzato dal valore z' della coordinata, per la (8.62) è: (8.64) Come è possibile verificare per mezzo della Fig. 8.10 valgono le relazioni: (8.65a) (8.65b) Sostituendo le (8.65) nella (8.64) si ha che: (8.66) ed integrando su tutto il solenoide, cioè tra ϑ1 e ϑ2, cosi come sono indicati in Fig. 8.10, si ottiene: (8.67) 8.8] MAGNETOSTATICA NEL VUOTO 23 FIG. 8.10 - Calcolo del campo magnetico assiale di un solenoide. Se la lunghezza del solenoide è molto maggiore del diametro delle spire che lo compongono si può adottare la cosiddetta approssimazione di solenoide infinito; in questa approssimazione si pone ϑ1 =0 e ϑ2 = π e per un punto P, che non sia troppo vicino ai bordi del solenoide, si ricava dalla relazione (8.67) il valore: B = μ0 IN. (8.68) Ovviamente il vettore B sull'asse del solenoide, essendo generato da una successione di spire piane, risulta parallelo all'asse z, mentre nei punti al di fuori dell'asse ha l'andamento mostrato in Fig. 8.11 dove sono riportate le linee di FIG. 8.11 - Linee di forza di B in un solenoide. forza di B relative ad un solenoide sufficientemente lungo e sottile da poter essere considerato infinito. È interessante notare come nella regione centrale di un tale solenoide il vettore B risulti pressocché parallelo all'asse del cilindro anche in punti che si discostano dall'asse. In Fig. 8.11 sono disegnate anche alcune linee 24 MAGNETOSTATICA NEL VUOTO [CAP. 8 di forza di B esterne al solenoide ; si può notare come la superficie formata dalle spire percorse da corrente costituisca una discontinuità per il vettore B. In effetti se tracciassimo le linee di forza in prossimità del filo di una singola spira non troveremmo variazioni così nette ma scopriremmo che esse hanno un andamento piuttosto complicato e continuo all'intorno dei fili. In Fig. 8.12 è mostrato l'andamento del valore del vettore induzione magnetica sull'asse di un solenoide la cui lunghezza l è di 100 cm e il raggio R di 10 cm. FIG. 8.12 - Andamento di B lungo l'asse di un solenoide con l/R = 10. In ordinate è riportato il valore di B normalizzato al valore B0 di un solenoide infinito di uguali caratteristiche. Come si può notare dalla figura il modulo di B, nell'intervallo che va dal centro del solenoide fino ad un punto corrispondente a circa 4 volte la lunghezza del raggio delle spire, è uniforme entro il 4%. Inoltre il valore di B al centro del solenoide risulta inferiore a quello che si avrebbe in un solenoide infinito di ugual numero di spire per unità di lunghezza, con lo stesso raggio, e che fosse percorso dalla stessa corrente I. 8.9 Forze agenti tra due circuiti percorsi da corrente In questo paragrafo ci proponiamo di calcolare la forza che un circuito C1 di forma qualsiasi percorso da una corrente I1 esercita su un altro circuito C2 percorso da una corrente I2. Un elemento dl2 del secondo circuito, posto a distanza r dall'origine delle coordinate, subisce da parte del campo magnetico generato in quel punto dal primo circuito una forza che per la seconda formula di Laplace risulta essere: dF = I2 (dl2 × B (r)). (8.69). 8.9] FORZE AGENTI TRA DUE CIRCUITI PERCORSI DA CORRENTE 25 Il vettore induzione magnetica B (r) prodotto dal primo circuito nel punto r può essere a sua volta calcolato per mezzo della prima formula di Laplace. La forza complessiva agente sul secondo circuito si ottiene allora integrando la (8.69) lungo la linea C2, ossia: (8.70) Questa relazione, che rappresenta l'espressione matematica relativa ad una delle prime esperienze di Ampère, risolve in linea di principio il problema che FIG. 8.13 - Interazione magnetica tra due circuiti percorsi da corrente. ci eravamo posti, anche se in pratica per circuiti di forma generica il calcolo degli integrali che in essa compaiono può risultare tutt'altro che semplice. Come applicazione particolare della (8.70) consideriamo il caso di due fili rettilinei ed indefiniti, percorsi dalla corrente I1 e I2, posti ad una distanza a. FIG. 8.14 - Il campo magnetico B generato dalla corrente I1 esercita una forza dF sull'elemento dl2 percorso dalla corrente I2. Scegliamo un sistema di riferimento, come mostrato in Fig. 8.14, tale che il primo filo giaccia lungo l'asse z ed il secondo, ad esso parallelo, passi per il punto x = 0, y = a. 26 MAGNETOSTATICA NEL VUOTO [CAP. 8 Il vettore B generato dalla corrente I1 in ogni punto del conduttore percorso da I2 è quello dato dalla legge di Biot e Savart: (8.71) esso risulta avere verso antiparallelo a quello dell'asse x, in accordo col fatto che le linee di forza di B sono delle circonferenze concentriche al filo rettilineo percorse in verso antiorario rispetto ad un osservatore orientato nella direzione della corrente. La forza esercitata dal campo magnetico generato dal primo filo su un elementino dl2 = dl2k del secondo filo è quindi: (8.72) dove nell'ultimo passaggio è stato omesso l'indice 2 all'elemento di circuito. La (8.72) ci mostra che la forza esercitata dal primo filo sul secondo, quando i fili sono percorsi da correnti concordi, è diretta in verso antiparallelo all'asse y e cioè che essa è attrattiva; in modo analogo si può vedere che la forza esercitantesi tra due fili percorsi da correnti I1 e I2 fra loro discordi ha lo stesso modulo del caso precedente ma è repulsiva. Dalla (8.72) mediante integrazione è possibile ottenere la forza che si esercita su un tratto finito di lunghezza l del secondo filo. Si ha: (8.73) Ricordando che μ0 = 4π × 10-7 (newton/ampere2), da questa espressione si ricava che tra due fili posti ad un metro di distanza e percorsi ciascuno da una corrente di 1 ampere, si esercita una forza per unità di lunghezza di 2⋅10-7 newton. Si può quindi dare una definizione di ampere, basandosi sulla relazione (8.73), che introduca solo grandezze meccaniche. 8.10 Potenziale scalare magnetico Vogliamo ora esaminare se sia possibile ricavare per il vettore induzione magnetica B una relazione simile alla (2.19) trovata per il campo elettrostatico, e cioè se sia possibile scrivere il vettore B come gradiente di un certo potenziale scalare, vale a dire: B = - μo grad ϕm . (8.74) Apparirà chiaro in seguito perché è stata introdotta a priori in questa espressione la quantità μ0, che formalmente non trova corrispondenza nella relativa formula del campo elettrostatico. 8.10] POTENZIALE SCALARE MAGNETICO 27 Ammettendo per ipotesi che la (8.74) sia valida, cerchiamo di determinare la funzione ϕm nel caso di un campo magnetico generato da una spira piana C percorsa da una corrente I. Il vettore induzione magnetica B, generato in un punto P, è dato dalla espressione (8.54), dove l'integrale è esteso a tutto il circuito chiuso C. Se operiamo uno spostamento del punto P di una quantità infinitesima arbitraria ds, come mostrato in Fig. 8.15, il potenziale ϕm subisce FIG. 8.15 - Metodo per derivare il potenziale scalare magnetico. una variazione dϕm che, per la relazione (1.26), è uguale a: (8.75) Se nella (8.75) introduciamo l'espressione di B data dalla prima formula di Laplace (8.54) otteniamo la relazione: (8.76) dove ds è stato portato sotto segno di integrale, trattandosi di una quantità costante, e con r si è indicata la distanza tra il generico elemento dl della spira e il punto P. È possibile ovviamente ottenere la stessa variazione del potenziale dϕm tenendo fisso il punto P e facendo subire alla spira C uno spostamento - ds. Per effetto di questo spostamento l'elemento dl descrive una superficie elementare da di area uguale al modulo del vettore (ds × dl). Utilizzando la regola (1.15) del triplo prodotto misto possiamo scrivere per il numeratore dell'integrando dell'espressione (8.76) : (8.77) La quantità - r ⋅ (ds × dl) rappresenta il prodotto tra la proiezione dell'area da in un piano perpendicolare ad r ed r. Pertanto avremo che l'integrale che 28 MAGNETOSTATICA NEL VUOTO [CAP. 8 compare nella (8.76) non è altro che la variazione dω dell'angolo solido prodotta dallo spostamento ds del punto P: (8.78) La variazione di potenziale dϕm diviene quindi: (8.79) e il potenziale scalare magnetico generato in P dalla spira è perciò: (8.80) dove ω rappresenta l'angolo solido sotteso tra P e tutta la spira C. Si suddivida ora la superficie S delimitata dalla spira C in tanti elementi di area da. Tali elementi possono essere riguardati come piccole spire percorse, tutte nello stesso verso, da una corrente I lungo i loro bordi, come mostrato in Fig. 8.16. FIG. 8.16 - Spira finita di corrente suddivisa in un insieme di spire elementari. Poiché ogni coppia di spire adiacenti ha in comune un tratto percorso dalla stessa corrente I con verso opposto, la somma di tutte le correnti delle spire contenute nella superficie S fornisce una sola corrente, diversa da zero, ed uguale ad I, che fluisce lungo il bordo esterno di S, che coincide con il circuito C di partenza. Ad ogni elemento di superficie possiamo inoltre associare un versore n diretto normalmente a da e con un verso tale che un osservatore orientato nello stesso modo vedrebbe la corrente fluire lungo il bordo di da in verso antiorario. Nel caso di Fig. 8.16 n ha la direzione uscente dal foglio. Indichiamo poi con da la quantità vettoriale da n. Poiché per definizione si ha che nel punto P: (8.81) 8.11] LEGGE DELLA CIRCUITAZIONE DI AMPÈRE 29 possiamo scrivere che per il potenziale magnetico vale la seguente espressione: (8.82) Nel paragrafo 8.4 abbiamo definito mediante la relazione (8.18) il momento magnetico dm = I da n di una spira elementare di superficie da percorsa da una corrente I. Tenendo conto di questa definizione la (8.82) diviene: (8.83) l'integrale essendo esteso alla superficie della spira. Nel caso che il punto P, in cui si vuole calcolare il campo, sia ad una distanza molto maggiore delle dimensioni lineari della spira, di modo che la spira possa essere considerata molto piccola, la (8.83) può essere approssimata (1) dalla relazione : (8.84) dove m = SI n. D'altra parte tale espressione risulta valida anche per un aghetto magnetico di momento magnetico m. Possiamo così enunciare la seconda parte del principio di equivalenza tra spire percorse da corrente e aghetti magnetici, a completamento di quanto già detto nel paragrafo 8.5 riguardo alle azioni meccaniche che un campo magnetico esercita su spire ed aghi magnetici. La relazione (8.84) ci permette infatti di affermare che il campo magnetico generato da una spira di superficie S percorsa da corrente I, in punti lontani dalla spira, è uguale al campo magnetico generato da un ago magnetico di momento magnetico m, purché esso abbia un valore m = IS n, sia cioè uguale al momento magnetico della spira. In altre parole ago magnetico e spira percorsa da corrente, caratterizzati dallo stesso valore del momento magnetico m, sono equivalenti per quanto riguarda il campo magnetico da essi generato in un punto dello spazio. 8.11 Legge della circuitazione di Ampère Abbiamo mostrato che il vettore B analogamente al campo elettrostatico, può essere rappresentato come gradiente di una funzione scalare ϕm, cui è stato dato il nome di funzione potenziale scalare magnetico. A differenza del potenziale (1) È possibile dimostrare, sviluppando particolareggiatamente il calcolo, che tale approssimazione è analoga a quella introdotta nella determinazione del potenziale elettrostatico generato da un dipolo elettrico. 30 MAGNETOSTATICA NEL VUOTO [CAP. 8 elettrostatico, il potenziale magnetico ϕm non è però una funzione del punto ad un solo valore, perché tale non è l'angolo solido ω che compare nella espressione (8.80). Per giustificare questa affermazione cominciamo con il far notare che nel calcolo che ha portato alla definizione di ϕm il segno è stato determinato dalla scelta del verso, fatta secondo la convenzione introdotta nel paragrafo 8.4, del versore n normale al piano della spira. Questo fa si che lo spazio circostante la spira possa essere suddiviso in due semispazi rispetto al piano in cui giace il circuito; uno dei quali, quello contenente il punto P nel nostro esempio di Fig. 8.17, verrà indicato come semispazio positivo e l'altro, quello opposto, come semispazio negativo. FIG. 8.17 - Angolo solido sotteso in P da una spira di corrente. La direzione di n indica il semispazio positivo. Aggiungiamo inoltre che l'angolo solido ω, sotteso dalla spira in P, e dato dalla (8.81), è l'angolo solido interno. Con riferimento all'esempio di Fig. 8.17 parleremo quindi d'ora in avanti in corrispondenza al semispazio a destra della spira, quello positivo, di angolo solido positivo quando considereremo l'angolo solido interno, e di angolo solido negativo quando considereremo quello esterno. Nel caso di un punto contenuto nel semispazio negativo l'angolo solido positivo sarà quello esterno e l'angolo solido negativo quello interno. Evidentemente se si inverte il verso di percorrenza della corrente I lungo la spira bisogna di conseguenza modificare quanto è stato detto, scambiando i due semispazi. 8.18 - Andamento dell'angolo solido positivo ω al variare del punto P dal semispazio positivo a quello negativo, passando attraverso la spira di corrente. FIG. Muoviamo ora il punto P nel semispazio positivo e facciamo tendere all'infinito la sua distanza dalla spira; l'angolo solido sotteso in P dalla spira, assume valori sempre più piccoli fino a divenire nullo. Se invece avviciniamo il punto 8.11] LEGGE DELLA CIRCUITAZIONE DI AMPÈRE 31 al piano della spira, l'angolo ω continua ad aumentare, trasformandosi con continuità in quello esterno, ed al tendere del punto all'infinito nel semispazio negativo tende a 4π. L'andamento dell'angolo solido positivo al variare di P da + ∞ a -∞ passando attraverso la spira è quello mostrato in Fig. 8.18. D'altra parte possiamo sempre far percorrere al punto P un cammino, come ad esempio quello mostrato in Fig. 8.19, che partendo dal semispazio positivo FIG. 8.19 - Andamento dell'angolo solido ω per spostamenti del punto P intorno alla spira. In P1 e P2 l'angolo solido è positivo, in P3 e P4 l'angolo solido è negativo. a destra, giri intorno alla spira ed arrivi nel semispazio negativo a sinistra. In questo caso l'angolo solido parte da un valore positivo ω, diviene nullo quando il punto P si trova nello stesso piano della spira, e poi, essendo l'angolo solido una funzione continua del punto, assume valori negativi via via crescenti e tendenti al valore di -2π, che è raggiunto quando il punto giunge nel piano della spira, muovendosi nel semispazio negativo. Se il punto ora attraversa il piano della spira, passando così dal semispazio negativo a quello positivo, l'angolo solido da considerare è quello esterno che nel semispazio positivo è quello che abbiamo definito come negativo. Ritornando così nel punto di partenza, l'angolo solido ha assunto il valore (ω - 4π). Da tutto ciò concludiamo che l'angolo solido, e quindi il potenziale scalare magnetico, non è una funzione del punto ad un solo valore. Se infatti il punto P compie una serie di n cammini che attraversano la spira, il valore dell'angolo solido sotteso in P varia e diviene uguale a ω ± n 4π dove il segno dipende dal verso di percorrenza dei cammini intorno alla spira (1). Risulta inoltre evidente che se il cammino chiuso percorso dal punto P non attraversa la superficie della spira la variazione dell'angolo solido è nulla. (1) In particolare, secondo le convenzioni da noi fatte, bisogna considerare il segno meno quando il cammino compiuto dal punto intorno alla spira viene percorso nello stesso verso dalle linee di forza del vettore B generato dalla spira. 32 MAGNETOSTATICA NEL VUOTO [CAP. 8 Consideriamo un circuito percorso da una corrente I ed eseguiamo la circuitazione del vettore B lungo una linea chiusa qualsiasi che supponiamo concatenata con il circuito; assumeremo come verso di percorrenza di questa linea quello concorde con il verso della linea di forza di B generato dalla corrente I. Tenendo conto della relazione B = - μ0 grad ϕm e delle proprietà dell'operatore gradiente si ha che: (8.85) Nella (8.85) dl sta ad indicare un tratto infinitesimo della linea chiusa che concatena il circuito e Δϕm la variazione che il potenziale scalare magnetico subisce lungo il cammino chiuso considerato. FIG. 8.20 - Corrente I concatenata dalla linea C. Il verso di percorrenza di C indicato è quello positivo. La differenza fondamentale tra la (8.85) e la relazione analoga ricavata per l'elettrostatica stà proprio nel fatto che la variazione del potenziale scalare magnetico non è nulla lungo il cammino chiuso da noi scelto ma è proporzionale alla variazione dell'angolo solido, che come abbiamo dimostrato, per un cammino chiuso concatenato una sola volta con il circuito, è uguale a ± 4π. Allora, per la definizione del potenziale scalare magnetico, e poiché nel nostro caso Δω = - 4π, si ha: (8.86) e quindi: (8.87) Se la linea concatena il circuito n volte la (8.87) diviene: (8.88) Nel caso in cui la linea chiusa lungo la quale viene calcolata la circuitazione di B non concateni alcun circuito percorso da corrente avremo che la variazione 8.12] IL FLUSSO DI B 33 di ω lungo tale linea è nulla, risulta dunque nulla la variazione del potenziale scalare magnetico e di conseguenza anche la circuitazione di B. Le relazioni (8.87) e (8.88) prendono il nome di legge della circuitazione di Ampère. In maniera analoga a quanto fatto per il potenziale elettrico anche il potenziale magnetico ϕm può essere definito in un punto P mediante l'espressione: (8.89) scegliendo per convenzione il punto di riferimento (in cui il potenziale è nullo) all'infinito. Osserviamo però nuovamente che il valore fornito dalla (8.89) non è unico perché dipende dal fatto che il cammino scelto per andare da P all'infinito concateni o no il circuito percorso da corrente. Rappresentando la corrente I che compare nella (8.87) mediante la densità di corrente J, cioè (8.90) possiamo porre la legge della circuitazione di Ampère nella forma: (8.91) dove S è una superficie aperta qualsiasi che ha come contorno la linea chiusa C. Applicando all'integrale di sinistra il teorema di Stokes otteniamo: (8.92) e poiché la (8.92) deve essere valida qualunque sia la superficie di integrazione S, si ricava che: rot B = μ0 J (8.93) che rappresenta il teorema di Ampère in forma differenziale. È possibile notare dalla (8.93) che il vettore B risulta irrotazionale in tutti i punti dello spazio dove J è nullo, dove cioè non esiste passaggio di corrente. Questo è ovviamente in accordo con quanto detto finora sull'esistenza di un potenziale magnetico scalare che per la (8.89) è univocamente determinato solo in quelle regioni dello spazio che non contengono circuiti percorsi da corrente. 8.12 Il flusso di B Esaminando attentamente quanto esposto nei paragrafi dedicati alla legge di Biot e Savart e alle applicazioni della prima formula di Laplace, si può notare 34 MAGNETOSTATICA NEL VUOTO [CAP. 8 che in tutti gli esempi riportati si è arrivati alla conclusione che le linee di forza di B o sono linee chiuse, o vanno all'infinito o ne provengono. Più in generale si nota che per il campo magnetico, a differenza di quanto accade per il campo elettrico, non esistono punti di accumulazione delle linee di forza ; ciò significa che il campo vettoriale B non presenta punti sorgenti del campo. Prendiamo allora in esame una superficie chiusa S in una regione dello spazio ove esista un campo magnetico e applichiamo le considerazioni illustrate nel paragrafo 1.5 relative alla relazione tra numero di linee di forza di un campo vettoriale che attraversano una superficie chiusa e valore del flusso del campo vettoriale attraverso la stessa superficie. Poiché le linee di forza di B sono o linee chiuse o linee che vanno all'infinito o ne provengono, si ha che attraverso la superficie chiusa S il numero di linee di forza entranti è uguale al numero di linee di forza uscenti: la loro somma algebrica è quindi nulla. In altre parole all'interno di S, come già detto, non esistono sorgenti del campo e quindi il flusso di B attraverso S deve essere nullo. Possiamo cioè scrivere che: (8.94) e affermare che il campo magnetico è un campo vettoriale solenoidale. Questa affermazione potrebbe essere contraddetta solo qualora fosse possibile isolare delle cariche magnetiche libere, cosa che fino ad ora non è avvenuta nonostante i tentativi fatti da numerosi ricercatori. Utilizzando nella (8.94) il teorema della divergenza otteniamo che: div B = 0 (8.95) valida in ogni punto dello spazio. Applicando l'operatore divergenza alla relazione (8.55) è possibile verificare con un calcolo diretto che: (8.96) La proprietà (8.95) è cioè sempre soddisfatta qualunque siano le distribuzioni di corrente che generano il campo B. Le due relazioni rot B = μ0 J e div B = 0 permettono di definire in maniera completa il vettore induzione magnetica nel caso di campi magnetici generati nel vuoto da generiche distribuzioni di correnti. 8.13 Potenziale vettore magnetico Nella trattazione del campo magnetico è possibile introdurre, accanto al potenziale scalare, funzione del punto a più valori, anche un potenziale vettore, funzione ad un solo valore. Tale potenziale rappresenta uno strumento estremamente 8.14] POTENZIALE VETTORE MAGNETICO 35 valido nella descrizione delle proprietà fondamentali dell'elettromagnetismo. Infatti dalla relazione (8.95) discende, per un noto teorema di calcolo vettoriale, l'esistenza di un vettore A tale che: B = rot A (8.97) Il vettore A prende il nome di potenziale vettore magnetico. Si noti che la (8.97) non è sufficiente per definire completamente il vettore A; si può vedere infatti che aggiungendo ad A il gradiente di una qualsiasi funzione scalare ψ si ottiene ancora: rot (A + grad ψ ) = rot A . (8.98) È necessaria allora una ulteriore condizione per A. Assumeremo che nel caso della magnetostatica, cioè in assenza di campi magnetici variabili col tempo, essa sia la seguente: div A = 0 . (8.99) È interessante poter disporre di una espressione che leghi il potenziale vettore A alle correnti, o densità di correnti, che sono responsabili dell'esistenza del campo magnetico. A tal fine prendiamo in esame la relazione: rot B = μ0 J (8.100) sostituiamo a B la (8.97) ed eseguiamo il rotore del rotore ricordando che div A = 0. Abbiamo così che: rot rot A= -∇2 A = μ0 J (8.101) Se confrontiamo questa equazione con quella di Poisson (3.5) valida in elettrostatica, notiamo che esse sono formalmente identiche eccetto per il fatto che nella (8.101) compaiono grandezze vettoriali anziché scalari. Ciò non costituisce una difficoltà perché sappiamo che ciascuna delle componenti di A deve soddisfare separatamente l'equazione (8.101). Siamo così in grado di scrivere per ogni componente di A una soluzione del tipo della (3.6), per cui, combinandole in forma vettoriale, troviamo in definitiva che: (8.102) 8.14 Potenziale vettore magnetico generato da una spira percorsa da corrente La determinazione mediante la (8.102) del potenziale vettore magnetico A presenta in generale maggiori difficoltà di quelle che si incontrano nel calcolo 36 MAGNETOSTATICA NEL VUOTO [CAP. 8 del potenziale scalare ϕm e per questo motivo ci limiteremo al semplice calcolo del potenziale A generato da una spira percorsa da corrente. Sia data una spira circolare di raggio r' percorsa da una corrente stazionaria I. Assumiamo una terna di assi cartesiani con l'asse z perpendicolare al piano contenente la spira, come mostrato in Fig. 8.21, e con l'origine delle coordinate coincidente con il centro della spira. FIG. 8.21 - Calcolo del potenziale vettore magnetico nel caso di una spira circolare. Poiché J dυ' = I dl', dove dl' rappresenta un elemento infinitesimo della spira, la (8.102) diviene: (8.103) l'integrale essendo esteso a tutta la spira. Consideriamo il punto P, distante r dall'origine O, caratterizzato dalle coordinate x, y, z. Dato che la spira giace nel piano z = 0, la componente del potenziale vettore lungo l'asse z, Az, è nulla. La quantità |r - r'| -1 può essere scritta nella forma: (8.104) dove ϑ rappresenta l'angolo formato tra il vettore r' e l'asse y. Se prendiamo in esame un punto P (x, y, z) posto ad una distanza dall'origine molto maggiore delle dimensioni della spira, tale cioè che r » r', possiamo sviluppare la (8.104) in serie di potenze di r' / r ed ottenere, limitandoci ai termini del primo ordine: 8.14] POTENZIALE VETTORE MAGNETICO 37 (8.105) Sostituendo la (8.105) nella (8.103) e tenendo conto che: dl' = - (r' dϑ cos ϑ i + r' dϑ sen ϑj) (8.106) le componenti lungo l'asse x e l'asse y del potenziale vettore A risultano essere : Date le espressioni (8.107) unitamente al fatto che Az = 0, la forma vettoriale di A risulta allora essere: (8.108) dove m = (πr'2) In rappresenta il momento magnetico della spira secondo la definizione (8.21) essendo (πr'2) la superficie S delimitata dalla spira ed n un versore orientato parallelamente all'asse z di Fig. 8.21. 9 Magnetostatica nei mezzi materiali 9.1 Introduzione Nel capitolo precedente abbiamo discusso i fenomeni magnetici dovuti a correnti stazionarie circolanti in fili conduttori posti nel vuoto e abbiamo dedotto le relazioni fondamentali che permettono di determinare in ogni punto dello spazio il campo magnetico generato da tali correnti. In questo capitolo indagheremo invece su quanto avviene quando i fili percorsi da corrente stazionaria si trovino in presenza di mezzi materiali. L'esperienza insegna che quando certi materiali vengono posti in un campo magnetico essi acquistano delle proprietà che in generale prima non possedevano e che a loro volta tali materiali, così modificati, sono in grado di influenzare il campo magnetico esterno : i materiali che presentano tale comportamento sono detti magnetizzati. Ci proponiamo di sviluppare in questo capitolo una teoria macroscopica dei materiali magnetizzati, seguendo una linea del tutto simile a quella utilizzata nel caso della discussione dei materiali polarizzati elettricamente, al fine di ricavare delle espressioni che siano in grado di fornire il valore del campo magnetico in ogni punto dello spazio in presenza e di correnti stazionarie e di materiali magnetizzati. 9.2 Correnti atomiche e vettore di magnetizzazione Uno dei risultati più interessanti a cui siamo arrivati discutendo la magnetostatica nel vuoto è la dimostrazione che una piccola spira percorsa da corrente è caratterizzabile mediante un momento magnetico e che per quanto riguarda i 40 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 fenomeni magnetici ad essa connessi è del tutto equivalente ad un piccolo ago di materiale magnetizzato avente un uguale momento magnetico. Furono constatazioni di questo genere che diedero ad Ampère già nel secolo scorso lo spunto per la soluzione del problema del magnetismo prodotto da mezzi materiali. Egli infatti avanzò l'ipotesi che l'origine di ogni specie di magnetismo nella materia fosse da ricondursi a piccole correnti circolanti in essa e associate agli atomi dei materiali. L'interpretazione moderna del magnetismo nella materia rimane essenzialmente quella di Ampère. Oggi sappiamo infatti che ogni atomo contiene degli elettroni che percorrono delle orbite intorno al nucleo in maniera simile a quanto avviene in un sistema planetario. Se pensiamo di rappresentare la carica dell'elettrone, invece che concentrata in una particella, distribuita lungo tutta l'orbita (il che è giustificato dal modello di atomo fornito dall'odierna teoria quantistica) possiamo riguardare il moto orbitale dell'elettrone come una piccola spira di dimensioni atomiche percorsa da un'opportuna corrente stazionaria. Ciò determina l'esistenza di un momento magnetico (detto orbitale). A questo va aggiunto inoltre che l'elettrone possiede, come abbiamo visto nel paragrafo 6.2, oltre al momento magnetico orbitale un momento magnetico intrinseco, associato al suo spin, che in un modello intuitivo dell'elettrone stesso può essere pensato come dovuto a un suo moto di rotazione attorno al proprio asse. Anche il momento magnetico intrinseco è dunque, in ultima analisi, riconducibile a un microscopico anello di corrente. Giungiamo così a riconoscere che ogni atomo di un materiale qualsiasi contiene delle correnti circolanti che generalmente vengono indicate con il nome di correnti atomiche. Per quanto riguarda tutti gli effetti magnetici, ciascuna spira percorsa da corrente atomica può essere rappresentata mediante un momento di dipolo magnetico e pertanto il campo magnetico generato da un atomo in un punto posto a grande distanza rispetto alle dimensioni atomiche è in prima approssimazione quello dovuto ad un momento di dipolo magnetico, trascurando, come abbiamo fatto nel caso della polarizzazione elettrica, i termini associati a poli di ordine superiore. Associando così ad ogni atomo un momento di dipolo magnetico m possiamo definire un vettore macroscopico M, detto intensità di magnetizzazione, o più semplicemente magnetizzazione del mezzo, dato da: (9.1) dove la sommatoria è estesa a tutti i momenti di dipolo magnetico contenuti nel volume Δ V, con Δ V che tende macroscopicamente a zero. Questo significa, come abbiamo già avuto occasione di dire, che Δ V deve essere sufficientemente piccolo da ridursi su scala macroscopica praticamente a un punto e sufficientemente grande da contenere un numero tale di dipoli magnetici per cui abbia senso considerare una media statistica, in modo che la funzione M (x, y, z) non vari bruscamente passando da un punto all'altro ed il mezzo possa essere considerato come un continuo. Il vettore M ha le dimensioni di un momento 9.3] CORRENTE DI MAGNETIZZAZIONE 41 magnetico per unità di volume e nel sistema MKS viene misurato in ampere/ metro. Nel caso in cui il materiale non sia soggetto ad un campo magnetico esterno non esiste alcun motivo per supporre che le correnti atomiche circolino tutte nello stesso verso e soprattutto che ruotino tutte intorno alla stessa direzione. In altre parole possiamo supporre che normalmente in un materiale, in assenza di campo magnetico, i singoli momenti di dipolo magnetico sono orientati in maniera del tutto casuale. Da questo consegue che la sommatoria vettoriale che compare nella (9.1) risulta in tal caso uguale a zero e che il vettore di magnetizzazione è pertanto nullo e nulli sono di conseguenza gli effetti magnetici. L'applicazione di un campo magnetico produce quella che abbiamo chiamata la magnetizzazione del mezzo e che rappresentiamo associando ad ogni elemento di volume un momento di dipolo magnetico che non è necessariamente uniforme in tutto il materiale e che generalmente è proporzionale al campo magnetico esterno. Il momento magnetico per unità di volume sorge per effetto dell'azione del campo magnetico applicato che, tramite una coppia di forze, tende a disporre le spire elementari percorse dalle correnti atomiche in un piano perpendicolare alla sua direzione o in altri termini ad orientare i dipoli magnetici atomici parallelamente a se stesso. Secondo la (9.1) il valore di M è allora uguale al prodotto del numero di dipoli magnetici, contenuti nell'unità di volume, per il valore del momento magnetico di ciascun dipolo. Ci proponiamo in questo capitolo di ricavare l'espressione del campo magnetico prodotto da un materiale magnetizzato caratterizzato dalla quantità macroscopica M, tralasciando ogni considerazione sulle cause della magnetizzazione e su come possa essere determinato da un punto di vista microscopico il valore del momento magnetico di ciascun atomo. Questo ultimo problema costituirà l'argomento del capitolo successivo. 9.3 Corrente di magnetizzazione Un materiale magnetizzato, per quanto detto, può quindi essere riguardato o come un insieme di correnti atomiche o come un insieme di dipoli magnetici più o meno ordinati. Per quanto riguarda le correnti atomiche è possibile dimostrare che esse si combinano in scala macroscopica per dar luogo ad una corrente, detta di magnetizzazione. Assumendo invece il secondo tipo di schematizzazione, quello dei dipoli magnetici, formalmente del tutto simile a quello utilizzato nella trattazione dei dielettrici polarizzati, siamo indotti a ritenere che sia possibile definire delle densità fittizie di cariche magnetiche mediante le quali giustificare gli effetti prodotti dai materiali magnetizzati. Questa supposizione non deve d'altra parte sorprendere perché già nel paragrafo 8.5 abbiamo mostrato come una spira percorsa da corrente possa essere sostituita in maniera equivalente da una lamina magnetica sulle cui faccie siano distribuite opportune densità superficiali di cariche magnetiche. Ci troviamo così di fronte a due diverse possibili rappresentazioni atte ad 42 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 analizzare il comportamento di un materiale magnetizzato: la prima basata sul concetto di densità di cariche o poli magnetici e quindi sull'utilizzo del potenziale scalare per il calcolo del campo magnetico generato, la seconda basata invece sul concetto di densità di corrente di magnetizzazione e quindi sull'utilizzo del potenziale vettore magnetico. Come mostreremo, sia la densità di corrente di magnetizzazione sia la densità di poli magnetici sono descrivibili in termini dell'intensità di magnetizzazione M e delle sue derivate. È nostra intenzione sviluppare dapprima la trattazione legata al concetto di corrente di magnetizzazione per poi passare a quella fondata sul concetto di polo magnetico. Consideriamo un pezzo di materiale magnetico come costituito da un certo numero di spire elementari per unità di volume percorse tutte nello stesso verso e intorno alla stessa direzione individuata da M, da correnti atomiche. Se l'intensità di magnetizzazione del materiale è uniforme, il numero di spire per unità di volume è allora costante e quindi all'interno del mezzo le correnti atomiche si annullano l'una con l'altra perché, in maniera simile a quanto è mostrato in Fig. 8.16, tratti prossimi di due spire adiacenti sono percorsi dalla stessa quantità di corrente in verso opposto. Sulle superficie del materiale, dove esiste una discontinuità, le correnti atomiche danno origine invece ad una densità di corrente che evidentemente ha un valore massimo sulle superficie parallele ad M ed un valore nullo su quelle perpendicolari ad M. FIG. 9.1 - Cilindro di materiale uniformemente magnetizzato. Un esempio che illustra un comportamento di questo genere è riportato in Fig. 9.1 dove è mostrato un cilindro di materiale uniformemente magnetizzato con l'asse parallelo alla direzione di M. È facile constatare, considerando per esempio le spire disegnate su una base del cilindro, come le correnti atomiche, che circolano su piani perpendicolari all'asse del cilindro, essendo distribuite uniformemente si annullino ovunque completamente eccetto che sulla superficie cilindrica laterale, parallela ad M, dove si compongono generando una corrente che si avvolge azimutalmente. Se la magnetizzazione M del materiale non è uniforme l'annullamento delle correnti atomiche non è completo all'interno del corpo ed esiste, oltre alla corrente superficiale, anche una corrente macroscopica non nulla che fluisce nel mezzo. In Fig. 9.2 sono rappresentate le spire delle correnti atomiche situate su un piano interno ad un materiale non uniformemente magnetizzato. Se prendiamo in esame la zona compresa tra le due linee l1 ed l2, notiamo che la quantità di carica che va dal basso verso l'alto è maggiore di quella che va in verso opposto e questo ci porta a concludere che, anche senza trasporto di cariche, esiste nel mezzo una corrente diretta verso l'alto: questa corrente unitamente a quelle 9.3] FIG. 9.2 CORRENTE DI MAGNETIZZAZIONE 43 - Correnti atomiche in un materiale magnetizzato non uniformemente. superficiali formano quella che noi abbiamo chiamato la corrente di magnetizzazione. Per mettere in relazione la corrente di magnetizzazione con l'intensità di magnetizzazione M operiamo nella seguente maniera. Dato un materiale che supponiamo non uniformemente magnetizzato consideriamo al suo interno due parallelepipedi elementari di volume rispettivamente dV1 e dV2 entrambi di lati dx, dy, e dz e, come mostrato in Fig. 9.3 adiacenti lungo la direzione y. FiG. 9.3 - Elementi di volume di un materiale magnetizzato non uniformemente. Rappresentazione della magnetizzazione mediante correnti circolari. Se al centro del volume dV1 l'intensità di magnetizzazione è M (x, y, z), al centro del volume dV2 essa vale, a meno di infinitesimi di ordine superiore: (9.2) 44 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 Consideriamo la componente Mx del vettore magnetizzazione; possiamo associare al volumetto dV1 un momento mangetico con una componente parallela all'asse x uguale a Mx dxdydz e immaginare che questa componente sia dovuta ad una corrente che si avvolge sul piano perpendicolare ad Mx in verso antiorario lungo una spira di superficie dydz. Per il volume dV1; ricordando la relazione m = IS, questa corrente ha quindi una intensità : (9.3) e per il volume dV2 una intensità: (9.4) Sulla superficie di separazione dei due volumetti in direzione z fluisce pertanto una corrente non nulla uguale a: (9.5) Se prendiamo in considerazione i due volumetti dVl e dV2 ancora adiacenti ma questa volta lungo la direzione x, si può vedere che esiste un ulteriore contributo alla corrente lungo z e precisamente quello dovuto alla corrente che fluisce sul piano xz in una spira di superficie dxdz intorno alla direzione della componente My del vettore magnetizzazione. Ripetendo il calcolo precedente si troverebbe che questo contributo vale: (9.6) la corrente totale lungo z è quindi: (9.7) Dividendo quest'ultima espressione per il valore dell'area elementare dxdy perpendicolare alla direzione della corrente Iz si ottiene: (9.8) che rappresenta la componente lungo z della densità di corrente di magnetizzazione. 9.3] CORRENTE DI MAGNETIZZAZIONE 45 Con lo stesso procedimento si possono ricavare anche le altre componenti della densità di corrente Jm e riconoscere poi che ognuna di esse è uguale alla rispettiva componente del vettore rot M. Si ha perciò: Jm = rot M. (9.9) Segue immediatamente dalla (9.9) che se M è uniforme Jm è nulla nel materiale ma non sulla superficie, dove esiste una discontinuità per M. Per chiarire questo punto, riprendiamo in esame l'esempio di Fig. 9.1 supponendo che l'asse del cilindro sia diretto lungo z e che quindi Mx = My = 0 ed MZ = M. Dalla (9.9) si deduce che: (9.10) Se la magnetizzazione è uniforme, cioè se M = cost, nel materiale Jm è nulla. Sulla superficie laterale del cilindro tuttavia la magnetizzazione M subisce una discontinuità passando dal valore M ad un valore mallo. Pertanto su questa superficie si avvolge una corrente che, come risulta dalla (9.10), è azimutale intorno alla direzione z come avevamo già dedotto con un ragionamento intuitivo. Per ottenere l'espressione in funzione della magnetizzazione M di questa densità di corrente superficiale, che indicheremo con Jsm, consideriamo la superficie di separazione tra materiale magnetizzato e vuoto di Fig. 9.4, supponendo FIG. 9.4 di M. - La densità di corrente superficiale di magnetizzazione è uguale alla componente M1 46 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 che sia il vettore M sia la normale n alla superficie giacciono nel piano del foglio. Dato allora il cammino chiuso C, calcoliamo il flusso di Jm attraverso la superficie S da esso delimitato; per la (9.9) questo vale: (9.11) L'integrale a destra può essere trasformato mediante il teorema di Stokes, e quindi: (9.12) La circuitazione di M, facendo tendere Δh a zero e supponendo M uniforme su tutto il tratto Δl, è uguale a Mt, Δl, mentre il flusso di Jm, se la densità di corrente superficiale è Jsm, risulta normale al piano del foglio e vale JsmΔl.Abbiamo pertanto che: Jsm = Mt (9.13) dove Mt, indica la componente di M tangente alla superficie di separazione tra il materiale e il vuoto. In forma vettoriale, indicando n il vettore normale alla superficie di separazione, la (9.13) si scrive: Jsm = M × n. (9.14) La quantità Jsm ha le dimensioni di una corrente per unità di lunghezza. 9.4 Campo magnetico generato da un materiale magnetizzato. Rappresentazione mediante correnti di magnetizzazione Per quanto mostrato nel paragrafo 8.13 il vettore induzione magnetica B si ottiene eseguendo il rotore del potenziale vettore magnetico A. Nel caso di una spira percorsa da corrente di momento magnetico m il potenziale vettore generato in un punto r posto a grande distanza è: (9.15) Poiché ad ogni elemento di volume di un materiale magnetizzato con intensità M possiamo attribuire un momento magnetico: (9.16) dove con r' indichiamo il raggio vettore, spiccato dall'origine delle coordinate, che individua il volumetto infinitesimo Δυ', abbiamo che il potenziale vettore 9.4] CAMPO MAGNETICO GENERATO DA UN MATERIALE 47 A generato in un punto r da un materiale magnetizzato di volume V è: (9.17) Il vettore B può essere ottenuto applicando l'operatore rotore alla (9.17). Ricordando che con grad' che opera sulle coordinate (x', y', z'), la (9.17) diviene: (9.18) Utilizzando la seguente relazione vettoriale, riportata in tabella 1.1, rot' ϕM = = ϕ rot' M - M × grad' ϕ con si ha, sostituendo nella (9.18), (9.19) Il secondo integrale a destra può essere trasformato in un integrale superficiale mediante relazioni del tipo (1.41), ottenendo in tal modo: (9.20) Tenendo conto della (9.9) e della (9.14) abbiamo infine che: (9.21) Quest'ultima espressione, valida per tutti i punti dello spazio interni ed esterni del materiale, mostra come il potenziale vettore magnetico generato da correnti di magnetizzazione abbia la stessa forma di quello creato da correnti di conduzione. Il problema di determinare l'espressione della induzione magnetica B dovuta ad un volume di materiale magnetizzato si risolve completamente eseguendo il rotore della (9.21). Tuttavia, per la complessità del calcolo del rotore di A, preferiamo non procedere oltre su questa linea e riprendere l'argomento più avanti, dove sarà affrontato utilizzando il concetto di poli magnetici. 48 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 9.5 Il vettore H. La legge della circuitazione di Ampère in presenza dei materiali magnetizzati Nel paragrafo 8.11 abbiamo dedotto la forma differenziale della legge di circuitazione di Ampère : rot B = μ0 J. Alla luce dei risultati del paragrafo precedente possiamo affermare che nel caso in cui il campo magnetico sia generato oltre che da correnti che fluiscono in fili conduttori anche da materiali magnetizzati, nell'equazione del rotore di B, dobbiamo considerare oltre alla densità di corrente di conduzione J anche la densità di corrente di magnetizzazione Jm, e scrivere: rot B = μ0 (J + Jm). (9.22) Poiché inoltre Jm = rot M possiamo trasformare la (9.22) nella seguente maniera: (9.23) Introducendo un nuovo vettore H, detto vettore intensità magnetica, definito come: (9.24) abbiamo che: rot H=J. (9.25) Nel vuoto, dove il vettore magnetizzazione M è ovviamente nullo, la (9.24) si riduce alla relazione B = μ0H che esprime una semplice proporzionalità tra il vettore B ed il vettore H. Pertanto tutte le leggi della magnetostatica nel vuoto ricavate nel capitolo 8 per il vettore B, valgono anche per il vettore H. Calcolando il flusso di rot H attraverso una superfìcie S aperta, di contorno C, per la (9.25) si ottiene: Applicando il teorema di Stokes all'integrale a sinistra, si ha: (9.26) espressione che rappresenta la forma integrale del teorema della circuitazione di Ampère nel caso in cui siano presenti oltre che correnti di conduzione anche materiali magnetizzanti. 9.6] LE EQUAZIONI DEL CAMPO 49 La ragione della comparsa del nuovo vettore H nella trattazione del magnetismo dei mezzi materiali è analoga a quella che in elettrostatica aveva portato, al termine della discussione del teorema di Gauss in presenza di dielettrici polarizzati, ad introdurre il vettore D. In realtà, come abbiamo visto, per la descrizione del magnetismo dei materiali sono sufficienti i due vettori B ed M ; inoltre H, come appare chiaramente dalla (9.24) non è un vettore indipendente. L'importanza tuttavia di questo vettore ausiliario è legata proprio alle espressioni (9.25) e (9.26) e cioè al fatto che il suo rotore o la sua circuitazione dipendono esclusivamente dalle correnti di conduzione senza esplicito riferimento alle correnti di magnetizzazione. La (9.25) e la (9.26) divengono cosi le espressioni più generali della legge di Ampère, rispettivamente in forma differenziale ed integrale, valide sia nel vuoto sia in presenza di materiali magnetizzati. Il vettore H ha le stesse dimensioni del vettore M e cioè quelle di un momento magnetico per unità di volume. Nel sistema MKS, come può ricavarsi anche dalla espressione (9.26), l'unità di misura di H è l'ampere per metro. 9.6 Le equazioni del campo. Le condizioni al contorno di B ed H Nel corso dell'esposizione delle principali proprietà che caratterizzano il campo magnetostatico abbiamo avuto occasione di mostrare che il vettore B generato nel vuoto da correnti di conduzione è un vettore solenoidale, cioè che : div B = 0 . (9.27) Per quanto detto nel paragrafo 9.4, sappiamo d'altra parte che il campo magnetico prodotto da materiali magnetizzati è deducibile schematizzando questi ultimi mediante opportune distribuzioni di densità di corrente. Essendo pertanto in ogni caso sorgenti del campo vettoriale B le correnti, o di conduzione o di magnetizzazione, è lecito affermare che la (9.27) deve essere valida dovunque, e quindi anche all'interno dei mezzi materiali. Se teniamo conto inoltre dell'espressione a cui siamo giunti per il teorema della circuitazione di Ampère in presenza di mezzi magnetizzati, possiamo concludere che le equazioni fondamentali della magnetostatica, valide nel vuoto e nella materia, sono la (9.27) e rot H = J (9.28) a cui deve aggiungersi naturalmente la relazione strutturale che lega i tre vettori B, H ed M. Vedremo tuttavia nel seguito che questa ultima relazione sarà sostituita, per poter pervenire alla soluzione del problema della magnetostatica, da una legge fenomenologica che, come nel caso dell'elettrostatica per E e D, permette di associare direttamente il vettore B al vettore H. Consideriamo ora due mezzi diversi separati da una superfìcie Σ ed un cilindro elementare di superficie S intersecato da Z come mostrato in Fig. 9.5a). Calcoliamo l'integrale di volume del vettore div B sul volume V racchiuso 50 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 a) b) FIG. 9.5 - a) e b) Calcolo delle condizioni al contorno di B ed H sulla superficie di separazione E. dalla superficie S. Per la (9.27) ed il teorema della divergenza possiamo scrivere: (9.29) Facendo tendere a zero l'altezza del cilindro in modo da limitare il calcolo ai soli contributi del flusso attraverso le due basi, sulle quali assumiamo il vettore B uniforme, otteniamo: B1n = B2n (9.30) dove Bln e B2n sono le componenti normali del vettore B alla superficie di separazione in punti molto prossimi a Σ rispettivamente nel primo e nel secondo mezzo. Dalla (9.30) risulta pertanto che attraverso la superficie di separazione tra due mezzi differenti la componente normale alla superficie del vettore B è continua. Dato il circuito elementare C di Fig. 9.5b) calcoliamo il flusso del vettore rot H attraverso la superficie S delimitata da C. Per la (9.28) abbiamo: (9.31) che mediante il teorema di Stokes applicato all'integrale a sinistra diviene: (9.32) 9.7] CAMPO MAGNETICO ESTERNO AD UN MATERIALE 51 Facendo tendere a zero l'altezza Δh di C e considerando H uniforme sui tratti infinitesimi Al, la (9.32) fornisce immediatamente il risultato: H1t,-H2t = Js (9.33) dove H1t e H2t rappresentano le componenti di H tangenti alla superficie I in punti prossimi alla superficie stessa rispettivamente nel primo e nel secondo mezzo, e Js indica una densità di corrente di conduzione superficiale, cioè una corrente di conduzione per unità di lunghezza sulla superfìcie Z, diretta normalmente rispetto al piano in cui è contenuto il cammino C. Nel caso in cui la corrente superficiale fosse nulla: H1t = H2t (9.34) e quindi la componente tangenziale del vettore H risulta continua attraverso la superficie di separazione dei due mezzi. 9.7 Campo magnetico esterno ad un materiale magnetizzato. Rappresentazione mediante poli magnetici Una spira percorsa da corrente avente momento magnetico m genera in un punto a grande distanza rispetto alle sue dimensioni lineari un campo magnetico B = - U0 grad ϕm con ϕm potenziale scalare magnetico dato da : (9.35) Dato un materiale magnetizzato caratterizzato da una magnetizzazione M possiamo associare ad ogni suo volumetto dυ′ un momento magnetico dm = M dυ′. Il potenziale scalare magnetico generato dal volumetto dυ′ di coordinata r′ in un punto esterno distante r dall’origine delle coordinate è allora: ( per cui il potenziale generato nel punto r da tutto il volume V del materiale risulta: (9.36) Poichè e valendo inoltre la relazione: div (ψ M) = ψ div M + M ⋅ grad ψ (9.37) 52 MAGNETOSTATICA NEI MEZZI MATERIALI ponendo ψ = 1 r − r' [CAP. 9 , possiamo scrivere che : (9.38) Per la (9.38), la (9.36) diviene: (9.39) Applicando il teorema della divergenza al primo integrale a destra si ottiene : (9.40) Definiamo ora le due quantità scalari: ρm(r') = - div' M(r') detta densità volumetrica di polo magnetico, e σm(r') = M(r')-n (9.41) (9.42) detta densità superficiale di polo magnetico. La ρm e la σm, consistenti in distribuzioni fittizie di cariche o poli magnetici distribuiti sulla superficie e nei volumi dei materiali magnetizzati, si rivelano quantità molto utili nella impostazione e risoluzione dei problemi di magnetostatica che coinvolgono mezzi magnetizzati. Esse svolgono nell'ambito del magnetismo lo stesso ruolo che le densità di cariche di polarizzazione σp e ρp rivestono nella teoria dei dielettrici e permettono di affrontare i problemi di magnetostatica utilizzando la stessa metodologia dell'elettrostatica. Avevamo già mostrato nel paragrafo 8.5, parlando delle lamine, che una spira percorsa da corrente, relativamente agli effetti magnetici, può essere considerata simile a due distribuzioni superficiali di poli magnetici di modulo uguale ma di segno opposto separate da un piccolo spessore δ: abbiamo ora dimostrato che il campo magnetico generato da un corpo magnetizzato può essere descritto come prodotto da una distribuzione superficiale e da una distribuzione volumetrica di poli magnetici. Se il materiale è uniformemente magnetizzato, cioè se div M = 0, la densità volumetrica ρm è nulla, ed è presente solamente una densità σm su quelle superfici per le quali esiste una componente normale di M non nulla. Queste sono le superfici che in una comune calamita a forma di barretta o di ferro di cavallo vengono comunemente indicate con il nome di poli: le distribuzioni superficiali di cariche magnetiche positive individuano il cosiddetto polo nord, le distribuzioni superficiali di cariche magnetiche negative il polo sud. 9.8] CAMPO MAGNETICO INTERNO AD UN MATERIALE 53 L'intensità totale dei poli magnetici distribuiti nel volume e sulla superficie di un mezzo magnetizzato è evidentemente nulla. Si ha infatti: (9.43) come è facile dimostrare applicando al primo integrale il teorema della divergenza. Il campo B generato da un materiale magnetizzato di volume V e superficie S è pertanto dato da: B(r) = -μ0 grad ϕm (9.44) con: (9.45) Risulta così evidente l'utilità della rappresentazione mediante poli magnetici, che permette di utilizzare in problemi di magnetostatica il formalismo della elettrostatica, data la maggiore semplicità connessa con il calcolo del gradiente di un potenziale scalare rispetto al calcolo del rotore di un potenziale vettore necessario nella rappresentazione mediante correnti di magnetizzazione. Dalla (9.44) ricaviamo inoltre, trattandosi di un punto esterno al materiale, dove vale la relazione B = μ0H, che H = - grad ϕm (9.46) 9.8 Campo magnetico interno ad un materiale magnetizzato Per quanto riguarda la descrizione del campo magnetico macroscopico all'interno della materia valgono naturalmente, da un punto di vista generale, le considerazioni fatte nella trattazione del campo elettrostatico nei dielettrici. L'induzione magnetica che in tal modo si definisce coincide con il valor medio del campo che si dedurrebbe considerando la deviazione prodotta dalla forza di Lorentz q (u × B) sul cammino di una particella di carica q che attraversa ad alta velocità il materiale magnetizzato. Prima tuttavia di procedere alla determinazione di B all'interno di un mezzo magnetizzato, visto che per semplicità di calcolo abbiamo deciso di far ricorso alla trattazione della magnetizzazione mediante poli magnetici, vogliamo ancora una volta sottolineare come tale rappresentazione non sia che un utile artificio, e che questo, in quanto tale, va applicato con molta cautela. A titolo di esempio ricordiamo che le linee di forza B sono linee chiuse o che si estendono all'infinito mentre la presenza di poli o cariche magnetiche comporta l'esistenza di linee di forza che iniziano e terminano in punti ben determinati. Per completare pertanto l'analogia con la trattazione del campo elettrostatico nella materia 54 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 utilizzeremo il vettore ausiliario H per il quale è possibile mostrare che nel materiale magnetizzato i poli magnetici rappresentano le sorgenti del campo. Se infatti calcoliamo la divergenza della (9.24) otteniamo: essendo div B = 0 e - div M = ρm, si ha : div H=ρm (9.47) relazione del tutto analoga a quella valida per il campo induzione elettrostatica D. Allo scopo di determinare il valore del campo magnetico nella materia, in maniera simile a quanto fatto per il campo elettrostatico, consideriamo una sottile cavità cilindrica scavata in un materiale magnetizzato, omogeneo lineare e isotropo, con l'asse parallelo alla direzione del vettore magnetizzazione M, come illustrato in Fig. 9.6. L'interno della cavità è una regione vuota nella quale in linea di principio è sempre possibile realizzare una esperienza per ricavare l'intensità del campo magnetico, misurando per esempio la coppia che agisce su una spira elementare percorsa da corrente o su un aghetto magnetico oppure la forza di Lorentz che agisce su una carica in moto. FIG. 9.6 - Cavità cilindrica all'interno di un materiale magnetizzato. In punti prossimi alla superfìcie laterale della cavità cilindrica e situati da parti opposte rispetto a questa, per le componenti tangenziali di H vale la relazione (9.34). Poiché inoltre si è scelto l'asse della cavità parallelo ad M, il vettore H nel materiale risulta tangente alla superfìcie laterale del cilindro e si ha perciò che: Hm=Hc (9.47 bis) dove con Hm ed Hc indichiamo il vettore intensità magnetica nel materiale e nella cavità. L'intensità magnetica Hc nella cavità può essere calcolata mediante la (9.46) prendendo per il potenziale ϕm l'espressione (9.45). Bisogna tuttavia tener presente che gli integrali che compaiono nella (9.45) sono estesi al volume totale V del materiale e alla sua superfìcie S esterna, mentre per il calcolo di 9.8] CAMPO MAGNETICO INTERNO AD UN MATERIALE 55 Hc nella cavità bisognerebbe tener conto del fatto che il materiale magnetizzato contenuto all'interno di S0 è stato rimosso e che sulle basi della cavità cilindrica appaiono delle densità superficiali di cariche magnetiche ± σm che non erano considerate nell'integrale superficiale della (9.45). D'altra parte, se supponiamo che la cavità cilindrica sia molto sottile, con un volume che al limite tende a zero, possiamo assumere che il vettore Hc nella cavità sia dato da: Hc=- grad ϕm (9.48) con ϕm esattamente uguale a quello dell'espressione (9.45) e cioè in altre parole con gli integrali estesi al volume e alla superficie del materiale magnetizzato. Possiamo così affermare che il vettore intensità magnetica H in un punto interno al materiale è deducibile dalla stessa espressione valida per il calcolo di H in un punto esterno. Per la relazione (9.24) abbiamo poi che nel materiale deve essere: (9.49) che combinata con la (9.47 bis) fornisce: (9.50) Da questa ultima espressione deduciamo che nel materiale il vettore induzione magnetica vale: B = μ0 (Hc + M) (9.51) che per la (9.48) diviene: B = - μ0 grad ϕm +ϕ0 M (9.52) con: (9.53) dove, come detto, gli integrali vanno estesi al volume V e alla superficie S del materiale magnetizzato. L'espressione (9.52) fornisce pertanto il valore di B generato da un materiale magnetizzato in ogni punto dello spazio, interno o esterno. Ovviamente all'esterno del materiale l'ultimo termine a destra è nullo essendo nel vuoto nullo il vettore M. Nel caso in cui, oltre al materiale magnetizzato, si prendano in considerazione come sorgenti del campo anche le densità di correnti di conduzione J, 56 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 l'induzione magnetica B, tenendo conto della (8.55), è data da: (9.54) che rappresenta pertanto l'espressione più generale per il vettore B. 9.9 La suscettività e la permeabilità magnetica L'equazione (9.54) ci permette di risalire al valore di B in ogni punto dello spazio una volta noti, oltre le correnti che fluiscono nei conduttori, il potenziale scalare ϕm e quindi le densità di polo magnetico σm e ρm. Dato che σm e ρm, per quanto dimostrato precedentemente, sono funzioni di M, il problema del calcolo di B è risolto, quando si è in presenza di materiali magnetizzati, se è nota la magnetizzazione M. D'altra parte la intensità di magnetizzazione M dipende e dalla natura del materiale e dal valore del campo magnetico totale applicato che a sua volta comprende il contributo dovuto al materiale magnetizzato. Il problema posto in questi termini è evidentemente senza soluzione in quanto non conoscendo il campo magnetico totale non siamo in grado di determinare il valore della magnetizzazione e viceversa. Risulta perciò necessario introdurre nella nostra trattazione una relazione sperimentale che leghi il vettore B al vettore H o, in modo equivalente, una relazione tra il vettore M ed uno dei due vettori del campo magnetico. Misure sperimentali atte a determinare il comportamento magnetico dei mezzi materiali mostrano che questi possono essere divisi in due categorie. Una comprendente i materiali cosiddetti diamagnetici e paramagnetici che presentano una debole magnetizzazione ed un comportamento lineare per cui B, H ed M risultano fra loro proporzionali, ed una comprendente i cosiddetti materiali ferromagnetici che presentano una forte magnetizzazione ed un comportamento decisamente non lineare. Questa ultima categoria sarà trattata a parte nel prossimo paragrafo. Normalmente per i materiali lineari si introduce la legge sperimentale: M=χm H (9.55) dove χm è una quantità adimensionale che prende il nome di suscettività magnetica. La (9.55) vale per tutti i materiali lineari isotropi mentre nel caso di materiali lineari anisotropi essa viene sostituita da una relazione tensoriale in cui la suscettività è rappresentata da una matrice a tre righe e tre colonne. Riprendendo allora la relazione: B = μ0 (H + M) (9.56) e sostituendo in essa l'espressione di M data dalla (9.55) otteniamo: B = μ0(l + χm) H. (9.57) 9.9 ] LA SUSCETTIVITÀ E LA PERMEABILITÀ MAGNETICA 57 Ponendo poi: μ = μ0 (l + χm) = μ0μr (9.58) μr = (l + χm) = μ /μ0 (9.59) B = μ H. (9.60) con la (9.57) si può scrivere: La quantità μ prende il nome di permeabilità magnetica assoluta mentre la quantità adimensionale μr viene chiamata permeabilità magnetica relativa. Entrambe sono caratteristiche di un determinato materiale. La relazione (9.60) vale per i materiali lineari isotropi omogenei; per i materiali disomogenei μ è uno scalare funzione del punto, mentre per i materiali anisotropi μ diviene un tensore del secondo ordine. In assenza di un mezzo materiale, cioè nel vuoto, la (9.60) si riduce alla relazione da noi già introdotta: B = μ0 H. (9.61) La suscettività magnetica χm è una quantità negativa per i materiali diamagnetici e positiva per quelli paramagnetici; tuttavia per entrambi i tipi di materiale Tabella 9.1. Suscettività magnetica di alcuni materiali diamagnetici e paramagnetici alla temperatura di 0 °C ed alla pressione di 1 atmosfera. Idrogeno Argon Acqua Rame Quarzo Diamante Argento Mercurio Oro Bismuto Ossigeno Magnesio Alluminio Tungsteno Titanio Platino Palladio -0,21 ⋅ 10-8 -0,95 ⋅ 10-8 -0.88 ⋅ 10-5 -0,94 ⋅ 10-5 -1.5 ⋅ 10-5 -2.2 ⋅ 10-5 -2,6 ⋅ 10-5 -3.2 ⋅ 10-5 -3,6 ⋅ 10-5 -1.7 ⋅ 10-4 17,9 ⋅ 10-7 1,2 ⋅ 10-5 2,3 ⋅ 10-5 6,8 ⋅ 10-5 7,0 ⋅ 10-5 2,9 ⋅ 10-4 8,2 ⋅ 10-4 58 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 il suo modulo è sempre molto minore dell'unità e pertanto la permeabilità magnetica relativa μr è assai prossima all'unità. All'interno dei materiali diamagnetici il campo magnetico risulta indebolito rispetto a quello che si avrebbe nel vuoto, nella stessa regione occupata dal mezzo; all'interno dei materiali paramagnetici al contrario il campo viene rafforzato; tuttavia, per il piccolo valore di χm, gli effetti magnetici dovuti a questi due tipi di materiale appaiono generalmente molto deboli. 9.10 Materiali ferromagnetici. Ciclo di isteresi Le sostanze ferromagnetiche, a differenza di quanto avviene per quelle diamagnetiche e paramagnetiche, sono sostanze a comportamento non lineare e pertanto presentano una suscettività magnetica χm, e quindi una permeabilità magnetica u, che dipende dalla intensità del campo magnetico applicato, cioè: μ = μ. (H). (9.62) Bisogna inoltre aggiungere che sia χm sia μ. non sono funzioni ben definite di H, perché per un dato valore di intensità di campo magnetico esse possono assumere differenti valori a secondo di come quel particolare valore di H sia stato raggiunto. Si suol dire così che suscettività e permeabilità magnetica dei mezzi ferromagnetici dipendono dalla storia magnetica del materiale considerato. Una ulteriore importante caratteristica dei materiali ferromagnetici è quella di presentare una suscettività che può essere anche dell'ordine di 106, estremamente grande se confrontata con i valori di χm delle sostanze diamagnetiche e paramagnetiche ; sotto l'azione di un campo magnetico anche debole le sostanze ferromagnetiche acquistano così una magnetizzazione molto intensa. I materiali ferromagnetici sono sostanze solide cristalline (non esistono infatti fluidi ferromagnetici) come per esempio il ferro, il nichel, il cobalto e le loro relative leghe. Esistono tuttavia leghe del ferro, come alcuni tipi di acciaio inossidabile, che non si comportano da ferromagnetici ma da paramagnetici. FIG. 9.7 - Anello di materiale ferromagnetico con avvolgimento toroidale ed una bobina per la misura della variazione di flusso magnetico. 9.10] MATERIALI FERROMAGNETICI. CICLO DI ISTERESI 59 Per trattare i problemi di ferromagnetismo, vista l'impossibilità, per quanto detto, di utilizzare una relazione tra B ed H come la (9.60), è necessario determinare sperimentalmente l'andamento di B (o di M) in funzione di H. A questo scopo consideriamo un anello di materiale ferromagnetico omogeneo e isotropo, ed avvolgiamo intorno ad esso una bobina di filo conduttore con N1 spire per unità di lunghezza, gli estremi della quale siano collegati ad un generatore di forza elettromagnetica. Facendo passare una corrente I nella bobina, nell'anello si produce un campo magnetico H che, se il raggio del toro r è molto più grande del raggio a della sezione, può essere considerato uniforme. La (9.26) calcolata lungo la circonferenza mediana del toro fornisce il valore dell'intensità magnetica, H = Nl I. Il toro ferromagnetico si magnetizza uniformemente ma, poiché la sua particolare geometria non permette la comparsa di distribuzioni di poli magnetici, H non è modificato rispetto a quello che la bobina percorsa dalla stessa corrente avrebbe prodotto se fosse stata avvolta nel vuoto. All'interno del toro il vettore B è parallelo ad H, essendo il materiale isotropo, e può essere determinato mediante una seconda piccola bobina avvolta sulla prima. Se questa seconda bobina è composta di N2 spire di sezione S, il flusso di B attraverso di essa è N2 BS. Collegando la bobina ad un galvanometro balistico o ad un flussometro calibrato è possibile, una volta noti N2 e S, risalire dalle variazioni di flusso alle variazioni di B. Facendo allora circolare una corrente di intensità variabile I nel primo avvolgimento, al toro ferromagnetico viene applicato un campo H di valore noto, N1 I. Contemporaneamente si può, mediante il secondo avvolgimento, misurare il valore del vettore B tramite le variazioni di flusso. Prima di iniziare questo tipo di misura, per essere sicuri di avere a che fare con un materiale inizialmente non magnetizzato, conviene far passare attraverso le spire del primo avvolgimento una corrente alternata di cui si diminuisce lentamente la intensità fino a zero. (1) FIG. 9.8 - Ciclo di isteresi di un materiale ferromagnetico. (1) Poiché come vedremo il comportamento ferromagnetico scompare al di sopra di una temperatura, che è caratteristica di ogni sostanza, la smagnetizzazione di un materiale può essere ottenuta mediante un opportuno riscaldamento. 60 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 Si faccia ora passare una corrente stazionaria nel primo avvolgimento in modo tale che H, partendo da zero, arrivi ad un valore determinato H * ; se riportiamo in un grafico i valori della induzione magnetica B vediamo che, all'aumentare di H, essi si dispongono lungo la curva 1 di Fig. 9.8. Diminuendo poi H fino a riportarlo a zero ed invertendo quindi il verso di percorrenza della corrente nella bobina, in modo da rendere possibile valori negativi di H, fino ad - H*, troviamo che B segue la curva 2. Riportando infine H dal valore -H* al valore H* notiamo che B descrive la curva 3 chiudendo il cammino in maniera simmetrica. La curva di Fig. 9.8 prende il nome di ciclo di isteresi del materiale. (1) La forma del ciclo di isteresi dipende dal tipo di materiale e dal valore di H*; in Fig. 9.9 sono riportati per un dato materiale alcuni cicli di isteresi per diversi valori di H*. La curva tratteggiata che unisce le punte dei diversi cicli viene detta curva di magnetizzazione. (2) FIG. 9.9 - Cicli di isteresi per diversi valori di H* e curva di magnetizzazione (tratteggiata). È interessante notare da questa curva, come la variazione di B, estremamente rapida per bassi valori di H, divenga molto lenta per valori di H più grandi. In effetti la magnetizzazione M del materiale al crescere di H aumenta fino a raggiungere il valore massimo ammesso per il materiale in questione; tale valore prende il nome di magnetizzazione di saturazione. Se allora indichiamo (1) Il ciclo di isteresi ha un andamento simmetrico come quello di Fig. 9.8 solo se si è avuto cura, prima di iniziare l'esperienza vera e propria, di far circolare nella prima bobina la corrente variando l'intensità fino al valore massimo e invertendo il verso più volte in modo che la magnetizzazione del materiale compia diversi cicli di isteresi. Generalmente dopo qualche decina di inversioni il materiale si dispone in quello che viene detto stato ciclico ed è in queste condizioni che è possibile ottenere una curva di isteresi simmetrica e riproducibile. (2) Nel caso in cui il ciclo di isteresi di Fig. 9.8 sia stato ricavato utilizzando un materiale portato in stato ciclico, secondo il significato attribuito a questa espressione nella nota precedente, la curva 1 del ciclo di isteresi si sovrappone alla curva di magnetizzazione. 9.10] MATERIALI FERROMAGNETICI. CICLO DI ISTERESI 61 con Hsat, il valore di H per cui la magnetizzazione si satura e ricordiamo la relazione : B = μ0(H + M) (9.63) vediamo che per H > Hsat l'incremento di B è dovuto solamente al termine μ0H. Esaminiamo ora più particolareggiatamente il ciclo di isteresi di Fig. 9.8. L'induzione B, al crescere di H tra zero ed H*, descrive inizialmente la curva l la quale, se H * è sufficientemente elevato, può presentare l'andamento tipico della condizione di saturazione della magnetizzazione. Al diminuire di H poi, B decresce seguendo la curva 2 e per H = 0 assume un valore non nullo indicato in figura con il punto r. Ciò è dovuto al fatto che, pur annullando il campo magnetico imposto, non si annulla tuttavia la magnetizzazione del materiale. Il materiale conserva cioè un ricordo del suo stato precedente e questo fa si che le variazioni di B avvengano in ritardo rispetto a quelle di H ; la magnetizzazione cioè si oppone al campo applicato e ne rallenta gli effetti. (1) Il valore di |B| corrispondente ad H=0 prende il nome di induzione residua. FIG. 9.10 - Permeabilità magnetica relativa del ferro in funzione di B. Per annullare l'induzione magnetica è necessario applicare un campo esterno inverso, indicato in figura con il punto c, il cui valore Hc è detto forza coercitiva. Sostanze che presentano un Hc grande sono dette magneticamente dure mentre sostanze con Hc piccolo sono dette magneticamente dolci. Per le sostanze magnetiche dolci Hc è dell'ordine di qualche A/m mentre per le sostanze magnetiche dure Hc può arrivare ad essere anche 105 - 106 A/m. Se si aumenta ulteriormente H, sempre per valori negativi, anche l'induzione magnetica B assume valori negativi fino a raggiungere nuovamente una condizione di saturazione (1) II termine isteresi deriva dal greco «υστερησις» che ha il significato di venire in ritardo. 62 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 per la magnetizzazione che evidentemente ha ora direzione opposta alla precedente. La parte del ciclo di isteresi per cui B è positivo ed H negativo è nota come curva di demagnetizzazione ed ha notevole importanza nella trattazione dei magneti permanenti. Dalla curva di magnetizzazione di Fig. 9.9 è possibile ricavare il grafico della permeabilità μr, del materiale (detta permeabilità ordinaria o normale) in funzione o di B o di H. Come è mostrato in Fig. 9.10 si vede che la permeabilità di un materiale ferromagnetico cresce all'aumentare del campo applicato, raggiunge un valore massimo e poi decresce rapidamente non appena la magnetizzazione comincia a raggiungere il suo valore di saturazione. Al crescere indefinito del campo la permeabilità assoluta del mezzo tende a quella del vuoto μ0 Il valore massimo della permeabilità relativa delle sostanze ferromagnetiche è normalmente dell'ordine di 103 -104 ma in alcuni casi può arrivare ad essere anche dell'ordine di 106. 9.11 Circuiti magnetici Consideriamo un anello di sostanza ferromagnetica su una parte del quale sia avvolta una bobina di N spire di filo conduttore percorso da una corrente stazionaria I, come mostrato in Fig. 9.11. FIG. 9.11 - Circuito magnetico chiuso formato da una bobina avvolta su un anello di materiale ferromagnetico. Dovendo essere div B = 0, le linee di forza del vettore B sono linee chiuse. Faremo l'ipotesi che le linee di forza B siano tutte contenute all'interno dell'anello, assumeremo cioè che non esistano linee di forza di B nella regione esterna al materiale. Supporremo cioè che il flusso di B sia lo stesso per ogni sezione dell'anello e che il flusso disperso in aria sia nullo. Questa è evidentemente una approssimazione che è tuttavia in pratica tanto meglio verificata quanto più la permeabilità magnetica del materiale è elevata rispetto a quello del mezzo circostante. Sappiamo infatti che attraverso la superficie di separazione tra due materiali con permeabilità magnetica relativa μr1 e μr2 in assenza di correnti di conduzione 9.11 ] CIRCUITI MAGNETICI 63 superficiali, vale per la componente tangente del vettore H la condizione: H1t = H2t e questa per la relazione esistente tra B ed H, cioè B = μ0μr H, può anche essere scritta nella forma: dalla quale deriva che: Se il primo mezzo ha una permeabilità magnetica relativa molto maggiore di quella del secondo (nel caso di un materiale ferromagnetico e dell'aria il rapporto μr1 / μr2 può essere anche molto maggiore di 103) Blt è molto maggiore di B2t, e quindi il numero di linee di forza di B nel primo mezzo è molto più grande che nel secondo. Si vede cosi che le linee di forza di B tendono ad addensarse all'interno del corpo con permeabilità magnetica più alta; esso sembra assorbire il flusso del vettore B. Applicando il teorema della circuitazione di Ampère alla circonferenza mediana C dell'anello troviamo che: (9.64) In ogni punto del percorso C, H e B sono paralleli tra loro e tangenti a C ed inoltre possiamo scrivere, assumendo B sufficientemente uniforme su ogni sezione del toro, che H = Φ/Sμ dove Φ = BS è il flusso dell'induzione magnetica. La (9.64) diviene cosi: (9.65) dove Φ è stato portato fuori dal segno di integrale poiché, avendo assunto il flusso disperso nullo, è costante lungo tutto l'anello. Se definiamo come forza magnetica motrice la quantità: f.m.m. = N1 (9.66) e riluttanza la quantità: (9.67) 64 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 la (9.65) si può scrivere nella forma: f.m.m. = Φ (9.68) espressione che risulta simile alla equazione valida per un circuito percorso da corrente continua : = RI. Questa analogia che è alla base del concetto di circuito magnetico non è altro che una schematizzazione per descrivere lo stato magnetico del materiale. Tuttavia, fintanto che rimane valida l'ipotesi di flusso disperso nullo, possiamo immaginare che il flusso di B all'interno del circuito magnetico sia l'analogo della corrente / in un circuito elettrico (che rimane sempre la stessa per ogni sezione del filo). L'avvolgimento di N spire della bobina, responsabile della generazione del flusso magnetico nel circuito magnetico, è paragonabile alla batteria che produce la corrente in un circuito elettrico; la forza magnetomotrice è così il corrispondente della forza elettromotrice e la riluttanza, che dipende dalle caratteristiche geometriche del circuito e dalla permeabilità magnetica del materiale secondo la (9.67), è l'analogo della resistenza. Consideriamo ora l'elettrocalamita di Fig. 9.12 formata da una bobina di N spire percorsa da corrente I avvolta su un anello di materiale ferromagnetico interrotto da un sottile strato di aria, detto traferro. In questo problema bisogna tener conto che le linee di forza di B nel traferro, dove la permeabilità magnetica è debole e circa uguale a quella del vuoto μ0, tendono ad allontanarsi una dall'altra allargandosi nella regione vicina. FIG. 9.12 - Circuito magnetico in serie formato da una bobina avvolta su un anello di materiale ferromagnetico con un traferro in aria. Tuttavia, se lo spessore del traferro è molto sottile, è sempre possibile in prima approssimazione trascurare il flusso di B disperso nella regione esterna al traferro e supporre che Φ rimanga costante lungo tutto il circuito magnetico composto questa volta da due parti: uno di materiale ferromagnetico ed uno 9.11 ] CIRCUITI MAGNETICI 65 di aria. Applicando allora la (9.65) al circuito di Fig. 9.12 e ricavando Φ otteniamo: (9.69) dove lm e la indicano rispettivamente il tratto del cammino C nel materiale e nel traferro entrambi di sezione S. Dalla (9.69) risulta che la riluttanza totale del circuito magnetico di Fig. 9.12, è: (9.70) e quindi che: (9.71) Generalizzando questo risultato possiamo scrivere che la riluttanza di un circuito magnetico composto da più parti in serie, ognuna omogenea e con sezione costante, è data da: (9.72) Nel caso di un circuito magnetico come quello di Fig. 9.13 è facile rendersi conto che: (9.73) dove Φ è il flusso totale di B, indotto dalla bobina percorsa dalla corrente I; Φ1, Φ2, 1 , e 2 sono rispettivamente i flussi e le riluttanze nel primo e nel secondo ramo del circuito magnetico. FIG. 9.13 - Circuito magnetico in parallelo. 66 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 Dall'espressione (9.73) si ricava che per la riluttanza totale di un circuito magnetico composto da più parti in parallelo vale la relazione: (9.74) Poiché la riluttanza è inversamente proporzionale alla permeabilità μ. del materiale, è evidente che un materiale ad alto μ. rappresenta un percorso di bassa riluttanza per il flusso magnetico. Pertanto tra due percorsi paralleli di un circuito magnetico, uno a bassa riluttanza ed uno ad alta riluttanza, la frazione maggiore del flusso magnetico passa attraverso il percorso a riluttanza minore (1). Ritornando alla formula (9.69) notiamo che per la determinazione di B si pone il problema di quale valore scegliere per la permeabilità magnetica del materiale dato che questa dipende da B. È possibile operare per approssimazioni successive nella seguente maniera: si trascura inizialmente nella (9.69) il termine lm/μS, che risulta generalmente molto minore del termine la/μ0S, e si ottiene B = μ0 NI/la ; il valore della permeabilità μ. del materiale si ricava riportando il valore di B ottenuto sulla corrispondente curva di magnetizzazione; a questo punto si calcola la riluttanza totale del circuito e tramite la (9.69) il flusso Φ; da questo valore di Φ si risale al nuovo valore di B nel materiale e si ridetermina la permeabilità magnetica μ. Ripetendo questo procedimento più volte è possibile ottenere il valore di B nel traferro con l'approssimazione desiderata. 9.12 Magneti permanenti E detto magnete permanente un materiale il quale, in assenza di campo magnetico esterno eccitatore, presenta una magnetizzazione M che entro certi limiti non dipende da fattori fisici, come per esempio la temperatura e la pressione, e resta invariata anche in presenza di un campo magnetico. Esistono magneti permanenti naturali come la magnetite (Fe3O4) e magneti permanenti artificiali prodotti sottoponendo sostanze ferromagnetiche, generalmente acciai di differenti composizioni, all'azione di un campo magnetico. I materiali più utilizzati per la produzione di magneti permanenti artificiali sono i cosiddetti Alnico, leghe speciali di alluminio, nichel, cobalto e ferro. Tra questi l'Alnico V, composto dal 14 % di Ni, dal 8 % di Al, dal 24 % di Co, dal 3 % di Cu e per il rimanente da Fe, presenta una forza coercitiva di 5 ⋅ 104 A/m ed una induzione residua di circa 1,3 weber/m2. Il materiale viene preparato mediante raffreddamento da 1250 °C a 600 °C alla velocità di 1-5 °C/s in presenza di un campo magnetico di 24 ⋅ 104 A/m. (') Lo schermaggio magnetico di strumenti molto delicati si ottiene circondando gli strumenti con del materiale ad alta permeabilità magnetica. Lo schermo rappresenta per il flusso di B un cammino con bassa riluttanza e pertanto le linee di forza di B si addensano all'interno dello schermo diminuendo nella regione in esso contenuta. 9.12] MAGNETI PERMANENTI 67 I magneti permanenti, in varie forme, trovano largo uso nella produzione di campi magnetici a scopi industriali. Ci limiteremo a prendere in esame un magnete permanente dalla configurazione classica, mostrata in Fig. 9.14, per il quale illustreremo in particolare il metodo per calcolare il valore dell'induzione magnetica nel traferro in funzione delle dimensioni geometriche e del tipo di materiale utilizzato. Supponiamo innanzitutto che le linee di forza di B siano tutto contenute nel magnete e che attraversino tutte la zona del traferro, che immaginiamo di sezione S uguale a quella del materiale magnetizzato. FIG. 9.14 - Magnete permanente con traferro in aria. Le linee di forza di B hanno quindi una forma perfettamente circolare, e, per quanto esposto nel paragrafo precedente, il flusso disperso di B è nullo e quindi il prodotto BS risulta costante lungo tutto il toro per ogni sezione del materiale e del traferro. In assenza di densità corrente di conduzione J, come si ha nel caso in considerazione, le leggi fondamentali della magnetostatica si scrivono: div B = 0 rot H = 0. (9.75) La prima di queste espressioni permette di affermare, secondo quanto già detto, che la componente normale di B attraverso la superficie di separazione tra il materiale magnetizzato ed il traferro è continua e poiché il vettore B in questo caso è perpendicolare alla superficie di separazione troviamo che: Ba = Bm (9.76) dove con gli indici a ed m indichiamo rispettivamente l'aria ed il materiale magnetizzato permanentemente. Assumendo come valore della permeabilità 68 MAGNETOSTATICA NEI MEZZI MATERIALI [CAP. 9 magnetica dell'aria quello del vuoto, abbiamo inoltre che nel traferro deve essere : Ba = μ0 Ha. (9.77) Calcolando il flusso di rotH attraverso la circonferenza mediana C del toro, e applicando il teorema di Stokes, per la (9.75) otteniamo che: (9.78) dove la ed lm rappresentano la lunghezza dei tratti del cammino C nel traferro e nel materiale. Dalla (9.78) si ricava così che: (9.79) che combinata con la (9.76) e (9.77) diviene: (9.80) espressione che lega il valore di H e B nel materiale con le dimensioni del magnete. Il segno meno che compare nella (9.80) è indice del fatto che all'interno del magnete permanente la linea di forza di H hanno verso opposto a quelle di B e che quindi il materiale è sottoposto ad un campo di demagnetizzazione. Le linee di forza di B, secondo la regola generale, sono linee chiuse percorse sempre nello stesso verso ; le linee di forza di H invertono invece il loro verso di percorrenza nel passaggio attraverso la superficie di separazione tra il materiale e l'aria. Questa discontinuità per H è giustificata dal fatto che sulle due facce del magnete (dette anche poli) come sappiamo esistono dalle distribuzioni di densità di poli magnetici ± σm che rappresentano le sorgenti del campo H. Pertanto B ed H risultano paralleli nel traferro ed antiparalleli nel materiale. FIG. 9.15 - Curva di demagnetizzazione di un materiale ferromagnetico. Hm e Bm sono i valori dei campi nei punti interni al materiale della calamita della precedente figura. 9.12] MAGNETI PERMANENTI 69 La relazione (9.80) tuttavia non è sufficiente a determinare i valori di B ed H nel magnete, bisogna infatti conoscere il diagramma che fornisce il valore di B in funzione di H per il materiale in questione. Questo diagramma, del tipo di quello mostrato in Fig. 9.15, rappresenta la parte del ciclo di isteresi per la quale B è positivo ed H negativo, e cioè il quadrante in cui è contenuta la curva di demagnetizzazione. Tracciando su questo grafico la retta individuata dalla (9.80) si risale ai valori di B ed H nel materiale, relativamente alle dimensioni geometriche del magnete in studio. L'induzione magnetica nel traferro, essendo Bm = Ba, risulta così determinata. 10 Origine atomica delle proprietà magnetiche di un materiale 10.1 Introduzione Nel precedente capitolo abbiamo descritto il comportamento magnetico della materia mettendoci da un punto di vista macroscopico ; gli effetti magnetici della materia sono stati descritti ricorrendo all'introduzione di una grandezza, il vettore M, che, legata sperimentalmente all'intensità del campo magnetico eccitatore, rappresentasse gli aspetti macroscopici della magnetizzazione. In questo capitolo, pur limitando la trattazione ad alcuni aspetti estremamente elementari, cercheremo di capire quale sia l'origine a livello microscopico della magnetizzazione, esaminando in particolare la risposta dei singoli atomi o molecole costituenti la materia ad un campo magnetico applicato. Per quanto riguarda le proprietà magnetiche in assenza di campo magnetico esterno, gli atomi e le molecole possono essere divisi in due categorie: quelli che hanno un momento magnetico proprio e quelli che non lo hanno. Tale momento magnetico, come abbiamo già avuto occasione di accennare, è dovuto sia al moto orbitale degli elettroni intorno al nucleo sia al moto rotatorio, o di spin, degli elettroni intorno al proprio asse. Gli atomi e le molecole per i quali la somma dei momenti magnetici dovuti al moto orbitale e allo spin di tutti gli elettroni ad essi appartenenti risulta uguale a zero sono quelli privi di momento magnetico proprio. Questo si verifica in particolare per gli atomi che presentano gli strati elettronici completi. L'applicazione di un campo magnetico esterno fa sì che gli elettroni degli atomi o delle molecole presentino, sovrapposto al moto primitivo, un altro 72 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 moto rotatorio, o più precisamente di precessione, intorno alla direzione del campo. Tale moto è responsabile dell'insorgere di un momento magnetico indotto orientato in senso opposto al campo che lo ha generato. Se inoltre gli atomi o le molecole sottoposte al campo magnetico sono dotati di momento magnetico proprio si manifesta anche un parziale orientamento, contrastato dall'agitazione termica, dei momenti magnetici propri in direzione del campo. La magnetizzazione delle sostanze costituite da atomi o molecole privi di momento magnetico proprio è quindi dovuta esclusivamente al primo dei due fenomeni sopra descritti, quello di precessione. L'effetto di una tale magnetizzazione, risultante dai momenti magnetici indotti orientati in senso antiparallelo al campo magnetico applicato, è quello di indebolire quindi il campo stesso. Questi materiali presentano pertanto una suscettività magnetica negativa e sono chiamati diamagnetici. Le sostanze costituite da atomi o molecole dotati di momenti magnetici propri subiscono entrambi i fenomeni, cioè sia quello di precessione degli elettroni, sia quello di orientamento dei momenti magnetici propri ; questo secondo contributo risulta però preponderante e pertanto atomi e molecole presentano globalmente una componente del momento magnetico parallela al campo esterno con un valore dipendente dalla temperatura. Questi materiali sono distinti da una suscettività magnetica positiva e sono detti materiali paramagnetici. Resta infine da analizzare il comportamento dei materiali ferromagnetici. Vedremo che esso è in parte riconducibile a quello dei materiali paramagnetici, anche se presenta aspetti molto più complessi ai quali dedicheremo soltanto alcuni brevi cenni. 10.2 Campo magnetico molecolare Si definisce campo magnetico molecolare o locale Bm il campo che agisce nel punto ove è situato un atomo (od una molecola) e che è responsabile della sua magnetizzazione; esso è generato dalle correnti di conduzione e da tutti i dipoli magnetici del materiale ad eccezione di quello relativo all'atomo o alla molecola in esame. Da un punto di vista microscopico possiamo assumere un modello di materiale magnetizzato costituito da un insieme di poli magnetici posti nel vuoto; tra il vettore induzione Bm ed il vettore intensità magnetica Hm intercorre allora la relazione: Bm = μ0Hm. (10.1) Il campo magnetico molecolare può essere messo in relazione con il campo magnetico macroscopico interno al materiale. Normalmente, anche se il vettore responsabile della magnetizzazione è il vettore Bm, si preferisce trovare una correlazione tra Hm ed H poiché questi vettori possono essere espressi in termini di correnti e di densità di poli magnetici. Per il calcolo del campo Hm si procede in modo simile a quanto fatto nel capitolo 5 per la determinazione dell'espressione del campo elettrico molecolare 10.2] CAMPO MAGNETICO MOLECOLARE 73 Em. Prendiamo un volume V di materiale, che per semplicità supporremo uniformemente magnetizzato, e scaviamo nell'intorno del punto in cui vogliamo conoscere il campo molecolare una cavità sferica. Il materiale esterno alla cavità viene considerato, ai fini del calcolo di Hm, macroscopicamente, cioè come un continuo rappresentabile pertanto mediante una opportuna distribuzione di poli magnetici; il materiale che si trova nella cavità viene rimesso al suo posto e considerato su scala microscopica, cioè come formato da un insieme di dipoli magnetici, ognuno dei quali contribuisce al campo magnetico molecolare al centro della sfera. In un punto interno al materiale, tenendo conto di tutte le sorgenti, il campo macroscopico H, come mostrato nel paragrafo 9.8, è uguale a: (10.2) Nel presente caso, avendo considerato una magnetizzazione uniforme, l'integrale relativo alla densità di magnetizzazione ρm è nullo. Per il calcolo del campo molecolare Hm oltre al campo macroscopico (10.2) dobbiamo tener conto del campo HS generato dalla densità di poli magnetici σm = M ⋅ n distribuita sulla superficie S della cavità sferica e del campo Hi, generato al centro della sfera da tutti i dipoli magnetici in essa contenuti. Avremo pertanto che: Hm=H + HS + Hi. (10.3) Operando in maniera analoga a quanto fatto nel paragrafo 5.1 si può dimostrare che: (10.4) Inoltre, ricordando la (5.8), si ha che: (10.5) dove la sommatoria è estesa a tutti i dipoli magnetici contenuti all'interno della cavità, e rk rappresenta la distanza del k-esimo dipolo dal centro della cavità. Se ci limitiamo a considerare i materiali, piuttosto numerosi, per i quali il campo Hi, è nullo, il campo molecolare risulta dato da: (10.6) Indicando con m il momento magnetico totale acquisito per effetto della magnetizzazione da una molecola in un campo magnetico, e a questo proporzionale 74 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 possiamo scrivere che: m = αmBm = αmμo Hm (10.7) dove αm prende il nome di polarizzabilità magnetica molecolare e rappresenta il momento magnetico che un campo magnetico di intensità unitaria induce, sia per effetto della precessione sia per effetto dell'orientamento, nella molecola. In un mezzo con N molecole per unità di volume la magnetizzazione risulta M = Nm; abbiamo quindi che: M = Nαm μ0 Hm. (10.8) Utilizzando la relazione M = χmH e la (10.6), ricaviamo dalla (10.8) la seguente relazione: (10.9) valida se il campo molecolare è quello dato dalla (10.6) e se tutte le molecole sono adeguatamente descritte mediante il loro campo di dipolo ed hanno lo stesso momento magnetico. Per la maggior parte dei materiali diamagnetici e paramagnetici, a causa della debole magnetizzazione, il termine 1 M, che compare nella (10.6), risulta 3 trascurabile e quindi il campo magnetico molecolare può essere approssimato con il campo macroscopico. Assumiamo allora la relazione: χm = N αm μ0. (10.10) 10.3 Origine del diamagnetismo Consideriamo l'elettrone di un atomo di idrogeno in moto rotatorio intorno al nucleo su un'orbita circolare di raggio r, con velocità v0. Al moto rotatorio dell'elettrone di carica - e possiamo immaginare associata una corrente equivalente avente una intensità I=e/T, dove T, il periodo del moto di rotazione, è uguale a 2πr/v0. Si ha così che: I= ev0 2πr (10.11) Inoltre, seguendo la convenzione sul verso della corrente, essa fluisce in verso opposto al moto dell'elettrone. Il modulo del momento magnetico di questa spira di corrente è dato dal prodotto della superficie della spira πr2 per la corrente I, e risulta: (10.12) 10.3] ORIGINE DEL DIAMAGNETISMO 75 la direzione ed il verso sono quelli indicati in Fig. 10.1 e dipendono ovviamente dal verso di rotazione dell'elettrone. L'elettrone, di massa me, per il suo moto possiede inoltre un momento angolare: L = mev0r (10.13) diretto perpendicolarmente al piano dell'orbita nel verso mostrato in Fig. 10.1. FIG. 10.1 - Momento magnetico m0 e momento angolare L associati ad un elettrone in moto su un'orbita circolare. Come si vede in figura, i due vettori L ed m0 risultano antiparalleli ; invertendo il verso di rotazione dell'elettrone risulta invertito sia il verso di L sia quello di m0. Il rapporto tra i due vettori è indipendente dalla velocità dell'elettrone essendo dato da: (10.14) Supponiamo ora che sull'atomo di idrogeno agisca un campo magnetico molecolare Bm che per semplicità assumeremo diretto perpendicolarmente al piano dell'orbita, come indicato in Fig. 10.2. Mediante l'elettrodinamica classica si può dimostrare che il raggio dell'orbita rimane inalterato al variare della velocità dell'elettrone. Tenendo conto di questo risultato, del quale però tralasciamo FIG. 10.2 - L'applicazione di un campo magnetico modifica la velocità dell'elettrone ruotante ma non il raggio dell'orbita. 76 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 lasciamo la dimostrazione, possiamo facilmente ricavare la nuova velocità dell'elettrone. In assenza di campo magnetico, come riportato nel paragrafo 6.1, in ogni punto dell'orbita la forza coulombiana esercitantesi tra il nucleo e l'elettrone è in equilibrio con la forza centrifuga: (10.15) con ω0 = v0/r. La presenza del campo magnetico fa si che sull'elettrone agisca una ulteriore forza, la forza di Lorentz FL = - e (v × Bm), che, in aggiunta a quella coulombiana, deve eguagliare la forza centrifuga. Si ha così: (10.16) dove con v abbiamo indicato la velocità dell'elettrone in presenza di campo magnetico. Ponendo allora ω = v/r e sostituendo la (10.15) nella (10.16) troviamo: (10.17) da cui deriva: (10.18) Dato che (ω2 - ω 0 ) = (ω - ω0) (ω + ω0), supponendo che ω differisca poco da 2 ω0, è (ω2 - ω 0 ) ≅ 2ω (ω - ω0) e la (10.18) diviene: 2 (10.19) dalla quale si ricava che la variazione della velocità angolare dell'elettrone dovuta al campo magnetico è: (10.20) Nell'esempio di Fig. 10.2, per la particolare scelta del verso di rotazione dell'elettrone e della direzione del campo magnetico, la velocità angolare dell'elettrone subisce un incremento positivo uguale a Δω. Se invertissimo il verso di rotazione dell'elettrone, o in maniera del tutto equivalente prendessimo per il campo magnetico la direzione opposta rispetto a quella di Fig. 10.2, la velocità angolare dell'elettrone subirebbe una diminuzione uguale a Δω. La quantità ± Δω, indicata sovente con il simbolo ωL, prende il nome di frequenza di Larmor. Dalla (10.14) e (10.20) si ricava inoltre che: (10.21) 10.3] ORIGINE DEL DIAMAGNETISMO 77 Si può allora concludere che l'applicazione del campo magnetico all'atomo di idrogeno fa sì che al moto primitivo di rotazione dell'elettrone intorno al nucleo si sovrapponga un altro moto rotatorio con velocità angolare ωL in verso antiorario intorno alla direzione del campo stesso. Per ricavare la (10.20) è stata necessaria una approssimazione: abbiamo cioè supposto che w differisse poco da ω0. Tale approssimazione rimane valida fintantoché è possibile supporre che Δω / ω0 « 1 e quindi, per la (10.20), finché: (10.22) Poiché ω0 ha lo stesso ordine di grandezza della frequenza della luce visibile, e cioè circa 10 + 15 s-1, e 2me / e = 2 ⋅ 9 ⋅ 10−31 ~ 10-11 troviamo che l'approssimazione −19 1,6 ⋅ 10 vale se: Bm « 104 weber/m2 (10.23) valore di campo magnetico considerevolmente più grande di quelli normalmente utilizzati. FIG. 10.3 a) b) - Precessione del momento angolare intorno alla direzione del campo magnetico applicato. Abbiamo trattato, per ragioni di semplicità, il caso molto particolare dell'atomo di idrogeno, prendendo inoltre il piano dell'orbita dell'elettrone perpendicolare al campo magnetico esterno. In generale si ha invece a che fare con atomi forniti di più elettroni, le orbite dei quali sono disposte su piani che formano angoli diversi con la direzione del campo. È possibile tuttavia dimostrare che per un elettrone con orbita posta su un piano inclinato rispetto a Bm la presenza del campo magnetico induce un moto rotatorio in verso antiorario intorno alla direzione del campo stesso con velocità angolare ωL (1). Consideriamo l'esempio riportato in Fig. 10.3 a) e b) relativo all'istante in cui il momento (l) Per una trattazione più rigorosa vedi Classical Mechanics di H. Goldstein pag. 176178. 78 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 mento angolare L di un elettrone avente un'orbita posta su un piano inclinato rispetto al campo magnetico giace nel piano y = 0. Il modulo del momento meccanico della coppia esercitata dal campo Bm sul momento magnetico m0 è : (10.24) mentre la direzione ed il verso sono quelli dell'asse y. Nell'intervallo di tempo dt il momento angolare subisce, per effetto della coppia, una rotazione e passa dalla posizione OA' alla posizione OB', compiendo un angolo dα'; la lunghezza A'B' rappresenta così la variazione del momento angolare. Questa variazione è inoltre uguale a: Ldα' = L sen ϑ dα (10.25) dove dα è l'angolo di rotazione sul piano z = 0 compiuto dalla proiezione del vettore L. Sappiamo inoltre che il momento meccanico della coppia deve essere uguale alla derivata rispetto al tempo del momento angolare che per quanto detto risulta essere L sen ϑ dα/dt. Da tutto questo si deduce che : (10.26) e tenendo conto della (10.21) si trova infine che: (10.27) La quantità dα/dt può essere riguardata come la velocità di rotazione intorno alla direzione del campo magnetico del vettore L ; tale vettore descrive nel tempo la superficie laterale di un cono con il vertice in O e con un angolo di semiapertura uguale a ϑ'. Il vettore L è d'altra parte in ogni istante perpendicolare al piano contenente l'orbita dell'elettrone per cui si deduce che questo piano, per effetto della presenza del campo magnetico, varia nel tempo conpiendo un moto di precessione intorno al campo con velocita angolare ωL. In conclusione possiamo FIG. 10.4 - Momento magnetico generato dalla precessione di Larmor. 10.3] ORIGINE DEL DIAMAGNETISMO 79 siamo dire che in presenza di un campo magnetico esterno gli elettroni acquistano un moto di precessione intorno al campo con velocità angolare ωL. Il moto di precessione si sovraimpone al moto primitivo degli elettroni e ne altera la frequenza di rivoluzione su un piano perpendicolare al campo. Tutti gli elettroni precedono nello stesso verso intorno al campo mentre la frequenza di precessione si somma o si sottrae a quella di rivoluzione a seconda del verso con il quale l'elettrone percorre l'orbita rispetto la direzione di Bm. Prendiamo nuovamente in esame un atomo di idrogeno con l'orbita dell'elettrone posta in un piano perpendicolare a Bm. Il moto rotatorio che l'elettrone compie intorno al campo con velocità angolare ωL può essere interpretato come una corrente IL che fluisce in una spira di raggio r come è mostrato in Fig. 10.4. Per le convenzioni fatte la corrente, essendo prodotta dal moto di un elettrone, fluisce in verso opposto al moto di questo e risulta uguale a: (10.28) A questa corrente è associato un momento magnetico di modulo m = IL S con S = πr2 che per la (10.28) è: (10.29) dove il segno meno indica che il verso di m è opposto a quello di Bm. Più in generale se l'orbita dell'elettrone è inclinata rispetto al campo magnetico applicato essa, come abbiamo dimostrato, precede intorno a Bm ed il momento magnetico indotto è in questo caso: (10.30) dove ρ è il raggio quadratico medio della proiezione dell'orbita su un piano perpendicolare a Bm. Per un atomo contenente Z elettroni il momento magnetico diviene: 2 (10.31) Se gli elettroni sono distribuiti con simmetria sferica si ha in media nel tempo 2 2 2 2 che xi = yi = zi =1/3 ri , indicando con ri 2 la distanza quadratica media dell'i- esimo elettrone dal nucleo. Da questo si deduce che quindi la (10.31) può essere scritta nella forma: ρi2 = xi2 + yi2 = 2/3 ri 2 e (10.32) 80 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 La polarizzabilità magnetica dell'atomo indotta dalla precessione è così: (10.33) e per una sostanza che possiede N atomi per unità di volume, approssimando il campo molecolare Hm con H e usando perciò la relazione (10.10) per cui χm = Nαmμ0, si ha che: (10.34) Indicando con a2 la media dei quadrati delle distanze degli elettroni dal nucleo abbiamo che: (10.35) e quindi che: (10.36) Se assumiamo a2 ~ 10-20 m, N ~ 5 ⋅ 1028 m-3 e Z ~ 10 si ottiene per la suscettività χmd un ordine di grandezza di 10-5. Per riassumere possiamo trarre le seguenti conclusioni: 1) - la suscettività indotta dalla precessione di Larmor è negativa ed è quindi la causa del diamagnetismo ; 2) - il diamagnetismo è una proprietà comune a tutta la materia; 3) - la suscettività diamagnetica non dipende dalla temperatura. Ricordiamo infine che la (10.36) vale solamente nel caso di atomi aventi simmetria sferica e non per le molecole. 10.4 L'origine del paramagnetismo Le sostanze diamagnetiche sono quelle per le quali gli atomi e le molecole hanno un momento magnetico proprio nullo. Il paramagnetismo al contrario è un fenomeno che interessa i materiali formati da atomi o molecole dotati di momento magnetico proprio. In assenza di campo magnetico i dipoli atomici, per effetto dell'agitazione termica, sono orientati a caso. Quando al materiale paramagnetico viene applicato un campo magnetico ogni dipolo magnetico m0 acquista una energia potenziale uguale a - m0 Bm cos ϑ dove ϑ è l'angolo compreso tra l'asse del dipolo e il campo magnetico. L'energia 10.4] L'ORIGINE DEL PARAMAGNETISMO 81 termica del sistema tende ad orientare in maniera del tutto casuale i dipoli magnetici; tuttavia, poiché l'energia potenziale del sistema in presenza del campo magnetico diminuisce se gli assi magnetici dei dipoli ruotano in maniera tale da assumere orientamenti paralleli al campo magnetico, un parziale allineamento dei dipoli alla direzione del campo è una configurazione favorita dal punto di vista energetico. Dato tuttavia che la energia termica, eccetto per temperature molto basse, è molto maggiore della energia potenziale, l'allineamento dei dipoli, che è contrastato per effetto delle collisioni, è fortemente influenzato dall'agitazione termica. Ad ogni modo l'orientamento, anche se parziale, dei momenti magnetici propri degli atomi o molecole produce macroscopicamente una magnetizzazione parallela al campo magnetico applicato. Il problema di determinare la magnetizzazione risultante è un problema di statistica, che può essere affrontato in maniera classica, ammettendo che tutte le orientazioni del momento magnetico rispetto al campo siano possibili o in maniera quantistica supponendo che solo alcune di queste siano permesse. Discuteremo brevemente la trattazione classica, sviluppata da Langevin, che è del tutto analoga a quella già descritta per la polarizzazione delle molecole polari nel paragrafo 5.4. Utilizzando punto per punto quanto detto in quella occasione possiamo scrivere che la componente media del momento magnetico proprio in direzione di Bm è data da: (10.37) Ponendo y = m0 Bm x = cosϑ la (10.37) diviene: kT (10.38) dalla quale ricaviamo: (10.39) ⎛ 1⎞ La quantità L (y) = ⎜⎜ coth y − ⎟ è nota come funzione di Langevin ed ha y⎠ ⎝ l'andamento già mostrato in Fig. 5.4. Nel caso di deboli campi magnetici, e cioè quando l'energia magnetica è 82 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 piccola rispetto all'energia termica, poiché y « 1, possiamo sviluppare la cotangente iperbolica in serie: (10.40) Fermando lo sviluppo al secondo termine e sostituendo nella espressione della funzione di Langevin, si ottiene L(y) = y/3 e di conseguenza la (10.39) si scrive: (10.41) La polarizzabilità magnetica dovuta all'effetto paramagnetico è quindi: (10.42) e, tenendo conto che anche per i materiali paramagnetici il campo molecolare differisce di poco dal campo macroscopico, per la (10.10) si ha che la suscettività paramagnetica è : (10.43) Quest'equazione, che prende il nome di legge di Curie mostra come la suscettività dovuta al paramagnetismo sia positiva e inversamente proporzionale alla temperatura. Il momento magnetico proprio m0 è dell'ordine di qualche magnetone di Bohr, dove un magnetone di Bohr è uguale a eh/4πme = 9,27⋅ 10-24 ampere⋅metro2. La legge di Curie, che fornisce valori in buon accordo con i dati sperimentali per i gas e per alcuni solidi, diviene inesatta per campi magnetici molto forti e per temperature molto basse quando comincia a manifestarsi il fenomeno della saturazione, cioè del quasi completo orientamento dei poli magnetici in direzione del campo. Evidentemente le sostanze paramagnetiche subiscono anche il fenomeno del diamagnetismo ma quest'ultimo risulta completamente mascherato dall'effetto paramagnetico, fortemente preponderante. Per una sostanza paramagnetica solida a temperatura ambiente che obbedisce alla legge di Curie, prendendo m0= 10-23 ampere ⋅ m2 ed N ~ 5 ⋅ 10+28 m-3, si vede che χmp ~ 10-3. 10.5 Il ferromagnetismo e la legge di Curie-Weiss Le sostanze ferromagnetiche, costituite da atomi o molecole dotati di momento magnetico proprio, a differenza delle sostanze paramagnetiche, sono caratterizzate dal fatto che già in presenza di campi magnetici relativamente 10.5] IL FERROMAGNETISMO E LA LEGGE DI CURIE-WEISS 83 deboli mostrano una magnetizzazione molto elevata, quasi prossima al valore di saturazione ; questa magnetizzazione in parte permane anche quando il campo viene rimosso. Un tale comportamento sembra dimostrare che i dipoli magnetici delle sostanze ferromagnetiche presentino una grande facilità ad allinearsi parallelamente e a mantenere questo orientamento anche quando il campo magnetico esterno è riportato a zero. Per spiegare queste peculiari caratteristiche dei materiali ferromagnetici, Weiss nel 1907 avanzò le seguenti due ipotesi: 1) ogni campione di materiale ferromagnetico è formato da un gran numero di piccole regioni, dette domini, ognuna delle quali è spontaneamente magnetizzata con una intensità di magnetizzazione all'incirca uguale a quella di saturazione ; 2) entro ogni dominio la magnetizzazione spontanea è sostenuta dalla esistenza di un campo molecolare molto intenso responsabile dell'allineamento dei momenti magnetici atomici. L'evidenza sperimentale dell'esistenza dei domini magnetici è stata ottenuta cospargendo con polveri molto sottili magnetizzabili o con soluzioni contenenti particelle magnetizzabili la superficie di campioni di materiali ferromagnetici opportunamente preparati e osservando al microscopio le figure formate dalle polveri e i loro mutamenti al variare della magnetizzazione. Si è così trovato che i domini di Weiss hanno dimensioni lineari molto piccole, comprese tra 10-2 e 10-6 cm, ma tali comunque da contenere un gran numero di atomi. In ogni dominio l'intensità di magnetizzazione, che come abbiamo detto è quasi uguale al valore di saturazione, è orientata preferenzialmente in direzioni correlate agli assi del cristallo; queste direzioni vengono chiamate direzioni di facile magnetizzazione. Poiché ogni dominio può presentare differenti direzioni di facile magnetizzazione si ha che in un materiale nello stato smagnetizzato in ogni dominio il vettore magnetizzazione ha un diverso orientamento ed è per questo motivo che globalmente il materiale presenta una magnetizzazione risultante nulla (Fig. 10.5a). L'applicazione di un debole campo magnetico produce l'espansione, a spese di domini confinanti, di quei domini che hanno il momento magnetico con una componente parallela al campo (Fig. 10.5b). Questo movimento dei confini FIG. 10.5 - Magnetizzazione di un materiale ferromagnetico; a) materiale magnetizzato; b) magnetizzazione per deformazione dei confini dei domini; c) magnetizzazione per rotazione dei momenti magnetici dei domini 84 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 dei domini è reversibile ed è collegato al tratto lineare della curva 1 di Fig. 9.8 del ciclo di isteresi del materiale. Per campi magnetici più elevati le modificazioni dei confini dei domini divengono irreversibili e per campi magnetici molto intensi si verifica infine una parziale rotazione dei momenti magnetici dei domini (Fig. 10.5c) verso la direzione del campo e la comparsa pertanto di una magnetizzazione di saturazione per tutto il materiale. Ci proponiamo ora di determinare mediante un metodo grafico la dipendenza della magnetizzazione M di un materiale ferromagnetico dal campo magnetico applicato H. A questo scopo al fine di giustificare la magnetizzazione spontanea dei domini assumiamo, seguendo quanto fu suggerito da Weiss, che il campo molecolare in luogo della (10.6) sia invece dato dalla relazione: Hm=H+γM (10.44) con H campo macroscopico e γ una costante detta costante di Weiss. Il termine γM della (10.44) rappresenta l'effetto di interazione esistente tra i dipoli magnetici atomici di un singolo dominio, responsabile della tendenza all'allineamento quasi totale. La costante γ, che per le sostanze paramagnetiche come abbiamo visto ha un valore uguale a 1/3, per i materiali ferromagnetici presenta un valore assai elevato compreso tra 103 e 104. Non è possibile tuttavia giustificare un valore così elevato del campo interno γM sulle basi della fisica classica ed infatti esso fu spiegato da Heisenberg nel 1928 applicando la meccanica quantistica. Noi ci limiteremo ad accettare la validità della (10.44) senza cercare di determinarne l'origine. Considerando ora un campione di materiale costituito da N molecole per unità di volume, tutte dello stesso tipo e dotate di momento magnetico proprio m0, avremo, sulla base di quanto dimostrato nel paragrafo precedente, che la magnetizzazione M del materiale, tenendo conto della (10.39), è data da: (10.45) Dalla (10.44) si ha inoltre che: (10.46) Ricordando che y = m0 μ0 H m , questa espressione si può scrivere nella forma: KT (10.47) Se tracciamo in un unico grafico, come mostrato in Fig. 10.6, la (10.45) e la (10.47) in funzione della variabile y possiamo determinare dall'intersezione 10.5] IL FERROMAGNETISMO E LA LEGGE DI CURIE-WEISS 85 FIG. 10.6 - Soluzione grafica delle equazioni (10.45) e (10.47): (a) è la funzione Nm0 L(y) ; (b) nel caso T<0, H ≠ 0; (c) nel caso T<0, H = 0; la temperatura nei casi (a) e (b) è la stessa; (d) nel caso T=0, H = 0. delle due curve il valore della magnetizzazione M del materiale relativo al campo magnetico applicato. La (10.47) in particolare è rappresentata nel grafico da una retta di coefficiente angolare: (10.48) che incontra l'asse delle ordinate nel punto - H/γ. Come risulta dalla (10.48) il coefficiente angolare della retta (10.47) è direttamente proporzionale alla temperatura del materiale. Se aumentiamo o diminuiamo il campo magnetico H mantenendo costante la temperatura, la retta (10.47) si sposta nel grafico rispettivamente verso destra o verso sinistra rimanendo tuttavia sempre parallela a se stessa. Per H uguale a zero la retta passa per l'origine delle coordinate (linea c di Fig. 10.6) ed il punto di intersezione tra le due curve in questo caso fornisce il valore della magnetizzazione residua del materiale per quella data temperatura. Consideriamo ora la retta passante per l'origine, limitiamoci cioè al caso in cui H = 0, ed aumentiamo la temperatura del campione. Il coefficiente angolare della retta all'aumentare della temperatura aumenta fino a che per un dato valore di T la retta risulta tangente nell'origine alla curva Nm0L(y). In questa situazione (linea d di Fig. 10.6) non esiste un punto di intersezione tra le due curve e pertanto il campione considerato non presenta più una magnetizzazione residua. Il coefficiente angolare relativo al valore della temperatura, indicata con 0, per la quale si verifica quanto detto, vale: (10.49) 86 ORIGINE ATOMICA DELLE PROPRIETÀ MAGNETICHE [CAP. 10 ossia per la (10.48) e le (10.39) e (10.40): (10.50) e quindi: (10.51) La temperatura 0 prende il nome di temperatura di Curie ed è caratteristica del materiale in esame. Al di sopra della temperatura di Curie, come detto, il materiale non presenta più magnetizzazione residua e perde quindi le sue caratteristiche ferromagnetiche per comportarsi come un materiale paramagnetico. Per il tratto lineare nella (10.45) abbiamo visto che si può scrivere: (10.52) Sostituendo ad Hm la (10.44) si ha che: (10.53) da cui si ricava: (10.54) e per la (10.51): (10.55) Da questa espressione si deduce che la suscettività magnetica del materiale è : (10.56) Arriviamo così a concludere che i materiali ferromagnetici al di sopra della temperatura di Curie si comportano come sostanze paramagnetiche con la sola 10.5] IL FERROMAGNETISMO E LA LEGGE DI CURIE-WEISS 87 differenza che al posto della temperatura T bisogna considerare la temperatura (T - 0). La temperatura di Curie per il ferro e le sue leghe è compresa tra 700 e 1300 °K. Ponendo nella (10.51) m0 uguale ad un magnetone di Bohr e cioè 9,27⋅ 10-24 ampere⋅m2, il numero N di atomi di ferro per metro cubo uguale a 8⋅5⋅10+28 m-3, e K= 1,38⋅10-23 joule/grado, si ottiene che γ ~ 4θ. Per cui prendendo θ= 800 °K abbiamo che γ = 3200, confermando così l'elevato valore che per essa avevamo già preannunciato. 11 L'induzione elettromagnetica 11.1 Introduzione Gli esperimenti condotti da Oersted, Ampère ed altri avevano mostrato come fosse possibile produrre effetti magnetici mediante fenomeni elettrici. Non si aveva invece alcuna prova che valesse anche l'opposto e cioè che fenomeni magnetici potessero generare effetti elettrici. Fu Faraday che nel 1831 compì l'importante scoperta che doveva completare la connessione tra elettricità e magnetismo osservando come una variazione di flusso di campo magnetico fosse in grado di indurre una corrente in un circuito conduttore. Questa scoperta non solo fu fonte di notevoli applicazioni pratiche quali ad esempio quelle dei generatori e dei trasformatori ma, introducendo il principio che ad ogni campo magnetico variabile è associato un campo elettrico, risultò fondamentale per la formulazione della teoria del campo elettromagnetico di cui ci occuperemo in dettaglio nel capitolo 13. In questo capitolo illustreremo la formulazione della legge di Faraday sull'induzione elettromagnetica e le sue principali conseguenze. 11.2 La legge dell'induzione elettromagnetica Se, ripetendo uno dei primi esperimenti di Faraday, avviciniamo un magnete ad un circuito, in cui sia inserito uno strumento per misurare deboli intensità di corrente, quale un galvanometro, notiamo che questo rivela un passaggio di corrente che permane fintantoché il magnete è in movimento rispetto al circuito. La corrente che fluisce nel circuito prende il nome di corrente indotta ed il fenomeno viene chiamato induzione elettromagnetica. 90 L'INDUZIONE ELETTROMAGNETICA [CAP. 11 Il medesimo effetto può essere prodotto muovendo il circuito rispetto al magnete tenuto fermo, oppure avvicinando al circuito invece di un magnete una bobina percorsa da corrente o tenendo fissi il magnete o la bobina e deformando il circuito. È possibile infine ottenere una corrente indotta nel circuito ponendo accanto a questo una bobina percorsa da corrente e facendone variare l'intensità. L'insieme di tutte queste osservazioni si trova raccolto in due leggi ; la prima, formulata nel 1845 da Neumann, e nota come legge di Faraday-Neumann, afferma che: quando il flusso del vettore induzione magnetica B concatenato con un circuito varia nel tempo, nel circuito si induce una forza elettromotrice proporzionale alla variazione del flusso. La seconda, dovuta a Lenz, si enuncia invece nel modo seguente: ogni variazione in un sistema magnetico produce un'azione che tende ad opporsi alla variazione stessa. Se consideriamo allora un circuito indeformabile e indichiamo con Φ (B) il valore istantaneo del flusso ad esso concatenato del vettore induzione magnetica troviamo che le due leggi sono espresse dall'equazione: (11.1) La quantità è chiamata forza elettromotrice indotta e come può facilmente dimostrarsi ha le dimensioni di un potenziale elettrico. La sua unità di misura nel sistema M.K.S. è pertanto il volt che, come del resto già sappiamo, risulta eguale a un weber/secondo. Disponendo di uno strumento per la misura di differenze di potenziale come l'elettrometro, aprendo il circuito e collegando gli estremi ai morsetti dello strumento, potremmo effettivamente misurare il valore della forza elettromotrice indotta dalla variazione del flusso magnetico. Assunto inoltre che la resistenza del circuito sia R, applicando la legge di Ohm, si ha che l'intensità della corrente indotta è data da: (11.2) Il segno meno che compare nella (11.1) è conseguenza della legge di Lenz. Si può provare infatti che la corrente indotta dalla forza elettromotrice (11.1) fluisce nel circuito in un verso tale da opporsi alla variazione del flusso del vettore B che la produce. Prendiamo per esempio in considerazione il circuito C di Fig. 11.1. Se il flusso del vettore B, prodotto ad esempio da un vicino magnete e concatenato con il circuito, ha la direzione indicata nella figura e noi operiamo in modo da ottenere un suo aumento, avvicinando il magnete, 11.2] LA LEGGE DELL'INDUZIONE ELETTROMAGNETICA 91 FIG. 11.1 - Applicazione della legge di Lenz. La curva tratteggiata rappresenta una linea di forza del campo magnetico generato dalla corrente indotta in C da un aumento del flusso di B. allora nel circuito, per la legge 11.1, si genera una forza elettromotrice la quale induce in C una corrente che per la legge di Lenz deve avere il verso indicato in figura. La corrente indotta a sua volta, per la prima formula di Laplace, è sorgente di un campo B diretto in verso opposto a quello iniziale e che, sottraendosi a questo, tende ad annullare l'incremento del flusso e quindi ad opporsi alla variazione che lo ha prodotto. Un ragionamento analogo vale nel caso in cui nel circuito C si produca una diminuzione dal flusso di B prendendo naturalmente per la corrente indotta il verso opposto e facendo attenzione che ora il campo da questa generato si somma con il campo iniziale. Ricordando le definizioni: (11.3) e (11.4) e sostituendo nella legge (11.1) si trova: (11.5) Per un circuito indeformabile e stazionario possiamo portare la derivata rispetto al tempo sotto il segno di integrale dove diviene una derivata parziale. Applicando inoltre all'integrale di sinistra della (11.5) il teorema di Stokes si ha: (11.6) 92 L'INDUZIONE ELETTROMAGNETICA [CAP. 11 Poiché S è una superficie arbitraria che ha per contorno la linea C del circuito, dalla (11.6), che deve valere per qualunque superficie appoggiata su C, si ottiene: (11.7) Questa espressione rappresenta la forma differenziale della legge di Faraday-Neumann sull'induzione elettromagnetica ed ha una validità molto più generale della (11.1). Infatti per essa possiamo affermare che in ogni regione dello spazio, sia essa vuota o contenga materiali dielettrici o conduttori, ove si abbia un campo magnetico variabile nel tempo si ha anche un campo elettrico non conservativo. 11.3 Flusso tagliato e flusso concatenato È importante notare come la equazione (11.1) rappresenti una legge sperimentale indipendente non deducibile da altre leggi. Tuttavia esiste un caso speciale, quello del flusso tagliato di B, in cui la forza elettromotrice indotta può essere dedotta mediante la forza di Lorentz e la conservazione dell'energia. Diciamo di essere in presenza di flusso tagliato ogni qualvolta un circuito si muove in una regione ove esiste un campo magnetico o quando una sorgente di campo magnetico è messa in moto rispetto al circuito. Consideriamo come esempio un circuito chiuso formato da una sbarra conduttrice in moto su due guide anch'esse conduttrici e poste a distanza l. Il circuito sia alimentato da un generatore di forza elettromotrice continua 0 e la sbarra si muova, mantenendo il contatto elettrico con le guide, in una regione ove esiste un campo magnetico uniforme diretto perpendicolarmente al piano contenete il circuito, come mostrato in Fig. 11.2. FIG. 11.2 - Sbarra conduttrice in moto. Nella sbarra fluisce una corrente che ad un dato istante ha un valore I e quindi su essa agisce una forza F = IBl risultante delle forze di Lorentz operanti sugli elettroni costituenti la corrente. Per azione della forza F la sbarra subisce una accelerazione e supponendo che in un certo istante sia v la sua velocità abbiamo che il lavoro compiuto su essa nell'unità di tempo è Fv. Questo 11.3] FLUSSO TAGLIATO E FLUSSO CONCATENATO 93 lavoro è compiuto dal generatore che quindi, indicando con R la resistenza del circuito, fornisce una potenza: (11.8) Da questa espressione si ricava che la corrente I è inferiore al valore I0 = 0/R che si avrebbe nel caso in cui la sbarra fosse fissa. Dividendo la (11.8) per RI otteniamo : (11.9) da cui deduciamo che la variazione di corrente è uguale a: (11.10) Arriviamo così a determinare che sul circuito opera, oltre alla forza elettromotrice 0, anche una forza elettromotrice Fv che tende a far circolare I corrente in verso opposto a quello della corrente prodotta da scrivere che: 0. Possiamo allora (11.11) dove il segno meno sta ad indicare che la forza elettromotrice forza elettromotrice 0. è opposta alla Dato poi che F=IlB si trova che: (11.12) e, poiché lds è uguale all'area da spazzata nell'unità di tempo dalla sbarra, la (11.12) diviene infine: (11.13) dr che è proprio l'espressione della forza elettromotrice derivante dalla legge di Faraday-Neumann. Il caso del flusso concatenato si ha quando sia il circuito in cui si induce la corrente sia il circuito sorgente del campo magnetico sono fissi ed indeformabili e la variazione del flusso è dovuto a variazioni di corrente. In questo caso la legge di Faraday-Neumann non è più giustificabile mediante la forza di Lorentz ma esprime qualche cosa di completamente nuovo. 94 L'INDUZIONE ELETTROMAGNETICA 11.4 [CAP. 11 Autoinduttanza Prendiamo in esame un circuito rigido isolato stazionario percorso da corrente e consideriamo il flusso del campo magnetico generato dalla corrente e concatenato con lo stesso circuito. Il flusso magnetico dipende dalla geometria del circuito e dal valore della corrente e pertanto la sua variazione, se il circuito è indeformabile, è dovuto alla variazione della corrente. Abbiamo cosi: (11.14) La quantità dΦ/dI è una costante caratteristica del circuito e se il flusso è direttamente proporzionale alla corrente è uguale a Φ/I. Si definisce autoinduttanza del circuito il rapporto: (11.15) Per la (11.14) e (11.15) la legge (11.1) diviene: (11.16) L'unità di misura dell'autoinduttanza nel sistema M.K.S. è denominata henry. Dalla (11.15), tenendo conto che l'unità di misura del flusso di B è il weber e quello della intensità di corrente è l'ampere, deriva che: Un circuito pertanto ha autoinduttanza di un henry quando, essendo concatenato da un flusso di induzione magnetica di un weber, in esso fluisce una corrente di un ampere. Come applicazione pratica della (11.15) calcoliamo il valore dell'autoinduttanza di un solenoide di lunghezza l costituito da N spire per unità di lunghezza percorse da una corrente I. Supponendo che le dimensioni del solenoide siano tali da poter applicare l'approssimazione di solenoide infinito, per il teorema della circuitazione di Ampère si ottiene per il vettore induzione magnetica il valore: B = μ0NI. (11.17) II flusso concatenato con ciascuna spira di superficie S del solenoide è: Φ = μ0N I S (11.18) 11.4] AUTOINDUTTANZA ed il flusso totale concatenato con tutte le NI spire vale: Φ = μ0N2 I l S. Per la (11.15) troviamo così che l'autoinduttanza del solenoide è: L = μ0 N2 l S. 95 (11.19) (11.20) Prendendo N = 104 m-1, l = 0,1 m, S = π(10-2)2 m2 si ottiene una bobina con un valore di autoinduttanza di circa 4 ⋅ 10-3 henry. Un altro esempio interessante, anche per le applicazioni pratiche nel campo delle trasmissioni delle radiofrequenze, è quello del sistema formato da due cilindri coassiali conduttori di raggi a e b con a < b, come mostrato in Fig. 11.3. FIG. 11.3 - Cilindri conduttori coassiali. Sul cilindro conduttore interno scorre in ogni punto una corrente I mentre sul conduttore esterno scorre una corrente di modulo uguale ma di verso opposto. Se consideriamo una circonferenza di raggio r, avvolta intorno al conduttore interno, con a < r < b, e calcoliamo lungo essa la circuitazione del vettore B, tenendo conto che le linee di forza in questo caso sono circonferenze con centro sull'asse del cilindro interno, si ha che: (11.21) Lo stesso calcolo eseguito lungo una circonferenza di raggio r >b, esterna cioè al secondo conduttore, dà come risultato che il vettore B in punti esterni ai due cilindri coassiali è dovunque nullo poiché la circonferenza concatena due correnti di modulo uguale ma di verso opposto. Il flusso di B attraverso la superficie S indicata in Fig. 11.3 vale: (11.22) dove a B si è sostituita l'espressione (11.21). Dalla (11.15) si determina quindi 96 L'INDUZIONE ELETTROMAGNETICA [CAP. 11 che l'induttanza per unità di lunghezza del sistema dei due cilindri è: (11.23) 11.5 Mutua induttanza Al posto di un unico circuito isolato consideriamo ora il caso di n circuiti ognuno percorso da corrente. Se allora indichiamo con Φij il flusso del vettore B concatenato con l'i-esimo circuito prodotto dalla j-esimo circuito, possiamo scrivere che il flusso totale concatenato con l'i-esimo circuito è: (11.24) La forza elettromotrice indotta sull'i-esimo circuito è pertanto data da: (11.25) Se ogni circuito è indeformabile in modo che, come già detto nel precedente paragrafo, le variazioni di flusso siano dovute solo a variazioni di correnti, la (11.25) si può anche scrivere nella forma: (11.26) Qualora il flusso dipenda linearmente dalla corrente, come è usuale che avvenga in assenza di mezzi non lineari, le quantità dΦij /dIj sono uguali a Φij /dIj e risultano costanti indipendenti dalla corrente. Si definisce mutua induttanza tra l'i-esimo ed il j-esimo circuito il rapporto : (11.27) mentre la quantità dΦij /dIi rappresenta l'autoinduttanza dell'i-esimo circuito come è stata definita nel paragrafo precedente. Nel caso che il flusso dipenda linearmente dalla corrente, dalla (11.27) discende che: Φij = IjMij (11.28) e cioè che il flusso concatenato con l'i-esimo circuito dovuto al campo magnetico prodotto dall'j-esimo è proporzionale alla corrente Ij che fluisce in quest'ultimo tramite il loro coefficiente di mutua induttanza Mij. 11.6] L'ENERGIA MAGNETICA 97 È possibile dimostrare che per i coefficienti di mutua induzione vale la relazione Mij = Mji, e cioè che l'interazione tra due circuiti è la stessa sia che uno di loro venga considerato come sistema attivo sia che esso venga considerato come sistema passivo. Per provare quanto detto limitiamoci a considerare due soli circuiti e ricordiamo che l'energia potenziale W di un circuito di superficie S percorso da corrente I posto in un campo magnetico B, può essere scritta, introducendo il momento magnetico dm = In da, nella forma: (11.29) L'energia potenziale del primo circuito dovuta al campo prodotto dal secondo è allora: W1 = -I1Φ12 = -I1I2 M12 (11.30) dove si è tenuto conto che, per la (11.28), Φ12 = I2 M12 D'altra parte l'energia potenziale del secondo circuito dovuta al campo prodotto dal primo è: (11.31) Dato che W1 è uguale a W2, eguagliando la (11.30) alla (11.31), arriviamo così a dimostrare che M12 = M21. 11.6 L'energia magnetica In questo paragrafo vogliamo fare qualche breve considerazione sull'energia necessaria per produrre un campo magnetico di determinato valore in una regione dello spazio. A tale scopo ci serviremo di un esempio del tutto particolare per poi estrapolare il risultato ottenuto al caso generale. Consideriamo un solenoide di lunghezza l e sezione S costituito da N spire di filo conduttore per unità di lunghezza e sia R la resistenza totale dell'avvolgimento. Se gli estremi del solenoide sono collegati ai poli di un generatore di forza elettromotrice 0 nelle spire fluisce una corrente I. Sul solenoide per effetto della variazione del flusso del campo magnetico, inizialmente nullo, agisce una forza elettromotrice indotta S. La legge di Ohm relativa al sistema assume pertanto la forma: (11.32) Poiché = -dΦ (B)/dt la (11.32) diviene: (11.33) 98 L'INDUZIONE ELETTROMAGNETICA [CAP. 11 Durante un tempo dt attraverso il circuito passa una quantità di carica dq = I dt ed il generatore conseguentemente compie un lavoro: dW = 0I dt = Id Φ + RI2dt. (11.34) Integrando questa espressione dall'istante iniziale t = 0, quando la corrente e il campo magnetico nel solenoide sono nulli, ad un istante generico t1; al quale corrisponde una data corrente I1 e un dato campo magnetico B1; abbiamo: (11.35) È facile riconoscere che il secondo termine a destra della (11.35) rappresenta l'energia fornita dal generatore e dissipata in calore per effetto Joule dall'istante iniziale fino all'istante t1. Il primo termine fornisce invece il lavoro Wm che il generatore ha compiuto contro la forza elettromotrice indotta per portare la corrente dal valore iniziale nullo al valore I1. La variazione di flusso concatenato con le Nl spire del solenoide supposte rigide è uguale a: dΦ = N l S dB. (11.36) In un solenoide per il quale vale l'approssimazione di solenoide infinito, si ha B = μ0 N I e quindi: (11.37) Sostituendo la (11.36) e la (11.37) nel primo integrale della (11.35) troviamo che il lavoro compiuto dal generatore contro la forza elettromotrice indotta risulta: (11.38) L'energia Wm fornita dal generatore 0 viene quindi utilizzata per creare un campo magnetico di valore B1 all'interno del solenoide. Possiamo immaginare così che questa energia, che chiameremo energia magnetica, si trovi localizzata ove il campo B è diverso da zero, e cioè all'interno del solenoide. Essa sarà disponibile per essere trasformata in altre forme di energia. Dato poi che lS rappresenta il volume occupato dal solenoide, appare logico supporre che tale energia magnetica sia distribuita all'interno del solenoide in maniera uniforme; essa avrà quindi una densità volumetrica: (11.39) avendo utilizzato la relazione B = μ0H. 11.6] L'ENERGIA MAGNETICA 99 Il risultato a cui siamo pervenuti con la (11.38) e la (11.39), anche se dedotto per un caso particolare, è del tutto generale ed applicabile a qualunque problema di magnetismo. Possiamo così affermare che l'energia necessaria per generare un campo magnetico B in una regione di volume V è in generale data da : (11.40) e che questa energia, sotto forma di energia magnetica, si trova distribuita nel volume V con una densità data dalla (11.39). L'espressione (11.39) resta valida anche nel caso in cui si sia in presenza di mezzi materiali, purché siano lineari, avendo supposto che il flusso di B è linearmente proporzionale alla corrente. Per un materiale isotropo lineare di permeabilità magnetica μ. essa si riduce alla forma: (11.41) Può essere inoltre interessante vedere come l'energia magnetica immagazzinata in un avvolgimento, quale ad esempio il solenoide già preso in considerazione all'inizio di questo paragrafo, possa essere espressa in funzione del valore dell'autoinduttanza. Nella (11.32) la frazione di energia erogata dal generatore e immagazzinata sotto forma di energia magnetica è data dall'integrale: (11.42) Per la (11.15) sappiamo inoltre che dΦ = Ld I, per cui: (11.43) Più in generale, prendendo spunto dal risultato della (11.43), possiamo dire che l'energia magnetica spesa in un circuito di autoinduttanza L per portare la corrente dal valore zero ad un dato valore I è uguale al semiprodotto del quadrato dell'intensità di corrente per l'autoinduttanza del circuito, cioè: (11.44) 12 Circuiti in corrente continua ed alternata 12.1 Introduzione Una rete o circuito elettrico consiste in un insieme di conduttori e generatori di forze elettromotrici collegati tra loro allo scopo di trasferire dell'energia elettrica da un punto ad un altro. Per quanto riguarda quello che esporremo in questo capitolo, assumeremo che l'energia fornita dai generatori al sistema o venga dissipata per effetto Joule oppure venga immagazzinata sotto forma di energia elettrica e magnetica. Nel caso di correnti variabili nel tempo(1) considereremo quindi trascurabile qualunque perdita di energia per irraggiamento elettromagnetico, che d'altra parte diviene significativa solo a frequenze sufficientemente alte o per sistemi appositamente progettati. Questa ultima ipotesi risulta in effetti di importanza rilevante in quanto ci permette di elaborare per i circuiti elettrici una teoria basata su concetti integrali, come il potenziale, la corrente, il flusso magnetico, la carica in luogo del campo elettrico, della densità di corrente, del campo magnetico, della densità di carica e di rappresentare così i conduttori facenti parte di un circuito mediante grandezze macroscopiche come la resistenza, la capacità e l'induttanza senza essere obbligati ad introdurre le loro proprietà microscopiche. Verranno analizzati circuiti risultanti dalla combinazione di generatori di forze elettromotrici costanti o variabili nel tempo, i cosiddetti elementi attivi, (1) In molti testi questa limitazione viene introdotta accennando al fatto che la teoria sviluppata resta valida solo nel caso di fenomeni lentamente variabili nel tempo. Affermazioni di questo genere appariranno più chiare dopo la lettura del Capitolo 13. 102 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 e di resistori, condensatori o induttori, gli elementi passivi, che supporremo concentrati in determinati punti del circuito e collegati tra loro, nella maniera più varia ma sempre in modo da formare cammini chiusi, mediante fili conduttori la cui resistenza verrà considerata nulla. I componenti fisici reali di un circuito saranno rappresentati mediante elementi ideali, intendendo come tali degli elementi caratterizzati unicamente dalla grandezza attinente al loro nome particolare. Questo significa per esempio che un resistore sarà caratterizzato solo dal valore della sue resistenza, un capacitore solo dal valore della sua capacità, un induttore solo dal valore della sua induttanza. Se vorremo tener conto del fatto che un resistore reale presenta oltre che una certa resistenza anche un piccolo valore di capacità ed induttanza dovremo considerare nello schema del circuito non soltanto un resistore ma anche un induttore ed un capacitore collegati tra loro in modo opportuno. Come ultima restrizione va ricordato che supporremo i valori delle resistenze, induttanze e capacità costanti, e che pertanto per tutti gli elementi dei circuiti verrà assunto un comportamento lineare. Dal paragrafo 12.2 al paragrafo 12.7 tratteremo solamente problemi riguardanti correnti continue e saremo quindi interessati a circuiti formati unicamente da resistori ideali e da generatori di forze elettromotrici costanti. Nei paragrafi successivi affronteremo invece problemi relativi a situazioni variabili nel tempo e in particolare a circuiti percorsi da correnti alternate. 12.2 Generatori di tensione e di correnti costanti Si definisce generatore ideale di tensione una sorgente capace di fornire una differenza di potenziale costante, uguale alla sua forza elettromotrice, indipendentemente dalla corrente che circola nel circuito interposto tra i suoi poli. Questo tipo di sorgente viene detto ideale perché, come abbiamo visto nel paragrafo 7.9, ogni generatore reale presenta un comportamento assai diverso. Sappiamo infatti che la differenza di potenziale (1) ai terminali di un generatore di forza elettromotrice I, è uguale a: 0 e di resistenza interna r, quando esso eroga una corrente (12.1) Appare allora evidente che un generatore reale può essere schematizzato come un generatore ideale di tensione con una resistenza r in serie, come è rappresentato in Fig. 12.1a). Dalla (12.1) risulta inoltre che la differenza di potenziale tra i poli del generatore coincide con la sua forza elettromotrice solo nel caso in cui I = 0, cioè solo a circuito aperto. Per un'analisi delle reti resistive è importante introdurre un ulteriore concetto, cioè quello di generatore ideale di corrente. Si chiama generatore ideale di corrente (1) In questo capitolo, come in quello sulle correnti continue, indicheremo il potenziale con il simbolo V e la differenza di potenziale con Δ V. 12.3] LE LEGGI DI KIRCHHOFF 103 FIG. 12.1 - Rappresentazione di un generatore di forza elettromotrice £0. a) come un generatore di tensione costante b) come un generatore di corrente costante. una sorgente capace di fornire una corrente costante indipendentemente dalla differenza di potenziale esistente tra i suoi estremi. Assunta questa definizione è possibile dimostrare che un generatore reale di forza elettromotrice 0 e resistenza interna r è equivalente a un generatore ideale di corrente I0 = 0/r in parallelo con una resistenza r, secondo lo schema di Fig. 12.1 b). Immaginando infatti di inserire tra i terminali del generatore di corrente I0 un carico, che lasciamo completamente indeterminato, nel quale circoli una corrente I, in base allo schema di Fig. 12.1 b) si ha, dato che la corrente I0 fornita dal generatore si ripartisce proporzionalmente tra r ed il carico esterno, che la differenza di potenziale tra gli estremi del generatore risulta: ΔV = (I0 - I) r. (12.2) Nel caso di circuito aperto, quando cioè I = 0, si ha che ΔV=I0r = Possiamo così scrivere la (12.2) nella forma: 0. (12.3) identica alla (12.1). Negli esempi che saranno presentati nei paragrafi seguenti considereremo i generatori sempre come generatori ideali e assumeremo che la resistenza interna corrispondente ad ogni generatore sia rappresentata da una elemento della rete anche se non verrà esplicitamente indicato come tale. 12.3 Le leggi di Kirchhoff Prima di affrontare il problema riguardante le reti resistive vogliamo dare la definizione di tre termini di cui faremo frequente uso in seguito. Chiameremo nodo un punto di connessione tra tre o più elementi della rete, ramo l'insieme degli elementi collegati in serie posti tra due nodi, e infine maglia un percorso chiuso formato da elementi della rete. Nel circuito di Fig. 12.2, per esempio, i punti 104 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 A, B, C e D sono dei nodi, gli elementi compresi tra A e D formano un ramo, mentre il percorso chiuso ACDA costituisce una maglia. L'analisi di una rete resistiva consiste nella determinazione dei valori delle correnti che attraversano tutti i singoli elementi che la compongono o ugualmente nella determinazione delle differenze di potenziale esistenti tra gli estremi degli stessi elementi. In generale tale analisi, sia per le complesse connessioni che si possono verificare tra i resistori sia per l'esistenza di generatori di forze elettromotrici in punti diversi della rete, non può essere condotta semplicemente scomponendo la rete nei suoi elementi in serie e in parallelo, ma deve necessariamente fare ricorso ad un metodo più sistematico basato su un opportuno insieme di equazioni per le correnti o per le tensioni incognite. Il metodo è chiamato metodo di Kirchhoff e si fonda su due leggi dette leggi di Kirchhoff. Tali leggi, note rispettivamente come legge dei nodi e legge delle maglie, si enunciano nella seguente maniera: 1 ) La somma delle intensità delle correnti entranti in un nodo è uguale alla somma delle intensità delle correnti uscenti dallo stesso nodo. 2) La somma algebrica (nel senso che verrà precisato) delle forze elettromotrici contenute in una maglia, è uguale alla somma delle differenze di potenziale ai capi di ciascuno degli elementi della maglia. Più in particolare possiamo dire che la prima legge esprime il principio della continuità della corrente, e cioè che le cariche non si creano e non si distruggono, e che la seconda rappresenta la natura conservativa del campo elettrostatico, e cioè che la variazione totale del potenziale su un cammino chiuso è uguale a zero. Partendo da queste due leggi esistono differenti maniere per scrivere il sistema di equazioni atto a determinare le incognite del problema. Noi illustreremo successivamente, utilizzando sempre lo stesso circuito come esempio, tre metodi distinti, quello delle correnti dei rami, quello delle correnti delle maglie ed infine quello delle tensioni dei nodi. 12.4 II metodo delle correnti dei rami Il metodo delle correnti dei rami consiste, assegnato ad ogni singolo ramo un simbolo ed una direzione per la corrente e fissato un verso di percorrenza per le maglie, nel ricavare dalle leggi di Kirchhoff due sistemi di equazioni per le correnti. Per illustrarne l'applicazione utilizzeremo l'esempio di Fig. 12.2, dove abbiamo indicato con l1, I2,..., I6 le correnti incognite dei rami e abbiamo scelto per tutte le maglie come verso di percorrenza quello antiorario. L'applicazione della prima legge di Kirchhoff ai nodi A, B, C e D del circuito di Fig. 12.2 fornisce rispettivamente le seguenti relazioni: (a) I1=I3 + I5 (b) I2=I3 + I6 (c) I5=I4 + I6 (d) I1=I2 + I4 12.3] IL METODO DELLE CORRENTI DEI RAMI 105 L'applicazione della seconda legge di Kirchhoff richiede qualche ulteriore considerazione. Innanzitutto nello scrivere le equazioni per ogni maglia bisogna fare attenzione a prendere la caduta di potenziale RI ai capi di ogni resistore con il segno positivo o negativo a seconda che la corrente del ramo percorra il resistore in verso concorde o discorde a quello scelto come verso di percorrenza della maglia. Se il valore di una corrente di ramo risulta avere, alla fine del calcolo, segno negativo significa che la corrente circola in quel ramo in verso opposto a quello scelto inizialmente. In secondo luogo bisogna ricordare che FIG. 12.2 - Rete resistiva. Analisi mediante le correnti dei rami. le forze elettromotrici vanno considerate con segno positivo o negativo a seconda che esse tendano a fare circolare la corrente nello stesso verso o in verso opposto a quello scelto come verso di percorrenza delle maglie. Sono da considerarsi così con segno positivo le forze elettromotrici che, seguendo il verso di percorrenza fissato per le maglie, vengono attraversate passando lungo il circuito dal polo negativo a quello positivo dei rispettivi generatori. Tenuto conto di quanto detto, abbiamo allora che la seconda legge di Kirchhoff fornisce per la maglia ADCA la relazione: (A D C A) Il Rl+I5 R5 + I4 R4.= - (12.5a) 1 e per le altre maglie: (A C B A) I3 R3 - I5 R5 - I6R6 = 0 (12.5b) (C D B C) I2R2 – I4R4 + I6R6 = 2 (A D B A) IlRl + I2R2 + I3R3=- 1+ (A D B C A) I1R1+I2R2 + I5R5 + I6R6= - (12.5c) (12.5d) 2 1+ 2 (12.5e) 106 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA (A C D B A) I2R2 + I3R3 - I4R4 - I5R5= 2 (A D C B A) I1Rl + I3R3 + I4R4 - I6R6= - 1 [CAP. 12 (12.50) (12.5g) Esaminando le equazioni dei sistemi (12.4) e (12.5) è facile constatare come esse non siano tutte indipendenti tra loro. Si vede per esempio che dalle equazioni (12.4) risulta essere (a) = (b) - (c) + (d) e che dalle equazioni (12.5) risulta essere (a) + (b) + (c) = (d). È possibile infatti dimostrare che in generale per una rete resistiva il numero di equazioni indipendenti per i nodi è (Nn - 1), dove Nn rappresenta il numero di nodi della rete, e che il numero di equazioni indipendenti per le maglie è uguale al numero Nm di maglie indipendenti della rete (1) Il numero totale di equazioni indipendenti risulta cosi essere (Nm + Nn - 1). D'altra parte, poiché si può anche provare che il numero totale dei rami di una rete resistiva è (Nm + Nn - 1), abbiamo che il numero delle correnti incognite risulta uguale al numero di equazioni indipendenti. Nel caso dell'esempio di Fig. 12.2 il numero dei nodi è 4 ed il numero di maglie indipendenti 3 ; il numero di equazioni indipendenti è allora 6, che coincide con il numero delle correnti incognite dei rami da noi prese in considerazione. 12.5 II metodo delle correnti di maglia Un diverso metodo di analisi di una rete resistiva, che in confronto al metodo delle correnti dei rami esposto nel precedente paragrafo risulta più semplice coinvolgendo un numero di equazioni minore, è quello delle correnti di maglia. Per illustrare l'applicazione di questo metodo riprendiamo in esame il circuito di Fig. 12.2 ed indichiamo con I1; I2 ed I3 le correnti che fluiscono in ciascuna delle tre maglie indipendenti del circuito secondo il verso indicato in Fig. 12.3. Poiché con questa scelta ognuna delle correnti di maglia è sia entrante sia uscente da ciascun nodo che incontra lungo il suo cammino, la prima legge di Kirchhoff risulta automaticamente soddisfatta, con il risultato che per risolvere il problema della determinazione delle correnti incognite in luogo di (Nm + Nn -1) equazioni abbiamo ora a che fare solo con Nm equazioni indipendenti. Per il circuito di Fig. 12.3 si devono considerare al posto delle 6 equazioni che risultavano necessarie applicando il metodo delle correnti di ramo, solamente le seguenti 3 equazioni ricavate dalla seconda legge di Kirchhoff: (A D C A) I1R1 + (I1 - I2) R4 + (I1 - I3) R5 = - (B C D B) (A C B A) I2R2 + (I2 - I1) R4 + (I2 - I3) R6 = I3R3 + (I3 - I1) R5 + (I3 - I2) R6 = 0 1 2 (12.6) (1) Si definisce maglia indipendente una maglia che non sia ottenibile come somma di altre maglie. 12.5] IL METODO DELLE CORRENTI DI MAGLIA 107 FIG. 12.3 - Analisi mediante le correnti di maglia. che si possono anche scrivere: I1 (R1 + R4 + R5) - I2R4 - I3R5 = - 1 - I1 R4 + I2(R2 + R4 + R6) – I3R6 = 2 - I1 R5 + I2R6 + I3(R3 + R5 + R6) = 0 (12.7) Se per semplicità di calcolo poniamo R11 = (R1 + R4 + R5), R22 = (R2 + R4 + R6), R33 = (R3 + R5 + R6), R12 = R21 = - R4, R13 = R31 = - R5 ed R23 = R32 = - R6, il sistema (12.7) può essere scritto in maniera più compatta nella forma: I1 R11 + I2 R12 + I3R13 = - 1 - I1 R21 + I2R22 + I3R23 = 2 (12.7) I1 R31 + I2R32 + I3R33 = 0 Questo sistema può essere risolto operando successive sostituzioni di variabile ma, come è facile riscontrare già nel caso del nostro esempio che è pure tra i più semplici, un tale metodo di soluzione appare estremamente lungo e laborioso; ancora più lo sarebbe per un circuito formato da un numero di maglie indpendenti maggiore di tre. Risulta in generale pertanto più conveniente risolvere il sistema (12.8) mediante la teoria dei determinanti e la regola Cramer. Secondo questa regola, se noi indichiamo con Δ il determinante formato dei coefficienti Rij delle correnti e con Δ sostituendo la colonna i-esima dei coefficienti con la colonna delle forze elettromotrici, si ha che la corrente i-esima è data da (12.9) 108 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 In particolare per il nostro circuito avremo che la corrente I1 risulta uguale a : (12.10) che, ricordando la regola per il calcolo dei determinanti di terzo ordine, diviene : (12.11) dove: (12.12) Analogamente può essere eseguito il calcolo esplicito delle espressioni per le rimanenti correnti, I2 ed I3. Vanno sottolineate alcune caratteristiche generali, che risultano importanti per l'analisi del comportamento delle reti resistive. Innanzitutto va notato come nella relazione (12.11) la corrente I1 risulti una funzione lineare delle forze elettromotrici. Questo significa in altre parole che ogni corrente che fluisce in un ramo o in una maglia della rete è la somma delle correnti che circolerebbero se ogni forza elettromotrice operasse singolarmente. Questa affermazione rappresenta il cosiddetto teorema di sovrapposizione per le reti in corrente continua con forze elettromotrici costanti, ed è una conseguenza della linearità assunta inizialmente per gli elementi singoli della rete. Tale proprietà permette di affrontare l'analisi di una rete anche in modo differente da quello precedentemente seguito. Potremmo cioè risolvere successivamente problemi separati assumendo di volta in volta che solo una delle forze elettromotrici della rete sia diversa da zero, calcolare i valori delle correnti ed ottenere il risultato finale per ciascuna corrente sommando le soluzioni trovate in maniera indipendente. Un'altra importante considerazione consegue dalla osservazione che il determinante A dei coefficienti del sistema (12.8) risulta simmetrico rispetto alla diagonale principale (Rij = Rji). Ricordando che i coefficienti Rij (con i ≠ j) rappresentano gli elementi del circuito in comune tra due maglie possiamo formulare il teorema di reciprocità secondo il quale la corrente prodotta per esempio nella maglia uno da una forza elettromotrice posta nella maglia due è uguale alla corrente prodotta nella maglia due dalla stessa forza elettromotrice posta nella maglia uno. I coefficienti Rij con i ≠ j prendono il nome di mutue resistenze tra la maglia i-esima e j-esima, mentre i coefficienti Rij con i = j, che rappresentano la resistenza totale incontrata dalla i-esima corrente nell'i-esima maglia, prendono il nome di autoresistenze della i-esima maglia. 12.6] 12.6 METODO DEI NODI 109 Metodo dei nodi L'analisi di una rete resistiva può in taluni casi, qualora risulti più semplice, essere compiuta con riferimento ai nodi piuttosto che alle maglie. Per ogni elemento resistivo del circuito sappiamo che vale la legge di Ohm ΔV = RI che, introducendo la conduttanza G =1/R, può anche scriversi nella forma I = ΔVG. Sfruttando questa relazione è possibile eseguire lo studio di una rete considerando differenze di potenziale al posto di correnti, generatori di corrente al posto di generatori di tensione e conduttanze al posto di resistenze. Prendiamo ancora in esame come esempio il circuito utilizzato precedentemente. Tale circuito può essere rappresentato secondo lo schema di Fig. 12.4 FIG. 12.4 - Analisi mediante il metodo della tensione dei nodi. dove abbiamo sostituito ai generatori di tensione opportuni generatori di corrente ed indicato i singoli conduttori della rete invece che con i valori delle loro resistenze mediante i valori corrispondenti delle conduttanze. Poiché hanno significato fisico solo le differenze di potenziale, possiamo assumere il potenziale di uno dei nodi, per esempio il nodo D, come potenziale di riferimento, che per comodità supporremo uguale a zero. Segue immediatamente che la legge di Kirchhoff sulle maglie risulta soddisfatta, mentre dalla legge di Kirchhoff sui nodi è possibile ricavare (Nn - 1) equazioni indipendenti. Per il circuito di Fig. 12.4, comprendente quattro nodi, abbiamo tre equazioni indipendenti. Indicando con V1 V2 e V3 rispettivamente i potenziali dei nodi A, E e C e ricordando che il potenziale in D è stato preso uguale a zero, esse sono: nodo A I01 = V1 G1 + (Vl - V2) G3 + (V1 - V3) G5 nodo B I02 = V2 G2 + (V2 - Vl) G3 + (V2 - V3) G6 nodo C 0 = V3G4 + (V3 - V1) G5 + (V3 - V2) G6 (12.13) 110 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 ovvero : (12.14) È ora possibile mediante il metodo di Cramer ricavare i valori delle tensioni dei nodi e poi risalire tramite la legge di Ohm ai valori delle correnti circolanti in ogni resistore. Generalizzando quanto sopra esposto possiamo dire che per l'analisi di una rete contenete Nn nodi valgono le seguenti regole: a) scegliere innanzitutto un nodo di riferimento rispetto al quale riferire i potenziali di tutti gli altri nodi; b) nell'equazione per un dato nodo il coefficiente del potenziale di quel nodo deve essere la somma delle conduttanze connesse a quel nodo; il coefficiente del potenziale degli altri nodi deve essere sempre negativo e uguale alla conduttanza connessa tra essi ed il nodo in questione; c) la soluzione generale è del tipo: (12.15) dove Δ rappresenta il determinante dei coefficienti del sistema di equazioni per Nn nodi e Δi è il determinante che si ottiene da Δ sostituendo la i-esima colonna con la colonna dei termini noti (le correnti dei generatori) del sistema. 12.7 Il teorema di Thevenin Un teorema in molti casi utile per lo studio dei circuiti resistivi è il teorema di Thevenin. Questo teorema afferma che qualunque combinazione di resistori e di generatori di forze elettromotrici avente due terminali può essere rappresentata in maniera equivalente come un generatore di forza elettromotrice ed una resistenza in serie. Per provare la validità di questo teorema riferiamoci come esempio alla rete del tutto arbitraria di Fig. 12.5a). Immaginiamo che essa sia contenuta in una scatola chiusa da cui escano due terminali attraverso i quali, quando fra essi sia inserito un generico carico, fluisca una corrente I ed esista una differenza di potenziale ΔV. Utilizzando il metodo delle maglie e considerando la differenza di potenziale A V tra i due terminali come un generatore di forza elettromotrice, siamo in grado di determinare il valore della corrente I. Nel paragrafo 12.5, e precisamente con la relazione (12.11), abbiamo visto infatti che in generale ogni corrente è una funzione lineare delle forze elettromotrici contenute nella rete con coefficienti che dipendono dai valori delle resistenze. Immaginiamo allora che la rete in esame sia formata da n forze elettromotrici, 1, 2, ..., , R2,..., Rm, con n ed m qualsiasi, e prendiamo n, e da m resistori di resistenza R1 12.7] FIG. 12.5 IL TEOREMA DI THEVENIN 111 - a) rete resistiva b) circuito equivalente secondo il teorema di Thevenin. ΔV come una caduta di potenziale nel verso scelto per I come positivo, quindi con il segno negativo. Potremo scrivere che: (12.16) dove G1, G2,..., Gn e g sono dei coefficienti che hanno le dimensioni dell'inverso di una resistenza. Risolvendo la (12.16) rispetto a ΔV, otteniamo: (12.17) Se poi poniamo: (12.18) ed: (12.19) la (12.17) diviene : (12.20) che è proprio, come volevamo dimostrare, l'espressione già nota della differenza di potenziale esistente tra i terminali di un circuito formato da un generatore di forza elettromotrice ed una resistenza r in serie, come quello mostrato in Fig. 12.5b). 112 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Una delle applicazioni più importanti del teorema di Thevenin è legata al calcolo della potenza trasferita da un circuito attivo, un circuito cioè contenente forze elettromotrici, ad un carico o ad un circuito passivo, privo cioè di forze elettromotrici. Nel paragrafo 7.10 abbiamo dimostrato come il massimo trasferimento di potenza tra un generatore di resistenza interna r ed un carico di resistenza R si ha quando r = R. Dall'equivalenza, precedentemente dimostrata, della rete di Fig. 12.5a) con quella di Fig. 12.5b), composta da un generatore e da una resistenza r in serie, deriva immediatamente che il massimo trasferimento di potenza dal circuito attivo di Fig. 12.5a) ad un carico R, che potremmo inserire tra i suoi terminali, si ha nel caso in cui r = R. (1) Quando tale condizione è verificata si dice che generatore e carico sono adattati. Questa condizione risulta ancora più importante nei circuiti in corrente alternata dove dall'adattamento tra la resistenza interna del generatore e quella del carico non dipende solo il massimo trasferimento di potenza ma anche, per esempio, la risposta in frequenza e la linearità. 12.8 Fenomeni transitori Finora sono stati considerati circuiti alimentati da forze elettromotrici costanti e formati solamente da resistori. Vogliamo adesso esaminare circuiti alimentati da forze elettromotrici costanti o variabili nel tempo in maniera periodica contenenti, oltre che resistori, anche condensatori ed induttori. Quello che si osserva in circuiti di questo genere è che, indipendentemente dal tipo di forza elettromotrice ad esso applicata, la corrente che si instaura nel circuito presenta sempre inizialmente un comportamento variabile nel tempo, non periodico, detto comportamento transitorio. Solo a partire da un certo istante la corrente assume un comportamento stazionario, e cioè nel caso di circuiti alimentati da generatori di forza elettromotrice costante, la corrente ha un andamento costante, mentre nel caso di circuiti alimentati da generatori di forza elettromotrice variabile nel tempo in modo periodico la corrente ha un andamento periodico analogo. In realtà questa affermazione non è completamente esatta perché, come vedremo, il comportamento stazionario a tutto rigore viene raggiunto dalla corrente solo dopo un tempo infinitamente lungo. Tuttavia, dopo un conveniente intervallo di tempo, è possibile considerare l'andamento della corrente stazionario entro l'approssimazione desiderata. Il problema che si pone a questo punto è di vedere in quale modo debbano essere generalizzate le leggi di Kirchhoff, introdotte nei paragrafi precedenti, per poter essere utilizzate nell'analisi dei circuiti percorsi da correnti variabili nel tempo. Sembra evidente che la prima legge di Kirchhoff, secondo la quale è impossibile che in un punto di un circuito percorso da corrente si formi un accumulo (1) Per generatori con bassa resistenza interna non è possibile assorbire la massima potenza senza danneggiare lo stesso generatore. Questa legge riveste quindi un interesse pratico nel caso di generatori con un'alta resistenza interna. 12.8] FENOMENI TRANSITORI 113 di carica, resti valida qualora venga applicata ai valori delle correnti che fluiscono nel circuito istante per istante. Essa si enuncia allora dicendo che: 1) la somma delle intensità di corrente istantanee entranti in un nodo è uguale alla somma delle intensità di correnti istantanee uscenti dallo stesso nodo. La presenza di condensatori nel circuito non invalida questa affermazione. In effetti sulle due armature di un condensatore si accumulano delle quantità di carica ma esse sono di segno opposto e uguale in modulo per cui non si manifesta alcun eccesso di carica di dato segno. La seconda legge di Kirchhoff riguarda invece la conservazione della energia; essa afferma che la variazione di potenziale lungo una maglia percorsa da corrente deve essere uguale a zero. Se nel circuito sono presenti non solo resistori ma anche condensatori ed induttori l'energia fornita dai generatori di forza elettromotrice non soltanto fa circolare le cariche nei conduttori ma produce anche campi elettrici e magnetici, a causa della presenza dei condensatori e degli induttori. Si ha cosi che l'energia erogata dai generatori è in parte dissipata sotto forma di calore nei resistori ed in parte immagazzinata come energia potenziale in condensatori ed induttori. Una singola carica che compia il percorso chiuso di una maglia del circuito non può presentare, quando torni al punto di partenza, né un guadagno né una diminuzione d'energia. Affinchè allora la variazione totale del potenziale lungo la maglia sia uguale a zero, come espresso dalla seconda legge di Kirchhoff, bisogna considerare non solo le forze elettromotrici e le cadute RI di potenziale ai capi dei resistori ma anche la differenza di potenziale ai capi dei condensatori e degli induttori. Poiché le differenze di potenziale dovute a resistori, condensatori ed induttori, tendono ad opporsi al passaggio delle correnti prodotte dai generatori, le indicheremo genericamente con il termine di forze controelettromotrici. Tenendo conto inoltre del fatto che i valori delle correnti, delle forze elettromotrici e delle forze contro-elettromotrici vanno considerati tutti allo stesso istante, la seconda legge di Kirchhoff si esprime dicendo che: 2) la somma algebrica delle forze elettromotrici istantanee contenute in una maglia è uguale alla somma delle forze controelettromotrici istantanee contenute nella stessa maglia. Per quanto riguarda le modalità con le quali va scelto il segno nelle somme delle forze elettromotrici e controelettromotrici vale quello che è stato detto per i circuiti resistivi in corrente continua e cioè che il segno viene determinato considerando il verso di percorrenza delle maglie scelto a priori. Come esempio di comportamento transitorio consideriamo ora tre semplici circuiti alimentati da generatori di forza elettromotrice costante. 12.8.1 Circuito R-L in serie Sia dato il circuito R-L di Fig. 12.6 alimentato da un generatore di forza elettromotrice costante Per questo circuito la seconda legge di Kirchhoff 114 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 fornisce la relazione, valida ad un generico istante t: (12.21) Il secondo termine a destra di questa espressione rappresenta la differenza di potenziale ai capi dell'induttanza che è uguale alla forza elettromotrice indotta nell'induttanza - LdI/dt cambiata di segno, dato che nella legge di Kirchhoff essa viene considerata non tra le forze elettromotrici ma tra quelle controelettromotrici. FIG. 12.6 - Circuito R-L in serie con generatore di forza elettromotrice costante. L'equazione (12.21) può essere scritta nella forma: (12.22) ed integrata tra l'istante iniziale t = 0, corrispondente alla chiusura dell'interruttore S, ed un generico istante t. Otteniamo così: essendo C una costante di integrazione. scriversi : (12.23) La formula precedente può anche (12.24) La costante A può essere determinata tenendo conto che per t = 0, al momento cioè della chiusura dell'interruttore, si ha I = 0, per cui pertanto in definitiva: /R – A = 0. Si ha (12.25) 12.8] FENOMENI TRANSITORI 115 dove /R rappresenta il valore della corrente che si instaura dopo un tempo infinito. La quantità L/R indicata spesso con τ, viene chiamata costante dì tempo del circuito e rappresenta il tempo necessario alla corrente per divenire uguale ad (1 - 1/e) volte il valore finale /R (circa il 63 % del valore finale). In un circuito quindi a parità di resistenza il tempo impiegato dalla corrente per raggiungere il suo valore stazionario è tanto maggiore quanto è maggiore il valore dell'induttanza. L'induttanza limita così la rapidità di crescita della corrente. Dopo un intervallo di tempo pari a cinque costanti di tempo il valore della corrente diviene uguale a 0,993 volte il suo valore finale. Si commette quindi un errore del 7 0 00 , affermando che in tale istante la corrente è uguale al suo valore massimo /R ed entro questa approssimazione la corrente può essere considerata stazionaria. (Per un circuito formato da una resistenza di 1000 Ω ed una induttanza di 1 mH la costante di tempo vale 10-6 secondi). L'andamento della corrente nel circuito R -L è quello mostrato in Fig. 12.7. FIG. 12.7 - Andamento in funzione del tempo della corrente del circuito della figura precedente (τ = L/K). La pendenza dI/dt nell'istante iniziale vale 1/τ ( /R). Questo significa che se la corrente continuasse ad aumentare con la stessa velocità raggiungerebbe il suo valore finale in un tempo uguale ad una costante di tempo τ. Se ad un determinato istante l'interruttore del circuito venisse aperto, tra le sue estremità si genererebbe una differenza di potenziale dovuta alla forza elettromotrice indotta che tenderebbe a mantenere la corrente. Questa differenza di potenziale, se sufficientemente alta, potrebbe produrre un arco tra gli estremi dell'interruttore attraverso il quale fluirebbe la corrente. Nel caso di un solenoide di 10 mH di induttanza percorso da una corrente di 1000 A in cui si riducesse a zero la corrente in 1 ms, si produrrebbe tra gli estremi dell'interruttore una differenza di potenziale di 10 KV. 116 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 12.8.2 Circuito R-C in serie Come secondo esempio prendiamo in esame il circuito in serie R-C alimentato da un generatore di forza elettromotrice costante FIG. 12.8 , mostrato in Fig. 12.8. - Circuito R-C in serie con generatore di forza elettromotrice costante. Per questo circuito la seconda legge di Kirchhoff fornisce, per un istante qualsiasi dopo la chiusura dell'interruttore S, la relazione: (12.26) La quantità q (t) / C rappresenta la differenza di potenziale ai capi del condensatore all'istante t e q(t) è la carica accumulata nel condensatore allo stesso istante. La caduta di potenziale, come per il resistore, è nella direzione della corrente. Poiché I = dq la (12.26) può essere scritta come: dt (12.27) o anche: (12.28) Integrando la (12.28) tra l'istante t = 0 in cui si chiude il circuito ed un istante generico t otteniamo: (12.29) La costante contenuta in questa espressione viene determinata tenendo conto che per t = 0 si ha q = 0, essendo il condensatore scarico al momento 12.8] FENOMENI TRANSITORI 117 della chiusura dell'interruttore. La (12.29) diviene allora: (12.30) e la corrente che fluisce nel circuito è: (12.31) Facciamo notare che /R è la corrente che si stabilirebbe nel circuito nel caso in cui il condensatore fosse cortocircuitato. La quantità RC viene chiamata costante di tempo del circuito e rappresenta il tempo necessario alla corrente per diminuire di un e-esimo. Dopo un tempo dell'ordine di 5 costanti di tempo la corrente nel circuito può essere considerata praticamente nulla ed il condensatore carico, anche se in teoria ciò accade in un tempo infinito. In Fig. 12.9 è rappresentato l'andamento della corrente che fluisce nel circuito in funzione del tempo. FIG. 12.9 - Andamento temporale della corrente del circuito di Fig. 12.8 (τ = RC). Come ulteriore esercizio immaginiamo di cortocircuitare il generatore di Fig. 12.8 dopo aver caricato il condensatore. Per ogni istante successivo a questa operazione vale l'espressione: (12.32) che è analoga alla (12.26), ad eccezione del termine a destra. Mediante lo stesso metodo utilizzato precedentemente e tenendo conto che all'istante in cui il generatore viene cortocircuitato sulle armature del condensatore 118 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA si ha q = [CAP. 12 C, otteniamo che : (12.33) la quale fornisce la legge di scarica del condensatore. Anche in questo caso dopo un tempo pari a 5 o 6 costanti di tempo si può praticamente considerare il condensatore scarico. 12.8.3 Circuito R-L-C in serie Consideriamo infine il circuito composto da una resistenza R, una induttanza L ed una capacità C in serie, mostrato in Fig. 12.10. Immaginiamo di aver caricato il condensatore con una carica q0, cui corrisponde una differenza di potenziale tra le armature Δ V0, e di chiudere successivamente l'interruttore S del circuito ad un istante che assumeremo come t = 0. FIG. 12.10 - Circuito R-L-C in serie. Il condensatore nel circuito compie le funzioni di un generatore di forza elettromotrice con una differenza di potenziale variabile nel tempo, man mano che esso si scarica. Dalla seconda legge di Kirchhoff si ricava l'equazione del circuito : (12.34) o, tenendo conto che ΔV è legato alla carica del condensatore in ogni istante dalla relazione ΔV=q/C, anche: (12.35) Se deriviamo la (12.35) rispetto al tempo e consideriamo che /= -dq/dt (il segno meno è qui dovuto al fatto che la carica del condensatore diminuisce 12.8] FENOMENI TRANSITORI 119 al fluire della corrente) si ottiene la seguente equazione differenziale del secondo ordine omogenea: (12.36) Una soluzione della (12.36) è data da: (12.37) dove I1 e I2 sono costanti da determinare mediante le condizioni iniziali, e k1 e k2 devono essere le radici dell'equazione: (12.38) cioè: (12.39) 1/ 2 ⎛ R2 1 ⎞ R Ponendo = a ed ⎜⎜ 2 − ⎟ 2L ⎝ 4 L LC ⎠ = b abbiamo che la soluzione della (12.37) si scrive in generale: (12.40) La quantità b può essere reale, nulla o immaginaria a seconda che sia: (12.41) Discutiamo questi tre casi separatamente: I) b reale In questa ipotesi le due quantità kl e k2 risultano entrambe reali e negative; gli esponenziali della (12.40) sono quindi decrescenti e la corrente I(t) per t → ∞ tende a zero. Un circuito di questo tipo viene chiamato sovrasmorzato. Per determinare le costanti I1 ed I2 imponiamo le condizioni iniziali e cioè: I(0) = 0 e q(0) = q0. Ponendo t = 0 nella (12.40) si ha che: I1+ I2 = 0 (12.42) da cui: I1 = -I2. (12.43) 120 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Dalla (12.35), sempre calcolata per t = 0, si ha invece che: (12.44) Sostituendo nella (12.44) la (12.40) e tenendo conto della (12.43), dopo semplici passaggi, si arriva al risultato: (12.45) 1 Ponendo = ω 0 l'espressione della corrente diventa: LC (12.46) Un andamento tipico di questa espressione è mostrato in Fig. 12.11 a). II) b nullo La soluzione dell'equazione (12.36) è in tal caso: (12.47) dove I1 e I2 sono le costanti di integrazione e a = R/2L. Seguendo il procedimento utilizzato precedentemente per determinare I1 ed I2 si ottiene: (12.48) Un circuito con tale comportamento è detto criticamente smorzato e presenta un andamento della corrente quale quello di Fig. 12.11b). III) b immaginario Questo è il caso più interessante poiché l'andamento della corrente risulta oscillatorio smorzato come mostrato in Fig. 12.11c). La soluzione dell'equazione differenziale diviene: (12.49) dove I1 e I2 sono le costanti di integrazione, α = il simbolo j indichiamo la quantità −1 . R e β = 2L 2 1 R − 2 . Con LC 4 L 12.8 ] FENOMENI TRANSITORI 121 FIG. 12. 11 - Andamento in funzione del tempo della corrente in un circuito R-L-C in serie. a) b reale, circuito sovrasmorzato (R = 300 Ω, L = 0,l H, C= 10 μF); b) b nullo, circuito criticamente smorzato (R = 200 Ω, L = 0,1 H, C= 10 μF); c) b immaginario, circuito oscillante smorzato (R = 20 Ω, L = 0,l H, C= 10 μF). 122 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Se determiniamo le costanti I1 e I2 imponendo le condizioni iniziali del circuito in esame I(0) = 0 e q (0) = q0, operando nella identica maniera del caso I), troviamo per la corrente l'espressione: (12.50) Per la nota relazione e jβt −e 2j − jβt = senβt la (12.50) si scrive anche: (12.51) e ponendo I 0 = q0ω 02 β otteniamo in conclusione: (12.52) Dalla (12.52) si vede che l'ampiezza delle oscillazioni sinusoidali risulta smorzata in maniera esponenziale per la presenza del termine e-αt. L'ampiezza delle oscillazioni della corrente diminuisce in effetti poiché l'energia del circuito, costituita dall'energia inizialmente immagazzinata nel condensatore, in ogni istante successivo alla chiusura dell'interruttore, risulta in parte ripartita tra energia elettrica del condensatore ed energia magnetica dell'induttore, ed in parte dissipata nella resistenza per effetto Joule. Accade così che al tendere di t all'infinito essa viene completamente trasformata in calore. Solo nel caso in cui potessimo considerare un circuito con R nulla si avrebbe che la corrente, essendo α = 0, sarebbe oscillante con ampiezza costante. Infatti, non dovendo considerare l'effetto Joule, per aver posto R = 0, e trascurando, secondo quanto detto nel paragrafo 12.1, ogni emissione di radiazione elettromagnetica, per un circuito in serie L-C saremmo 2 in assenza di ogni fenomeno dissipativo e l'energia iniziale, cioè 1 / 2 q0 / C , si conserverebbe risultando in ogni istante ripartita tra l'energia del condensatore, WC, e l'energia dell'induttore, WL. Varrebbe cioè la relazione: ( ) (12.53) Per dimostrare la validità della (12.53) calcoliamo esplicitamente i valori di WC e di WL. L'energia WC (t) può essere ricavata ricordando che essa è legata alla differenza di potenziale ΔV esistente tra le armature di un condensatore dalla formula 1/2 (CΔV2). La differenza di potenziale tra le piastre del condensatore del circuito in esame è variabile nel tempo e può essere ottenuta dalla (12.34) ponendo R = 0 e utilizzando come espressione per la corrente la (12.52) con α = 0 e β =ω0= 1 / LC . 12.9] CORRENTI ALTERNATE 123 Abbiamo così: (12.54) e conseguentemente l'energia del condensatore è: (12.55) L'energia magnetica dell'induttore vale 1 2 LI (t ) e se prendiamo per la corrente 2 I la (12.52) con le stesse considerazioni fatte precedentemente, otteniamo: (12.56) Sommando la (12.55) e la (12.56) ed esplicitando il valore di I0 che, per un circuito con R = 0, è uguale a q0 ω0 si trova : (12.57) come volevasi dimostrare. Da notare infine, come deriva dalla (12.57), che ad ogni quarto di periodo l'energia del circuito L-C risulta essere o tutta elettrica o tutta magnetica. 12.9 Correnti alternate In una regione dello spazio, ove esista un campo magnetico B uniforme, inseriamo una spira piana rigida conduttrice di superficie S connessa, mediante un giunto a contatti rotanti, ad un circuito di resistenza R. Se la spira viene messa in rotazione con velocità angolare costante co, come si vede in Fig. 12.12, su essa agisce, secondo la legge di Faraday, una forza elettromotrice indotta uguale a -dΦ (B)/dt. FIG. 12.12 - Spira conduttrice ruotante in presenza di campo magnetico uniforme. 124 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Indicando con ϑ l'angolo formato tra il vettore B e la normale n al piano della spira, si ha che il flusso di B attraverso la superficie della spira è: (12.58) L'angolo ϑ dipende dal tempo secondo la legge ϑ = ωt + α essendo a l'angolo tra B ed n all'istante iniziale t = 0. La forza elettromotrice indotta operante sulla spira vale allora: (12.59) e di conseguenza la corrente che percorre il circuito di resistenza R risulta essere : (12.60) Ponendo I0 = ω BS/R la (12.60) può essere scritta più compattamente nella forma: (12.61) che fornisce la tipica espressione per una corrente variabile sinusoidalmente nel tempo. La quantità I0, indicata generalmente con il nome di ampiezza o valore di picco della corrente, rappresenta il valore massimo che essa può assumere in modulo. L'argomento della funzione sinusoidale, (ωt + α), è detto fase della corrente, e a in particolare viene chiamata fase iniziale. Con una opportuna scelta dell'origine della variabile temporale la fase iniziale a può essere posta uguale a zero. Nel nostro esempio questo si verificherebbe se facessimo in modo che il piano della spira fosse perpendicolare al vettore B nell'istante t = 0. La relazione (12.61) fornisce il valore istantaneo della corrente, variabile nel tempo con l'andamento riportato in Fig. 12.13. Dalla figura appare evidente come durante ogni rivoluzione o ciclo della spira la corrente inverta la sua direzione all'interno di essa. La velocità angolare co di rotazione della spira che, come appare dalla espressione (12.61), determina la periodicità della funzione sinusoidale e quindi della corrente, prende il nome di pulsazione e viene misurata in radianti al secondo. La quantità v = ω/2π, uguale al numero di volte che la corrente assume lo stesso valore in un secondo, è chiamata frequenza (1) della corrente e viene misurata in cicli al secondo o hertz (Hz) (1 Hz = l ciclo al secondo). (1) Spesso nei paragrafi successivi ci capiterà, per comodità o per consuetudine, di chiamare frequenza la pulsazione. 12.9] CORRENTI ALTERNATE FIG. 12.13 125 - Corrente variabile sinusoidalmente nel tempo. Il periodo di rivoluzione T della spira, corrispondente all'intervallo di tempo intercorrente tra due valori identici della corrente, per esempio l'intervallo di tempo tra due massimi, è legato alla frequenza e alla pulsazione dalle relazioni : (12.62) Usando la relazione: (12.63) si può scrivere: ⎛ ⎝ dove α = ⎜ α − ' π⎞ (12.64) ⎟ . È facile rendersi conto allora che la corrente può essere 2⎠ rappresentata, operando una opportuna scelta della fase iniziale, utilizzando indifferentemente o la funzione seno o la funzione coseno. Nel seguito di questo capitolo tuttavia preferiremo esprimere le correnti alternate mediante la funzione coseno nella seguente maniera: (12.65) risultando questa formula essere in molti casi vantaggiosa. Per introdurre il concetto di corrente alternata abbiamo fatto uso dell'esempio di una spira ruotante in un campo magnetico uniforme dando in questo modo un'idea, seppure estremamente semplice e schematica, di come sia possibile 126 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 realizzare un generatore di forza elettromotrice variabile nel tempo sinusoidalmente. D'ora in avanti ogni qualvolta considereremo un circuito percorso da corrente alternata di frequenza M supporremo che ad esso sia applicato un generatore capace di fornire una forza elettromotrice del tipo: (12.66) di ampiezza 0 e frequenza ω, responsabile del passaggio della corrente. Il problema fondamentale della teoria dei circuiti in corrente alternata, di cui ci occuperemo nei paragrafi successivi, è la determinazione dell'ampiezza e della fase della corrente che fluisce in un circuito qualsiasi, formato da resistori condensatori ed induttori, quando ad esso sia applicato un generatore di forza elettromotrice del tipo (12.66). 12.10 Rappresentazione mediante vettori ruotanti Nello studio dei circuiti a corrente alternata si dimostra molto utile la rappresentazione delle grandezze variabili sinusoidalmente nel tempo, dette fasori, come proiezioni di vettori ruotanti in grafici polari. In Fig. 12.14 viene mostrato come esempio la rappresentazione della corrente (12.65). Il vettore OP, di lunghezza proporzionale al valore di picco I0, ruota in verso antiorario (1), con velocità angolare ω, uguale alla pulsazione della corrente, formando un angolo ϑ con l'asse di riferimento x. Ponendo ϑ = (ωt + ϕ), otteniamo per la proiezione del vettore OP sull'asse x l'espressione: . (12.67) che fornisce il valore istantaneo della corrente I. Per dimostrare l'efficacia di questo metodo, eseguiamo il calcolo della somma di due correnti che fluiscano nel medesimo circuito. Le due correnti possono FIG. 12.14 - Rappresentazione di un fasore mediante un vettore ruotante. (1) Il verso di rotazione antiorario è stato preso affinchè l'angolo ϑ risultasse crescente in questo verso secondo la convenzione dei grafici polari. 12.10] RAPPRESENTAZIONE MEDIANTE VETTORI RUOTANTI 127 essere ottenute per esempio per mezzo di due spire diverse (per maggiore generalità vogliamo considerare correnti di ampiezza diversa) ruotanti in una regione di campo magnetico uniforme intorno allo stesso asse con velocità angolare ni e giacenti su due piani che all'istante t = 0 formano un angolo ϕ. Scegliamo inoltre come istante t = 0 quello per cui l'orientamento del piano della prima spira rispetto alla direzione del campo magnetico è tale da rendere nullo l'angolo di fase iniziale della prima corrente. Per quanto detto nel paragrafo precedente, avremo che le due correnti saranno: I1 =I01 cos ωt e I2 = I02 cos (ωt + ϕ). (12.68) (12.69) Le correnti I1 e I2 si dicono sfasate tra loro di un angolo ϕ ed in questo caso particolare si dice che la corrente I2 precede la corrente I1 o anche che la corrente I1 è in ritardo sulla corrente I2. In Fig. 12.15 è riportato il grafico delle due correnti. 12.15 - Andamento temporale di due correnti sinusoidali di uguale pulsazione ω, di ampiezza diversa e sfasate tra loro di un angolo ϕ. FIG. Nel circuito collegato alle due spire rotanti fluisce una corrente I, pari alla somma della (12.68) e della (12.69), che risulta essere: (12.70) La corrente I può essere scritta nella forma: (12.71) 128 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 se, come si ricava dalla Fig. 12.16 a) applicando la regola del parallelogrammo ai due vettori rotanti, si prende (1): (12.72) e (12.73) In Fig. 12.16a) il valore istantaneo (12.71) della corrente I è dato dalla proiezione sull'asse di riferimento x del vettore risultante. Poiché i vettori ruotano tutti con la medesima velocità angolare co, lo sfasamento esistente tra essi rimane invariato nel tempo ed uguale a quello che avevano all'istante iniziale. La differenza di fase può essere determinata facilmente per mezzo di un diagramma, come quello mostrato in Fig. 12.16 b), detto diagramma FIG. 12.16 - Somma di due correnti sinusoidali di uguale frequenza: a) diagramma dei fasori, b) diagramma stazionario. stazionario in cui i vettori sono fissi e gli sfasamenti tra i fasori sono calcolati rispetto ad uno preso come riferimento, nel nostro caso per esempio I1 (1) Il procedimento seguito è del tutto equivalente, come è facile verificare, a trasformare analiticamente la (12.70) con note formule di trigonometria, come si suol fare ad esempio nello studio della composizione dei moti armonici. 12.11] RAPPRESENTAZIONE MEDIANTE NUMERI COMPLESSI 129 Il metodo appena illustrato può essere evidentemente applicato a più di due correnti e vale inoltre anche per le differenze di potenziale esistenti ai capi dei componenti di un circuito in corrente alternata, rappresentabili esse pure mediante vettori ruotanti. 12.11 Rappresentazione mediante numeri complessi Consideriamo il numero complesso: z = a + jb (12.74) dove a e b sono rispettivamente la componente reale e quella immaginaria del numero complesso e j = − 1 rappresenta l'unità immaginaria. Mediante l'uso dei grafici di Argand o di Gauss è possibile fornire una rappresentazione geometrica del numero complesso. Prendiamo infatti in esame il piano complesso di Fig. 12.17 nel quale l'asse x costituisce l'insieme dei numeri reali e l'asse y quello dei numeri immaginari puri. In questo piano il numero (12.74) può essere riguardato come un vettore OP, applicato alla origine degli assi con componente lungo l'asse (reale) x uguale ad a e con componente lungo l'asse (immaginario) y uguale a b. FIG. 12.17 - Rappresentazione geometrica di un numero complesso. Se indichiamo con ϑ = arctg b/a l'angolo che il vettore OP forma con l'asse x e con r= (a2 + b2)1/2 la sua ampiezza, si ricava facilmente che: (12.75) e (12.76) Per queste due relazioni e per la formula di Eulero: (12.77) 130 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 il numero complesso (12.74) si può anche scrivere nella forma: (12.78) dove r è detto modulo e ϑ argomento del numero complesso. Abbiamo visto che correnti o tensioni variabili sinusoidalmente nel tempo sono rappresentabili come proiezioni lungo l'asse x di vettori ruotanti con velocità angolare uguale alla frequenza ω. Appare evidente a questo punto la correlazione esistente tra il metodo dei vettori ruotanti e la rappresentazione geometrica dei numeri complessi nei grafici di Argand. Infatti i vettori ruotanti relativi a grandezze sinusoidali variabili con frequenza w possono essere scritti come numeri complessi nella forma (12.74) o in quella (12.78), forme che abbiamo dimostrato essere equivalenti, con un argomento ϑ = (ωt + ϕ) ed un modulo r uguale al valore di picco della grandezza. Una corrente alternata di frequenza ω, ampiezza I0, fase iniziale ϕ, si scrive così in maniera complessa: (12.79) ed il suo valore istantaneo, che coincide con la proiezione del vettore lungo l'asse x, o asse reale, è quindi uguale alla parte reale (1) I0 cos (ωt + ϕ) del numero complesso. In conclusione possiamo riassumere dicendo che un problema concernente correnti o tensioni alternate può essere trattato nel campo complesso scrivendo queste quantità nella forma (12.78). Il risultato finale del calcolo è generalmente un numero complesso e la quantità alla quale siamo interessati, quella che ha significato fisico, è la parte reale del numero complesso. Il suo valore di picco si ottiene prendendo il modulo del numero complesso mentre la fase è data dall'arcotangente del rapporto tra il coefficiente della parte immaginaria e la parte reale. Per dimostrare come il metodo dei numeri complessi riunisce in sé la comodità della rappresentazione mediante vettori e la semplicità del calcolo algebrico, riconsideriamo il problema del calcolo della corrente somma delle due correnti (12.68) e (12.69), che adesso scriviamo in notazione complessa: (12.80) ed (12.81) Se per la corrente risultante prendiamo la espressione I = I 0 e j (ωt + ϕ ' ) vale la relazione: (12.82) (1) Può essere usata indifferentemente anche la parte immaginaria ma ovviamente una volta deciso quali delle due componenti considerare è necessario attenersi nell'ambito di un dato problema sempre alla stessa scelta. 12.12] L' IMPENDENZA 131 Tenendo conto che il termine ejωt nella (12.82) si semplifica e sfruttando la proprietà per cui in una eguaglianza tra numeri complessi le parti reali e quelle immaginarie devono essere separatamente fra loro eguali, ricaviamo che: (12.83) e che: (12.84) Quadrando e sommando le due espressioni otteniamo il valore di picco della corrente /: (12.85) e dividendo la seconda espressione per la prima abbiamo lo sfasamento ϕ' tra la corrente I e la corrente I1 presa come riferimento: (12.86) La (12.85) e (12.86) coincidono con le pressioni (12.72) e (12.73) precedentemente calcolate dalla determinazione geometrica del risultante di due vettori rotanti. 12.12 L'impedenza La differenza di potenziale (1) ai capi di un resistore di resistenza R percorso da una corrente alternata I = I0cosoωt è: (12.87) Tra le estremità di un induttore di induttanza L in cui circoli la stessa corrente I abbiamo invece: (12.88) Infine tra le armature di un condensatore di capacità C in cui fluisce la corrente I0 cos ωt la differenza di potenziale all'istante t è: (12.89) (1) Per comodità in questo paragrafo indichiamo la differenza di potenziale con V in luogo di ΔV. 132 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Esaminando queste tre espressioni si nota come la corrente e la tensione, che nel caso del resistore sono in fase, nel caso dell'induttore e del condensatore risultano sfasate di un angolo uguale a π/2, e in particolare si osserva che per l'induttore è la tensione a precedere la corrente mentre per il condensatore è la corrente a precedere la tensione. È bene chiarire subito a questo riguardo che quando affermiamo che una corrente precede o segue una tensione non vogliamo con questo far riferimento ad una relazione del tipo causa-effetto. Va ricordato infatti che le espressioni sinusoidali da noi considerate per le correnti e per le tensioni alternate sono caratteristiche del comportamento stazionario del circuito e valgono quindi quando l'andamento transitorio iniziale può essere considerato sufficientemente smorzato. Così la corrente alternata prodotta dalla spira ruotante di paragrafo 12.9 sarà uguale alla (12.61) o alla (12.65) solamente dopo un numero sufficientemente grande di rivoluzioni. I rapporti di fase a cui prima accennavamo tra corrente e tensione sono perciò tipici del comportamento assunto da queste grandezze dopo un intervallo di tempo, preso a partire dall'istante in cui la corrente ha cominciato a circolare, grande rispetto alla costante di tempo del circuito. Immaginiamo ora che la corrente I0 cos ωt fluisca attraverso un resistore di resistenza R ed un induttore di induttanza L posti in serie. Tra gli estremi del sistema esiste una differenza di potenziale: (12.90) somma delle differenze di potenziale di ogni singolo elemento. Similmente se un sistema, costituito da un resistore di resistenza R e da un condensatore di capacità C posti in serie, è percorso dalla corrente I0 cos ωt la differenza di potenziale agli estremi risulta essere: (12.91) Abbiamo ricavato la (12.90) e la (12.91) per mostrare come non sia immediato trovare una relazione semplice tra tensioni e correnti alternate, del tipo della legge di Ohm per i circuiti in corrente continua, per la presenza nelle espressioni di due termini, uno in fase ed uno sfasato di π/2. Questa difficoltà tuttavia può essere superata facendo uso della notazione complessa. Se scriviamo infatti la corrente che fluisce in un elemento, o sistema di elementi di un circuito, nella forma I=I0 ejωt e la differenza. di potenziale esistente ai suoi estremi nella forma V = V0 ej(ωt + ϕ), essendo ϕ la differenza di fase tra tensione e corrente, abbiamo che vale la semplice relazione: (12.92) 12.12] L' IMPENDENZA 133 La quantità complessa Z prende il nome di impedenza dell'elemento o della combinazione. Se scrivessimo le relazioni (12.87), (12.88) e (12.89) in forma complessa, troveremmo che l'impedenza di un resistore si riduce a una quantità sempre reale ed uguale al valore della sua resistenza R, e che l'impedenza di un induttore o di un condensatore si riduce al contrario a una quantità sempre immaginaria ed uguale rispettivamente a jwL od a − j 1 ωC La relazione in forma complessa corrispondente alla (12.90) si scrive: (12.93) e applicando la (12.92) si ha che l'impedenza per un sistema in serie R-L è: (12.94) Con il medesimo procedimento si ricava per il sistema in serie R-C un valore : (12.95) Notiamo che sia nella (12.94) sia nella (12.95) la parte reale della impedenza è uguale al valore R della resistenza mentre la parte immaginaria per la serie R-L è uguale ad jωL e per la serie R-C è uguale ad – j (l/ωC). In generale l'impedenza di un elemento o di un sistema di elementi, si scrive nella forma: Z = (R + jX ) con una parte reale R che rappresenta la resistenza ed una parte immaginaria il cui coefficiente (reale) X dicesi reattanza. Dato che per un induttore ed un condensatore, come abbiamo visto, l'impedenza, essendo puramente immaginaria, coincide (a parte il fattore j) con la reattanza e poiché la reattanza di un induttore è positiva e quella di un condensatore è negativa, si è soliti chiamare reattanza induttiva una X positiva e reattanza capacitiva una X negativa. Dagli esempi sopra riportati deduciamo inoltre che le impedenze si compongono analogamente alle resistenze nei circuiti in corrente continua. Quindi N impedenze in serie si sommano: Z = Z1 + Z 2 + ...... + Z N (12.96) ed N impedenze in parallelo si compongono secondo la regola: (12.97) 134 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 L'inverso della impedenza Z è chiamata ammettenza e normalmente viene indicata con il simbolo Y. Per meglio capire quanto finora esposto ricapitoliamo i punti essenziali della trattazione complessa. Dato un elemento, od un sistema di elementi con due estremi, di impedenza Z, percorso da una corrente I0 ejωt, la differenza di potenziale V0 ej(ωt + ϕ) esistente ai suoi estremi è: (12.98) con un valore istantaneo, uguale alla parte reale della (12.98), dato da: (12.99) Sostituendo le espressioni di V ed I e semplificando, la (12.98) diviene: (12.100) e da questa, per una proprietà dei numeri complessi ('), si ricava che: (12.101) e che: (12.102) In un grafico complesso, in cui la fase della corrente venga presa come riferimento, il vettore corrente risulta parallelo all'asse reale x. Il vettore che rappresenta la tensione ha un modulo proporzionale alla (12.101) e forma con l'asse x un angolo ϕ dato dalla (12.102). Il vettore della tensione può essere inoltre pensato come il risultante della somma di un vettore parallelo all'asse x, dipendente dalla resistenza R, e di un vettore, dipendente dalla reattanza X, parallelo all'asse y e precisamente ruotando rispetto all'asse x di più o meno π/2 a seconda che la reattanza sia induttiva o capacitiva. Per quando riguardo poi le leggi di Kirchhoff, esse continuano naturalmente a valere anche nel campo complesso purché scritte in termini di quantità complesse. 1) la somma delle correnti complesse entranti in un nodo è uguale alla somma delle correnti complesse uscenti dallo stesso nodo; 2) la somma algebrica delle forze elettromotrici complesse contenute in una maglia è uguale alla somma delle cadute di potenziale complesse esistenti lungo la maglia. (1) Ricordiamo che se due numeri complessi, z1 = x1 +jy1 e z2 = x2 +jy2, sono uguali, z1 = z2, ( saranno uguali anche i loro moduli, x12 + y12 = arctg y2/x2 ) 1/ 2 ( = x 22 + y 22 ) 1/ 2 , ed i loro argomenti arctg y1/x1 12.13] CIRCUITO R-L-C IN SERIE 135 12.13 Circuito R-L-C in serie Esaminiamo il comportamento del circuito in serie di Fig. 12.18 formato da una resistenza R, una induttanza L e una capacità C, al quale è applicato un generatore di forza elettromotrice alternata di caratteristiche note: (12.103) Dopo la chiusura dell'interruttore S, che supponiamo avvenire all'istante t = 0, il circuito è percorso da una corrente I che, per la seconda legge di Kirchhoff, deve soddisfare la relazione: (12.104) Derivando rispetto al tempo e facendo uso della relazione I = dq/dt, la (12.104) diviene: (12.105) È immediato notare che se la forza elettromotrice fosse costante nei tempo la (12.105) coinciderebbe con l'equazione (12.36), già analizzata nel paragrafo 12.8 con differenti condizioni iniziali. FIG. 12.18 - Circuito R-L-C in serie con generatore di forza elettromotrice alternata. Nel caso invece in cui è variabile nel tempo la (12.105) è una equazione differenziale del secondo ordine non omogenea. Per un teorema di analisi la sua soluzione è data dalla somma della soluzione generale dell'equazione omogenea associata più un integrale particolare dell'equazione disomogenea. Da un punto di vista fisico la soluzione dell'equazione omogenea associata corrisponde al comportamento transitorio iniziale della corrente nel circuito mentre l'integrale particolare fornisce il comportamento stazionario valido per tempi sufficientemente lunghi. 136 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Questo significa in altre parole che una volta smorzatosi il contributo iniziale, che è sempre decrescente nel tempo, la corrente assume un andamento oscillante stazionario con frequenza uguale a quella del generatore di forza elettromotrice applicato al circuito. Tali oscillazioni prendono il nome di oscillazioni forzate. Come abbiamo visto nel paragrafo 12.8 la soluzione dell'equazione omogenea associata della (12.105) è: (12.106) con kl e k2 che dipendono dai valori degli elementi componenti il circuito ed I1 ed I2 che costituiscono le costanti di integrazione. Per determinare l'integrale particolare della (12.105) facciamo uso della trattazione complessa scrivendo cercando una soluzione del tipo: = 0 ej(ωt+ϕv) e (12.107) Per determinare i valori di I0 e ϕ1, sostituiamo la (12.107) nella (12.105) ed eseguiamo le derivate; abbiamo allora l'espressione: (12.108) che con semplici operazioni algebriche si riduce a: (12.109) Ponendo poi: (12.110) e: (12.111) la (12.109) si trasforma nella: (12.112) La (12.110) rappresenta l'impedenza del circuito che, essendo formato da un sistema di elementi in serie, è uguale alla somma delle impedenze dei tre elementi. Seguendo il procedimento illustrato nel paragrafo precedente è facile ottenere il valore dell'ampiezza della corrente: (12.113) 12.13] CIRCUITO R-L-C IN SERIE 137 dove con | Z | indichiamo il modulo dell'impedenza, e il valore della differenza di fase tra tensione e corrente: (12.114) Le due ultime relazioni determinano completamente le caratteristiche della corrente stazionaria del circuito, e quindi l'integrale particolare della (12.105). Si potrà allora calcolare la soluzione generale. Prima di procedere a questo calcolo esplicito, è però interessante vedere come sia possibile arrivare agli stessi risultati applicando il metodo dei vettori ruotanti nel piano complesso. I tre termini a destra dell'equazione (12.104), sono delle tensioni alternate e possono essere rappresentati quindi come proiezioni sull'asse reale x di un piano complesso di tre vettori ruotanti, vedi Fig. 12.19, ciascuno con le seguenti caratteristiche : I) un vettore di modulo RI0 e fase iniziale ϕI, quindi parallelo al vettore corrente. II) un vettore di modulo ωLI0 e fase iniziale (ϕI + π/2), ruotato perciò di 90° in senso antiorario rispetto al primo vettore. III) un vettore di modulo I0/ωC e di fase iniziale (ϕI - π/2), ruotato perciò di 90° in senso orario rispetto al primo vettore. Il valore istantaneo della forza elettromotrice, a sinistra della (12.104), è dato allora dalla proiezione sull'asse x del vettore di modulo 0 risultante dei tre vettori di Fig. 12.19a). Ciò è mostrato in Fig. 12.19b), dove abbiamo prima eseguito la somma dei due vettori antiparalleli di modulo ωLI0 e I0/ωC e poi la somma del risultante FIG. 12.19 - Applicazione del metodo dei vettori ruotanti. a) Le differenze di potenziale ai capi degli elementi del circuito di Fig. 12.18 come proiezioni di vettori ruotanti. b) valore istantaneo della forza elettromotrice come proiezione del vettore risultante dei tre vettori della figura precedente. 138 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 di questi due con il terzo, di modulo RI0. Dalla stessa figura si trova facilmente: (12.115) e (12.116) relazioni che, come volevamo dimostrare, coincidono con la (12.113) e la (12.114). Nel caso in cui la frequenza ω della forza elettromotrice applicata sia uguale alla frequenza propria del circuito : (12.117) l'impedenza Z del circuito, come risulta dalla (12.110), diventa una quantità reale coincidente con il valore R della resistenza. In questa condizione di funzionamento, detta di risonanza, l'ampiezza I0 della corrente stazionaria ha un valore massimo pari ad 0/R e la differenza di fase ϕ tra tensione e corrente diventa nulla. L'effetto di risonanza non è tipico solo dei circuiti in corrente alternata, ma si riscontra in molti differenti fenomeni fisici. In generale possiamo dire che esso si verifica ogniqualvolta si applica ad un determinato sistema una forza variabile, che a seconda dei casi può essere meccanica, elettrica, magnetica, caratterizzata da una frequenza il cui valore coincide con una delle frequenze proprie del sistema. Particolarmente interessante per determinare le proprietà di un circuito risonante è il cosiddetto fattore di qualità, Q0 definito come : (12.118) Questa quantità, che può essere introdotta in maniera molto più generale (1), risulta direttamente collegata con la larghezza del massimo di risonanza della corrente, vale a dire della curva I0(ω). Infatti, tenendo conto della (12.118), l'ampiezza della corrente I, si scrive: (12.119) (1) Per un sistema oscillante si definisce fattore di qualità il rapporto adimensionale tra l'energia immagazzinata nel sistema e l'energia media dissipata. In maniera analoga il Q0 può essere definito anche come il rapporto ω0/γ tra la frequenza propria del sistema ω0 e la quantità γ che rappresenta l'inverso del tempo richiesto perché l'energia del sistema decresca di l/e rispetto al suo valore iniziale. 12.13] CIRCUITO R-L-C IN SERIE 139 ed il rapporto tra la resistenza R ed il modulo della impedenza | Z |, vale: (12.120) Entrambe queste espressioni per co = co0 presentano un massimo e, come può riscontrarsi in Fig. 12.20 e 12.21, all'aumentare del parametro Q0 tale massimo diviene sempre più stretto ed in particolare per l'intensità di corrente sempre più elevato. Per definire quantitativamente un tale comportamento determiniamo quei valori di u>, indicati con o^ ed o>2, per i quali il valore di R/\ Z | diviene l/j/2 del suo valore massimo (1). Tale condizione si verifica quando 12.20 - Comportamento risonante dell'ampiezza della corrente in funzione di ω/ω0 per un circuito in serie R-L-C. FIG. (1) Questi valori della frequenza prendono il nome di punti di potenza dimezzata. 140 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 12.21 - Rapporto R/Z in funzione di ω/ ω0 per un circuito in serie R-L-C. (Scala logaritmica per ascisse ed ordinate). FIG. (12.121) relazione che è soddisfatta da quattro differenti valori di ω, due negativi e due positivi. I due valori positivi, ai quali evidentemente siamo interessati, sono: (12.122) La differenza tra questi due valori della frequenza, detta anche ampiezza 12.13] CIRCUITO R-L-C IN SERIE 141 di banda, risulta essere: (12.123) Come volevamo dimostrare troviamo così che la larghezza del massimo di risonanza (1) è inversamente proporzionale al Q0 del circuito. In Fig. 12.22 è riportato l'andamento della differenza di fase tra tensione e corrente in funzione di ω/ω0. È interessante notare che per ω < ω0 la differenza di fase è negativa ; quindi la corrente precede la tensione e la reattanza X del circuito risulta capacitiva ; per ω >ω0 la differenza di fase è positiva, ed è allora la tensione a precedere la corrente e la reattanza X del circuito è induttiva. 12.22 - Andamento della differenza di fase tra tensione e corrente in funzione di ω/ω0 per un circuito R-L-C in serie. FIG. (1) In molti casi la resistenza di un circuito risuonante è quella dell'avvolgimento con il quale è costruito l'induttore e pertanto Q0 diventa una proprietà di quest'ultimo. Per bobine di alta qualità utilizzate in circuiti a radio-frequenza il fattore di qualità è dell'ordine di 100. 142 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Tornando infine al problema di determinare la soluzione generale dell'equazione (12.105), siamo ora in grado di scrivere che essa, in forma complessa, risulta essere: (12.124) con I0 e ϕI, dati dalla (12.113) e dalla (12.114), I1 ed I2 costanti da determinarsi imponendo le condizioni iniziali che per il nostro caso sono I (0) = 0 e q (0) = 0 e con k1 e k2 che, se ci limitiamo al caso di circuito oscillante smorzato, per quanto visto nel paragrafo 12.8, sono uguali a: (12.125) dove: Imponendo la prima condizione iniziale, I(0) = 0, alla espressione (12.124) calcolata per t = 0 si trova che : (12.126) Imponendo la seconda condizione iniziale, q (0) = 0, alla espressione (12.104) calcolata per t = 0 e utilizzando per I la (12.124) si ha inoltre: (12.127) Risolvendo il sistema formato dalla (12.126) e dalla (12.127) otteniamo le due costanti I1 ed I2 che sostituite nella (12.124) danno: (12.128) Il valore istantaneo della corrente I(t) è allora uguale alla parte reale della (12.128). Ricordando inoltre che: (12.129) possiamo scrivere in conclusione che: 12.14] POTENZA DISSIPATA NEI CIRCUITI A CORRENTE ALTERNATA 143 Per t tendente all'infinito il valore della corrente si riduce al primo termine a destra che, come abbiamo già detto, rappresenta il comportamento stazionario. In pratica è sufficiente attendere un tempo dell'ordine di qualche 1/α perché il secondo termine a destra divenga trascurabile e la corrente assuma il suo valore stazionario. In Fig. 12.23 è rappresentato un tipico andamento per la corrente (12.130). FIG. 12.23 - Andamento della corrente in funzione del tempo in un circuito del tipo di Fig. 12.18 con comportamento oscillatorio smorzato (R = 20Ω, L = 0,1 H, C = 10μF , ω0 = 103Hz). 12.14 Potenza dissipata nei circuiti a corrente alternata In questo paragrafo cercheremo di determinare una relazione che fornisca la potenza dissipata in un elemento di circuito percorso da corrente alternata, simile a quella da noi a suo tempo ricavata per il caso di un puro resistore di resistenza R attraversato da una corrente continua I, e cioè P = RI2. Abbiamo visto che se ad un elemento di impedenza Z applichiamo un generatore di forza elettromotrice = 0 cos(ωt + ϕv) in esso fluisce una corrente I = I0 cos (ωt + ϕI) con ampiezza e fase determinabili secondo le regole generali introdotte nei paragrafi precedenti. Ponendo per comodità ϕI = 0 e ϕv = ϕ, la potenza fornita dal generatore è data allora da: (12.31) 144 CIRCUITI IN CORRENTE CONTINUA E ALTERNATA [CAP. 12 Questa quantità è variabile nel tempo per cui, se vogliamo ottenere una informazione di maggiore interesse pratico, è preferibile ricavare la potenza media fornita dal generatore integrando la (12.131) su un ciclo completo e dividendo poi il risultato per un intervallo di tempo pari ad un periodo T. Abbiamo così : (12.132) Il primo integrale a destra della (12.132) può essere calcolato utilizzando una delle relazioni (12.129): (12.133) mentre si vede facilmente che il secondo integrale è nullo. La (12.132) fornisce quindi il risultato: (12.134) Se calcoliamo il valore quadratico medio della corrente I2, troviamo che esso vale: (12.135) È consuetudine definire valore efficace della corrente alternata la radice quadrata del suo valore quadratico medio, e cioè: (12.136) Per la forza elettromotrice si ricava naturalmente la relazione analoga: (12.137) Sostituendo la (12.136) e la (12.137) nella (12.134) si ha che: (12.138) La quantità cos ϕ, che appare in questa ultima espressione, viene chiamata fattore di potenza e poiché : (12.139) 12.14] POTENZA DISSIPATA NEI CIRCUITI A CORRENTE ALTERNATA 145 essa ha valore uno per un elemento puramente resistivo, cioè con reattanza nulla, ed è zero per un elemento puramente reattivo come un condensatore od un induttore. [ ] 1/ 2 Dato poi che 0= R 2 + X 2 I 0 la (12.134) può essere scritta, facendo uso anche della (12.139), come: (12.140) ottenendo in modo tale una espressione analoga a quella valida nel caso di resistori percorsi da corrente continua, con la sola differenza che per le correnti alternate nell'espressione della potenza media bisogna considerare il valore efficace della corrente. Come era da aspettarsi troviamo inoltre che solo la parte resistiva dell'elemento dissipa energia, trasformandola in calore, mentre la potenza media dissipata nella parte reattiva è nulla. 13 Teoria del campo elettromagnetico 13.1 Equazioni differenziali di Maxwell Abbiamo visto come nello studio dei fenomeni elettrici e magnetici si potessero considerare alcune leggi fondamentali da cui ricavare il complesso dei risultati sperimentali. Ricorderemo il teorema di Gauss dell'elettrostatica che per una distribuzione continua di cariche elettriche con densità p può scriversi nella seguente forma differenziale: div D = ρ (D = εE); (13.1) il teorema di Gauss per la magnetostatica : (B = μH); div B = 0 (13.2) il teorema di Ampère, che per una distribuzione continua di correnti costanti di densità J può scriversi: rot H=J (13.3) la legge dell'induzione elettromagnetica: rot E = − ∂B ∂t (13.4) 148 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 Esse si possono riunire nel seguente sistema di equazioni differenziali: (13.5) con: A queste possiamo aggiungere l'equazione di continuità: (13.6) che esprime la conservazione della carica elettrica. Osserviamo che applicando l'operatore divergenza alla (13.3) si ha: per cui, essendo per un vettore u qualsiasi div rot u = 0, si ha: (13.7) che è in contrasto con l'equazione di continuità (13.6). Da questa discende infatti che la (13.7) non è in generale valida, ma che essa lo è solo per i fenomeni ∂B = 0 o, come si suol dire, in regime stazionari per i quali vale la condizione ∂t permanente. L'equazione rot H = J non è quindi valida in generale, ma solo per i regimi stazionari o permanenti. Ciò può essere verificato in modo intuitivo nella maniera seguente. Si consideri il circuito di Fig. 13.1 che consiste in un piccolo condensatore a facce piane caricato da una corrente I(t). Tracciato un contorno C che contenga 13.1 - Verifica della legge di circuitazione di Ampere. Le superfici S1 ed S2 si appoggiano al contorno C. FIG. 13.1] EQUAZIONI DIFFERENZIALI DI MAXWELL 149 il conduttore che adduce la corrente, consideriamo due superficie S1 e S2 che si appoggiano a tale contorno; di queste S1 sia esterna alla regione compresa fra le armature del condensatore, mentre S2 tagli proprio tale regione. Applicando allora il teorema di Ampère (che non è altro che l'espressione finita della legge differenziale rot H = J) al contorno C e alla superficie S1 avremo: (13.8) Applicando lo stesso teorema al contorno C e alla superficie S2 avremo invece : (13.9) Evidentemente la (13.8) e la (13.9) sono fra loro in contraddizione. La ragione fisica di ciò va cercata nel fatto che, come ha chiarito Faraday, nel dielettrico (che può essere anche il vuoto) contenuto fra le armature del condensatore si generano delle correnti, dette di spostamento, che chiudono per cosi dire il circuito e delle quali chiaramente non si è tenuto conto scrivendo la (13.9). L'equazione rot H = J va pertanto scritta nel modo seguente: rot H = J + Js essendo Js la densità della corrente di spostamento. Per determinare l'espressione di Js possiamo procedere in un modo formale, ma assai semplice, che consiste sostanzialmente nel generalizzare opportunamente la legge di Ampère in modo da renderla valida anche per i fenomeni variabili e compatibile con l'equazione di continuità (13.6). Dovrà essere infatti: rot H = J rot H = J + Js ≡ u per regimi stazionari per regimi non stazionari. Il vettore da determinarsi u è pertanto tale che, nel caso di regimi stazionari, si dovrà ridurre a J e in ogni caso (per il fatto che esso è uguale a rot H ) dovrà soddisfare alla: div u = 0. Osserviamo che in conseguenza della (13.6) si ha: da cui, tenendo conto della (13.1), si ricava: (13.10) cioè : (13.11) 150 Prendendo TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 tutte le condizioni richieste risul teranno evidentemente soddisfatte. Con ciò l'equazione differenziale di Ampère verrà ad essere costituita dalla: (13.12) valida in generale. Le equazioni differenziali (13.5) verranno così ad essere sostituite dalle seguenti: (13.13) che riassumono pertanto tutte le leggi fondamentali della elettrologia e del magnetismo, e che valgono per campi comunque variabili col tempo. Esse costituiscono il sistema delle equazioni di Maxwell. Si osservi che, dato il procedimento adottato per generalizzare l'equazione rot H = J, l'equazione di continuità (13.6) risulta pure contenuta nel sistema di equazioni di Maxwell. Ad ogni modo per verificare direttamente questa affermazione applichiamo l'operatore divergenza alla seconda delle (13.13). Si ha: (13.14) trasformando il secondo membro per mezzo della prima delle (13.13) e ricordando che per un vettore u qualsiasi si ha div rot u = 0, si ottiene immediatamente l'equazione di continuità (13.6). Quest'ultima osservazione mette anche in rilievo il fatto che le equazioni che costituiscono il sistema (13.13) non sono fra loro indipendenti. D'altra parte, tenendo conto delle relazioni strutturali D = εE, B = μH, esse risultano in numero di otto equazioni scalari in solo sei funzioni incognite (le tre componenti di E e le tre componenti di H). Precisamente, tenendo conto del procedimento ora seguito per ricavare l'equazione di continuità, possiamo considerare come effettivamente indipendenti le equazioni (13.15) 13.1] EQUAZIONI DIFFERENZIALI DI MAXWELL 151 (vale a dire quelle che contengono le sorgenti del campo ρ, J) a cui vanno aggiunte le relazioni strutturali D = εE, B = μH. Abbiamo così due equazioni vettoriali che definiscono i due vettori E e H. Queste due equazioni, con le corrispondenti condizioni iniziali e al contorno, determinano E e H completamente. In altri termini, il sistema di equazioni di Maxwell è un sistema completo. È anche facile rendersi conto dell'unicità della soluzione di tali equazioni. Infatti se, per ipotesi, si assumesse l'esistenza di due soluzioni distinte avremmo, come conseguenza della linearità delle equazioni di Maxwell, che anche la differenza di dette soluzioni sarebbe pure una soluzione delle equazioni corrispondenti a sorgenti nulle (J = 0, ρ = 0) e a valori iniziali e al contorno pure nulli. Ma tale soluzione risulta identicamente nulla. Notiamo infine che l'equazione tenendo conto che : può essere scritta nella forma: dove ovviamente il termine ∂P è diverso da zero solo in presenza di mezzi ∂t materiali. Il termine che abbiamo chiamato densità di corrente di spostamento, risulta scisso in ∂E due parti: la prima soltanto, cioè ε 0 , deve effettivamente essere considerata una ∂t densità di corrente di spostamento, dovuta cioè a variazione nel tempo del campo ∂P elettrico; la seconda, rappresenta una densità di corrente dovuta alle cariche ∂t ∂P legate. Ricordando la relazione σp = P ⋅ n appare che ha le dimensioni di una ∂t densità di corrente. Consideriamo un dielettrico in cui vi siano N dipoli per unità di volume, ognuno con momento di dipolo p, che nell'intervallo di tempo dt subisca una variazione dp. Tale variazione può essere attribuita ad uno spostamento di un tratto dl subito da una carica q. È allora dp = q dl. La densità di carica che si sposta è ρ = Nq ed essa produce una densità di corrente data da: essendo P = Np la densità di polarizzazione macroscopica. 152 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 13.2 Conservazione dell'energia e vettore di Poynting Consideriamo una regione dello spazio di volume V racchiusa da una superficie S entro la quale esista un campo elettromagnetico e delle correnti elettriche che, per effetto Joule, dissipino una potenza PJ. La forza per unità di volume (o densità di forza) che agisce sulle cariche è: (13.16) Dove si è supposto che la corrente sia dovuta al moto di particelle di carica q con velocità v in numero di N per unità di volume. Il lavoro che la densità di forza f compie nell'unità di tempo sulle cariche, cioè la densità di potenza, è : (13.17) avendo utilizzata la definizione J = Nqv. Il risultato, come era prevedibile, non dipende dal campo magnetico dato che la forza magnetica è perpendicolare allo spostamento della carica e quindi non compie lavoro. La potenza dissipata per effetto Joule nel volume V è allora: (13.18) Sostituendo a J l'espressione che si ricava dalla seconda delle equazioni di Maxwell (13.13) abbiamo: (13.19) Trasformiamo questa espressione valendoci della formula (vedi tabella 1.1) di calcolo vettoriale: (13.20) e utilizzando per rot E la espressione che risulta dalla quarta delle equazioni (13.13), troviamo che: (13.21) Osservando poi che: 13.3] QUANTITÀ DI MOTO ELETTROMAGNETICA 153 si ottiene: (13.22) ove si è indicato con W l'energia del campo elettromagnetico contenuta nel volume V e cioè: (13.23) Trasformando il primo integrale al secondo membro della (13.21) mediante il teorema di Gauss e introducendo il vettore: (13.24) si ha: (13.25) L'equazione (13.21) si scrive pertanto: (13.26) La (13.26) esprime la legge di conservazione dell'energia per il campo elettromagnetico. Essa mette in evidenza il fatto che l'energia del campo in una regione dello spazio varia a causa di due fattori: la dissipazione per effetto Joule entro il volume V ed il flusso di energia che entra o esce da tale regione attraversando la superficie S che la racchiude. Si osservi che il secondo termine del secondo membro della (13.26) tiene conto del flusso dell'energia elettromagnetica attraverso la superfìcie S delimitante il volume V. È perciò chiaro che S = (E × H) è un vettore associato al propagarsi dell'energia elettromagnetica nello spazio. Esso è denominato vettore di Poynting. 13.3 Quantità di moto elettromagnetica Consideriamo un campo elettromagnetico E, B, che agisce in un volume V su una distribuzione continua di cariche con densità variabile ρ. Possiamo dire che sulla carica dq =ρ dυ si esercita la forza elettromagnetica : (13.27) 154 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 essendo: (13.28) la densità della forza. La forza risultante su tutto il volume V è allora: (13.29) Notiamo che per il caso che stiamo trattando la corrente è determinata completamente dal moto delle cariche per cui: (13.30) Usando quindi le equazioni di Maxwell: (13.31) possiamo eliminare ρ e v dalla (13.28) ottenendo: (13.32) tenendo poi presente che: (13.33) la (13.32) si trasforma nella seguente espressione: (13.34) Integrando sul volume V otteniamo: (13.35) dove con Σ abbiamo indicato simbolicamente il complesso dei quattro termini rimanenti. Ma, come si può verificare dopo opportune manipolazioni (1), l'ultimo (1) Vedi per esempio J. D. Jackson: Classica! Electrodynamics pag. 190-194. 13.4] POTENZIALI DEL CAMPO ELETTROMAGNETICO 155 mo integrale può essere trasformato in un integrale di superficie di un'espressione contenente solo i quadrati delle diverse componenti di E e di H. Di conseguenza in un sistema isolato, sul quale agiscono solo forze elettromagnetiche, prendendo un volume V sufficientemente grande (al limite infinito) in modo che E ed H si annullino sulla superficie, tale integrale risulta nullo. Possiamo quindi scrivere: (13.36) La forza F agendo sulle cariche contenute in V impartisce a queste una accelerazione. Denotiamo con GM la quantità di moto totale delle particelle cariche in V. Per la legge di Newton possiamo scrivere: (13.37) Dalla (13.36) si ricava pertanto: (13.38) da cui si vede che, per un sistema elettromagnetico isolato, la quantità di moto meccanica GM non è una costante del movimento, ma è invece tale la grandezza che si ottiene aggiungendo ad essa il termine: (13.39) Detto termine prende il nome di quantità dì moto o impulso elettromagnetico. Il vettore: (13.40) ha pertanto il significato di densità della quantità di moto elettromagnetica. 13.4 Potenziali del campo elettromagnetico Riprendiamo in considerazione il sistema (13.13) delle equazioni di Maxwell. L'espressione : div B = 0 (13.41) dice che il vettore B è a divergenza nulla, ossia, come si suol dire, che esso è un vettore solenoidale. Come conseguenza di questo fatto sappiamo che esiste 156 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 un vettore A detto potenziale magnetico o potenziale vettore tale che : B = rot A. Con questa posizione l'altra equazione di Maxwell: (13.42) (13.43) si può scrivere: (13.44) ∂A è a rotore nullo o, come si suol dire, irro ∂t tazionale. Per un noto teorema di calcolo vettoriale esiste uno scalare ψ tale che : la quale esprime che il vettore E + (13.45) Ponendo poi ψ = - ϕ, si potrà scrivere : (13.46) Chiameremo ϕ potenziale scalare o potenziale elettrico. È importante notare il fatto che i potenziali A e ϕ, funzioni di x, y, z, e di t, introdotti per mezzo delle relazioni (13.42) e (13.46), non risultano completamente determinati. Nei problemi pratici di elettrodinamica si limita la notevole arbitrarietà, che è una conseguenza delle predette incomplete definizioni, imponendo la condizione che A e ϕ soddisfino all'equazione supplementare (detta di Lorentz): (13.47) Si noti che questa condizione non comporta alcuna limitazione alle soluzioni dei problemi fisici, i quali si debbono sempre poter esprimere come relazioni fra le grandezze E e H che definiscono effettivamente il campo : e queste grandezze sono completamente determinate dalle equazioni di Maxwell, indipendentemente dal fatto che esse si esprimano in funzione di altre grandezze, quali i potenziali A e ϕ, che possono o no venir definiti in modo completo. Vogliamo ora scrivere, limitandoci per semplicità al caso di un mezzo omogeneo isotropo e lineare (ε = cost) le equazioni differenziali del secondo ordine a cui soddisfano i potenziali A e ϕ. 13.4] POTENZIALI DEL CAMPO ELETTROMAGNETICO 157 Sostituendo la (13.46) nell'equazione: (13.48) si ha: (13.49) Tenendo conto dell'equazione supplementare (13.47) e della relazione: (13.50) si ottiene l'equazione: (13.51) Analogamente, sostituendo nell'equazione: (13.52) la (13.42) e la (13.46), tenendo conto delle relazioni tra H e B e tra E e D, si ha: (13.53) Trasformando il primo membro per mezzo della nota relazione di calcolo vettoriale : (13.54) si ha: (13.55) onde, tenendo al solito conto dell'equazione supplementare (13.47), si trova: (13.56) Le (13.51) e (13.56) costituiscono le equazioni differenziali del secondo ordine a cui soddisfano i potenziali del campo elettromagnetico. 158 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 Di notevole interesse sono le soluzioni di queste equazioni, che ci limitiamo a riportare senza dimostrazione: (13.57) dove si è posto v = 1 / εμ = 1/J/e/z e la scrittura [ ]t - r/v sta ad indicare il valore che la funzione entro parentesi assume in ogni punto Q (distante r da P) al tempo t - r/v (essendo r/v il tempo necessario per percorrere con la velocità v la distanza r). Queste soluzioni esprimono quindi il ben noto fatto che una perturbazione elettromagnetica si propaga in un mezzo qualsiasi omogeneo con la velocità costante v ; in altri termini i potenziali ϕ e A, generati da una certa distribuzione di cariche e di correnti, si fanno sentire nei vari punti dello spazio con un certo ritardo. Per questa ragione ϕ e A, dati dalla (13.57), si dicono potenziali ritardati e le equazioni (13.51) e (13.56) che li definiscono si dicono equazioni dei potenziali ritardati. 13.5 Equazione generale delle onde Una delle più importanti applicazioni delle equazioni di Maxwell consiste nella possibilità di dimostrare che, come conseguenza di esse, esistono campi elettromagnetici che si possono propagare in un mezzo con legge analoga a quella dei moti ondosi. Si suole pertanto parlare di onde elettromagnetiche. Premettiamo una osservazione sul vettore densità di corrente J. Nel caso che il mezzo, supposto omogeneo, sia conduttore, vale la legge di Ohm: J=σE (13.58) essendo σ la conducibilità elettrica. Se il mezzo è isolante si pone invece σ = 0 per cui J = 0. Tratteremo dapprima il caso di un mezzo conduttore omogeneo indefinito. Applicando l'operatore rotore ai vettori che costituiscono i due membri dell'equazione: (13.59) abbiamo : (13.60) 13.5] EQUAZIONE GENERALE DELLE ONDE 159 che ponendo D = ε E, J = σ E si scrive: (13.61) Valendosi dell'altra equazione di Maxwell: (13.62) e ricordando la relazione vettoriale valida per un vettore u qualsiasi rot rot u = grad div u - ∇2 u, la (13.61) si scrive: (13.63) Ma essendo per un mezzo omogeneo: (13.64) si ottiene per H l'equazione delle onde: (13.65a) Considerando ora il vettore E, con un procedimento del tutto analogo e supponendo il mezzo privo di cariche libere, per cui ρ = 0 e quindi div D = 0. si ottiene: (13.65b) Le equazioni precedenti nel caso di un mezzo isolante, per cui σ = 0, si riducono alle: (13.66) Si noti che le equazioni delle onde (13.65), o le (13.66) per un mezzo isolante, determinano E e H in maniera non completa. Infatti esse sono state ricavate dalle primitive equazioni di Maxwell eseguendo delle derivazioni per cui non è detto che le loro soluzioni siano necessariamente tutte anche soluzioni 160 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 delle equazioni di Maxwell. Per avere soluzioni delle onde che siano soluzioni anche delle equazioni di Maxwell occorre sostituire le soluzioni delle equazioni delle onde nelle primitive equazioni di Maxwell e vedere quali condizioni si devono imporre affinchè anche quest'ultime equazioni siano effettivamente soddisfatte. Facciamo notare che, introducendo l'operatore dalembertiano ≡ ∂2 ≡ ∇ 2 − εμ 2 l'equazione delle onde si può scrivere nella forma: ∂t H=0 e E=0 13.6 Onde piane in un mezzo omogeneo isolante. Ponendo : (13.67) le (13.66) si scrivono: (13.68) Ricordiamo che queste sono una conseguenza delle equazioni di Maxwell le quali, per il caso che stiamo trattando, si scrivono: (13.69) Ci proponiamo di trovare, se è possibile, una soluzione particolare delle (13.69), e quindi anche delle (13.66), la quale risulti indipendente dalle variabili y e z. Detta soluzione dovrà cioè essere tale che i vettori E e H siano funzioni 13.6] ONDE PIANE IN UN MEZZO OMOGENEO ISOLANTE 161 unicamente di x e di t. Fisicamente ciò significa che tali vettori avranno, ad un dato istante, lo stesso valore in tutti i punti di un piano normale all'asse x. In conseguenza dell'ipotesi assunta ogni componente del campo elettrico e magnetico soddisferà alla seguente equazione che deriva immediatamente dalle (13.66): (13.70) La (13.70) è la nota equazione delle corde vibranti di cui è conosciuta la soluzione. Nel caso generale, questa è del tipo: (13.71) essendo le fi delle funzioni generiche. Ci limitiamo qui a provare che la f1 (x - vt) e la f2 (x + vt) sono soluzioni della (13.70), procedendo per semplice sostituzione. Si ha infatti (indicando con l'apice la derivata della funzione rispetto al suo argomento) : (13.72) da cui si vede che la (13.70) risulta soddisfatta. In modo analogo si verifica che la f2 (x + vt) è pure soluzione della (13.70). Essendo poi questa un'equazione lineare, anche la è soluzione della stessa. Veniamo ora al significato fisico delle funzioni f1 (x - vt) e f2 (x + vt). La prima rappresenta una perturbazione che si propaga lungo il verso positivo dell'asse x con velocità v (onda progressiva), la seconda una perturbazione che si propaga lungo il verso negativo dello stesso asse con la stessa velocità v (onda regressiva). Infatti la perturbazione f1 all'istante t1 e nel punto x1 ha il valore f1 (x1 - vt1). Ma tale valore, come è mostrato in Fig. 13.2, è ritrovato nel punto x2 = x1 + Δx all'istante t2 = t1 + τ dato che si ha: (13.73) e questo vale solo se gli argomenti della funzione f1 sono uguali ; ne deduciamo che nel tempo τ la perturbazione ha subito uno spostamento Δx = (x2 - x1) = ντ, muovendosi quindi con la velocità v in direzione delle x positive. 162 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 13.2 - Onda progressiva: perturbazione propagante lungo il verso positivo dell'asse x con velocità v = (x2 - x1) /τ FIG. È d'altra parte facile mostrare che la quantità v = 1 / εμ ha le dimensioni di una velocità. Infatti: (13.74) Nel caso dello spazio libero si ha che v = c = 1 / ε 0 μ 0 = 2,9979 ⋅ 108 m/s che rappresenta la velocità della luce nel vuoto. Considerazioni analoghe si possono fare per l'interpretazione di f2 (x + vt). Cerchiamo ora di esplicitare le espressioni delle componenti di E e di H. Cominciamo con l'osservare che per le componenti Ex, Hx le equazioni div E = 0 e divH = 0 danno: (13.75) e le rimanenti due equazioni di Maxwell relative al rotore di E e di H portano alle: Avremo quindi (introducendo delle funzioni generiche ψi, χi, γi, δi): (13.76) (13.77) Per le applicazioni pratiche interessano solo i fenomeni che si manifestano nei campi variabili, per cui potremo trascurare gli effetti delle componenti longitudinali costanti c1 e c2 ed assumere Ex = Hx = 0. Con questa posizione la soluzione considerata rappresenterà delle onde trasversali che si propagano, 13.6] ONDE PIANE IN UN MEZZO OMOGENEO ISOLANTE 163 sovrapponendosi, nei due sensi dell'asse x, con velocità v. Di regola poi nelle applicazioni si hanno da considerare onde che si propagano solo in un senso dell'asse x (ad esempio in avanti, cioè lungo il senso positivo dell'asse x); porremo quindi : Con ciò la soluzione in considerazione sarà rappresentata dalle espressioni: (13.78) Ricordiamo però che, come già si è detto, le varie funzioni che compaiono nelle (13.78) non sono tra loro indipendenti, ma risultano legate da relazioni. Infatti, nell'eliminazione operata per dedurre le equazioni del secondo ordine (13.68) da quelle primitive di Maxwell, si sono eseguite le derivazioni, per cui non è detto che le soluzioni delle (13.68) soddisfino anche le (13.69). Occorre pertanto sostituire le (13.78) nelle (13.69) e vedere quali condizioni si devono imporre affinchè queste ultime risultino soddisfatte. Eseguendo tale sostituzione si trovano precisamente le seguenti condizioni: (13.79) (l'apice indica derivazione rispetto all'argomento della funzione). Tenendo conto dell'espressione di v si ha che le equazioni della prima coppia sono identiche fra loro e così pure quelle della seconda. In definitiva le varie funzioni risultano fra loro legate dalle relazioni (naturalmente la costante di integrazione può essere presa eguale a zero): (13.80) da cui derivano per conseguenza le seguenti: (13.81) Questo legame può anche essere scritto in forma sintetica vettoriale. Infatti, denotato con i il versore dell'asse x, che nel nostro caso coincide con la direzione di propagazione, si ha: (13.82) 164 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 con E perpendicolare a i ma diretto in modo qualsiasi. Possiamo così concludere che per un'onda «piana», un'onda cioè in cui campo elettrico e campo magnetico risultano costanti su ogni piano perpendicolare alla direzione di propagazione, campo elettrico, campo magnetico e direzione di propagazione formano una terna ortogonale. Inoltre le ampiezze di E e di H sono legate in ogni punto ed in ogni istante, dalle relazioni (13.81) e la velocità di propagazione è data dalla (13.67). I risultati ottenuti sono tali da poter essere messi in diretto raffronto con alcuni dati sperimentali. Allo scopo osserviamo che, secondo quanto risulta dall'ottica, si definisce indice dì rifrazione assoluto di un mezzo la quantità : (13.83) dove c rappresenta la velocità di propagazione della luce nel vuoto e v la velocità di propagazione della luce nel mezzo. Confrontando questa relazione con la (13.67) troviamo, come risultato derivante dalle equazioni di Maxwell, che deve essere: (13.84) Praticamente però, dato che la permeabilità magnetica relativa dei corpi trasparenti, e quindi non ferromagnetici, è estremamente prossima ad uno, si ha con sufficiente approssimazione che: (13.85) Il confronto fra i valori sperimentali di n e quelli di ε r , è mostrato nella tabella 13.1 dove sono riportati gli indici di rifrazione corrispondenti alla riga D del sodio. Tabella 13.1. Sostanza Ossigeno ......................... Azoto .............................. Idrogeno ......................... Aria. ..................... ......... Anidride Carbonica ....... Acqua ............................ Vetro (flint) .................. Solfuro di carbonio ....... Benzolo ........................... Allume .......................... n εr 1,000272 1,000297 1,000132 1,000295 1,000473 1,333 1,51 1,63 1,502 1,46 1,000273 1,000300 1,000138 1,000294 1,000450 9 2,5 1,65 1,514 2,58 13.7] ONDE SINUSOIDALI 165 Come si vede, la relazione (13.85) è in alcuni casi ben verificata, specialmente per i gas, in altri casi invece essa cade completamente in difetto. La ragione di questa discrepanza è da ricercarsi nel fatto che la costante dielettrica, quale risulta dalle misure ordinarie, è dedotta dalla polarizzazione elettrica della sostanza sotto l'azione di campi elettrici costanti; i campi elettrici della radiazione luminosa sono invece variabili con frequenze dell'ordine di 1015 periodi al secondo, e per tali frequenze l'azione del campo elettrico è assai diversa che per i campi statici : in altri termini, i fenomeni di polarizzazione e conseguente-mente i valori di εr, dipendono dalla frequenza del campo elettrico stesso. Ne consegue che anche n è funzione della frequenza, cioè che in generale il mezzo è dispersivo: questo è di regola il comportamento delle sostanze. E poiché, com'è ovvio, er tende al valore elettrostatico per v → 0, ossia λ → ∞, è da presumere che la (13.85) sia verificata tanto meglio quanto maggiore è il valore di λ in corrispondenza del quale viene misurato l'indice di rifrazione: difatti le onde hertziane la verificano già meglio che non le luminose (1). D'altra parte l'equivalenza fra onde luminose ed onde elettromagnetiche è stata successivamente dimostrata in modo diretto e completo. Difatti l'odierna tecnica elettronica permette di realizzare opportuni generatori di microonde di lunghezze così corte (onde millimetriche) da sovrapporsi a quelle dell'estremo spettro infrarosso di alcune molecole. L'esperienza permette di verificare come il comportamento dei due tipi di onde sia perfettamente equivalente. 13.7 Onde sinusoidali Se nella soluzione dianzi ottenuta dell'equazione delle onde, che, come abbiamo detto, rappresenta il propagarsi di un'onda piana, poniamo ulteriormente Ez = 0, si ottiene dalle (13.81) che Hy = 0 e che: (13.86) In questa soluzione particolare il campo elettrico varia nel tempo mantenendosi sempre parallelo all'asse y: si suol dire che l'onda è polarizzata rettilineamente lungo l'asse y. Se in particolare si considerano onde in cui la vibrazione del campo elettrico avviene secondo una legge sinusoidale, (vedi Fig. 13.3) e cioè ad esempio: (13.87) (1) Le onde hertziane hanno lunghezze d'onda comprese tra 104 e 10-4 metri, mentre le onde luminose sono caratterizzate da lunghezze d'onda comprese tra 10-6 e 10-7 metri. 166 FIG. 13.3 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 - Onda sinusoidale polarizzata linearmente. per la (13.86) abbiamo: (13.88) Queste soluzioni rappresentano fisicamente la propagazione di un'onda monocromatica avente lunghezza d'onda λ, ampiezza E0y per il campo elettrico e H0z, per il campo magnetico e fase iniziale β. Per un istante t fissato abbiamo che la distanza tra due punti nei quali il campo assume lo stesso valore è uguale alla lunghezza d'onda. Se ci poniamo fissi in un punto, l'intervallo di tempo, chiamato periodo ed indicato con il simbolo T, che è necessario attendere perché il campo riacquisti lo stesso valore risulta legato alla lunghezza d'onda ed alla velocità di propagazione dalla relazione: (13.89) 1 dell'onda, la lunghezza d'onda λ e la velocità di T propagazione v vale perciò la relazione: Tra la frequenza v = (13.90) Chiameremo inoltre pulsazione dell'onda la quantità ω = 2πv. Da un punto di vista analitico sono però possibili anche soluzioni dell'equazione (13.69) che si possono ottenere dalla sovrapposizione di tante funzioni del tipo (13.87) e (13.88), ma ognuna di esse è caratterizzata da un diverso valore della frequenza v; si può pure dimostrare che ogni generica soluzione del tipo (13.77) può essere rappresentata come sovrapposizione di una successione discreta (serie di Fourier) o continua (integrale di Fourier) di onde sinusoidali di frequenza diversa. Da un punto di vista fisico, questo risultato trova riscontro nel fatto che ogni vibrazione elettromagnetica complessa si può risolvere spettroscopicamente 13.7] ONDE SINUSOIDALI 167 in tante vibrazioni semplici di frequenza diversa (principio di sovrapposizione). Si noti che finora abbiamo sempre assunto per semplicità l'asse x (di versore i) come direzione di propagazione dell'onda. Ciò è rispecchiato ad esempio nella formula (13.82). Esplicitando questa nel caso di un'onda monocromatica possiamo scrivere: (13.91) essendo cp la fase dell'onda che, definendo : e ricordando le relazioni tra λ, v, ν ed ω è data da: (13.92) (13.93) Come è facile vedere dalla (13.93), ad un determinato istante t = t0 le superficie a fase costante (superficie equifase) sono dei piani perpendicolari all'asse x. In altri termini E ed H assumono gli stessi valori in tutti i punti di un piano x = cost. Se si suppone invece che l'onda piana si propaghi lungo una direzione individuata da un versore generico u (non necessariamente coincidente con l'asse delle ascisse) le superficie a fase costante sono allora, in un dato istante, i piani normali a tale direzione. Pertanto, ad un istante fissato t = t0, un punto generico P, la cui posizione è individuata rispetto ad un'origine O dal vettore r = OP, appartiene alla superficie di fase coincidente con il piano Π (in Fig. 13.4 né è disegnata la traccia) passante per P e normale alla direzione del versore u. FIG. 13.4 - Onda piana che propaga in una direzione generica u. Ciò equivale ad assumere, come fase ϕ, anziché la (13.93), l'espressione: ϕ = (k ⋅ r - ωt + β) (13.94) 168 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 dove si è posto: k = k u. (13.95) Il vettore k, parallelo alla direzione di propagazione dell'onda, viene chiamato vettore di propagazione. Si può quindi scrivere l'equazione generale dell'onda piana nel modo seguente: (13.96) con E arbitrario purché perpendicolare ad u. La (13.96) costituisce la cosiddetta equazione del raggio per la radiazione elettromagnetica. 13.8 Rappresentazione complessa delle onde Se una radiazione monocromatica di frequenza v = ω propaga lungo il senso 2π positivo dell'asse x, la grandezza vibrante ψ è espressa, secondo quanto visto nel paragrafo precedente, dalla equazione: (13.97) Un'altro modo di rappresentare un'onda monocromatica si ha scrivendo l'equazione (13.97) sotto forma complessa: (13.98) dove con j abbiamo indicato la quantità − 1 . Si osservi infatti che anche questa espressione è una soluzione dell'equazione delle onde (13.70). In questa rappresentazione è poi evidente che la ψ è una quantità complessa, ma si conviene di far corrispondere ad essa la stessa grandezza fìsica che, nella rappresentazione reale consueta, viene ad essere rappresentata dalla parte reale della (13.98). Con questa convenzione le scritture (13.97) e (13.98) risultano equivalenti. Infatti si può scrivere: (13.99) prendendo, secondo la convenzione fatta, la sola parte reale di questa espressione si ha proprio la (13.97). L'espressione esplicita dei vettori E ed H che caratterizzano l'onda piana (13.96) propagante nella generica direzione individuata dal versore u nella 13.9] ONDE PIANE MONOCROMATICHE IN UN MEZZO CONDUTTORE 169 rappresentazione complessa è data da: (13.100) con E0 arbitrario purché perpendicolare ad u. 13.9 Onde piane monocromatiche in un mezzo conduttore Dato un mezzo conduttore omogeneo indefinito, caratterizzato nelle equazioni di Maxwell dal termine J = σE, le equazioni delle onde elettromagnetiche che in esso propagano si possono ancora dedurre seguendo un procedimento analogo a quello usato per il caso di un mezzo isolante. Tali equazioni risultano essere: (13.101) Nel caso di un'onda piana monocromatica che propaga lungo l'asse x, si ha per una generica componente ψi (x, t) trasversale di E e di H l'espressione: dove la funzione complessa Φ (x) soddisfa all'equazione : (13.102) (13.103) Questa ammette una soluzione del tipo: dove γ risulta dato dall'equazione algebrica: (13.104) (13.105) La tecnica ordinaria dell'algebra dei numeri complessi permette, posto γ = α + jβ, di determinare parte reale a e coefficiente β del numero complesso γ. 170 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 Si trova con qualche calcolo: (13.106) L'onda piana che propaga nel verso positivo dell'asse x è caratterizzata dall'espressione: (13.107) che rappresenta un'onda smorzata nella direzione di propagazione. Nel caso in cui σ » εω il coefficiente di smorzamento assume l'espressione assai semplice : (13.108) Il termine d=1/β misura la distanza alla quale un'onda elettromagnetica che penetra in un mezzo conduttore si riduce nell'intensità a 1/e-esimo (vale a dire ~ 1/3) del suo valore iniziale. Ad esempio per l'argento, per frequenze dell'ordine di 1010 hertz, si ha σ = 3-107 mho/m, per cui (13.109) da cui si vede come la penetrazione delle onde sia assai piccola. 13.10 Quantità di moto, energia, intensità di un'onda elettromagnetica Come abbiamo visto nei paragrafi 13.2 e 13.3 a un campo elettromagnetico contenuto in una regione di volume V in un mezzo di natura qualsiasi sono associate una energia W e una quantità di moto Gem date da : (13.110) essendo w e g le densità rispettivamente di energia e di quantità di moto: (13.111) Nel caso di un'onda elettromagnetica piana che propaga in un mezzo omogeneo 13.10] QUANTITÀ DI MOTO, ENERGIA, INTENSITÀ DI UN'ONDA 171 ricordiamo che essa è caratterizzata da due vettori ortogonali E e H i cui moduli soddisfano alla relazione ε E= μ H e che la velocità di propaga zione è data da v = 1 εμ Avremo pertanto: (13.112) (13.113) essendo S il vettore di Poynting. Dal confronto delle due si ottiene: (13.114) e (13.115) essendo u il versore della direzione di propagazione dell'onda. È questa una relazione assai importante che stabilisce uno stretto legame fra l'energia e la quantità di moto della radiazione che propaga in un mezzo e in particolare nel vuoto (per cui si ha v = c= 1 / ε 0 μ0 ). Si noti che, secondo l'ipotesi dei quanti, la radiazione è costituita da fotoni ciascuno dei quali propaga, ad esempio nel vuoto, con velocità c e trasportando una energia hv. Dalla (13.115) consegue che ad ogni fotone è pure associata hv una quantità di moto u. c Questo risultato trova una precisa conferma sperimentale, ad esempio nell'effetto Compton. L'energia trasportata da un'onda elettromagnetica nell'unità di tempo attraverso una superficie unitaria ortogonale alla direzione di propagazione è uguale a wv. Considerando la (13.112) e ricordando che v= 1 / εμ possiamo inoltre scrivere che: (13.116) In particolare se il campo E ha un andamento sinusoidale del tipo: (13.117) 172 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 la (13.116) diviene: (13.118) Questa quantità è una funzione del tempo rapidamente variabile e i suoi valori istantanei non possono essere misurati sperimentalmente. In pratica per rappresentare gli effetti osservabili di una radiazione, soprattutto di quella luminosa, si preferisce definire una nuova grandezza I, detta intensità dell'onda elettromagnetica uguale al valore medio dell'energia trasportata dall'onda nell'unità di tempo attraverso l'unità di superficie normale alla direzione di propagazione. Tale definizione tiene conto essenzialmente del fatto che normalmente i rivelatori della radiazione visibile sono sensibili agli effetti termici della luce i quali risultano proporzionali alla quantità media di energia assorbita nell'unità di tempo. Eseguendo allora la media temporale della (13.118) troviamo che per l'intensità I vale la relazione: (13.119) dove la media è stata eseguita su un tempo pari ad un periodo T dell'onda. Come abbiamo già mostrato nel paragrafo 12.14 l'integrale che compare nella (13.119) vale T/2 e pertanto: (13.120) Facciamo notare che quest'ultima espressione è valida solo nel caso particolare di un'onda piana per cui valgono le relazioni (13.81) per la componente del vettore elettrico e di quello magnetico. Nel caso più generale vale la relazione: dove w rappresenta il valor medio della densità di energia elettromagnetica. Il fatto che all'energia elettromagnetica sia sempre associata una quantità di moto ha come conseguenza l'esistenza di una pressione, che la radiazione elettromagnetica esercita su di uno schermo sul quale incida. Consideriamo dapprima il caso di uno schermo perfettamente assorbente. Sia S la sezione di detto schermo ed w la densità di energia trasportata sullo schermo nell'unità di tempo da parte della radiazione, che supponiamo dapprima incidere normalmente. Se tale radiazione è costituita da un gruppo d'onde (1) di lunghezza l, la quantità di energia raccolta sullo schermo, nel (1) Per gruppo d'onde di lunghezza l s'intende una successione di onde che si estende per un tratto / lungo la direzione di propagazione. 13.10] QUANTITÀ DI MOTO, ENERGIA, INTENSITÀ DI UN ONDA 173 l tempo t = è W=wlS; a questa energia è associata una quantità di moto data da c wlS . Questa quantità di moto, posseduta dalla radiazione viene trasmessa G em = c interamente allo schermo assorbente, sul quale pertanto, in virtù del noto teorema dell'impulso (Ft = G) si esercita una pressione p data dalla relazione : (13.121) da cui, ricordando che è l = t si ricava: c p = w (schermo assorbente e incidenza normale) . (13.122) Se lo schermo, anziché assorbente, è invece perfettamente riflettente, esso subisce una pressione doppia, perché invertendo il gruppo d'onde, a cui è associato il propagarsi della radiazione, il suo verso, in seguito all'urto sullo schermo, si ha una variazione della quantità di moto doppia di quella che si manifesta nel processo di assorbimento. Si ha cioè: p = 2w (schermo riflettente e incidenza normale). (13.123) Supponiamo ora che la radiazione, anziché propagare lungo la direzione normale dello schermo, sia distribuita isotropicamente in tutte le direzioni dello spazio. Sia: w = εE2 (13.124) la densità dell'energia elettromagnetica associata alla radiazione. Riferendosi ad un sistema di assi cartesiani ortogonali si ha: (13.125) onde potremo scrivere: w = wx + wy + w z (13.126) avendo posto: (13.127) Ma, avendo supposto che la distribuzione spaziale della radiazione sia isotropa, si ha wx = wy = wz, onde per la (13.126) il valore comune di queste tre grandezze è : (13.128) 174 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 Si deduce quindi immediatamente, ricordando i risultati stabiliti nel caso dell'incidenza normale, che la pressione esercitata dalla radiazione elettromagnetica, distribuita in modo isotropo nello spazio, su di uno schermo assorbente vale: (13.129) e quella su di uno schermo riflettente: (13.130) 13.11 Condizioni al contorno per campi variabili Le condizioni al contorno che debbono essere soddisfatte da campi elettrici e magnetici sulla superficie di separazione fra mezzi diversi possono essere dedotte ricorrendo alle equazioni stesse cui soddisfano i campi, vale a dire in questo caso alle equazioni di Maxwell. D'altra parte problemi di questo tipo sono stati da noi affrontati nello studio del comportamento dei vettori E, D e B, H in elettrostatica e magnetostatica per cui qui ci limiteremo a ricavare in modo coinciso le sole relazioni fondamentali. 13.5 - Calcolo delle condizioni al contorno sulla superficie di separazione Σ per i vettori elettrici e magnetici. FIG. Data una superficie Σ di separazione tra due mezzi qualsiasi, consideriamo, come mostrato in Fig. 13.5, un piccolo cilindro intersecato da Σ con superficie di base Δa. Integrando l'equazione di Maxwell: (13.131) su tutto il volume V del cilindretto otteniamo: (13.132) 13.11] CONDIZIONI AL CONTORNO PER CAMPI VARIABILI 175 Applicando il teorema della divergenza all'integrale a sinistra abbiamo: (13.133) dove a rappresenta la densità superficiale di carica posta su Σ, che in particolare può anche essere nulla. È facile vedere che facendo tendere a zero l'altezza del cilindretto gli unici contributi non nulli al flusso D sono quelli attraverso le due basi. Dopo semplici passaggi si trova così che: (13.134) avendo indicato con D1n e D2n le componenti del vettore D normali alla superficie Σ, in punti molto prossimi ad essa, rispettivamente nel primo e nel secondo mezzo. Se ripetiamo lo stesso calcolo con l'altra equazione di Maxwell: (13.135) ricaviamo le condizioni al contorno per le componenti di B normali alla superficie Σ, e cioè: (13.136) Prendiamo ora in esame un piccolo cammino chiuso C, come mostrato in Fig. 13.5, con basi di lunghezza Δl ed altezza Δh, intersecato dalla superficie di separazione Σ. Calcoliamo il flusso attraverso C di rot E. Essendo : (13.137) Si ha: (13.138) Trasformando l'integrale a sinistra mediante il teorema di Stokes questa espressione diviene: (13.139) Se facciamo tendere a zero l'altezza Ah del circuito C, mantenendo le due basi da parti opposte rispetto a Σ, possiamo calcolare l'integrale di linea lungo C considerando i soli due tratti di lunghezza Δl mentre l'integrale di superficie si 176 TEORIA DEL CAMPO ELETTROMAGNETICO annulla purché [CAP. 13 ∂B sia finito. Dalla (13.139) ricaviamo pertanto: ∂t (13.140) relazione che fornisce le condizioni di contorno per le componenti di E tangenti alla superficie Σ. Con procedimento analogo, partendo dalla quarta equazione di Maxwell: (13.141) troviamo infine che per le componenti di H tangenziali a Σ vale la condizione al contorno: (13.142) dove Js è la corrente superficiale, misurata in ampere per metro, che fluisce sulla superficie di separazione attraverso il circuito C. La corrente Js rappresenta una corrente finita in uno strato infinitesimo ed è diversa da zero solo nel caso di conducibilità infinita di uno dei due mezzi. Come problema particolare supponiamo che il primo mezzo sia il vuoto o un dielettrico ed il secondo un conduttore con conducibilità infinita. In questo caso la profondità di penetrazione del campo elettromagnetico nel conduttore, come risulta da quanto detto nel paragrafo 13.9, è nulla e perciò E2, D2, B2 e H2 sono uguali a zero. Riconsiderando allora sotto questa ipotesi le quattro espressioni appena ricavate per le condizioni al contorno dei campi, troviamo che esse per il nostro esempio si riducono a: (13.143) Si vede così come sulla superficie di separazione compaiono cariche indotte e correnti con valori che sono determinati dall'intensità del campo elettromagnetico applicato. 13.12 Riflessione e rifrazione delle onde elettromagnetiche Immaginiamo due mezzi dielettrici separati da una superficie, rappresentata in Fig. 13.6 mediante il piano xy. Consideriamo un'onda piana monocromatica (1) che provenendo dal primo mezzo incida sulla superficie di separazione: (1) Si può dimostrare che quanto ricaveremo nel seguito di questo paragrafo vale non solo nel caso di un'onda monocromatica ma anche per un'onda qualsiasi. 13.12] RIFLESSIONE E RIFRAZIONE DELLE ONDE ELETTROMAGNETICHE 177 l'esperienza mostra che una parte dell'onda viene trasmessa (o rifratta) ed una parte riflessa. Indichiamo con ϑ l'angolo di incidenza rispetto alla normale alla superficie di separazione orientata come l'asse z e prendiamo l'asse y in modo che il piano yz contenga la direzione di propagazione dell'onda incidente e coincida quindi con il piano di incidenza (definito come il piano contenente la normale alla superficie di separazione e la direzione di propagazione). FIG. 13.6 - Riflessione e rifrazione di un'onda elettromagnetica su una superficie di separazione tra due dielettrici. Per quanto detto, avremo che i coseni direttori della direzione di propagazione, individuata dal vettore k di modulo k = ω/v1 (v1 essendo la velocità dell'onda nel primo mezzo), rispetto agli assi cartesiani sono: (13.144) Facendo uso della notazione complessa possiamo scrivere il vettore E dell'onda incidente mediante l'espressione: (13.145) Le componenti del campo E lungo l'asse x ed y (la componente lungo l'asse z non è essenziale ai fini di quanto vogliamo dimostrare) sono: (13.146) 178 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 Per quanto riguarda le onde riflessa e rifratta generate dall'onda incidente non faremo altra ipotesi limitativa se non quella che esse sono due onde piane, lasciando completamente indeterminate le loro ampiezze, le frequenze e le direzioni di propagazione. Se allora indichiamo con α x′ , α ′y , α z′ i coseni direttori rispetto ai tre assi del vettore di propagazione dell'onda riflessa di modulo k' = ω'/v1 e con α x′′ , α ′y′ , α z′′ , i coseni direttori del vettore di propagazione dell'onda rifratta di modulo k' = ω'/v2, le componenti x ed y del campo elettrico dell'onda riflessa sono: (13.147) e quelle dell'onda rifratta sono: (13.148) La condizione al contorno (13.140) per la componente tangenziale del vettore E sulla superfìcie di separazione tra i due mezzi, e cioè per z = 0, nel nostro caso si scrive: (13.149) ed (13.150) Sostituendo nelle (13.149) e (13.150) le espressioni (13.146), (13.147) e (13.148) si ottiene: (13.151) e (13.152) Ogni termine contenuto nelle (13.151) e (13.152) dipende dalle variabili t, x ed y e poiché le due espressioni devono essere valide per qualunque valore di queste tre variabili è necessario che i coefficienti delle variabili negli esponenti siano uguali. Abbiamo quindi che deve essere: (13.153) 13.13] CENNO ALLE ONDE EMERGENTI O CONVERGENTI IN UN PUNTO 179 La prima della (13.153) impone che le frequenze delle onde riflessa e rifratta devono essere uguali a quelle dell'onda incidente. La seconda delle (13.153) dice invece che le direzioni di propagazione delle onde riflessa e rifratta giacciono nel piano di incidenza. Riferendoci al disegno di Fig. 13.6, nel quale abbiamo indicato con &' e B" gli angoli formati con l'asse z normale alla superficie di separazione tra i due mezzi, dalle direzioni di propagazione dell'onda riflessa e dell'onda rifratta, abbiamo che: (13.154) Combinando le (13.154) con l'ultima delle (13.153) ricaviamo che: (13.155) Per quanto ricavato precedentemente, e cioè che ω = ω', sappiamo che k = k' e pertanto la prima delle (13.155) diviene: (13.156) che rappresenta la legge della riflessione per la quale l'angolo di incidenza è uguale all'angolo di riflessione. Dato inoltre che k ′ = ω v1 = ω c n1 ed k ′′ = ω v2 = ω c n2 la seconda delle (13.155) si scrive: (13.157) che rappresenta la nota legge di Snell per la rifrazione e cioè : il rapporto tra il seno dell'angolo di incidenza e il seno dell'angolo di rifrazione è costante ed uguale al rapporto tra la velocità dell'onda nel primo e la velocità dell'onda nel secondo mezzo o ugualmente al rapporto tra l'indice di rifrazione assoluto del secondo mezzo e l'indice di rifrazione assoluto del primo mezzo. Con nl2 indichiamo l'indice di rifrazione relativo del secondo mezzo rispetto al primo. Per quanto riguarda il problema della determinazione dell'ampiezza dei vettori elettrici e magnetici associati all'onda riflessa e all'onda rifratta in funzione dell'ampiezza dei vettori dell'onda incidente e delle caratteristiche del mezzo, nonché la discussione dei differenti possibili risultati, rimandiamo il lettore ad un testo di elettromagnetismo più specializzato o ad un testo di ottica. 13.13 Cenno alle onde emergenti o convergenti in un punto In un mezzo isolante omogeneo indefinito le onde emergenti o convergenti sono rappresentate dalla soluzione dell'equazione delle onde: 180 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 (13.158) corrispondente al caso che la ϕ sia funzione, oltre che del tempo t, della sola distanza r da un punto fisso O, che diremo sorgente dell'onda. Esprimendo il laplaciano in coordinate polari si ha: (13.159) Ponendo : (13.160) si ottiene per la χ l'equazione delle corde vibranti: (13.161) la cui soluzione generale è, come sappiamo, data da : (13.162) Il primo termine corrisponde a un'onda emergente da O, per cui: (13.163) il secondo a un'onda convergente per cui: (13.164) In particolare per un'onda monocromatica emergente o convergente avremo rispettivamente : (13.165) o in forma esponenziale: (13.166) 13.14] RADIAZIONE DI UNA CARICA IN MOTO ACCELERATO 181 Naturalmente le relazioni fra i vettori E e H sono analoghe a quelle che abbiamo visto nel caso delle onde piane. 13.14 Radiazione di una carica in moto accelerato Sappiamo che cariche in moto vario emettono radiazioni elettromagnetiche ; in questo paragrafo ci proponiamo di ricavare, anche se in maniera molto semplificata, l'espressione della potenza irradiata da una singola carica. Consideriamo per esempio un elettrone che si muova nel vuoto con velocità u ; la potenza P irradiata da questa carica in moto si ottiene calcolando il flusso del vettore di Poynting S = (E × H) attraverso una superficie sferica contenente la carica al suo centro; abbiamo: (13.167) Per calcolare questo integrale dobbiamo conoscere i valori che E ed H, generati dall'elettrone, assumono sulla superficie sferica. Tali valori possono essere determinati per mezzo del potenziale scalare ϕ e del potenziale vettore A secondo quanto è stato mostrato nel paragrafo 13.4. Schematizzeremo l'elettrone come una distribuzione di carica di densità volumetrica ρ in moto con velocità u localizzata in una regione molto piccola dello spazio. I potenziali elettromagnetici generati nel vuoto da questa distribuzione di carica nel punto r all'istante t secondo la (13.57) si scrivono allora: (13.168) e (13.169) dove con r' abbiamo indicato la posizione delle sorgenti del campo all'istante r − r′ t′ = t − , precedente quindi l'istante t in cui si valuta l'effetto in r. La c difficoltà nell'eseguire il calcolo degli integrali che compaiono nella (13.168) e (13.169) è dovuto principalmente al fatto che per i vari elementi di volume dυ' dobbiamo considerare la funzione integrando a istanti t' diversi. Prendendo in esame l'espressione del potenziale scalare ϕ, vediamo alla luce di questa affermazione che l'integrale ρ (r ′, t ′)dυ ′ non rappresenta la carica ∫ totale situata nello spazio, carica che si otterrebbe nel caso in cui l'integrando 182 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 fosse considerato tutto allo stesso istante, ma che esso tiene conto in effetti del moto delle cariche. Per meglio chiarire questo concetto supponiamo di voler calcolare il potenziale scalare ϕ al tempo t in un punto P distante r dall'origine delle coordinate. Immaginiamo allora una sfera con centro nel punto P che si contragga con velocità uguale alla velocità delle onde elettromagnetiche nel vuoto e che si riduca al punto P all'istante t. La superficie sferica in esame passa in particolare per un punto r', in cui è situata la densità di carica che genera il campo, all'istante r − r′ t′ = t − . Sì può allora pensare che la superficie sferica cosi concepita c raccolga nella sua contrazione tutti i contributi alle densità di carica poste nello spazio nei diversi punti r' negli istanti corrispondenti t'. Se la distribuzione di carica ρ fosse ferma nello spazio la quantità di carica dq spazzata da un elemento dS della superficie sferica che si contrae di dr nel tempo dt sarebbe dq = ρ dS dr. Ma se la carica si muove con velocità u, diretta come mostrato in Fig. 13.7, allora questa quantità risulta diminuita di: Essendo dr/c = dt e dS dr = dυ', la quantità di carica effettivamente spazzata da dS è: ._ (13.170) dalla quale otteniamo che: (13.171) Ponendo questa espressione nella (13.168) si ricava che: (13.172) Se poi la distribuzione di carica è limitata ad un volume molto piccolo, come è nel caso di un elettrone di carica e, i termini dipendenti dalla distanza variano molto lentamente per cui possiamo considerare l'integrando come costante e scrivere : (13.173) 13.14] FIG. RADIAZIONE DI UNA CARICA IN MOTO ACCELERATO 183 13.7 - Superficie sferica che si contrae con velocità c. In maniera analoga per il potenziale vettore si ottiene: (13.174) Queste due espressioni rappresentano i potenziali di Lienard-Wiechert per l'elettrone; dal procedimento seguito consegue che le grandezze fra le parentesi [ ] r − r′ devono essere calcolate all'istante t ′ = t − . Ritornando al nostro pro c blema del calcolo della potenza irradiata dall'elettrone in moto abbiamo che l'espressione (13.167) in coordinate sferiche si scrive: (13.175) dove con (E × H)n indichiamo la componente normale alla superficie sferica del vettore di Poynting e con R il raggio della superficie stessa. Il campo elettrico E, per quanto detto nel paragrafo 13.4, è legato al potenziale vettore A e al potenziale scalare ϕ dalla relazione: (13.176) Possiamo immaginare che a grandi distanze la radiazione emessa dall'elettrone sia approssimabile con un'onda piana e quindi supporre che per le componenti tangenti di E e di H valga la relazione E = μ0 H ε0 Per semplificare il calcolo trascureremo inoltre tutte le componenti di E e di H che vanno a zero più rapidamente di 1/R. Come appare infatti dalla 184 TEORIA DEL CAMPO ELETTROMAGNETICO [CAP. 13 (13.175) per R molto grande il contributo di queste componenti è trascurabile (1). Tale ipotesi permette di limitarci nella determinazione di E al solo calcolo del ∂A termine − essendo evidente che le componenti derivanti da - grad ϕ tendono ∂t a zero più rapidamente di 1/R per R tendente all'infinito. Il moto dell'elettrone avvenga lungo la direzione mostrata in Fig. 13.8 rispetto al sistema di riferimento (in coordinate sferiche) assunto e l'elettrone passi per il centro della sfera attraverso la quale vogliamo calcolare il flusso del vettore di Poynting. FIG. 13.8 - Elettrone in moto con velocità u. Se la velocità u dell'elettrone è infine molto minore della velocità c della luce allora la (13.174) si riduce a: (13.177) La sola componente di A tangente alla sfera è quindi: (13.178) e pertanto la componente tangente di E vale: (13.179) Per quanto detto possiamo scrivere: (13.180) (1) Con questa approssimazione si intende considerare solo il contributo del cosiddetto campo di radiazione. 13.14] dove u = RADIAZIONE DI UNA CARICA IN MOTO ACCELERATO 185 du rappresenta l'accelerazione dell'elettrone. Dalla (13.180) risulta dt che la potenza irradiata è diversa da zero solo se il moto della carica è accelerato, dipende dal quadrato dell'accelerazione ed ha un massimo per ϑ = π/2, perpendicolarmente cioè alla direzione del moto della carica. Per la (13.175) si ha in definitiva che la potenza totale istantanea irradiata dall'elettrone in moto abbastanza lento, per cui sono trascurabili le correzioni relativistiche, è data da: (13.181) 14 Onde elettromagnetiche in cavi coassiali e guide d'onda 14.1 Introduzione Nel capitolo precedente abbiamo illustrato le principali proprietà delle onde elettromagnetiche nel caso di propagazione libera in un mezzo lineare, isotropo ed omogeneo. Ci sembra interessante aggiungere qualche semplice considerazione anche per quanto riguarda la propagazione delle onde elettromagnetiche in quelle strutture, quali i cavi coassiali e le guide d'onda, che sono normalmente utilizzate per la trasmissione di segnali elettromagnetici in un sistema costituito da un generatore di forza elettromotrice variabile nel tempo e da un carico. Nello studio della propagazione dei campi elettromagnetici in tali strutture, cioè della propagazione guidata, appaiono alcune caratteristiche delle onde che differiscono da quelle tipiche della propagazione libera. 14.2 Onde in un cavo coassiale Per la trasmissione di onde, soprattutto alle alte frequenze, trova ampia applicazione il cavo coassiale. Esso è costituito da un filo conduttore generalmente di rame posto lungo l'asse (o come si suol dire coassialmente) all'interno di un conduttore cilindrico cavo e da questo separato mediante un materiale isolante. Nei cavi coassiali flessibili normalmente il conduttore esterno è formato da una calza di rame ed il materiale isolante riempie tutto lo spazio tra conduttore centrale e conduttore esterno. 188 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 In questo paragrafo vogliamo determinare il comportamento dei campi, elettrico e magnetico, delle cariche e delle correnti all'interno del cavo. Assumiamo che il cavo sia formato da un conduttore cilindrico interno di raggio a e da un conduttore cilindrico esterno cavo di raggio b e che il materiale dielettrico fra essi frapposto abbia permittività dielettrica relativa εr e permeabilità magnetica relativa μr ~1. Supponiamo inoltre il cavo infinitamente lungo e caratterizziamo con la coordinata z, presa lungo l'asse, i piani perpendicolari al cavo, a partire da un estremo. Consideriamo l'equazione di Maxwell: div D = ρ (14.1) e la superficie cilindrica S, mostrata in Fig. 14.1, coassiale con il conduttore centrale, limitata da due basi circolari di raggio r poste sui piani di coordinate z e z + Δz. Chiamiamo q~ (z, t) la densità di carica lineare nel punto z e all'istante t, cioè la grandezza dq/dz essendo dq la carica infinitesima distribuita sul tratto di conduttore compreso fra z e z + dz. FIG. 14.1 - Cavo coassiale. Calcoliamo, per mezzo della (14.1), il flusso del vettore D attraverso la superficie S sopra definita assumendo che, come nel caso elettrostatico, il vettore D sia diretto radialmente. Si trova così che: (14.2) Prendiamo ora in esame un cammino circolare C di raggio r con il centro sull’asse FIG. 14.2 - Sezione di un cavo coassiale. del conduttore interno, come mostrato in Fig. 14.2, posto sul piano perpendicolare al cavo di coordinata z. 14.2] ONDE IN UN CAVO COASSIALE 189 Utilizzando l'equazione di Maxwell: (14.3) calcoliamo il flusso di rot H attraverso la superficie S di contorno C. Applicando il teorema di Stokes al termine che costituisce il primo membro dell'equazione, abbiamo che: (14.4) Poiché il vettore D è diretto radialmente, l'ultimo integrale a destra è nullo e cosi dalla (14.4) si ottiene che: (14.5) Consideriamo quindi il circuito C1 di Fig. 14.3 posto su un piano radiale ed FIG. 14.3 - Determinazione del comportamento del campo elettrico e magnetico in un cavo coassiale. eseguiamo il calcolo del flusso attraverso la superficie S1, che ha per contorno C1 dei vettori che costituiscono i due membri della equazione: (14.6) applicando anche in questo caso al vettore a sinistra il teorema di Stokes, si ha : (14.7) Esplicitando questa equazione per il contorno in considerazione, è facile vedere che deve essere: (14.8) 190 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 e quindi che: (14.9) Se ripetiamo lo stesso procedimento per l'equazione: (14.10) su un circuito C2 posto in un piano perpendicolare alla direzione radiale r, di cui in Fig. 14.3 è mostrata l'intersezione con il piano del foglio, ricaviamo inoltre che: (14.11) Se ora deriviamo la (14.9) rispetto a z e utilizziamo la (14.11) e le relazioni B = μH e D = εE arriviamo per E all'equazione delle onde: (14.12) dove υ = 1 εμ Operando in eguai maniera sulla (14.11) si arriva all'equazione delle onde anche per H. Ricordando la (14.2) deduciamo allora che anche per q deve valere l'equazione: (14.13) ~ La densità lineare di carica q (z, t) lungo il cavo ha pertanto un andamento del tipo: (14.14) se ci limitiamo a considerare solo l'onda progressiva. Immaginiamo adesso che ad una estremità del cavo, considerato sempre di lunghezza infinita, sia applicato un generatore di forza elettromotrice variabile nel tempo che fornisca una differenza di potenziale: (14.15) In un piano di coordinata z la differenza di potenziale tra il conduttore esterno e quello interno del cavo vale: (14.16) 14.3] IL CAVO COASSIALE RAPPRESENTATO MEDIANTE ELEMENTI 191 che per la (14.2) e per la relazione D = eE si riduce a: (14.17) 2πε rappresenta la b ln a capacità C per unità di lunghezza di due cilindri coassiali, per cui : Nel paragrafo 3.9 abbiamo mostrato che la quantità (14.18) Da questa espressione deduciamo che anche la differenza di potenziale V (z, t), essendo proporzionale a q~ (z, t), deve soddisfare l'equazione delle onde. Potremo quindi assumere in maniera del tutto generale: (14.19) Siamo arrivati così a dimostrare che lungo il cavo coassiale si propaga un'onda di potenziale data dalla (14.19). A questo punto è facile far vedere come i campi E, D, H e B, la densità lineare di carica q~ e la corrente I possano essere espresse in funzione del potenziale V(z, t). In particolare mediante la (14.18) e la (14.19) si ha che: (14.20) e utilizzando la (14.2), la (14.11) e la (14.5) si ricava che: (14.21) Questi risultati mostrano che tutte le quantità elettromagnetiche, per ogni z e t, sono proporzionali e che viaggiano lungo il cavo con velocità v. Vogliamo far notare che nella nostra esposizione, avendo considerato un cavo infinito, ci siamo limitati alla discussione della sola onda progressiva. Evidentemente però la soluzione generale comprende anche un'onda regressiva che assume significato nel caso in cui il cavo sia limitato, a seguito degli effetti di riflessione che si possono verificare sulle sezioni estreme del cavo. 14.3 Il cavo coassiale rappresentato mediante elementi concentrati È possibile dimostrare che tutte le grandezze elettromagnetiche caratteristiche di una linea di trasmissione sono descrivibili rappresentando il cavo coassiale, di cui essa è costituita, come un circuito formato dalla successiva 192 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 ripetizione di una opportuna combinazione di elementi concentrati (condensatori, induttori, resistori), i valori dei quali dipendono dalla capacità, induttanza, resistenza e conduttanza distribuita del cavo. Questo concetto è visualizzato nella Fig. 14.4. FIG. 14.4 - Linee di trasmissione in cui il cavo coassiale è rappresentato mediante elementi concentrati. Tale rappresentazione è ovviamente approssimata se gli elementi concentrati hanno dimensioni finite mentre risulta esatta nel caso limite in cui ogni elemento diventa infinitamente piccolo. In questo paragrafo ci limiteremo a ricavare l'espressione del potenziale V e della corrente I in ogni punto z della linea ad ogni istante t, assumendo che l'origine della coordinata 2 sia situata in corrispondenza del carico su cui è chiusa la linea. Per semplicità utilizzeremo inoltre la notazione complessa e supporremo che tutte le grandezze abbiano una dipendenza temporale del tipo ejωt. Questo significa che considereremo la linea alimentata da un generatore di forza elettromotrice alternata di pulsazione ω. FIG. 14.5 - Elementi in serie in un tratto dz di una linea di trasmissione. Se con V rappresentiamo il potenziale e con I la corrente nel punto z del cavo all'istante t, la variazione del potenziale passando dal punto z al punto z + dz, come può dedursi dalla Fig. 14.5, è data da: (14.22) ~ ~ dove con R e L abbiamo indicato rispettivamente la resistenza e l'induttanza per per unità di lunghezza del cavo o meglio la loro densità lineare e cioè la derivata delle rispettive grandezze rispetto a z. ~ La quantità R dz è dunque la consueta resistenza ohmica di un tratto di ~ lunghezza dz dei conduttori che costituiscono il cavo ed L dz l'induttanza di un tratto 14.3] IL CAVO COASSIALE RAPPRESENTATO MEDIANTE ELEMENTI 193 dz dei due conduttori cilindrici coassiali. L'espressione (14.22) esprime così il fatto che la variazione di potenziale dV lungo un tratto dz della linea è uguale alla somma della caduta di potenziale per il passaggio della corrente I nella resistenza ~ R dz più la caduta di potenziale dovuta alla variazione della corrente nella ~ induttanza L dz. La variazione di potenziale dV lungo un tratto infinitesimo dz del cavo per la (14.22) è allora: (14.23) che eseguendo la derivata rispetto al tempo della corrente diviene: (14.24) Ponendo poi: (14.25) la (14.24) si scrive: (14.26) ~ La quantità Z rappresenta così la densità lineare di impedenza della linea coassiale. FIG. 14.6 - Elementi in parallelo in un tratto dz di una linea di trasmissione. La variazione di corrente dI tra un punto z e un punto z + dz del cavo, come si deduce dalla Fig. 14.6, risulta essere: (14.27) ~ dove G è la densità lineare di conduttanza del cavo, conseguenza diretta delle perdite attraverso il dielettrico posto tra conduttore esterno e conduttore interno, e ~ C è la densità lineare di capacità dei due conduttori cilindrici coassiali. Il termine ~ C ∂V/∂t 194 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 contenuto nella (14.27) non è altro che la corrente che fluisce nel condensatore di ~ capacità C dz durante la sua carica. Analogamente a quanto fatto in precedenza per la tensione V, la (14.27) può essere trasformata nella: (14.28) ~ Se con Y indichiamo la densità lineare di ammettenza del cavo, e cioè: (14.29) Deriviamo ora la (14.26) rispetto a z: (14.30) e combiniamo il risultato con la (14.28); otteniamo: (14.31) Procedendo in maniera identica con l'equazione (14.28) si trova che: (14.32) È immediato verificare che la (14.31) ammette, per quanto riguarda la dipendenza spaziale, una soluzione del tipo: (14.33) ~~ con γ = ZY . L'espressione completa per il potenziale, tenendo conto della dipendenza temporale, è allora: (14.34) Per la corrente I vale l'analoga espressione: (14.35) Le costanti V1, V2, I1, ed I2 vanno determinate tenendo conto del carico su cui la linea è chiusa e del generatore ad essa applicato. Il potenziale e la corrente definiti dalle (14.34) e (14.35) sono quantità complesse; le grandezze tìsicamente osservabili, secondo la convenzione da noi fatta, si ottengono prendendo la parte reale di queste espressioni. 14.3] IL CAVO COASSIALE RAPPRESENTATO MEDIANTE ELEMENTI 195 Seguendo un metodo del tutto diverso da quello illustrato nel paragrafo precedente siamo così ugualmente arrivati a concludere che in ogni punto del cavo ed ad ogni istante il potenziale e la corrente, e quindi ogni altra grandezza elettromagnetica, risultano dati dalla somma di due termini che rappresentano fisicamente due onde viaggianti in versi opposti. Nelle (14.34) e (14.35) il primo termine a destra rappresenta un'onda viaggiante in direzione opposta a z, diretta quindi dal generatore al carico, mentre il secondo termine è un'onda viaggiante nella direzione concorde a z, e cioè dal carico al generatore. Usualmente la prima onda viene chiamata onda incidente e la seconda onda riflessa (1). Limitiamoci a considerare la sola onda incidente di tensione e di corrente. Sostituendo Vt eyz e I1 eyz nelle (14.26) e (14.28) troviamo : (14.36) e (14.37) ~ Dividendo la prima per γ e la seconda per Y e moltiplicando membro a membro si ottiene: (14.38) ~ ~ La quantità Z / Y , che riveste una notevole importanza nella teoria delle linee, prende il nome di impedenza caratteristica della linea e normalmente viene indicata ~ ~ con il simbolo Z0. Nel caso in cui si possa considerare R = 0 e G = 0, nel limite cioè in cui il cavo risulti non dissipativo, l'impedenza caratteristica diviene : (14.39) In tal caso l'impedenza Z0 è una quantità puramente reale e dipende esclusivamente dalle caratteristiche costruttive del cavo : geometria dei due conduttori e permettività dielettrica dell'isolante impiegato. I cavi coassiali più comunemente utilizzati presentano una impedenza caratteristica di 50, 60 e 75 ohm. Si può dimostrare che se il carico su cui è chiusa la linea di trasmissione ha una impedenza uguale all'impedenza caratteristica del cavo l'onda riflessa è nulla (2). (1) Nel paragrafo precedente l'onda riflessa non era stata considerata poiché trattavamo il caso di cavo infinitamente lungo. (2) Per approfondire questi argomenti vedi per esempio il testo di H. M. Skilling: «Eletric Transmission Lines», della McGraw-Hill Book Company Inc. 196 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 14.4 Guida d'onda rettangolare Per guida d'onda si intende un tubo metallico cavo, di sezione rettangolare o circolare, utilizzato per la trasmissione di onde elettromagnetiche, generalmente di frequenza superiore ad 1 GHz (109 hertz). Limitando la nostra attenzione ad una guida d'onda di sezione rettangolare, che supponiamo delimitata da superficie metalliche con conducibilità elettrica infinita e riempita con un mezzo di permittività dielettrica s e permettività magnetica n (in particolare il vuoto o l'aria) ci proponiamo di determinare il comportamento dei campi elettrici e magnetici che in essa propagano. Sia data una guida d'onda rettangolare di larghezza a e di altezza b posta, rispetto al sistema di coordinate cartesiane scelto, secondo quanto è mostrato in Fig. 14.7. FIG. 14.7 - Guida d'onda rettangolare. Il primo problema da affrontare è quello di specificare l'andamento dei campi dell'onda elettromagnetica che propaga nella guida. Questi, infatti, per la presenza delle pareti metalliche e per la conseguente necessità di soddisfare le condizioni al contorno, risultano alquanto più complicati di quelli di un'onda piana, come si presentava nella propagazione libera, per esempio nel vuoto. Nell'ipotesi particolare che le superficie metalliche della guida siano infinitamente conduttrici, come è stato mostrato nel paragrafo 13.11 la componente di E tangente e la componente di H normale alla superficie devono annullarsi. Assumiamo che per l'onda che si propaga nella guida in direzione z il campo elettrico E sia parallelo all'asse x. Le condizioni al contorno per E impongono che in ogni piano perpendicolare a z ed a ogni istante t la componente Ex debba annullarsi per i valori y = 0 ed y = a. Per quanto riguarda il campo magnetico H le cose sono alquanto più complicate. Se considerassimo infatti un'onda piana, il vettore H sarebbe diretto parallelamente all'asse y. Ma per le condizioni al contorno la componente di H normale alla superficie metallica deve annullarsi per y = 0 e y = a, e d'altronde le linee di forza di H devono essere linee chiuse. Per soddisfare contemporaneamente 14.4] GUIDA D'ONDA RETTANGOLARE 197 queste due condizioni dobbiamo supporre che le linee di H, rimanendo in un piano perpendicolare ad x, passino curvando dalla direzione y alla direzione z e si richiudano su se stesse girando intorno alle linee di forza del vettore E dirette parallelamente ad x (vedi Fig. 14.8). Risulta così, a differenza di quanto accade per l'onda piana in propagazione libera, che per l'onda che si propaga nella guida esiste una componente di H longitudinale e cioè parallela alla direzione di propagazione. Un'onda caratterizzata da un andamento dei campi come quello ora descritto e per la quale il campo elettrico giace tutto su un piano perpendicolare alla direzione di propagazione prende il nome di onda trasversale elettrica. FIG. 14.8 - Guida d'onda rettangolare. a) Sezione trasversale. Linee di forza del campo elettrico (continue) e del campo magnetico (tratteggiate) ; b) Sezione longitudinale. Linee di forza del campo magnetico. Si può dimostrare che nella guida si propagano anche delle onde per le quali il vettore H è perpendicolare alla direzione di propagazione mentre il vettore E presenta una componente longitudinale. Queste sono le cosiddette onde trasversali magnetiche (1). Per gli scopi che ci siamo proposti, e cioè di ricavare semplicemente le principali caratteristiche dei campi elettrici e magnetici nella guida, ci limitiamo a considerare il caso di un'onda trasversale elettrica con il campo elettrico diretto parallelamente all'asse x. Assumeremo inoltre che la dipendenza spaziale e (1) L'onda elettromagnetica completamente trasversale, con E ed H perpendicolari alla direzione di propagazione, viene indicata in forma abbreviata con le lettere TEM (trasversale elettrica magnetica); l'onda trasversale elettrica viene indicata con TE e quella trasversale magnetica con TM. 198 ONDE ELETTROMAGNETICHE IN CAVI COASSIALI [CAP. 14 temporale per tutte le componenti dei campi dell'onda elettromagnetica sia, come per l'onda piana monocromatica, del tipo e (γz + jωt ) dove la quantità γ, che rappresenta il coefficiente di propagazione dell'onda, deve essere determinato imponendo che la soluzione soddisfi le equazioni di Maxwell. Poiché per le condizioni al contorno la componente Ex deve annullarsi nei punti y = 0 ed y = a, assumeremo per E una dipendenza dalla variabile y data da sen π a y . Si ha così che: (14.40) Dalle equazioni di Maxwell, tenendo conto che Ev = E2 = Hx = O, che all'interno della guida p = O e J = 0 e ricordando inoltre le relazioni D = E E, B = y. H, ricaviamo : 1) div D = 0 (14.41) 2) div B = 0 (14.42) 3) (14.43) (14.44) (14.44) 4) (14.45) (14.46) (14.47) (14.47) Facciamo notare che nel ricavare le equazioni ( 14.41)-(14.47) è stata eseguita la derivazione rispetto alla variabile temporale. Dalla (14.43) e (14.44) 14.4] GUIDA D'ONDA RETTANGOLARE 199 mediante la (14.40) si trova che: (14.48) (14.49) che esprimono, in funzione della componente Ex del campo elettrico, le due componenti non nulle del campo magnetico H. Sostituendo ora nella (14.45) le (14.40), (14.48) e (14.49) dopo alcune semplificazioni si ha che: (14.50) Da questa relazione deduciamo che affinchè nella guida si abbia propagazione è necessario che la quantità a destra entro parentesi sia negativa in modo che γ sia una quantità immaginaria. Deve essere quindi: (14.51) e poiché la velocità di propagazione libera dell'onda è υ = 1 εμ e inoltre ω = 2π v, la disuguaglianza (14.51) diviene: (14.52) e cioè: (14.53) Possiamo pertanto concludere che l'onda propaga nella guida solo se γ =jβ, con β reale, e questo si verifica solo se l'onda ha nel vuoto una lunghezza che è minore di due volte la larghezza della guida. La lunghezza d'onda λc tale che : (14.54) prende il nome di lunghezza d'onda critica e rappresenta la massima lunghezza d'onda che possa propagare in una guida di larghezza a. 15 Cenni sulla teoria della relatività ristretta 15.1 Relatività della meccanica galileiana 15.1.1 Il principio della relatività in meccanica. Sistemi inerziali La meccanica è stata la prima branca della fisica che si è sviluppata in maniera consistente soprattutto per opera di Galileo e di Newton. Essa si occupa del comportamento dei corpi, e sostanzialmente del loro movimento, quando essi siano sollecitati da azioni esterne. Le leggi della meccanica consistono pertanto in relazioni fra le diverse grandezze, ad esempio velocità, accelerazione, energia, momento angolare, ecc., che caratterizzano il comportamento dei corpi stessi. Queste grandezze sono in generale funzione della posizione spaziale del corpo e del tempo. Esse sono cioè funzioni del tipo: A= A(x, y, z; t). Ciò implica, per la descrizione dei fenomeni meccanici, l'introduzione di un sistema di riferimento, caratterizzato per esempio da una terna di assi cartesiani x, y, z, e l'impiego di un misuratore (orologio) del tempo t. Una legge meccanica sarà pertanto una relazione del tipo: f (A, B, C, ...) = 0 (15.1) fra le diverse grandezze A, B, C,.... considerate in un sistema di riferimento S, e funzioni quindi delle variabili x, y, z; t. Un problema importante è quello di stabilire come le relazioni (15.1) si trasformino quando i fenomeni vengono descritti, anziché nel riferimento S, in un altro riferimento S′ in movimento rispetto a S. 202 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Dette x', y', z', le coordinate di un punto qualsiasi rispetto a S' e t' il tempo misurato in S' (lasciamo per ora impregiudicato se si dovrà assumere o no, t' = t), avremo che il legame tra le coordinate di un punto nel riferimento S' e quelle del medesimo punto nel riferimento S sarà espresso da certe relazioni: (15.2a) ovvero (15.2b) Le grandezze A, B, C,..., considerate nel sistema S', assumeranno pertanto delle espressioni del tipo: e, in generale, la legge espressa nel riferimento S dalla (15.1) sarà espressa nel riferimento S' da una relazione del tipo: È evidente, e si può del resto rendersene conto con considerazioni elementari, che in generale, vale a dire se il moto di S' rispetto a S è un moto vario generico, si ha: Orbene, com'è stato illustrato da Galileo in alcune celebri pagine dei «Dialoghi sui Massimi Sistemi» (Giornata II), riveste un interesse particolare la considerazione di sistemi di riferimento dotati di moto rettilineo e uniforme l'uno rispetto all'altro. Infatti in questo caso, partendo da osservazioni di carattere fisico, Galileo ha introdotto, erigendolo a principio fondamentale della meccanica, il seguente principio della relatività: le leggi che governano i fenomeni meccanici in due sistemi di riferimento S e S', dotati di moto rettilineo e uniforme l'uno rispetto all'altro, hanno la stessa forma. Vale a dire se tali fenomeni sono descritti in S dalla relazione matematica (15.1), in S' saranno descritti dalla relazione: f(A', B', C. ...) = 0 ; la f è la stessa nei due riferimenti. 15.1] RELATIVITÀ DELLA MECCANICA GALILEIANA 203 Di particolare importanza fra le leggi della meccanica è quella espressa dall'equazione fondamentale della dinamica: m0 a = F (15.3) essendo m0 la massa del corpo, a la sua accelerazione e F la forza risultante agente su di esso. La (15.3) è stata stabilita da Newton e ritenuta valida in un sistema di riferimento associato al Sole ed avente gli assi rigidamente collegati con le cosiddette stelle fisse, con quelle stelle cioè che da secoli non presentano alcuna modificazione sensibile nelle loro posizioni relative. Il sistema di riferimento a cui stiamo alludendo è noto come sistema delle stelle fisse. Naturalmente, se si accetta questa convenzione, nel sistema collegato con la Terra, evidentemente dotato di moto accelerato rispetto a quello delle stelle fisse, la (15.3) non potrà più essere scritta nella forma F' = m0 a' : è infatti noto che nel passaggio dal primo al secondo sistema di riferimento, compaiono, come conseguenza del teorema di Coriolis, dei nuovi termini (forze apparenti) dovuti al moto della Terra rispetto alle stelle fisse. Pertanto, anche se in pratica tali termini sono molto piccoli per cui, almeno per i problemi più comuni, si possono ritenere completamente trascurabili, è F' ≠ m0 a'. In base però al principio di relatività galileiana l'equazione (15.3) si trasformerà invece in una della stessa forma F' = m0 a', quando dal sistema S delle stelle fisse si passa ad un altro sistema di riferimento in moto rettilineo uniforme rispetto ad esso. Tutti i sistemi di riferimento costituiti dal sistema delle stelle fisse e da quelli in moto rettilineo uniforme rispetto a questo, per i quali, come si è detto, vale l'equazione fondamentale della dinamica nella forma (15.3), si sogliono chiamare sistemi inerziali. Essi svolgono un ruolo fondamentale nello studio della meccanica, per cui è importante definirli in base alle loro proprietà intrinseche. Assumeremo che un sistema è inerziale se le relazioni spaziali in esso, quali risultano determinate da regoli rigidi fermi nel riferimento, seguono la geometria euclidea e se in esso esiste un tempo universale, per il quale una particella libera obbedisce al principio di inerzia, vale a dire rimane ferma o continua a muoversi di moto rettilineo uniforme. In base a queste proprietà le particelle libere, poste in condizioni di riposo in punti fissi del sistema di riferimento, ivi rimangono. Si può pertanto descrivere un riferimento inerziale come un aggregato di particelle-campione libere e mutuamente ferme, a distanze costanti misurate da regoli rigidi. Queste distanze soddisfano ai teoremi della geometria euclidea. In un siffatto riferimento le linee rette sono delle geodetiche e le particelle libere non appartenenti all'aggregato di definizione si muoveranno in linea retta. Si potrà poi supporre che alle particelle campione dell'aggregato-riferimento siano associati degli orologi che misurano l'istante di passaggio delle particelle in moto. Con la locuzione tempo universale si vuoi intendere che è possibile accordare e sincronizzare gli orologi associati alle diverse particelle campione in modo che col tempo segnato da ognuno di essi le leggi della meccanica risultino omogenee e isotrope (cioè ad esempio: proiettili identici sparati da fucili identici in ogni punto e 204 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 lungo una qualunque direzione si muovono con la stessa velocità). Si può ritenere, con buona approssimazione, che la scala dei tempi definita da vari processi che si ripetono in modo identico, come ad esempio le vibrazioni di un atomo eccitato, si mantenga sincronizzata col tempo inerziale. Il sistema delle stelle fisse e quelli che si ottengono da questo con una traslazione rettilinea ed uniforme soddisfano approssimativamente alle proprietà che abbiamo enumerato per caratterizzare i sistemi inerziali. Inoltre, perché il principio di inerzia sia valido in un sistema, occorre che ivi sia trascurabile la gravita. Anche questa proprietà può essere realizzata approssimativamente in regioni sufficientemente lontane da distribuzioni di masse. Osserviamo ancora, che per una larga classe di fenomeni, anche il riferimento del nostro laboratorio, sebbene in lenta rotazione rispetto al sistema delle stelle fisse e non esente da gravita, può essere considerato come inerziale. 15.1.2 La trasformazione di Galileo Come abbiamo detto, il principio di relatività di Galileo esige che le leggi della meccanica mantengano la stessa forma quando si passi da un sistema di riferimento a un altro dotato di moto rettilineo uniforme rispetto al primo. In particolare,come conseguenza di ciò, si richiede che la legge di Newton F = m0 a conservi la sua forma passando da un sistema inerziale ad un altro. È pertanto di fondamentale importanza verificare se tale esigenza è effettivamente soddisfatta. Allo scopo è necessario anzitutto stabilire le formule di trasformazione che permettono di passare dalle coordinate x, y, z, t di S a quelle x', y', z', t' di S' in moto rispetto a S con una velocità w costante; in altri termini si devono esplicitare le formule di trasformazione (15.2) per il caso che ci interessa di una traslazione uniforme. Non è possibile fare ciò senza introdurre alcune ipotesi relative alle proprietà dello spazio e del tempo ed a quelle del movimento. Nella fisica prerelativisttica le due principali ipotesi che si assumevano erano essenzialmente le seguenti: 1a Ipotesi: «Esistenza di un tempo assoluto». — Abbiamo detto precedentemente come sia possibile definire in ogni singolo sistema inerziale un tempo universale. Nella fisica prerelativistica si suppone che sia possibile regolare gli orologi, che nei vari sistemi inerziali misurano il tempo, in modo che il valore di questo sia lo stesso in ogni sistema. Ad un tempo t di S può corrispondere, cioè, in S' un tempo t' = t. 2a Ipotesi: «Reciprocità del moto». — Dati due sistemi S e S' in moto l'uno rispetto l'altro, è equivalente dal punto di vista cinematico supporre il primo «fermo» e S' in moto con velocità w, oppure il secondo «fermo» e il primo in moto con velocità - w (1). (1) Per punto di vista cinematico si vuol qui intendere che l'ipotesi assunta riguarda unicamente la struttura delle formule di trasformazione per il passaggio dalle coordinate (x, y, z; t) dì S a quelle (x', y', z'; t') di S' mentre non si fa assolutamente alcuna asserzione sulla relazione che lega le leggi di un fenomeno osservato in S e quelle dello stesso osservato in S'. 15.1] RELATIVITÀ DELLA MECCANICA GALILEIANA 205 Questa ipotesi comporta che, se il passaggio da S a S' è retto dalla formula necessariamente quello da S' a S dovrà essere retto dalla: Si tratta quindi, sulla base delle due ipotesi assunte e tenendo presenti le proprietà che caratterizzano i sistemi inerziali, di determinare il legame fra r e r', ossia fra x, y, z e x', y', z'. Allo scopo ricordiamo anzitutto che in ogni sistema inerziale deve valere il principio di inerzia. Ciò comporta che, se un punto materiale non soggetto a forze si muove di moto rettilineo uniforme rispetto a S, e cioè se si ha: si deve avere un moto rettilineo uniforme anche in S', e cioè deve aversi (si ricordi che è t' = t) : Ciò è possibile, com'è noto, se x', y', z' sono funzioni lineari di x, y, z e t. Convenendo poi di fissare l'origine dei tempi e l'origine degli assi nei due sistemi in modo che per t = 0 si abbia : x = 0, y = 0, z = 0 e x' = 0, y' = 0, z' = 0, le relazioni cercate dovranno essere omogenee, e quindi della forma: (15.4) e si tratterà di determinare i 12 coefficienti ahk. Supponendo per semplicità di considerare una traslazione lungo l'asse x e di prendere gli assi di S' coincidenti all'istante iniziale con quelli di S, dovremo avere : Inoltre, essendo gli assi y e z trattati allo stesso modo (data l'isotropia dello spazio), avremo: indicando il valore comune di questi coefficienti (che eventualmente sarà una funzione di w) con λ(w), la seconda e la terza delle (15.4) si ridurranno a: (15.5) 206 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Ma, per l'ipotesi della reciprocità del moto, gli stessi risultati si dovranno avere considerando S in moto con velocità - w rispetto a S'. Dovranno quindi valere anche le relazioni: che, confrontate con le precedenti, danno: (15.6) D'altra parte un'inversione del verso positivo di x e x' porta a sostituire - w a w, senza però che nulla muti nei riguardi di y e z. Dovendo pertanto le equazioni che in questo modo si ottengono, e cioè: coincidere con le (15.5), si avrà: onde dalla (15.6): ossia: Avendo però supposto gli assi y' e z' rispettivamente equiversi con y e z, dovremo prendere senz'altro il segno +, per cui in definitiva avremo: Osserviamo ora che, siccome i punti fermi rispetto a S' debbono, rispetto a S, traslare con velocità w lungo il verso positivo dell'asse x, si deve avere che, quando x' è costante, lo è anche x - wt; pertanto la prima delle (15.4) dovrà avere la forma: Per l'ipotesi della reciprocità del moto, dovrà allora valere anche la: . La compatibilita di queste due equazioni richiede che sia: 15.1] RELATIVITÀ DELLA MECCANICA GALILEIANA 207 Le formule di trasformazione cercate sono pertanto le seguenti: (15.7) Da esse si deducono quelle inverse : (15.8) Esse sono note come trasformazioni di Galileo o galileiane. Di queste formule vogliamo ricordare due conseguenze importanti. La prima riguarda la misura della lunghezza di uno stesso segmento eseguita nei due sistemi S e S'. Detti A e B gli estremi del segmento, in S si avrà per detta lunghezza: In S' avremo invece: ora, in virtù delle (15.7), si ha: onde: Tale lunghezza è cioè invariante, risultando sempre la stessa in tutti i riferimenti in moto rettilineo ed uniforme l'uno rispetto all'altro. L'invarianza di una lunghezza risulta pertanto una conseguenza delle due ipotesi assunte per dedurre la trasformazione di Galileo. È immediato verificare che questa trasformazione potrebbe anche dedursi assumendo, accanto all'ipotesi dell'esistenza di un tempo assoluto (t = t') l'ipotesi dell'invarianza della lunghezza di un segmento (l = l'). In questo caso la reciprocità del moto risulterebbe una conseguenza delle due ipotesi assunte (t = t', l = l'). La seconda conseguenza delle trasformazioni di Galileo concerne il cosiddetto teorema di composizione delle velocità, che si ricava immediatamente derivando le (15.7) rispetto al tempo: (15.9a) o anche, in notazioni vettoriali, (15.9b) 208 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 dove si è posto per definizione: È questo il teorema di composizione delle velocità della meccanica newtoniana. 15.1.3 Invarianza delle leggi di Newton rispetto ad una trasformazione galileiana Ammesso che le formule di passaggio da un riferimento inerziale S ad un altro pure inerziale S' siano date da una trasformazione di Galileo, è possibile verificare se la equazione fondamentale della dinamica soddisfi o no il principio di relatività galileiana. Per precisare il problema supponiamo che il sistema in considerazione sia costituito da un insieme di masse puntiformi : su ogni coppia di queste si eserciti una forza, derivabile da un potenziale V, la cui direzione coincida con la congiungente i due punti materiali e la cui intensità sia funzione solo della loro distanza. Avremo allora per un insieme di n punti: La forza agente sull'i-esimo punto materiale sarà data da : (15.10) La forma di queste equazioni comporta che le componenti della forza dovuta all'azione dell'i-esimo sul k-esimo punto materiale e quelle della forza dovuta all'azione del k-esimo sull'i-esimo punto materiale siano eguali e di segno 15.1] RELATIVITÀ DELLA MECCANICA GALILEIANA 209 opposto, cioè: per cui la somma di tutte le forze agenti su tutti gli n punti materiali è nulla: Le equazioni differenziali di Newton per il sistema sono: (15.11) dove m0 è la massa dell'i-esimo punto materiale. Passando da S a S' con la trasformazione (15.8) osserviamo che le grandezze xi - xk e rìk rimangono, per quanto abbiamo mostrato alla fine del paragrafo precedente, invariate. Lo stesso avverrà quindi anche per la grandezza V la quale, espressa in funzione delle nuove coordinate, conserva la stessa forma e assume gli stessi valori che nel primitivo sistema di riferimento. Avendosi poi: i secondi membri delle equazioni (15.11) risulteranno invariati rispetto alla trasformazione di Galileo (15.7). Si verifica poi facilmente che anche i primi membri delle (15.11), per effetto della relazione t = t', rimangono invariati per una trasformazione galileiana. Possiamo pertanto concludere che le equazioni fondamentali della dinamica mantengono non solo la stessa forma, ma addirittura rimangono invariate passando dal riferimento S a quello S' per mezzo di una trasformazione galileiana. Esse sono cioè invarianti rispetto ad una siffatta trasformazione. Si noti che questa proprietà da esse posseduta è più stringente di quella richiesta dal principio di relatività galileiana; questo infatti richiede che dette equazioni si trasformino in altre della stessa forma senza che i singoli termini mantengano il loro valore: in altre parole il principio di relatività richiede solo che le equazioni della meccanica siano covarianti rispetto ad una trasformazione galileiana. Si osservi inoltre che, come deriva immediatamente dalla loro forma vettoriale e dell'essere le m0i degli invarianti, le equazioni della meccanica newtoniana sono covarianti anche rispetto a una rotazione degli assi, ossia rispetto a una trasformazione che lasci invariata l'espressione: 210 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Questa proprietà analitica delle equazioni di Newton traduce l'isotropia e l'omogeneità dello spazio sede dei fenomeni fisici. Vogliamo osservare che anche le altre branche della meccanica, come la trattazione della materia continua (elasticità, idrodinamica, ecc.) o la meccanica dei corpi rigidi, si possono dedurre dalla meccanica dei punti materiali introducendo opportune interazioni del tipo (15.10) e operando certi passaggi al limite. È evidente, anche senza un esame particolareggiato, che i risultati precedenti, ottenuti applicando una trasformazione galileiana a un sistema di punti materiali, si estendono anche a queste branche della meccanica. Osserviamo infine che, in questo paragrafo, si è supposto che le forze siano di tipo posizionale, cioè dipendenti dalle sole coordinate di posizione. Se esse, pur essendo derivabili da un potenziale, dipendono anche dalla velocità, (come per esempio le forze di Lorentz, che un campo magnetico B esercita su una massa puntiforme, carica elettricamente e in moto con velocità v, e cioè, F = e v × B), non vale più la proprietà di invarianza (o di semplice covarianza) richiesta dal principio di relatività galileiana. La ragione di ciò, nella fisica prerelativistica, veniva attribuita al fatto che tali forze descrivono delle proprietà elettromagnetiche, e le leggi nell'elettromagnetismo, come diremo particolareggiatamente nel prossimo paragrafo, si ritenevano valide non in tutti i sistemi inerziali ma solo in un particolare sistema di riferimento collegato ad un ipotetico mezzo, riempiente tutto lo spazio, denominato etere. In altri termini, nella fisica prerelativistica il principio di relatività si riteneva applicabile ai soli fenomeni meccanici. Vedremo come la teoria della relatività abbia modificato, e in modo essenziale, il punto di vista della fisica prerelativistica mostrando l'inconsistenza di tale ipotesi dell'etere ed estendendo il principio di relatività anche ai fenomeni elettromagnetici. 15.2 I fenomeni elettromagnetici e l'ipotesi dell'etere 15.2.1 Apparente dipendenza delle equazioni di Maxwell dal sistema di riferimento Le leggi dei fenomeni elettromagnetici sono notoriamente compendiate dalle equazioni di Maxwell: (15.12) dove rispettivamente E e H denotano il campo elettrico ed il campo magnetico, D e B i vettori induzione elettrica e magnetica, ε e μ. la costante dielettrica e la permeabilità magnetica, ρ e J la densità di carica e di corrente elettrica. 15.2] I FENOMENI ELETTROMAGNETICI E L'IPOTESI DELL'ETERE 211 Secondo la concezione maxwelliana le equazioni del campo elettromagnetico si devono intendere riferite ad un qualsiasi sistema di riferimento immobile rispetto all'etere, considerato questo come la sede di tutti i fenomeni elettromagnetici. Quale conseguenza di questa concezione, veniva a porsi il problema di trovare le equazioni dell'elettromagnetismo valide in un sistema di riferimento in moto rispetto all'etere, problema che evidentemente implicava la necessità di fissare il modo di comportarsi dell'etere rispetto ai corpi in moto entro di esso. La questione è analoga a quella che abbiamo visto presentarsi nello studio dei fenomeni meccanici, quando si faccia corrispondere al sistema assoluto (o delle stelle fisse) della meccanica, quello dell'elettromagnetismo (cioè l'etere). In un punto importante però le equazioni di Newton differiscono da quelle di Maxwell: mentre infatti le prime sono, come abbiamo visto, invarianti rispetto ad una trasformazione galileiana, le seconde non lo sono affatto. Ciò ha come conseguenza che le equazioni del campo elettromagnetico assumono forma diversa in dipendenza del movimento (anche rettilineo ed uniforme) rispetto all'etere del sistema di riferimento entro il quale si osservano i fenomeni elettromagnetici. Si arriva così alla conclusione che dovrebbe essere possibile istituire delle esperienze atte a mettere in luce, dall'osservazione di fenomeni elettromagnetici che su di esso si svolgano, il moto di un corpo (o di un mezzo) rispetto all'etere. Terminiamo questo argomento ricordando un'importante scoperta fatta da Lorentz nel 1904, relativa ad una singolare proprietà di cui godono le equazioni di Maxwell e sulla quale avremo occasione di ritornare diffusamente in seguito : tali equazioni, anziché di fronte alla trasformazione galileiana espressa dalla (15.7) risultano covarianti (nel senso che conservano la stessa forma) rispetto alla seguente trasformazione: (15.13) che si dice appunto trasformazione di Lorentz. Si noti che, a differenza delle trasformazioni galileiane, quelle lorentziane richiedono, nel passaggio da un sistema di riferimento ad un altro in moto rispetto al primo, un cambiamento anche nella variabile temporale; a questo proposito anzi è notevole il fatto che il legame tra t e t' inveiva anche le variabili di posizione. E infine interessante osservare che la trasformazione lorentziana (15.13) si riduce alla corrispondente trasformazione galileiana (15.7) per β = 0, cioè per c = ∞. 15.2.2 L'esperimento di Michelson Come già abbiamo avuto occasione di dire, la non invarianza delle equazioni di Maxwell rispetto ad una trasformazione galileiana induce a ritenere che sia possibile mettere sperimentalmente in risalto il movimento di un corpo (o mezzo), entro il quale si eseguono delle esperienze relative a fenomeni elettromagnetici, rispetto al sistema di riferimento assoluto (etere). 212 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Per raggiungere tale scopo si può per esempio pensare di ricercare, istituendo opportune esperienze di ottica, come la velocità della luce misurata da un osservatore terrestre vari a seconda della direzione in cui essa si propaga: l'interpretazione dei fenomeni fisici fornitaci dalla fisica prerelativistica, che comporta fra l'altro l'ammissione dell'esatta validità del teorema della composizione delle velocità espresso dalla formula (15.9b), porterebbe a ritenere che la velocità della luce misurata dall'osservatore terrestre debba risultare massima quando la luce si propaga nella stessa direzione ma in verso contrario a quello del moto della Terra e minima nel caso opposto. La più celebre esperienza a questo riguardo è quella eseguita per la prima volta da Michelson nel 1879 e ripetuta successivamente da lui e da altri sperimentatori (tra cui notevoli le misure di Kennedy) con sempre maggiore precisione ed in diverse condizioni sperimentali. Ne daremo una descrizione schematica. Un raggio luminoso (Fig. 15.1) SO incide su di una lastra semiargentata s sotto un angolo di 45° : esso si scinde in due raggi OA e OB, che vengono riflessi su se stessi da due specchi s' e s" e rinviati sulla lastra s, dove ciascuno di essi si scinde ancora in altri due raggi. Consideriamo i due raggi sovrapposti che escono in direzione OC, i quali hanno percorso rispettivamente i cammini SOAOC e SOBOC. In C si osserveranno fenomeni di interferenza che dipenderanno dalla differenza di fase dei due raggi provocata dalla differenza di tempo impiegata dalla luce a percorrere i due tratti OAO e OBO. FIG. 15.1 - Interferometro di Michelson. Supponiamo ora che la Terra si muova rispetto al sistema di riferimento assoluto (cioè l'etere) e sia w la velocità di tale movimento. Orientando per ragioni di semplicità il braccio SA dell'interferometro lungo la direzione del vettore w, la velocità con cui la luce si muove lungo il tratto OA dell'apparecchio è per un osservatore terrestre (ritenendo valido il teorema (15.9b) di composizione delle velocità) eguale a c - w, mentre la velocità con cui la luce percorre il tratto AO sarà c + w. Di conseguenza il tempo τ1 impiegato a percorrere il tratto OA+AO, posto OA = ll, sarà: 15.2] I FENOMENI ELETTROMAGNETICI E L'IPOTESI DELL'ETERE 213 dove si è posto al solito β = w/c. Essendo β in pratica molto piccolo (dell'ordine di 10-4) potremo sviluppare τ1 in serie di potenze di β e ritenere trascurabili le potenze di β superiori alla seconda; onde: Per il calcolo del tempo τ2 impiegato dal secondo raggio a percorrere il cammino OB + BO, occorre anzitutto tener presente qual'è il cammino effettivo che detto raggio percorre (Fig. 15.2). FIG. 15.2 - Illustrazione dell'esperienza di Michelson. Sia O' la posizione del punto O di Fig. 15.1 all'istante di partenza e sia O" la sua posizione al tempo τ2 quando il raggio riflesso da s" incontra di nuovo la lastra s. Il segmento O' O" è allora uguale a w τ2 Il cammino completo, effettivamente percorso dal raggio, è dunque: Questo cammino si può ritenere eguale a cτ2, in quanto è percorso dalla luce in direzione praticamente perpendicolare a quella del movimento della Terra. Si ha perciò: La differenza di tempo, che determina lo stato di interferenza in C, risulta pertanto : Se ora si ruota tutto l'apparecchio di 90° attorno a O, la posizione reciproca dei cammini l1 e l2 rispetto all'etere viene ad essere scambiata e di conseguenza 214 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 si avrà per il tempo di ritardo: Ne deriva che, con la rotazione dell'apparecchio, si dovrebbe osservare uno spostamento delle frange corrispondente ad un ritardo: dalla misura di questo spostamento sarebbe possibile dedurre β e quindi w. L'esperienza, eseguita ripetutamente con estrema precisione e in diverse ore del giorno e della notte (quindi con diversi orientamenti del piano dell'apparecchio rispetto alle stelle fisse) e in tutte le epoche dell'anno, ha sempre dato per risultato w = 0 entro i limiti dell'errore sperimentale (che in certi casi non superavano i 0,3 km/s). E, fatto estremamente interessante, un uguale risultato ha pure dato l'esperienza di Michelson eseguita con luce solare, cioè con una sorgente in moto relativo rispetto all'osservatore. Che la velocità della luce non dipenda dal moto della sorgente è dimostrato anche dalle osservazioni di De Sitter sulle stelle doppie e da altri esperimenti. Il risultato dell'esperienza di Michelson ha trovato una conferma indiretta in varie altre esperienze (Trouton e Noble, Des Coudres, Trouton e Rankine, ecc.) relative a fenomeni elettromagnetici, i quali, secondo le concezioni preeinsteiniane, avrebbero pure dovuto venir influenzati da un eventuale moto della Terra rispetto all'etere: anche tutte queste esperienze hanno invece dato risultato negativo. Dall'esito dell'esperienza di Michelson e delle altre ora menzionate, sembrerebbe naturale di dover trarre la seguente conclusione: la Terra è ferma rispetto al sistema assoluto dei fenomeni elettromagnetici, cioè rispetto all'etere; dal punto di vista cinematico ciò equivale a dire che detto sistema assoluto coincide con un sistema di riferimento fisso rispetto alla Terra. Ma accettando questa conclusione deriverebbe un'inaspettata posizione di privilegio per la Terra, tale da far pensare addirittura ad una specie di ritorno al sorpassato geocentrismo tolemaico. Per di più all'accettazione di una siffatta conclusione, che pur sembrerebbe una immediata conseguenza del risultato negativo dell'esperienza di Michelson, si oppongono i risultati di altre esperienze, qualcuna delle quali discuteremo brevemente nel paragrafo seguente. 15.2.3 Difficoltà della fisica prerelativistica Come abbiamo detto, dal risultato dell'esperienza di Michelson sembra derivare in maniera immediata e senza possibilità di dubbio che il sistema assoluto, rispetto al quale si ritengono riferite le equazioni di Maxwell, coincida con un sistema collegato alla Terra. Vogliamo ora mostrare come questo risultato, oltre che del tutto inaspettato e sorprendente, è difficilmente conciliabile coi risultati di altre esperienze. Ci limiteremo qui alla discussione di due fenomeni: 15.2] I FENOMENI ELETTROMAGNETICI E L'IPOTESI DELL'ETERE 215 l'aberrazione astronomica annua e la propagazione della luce in un mezzo materiale in movimento. Aberrazione astronomica annua. Il fenomeno fu scoperto da Bradley nel 1727 e consiste nel fatto che le stelle, nel corso di un anno, descrivono, in apparenza, una piccola ellisse sulla volta celeste. Una spiegazione accurata di questo fenomeno richiederebbe lo studio particolareggiato delle onde nelle lenti e nei prismi degli strumenti di osservazione; ma, se si concepiscono i raggi luminosi come la traiettoria dell'energia delle onde luminose, ci si può attenere alla spiegazione più semplice e intuitiva fornita dalla teoria dell'emissione e che porta ai medesimi risultati. FIG. 15.3 - Aberrazione della luce stellare. Detta (Fig. 15.3) cu (u è un vettore unitario nella direzione Stella-Terra) la velocità della luce rispetto al sistema assoluto e w0 quella della Terra, sempre rispetto a detto sistema, la velocità della luce relativa a un osservatore terrestre per il teorema galileiano dei moti relativi sarà rappresentata dal vettore: La luce risulterà quindi all'osservatore terrestre come provenienete lungo la direzione u'. Pertanto se si indica con ϕ l'angolo formato dai due vettori w0 e u e con ψ0 quello compreso fra i due vettori u e u', applicando il teorema dei seni al triangolo TAB si trova: (15.14a) essendo poi una quantità assai piccola, la relazione precedente si può scrivere con buona approssimazione: (15.14b) 216 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Per il moto di rivoluzione della Terra, il vettore w0, se diverso da zero, ruoterà in un anno di un angolo di 360°. Ne segue che la visuale TS' volta dalla Terra alla stella subisce una variazione periodica, descrivendo in un anno un cono ellittico col vertice nell'occhio dell'osservatore. Per poter eseguire un confronto quantitativo fra la (15.14b) ed i risultati sperimentali prendiamo in considerazione, per semplificare le cose, una stella circumpolare, per la quale ϕ = 90°. Facendo due osservazioni della stella a sei mesi di distanza, avremo (Fig. 15.4) che la prima volta essa apparirà nella direzione TS', e la seconda lungo TS", cioè lungo la direzione simmetrica di TS' rispetto alla verticale TN: l'angolo compreso fra le due visuali della stella, che è il dato fornito direttamente dall'esperienza, risulta essere di 41". FIG. 15.4 - Aberrazione della luce di una stella circumpolare. Orbene se, in accordo alla conclusione che sembrava doversi dedurre dall'esperienza di Michelson, si assumesse il sistema assoluto fisso con la Terra, avremmo w0 = 0 e quindi ψ0 = 0, e cioè assenza assoluta del fenomeno dell'aberrazione, in contraddizione con i risultati sperimentali. Questi si spiegano invece nella maniera più semplice supponendo il sistema assoluto fisso rispetto al Sole; infatti in questo caso w0 rappresenta la velocità della Terra rispetto al Sole, la quale, com'è noto dall'esperienza, è uguale a 3 ⋅ 106 cm/s, onde: L'angolo di aberrazione di una stella circumpolare risulterà quindi: in perfetto accordo con i risultati sperimentali. Esperienza di Fizeau. Un'altra esperienza interessante, per mettere in rilievo le difficoltà cui si va incontro nel tentativo di stabilire quale sia il sistema assoluto cui si debbono ritenere riferite le equazioni di Maxwell, è quella eseguita nel. 1851 per opera di Fizeau. Nella nostra descrizione sommaria ci riferiremo alla disposizione escogitata da Zeemann (Fig. 15.5). 15.2] FIG. I FENOMENI ELETTROMAGNETICI E L'IPOTESI DELL'ETERE 217 15.5 - Esperimento di Fizeau Entro due tubi disposti parallelamente si fa scorrere dell'acqua in direzioni opposte, ma con la stessa velocità w. Un raggio «a» di luce monocromatica incontra una lastra semiargentata L, la quale scinde il raggio in due; uno di questi passa per trasparenza e l'altro viene riflesso. Questi due raggi poi si riflettono rispettivamente sugli specchi M1 e M2 e vengono inviati nei due tubi entro cui scorre l'acqua, per poi penetrare nel prisma a riflessione totale P che ne scambia i cammini; mediante gli specchi Ml e M2 e la lastra L, i due raggi sono nuovamente riuniti ed entrano nel cannocchiale C, attraverso il quale si possono osservare le frange di interferenza. Si noti che i due raggi compiono esattamente lo stesso cammino, ma entro i due tubi un raggio si muove secondo la corrente dell'acqua e l'altro nel senso contrario. Il fatto che, quando l'acqua nei due tubi è in moto, si osservino delle frange parrebbe dimostrare che la velocità della luce rispetto ad un riferimento terrestre è diversa nei due tubi in cui l'acqua si muove in sensi opposti, come se cioè il sistema assoluto (etere) fosse trascinato dall'acqua in moto. Ammettendo anzi un trascinamento completo (1) e accettando al solito la validità del teorema galileiano della composizione delle velocità, deriva che la velocità della luce rispetto al riferimento terrestre è nei due tubi rispettivamente V - w e V + w, denotando con V la velocità c della luce nell'acqua (se n è l'indice di rifrazione, è V = ). Di conseguenza il primo n raggio impiegherà ad attraversare i due tubi, di lunghezza comune l, il tempo: ed il secondo: La differenza dei tempi impiegati dai due raggi è pertanto: (1) L'ipotesi di un trascinamento completo dell'etere da parte di un corpo in moto è suggerita dal fatto che, mediante essa, immediatamente si spiega il risultato negativo dell'esperienza di Michelson. Si viene così ad ammettere che il sistema cui sono riferite le equazioni dell'elettromagnetismo è sempre solidale col corpo (o mezzo) nel quale il campo elettromagnetico si propaga. 218 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Si può rilevare e misurare questa differenza mediante lo spostamento che subiscono le frange di interferenza rispetto alla posizione che esse hanno quando l'acqua è immobile. L'esperienza dimostra però in modo indubbio che lo spostamento che si osserva non corrisponde affatto alla formula ora trovata, ma le cose vanno, almeno con buona approssimazione, come se la velocità del mezzo fosse ridotta da w a: Ciò farebbe supporre che, almeno in questo fenomeno, anziché totalmente, l'etere sia solo parzialmente trascinato con un coefficiente di trascinamento k = 1 - 1/n2. Questo risultato sembra però inconciliabile col risultato dell'esperienza di Michelson la cui spiegazione, come abbiamo detto precedentemente, parrebbe richiedere l'ipotesi di un trascinamento totale dell'etere. 15.3 15.3.1 I principi della relatività ristretta Il principio della relatività secondo Einstein Dal complesso dei fatti sperimentali dianzi ricordati, discende come questi appaiono in contraddizione fra di loro quando si tenti di interpretarli alla luce della concezione fisica preeinsteiniana, basata sull'idea dell'esistenza di un riferimento (etere) sede dei fenomeni elettromagnetici e sull'accettazione delle leggi galileiane per il passaggio da un sistema di riferimento a un altro, animato rispetto al primo di moto rettilineo uniforme, leggi che tra l'altro comportano l'esistenza di un tempo assoluto invariabile col moto dell'osservatore. In un primo tempo si tentò di superare queste difficoltà attribuendo all'etere proprietà sempre diverse, ma, a parte l'artificiosità di siffatti tentativi che da un punto di vista concettuale erano difficilmente accettabili, per tale via non fu possibile arrivare ad una teoria che rendesse conto esattamente, partendo da un gruppo di ipotesi coerenti, di tutti i fenomeni osservati. Da un punto di vista concettuale si può anche osservare che il diverso comportamento dei fenomeni meccanici da quelli elettromagnetici, rispetto al passaggio da un sistema inerziale ad un altro, appare contrario allo spirito unitario che sembra reggere tutti i fenomeni fisici; ciò soprattutto se si pensa che è difficile immaginare un esperimento che riguardi la dinamica newtoniana, nel quale non abbiano un ruolo essenziale anche fenomeni elettromagnetici (come ad esempio procedimenti ottici di osservazione, ecc.). La situazione era a questo punto quando nel 1905 comparve una celebre memoria di Albert Einstein, nella quale si sosteneva che per superare tutte le difficoltà era necessario sottoporre anzitutto ad una critica rigorosa gli stessi concetti e postulati sperimentali su cui era costruita l'intera fisica e dai quali in particolare si deducevano le leggi di trasformazione galileiane. Anzitutto Einstein, basandosi sul fatto che tutti i tentativi di scoprire il riferimento associato all'etere non avevano ottenuto alcun risultato e che anche 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 219 i fenomeni elettromagnetici si dimostravano insensibili a un moto rettilineo ed uniforme del sistema di riferimento nel quale venivano descritti, pensò di estendere il principio galileiano di relatività, valido per i fenomeni meccanici, a tutti i fenomeni fisici. Egli enunciò pertanto il seguente principio della relatività (ristretta): «Un sistema di riferimento in moto traslatorio uniforme rispetto ad un sistema inerziale non può essere da questo distinto per mezzo di un qualsiasi esperimento fisico». Ciò equivale a dire che, se S è un sistema inerziale e S' è un sistema dotato di moto rettilineo uniforme rispetto a S, anche S' è inerziale. Il principio di relatività di Einstein può pertanto essere enunciato anche nella seguente forma : tutti i sistemi di riferimento inerziali sono equivalenti per la formulazione di tutte le leggi fisiche. Come si vede il principio di relatività di Einstein non è altro che un'estensione del principio di Galileo dalla meccanica all'intera fisica. Una conseguenza immediata del principio di Einstein è l'abolizione del concetto di etere. Infatti, anche se l'etere esistesse, in virtù del principio della relatività einsteiniana non sarebbe possibile in alcun modo mettere in rilievo il moto rispetto ad esso degli altri sistemi inerziali : ciò fisicamente equivale ad ammettere che l'etere non esista del tutto. Si osservi che i sistemi inerziali a cui si fa riferimento nell'enunciazione del principio einsteiniano della relatività ristretta vanno intesi come definiti in base alle loro proprietà intrinseche (come si è detto al paragrafo 15.2.1) e non in relazione al moto rispetto al sistema delle stelle fisse. Vogliamo infine sottolineare che il principio di relatività einsteiniana riguarda tutta la fisica e non solo la meccanica e l'elettromagnetismo. Così, ad esempio, anche i campi delle forze nucleari, che non sono riducibili a campi elettromagnetici, debbono soddisfare al suddetto principio. 15.3.2 Critica della trasformazione di Galileo Il principio della relatività einsteiniana esige che le leggi dell'elettromagnetismo conservino la stessa forma, passando da un sistema inerziale S ad un altro S'. D'altra parte, se per tali leggi si assumono le equazioni di Maxwell e per formule di trasformazione quelle di Galileo, sappiamo che tale esigenza non è verificata ; è stato appunto per questa circostanza che si era formulata l'ipotesi dell'etere con il conseguente problema di determinare il sistema di riferimento ad esso associato. È chiaro che si potrà uscire da questo apparente circolo chiuso solo supponendo che o le equazioni di Maxwell o le formule di Galileo siano insoddisfacenti e sostituendole con altre tali da soddisfare al principio di relatività. D'altra parte l'accuratezza con cui le equazioni di Maxwell hanno potuto essere verificate escludono l'utilità di una loro modifica. Perciò Einstein rivolse la sua indagine critica alle formule di trasformazione di Galileo e alle ipotesi sulle quali queste erano fondate: quella della reciprocità del moto e quella dell'esistenza di un tempo assoluto. 220 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Partendo da questa critica Einstein arrivò alla conclusione che era proprio la seconda di dette ipotesi, cioè quella della esistenza di un tempo assoluto, che doveva essere abbandonata. Per definire un tempo universale comune a tutti i sistemi inerziali, com'è stato supposto per la deduzione delle formule di trasformazione gaMleiane, è necessario definire cosa si intende per simultaneità. Nella fisica prerelativistica si supponeva che l'affermazione «due eventi si verificano simultaneamente» avesse significato indipendentemente dal sistema di riferimento. Naturalmente, perché sia effettivamente così, deve essere possibile escogitare un esperimento capace di provare se due eventi sono simultanei. Ed in realtà, se i due eventi si verificano nello stesso posto dello spazio, si può ad esempio ricorrere ad un sistema di contatori in coincidenza, come si fa nello studio dei raggi cosmici: infatti un dispositivo di questo tipo scatta solo se i due eventi si verificano simultaneamente. Se i due eventi hanno invece luogo in due posizioni diverse dello spazio, il dispositivo precedente non serve più. In questo caso occorre inviare, da ciascuno dei due punti ove si sono verificati gli eventi, un segnale ad un dispositivo di coincidenza. Se esistesse la possibilità di trasmettere segnali istantaneamente, cioè con velocità infinita, ciò non introdurrebbe nessuna complicazione. Purtroppo però non si conoscono segnali con questa proprietà, perché tutti i segnali che si possono effettivamente realizzare si trasmettono con una velocità finità, per cui essi richiedono un tempo finito per andare da un punto ad un altro. In questo caso nella definizione di simultaneità entra in gioco il modo di propagarsi dei segnali usati: è ovvio che converrà scegliere un tipo di segnale la cui velocità di trasmissione dipenda dal minor numero di parametri possibili. A questo riguardo i più adatti sembrano i segnali elettromagnetici (in particolare quelli luminosi), perché la loro trasmissione non richiede la presenza di alcun mezzo materiale e perché la loro velocità nello spazio vuoto non sembra dipendere nè dalla direzione di propagazione, nè dalla lunghezza d'onda, nè dall'intensità della radiazione usata. È per questa ragione che nella fisica, com'è stato soprattutto mostrato dalla teoria einsteiniana della relatività, il fenomeno della propagazione della luce riveste una importanza fondamentale. Prima perciò di esporre come sia possibile dare una definizione della simultaneità di due eventi, che hanno luogo in punti diversi dello spazio, premetteremo qualche osservazione sul fenomeno della propagazione della luce. 15.3.3 Considerazioni sulla propagazione della luce Nell'originaria interpretazione della teoria di Maxwell, la luce era descritta come una perturbazione ondosa che si propagava in seno all'etere, immaginato come un mezzo statico e permeante tutti i corpi. In questa descrizione alcune delle caratteristiche principali della propagazione ondosa trovavano una spiegazione immediata. Non così invece altre caratteristiche. In particolare abbiamo a suo tempo insistito sulle contraddizioni cui portavano 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 221 i diversi esperimenti escogitati allo scopo di mettere in evidenza il moto di riferimenti (ad esempio la Terra) rispetto all'etere. Come risultato di tali esperimenti, sembrava impossibile mettere in evidenza una dipendenza della velocità di propagazione della luce non solo dalla sorgente, ma anche dal sistema di riferimento (inerziale) in cui il fenomeno veniva osservato. Sulla base degli stessi esperimenti, Einstein formulò per la propagazione della luce la seguente ipotesi (detta della costanza della velocità della luce): I segnali luminosi nel vuoto si propagano rettilineamente, con la stessa velocità costante c ad ogni istante, in tutte le direzioni, in tutti i sistemi inerziali. Dalle misure più recenti si ha che c = 2,997930 ⋅1010 cm/s. Come abbiamo detto, questa asserzione è un'ipotesi e non una proprietà deducibile, almeno in modo semplice, da una teoria ondulatoria o corpuscolare. Essa, come vedremo, verrà assunta come uno dei postulati da cui dedurre le formule di trasformazione da sostituire a quelle galileiane. Sebbene, a prima vista, possa anche sembrare contraria al modello intuitivo che siamo soliti farci del fenomeno della propagazione della luce per la descrizione dei fenomeni ordinari della vita quotidiana, tuttavia essa ci riuscirà comprensibile non appena ci saremo familiarizzati col pensiero relativistico e, in modo particolare, coi concetti di spazio e di tempo quali derivano dalla revisione critica di Einstein. L'ipotesi della costanza della velocità della luce comporta in particolare che detta velocità sia indipendente dal movimento della sorgente luminosa. Ciò risultava, come abbiamo già accennato, dal fatto che l'esperienza di Michel-son aveva dato lo stesso risultato sia usando luce proveniente da una sorgente terrestre sia luce solare. È stato anche (1963) possibile provare questa assunzione con un apposito esperimento terrestre (Alvàger, Nilsson e Kjellman). Il principio sul quale l'esperimento è basato è il seguente. Un nucleo di carbonio 12 (C12) colpito da una particella a dà luogo a un processo di scattering anelastico con conseguente transizione in uno stato eccitato del nucleo che acquista anche una certa energia cinetica di rinculo ; analogamente si comporta un nucleo di ossigeno 16 (O16). Mentre però il C12 eccitato emette un raggio gamma prima di fermarsi, l'O16 lo emette dopo essersi fermato. Utilizzando un'attrezzatura capace di rilevare i raggi γ dopo che questi hanno coperto una certa distanza, i ricercatori citati hanno constatato che non vi era alcuna differenza fra i percorsi coperti dai raggi γ provenienti dagli atomi di carbonio, sorgente in moto, e da quelli provenienti dagli atomi di ossigeno, sorgente fissa : pertanto risultano eguali anche le velocità dei due raggi. Dato che i raggi γ non sono altro che radiazione elettromagnetica come la luce, questa esperienza dimostra l'indipendenza della velocità dei segnali luminosi dal moto della sorgente. 15.3.4 Il carattere relativo della simultaneità Mostreremo ora come l'ipotesi introdotta sulla propagazione della luce sia in grado di fornire un criterio per risolvere la questione da noi posta alla fine del paragrafo 15.3.2, ossia per decidere se due eventi che si verificano in punti diversi dello spazio siano o no simultanei. A questo proposito osserviamo che, 222 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 nella fisica prerelativistica, si è sempre ritenuto come sicuramente acquisito che in ogni caso il giudizio sulla contemporaneità o meno di due eventi dovesse essere lo stesso in tutti i sistemi di riferimento, indipendentemente dal loro moto. Con la teoria della relatività si viene invece ad adottare la seguente definizione di simultaneità: due eventi che si producono nei punti P e Q di un sistema di riferimento inerziale S sono simultanei in S se e solo se la luce emessa in tali punti al manifestarsi dei due eventi arriva simultaneamente al punto di mezzo del segmento PQ nel sistema S. Questa definizione implica l'assunzione dell'ipotesi formulata al paragrafo precedente sulla propagazione della luce. Siano ora e due eventi che si verificano simultaneamente nei punti P e Q di un riferimento inerziale S e sia M il punto di mezzo di PQ in S. Considerato ora un secondo sistema inerziale S′, mobile lungo la direzione di PQ, siano P' e Q' i punti in S' nei quali si verificano e e sia M' il punto di mezzo di P' Q' in S' (Fig. 15.6a): per la simultaneità degli eventi e in S, i segnali luminosi si incontreranno in M. Dato però che l'incontro avviene (per la velocità finita della luce) con un certo ritardo dopo l'emissione dei segnali, all'istante di detto incontro M e M' saranno spostati l'uno rispetto all'altro (Fig. 15.6b). Siccome ovviamente i segnali non possono incontrarsi e in M e in M', ne deriva che gli eventi simultanei in S, non sono più tali in S'. Se ne conclude che la simultaneità in punti diversi è un concetto relativo, dipendendo dal moto del sistema di riferimento. Ciò porta inevitabilmente a rinnegare l'ipotesi di Newton del tempo assoluto. FIG. 15.6 - a), b) dimostrazione del carattere relativo della simultaneità. Ovviamente la definizione di simultaneità data precedentemente permette di sincronizzare due o più orologi in riposo l'uno rispetto all'altro. Infatti, supposto di avere due orologi l'uno nel punto P l'altro nel punto Q, basterà inviare da P verso Q un segnale luminoso all'istante t0 segnato dall'orologio in P. L'orologio in Q risulterà sincronizzato con quello in P se all'arrivo del segnale luminoso esso segnerà il tempo t1, tale che t1 - t0 = d/c, essendo d la distanza da Q a P. La correlazione invece del tempo segnato dai due orologi in P e in Q, quando Q si muove rispetto a P, è più complicata e verrà discussa in seguito. 15.3.5 La trasformazione di Lorentz Abbandonata cosi una delle ipotesi fondamentali sulle quali nella fisica prerelativistica si fondava la deduzione delle formule di trasformazione che 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA. 223 permettevano di passare da un sistema di riferimento S a un altro S' in moto rettilineo uniforme rispetto al primo, occorrerà riprendere la deduzione di tali formule di trasformazione da noi sviluppata nel paragrafo 15.1.2. Si assumeranno ora le seguenti due ipotesi : 1a Ipotesi: «Costanza della velocità della luce» — come è stata enunciata nel paragrafo 15.3.3. 2a Ipotesi: «Reciprocità del moto» — nella stessa forma enunciata al paragrafo 15.1.2. Seguendo passo per passo la deduzione del paragrafo 15.1.2 delle trasformazioni di Galileo, anche qui il principio d'inerzia imporrà che le relazioni cercate siano della forma: Supponendo ora per semplicità di considerare una traslazione lungo l'asse x, e di prendere gli assi mobili coincidenti all'istante iniziale con quelli fissi, e ripetendo per gli assi y e z le stesse considerazioni del paragrafo 15.1.2, si arriva immediatamente a stabilire che le formule di trasformazione potranno ridursi alla forma: (15.15a) Tenendo presente che eseguendo una riflessione dell'asse x in S e dell'asse x' in S', e cioè x→ - x e x' → - x', il sistema S risulta traslare rispetto a S' con velocità +w, e cioè nello stesso modo in cui, prima della riflessione, S' traslava rispetto a S, si deduce che deve essere: μ.(-w) = μ (w). Le due ultime equazioni delle (15.15a) potranno quindi riscriversi: (15.15b) Risolvendo la seconda rispetto a t' e tenendo conto della prima si ha: (15.16a) ove si è posto: (15.16b) Per calcolare il coefficiente μ (w) ricorriamo al principio della costanza della velocità della luce : un raggio luminoso partito per esempio all'istante t' = t = 0 224 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 dall'origine comune O' = O dei due sistemi S' e S deve, dopo un tempo rispettivamente t' e t, aver raggiunto tutti i punti della superficie di una sfera di centro O' = O e raggio rispettivamente ct' e ct. Dovranno cioè valere contemporaneamente le due equazioni : Considerando i due punti di intersezione della sfera con l'asse x (rispettivamente x'), le equazioni precedenti si riducono alle: la prima di queste ci dà: x = ct e x = - ct ; in corrispondenza di questi valori, dalla prima equazione delle (15.15b), tenendo conto della (15.16a), si ottiene: (15.17) che, dovendo essere soddisfatte per ogni valore di t, comportano che: Sottraendo membro a membro, e tenendo conto della (15.16b) si ha: Scartando la soluzione negativa, dato che x e x' sono equiversi, si ottiene: e di conseguenza per la (15.17): (1) È facile verificare che le μ e v da noi trovate sono soluzioni del sistema (15.17); anzi sono le uniche soluzioni del problema fisicamente significative. 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 225 Riunendo i risultati ottenuti, si ha in definitiva: (15.18a) Si può verificare inoltre che questi valori soddisfano la relazione: La trasformazione (15.8a) ha cioè la proprietà di lasciare invariata la forma quadratica. Le (15.18) esprimono la celebre trasformazione di Lorentz, che sostituisce la trasformazione di Galileo della fisica prerelativistica. Come abbiamo già avuto occasione di dire (paragrafo 15.1.1) e come mostreremo più avanti, tale trasformazione gode della proprietà di lasciare covarianti le equazioni di Maxwell del campo elettromagnetico. Le formule inverse delle (15.18a) si possono ottenere o risolvendo questo sistema rispetto a x, y, z, t, o anche più semplicemente (per l'ipotesi della reciprocità del moto) scambiando x, y, z, t, con x', y', z', t', e w con - w; esse sono quindi: (15.18b) Giova osservare che le (15.18a) e (15.18b), quando in esse si faccia tendere c a ∞ (e quindi β a 0), si riducono alle (15.7), (15.8) del paragrafo 15.1.2 della trasformazione galileiana. Ciò era d'altronde da aspettarsi, perché il far tendere c a ∞ equivale ad ammettere che i segnali luminosi si propaghino istantaneamente : ma in questo caso, come sappiamo, ha senso la definizione di tempo assoluto (t = t'), e quindi le ipotesi assunte in questo paragrafo per dedurre le formule di trasformazione da S a S' coincidono con quelle nel paragrafo 15.1.2 per la deduzione della trasformazione galileiana. Comunque questa osservazione ci assicura che quando w « c la trasformazione galileiana è valida con buona approssimazione e nessuna difficoltà si incontra praticamente nell'adozione delle equazioni della meccanica prerelativistica: d'altronde in questo caso, che si verifica nella maggior parte dei problemi che si incontrano nello studio delle proprietà dei corpi macroscopici, l'esperienza testimonia della correttezza dei risultati che da tali equazioni conseguono. Si noti che le (15.18a) non danno la trasformazione più generale che, pur essendolineare in modo da soddisfare il principio di relatività applicato alla legge d'inerzia, lasci invariata l'espressione x2 + y2 + z2 - c2t2. Le (15.18a) costituiscono cioè, come si suol dire, una trasformazione speciale di Lorentz. La trasformazione più generale è più complicata: essa si ottiene componendo 226 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 la traslazione rappresentata dalla (15.18a) con un numero opportuno di rotazioni spaziali ordinarie. Ci riserviamo ad ogni modo di studiare più particolareggiatamente in seguito le proprietà analitiche delle trasformazioni di Lorentz e di discutere la loro interpretazione geometrica. Osserviamo infine che in alcune trattazioni si preferisce procedere alla deduzione della trasformazione di Lorentz partendo dal principio di relatività einsteiniana. Basta allora ammettere che la velocità della luce abbia, in tutte le direzioni, il valore c in un particolare sistema di riferimento (ad esempio quello delle Stelle fisse), per dedurre che essa dovrà avere lo stesso valore c, in tutte le direzioni, anche in qualsiasi altro sistema che si muova rispetto al primo di moto traslatorio uniforme. Ci sembra però che da un punto di vista concettuale sia più opportuno tenere distinto il principio di relatività dalle ipotesi che si devono assumere per stabilire formule di passaggio da un sistema di riferimento inerziale a un altro (confronta il procedimento corrispondente per la deduzione della trasformazione di Galileo). Infatti il problema di determinare le formule per il passaggio da un sistema di riferimento a un altro si pone indipendentemente dal fatto che le leggi della fisica soddisfino o meno il principio di relatività. 15.3.6 Conseguenze immediate della trasformazione di Lorentz Con l'aiuto delle equazioni (15.18a) che costituiscono la trasformazione di Lorentz si possono trarre alcune immediate conclusioni circa il modo di confrontare misure di lunghezza e di intervalli di tempo, eseguite in due sistemi di riferimento S e S' in moto rettilineo ed uniforme l'uno rispetto all'altro. Supponiamo, ad esempio, che in S e in S' si misuri la lunghezza di una sbarra parallela all'asse x, la quale si trovi in quiete rispetto a S'. È ovvio come si procederà in S' nell'eseguire tale misura. Per quanto concerne invece il riferimento S, rispetto a cui la sbarra si muove con velocità w, per eseguire la misura si dovrà, in un dato istante, segnare su di un segmento di retta (asse x) le posizioni simultanee (rispetto ad S) dei due estremi di essa e poi, al solito modo, misurare la distanza fra i due segni. Nel riferimento fermo S', per quanto abbiamo detto, per eseguire la misura si potrà riportare semplicemente lungo la sbarra data il regolo-unità un numero opportuno di volte. Denotando con A e B gli estremi della sbarra, nel riferimento S' si troverà così la lunghezza della sbarra: l' = x'B - x'A . Nel riferimento S invece si segnerà in uno stesso istante (che assumeremo come istante O, misurato dall'orologio di S) i due segni dell'asse x che corripondono, come abbiamo detto, agli estremi della sbarra. Se essi sono xA e xB, la lunghezza della sbarra rispetto a S sarà l = xB - xA. Le (15.18a) forniscono una relazione che lega l con l'. Infatti dalla prima 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 227 di esse si trova: e quindi: ossia: (15.19) Se ne conclude che la lunghezza / della sbarra in movimento è minore della sua lunghezza l' di quiete. In altri termini la sbarra in moto risulta contratta nel rapporto 1− β 2 . È facile vedere invece che, come conseguenza della seconda e della terza delle (15.18), per una sbarra disposta normalmente nella direzione del suo moto non vi deve essere differenza fra i risultati delle misure eseguite nei sistemi di riferimento S e S'. Consideriamo ora due eventi che, rispetto ad S', avvengono entrambi nello stesso punto (e sia questo l'origine degli assi del sistema di riferimento S' fermo), uno all'istante 0 e uno all'istante τ' ; essi avranno dunque in S' le coordinate : Dalle (15.18a) si ricava che gli stessi eventi, osservati in S, avvengono negli istanti : per cui la durata τ = t2 - t1 misurata da un orologio in S sarà: (15.20) Se ne conclude che la durata τ di un fenomeno in un corpo in movimento è maggiore di quella dello stesso fenomeno in un corpo fermo; in altri termini la durata di un fenomeno risulta dilatata, a causa del moto, nel rapporto 1/ 1 − β 2 . Si suoi dire, sia pure impropriamente, che un orologio viene rallentato dal movimento. 228 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Il significato fisico dei risultati precedenti può essere chiarito in base alle seguenti considerazioni. Prendiamo in esame le misure di lunghezza e supponiamo, per fissare le idee, che un osservatore terrestre ed un osservatore su un treno, dotato di moto rettilineo uniforme rispetto alla terra, procedano alla misura della lunghezza di un oggetto nei loro rispettivi sistemi di riferimento. Due aste a risposo nello stesso riferimento sono da considerarsi della stessa lunghezza se è possibile disporle l'una accanto all'altra in modo che i loro rispettivi punti estremi A, A' e B, B' coincidano. Lo stesso criterio può essere usato per confrontare lunghezze su due corpi in moto relativo se dette lunghezze sono fra loro parallele e perpendicolari alla direzione del moto relativo. Se invece esse sono parallele alla direzione occorre un'analisi un po' più particolareggiata. Consideriamo pertanto un'asta Y a riposo in un sistema di riferimento inerziale, e due aste identiche AB e A' B' in moto con velocità uguali ed opposte nella direzione Y. Non è difficile immaginare un dispositivo che stabilisca in quali punti di Y i due estremi destri e sinistri delle aste si incontrano. Le formule relativistiche prevedono che la distanza fra i suddetti punti sarà minore della lunghezza di una singola asta a riposo e che sarà tanto più piccola quanto maggiore è la velocità. Vogliamo renderci conto di come questa contrazione sia strettamente connessa con il carattere relativo della simultaneità. Supponiamo infatti che le aste AB e A' B' di Fig. 15.7 siano a riposo rispettivamente nei sistemi S e S' e che Y sia a riposo nel riferimento S". Per ragioni di simmetria, gli eventi in corrispondenza dei quali A incontra A' e B incontra B', rispettivamente, sono simultanei in S''. L'incontro in S" di segnali luminosi da A e B, avverrà esattamente nel punto di mezzo delle posizioni spaziali di A e B. Nel riferimento S, invece, precede onde A'B' è da considerarsi più corto di AB. Analogamente in S' si ha che precede , onde AB è da considerarsi più corto di A'B'. FIG. 15.7 - Misurazione della lunghezza in sistemi inerziali in moto relativo. Illustreremo ora con un esempio il significato della misura relativistica del tempo e delle relazioni fra i valori che, con tale misura, si ottengono in sistemi in moto relativo. Sia dato un corpo (ad es. un treno) che si muova parallelamente rispetto a un altro (ad es. un secondo treno) con velocità v. Sia S un sistema di riferimento solidale col primo corpo (mobile) e S' uno solidale col secondo( fermo) (Fig. 15.8), Supponiamo che nei punti A, B, C di di coordinate (in S) rispettivamente x = - d, 0, + d si verifichi contemporaneamente (istante t = 0) un evento (ad es. accensione di una lampadina). Nel sistema S', solidale co) corpo , tali eventi non risulteranno più contemporanei 15.3] FIG. 15.8 I PRINCIPI DELLA RELATIVITÀ RISTRETTA 229 - Confronto delle misurazioni di durate temporali in sistemi inerziali in moto relativo. temporanei ma si verincheranno, in virtù della formula t ′ = t−β x c negli istanti : 1− β 2 Se successivamente, all'istante t = τ, sul corpo (sistema S) si produce una nuova serie di eventi (ad es. spegnimento contemporaneo delle lampade in A, B, C) avremo che tali eventi su (sistema S') si verificheranno negli istanti: La durata dei fenomeni (lampadina accesa) in A, B, C, che nel riferimento S è uguale a t, risulterà anche in S' la stessa per tutti e tre i fenomeni, essendo essa : in accordo con la formula di dilatazione del tempo. Reciprocamente, assunto che all'istante t' = 0 si producano su (sistema S') una serie di eventi contemporanei in A', B', C' (di coordinate x' — d, 0, + d), essi su (sistema S in moto rispetto a S' con velocità - v) si verincheranno rispettivamente negli istanti : Analogamente una seconda serie di eventi contemporanei in S' all'istante 230 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 t' = τ verrà osservata in S ad istanti diversi : La durata dei fenomeni in A', B', C', determinati dai due successivi eventi, e che in S' è data da t, in S risulterà: Come si vede dall'esempio ora illustrato i sistemi S e S' sono completamente equivalenti nella descrizione dei fenomeni. Verifiche sperimentali. La formula (15.20) ha trovato una verifica sperimentale diretta nello studio di due fenomeni: a) la dipendenza della vita media di un mesone in moto dalla sua velocità; b) l'esistenza di un effetto Doppler trasversale. Incominciamo col considerare il primo di questi fenomeni: a) Dipendenza dalla velocità della vita media di un mesone in moto. È noto che la maggior parte dei mesoni che si osservano al livello del mare o ad altezze di qualche migliaio di metri sono mesoni μ (di massa pari a ~ 206 volte la massa dell'elettrone e carica ± e). Una numerosa serie di esperienze di diverso tipo ha dimostrato con sicurezza che il mesone μ è radioattivo, vale a dire che esso si disintegra spontaneamente, dopo una vita media τ0 2,15 ⋅ 10-6 s, in un elettrone (con carica dello stesso segno del mesone) più due neutrini. Procedimenti sperimentali, cui ora accenneremo, permettono di misurare indipendentemente la vita media di un mesone μ a riposo e quella di un mesone μ. che si muove con velocità nota. È così possibile determinare sperimentalmente la dipendenza della vita media di disintegrazione dalla velocità della particella e stabilire quindi se tale dipendenza è in accordo con quella prevista dalla teoria della relatività. Per la misura diretta della vita media τO del mesone a riposo si ricorre al metodo seguente ideato da C. G. Montgomery, W. E. Ramsey, D. B. Cowie e D. D. Montgomery, migliorato da F. Rasetti e usato con ulteriori perfezionamenti da altri. I mesoni incidenti, rivelati da un contatore di Geiger-Mùller, sono frenati ed arrestati da una massa di metallo assorbente; dopo un certo tempo dal loro arrivo, essi si disintegrano e l'elettrone emesso, lanciato fuori dalla massa del metallo, è a sua volta rivelato per mezzo di un altro contatore. Tramite un'opportuna tecnica elettronica si registrano le coincidenze fra i segnali del contatore d'entrata, ritardati di un certo intervallo di tempo t0, ed i segnali del contatore d'uscita. In pratica si osservano i conteggi sulla scala del contatore d'entrata e quelli sulla scala del dispositivo di coincidenza dopo un certo intervallo di tempo Δt a partire da un'origine dei tempi convenuta ; dalla prima scala si ottiene il numero N0 di mesoni arrivati nella massa metallica durante il tempo Δt, dalla 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 231 seconda il numero N0 f(Δt) di mesoni disintegrati nello stesso intervallo di tempo. La differenza N0 - N0f(Δt) costituisce il numero N(Δt) dei mesoni presenti nella massa metallica all'istante Δt. ⎞ ⎛ 1 Dalla legge fondamentale per il decadimento radioattivo ⎜⎜ dN = − Ndt ⎟⎟ si ricava τ0 ⎠ ⎝ immediatamente la relazione che lega il numero di particelle residue al tempo Δt ; sarà : Ripetendo le osservazioni ad intervalli di tempi successivi e riportando in (Δt ) in corrispondenza a vari Δt, i carta semilogaritmica i valori sperimentali per ln N0 punti risultano effettivamente allineati ed il coefficiente angolare della retta interpolata è l'inverso della vita media τO. Il valore più attendibile, determinato con misure di questo tipo, è: Data la brevità della vita media del mesone, se non valesse la legge relativistica di trasformazione del tempo per un evento che si verifica in un corpo in moto, risulterebbe difficile spiegare il fatto che, come dimostra l'esperienza, i mesoni provenienti dagli alti strati dell'atmosfera siano, capaci di attraversare diversi chilometri di atmosfera; infatti, anche supponendo che essi si muovano con la velocità della luce, dovrebbero percorrere in media soltanto un tratto di circa 600 m nel tempo τO. Tenendo invece conto della teoria della relatività, per un mesone dotato di energia: con m0 = massa di riposo del mesone essendo la velocità del mesone, la vita media misurata nel sistema di riferimento terrestre avrà il valore: e di conseguenza la distanza percorsa in media del mesone risulterà data da: 232 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Dalla formula precedente risulta in particolare che un mesone di energia pari a 1 GeV=109 eV= 1 ⋅ 591 ⋅ 10-3 erg potrà percorrere in media, prima di disintegrarsi, una distanza di circa 6,4 km. Il lungo percorso che un mesone è in grado di compiere, nonostante la sua breve vita media, può essere considerato come una conferma qualitativa della legge relativistica di trasformazione del tempo (1). Una verifica quantitativa di questa legge nel fenomeno della disintegrazione del mesone n è stata ottenuta da B. Rossi e B. D. Hall. Il principio del loro metodo di misura è il seguente: per mezzo di misure di assorbimento dei mesoni nell'atmosfera, dalla legge: che regola tale fenomeno di assorbimento, si ricava il percorso medio L relativo a mesoni in uno stretto intervallo di energia attorno ad un valore E. D'altra parte il percorso medio L di un mesone di energia totale E = mc2 è: Nelle loro esperienze Rossi e Hall osservavano mesoni di energia ≥ 5 ⋅ 108 eV; per mesoni di tale energia è: vale a dire: Si può quindi porre nella (15.21), senza commettere alcun sensibile errore, v = c; da cui si ottiene: (15.22) I risultati sperimentali dimostrano che il rapporto L/E è sensibilmente costante (1) Si noti che, se si osservasse il fenomeno ih un sistema di riferimento S solidale col mesone, la vita media di questo risulterebbe eguale a τO, mentre il cammino che il mesone deve percorrere per arrivare sulla superficie terrestre risulterebbe in S eguale a l = L 1 − β 2 ,che può ancora essere percorso durante la vita media τO del mesone, dato che l = L 1 − β 2 =υτ0. Si vede da ciò come la descrizione del fenomeno sia del tutto indipendente dal sistema di riferimento rispetto al quale esso si osserva. 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 233 al variare di E, come richiesto dalla (15.22). Inoltre il valore numerico di tale rapporto risulta pari a circa 4,5 ± 0,6 km/GeV, onde tenendo conto del valore della massa di riposo del mesone μ si trova: in ottimo accordo con le misure dirette sopra citate. Verifiche analoghe sono state eseguite anche su mesoni π prodotti artificialmente in macchine acceleratrici. b) Effetto Doppler trasversale. Un'altra verifica sperimentale della formula (15.20) per la dilatazione relativistica del tempo si può avere attraverso l'osservazione del cosiddetto effetto Doppler trasversale. È noto come la fisica classica dia un'interpretazione elementare dell'effetto Doppler, vale a dire del cambiamento di frequenza della luce emessa da una sorgente in moto con una velocità v rispetto a un sistema S. Precisamente, secondo la fisica classica, se v0 è la frequenza della radiazione emessa dalla sorgente O in un sistema fermo rispetto a questa, la frequenza v, misurata in un punto P nel sistema S' in moto rispetto a S con velocità v, risulta data da: (15.23) denotando con ϑ l'angolo di v con PO. Nella trattazione relativistica del fenomeno, detto T0 il periodo della sorgente della radiazione (misurato nel sistema S), si avrà che nel sistema S' tale periodo risulterà uguale a: da cui si deduce immediatamente la relazione che lega le frequenze corrispondenti: La formula relativistica dell'effetto Doppler si otterrà pertanto dalla formula classica (15.23) sostituendo in questa v* a v0. Si ha così: (15.24) Supponendo in particolare che il moto della sorgerrte~avvenga lungo la retta PO, si dovrà porre cosϑ = - 1 o cos ϑ = 1, a seconda che trattisi di avvicinamento 234 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 mento della sorgente al riferimento S' o di allontanamento; avremo pertanto: che costituisce la legge del cosiddetto effetto Doppler longitudinale, il solo considerato nella trattazione ordinaria elementare. Supponendo invece la sorgente in moto normalmente alla direzione di osservazione (cosϑ = 0), si avrà: che costituisce la legge del cosiddetto effetto Doppler trasversale, per il quale la grandezza v - v0, contrariamente all'effetto longitudinale, è proporzionale circa a β2, e quindi di assai più difficile osservazione, tanto che tale effetto non era mai stato messo in evidenza prima dell'avvento della teoria della relatività. L'effetto Doppler trasversale, tipicamente relativistico, è estremamente difficile da rilevare, non solo perché si tratta di un effetto assai piccolo (dell'ordine di β2), ma anche perché una piccolissima deviazione nel dispositivo sperimentale dalla perfetta ortogonalità fra direzione del moto della sorgente e direzione di osservazione è causa, in conformità della (15.24), della comparsa di un effetto legato al termine β cos ϑ del primo ordine, che rende illusoria la misura dello spostamento spettrale dovuto all'effetto Doppler del secondo ordine. È ovvio d'altra parte che un tentativo di misura delle correzioni relativisti-che, legate ai termini in β2, sull'effetto Doppler longitudinale (cosϑ = 1) è così fortemente mascherato dall'esistenza dell'effetto legato ai termini del primo ordine in β, che solo una conoscenza assai più precisa di quella che in pratica si ha per il valore di β potrebbe rendere tale tentativo coronato da successo. Ives e Stilwell hanno superato le difficoltà ora ricordate, che per un certo tempo erano state ritenute insormontabili, osservando simultaneamente la radiazione emessa da una stessa sorgente nei due sensi opposti di una medesima direzione (precisamente per ϑ assai vicino a 0 ed a π). Si ha allora, ponendo rispettivamente nella (15.24) , ϑ = 0 e ϑ = π: o, nella scala delle lunghezze d'onda: Il baricentro delle due righe prodotte per effetto Doppler corrisponderà 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 235 alla lunghezza d'onda: e pertanto non coincide, come invece prevedeva la teoria prerelativistica, con la posizione della riga non spostata emessa dalla stessa sorgente a riposo nel sistema di osservazione; rispetto a questa posizione, che corrisponde alla lunghezza d'onda λ0, tale baricentro è spostato, verso il rosso, di una quantità: (15.25) Per via sperimentale è pertanto possibile misurare lo spostamento del secondo ordine Δ'λ. e confrontarlo con il valore teorico, che può essere calcolato prendendo per il valore della velocità βc, con cui si sposta la sorgente, quello che può dedursi dalla misura dello spostamento spettrale del primo ordine: (15.26) Le esperienze ideate da Ives e Stilwell si realizzano impiegando uno speciale tubo a raggi canale che permette di ottenere un fascio di ioni rigorosamente monocromatico. Normalmente si usa un tubo contenente idrogeno molecolare, le cui molecole vengono dissociate e ionizzate bombardandole con gli elettroni emessi da un filamento. Sul percorso degli ioni così prodotti si stabilisce, tramite una coppia di elettrodi forati, che permettono il passaggio degli ioni, una d.d.p. acceleratrice molto elevata. Per mezzo di uno spettrografo a reticolo a forte dispersione si esaminano le radiazioni emesse dal fascio di atomi di idrogeno (ottenuti dalla ricombinazione degli ioni con gli elettroni all'uscita del campo elettrico), osservando il raggio propagantesi verso la fenditura e l'altro nel senso opposto. I risultati sperimentali ottenuti da Ives e Stilwell esaminando la riga Hβ (4861 Å) dell'idrogeno e operando con tensioni fino a oltre 40 000 V sono riportati sul diagramma di Fig. (15.9). L'accordo fra teoria ed esperienza, come si vede, è eccellente. FIG. 15.9 - Effetto Doppler trasversale. 236 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Si noti che in questa esperienza le velocità degli atomi emettitori non superavano il valore di 0,007 c. 15.3.7 La composizione delle velocità nella cinematica relativistica Ci proponiamo ora di ricavare dalle formule di trasformazione lorentziana un teorema analogo a quello della composizione delle velocità che, nella fisica prerelativistica, deriva immediatamente dalle formule di trasformazione galileiana. Sia v la velocità di un punto mobile rispetto a S e v' quella dello stesso punto rispetto a S', il quale si muove con velocità w costante rispetto a S. Per definizione si ha: (15.27) D'altra parte, differenziando le (15.18b), si ottiene (avendo scelto gli assi x e x' dei due sistemi di riferimento coincidenti con la linea di applicazione del vettore w): (15.18c) Dividendo rispettivamente dx, dy, dz per dt si ricava: e, ricordando le definizioni (15.27) si hanno le formule: (15.28a) 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 237 le quali, assieme alle loro inverse che si ricavano immediatamente applicando il principio di reciprocità del moto e cioè le: (15.28b) sostituiscono le corrispondenti formule galileiane (15.9a) e (15.9b) del paragrafo 15.1.2, ed a queste si riducono, come facilmente si verifica, per β « 1. Una caratteristica importante, che si nota nelle formule (15.28) consiste nel fatto che anche le componenti della velocità del punto mobile perpendicolari alla velocità di trascinamento sono alterate quando quest'ultima velocità viene composta con la velocità del punto mobile rispetto al primo sistema : ciò risulta infatti dalle ultime due equazioni del gruppo (15.28). Dalle (15.28) è pure facile dedurre la relazione che lega i moduli della velocità del corpo mobile rispetto ai sistemi di riferimento S e S'. Si ha infatti con calcoli immediati : da cui introducendo i moduli delle velocità e con ovvi passaggi: (15.29) Dalle formule di composizione delle velocità nella cinematica relativistica si può dedurre immediatamente che la velocità della luce nel vuoto, c, può essere considerata, in questa teoria, come il valore limite superiore di ogni possibile velocità che possa essere impressa ad un corpo o a un segnale fisico qualsiasi. Infatti, in accordo con la prima delle equazioni (15.28), anche attribuendo a S' una velocità w = c rispetto a S, e al punto mobile una velocità (rispetto a S') pure eguale a c e diretta lungo x (che è pure la direzione del vettore w), nel sistema S si misurerà una velocità del punto mobile data da: (basta che sia w = c, oppure vx = c, perché risulti v'x = c). D'altronde il carattere limite della velocità della luce nella cinematica relativistica risulta evidente anche dalle formule (15.19) e (15.20), che danno la contrazione delle lunghezze e la dilatazione degli intervalli temporali. 238 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Infatti dette formule perdono per w > c, cioè per β > 1, ogni loro significato, in quanto, corrispondentemente a tali valori, il fattore 1 − β 2 diverrebbe immaginario. Vedremo più avanti come una verifica diretta delle formule relativistiche di composizione delle velocità sia data dall'esperienza già ricordata di Fizeau. 15.3.8 Il cronotopo: definizione e proprietà Vogliamo ora studiare un metodo geometrico, dovuto a Minkowski, per rappresentare le trasformazioni lorentziane ed in genere tutti i risultati della cinematica relativistica. In questa rappresentazione l'insieme di una quaterna di valori per le variabili x, y, z, t, si assume a coordinate di un punto cronotopico o evento elementare in uno spazio a quattro dimensioni detto spazio-tempo o cronotopo. L'ordinario spazio geometrico (x, y, z) è allora l'insieme tridimensionale dei punti cronotopici simultanei (cioè per t = cost). Mentre un punto P si muove nello spazio ordinario tridimensionale, variano le sue coordinate spaziali insieme al tempo. La sua storia (cinematica) è rappresentata dalla successione delle posizioni assunte dal punto rappresentativo nel cronotopo: l'insieme di tali posizioni forma una linea, detta linea universale, o linea oraria, o linea cronotopica. L'inclinazione della linea rispetto all'asse t, determinata dai dx dy dz valori delle derivate , , , che sono funzioni di t, indica in ogni istante la dt dt dt velocità vettoriale del punto mobile rispetto al sistema di riferimento spaziale. Essendo dx, dy, dz, dt gli incrementi che subiscono le coordinate di un punto-evento del cronotopo quando si passa da detto punto ad un altro infinitamente vicino, si definisce quadrato dell'elemento lineare del cronotopo la forma differenziale: ds2 = c2dt2 - dx2 - dy2 - dz2 . (15.30) Per la speciale forma che ha questo elemento lineare (che ricorda la distanza di due punti nello spazio ordinario), il cronotopo della relatività ristretta si dice pseudoeuclideo. Con le locuzioni ora introdotte, si può affermare che le trasformazioni lorentziane sono quelle che lasciano invariata la forma dell'elemento lineare del cronotopo. Vogliamo ora studiare un metodo geometrico, basato sulla rappresentazione cronotopica, atto a mettere in luce le proprietà della trasformazione di Lorentz. Tale metodo permette in particolare lo studio da un punto di vista formale delle relazioni esistenti tra le varie grandezze fisiche in due diversi sistemi di riferimento. Immaginiamo in un primo tempo, per metterci nel caso più semplice e intuitivo, di avere un punto materiale che si muova lungo l'asse x. Per la descrizione della storia cinematica del punto ci si potrà riferire, anziché al cronotopo quadrimensionale, ad un piano determinato degli assi x e t. Per ragioni di comodità. 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 239 assumiamo al posto della variabile t una nuova variabile Θ = ct convenendo anche di assumere la stessa unità di lunghezza per la misura delle ascisse e per quella delle ordinate (Fig. 15.10). Il nostro piano x, Θ è evidentemente un piano FIG. 15.10 - Passato, presente e futuro nel cronotopo di Minkowski. cronotopico, in quanto ogni suo punto rappresenta un punto-evento. Il moto del nostro punto materiale sarà quindi rappresentato da una linea oraria nel piano x, Θ. La condizione che il punto materiale si muova lungo l'asse x con una velocità inferiore a quella della luce è espressa da: cioè dal fatto che il coefficiente angolare della linea oraria in un punto qualsiasi di questa deve essere minore di uno, ossia che la tangente della linea oraria in un suo punto qualsiasi deve formare con l'asse dei tempi un angolo inferiore a 45°. Se si tracciano perciò le due rette formanti un angolo di 45° con l'asse dei tempi (asse Θ) ed aventi per equazioni: tutte le linee orarie passanti per l'origine e corrispondenti a punti materiali che si muovono con velocità minore di c (com'è richiesto dalla teoria della relatività) risultano interne all'angolo tratteggiato compreso tra queste due rette, le quali sono evidentemente le linee orarie di un punto che, partendo dall'origine, si muove con la velocità della luce lungo l'asse delle x rispettivamente nel senso positivo ed in quello negativo. In altre parole, dati due punti eventi appartenenti alla stessa retta di luce, un segnale luminoso emesso all'istante t = 0 nel punto x = 0 raggiunge il punto dell'asse x corrispondente all'ascissa di nell'istante corrispondente all'ordinata di . Le due rette di luce dividono il piano cronotopico in tre parti: una (futuro fisico) costituita da tutti i punti-eventi raggiunti dai segnali che partono dall'origine e che si trasmettono con velocità inferiore a quella della luce, un'altra (passato fisico) costituita da tutti i punti-eventi da cui possono partire dei segnali 240 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 diretti verso l'origine ed aventi velocità inferiore a quella della luce, ed infine una terza costituita da punti-eventi per i quali passano le linee orarie di ipotetici (fisicamente un esistenti) segnali che dovrebbero trasmettersi con velocità superiore a quella della luce : i punti della terza zona non possono quindi avere alcuna relazione con il punto-evento che abbiamo assunto come origine. Si osservi esplicitamente che nelle considerazioni ora fatte l'origine degli assi non rappresenta alcun punto-evento particolare, ma un punto-evento qualsiasi, quale ad esempio quello in cui si trova l'osservatore. Rispetto a tale punto-evento si hanno perciò tre zone cronotopiche di cui l'una rappresenta il futuro attivo, costituita dagli eventi su cui l'osservatore può agire con un'azione fìsica; l'altra il passato passivo, costituita dall'insieme degli eventi che possono aver avuto un'influenza fisica qualsiasi sullo stato in cui si trova l'osservatore; e la terza una sorta di presente inerte, costituito dall'insieme degli eventi su cui l'osservatore non può avere alcuna influenza fisica e che a loro volta non possono esercitare alcuna influenza sull'osservatore. È facile estendere le considerazioni precedenti ad eventi che si svolgono in un cronotopo a tre dimensioni (di coordinate x, y, Θ) vale a dire al caso di punti materiali, che si svolgono in un piano ordinario xy. Immaginiamo allo scopo un segnale luminoso il quale all'istante t = 0 parta dal punto O (x = 0, y = 0) ed arrivi all'istante t nel. punto P (x, y). L'equazione del raggio sarà: ossia : Questa equazione individua nel cronotopo tridimensionale (x, y, Θ) un cono retto avente il vertice nell'origine, le cui sezioni con piani paralleli al piano x, y sono cerchi col centro sull'asse Θ. Le generatrici di questo cono di luce sono le linee orarie dei raggi luminosi partenti da O (x = 0, y = 0) in tutte le direzioni del piano xy. Perciò un segnale luminoso emesso da O nell'istante t = 0 raggiunge il punto P (x, y) nell'istante t che corrisponde alla coordinata appartenente al punto-evento della falda superiore del cono di luce avente per proiezione sul piano xy il punto P. Le considerazioni precedenti si possono infine estendere al caso generale in cui il punto materiale si muove comunque nello spazio ordinario, in corrispondenza del quale si ha da considerare un cronotopo tetradimensionale. Questo verrà ad essere suddiviso ancora in tre zone: futuro fisico, che è la zona cronotopica contenuta all'interno dell'ipercono anteriore, contenuta cioè all'interno della falda superiore (Θ > 0) dell'ipercono di equazione: passato fisico, costituito dalla zona cronotopica contenuta all'interno della falda 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 241 inferiore (Θ <0) dell'ipercono; presente inerte costituito dalla zona crono-topica esterna all'ipercono di luce. 15.3.9 Superamento delle difficoltà della fisica prerelativistica Abbiamo già avuto occasione di dire come nella fisica prerelativistica i risultati di diverse misure ed esperienze — quali in particolare l'esperienza di Mi-chelson, l'esperienza di Fizeau e la misura dell'aberrazione annua delle stelle — fossero in inconciliabile contradizione fra di loro nonostante che si fosse ricorso, nel tentativo di darne una spiegazione accettabile, all'introduzione di ipotesi artificiose e del tutto improbabili sul comportamento dell'etere. Vogliamo ora mostrare come tali risultati trovino invece un'immediata spiegazione nelle formule dianzi dedotte per la cinematica relativistica. a) Esperienza di Michelson. Il risultato negativo dell'esperienza di Michelson si spiega quale conseguenza ovvia del postulato relativistico sulla costanza della velocità della luce, il quale d'altra parte fu assunto proprio col preciso scopo di giustificare il risultato di tale esperienza. Risultando infatti la velocità di una raggio luminoso che propaga in uno dei bracci dell'interferometro sempre eguale a e ed essendo l'interferometro fermo rispetto ad un osservatore terrestre, i bracci OA e OB di detto interferometro (Fig. 15.1) avranno nel sistema di riferimento terrestre sempre le stesse lunghezze l1 e l2. Sarà pertanto: ed a rotazione avvenuta: onde per il ritardo che dovrebbe produrre uno spostamento delle frange di interferenza, si ha: in accordo con l'esperienza. b) Aberrazione annua delle stelle. Come abbiamo detto a suo tempo, questo fenomeno si osserva confrontando le posizioni di una stella in due istanti diversi t e t'. Considerando un sistema di riferimento solidale con la Terra, esso verrà ad assumere agli istanti t e t' due posizioni diverse, che noi assumeremo come sistemi S e S', e potrà quindi essere considerato in moto rispetto a S con la velocità w (se l'intervallo t e t' è di sei mesi w risulterà eguale in modulo al doppio della velocità w0 della Terra nel suo moto di rivoluzione). Scelti allora (Fig. 15.11) gli assi in modo che l'asse x risulti orientato come il vettore w, sia a l'angolo che il raggio di luce che arriva sulla Terra all'istante t forma con l'asse 242 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 y nel sistema S (si suppone il piano xy coincidente col piano che contiene la direzione di w e il raggio ST), e sia α' il corrispondente angolo misurato all'istante t' in S'. FIG. 15.11 - Aberrazione di una stella. La componente della velocità della luce lungo l'asse x nel sistema S è c sen α, quella lungo x' in S' è invece e sen α'. Applicando allora la prima delle (15.28) avremo : da cui, dividendo ambo i membri per c, si ricava: Togliendo + 1 ad entrambi i membri, dopo averli moltiplicati per β, e riducendo allo stesso denominatore si ha: da cui con semplici passaggi algebrici: Essendo β « 1, potremo porre α' = α + ε e considerare β e ε come infinitesimi del primo ordine. Sviluppando i calcoli in prima approssimazione si ottiene: da cui la formula che da l'aberrazione: (15.31) In questa formula α — α' rappresenta l'angolo compreso fra le direzioni della stella agli istanti t e t', cioè la misura dell'aberrazione della stella. 15.3] I PRINCIPI DELLA RELATIVITÀ RISTRETTA 243 La formula (15.31), tenendo conto del significato dei simboli, coincide praticamente con la (15.14) dedotta al paragrafo 15.2.3 basandosi sull'ipotesi, dimostratasi poi insostenibile, dell'esistenza di un sistema privilegiato, da assumersi come sede di tutti i fenomeni elettromagnetici, solidale col Sole. Anzi, il confronto fra la (15.31) e la (15.14) è particolarmente significativo nel caso dell'aberrazione che si rileva osservando una stella circumpolare a intervalli di sei mesi: infatti, in questo caso, gli angoli ϕ di (15.2.3) e α di questo paragrafo risultato rispettivamente eguali a 90° ed a 0°, l'angolo α - α' coincide con 2ψ0, la velocità w che compare nella (15.31) viene ad essere uguale a 2w0 e di conseguenza le due formule vengono proprio ad identificarsi (1). e) Esperienza di Fizeau. Questa esperienza è direttamente interpretabile per mezzo del teorema relativistico della composizione delle velocità. Prendendo infatti (Fig. 15.5) la direzione di propagazione della luce nell'acqua come asse x, dovremo applicare la prima delle (15.28) per ottenere la velocità V della luce (che si propaga nel liquido in moto) rispetto all'osservatore. Si ottiene così: dove si deve prendere il segno + o il segno - a seconda del senso del moto del liquido. Essendo w « c/n, potremo sviluppare in serie di potenze di β/n e trascurare le potenze superiori alla prima, onde: che, come abbiamo detto a suo tempo (cfr. paragrafo 15.2.3), costituisce la formula richiesta per la spiegazione dei risultati sperimentali. (1) Si noti che in generale la trattazione anche relativistica che si da nei vari testi dell'aberrazione delle stelle non è corretta: infatti essa si basa di regola nel confrontare il moto del raggio luminoso, rispetto ad un osservatore terrestre, con quello rispetto ad un sistema associato al Sole od alla Stella considerata. Questo modo di procedere porta a calcolare una grandezza che non è quella che in realtà ci forniscono le misure sperimentali e che consiste nel confronto dei risultati ottenuti in due riferimenti solidali con la Terra in due istanti diversi ; per di più esso porta al risultato (sperimentalmente dimostrato errato) di una dipendenza del fenomeno dell'aberrazione stellare della velocità della Stella rispetto all'osservatore. 244 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 15.4 Elettrodinamica Relativistica 15.4.1 Covarianza delle equazioni di Maxwell rispetto ad una trasformazione di Lorentz Il principio di relatività enunciato da Einstein esige che esso sia valido per tutti i fenomeni fisici e non solo per quelli meccanici come esigeva invece lo stesso principio secondo l'enunciato di Galileo. Ciò comporta la covarianza delle leggi che regolano i fenomeni fisici quando si passa da un sistema di riferimento S a un altro S' in moto rettilineo uniforme rispetto al primo. Tale passaggio, nella teoria relativistica ristretta, avviene secondo una trasformazione di Lorentz che, nel caso in cui all'istante iniziale t = t' = 0 si assumano coincidenti gli assi xyz e x' y' z' e la traslazione w di S' rispetto a S avvenga lungo l'asse x=x', è del tipo speciale: (15.32) In particolare dunque dovranno essere covarianti rispetto a tale trasformazione le equazioni di Maxwell nel vuoto: (15.33) con Si osservi a questo proposito che il fatto che da queste equazioni si possa dedurre la legge di propagazione dei raggi luminosi con velocità costante c = 1 / ε 0 μ 0 rispetto a un sistema di riferimento inerziale non è condizione sufficiente per assicurare che le equazioni di Maxwell siano covarianti rispetto a una trasformazione di Lorentz. Infatti la legge di propagazione di un raggio luminoso è solo un caso particolare dei fenomeni descritti dalle equazioni di Maxwell e non è affatto evidente a priori che anche le leggi dei numerosi altri fenomeni derivanti da queste equazioni soddisfino alle richieste condizioni di invarianza. 15.4] ELETTRODINAMICA RELATIVISTICA 245 La dimostrazione che l'intero sistema di equazioni di Maxwell (15.33) sia covariante rispetto alle trasformazioni (15.32) è stata data, come già abbiamo accennato (cfr. paragrafo 15.2.1), dallo stesso Lorentz ancor prima dell'avvento della relatività einsteiniana. Ometteremo tale dimostrazione, limitandoci a scrivere esplicitamente le •leggi di trasformazione dei vettori E e B. Esse sono: (15.34) Per le densità di carica e corrente si hanno ancora le formule di trasformazione: avendo indicato con ρ0 la densità di carica nel sistema per cui w = 0. Si noti che come conseguenza delle relazioni soprascritte e delle formule di trasformazione per le coordinate spaziotemporali si ha che la carica elettrica dq contenuta in un volume dV = dx dy dz : è un invariante, cioè la carica dq è la stessa in tutti i sistemi inerziali. Questo risultato vale in particolare per la carica e dell'elettrone e di qualsiasi altra particella carica. Un carattere preliminare delle formule di trasformazione (15.34) è che ciascuno dei vettori E', B' dipende simultaneamente da E e da B: in altri termini la separazione di un campo elettromagnetico nelle sue parti elettrica e magnetica dipende dal moto del sistema di riferimento, per cui un campo che in un sistema può venir considerato come puramente elettrico, in un altro sistema in moto rispetto al precedente viene a possedere anche componenti magnetiche. Questa caratteristica ha un significato geometrico profondo: infatti si potrebbe dimostrare che il complesso delle sei componenti Ex, Ey, Ez, Bx, By, Bz, che caratterizzano il campo elettromagnetico sono le componenti di un tensore emisimmetrico Fαβ (α, β = 1, 2, 3, 4) associato alla varietà quadrimensionale detta cronotopo o spazio-tempo (cfr. paragrafo 15.3.8). 246 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Ricordiamo ora che i vettori E e B del campo elettromagnetico si possono derivare da un vettore A (potenziale vettore) e da uno scalare ϕ (potenziale scalare) per mezzo delle relazioni: Dalle formule di transizione (15.34) di E, B rispetto a una trasformazione di Lorentz (15.32) è allora possibile ricavare le formule di trasformazione di ϕ, A. Esse risultano date da: (15.35) Dal punto di vista dell'interpretazione geometrica si potrebbe anche qui dimostrare che il complesso delle quattro componenti Ax, Ay, Az ϕ sono le componenti Aα (α= 1, 2, 3, 4) di un vettore associato alla varietà quadrimensionale detta cronotopo o spazio-tempo (cfr. paragrafo 15.3.8). Si potrebbe infine verificare la covarianza sia delle equazioni dei potenziali ritardati sia delle condizioni supplementari di Lorentz. Osserviamo che la legge di trasformazione delle componenti del campo elettromagnetico non solo ha il vantaggio di mettere in evidenza la covarianza delle equazioni di Maxwell rispetto ad una trasformazione di Lorentz e di permettere l'esecuzione rapida dei calcoli per il passaggio da un sistema di riferimento ad un altro, ma porta pure ad una nuova concezione del campo elettromagnetico stesso. Questa concezione è una conseguenza dell'intima fusione del campo elettrico con quello magnetico, i quali nella teoria della relatività costituiscono un ente unico; essa permette inoltre di dare, anche nella approssimazione della fisica prerelativistica (vale a dire quando si trascurano i termini dell'ordine di β2 = v2/c2), un'interpretazione di alcuni fenomeni elettromagnetici diversa e forse più espressiva di quella ordinaria. Illustreremo questa circostanza su di un esempio semplice. In due riferimenti S e S' in moto relativo con velocità w si consideri l'azione di un campo elettromagnetico su di una carica che si muove solidamente ad S. Secondo l'ordinaria concezione maxwelliana in S si constaterà che il campo elettrico esercita sulla carica q una forza: F = qE mentre il campo magnetico non esercita alcuna azione. Nel sistema S', rispetto al quale la carica si muove con velocità w, si constaterà invece che il campo elettrico E esercita ancora un'azione data dalla formula precedente, mentre il campo 15.41 ELETTRODINAMICA RELATIVISTICA 247 magnetico B eserciterà (come conseguenza della legge elementare di Laplace che da origine alla cosiddetta forza di Lorentz) una forza : qw × B, onde complessivamente : F' = q (E + w × B). Secondo la concezione relativistica invece, per trovare la forza esercitata sulla carica e misurata in S' basterà applicare la formula di trasformazione del campo elettrico per il passaggio dal sistema S a quello S' che, nell'approssimazione in cui intendiamo eseguire i calcoli, risulta : E' = E + w × B, onde : F' = qE' = q (E + w × B) che coincide con la precedente. Da ciò si vede come, secondo la concezione relativistica, la validità della legge di Lorentz non deve essere assunta come un fatto sperimentale nuovo indipendente dalle equazioni del campo elettromagnetico (il che si verifica nell'ordinaria concezione maxwelliana), ma è strettamente legata alle leggi di trasformazione di detto campo. 15.4.2 Campo di un elettrone in moto e suo irraggiamento Ci proponiamo ora di calcolare il campo di una particella carica dotata di moto qualsiasi, allo scopo di derivare poi l'energia emessa sotto forma di irraggiamento. L'applicazione delle formule relativistiche di trasformazione si dimostra particolarmente utile a questo riguardo. Cominceremo a trattare un caso particolarmente semplice, consistente nel calcolo del campo elettromagnetico generato da una carica q puntiforme dotata di moto rettilineo ed uniforme rispetto all'osservatore. Detto S (O, x, y, z, t) un sistema di riferimento solidale con l'osservatore, introduciamo un altro sistema S' (O', x', y', z', t'), solidale con la carica in moto con velocità v rispetto al sistema S. Sia R' (x', y', z') la posizione della carica all'istante t' = O (che supporremo coincidere con t = 0) nel sistema S'. Essendo, come si è detto, questo sistema solidale con la particella in qualsiasi istante, questa occuperà sempre la posizione R'. Vogliamo calcolare il campo all'istante t = 0 nel punto O, che supporremo coincidere in tale istante con O'. In S' il campo generato dalla particella (ferma) sarà un campo puramente elettrostatico, vale a dire si avrà: (15.36) Si tratta ora di calcolare il campo osservato nel sistema S. Ciò può conseguirsi per mezzo di una trasformazione di Lorentz. Assumendo per semplicità l'asse x di S coincidente con x' di S', potremo applicare le formule (15.35) per la trasformazione dei potenziali; avremo cosi: (15.37) 248 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Esprimeremo r' in funzione delle coordinate relative al sistema S. Dato che, come abbiamo già osservato, la posizione R' (riferita al sistema S') è indipendente dal tempo, potremo eseguire il calcolo di r' per un istante qualsiasi: per esempio l'istante t' in corrispondenza del quale si ha: (15.38) vale a dire: Per l'invarianza delle equazioni ora scritte, avremo che per le coordinate x, y, z, t, che caratterizzano lo stesso evento in S, si avrà pure: (15.38a) vale a dire: Ma dalle formule della trasformazione speciale di Lorentz si ha: Sostituendo in questa formula a ct ed a ct' le loro espressioni che si ricavano rispettivamente dalla (15.38) e dalla (15.38a), si ottiene: x rappresenta la proiezione del vettore v, diretto lungo x, sulla r → r direzione r del vettore RO vale a dire la velocità radiale − v ⋅ calcolata all'istante r r t = - r/c, cioè ad un istante precedente di un tempo quello (assunto come t = 0) in c cui l'osservatore determina il campo nel punto O. Conscguentemente le (15.37) danno, per i potenziali del campo, ad un istante t: Osserviamo che − v dove le entità entro [ ] denotano valori ritardati, cioè misurati all'istante che precede r/c quello considerato dall'osservatore in O. 15.4] ELETTRODINAMICA RELATIVISTICA 249 Le formule precedenti possono anche scriversi in forma vettoriale nel modo seguente : (15.39a) Il significato fisico delle equazioni scritte discende immediatamente dal fatto ben noto che le azioni elettromagnetiche si propagano con la velocità e. Infatti (Fig. 15.12) esse danno il potenziale in un punto P (ove si esegue la misura) FIG. 15.12 - Illustrazione del carattere ritardato delle azioni elettromagnetiche. all'istante in cui la particella, muovendosi lungo la sua traiettoria rettilinea, passa per un punto B. Nelle formule che determinano tale campo non figura però la distanza r0 = BP, che separa la posizione della particella dal punto di osservazione all'istante della misura, ma quella r = AP che separa la particella dal punto di osservazione nell'istante in cui da essa partiva l'azione elettromagnetica che giungerà in P all'istante considerato. Se indichiamo con r0 il raggio vettore che congiunge la posizione B (all'istante t) della particella col punto di osservazione P, e con r il raggio vettore che congiunge il punto A, ove si trovava la particella all'istante t – r/c, con il punto P, si ha infatti : come risulta chiaro tenendo presente che r/c è il tempo impiegato dall'azione elettromagnetica per propagarsi da A a P, e che tale tempo è eguale a quello impiegato dalla particella per spostarsi da A a B. Si noti che essendo v costante si ha: [v] = v onde le (15.39a) possono scriversi: (15.39b) Queste formule, da noi dimostrate per una particella carica dotata di moto rettilineo ed uniforme, sono valide in realtà per moti qualsiasi della particella. 250 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Esse vengono indicate nella letteratura come formule dei potenziali di WiechertLiénard. Dall'espressione scritta dei potenziali A e ϕ si possono ricavare i vettori del campo elettromagnetico E e B per mezzo delle solite relazioni: I calcoli sono abbastanza complessi, per cui ci limiteremo a dare i risultati finali. Si trova: (15.40) dove si è posto: Come si verifica facilmente si ha: cioè, il campo magnetico è ovunque perpendicolare al raggio vettore. Il campo (15.40) può essere scomposto in due parti: a) il campo E1 H1 che dipende solo dalle velocità ed è inversamente proporzionale al quadrato della distanza: (15.41) b) il campo E2, H2 che dipende dall'accelerazione ed è inversamente proporzionale alla prima potenza della distanza: (15.42) 15.5] DINAMICA RELATIVISTICA 251 Si può facilmente verificare che: e che E2 e H2 sono perpendicolari al raggio vettore. Si ha inoltre la relazione fra i moduli dei vettori: cioè : In altri termini le parti E2,H2 dei vettori E e H che dipendono dalla accelerazione sono fra loro legate nel modo caratteristico di un'onda elettromagnetica. I campi E2, H2 rappresentano un'onda sferica emessa dall'elettrone. Il campo parziale El , H1, che dipende solo dalla velocità, è il campo elettrostatico che si muove con l'elettrone, mentre il campo E2, H2, che è dovuto all'accelerazione, è un campo di radiazione. A distanze grandi dall'elettrone il campo di radiazione è predominante poiché esso si smorza più lentamente con la distanza del campo elettrostatico. Possiamo infine calcolare l'energia irradiata dalla carica in moto sotto forma di onde elettromagnetiche. La potenza irradiata P sarà data dal flusso del vettore di Poynting S attraverso una superficie chiusa S che circonda la carica. Considerando per semplicità una sfera di raggio R con il centro nella posizione della carica all'istante t - R/c, avremo: Tenendo conto delle espressioni (15.42) per il campo di radiazione E2, H2 si trova, con qualche calcolo che per semplicità tralasciano, il risultato finale: (15.43) da cui si vede come la potenza irradiata sia proporzionale al quadrato dell'accelerazione della particella carica. 15.5 Dinamica Relativistica 15.5.1 Generalizzazione relativistica dell'equazione di Newton La legge fondamentale della dinamica prerelativistica è, come si è detto a suo tempo (cfr. paragrafo 15.3), covariante (anzi invariante) rispetto ad una 252 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 trasformazione galileiana, ma non covariante rispetto a una trasformazione lorentziana. La dinamica relativistica dovrà quindi essere fondata su leggi diverse da quelle della dinamica newtoniana, pur dovendosi in pratica ridurre a questa per velocità piccole rispetto a quella della luce. Anzi in un sistema di riferimento nel quale il punto materiale è a riposo varrà esattamente l'equazione : (15.44) della dinamica newtoniana (equazione del moto incipiente). Si pone pertanto il problema di cercare quali modifiche si debbono apportare alla (15.44) onde renderla covariante rispetto a una trasformazione di Lorentz. Dato che il problema, nel suo caso più generale, è piuttosto complesso, ci limiteremo a considerare il caso di particolare interesse fisico di una particella di carica e sottoposta all'azione di un campo elettromagnetico caratterizzato dai vettori E e B. Nella meccanica newtoniana tale equazione si scrive: (15.45) essendo: la quantità di moto della particella. Già sappiamo come si trasformano, rispetto a una trasformazione di Lorentz le varie grandezze che compaiono nella (15.45) all'infuori della quantità di moto p e in particolare della massa che in essa compare. Per trovare l'espressione relativistica di p = m0v in un sistema in moto ricorreremo allo studio dell'urto fra due particelle sulla base delle leggi di trasformazione delle velocità che già abbiamo stabilito nella cinematica relativistica come conseguenza della trasformazione di Lorentz. 15.5.2 Massa relativistica di una particella Come si è visto nel paragrafo 15.3.7, nella teoria einsteiniana il teorema di composizione delle velocità della meccanica newtoniana risulta modificato ed espresso dalle formule (15.28). Ciò implica una variazione anche dei teoremi che regolano l'urto fra le particelle. Vogliamo ora mostrare come tale variazione porti sostanzialmente a un risultato di notevole importanza: la massa di un corpo dipende dalla sua velocità e quindi risulta diversa in riferimenti inerziali in moto relativo l'uno rispetto l'altro. Consideriamo l'urto frontale fra due particelle elastiche identiche ed esaminiamo l'evento in due sistemi di riferimento S ed S', con S' che trasla rispetto ad S con velocità w diretta lungo l'asse x. Si scelga il sistema S' in modo che 15.5] DINAMICA RELATIVISTICA 253 in esso le due particelle si muovano con velocità v' e - v' parallelamente all'asse x. Nel sistema S esse, prima dell'urto, avranno velocità rispettivamente v1 e v2. Allo scopo di non introdurre a priori alcuna restrizione su un'eventuale dipendenza della massa dalla velocità, denoteremo in S la massa della prima parti-cella con ml e quella della seconda con m2. Nell'urto dovranno conservarsi la massa totale M del sistema costituito dalle due particelle e la quantità di moto totale. Scrivendo tali reazioni nel sistema S avremo: (15.46) avendo denotato V la velocità comune in S delle due particelle all'atto dell'urto che corrisponde alla velocità zero in S'. Le formule relativistiche ((15.28) di paragrafo 15.3) per la composizione delle velocità ci daranno quindi per il fenomeno in esame (essendo nel nostro caso v'1 = v' e v2= - v'): (15.47) Eliminando M, v1 e v2 dalle (15.46) e (15.47) otteniamo: Tenendo presente la relazione (15.29) di paragrafo 15.3.7 che lega i moduli delle velocità v e v' di un punto misurate in due sistemi di riferimento S e S' in moto relativo l'uno rispetto all'altro con velocità w si trova per il nostro caso: Dividendo la seconda per la prima e semplificando si ha immediatamente: (15.48) Essendo le particelle identiche esse avranno in un sistema a riposo la stessa massa m0. La (15.48) esprime pertanto che la massa di una particella in un riferimento 254 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 rispetto al quale si muove con velocità v è inversamente proporzionale al fattore 1 − v 2 / c 2 . In altri termini possiamo dire che la massa m di una particella dipende dalla sua velocità v conformemente alla relazione (15.49) dove m0 rappresenta la massa a riposo della particella. Nella teoria di Einstein si arriva dunque a questo risultato nuovo : la massa di una particella, da intendere ovviamente come misura della sua inerzia, è funzione della velocità; tale funzione è rappresentata graficamente in Fig. 15.13. Come si vede da questa figura, per velocità piccole rispetto a c (β2 « 1), la massa m della particella è quasi costante e praticamente coincide con la massa propria o intrinseca m0, vale a dire con la massa a riposo: si noti che la differenza relativa fra massa della particella in moto e massa a riposo non supera il milionesimo finché la velocità non supera i 400 km/s. La massa a riposo è pertanto la massa della particella della meccanica newtoniana. Col crescere della velocità la massa d'inerzia aumenta e tende a diventare ∞ per v → c: questa circostanza illumina un altro aspetto del carattere di valore limite che ha, come già abbiamo più volte riscontrato nello studio della cinematica (paragrafo 15.3) la velocità della luce nella teoria della relatività. Vedremo a suo tempo come la (15.49) sia suscettibile di un'accurata verifica sperimentale. FIG. 15.13 - Dipendenza della massa dalla velocità. 15.5.3 Equazione del moto di una particella carica in un campo elettromagnetico. Espressione dell'energia cinetica Sulla base dei risultati precedenti assumeremo come equazione relativistica di una particella carica in un campo elettromagnetico la seguente: (15.50) 15.5] DINAMICA RELATIVISTICA 255 dove: Si può verificare che applicando una trasformazione di Lorentz e tenendo presente le leggi di variazione di t (paragrafo 15.3.5), di v (paragrafo 15.3.7) e di E, B (paragrafo 15.4.1) la (15.50), valida in un sistema inerziale S, si trasforma in un'altra per il sistema S' della stessa forma. Vogliamo studiare ora alcune conseguenze dell'equazione (15.50) che, ponendo al solito: (15.51) si scrive: Come nella meccanica prerelativistica, definiremo la potenza P della forza F come: P = F ⋅ v. Dalla (15.51) si ha, data l'ortogonalità dei vettori v e v × B: P = F ⋅ v = eE ⋅ v, (15.52) cioè la potenza esercitata dalla sola forza elettrica (il campo magnetico non compie alcun lavoro). Per l'equazione (15.50) della dinamica si ha inoltre: da cui con facili passaggi algebrici: Si conclude quindi che il lavoro elementare dL è il differenziale esatto della quantità mc2. Integrando fra t1 e t2 si ha: (15.53) 256 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Questa relazione si può mettere sotto una forma identica a quella che esprime nella dinamica newtoniana il teorema della energia cinetica. A questo scopo assumeremo per l'energia cinetica relativistica la seguente espressione: dove K è una costate che potremo scegliere in modo che per v = 0 si abbia T = 0. Sarà perciò K= - m0c2 e di conseguenza l'espressione relativistica dell'energia cinetica sarà la seguente: (15.54) È facile verificare che per v « c questa espressione si riduce a quella consueta della meccanica newtoniana. Infatti, tenendo presente lo sviluppo in serie di potenze di β2 dell'espressione (1 — β2)-1/2, e cioè si ha approssimativamente: Si osservi che, secondo la (15.54) l'energia cinetica di un punto materiale va crescendo e tende a ∞ per v → c : ciò significa che per imprimere ad un corpo la velocità c occorre spendere un lavoro ∞, fatto questo in evidente relazione col carattere di velocità limite posseduto nella teoria della relatività della velocità della luce. Con la espressione (15.54) dell'energia cinetica, la (15.53) si scrive: e cioè: il lavoro eseguito dalle forze elettromagnetiche sulla particella in moto operando per un intervallo di tempo t2 - tl è eguale alla variazione dell'energia cinetica della particella nello stesso intervallo di tempo. La (15.53) esprime dunque, come avevamo detto, la generalizzazione relativistica del noto teorema dell'energia cinetica o delle forze vive. 15.5.4 Massa ed energia Dall'espressione (15.54) dell'energia cinetica si può ricavare: 15.5] DINAMICA RELATIVISTICA 257 che esprime come, nella teoria della relatività, l'acquisto da parte di un corpo di un'energia cinetica T si manifesti come un incremento della massa inerziale da m0 a m. In altri termini si può dire che all'energia cinetica T posseduta da un corpo è legata una massa T/c2. Se si tiene poi presente che l'energia cinetica T può trasformarsi in altre forme di energia (potenziale, termica, elettromagnetica, chimica, ecc.), appare del tutto spontaneo generalizzare il risultato dianzi ottenuto affermando che a una quantità di energia E corrisponde, in qualunque forma essa si manifesti, una massa m legata ad E dalla relazione: (15.55a) Ciò induce, in modo del tutto naturale, ad associare una massa, e quindi un'inerzia, ad ogni forma di energia e ad assumere che reciprocamente ad una massa qualsiasi, in moto o a riposo, sia associata una quantità di energia data da E = mc2. In particolare un corpo a riposo di massa m0 possiede un contenuto di energia, detta intrinseca, pari a m0c2. La conseguenza immediata di una siffatta concezione è che ad ogni variazione ΔE dell'energia di un corpo, comunque questa possa venir provocata (per mezzo di effetti cinetici, di fenomeni elettrici, magnetici, termici, chimici, ecc.), ci si deve attendere una corrispondente variazione della massa complessiva del corpo data da: (15.55b) Tale variazione di massa è in generale estremamente piccola ed in pratica trascurabile. Infatti dalla relazione scritta discende che ad una variazione energetica di un Joule corrisponde una variazione di massa pari a ~ 1,1 ⋅ 10-12 g. Inversamente alla massa a riposo anche piccolissima di una particella corrisponde un contenuto energetico enorme ; infatti, sempre in virtù della relazione (15.55) la massa di un grammo risulta equivalente a ben 9 ⋅ 1020 erg = 9 ⋅ 1013 joule. Si osservi che dalla relazione tra massa ed energia deriva che anche quando non entrano,in gioco velocità così elevate da rendere sensibile l'influenza del fattore 1 / 1 − β 2 , in un sistema isolato tali grandezze (non relativistiche) M0, E non si conservano separatamente come si ammetteva nella teoria prerelativistica, ma ciò che resta costante attraverso tutte le trasformazioni è la combinazione M0 c2 + E (principio generalizzato dalla conservazione dell'energia). Si noti ancora che l'equivalenza, come impropriamente si suoi dire, tra massa ed energia comporta pure che al propagarsi di una certa energia E con velocità v è necessariamente associata una quantità di moto: (15.56) 258 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Una relazione di questo tipo era d'altronde già nota, come conseguenza della teoria di Maxwell, nello studio della propagazione dell'energia posseduta dalle onde elettromagnetiche; risultato questo che appare ora come un caso particolare di un teorema del tutto generale. 15.5.5 Verifiche sperimentali a) Dipendenza della massa dalla velocità. È possibile, mediante esperienze dirette, verificare la legge relativistica della dipendenza della massa dalla velocità. I vari dispositivi usati nelle numerose esperienze eseguite a questo riguardo sono sostanzialmente gli stessi che vengono usati per la determinazione della carica specifica dell'elettrone. Osserviamo esplicitamente che la possibilità di determinare la dipendenza della massa dell'elettrone in moto dalla velocità, con esperienze di questo tipo, si fonda sull'ipotesi che la carica elettrica e dell'elettrone sia una grandezza invariante. Tutti i metodi usati prima del 1940, tra i quali ricordiamo quello ben noto delle parabole di J. J. Thomson, per la determinazione della variabilità della massa dell'elettrone in funzione della sua velocità erano però affetti da un certo errore dovuto soprattutto al fatto che, usandosi per la deflessione delle parti-celle un condensatore piano a facce parallele, la focalizzazione era piuttosto scarsa; sebbene quindi i risultati permettessero di affermare con certezza che la massa dell'elettrone è una funzione crescente della velocità, l'incertezza dei valori misurati era tale da non permettere di verificare se tale funzione fosse quella espressa dalla formula di Einstein o quella espressa dall'altra formula proposta da Abraham: e che ebbe storicamente una notevole importanza. Solo nel 1940 fu ideato (da M. M. Rogers, Reynolds e F. T. Rogers) un metodo di misura più preciso; la differena importante tra questo metodo ed i precedenti sta nell'uso di un campo elettrico radiale piano, realizzabile con notevole perfezione grazie ad una tecnica messa a punto soprattutto per opera di Dempster, che permette una migliore messa a fuoco. In linea di principio l'esperimento non differiva però dagli schemi consueti; ossia, si misuravano le deflessioni di un fascette di particelle cariche (in questo caso elettroni) prima in un campo magnetico costante, poi nel campo elettrico radiale. Le misure venivano eseguite su fasci di raggi β del Ra (B + C) che emette elettroni di tre energie diverse e ben definite. L'accurata precisione con cui erano realizzate le varie parti del dispositivo sperimentale di Rogers permetteva una precisione dell'ordine dell'1 %. I risultati ottenuti per le tre energie degli elettroni emessi dal Ra(B + C) sono rappresentati in Fig. 15.14. Dall'esame di questa si vede chiaramente come i punti sperimentali giacciano sulla curva tracciata in base alla formula di Einstein; inoltre la differenza fra i valori dati da questa curva e quelli dati dalla curva che corrisponderebbe alla formula di Abraham supera di circa 10 volte l'errore sperimentale. 15.5] FIG. 15.14 DINAMICA RELATIVISTICA 259 - Verifica sperimentale della dipendenza della massa dalla velocità. Le esperienze di M. M. Rogers, Reynolds e F. T. Rogers provano quindi entro i limiti degli errori sperimentali (che come abbiamo detto non superano l' 1%), che (almeno per gli elettroni) la legge di variazione della massa con la velocità è quella prevista dalla teoria della relatività. Ulteriori verifiche sono state eseguite usando fasci di elettroni monocromatici prodotti in macchine acceleratrici (ad esempio betatroni). b) Bilancio energia-massa nelle reazioni nucleari. Una verifica sperimentale del principio generale di equivalenza massa-energia è stata conseguita nello studio di numerose reazioni nucleari nelle quali si conosce, attraverso misure dirette (eseguite con lo spettrografo di massa), la massa delle particelle reagenti e nelle quali l'energia (sviluppata od assorbita) ha pure potuto essere misurata direttamente. Prenderemo ad esempio una reazione particolarmente semplice ma assai comune, del tipo: (15.57) denotando con A0 il nucleo urtato, A1 la particella urtante, A3 il nucleo residuo ed A2 la particella emessa. Indicando con E0, El, E2, E3 le energie cinetiche delle varie particelle in gioco nel sistema del centro di massa, avremo per l'energia liberata nella reazione: (15.58) Questa grandezza, secondo la concezione einsteiniana dell'equivalenza tra massa ed energia, dovrà essere legata alla differenza ΔM fra le masse a riposo delle particelle al primo membro e quelle delle particelle al secondo membro della (15.57) dalla relazione: (15.59) 260 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 Considereremo particolareggiatamente la reazione nucleare: (15.60) che permette la verifica della (15.59) con un'incertezza che comporta un errore inferiore all'1 %. Tale reazione è stata ottenuta per la prima volta da Crockroft e Walton bombardando il litio con protoni accelerati mediante l'applicazione di un campo elettrico generato da una d.d.p. di qualche centinaio di migliaia di volt. Il dispositivo sperimentale per lo studio di tale reazione è schematicamente il seguente : un fascio di protoni (provenienti da un acceleratore elettrostatico) incide su una lastra di litio e sul cammino delle particelle a uscenti da questa è interposto un foglio di mica a spessore variabile, per mezzo del quale si misura l'assorbimento e quindi l'energia delle particelle. Infine una camera a ionizzazione, collegata con un'amplificatore, permette di misurare il numero delle particelle stesse. Dai valori dell'energia cinetica delle particelle a si deduce: D'altra parte le masse delle particelle in gioco nella relazione sono ben note attraverso misure dirette per mezzo dello spettrografo di massa. Si ha precisamente (esprimendo le masse in unità atomiche): Alla reazione (15.60) è pertanto associata una variazione di massa pari a 0,01858, cioè, in conseguenza della relazione di equivalenza (15.59), pari a 17,27 MeV; questo coincide con uno scarto di circa l'1 % col valore misurato di Q. Si conoscono oggigiorno numerose reazioni nucleari, che permettono la verifica sperimentale della relazione di Einstein con un errore probabile di qualche % ; alcune di queste sono riportate nella Tabella 15.1. Tabella 15.1. Tipo di reazione Nuclei iniziali α-p F 19 9 + p-α L p-γ ΔM.c2 Nuclei finali (MeV) Q (MeV) α Ne 22 10 +p 1.53 1.58 7 3 +p He 4 2 +α 17.27 17.13 L 7 3 +p Be 8 4 +γ 17.12 17.1 d-α O 16 8 + d N 14 7 + α 3.11 3.13 d- p N 14 7 + d N 15 7 + p 8.57 8.55 n-γ H 11 + n +γ 2.20 2.237 H 2 1 15.5] DINAMICA RELATIVISTICA 261 Concludendo possiamo affermare che il confronto fra l'energia sviluppata nelle reazioni nucleari e le differenze di massa ottenute per mezzo di misure con lo spettrografo di massa costituisce una verifica sufficientemente precisa del principio di equivalenza tra massa ed energia. c) Verifiche globali dell'equazione della dinamica. Tutta la teoria della relatività ristretta, ed in particolare le equazioni relativistiche del moto di una carica in un campo elettromagnetico, trovano la conferma più evidente e sensazionale nel ruolo fondamentale che esse hanno ormai assunto in due campi della tecnica: quello dell'elettronica e quello delle macchine acceleratrici. Infatti sia nel funzionamento di tubi elettronici di vario tipo (tubi a raggi catodici, valvole termoioniche, magnetron, klystron, ecc.) sia nella progettazione delle grandi macchine acceleratrici (betatroni, sincrotroni, ciclotroni, acceleratori lineari di risonanza, ecc.), che vengono impiegate nei laboratori di ricerca, tecnologici e medicali, allo scopo di accelerare ioni ed elettroni fino ad imprimere loro velocità corrispondenti a tensioni acceleratrici di diverse decine di GeV, è necessaria la considerazione delle leggi relativistiche della meccanica e dell'elettromagnetismo. 15.5.6 Cenno alla teoria della relatività generale La teoria della relatività ristretta permette la descrizione dei fenomeni meccanici ed elettromagnetici per mezzo di leggi valide in tutti i sistemi di riferimento inerziali (e quindi in assenza di gravitazione) e dotati di moto relativo, l'uno rispetto all'altro, rettilineo e uniforme. Successivamente Einstein ha generalizzato la sua teoria in modo da renderla adatta alla descrizione anche dei fenomeni gravitazionali ed alla formulazione di leggi valide qualunque sia il moto del sistema di riferimento; tale estensione costituisce la cosiddetta teoria della relatività generale. In questa i fenomeni fisici sono descritti in un cronotopo la cui metrica non è più caratterizzata da un ds2 pseudoeuclideo, ma da una forma più generale del tipo: i cui coefficienti gαβ funzioni a priori qualunque del punto cronotopico, sono determinati dalla distribuzione di materia. In essa tutti i sistemi di riferimento sono equivalenti per una formulazione delle leggi della natura, indipendentemente dalla presenza di un campo gravitazionale o dal loro moto relativo comunque vario. In altri termini nella teoria della relatività generale le leggi fisiche devono esprimersi per mezzo di formule covarianti rispetto a trasformazioni generali di coordinate che fanno passare da un sistema di riferimento qualsiasi ad un altro pure qualsiasi. La teoria della relatività ristretta si presenta come un caso limite di quella generale, quando i campi gravitazionali diventano di intensità trascurabile ed il moto relativo dei sistemi di riferimento diventa rettilineo ed uniforme. 262 CENNI SULLA TEORIA DELLA RELATIVITÀ RISTRETTA [CAP. 15 La teoria della relatività generale ha trovato a tutt'oggi brillanti conferme sperimentali specie nello studio di fenomeni astronomici. Essa ha dato la spiegazione dello spostamento del perielio di Mercurio, che era stato osservato prima della formulazione della teoria stessa; ha previsto l'esistenza di uno spostamento delle righe spettrali della luce originata in stelle dense (ad esempio la luce proveniente dalla compagna di Sirio) e l'esistenza di una deflessione, per l'effetto di campi gravitazionali (come quello del Sole), di un raggio di luce che propaghi nello spazio: anche questi due effetti sono stati accuratamente verificati. Oggigiorno il progredire della tecnica sperimentale (applicazione dell'effetto Mössbauer) ha permesso la verifica dello spostamento gravitazionale anche per mezzo di esperienze terrestri, nelle quali si misura l'effetto su tale spostamento delle piccole variazioni che il campo gravitazionale subisce passando, ad esempio, dal livello del mare ad un'altezza di qualche decina di metri. INDICE ANALITICO Ago magnetico, 10, 29 Alnico, 66 Ammettenza, 134 Ampère, principio di equivalenza di-, 12, 29 teorema di-, 29, 48, 148 Ampiezza di banda, 140 Argand, grafici di, 129 Autoinduttanza, 94 - di un solenoide, 94 - di due cilindri coassiali, 95 Biot Savart, legge di, 16 Campo magnetico, - di una spira, 20 -di un filo, 15, 18 -di un solenoide, 21 - di un materiale, 53 - molecolare, 72, 83 nel vuoto, 3 Cariche magnetiche, 11 Cavo coassiale, 187, 191 Circuiti forze tra -, 24 - in corrente alternata, 123-145 -in corrente continua, 101-112 Circuito, -adattato, 112 costante di tempo di un-, 115, 117 -elettrico, 101 forza agente su un -, 5 frequenza propria di un -, 138 - magnetico, 62 - oscillatorio smorzato, 120 potenza dissipata in un-, 143 - RC in serie, 116 - RL in serie, 113 - RLC in serie, 118, 135 - smorzato, 120 - sovrasmorzato, 119 Coefficiente di propagazione, 169, 198 Coefficiente di smorzamento, 170 Condizioni al contorno, 49, 174 Continuità, equazione di, 148 Coppia magnetica, 8 Corrente alternata, 123-145 ampiezza di una-, 124 fase di una-, 124 potenza efficace di una -, 145 pulsazione di una -, 144 valore istantaneo di una -, 124, 126, 130 Corrente istantanea, 113 Corrente di polarizzazione, 151 Corrente di spostamento, 149 Corrente indotta, 89 Correnti atomiche, 38 Cronotopo, 238 Curie, legge di -, 82 temperatura di -, 86 Curie, Weiss, legge di, 86 Dalembertiano, 160 Demagnetizzazione, 264 INDICE ANALITICO campo di -, 67 curva di -, 62, 69 Diagramma stazionario, 128 Diamagnetismo, 56, 72 origine del -, 74 Dilatazione temporale, 227, 229 Dinamica relativistica, 251 Dispersivo, mezzo, 165 Doppler, effetto, 233 - longitudinale, 234 - trasversale, 234 Einstein, principio di relatività di, 219 Elettrodinamica relativistica, 244 Elettromagnetica, quantità di moto, 153, 170 Elettrone, moto di un - in campo magnetico, 13 radiazione di un - in moto, 181, 247 Energia, - cinetica relativistica, 256 conservazione dell'-, 152 -elettromagnetica, 153, 170 - intrinseca, 257 - magnetica, 97 densità di - magnetica, 98 Equifase, superficie, 167 Equivalenza massa-energia, 257, 259 Etere, 210, 217, 219 Faraday, Neumann, legge di, 90 Fasore, 126 Fattore di qualità, 138 Ferromagnetismo, 56, 57, 72, 82 Fizeau, esperienza di, 216, 243 Flusso disperso, 62 Forza, -coercitiva, 61 - controelettromotrice, 113 - elettromotrice indotta, 90 -elettromotrice variabile, 126 - magnetica motrice, 63 Galileo, trasformazioni di, 204, 207, 225 Gauss, grafici di, 129 Generatore, - ideale di corrente, 102 - ideale di tensione, 102 Guida d'onda, 196 Henry, definizione dell', 16, 94 Invarianza della lunghezza, 207 Impendenza, 131 - in parallelo, 133 - in serie, 133 Impendenza caratteristica, 195 Inerziale sistema, 201, 205, 219 Induzione elettromagnetica, 89 Induzione magnetica, definizione del vettore -, 3, 6, 9 flusso dell'-, 33 flusso tagliato dell'-, 92 flusso concatenato dell'-, 92 linee di forza dell'-, 15, 34, 63, 68 Induzione residua, 61 Intensità magnetica, definizione del vettore, 48 Isteresi, ciclo di. 57 Ives e Stilwell, esperienze di, 235 Kirchhoff, leggi di, 103, 113, 134 Lamina magnetica, 12 Langevin, funzione di, 81, 84 Laplace, prima formula di -, 17 seconda formula di -, 7 Larmor, frequenza di, 76 Legge di, -Biot e Savart, 16 -Curie, 82 - Curie-Weiss, 86 - Faraday-Neumann, 90 -Kirchhoff, 103, 113, 134 -Lenz, 90 -Snell, 179 Lenz, legge di, 90 Lienard-Wickert, potenziali di - per l'elettrone, 183, 250 Lorentz, equazioni di -. 156 forza di -, 4 trasformazione di -, 211,222, 225, 236, 244 Luce, costanza della velocità della -, 221, 223 INDICE ANALITICO propagazione della -, 220, 223 velocità della -, 162 Lunghezza d'onda critica, 199 Maglia, 104 - indipendente, 106 metodo delle correnti di -, 106 Magneti permanenti, 66 Magnetizzazione, corrente di -, 41, 43 curva di -, 60 densità di corrente di -, 45, 46 - di saturazione, 60 - per orientamento, 72, 80 - residua, 85 vettore intensità di -, 40 Magnetostatica - nel vuoto, 1-37 - nella materia, 39-87 Massa, - a riposo, 253 relativistica, 254 Masse magnetiche, 11 Maxwell, equazioni di, 147, 150, 160, 210, 244 Mesone, vita media del, 230 Michelson, esperimento di, 211, 218, 241 Minkowski, spazio di, 238 Momento magnetico, - di spin, 40, 71 - di un ago magnetico, 11 - di una spira, 9, 29, 37 - di un atomo, 79, 82 - di un elettrone, 74 -orbitale, 40, 71 -proprio, 71, 80 Mutua induttanza, 96 Mutua resistenza, 108 Newton, equazione di, 201, 203, 208, 211, 251 Nodi, metodo dei, 109 Nodo, 104 Numero complesso, 129 Onda, - convergente, 179 - emergente, 179 energia di un'-, 170 fase di un'-, 167 -incidente, 195 intensità di un'-, 172 -monocromatica, 166 -piana, 160, 169 - polarizzata rettilinearmente, 165 - progressiva, 161 quantità di moto di un'-, 170 - regressiva, 161 -riflessa, 195 - sinusoidale, 165 - trasversale elettrica, 197 -trasversale magnetica, 197 -velocità di un'-, 162 Onde, equazioni delle -, 158 - in guida d'onda, 196 -in un cavo coassiale, 187, 194 -in un conduttore, 158, 169 -in un isolante, 159, 160 riflessione delle -, 176 rifrazione delle -, 176 Oscillazioni, - forzate, 136 - smorzate, 120 Paramagnetismo, 56, 72 origine del -, 80 Permeabilità magnetica, - del vuoto, 16 - dì un materiale, 57, 58, 61, 63 relativa, 57 Piano d'incidenza, 177 Polarizzabilità magnetica, 74, 80, 82 Poli di una calamita, 52, 68 Poli magnetici, 12, 42, 51 densità superficiale di -, 52 densità volumetrica di -, 52 Potenza, 143 fattore di -, 143 Potenziale, - scalare, 156 - scalare magnetico, 26, 28 -vettore magnetico, 34, 35, 156 Potenziali ritardati, 158, 183, 248 Poynting, vettore di, 152 Pressione elettromagnetica, 172 Propagazione guidata, 187 265 266 INDICE ANALITICO Radiazione, campo di -, 250 - di una carica accelerata, 181, 247 Ramo, 103 metodo delle correnti di -, 105 Reattanza, 133 -capacitiva, 133 -induttiva, 133 Reciprocità del moto, 204, 223 Reciprocità, teorema di, 108 Relatività, principio di - galileiana, 202, 208 principio di - einsteiniana, 218 - ristretta 201-262 Rifrazione, indice di, 164 Riluttanza, 63 - in parallelo, 66 in serie, 65 Risonanza, 138 Rossi e Hall, esperienza di, 232 Sovrapposizione, teorema di, 108 Spazio-tempo, 238 Spostamento gravitazionale, 262 Stelle doppie, 214 Stelle fisse, sistema delle, 203 Suscettività magnetica, 56, 74, 80, 82, 86 Schermaggio magnetico, 66 Simultaneità, 220, 221 Snell, legge di, 179 Solenoide, 21, 23, 95, 97 Weber, definizione del, 5 Weiss costante di -, 84 campo molecolare di -, 84 Tempo -assoluto, 204 universale, 203 Thevenin, teorema di, 110 Traferro, 64 Transitorio, comportamento, 112 Valori efficaci, 143 Velocità, composizione delle, 207, 236 Vettore di propagazione, 168 Vettori ruotanti, 126, 137