Appunti del Corso di Complementi di Elettromagnetismo

annuncio pubblicitario
Appunti del Corso di
Complementi di Elettromagnetismo
Tullio Bressani e Elena Botta
Dipartimento di Fisica Sperimentale
Anno Accademico 2006–2007
Indice
1 Equazioni di Maxwell
5
1.1 Le leggi di Laplace e Coulomb . . . . . . . . . . . . . . . . . . 10
2 Potenziali E.M.
2.1 Potenziale vettore e potenziale scalare . . . . . . . . . . . . . .
2.2 Superpotenziale di Hertz . . . . . . . . . . . . . . . . . . . . .
2.3 Calcolo dei Potenziali con il metodo di Green . . . . . . . . .
18
18
21
23
3 L’energia del campo elettromagnetico.
28
3.1 Il vettore di Poynting . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Il tensore degli sforzi elettromagnetici . . . . . . . . . . . . . . 32
3.3 Quantità di moto E.M.. . . . . . . . . . . . . . . . . . . . . . 35
4 Propagazione di onde E.M. nel vuoto
4.1 Introduzione . . . . . . . . . . . . . . . . . .
4.2 Tecnica di separazione delle variabili . . . .
4.2.1 Coordinate cartesiane . . . . . . . . .
4.2.2 Coordinate cilindriche . . . . . . . .
4.3 Propagazione di onde a simmetria cilindrica
.
.
.
.
.
40
40
41
41
45
48
.
.
.
.
.
53
53
53
60
65
65
6 Guide d’onda
6.1 EqM per la guida d’onda . . . . . . . . . . . . . . . . . . . . .
6.2 Esempi di propagazione in guide d’onda con contorno definito
6.2.1 Guida d’onda a sezione rettangolare . . . . . . . . . . .
74
74
83
83
5 Irraggiamento di onde E.M.
5.1 Introduzione . . . . . . . .
5.2 Dipolo oscillante . . . . .
5.3 Oscillazioni smorzate . . .
5.4 Onde E.M. in risonanza .
5.5 Antenna Lineare . . . . .
.
.
.
.
.
.
.
.
.
.
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
INDICE
6.3
6.4
6.5
6.2.2 Guida d’onda a sezione circolare . .
Cavo coassiale . . . . . . . . . . . . . . . .
Attenuazione lungo una guida d’onda reale
Cavità risonanti . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
92
97
100
101
7 Generatori di onde EM
105
7.1 Il klystron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8 Fibre ottiche
8.1 Considerazioni generali . . . . . . . . .
8.2 Trasmissione di segnali in fibre ottiche
8.3 L’approssimazione dell’iconale . . . . .
8.4 Le formule di Fresnel . . . . . . . . . .
8.5 Propagazione modale nelle fibre ottiche
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9 Ottica coerente
9.1 Elementi di Ottica coerente . . . . . . . . . . . .
9.2 L’interferometro di Michelson . . . . . . . . . . .
9.3 L’esperimento di Michelson e Morley . . . . . . .
9.4 La massa apparente dei fotoni . . . . . . . . . . .
9.5 Coerenza di un’onda E.M. . . . . . . . . . . . . .
9.5.1 Coerenza spaziale e temporale . . . . . . .
9.5.2 Grado di coerenza spaziale e temporale . .
9.5.3 Misura della coerenza spaziale e temporale
9.6 Olografia . . . . . . . . . . . . . . . . . . . . . . .
9.6.1 Generalità . . . . . . . . . . . . . . . . . .
9.6.2 Principio fisico dell’olografia . . . . . . . .
9.6.3 Olografia in asse e fuori asse . . . . . . . .
9.6.4 Olografia in riflessione . . . . . . . . . . .
9.6.5 Applicazioni dell’olografia . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
. 113
. 114
. 118
. 121
. 127
.
.
.
.
.
.
.
.
.
.
.
.
.
.
133
. 133
. 136
. 138
. 141
. 147
. 147
. 149
. 151
. 154
. 154
. 156
. 159
. 161
. 162
A Operatori Scalari e Vettoriali
164
B Teoremi notevoli del Calcolo Differenziale
168
C Espressione di operatori differenziali in diverse coordinate 172
D Cenni sulle Trasformate di Fourier
175
D.1 Serie trigonometriche di Fourier . . . . . . . . . . . . . . . . . 175
D.2 Integrale di Fourier . . . . . . . . . . . . . . . . . . . . . . . . 177
4
INDICE
E Cenni sui tensori
178
E.1 Generalità sui tensori . . . . . . . . . . . . . . . . . . . . . . . 178
E.2 Definizione di tensore . . . . . . . . . . . . . . . . . . . . . . . 179
F Cenni sulle funzioni di Bessel
181
Capitolo 1
Equazioni di Maxwell
La descrizione in termini classici dei fenomeni elettromagnetici (E.M.) è data
dalle equazioni di Maxwell (EqM) e risale a 140 anni fa. Ad essere pignoli, Maxwell aggiunse un termine (la corrente di spostamento) ad una delle
quattro equazioni, già proposte da altri autori precedenti, ma il suo nome
è associato a tutto il complesso di equazioni che legano i campi E.M. alle
sorgenti (distribuzioni di cariche e di correnti) in quanto egli operò la prima unificazione tra fenomeni fisici apparentemente scorrelati (l’elettricità, il
magnetismo e l’ottica).
L’osservazione principale era che la velocità di propagazione delle oscillazioni trasversali dell’ipotetico mezzo materiale, l’etere (che non serviva a
niente altro se non a suffragare l’ipotesi che un qualsiasi fenomeno fisico non
potesse avvenire se non in presenza di un mezzo materiale) era eguale a quella
della luce. Dal senno di poi sappiamo che l’etere, come altre entità fisiche che
dovevano esistere, anche se non accessibili a nessuna misura diretta, per non
contraddire le elucubrazioni teoriche più gettonate in quel momento (tipo il
calorico), non esiste.
I fisici di oggi continuano a muoversi nella direzione indicata da Maxwell di cercare l’unificazione di fenomeni apparentemente scorrelati, e con
successo (l’unificazione tra interazioni E.M. e interazioni deboli è di un paio
di decenni fa.)
Pur con i limiti concettuali (trattazione non relativistica) le EqM rimangono ancora oggi lo strumento di base per la comprensione di tutti i
fenomeni E.M., e soprattutto per le applicazioni.
Ricordiamo le EqM, nel sistema SI, in forma differenziale, nel vuoto:
~ = ρ/ǫ0
∇·E
(alias teorema di Gauss)
~ = 0 (non ci sono cariche magnetiche libere)
∇·B
5
(1.1)
(1.2)
6
CAPITOLO 1. EQUAZIONI DI MAXWELL
~
~ = − ∂B
∇×E
∂t
(alias legge di Faraday − Neumann − Lenz)
(1.3)
~
~ = µ0~j + ǫ0 µ0 ∂ E
∇×B
(1.4)
∂t
(senza l’ultimo termine è il teorema della circuitazione di Ampère).
~ è il vettore intensità di campo elettrico,
Nelle precedenti equazioni E
~
B è il vettore induzione magnetica, ρ la densità di carica e ~j la densità di
corrente.
L’uso del sistema SI è il “meno peggio” soprattutto per quanto riguarda le applicazioni, dove siamo condizionati dall’uso generalizzato di Volt/m
~ e Tesla per B.
~ Siamo peraltro costretti a portarci dietro i valori ǫ0 =
per E
√
−12
−1
8.84 × 10
F m e µ0 = 12.566 × 10−7 N A−2 . Per fortuna 1/ ǫ0 µ0 = c
= 299792456.2±1.1 m s−1 , misurata con tale precisione da costituire ormai
una grandezza fondamentale.
Il sistema di Gauss, che fa comparire c nei secondi membri delle (1.1)
e (1.4), è più semplice nella scrittura delle equazioni e nell’interpretazio~ e B
~ in unità poco
ne, ma si porta dietro la complicazione di esprimere E
convenzionali.
A puro titolo di esempio di complicazioni dovute alle unità di misura
e di assoluta validità delle EqM a descrivere qualsiasi fenomeno elettromagnetico, poniamoci questo problema. I fenomeni di tipo elettrico (o meglio
elettrostatico) sono molto più evidenti che non quelli di tipo magnetico ( o
meglio magnetostatico), e ciò porta alla convinzione errata che le intensità
~ ottenibili e maneggiabili siano molto superiori a quelli di B.
~ In realtà
di E
stiamo paragonando grandezze fisiche diverse, espresse in unità di misura
convenzionali diverse, cioè le classiche capre con cavoli. Possiamo ottenere un paragone significativo guardando gli effetti. È noto che la densità di
~ uniforme ed un
energia W in una regione spaziale in cui esiste un campo E
~
campo di induzione magnetica B uniforme sono date da:
1
WE = ǫ0 E 2
2
(1.5)
e rispettivamente
WB =
1 2
B
2µ0
(1.6)
supponendo di essere nel vuoto ed indicando con E e B i moduli dei rispettivi
vettori.
Chiediamoci ora quale sia l’intensità del campo elettrico, E, supposto
uniforme nel volume che consideriamo (1 m3 ), necessario ad avere la stessa
7
densità di energia ottenuta con un campo di induzione B, sempre uniforme,
di 1T. Si vede immediatamente che deve essere E=cB e quindi E risulta essere
di 3 × 108 V/m. Per completezza, la densità di energia W risulta essere di
∼ 4 × 105 J/m3 .
Per quanto riguarda la densità di energia magnetica, i valori descritti
sono facilmente ottenibili e comunemente usati, in Laboratorio ma anche in
diagnostica medica (risonanza magnetica nucleare). Lo stesso non è per la
densità di energia elettrica. Campi elettrostatici di 3 × 108 V/m non sono
ottenibili, non certo in aria, come per il campo magnetico, ma neanche in
condizioni di vuoto spinto. Perchè e come lo vediamo dalle EqM. Premettiamo che molto spesso, a seconda delle circostanze, confonderemo il “vuoto
teorico” con il “vuoto sperimentale” e con l’aria, nel senso che in molte circostanze i fenomeni sono sostanzialmente gli stessi. Questo non è il caso
dell’esempio sopra riportato, nel senso che in aria, ma anche in condizioni
di “vuoto sperimentale” esistono comunque delle cariche libere, che vengono
~ e dissipano l’energia immagazzinata, mentre non
accelerate in un campo E
esistono cariche magnetiche libere e questo è contenuto nelle prime due EqM.
Nelle EqM nel vuoto compaiono ρ e ~j, nell’ipotesi che la carica sia
una grandezza fisica continua. Dall’esperimento di Millikan, successivo alla
formulazione delle EqM, sappiamo che non è cosı̀, ma che esiste una carica
elettrica elementare, quella dell’elettrone, pari a 1.6 × 10−19 C. Sappiamo
anche che le cariche elementari positive e negative sono associate a particelle
di massa diversa, quella positiva al protone di massa 1.67252×10−27 kg e
quella negativa all’elettrone di massa 9.10909×10−31 kg. Come possiamo
esprimere ρ e ~j in maniera realistica, tenendo conto che la carica è discreta?
Possiamo scrivere classicamente:
dq = ρ dV
con ρ = ρ(x, y, z, t)
(1.7)
e quindi
q =
Z
V
ρ dV
(1.8)
per quanto riguarda la carica totale contenuta in un volume V .
Tenendo conto della struttura atomica della materia possiamo scrivere, in luogo della (1.8):
n(V )
q =
X
qi
(1.9)
i=1
che descrive il fatto che la carica considerata è costituita da n(V ) cariche
elementari qi appartenenti agli elettroni ed agli ioni positivi, oppure ai nuclei
8
CAPITOLO 1. EQUAZIONI DI MAXWELL
atomici, della materia contenuta nel volume V . Scegliendo, anzichè V , un
volume ∆V abbastanza piccolo, la densità di carica nel suo punto centrale
può essere assunta eguale alla densità media. Possiamo cioè porre:
ρ =
Pn(∆V )
i=1
qi
∆V
(1.10)
Ciò richiede, però, che, anche quando ∆V è molto piccolo, n(∆V ) sia grande
abbastanza da poter ritenere continua la distribuzione di carica. In pratica
ciò accade quasi sempre; il numero di cariche presenti nella materia è, infatti,
molto elevato essendo il suo ordine di grandezza compreso tra 1026 /m3 , per
i gas in condizioni normali di temperatura e pressione, e 1031 /m3 , per le
sostanze solide. Si badi però che nelle (1.9) e (1.10) intervengono cariche qi di
segno opposto le quali, per un oggetto materiale macroscopico, si compensano
di regola quasi esattamente. L’eccesso di una carica, positiva o negativa, su
1011 ÷ 1012 cariche dei due segni corrisponde già ai massimi possibili valori di
ρ. Ciò è dovuto al fatto che un sensibile eccesso di carica, positivo o negativo,
darebbe luogo a delle forze repulsive cosı̀ intense da vincere la coesione della
materia di cui è costituito l’oggetto.
Tuttavia, utilizzando una speciale funzione discontinua dovuta a Dirac, è possibile estendere il concetto di densità di carica anche a distribuzioni
discrete, contenenti un numero di cariche arbitrariamente piccolo. Consideriamo, a questo scopo, la cosiddetta f unzione δ tridimensionale; essa, data
una funzione arbitraria del posto ~x, f (~x), è definita dalla relazione:
Z
V
f (~x) δ(~x − x~i ) dV = f (x~i )
(1.11)
e, in particolare,
Z
V
δ(~x − x~i ) dV = 1
(1.12)
Sostanzialmente δ(~x − x~i ) è una funzione nulla dappertutto, tranne nel punto
x~i dove, pur soddisfacendo la condizione (1.12), assume un valore infinito.
Poniamo, come definizione di ρ:
n(V )
ρ(~x) =
X
i=1
qi δ(~x − x~i )
(1.13)
da essa risulta subito, integrando su V , che la (1.8) è verificata e la carica
totale q assume il valore (1.9) indipendentemente da ogni restrizione sul valore di n. La (1.13) esprime pertanto, nel modo più generale, la relazione tra
ρ e la distribuzione della cariche qi .
9
Al moto delle cariche possiamo associare un vettore ~j, detto densità
di corrente, mediante le seguenti due relazioni:
~j =
e
Pn(∆V )
i=1
qi v~i
∆V
(1.14)
n(∆V )
~j =
X
i=1
qi v~i δ(~x − x~i )
(1.15)
dove v~i è la velocità della i–esima carica. La (1.14), analogamente al caso della (1.10), corrisponde al caso della distribuzione continua; la (1.15),
analogamente alla (1.13), è del tutto generale.
Introducendo la seguente definizione della velocità media delle n(∆V )
cariche:
~v =
Pn(∆V )
i=1
qi v~i
Pn(∆V )
i=1
qi
e, ricordando la (1.10), possiamo scrivere:
~j = ρ ~v
(1.16)
(1.17)
La generalizzazione della (1.16) al caso della distribuzione discreta è
banale: ~v , in questo caso, può essere calcolato sostituendo le (1.13) e (1.15)
nella (1.17). Si deve notare, riguardo l’equazione (1.16), che il rapporto tra la
velocità media ~v e le velocità ~vi delle singole cariche può essere diversissimo
a seconda dei casi. Nei raggi catodici, ad esempio, ~v coincide praticamente
con le velocità dei singoli elettroni; gli elettroni di conduzione di un metallo, invece, posseggono delle velocità che raggiungono i 106 m/s, contro una
velocità media, dovuta al passaggio della corrente, dell’ordine di soli 10−4
m/s.
Un’ulteriore considerazione riguarda la linearità delle EqM nei campi
~
~
E e B. Ciò significa che il campo esistente in un dato punto dello spazio,
dovuto alla presenza di un certo numero N di sorgenti (cariche e correnti)
è la somma vettoriale degli N campi dovuti alle singole sorgenti in conformità al P rincipio di Sovrapposizione. Dalla struttura stessa delle EqM
~ è un vettore polare, che cambia cioè segno per
appare anche chiaro che E
~ è invece un vettore assiale
inversione del segno delle coordinate spaziali, e B
(o pseudovettore), che non cambia segno. Si ricorda infatti che l’operatore
∇× trasforma un vettore polare in uno assiale e viceversa. Le (1.3) e (1.4)
evidenziano questa proprietà.
Per descrivere i fenomeni E.M. nei mezzi materiali è noto che bisogna
~ e H,
~ con le debite complicazioni di forma e di sostanza.
introdurre i vettori D
Le affronteremo al momento debito.
10
1.1
CAPITOLO 1. EQUAZIONI DI MAXWELL
Le leggi di Laplace e Coulomb
Consideriamo un fenomeno puramente stazionario, per il quale cioè il campo
~ il campo magnetico di induzione B,
~ la densità di caelettrico di intensità E,
~
rica ρ e la densità di corrente j non variano nel tempo; partendo dalle EqM
(1.1)–(1.4) si possono ricavare le espressioni esplicite dei campi (statici), che
saranno, in generale più utili della legge della circuitazione di Ampère (1.4)
o del teorema di Gauss (1.1), i quali determinano i campi solo in forma implicita. Il procedimento qui usato è estensibile anche al caso non stazionario,
ponendo però una particolare cura nell’esame della dipendenza temporale dei
campi, e verrà utilizzato nel seguito del Corso per risolvere le EqM nel caso
generale.
Consideriamo l’equazione (1.4); nel caso stazionario essa si riduce a:
~ = µ0~j
∇×B
(1.18)
applicando ad ambo i membri l’operatore vettoriale rotore si ottiene:
~ = ∇∇ · B
~ − ∇2 B
~ = ∇ × µ0~j
∇×∇×B
(1.19)
dove ∇2 indica l’operatore laplaciano e dove si è tenuto conto che vale la
relazione vettoriale:
~ = ∇∇ · B
~ − ∇2 B
~
∇×∇×B
(1.20)
Ricordando la (1.2) la (1.19) diventa:
~ = −µ0 ∇ × ~j
∇2 B
(1.21)
In modo analogo, applicando l’operatore rotore alla (1.3) scritta nel caso
stazionario si ottiene:
~ = ∇∇ · E
~ − ∇2 E
~ = 0
∇×∇×E
(1.22)
che, ricordando la (1.1), fornisce l’equazione:
~ =∇
∇2 E
ρ
ǫ0
(1.23)
~ B
~ e ~j vengano espressi
Le due equazioni vettoriali (1.21) e (1.23), qualora E,
mediante le loro componenti cartesiane, si riducono ad un sistema di sei
equazioni scalari della forma:
∇2 ϕ = Φ
(1.24)
11
1.1. LE LEGGI DI LAPLACE E COULOMB
~ i (i = 1, 2, 3) o, rispettivamente, ϕ = E
~ i e Φ = −µ0 ∇ × ~j
dove ϕ = B
i
o, rispettivamente, Φ = ∇ ǫρ0 . Come si può vedere, Φ è una funzione
i
assegnata del posto, dipendente dalla particolare distribuzione delle cariche
o da quella delle correnti, supposte note per il problema considerato.
Per integrare la (1.24) si applica un metodo, dovuto a G. Green,
che consiste nell’applicare l’omonimo lemma alla funzione scalare incognita ϕ ed ad un’ altra funzione scalare ausiliaria, g, che non essendo fissata
dal problema può essere scelta in modo opportuno. Generalmente conviene
scegliere:
1
1
=
r
rP Q
g =
(1.25)
dove r (rP Q ) è la distanza da un punto variabile Q al punto P in cui si vuole
determinare il valore di ϕ. La funzione g è regolare in tutto lo spazio eccetto
il punto P in cui, essendo r = 0, essa diventa infinita; inoltre, escluso il punto
P , per essa vale ovunque l’equazione:
1 d
dg
∇g = 2
r2
r dr
dr
2
!
= 0
(1.26)
come è facile verificare considerando l’operatore laplaciano in coordinate
polari sferiche e considerando che g non dipende dagli angoli polare ed
azimuthale.
Il lemma di Green può essere scritto come:
Z V
2
2
h∇ f − f ∇ h dV =
Z
S
(h∇f − f ∇h) · ~ndS
(1.27)
dove f e g sono due funzioni scalari regolari sul volume V , S è la superficie
che comprende il volume V e ~n è la normale esterna alla superficie S. Per
applicare il teorema nel caso in questione, consideriamo un volume V ∗ compreso entro una superficie S di forma arbitraria che contenga il punto P ed
una seconda superficie sferica S0 , di raggio molto piccolo, ǫ, concentrica al
punto P , come indicato in figura 1.1. Poichè in questo volume le funzioni ϕ
e g sono entrambe regolari (la funzione ϕ è regolare in quanto rappresenta
una grandezza fisica), dal lemma di Green abbiamo:
Z
V∗
g∇2 ϕ − ϕ∇2 g dV
=
Z
S0
Z
S
(g∇ϕ − ϕ∇g) · ~n dS0 +
(g∇ϕ − ϕ∇g) · ~n dS
(1.28)
12
CAPITOLO 1. EQUAZIONI DI MAXWELL
Figura 1.1:
ovvero, applicando la definizione di derivata direzionale di un campo scalare
dh
h secondo la direzione individuata dal versore ~u, du
= ∇h · ~u:
Z
V∗
2
2
g∇ ϕ − ϕ∇ g dV
!
dg
dϕ
dS0 +
−ϕ
=
g
dn
dn
S0
!
Z
dg
dϕ
dS
−ϕ
g
dn
dn
S
Z
(1.29)
Usando le equazioni (1.24) e (1.26) l’intergrale a primo membro diventa:
Z
V∗
2
2
g∇ ϕ − ϕ∇ g dV =
Z
V∗
g Φ dV
(1.30)
Trasformiamo il primo integrale a secondo membro della (1.29). Tenendo
conto che sulla superficie S0 la normale ~n, essendo diretta all’esterno di V ∗ ,
è opposta al raggio ~r ( ~rP Q )risulta:
d
∂
= −
dn
∂r
d
−
dr
!
per g(r)
(1.31)
inoltre,
dS0 = ǫ2 dω
(1.32)
ove dω indica l’angolo solido elementare sotteso da dS0 rispetto al punto P ,
e esplicitando g, il primo integrale di superficie nella (1.29) si scrive:
Z
S0
!
dϕ
dg
dS0
g
−ϕ
dn
dn
= −
Z
= −
Z
S0
4π
!
dg
∂ϕ
dS0
−ϕ
g
∂r
dr
!
1 ∂ϕ
1
+ ϕ 2 dω
ǫ ∂r
ǫ
(1.33)
13
1.1. LE LEGGI DI LAPLACE E COULOMB
Introducendo i valori medi ϕ e ∂ϕ
della funzione ϕ e della sua derivata valutati
∂r
sulla superficie S0 e facendo tendere a zero il raggio ǫ, la (1.33) diventa:
Z
S0
lim
Z
ǫ→0 S0
!
dg
dϕ
dS0
−ϕ
g
dn
dn
!
dϕ
dg
g
dS0
−ϕ
dn
dn
2
= −4πǫ
=
1 ∂ϕ
1
+ ϕ 2
ǫ ∂r
ǫ
!
−4π ϕ = −4πϕ(P )
(1.34)
Inserendo questo risultato e la (1.30) nella (1.29) si ottiene:
ϕ(P )
1 dϕ(Q)
1 drP Q
1
+ ϕ(Q) 2
=
4π S rP Q dn
rP Q dn
Z
1
Φ(Q)
−
dVQ
4π V rP Q
Z
!
dSQ −
(1.35)
in cui V indica l’intero volume interno alla superficie S (escluso il punto P ).
Questa equazione, benchè dia un’espressione esplicita di ϕ non risolve
ancora il problema della determinazione della funzione ϕ; essa infatti richiede
la conoscenza di ϕ e di dϕ/dn sulla superficie S. Dal punto di vista matematico la (1.35) può essere considerata un’equazione integrale equivalente
all’equazione a derivate parziali (1.24). Tuttavia, supposto che la funzione Φ
sia nulla in tutto lo spazio salvo entro una regione V0 di estensione limitata, è
possibile dimostrare che quando la superficie S va all’infinito l’integrazione su
di essa dà contributo nullo. A questo scopo osserviamo che la (1.35), tenuto
conto dell’ipotesi sul comportamento di Φ, può essere scritta nella forma:
ϕ(P )
1 drP Q
1 dϕ(Q)
1
= lim
+ ϕ(Q) 2
S→∞ 4π S
rP Q dn
rP Q dn
Z
1
Φ(Q)
−
dVQ′
4π V0 rP Q
Z
!
dSQ −
(1.36)
Dimostriamo che sostituendo nella (1.36) l’espressione:
ϕ(P ) = −
1
4π
Z
V0
Φ(Q)
dVQ′
rP Q
(1.37)
essa risulta identicamente verificata. Infatti, indicando con O un’origine
arbitraria interna al volume V0 , come indicato in figura 1.2, ed applicando il
teorema di Carnot al triangolo P OQ, la (1.37) può essere scritta nella forma:
ϕ(P ) = −
1
4πrP O
Z
V0
Φ(Q)dVQ′
r
1−
r
2 rQO
PO
cos ϑ +
rQO 2
rP O
(1.38)
14
CAPITOLO 1. EQUAZIONI DI MAXWELL
Figura 1.2:
dove rP O , rQO sono le distanze dei punti P e Q dall’origine e ϑ indica l’angolo
QÔP . Quando il punto P va all’infinito il rapporto rQO /rP O tende a zero e
la (1.38) diventa asintoticamente:
lim ϕ(P ) = −
P →∞
1
4πrP O
Z
V0
Φ(Q)dVQ′
(1.39)
in cui, manifestamente, l’integrale della funzione Φ è una quantità finita. Ne
segue che valgono le equazioni asintotiche:
1
4π
Z
Φ(Q)dVQ′ = −k
(1.40)
dϕ(P ) 2
1
lim
rP O =
P →∞ drP O
4π
Z
Φ(Q)dVQ′ = k
(1.41)
lim ϕ(P ) rP O = −
P →∞
V0
V0
dove k è una costante finita. Possiamo ora valutare il primo integrale che
compare nella (1.36). Assumendo come superficie S una sfera di centro O,
le derivate rispetto alla direzione normale ad S vengono sostituite dalle derivate rispetto a rQO . Di conseguenza, osservando che rP Q e rQO diventano
coincidenti per Q tendente ad infinito e tenendo conto delle (1.40) e (1.41)
(in cui si sostituisca P con Q), i due termini che compaiono nell’integrale in
−3
. Tenendo conto che
questione diventano asintoticamente proporzionali a rQO
2
l’estensione di S cresce proporzionalmente a rQO , ciò basta a concludere che
l’integrale su S calcolato mediante la (1.37), tende a zero (questa conclusione
è rafforzata dal fatto che i due contributi che intervengono nell’integrazione
su S sono eguali in valore assoluto ma opposti in segno).
15
1.1. LE LEGGI DI LAPLACE E COULOMB
Abbiamo pertanto provato che la (1.36) effettivamente si riduce ad
una identità quando in essa si sostituisca la (1.37). Essendo, d’altra parte,
la (1.36) equivalente all’equazione iniziale (1.24), ne segue che l’espressione
(1.37) di ϕ costituisce la soluzione di questa equazione nel caso in cui le
condizioni limitative per la Φ siano verificate. Bisogna osservare che tali condizioni implicano condizioni equivalenti per ~j(Q) e ρ(Q) di cui Φ è funzione;
in pratica si ha che l’equazione (1.24) ammette come soluzione la (1.37) solo
se l’estensione delle sorgenti dei campi statici è limitata, condizione che nella
realtà è sempre verificata e perciò non risulta minimamente limitativa (basti
pensare che in natura non esistono oggetti di dimensioni infinite e pertanto
neppure distribuzioni di correnti o di cariche (stazionarie) infinite!). Inoltre,
confrontando la (1.37) con la (1.35), risulta subito che nella (1.35) l’integrale
su S rappresenta, per un volume V limitato e più piccolo di V0 , il contributo
dovuto ai valori di Φ esterni a V .
Applicando la (1.37) alle componenti della (1.21), si ottiene per il
~
vettore induzione magnetica B:
~ ))i = µ0
(B(P
4π
Z
V0
∇Q × ~j(Q)
rP Q
i
dVQ
(i = 1, 2, 3)
(1.42)
in cui si è indicato con V0 il volume finito occupato dalle correnti (stazionarie)
e ∇Q × indica il rotore calcolato rispetto alle coordinate del punto mobile Q;
la relazione vettoriale è ricavabile immediatamente. Poichè vale la relazione:
!
~j
1
1
∇×
=
∇ × ~j + ∇
× ~j
(1.43)
rP Q
rP Q
rP Q
possiamo scrivere la relazione vettoriale corrispondente alla (1.42) nella forma:
!
Z
~j
µ0
~
B(P ) =
dVQ −
∇Q ×
4π V0
rP Q
!
Z
1
µ0
× ~j(Q)dVQ
(1.44)
∇Q
−
4π V0
rP Q
dove ∇Q indica il gradiente calcolato rispetto alle coordinate del punto mobile
Q. Il primo integrale a secondo membro è nullo; infatti, in conseguenza del
teorema della divergenza, si ha:
Z
V0
∇Q ×
~j
rP Q
!
dVQ =
Z
S′
~n ×
~j
rP Q
!
dSQ′
(1.45)
dove S ′ è la superficie che limita il volume occupato dalla corrente e ~n è
la normale a S ′ diretta verso l’esterno. Poichè S ′ contiene all’interno tutti
16
CAPITOLO 1. EQUAZIONI DI MAXWELL
i punti in cui ~j è diverso da zero, l’integrale (1.45) effettivamente è nullo.
Pertanto la (1.44) diventa:
~ ) = − µ0
B(P
4π
1
!
Z
∇Q
Z
~rP Q ~
~rP Q
µ0 Z ~
j(Q)
×
×
j(Q)dV
=
dVQ
Q
rP3 Q
4π V0
rP3 Q
V0
rP Q
× ~j(Q)dVQ
(1.46)
ovvero:
~ ) = − µ0
B(P
4π
V0
(1.47)
che esprime la prima legge di Laplace per una distribuzione di correnti (stazionarie) in un volume finito V0 con dimensioni trasverse non trascurabili.
Considerando come elemento di volume un tratto di un sottile tubo di flusso,
di lunghezza eguale al vettore infinitesimo d~s parallelo alla densità di corrente ~j e percorso da una corrente di intensità i, la (1.47) può essere scritta
come:
~ ) = µ0 i d~s(Q) × ~rP Q
B(P
4π
rP3 Q
(1.48)
che, integrata sulla lunghezza totale del tubo di flusso, supposto infinito,
fornisce la ben nota legge di Biot-Savart.
Partendo dalla (1.23) è possibile ottenere per il campo elettrico di
~ una espressione di tipo analogo. Infatti, applicando la (1.37) alle
intensità E
componenti della (1.23) si ha:
~ ))i = −
(E(P
1
4πǫ0
Z
V0
(∇Q ρ(Q))i
dVQ
rP Q
(i = 1, 2, 3)
(1.49)
Poichè vale la relazione:
∇Q
ρ(Q)
rP Q
!
= (∇Q ρ(Q))
1
rP Q
+ ρ(Q)∇Q
1
rP Q
!
(1.50)
si può scrivere la relazione vettoriale corrispondente alla (1.49) nella forma:
~ ) = − 1
E(P
4πǫ0
Z
V0
∇Q
!
ρ(Q)
dVQ −
rP Q
Z
V0
ρ(Q)∇Q
1
rP Q
dVQ
!!
(1.51)
Di nuovo, il primo integrale a secondo membro è nullo: infatti, in conseguenza
del teorema della divergenza, si ha:
Z
V0
∇Q
!
Z
ρ(Q)
ρ(Q)
dVQ =
~ndS ′
rP Q
S ′ rP Q
(1.52)
1.1. LE LEGGI DI LAPLACE E COULOMB
17
dove S ′ è la superficie che limita il volume V0 ; per le ipotesi fatte, la densità
di carica su questa superficie e quindi gli integrali che compaiono nei due
membri della (1.52) sono nulli. Si ha pertanto:
~ ) =
E(P
1
4πǫ0
Z
V0
ρ(Q)
~rP Q
dVQ
rP3 Q
(1.53)
che è l’espressione della legge di Coulomb per una distribuzione di cariche
(stazionarie) estesa nel volume finito V0 . Considerando la carica infinitesima
contenuta in un elemento di volume dVQ :
dq(Q) = ρ(Q) dVQ
(1.54)
il contributo all’intensità del campo elettrico dovuto ad essa sarà:
~ ) =
dE(P
~rP Q
1
dq 3
4πǫ0
rP Q
(1.55)
Capitolo 2
Potenziali E.M.
2.1
Potenziale vettore e potenziale scalare
~ e B,
~ in funzione del posto e
Le EqM nel vuoto permettono di calcolare E
del tempo, quando siano note le distribuzioni di ρ e di ~j. Appare comunque
~ e B
~ (6 funzioni, le componenti) a partire
chiaro che la descrizione con E
da quattro funzioni (le componenti di ~j e ρ) è ridondante, ed è possibile
effettuare una riduzione. A questo scopo, osservando che la divergenza di un
rotore è identicamente nulla (∇ · ∇ × ~v = 0, ~v vettore qualsiasi) e che tale
~ poniamo:
è pure, per la (1.2), la divergenza di B,
~ = ∇×A
~
B
(2.1)
~ è un vettore, funzione del posto e del tempo, detto potenziale vettore.
dove A
Sostituendo la (2.1) nella (1.3) e scambiando l’ordine delle derivate temporali
e spaziali si ottiene:


~
~ + ∂A  = 0
∇ × E
∂t
(2.2)
Tenendo conto che il rotore di un gradiente è identicamente nullo
(∇ × ∇ s = 0, s scalare qualsiasi), poniamo:
~
~ + ∂A = − ∇ V
E
∂t
(2.3)
dove V è una funzione del posto e del tempo, detta potenziale scalare. Il
campo E.M. risulta cosı̀ espresso mediante la (2.1) e la (2.3), riscritta come:
~
~ = − ∇ V − ∂A
E
∂t
(2.4)
18
2.1. POTENZIALE VETTORE E POTENZIALE SCALARE
19
In esse intervengono solo quattro funzioni scalari, ossia V e le tre
~ Si deve però notare che la scelta dei potenziali A
~ e V
componenti di A.
non è univoca. Infatti, indicata con A~0 e V0 una determinazione dei potenziali soddisfacente le (2.1) e (2.4), si verifica immediatamente che anche i
potenziali:
~ = A~0 + ∇ φ
A
V = V0 −
(2.5)
∂φ
∂t
(2.6)
dove φ è una arbitraria funzione del posto e del tempo, soddisfano queste
equazioni. La trasformazione rappresentata dalle (2.5) e (2.4) prende il nome
~ e
di trasformazione di gauge: essa lascia invariate le espressioni dei campi E
~
B
~ e V. A
Determiniamo ora le equazioni cui obbediscono i potenziali A
questo scopo sostituiamo le (2.1) e (2.4) nella (1.4); si ottiene:
~
∂
∂2A
~
∇ × ∇ × A + ǫ0 µ0 ∇ V + ǫ0 µ0 2 = µ0~j
∂t
∂t
(2.7)
Utilizzando l’identità
~ = ∇∇ · A
~ − ∇2 A
~
∇× ∇× A
(2.8)
la (2.7) diventa:
2 ~
~ + 1∂V
~ − 1 ∂ A = −µ0~j + ∇ ∇ · A
∇A
2
2
c ∂t
c2 ∂t
2
!
(2.9)
Analogamente, sostituendo la (2.4) nella (1.1) abbiamo:
∇2 V +
∂
~ = −ρ
∇ · A
∂t
ǫ0
(2.10)
È possibile dare a queste equazioni una forma più compatta approfittando
della arbitrarietà della funzione φ. Supponiamo, infatti, di scegliere φ in
modo che
~ + 1∂V = 0
∇ · A
c2 ∂t
(2.11)
ossia, come si vede subito usando le (2.5) e (2.6):
1 ∂2 φ
∇φ − 2 2 = −
c ∂t
2
~ 0 + 1 ∂ V0
∇ · A
c2 ∂t
!
(2.12)
20
CAPITOLO 2. POTENZIALI E.M.
In questo modo, mediante la (2.12), che viene detta condizione di gauge di
Lorentz, le equazioni per i potenziali diventano semplicemente:
~ −
∇2 A
~
1 ∂2 A
= − µ0~j
c2 ∂t2
(2.13)
∇2 V −
ρ
1 ∂2 V
= −
2
2
c ∂t
ǫ0
(2.14)
Esse, tenendo conto della (2.1) e della (2.4), della condizione di gauge di
Lorentz e delle condizioni al contorno, ci permettono di determinare il campo
E.M. in funzione delle cariche e delle correnti. Sovente, per semplificare le
notazioni, si fa uso del simbolo
1 ∂2
(2.15)
c2 ∂t2
esso prende il nome di operatore D’Alambertiano. Le equazioni (2.12), (2.13)
e (2.14) assumono cosı̀ la forma:
2 = ∇2 −
~ 0 + 1 ∂ V0
2φ = − ∇ · A
c2 ∂t
!
(2.16)
~ = − µ0~j
2A
2V = −
(2.17)
ρ
ǫ0
(2.18)
È importante rilevare che la condizione di gauge di Lorentz implica la
validità della fondamentale equazione di continuità:
∂ρ
= 0
(2.19)
∇ · ~j +
∂t
che esprime il fondamentale e basilare concetto che la carica è conservata. Infatti applicando alla (2.17) l’operatore ∇· e sommando con la (2.18) derivata
rispetto a c2 t, si ottiene:
~ + 1∂V
0 = 2 ∇·A
c2 ∂t
!
= −µ0
∂ρ
∇ · ~j +
∂t
!
(2.20)
Ciò significa, in altri termini, che il legame esistente tra le soluzioni (2.17) e
(2.18) corrisponde a quello che intercorre tra ~j e ρ.
Si può notare che a partire dalle quattro funzioni che descrivono le
tre componenti di ~j e ρ si ottengono, tramite le (2.17) e (2.18), altre quattro
~ e V ). Le (2.1) e (2.4) forniscono il legame
funzioni (le tre componenti di A
~ eB
~ che sono i campi fisici misurabili.
con E
2.2. SUPERPOTENZIALE DI HERTZ
2.2
21
Superpotenziale di Hertz
Nelle applicazioni si può utilizzare la (2.19) per evitare di integrare l’equa~ dalla (2.17) e
zione per il potenziale scalare V . Per fare ciò basta ricavare A
calcolarne la divergenza, dopodichè la (2.11), con una integrazione rispetto
al tempo, ci fornisce, a meno di una costante dipendente dal posto, il valore di V . All’atto pratico questa costante può, di solito, essere determinata
senza difficoltà; è tuttavia preferibile seguire un differente procedimento che,
anche a priori, non dà luogo ad alcuna ambiguità. In altre parole, si cerca
di ottenere una ulteriore riduzione del numero di funzioni che descrivono le
sorgenti (3 anzichè 4) e di componenti dei campi generati.
~ funzione del posto e del
A questo scopo introduciamo un vettore Q,
tempo, tale che:
~
~j = ∂ Q
∂t
(2.21)
~
ρ = −∇ · Q
(2.22)
e
Si constata immediatamente che la forma di queste equazioni garantisce la
~
validità dell’equazione di continuità (2.19), qualunque sia Q.
Poniamo ora:
~
~ = 1∂Z
A
c2 ∂t
(2.23)
~
V = −∇ · Z
(2.24)
~ è un vettore da determinarsi, detto vettore (o superpotenziale) di
dove Z
Hertz. Sostituendo le (2.21) e (2.23) nella (2.17) si ha:


~
1 ∂  ~
Q
 = 0
2
Z
+
c2 ∂t
ǫ0
(2.25)
Analogamente, sostituendo le (2.22) e (2.24) nella (2.18) si ottiene:


~
~ + Q = 0
∇ · 2Z
ǫ0
(2.26)
~ tale da verificare l’equazione:
Basta pertanto assumere Z
~ = −
2Z
~
Q
ǫ0
(2.27)
22
CAPITOLO 2. POTENZIALI E.M.
perchè le (2.17) e (2.18) siano a loro volta verificate. Partendo dall’espres~ si può ottenere, mediante successive derivazioni, il campo E.M.;
sione di Z
è da notare che la condizione di gauge di Lorentz è immediata conseguenza
~ risulta:
della forma delle (2.23) e (2.24). L’espressione per B
~ = 1 ∂ ∇×Z
~
B
c2 ∂t
(2.28)
~ con qualche trasformazione e mediante la
e quella del campo elettrico E,
(2.27):
~
E
=
=
~
~
1 ∂2Z
1 ∂2Z
2~
~
~
∇∇ · Z − 2 2 = ∇ × ∇ × Z + ∇ Z − 2 2 =
c ∂t
c ∂t
~
Q
~ + 2Z
~ = ∇×∇×Z
~ −
(2.29)
∇×∇×Z
ǫ0
~ in tutti i punti dello spazio in cui Q
~ = 0.
che si riduce a ∇ × ∇ × Z
2.3. CALCOLO DEI POTENZIALI CON IL METODO DI GREEN
2.3
23
Calcolo dei Potenziali con il metodo di
Green
~ e
Occorre ora sviluppare un metodo che permetta di valutare i potenziali A
~ A questo scopo osserviamo che l’equazione
V oppure il vettore di Hertz Z.
(2.14), le tre componenti della (2.13), la (2.12) e le componenti della (2.27)
sono della forma:
2f = ∇2 f −
1 ∂2f
= F (x, y, z, t)
c2 ∂t2
(2.30)
Per integrare una equazione di questo tipo si può utilizzare un metodo che
si basa sulla applicazione del lemma di Green (B.13), il che richiede, però, di
eliminare la dipendenza esplicita dalla variabile tempo. A tal fine sviluppiamo in serie di Fourier di forma complessa (cfr. appendice D) le funzioni f e
F , nell’ ipotesi che esse siano funzioni periodiche del tempo con periodo T e
pulsazione ω = 2π/T , altrimenti si potrà eseguire uno sviluppo in integrali
di Fourier e procedere poi in modo analogo a quanto fatto nel seguito:
F (x, y, z, t) =
+∞
X
Φs (x, y, z)e(−iωs t)
(2.31)
ϕs (x, y, z)e(−iωs t)
(2.32)
−∞
f (x, y, z, t) =
+∞
X
−∞
nelle quali si è posto ωs = s ω. Sostituendo nella (2.30) abbiamo:
+∞
Xh
i
∇2 ϕs + ks2 ϕs − Φs e(−iωs t) = 0
−∞
(2.33)
dove si è posto:
ωs
= ks
c
(2.34)
La (2.33) è verificata se valgono le equazioni:
∇2 ϕs + ks2 ϕs = Φs
(2.35)
Quando ks vale zero esse si riducono alla (1.24), già incontrata nel paragrafo 1.1; generalizziamo pertanto il procedimento allora usato. Consideriamo
questa volta la funzione:
gs (r) =
e(iks r)
r
(2.36)
24
CAPITOLO 2. POTENZIALI E.M.
dove r è la distanza dal punto P (x, y, z) in cui si vuole determinare il valore della funzione ϕs . Usando l’espressione dell’operatore laplaciano in
coordinate polari, C.9:
1 ∂
∂
∇2 = 2
r2
r ∂r
∂r
!
1
∂
∂
+ 2
sin θ
r sin θ ∂θ
∂θ
!
+
∂2
1
(2.37)
r 2 sin2 θ ∂ϕ2
si verifica subito che gs è un integrale particolare dell’equazione:
∇2 gs + ks2 gs = 0
(2.38)
Poichè, come già la funzione g dell’equazione (1.25), anche gs è singolare
in P usiamo per applicare il lemma di Green lo stesso volume scelto per la
(1.24), cioè il volume V ∗ compreso entro una superficie chiusa S contenente
all’interno il punto P ed una seconda superficie sferica S0 , di raggio molto
piccolo, ǫ, con centro nel punto P stesso (vedi figura 1.1). Si ha in questo
modo:
Z
V∗
2
2
gs ∇ ϕs − ϕs ∇ gs dV
!
dgs
dϕs
dS0 +
− ϕs
=
gs
dn
dn
S0
!
Z
dgs
dϕs
dS
(2.39)
− ϕs
gs
dn
dn
S
Z
Usando le equazioni (2.35) e (2.38) l’integrale a primo membro diventa:
Z
V∗
2
2
gs ∇ ϕs − ϕs ∇ gs dV =
Z
V∗
gs Φs dV
(2.40)
Trasformiamo ora il primo integrale a secondo membro della (2.39); tenendo
conto che sulla superficie S0 la derivata normale coincide, salvo il segno, con
la derivata rispetto a r, si ottiene:
!
dϕs
dgs
gs
dS0 = −
− ϕs
dn
dn
Z
S0
Z
S0
(iks r)
e
"
1
iks
1 dϕs
− ϕs
− 2
r dr
r
r
!#
dS0 (2.41)
ϕ̄s
Introduciamo i valori medi ϕ̄s e ddr
e facciamo tendere a zero ǫ; la (2.41)
analogamente alla (1.34) si riduce a:
Z
S0
lim
Z
ǫ→0 S0
!
dϕs
dgs
gs
dS0
− ϕs
dn
dn
!
dgs
dϕs
dS0
− ϕs
gs
dn
dn
2 (iks ǫ)
= −4πǫ e
=
−4πϕs (P )
1 dϕ̄s
iks
1
− ϕ̄s (
− 2)
ǫ dr
ǫ
ǫ
!
(2.42)
Sostituendo le (2.40) e (2.42) nella (2.39) ed osservando che per ǫ tendente a
zero il volume V ∗ coincide con l’intero volume V (escluso il punto P ) interno
ad S abbiamo:
2.3. CALCOLO DEI POTENZIALI CON IL METODO DI GREEN
1
ϕs (P ) =
4π
!
25
dϕs
1
dgs
gs
dS −
− ϕs
gs Φs dV
dn
dn
4π V
S
#
!
"
1 Z (iks r) 1 dϕs
1 dr
iks
=
dS −
− ϕs
− 2
e
4π S
r dn
r
r dn
Z
1
−
4π
Z
V
Z
e(iks r)
Φs dV
r
(2.43)
dove è stata inserita l’espressione (2.36) della funzione gs . Risulta cosı̀ determinata anche la funzione f ; per ricavarla in modo esplicito, sostituiamo
la (2.43) nella (2.32) ed eliminiamo ks mediante la (2.34). Si trova:
f (P, t) =
+∞
X
ϕs e−iωs t =
−∞
"
1
4π
Z +∞
X
S −∞
1
iωs
1 dϕs
− ϕs
− 2
·
r dn
cr
r
1
4π
Z +∞
X
V
e−iωs (t −
r
−∞
e−iωs (t
− r/c)
#
dr
dS −
dn
r/c)
Φs dV
(2.44)
Notiamo ora che, esprimendo la (2.32) all’istante t − r/c anzichè all’istante
t, si ottiene:
f (P, t − r/c) =
+∞
X
ϕs (P ) e−iωs (t
− r/c)
(2.45)
−∞
e analogamente la derivata di f calcolata all’istante t − r/c diventa:
∂f
∂t
!
= −
t−r/c
+∞
X
ϕs (P ) i ωs e−iωs (t
− r/c)
(2.46)
−∞
Infine, considerando sempre allo stesso istante la funzione F , si ha:
F (P, t − r/c) =
+∞
X
Φs (P ) e−iωs (t
− r/c)
(2.47)
−∞
Mediante la (2.45), l’equazione da essa ottenuta derivata rispetto a n e le
(2.46), (2.47), l’espressione (2.44) della funzione f assume la forma:
1
f (P, t) =
4π
Z "
1
1 df
1 ∂f
+
+ 2f
cr ∂t
r
S r dn
Z
1
1
−
Ft − r/c dV
4π V r
!
dr
dn
#
dS −
t−r/c
(2.48)
26
CAPITOLO 2. POTENZIALI E.M.
Questa relazione, dovuta a Kirchhoff, determina il valore del campo f nel
punto P e all’istante t mediante i valori che questa funzione e le sue derivate
assumono sulla superficie S, oltrechè mediante i valori di F (le sorgenti) nel
volume interno ad S. Tutte queste quantità devono, però, essere valutate
all’istante antecedente t − r/c. In altre parole, il valore di f (P, t) dipende
con il ritardo r/c dalla situazione sulla superficie S e nel volume V . Tenendo
conto che r è la distanza tra P e il punto variabile nelle integrazioni in questi
domini, ne segue l’importante risultato che la funzione f si propaga con
velocità c.
Consideriamo ora due casi estremi, ma molto istruttivi e quasi sempre
utilizzati in pratica, della formula di Kirchhoff.
1. Supponiamo che la superficie S sia all’infinito e quindi V diventi tutto
lo spazio. Nessun campo può percorrere lo spazio tra S e il punto
P considerato in un tempo finito e quindi l’integrale di superficie si
annulla. In tale caso la (2.48) fornisce, nel punto P la relazione:
1 Z F (Q, t − rP Q /c)
f (P, t) = −
dVQ
4π V
rP Q
(2.49)
Ricordando che avevamo indicato genericamente con f le funzioni descriventi i potenziali e con F le sorgenti, possiamo esplicitare le relazioni
~ V e Z:
~
finali per A,
µ0
~
A(P,
t) =
4π
Z
V
~j(Q, t − rP Q /c)
dVQ
rP Q
(2.50)
1
V (P, t) =
4πǫ0
Z
V
ρ(Q, t − rP Q /c)
dVQ
rP Q
(2.51)
1
4πǫ0
Z
V
~
Q(Q,
t − rP Q /c)
dVQ
rP Q
(2.52)
~
Z(P,
t) =
~ eB
~ tramite le (2.3), (2.29),
dalle quali è possibile risalire ai campi E
(2.1) e (2.28) rispettivamente.
2. Supponiamo che nel volume V non ci siano sorgenti. Allora la (2.48)
si riduce a:
1
f (P, t) =
4π
Z "
S
1 df
+
r dn
1
1 ∂f
+ 2f
cr ∂t
r
!
dr
dn
#
dS
t−r/c
(2.53)
2.3. CALCOLO DEI POTENZIALI CON IL METODO DI GREEN
27
Ma, in assenza di sorgenti, sappiamo che le EqM forniscono le equazioni
delle onde libere, e la (2.53) sarà la soluzione quando siano dati i valori
df
di f , dn
e ∂f
in funzione del tempo e per tutti i punti della superficie
∂t
S.
La (2.53) è una giustificazione rigorosa a posteriori del principio di
Huygens–Fresnel, proposto in modo del tutto empirico e con prescrizioni non corrette. Essa mostra, infatti, come l’ idea che sta alla base di
questo principio, vale a dire quella di considerare ogni punto di una superficie d’ onda come sorgente di nuove onde e sostituire queste sorgenti
secondarie alle sorgenti reali, sia sostanzialmente giusta; mette però anche in evidenza come la prescrizione per l’ applicazione del principio di
Huygens–Fresnel sia basata su un postulato non vero e cioè che le onde
elementari secondarie partano dai vari punti della superficie S con la
stessa fase e con ampiezza decrescente al crescere dell’ angolo θ fra la direzione considerata e la normale a dS (fino ad annullarsi per θ ≥ π/2).
La (2.53) può, dunque essere considerata come la formulazione corretta
di quel famoso principio.
Capitolo 3
L’energia del campo
elettromagnetico.
3.1
Il vettore di Poynting
Dimostreremo ora che il campo E.M. possiede dell’energia; precisamente, faremo vedere che è possibile associare al campo esistente in un dato volume V
~ eB
~ e dall’estenuna quantità di energia che risulta dipendente dai valori di E
sione di V . Per far questo consideriamo un sistema di N cariche puntiformi
sottoposte all’azione del campo E.M. da esse stesse generato. Tenendo conto
della espressione della forza di Lorentz che agisce sulla carica i–esima
~ + ~vi × B)
~
F~i = qi (E
(3.1)
il lavoro fatto dal campo sull’i–esima carica nel tempo dt è:
dLi
= F~i · d~si = F~i · ~vi dt =
~ + ~vi × B)
~ · ~vi dt =
= qi (E
~ · ~vi dt
= qi E
(3.2)
Il lavoro totale risulta pertanto:
dL =
N
X
~ · ~vi dt
qi E
(3.3)
i=1
Dividiamo il volume V in un numero molto grande di volumetti ∆Vj , ciascuno attorno ad un punto Pj , e indichiamo con n(∆Vj ) il numero di cariche
contenute in ciascuno di essi; ricordando la definizione di densità di corrente
28
29
3.1. IL VETTORE DI POYNTING
(1.14) si ottiene:
dL
X n(∆V
Xj )
=
∆Vj
X
=
dLi
i=1
~ j) ·
∆Vj E(P
∆Vj
i=1
qi ~vi
∆Vj
dt
~ j ) · ~j(Pj ) dt
∆Vj E(P
X
=
Pn(∆Vj )
(3.4)
∆Vj
Ne segue che la (3.4) può essere scritta nella forma:
dL =
Z
~ · ~j dV dt
E
(3.5)
V
Questa equazione, d’altra parte, purchè si tenga conto della definizione (1.15)
di ~j, è valida anche per una distribuzione discreta. Eliminando ~j mediante
la (1.4), la (3.5) diventa:
1
dL
=
dt
µ0
Z
V
~ · ∇×B
~ dV − ǫ0
E
Z
V
~
~ · ∂ E dV
E
∂t
(3.6)
Sostituendo nella (3.6) l’identità (A.26):
~ × B)
~ = B
~ ·∇×E
~ − E
~ ·∇×B
~
∇ · (E
(3.7)
si ha:
dL
dt
1
µ0
~ × B)
~ dV + 1
∇ · (E
µ0
V
Z
~
~ · ∂ E dV
−ǫ0
E
∂t
V
= −
Z
Z
~ ·∇×E
~ dV −
B
V
(3.8)
~
ossia, applicando il teorema della divergenza (B.10) ed eliminando ∇ × E
tramite la (1.3):
dL
dt
1
µ0
~ × B)
~ · ~n dS − 1
(E
µ0
S
Z
~
~ · ∂ E dV
−ǫ0
E
∂t
V
= −
Z
Z
V
~
~ · ∂ B dV −
B
∂t
(3.9)
dove S è la superficie che limita il volume V e ~n è la normale ad S orientata
all’esterno di V . Introducendo il vettore:
~ × B)
~ = c2 ǫ0 (E
~ × B)
~
~ = 1 (E
(3.10)
S
µ0
30 CAPITOLO 3. L’ENERGIA DEL CAMPO ELETTROMAGNETICO.
la (3.9) assume la forma:
dL
= −
dt
~ · ~n dS − ǫ0 d
S
2 dt
S
Z
Z
~ 2 + c2 B
~ 2 ) dV
(E
(3.11)
V
Si badi che nel prodotto esterno a secondo membro della (3.10) compare il
~ pur
vettore induzione magnetica, che è un vettore assiale; di conseguenza S,
essendo definito mediante un prodotto esterno, è un vettore polare. Esso
prende il nome di vettore di Poynting. Trasformiamo ulteriormente l’equazione (3.11); osservando che il lavoro del campo è esprimibile mediante il
teorema dell’energia cinetica, ossia con l’equazione:
N
d X
1
dL
=
mi~vi2
dt
dt i=1 2
(3.12)
dove si è indicata con mi la massa della carica i−esima e con ~vi la sua velocità,
si ottiene infine:

N
d X
1
mi~vi2 +
dt i=1 2
Z
V

~ 2 + c2 B
~ 2)
ǫ0 (E
dV  = −
2
Z
S
~ · ~n dS
S
(3.13)
Per chiarire il risultato testè ottenuto, supponiamo che le N cariche
siano tutte contenute in una parte limitata del volume V . Ammettiamo,
inoltre, che il loro movimento sia tale che ~j e ρ rimangano costanti nel tempo
fino ad un determinato istante t0 dopo il quale essi iniziano a variare e quindi
a generare un campo propagativo. Se si suppone il volume V illimitato, e
quindi la superficie S situata a distanza infinita dalla zona occupata dalle
cariche, è ovvio che su di essa il contributo del campo propagativo è nullo.
Esso, infatti, nel tempo t − t0 percorre la distanza finita c(t − t0 ) e non
arriva a raggiungere S. Ciò non accade per il contributo del campo statico;
tuttavia, essendosi ammesso che la distribuzione di cariche e correnti occupi
~ che B
~ decrescono almeno come 1/r 2 ed il vettore
un volume limitato, sia E
~ di conseguenza, almeno come 1/r 4 , r essendo la distanza da un generico
S,
punto interno alla distribuzione di carica. Poichè l’estensione della superficie,
invece, aumenta secondo r 2 , si conclude che anche il contributo del campo
statico è nullo e che l’integrale a secondo membro della (3.13), quando V
tende ad infinito, vale zero. Ne segue perciò:
N
X
1
mi~vi2 +
2
i=1
Z
V
~ 2 + c2 B
~ 2)
ǫ0 (E
dV = cost
2
(3.14)
Non è difficile stabilire il significato fisico di questa equazione; a questo
scopo supponiamo dapprima che gli N oggetti non posseggano carica elettrica
3.1. IL VETTORE DI POYNTING
31
e che quindi il campo E.M. sia nullo. In queste condizioni l’energia del
sistema si riduce alla sola energia cinetica, ed essa, come risulta dalla (3.14)
~ =B
~ = 0, si conserva costante nel tempo. In presenza di cariche,
ponendovi E
invece, interviene anche il termine dipendente dal campo E.M. ed esso forma
con l’energia cinetica una quantità costante. È dunque ovvio concludere
che questo termine rappresenta l’energia del campo E.M.. Possiamo, perciò,
introdurre la densità di energia elettromagnetica:
w =
ǫ0 ~ 2
~ 2)
(E + c 2 B
2
(3.15)
Il suo integrale su un volume V rappresenta l’energia associata al campo
contenuto in V ; avremo, cioè, indicando con W questa energia:
W =
Z
V
ǫ0 ~ 2
~ 2 ) dV
(E + c 2 B
2
(3.16)
Quando, invece, V è limitato il primo membro della (3.13) rappresenta la variazione per unità di tempo dell’energia totale contenuta in V ; ad
essa corrisponde, a secondo membro, un flusso di energia uscente attraverso
S. Resta cosı̀ chiarito che il vettore di Poynting rappresenta la densità di
flusso dell’energia E.M.. È utile anche scrivere la (3.13) in modo leggermente
diverso. Per fare questo osserviamo che si ha, inserendo la (3.5) nella (3.11):
Z
Z
d Z
~
~ · ~j dV
−
w dV =
S · ~n dS +
E
dt V
S
V
(3.17)
Questa relazione stabilisce che la diminuzione per unità di tempo dell’energia
E.M. contenuta in V è pari al flusso di energia uscente da V aumentato
della potenza dissipata in V dal campo elettrico. Mediante un procedimento
consueto, utilizzando il teorema della divergenza e la (3.15), la (3.17) può
essere sostituita dalla relazione differenziale equivalente:
~ · ~j
~ + ∂w = −E
∇·S
∂t
(3.18)
La (3.18) è formalmente analoga all’equazione di continuità delle cariche
e delle correnti, salvo la presenza, a secondo membro, di un termine che
rappresenta una “sorgente”, eventualmente negativa, di energia E.M..
32 CAPITOLO 3. L’ENERGIA DEL CAMPO ELETTROMAGNETICO.
3.2
Il tensore degli sforzi elettromagnetici
Abbiamo stabilito nel paragrafo precedente che il vettore di Poynting rappresenta il flusso dell’energia E.M.; dimostreremo ora, nel presente e nel successivo paragrafo, che al flusso di energia è associata una quantità di moto.
A questo scopo consideriamo un sistema di cariche contenute in un volume
finito V ; assumendo che le cariche formino una distribuzione continua, la
forza E.M. che agisce su di esse è data dalla forza di Lorentz, che può essere
scritta come:
f~ =
Z ~ + ~j × B
~
ρE
V
dV
(3.19)
Eliminando da questa equazione ρ e ~j per mezzo delle (1.1) e (1.4), si ottiene:
f~ =
Z
V




~
~ ∇·E
~ +  1 ∇×B
~ − ǫ0 ∂ E  × B
~  dV
ǫ0 E
µ0
∂t
(3.20)
~
L’espressione sotto integrale può essere trasformata in modo che in essa E
~ figurino simmetricamente. Per fare ciò basta aggiungere all’integrando
eB
~ e vettorialmente
le equazioni omogenee (1.2) e (1.3) moltiplicate per 1/µ0 B
~ Si ottiene:
per ǫ0 E.
f~
=
Z
V
+
+
~ ∇·E
~ + c2 B∇
~ ·B
~
ǫ0 E
Z
V
Z
V
dV +
~ ×E
~ + c2 ∇ × B
~ ×B
~
ǫ0 ∇ × E

−ǫ0

dV +
~
~
∂E
~ + ǫ0 ∂ B × E
~  dV
×B
∂t
∂t
(3.21)
~ si ricava:
Ricordando la definizione (3.10) di S
f~
=
Z
V
Z
V
~ ∇·E
~ + ∇×E
~ ×E
~
ǫ0 E
~ ∇·B
~ + ∇×B
~ ×B
~
ǫ0 c2 B
dV +
dV −
1 d
~ dV
S
(3.22)
c2 dt V
Per trasformare ulteriormente i primi due integrali osserviamo che, per la
~ vale l’identità:
componente x del termine dipendente da E,
−
h
Z
~ ∇·E
~ + ∇×E
~ ×E
~
E
i
x
=
∂ 1 2
Ex − Ey2 − Ez2
+
∂x 2
∂
∂
+ (Ex Ey ) +
(Ex Ez )
(3.23)
∂y
∂z
33
3.2. IL TENSORE DEGLI SFORZI ELETTROMAGNETICI
per le rimanenti componenti possono essere scritte delle relazioni analoghe, ottenibili dalla precedente con permutazioni circolare degli indici. Di
conseguenza ponendo:
ǫ0 2
ǫ0 c2 2
Ex − Ey2 − Ez2 +
Bx − By2 − Bz2 = −Txx
2
2
2 ǫ
ǫ0 2
0c
Ey − Ez2 − Ex2 +
By2 − Bz2 − Bx2 = −Tyy
2
2
2 ǫ
ǫ0 2
0c
2
2
Ez − Ex − Ey +
Bz2 − Bx2 − By2 = −Tzz
2
2
(3.24)
ǫ0 Ex Ey + ǫ0 c2 Bx By = −Txy = −Tyx
ǫ0 Ex Ez + ǫ0 c2 Bx Bz = −Txz = −Tzx
ǫ0 Ey Ez + ǫ0 c2 By Bz = −Tyz = −Tzy
(3.25)
e tenendo conto che delle relazioni analoghe alla (3.23) possono essere scritte
~ nella (3.22), si trova:
per le componenti del termine dipendente da B
h
~ ∇·E
~ + ∇×E
~ ×E
~ + c2 B
~ ∇·B
~ + ∇×B
~ ×B
~
ǫ0 E
i
x
=
!
∂Txx
∂Txy
∂Txz
= −
(3.26)
+
+
∂x
∂y
∂z
Corrispondenti relazioni valgono per le componenti y e z. La componente x
della forza di Lorentz f~ diventa pertanto:
fx = −
∂Txx
∂Txy
∂Txz
+
+
∂x
∂y
∂z
Z
V
1 d
− 2
c dt
Z
V
!
dV −
Sx dV
(3.27)
da essa, utilizzando il teorema della divergenza, si ha:
fx = −
Z
S
(Txx nx + Txy ny + Txz nz ) dS −
1 d
− 2
c dt
Z
V
Sx dV
(3.28)
dove S è la superficie che limita il volume V ; analogamente per fy e fz .
Le nove quantità Txx , Txy , ..., costituiscono le componenti di un tensore
simmetrico di rango 2 (cfr. appendice E). Ciò è provato dal fatto che la
34 CAPITOLO 3. L’ENERGIA DEL CAMPO ELETTROMAGNETICO.
(3.28) e le corrispondenti equazioni per fy , fz , impongono alle tre quanP
tità 3i=1 Tij di trasformarsi come le rispettive componenti di un vettore.
Indicando semplicemente con T questo tensore ed introducendo il vettore:
ϕ
~ = −
Z
S
T · ~n dS
(3.29)
l’espressione finale di f~ è:
d
f~ = ϕ
~ −
dt
Z
V
~
S
dV
c2
(3.30)
Per chiarire il significato fisico dei risultati ora ottenuti è necessaria una analisi che richiede una certa attenzione. A questo scopo consideriamo dapprima
~ non interviene e la (3.30) si
il caso statico in cui il termine dipendente da S
riduce a:
f~ = ϕ
~
(3.31)
Questa eguaglianza stabilisce che la forza E.M. che agisce sulla distribuzione
di carica contenuta nel volume V può essere espressa mediante i valori che
il tensore T assume sulla superficie S che limita V . È da notare che ad un
risultato analogo si arriva nello studio dell’elasticità di un mezzo materiale
continuo; si può infatti dimostrare che le forze elastiche che agiscono sulle
masse contenute in un volume V dipendono dai valori che il cosiddetto tensore
elastico assume sul contorno di V . Per questa ragione T prende il nome di
tensore degli sforzi elettromagnetici o tensore di Maxwell. È da notare che
questa analogia, assieme ad altre, indussero Maxwell ed i fisici contemporanei
a credere nell’esistenza del famigerato etere, un mezzo materiale che “doveva”
esserci per “sostenere” i campi E.M., ma non era rivelabile sperimentalmente.
3.3. QUANTITÀ DI MOTO E.M..
3.3
35
Quantità di moto E.M..
Per stabilire il significato della (3.30) nel caso non statico, introduciamo in
essa la quantità di moto meccanica delle masse contenute nel volume V .
Ponendo:
N
X
~
mi~vi = Q
(3.32)
i=1
in cui la somma è estesa a tutte le masse contenute in V , l’espressione della
forza diventa:
!
N
~
d X
dQ
~
f =
mi~vi =
(3.33)
dt i=1
dt
Ne segue che la (3.30) può essere scritta nella forma:


Z ~
S
d ~
dV  = ϕ
Q +
~
dt
V c2
(3.34)
questa equazione stabilisce che agli sforzi E.M. applicati alla superficie S
corrisponde la variazione, per unità di tempo, della quantità di moto meccanica delle masse presenti in S aumentata, però, di un termine dipendente
dal campo E.M.. In altre parole l’inerzia del sistema dipende, oltrechè dalle
masse, anche dal campo attraverso la grandezza:
~
S
dV
(3.35)
V c2
essa, per questa ragione, prende il nome di quantità di moto elettromagnetica.
Si riserva, invece, il nome di densità di quantità di moto all’integrando che
compare nella (3.35), cioè alla grandezza:
~ =
G
Z
~g =
~
S
~ ×B
~
= ǫ0 E
c2
(3.36)
È ovvio che la (3.34), applicata ad un volume limitato da una superficie sulla
quale il tensore T sia nullo, stabilisce la conservazione della quantità di moto
complessiva contenuta in questo volume.
Tenendo conto del significato energetico ed inerziale del vettore di
Poynting, è possibile stabilire una importante relazione tra l’energia e la
quantità di moto del campo E.M.. A questo scopo consideriamo un elemento
~ risulta subito, dal secondo membro
di area ∆S ortogonale alla direzione di S;
della (3.13) che l’energia che attraversa ∆S nel tempo ∆t è:
~ | ∆S ∆t
W =|S
(3.37)
36 CAPITOLO 3. L’ENERGIA DEL CAMPO ELETTROMAGNETICO.
D’altra parte avevamo visto nel paragrafo 2.3 che i potenziali e quindi anche
il campo E.M. si propagano con velocità c; di conseguenza nel tempo ∆t la
~ del tratto c∆t. Entro il volupropagazione procederà nella direzione di S
metto c ∆S ∆t, interessato dalla propagazione, è contenuta la quantità di
moto E.M.:
~
~ = S c ∆S ∆t
G
c2
(3.38)
Prendendo il modulo e confrontando con la (3.37) si ottiene subito:
~ |= W
|G
c
(3.39)
che è appunto il risultato cui si voleva arrivare. La relazione (3.39) non trova
~ e
riscontro nel caso meccanico in cui la relazione tra la quantità di moto Q
l’energia cinetica Ecin di una massa in moto con velocità ~v è:
~ =
|Q|
2 Ecin
v
(3.40)
La (3.39) peraltro, stabilisce la corretta relazione tra la quantità di moto
e l’energia di un fotone. Essa, infatti, purchè si assuma l’energia E.M. W
coincidente con quella hν di un singolo quanto, porta alla ben nota relazione
p = hν/c, dove indichiamo con p la quantità di moto del fotone.
È interessante notare che l’equazione (3.39) implica l’esistenza di una
massa associata all’energia E.M.. Infatti il rapporto tra il modulo della
quantità di moto e la velocità c, con cui l’energia E.M. si propaga, risulta
essere:
~ |
W
|G
= 2
c
c
(3.41)
Se, in analogia al caso meccanico, si attribuisce a tale rapporto il significato
di massa inerziale, si avrà:
m=
W
c2
(3.42)
Il risultato ora ottenuto ha valore più che altro euristico, il suo significato e
la sua importanza fisica verranno stabiliti nella teoria della relatività.
Un’altra importante conseguenza della relazione (3.36) è l’esistenza di
una pressione con cui il campo E.M. agisce sugli ostacoli capaci di alterarne
la propagazione. Una esauriente discussione di questo fenomeno richiederebbe, tuttavia, lo studio della propagazione in presenza del mezzo materiale
che costituisce l’ostacolo. Ci limitiamo, per ora, ad assumere l’effetto del
3.3. QUANTITÀ DI MOTO E.M..
37
mezzo materiale sulla propagazione come dato del problema deducendone la
conseguente pressione elettromagnetica.
A questo scopo consideriamo, dapprima, il caso in cui l’effetto consiste
nell’assorbimento totale dell’energia E.M.. Supponiamo, inoltre, per semplificare il calcolo, che l’ostacolo sia costituito da un oggetto abbastanza piccolo
da poter supporre, in un volume di estensione paragonabile alle sue dimensioni, il vettore di Poynting costante rispetto al posto. A causa del teorema
~
di conservazione della quantità di moto, la quantità di moto meccanica ∆Q
che l’oggetto acquista nel tempo ∆t deve essere pari a quella persa dal campo
E.M.. Quest’ultima, indicata con ∆S l’area della proiezione dell’oggetto sul
~ (vedi figura 3.1) è data dall’equazione (3.38).
piano ortogonale a S
Figura 3.1:
Si deve avere perciò:
~
S
∆S ∆t
(3.43)
c
D’altra parte, supposto ∆t piccolo a piacere, dalla legge fondamentale della
dinamica si ha:
~ =
∆Q
~ = f~ ∆t
∆Q
(3.44)
dove f~ è la risultante delle forze che agiscono sull’oggetto nell’intervallo di
tempo ∆t. Confrontando le (3.43), (3.44) si ottiene pertanto:
~
S
f~
=
(3.45)
∆S
c
Questa equazione, nel caso in cui la superficie dell’oggetto sia ortogonale a
~ può essere scritta nella forma:
S,
~|
|S
(3.46)
c
la quale determina la pressione della radiazione E.M. su di un ostacolo perfettamente assorbente. Considerando la conservazione della quantità di moto
p =
38 CAPITOLO 3. L’ENERGIA DEL CAMPO ELETTROMAGNETICO.
è immediato capire che la pressione di radiazione vale il doppio nel caso di
un ostacolo perfettamente riflettente, con incidenza normale.
In pratica la pressione E.M., a causa del fattore c che compare a
~ |
denominatore della (3.45) è sempre molto piccola salvo i casi i cui | S
assuma un valore eccezionalmente grande. Ciò accade, ad esempio, all’interno
delle stelle in cui esiste una fortissima pressione di radiazione che interviene
in modo essenziale a determinarne l’equilibrio. Per la radiazione E.M. del
~ | risulta essere circa 2 calorie per
Sole al limite dell’atmosfera terrestre, | S
centimetro quadro e per minuto, pari a 1.4 103 J m−2 s−1 . Mediante la
(3.46) ciò corrisponde ad una pressione di circa 0.5 10−5 Pa (1Pa ≃ 9.868
10−6 atm). Questa pressione, benchè piccola, può dar luogo, nel caso di
oggetti di dimensioni molto ridotte, ad una forza superiore a quella dovuta
alla attrazione gravitazionale del Sole. Infatti, la forza di attrazione del Sole
è | Fa |∝ r 3 , avendo indicato con r il raggio dell’oggetto, supposto sferico,
mentre quella dovuta alla pressione di radiazione è | Fr |∝ r 2 . Il rapporto
Fr /Fa ∝ 1/r e può diventare maggiore di 1 per r sufficientemente piccolo.
Esercizio: Una particella nel sistema solare si trova sottoposta alla
azione combinata della attrazione gravitazionale del Sole e della forza della
radiazione dovuta ai raggi del Sole. Si supponga che la particella sia una sfera
di densità ρ = 103 kg/m3 (ghiaccio, per esempio) e che la radiazione incida
su di essa perpendicolarmente e venga assorbita completamente. Si trovi
il minimo raggio, rC , della particella per cui essa viene espulsa dal sistema
solare.
La forza di attrazione gravitazionale è data da:
~
M mR
F~a = −G
R3
(3.47)
dove G è la costante di gravitazione universale, M è la massa del Sole, m è
~ è la distanza Sole–particella, R il suo modulo;
la massa della particella, R
essa agisce lungo la congiungente Sole–particella ed è diretta verso il Sole. Il
suo modulo può essere espresso come:
Fa = G
M
4 3
ρ
πr
R2 3
(3.48)
La forza della radiazione agisce lungo la direzione di propagazione delle onde
E.M. emesse dal Sole; queste sono onde sferiche e a, grande distanza, i loro
fronti d’onda possono approssimarsi a dei piani perpendicolari alla direzione
di propagazione (onde piane). La forza della radiazione ha, pertanto, la
3.3. QUANTITÀ DI MOTO E.M..
39
stessa direzione ma verso opposto rispetto alla attrazione gravitazionale; il
suo modulo è:
~|
|S
Fr =
πr 2
(3.49)
c
~ | è il modulo del vettore di Poynting nel punto in cui si trova la
dove | S
particella, cioè a distanza R dal Sole. All’equilibrio:
~|
M
4 3
|S
ρ
πr
=
πr 2
(3.50)
2
R
3
c
da cui si può vedere che l’equilibrio è soddisfatto per particelle con raggio:
G
rC =
~ | 3 R2
|S
c 4ρ G M
(3.51)
Osserviamo che, supponendo che durante la propagazione delle onde non vi
sia assorbimento di energia ad esse associata (o che sia trascurabile), deve
valere la relazione:
Φ(R1 ) = Φ(R2 )
(3.52)
qualunque siano le distanze R1 ed R2 considerate, per la conservazione dell’energia, ovvero:
~ 1 ) | 4πR2 = | S(R
~ 2 ) | 4πR2
| S(R
1
2
(3.53)
da cui si ricava:
~ 1 ) | R12 = | S(R
~ 2 ) | R22
| S(R
(3.54)
Pertanto il raggio critico rC cercato non dipende dalla distanza rispetto al Sole a cui si trova la particella; il valore di rC può essere calcolato, per esempio,
~ | e R al limite dell’atmosfera terrestre:
considerando i valori noti di | S
~|
1.4 103 N
N
|S
=
= 0.47 · 10−5 2
8
2
c
3 10 m
m
(3.55)
6.67 10−11 2.01 1030 m
m
GM
=
= 5.96 103 2
2
2
22
2
R
(1.5) 10
s
s
(3.56)
rC =
~ | 3 R2
|S
= 0.585 10−6 m
c 4ρ G M
(3.57)
Sferette di ghiaccio con raggio inferiore a rC verranno allontanate dal Sole
sotto l’effetto della risultante di Fr − Fa ; resta cosı̀ spiegato il fatto che le
comete rivolgano la coda, formata principalmente da sferette microscopiche
di ghiaccio, sempre nella direzione opposta a quella del Sole.
Capitolo 4
Propagazione di onde E.M. nel
vuoto
4.1
Introduzione
È già stato trattato nel corso di Ottica ed Elettromagnetismo il caso semplice
della propagazione nel vuoto di onde E.M. piane e polarizzate nel caso unidimensionale (propagazione lungo l’asse x, per esempio). Si ricorda in sintesi il
metodo seguito. In assenza di sorgenti (ρ = 0, ~j = 0) le EqM assumono una
~ eB
~ compaiono simmetricamente. Applicando
forma molto semplice, in cui E
l’operatore ∇× alle (1.3) e (1.4) e ricordando la (A.28) si ottengono le due
espressioni:
~ =0
2E
(4.1)
~ =0
2B
(4.2)
e
che si possono riassumere nell’equazione generale:
2f = 0
(4.3)
~ e di B.
~ Nelle ulin cui f indica una qualsiasi delle tre componenti di E
teriori ipotesi che si abbia simmetria piana, e quindi propagazione soltanto
lungo l’asse x (di conseguenza ∂/∂y = ∂/∂z = 0), e che il campo elettri~ sia contenuto soltanto nel piano (x, z) (onda polarizzata, Ey = 0 e
co E
conseguentemente Bz = 0), la (4.3) si riduce a:
∂2f
1 ∂2f
−
= 0
∂x2
c2 ∂t2
(4.4)
40
4.2. TECNICA DI SEPARAZIONE DELLE VARIABILI
41
in cui f rappresenta Ez o By .
L’integrale generale della (4.4) è:
f = a(x − ct) + b(x + ct)
(4.5)
dove a e b sono due funzioni arbitrarie del loro argomento (onde progressive
e onde regressive). È anche noto dall’Analisi che una funzione arbitraria è
esprimibile sotto forma di somma (o integrale) di Fourier (vedi appendice
D), e quindi il caso generale può essere ricondotto allo studio della funzione
sinusoidale:
2π
f (x, t) = f0 sin
(x − ct) + α
(4.6)
λ
o
f (x, t) = f0 sin [(kx − ωt) + α]
(4.7)
avendo posto come al solito k = 2π/λ. Le conseguenze immediate delle
~ eB
~ sono ortogonali e formano una
relazioni precedenti erano che i campi E
terna destrorsa, nell’ordine, in cui il versore ~i dell’asse x è il terzo elemento,
e che E = cB
4.2
4.2.1
Tecnica di separazione delle variabili
Coordinate cartesiane
Per studiare, in casi differenti da quello della simmetria piana, la propagazione di onde E.M. è necessario, innanzitutto, sviluppare un metodo generale
per integrare l’equazione (4.3). Dedichiamo, pertanto, il presente paragrafo alla risoluzione di questo problema matematico. A rigore una soluzione
dell’equazione (4.3) è già nota; si constata, infatti, ponendo F = 0 nelle equazioni (2.30) e (2.48), che la formula di Kirchhoff fornisce la richiesta funzione
f (P, t) sotto forma di un integrale di superficie. Tuttavia, l’applicazione di
questa formula non è all’atto pratico molto opportuna specie quando occorra ottenere f (P, t) in forma esplicita. Pertanto non useremo la formula di
Kirchhoff, ma bensı̀ un procedimento che permette di integrare la (4.3) mediante quattro equazioni alle derivate totali rispettivamente per la variabile
tempo e le tre variabili di posizione. Questo procedimento, che viene detto
per separazione delle variabili, richiede l’uso di coordinate ortogonali; noi lo
svilupperemo, con un certo dettaglio, nel caso delle coordinate cartesiane e
cilindriche.
Consideriamo dunque l’equazione alle derivate parziali (4.3); occorre
determinarne le soluzioni sotto forma di funzioni del posto e del tempo finite
42
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
e regolari (cioè continue e ad un sol valore) entro il dominio di integrazione
prescelto. Considerando la forma dell’ operatore differenziale che compare
nella (4.3) possiamo osservare che esso può essere decomposto nella somma di
due operatori, uno dei quali, ∇2 , dipende solo dalle coordinate spaziali mentre
∂2
il secondo dipende solo dalla coordinata temporale, ∂t
2 . Questa circostanza
fa sı̀ che la soluzione della (4.3) possa essere scritta in modo fattorizzato,
come prodotto di una funzione dello spazio e di una del tempo, ossia che si
possa applicare la tecnica di separazione delle variabili.
Infatti, riferendoci ad un caso generale, se in una equazione differenziale O(x1 , x2 ) ψ(x1 , x2 ) = k ψ(x1 , x2 ), con k costante, compare un operatore
O(x1 , x2 ) che agisce sulle variabili x1 e x2 e che può essere scritto come
O = O1 (x1 ) + O2 (x2 ), dove gli operatori O1 e O2 agiscono solo sulle variabili
indicate, se la soluzione viene scritta come ψ(x1 , x2 ) = χ(x1 ) φ(x2 ), sostituendo tale soluzione nella equazione di partenza e dividendola per ψ = χ φ
si ottiene l’equazione: χ1 O1 (x1 )χ(x1 )+ φ1 O2 (x2 )φ(x2 ) = k. Affinchè tale equazione sia soddisfatta, e con essa anche l’ equazione di partenza, nell’ ipotesi
che le variabili x1 e x2 siano indipendenti, occorre che, posto k = k1 + k2 ,
siano soddisfatte le due equazioni: χ1 O1 (x1 )χ(x1 ) = k1 e φ1 O2 (x2 )φ(x2 ) = k2 .
Questo riconduce la soluzione della equazione di partenza alla soluzione di
queste due ultime equazioni, dove le derivate che compaiono saranno derivate
totali e perciò la soluzione potrà essere ricondotta a tecniche già note.
Possiamo, dunque, pensare di applicare la separazione delle variabili
alla soluzione della (4.3), sapendo che questa si riduce alla forma generale
qualora si consideri che nel caso specifico, risulta k = 0. Per far ciò cominciamo col decomporre la f nel prodotto di due funzioni rispettivamente del
posto e del tempo, cioè:
f (P, t) = ψ(P ) χ(t)
(4.8)
Sostituendo questa espressione nella (4.3) e dividendo membro a membro per
f , si ottiene:
∇2 ψ
1 d2 χ
c
=
ψ
χ dt2
2
(4.9)
Poichè il primo membro è funzione solo del posto e il secondo solo del tempo,
ciascuno di essi deve essere uguale ad una costante a priori arbitraria, che
verrà indicata con ±ω 2 . È evidente che solo il segno meno è accettabile;
infatti scegliendo il segno positivo, l’equazione:
d2 χ
= +ω 2 χ
dt2
(4.10)
4.2. TECNICA DI SEPARAZIONE DELLE VARIABILI
43
fornisce per il fattore temporale delle funzioni esponenziali variabili monotonicamente, le quali diventano infinite quando la variabile t assume dei valori
positivi o negativi arbitrariamente grandi. Viceversa, la scelta del segno
meno corrisponde a delle funzioni periodiche che, per comodità, scriveremo
mediante esponenziali immaginari, cioè:
−iωt
χω (t) = χ(0)
ω e
(4.11)
dove χ(0)
ω è una costante complessa di scelta arbitraria. Combinando linearmente questa funzione colla complessa coniugata, che verifica pure essa la
(4.3), si possono ottenere delle soluzioni reali fisicamente significative. Oppure, scegliendo un procedimento molto comune in elettromagnetismo, si può
prendere come fattore temporale la parte reale, o il coefficiente dell’unità immaginaria, della soluzione (4.11). In ogni modo, l’equazione per la parte
spaziale diventa:
ω2
ψ = 0
(4.12)
c2
Sostituendo l’integrale ψω della (4.12) e l’espressione (4.11) di χω nella (4.8),
si otterrà un integrale particolare fω dell’equazione (4.3). Sovrapponendo gli
integrali corrispondenti ai vari valori di ω si otterrà, a causa della linearità
della (4.3), l’integrale generale richiesto. In particolare, se le costanti ω formano una progressione aritmetica, la funzione f risulterà espressa mediante
una serie di Fourier.
Occorre ora determinare gli integrali della (4.12). Ciò può essere fatto
abbastanza facilmente se l’operatore laplaciano è espresso mediante coordinate ortogonali; in questo modo, infatti, la (4.12) si decompone in tre equazioni
separate, una per ogni coordinata. Cominciamo dal caso delle coordinate
cartesiane, che fra tutti è il più semplice. Ponendo:
∇2 ψ +
ψ(P ) = X(x) Y (y) Z(z)
(4.13)
e dividendo per ψ, la (4.12) diventa:
1 d2 Y
1 d2 Z
ω2
1 d2 X
+
+
=
−
X dx2
Y dy 2
Z dz 2
c2
(4.14)
Introduciamo tre costanti α, β, γ soddisfacenti alla relazione:
ω2
c2
e consideriamo le equazioni:
α2 + β 2 + γ 2 =
(4.15)
d2 Y
d2 Z
d2 X
2
2
=
−α
X,
=
−β
Y,
= −γ 2 Z
2
2
2
dx
dy
dz
(4.16)
44
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
i loro integrali, evidentemente, forniscono, se sono sostituiti nella (4.13), un
integrale particolare della (4.12). Procedendo in analogia a quanto fatto in
precedenza per il fattore temporale, gli integrali richiesti possono pertanto
essere scritti nella forma:
(0)
Xα (x) = Xα(0) eiαx , Yβ (y) = Yβ
eiβy , Zγ (z) = Zγ(0) eiγz , (4.17)
Introducendo il vettore:
c
~τ (α, β, γ) = (α~i + β~j + γ~k)
ω
(4.18)
il cui modulo, come risulta dalla (4.15), è unitario, avremo:
(0)
ψα,β,γ = ψα,β,γ ei c ~r·~τ (α,β,γ)
ω
(4.19)
da cui, tenendo conto della (4.8):
(0)
fα,β,γ (x, y, z, t) = fα,β,γ ei c [~r·~τ (α,β,γ)
ω
− ct]
(4.20)
(0)
Nella (4.19) si è indicato con ψα,β,γ il prodotto delle tre costanti che compa(0)
iono a secondo membro nelle (4.17); cosı̀ pure nella (4.20) si è scritto fα,β,γ
(0)
al posto del prodotto ψα,β,γ χ(0)
ω . Si deve tener conto che queste costanti, e
(0)
quindi anche il coefficiente fα,β,γ , sono in generale delle quantità complesse.
La (4.20) rappresenta in forma complessa un’onda piana di tipo sinusoidale
che si propaga lungo la direzione ~τ . È possibile poi, scegliendo diversamente
i segni nelle (4.11) e (4.17), ottenere soluzioni corrispondenti ad onde regressive. Abbiamo cosı̀ riottenuto, col metodo della separazione delle variabili,
il risultato cui eravamo pervenuti nel paragrafo precedente. Tuttavia, nel
caso attuale, la direzione di ~τ non è più fissata in quanto, salvo la condizione
(4.15) che stabilisce l’unitarietà del modulo di ~τ , le costanti α, β, γ sono
arbitrarie. L’integrale generale della (4.3) lo si otterrà, sotto forma di serie
(o di integrale) di Fourier, sommando (o integrando) la (4.20) su tutte le
direzioni di ~τ e su tutti i valori di ω, cioè:
f (x, y, z, t)
=
X
(0)
fα,β,γ ei c [~r·~τ (α,β,γ)
ω
− ct]
α,β,γ
=
X
(0) i c [~
fτ,ω
e r·~τ
ω
− ct]
(4.21)
~
τ ,ω
Evidentemente questa relazione, che rappresenta una propagazione di tipo
qualsiasi come sovrapposizione di onde piane, si riduce al caso particolare
(0)
della simmetria piana quando i coefficienti fα,β,γ con indici β e γ differenti
da zero sono nulli, ossia quando esiste una sola orientazione di ~τ .
4.2. TECNICA DI SEPARAZIONE DELLE VARIABILI
4.2.2
45
Coordinate cilindriche
Consideriamo ora il caso delle coordinate cilindriche. Ponendo:
ψ(P ) = R(r) Φ(ϕ) Z(z)
(4.22)
esplicitando mediante la (C.14) il laplaciano e dividendo membro a membro
per ψ, la (4.12) diventa:
1 d dR
1 d2 Φ
ω2
1 d2 Z
(r ) + 2
+
=
−
rR dr dr
r Φ dϕ2
c2
Z dz 2
(4.23)
Poichè il primo membro dipende solo da r e ϕ mentre il secondo solo da
z, ciascuno dei due membri deve essere costante rispetto alle coordinate;
possiamo perciò separare le variabili ponendo:
1 d2 Z
= −a1
Z dz 2
(4.24)
1 d2 Φ
ω2
1 d dR
(r ) + 2
+
= a1
rR dr dr
r Φ dϕ2
c2
(4.25)
dove a1 è una costante arbitraria. La (4.25) può essere riscritta nella forma:
r d dR
ω2
1 d2 Φ
(r ) + ( 2 − a1 )r 2 = −
R dr dr
c
Φ dϕ2
(4.26)
da cui appare evidente che è ancora possibile separare le variabili r e ϕ
mediante le due equazioni:
1 d2 Φ
= −a2
Φ dϕ2
(4.27)
r d dR
ω2
(r ) + ( 2 − a1 )r 2 = a2
R dr dr
c
(4.28)
dove a2 è un’altra costante arbitraria. L’integrazione della (4.12) è cosı̀ ricondotta a quella delle equazioni (4.24), (4.27) e (4.28), ossia delle equazioni
alle derivate totali:
d2 Z
+ a1 Z = 0
dz 2
(4.29)
d2 Φ
+ a2 Φ = 0
dϕ2
(4.30)
46
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
d2 R
1 dR
+
+
2
dr
r dr
a2
ω2
− a1 − 2 R = 0
2
c
r
!
(4.31)
Dalla (4.24) otteniamo per la funzione Z una espressione di tipo esponenziale
o periodico a seconda che la costante a1 sia negativa o positiva. Poichè al
crescere del modulo di z la funzione esponenziale diventa nulla o infinita,
essa non è fisicamente accettabile, dato che il valore di ψ deve rimanere
dappertutto finito. Escludendo il caso, non interessante per i nostri scopi, in
cui il dominio di integrazione è limitato, concludiamo che la costante a1 deve
essere scelta positiva. Di conseguenza, ponendo:
a1 = h2
(4.32)
in cui h è una costante reale, di dimensioni pari al reciproco di una lunghezza,
avremo:
(0)
Zh (z) = Zh eihz
(4.33)
Mediante la (4.33) e la sua coniugata, che sono degli integrali particolari,
possiamo costruire l’integrale generale della (4.29).
Considerando la (4.30) è facile vedere che la costante a2 deve essere
scelta uguale al quadrato di un numero intero. In questo caso, infatti, la
funzione Φ avrà carattere periodico con periodo 2π; ciò evidentemente è
richiesto dalla condizione che Φ sia continua per ϕ=0. Ponendo:
a2 = n2
n = 0, 1, 2, .....
(4.34)
otteniamo dalla (4.30) l’integrale particolare:
inϕ
Φn = Φ(0)
n e
(4.35)
dove il fattore costante Φ(0)
n è, come per la (4.33), complesso. L’integrale
generale, anche questa volta, risulterà dalla (4.35) e dalla sua coniugata.
Tenendo conto della (4.32) e della (4.34) e introducendo al posto di r
la variabile ausiliaria:
ξ = r
s
ω2
− h2
c2
(4.36)
l’equazione radiale (4.31) diventa:
d2 R
1 dR
+
+
2
dξ
ξ dξ
n2
1− 2 R = 0
ξ
!
(4.37)
4.2. TECNICA DI SEPARAZIONE DELLE VARIABILI
47
che è l’equazione di Bessel di ordine n (cfr. Appendice F). Essa ammette
due integrali indipendenti, la funzione di Bessel Jn (ξ) e la funzione di Neumann Nn (ξ) 1 . La più generale soluzione della (4.37) sarà quindi esprimibile
mediante una combinazione lineare di queste due funzioni. Per ξ = 0, tuttavia, la funzione di Neumann è infinita; essa non può quindi intervenire per
rappresentare un campo finito per r = 0, cioè lungo l’asse z. Escludendo
questo asse dal dominio di integrazione, possiamo assumere come integrali
indipendenti della (4.37) due combinazioni lineari, di forma complessa, di Jn
e Nn , ossia la funzione:
Hn (ξ) = Jn (ξ) + iNn (ξ)
(4.38)
e la sua coniugata. La forma esplicita di Hn , che prende il nome di funzione
di Hankel, può essere ottenuta mediante le espressioni di Jn e Nn .
Per grandi valori di ξ conviene tuttavia rappresentare le funzioni Jn ,
Nn e Hn mediante i seguenti sviluppi asintotici:
Jn (ξ) ≃
s
Nn (ξ) ≃
s
2
2n + 1
cos ξ −
π
πξ
4
2
2n + 1
sin ξ −
π
πξ
4
Hn (ξ) ≃
s
2 i(ξ
e
πξ
−
2n+1
π
4
(4.39)
)
(4.40)
validi per | ξ |≫ 1 e | ξ |≫ n.
Ricordando l’equazione (4.36), il fattore radiale risulta espresso mediante le funzioni di Hankel nellaforma:

Rω,n,h,α(r) =
(0)
Rω,n,h,α
Hnα r
s
ω2
− h2 
c2
(4.41)
In questa relazione si è introdotto un indice α suscettibile di assumere i valori
1 e 2; esso serve a distinguere la funzione Hn dalla sua coniugata.
Riassumendo, ne segue che la funzione f , soluzione generale della
(4.3), è data in coordinate cilindriche dallo sviluppo:
f (r, ϕ, z, t)
=
X
(0)
(0)
(0)
Rω,n,h,α Φ(0)
n Zh χω
ω,n,h,α
 s
1
Hnα r
ω2
c2

− h2  ei(nϕ
+ hz − ωt)
(4.42)
Per dettagli sulle funzioni di Bessel si rimanda a testi dedicati; vedi per esempio:
G. N. Watson “A treatise on the theory of Bessel Functions” 2nd edition – Cambridge,
1962
48
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
(0)
(0)
(0)
Scegliendo opportunamente i valori delle costanti Rω,n,h,α, Φ(0)
n , Zh e χω , la
(4.42) rappresenta, come già accadeva per la (4.21), onde di forma qualsiasi
che si propagano in un dominio esteso a tutto lo spazio salvo l’asse z.
4.3
Propagazione di onde a simmetria cilindrica
Utilizzando i risultati dei paragrafi precedenti, possiamo ora riprendere lo
studio della propagazione delle onde E.M., iniziato con le onde piane. Appare subito che le soluzioni dell’equazione (4.3) assumono una forma particolarmente semplice se si impone alla funzione f (P, t) la simmetria cilindrica.
Infatti, f (P, t) non dipende da ϕ. Supponiamo, dunque, che il fenomeno di
propagazione abbia simmetria cilindrica cioè che sia indipendente dalla coordinata ϕ. Inoltre, supponiamo che esso sia indipendente anche da z. Ciò non
costituisce una sostanziale restrizione; si può facilmente verificare che lungo
la coordinata z la propagazione può avvenire solo sotto forma di onde piane
e ciò attualmente non ha interesse per i nostri scopi. Con queste ipotesi e
usando le coordinate cilindriche, ricordando che:
~ = 1 ∂ (r Er ) + 1 ∂Eϕ + ∂Ez = 0
∇·E
r ∂r
r ∂ϕ
∂z
(4.43)
~ = 0, inoltre:
e analogamente per ∇ · B
!
~ = ~ir 1 ∂Ez − ∂Eϕ +
∇×E
r ∂ϕ
∂z
!
~iϕ ∂Er − ∂Ez +
∂z
∂r
!
1
∂
∂E
r
~iz
=
(r Eϕ ) −
r ∂r
∂ϕ
!
∂Bϕ ~
∂Bz ~
∂Br ~
ir +
iϕ +
iz
−
∂t
∂t
∂t
~ = ǫ0 µ0
e l’analoga per ∇ × B
scritte nella forma:
1 ∂Er
= 0
c2 ∂t
−
∂Bz
1 ∂Eϕ
− 2
= 0
∂r
c ∂t
~
∂E
∂t
(4.44)
(4.45)
le equazioni (1.1)–(1.4) possono essere
(4.46)
(4.47)
4.3. PROPAGAZIONE DI ONDE A SIMMETRIA CILINDRICA
49
1 ∂
1 ∂Ez
(rBϕ ) − 2
= 0
r ∂r
c ∂t
(4.48)
1 ∂
(rEr ) = 0
r ∂r
(4.49)
∂Br
= 0
∂t
(4.50)
−
∂Bϕ
∂Ez
+
= 0
∂r
∂t
(4.51)
1 ∂
∂Bz
(rEϕ ) +
= 0
r ∂r
∂t
(4.52)
1 ∂
(rBr ) = 0
r ∂r
(4.53)
dove Er , Ez , Eϕ sono le componenti cilindriche del campo elettrico e Br , Bz ,
Bϕ quelle del vettore induzione magnetica. Risulta subito da queste equazioni
che Er e Br non possono propagarsi; le (4.46) e (4.50), infatti, stabiliscono
che esse sono costanti nel tempo, le (4.49) e (4.53) che possono variare in
funzione di r solo con legge iperbolica. Noi pertanto, essendo interessati solo
alle componenti che si propagano, assumiamo Er e Br nulle.
Consideriamo ora le equazioni (4.1) e (4.2) ed esprimiamole mediante
~ e B.
~ Tenendo conto che il laplaciano del
le componenti cilindriche di E
campo magnetico è:
2~
∇B
= ~ir
~iϕ
!
Br
2 ∂Bϕ
∇ Br − 2 − 2
+
r
r ∂ϕ
!
2
∂B
B
r
ϕ
+
∇2 Bϕ − 2 + 2
r
r ∂ϕ
2
~iz ∇2 Bz
(4.54)
dove ~ir , ~iϕ , ~iz sono i versori delle linee coordinate, e che vale per il campo
elettrico una relazione analoga, le (4.1) e (4.2) diventano:
1 ∂ ∂Bϕ
1
1 ∂ 2 Bϕ
(r
) − 2 Bϕ − 2
= 0
r ∂r ∂r
r
c ∂t2
(4.55)
1 ∂ ∂Bz
1 ∂ 2 Bz
(r
) − 2
= 0
r ∂r ∂r
c ∂t2
(4.56)
1 ∂ ∂Eϕ
1
1 ∂ 2 Eϕ
(r
) − 2 Eϕ − 2
= 0
r ∂r ∂r
r
c ∂t2
(4.57)
50
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
1 ∂ ∂Ez
1 ∂ 2 Ez
(r
) − 2
= 0
r ∂r ∂r
c ∂t2
(4.58)
in cui ovviamente è stata considerata solo la dipendenza dalla coordinata
r. Le (4.55) e (4.57) a differenza delle (4.56) e (4.58) non sono della forma
(4.3) e quindi la loro integrazione costituisce un problema non ancora risolto; tuttavia ricavando dalle (4.56) e (4.58) Bz e Ez possiamo sostituirne le
espressioni nelle equazioni del campo ottenendone Eϕ e Bϕ . Ne segue che
l’integrazione delle (4.55) e (4.57) è superflua.
Ponendo nella (4.42) n = 0, h = 0 essa fornisce gli integrali, indipendenti da ϕ e z, delle (4.56) e (4.58); possiamo, inoltre, scegliere le costanti
che intervengono nella (4.42) in modo che:
Bz = 0
(4.59)
e
(1)
Ez = Ez(0) H0 (r
ω −iωt
)e
c
(4.60)
Ciò, evidentemente, equivale a supporre il campo magnetico polarizzato lungo la direzione del versore ~iϕ . Sostituendo la (4.59) nelle (4.47) e (4.52),
risulta che la componente Eϕ è costante rispetto al tempo ed al posto; di
conseguenza, la parte del campo elettrico che si propaga si riduce alla componente Ez . Calcoliamo ora Bϕ ; sostituendo la (4.60) nella (4.51) e tenendo
conto della relazione:
(1)
dH0 (ξ)
(1)
= − H1 (ξ)
dξ
(4.61)
si ha:
−Ez(0)
ω (1) ω −iωt
∂Bϕ
H1 (r ) e
=
c
c
∂t
(4.62)
da cui integrando si ottiene:
1 (0) (1) ω −i(ωt
1
(1) ω
E H1 (r ) e
Bϕ = − Ez(0) H1 (r ) i e−iωt =
c
c
c z
c
+ π/2)
(4.63)
Scegliendo diversamente le costanti nella (4.42) possiamo ottenere, in luogo
delle equazioni (4.60) e (4.63), una seconda soluzione in cui le direzioni del
campo elettrico e magnetico sono scambiate, cioè il campo elettrico è diretto
lungo ~iϕ e quello magnetico lungo ~iz . La combinazione di queste due soluzioni ci permetterebbe di rappresentare il più generale stato di polarizzazione;
la soluzione particolare da noi considerata, tuttavia, è sufficiente per chiarire
4.3. PROPAGAZIONE DI ONDE A SIMMETRIA CILINDRICA
51
Figura 4.1:
le modalità della propagazione con simmetria cilindrica. Essa inoltre è interessante perchè corrisponde al caso in cui il campo magnetico (vedi figura
4.1) è generato da una corrente non stazionaria che percorre un filo rettilineo
illimitato disposto lungo l’asse z. Studiamo, pertanto, le proprietà del campo
E.M. rappresentato dalle (4.60) e (4.63). Per far questo supponiamo che si
abbia:
c
r ≫
(4.64)
ω
ossia che la distanza dall’asse cilindrico sia grande rispetto al tratto percorso
da un’onda E.M. che si propaghi per un tempo 1/ω. Mediante queste ipotesi
e ricordando la (4.40), le (4.60) e (4.63) diventano:
Ez ≃ Ez(0)
Bϕ ≃
s
−Ez(0)
2c i[ω( rc
e
πωr
s
− t) −
r
2
ei[ω( c
cπωr
π
4
]
− t) −
(4.65)
π
4
]
(4.66)
Da queste soluzioni complesse possiamo ottenere quelle reali, fisicamente significative, prendendone la parte reale o il coefficiente dell’unità immaginaria;
possiamo perciò scrivere:
Ez ≃
Bϕ ≃
Ez(0)
s
−Ez(0)
2c
r
π
sin ω( − t) −
πωr
c
4
s
r
π
2
sin ω( − t) −
cπωr
c
4
(4.67)
(4.68)
Queste equazioni stabiliscono che il campo E.M. si propaga con velocità c sotto forma di onde la cui ampiezza decresce al crescere della distanza dall’asse
z.
52
CAPITOLO 4. PROPAGAZIONE DI ONDE E.M. NEL VUOTO
Studiamo ora le proprietà energetiche della propagazione a simmetria
cilindrica; il vettore di Poynting associato alle espressioni asintotiche (4.67)
e (4.68) del campo è:
2
~ = c ǫ0 E (0)
S
πω z
2
r
π ~
2
sin2 ω( − t) −
ir
r
c
4
(4.69)
mentre la corrispondente intensità di radiazione vale pertanto:
I =
ǫ0 c2 Ez(0)
1 ZT ~
| S | dt =
T 0
πωr
2
(4.70)
Risulta cosı̀ che l’energia E.M. si propaga in direzione radiale con densità di
flusso inversamente proporzionale a r. Si vede subito, inoltre, che il flusso
di energia è costante attraverso a tutte le superfici cilindriche con asse z e
altezza h assegnata; si ha infatti:
Z
S
I dS =
Z
0
2π
Z
0
h
I r dϕ dz =
2 ǫ0 c2 h (0)
Ez
ω
2
(4.71)
che è appunto una quantità indipendente da r. Questa equazione può essere
interpretata supponendo che la sorgente di energia sia uniformemente distribuita lungo l’asse z; è ovvio, in tal modo, che il flusso energetico sia costante
attraverso a tutte le superfici S.
Capitolo 5
Irraggiamento di onde E.M.
5.1
Introduzione
Iniziamo in questo paragrafo lo studio dell’emissione di onde E.M. da parte
di distribuzioni non stazionarie di cariche e correnti. Questo studio completerà i risultati del capitolo 4 in cui abbiamo trattato la propagazione del
campo indipendentemente dalle sue sorgenti. Come primo caso concreto per
sviluppare i nostri calcoli, consideriamo un dipolo elettrico oscillante; esso è
di particolare importanza in quanto sia fenomeni di irraggiamento atomici
sia quelli relativi alle antenne trasmittenti possono, in un certo modo, essere
considerati come dovuti a dei dipoli di momento variabile nel tempo. Benchè
lo strumento matematico più adatto al nostro scopo sia il vettore di Hertz
~ e V . In que(vedi paragrafo 2.2), eseguiremo i calcoli usando i potenziali A
sto modo apparirà evidente come la condizione di Lorentz (2.12) intervenga
a semplificare il problema permettendo di calcolare solo tre integrali anzichè
i quattro che compaiono nelle (2.50) e (2.51). Inoltre, sarà possibile confrontare attraverso le proprietà del potenziale V il comportamento del dipolo
~ e V , le (2.1) e (2.4) ci
oscillante con quelle del dipolo statico. Ottenuti A
~ ed E.
~
forniranno per derivazione i campi B
5.2
Dipolo oscillante
~ come
Date due cariche −q e +q collocate rispettivamente nei punti O e O + d,
indicato in figura 5.1, supponiamo che, mentre la carica −q rimane ferma,
la carica +q oscilli lungo una direzione assegnata in modo che la distanza d~
vari secondo la legge:
d~ = d~0 cos ωt
(5.1)
53
54
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Figura 5.1:
o, in forma complessa:
d~ = d~0 e−iωt
(5.2)
Evidentemente, al limite per d~0 tendente a zero, questo sistema di cariche
costituisce un dipolo il cui momento, oscillante, è dato dalla relazione:
~p = ~p0 e−iωt
(5.3)
in cui ~p0 indica la quantità:
~p0 = q d~0
(5.4)
Non ci interessa, per il momento, considerare le forze che determinano l’oscillazione del dipolo ; le (5.2) e (5.3) vengono assunte semplicemente come
dato iniziale del nostro calcolo. Ricordando la (1.15) e tenendo conto della
(5.3), la densità di corrente associata al dipolo risulta essere:
i
h
i
~ h
~ = −iωq d~0 e−iωt δ Q − (O + d)
~ (5.5)
~j(Q) = q dd δ Q − (O + d)
dt
ossia, utilizzando la (5.4)
~
~j(Q) = −iω~p0 e−iωt δ Q − (O + d)
h
i
(5.6)
Supponendo il vettore d~ trascurabile di fronte alla distanza (Q − O) e
calcolando mediante la (5.6) l’integrale che interviene nella (2.50) si ottiene
~ esso, come è evidente dalla (2.50), è
subito l’espressione del potenziale A;
55
5.2. DIPOLO OSCILLANTE
parallelo alla corrente ~j. Di conseguenza, assumendo la direzione di ~j come
~ sono:
asse polare ed O come origine, le componenti sferiche di A
Ar (P, t) = −
Aθ (P, t) =
r/c)
1 iω | ~p0 | e−iω(t −
4πǫ0
c2
r
1 iω | p~0 | e−iω(t −
4πǫ0
c2
r
cos ϑ
(5.7)
r/c)
sin θ
(5.8)
Aϕ (P, t) = 0
(5.9)
Da esse è immediato ottenere le componenti sferiche del vettore induzione
magnetica; infatti usando la (2.1) e ricordando le espressioni delle componenti
sferiche del rotore (C.8) si ottiene:
"
∂
1
∂Aθ
Br =
(sin θ Aϕ ) −
r sin θ ∂θ
∂ϕ
"
1 ∂Ar
∂
1
−
(r Aϕ )
Bθ =
r sin θ ∂ϕ
∂r
Bϕ
"
1 ∂
∂Ar
=
(r Aθ ) −
r ∂r
∂θ
= −
1 iω | p~0 |
4πǫ0
c2
#
#
#
= 0
(5.10)
= 0
(5.11)
=
iω
1
−
r
c
e−iω(t −
r
r/c)
sin θ
(5.12)
Per calcolare il potenziale V occorrerebbe considerare la densità di carica
associata al dipolo oscillante. Tuttavia possiamo arrivare più rapidamente al risultato utilizzando la condizione di Lorentz (2.11). Si ha infatti in
coordinate polari (vedi (C.7)):
∂V
∂t
~ =
= −c2 ∇ · A
= −c
2
"
#
1 ∂ 2
1 ∂
1 ∂Aϕ
(5.13)
(r Ar ) +
(sin θAθ ) +
2
r ∂r
r sin θ ∂θ
r sin θ ∂ϕ
ossia, usando le (5.7), (5.8) e (5.9),
∂V
1
e−iω(t −
= −
iω | ~p0 |
∂t
4πǫ0
r
r/c)
cos θ
iω
1
−
r
c
(5.14)
+ V0 (P )
(5.15)
Integrando questa relazione si ottiene:
1
e−iω(t −
V (P, t) =
| p~0 |
4πǫ0
r
r/c)
iω
1
cos θ
−
r
c
56
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
dove V0 (P ) è una funzione del posto indipendente dal tempo. Al limite per
ω tendente a zero il potenziale (5.15) diventa:
V (P, t) =
1 | p~0 | cos θ
+ V0 (P )
4πǫ0
r2
(5.16)
Questa espressione deve coincidere con il potenziale di un dipolo statico di
momento ~p0 ; di conseguenza si verifica immediatamente che V0 (P ) è nullo.
Possiamo ora ricavare dalla (2.4) il campo elettrico; si ha con qualche calcolo:
∂V
∂Ar
−
=
∂r
∂t
2
e−iω(t −
=
| ~p0 | cos θ
4πǫ0
r2
r/c)
1 ∂V
∂Aθ
−
=
r ∂θ
∂t
1
e−iω(t −
=
| ~p0 | sin θ
4πǫ0
r2
r/c)
Er = −
iω
1
−
r
c
(5.17)
Eθ = −
Eϕ = −
"
∂Aϕ
∂V
1
−
= 0
r sin θ ∂ϕ
∂t
iω
1
−
r
c
ω2
− 2 r
c
#
(5.18)
(5.19)
Le equazioni (5.10)–(5.12) e (5.17)–(5.19), di cui solo la parte reale è per
noi significativa, risolvono il problema dell’irraggiamento del dipolo; risulta
~ eB
~ sono tra loro ortogonali.
subito da esse che il campo E
É possibile distinguere, in base al valore della distanza r dal dipolo,
tre zone nelle quali i campi mostrano comportamenti differenti. La prima
zona e’ la cosiddetta zona vicina, corrispondente a punti a distanza r tali
che d << r << λ, ove λ indica la lunghezza d’ onda corrispondente alla
pulsazione ω del moto del dipolo. Per tali punti risulta
1
ω
ω2
>> >> 2 r
r
c
c
ed anche il ritardo rc con cui l’ onda arriva nel punto considerato é trascurabile. In tale zona le espressioni dei campi sono, percio’:
Bϕ ≃ −
e−iωt
iω
|
p
~
|
sin
θ
0
4πǫ0 c2
r2
2 | p~0 |
e−iωt
Er ≃
cos θ
4πǫ0
r3
(5.20)
(5.21)
57
5.2. DIPOLO OSCILLANTE
| p~0 |
e−iωt
Eϕ ≃
sin θ 3
4πǫ0
r
(5.22)
La (5.20) é la stessa espressione che si ricava dalla prima legge di Laplace
sostituendo ad una corrente di intensitá costante I una corrente di intensitá
variabile nel tempo qωe−iωt . Le (5.21) e (5.22) sono le espressioni che si
ottengono dalle corrispondenti relazioni per il dipolo statico, sostituendo ad
un momento di dipolo costante p~ un momento di dipolo variabile nel tempo
p~0 e−iωt . In questa regione, cioé, i campi, a parte il termine e−iωt , hanno un
comportamento di tipo stazionario, per cui la zona vicina viene detta anche
zona quasi–stazionaria.
La seconda zona é la cosiddetta zona intermedia o zona di induzione,
corrispondente a punti a distanza r tali che d << r ∼ λ. In tale zona 1r ∼ ωc
e nelle espressioni delle componenti dei campi sono presenti tutti i termini
delle (5.10)–(5.12) e (5.17)–(5.19).
La terza zona é la cosiddetta zona lontana o zona di radiazione o
asintotica, corrispondente a punti a distanza r tali che d << λ << r per
i quali risulta 1r << ωc . Analogamente a quanto è stato fatto nel paragrafo 4.3 per le onde cilindriche, studiamo le proprietà fisiche della soluzione
(5.10)–(5.12), (5.17)–(5.19) considerandone il comportamento asintotico. A
questo scopo supponendo che r sia grande rispetto a c/ω dalle (5.10)–(5.12)
otteniamo:
Bϕ ≃ −
ω2
e−iω(t −
1
| p~0 | 3 sin θ
4πǫ0
c
r
r/c)
(5.23)
Osservando poi che, per l’ipotesi fatta, si ha:
r
ω2
ω
1
≫
≫
2
c
c
r
(5.24)
le (5.17)–(5.19) danno:
Er = 0
Eθ ≃ −
(5.25)
| ~p0 | ω 2
e−iω(t −
sin
θ
4πǫ0 c2
r
r/c)
(5.26)
Prendendo la parte reale della (5.23) e della (5.26) si ottengono infine le
espressioni asintotiche del campo E.M.:
Bϕ
1
ω2
cos[ω(t − r/c)]
≃ −
| p~0 | 3 sin θ
4πǫ0
c
r
(5.27)
58
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Figura 5.2:
Eθ ≃ −
cos[ω(t − r/c)]
| p~0 | ω 2
sin θ
2
4πǫ0 c
r
(5.28)
~ eB
~ sono ortogonali alla direzione r (vedi figura 5.2),
Risulta dunque che E
~ |=|E
~ | /c.
oltrechè tra di loro e che | B
Essi si propagano sotto forma di onde T EM, Trasversali Elettriche
~ eB
~ sono
e Magnetiche (cosı̀ dette perchè le componenti longitudinali di E
nulle), smorzate con legge iperbolica, la loro ampiezza è massima nel piano
ortogonale all’asse del dipolo e diminuisce fino ad annullarsi quando ci si
avvicina a questo asse. Ponendo ω = 0 nelle (5.17)–(5.19) si ottengono
invece le componenti del campo elettrico statico:
Er =
2 | ~p0 | cos θ
4πǫ0 r 3
(5.29)
Eθ =
| p~0 | sin θ
4πǫ0 r 3
(5.30)
analogamente si vede dalle (5.10)–(5.12) che il campo magnetico statico è
nullo. È da notare che mentre la parte statica del campo diminuisce con la
terza potenza di r, la parte che si propaga è solo inversamente proporzionale
a r. Ne segue che ad una certa distanza dal dipolo, esiste una zona, detta
zona delle onde in cui il campo E.M. si riduce alla sola parte propagativa.
Per dare una idea pittorica della generazione del campo propagativo
del dipolo oscillante, in figura (5.3) vengono riportate le linee del campo elettrico (riga superiore) e del campo magnetico (riga inferiore) in sette istanti
successivi, sei dei quali compresi entro il primo periodo di oscillazione del
sistema di cariche: in questo caso, il sistema di riferimento è stato scelto in
modo che entrambe le cariche risultano muoversi di moto armonico lungo la
congiungente, con la stessa pulsazione ω. Si può osservare come, al ripetersi
59
5.2. DIPOLO OSCILLANTE
Figura 5.3:
del moto periodico delle cariche le linee di campo generate durante i periodi precedenti di allontanino dalla sorgente propagandosi con le proprietà
discusse finora.
Calcoliamo ora il vettore di Poynting associato al campo dato dalle
equazioni (5.27) e (5.28); ricordando la definizione del vettore si ha:
2 4
2
~ = ǫ0 c2 E
~ ×B
~ = | ~p0 | ω sin2 θ cos [ω(t − r/c)] ~ir
S
16π 2 ǫ0 c3
r2
(5.31)
~ sul tempo, è:
L’intensità di radiazione, ossia il valor medio di S
1
I =
T
Z
0
T
2
2 4
~ | dt = | ~p0 | ω sin θ
|S
32π 2 ǫ0 c3 r 2
(5.32)
Questa relazione stabilisce che l’intensità I decresce, come è intuitivo, con
il quadrato della distanza mentre varia come sin2 θ quando ci si allontana
dall’asse del dipolo, come illustrato in figura 5.4. L’energia totale media
irradiata per unità di tempo, ossia la potenza media W irradiata dal dipolo,
può essere facilmente ottenuta integrando la (5.32) su una sfera di raggio r
con centro nel dipolo:
W =
Z
4π
I r 2 dΩ =
60
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Figura 5.4:
=
| p~0 |2 ω 4
32π 2 ǫ0 c3
Z
2π
0
dϕ
Z
0
π
sin3 θ dθ =
| ~p0 |2 ω 4
12πǫ0 c3
(5.33)
Questo risultato può essere espresso in altra forma introducendo l’accelerazione quadratica media am della carica oscillante. Si ha infatti dalla (5.1):
d2 d~
= −d~0 ω 2 cos ωt
dt2
(5.34)
da cui, prendendo il quadrato del modulo, mediando su un periodo e ricordando la (5.4), si ottiene:
a2m =
1 ~ 2 4
| p~0 |2 ω 4
| d0 | ω =
2
2q 2
(5.35)
La (5.33) diventa perciò:
W =
2 1 q 2 a2m
3 4πǫ0 c3
(5.36)
questa espressione, detta equazione di Larmor, è di particolare importanza
perchè, come vedremo in seguito, l’irraggiamento di una carica in movimento
qualsiasi dipende dal modulo dell’accelerazione istantanea proprio attraverso
una relazione della forma (5.36).
5.3. OSCILLAZIONI SMORZATE
5.3
61
Oscillazioni smorzate
Nel precedente paragrafo abbiamo studiato l’irraggiamento del dipolo supponendo costante l’ampiezza di oscillazione d~0 . Questa ipotesi, tuttavia, richiede alcune precisazioni; è evidente infatti che l’emissione di un’onda E.M. fa
diminuire l’energia posseduta dalla carica oscillante e di conseguenza il valore
di d~0 . Ciò, beninteso, a patto che nulla intervenga a compensare l’energia
persa per irraggiamento. Senza considerare le cause dello smorzamento, ci
proponiamo ora di studiare le caratteristiche dell’emissione nell’ipotesi che
d~0 effettivamente decresca a causa dell’irraggiamento.
Stabiliamo, per prima cosa, il bilancio tra l’energia irradiata e l’energia
meccanica H posseduta dalla carica oscillante; quest’ultima, nel punto di
massima elongazione, cioè per d~ = d~0 , coincide con l’energia potenziale della
forza di tipo elastico che determina l’oscillazione del dipolo. Si ha pertanto:
H =
k ~ 2
| d0 |
2
(5.37)
dove k è la costante della forza elastica, la quale è legata alla massa m della
particella oscillante e alla frequenza angolare ω dalla ben nota relazione:
ω2 =
k
m
(5.38)
Mediante la (5.38) e la (5.4) la (5.37) può essere scritta nella forma:
H =
mω 2
| ~p0 |2
2q 2
(5.39)
Nell’ipotesi che lo smorzamento sia piccolo, ossia supponendo che in un tempo
pari al periodo T dell’oscillatore, l’ampiezza d~0 diminuisca di una quantità
trascurabile, si può calcolare il decremento di H eguagliandolo alla potenza
media irradiata. In questo modo, ricordando la (5.33), si ha:
−
dH
1 | ~p0 |2 ω 4
=
dt
12πǫ0
c3
(5.40)
da cui, utilizzando la (5.39):
d | ~p0 |
1 q2ω2
= −
| p~0 |
dt
4πǫ0 3mc3
(5.41)
Ponendo:
3mc3
1
= 4πǫ0 2 2
γ
q ω
(5.42)
62
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
ed integrando, si ottiene dalla (5.41):
| ~p0 | = | ~p0i | e−γt
(5.43)
dove p~0i indica il valore di ~p0 all’istante t = 0 in cui il dipolo inizia ad oscillare.
La (5.3) va pertanto sostituita dalle equazioni:
~p = 0 (t < 0)
~p = ~p0i e−γt e−iωt
(5.44)
(t ≥ 0)
(5.45)
le quali rappresentano una oscillazione smorzata, del tipo di quella indicata
in figura 5.5.
Figura 5.5:
È evidente che è essenziale supporre, come appunto si è fatto nella
(5.44), che per t < 0 il dipolo sia in quiete; diversamente l’equazione (5.45)
fornirebbe, al decrescere di t, dei valori di ~p arbitrariamente grandi, il che
manifestamente è cosa assurda. La costante 1/γ è una quantità, con dimensioni di un tempo, che prende il nome di vita media dell’oscillatore, τ ; essa
rappresenta il tempo durante il quale l’ampiezza di oscillazione si riduce di
un fattore 1/e.
L’ipotesi di un piccolo smorzamento equivale alla condizione:
1
≫ T;
γ
(5.46)
notiamo che 1/γ = τ è dell’ordine di 10−8 s nel caso di un elettrone che oscilli
ed emetta radiazione luminosa per la quale T = 10−15 − 10−16 s.
63
5.3. OSCILLAZIONI SMORZATE
Esaminiamo ora l’effetto della legge del moto (5.44)–(5.45) sulle onde
irradiate dal dipolo. È manifesto che, nell’ipotesi di piccolo smorzamento,
tutto si ridurrà a scrivere delle equazioni simili alla (5.28), in cui però il
momento ~p0 è smorzato con legge esponenziale. A partire dall’istante t = r/c,
in cui l’onda emessa all’istante t = 0 raggiunge i punti situati a distanza r,
il campo elettrico sarà pertanto rappresentato dall’equazione asintotica:
Eθ (P, t) ≃ −
−iω(t −
| p~0i | ω 2
−γ(t−r/c) e
sin
θ
e
4πǫ0 c2
r
r/c)
(t ≥
r
) (5.47)
c
mentre, prima di questo istante:
r
(5.48)
Eθ (P, t) = 0 (t < )
c
Si può dimostrare che, a causa del fattore di smorzamento, la composizione
spettrale dell’onda E.M. risulta alterata; essa, anzichè essere rigorosamente
monocromatica, è costituita da una banda di frequenze con centro in ω. Per
fare ciò consideriamo la variabile t′ = t − r/c ed introduciamo la costante:
1
ω 2 sin θ
= −
| p~0i | 2
4πǫ0
c
r
(0)
Eθ
(5.49)
in questo modo la (5.47) può essere scritta in funzione di t′ nella forma:
(0)
Eθ (P, t′ ) = Eθ
e−(γ
+ iω) t′
(5.50)
Sviluppiamo ora in integrale di Fourier (vedi appendice D):
1
Eθ (P, t′ ) = √
2π
+∞
Z
′ ′
K(ω ′ ) e−iω t dω ′
(5.51)
−∞
in cui K(ω ′ ) è la funzione che rappresenta la composizione spettrale in
questione. Siccome per la (5.48) Eθ è nullo per t′ < 0, si può scrivere:
1
K(ω ′ ) = √
2π
Z
+∞
0
′ ′
Eθ eiω t dt′
(5.52)
ossia, usando la (5.50):
(0)
+∞
E
′
′
e[i(ω − ω) − γ]t dt′
K(ω ) = √θ
2π 0
(0)
E
1
= − √θ
=
′
2π i(ω − ω) − γ
′
Z
i arctan
(0)
Eθ
= √
2π
e
q
ω′ − ω
γ
(ω ′ − ω)2 + γ 2
(5.53)
64
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Sostituendo nella (5.51) il campo propagativo assume la forma:
(0)
Eθ
Eθ (P, t) =
2π
+∞
Z
−∞
h
−i ω ′ (t − rc ) − arctan
e
q
(ω ′
−
ω)2
+
ω′ − ω
γ
γ2
i
dω ′
(5.54)
esso è pertanto costituito da uno spettro continuo di onde con ampiezze di
densità:
(0)
Eθ
′
Λ(ω ) =
q
2π (ω ′ − ω)2 + γ 2
(5.55)
′
il termine arctan ω γ− ω rappresenta invece una costante di fase. Tenendo
~ |=|E
~ | /c, l’intensità associata all’onda di frequenza angolare
conto che | B
ω ′ risulta essere:

(0)
2
ǫ0 c  Eθ 
1
I(ω ′) =
′
2
2π
(ω − ω)2 + γ 2
(5.56)
ponendo:
Im

(0)
2
ǫ0 c  Eθ 
=
2 2πγ
(5.57)
l’espressione (5.56) assume la forma:
I(ω ′) = Im
γ2
(ω ′ − ω)2 + γ 2
(5.58)
La funzione I(ω ′), che prende il nome di funzione lorentziana, è rappresentata
in figura 5.6. Il suo massimo valore Im corrisponde a ω ′ = ω; si ottiene
subito inoltre:
I(ω + γ) =
1
Im
2
(5.59)
per cui la costante γ rappresenta anche la semiampiezza della distribuzione
I(ω ′) a metà altezza massima. In altri termini: il reciproco della vita media
dell’oscillatore è uguale alla semiampiezza γ. Questo risultato può essere
espresso più chiaramente nella forma:
∆ω ∆t =
1
2
(5.60)
dove al posto di γ si è scritto ∆ω e ∆t indica la metà della vita media 1/γ.
5.3. OSCILLAZIONI SMORZATE
65
Figura 5.6:
L’equazione (5.60) assume un particolare significato in elettrodinamica quantistica. Moltiplicandola membro a membro per h̄ e ricordando la
relazione che lega l’energia di un fotone alla sua pulsazione, essa diventa:
∆W ∆t =
h̄
2
(5.61)
dove W è l’energia associata al fotone. L’interpretazione quantistica di questa relazione è la seguente: l’oscillatore irradia fotoni la cui energia è affetta
da una indeterminazione ∆W ; l’istante in cui ciò avviene è contenuto nell’intervallo di tempo 2 ∆t, ossia è affetto a sua volta dall’indeterminazione
temporale ∆t. Il prodotto delle due indeterminazioni è costante e vale h̄2 .
Questo appunto è l’enunciato del principio di indeterminazione di Heisenberg nel caso in cui si voglia studiare la dipendenza dal tempo dell’energia
di una particella.
66
5.4
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Onde E.M. in risonanza
Finora abbiamo trattato i problemi relativi alla propagazione di onde E.M.
in maniera molto astratta, da un punto di vista matematico e rifacendo trattazioni ed argomentazioni di più di un secolo fa. Vediamo ora di trattare
qualche argomento più moderno e soprattutto di valenza applicativa. É superfluo notare che la nostra vita quotidiana è condizionata, praticamente in
ogni istante, dall’uso di strumenti basati sulla ricezione di onde E.M. (radio,
TV, radar, telefoni cellulari, fibre ottiche per telecomunicazioni, ... ). Il
funzionamento di tali strumenti è ottimizzato sfruttando il fenomeno della
risonanza, nell’emissione, nella trasmissione e nella ricezione delle onde E.M..
Descriveremo brevemente e semplicemente alcuni dei principi fisici sui quali
si basano queste tecnologie, incominciando dall’antenna lineare, che è il prototipo di un emettitore di onde E.M. in risonanza, e per il quale possiamo
ancora usare le EqM macroscopiche nel vuoto, senza grosse limitazioni.
5.5
Antenna Lineare
Il presente paragrafo è dedicato allo studio dell’irraggiamento di uno dei più
semplici, ma anche più significativi, tipi di antenna lineare. Consideriamo il
sistema, schematizzato in figura 5.7, formato da due barre metalliche di lunghezza d/2 allineate lungo l’asse z e collegate, per le estremità contigue, ad un
generatore di oscillazioni elettriche funzionante con una frequenza angolare
ω (ad esempio, un generatore di corrente alternata).
Se si trascura lo smorzamento dovuto all’emissione di radiazione e
se l’antenna è sottile, in modo da poter trascurare la propagazione della
corrente in direzione perpendicolare all’ asse z, dopo un transitorio pari ad
alcuni periodi di oscillazione del generatore, l’ antenna diventa sede di un’
onda di corrente lungo l’ asse z, di tipo stazionario.
Facendo riferimento ad una delle due barre metalliche e supponendo,
per semplicità di trattazione, di spostare l’ origine dell’ asse nell’ estremo
libero della barra e che il generatore sia collegato al secondo estremo, in
z = d/2, la corrente che percorre l’ antenna dal generatore verso l’ estremo
libero è rappresentata da un’ onda regressiva:
i1 = I1 sin(ωt + kz)
(5.62)
dove I1 rappresenta l’ ampiezza dell’ onda di corrente del generatore e l’
onda si propaga con velocita’ c, ovvero ω = kc. Sulla superficie terminale
della barretta, in z = d/2, si ha una riflessione totale della corrente, con
uno sfasamento di π radianti. La barretta è dunque percorsa anche da una
67
5.5. ANTENNA LINEARE
Figura 5.7:
seconda corrente, rappresentata da un’ onda progressiva, che si somma a
quella regressiva:
i2 = I2 sin(ωt − kz + π)
(5.63)
Ad ogni istante, dunque, la corrente totale presente nella barretta è data
dalla somma:
i = i1 + i2 = I1 [sin(ωt + kz) + sin(ωt − kz + π)]
(5.64)
ove si è tenuto conto del fatto che l’ ampiezza dell’ onda riflessa è uguale a
quella dell’ onda incidente, come per un passaggio da un mezzo conduttore
ad uno perfettamente isolante. La corrente totale risulta allora (si usino, per
esempio, le formule di prostaferesi):
i = i1 +i2 = 2 I1 [sin(ωt+π/2)∗cos(kz−π/2)] = 2 I1 cos ωt ∗ sin kz(5.65)
In questa espressione è facile riconoscere un’ onda stazionaria che presenta
dei nodi in corrispondenza dei punti di coordinata z = 2n λ/4, con n ≥ 0 e
λ = 2π
c, e dunque anche in corrispondenza dell’ estremo libero, e dei ventri in
ω
corrispondenza dei punti di coordinata z = (2n+ 1) λ/4, con n ≥ 0. In figura
5.8 è riportato il profilo della corrente stazionaria lungo l’ intera antenna,
considerata nel sistema di riferimento di figura 5.7, ad un istante fissato: nel
68
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
caso in cui la lunghezza totale d sia pari ad un multiplo pari o dispari di λ/2
la corrente lungo l’ antenna avrà due nodi in corrispondenza dei due estremi
liberi e un nodo o, rispettivamente, un ventre in corrispondenza del punto
di inserimento del generatore; in tal caso si è in presenza di una antenna in
configurazione risonante. Se, invece, d non è un multiplo intero di λ/2 in
corrispondenza del punto centrale si avrà un valore di corrente non estremale
e l’ antenna opererà in configurazione non risonante. Considerando, invece,
l’ onda di tensione lungo l’ antenna, anche in questo caso si ha la somma
di un’ onda regressiva e di una progressiva, che non presentano, per/ó, uno
sfasamento relativo dovuto alla riflessione sull’ estremo libero:
v = v1 +v2 = 2 V1 [sin(ωt+kz)+sin(ωt−kz)] = 2 V1 sin ωt ∗ cos kz(5.66)
dove l’ ampiezza dell’ onda riflessa e’ ancora uguale a quella dell’ onda incidente. Si vede, pertanto, che le onde di tensione e di corrente, ad ogni
istante, risultano essere sfasate di λ/4 e all’ estremita’ libera della bacchetta
metallica, dove la corrente presenta un nodo, la tensione ha un ventre.
Figura 5.8:
Nell’ ipotesi di antenna con sezione trascurabile, sulla quale la corrente
abbia una distribuzione uniforme, le barre sono sede di una corrente elettrica
69
5.5. ANTENNA LINEARE
la cui densità, ritornando al sistema di riferimento di figura 5.7, può essere
scritta come:
!#
"
I
d
ω
0
−iωt
~j = ~k
|z| −
(5.67)
e
sin
S
c
2
dove S è la sezione delle barre, supposta costante per semplicità, e I0 = 2 I1
è la massima intensità di corrente che le percorre. Tale densità di corrente
è chiaramente simmetrica nelle due parti dell’ antenna. Ci interessa ora
studiare il campo E.M. prodotto dalla corrente che percorre l’antenna, in
punti posti ad una distanza da essa molto grande rispetto alla sua dimensione
lineare d.
Per sviluppare i calcoli utilizziamo il metodo del vettore di Hertz,
~
introdotto nel paragrafo 2.2. Occorre innanzitutto ricavare il vettore Q;
ricordando la (2.21), dalla (5.67) si ottiene:
!#
"
~
d
I
∂Q
ω
0
−iωt
|z| −
(5.68)
= ~k
e
sin
∂t
S
c
2
da cui, integrando:
"
−iωt
ω
~ = ~k I0 ie
Q
sin
S
ω
c
d
|z| −
2
!#
Mediante la (2.52) si ha pertanto:
~
t − rP Q /c)
1 Z Q(Q,
~
dVQ =
Z(P,
t) =
4πǫ0 V
rP Q
"
Z
1 ~kI0 i
e−iω(t−rP Q /c)
ω
=
sin
4πǫ0 Sω V
rP Q
c
(5.69)
(5.70)
d
|z| −
2
!#
dVQ
dove l’integrazione è estesa a tutto il volume occupato dalle sbarre dell’antenna. Avendo supposto la distanza rP Q grande rispetto a d, si può sviluppare
rP Q in serie di Mac Laurin nell’intorno dell’origine, O, e scrivere:
rP Q = rP O +
∇Q rP Q · ~k
O
| Q − O | + ....
~rP O · ~k
z = rP 0 − z cos θ
(5.71)
rP O
dove θ è l’angolo tra la direzione di P − O e l’asse dell’antenna. Inserendo
questa relazione nella (5.71) e trascurando i termini proporzionali alle potenze
~ diventa:
di 1/rP 0 superiori alla prima, l’espressione di Z
≃ rP O +
~
Z(P,
t) ≃
1 ~ iI0 e−iω(t−rP O /c)
k
·
4πǫ0 Sω
rP O
"
!#
Z
ω
d
−i ωc cos θ z
sin
|z| −
dV
e
c
2
V
(5.72)
70
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Tenendo conto che dV = S dz, trasformando l’integrazione sui valori negativi di z in quella sui valori positivi ed esprimendo il seno con gli esponenziali
immaginari, si ottiene con semplici calcoli:
~
Z(P,
t) ≃
=
1 ~ iI0 e−iω(t−rP O /c)
k
4πǫ0
ω
rP O
"
!#
ω
d
sin
|z| −
dz
c
2
Z
+d/2
1 ~ iI0 e−iω(t−rP O /c)
k
4πǫ0
ω
rP O
!#
"
d
ω
z −
dz
sin
c
2
Z
+d/2
cos θ
cos ωd
− cos ωd2c
2c
2icI0 e
1
4πǫ0 ω 2
−iω(t−r/c)
= ~k
r
ω
cos θ z
e−i c
−d/2
0
ω
e−i c
cos θ z
·
ω
+ ei c
sin2 θ
cos θ z
(5.73)
dove al posto di rP O si è scritto semplicemente r. La (5.73) è la richiesta
espressione asintotica del vettore di Hertz.
~ mediante
Per calcolare il campo E.M. cominciamo col valutare ∇ × Z;
la (A.20) si ricava:

1 2icI0 e−iω(t−r/c)
~

∇×Z = ∇
4πǫ0 ω 2
r
cos θ
cos ωd
− cos ωd2c
2c
sin2 θ


× ~k
D’altra parte, utilizzando l’espressione (C.6) del gradiente in coordinate polari e tenendo conto solo dei termini infinitesimi del primo ordine per r tendente
ad infinito, si ha:

∇
2icI0 e
1
4πǫ0 ω 2
−iω(t−r/c)
r
cos θ
cos ωd
− cos ωd2c
2c
sin2 θ


−iω(t−r/c) cos ωd − cos ωd cos θ
2c
2c
~ir  1 2icI0 iω e
2
2
4πǫ0 ω
c
r
sin θ

Essendo
≃

(5.74)

~ir × ~k = −~iϕ sin θ
(5.75)
la (5.74) diventa infine:
1 2I0 e
4πǫ0 ω
−iω(t−r/c)
~ ≃ ~iϕ
∇×Z
r
cos θ
cos ωd
− cos ωd2c
2c
sin θ
·
71
5.5. ANTENNA LINEARE
Applicando la (2.28) possiamo ora dedurre l’espressione asintotica del vettore
induzione magnetica; si ha:
~ =
B
1 ∂
~
∇×Z
c2 ∂t
e
1 1
2iI0
≃ −~iϕ 2
c 4πǫ0
−iω(t−r/c)
r
cos θ
cos ωd
− cos ωd2c
2c
sin θ
(5.76)
~ è differente
Analogamente, applicando la (2.29) e ricordando che il vettore Q
da zero solo dove esiste la distribuzione di corrente, ossia nel volume interno
alle barre dell’antenna, si ottiene:
−iω(t−r/c) cos ωd − cos ωd cos θ
2c
2c
~ = ∇×∇×Z
~ = ∇× 1 2I0 e
E
4πǫ0 ω
r
sin θ

Tenendo conto che:
~ir × ~iϕ = −~iθ

 ~iϕ
(5.77)
(5.78)
e considerando sempre solo termini infinitesimi del primo ordine per r ten~ risulta essere pertanto:
dente ad infinito, l’espressione asintotica di E
−iω(t−r/c) cos ωd − cos ωd cos θ
1
2I
e
0
2c
2c
~
E = ∇
4πǫ0 ω
r
sin θ


1 2iI0 e
≃ −~iθ 
4πǫ0 c
−iω(t−r/c)
r


× ~iϕ
cos θ
cos ωd
− cos ωd2c
2c
sin θ

(5.79)

Basta ora prendere la parte reale delle (5.76) e (5.79) per ottenere le espressioni asintotiche finali dei campi:
~iϕ (5.80)
~iθ (5.81)
ωd cos θ
ωd
1 2I0 sin[ω(t − r/c)] cos 2c − cos 2c
~
B(P, t) ≃ −
4πǫ0 c2
r
sin θ
ωd
ωd cos θ
1 2I0 sin[ω(t − r/c)] cos 2c − cos 2c
~
E(P, t) ≃ −
4πǫ0 c
r
sin θ
Dalle equazioni ottenute si deduce che il campo si propaga sotto forma di
~ eB
~ sono ortogonali tra di loro, diminuiscono con
onde trasversali, i campi E
~
~ |. La dipendenza da θ, però, è alquanto
la distanza come 1/r e | B |= 1/c | E
complicata e contiene, come parametro la lunghezza dell’antenna.
72
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Per completare questi risultati non resta che scrivere l’espressione del
vettore di Poynting; ricordando la (3.10) e tenendo conto che i versori ~ir , ~iθ
e ~iϕ formano una terna destrorsa, essa è:
~ =
S
I02
4π 2 ǫ0 c
2

sin [ω(t − r/c)] 
r2
cos θ
cos ωd
− cos ωd2c
2c
sin θ
2

~ir
(5.82)
Ne segue che l’intensità di radiazione vale:

ωd cos θ
ωd
1 ZT ~
1
I02  cos 2c − cos 2c
I =
| S | dt =
T 0
4π 2 ǫ0 c 2r 2
sin θ
2

(5.83)
Questa equazione richiede un’analisi accurata per stabilire, in relazione alla
lunghezza dell’antenna, la dipendenza da θ dell’energia irradiata. Osserviamo
innanzitutto che
πd
ωd
=
2c
λ
(5.84)
Quando la lunghezza dell’antenna è piccola rispetto alla lunghezza d’onda λ,
sviluppando i coseni in serie di potenze, la (5.83) diventa:
1
I02
I =
4π 2 ǫ0 c 2r 2
ω 2 d2 1
8c2
1
=
32π 2 ǫ0 c3
!2
− cos2 θ
=
sin θ
!
2
I02 d4
4 sin θ
ω
16c2
r2
(5.85)
Ne segue, confrontando con la (5.32), che l’irraggiamento dell’antenna coincide con quello di un dipolo oscillante per il quale si abbia:
I0 d2
| ~p0 | =
4c
(5.86)
Particolarmente importante è il caso in cui la lunghezza dell’antenna
d è uguale ad un numero intero di semilunghezze d’onda, cioè:
d = n
λ
2
(n = 1, 2, 3.....)
(5.87)
Tenendo conto della (5.84) e sostituendo nella (5.83) si ottiene per n pari:
1
I02 (1 ± cos(n/2π cos θ))2
I =
4π 2 ǫ0 c 2r 2
sin2 θ
(5.88)
73
5.5. ANTENNA LINEARE
in cui i due segni si riferiscono al caso in cui n/2, a sua volta, è rispettivamente
pari o dispari. Per n pari, la (5.88) può quindi essere messa nella forma:
I =
I =
1
π 2 ǫ0 c
I02
2r 2
1
I02
π 2 ǫ0 c 2r 2
cos4
n
π cos θ
4
2
sin θ
4 n
sin 4 π cos θ
sin2 θ
(n = 2, 6, 10, .......)
(n = 4, 8, 12, .......)
(5.89)
Per n dispari, invece:
I =
1
4π 2 ǫ0 c
I02
2r 2
cos2
n
π cos θ
2
2
sin θ
(5.90)
In figura 5.9 sono riportati, per vari valori di n, i grafici polari della
dipendenza angolare di I; da essi appare evidente che al crescere di n l’emissione diventa via via più direzionale e si allontana dal piano ortogonale
all’antenna.
Consideriamo ora, limitatamente al caso in cui n = 1, la potenza
totale irradiata da un’antenna. Analogamente a quanto fatto per il dipolo,
occorre calcolare l’integrale:
Z
Z π cos2 π cos θ
I02 2π
1
2
dθ
dϕ
W =
I r 2 dΩ =
2
4π ǫ0 c 2 0
sin θ
0
4π
Z π cos2 π cos θ
1
I02
2
2
=
I
= 2, 44
(5.91)
4πǫ0 c 0 0
sin θ
8πǫ0 c
Z
È da notare che per d = λ, cioè nel caso n = 2, vale una relazione analoga,
salvo che il coefficiente di proporzionalità passa da 2.44 a 6.72. Vicerversa,
per d = 10−2 λ, nel qual caso l’antenna è approssimabile con un dipolo
oscillante e la potenza può essere ottenuta sostituendo la (5.86) nella (5.33),
si ha:
W =
2
I02 (10−2 2π)4
ω4
I02 d4
−7 I0
=
=
6.49
10
16c2 12πǫ0 c3
8πǫ0 c
24
8πǫ0 c
(5.92)
avendo usato la relazione ωλ = 2πc. Se ne conclude che, a parità di I0
l’efficienza di irraggiamento di una antenna lineare in risonanza è di gran
lunga maggiore di quella di un dipolo.
74
CAPITOLO 5. IRRAGGIAMENTO DI ONDE E.M.
Figura 5.9:
Capitolo 6
Guide d’onda
6.1
EqM per la guida d’onda
Abbiamo visto che usando in maniera appropriata un’antenna lineare è possibile ottenere una buona direzionalità nella emissione delle onde E.M.. Emissioni ancora più direzionali potrebbero essere ottenute con configurazioni geometriche dell’antenna più complicate o con sistemi composti da piu’ antenne
lineari opportunamente spaziate.
Viene da chiedersi se non sia possibile convogliare tutta l’energia E.M.
emessa da una sorgente in un’unica direzione. Il problema che si vuole affrontare, in particolare, è quello di una propagazione direzionale e confinata
di un’ onda E.M.. Il metodo più utile per confinare i campi propagativi dell’
onda è quello di realizzare una struttura guidante con pareti metalliche, un
tubo metallico: in tale modo, infatti, si sfrutta il fatto che i campi propagativi si attenuano entro un conduttore secondo una legge esponenziale del
tipo:
~
~ = 0)|e−x/δ
|E(x)|
= |E(x
(6.1)
~
dove x indica la profondità entro il materiale conduttore, E(x
= 0) è il
~
campo elettrico dell’ onda all’ ingresso del materiale conduttore, E(x)
è il
campo elettrico dell’ onda alla profondità x e δ rappresenta lo spessore di
conduttore dopo il quale il campo si è attenuato di un fattore e; tale spessore
viene indicato con il termine profondità di pelle ed il suo valore dipende sia
dalle caratteristiche del conduttore, ovvero dalla sua conduttività σ, sia dalla
frequenza dell’ onda e.m., secondo la relazione:
δ=
s
2ǫ0 c2
σω
(6.2)
75
76
CAPITOLO 6. GUIDE D’ONDA
La profondità di pelle per un buon conduttore, quale è il rame, assume valori
di ∼ 6 · 10−10 m per frequenze di ∼ 5 · 1015 Hz, cioè nell’ ultravioletto,
di ∼ 6 · 10−9 m per frequenze di ∼ 5 · 1013 Hz, cioè nell’ infrarosso, di
∼ 7 · 10−7 m per frequenze di ∼ 3 · 1011 Hz, cioè nella regione delle microonde
e di ∼ 6 · 10−5 m per frequenze di ∼ 3 · 105 Hz, cioè nella regione delle onde
lunghe.
Utilizzando una parete metallica per definire il volume entro il quale
far propagare le onde E.M. si ottiene l’ azione guidante voluta, dal momento
che una qualunque componente dell’ onda che si propaghi perpendicolarmente alla superficie metallica si smorzerà rapidamente entro di essa e la
sola componente parallela all’ asse della guida sopravviverà, imponendo cosı̀
di fatto una direzione di propagazione. Un altro effetto della azione guidante di una struttura metallica consiste nel fatto che i campi che si trovano
all’ interno di essa rimangono ivi contenuti, assicurando il confinamento dell’
energia associata all’ onda ed impedendo, altresı̀, che campi esterni vengano
a interferire con quelli da trasmettere.
Tenendo conto che le dimensioni trasversali dei tubi metallici sono
dell’ordine di grandezza della lunghezza d’onda dell’onda E.M. che si vuole
trasmettere, per motivi pratici parleremo di tubi delle dimensioni di qualche
cm, e di conseguenza di onde centimetriche. L’interesse ad avere sorgenti
intense di onde E.M. con lunghezza d’onda dell’ordine del centimetro fu stimolato soprattutto dalla richiesta di localizzare oggetti in movimento (aerei)
a distanza, tramite riflessione di onde E.M. di lunghezza d’onda inferiore alla dimensione dell’oggetto. Se si fossero utilizzate onde E.M. di lunghezza
d’onda maggiore (decina di metri), l’intensità delle onde riflesse sarebbe stata
trascurabile.
Studiamo quindi il problema della propagazione di un’onda E.M. in
un tubo metallico rettilineo e di sezione costante, con pareti di spessore
trascurabile e conducibilità infinita. Vedremo poi come correggere per queste
ipotesi non fisiche. Supponiamo che all’interno del tubo sia contenuto un
mezzo materiale isotropo non dispersivo, con costante dielettrica ǫ = ǫr ǫ0 ,
dove ǫr è la suscettività elettrica relativa, e con permeabilità magnetica µ =
µr µ0 , dove µr è la suscettività magnetica relativa. Utilizzeremo le EqM
macroscopiche in un mezzo materiale:
~ = ρlibere
∇·D
(6.3)
~ = 0
∇·B
(6.4)
~
~ = − ∂B
∇×E
∂t
(6.5)
6.1. EQM PER LA GUIDA D’ONDA
~
~ = ~jcond + ∂ D
∇×H
∂t
77
(6.6)
~ e campo main cui sono stati introdotti i vettori spostamento elettrico D
~ per tenere conto degli effetti dovuti al mezzo materiale, lasciando
gnetico H
inalterata la struttura delle sorgenti (ρlibere e ~jcond ). Nel caso semplice che
trattiamo porremo:
~ = ǫr ǫ0 E
~ = ǫE
~
D
(6.7)
~ = µr µ0 H
~ = µH
~
B
(6.8)
~ = ρ ~j
E
(6.9)
dove ρ è la resistività specifica del mezzo materiale.
Vogliamo studiare, in particolare, se è possibile propagare un’onda
E.M. lungo l’asse della guida senza perdite. Si vede subito che questa condi~ che si propaga sia, in ogni istante
zione fisica impone che il campo elettrico E
ed in ogni punto del contorno, normale alla superficie, cioè:
~ × ~n = 0
E
(6.10)
Questa condizione assicura che non ci sono perdite di potenza per effetto
Joule sulle pareti. Dalla (6.9) si vede che la condizione (6.10) ammette solo
~j ortogonale in ogni punto alla superficie del contorno della guida, ipotizzata
per ora come una pura superficie geometrica, di “spessore” nullo.
Supponiamo di propagare onde E.M. armoniche rispetto al tempo, che
variano cioè in ogni punto rispetto al tempo come eikct , dove k è il numero
d’onda nel vuoto, cioè ω = kc. Consideriamo un sistema di assi cartesiani
ortogonali in cui l’asse z coincida con l’asse della guida e consideriamo una
~ eB
~ per t = 0 e z = 0 (cioè la sezione della guida
configurazione dei campi E
~
~ 0 . Sarà:
a z = 0), che chiameremo E0 e B
~ 0 (x, y) = E0x (x, y)~i + E0y (x, y)~j + E0z (x, y)~k
E
(6.11)
~ 0 (x, y) = B0x (x, y)~i + B0y (x, y)~j + B0z (x, y)~k
B
(6.12)
e
Questi vettori rappresentano i campi che entrano attraverso la prima faccia
della struttura guidante e che si vogliono far propagare, senza perdite, lungo
la guida.
78
CAPITOLO 6. GUIDE D’ONDA
Chiediamoci se è possibile propagare lungo l’asse z le configurazioni
(6.11) e (6.12) con una velocità di fase vf . Poniamo cioè per il numero d’
onda che caratterizza la propagazione entro la guida:
α =
ω
kc
=
vf
vf
(6.13)
Si precisa che vf è diverso da c, ovviamente, in quanto non siamo nel vuoto,
√
ma sarà anche diverso, come vedremo, da c/ ǫr µr , cioè la velocità di propagazione nel mezzo materiale infinito, non limitato dalle pareti conduttrici.
~ eB
~ saranno allora descritti, in ogni punto P interno alla
I campi E
guida e ad ogni istante t, dalle equazioni:
~
E(x,
y, z, t) = E0x (x, y)~i + E0y (x, y)~j + E0z (x, y)~k ei(kct
− αz)
~
B(x,
y, z, t) = B0x (x, y)~i + B0y (x, y)~j + B0z (x, y)~k ei(kct
− αz)
h
h
i
i
(6.14)
(6.15)
Data la (6.14), la condizione (6.10) diventa:
~ 0 × ~n = 0
E
(6.16)
Con le posizioni (6.14) e (6.15), le (6.5)– (6.6) in cui si ponga ~jcond = 0, e si
utilizzino le (6.7), (6.8), diventano:
k
∂B0z
+ iαB0y = iǫr µr E0x
∂y
c
∂B0z
k
−iαB0x −
= iǫr µr E0y
∂x
c
∂B0x
k
∂B0y
−
= iǫr µr E0z
∂x
∂y
c
∂E0z
+ iαE0y = −ikcB0x
∂y
∂E0z
−iαE0x −
= −ikcB0y
∂x
∂E0x
∂E0y
−
= −ikcB0z
∂x
∂y
e le (6.3)–(6.4), in cui si ponga ρlibere = 0:
(6.17)
(6.18)
79
6.1. EQM PER LA GUIDA D’ONDA
∂E0x
∂E0y
+
− iαE0z = 0
∂x
∂y
∂B0x
∂B0y
+
− iαB0z = 0
∂x
∂y
(6.19)
Di queste ultime possiamo non tenere conto poichè sono una conseguenza delle (6.17) e (6.18). Risolvendo le prime due delle (6.17) e (6.18)
rispetto a E0x , E0y , B0x , B0y , si ottiene:
"
#
∂E0z
i
∂B0z
E0x = − 2 α
+ kc
λ
∂x
∂y
#
"
∂E0z
∂B0z
i
− kc
E0y = − 2 α
λ
∂y
∂x
#
"
i
k ∂E0z
∂B0z
B0x = 2 ǫr µr
− α
λ
c ∂y
∂x
#
"
k ∂E0z
∂B0z
i
+ α
B0y = − 2 ǫr µr
λ
c ∂x
∂y
(6.20)
dove per semplicità si è posto:
λ2 = ǫr µr k 2 − α2
(6.21)
supponendo λ2 6= 0.
Sostituendo le (6.20) nell’ultima equazione delle (6.17) e (6.18), si ha
che queste risultano soddisfatte se:
∂ 2 E0z
∂ 2 E0z
+
+ λ2 E0z = 0
∂x2
∂y 2
(6.22)
∂ 2 B0z
∂ 2 B0z
+
+ λ2 B0z = 0
∂x2
∂y 2
(6.23)
Consideriamo ora la condizione al contorno (6.16). Con riferimento alla figura
6.1, se indichiamo con ~τ il versore tangente al contorno della guida nel punto
(x, y, 0) e con ~n il versore normale, si ha evidentemente ~n = ~k × ~τ .
Ricordando l’espressione del doppio prodotto esterno (A.5) avremo:
~ 0 × ~n = E
~ 0 × (~k × ~τ ) = (E
~ 0 · ~τ )~k − (E
~ 0 · ~k)~τ
E
80
CAPITOLO 6. GUIDE D’ONDA
Figura 6.1:
e quindi dovremo avere, separatamente:
~ 0 · ~k) = E0z = 0
(E
~ 0 · ~τ ) = 0
(E
sul contorno
sul contorno
(6.24)
(6.25)
Indicando con dx/ds e dy/ds i coseni direttori della tangente al contorno s,
la condizione (6.25) equivale a:
E0x
dx
dy
+ E0y
= 0
ds
ds
(6.26)
Sostituendo nella (6.26) le prime due delle (6.20) in cui si sia posto E0z = 0,
ricaviamo:
∂B0z dy
∂B0z dx
kc
−
∂x ds
∂y ds
!
= 0
(6.27)
Ricordando che i coseni direttori della normale ~n al contorno s sono rispetdy
dx
tivamente dn
= dy
e dn
= − dx
, la condizione al contorno (6.26) diventa:
ds
ds
dB0z
= 0
dn
sul contorno
(6.28)
Da un punto di vista fisico il fatto che l’unica condizione iniziale (6.16) si
trasformi nelle due condizioni (6.24) e (6.28) corrisponde al fatto che il campo
elettrico totale è costituito da due componenti, una di tipo “elettrostatico”
ed una di tipo “indotto”.
Il problema della propagazione di onde E.M. entro un tubo cilindrico
riempito con un mezzo dielettrico omogeneo è dunque ridotto all’integrazione
delle equazioni differenziali (6.22) e (6.23), con le rispettive condizioni al
contorno (6.24) e (6.28). Ricavate E0z e B0z , le (6.20) forniscono le altre
~ eB
~ e le condizioni al contorno risultano soddisfatte.
componenti di E
6.1. EQM PER LA GUIDA D’ONDA
81
Fra le soluzioni del sistema considerato sono particolarmente importanti quelle in cui è nulla la componente assiale B0z del campo magnetico,
oppure quelle in cui è nulla la componente assiale E0z del campo elettrico.
Le prime sono dette onde di tipo elettrico o trasversali magnetiche (T.M.);
le seconde sono dette onde di tipo magnetico o trasversali elettriche (T.E.).
Si fa notare che, secondo questa terminologia, le onde E.M. che si propagano nello spazio indefinito, privo di sorgenti, sarebbero trasversali elettriche e
magnetiche (T.E.M.).
Per le onde di tipo elettrico il problema si riduce a determinare la
componente assiale E0z del campo elettrico soddisfacente alla (6.22) e alla
condizione al contorno (6.24). Dopo ciò, le altre componenti del campo
saranno date da:
iα ∂E0z
iα ∂E0z
E
=
−
0y
λ2 ∂x
λ2 ∂y
k ∂E0z
i
k ∂E0z
i
B0y = − 2 ǫr µr
= 2 ǫr µr
λ
c ∂y
λ
c ∂x
E0x = −
B0x
(6.29)
Le onde T.M. vengono generate da conduttori penetranti in una estremità
della guida in modo da simulare un dipolo elettrico oscillante parallelo all’
asse z di propagazione.
Per le onde di tipo magnetico il problema si riduce, invece, a determinare la componente assiale B0z del campo magnetico soddisfacente alla
(6.23) con la condizione al contorno (6.28). In tal caso le altre componenti
del campo saranno date da:
ikc ∂B0z
λ2 ∂y
iα ∂B0z
= − 2
λ ∂x
ikc ∂B0z
λ2 ∂x
iα ∂B0z
= − 2
λ ∂y
E0x = −
E0y =
B0x
B0y
(6.30)
Le onde T.E. vengono generate facendo penetrare nella guida, attraverso
una sua estremità, dei conduttori simulanti un dipolo magnetico oscillante
parallelo all’ asse z di propagazione.
I vari casi di onde T.M. e T.E. (più l’ onda T.E.M., qualora esistente,
cosa non vera nel caso particolare delle guide d’ onda) costituiscono un insieme di campi completo per la descrizione di una perturbazione E.M. qualsiasi
entro una guida o una cavità.
Le equazioni (6.22) e (6.23) con le relative condizioni al contorno (6.24)
e (6.28) sono una vecchia conoscenza della Fisica Matematica. Se consideriamo una membrana elastica piana con l’orlo fisso (un tamburo) ed indichiamo
con ~z(x, y) lo spostamento lungo la normale al piano di un punto qualsiasi della membrana, otterremo che la membrana vibrerà secondo l’equazione
82
CAPITOLO 6. GUIDE D’ONDA
(6.22), con z al posto di E0z , e la condizione al contorno z = 0. Se volessimo,
invece, studiare le vibrazioni di una membrana con il bordo libero, ma vincolato a spostarsi solo perpendicolarmente al piano della membrana (i piatti
di una batteria musicale), otterremmo l’equazione (6.23) con z al posto di
B0z con la condizione al contorno (6.28).
Si sapeva quindi che ambedue le equazioni ammettevano soluzioni non
nulle soltanto per valori discreti del parametro λ2 , detti autovalori, dipendenti
dalla forma del contorno s della sezione del tubo. Le soluzioni corrispondenti
ad un dato autovalore si chiamano autofunzioni. Si può dimostrare che λ2 è
un numero reale e positivo; dalla (6.21), ricordando la (6.13), si ha:
α2 =
k 2 c2
= ǫr µr k 2 − λ2
vf2
(6.31)
da cui risulta che vf2 è reale. Però, affinchè in corrispondenza dell’autovalore
λ2 si abbia un’onda non smorzata, deve essere α, e quindi anche vf , reale.
Ciò richiede che sia ǫr µr k 2 − λ2 ≥ 0, e quindi:
k ≥ √
λ
ǫr µr
(6.32)
la quale mostra che esiste un valore minimo di k, cioè della frequenza ν =
kc/(2π), al di sotto della quale nessuna propagazione è più possibile nella
guida. Se λ20 è il più piccolo degli autovalori della (6.22) o (6.23), nel tubo
si possono propagare soltanto onde di frequenza ν superiore, o tutto al più
eguale, alla frequenza νc , che diremo critica, espressa dalla relazione:
νc =
λ0 c
√
2π ǫr µr
(6.33)
Ogni modo di propagazione, identificato da un autovalore λ, avrà poi una
frequenza di taglio, definita da una relazione analoga alla (6.33) ove a λ0
si sostituisca il corrispondente valore di λ, al di sotto della quale il modo
non può propagarsi nel tubo senza smorzarsi, in quanto α diventa complesso.
L’andamento di α, ovvero della corrispondente quantità normalizzata all’
unità per ν → ∞, in funzione della frequenza è indicato qualitativamente
nella figura 6.2, ove sono rappresentati solamente i primi cinque generici modi
di propagazione e le relative frequenze di taglio sono indicate con νi (i=0,
..., 4). Si può riconoscere che per ogni frequenza assegnata, maggiore della
frequenza critica, c’é solo un numero finito di modi che si possono propagare,
indicati in figura dai punti sulle rette verticali di equazione ν = cost disegnate
per due generici valori di ν diversi da νi .
6.1. EQM PER LA GUIDA D’ONDA
83
Figura 6.2:
Dalla (6.31), per vf reale, si ricava ancora:
c
c
kc
1
q
> √
= √
(6.34)
2
2
2
λ
ǫr µr 1 −
ǫr µr
ǫr µr k − λ
2
ǫr µr k
√
dalla quale risulta che variando k dal valore λ/ ǫr µr ad ∞, la vf , sempre
√
√
decrescendo, varia da +∞ al valore c/ ǫr µr . Ora c/ ǫr µr è la velocità di
propagazione in un mezzo dielettrico identico a quello contenuto nel tubo e
che riempia tutto lo spazio. Ne segue che la velocità di propagazione delle
onde nel tubo è superiore a quella delle onde libere (non guidate) in un
dielettrico identico a quello contenuto nel tubo stesso e che riempia tutto lo
spazio. In particolare, se il dielettrico nel tubo è il vuoto, allora detta velocità
supera la velocità della luce nel vuoto. Questo risultato non contraddice la
teoria della relatività poichè si tratta di velocità di propagazione della fase,
che è una grandezza geometrica, mentre nella teoria della relatività si intende
la velocità di propagazione di un segnale fisico, quindi di una velocità di
gruppo.
Fissato un autovalore di λ, ad ogni valore di k corrisponde un valore
di α, e quindi un valore della velocità di propagazione di fase vf dato dalla
(6.34). D’altra parte è impossibile realizzare fisicamente un generatore con k
esattamente definito, ma sarà più realistico parlare di un intervallo (k, k+dk),
in corrispondenza al quale avremo un intervallo di valori di α, (α, α+dα), che
si può scrivere anche come (α, α+ dα
dk). Consideriamo ora la sovrapposizione
dk
delle onde appartenenti al piccolo intervallo (k, k + dk). Questo insieme di
onde è detto gruppo di onde, e la quantità vg , definita dalla relazione:
vf = √
vg = c
dk
dα
(6.35)
84
CAPITOLO 6. GUIDE D’ONDA
è detta velocità di gruppo. Ora risulta:
dk
α
=
dα
ǫr µr k
(6.36)
e quindi:
vg
cα
c
=
= √
ǫr µr k
ǫr µr
s
1 −
c
λ2
< √
≤ c
2
ǫr µr k
ǫr µr
(6.37)
che mostra che la velocità di gruppo è minore della velocità della luce. Si ha
inoltre che vf e vg sono legate dalla relazione:
vg vf =
6.2
6.2.1
c2
ǫr µr
(6.38)
Esempi di propagazione in guide d’onda
con contorno definito
Guida d’onda a sezione rettangolare
Il caso più semplice che si può presentare è quello di una guida d’onda a
sezione rettangolare i cui lati indichiamo con a e b. Assumeremo uno dei
vertici del rettangolo sezione come origine degli assi, con gli assi x e y diretti
rispettivamente secondo i lati di lunghezza a e b, come indicato in figura 6.3.
Le equazioni (6.22) e (6.23) sono dello stesso tipo di quella risolta per la pro-
Figura 6.3:
pagazione di onde libere in coordinate cartesiane (vedi paragrafo 4.2.1 ), anzi
più semplici in quanto in due dimensioni (x, y) e con l’unica differenza che
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO85
abbiamo indicato con λ2 (anzichè con ω 2 /c2 ) la costante reale. Procedendo
esattamente allo stesso modo col criterio della separazione delle variabili e
passando direttamente all’espressione con funzioni trigonometriche, si trova
facilmente che, per onde di tipo elettrico (B0z =0) la soluzione sarà:
E0z = (A cos px + B sin px) (C cos qy + D sin qy)
(6.39)
con A, B, C, D costanti per ora arbitrarie, con dimensione di un campo
elettrico, e con
p2 + q 2 = λ 2
(6.40)
Rispetto alle onde libere le cose cambiano ora. Mentre nel caso della
(4.13) non c’erano condizioni al contorno da rispettare, e quindi tutti i valori di ω erano permessi, il soddisfacimento della (6.24) sul contorno cambia
radicalmente la situazione. Dobbiamo avere:
per x = 0 ed x = a, y arbitrario
E0z = 0
(6.41)
per y = 0 ed y = b, x arbitrario
ne segue che deve essere A = 0, C = 0, ed inoltre pa = mπ, qb = nπ, da cui
p = mπ/a, q = nπ/b, con m, n numeri interi. Si ha dunque:
mπ
nπ
E0z = C1 sin
x sin
y
(6.42)
a
b
con C1 costante (complessa) arbitraria con dimensione di un campo elettrico.
Ricordando la (6.40) si deducono per λ2 gli autovalori:
λ2mn = π 2
m2
n2
+
a2
b2
!
(6.43)
In figura 6.4 è riportato, in vista tridimensionale, l’insieme degli autovalori
λ2mn per m=0, ... 10 e n=0, ... 10, avendo supposto a = 10 unita’, b = 5
unita’.
′
Dalle (6.29) e scrivendo λ2 C1 al posto di C1 , abbiamo in conclusione
le seguenti soluzioni di tipo elettrico (T.M.):
mπ
nπ
mπ
′
cos
x sin
y
E0x = −iC1 αmn
a
a
b
nπ
mπ
nπ
′
E0y = −iC1 αmn
sin
x cos
y
b
a
b
nπ
mπ
′
x sin
y
E0z = C1 λ2mn sin
a
b
k nπ
mπ
nπ
′
B0x = iC1 ǫr µr
sin
x cos
y
c b
a
b
mπ
nπ
k mπ
′
cos
x sin
y
B0y = −iC1 ǫr µr
c a
a
b
B0z = 0
(6.44)
86
CAPITOLO 6. GUIDE D’ONDA
Figura 6.4:
ove, in virtù della (6.31) è:
2
αmn
= ǫr µr k 2 − λ2mn ,
αmn =
q
ǫr µr k 2 − λ2mn
(6.45)
Dalle prime due delle (6.44) si riconosce che è soddisfatta la condizione al
contorno (6.25) sulle componenti tangenziali del campo elettrico. La presenza
dell’ unità immaginaria nella espressione di alcune componenti sta ad indicare
una differenza di fase spaziale (o temporale) di π/2 tra tali componenti ed
E0z .
Considerando le espressioni (6.44) delle componenti dei campi dell’
onda T.M. si possono fare alcune osservazioni. Si può notare innanzi tutto
che per m = 0 e n = 0 anche E0z = 0 e tutte le componenti trasversali si
annullano, ovvero che i valori piu’ piccoli di m e n per un’ onda T.M. devono
essere entrambi maggiori di zero.
Una seconda osservazione riguarda l’ orientazione relativa dei vettori
~
~
~0 e B
~ 0 . Come è facile verificare, il prodotto
E e B, ovvero dei vettori E
~
~
~
~
scalare E · B = E0 · B0 = 0, cosa che indica come entro la guida sia possibile
propagare, lungo l’ asse della stessa e senza perdite, un campo incidente con
vettore induzione magnetica perpendicolare sia alla direzione di propagazione
che al vettore campo elettrico, mentre quest’ ultimo non è più perpendicolare
alla direzione di propagazione. Entro la guida i vettori: vettore d’ onda α~k,
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO87
~ eB
~ non formano più una terna destrorsa, come, invece avviene sia nello
E
spazio libero che in un mezzo materiale infinito.
Con semplici calcoli è anche immediato verificare che per i campi dell’
onda T.M. non vale più una semplice relazione tra i moduli dei vettori, quale
~ = c|B|
~ nel caso dello spazio vuoto o |E|
~ = c/√ǫr µr |B|
~ nel caso di un
|E|
mezzo materiale.
Per terminare queste considerazioni sulle componenti dei campi di un’
onda T.M., se si considera l’ espressione del vettore di Poynting entro la guida
si ottiene:
~ = ǫc2 E
~ ×B
~ = ǫc2 E
~0 × B
~ 0 e2i(kct−αz)
S
k
iC1,2 λ2mn ǫr µr
(6.46)
!
mπ
mπ
mπ
nπ
sin
x cos
x sin2 y +
c a
a
a
b
!
mπ
nπ
nπ
nπ
k
,2
2
2
sin
x sin y cos y +
+ ~j iC1 λmn ǫr µr
c b
a
b
b
k
− ~k C1,2 αmn ǫr µr
c#
"
2
mπ 2
nπ
nπ
mπ
nπ
mπ
x sin2 y +
x cos2 y
cos2
sin2
a
a
b
b
a
b
~0 × B
~ 0 = ~i
E
Le componenti trasversali del vettore di Poynting sono immaginarie pure e
non danno contributo al flusso di energia mediato sul tempo; la componente
~ invece, fornisce il valor medio della densità di flusso di potenza
assiale di S,
lungo la guida. Le componenti trasversali, inoltre, si annullano sul bordo, in
virtù delle condizioni al contorno, assicurando il confinamento dell’ energia
all’ interno della guida.
In figura 6.5 sono riportate le dipendenze delle tre componenti di
~ 0 e delle due non nulle di B
~ 0 da x e y separatamente: le tre curve si
E
riferiscono a m=1, 2, 3 e n=1, 2, 3 rispettivamente e fanno riferimento a
valori delle dimensioni dei lati del rettangolo sezione a = 10 unita’, b = 5
unita’. Come è già stato osservato, le componenti trasversali soddisfano la
condizione sulla componente tangenziale del campo elettico sul bordo della
sezione della guida.
In figura 6.6 sono riportati i grafici bidimensionali delle tre componenti
~
di E0 per m=1, n=1, nell’ipotesi a=10 unità e b=5 unità.
In figura 6.7 è riportato l’ andamento sulla sezione della guida della
componente longitudinale del vettore di Poynting per m=1 e n=1, m=1 e
n=2 e per m=2 e n=1 nell’ipotesi a=10 unità e b=5 unità. Si può osservare
88
CAPITOLO 6. GUIDE D’ONDA
come la distribuzione dell’ energia sulla sezione non sia uniforme, ma tenda
a presentare dei massimi locali, la cui posizione dipende dai valori di m e n:
i modi T.M. che si propagano nella guida distribuiscono, cioè, la loro energia
in modo da occupare spazialmente in maniera diversa la guida.
In figura 6.8 è riportato l’ andamento sulla sezione della guida delle tre
componenti del vettore di Poynting per m=1 e n=1, nell’ipotesi a=10 unità
e b=5 unità. Si può osservare come il flusso di energia secondo le direzioni
trasversali x e y risulti essere in parte positivo ed in parte negativo, in modo
tale che il suo valore netto sulla sezione, puntuale o mediato sul tempo,
risulta nullo. Come già accennato, le componenti trasversali del vettore di
Poynting non contribuiscono al flusso netto di energia E.M. nella guida: al
più, nel caso di un modo o di una combinazione lineare di modi con campi
longitudinali complessi si può avere un flusso di energia medio trasversale.
Tuttavia, siccome si tratta di un flusso circolatorio, esso costituisce in realtà
solo energia immagazzinata (si vedano più oltre le cavità risonanti) e non ha
in pratica una grande importanza.
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO89
Figura 6.5:
90
CAPITOLO 6. GUIDE D’ONDA
Figura 6.6:
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO91
Figura 6.7:
92
CAPITOLO 6. GUIDE D’ONDA
Figura 6.8:
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO93
Per avere soluzioni di tipo magnetico (T.E.), dobbiamo porre E0z = 0
e possiamo sempre scrivere B0z , in analogia alla (6.39), come:
B0z = (A cos px + B sin px) (C cos qy + D sin qy)
(6.47)
sempre con la condizione (6.40). La condizione al contorno (6.28) si traduce
in:
∂B0z
∂x
∂B0z
∂y
= 0
= 0
per x = 0 ed x = a, y arbitrario
per y = 0 ed y = b, x arbitrario
(6.48)
Sarà quindi B = 0, D = 0, p = mπ/a, q = nπ/b, e quindi, dalle (6.30) si
otterranno le seguenti soluzioni di tipo magnetico:
mπ
nπ
nπ
′
cos
x sin
y
E0x = iC2 kc
b
a
b
mπ
mπ
nπ
′
E0y = −iC2 kc
sin
x cos
y
a
a
b
E0z = 0
mπ
nπ
mπ
′
sin
x cos
y
B0x = iC2 αmn
a
a
b
nπ
mπ
nπ
′
B0y = iC2 αmn
cos
x sin
y
b
a
b
mπ
nπ
′
B0z = C2 λ2mn cos
x cos
y
(6.49)
a
b
′
dove C2 è al solito un fattore costante complesso arbitrario, e gli autovalori
λ2mn di λ2 sono definiti ancora dalla (6.43) e (6.45).
Nel caso delle onde T.E. si può osservare che i più piccoli valori di m e
n accettabili sono (0,1) o (1,0) a seconda di quale dei due lati del rettangolo
sia maggiore. Si possono poi ripetere considerazioni analoghe a quelle fatte
per le onda di tipo elettrico per quanto riguarda l’ orientazione dei vettori α~k,
~ e B,
~ la relazione tra i moduli dei vettori E
~ e B,
~ l’ espressione del vettore di
E
Poynting entro la guida. Tali osservazioni saranno, poi, valide anche per un’
onda qualunque entro la guida, espressa nella base dell’ insieme delle onde
T.M. e T.E..
È ovvio che, tanto per le soluzioni T.E. quanto per le soluzioni T.M.,
per avere le componenti del campo E.M. dappertutto nella guida occorre moltiplicare ciascuna delle (6.44) e (6.49) per il fattore di propagazione
ei(kct−αmn z) . Dovendo αmn essere reale, affinchè l’onda non sia smorzata, dalla (6.45) si deduce che la guida non può trasmettere tutte le frequenze. Per
ogni onda, caratterizzata dalla coppia di numeri interi m e n, vi è dunque un
valore minimo di k, compatibile con una propagazione senza smorzamento;
questo valore minimo definisce per ogni tipo di onda la frequenza di rottura,
al di sotto della quale non vi può più essere propagazione. Supposto a > b,
94
CAPITOLO 6. GUIDE D’ONDA
la più piccola delle frequenze di rottura, o frequenza critica νc , corrisponde
al valore:
π
λ10
= √
kmin = √
ǫr µr
a ǫr µr
per cui, ricordando che ν =
νc =
(m = 1, n = 0)
(6.50)
kc
,
2π
c
√
2a ǫr µr
(6.51)
Esaminando le (6.44) e (6.49), si vede che per ν di poco superiore a νc , avremo
onde di tipo (6.47), cioè T.E., non di tipo T.M., che sono identicamente
eguali a zero. Cioè le onde di frequenza di poco superiore a quella critica
che si propagano nel tubo sono di tipo T.E.. Affinchè nel tubo a sezione
rettangolare si propaghino anche onde di tipo T.M. è necessario che k superi
il minimo autovalore corrispondente alla (6.22) con valori dei campi non
identicamente nulli, e cioè:
π
λ11
= √
k ≥ √
ǫr µr
ǫr µr
s
1
1
+ 2
2
a
b
(6.52)
e quindi
c
ν ≥ √
2 ǫr µr
s
1
1
+
a2
b2
(6.53)
Si osserva infine che, assegnato un valore di k maggiore del valore minimo
(6.50), si possono propagare nel tubo un numero finito di onde di tipo elettrico
e di tipo magnetico e precisamente tutte le onde corrispondenti agli autovalori
λmn di λ per cui è verificata la (6.32).
6.2.2
Guida d’onda a sezione circolare
Consideriamo ora una guida d’onda costituita da un cilindro circolare di
~
raggio a e, assumendo come asse z l’asse del cilindro, riferiamo i campi E
~ interni ad esso ad un sistema di coordinate cilindriche r, ϕ, z, come
e B
indicato in figura 6.9. Come nel caso precedente, assumeremo che i campi
~ eB
~ dipendano dal tempo t e dalla coordinata z per mezzo del termine di
E
propagazione ei(kct−αz) . Nel piano (r, ϕ) esprimeremo invece i campi mediante
le componenti Er , Eϕ , Br , Bϕ . Le (6.14) e (6.15) saranno quindi riscritte
come:
~ ϕ, z, t) = E0r (r, ϕ)~ir + E0ϕ (r, ϕ)~iϕ + E0z (r, ϕ)~k ei(kct
E(r,
h
i
− αz)
(6.54)
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO95
Figura 6.9:
~ ϕ, z, t) = B0r (r, ϕ)~ir + B0ϕ (r, ϕ)~iϕ + B0z (r, ϕ)~k ei(kct
B(r,
h
i
− αz)
(6.55)
Con un po’ di facile ginnastica matematica si ottengono le equazioni:
"
#
∂E0z
1 ∂B0z
i
+ kc
E0r = − 2 α
λ
∂r
r ∂ϕ
#
"
1 ∂E0z
∂B0z
i
− kc
E0ϕ = − 2 α
λ
r ∂ϕ
∂r
#
"
i
k 1 ∂E0z
∂B0z
B0r = 2 ǫr µr
− α
λ
c r ∂ϕ
∂r
#
"
k ∂E0z
1 ∂B0z
i
+ α
B0ϕ = − 2 ǫr µr
λ
c ∂r
r ∂ϕ
(6.56)
analoghe alle (6.20) e in cui è sempre λ2 = ǫr µr k 2 − α2 . Si ricavano ancora,
ricordando l’espressione del laplaciano trasverso (cioè nelle coordinate x e y)
in coordinate polari ∇2 f = ∂ 2 f /∂x2 + ∂ 2 f /∂y 2 = ∂ 2 f /∂r2 + 1/r ∂f /∂r +
1/r 2 ∂ 2 f /∂ϕ2 , le equazioni:
∂ 2 E0z
1 ∂E0z
1 ∂ 2 E0z
+
+
+ λ2 E0z = 0
∂r 2
r ∂r
r 2 ∂ϕ2
(6.57)
1 ∂B0z
1 ∂ 2 B0z
∂ 2 B0z
+
+
+ λ2 B0z = 0
∂r 2
r ∂r
r 2 ∂ϕ2
(6.58)
analoghe alle (6.22) e (6.23). Le condizioni al contorno che vanno associate
rispettivamente alle (6.57) e (6.58) sono:
E0z = 0
per r = a
(6.59)
96
CAPITOLO 6. GUIDE D’ONDA
∂B0z
= 0
∂r
per r = a
(6.60)
Potremo considerare onde di tipo magnetico (E0z = 0) o di tipo elettrico
(B0z = 0) ponendo eguale a zero i primi o rispettivamente i secondi membri
nelle parentesi delle (6.56). Le equazioni (6.57) e (6.58) erano state già trovate
∂2
(con la complicazione di un termine aggiuntivo con ∂z
2 ) nel paragrafo 4.2.2
relativo alla propagazione di onde libere in coordinate cilindriche e si era
già visto il metodo della separazione delle variabili per ottenere due integrali
particolari e quindi l’integrale generale dalla combinazione lineare dei due
integrali particolari. Più precisamente, esprimendo E0z o B0z come prodotti
delle due funzioni R(r) e Φ(ϕ), le (6.57) e (6.58) vengono soddisfatte dalle
equazioni:
1 dR
d2 R
+
+
dr 2
r dr
n2
λ − 2 R = 0
r
2
!
d2 Φ
+ n2 Φ = 0
2
dϕ
(6.61)
(6.62)
con n numero intero. Si era già visto che la (6.61) è l’equazione differenziale di Bessel di ordine n, di argomento λr, che ammette come soluzioni
la funzione di Bessel Jn (λr) e la funzione di Neumann Nn (λr) (cfr. Appendice F). Avevamo già visto che Nn (λr) non è regolare per r = 0, che
è per altro una coordinata possibile per la propagazione nella guida (l’asse
del cilindro). Le soluzioni accettabili per le (6.57) e (6.58) saranno quindi
del tipo Jn (λr) (An cos nϕ + Bn sin nϕ) con An e Bn costanti arbitrarie.
Consideriamo onde di tipo elettrico:
E0z = E0 Jn (λr) (An cos nϕ + Bn sin nϕ)
(6.63)
con la condizione al contorno (6.59). Essa richiede che:
Jn (λa) = 0
(6.64)
e se indichiamo con ξn1, ξn2 , ξn3 , ..., ξnj , gli zeri positivi (non nulli) della
funzione Jn (λr) (cfr. la figura F.1), disposti in ordine crescente, la condizione
(6.64) è soddisfatta ponendo:
(e)
λ = λnj =
ξnj
a
(n = 0, 1, 2, 3, ..., j = 1, 2, 3, ...)
(6.65)
(e)
che fornisce gli autovalori λnj del parametro λ per le onde di tipo elettrico.
(e)
q
(e)2
Ponendo αnj =
ǫr µr k 2 − λnj e tenendo conto delle (6.56) in cui sia
stato posto B0z = 0, si ottengono le relazioni esplicite di E0r , E0ϕ , B0r , B0ϕ :
6.2. ESEMPI DI PROPAGAZIONE IN GUIDE D’ONDA CON CONTORNO DEFINITO97
(e)
E0φ =
αnj
(e)
J ′ (λ r) (An cos nϕ + Bn sin nϕ)
(e) n nj
λnj
(e)
1 αnj
(e)
Jn (λnj r) (−An sin nϕ + Bn cos nϕ) n
−iE0 (e)2
r
λnj
(e)
E0z = E0 Jn (λnj r) (An cos nϕ + Bn sin nϕ)
E0r = −iE0
B0r = E0
iǫr µr k
(e)
J (λ r) (−An sin nϕ + Bn cos nϕ) n
(e)2 rc n nj
λnj
B0φ = E0
−iǫr µr k ′ (e)
Jn (λnj r) (An cos nϕ + Bn sin nϕ)
(e)
λnj c
(6.66)
Si puo’ verificare che la condizione al contorno per il campo elettrico tangenziale e’ soddisfatta, in quanto E0r = E0ϕ = 0 per r = a. Come si può
~0
facilmente verificare, anche in questo caso il prodotto scalare del vettore E
~ 0 è nullo, mentre E
~ 0, B
~ 0 e αnj ~k non formano più una terna
col vettore B
destrorsa. É poi, nuovamente vero che non esiste più una semplice relazione
~0 e B
~ 0 e che il flusso di energia netto è dato dalla
tra i moduli dei vettori E
sola componente longitudinale del vettore di Poynting.
In figura 6.10 è riportato l’andamento in funzione della coordinata
radiale e di quella angolare di E0z , nonchè il grafico bidimensionale di E0z
nel caso in cui si considera J1 (λr) con λ = ξ11 /a, con una dimensione radiale
a pari a 10 unità.
Nel caso di onde di tipo magnetico avremo:
B0z = B0 Jn (λr) (A′n cos nϕ + Bn′ sin nϕ)
(6.67)
con la condizione al contorno (6.60), la quale richiede che sia:
Jn′ (λa) = 0
(6.68)
Se indichiamo ora con ηn1 , ηn2 , ηn3 , ..., ηnj , ... gli zeri positivi non nulli,
disposti in ordine crescente, della Jn′ (λr) (cfr. la figura F.2), gli autovalori di
λ, per le onde di tipo magnetico, saranno
ηnj
(m)
(n = 0, 1, 2, 3, ..., j = 1, 2, 3, ...)
(6.69)
λ = λnj =
a
(m)
q
(m)2
con i corrispondenti valori αnj
=
ǫr µr k 2 − λnj . Sostituendo tali espressioni nella (6.56) in cui sia stato posto E0z = 0, si ottengono le
espressioni esplicite di E0r , E0ϕ , B0r , B0ϕ , non riportate esplicitamente per
brevità.
98
CAPITOLO 6. GUIDE D’ONDA
Figura 6.10:
6.3. CAVO COASSIALE
99
Tanto nel caso di onde T.M. che T.E. esiste dunque una successione
doppiamente infinita di autovalori del parametro λ, ciascuno caratterizzato
da due numeri interi, per i quali si ha propagazione lungo la guida. Per le
onde T.M. il più piccolo autovalore di λ è λe01 = ξa01 ≃ 2.4
e quindi
a
(e)
νmin =
1.2 c
√
πa ǫr µr
(6.70)
Per le onde T.E., se indichiamo con η0 il più piccolo degli zeri ηnj della (6.68),
si ha:
η0 c
(m)
(6.71)
νmin =
√
2πa ǫr µr
Ma qui, contrariamente a quello che avviene per gli zeri ξnj delle Jn (λr), il
più piccolo degli zeri delle Jn′ (λr) non è η01 bensı́ η11 ≃ 1.841, come si può
dimostrare da alcune relazioni di ricorrenza delle Jn′ (λr) e Jn (λr) (cfr. la
figura F.2), per cui risulta η11 < ξ01 . Ne segue che mentre per le onde T.M.,
quella di più bassa frequenza che si può propagare nel tubo è la T.M.01 ,
per le onde T.E. sarà la T.E.11 , e la prima a propagarsi al di sopra della
frequenza critica sarà la T.E.11 , diversamente dal caso della guida a sezione
rettangolare ove il primo modo di propagazione e’ di tipo T.E.01 o T.E.10 .
6.3
Cavo coassiale
Col nome di cavo coassiale si intende un tubo limitato da due cilindri metallici
circolari e coassiali che serve a guidare un’onda E.M. che si propaga nello
spazio anulare tra i due cilindri.
Indicheremo con a il raggio del cilindro esterno, con b il raggio di
quello interno e riferiremo al solito i campi interni alla guida a coordinate
cilindriche r, ϕ, z, con z asse della guida.
Analogamente al caso precedente, il problema si riduce ancora a determinare la soluzione delle (6.61) e (6.62) con le rispettive condizioni al
contorno:
E0z = 0
per r = a, r = b
(6.72)
e
∂B0z
= 0 per r = a, r = b
∂r
(6.73)
Ma qui l’asse z non è più compreso nel dominio di propagazione dell’onda e
quindi non è più necessario imporre la condizione che la funzione R(r) definita
100
CAPITOLO 6. GUIDE D’ONDA
dall’equazione differenziale (6.61) sia regolare per r = 0, ma solamente per
b ≤ r ≤ a. In questo caso le soluzioni sono le funzioni di Bessel Jn (λr) e
di Neumann Nn (λr) di ordine n. Possiamo perciò prendere come soluzione
della (6.61) una combinazione lineare a coefficienti costanti delle suddette
funzioni, ponendo:
R(λr) = C Jn (λr) + D Nn (λr)
(6.74)
Per le onde di tipo T.M. avremo allora:
E0z = E0 [C Jn (λr) + D Nn (λr)] (An cos nϕ + Bn sin nϕ) (6.75)
con la condizione (6.72). Ne segue che deve essere:
C Jn (λa) + D Nn (λa) = 0
C Jn (λb) + D Nn (λb) = 0
(6.76)
Queste equazioni, lineari omogenee in C e D, sono compatibili soltanto
quando il loro determinante è nullo, cioè:
Jn (λa) Nn (λb) − Jn (λb) Nn (λa) = 0
(6.77)
I valori accettabili per λ, cioè gli autovalori di λ, sono le radici dell’equazione
trascendente (6.77), che disposte in ordine crescente indicheremo con βn1 ,
βn2 , βn3 , ..., βnj . Avremo allora:
C
Nn (βnj a)
Nn (βnj b)
= −
= −
D
Jn (βnj a)
Jn (βnj b)
(6.78)
e potremo assumere:
2
E0z = E0 βnj
[Nn (βnj a) Jn (βnj r) − Jn (βnj a) Nn (βnj r)]
(Anj cos nϕ + Bnj sin nϕ)
(6.79)
con Anj , Bnj costanti arbitrarie. Sostituendo nelle (6.56), in cui si sia posto
~0 e B
~ 0 che definiscono il modo
B0z = 0, si ottengono le altre componenti di E
di propagazione. Si puo’ verificare che anche in questo caso le componenti
tangenziali del campo elettrico si annullano sulle pareti metalliche del cavo.
Per le onde di tipo T.E. avremo analogamente:
B0z = B0 [C ′ Jn (λr) + D ′ Nn (λr)]
(An cos nϕ + Bn sin nϕ)
con la condizione al contorno (6.73).
(6.80)
101
6.3. CAVO COASSIALE
Sarà pertanto:
C ′ Jn′ (λa) + D ′ Nn′ (λa) = 0
C ′ Jn′ (λb) + D ′ Nn′ (λb) = 0
(6.81)
da cui segue
Jn′ (λa) Nn′ (λb) − Jn′ (λb) Nn′ (λa) = 0
(6.82)
che è l’equazione trascendente che determina gli autovalori del parametro
λ, che, disposti in ordine crescente, indicheremo con γn1 , γn2 , γn3, ..., γnj .
Avremo ora:
C′
Nn′ (γnj a)
Nn′ (γnj b)
=
−
=
−
(6.83)
D′
Jn′ (γnj a)
Jn′ (γnj b)
e pertanto potremo assumere:
2
B0z = B0 γnj
[Nn′ (γnj a) Jn (γnj r) − Jn′ (γnj a) Nn (γnj r)]
′
A′nj cos nϕ + Bnj
sin nϕ
(6.84)
′
con A′nj , Bnj
costanti arbitrarie. Sostituendo nelle (6.56), in cui si sia posto
~0 e B
~ 0 e si puo’ verificare
E0z = 0, si ottengono le altre componenti di E
che le componenti tangenziali del campo elettrico si annullano sulle pareti
metalliche del cavo.
Concludendo, anche per i cavi coassiali vi è per ogni intero n (n =
0,1,2,3,...) una successione di infiniti autovalori del parametro λ. Inoltre ad
ogni valore di n e di j corrisponde un valore minimo di k per il quale la
propagazione del tipo di onda considerata è possibile. Si può osservare che,
a parità di raggio esterno a, le frequenze critiche corrispondenti ai modi di
oscillazione di un cavo coassiale costituiscono un insieme più denso di quello
della guida d’onda a sezione circolare e quindi il cavo coassiale è più adatto
alla trasmissione di segnali analizzabili in serie di Fourier.
Una particolarità del cavo coassiale è che, a differenza di quanto succede in una guida d’ onda, in esso il modo TEM è non solo possibile ma
anche dominante: tale modo è privo di frequenza di taglio, perchè per esso
il numero d’ onda αnj è sempre reale e coincide con il valore caratteristico
~ = c/n|B|
~ e,
del mezzo indefinito. Per tale modo vale anche la relazione |E|
~ B
~ e αnj~k formano una terna destrorsa.
come ovvio, i vettori E,
Per completezza possiamo osservare che il modo TEM non puo’ sussistere in una guida formata da un solo conduttore perchè, possedendo solamente componenti dei campi trasversali alla direzione di propagazione, per
essi devono valere le equazioni di Maxwell:
~ 0T EM = 0, ∇t · E
~ 0T EM = 0,
∇t × E
(6.85)
102
CAPITOLO 6. GUIDE D’ONDA
dove ∇t indica l’ operatore vettoriale ∇ ove si considerino le sole compo~ 0T EM è soluzione di un problema
nenti trasversali. Questo vuole dire che E
elettrostatico bidimensionale, per cui oltre alle già menzionate relazioni sul
numero d’ onda e sui moduli del vettori, siccome la superficie del cilindro
metallico della guida deve essere equipotenziale, il campo elettrico all’ interno è identicamente nullo. Non è dunque possibile sostenere il modo TEM
con una struttura costituita da un unico conduttore, ma è necessario avere
due o più superfici cilindriche distinte, come per il cavo coassiale e la linea
di trasmissione a fili paralleli.
6.4
Attenuazione lungo una guida d’onda reale
Finora abbiamo trattato il problema della propagazione di onde E.M. con
interessanti conseguenze, ma con ipotesi non fisiche, in particolare una: che
lo spessore del conduttore fosse eguale a zero. Chiediamoci quale sia l’effetto
di pareti metalliche di spessore finito, costituite da buoni conduttori metallici
(con ρ piccola, ma non nulla).
Il valore grande ma limitato della conducibilita’ σ del metallo fa si’ che
la profondita’ di pelle dello stesso, δ, sia diversa da zero, benche’ piccola, e
che, come conseguenza, il campo elettrico dell’ onda penetrando nella parete
metta in movimento gli elettroni di conduzione, liberi di muoversi con relativa
facilita’, dissipando per effetto Joule una parte della energia e.m. dell’ onda.
Nel caso delle guide d’onda ideali trattato fino ad ora E0z si annulla
sulla superficie, senza penetrare in essa. In realtà, si può dimostrare che, se
σ è grande, la costante di propagazione α conterrà dei piccoli termini addizionali, reali ed immaginari. Indicando, cioè, con α0 anzichè α, la costante
di propagazione nel caso della guida ideale trattata in precedenza, sarà:
α = α0 + ζλ + iβλ
(6.86)
dove ζλ è una correzione ininfluente, che diventa importante solo alla frequenza di taglio del modo considerato, dove α = 0, e βλ può essere considerato
come la costante di attenuazione della potenza trasmessa nella guida:
P (z) = P (0) e−2βλ z
(6.87)
ζλ e βλ dipendono dal particolare modo considerato. Si può dimostrare che
βλ è data dalla formula:
βλ =
s
i
ǫr 1 C (ν/νλ )1/2 h
ξλ + ηλ (ν/νλ )2
µr σδλ 2∆ 1 − ν 2
ν2
λ
(6.88)
103
6.5. CAVITÀ RISONANTI
dove νλ è la frequenza critica del modo considerato, corrispondente all’autovalore λ, C è la lunghezza del contorno della guida, ∆ la sezione della guida,
σ la conducibilità e δλ la profondità di pelle alla frequenza critica considerata, ξλ e ηλ numeri puri dell’ordine di grandezza dell’unità. Si fa notare che
ηλ per i modi T.M. è nulla.
Il calcolo dei parametri adimensionali ξλ e ηλ nella (6.88) può essere effettuato senza complicazioni di principio. Ad esempio, per la guida
rettangolare ed il modo T E01 , i valori sono ξ01 = a/(a+b) e η01 = 2b/(a+b).
Il comportamento di βλ in funzione di ν/νλ è rappresentato in figura
6.11. L’attenuazione minima si ha per una frequenza superiore a quella
Figura 6.11:
critica. Per i modi T.E. i valori relativi di ξλ e ηλ dipendono dal contorno
della guida e da λ, e quindi non è possibile fare considerazioni generali sulla
frequenza alla quale si ha l’attenuazione
√ minima. Per i modi T.M., invece, il
3 νλ . Ad alte frequenze l’attenuazione
minimo si ha sempre per νmin =
1/2
varia come ν . Come ordine di grandezza, in una guida con pareti di
rame βλ corrisponde ad una lunghezza di attenuazione dell’ordine di qualche
centinaio di metri (200–400 m) nella regione di frequenza delle microonde.
Va osservato che l’ approssimazione nella quale viene valutato il parametro
βλ come rappresentato nella figura (6.11) non e’ piu’ valida per frequenze
molto prossime al valore di taglio, ove βλ tende ad infinito sia per modi T.M.
che per modi T.E., cosa fisicamente impossibile.
6.5
Cavità risonanti
Affrontiamo ora il problema di studiare la risonanza di onde E.M. nel caso
tridimensionale. In altre parole chiediamoci se è possibile immagazzinare
104
CAPITOLO 6. GUIDE D’ONDA
l’energia E.M. in un volume delimitato da una superficie chiusa metallica
conduttrice. La risposta è affermativa e consideriamo per semplicità il caso
ideale già affrontato con le guide d’onda, e cioè spessore dei conduttori nullo
e conducibilità infinita. È immediato constatare che anche in questo caso la
condizione al contorno affinchè non ci sia dissipazione di energia per effetto
Joule è che in ogni punto della superficie chiusa sia soddisfatta la condizione
(6.16).
Consideriamo una guida d’onda di sezione rettangolare chiusa da due
piani perpendicolari all’asse z, posti nell’origine e ad una distanza d.
Come si è visto nel caso della guida d’ onda rettangolare, le componenti dei campi risultano essere stazionarie nelle dimensioni trasversali della
guida. Pensando di estendere la trattazione fatta in quel caso anche alla
terza dimensione, per ottenere onde stazionarie, e dunque confinamento, anche lungo l’asse z, si deve ipotizzare che nella cavita’ si abbiano dei campi
longitudinali del tipo:
Ez = E0z (x, y) [F sin rz + G cos rz]
Bz = B0z (x, y) [F sin rz + G cos rz]
(6.89)
(6.90)
(6.91)
nel caso di onde T.M. e T.E. rispettivamente, con E0z (x, y) dato dalla (6.39)
e B0z (x, y) dato dalla (6.47), e relazioni analoghe per le altre componenti dei
campi, in completa analogia con la trattazione delle guide d’ onda a sezione
rettangolare. E’ immediato verificare, allora, che r deve essere eguale a o π/d
con o numero intero e F e G devono essere posti eguali a zero rispettivamente
per onde T.M. e onde T.E., per evitare perdite ohmiche sulle pareti metalliche
poste in z = 0 e z = d. Gli autovalori relativi alle soluzioni (degeneri, come
noto) (6.91) saranno dati da:
λ2mno = π 2
m2
n2
o2
+
+
a2
b2
d2
!
(6.92)
corrispondenti alle frequenze:
νmno
c
=
√
2 ǫr µr
m2
n2
o2
+
+
a2
b2
d2
!1/2
ed alle autofunzioni, nel caso di onde T.M.:
nπ
oπ
mπ
x sin
y sin z
a
b
d
mπ
nπ
oπ
sin
x cos
y sin z
a
b
d
Ex = −i Cmno αmno cos
Ey = −i Cmno αmno
(6.93)
105
6.5. CAVITÀ RISONANTI
mπ
nπ
oπ
x sin
y cos z
a
b
d
nπ
oπ
mπ
x cos
y sin z
ǫr µr sin
a
b
d
mπ
nπ
oπ
ǫr µr cos
x sin
y sin z
a
b
d
Ez = Cmno λ2mno sin
Bx = i Cmno
By = −i Cmno
(6.94)
ovvero, nel caso di onde T.E.:
mπ
x
a
mπ
′
Ey = −i Cmno
kc sin
x
a
mπ
′
x
Bx = i Cmno
αmno sin
a
mπ
′
By = i Cmno
αmno cos
x
a
mπ
′
Bz = Cmno
λ2mno sin
x
a
′
Ex = i Cmno
kc cos
nπ
y
b
nπ
cos
y
b
nπ
cos
y
b
nπ
sin
y
b
nπ
sin
y
b
sin
oπ
z
d
oπ
sin z
d
oπ
sin z
d
oπ
sin z
d
oπ
sin z
d
sin
(6.95)
ove la soluzione completa sara’ data dal prodotto delle componenti (6.94) o
(6.95) per il fattore temporale e−iωt .
Notiamo due aspetti delle soluzioni trovate. Se paragoniamo la (6.93)
con la (4.15), notiamo che, mentre le onde libere possono avere qualsiasi
valore di ω, quelle risonanti in una scatola chiusa da pareti metalliche possono
avere soltanto valori discreti della frequenza, dipendenti dai tre interi m, n,
o. Ancora, ricordando la (6.37) si può considerare l’onda stazionaria in una
scatola come l’onda propagantesi in una guida con k esattamente uguale a
√
λmn / ǫr µr , e quindi vg = 0, con l’ulteriore condizione, per le componenti
trasversali, di avere un nodo per z = 0 e z = d.
É evidente dalle (6.94) che la condizione al contorno relativa alle
componenti tangenziali del campo elettrico (6.25) è soddisfatta in quanto
sulle pareti terminali, in z = 0 e z = d, le componenti E0x e E0y si annullano,
mentre la componente E0z , essendo perpendicolare a tali pareti, si attenua nel
metallo in base alla profondità di pelle δ del materiale specifico, idealmente
nulla. Si è ottenuta, adesso, una completa simmetrizzazione delle espressioni
delle componenti dei campi, come logico dal momento che in questo caso non
vi è più una direzione privilegiata, quella di propagazione.
Un ragionamento analogo vale anche per cavita’ risonanti a sezione
circolare, ottenute chiudendo una guida d’ onda circolare con due piani metallici perpendicolari all’ asse del cilindro e posti a distanza d uno rispetto
all’ altro. Le espressioni delle componenti dei campi potranno essere ottenute
da quelle della corrispondente guida d’ onda moltiplicandole per un termine
cos oπ
z o cos oπ
z in modo da ottenere la condizione di stazionarieta’ voluta
d
d
106
CAPITOLO 6. GUIDE D’ONDA
anche lungo l’ asse del cilindro, cioe’, per le componenti longitudinali dei
campi si avra’ esplicitamente:
oπ
z
d
oπ
= B0 Jn (λnj )[An cos nϕ + Bn sin nϕ] sin z
d
Ez = E0 Jn (λnj )[An cos nϕ + Bn sin nϕ] cos
(6.96)
Bz
(6.97)
(6.98)
per onde T.M. e T.E. rispettivamente, con l’ opportuno significato della
costante λnj in ciascun caso. I corrispondenti autovalori avranno espressione:
λ2mno
s
=
τnj
a
2
+
oπ
d
2
(6.99)
dove τnj indica lo zero della corrispondente funzione di Bessel di prima specie
(onde T.M.) o della sua derivata prima (onde T.E.) ed a indica il raggio della
sezione circolare della cavita’ cilindrica.
Come per il caso delle guide d’onda, una cavità reale, con spessore finito e conducibilità σ non infinita, non si comporterà come la schematizzazione
descritta. L’effetto che ci si può aspettare è che le frequenze di risonanza νmno
definite dalla (6.93) non siano esattamente definite, ma abbiano un certo allargamento, dovuto alla dissipazione dell’energia E.M. per effetto Joule sulle
pareti.
Per caratterizzare una cavità risonante si definisce il fattore di merito
o fattore Q, definito come:
energia immagazzinata nell′ interno della cavita′
=
energia persa per ciclo
energia immagazzinata nell′ interno della cavita′
= ω
(6.100)
energia persa per secondo
Q = 2π
Dal teorema della conservazione dell’energia, indicata con U, e dalla definizione di Q si ricava che:
dU
ωU
= −
dt
Q
(6.101)
da cui
U(t) = U(0) e
−ωt
Q
(6.102)
cioè se si immagazzina al tempo t = 0 l’energia U(0) nella cavità, essa decade esponenzialmente con una costante inversamente proporzionale a Q.
6.5. CAVITÀ RISONANTI
107
La (6.102) significa che le oscillazioni del campo elettrico nella cavità sono
smorzate con la legge:
−ωt
E(t) = E0 e 2Q e−iωt
(6.103)
in cui si è tenuto conto che U ∝ E 2 .
Ricordando la trattazione svolta per il dipolo oscillante smorzato (paragrafo 5.3) si trova in maniera del tutto analoga che la curva di risonanza
di una cavità è una Lorentziana del tipo:
| E(ω) |2 = cost ·
1
(ω − ω0 )2 + (ω0 /2Q)2
(6.104)
Il parametro ω0 /2Q determina, come è noto, la larghezza della Lorentziana,
e quindi una cavità sarà tanto più efficace quanto più Q è grande. Per
cavità con pareti di rame si arriva a valori di Q di 104 . Usando materiali
superconduttori (σ → ∞) si può arrivare a valori di Q 2–3 ordini di grandezza
superiori.
Capitolo 7
Generatori di onde EM
7.1
Il klystron
Per produrre onde E.M. nell’intervallo 1–100 GHz (microonde), l’uso di una
antenna lineare in risonanza non è efficiente e risulta anzi impossibile produrre potenze notevoli. Il motivo è molto semplice. La lunghezza d dell’antenna
deve essere un multiplo intero della semilunghezza dell’onda, e quindi da
qualche cm a qualche mm. Per rimanere nell’approssimazione dell’antenna
lineare (spessore trascurabile rispetto alla lunghezza), si dovrebbero utilizzare dei fili sottili, nei quali è impossibile far circolare correnti di intensità
massima I0 , che determinano, con una dipendenza quadratica (5.89, 5.90),
la potenza emessa.
I generatori di microonde sono basati sul principio della modulazione
di un intenso fascio di elettroni, ed i più comunemente usati nelle applicazioni
sono il Klystron e il Magnetron. Il principio di funzionamento del klystron,
che descriveremo brevemente nel seguito, fu realizzato nel 1935 dai fratelli
Varian e questo generatore, con i miglioramenti tecnologici apportati nel
corso degli anni, è in uso ancora oggi.
Un klystron (vedi figura 7.1) è costituito nelle sue parti essenziali da
un cannone elettronico, una struttura di interazione tra il fascio elettronico
e campi E.M. delle frequenze che si vogliono produrre, ed un collettore. Il
cannone elettronico, composto da un catodo e da un sistema di elettrodi di
focalizzazione, tra i quali sono applicate opportune differenze di potenziale statiche, consente la formazione di un pennello, generalmente di sezione
circolare, costituito da elettroni le cui traiettorie, a meno delle forze di repulsione tra essi, coincidono con le linee del campo elettrico; grazie all’ elevata
intensità del campo accelerante, il raggio del pennello è, in genere, più piccolo
di quello del catodo.
108
109
7.1. IL KLYSTRON
Figura 7.1:
La struttura di interazione consente uno scambio energetico tra il pennello di elettroni e i campi a radiofrequenza presenti in essa. La più semplice
schematizzazione di una struttura di interazione è costituita da due o più
gap sedi di campi elettrici variabili nel tempo (chiamati in gergo campi a
radiofrequenza) diretti secondo la direzione del moto degli elettroni. Un gap,
con un campo elettrico del tipo anzidetto, viene comunemente realizzato mediante una cavità risonante in cui, con un opportuno modo di oscillazione
(in genere quello TM010), si crea, in una regione compresa tra due griglie
parallele (il cosiddetto spazio di interazione), un campo elettrico a radiofrequenza avente direzione ortogonale a esse. Il segnale a radiofrequenza alla
prima cavità è applicato in genere mediante un cavo coassiale o una guida
d’onda. Nell’attraversare il gap la velocità degli elettroni viene modulata e
questa modulazione di velocità si traduce in una modulazione dell’intensità
del fascio di elettroni all’uscita del primo gap. La modulazione di velocità
impressa dal segnale a radiofrequenza al fascio elettronico può essere visualizzata ricorrendo a un particolare diagramma delle traiettorie elettroniche
(diagramma di Applegate, vedi figura 7.2). In esso sono riportate, in funzione del tempo, le distanze dal primo gap di un numero rappresentativo di
elettroni (in questo caso 24 per ogni ciclo di radiofrequenza) e l’ampiezza
della tensione a radiofrequenza applicata al primo gap.
Gli elettroni che attraversano il gap nell’intervallo di tempo in cui
la tensione a radiofrequenza ad esso applicata è accelerante aumentano la
loro velocità; viceversa, gli elettroni che transitano nel semiperiodo successivo riducono la loro velocità. Le variazioni di velocità sono visualizzate nel
diagramma mediante variazioni di pendenza delle traiettorie degli elettroni;
laddove molte traiettorie s’intersecano si ha un addensamento di elettroni.
110
CAPITOLO 7. GENERATORI DI ONDE EM
Figura 7.2:
La modulazione di velocità, generata dal primo gap, comporta una modulazione dell’intensità del fascio di elettroni. I pacchetti di elettroni in moto,
attraversando il gap della seconda cavità, posta ad una opportuna distanza
dalla prima per ottenere la massima modulazione di densità (si veda più oltre), inducono nel gap cariche di segno opposto, che danno luogo ad una vera
e propria corrente circolante. Se si considera, infatti, il gap di una cavità
risonante, la presenza di un pacchetto di elettroni dà luogo, sulle due griglie,
a cariche indotte che vanno variando di intensità con lo spostamento del pacchetto; tale variazione è ottenuta per passaggio di corrente sulle pareti della
cavità. Alla risonanza, la cavità di uscita rappresenta un carico puramente
resistivo e quindi la tensione a radiofrequenza che si stabilisce nel gap risulta
ritardante per i pacchetti di elettroni. In queste condizioni il pennello cede
energia al campo a radiofrequenza della cavità di uscita a spese dell’ energia
posseduta dal pennello, con una cadenza temporale stabilita dal periodo del
segnale applicato alla cavità di ingresso.
Il rapporto tra la potenza del segnale di uscita dalla seconda cavità
e il segnale di ingresso nella prima cavità viene denominato guadagno G
del klystron a due cavità. Esso raggiunge valori tra 10 e 20 dB. Questo
guadagno non è da confondere con il guadagno di energia globale del sistema,
ovviamente <1. L’energia “sprecata” è data dal prodotto dell’intensità della
corrente del cannone elettronico (che può arrivare a qualche kA), per la
differenza di potenziale statico applicata al cannone (fino a 100 kV ), cioè
qualche 107 W , e l’efficienza dei klystron migliori non arriva a più di 30-40%.
Si ottengono cioè potenze di campo E.M. in uscita fino a 10 MW , certamente
non da trascurare!
111
7.1. IL KLYSTRON
Figura 7.3:
Vediamo ora di trattare analiticamente il problema della modulazione
di velocità degli elettroni. Si consideri il gap della cavità di ingresso di un
klystron a due cavità, schematizzato in figura 7.3, in cui il fascio del cannone
elettronico sia accelerato da una differenza di potenziale V0 ; sia d la distanza
tra le griglie e A sin ωt la tensione modulante, di pulsazione ω, applicata tra
esse. Si scelga un sistema di riferimento costituito da un asse diretto secondo
il moto degli elettroni, con l’origine O coincidente con la griglia di ingresso.
Il campo Ez , esistente nel gap per effetto della tensione applicata, esercita sui
singoli elettroni di carica −e e massa m, che l’attraversano, la forza −eEz ,
cui corrisponde una accelerazione:
d2 z
eEz
= −
2
dt
m
(7.1)
da cui (si veda la figura 7.3):
eA
d2 z
=
sin(ωt)
2
dt
dm
(7.2)
Integrando rispetto a t e denotando con t0 l’istante in cui l’elettrone di
velocità u0 attraversa la prima griglia, si ottiene:
dz
eA
= u0 −
[cos(ωt) − cos(ωt0 )]
dt
ωdm
(7.3)
La velocità u0 è data da:
u0 =
2eV0
m
1/2
(7.4)
in cui V0 è la differenza di potenziale statico applicata tra anodo e catodo
del cannone elettronico. Nell’ipotesi che l’ampiezza A della tensione a radiofrequenza sia piccola rispetto a V0 , si può allora assumere che il tempo
112
CAPITOLO 7. GENERATORI DI ONDE EM
di transito degli elettroni nel gap sia approssimabile a quello che si avrebbe
per la presenza della sola tensione continua. È da sottolineare che il tempo
di transito che interessa non è quello relativo al percorso catodo–anodo del
cannone elettronico, ma quello relativo allo spazio compreso tra le due griglie
di ogni cavità; data la vicinanza delle due griglie tale tempo è, almeno per
onde di frequenza fino a circa 100 GHz, molto minore del periodo dell’onda di
lavoro. Se si indica con t1 l’istante in cui l’elettrone si trova in corrispondenza
del centro del gap e con t2 l’istante in cui l’elettrone attraversa la seconda
griglia, si ha:
t0 = t1 −
d
,
2u0
t2 = t1 +
d
2u0
(7.5)
La velocità dell’elettrone all’uscita del gap del modulatore, u(d), può essere
valutata sostituendo nella (7.3) t con t2 :
2eA
ωd
u(d) = u0 +
sin
ωmd
2u0
!
sin(ωt1 )
Definendo come coefficiente di accoppiamento M il rapporto sin
e utilizzando la (7.4), si ottiene:
(7.6)
ωd
2u0
u(d) = u0 [1 + MA sin(ωt1 )/2V0 ]
/
ωd
2u0
(7.7)
M tende ad 1 per tempi di transito nel gap prossimi allo zero, a 0 per tempi
di transito nel gap grandi. Gli elettroni, dopo aver superato il primo gap, si
muovono in una zona di campo elettrico nullo. Indicando con l la distanza
tra i centri del primo e del secondo gap, il tempo di arrivo dell’elettrone nella
seconda cavità risulta:
t3 − t1 = l/ {u0 [1 + MA sin(ωt1 )/2V0 ]}
(7.8)
Considerato che A/V0 << 1, la (7.8) può essere approssimata a:
t3 − t1 =
ossia, indicando
l
[1 − MA sin(ωt1 )/2V0 ]
u0
l
u0
come tt e
l MA
u0 2V0
t3 = t1 + tt − Y sin(ωt1 )
(7.9)
come Y , a:
(7.10)
La rappresentazione grafica della (7.10) è data in figura 7.4 per diversi valori
di Y (0.5, 1.0, 1.5). È evidente l’impacchettamento: per Y ≥ 1, ad un valore
di t3 corrispondono due valori di t1 , cioè gli elettroni che hanno attraversato
il primo gap a tempi t1 diversi arrivano al secondo gap allo stesso tempo t3 .
113
7.1. IL KLYSTRON
Figura 7.4:
Da notare che valori di Y ≥ 1 si ottengono con l sufficientemente elevati,
dato che M < 1 e VA0 << 1. Si è soliti indicare il fattore Y , moltiplicato per
ω, come parametro di impacchettamento X, in una relazione ottenuta dalla
(7.8) moltiplicata per ω, ed in cui, anzichè i tempi, sono definiti gli angoli di
fase all’ingresso, ωt1 , e al secondo gap, ωt3 .
Si può dimostrare che l’ intensità della corrente indotta sulle pareti
della cavità di uscita è pari al prodotto del coefficiente di accoppiamento del
gap e della ampiezza della corrente modulata del pennello elettronico. Tale corrente, a causa dell’ azione modulante della tensione a radiofrequenza
applicata, è una funzione periodica che può essere espressa come somma delle sue varie armoniche, le cui ampiezze mostrano una notevole dipendenza
dal parametro di impacchettamento X. La corrente indotta risulta, perciò, a
sua volta avere una struttura periodica con le stesse armoniche della radiofrequenza, ma, grazie ad una opportuna ottimizzazione dei parametri geometrici
ed elettrici della struttura, una intensità molto maggiore. La struttura fin
qui descritta si comporta fondamentalmente come un amplificatore di radiofrequenze; per ottenere il funzionamento del klystron a due cavità come
generatore di oscillazioni persistenti è sufficiente connettere fra l’ ingresso e
l’ uscita un tratto di cavo coassiale o di guida d’ onda lungo quanto basta
per avere tra le correnti a radiofrequenza delle due cavità la relazione di fase
necessaria e sufficiente per l’ innesco (dovuto ai modi termici della cavita’) e
il mantenimento delle oscillazioni.
Le realizzazioni di una struttura risonante ad impacchettamento di
elettroni tipo klystron possono assumere configurazioni diverse, in relazione
alle potenze che si vogliono ottenere. Se si vuole massimizzare la potenza,
conviene usare non una ma due o più cavità oscillatrici per convertire l’ener-
114
CAPITOLO 7. GENERATORI DI ONDE EM
gia dei fasci di elettroni modulati in intensità in energia E.M.. Si possono
costruire klystron in continua con potenze di uscita superiori al MW e con
rendimenti del 40% circa.
Figura 7.5:
Nell’intervallo di frequenze 1–100 GHz, in alternativa, si possono realizzare klystron con una sola cavità (modulatore e oscillatore) deflettendo
all’indietro gli elettroni tramite un elettrodo (lente elettrostatica) polarizzato positivamente, posto ad una distanza circa eguale alla metà della distanza
in cui sarebbe stata posta la seconda cavità; tali dispositivi prendono il nome
di klystron reflex e la loro struttura è schematizzata in figura 7.5. Chiaramente il rendimento di un klystron reflex è basso (<10%): esso arriva a fornire
potenze piuttosto modeste (fino a circa 1 W) ed è stato particolarmente usato
come eterodina in ricevitori radar.
Figura 7.6:
I klystron di potenza elevata sono utilizzati per applicazioni in tecniche
radarimetriche e di accelerazione di particelle. È da notare che l’installazione
7.1. IL KLYSTRON
115
base per accelerare un fascio di particelle (indipendente dal tipo di acceleratore, circolare o lineare) è quella schematizzata in figura 7.6. Nel klystron
abbiamo una corrente di elettroni molto elevata I (kA), con differenze di potenziale “basse” (100 kV), nella cavità risonante il fascio di particelle viene
accelerato con incrementi di energia fino a 10 MV·q, essendo q la carica della
particella accelerata, ma con intensità del fascio inferiori ad 1 A. Il sistema
klystron–guida d’onda–cavità è quindi assimilabile ad un trasformatore, che
opera però attraverso campi E.M. risonanti. L’efficienza di questo “trasformatore” (<20%) è peraltro molto più bassa di quella di un trasformatore
normale per corrente alternata, vicina al 100%.
I generatori di microonde a potenze molto minori, inclusi quelli per
i fornetti a microonde di uso domestico, sono di solito del tipo magnetron,
non descritti per brevità.
Capitolo 8
Fibre ottiche
8.1
Considerazioni generali
Nelle telecomunicazioni il trasferimento di informazione è generalmente eseguito mediante una modulazione di un’onda E.M. che agisce da vettore dell’informazione stessa. La quantità di informazione che può essere trasferita
è legata alla cosiddetta banda passante che è un intervallo di frequenze ∆ν0
centrato attorno alla frequenza ν0 dell’onda portante. È quindi evidente che,
maggiore la frequenza ν0 , maggiore sarà la quantità di informazione trasmessa, nell’ipotesi di ∆ν0 /ν0 costante. Passando da ν0 ≃ 107 Hz (radioonde)
a ν0 ≃ 1010 Hz (microonde) a ν0 ≃ 1014 Hz (visibile) si guadagnano
3 o, rispettivamente, 7 ordini di grandezza nella quantità di informazione
trasferita.
Da questa considerazione, legata ad altre di carattere economico (reperibilità dei materiali) e di sicurezza, ha avuto origine lo studio e quindi
l’utilizzo delle fibre ottiche per trasmettere, con poca attenuazione, segnali a
grandi distanze.
La prima trattazione teorica della propagazione della luce in cilindri
dielettrici risale al 1910. Soltanto dopo il 1950 le fibre ottiche incominciarono
a trovare delle applicazioni pratiche nel campo della trasmissione di immagini
lungo fasci flessibili di fibre. La prima proposta di utilizzo delle fibre ottiche
nel campo delle comunicazioni ottiche risale al 1966. La ragione di ciò va
ricercata nel fatto che l’attenuazione da cui erano afflitte le fibre di vetro fino
a quel tempo era superiore alle centinaia di dB/km. Inoltre le sorgenti ed i
rivelatori di luce non erano ottimizzati e compatibili (laser e fotodiodi erano
agli albori). Nel decennio 1966–1976 si realizzarono i progressi tecnologici
decisivi. Fu dimostrato che l’attenuazione dei materiali vettori utilizzati per
le fibre ottiche non è una proprietà intrinseca del materiale, ma è dovuta
116
8.2. TRASMISSIONE DI SEGNALI IN FIBRE OTTICHE
117
alla presenza di impurità, soprattutto ioni metallici. Usando tecnologie di
purificazione e deposizione di silice pura, si ottennero attenuazioni sempre
minori (vedi figura 8.1).
Figura 8.1:
Nel 1976 ricercatori giapponesi riuscirono a fabbricare una fibra con un
bassissimo contenuto di ioni OH − e attenuazioni minori di 0.47 dB/km, molto
vicine alle perdite intrinseche del materiale (diffusione di Rayleigh). La figura
8.2 mostra la curva di attenuazione per una fibra ottica in materiale vetroso.
Dalla figura appare chiaro che conviene lavorare nell’intervallo di lunghezze
d’onda 800–1500 nm, cioè nell’infrarosso, dove la diffusione di Rayleigh (si
ricorda che l’attenuazione dovuta a questo fenomeno è proporzionale a ω 4 ,
cioè a 1/λ4 ) è ridotta. Siamo cioè nell’infrarosso e, nel corso degli anni, si
è passati successivamente da lunghezze d’onda di lavoro di 850, 1300 e 1550
nm, denominate rispettivamente prima, seconda e terza finestra. Oggi le
comunicazioni avvengono quasi esclusivamente mediante fibre monomodali
(vedi in seguito) operanti nella terza finestra (1550 nm).
8.2
Trasmissione di segnali in fibre ottiche
Premettiamo che il fenomeno fisico utilizzato per trasmettere segnali ottici
a grandi distanze è quello della riflessione totale. È ben noto che un raggio
luminoso, incidendo sull’interfaccia tra due mezzi con indici di rifrazione n1
e n2 , con n1 > n2 e provenendo dal mezzo n1 , subisce riflessione totale,
senza rifrazione, se l’angolo di incidenza θi con la normale alla superficie di
118
CAPITOLO 8. FIBRE OTTICHE
Figura 8.2:
separazione tra i due mezzi è maggiore o eguale al cosiddetto angolo limite
θL , definito dalla relazione:
n2
(8.1)
sin θL =
n1
Figura 8.3:
Consideriamo il sistema rappresentato in figura 8.3, costituito da un
cilindro di materiale vetroso di raggio r1 e indice di rifrazione n1 , detto nocciolo, contornato da un cilindro cavo, sempre di materiale vetroso, di raggio
8.2. TRASMISSIONE DI SEGNALI IN FIBRE OTTICHE
119
interno r1 , raggio esterno r2 ed indice di rifrazione n2 , con n1 > n2 , chiamato
mantello. Il mantello è racchiuso da una guaina opaca di materiale plastico.
Premettiamo anzitutto che esistono tre tipi di configurazione in cui la
luce può trasmettersi per riflessione totale e che sono dette:
• a) le guide di luce, con r1 dell’ordine del cm, costituite solo dal nucleo,
solitamente di materiale plastico;
• b) le fibre multimodali, con r1 dell’ordine di 30 µm e r2 dell’ordine di
60 µm;
• c) le fibre monomodali, con r1 dell’ordine di 5 µm e r2 dell’ordine di 60
µm.
Le guide di luce sono usate per trasmettere a distanze dell’ordine di
1–5 m i segnali luminosi prodotti dal passaggio di particelle ionizzanti in opportuni materiali (gli scintillatori) a rivelatori optoelettronici (fotomoltiplicatori, fotodiodi). Le fibre multimodali sono usate per trasmettere immagini
lungo cammini incurvati, sempre dell’ordine di 1–5 m. Le fibre monomodali
sono usate per trasmettere segnali nell’infrarosso per telecomunicazioni fino a
distanze di 100 km, senza amplificazione. Per trasmettere a lunghe distanze
(intercontinentali) è necessario, ogni 100 km circa, introdurre un amplificatore ottico (una fibra attiva, che funziona secondo i principi del laser e che
non viene qui descritta).
Vediamo che cosa c’è di comune tra questi tre sistemi e dove differiscono. Riferendoci sempre alla figura 8.3, che rappresenta il caso più semplice di
una fibra a step index (salto di indice di rifrazione, rappresentato graficamente a destra nella figura), vediamo le semplici considerazioni che si possono
trarre nelle ipotesi di validità dell’ottica geometrica. Consideriamo per semplicità raggi luminosi meridiani, che si propaghino, cioè sul piano contenente
l’asse z della fibra. Le considerazioni possono essere ripetute anche per raggi
sghembi, in cui le traiettorie sono molto più complesse, ma le conclusioni non
molto diverse.
Il raggio luminoso indicato in figura viene immesso nel nocciolo della
fibra attraverso la superficie di separazione aria (indice di rifrazione n0 )–
vetro (indice di rifrazione n1 ) e verrà rifratto secondo la ben nota legge di
Snellius Cartesio:
n0 sin θi = n1 sin θt
(8.2)
avendo indicato come al solito con θt l’angolo formato dal raggio rifratto
con la normale alla superficie nel punto di incidenza. Il raggio prosegue fino
all’interfaccia con il mantello, dove subisce riflessione totale se l’angolo θL è
120
CAPITOLO 8. FIBRE OTTICHE
≥ al valore dell’angolo limite (8.1). Si ricava quindi immediatamente dalle
(8.1) e (8.2) che l’angolo θi massimo per cui i raggi luminosi si propagano
nella fibra per riflessione totale, ponendo n0 = 1 per semplicità, è dato da:
π
θi = arcsin(n1 sin θt ) = arcsin n1 sin
− θL
=
2
q
= arcsin(n1 cos θL ) = arcsin n1 1 − sin2 θL
= arcsin
q
q
=
n21 − n22
(8.3)
La quantità n21 − n22 viene comunemente definita apertura numerica (N.A.)
della fibra e il suo arcoseno rappresenta l’angolo di apertura del cono entro
cui i raggi incidenti vengono trasmessi per riflessione totale.
Se questa fosse l’unica considerazione riguardante la trasmissione totale, è evidente che converrebbe operare con N.A. il più grande possibile,
riducendo il sistema al solo nocciolo, con anche n2 ≃ 1 (aria). È quanto
avviene per le guide di luce. In realtà un’altra considerazione, riguardante i
tempi di arrivo dei segnali luminosi, dimostra che converrebbe lavorare con
N.A. → 0. Questa circostanza si può verificare supponendo di immettere
ad un certo istante t0 un certo numero di fotoni in z = 0 e valutando la
dispersione dei tempi di arrivo dopo aver percorso una lunghezza L di fibra
rettilinea. Il cammino percorso dai fotoni che si muovono lungo l’asse è il minore, quello dei fotoni che vengono riflessi secondo θL il maggiore. Indicando
con l1 e l2 questi cammini (distanze percorse dai raggi luminosi) si ha:
l1 = L;
l2 =
L
;
sin θL
l2 − l1 = ∆L = L
1
−1
sin θL
(8.4)
Ricordando che la velocità di propagazione nel nocciolo è v = c/n1 , la differenza di tempo tra il fotone che ha percorso il cammino 1 e quello che ha
percorso il cammino 2 è:
Ln1
1
∆L
−1 =
=
∆t =
v
c
sin θL
Ln1 n1
Ln1
=
−1 =
(n1 − n2 )
c
n2
cn2
(8.5)
Come vedremo, nelle fibre ottiche per telecomunicazioni è n1 ≃ n2 e quindi
si può approssimare:
(N.A.)2 = (n21 − n22 ) = (n1 + n2 )(n1 − n2 ) ≃ 2n1 (n1 − n2 )(8.6)
da cui, sostituendo nella (8.5), si ha:
L(N.A.)2
∆t =
2cn2
(8.7)
8.3. L’APPROSSIMAZIONE DELL’ICONALE
121
Il tempo ∆t, chiamato di solito dispersione modale, aumenta con il quadrato
di (N.A.). Per ottenere una piccola dispersione modale è necessario ricorrere, a differenze (n1 − n2 ) molto piccole, dell’ordine di (1–2)% di n1 ed
utilizzare altri artifici (fibre ad indice graduato, trasmissione monomodale)
per ottenere il risultato cercato. Prima di discutere questi ulteriori aspetti
è però necessario ricordare alcune proprietà importanti della propagazione
della luce in un dielettrico trasparente.
8.3
L’approssimazione dell’iconale
Le leggi dell’ottica geometrica sono valide nell’ipotesi che le dimensioni spaziali degli oggetti che la luce incontra siano molto maggiori della sua lunghezza d’onda λ. Quando, invece, esse sono dell’ordine di grandezza di λ, i
fenomeni che si osservano (diffrazione, interferenza) possono essere spiegati
soltanto con l’equazione della propagazione ondosa. Verifichiamo che dalle
equazioni delle onde è possibile ricavare le leggi dell’ottica geometrica.
Nel Capitolo 4 era stato dimostrato che una qualsiasi delle componenti
~
~ indicata per semplicità con f , e per una frequenza determinata ω,
di E e B,
soluzione della (4.3), era esprimibile dalla (4.20), che qui riscriviamo come:
~
f = f0 eik0
·~
r
e−iωt = ψ e−iωt
(8.8)
ψ soddisfa l’equazione per la parte spaziale (4.12).
Supponiamo ora che la propagazione avvenga in un mezzo materiale
isotropo non dispersivo di indice di rifrazione costante n = c/v. È immediato
verificare che l’equazione di propagazione è sempre la (4.3), in cui però al
posto di 1/c2 si ha 1/v 2 = n2 /c2 . La (4.12) diventa allora:
∇2 ψ1 + ω 2
n2
ψ1 = 0
c2
(8.9)
Se n = cost, la soluzione sarà simile alla (8.8), ma con k1 = k0 n al posto di
k0
~
ψ1 = f0 eik1 ·~r
(8.10)
Facciamo ora l’ipotesi che n non sia più una costante, ma una funzione del
posto, n(x, y, z), la cui variazione sia però molto lenta su distanze paragonabili alla lunghezza d’onda λ dell’onda di frequenza angolare ω. La (8.9)
diventa allora:
∇2 ψ1 + ω 2
n2 (x, y, z)
ψ1 = 0
c2
(8.11)
122
CAPITOLO 8. FIBRE OTTICHE
Si può provare a soddisfare la (8.11) con una funzione del tipo:
ψ1 = f0 eik0
S(x,y,z)
(8.12)
supponendo per semplicità che sia ancora f0 costante ed S reale. Osservando
che si ha:
∂ 2 ψ1
∂S
= −k02 f0
2
∂x
∂x
!2
eik0
S
+ ik0 f0
∂ 2 S ik0
e
∂x2
S
(8.13)
e analogamente per le derivate parziali rispetto a y e z, sostituendo nella
(8.9) si deduce:
ik0 f0 ∇2 Seik0
S
− k02 f0 (∇S)2 eik0
S
+ k02 n2 f0 eik0
S
= 0
(8.14)
Dividendo la (8.14) per k02 = 4π 2 /λ20 si ottiene:
f0 eik0
S
h
i
(∇S)2 − n2 −
if0 λ0 ik0 S 2
e
∇S = 0
2π
(8.15)
Introducendo ora l’ipotesi dell’ottica geometrica, e cioè che sia λ0 → 0, la
(8.15) si riduce a:
(∇S)2 = n2
(8.16)
detta anche equazione dell’iconale, attribuendo questo nome alla funzione
S. La (8.16) può essere considerata l’ equazione fondamentale dell’ ottica
geometrica. Dalla (8.12) appare chiaro il significato fisico dell’iconale. Le
superfici S(x, y, z) = cost rappresentano le superfici di eguale fase, in altre
parole i fronti d’onda nel mezzo di indice di rifrazione variabile n(x, y, z). È
noto che nelle onde piane, in un mezzo con n = cost, i raggi luminosi sono
ortogonali ai fronti d’onda. È intuitivo ammettere che anche nel caso di n
variabile il raggio luminoso passante per un punto di un fronte d’onda sia
ortogonale ad esso. Indicando con ~us il versore ortogonale alla superficie S,
si avrà:
∇S = | ∇S | ~us = n~us
(8.17)
Moltiplicando scalarmente la (8.17) per ~us , ed indicando con s la coordinata
curvilinea del raggio passante per S(x, y, z), si ha:
dS
= n
ds
(8.18)
di cui si deduce chiaramente il significato fisico. Dati due fronti d’onda vicini,
S = cost e S + dS = cost, la distanza ds tra queste due superfici è in ogni
punto inversamente proporzionale a n. Nelle regioni dello spazio in cui è
123
8.3. L’APPROSSIMAZIONE DELL’ICONALE
n=cost., le superfici d’ onda sono tra di loro parallele, ovvero la distanza
ds è costante e le linee s sono rette, ossia, in quelle regioni la propagazione
della luce è rettilinea. Il concetto di iconale permette quindi di estendere
anche al caso di n variabile la rappresentazione con raggi luminosi, non più
rettilinei. È possibile dimostrare rigorosamente le (8.17) e (8.18) partendo
dallo sviluppo in serie da Taylor della funzione iconale nell’intorno di un
punto.
R
L’ integrale γ n dl lungo un tratto di curva γ è detto lunghezza ottica
di γ o cammino ottico. Se consideriamo due punti P1 e P2 appartenenti ad
una stessa linea s avremo:
Z
P2
Z
n ds = c
P1
P2
dt = S(P2 ) − S(P1 )
P1
(8.19)
dove dt è il tempo che impiega la luce a percorrere la distanza ds lungo la
linea s. Il tempo che impiega la luce a percorrere la linea s da P1 a P2 sarà:
Z
P2
dt =
P1
1
c
Z
P2
P1
n ds =
1
(S(P2 ) − S(P1 )) .
c
(8.20)
Vogliamo confrontare questo tempo con quello che la luce impiegherebbe per
andare da P1 a P2 lungo un’ altra linea γ, che non sia una linea s. Osserviamo
che è anche:
Z
Z P2
dS
dγ =
dS = S(P2 ) − S(P1 ).
dγ
P1
P2
P1
(8.21)
Ma, indicando con ~uγ il versore della linea γ:
dS
= ∇S · ~uγ ≤ |∇S| = n
dγ
(8.22)
Perciò si ottiene:
Z
P2
n ds = S(P2 ) − S(P1 ) =
P1
Z
P2
P1
dS
dγ ≤
dγ
Z
P2
P1
n dγ
(8.23)
Inoltre, deve essere:
dS
<n
dγ
(8.24)
= n e quindi
almeno in qualche punto di γ perchè sennò si avrebbe sempre dS
dγ
γ sarebbe, contrariamente all’ ipotesi fatta, una linea s. In conclusione:
1
c
Z
P2
P1
1
n ds <
c
Z
P2
P1
n dγ.
(8.25)
124
CAPITOLO 8. FIBRE OTTICHE
É questa la formulazione del famoso principio di Fermat, che si può esprimere
dicendo che tra tutti i possibili percorsi che potrebbe compiere per andare
da P1 a P2 la luce sceglie quello (linea s) che richiede il minor tempo. Da
questo principio si possono facilmente ricavare le leggi della riflessione e della
rifrazione e generare quelle conclusioni che formano il corpus dell’ ottica
geometrica.
8.4
Le formule di Fresnel
Ricaveremo ora le formule di Fresnel, molto importanti per calcolare le potenze trasmesse e riflesse quando un fascio luminoso incide sulla superficie di
separazione tra due mezzi materiali dielettrici. Si suppone che la superficie
sia liscia ed i mezzi materiali omogenei, isotropi e non dispersivi. La trattazione potrebbe essere quella generale relativa ad un onda E.M. di frequenza
angolare ω qualsiasi. Ci limiteremo al caso ottico per semplificare i calcoli
e l’interpretazione dei risultati. Supporremo valide le equazioni di Snellius–
Cartesio (che si potrebbero anche ricavare come premessa delle equazioni di
Fresnel), che le permeabilità magnetiche relative dei due mezzi siano = 1 e
√
√
che quindi n1 = ǫr1 = c/v1 , n2 = ǫr2 = c/v2 .
I raggi incidente i, riflesso r e trasmesso (o rifratto) t, saranno rappresentati dalle onde piane:
~i = E
~ 0i cos(ωt − ~ki · ~r)
E
(8.26)
~r = E
~ 0r cos(ωt − ~kr · ~r)
E
(8.27)
~t = E
~ 0t cos(ωt − ~kt · ~r)
E
(8.28)
Per le ipotesi fatte e facendo riferimento alla figura 8.4, θi = θr , n1 sin θi =
n2 sin θt , | ~ki |=| ~kr |= ωn1 /c, | ~kt |= ωn2 /c ed i raggi i, r e t stanno nello
stesso piano, contenente anche la normale ~un alla superficie di separazione
nel punto di incidenza, orientata verso il mezzo 2. Tale piano e’ detto piano
di incidenza. Vogliamo ricavare le relazioni tra i valori E0i , E0r e E0t nell’ipotesi che nel punto di incidenza le fasi dell’onda incidente, riflessa e rifratta
coincidano. Tale ipotesi e’ necessaria per poter applicare le condizioni al
contorno che devono valere in ogni punto della superficie e per ogni istante,
per cui la legge di variazione spazio–temporale di tutti i campi deve essere la
stessa. Supponiamo ancora che l’onda incidente sia linearmente polarizzata
~ 0i = cost ). Qualunque sia l’orientazione di E
~ 0i , potremo sempre scomporlo
(E
in due vettori, uno parallelo e l’altro ortogonale al piano di incidenza, e considerare solo queste due situazioni, senza ledere la generalità della trattazione.
8.4. LE FORMULE DI FRESNEL
125
È noto che, come conseguenza delle (6.3)– (6.6), all’interfaccia tra i due mezzi
~ e di H
~ = B/µ
~ 0 µr tangenziali, ossia
1 e 2 sono continue le componenti di E
parallele alla superficie di separazione tra i due mezzi. Nella semplificazione
~ (da notare bene
fatta (µr = 1), ciò significa le componenti tangenziali di B
la differenza rispetto a mezzi con µr 6= 1, soprattutto ferromagnetici !!).
Consideriamo separatamente i due casi.
~ 0i perpendicolare al piano di incidenza.
• A) E
Figura 8.4:
Si ricava immediatamente:
E0i + E0r = E0t
(8.29)
−B0i cos θi + B0r cos θi = −B0t cos θt
(8.30)
ricordando anche che in un mezzo materiale è B = nE/c, la (8.30)
diviene:
cos θi (E0i − E0r )n1 = n2 E0t cos θt
(8.31)
Dividendo le (8.29) e (8.31) per E0i e ponendo:
r⊥ = E0r /E0i
t⊥ = E0t /E0i
(8.32)
126
CAPITOLO 8. FIBRE OTTICHE
dove r e t rappresentano i coefficienti di riflessione e trasmissione (rifrazione) per le ampiezze, le (8.29) e (8.31) si riducono a:
1 + r⊥ = t⊥
(8.33)
n1 (1 − r⊥ ) cos θi = n2 t⊥ cos θt
(8.34)
che, risolte, forniscono:
r⊥ =
n1 cos θi − n2 cos θt
n1 cos θi + n2 cos θt
(8.35)
t⊥ =
2n1 cos θi
n1 cos θi + n2 cos θt
(8.36)
~ 0i parallelo al piano di incidenza.
• B) E
Figura 8.5:
Riferendoci ora alla figura 8.5, si verifica che si deve ora porre:
E0i cos θi − E0r cos θi = E0t cos θt
(8.37)
B0i + B0r = B0t
(8.38)
8.4. LE FORMULE DI FRESNEL
127
da cui si ricava, in maniera del tutto analoga al caso A):
rk =
n2 cos θi − n1 cos θt
n1 cos θt + n2 cos θi
(8.39)
tk =
2n1 cos θi
n1 cos θt + n2 cos θi
(8.40)
Le equazioni (8.35), (8.36), (8.39) e (8.40) costituiscono le formule di
Fresnel, applicabili in maniera generale a tutti i mezzi isotropi, omogenei e
non dispersivi. Si fa notare che esse sono applicabili alle specifiche direzioni
dei campi ipotizzati in partenza, cioè le fasi (i versi dei vettori) sono state
scelte arbitrariamente e le formule di Fresnel calcolate per quella configurazione. Nei casi A e B è stata scelta una orientazione “giusta”; se se ne
fosse scelta una sbagliata, sarebbe comparso un valore negativo per r o t,
ad indicare che uno dei campi andava ruotato di π. In particolare, nel caso
di incidenza normale alla superficie di separazione tra i due mezzi, il campo
elettrico risultera’ avere solo componente parallela ad essa e percio’ le relazioni per i coefficienti di riflessione e trasmissione saranno date dalle (8.35) e
(8.36) con cos θi = cos θt = 1. Dalla (8.35), in tal caso, si puo’ osservare
che, posto che gli indici di rifrazione di due mezzi siano diversi, n1 6= n2 , cioe’
che si abbia effettivamente una interfaccia tra mezzi otticamente differenti, si
ha comunque una componente di campo elettrico riflessa indietro, e pertanto
anche un fascio riflesso. Inoltre, se n1 < n2 , il coefficiente di riflessione r
risulta essere negativo, ad indicare che il campo elettrico dell’ onda riflessa
risulta essere sfasato di π rad rispetto a quello dell’ onda incidente. Tali
osservazioni, evidenti per incidenza normale, risultano vere anche per θi 6= 0
rad.
Le equazioni di Fresnel possono essere ancora scritte eliminando gli
indici di rifrazione n1 e n2 con la legge di Snellius–Cartesio. Si ottiene, con
qualche passaggio:
sin(θi − θt )
sin(θi + θt )
tan(θi − θt )
rk =
tan(θi + θt )
2 sin θt cos θi
t⊥ =
sin(θi + θt )
2 sin θt cos θi
=
sin(θi + θt ) cos(θi − θt )
r⊥ = −
tk
(8.41)
128
CAPITOLO 8. FIBRE OTTICHE
Delle (8.41) è particolarmente significativa ed interessante la seconda, che
permette di ricavare e definire l’angolo di Brewster. Si vede che se (θi +
θt ) = π/2, rk = 0, cioè la luce riflessa è totalmente polarizzata in un piano
perpendicolare al piano di incidenza. L’angolo di Brewster, tramite la solita
legge di Snellius–Cartesio, è dato dalla relazione:
n2
θB = arctan
(8.42)
n1
Le equazioni di Fresnel definiscono i coefficienti di riflessione e trasmissione
dei campi, mentre nelle applicazioni si è interessati ai coefficienti di riflessione
di potenza R (o riflettanza) e di trasmissione di potenza T (o trasmittanza),
definiti come:
potenza rif lessa
(8.43)
R =
potenza incidente
T =
potenza trasmessa
potenza incidente
(8.44)
Per calcolare R e T , riferiamoci alla figura (8.5), ma immaginando di
avere anzichè un raggio incidente, un fascio di luce incidente sull’interfaccia
tra i due mezzi, e che definisce su di essa un’area σ. Le sezioni dei fasci
incidente e riflesso saranno evidentemente σ cos θi e quella del fascio trasmesso
σ cos θt . Il vettore di Poynting in un mezzo materiale di indice di rifrazione
n e µr = 1 è dato dall’espressione:
~ ×B
~
~ = 1 E
S
µ0
~ 2
~|= |E| n
|S
cµ0
(8.45)
ed il valore medio su un periodo dell’ onda risulta:
2
~ |> = 1 E0 n
<| S
2 cµ0
(8.46)
La potenza media dei fasci incidente, riflesso e trasmesso sarà data
~ |> per le rispettive sezioni. Sarà quindi:
dal prodotto di <| S
~ |>r σ cos θi
<| S
E0r 2
R =
=
= r2
~ |>i σ cos θi
E0i
<| S
~ |>t σ cos θt
n2 cos θt
<| S
=
~ |>i σ cos θi
n1 cos θi
<| S
n2 cos θt 2
=
t
n1 cos θi
T =
E0r
E0i
(8.47)
2
(8.48)
129
8.4. LE FORMULE DI FRESNEL
Figura 8.6:
in cui r e t vanno intesi o con i pedici k e ⊥ oppure come una media di essi.
Si può verificare che R + T = 1 in ciascun caso. La figura 8.6 rappresenta
~ 0i perpendicolare al piano di incidenza, per
l’andamento di R e T nel caso di E
due mezzi materiali costituiti dal materiale vetroso del nocciolo e del mantello
di una fibra in cui n1 = 1.461, n2 = 1.457, tipici di fibre monomodali. È anche
evidente che per θi > θL si ha R = 1, T = 0 (riflessione totale). A questo
proposito notiamo un aspetto particolare della propagazione per riflessione
totale, che è poi forse il fattore determinante per la trasmissione in fibra
ottica. Per θi = θL l’onda trasmessa si propaga parallelamente alla superficie
di separazione e non c’è trasporto di energia attraverso la superficie stessa.
Che cosa succede per θi > θL ?
Dalla formula di Snellius–Cartesio, per θi > θL = arcsin nn12 si ricava:
sin θt =
n1
sinθi
sinθi =
>1
n2
sin θL
avendo indicato con β la quantita’ β =
complesso con un coseno immaginario:
cos θt =
q
1 − sin2 θt =
sin θt =
sin2 θi
sin2 θL
s
q
1 + β2
(8.49)
− 1 e, cioè, che θt è un angolo
s
sin2 θi
sin2 θi
1−
=
±i
− 1 = ±iβ(8.50)
sin2 θL
sin2 θL
L’ onda piana che si propaga nel secondo mezzo sarà rappresentata da un
campo elettrico:
~t = E
~ 0t ei(ωt−~km ·~r) = E
~ 0t eiω(t− v1 ~s·~r)
E
(8.51)
130
CAPITOLO 8. FIBRE OTTICHE
dove ~km è il vettore d’ onda nel mezzo di indice di rifrazione n2 , ~s è il suo
versore e v è la velocità dell’ onda nel mezzo meno rifrangente. Dato che:
s
sinθi
sin2 θi
−1 + z
2
sin θL
sin θL
z
sinθi
sin θL
~s · ~r = x cos θt + z sin θt = ±ix
(8.52)
si avrà:
h
iωt −i ±ix
~t = E
~ 0t e
E
e
~ 0t e−km
= E
x
q
q
sin2 θi
−1+
sin2 θL
sin2 θi
−1
sin2 θL
h
iω t− vz
e
i
km
sinθi
sin θL
i
(8.53)
dove si è scelto il segno negativo nell’ espressione di cosθt . Questa risulta
essere un’ onda con una ampiezza che decresce esponenzialmente al crescere
di x, che si propaga lungo z, ossia parallelamente alla superficie di separazione
tra i due mezzi; essa dunque penetra nel mezzo meno rifrangente e viene detta
onda evanescente. Si può osservare che la parte reale della fase spaziale può
ω
essere scritta, usando la (8.50), come e−xβ v , da cui si ricava che la distanza
v
λm
caratteristica di decadimento dell’ ampiezza dell’ onda è data da ωβ
= 2πβ
,
dove λm è√la lunghezza d’ onda
nel
mezzo
meno
rifrangente.
Se,
per
esempio,
√
n1 /n2 =r 2, θL = arcsin 2 = 45◦ ; per un angolo di incidenza θi = 46◦ si
2
n1
ha β =
sinθi − 1 = 0.187 e la distanza di decadimento risulta circa
n2
0.8λm .
√
Si può verificare che dalla posizione sin θt = 1 + β 2 segue che i coefficienti di riflessione diventano delle quantità complesse di ampiezza unitaria:
di conseguenza, la potenza media riflessa dall’ unità di superficie risulta uguale alla corrispondente potenza media incidente, cosicchè il potere riflettente
è R = 1. Pertanto, sebbene ci sia un’ onda al di là dell’ interfaccia, non c’é
un flusso netto di energia se mediato nel tempo. A questa stessa conclusione
si arriva anche esaminando il vettore di Poynting, che ha una componente
ortogonale alla superficie puramente immaginaria.
8.5
Propagazione modale nelle fibre ottiche
Vediamo ora di capire come avvenga la propagazione della luce in una fibra
secondo modi discreti in analogia alla guida d’onda. Riferendoci alla figura
(8.3) il cammino spezzato 2, secondo l’ottica geometrica, può essere pensato
come risultante di una propagazione lungo l’asse, caratterizzata da una costante di fase β analoga alla costante α (6.13) introdotta nelle (6.14) e (6.15)
ed una configurazione stazionaria lungo la direzione ortogonale che soddisfi
le condizioni al contorno.
8.5. PROPAGAZIONE MODALE NELLE FIBRE OTTICHE
131
Con un procedimento del tutto analogo a quello seguito per la guida
d’onda a contorno circolare, si possono esprimere i campi E0z e B0z in coordinate cilindriche e verificare che essi devono soddisfare alle due equazioni
(6.57) e (6.58). In questo caso, però, le condizioni al contorno da imporre
~ e di D
~ e quella delle
saranno la continuità delle componenti normali di B
~ e di H
~ sulla superficie di separazione tra nucleo
componenti tangenziali di E
e mantello, al posto delle (6.59) e (6.60).
L’autovalore λ viene di solito indicato con il simbolo βt , chiamato
costante di fase trasversa. Le differenze nascono ora. In questo caso, infatti,
si avranno due coppie di equazioni, una valida nel nocciolo, dove l’ autovalore
sarà dato da βt2 = ǫr1 µr1 k 2 − β 2 , e l’ altra nel mantello, dove l’ autovalore
sarà dato da βt2 = ǫr2 µr2k 2 − β 2 . La costante di propagazione assiale, β, deve
essere la stessa in entrambi i mezzi affinchè le condizioni al contorno sulla
superficie di separazione siano soddisfatte in tutti i punti e per tutti i valori
del tempo t.
Nel nocciolo si deve ottenere la propagazione di un’onda che trasporti
energia: questo comporta, da un punto di vista matematico, di richiedere
che βt sia reale, nel qual caso la soluzione fisicamente accettabile delle (6.57)
e (6.58) è data, come visto per le guide d’ onda a sezione circolare, dalle
funzioni di Bessel di prima specie Jn (βt r); nel mantello si deve ottenere la
propagazione di un’onda evanescente e questo comporta di richiedere che
βt sia immaginario, nel qual caso la soluzione fisicamente accettabile delle
(6.57) e (6.58) è data dalle funzioni modificate di Neumann Kn (βt′ r), con βt′
pari al modulo di βt , rappresentate in figura F.4 per due valori di n insieme
alle funzioni modificate di Bessel In . Appare chiaro dalla figura che solo le
funzioni di Neumann modificate possono rappresentare un’onda evanescente,
di ampiezza decrescente.
Nel nocciolo si ha allora:
βt2 = k 2 n21 − β 2 > 0, che comporta β < kn1
(8.54)
Nel mantello si ha invece:
βt2 = k 2 n22 − β 2 < 0, che comporta β > kn2
(8.55)
Cioé sarà
kn2 < β < kn1 .
(8.56)
Per ottenere le soluzioni volute occorrerà ora imporre le succitate condizioni al contorno, il che implica imporre l’eguaglianza della funzione di Bessel di ordine n ed argomento (βt r) e della funzione di Neumann modificata,
sempre di ordine n e argomento (βt′ r), per r = r1 e delle loro derivate prime
132
CAPITOLO 8. FIBRE OTTICHE
rispetto a r. Si otterranno cosı̀ due insiemi discreti di valori di n e di (βt r1 ),
radici di un sistema di equazioni trascendenti che non vengono riportate, che
permetteranno di caratterizzare i modi di propagazione guidata o modi guidati della fibra secondo una classificazione analoga a quella dei modi della
guida circolare.
Indicando con n l’ ordine delle funzioni di Bessel e di Neumann modificate che soddisfano contemporaneamente le (6.57) e (6.58) e le condizioni
al contorno, se n = 0 è possibile distinguere soluzioni di tipo T.M. e T.E.:
T.M.01 e T.E.01 che non dipendono dall’ angolo ϕ. Se, invece, n ≥ 1, le soluzioni non possono essere separate nei due gruppi T.M. e T.E., dato che sia
Ez che Bz sono sempre diversi da zero: si parla allora di modi ibridi. Nella
approssimazione di debole effetto guidante, sempre ben verificata in pratica,
che n1 ≃ n2 , ovvero che ∆ = (n1 − n2 )/n1 ≃ 0, è possibile distinguere due
gruppi di soluzioni a seconda del segno scelto per la soluzione della equazione trascendente dovuta alle condizioni al contorno. Tali gruppi sono indicati
~ è relativamente
come EH, per i cui modi la componente assiale del vettore B
~ è relativamente
forte, e HE per i cui modi la componente assiale del vettore E
forte.
I modi di propagazione in una fibra ottica possono, cosı̀ essere classificati secondo quattro classi generali: T.M.01 , T.E.01 , EHnp ed HEnp . Nei
modi ibridi, il primo pedice indica l’ ordine della soluzione, il secondo il numero d’ ordine del valore dell’ autovalore βt che permette di soddisfare le
condizioni al contorno. Tutti i modi caratterizzati da una stessa coppia di
valori di n e p hanno la stessa costante di propagazione β; la combinazione
lineare di tali modi degeneri viene detta modo linearmente polarizzato LPqp ,
con q = 1 per i modi T.M. e T.E., q = n + 1 per i modi EH e q = n − 1 per
i modi HE. Per i modi polarizzati linearmente il primo pedice rappresenta
il numero di nodi azimutali presenti nella distribuzione del campo elettrico
del modo, il secondo il numero di nodi radiali. Tali modi possono essere
identificati osservando la distribuzione della intensità luminosa in uscita da
una fibra, come indicato in figura (8.7), dove si assume che lo zero del campo elettrico al bordo estremo della distribuzione sia contato come un nodo,
cosicchè p ≥ 1, mentre per i nodi azimutali q ≥ 0.
Una quantità importante nel determinare quali modi E.M. vengano
supportati da una fibra ottica è un parametro chiamato numero d’ onda
normalizzato o anche V-number. Esso è definito come:
V = k0 · r1 · NA
(8.57)
dove k0 è il numero d’ onda nel vuoto e r1 e’ sempre il raggio del nocciolo
della fibra; il V-number rappresenta una particolare combinazione delle tre
8.5. PROPAGAZIONE MODALE NELLE FIBRE OTTICHE
133
Figura 8.7:
quantità coinvolte, caratteristica della specifica fibra considerata. Se si graficano le costanti di propagazione β in funzione del V-number, in analogia con
la figura (6.2) introdotta per le guide d’ onda, risulta semplice determinare il
numero di modi che possono essere fatti propagare in una particolare fibra.
Nella figura (8.8) tale grafico viene riportato per alcuni modi HE ed EH di
basso numero d’ ordine. Il numero di modi che si propagano è determinato
dal numero di curve che intersecano una linea verticale tracciata in corrispondenza del V-number della fibra in questione. Per fibre con V < 2.405 (si
ricorda che 2.405 corrisponde al primo zero della J0 ) solo un modo si propagherà nella fibra: questa è la regione delle fibre a singolo modo o monomodali.
La lunghezza d’ onda per la quale V = 2.405 è chiamata lunghezza d’ onda
di cut-off, λc , perchè per un particolare valore del prodotto r1 · NA, al crescere della λ della radiazione, questa è la lunghezza d’ onda alla quale tutti i
modi di ordine superiore sono esclusi in quanto per essi risulta β < kn2 , per
cui βt e’ reale e il campo non è più confinato entro il nucleo, e solo il modo fondamentale si propaga nella fibra: una fibra che propaghi solo il modo
HE11 è una fibra monomodale. Il modo di ordine più basso HE11 consiste di
due modi LP01 con direzioni di polarizzazione perpendicolari tra di loro. La
figura (8.9) riporta le costanti di propagazione dei modi LP in funzione del
134
CAPITOLO 8. FIBRE OTTICHE
Figura 8.8:
V-number. Quando V > 2.405 il modo linearmente polarizzato successivo,
Figura 8.9:
LP11 può essere supportato dalla fibra, cosicchè entrambi i modi LP01 e LP11
propagheranno la stessa frequenza. Per una fibra con V-number 3.832 (primo
zero della J1 ) si aggiungono due ulteriori modi LP: LP21 e LP02 . Si tende ora
al regime di propagazione multimodale: le fibre multimodali utilizzate nelle
telecomunicazioni hanno r1 = 25 µm e NA=0.20 o r1 = 50 µm e NA= 0.30,
cosicchè, per una radiazione con λ = 633 nm il V-number risulta essere 50
o 150 rispettivamente, cosa che corrisponde ad un elevato numero di modi
trasmessi per riflessione totale, come si può intuire pensando di estendere
opportunamente l’ asse orizzontale della figura (8.9).
Come si può osservare dalla figura (8.7), i modi di ordine maggiore
hanno una distribuzione di energia che tende via via ad allontanarsi dall’
asse della fibra; in altri termini, i raggi degli ordini superiori passano più
8.5. PROPAGAZIONE MODALE NELLE FIBRE OTTICHE
135
tempo in prossimità dell’ interfaccia nucleo-mantello ed i loro campi evanescenti si estendono maggiormente entro il mantello, causando una maggiore
attenuazione. Inoltre, se la fibra viene incurvata, i raggi con angoli grandi
rispetto all’ asse della stessa non possono più soddisfare la condizione dell’
angolo critico e non verranno riflessi totalmente all’ interno. Poichè una parte della potenza di questi modi viene irradiata entro il mantello ed aumenta
l’ attenuazione, tali modi vengono detti modi radiativi.
Nelle fibre multimodali, poi, data la compresenza di molti modi, la
dispersione modale diventa troppo elevata, almeno per fibre a salto d’indice.
È possibile ovviare a questo inconveniente abbandonando l’ipotesi, mantenuta fino ad ora, di n1 costante nel nocciolo (le soluzioni delle equazioni
di Maxwell possono essere ottenute analiticamente solo per le fibre a salto
di indice), ma ipotizzando una variazione di n1 con r tale da compensare
la dispersione modale. Esempi di graduazione dell’indice di rifrazione sono
riportati in figura 8.10.
Figura 8.10:
Da notare che si tende a lasciare sempre una piccola discontinuità
in corrispondenza all’interfaccia nocciolo–mantello, per avere comunque una
trasmissione per modi. Ricordando l’approssimazione dell’iconale, è possibile
immaginare che i raggi luminosi percorrano traiettorie come quelle indicate
in figura 8.11. Più i raggi si allontanano dall’asse della fibra e più aumenta
la loro velocità , in quanto si trovano in zone in cui n1 è localmente minore.
Sarebbe possibile , utilizzando l’equazione dell’iconale, trovare una forma di
n(r) per cui tutti i raggi impiegano lo stesso tempo e quindi la dispersione
modale è nulla. Si fa notare che, siccome ad un indice di rifrazione minore
per r maggiori corrisponde anche un angolo di rifrazione maggiore, in questa
ipotesi, più che di una trasmissione risonante, sarebbe il caso di parlare di
una lente continua che esercita una sorta di “focheggiamento” continuo del
fascio luminoso. È evidente che la realizzazione di una guida multimodale ad
“indice graduato perfetto” è impossibile, e anche una graduazione semplice,
come quella lineare rappresentata in figura 8.10 b), e che pure si dimostra
136
CAPITOLO 8. FIBRE OTTICHE
Figura 8.11:
molto efficiente (è in grado di diminuire la dispersione modale di 3 ordini
di grandezza), comporta costi economici di realizzazione molto elevati. Per
questo motivo le fibre multimodali hanno applicazioni soprattutto per la trasmissione di immagini e di segnali (laser) su piccole distanze lungo cammini
curvi (endoscopie, microchirurgia).
Le fibre monomodali, a semplice salto d’indice, sono invece ideali per
la trasmissione a lunga distanza, in cui una dispersione modale minima è un
requisito fondamentale. Anche il loro costo di fabbricazione è contenuto.
Capitolo 9
Ottica coerente
9.1
Elementi di Ottica coerente
Si è visto nei capitoli 6, 7 e 8 l’importanza dei fenomeni di risonanza nella
produzione, trasmissione ed utilizzazione delle onde E.M.. L’utilizzo di sistemi risonanti ottimizza le prestazioni, rispetto a quanto si otterrebbe con
l’uso di sistemi non–risonanti. Ci si può chiedere se l’utilizzo di sistemi risonanti rappresenti quanto di meglio si possa ottenere o se esistano ancora
altre peculiarità, non ancora prese in esame, delle onde E.M. che potrebbero
ulteriormente ottimizzare la risposta degli strumenti progettati per diversi
scopi. La risposta è affermativa e la proprietà che non abbiamo ancora preso
in esame è la cosiddetta coerenza, cioè l’effetto di un’onda E.M. su diversi
sistemi elementari (atomi) con una fase costante. In effetti, abbiamo sempre
trascurato nelle trattazioni precedenti la fase iniziale, in quanto ininfluente.
Nelle operazioni di media eseguite per valutare gli effetti misurabili (vettore
di Poynting, Lorentziana, ...) non resta traccia della fase iniziale. Il risultato più spettacolare ottenuto con l’applicazione simultanea dei fenomeni di
risonanza e coerenza è stato ottenuto nella costruzione di generatori di onde
E.M. (MASER nel campo delle microonde, LASER nel campo dell’infrarosso, visibile, ultravioletto) che non possono essere descritti in questo Corso
in quanto necessitano di elementi di Meccanica Quantistica. Le onde emesse
(ci limiteremo al campo del visibile) hanno intensità e soprattutto coerenza
di ordini di grandezza superiori a quelli delle normali sorgenti luminose e
mentre l’aspetto “intensità” è facilmente spiegabile nelle applicazioni come
metodo della forza bruta, l’aspetto coerenza è più interessante dal punto di
vista fisico.
Tratteremo quindi alcuni problemi in cui l’uso di luce coerente permette di ottenere risultati inaspettati. L’interferenza luminosa, assieme alla
137
138
CAPITOLO 9. OTTICA COERENTE
diffrazione, è la manifestazione più caratteristica della natura ondulatoria della luce. Rispetto ad altri fenomeni di propagazione ondosa (tipo il suono), la
realizzazione di dispositivi interferenziali ottici è peraltro più complessa, proprio per l’impossibilità di ottenere due sorgenti luminose, monocromatiche,
che emettano le onde luminose agganciate in fase. Ciò è legato alla natura
stessa delle sorgenti luminose. Un fascio luminoso proveniente da una sorgente monocromatica S è in realtà la sovrapposizione di un numero enorme di
treni d’onda elementari, la cui lunghezza ct (o ct/n se in un mezzo materiale)
è di circa 3 m, in relazione al fatto che il tempo in cui viene emesso tale treno
d’onde è 10−8 s, il tempo tipico di diseccitazione di un atomo. I processi di
emissione di atomi eguali, ma appartenenti a sorgenti diverse, sono scorrelati,
e quindi i treni d’onda provenienti dalle due sorgenti sono privi di qualsiasi
relazione di fase costante. Le sorgenti sono cioè incoerenti. Il trucco per ottenere due sorgenti luminose coerenti è quello di ottenere, tramite opportuni
sistemi ottici, due immagini virtuali S1 e S2 della stessa sorgente S, che a
questo punto diventano coerenti in quanto ogni treno d’onda emesso da S
viene diviso in due treni d’onda che, percorrendo cammini ottici diversi, si
incontrano in un punto dando luogo a fenomeni interferenziali.
É noto che in un P punto in cui si incontrino due raggi luminosi
provenienti da S1 e S2 sarà:
E~1 = E~01 cos(ωt − ~k · ~r1 )
(9.1)
E~2 = E~01 cos(ωt − ~k · ~r2 )
(9.2)
dove ~r1 è la distanza del punto P misurata dalla sorgente S1 e ~r2 quella dalla
sorgente S2 . Poichè si sta osservando la sovrapposizione dei due campi in P ,
~k · ~r1 e ~k · ~r2 sono due costanti. Per il principio di sovrapposizione si avrà che
il campo elettrico risultante sarà la somma di (9.1) e (9.2):
~ 02 cos(ωt − ~k · ~r2 )
~ = E~01 cos(ωt − ~k · ~r1 ) + kE
E
(9.3)
L’intensità del campo nel punto considerato sarà proporzionale al quadrato
della (9.3) ed è noto che, a causa del doppio prodotto, l’intensità non sarà
costante al variare del punto di intersezione dei
q raggi considerato, ma, supponendo E01 e E02 uguali, varierà tra 4I0 = 4 (ǫ0 /µ0 )E02 /2 e 0. Si avrà un
massimo quando | ~r1 − ~r2 | è uguale ad un multiplo pari di λ/2, un minimo quando è uguale ad un multiplo dispari di λ/2. È da notare che, in un
dispositivo interferenziale con S sorgente tradizionale, | ~r1 − ~r2 | non deve
essere maggiore di 3 m, altrimenti i trenini elementari andrebbero fuori fase.
Le caratteristiche degli interferometri più comuni (specchi di Fresnel, fenditure di Young, interferometro di Newton, interferometro di Michelson) sono
9.1. ELEMENTI DI OTTICA COERENTE
139
compendiate in figura 9.1 che aiuta anche a capire perchè, a seconda delle
diverse sistemazioni, si osservino fenomeni apparentemente diversi (anelli,
frange diritte, frange storte).
I massimi e i minimi di interferenza, costruiti attorno alle due sorgenti
virtuali S1 e S2 , sono iperboloidi di rotazione con i fuochi nelle due sorgenti,
e con equazione | ~r1 − ~r2 | = 2kλ/2 per i massimi e | ~r1 − ~r2 | = (2k +
1)λ/2 per i minimi. La figura 9.1 mostra in maniera pittorica una sezione
di tali iperboloidi con un piano che contiene le due sorgenti S1 e S2 (le
curve continue indicano gli iperboloidi corrispondenti ai massimi di intensità,
quelle tratteggiate gli iperboloidi corrispondenti ai minimi); osservandola si
può comprendere come, a seconda delle diverse sistemazioni, si osservino
fenomeni apparentemente diversi (anelli, frange diritte, frange storte). Un
interferometro, infatti, intercetterà, generalmente in un piano, una frazione
di queste famiglie di iperboloidi e la figura di interferenza osservata varierà
a seconda della posizione di questo piano. Nell’interferometro di Newton il
piano di osservazione è ortogonale alla retta S1 S2 e quindi si osserveranno
delle circonferenze; in quello di Young il piano è parallelo alla retta S1 S2
e quindi si osserveranno degli archetti, approssimabili a segmenti; per gli
specchi di Fresnel il piano è sghembo rispetto alla retta S1 S2 e perciò si
osserveranno ancora degli archetti. Il caso più importante è però quello
dell’interferometro di Michelson, che verrà descritto in dettaglio nel seguito.
Figura 9.1:
140
9.2
CAPITOLO 9. OTTICA COERENTE
L’interferometro di Michelson
Di tutti i dispositivi interferenziali escogitati, l’interferometro di Michelson
è certamente il più ingegnoso ed utile in molti esperimenti di Fisica fondamentale ed applicata. Il vantaggio principale di questo interferometro è che
esso è in grado di misurare spostamenti di oggetti materiali dell’ordine di
qualche 10−8 m. Con l’avvento dei laser, in grado di fornire treni d’onda
di lunghezza superiore di 103 − 104 ordini di grandezza rispetto alle normali
sorgenti luminose, l’interferometro di Michelson è diventato uno strumento
di routine per misure di precisione in diverse branche delle scienze pure ed
applicate. Ideato allo scopo di eseguire una misura fondamentale di Fisica
(l’esistenza dell’etere) esso continua ad essere utilizzato per ambiziosi esperimenti di Fisica fondamentale (l’esperimento VIRGO, che dovrebbe rivelare
l’esistenza di onde gravitazionali). Descriviamo il principio di funzionamento
dello strumento, schematizzato in figura 9.2.
Figura 9.2:
La sorgente luminosa S è posta nel fuoco di una lente, o di un sistema
ottico centrato più complesso, che trasforma i raggi luminosi in un fascio
parallelo. Il fascio incide su una lastra piana parallela con la superficie posteriore debolmente metallizzata, sı̀ da fungere da specchio semiriflettente,
che è chiamato divisore del fascio. Il divisore trasforma il fascio incidente in
due fasci, di eguale intensità (più o meno!), uno riflesso e l’altro trasmesso,
che si propagano in direzioni ortogonali. I due fasci incontrano a distanze
d1 e d2 dal centro del divisore, due specchi piani ortogonali ai fasci, P1 e
9.2. L’INTERFEROMETRO DI MICHELSON
141
P2 , totalmente riflettenti. I fasci riflessi ripercorrono all’indietro i cammini,
riattraversano il divisore, questa volta con sorte opposta (il fascio S1 , che
prima era stato trasmesso, ora viene riflesso, e l’opposto accade per il fascio
S2 ) e, con intensità pari al 25% del fascio iniziale S, si sovrappongono dando
luogo a fenomeni di interferenza osservabili col cannocchiale C.
Esaminiamo anzitutto che cosa ci aspettiamo come figure di interferenza. Supponiamo di disporre di un interferometro di Michelson ideale, cioè
senza aberrazioni, distorsioni, ecc.. Ricordando la figura 9.1 è facile riconoscere che stiamo osservando all’infinito, l’interferenza di due sorgenti virtuali
coerenti poste all’infinito, ad una distanza relativa d1 − d2 . Se d1 = d2 , si
dovrebbe osservare interferenza costruttiva all’infinito e quindi un massimo
di intensità luminosa. Ad essere pignoli, in questa situazione non si ha lo
stesso cammino ottico (il fascio S1 attraversa la lastra del divisore una volta,
il fascio S2 tre volte) ma la configurazione può essere corretta in modo da
eliminare, o per lo meno ridurre il più possibile le differenze tra i due cammini
(inserendo una lastra trasparente dello stesso materiale e spessore del divisore
lungo il tratto tra il divisore e P1 , per esempio). In realtà, sperimentalmente,
è molto più semplice montare lo specchio P1 (o P2 ) su un dispositivo a viti
micrometriche che permette di variare la distanza d1 . Si osserverà cosı̀ il
passaggio da campo chiaro a campo oscuro per uno spostamento di λ/4.
In realtà questo metodo non è il più sensibile, perchè l’occhio umano
o altro strumento di misura dell’intensità luminosa non è molto sensibile
al valore assoluto dell’intensità. È più conveniente inclinare leggermente la
superficie di P2 ed ottenere un sistema di frange chiare e scure sull’oculare
del cannocchiale. È intuitivo capire che, spostando uno specchio di λ/4, si
otterrà lo spostamento del sistema di frange: dove c’era una frangia chiara
ora ci avrà una frangia scura.
La limitazione dell’interferometro di Michelson con S sorgente tradizionale sta nel fatto che | d1 − d2 |< 3 m, altrimenti non si otterrà più
l’interferenza dei due trenini d’onda ottenuti dal divisore. I due bracci devono essere eguali (o quasi) e questo limitava l’uso a misure di laboratorio,
ben termostato. Variazioni termiche locali nei due bracci possono comunque
falsare i risultati delle misure. Con treni d’onda dell’ordine del km è possibile
osservare fenomeni interferenziali con | d1 − d2 |< 1 km. Il braccio con S1
quindi può essere costituito da uno specchio S1 molto vicino al divisore e ad
esso solidale. S2 può essere, invece, piazzato a grande distanza (ad es. su
una diga, per studiarne le deformazioni, o sul terreno, per studiare le maree
terrestri).
142
9.3
CAPITOLO 9. OTTICA COERENTE
L’esperimento di Michelson e Morley
L’ipotesi di Maxwell e di tutti i fisici dell’epoca (seconda metà ’800) era che
dovesse esistere un mezzo materiale, chiamato etere (o etere luminifero) che
era il supporto materiale delle onde E.M.. L’etere pervadeva tutto lo spazio e
l’ipotesi più plausibile era che fosse solidale con il sistema delle stelle fisse. La
Terra, nel suo moto di rivoluzione attorno al Sole, con velocità v ≃ 30 km/s,
si muoveva quindi con velocità v rispetto all’etere, mentre la luce si propagava
con velocità c rispetto all’etere indipendentemente dal fatto che la sorgente
fosse in quiete o meno rispetto ad esso.
Questo ultimo aspetto è una conseguenza delle EqM, le quali prevedono l’ esistenza di onde E.M. che si propagano con la stessa velocità in tutte
le direzioni in un mezzo omogeneo (c o c/n) senza esplicitare una dipendenza
dall’ eventuale stato di moto della sorgente che le emette. Proprio questo
aspetto contrasta con quanto previsto dal Principio di relatività galileiana,
per il quale vale la legge di composizione delle velocità in meccanica classica.
L’ ipotesi della esistenza dell’ etere poneva l’ elettromagnetismo come una
branca a parte della Fisica e implicava che le sue leggi non fossero invarianti
per trasformazioni galileiane. Dal punto di vista di tali trasformazioni, sarebbe dunque dovuto esistere un sistema di riferimento privilegiato, l’ etere
appunto, nel quale la velocità della luce nel vuoto risultasse essere c e, di conseguenza, in altri sistemi di riferimento la velocità della luce avrebbe dovuto
essere diversa da c.
Un considerevole numero di fatti sperimentali condussero all’ abbandono dell’ ipotesi dell’ etere ed alla nascita della relatività speciale (Einstein
1905). Fra questi fatti si possono citare l’ aberrazione della posizione di una
stella nel corso dell’ anno, l’ esperimento di Fizeau sul trascinamento della luce in un fluido in moto (1859), che qui non verranno descritti, ma soprattutto
l’ esperimento di Michelson e Morley, descritto brevemente nel seguito.
Disponendo di uno strumento molto sensibile (l’interferometro di Michelson) doveva essere possibile misurare la velocità della Terra v rispetto
all’etere solidale con il Sole (il cosiddetto vento d’etere), sfruttando l’ effetto
che tale v avrebbe dovuto produrre sulla velocità di propagazione della luce
rispetto ad un osservatore solidale con la Terra e quindi non con il sistema
privilegiato dell’ etere. Supponiamo di orientare l’interferometro in modo che
esso si muova lungo la retta DP1 con velocità v e sia ∆t1 il tempo impiegato
dalla luce a percorrere la distanza DP1 D per un osservatore solidale all’interferometro. La luce si propaga rispetto all’etere con velocità c nel tratto DP1
e l’apparato si muove lungo la stessa direzione con velocità v. La velocità
della luce relativa all’apparato è (c − v) e il tempo impiegato a percorrere la
distanza l è l/(c − v). Abbiamo, per semplicità, posto d1 = d2 = l. L’opposto
9.3. L’ESPERIMENTO DI MICHELSON E MORLEY
143
accade nel percorso di ritorno P1 D, la velocità della luce relativa all’apparato
è (c+v) ed il tempo l/(c+v). Il tempo totale impiegato dalla luce per andare
da D a P1 e poi tornare in D per l’osservatore solidale con l’interferometro
sarà quindi:
∆t1 =
l
l
2l
1
+
=
c−v
c+v
c 1 − v22
c
(9.4)
Da notare che, se l’apparato fosse fermo rispetto all’etere, ∆t1 sarebbe 2l/c.
Determiniamo ora il cammino percorso dal raggio DP2 D ed il tempo ∆t2
impiegato a percorrerlo rispetto all’osservatore.
In figura 9.3 sono rappresentate tre posizioni di D e P2 , indicate con
gli apici, corrispondenti agli istanti in cui la luce lascia il punto D, raggiunge
lo specchio nel punto P2′ e quindi ritorna in D ′′ .
Figura 9.3:
Osservando che:
c2
∆t2
2
2
= v2
∆t2
2
2
+ l2
(9.5)
si ha:
∆t2 = √
2l
2l
1
=
2
c 1 − v2 1/2
−v
2
c
(9.6)
c2
La differenza tra i tempi impiegati nei due percorsi ∆τ = ∆t1 − ∆t2 è:
∆τ = ∆t1 − ∆t2

2l 
v2
=
1− 2
c
c
!−1
v2
− 1− 2
c
!−1/2 

(9.7)
144
CAPITOLO 9. OTTICA COERENTE
Poichè v/c << 1 sviluppando le parentesi in serie binomiale arrestata al
secondo termine si ha:
2l
∆τ =
c
"
v2
1 + 2 + ...
c
!
−
v2
1 + 2 + ...
2c
!#
=
lv 2
c3
(9.8)
Se l’interferometro, che in alcuni esperimenti galleggiava in una vasca di
mercurio per evitare le più piccole vibrazioni che avrebbero potuto inficiare i risultati, viene ruotato di π/2, il cammino DP2 D diventa parallelo a v
e DP1 D ortogonale. Anche il ritardo tra le due onde che arrivano al cannocchiale è invertito. Questo provoca uno sfasamento tra le onde che interferiscono e i massimi (e minimi) si spostano. L’esperimento, in sostanza,
consiste nell’osservare uno spostamento delle frange, quando si ruota di π/2
l’apparato.
La variazione della differenza di tempo è 2∆τ , che corrisponde ad uno
spostamento di frange 2∆τ /T = 2∆τ c/λ. La variazione ∆N del numero di
frange è quindi:
2l
2∆τ
=
∆N =
T
λ
2
v
c
(9.9)
Nel caso del primo esperimento di Michelson e Morley si aveva l = 11 m
(ottenuti mediante riflessioni multiple) e λ = 590 nm e quindi ci si aspettava
uno spostamento di frange ∆N ∼ 0.4, con una precisione dello strumento
σ∆N di circa un ordine di grandezza inferiore. Tale spostamento non fu
osservato, contraddicendo la teoria dell’etere: in qualche punto della sua
orbita la Terra ha una velocità rispetto all’ etere di almeno 104 m/s (la sua
velocità orbitale) che l’ apparato avrebbe dovuto rilevare! Ma non fu neanche
osservato ∆N ∼ 0, come viene spesso riportato nei libri, bensı̀ ∆N ∼ 0.15!
Il motivo era che non si erano tenuto in conto tanti fattori correttivi, tipo il
moto di rotazione della Terra,... L’esperimento resta, comunque, una pietra
miliare nella storia della Fisica.
Una possibilità di riconciliare l’ osservazione sperimentale con l’ ipotesi
dell’ etere è quella del trascinamento dell’ etere da parte della Terra, ma
questa a sua volta è in contraddizione con le misure di aberrazione. Tra i
vari tentativi di salvare l’ ipotesi dell’ etere si può ricordare quello dovuto
a Fitz Gerald e Lorentz (1892) che postularono una contrazione ad hoc dei
corpi materiali al passaggio attraverso l’ etere, con conseguente dilatazione
dei tempi, secondo leggi che derivano, invece, direttamente dai postulati di
relatività speciale di Einstein.
Si può ancora ricordare che nel 1904 Lorentz dimostrò la curiosa proprietà delle EqM di essere invarianti non per le trasformazioni di Galileo
ma per quelle che sono ora note come trasformazioni di Lorentz; poco dopo,
9.4. LA MASSA APPARENTE DEI FOTONI
145
Poincarè dimostrò che tutte le equazioni della elettrodinamica sono invarianti
per tali trasformazioni (cioè anche la carica e la densità di corrente).
Quasi allo stesso tempo, ma senza basarsi su una discussione della
sola elettrodinamica, Einstein (1905) mostrava che due postulati generali
sono in grado di risolvere tutte le apparenti contraddizioni tra le leggi della
meccanica e dell’ elettromagnetismo, sbarazzando allo stesso tempo il campo
dallo scomodo etere. Il primo di tali postulati è il postulato di relatività: tutti
i sistemi inerziali sono equivalenti per la formulazione di tutte le leggi fisiche.
Tale principio rende superfluo il concetto di etere che, se esistesse, dovrebbe
privilegiare un sistema di riferimento (inerziale o no) rispetto al quale uno
potrebbe mettere in evidenza il moto di tutti gli altri sistemi inerziali contro,
appunto, al principio di relatività. Diventa cosı̀ del tutto irrilevante se l’
etere esista o meno perchè comunque la sua esistenza non sarebbe rilevabile,
il che vuol dire che esso da un punto di vista fisico non esiste.
Il secondo postulato di Einstein è il postulato della costanza della velocità della luce: tutti gli osservatori, anche quando animati di moto relativo
uniforme, trovano sempre lo stesso valore c per la velocità delle luce nel vuoto.
Tale postulato è indispensabile per arrivare alle trasformazioni di Lorentz.
A partire da tali trasformazioni discende poi la necessita’ di promuovere la
velocita’ della luce nel vuoto a velocita’ limite universale di tutte le velocita’
effettive come conseguenza della richiesta di causalita’. Tale condizione costituisce una formulazione alternativa ed equivalente del secondo postulato
di Einstein.
9.4
La massa apparente dei fotoni
Si era visto nel paragrafo 3.3 che si poteva attribuire, per analogia con il caso
meccanico, ad un’onda E.M., o meglio ad un fotone, una massa inerziale:
m=
W
hν
= 2
2
c
c
(9.10)
La circostanza passò praticamente inosservata, assieme a tante altre, finchè
Einstein reinterpretò tutte le relazioni alla luce della teoria della relatività
generale. Senza entrare nel merito di questa teoria, oggetto di corsi avanzati, un fotone che “cade” sulla superficie terrestre da un’altezza h dovrebbe
presentare un incremento di energia (shift violetto) pari a:
∆E = gh
E
c2
(9.11)
146
CAPITOLO 9. OTTICA COERENTE
in cui si è fatta l’ipotesi dell’equivalenza della massa inerziale del fotone
(9.10) con la sua massa gravitazionale. L’incremento percentuale di energia
corrisponde ad un incremento percentuale di frequenza dato da:
∆E
h∆ν
∆ν
gh
=
=
= 2 = 1.09 · 10−16 h
(9.12)
E
hν
ν
c
dove h sia espresso in metri. In un tipico esperimento di laboratorio h può
valere h = 10 m e, dalla (9.12) appare chiaro che è necessario misurare delle
variazioni percentuali di frequenza dell’ordine di 10−15 per poter verificare
l’effetto. Da un punto di vista sperimentale è impossibile pensare di poter
misurare delle variazioni percentuali di frequenza cosı̀ piccole, in tutto il
campo di frequenze delle onde E.M., a meno che non ci sia un fenomeno
fisico specifico che sia sensibile a variazioni cosı̀ piccole.
Nel 1958 venne scoperto un fenomeno che presentava una sensibilità
intrinseca di ∼ 10−12 a variazioni di frequenza, l’effetto Mössbauer, e mediante esso fu possibile verificare sperimentalmente in laboratorio lo shift violetto
dei fotoni in un campo gravitazionale (esperimento di Pound e Rebka, 1960).
Accenniamo brevemente all’effetto Mössbauer, dal nome del suo scopritore, che può anche essere definito come: “assorbimento risonante nucleare di
fotoni senza rinculo”.
Per capire il fenomeno in modo abbastanza intuitivo, cominciamo con
il considerare con un po’ più di attenzione il fenomeno dell’emissione e dell’assorbimento di un fotone di energia hν da parte di un sistema quantistico
elementare (un atomo o un nucleo) a due livelli, quale quello schematizzato
in figura 9.4.
Figura 9.4:
Supponiamo all’inizio che i due livelli energetici siano perfettamente
definiti in energia ed indichiamo con ∆Etr la differenza di energia tra di essi,
9.4. LA MASSA APPARENTE DEI FOTONI
147
∆Etr = E2 − E1 . L’emissione di un fotone dallo stato 2 allo stato 1 viene
abitualmente associata all’equazione:
∆Etr = E2 − E1 = hν
(9.13)
che corrisponde alla semplice conservazione dell’energia. Non si deve però
dimenticare che bisogna anche conservare la quantità di moto totale del sistema, di massa M, e che quindi una parte, molto piccola, di ∆Etr viene
“sprecata” per conservare la quantità di moto e non si ritrova sottoforma di
energia E.M. (fotone). Indicando con Ef l’energia del fotone e con R l’energia
di rinculo del sistema, la formulazione corretta del fenomeno è descritta dal
sistema di equazioni:
∆Etr = Ef + R
pf = pR
(9.14)
dove pf = hν/c = Ef /c.
Si ricava:
p2f
Ef2
p2R
R=
=
=
2M
2M
2Mc2
(9.15)
Poichè R << Ef , dalla (9.10), la (9.15) si può anche riscrivere come:
R≃
(∆Etr )2
2Mc2
(9.16)
La situazione opposta si verifica per l’assorbimento, in quanto Ef deve
non solo compensare ∆Etr , ma fornire anche la quantità di moto necessaria
alla conservazione, dato che il sistema assorbente è inizialmente fermo.
Abbiamo per ora considerato il fenomeno indifferenziato a seconda che
si trattasse di una transizione atomica (∆Etr ∼ 1 eV ) o nucleare (∆Etr ≥
10 keV ). In realtà il fenomeno si osserva molto facilmente nel caso atomico
(si ricordino gli spettri di assorbimento di una luce “bianca”), e non nel caso
nucleare. Perchè? Bisogna anzitutto tenere conto che, se ∆Etr fosse perfettamente definito non osserveremmo mai l’assorbimento risonante. Infatti in
emissione Ef < ∆Etr , anche se di pochissimo, in assorbimento Ef > ∆Etr ,
sempre di pochissimo.
La natura ci aiuta nel caso atomico. Lo stato E2 non è stazionario
(decade!) e quindi sappiamo, dal principio di indeterminazione di Heisenberg,
che, detta Γ l’indeterminazione sull’energia (si ricordi il dipolo smorzato!),
vale la relazione:
Γτ ≥ h̄ = 1.056 · 10−34 Js
(9.17)
148
CAPITOLO 9. OTTICA COERENTE
Assumendo come valore tipico di τ per le transizioni atomiche (ottiche) τ ∼ 10−8 s, dalla (9.17) si ottiene Γ ≃ 6.6 · 10−8eV .
Calcoliamoci ora dalla (9.16) quant’è R, per una transizione ottica
in cui ∆Etr = 1 eV e per un atomo di numero di massa A=100, per cui
supponiamo che 2Mc2 = 2 · 102 · 109 eV (si è supposto per semplicità che la
massa di un nucleone sia Mn = 109 eV). Si ottiene
R=
1
eV = 5 · 10−12 eV
11
2 · 10
(9.18)
cioè R << Γ. Gli spettri del fotone emesso e di quello assorbito non risentono
quindi dell’effetto dell’energia di rinculo.
Nel caso nucleare τ e ∆Etr possono variare di diversi ordini di grandezza (∼ 5 per τ , ∼ 3 per ∆Etr ) e la fenomenologia non è delle più semplici,
comunque oggetto di Corsi specialistici. Qui faremo un esempio numerico che, implicitamente, si riferisce alla transizione nucleare più nota nella
spettroscopia Mössbauer, quella del 57 F e, riportata nel dettaglio in seguito.
Per estrema semplicità assumiamo τ ∼ 10−8 s e ∆Etr = 10 keV, e quindi
R = 5 · 10−4 eV.
Abbiamo ora R >> Γ, quindi gli spettri di emissione e di assorbimento
non si sovrappongono e il fenomeno non avviene. La figura 9.5 rappresenta
graficamente queste osservazioni.
Per fare avvenire il fenomeno dell’assorbimento risonante è necessario
fornire al fotone emesso un’energia maggiore, pari a 2R ≃ 10−3 eV e ciò può
essere fatto spalmando la sorgente radioattiva che emette il fotone su un disco
rotante e osservando l’asorbimento in direzione tangenziale. L’incremento di
energia 2R è dato, ricordando l’effetto Doppler, da 2R = ∆E v/c, quindi
esso si produce per una velocità tangenziale tale che v/c ∼ 10−7 . Oppure si
può ottenere l’incremento di energia sfruttando il fatto che un aumento di
temperatura della sorgente e dell’assorbitore corrisponde ad un incremento
dell’energia cinetica media degli atomi e quindi ad una probabilità maggiore
di osservare il fenomeno. La figura 9.6 schematizza le due differenti possibili
modalità di operazione. Tralasciando tutti i dettagli, si può dire che aumentando T si sarebbe dovuto osservare un aumento dell’effetto di assorbimento
risonante. Ciò venne effettivamente verificato in vari laboratori, senza che
il fenomeno, previsto, suscitasse particolare interesse. Mössbauer, nel 1957,
scoprı̀ che nel caso della transizione γ da 129 keV nel 191 Ir si verificava un
effetto opposto; diminuendo la temperatura (∼ 20 K) l’assorbimento risonante aumentava anzichè diminuire. Questo fenomeno venne denominato
effetto Mössbauer.
La spiegazione intuitiva dell’effetto Mössbauer consiste nell’ipotizzare
che, in una certa percentuale di casi, sia nell’emissione che nell’assorbimento
9.4. LA MASSA APPARENTE DEI FOTONI
149
Figura 9.5:
risonante, il nucleo emettitore e quello assorbitore non si comportino come
nuclei isolati per quanto riguarda la conservazione della quantità di moto,
come sembrerebbe logico, ma è tutta la matrice cristallina a cui appartengono
a contribuire alla conservazione. Quantitativamente, non bisogna utilizzare
Mn c2 a denominatore della (9.16), ma Mn c2 · 10x con x pari ad almeno 15
(cioè un granulo di materiale contenente almeno 1015 atomi). In questo caso
R risulta 1015 volte più piccolo e quindi molto inferiore a Γ. Le linee di
emissione e di assorbimento quindi coincidono e l’assorbimento risonante si
verifica. L’interesse per l’effetto Mössbauer “esplose” sia nel campo della
Fisica fondamentale che di quella applicata con la scoperta, nel 1959, che
anche la transizione γ da 14.4 keV del 57 F e presentava un assorbimento
risonante, a temperatura ambiente, e in modo molto pronunciato. Ciò aprı̀
la strada ad una lunga serie di esperimenti, che continua tuttora, di cui il più
spettacolare è quello relativo allo shift violetto dei fotoni, eseguito da Pound
e Rebka nel 1960.
150
CAPITOLO 9. OTTICA COERENTE
Figura 9.6:
Premettiamo una brevissima introduzione di carattere sperimentale,
descrivendo una semplice misura di trasmissione, schematizzata nella figura 9.7. Supponiamo che i nuclei di 57 F e emettitori (sorgente radioattiva)
e assorbitori siano contenuti nella stessa matrice cristallina ed alla stessa
temperatura. Il rivelatore R misurerà l’intensità del fascio di γ emessi dalla
sorgente e trasmessi (cioè non assorbiti) dall’assorbitore. Supponiamo ora,
invece, che l’assorbitore sia piazzato su un carrellino che si muove con velocità costante v. Se v 6= 0 l’assorbitore vedrà fotoni non più di energia hν,
ma h(ν + ∆ν), con ∆ν = ±v/c a seconda del verso di ~v , e quindi andrà fuori
risonanza lasciando passare un numero maggiore di fotoni (alla risonanza i
fotoni vengono assorbiti di più e poi riemessi in tutte le direzioni). La larghezza della curva sperimentale della trasmissione in funzione di v permette
di risalire immediatamente alla larghezza intrinseca Lorentziana della linea.
Si trovò, per il 57 F e, ∆ν/ν = 1.13 · 10−12 ; bastava una velocità relativa v di
qualche centesimo di mm/s per andare fuori risonanza!
9.4. LA MASSA APPARENTE DEI FOTONI
151
Figura 9.7:
Ecco quindi un fenomeno fisico sensibile a variazioni di frequenza che
si avvicinavano a quelle richieste per la misura dello shift violetto dei fotoni
nel campo gravitazionale. In realtà bisogna ancora guadagnare tre ordini di
grandezza (da 10−12 a 10−15 ) e ciò fu ottenuto con l’artificio sperimentale
di osservare la variazione della curva Lorentziana di risonanza non al centro
del picco (tangente orizzontale, sensibilità minima), ma circa a mezza altezza (tangente al massimo dell’inclinazione, sensibilità massima). Sorgente ed
assorbitore di 57 F e erano posti verticalmente ad una distanza di circa 20 m e
fu verificata sperimentalmente in laboratorio, con un errore del 10%, la previsione della relatività generale circa lo shift violetto dei fotoni che “cadono”
sulla Terra. In seguito l’esperimento fu ripetuto, con lo stesso errore, su una
lunghezza di caduta di soli 2 m.
152
CAPITOLO 9. OTTICA COERENTE
9.5
Coerenza di un’onda E.M.
9.5.1
Coerenza spaziale e temporale
Considerando l’espressione della fase di un’onda E.M. si suole parlare di
coerenza spaziale e coerenza temporale.
• Coerenza spaziale.
Dati due punti P1 e P2 del fronte d’onda al tempo t0 di un’onda E.M.,
si indichino con E1 e E2 i rispettivi campi elettrici. Per definizione di
fronte d’onda, la differenza di fase tra i due campi elettrici al tempo
t0 sarà zero. Se tale differenza di fase rimane zero a qualsiasi istante
t, i due punti si diranno coerenti. Se questo avviene qualunque siano i
due punti sul fronte d’onda, si dirà che l’onda E.M. possiede coerenza
spaziale perfetta. In realtà per un qualsiasi punto P1 il punto P2 deve
essere contenuto entro un’area finita S contenente P1 . In questo caso
si dirà che l’onda possiede coerenza spaziale parziale e per ogni punto
P si può introdurre un’area di coerenza opportunamente definita.
• Coerenza temporale.
In un generico punto P dello spazio si consideri il campo elettrico dell’onda E.M. al tempo t ed al tempo (t + τ ). Se la differenza di fase tra
E(t) ed E(t + τ ) rimane costante per qualunque t e se questo avviene
per 0 ≤ τ ≤ τ0 , si dirà che l’onda E.M. possiede coerenza temporale
parziale con un tempo di coerenza pari a τ0 ; se, invece, la differenza di
fase rimane costante anche per qualunque valore di τ , si dice che l’onda
E.M. possiede coerenza temporale perfetta. Un esempio di onda E.M.
coerente per un tempo τ0 è indicato in figura 9.8: in essa è rappresentato un campo elettrico di tipo sinusoidale con salti di fase ad ogni
intervallo di tempo in media pari a τ0 .
È facile capire che un’onda la cui fase vari uniformemente nel tempo
risulterà avere coerenza temporale perfetta, mentre un’onda la cui fase varia
in modo non uniforme con il tempo, per esempio a causa di salti improvvisi nel
valore della fase iniziale, come indicato nella figura 9.8, o a causa di mutazioni
repentine della frequenza, possiederà coerenza temporale limitatamente agli
intervalli di tempo τ0 nei quali la sua fase ha un andamento uniforme.
È bene notare che i due concetti di coerenza spaziale e temporale sono
distinti e che, ad esempio, un’onda E.M. può possedere una parziale coerenza
temporale pur essendo perfettamente coerente da un punto di vista spaziale.
Se, infatti, la stessa onda di figura 9.8 rappresenta sia il campo elettrico in
9.5. COERENZA DI UN’ONDA E.M.
153
Figura 9.8:
P1 che in P2 del fronte d’onda, l’onda E.M. sarà spazialmente coerente pur
essendo parzialmente coerente da un punto di vista temporale.
9.5.2
Grado di coerenza spaziale e temporale
Per descrivere quantitativamente le proprietà di coerenza spaziale e temporale di un’onda E.M. si introduce una classe di funzioni di correlazione
(o matrici di coerenza). Indichiamo con E il campo elettrico propagativo,
utilizzando la notazione complessa e limitiamoci alle correlazioni del primo
ordine. In un punto ~r1 possiamo definire la funzione di correlazione Γ(1) al
primo ordine come:
Γ(1) (~r1 , ~r1 , τ ) = lim
T →∞
1
2T
Z
T
E(~r1 , t + τ ) E ∗ (~r1 , t) dt
(9.19)
−T
Tale funzione è quindi pari alla funzione di autocorrelazione di E(~r, t),
ovvero pari al valore medio sul tempo del prodotto E(~r1 , t + τ ) E ∗ (~r1 , t). Si
può quindi scrivere più semplicemente
Γ(1) (~r1 , ~r1 , τ ) = hE(~r1 , t + τ ), E(~r1 , t)i
(9.20)
Si può anche definire una funzione normalizzata, γ (1) (~r1 , ~r1 , τ ) come segue:
γ (1) (~r1 , ~r1 , τ ) =
Γ(1) (~r1 , ~r1 , τ )
Γ(1) (~r1 , ~r1 , τ )
=
hE(~r1 , t), E(~r1 , t)i
I(~r1 , t)
(9.21)
dove I(~r1 , t) indica l’intensità del campo elettrico. Dalla disuguaglianza
di Schwartz si può immediatamente vedere che | γ (1) (~r1 , ~r1 , τ ) |≤ 1. Si
può anche dimostrare che γ (1) (~r1 , ~r1 , −τ ) = [γ (1) (~r1 , ~r1 , τ )]∗ . La funzione
γ (1) (~r1 , ~r1 , τ ) è chiamata grado complesso di coerenza temporale nel punto ~r1 .
Il suo modulo | γ (1) (~r1 , ~r1 , τ ) | è invece chiamato grado di coerenza temporale.
154
CAPITOLO 9. OTTICA COERENTE
È infatti evidente che Γ(1) e quindi γ (1) sono un indice di quanta correlazione
ci sia nel campo E nello stesso punto a due istanti successivi separati di τ .
Nel caso di completa assenza di coerenza temporale, dalle (9.19) e (9.21) si ha
infatti γ (1) = 0 per τ > 0 (γ (1) = 1 per τ = 0). Nel caso di perfetta coerenza
temporale (un ’onda sinusoidale, p. es.) si ha | γ (1) |= 1 per qualsiasi τ . La
quantità | γ (1) | è quindi una funzione compresa tra 0 e 1 che descrive il grado
di coerenza temporale dell’onda. In generale la funzione | γ (1) | sarà del tipo
indicato in figura 9.9 (si ricorda che | γ (1) (−τ ) |=| γ (1) (τ ) |). Si può quindi
definire un tempo caratteristico τco , detto tempo di coerenza temporale, ad
es. come quel tempo per cui si ha | γ (1) |= 1/2. Per un’onda perfettamente
coerente si ha ovviamente τco = ∞.
Figura 9.9:
In modo analogo, si può definire una funzione di correlazione al primo
ordine fra due punti ~r1 e ~r2 diversi allo stesso istante:
1
Γ (~r1 , ~r2 , 0) = lim
T →∞ 2T
(1)
Z
T
E(~r1 , t) E ∗ (~r2 , t) dt =
−T
= hE(~r1 , t)E(~r2 , t)i
(9.22)
Si può definire inoltre la corrispondente funzione normalizzata γ (1) (~r1 , ~r2 , 0)
come
γ (1) (~r1 , ~r2 , 0) =
Γ(1) (~r1 , ~r2 , 0)
1/2
[Γ(1) (~r1 , ~r1 , 0) Γ(1) (~r2 , ~r2 , 0)]
(9.23)
Dalla disuguaglianza di Schwartz si può ancora vedere che | γ (1) (~r1 , ~r2 , 0) |≤
1. La quantità γ (1) (~r1 , ~r2 , 0) è detta grado complesso di coerenza spaziale ed il
suo modulo grado di coerenza spaziale. In analogia con quanto detto prima,
fissato ~r1 , è chiaro che | γ (1) (~r1 , ~r2 , 0) | decadrà dal valore 1 (che si ha per
~r2 = ~r1 , cioè per | ~r2 − ~r1 |= 0) a 0 in una certa lunghezza caratteristica che
chiameremo lunghezza di coerenza spaziale (o lunghezza di correlazione dcorr )
155
9.5. COERENZA DI UN’ONDA E.M.
Figura 9.10:
dell’onda luminosa nel punto ~r1 , come indicato qualitativamente in figura
9.10.
I concetti di coerenza spaziale e temporale possono essere combinati
in quello espresso dalla funzione di coerenza mutua Γ(1) (~r1 , ~r2 , τ ) definita da:
Γ(1) (~r1 , ~r2 , τ ) = hE(~r1 , t + τ ), E(~r2 , t)i
(9.24)
che può essere al solito normalizzata come segue:
γ (1) (~r1 , ~r2 , τ ) =
Γ(1) (~r1 , ~r2 , τ )
1/2
[Γ(1) (~r1 , ~r1 , 0) Γ(1) (~r2 , ~r2 , 0)]
(9.25)
La precedente funzione di correlazione definisce il grado di coerenza complesso
tra due punti dell’onda a due tempi successivi.
9.5.3
Misura della coerenza spaziale e temporale
Una maniera molto semplice per la misura del grado di coerenza spaziale fra
due punti x1 e x2 di un’onda luminosa è costituita dall’uso dell’interferometro
di Young, schematizzato in figura 9.11. Esso è semplicemente costituito da
Figura 9.11:
156
CAPITOLO 9. OTTICA COERENTE
uno schermo 1 in cui siano praticati due piccoli fori in corrispondenza dei
punti x1 e x2 ed uno schermo 2 su cui si forma la figura di interferenza
dovuta alla luce che passa attraverso i due fori. Consideriamo per semplicità
il caso in cui l’onda luminosa sia perfettamente coerente da un punto di
vista temporale. In questo caso, si vedranno sullo schermo 2 delle frange di
interferenza che saranno tanto più nitide quanto più i due campi E(x1 , t) e
E(x2 , t) si sono mantenuti in fase durante il tempo di misura delle frange (p.
es. il tempo di esposizione di una lastra fotografica). Pertanto il grado di
visibilità delle frange è una misura del grado di coerenza spaziale fra i punti
x1 e x2 . Precisamente, definiamo visibilità VP delle frange nel punto P la
quantità:
Imax − Imin
VP =
(9.26)
Imax + Imin
dove Imax e Imin sono rispettivamente le intensità nel punto di massimo e di
minimo delle frange intorno al punto P . Se i due fori 1 e 2 lasciano arrivare
nel punto P la stessa intensità di luce e se l’onda è perfettamente coerente
da un punto di vista spaziale, si ha Imin = 0 per cui VP = 1. Nel caso in cui i
segnali nei due punti x1 e x2 siano completamente incorrelati (cioè incoerenti),
le frange scompaiono (cioè Imax = Imin ) per cui VP = 0. Per quanto detto
nel paragrafo precedente, appare dunque chiaro che VP debba essere legato
al modulo della funzione γ (1) (~r1 , ~r2 , τ ). Tale legame è facilmente ottenibile
nel modo seguente. Indichiamo con EP (t′ ) il campo elettrico nel punto P
all’istante t′ . Esso è dovuto alla sovrapposizione dei campi provenienti dai
due fori, per cui potremo scrivere:
EP (t′ ) = K1 E(x1 , t′ − t1 ) + K2 E(x2 , t′ − t2 )
(9.27)
EP = K1 E(x1 , t + τ ) + K2 E(x2 , t)
(9.28)
dove t1 = l1 /c, t2 = l2 /c. I fattori K1 e K2 , chiamati fattori di obliquità,
sono inversamente proporzionali a l1 e l2 e dipendono anche dalle dimensioni
dei due fori e dagli angoli fra l’onda incidente e l’onda diffratta nei punti x1
e x2 ; in generale, essi saranno due fattori costanti complessi. Definendo ora
t = t′ − t2 e τ = t2 − t1 , la (9.27) può scriversi:
L’intensità istantanea nel punto P , ovvero il modulo del vettore di Poynting,
a meno di un fattore moltiplicativo f rac1µ0c, vale dunque:
IP = EP EP∗ = I1 (t+τ ) + I2 (t) + 2Re[K1 K2∗ E(x1 , t+τ )E ∗ (x2 , t)](9.29)
dove I1 e I2 sono le intensità nel punto P dovute, singolarmente, alle emissioni
dei due punti x1 e x2 e sono date da:
I1 = | K1 |2 | E(x1 , t + τ ) |2 = | K1 |2 I(x1 , t + τ )
I2 = | K2 |2 | E(x2 ) |2 = | K2 |2 I(x2 , t)
(9.30)
157
9.5. COERENZA DI UN’ONDA E.M.
dove I(x1 , t + τ ) e I(x2 , t) sono le intensità nei punti x1 e x2 agli istanti di
emissione delle onde che interferiscono in P all’istante t′ . Eseguendo una
media temporale su ambo i membri della (9.29) ed usando la (9.24), si ha:
< IP > = < I1 > + < I2 > +2 | K1 || K2 | Re Γ(1) (~r1 , ~r2 , τ )
(9.31)
Con qualche passaggio, si possono ottenere le espressioni di Imax e Imin :
Imax =< I1 > + < I2 > +2(< I1 >< I2 >)1/2 | γ (1) |
Imin =< I1 > + < I2 > −2(< I1 >< I2 >)1/2 | γ (1) |
(9.32)
e quindi dalla (9.26)
VP =
2(< I1 >< I2 >)1/2
| γ (1) (x1 , x2 , τ ) |
< I1 > + < I2 >
(9.33)
Nel caso < I1 >=< I2 > si ha VP =| γ (1) |. Nel caso τ = 0 (cioè l1 = l2 )
la (9.33) permette dunque una misura di | γ (1) (x1 , x2 , 0) | cioè del grado di
coerenza spaziale dell’onda fra i punti x1 e x2 .
Una maniera molto semplice per la misura della coerenza temporale è
costituita dell’uso dell’interferometro di Michelson (vedi figura 9.2), in cui tra
la sorgente S e l’interferometro sia frapposto uno schermo con un piccolo foro
in corrispondenza del punto P in cui si vuole misurare la coerenza temporale
dell’onda. Nella direzione C, come noto, a causa dell’interferenza dei due
fasci si avrà luce o buio secondo che 2(d1 − d2 ) sia uguale ad un numero
pari o dispari di semilunghezze d’onda. Per un’onda parzialmente coerente
l’intensità IC nel punto C in funzione di 2(d1 − d2 ) andrà come indicato in
figura 9.12. Anche in questo caso si può definire una visibilità delle frange
VP (τ ) come nella (9.26), essendo ora τ = 2(d1 − d2 )/c. In maniera analoga a
Figura 9.12:
quanto fatto per l’interferometro di Young, si può ora dimostrare che:
VP = | γ (1) (P, P, τ ) |
(9.34)
158
CAPITOLO 9. OTTICA COERENTE
La misura della visibilità delle frange permette quindi, in questo caso, la
misura del grado di coerenza temporale dell’onda nel punto P . Si può anche
definire una lunghezza di coerenza temporale lτ come lτ = cτco , dove τco è il
tempo di coerenza temporale. La quantità lτ /2 fornisce la differenza (d1 −d2 )
fra i due bracci dell’interferometro per cui risulta VP = 1/2.
Il concetto di coerenza temporale di un’onda E.M., come si è visto, è
legato alla variazione nel tempo della fase dell’onda ed è intimamente connesso alla sua monocromaticità. Si può dimostrare che esiste un legame
preciso tra la indeterminazione in frequenza dell’onda, ∆ν e il suo tempo di
coerenza τco : ∆ν · τco ≥ 1/4π, da cui si deduce che quanto più un’onda è
monocromatica, tanto più essa è temporalmente coerente.
Per definire il grado di coerenza di un’onda sono state valutate le correlazioni tra i valori del campo elettrico dell’onda in due punti dello spazio
in cui essa si propaga e a due istanti differenti. Considerando, invece, correlazioni esistenti tra i valori del campo elettrico in tre o più punti differenti
ed a tre o più istanti differenti (ossia in tre o più punti dello spazio–tempo) è
possibile definire la coerenza al secondo ordine o superiore dell’onda in esame.
Nelle sorgenti luminose termiche (Sole, lampade ad incandescenza,
lampade al mercurio, ...) si ha la somma dei contributi dei singoli emettitori
scorrelati che le compongono (atomi); tali sorgenti possono dare coerenza
solamente al primo ordine.
Il laser, invece, può generare radiazione ottica coerente in più ordini, al
limite in tutti, grazie al fatto che il meccanismo che sta alla base del processo
di emissione è il processo di emissione stimolata, nel quale un atomo, in
presenza di un’onda E.M. di frequenza opportuna, incidente su di esso, viene
stimolato ad emettere un’altra onda E.M.con gli stessi valori di frequenza e
di fase dell’onda incidente.
9.6
Olografia
9.6.1
Generalità
Vediamo ora una delle applicazioni più spettacolari dell’Ottica coerente:
l’olografia o fotografia tridimensionale. Il principio base dell’olografia è illustrato in figura 9.13. Un fascio di luce coerente (un fascio di luce laser, p.
es.) viene fatto incidere su uno specchio semiriflettente e diviso cosı̀ in un
fascio A riflesso ed un fascio B trasmesso. Il fascio A incide direttamente su
una lastra fotografica mentre il fascio B illumina l’oggetto che si vuole “fotografare”. Una parte della luce diffusa dall’oggetto cadrà sulla lastra, come
indicato in figura 9.13 a). Pertanto sulla lastra, durante la fase di esposizio-
159
9.6. OLOGRAFIA
Figura 9.13:
ne, si verrà a formare una figura di interferenza dovuta alla sovrapposizione
di questi due fasci incidenti: il fascio diretto o fascio di riferimento A e il
fascio diffuso da ogni punto dell’oggetto. Se la pellicola viene sviluppata e la
si esamina con un ingrandimento sufficiente, si potranno vedere le figure di
inteferenza che sono estremamente complicate e non hanno alcuna relazione
ovvia con l’oggetto “fotografato” ma contengono una registrazione completa
delle proprietà geometriche dell’oggetto.
La lastra sviluppata venga di nuovo messa nella posizione in cui si
trovava durante l’esposizione e si rimuova l’oggetto, come indicato in figura
9.13 b). Il fascio di riferimento A, durante questa fase di ricostruzione dell’immagine, interagisce con la figura di interferenza sulla lastra e riproduce
dietro di essa un fascio diffratto che risulta essere esattamente la stessa onda
′
E.M. P diffusa dall’oggetto in figura 9.13 a). Un osservatore che guardi la
lastra fotografica da dietro, come indicato in figura 9.13 b), vedrà l’oggetto
dietro la lastra come se esso fosse realmente lı́.
Il principio dell’olografia è stato stabilito ben prima dell’avvento dei
160
CAPITOLO 9. OTTICA COERENTE
laser; la tecnica, infatti, è stata proposta da Gabor nel 1948, ma è solo dopo
l’invenzione del laser che essa è diventata utilizzabile in pratica ed ha dimostrato il suo grande potenziale. Una delle caratteristiche più interessanti
dell’olografia è che l’oggetto ricostruito possiede proprietà tridimensionali.
Cosı̀, se l’osservatore cambia il suo punto di osservazione può vedere gli altri lati dell’oggetto. Questo avviene perchè la lastra fotografica contiene,
sotto forma di figura di interferenza, informazioni su tutte le caratteristiche
geometriche dell’oggetto, e pertanto anche la sua tridimensionalità.
9.6.2
Principio fisico dell’olografia
Consideriamo ora più in dettaglio il principio fisico dell’olografia. Per semplicità consideriamo il caso di un oggetto puntiforme P , ad esempio il punto
P in figura 9.13 a), e facciamo riferimento ad una disposizione geometrica
dei due fasci, di riferimento e diffuso, particolarmente semplice, quale quella
schematizzata in figura 9.14. In questo caso il fascio di riferimento è parallelo
Figura 9.14:
alla direzione media del fascio diffuso e si parla di olografia in asse. Consideriamo come onda di riferimento un’onda piana, mentre l’onda diffusa dal
punto P sarà un’onda sferica e scegliamo come origine del sistema di riferimento il punto P . I campi elettrici delle due onde in un punto O della lastra
fotografica sono dati da:
E1 (z0 , t) = A1 ei(kz0 −ωt)
(9.35)
161
9.6. OLOGRAFIA
E2 (r0 , t) =
A2 i(kr0 −ωt)
e
r0
(9.36)
dove A1 e A2 sono delle costanti complesse, z0 è la distanza dal punto P al
piano della lastra e r0 è la distanza del punto O dall’origine. L’intensità in
O vale pertanto, a meno di una costante ǫ0 c:
I = | E1 + E2 |2 = | E1 |2 + | E2 |2 + E1∗ E2 + E1 E2∗ =
′
′′
′′′
= I +I +I
(9.37)
con
′
I = | E1 |2 + | E2 |2 = | A1 |2 +
I
′′
I
′′′
| A2 |2
r02
(9.38)
= E1∗ E2 =
A∗1 A2 ik(r0 −z0 )
e
r0
(9.39)
= E1 E2∗ =
A1 A∗2 ik(z0 −r0 )
e
r0
(9.40)
′
L’intensità totale I è pertanto la somma di una quantità, I , che è una
′′
′′′
funzione della posizione del punto O, e delle quantità I e I , la cui somma
può essere scritta come:
I
′′
+ I
′′′
∝
cos[k(r0 − z0 ) + φ]
r0
(9.41)
dove φ è una costante. A causa del termine coseno nella (9.41), l’intensità
totale I in funzione di r0 mostra una serie di massimi e minimi. Cosı̀ l’interferenza tra l’onda piana E1 (z, t) e l’onda sferica E2 (r, t) produce una serie di
frange circolari sulla lastra, come mostrato in figura 9.14 b). La distanza ∆r0
tra le frange soddisfa la condizione k∆r0 = 2π. Cosı̀, se nel punto O si ha un
′
′
massimo, il massimo successivo sarà in un punto O tale che P O − P O = λ.
Quando la lastra viene sviluppata, essa mostrerà una serie di frange
chiare e scure. Se supponiamo, come approssimazione alquanto soddisfacente
della realtà, che la risposta della pellicola sia proporzionale all’intensità I,
allora l’annerimento sarà proporzionale a I e si potrà scrivere:
1 − T = αI
(9.42)
dove T è il coefficiente di trasmissione di potenza della lastra e α è una costante che rappresenta il grado di annerimento. Il coefficiente di trasmissione
162
CAPITOLO 9. OTTICA COERENTE
Figura 9.15:
′
del campo elettrico della lastra, perciò, è T =
per un piccolo grado di annerimento, si ha:
T
′
√
T e dall’equazione (9.42)
1
= (1 − αI)1/2 ≃ 1 − αI
2
(9.43)
Supponiamo ora di illuminare la lastra con il fascio di riferimento E1 (z, t),
come indicato in figura 9.15. Il campo elettrico subito dietro la lastra sarà:
′
E(z0 , r0 , t) = T E1 ≃
1
1 − αI E1 =
2
1
′
′′
′′′
′
′′
′′′
1 − α(I + I + I ) E1 = E + E + E
2
=
(9.44)
dove, dalle (9.35), (9.38)–(9.40) e (9.43) si ha:
′
E =
E
′′
E
′′′
| A1 |2
| A2 |2
1−α
−α
2
2r02
= −α
!
E1 (z0 , t)
(9.45)
| A1 |2 A2 i(kr0 −ωt)
e
2r0
(9.46)
A21 A∗2 i(2kz0 −kr0 −ωt)
e
2r0
(9.47)
= −α
Il comportamento dell’onda diffratta dietro la lastra può, in linea di principio,
′
′′
′′′
essere calcolato usando il metodo di Fresnel per un campo E = E +E +E .
163
9.6. OLOGRAFIA
′
Tuttavia, si può vedere immediatamente che il primo termine E dà origine
ad un’onda diffratta
| A1 |2
| A2 |2
1−α
−α
2
2r02
!
E1 (z, t)
(9.48)
′
Infatti, quest’onda produce un campo uguale a E sulla lastra, cioè per z = z0 .
′
Il termine E , pertanto, produce dietro la lastra un’onda piana uguale a quella incidente, eccetto per un fattore di attenuazione che corrisponde all’annerimento medio sulla lastra. Analogamente, è facile vedere che i termini
′′
′′′
E e E producono due onde sferiche, una divergente dal punto P e l’altra
′
′′′
convergente verso il punto P in figura 9.15. Considerando il termine E ,
per esempio, è sufficiente osservare che un’onda sferica che converge verso il
′
punto P produce sulla lastra un campo
′
EP ′
ei(−kr0 −ωt)
∝
r0′
′
(9.49)
dove r0′ = P O. Ora, dato che r0′ = r0 un confronto tra la (9.47) e la
(9.49) mostra che i due campi sono uguali eccetto che per un fattore di fase
costante (ei2kz0 ) che non è significativo. Poichè la soluzione è unica, segue
′′′
′
che il termine E da origine ad un’onda sferica diffratta che converge in P .
′
Trascurando il termine ovvio dovuto a E (che rappresenta la trasmissione parziale dell’onda che incide sulla lastra sviluppata), si vede infine che
′
l’ologramma produce un’immagine virtuale P ed un’immagine reale P del
punto P di figura 9.14 a).
Le considerazioni fatte fino ad ora si ripetono nel caso di un corpo
non puntiforme; per analogia con il caso di un corpo puntiforme, si può
vedere che l’ologramma di un oggetto esteso, illuminato dall’onda di riferi′
mento, produce dietro alla lastra tre contributi: un campo E , che è l’onda
′′
di riferimento E1 opportunamente attenuata, un campo E , che produce
′′′
un’immagine virtuale dell’oggetto, ed un campo E , che produce un’immagine reale dell’oggetto (che può cioè essere proiettata su uno schermo) in una
posizione che è speculare all’immagine virtuale rispetto alla lastra. Si può
ora vedere come l’olografia permetta di registrare completamente il campo
′′
diffuso dall’oggetto. Dalla (9.46) si vede che E ∝ E2 e pertanto vengono
registrate sia l’ampiezza che la fase del campo E2 . Se non ci fosse l’interferenza con il campo di riferimento, l’intensità del campo sulla lastra, e perciò
anche l’annerimento, sarebbe proporzionale a | E2 |2 , cioè solo il modulo di
E2 verrebbe registrato. Il principio dell’olografia permette, invece, di registrare anche l’informazione della fase del campo diffuso dall’oggetto e questo
rende possibile una ricostruzione completa dell’oggetto.
164
9.6.3
CAPITOLO 9. OTTICA COERENTE
Olografia in asse e fuori asse
Il semplice dispositivo olografico in asse sopra descritto è analogo a quello
proposto da Gabor nel 1948. In esso l’oggetto che viene “fotografato” è un
corpo trasparente (Gabor usò una diapositiva con nomi di scienziati) e produce esso stesso l’onda di riferimento; in questo modo le differenze di cammino
ottico tra i due fasci sono minime e questo consente l’uso di una sorgente
con lunghezza di coerenza relativamente corta, spiegando lo sviluppo della
tecnica anche in assenza di sorgenti laser che si sarebbero diffuse solo una
ventina di anni più tardi. Le limitazioni di questo tipo di olografia sono dovute essenzialmente al ristretto numero di oggetti di cui è possibile realizzare
una registrazione olografica. Inoltre, i tre termini prodotti dall’ologramma
durante la restituzione sono spazialmente sovrapposti e l’immagine ottenuta
è di scarsa qualità.
Questi inconvenienti vengono superati nella tecnica della olografia fuori asse, che è ora considerata la configurazione olografica fondamentale e
viene schematizzata nella figura 9.16. In essa le direzioni di propagazione
Figura 9.16:
media dei fasci diffuso e di riferimento non sono più coincidenti: per questo
si parla di olografia fuori asse. Questo comporta, nella restituzione, la separazione spaziale dei termini prodotti per diffrazione dall’ologramma e quindi
una perfetta ricostruzione del fronte d’onda diffuso dall’oggetto, ora non più
degradato dalla sovrapposizione con le altre componenti. Per questo tipo
di configurazione non esistono limitazioni sul tipo di oggetti fotografabili; in
generale, però, le differenze di cammino ottico tra il fascio oggetto e quello di
165
9.6. OLOGRAFIA
riferimento possono essere notevoli, soprattutto nel caso di oggetti di dimensioni notevoli. È allora indispensabile l’uso di sorgenti di grande lunghezza
di coerenza, quali sono i laser.
9.6.4
Olografia in riflessione
All’inizio degli anni ’60 nell’URRS fu sviluppata la configurazione detta olografia in riflessione. In questo caso, i fronti d’onda ricostruiti sono ottenuti
per riflessione dall’ologramma invece che per trasmissione come nelle tecniche descritte in precedenza. Questa olografia utilizza le proprietà di volume
dell’emulsione fotografica e, infatti, in questo caso si parla di ologrammi di
volume. La tecnica è schematizzata in figura 9.17. Per registrare un olo-
Figura 9.17:
gramma in riflessione i fasci oggetto e di riferimento incidono sulla lastra da
parti opposte. L’interferenza produce, dopo il trattamento della lastra, strati di argento metallico all’interno del volume dell’emulsione che, in fase di
ricostruzione, agiscono come superfici semiriflettenti. Nel caso particolare di
interferenza tra due onde piane, di lunghezza d’onda λ, propagantisi in direzione perpendicolare alla lastra e in versi opposti, queste superfici sono piani
paralleli all’emulsione e separati tra loro di λ/2. Gli ologrammi in riflessione
sono visibili anche in luce bianca perchè funzionano essi stessi da filtri monocromatori: fissata la geometria di osservazione, ossia l’ angolo di incidenza
166
CAPITOLO 9. OTTICA COERENTE
del fascio di luce, esiste infatti una sola lunghezza d’onda di risonanza (λris )
che soddisfa la condizione di Bragg, come indicato in figura 9.18.
Figura 9.18:
9.6.5
Applicazioni dell’olografia
Dopo aver spiegato il principio su cui si basa la tecnica dell’olografia, consideriamo ora brevemente alcuni suoi campi di applicazione.
Memorie olografiche. Una porzione, anche piccola, di ologramma contiene pur anche se degradata in qualità, l’informazione dell’intero oggetto. Ripartendo la lastra in un numero di piccoli elementi è possibile immagazzinare
olograficamente una quantità grandissima di immagini, ciascuna restituibile
interrogando selettivamente ogni elemento con il fascio di riferimento.
Interferometria olografica Si tratta di una tecnica di prova non invasiva, che consente il confronto tra stati diversi di uno stesso oggetto e trova
applicazioni per l’industria, la medicina, il restauro, i collaudi ottici , ecc. A
tal fine, viene dapprima registrato l’ologramma dell’oggetto nella sua condizione iniziale; esposta e sviluppata la lastra, la si riposiziona accuratamente
nella sua sede; illuminando quindi l’ologramma con l’onda di riferimento si
ricostruisce l’immagine dell’oggetto non perturbato. Illuminando nel contempo anche l’oggetto vero, visto dall’osservatore attraverso la lastra, si ha
interferenza tra luce diffusa dall’oggetto vero e quella dell’immagine olografica virtuale; perturbando l’oggetto con un agente esterno (meccanico, termico
o di altra natura) si visualizza il campo di deformazione superficiale indotto sotto forma di frange di interferenza, continuamente mutanti in funzione
9.6. OLOGRAFIA
167
delle caratteristiche della perturbazione (interferometria olografica in tempo
reale). Come tecnica alternativa, si registrano sulla stessa lastra due ologrammi, uno dell’oggetto nel suo stato iniziale e uno dell’oggetto perturbato.
La ricostruzione fornisce due immagini olografiche virtuali, che, per interferenza producono lo stesso tipo di informazione congelata all’istante della
seconda esposizione (interferometria olografica in doppia esposizione). La
tecnica si estende anche, con opportune varianti, allo studio di vibrazioni di
corpi sollecitati.
Da ricordare anche altre applicazioni, quali l’elaborazione ottica dell’informazione, la realizzazione di componenti ottici per via olografica, codici
di protezione, creazioni artistiche figurative, documentazione.
Appendice A
Operatori Scalari e Vettoriali
Si consideri un sistema di riferimento cartesiano individuato da una terna di
assi coordinati (x, y, z) con versori ~i, ~j e ~k; per definizione di versori valgono
le relazioni:
~i · ~j = ~i · ~k = ~j · ~k = 0
~i · ~i = ~j · ~j = ~k · ~k = 1
(A.1)
In tale sistema di riferimento si definisce prodotto scalare (o interno) di due
vettori ~u e ~v , di componenti (ux , uy , uz ) e (vx , vy , vz ), la quantità:
~u · ~v = ux vx + uy vy + uz vz
(A.2)
e prodotto vettoriale (o esterno) dei due vettori la quantità:
~u × ~v = ~i(uy vz − uz vy ) + ~j(uz vx − ux vz ) + ~k(ux vy − uy vx )
(A.3)
che è anche lo sviluppo del determinante:
~u × ~v
≡
~i
ux
vx
~j
uy
vy
~k
uz
vz
Si definisce prodotto misto dei vettori ~u, ~v e ~t la quantità:
~u · ~v × ~t = ~v · ~t × ~u = ~t · ~u × ~v
(A.4)
che gode della proprietà ciclica, e doppio prodotto esterno:
~u × (~v × ~t) = (~u · ~t) ~v − (~u · ~v) ~t
(A.5)
Inoltre:
(~u × ~v ) · (~t × ~z)
= ~u · ~v × (~t × ~z )
= ~u [ (~v · ~z ) ~t − (~v · ~t) ~z ]
= (~u · ~t)(~v · ~z ) − (~u · ~z )(~v · ~t)
(A.6)
e
(~u × ~v ) × (~t × ~z) = (~u × ~v · ~z) ~t − (~u × ~v · ~t) ~z
(A.7)
Se indichiamo con f , un generico campo scalare, possiamo definire
l’operatore vettoriale nabla ∇, come:
∂
∂
∂
+ ~j
+ ~k
∇ ≡ ~i
∂x
∂y
∂z
(A.8)
ed in funzione di questo l’operatore vettoriale gradiente:
∂f
∂f
∂f
∇ f ≡ ~i
+ ~j
+ ~k
∂x
∂y
∂z
(A.9)
Consideriamo, ora, un campo scalare U(x, y, z); se partendo da un punto
P = (x, y, z) si esegue uno spostamento infinitesimo:
d~s = ~i dx + ~j dy + ~k dz = ~n ds
(A.10)
con (ds)2 = (dx)2 + (dy)2 + (dz)2 , la variazione corrispondente di U è:
dU
=
U(x + dx, y + dy, z + dz) − U(x, y, z)
∂U
∂U
∂U
=
dx +
dy +
dz
∂x
∂y
∂z
= ∇U · d~s = ∇U · ~nds
(A.11)
In un punto P = (x, y, z) la derivata direzionale di U nella direzione
specificata dal versore ~n è definita come:
dU
≡ ∇U · ~n
ds
(A.12)
cioè è la componente del vettore ∇U nella direzione orientata fissata dallo
spostamento d~s. Da questa ultima relazione si ricava che:
1. il gradiente di U è un vettore di modulo uguale al valore assoluto
massimo della derivata direzionale;
2. la direzione e il verso coincidono con quelli per i quali la derivata
direzionale è massima;
3. in ogni punto il vettore gradiente è perpendicolare alla superficie di
valore U = cost passante per il punto considerato.
Due grandezze frequentemente usate in relazione ad un generico campo vettoriale ~v sono l’operatore scalare divergenza:
∇ · ~v ≡
∂vy
∂vz
∂vx
+
+
∂x
∂y
∂z
(A.13)
(che si ottiene applicando formalmente la definizione dell’operatore ∇ scalarmente al vettore ~v ) e l’operatore vettoriale rotore tale che:
∇ × ~v
≡
!
∂vy ~
∂vz
−
i +
∂y
∂z
!
∂vy
∂vx
~k
−
∂x
∂y
∂vz
∂vx
−
∂z
∂x
!
~j
(A.14)
che, di nuovo, si ottiene applicando formalmente l’operatore ∇ vettorialmente
al vettore ~v e che si può ottenere anche come lo sviluppo del determinante:
∇ × ~v
≡
~i
~j
~k
∂
∂x
∂
∂y
∂
∂z
vx
vy
vz
Per la linearità dell’operatore ∇ si ha:
∇ (f + g) = ∇ f + ∇ g
(A.15)
∇ (f g) = f ∇ g + g∇ f
(A.16)
∇ · (~u + ~v) ≡ ∇ · ~u + ∇ · ~v
(A.17)
∇ × (~u + ~v ) = ∇ × ~u + ∇ × ~v
(A.18)
∇ · (f ~u) = ~u · ∇f + f ∇ · ~u
(A.19)
∇ × (f ~u) = ∇f × ~u + f ∇ × ~u
(A.20)
Si definisce anche l’operatore di Laplace o laplaciano ∇2 come:
∇ · ∇f ≡ ∇2 f
(A.21)
ovvero
∇2 ≡
∂2
∂2
∂2
+
+
∂x2
∂y 2
∂z 2
(A.22)
Il laplaciano può essere applicato sia ad un campo scalare:
∇2 f = ∇ · ∇f =
∂2f
∂2f
∂2f
+
+
∂x2
∂y 2
∂z 2
(A.23)
sia ad un campo vettoriale:
∇2~u = ∇∇ · ~u − ∇ × ∇ × ~u = ∇2 ux ~i + ∇2 uy ~j + ∇2 uz ~k(A.24)
Le formule (A.9), (A.13)–(A.21) seguono per diretta applicazione dell’operatore ∇ a campi scalari e vettoriali; un po’ più elaborata è, invece, la
dimostrazione delle seguenti utili proprietà:
∇(~u · ~v ) = (~u · ∇)~v + (~v · ∇)~u + ~u × (∇ × ~v ) + ~v × (∇ × ~u)(A.25)
∇ · (~u × ~v ) = ~v · (∇ × ~u) − ~u · (∇ × ~v )
(A.26)
∇ × (~u × ~v ) = ~u(∇ · ~v ) − ~v(∇ · ~u) + (~v · ∇)~u − (~u · ∇)~v
(A.27)
∇ × ∇ × ~u = ∇∇ · ~u − ∇2~u
(A.28)
Si dimostra anche facilmente che:
∇ × ∇f = 0
(A.29)
che si esprime dicendo che il vettore ∇f è sempre irrotazionale, qualunque
sia lo scalare f . Infine:
∇ · ∇ × ~u = 0
(A.30)
che si esprime dicendo che ∇ × ~u è sempre solenoidale, qualunque sia il
vettore ~u. Se un vettore, oltre che irrotazionale, cioè tale che ~v = ∇f , è
anche solenoidale, cioè tale che ∇ · ~u, allora si ha anche:
∇2 f ≡
∂2f
∂2f
∂2f
+
+
∂x2
∂y 2
∂z 2
!
f = 0
(A.31)
Appendice B
Teoremi notevoli del Calcolo
Differenziale
Sia f (x, y, z) uno scalare qualsiasi; consideriamone una superficie di livello,
cioè una superficie tale che su di essa sia f (x, y, z) = cost. Per definizione di
superficie di livello, su di essa df = 0, ovvero, se d~s è l’elemento infinitesimo
di arco su tale superficie
d~s = dx ~i + dy ~j + dz ~k
(B.1)
si avrà:
0 ≡ df = d~s · ∇f
(B.2)
come già visto dalla definizione di gradiente (A.9) e di derivata direzionale
(A.12).
Si definisce la circuitazione di un vettore ~v come l’integrale di ~v · d~s
valutato lungo una qualche linea s:
I =
Z
~v · d~s
s
(B.3)
Se ~v è tale che
~v = ∇f
(B.4)
abbiamo
df = ∇f · d~s
(B.5)
Quindi, se P1 e P2 sono gli estremi della curva s, la circuitazione I definita
in (B.3) diventa semplicemente
I =
Z
P2
P1
df = f (P2 ) − f (P1 )
(B.6)
cioè dipende solo dagli estremi della curva e non dal cammino seguito pare
passare da P1 a P2 . Pertanto, tutte le volte che
~v = ∇f
(B.7)
si ha che la sua circuitazione lungo una linea chiusa è nulla:
I
∇f · d~s = 0
(B.8)
in tal caso si dice che il vettore è conservativo.
Si definisce flusso di un vettore ~v attraverso una superficie S, l’integrale di superficie
φS (~v ) =
Z
S
~v · ~n dS
(B.9)
ove ~n è il versore avente in ogni punto (si S) la direzione normale alla superficie S in quel punto e rivolto sempre dalla stessa parte di S. Se ora S è
una superficie chiusa e orientabile, con normale esterna ~n, che costituisce la
frontiera di un solido (nello spazio a tre dimensioni) di volume V , e ~v è un
campo vettoriale differenziabile con continuità definito in V , si ha il teorema
di Gauss o della divergenza (cfr. Apostol, volume 3, p.430 oppure dispensa
Prof. Zampieri, pag. 55)
φS (~v ) =
Z
S
~v · ~n dS =
Z
V
(∇ · ~v ) dV
(B.10)
che permette di sostituire un integrale di volume ad un integrale di superficie
(o viceversa) e fornisce il significato fisico dell’operatore divergenza definito
dalla (A.13). Dal teorema della divergenza seguono le relazioni:
Z
S
f~n dS =
Z
V
∇f dV
(B.11)
Z
(B.12)
e
Z
S
~n × ~v dS =
V
∇ × ~v dV
per la cui dimostrazione è sufficiente moltiplicare scalarmente i due membri
delle equazioni con un vettore costante ~a e poi applicare le (A.19) e (A.26),
rispettivamente, ricordando la definizione di prodotto misto nel caso della
(B.12), ed il teorema della divergenza (B.10).
Di grande utilità è anche il teorema o lemma di Green che, di nuovo,
permette di trasformare un integrale di volume in uno di superficie o un
integrale di superficie in uno di linea. Considerando una superficie S ed un
volume V del tipo descritto nel teorema della divergenza, se f e g sono due
campi scalari differenziabili con continuità e definiti in V , allora:
Z
V
(g∇2f − f ∇2 g) dV
=
=
R
V
∇ · (g∇f − f ∇g) dV
R
S (g∇f
− f ∇g) · ~n dS
(B.13)
in cui ~n è la normale esterna a S; parimenti, considerando una superficie
regolare nel piano, S, ed il suo contorno s, se f e g sono due campi scalari
differenziabili con continuità e definiti in S, allora:
Z
S
(g∇2 f − f ∇2 g) dS
=
=
R
S
∇ · (g∇f − f ∇g) dS
H
s (g∇f
− f ∇g) · ~n ds
(B.14)
in cui ~n è il versore normale a s. Si può facilmente osservare (cfr. anche
Apostol, volume 3, pag. 437, esercizio 7) che questo lemma è conseguenza
del teorema della divergenza (B.10) e della relazione
∇ · (f ∇g) = ∇f · ∇g + f ∇2 g
(B.15)
che segue dalla (A.19) nel caso in cui ~u = ∇g.
Tornando alla definizione di circuitazione (B.3), un altro teorema importante, il teorema di Stokes o della circuitazione (cfr. Apostol, volume 3,
pag. 408 oppure dispensa Prof. Zampieri pag. 47), asserisce che se S è una
superficie parametrica semplice e regolare, ~v è un campo vettoriale differenziabile definito su S e s è la frontiera orientata (percorsa in senso antiorario)
di S, allora:
I
s
~v · d~s =
Z
S
(∇ × ~v ) · ~n dS
(B.16)
che permette di sostituire un integrale di superficie ad un integrale di linea (o
viceversa), fornendo al contempo l’interpretazione fisica dell’operatore rotore
introdotto dalla (A.14), e che dice che la circuitazione di un vettore ~v lungo
una linea chiusa s è uguale al flusso del vettore ∇×~v attraverso una qualsiasi
superficie S avente per contorno la linea s. In particolare ciò mostra che il
flusso del vettore ∇ × ~v dipende solo dal contorno e non dalla particolare
forma della superficie S.
Si noti ancora, alla luce delle (B.8) e (B.16), come un vettore conservativo (B.7) sia anche irrotazionale (A.29)
∇ × ∇f = 0
(B.17)
Inoltre le due espressioni
~v = ∇f
o ∇ × ~v = 0
(B.18)
hanno lo stesso significato e una segue dall’altra.
Dal teorema della circuitazione seguono le relazioni:
I
s
f d~s =
Z
S
~n · ∇f dS
(B.19)
Z
(B.20)
e
I
s
d~s × ~v =
S
dS(~n × ∇) × ~v
per la cui dimostrazione è sufficiente moltiplicare scalarmente i due membri
delle equazioni con un vettore costante ~a, ricordando la definizione di prodotto misto, e poi applicare la (A.20), nel caso della (B.18), ed il teorema
della circuitazione (B.16).
Appendice C
Espressione di operatori
differenziali in diverse
coordinate
Ricordiamo le espressioni degli operatori differenziali in un sistema di coordinate cartesiane (x, y, z).
∂
∂
∂
+ ~j
+ ~k
∇f = ~i
∂x
∂y
∂z
∇ · ~u =
(C.1)
∂ux
∂uy
∂uz
+
+
∂x
∂y
∂z
∂uy
∂uz
−
∇×~u = ~i
∂y
∂z
∇2 f = ∇ · ∇f =
!
∂ux
∂uz
+ ~j
−
∂z
∂x
∂2f
∂2f
∂2f
+
+
∂x2
∂y 2
∂z 2
∇2~u = ∇2 ux ~i + ∇2 uy ~j + ∇2 uz ~k
(C.2)
!
!
∂uy
∂ux
+ ~k
(C.3)
−
∂x
∂y
(C.4)
(C.5)
Capita assai comunemente che la simmetria di un particolare problema
suggerisca l’uso di un sistema di coordinate curvilinee diverso da quello cartesiano. Per questo motivo riportiamo di seguito le espressioni degli operatori
differenziali suindicati in coordinate polari sferiche e cilindriche.
In coordinate polari sferiche (r, θ, ϕ), con versori ~ir , ~iθ e ~iϕ :
1 ∂f
1 ∂f
∂f
+ ~iθ
+ ~iϕ
∇f = ~ir
∂r
r ∂θ
r sin θ ∂ϕ
(C.6)
r = (x2 + y 2 + z 2 )1/2
→ θ = arccos √ 2 z 2
2
x = r sin θ cos ϕ
y = r sin θ sin ϕ
(x
z = r cos θ
+ z )
1 ∂ 2
1 ∂
1 ∂uϕ
(r ur ) +
(sin θuθ ) +
2
r ∂r
r sin θ ∂θ
r sin θ ∂ϕ
∇ · ~u =
∇ × ~u
∇2 f
+ y
ϕ = arctg y/x
"
1 ∂
r 2 ∂r
=
#
∂
∂uθ
~ir 1
+
(sin θ uϕ ) −
r sin θ ∂θ
∂ϕ
"
#
1
1
∂
∂u
r
~iθ
−
(r uϕ ) +
r sin θ ∂ϕ
∂r
"
#
∂
∂u
1
r
~iϕ
(r uθ ) −
r ∂r
∂θ
=
=
(C.7)
r 2 ∂f
∂r
1 ∂2
(rf )
r ∂r 2
h
∇2~u = ~ir ∇2 ur −
h
+
+
~iϕ ∇2 uϕ −
1
∂
sin θ ∂θ
1
∂
r 2 sin θ ∂θ
2
u
r2 r
~iθ ∇2 uθ −
h
r2
−
r2
sin θ ∂f
∂θ
sin θ ∂f
∂θ
2
sin2 θ
uθ
r 2 sin2 θ
uϕ
r 2 sin2 θ
+
+
+
+
∂
(sin θ
∂θ
2 ∂ur
r 2 ∂θ
r2
−
∂ur
2
sin θ ∂ϕ
(C.8)
∂2f
1
r 2 sin2 θ ∂ϕ2
∂2f
1
r 2 sin2 θ ∂ϕ2
uθ ) +
∂uϕ
∂ϕ
2 cos θ ∂uϕ
r 2 sin2 θ ∂ϕ
+
(C.9)
i
i
+
+
2 cos θ ∂uθ
r 2 sin2 θ ∂ϕ
i
(C.10)
In coordinate cilindriche (r, ϕ, z), con versori ~ir , ~iϕ e ~iz :
x = r cos ϕ
y = r sin ϕ
z = z
r = (x2 + y 2)1/2
→ ϕ = arctg y/x
z = z
∂f
1 ∂f
∂f
∇f = ~ir
+ ~iϕ
+ ~iz
∂r
r ∂ϕ
∂z
∇ · ~u =
1 ∂uϕ
∂uz
1 ∂
(r ur ) +
+
r ∂r
r ∂ϕ
∂z
(C.11)
(C.12)
!
1 ∂uz
∂uϕ
∇ × ~u = ~ir
+
−
r ∂ϕ
∂z
!
∂u
∂u
z
r
~iϕ
+
−
∂z
∂r
!
~iz 1 ∂ (r uϕ ) − ∂ur
r ∂r
∂ϕ
∂f
1 ∂
r
∇f =
r ∂r
∂r
2
∇2~u
= ~ir
~iϕ
!
+
(C.13)
1 ∂2f
∂2f
+
r 2 ∂ϕ2
∂z 2
(C.14)
!
2 ∂uϕ
ur
+
∇2 u r − 2 − 2
r
r ∂ϕ
!
uϕ
2 ∂ur
2
∇ uϕ − 2 + 2
+
r
r ∂ϕ
~iz ∇2 uz
(C.15)
Appendice D
Cenni sulle Trasformate di
Fourier
D.1
Serie trigonometriche di Fourier
Qualunque funzione periodica con periodo T = 2π che soddisfi alle condizioni
f (2π) = f (0), f ′ (2π) = f ′ (0) può essere sviluppata in serie trigonometrica
del tipo
f (x) =
∞
X
1
(an cos(nx) + bn sin(nx))
a0 +
2
n=1
(D.1)
con
a0 =
1
π
Z
π
an =
1
π
Z
π
bn =
1
π
Z
π
−π
f (x) dx
(D.2)
f (x) cos(nx) dx
n = 0, 1, 2, ....
(D.3)
f (x) sin(nx) dx
n = 1, 2, ....
(D.4)
−π
e
−π
La (D.1) è un esempio particolare di serie di Fourier, come derivante
dal teorema di Fourier: una funzione f(x), di periodo 2π ma forma arbitraria
sopra una lunghezza uguale al periodo, può ottenersi come somma di funzioni
sinusoidali con periodi pari a sottomultipli di T (cioè T , T /2, T /3, ... ).
(Si noti che le funzioni √1π cos(mx) e √1π sin(nx) con m = 0, 1, 2, ..
e n = 0, 1, 2, .., ortonormali sull’intervallo (−π, π), costituiscono una base
ortonormale sullo stesso intervallo).
Si può dimostrare che se f (x) è sommabile nell’intervallo x(0, 2π) ed
è di classe C 1 nell’intorno di un punto x0 , la serie di Fourier corrispondente
converge puntualmente a
i
1h
−
f (x+
)
+
f
(x
)
0
0
2
f (x0 ) =
(D.5)
−
avendo indicato con f (x+
0 ) e f (x0 ) i limiti destro e sinistro della funzione in
x0 . Una funzione pari nell’intervallo (0, 2π) si sviluppa in serie di soli coseni,
mentre una funzione dispari si sviluppa in serie di soli seni.
Per le formule trigonometriche di Eulero, la (D.1) si può equivalentemente scrivere nella forma
f (x) =
+∞
X
An einx
(D.6)
−∞
Per calcolare i coefficienti An moltiplichiamo ambo i membri della (D.6) per
e−imx e integriamo tra 0 e 2π. Usando la relazione di ortonormalità
Z
2π
0
eix(n−m) dx = 2 π δnm
(D.7)
ove δnm è il simbolo di Kronecker e vale 0 se n 6= m, 1 se n = m, abbiamo
1
2π
Z
2π
0
f (x)e−ixm dx =
∞
X
An δnm = Am
(D.8)
−∞
Se ora consideriamo lo sviluppo (D.6) e usiamo la (D.7) abbiamo
1
2π
Z
2π
0
| f (x) | =
=
Z 2π
1 X
An A∗m
eix(n−m) dx
2π n,m
0
∞
X
n=−∞
| An |2
(D.9)
che stabilisce la completezza della serie di Fourier e prende il nome di teorema di Parseval. Di consueto, per simmetria, si considera lo sviluppo
nell’intervallo simmetrico (−π, π), per cui le (D.6) e (D.8) diventano
f (x) =
An einx
X
(D.10)
n
An =
1
2π
Z
π
−π
f (x)e−ixn dx
(D.11)
D.2
Integrale di Fourier
Le considerazioni precedenti possono essere estese al caso di una funzione
qualsiasi (cioè non periodica o , che è lo stesso, periodica con periodo infinito)
se, formalmente facciamo il limite T → ∞ nelle equazioni precedenti. Per
questo poniamo
2πn
≡ kn
(D.12)
T
e
1
1 Z T /2 −ikn x
F (kn ) ∆k
(D.13)
e
f (x) dx = √
An =
T −T /2
2π
ove
Z T /2
1
F (kn ) ≡ √
e−ikn x f (x) dx
(D.14)
2π −T /2
e ∆k = 2π/T. Le (D.10) e (D.11) divengono allora quando T → ∞ e
supponendo convergenti tutti i limiti coinvolti
1 Z∞
f (x) = √
F (k) eikx dk
(D.15)
2π −∞
Z ∞
1
f (x) e−ikx dx
(D.16)
F (k) = √
2π −∞
Convenzionalmente si dice che F (k) è la trasformata di Fourier di f (x) e che
f (x) è l’ antitrasformata di Fourier di F (k).
Considerando le condizioni sotto le quali il passaggio al limite dal
caso discreto al caso continuo può essere effettuato, si può dimostrare che
condizione necessaria e sufficiente affinchè una funzione ammetta trasformata
di Fourier è che essa sia di classe L2 , cioè che l’integrale del suo modulo quadro
tra −∞ e +∞ sia finito.
In maniera analoga e sotto condizioni del tutto simili, il formalismo
delle trasformate di Fourier si estende al caso tridimensionale:
Z
1
~
f (~r) =
F (~k) eik·~r d3~k
(D.17)
3/2
(2π)
F (~k) =
1 Z
~
f (~r) e−ik·~r d3~r
3/2
(2π)
(D.18)
Per una descrizione più completa dell’argomento si faccia riferimento agli appunti del Corso di Metodi Matematici 1 (reperibili all’indirizzo:
http://www.ph.unit.it/ccl/riforma/progr 2000 comdid.html)
Appendice E
Cenni sui tensori
E.1
Generalità sui tensori
Un tensore è una entità costituita da componenti che, in genere, sono funzioni di un certo numero di variabili indipendenti (le coordinate in un certo
spazio, che individuano un punto dello spazio). L’insieme delle componenti
si comporta come un tensore o meno a seconda del modo in cui le componenti
si trasformano per un cambiamento di coordinate.
In uno spazio a n dimensioni (cioè n variabili o coordinate) un tensore
di rango r ha nr componenti. Un tensore di rango zero ha una sola componente A ed è chiamato scalare. Un tensore di rango 1 ha n componenti
(A1 , A2 , ...An ) ed è chiamato vettore. Un tensore di rango 2 ha n2 componenti
e si può rappresentare sotto forma matriciale:





A11 A12
A21 A22
...
...
An1 An2
... A1n
... A2n
... ....
... Ann





Il tensore è detto singolare se il determinante della matrice è nullo ed è detto
simmetrico se Aij = Aji per tutti gli indici i e j. I tensori di rango più alto
vengono rappresentati indicando la componente generica, Aijk per un tensore
di rango 3, Aijkl per un tensore di rango 4 e cosı̀ via. In genere bisogna tenere
conto dell’ordine degli indici, cioè A123 6= A231 , a meno di particolari proprietà
di simmetria del tensore. Si noti che quando si rappresentano le componenti
di un tensore di rango 2, Aij , sotto forma di matrice il primo indice si riferisce
sempre alla riga, il secondo alla colonna.
E.2
Definizione di tensore
Si consideri un sistema di coordinate xi i=1, 2, ... n nello spazio a n di′
mensioni ed un secondo sistema di coordinate xl l=1, 2, ... n. Siano Aij...k
′
le componenti di un tensore nel sistema delle xi e Alm...n le sue componenti
′
′
nel sistema delle xl . Si supponga che i due sistemi delle xi e delle xj siano
legati da una trasformazione di coordinate che non sia singolare, cioè che le
′
equazioni che esprimono le xl in funzioni delle xi siano invertibili in modo da
′
poter esprimere le xi in funzione delle xj , e che le funzioni che specificano la
′
trasformazione xl = f (xi ) siano derivabili tante volte quanto è necessario.
′
Un’entità con componenti Aij...k nel sistema delle xi e Alm...n nel si′
stema delle xl si comporta per definizione come un tensore covariante per la
′
trasformazione xi → xl se
′
Alm...n =
X X
i
...
j
X
∂xi ∂xj
∂xk
...
′
′
∂xl ∂xm
∂x′n
Aij...k
k
(E.1)
Similmente Aij...k si comporta per definizione come un tensore controvariante
′
per la trasformazione xi → xl se
′
′ lm...n
A
=
X X
i
...
j
X
′
′
∂xl ∂xm
∂xn
...
∂xi ∂xj
∂xk
ij...k
A
k
(E.2)
Infine Ai...j
k...l si comporta per definizione come un tensore misto per la trasfor′
mazione xi → xl se
′
′ m...n
Ap...q =
X
i
...
X
j
...
X
k
...
X
l
Ai...j
k..l
′
∂xm ∂xn ∂xk ∂xl
...
...
∂xi
∂xj ∂x′p ∂x′q
(E.3)
Se si afferma semplicemente che una entità è un tensore si intende che essa si comporta come un tensore per tutte le trasformazioni delle coordinate
pertinenti, non singolari e derivabili. Si può osservare che in ogni dato punto
′
sono numeri puri, per cui le trasformazioni di tensori (E.1)–(E.3) sono
le ∂x
∂x
lineari: le componenti nel nuovo sistema sono funzioni lineari delle componenti nel vecchio, con coefficienti uguali a prodotti di derivate parziali prime
calcolate nel punto dato.
Tensori covarianti comportano derivate delle vecchie coordinate rispetto alle nuove e vengono indicati con indici posti a pedice; tensori controvarianti comportano derivate delle nuove coordinate rispetto alle vecchie
e vengono indicati con indici posti ad apice; tensori misti, infine comportano
derivate di entrambi i tipi e vengono indicati con indici ad apice e a pedice in
corrispondenza delle coordinate per le quali si hanno trasformazioni di tipo
controvariante e covariante rispettivamente.
Le definizioni date, applicate ad un tensore di rango zero (scalare)
′
comportano che A = A; perciò uno scalare è funzione solo della posizione, è
indipendente dal sistema di coordinate e viene detto invariante.
Ricordiamo, infine, il teorema principale del calcolo tensoriale: se due
tensori dello stesso tipo sono uguali in un sistema di coordinate, lo sono in
tutti i sistemi.
Appendice F
Cenni sulle funzioni di Bessel
Riassumiamo brevemente definizioni e proprietà delle funzioni di Bessel.
L’equazione differenziale
1 dR
d2 R
+
+
2
dx
x dx
ν2
1− 2 R = 0
x
!
(F.1)
prende il nome di equazione di Bessel; le sue soluzioni sono chiamate funzioni di Bessel di ordine ν. La forma esplicita della soluzione, indicata
comunemente con Jν (x), è:
Jν (x) =
ν X
∞
x
2
(−1)j
j=0 j! Γ(j + ν + 1)
2j
x
2
(F.2)
e prende il nome di funzione di Bessel di prima specie di ordine ν; Γ è la
funzione di Eulero, la cui rappresentazione integrale è:
Γ(z) =
Z
0
∞
e−t tz−1 dt
(F.3)
Si può dimostrare che la serie che definisce la Jν (x) converge per tutti i valori
finiti di x e per ogni ν. Se ν non è un numero intero, la funzione J−ν (x), che
è a sua volta soluzione della (F.1), risulta linearmente indipendente da Jν (x)
e le due funzioni J±ν (x) costituiscono una coppia di soluzioni linearmente indipendenti dell’equazione differenziale di second’ordine di Bessel. Se, invece,
ν è un numero intero, le due soluzioni sono linearmente dipendenti e vale la
relazione:
J−ν (x) = (−1)ν Jν (x)
(F.4)
Pertanto è necessario trovare un’altra soluzione linearmente indipendente
quando ν è intero. Normalmente, anche quando ν non è un intero, si sostituisce la coppia J±ν (x) con la coppia costituita la Jν (x) e da Nν (x), la
cosiddetta funzione di Neumann o funzione di Bessel di seconda specie:
Nν (x) =
Jν (x) cos νπ − J−ν (x)
sin νπ
(F.5)
che è linearmente indipendente da Jν (x), qualunque sia ν.
Accanto alle funzioni di Bessel di prima e di seconda specie è sovente
utile considerare le cosiddette funzioni di Bessel di terza specie o funzioni di
Hankel, definite come particolari combinazioni lineari di Jν (x) e Nν (x):
Hν(1) (x) = Jν (x) + iNν (x)
Hν(2) (x) = Jν (x) − iNν (x)
(F.6)
esse formano un insieme fondamentale di soluzioni dell’equazione di Bessel, al
pari delle Jν (x) e Nν (x). Si noti che, facendo un parallelismo tra le funzioni
di Bessel e le funzioni trigonometriche, si può dire, in un certo senso, che
le funzioni Jν (x) e Nν (x) stanno a cos x e sin x come le funzioni Hν(1) (x) e
Hν(2) (x) stanno agli esponenziali eiz e e−iz ; come in certi problemi che portano
a considerare funzioni di tipo trigonometrico è più opportuno a volte servirsi
di seno e coseno e a volte di esponenziali, cosı̀ nei problemi che portano alle
funzioni di Bessel si useranno, di volta in volta, come sistema fondamentale
di soluzioni, o le funzioni Jν (x) e Nν (x) o le funzioni di Hankel, a seconda
del particolare problema.
Tutte le funzioni Jν (x), Nν (x), Hν(1) (x), Hν(2) (x) soddisfano le formule
ricorrenti
Ων−1 (x) + Ων+1 (x) =
2ν
Ων (x)
x
(F.7)
dΩν (x)
dx
(F.8)
Ων−1 (x) − Ων+1 (x) = 2
dove Ων (x) è una qualsiasi delle funzioni suindicate. In particolare, tenuto
′
conto della (F.4), per ν intero si ha J0 (x) = (−1) J1 (x).
In figura F.1 sono riportate le funzioni di Bessel di prima e di seconda
specie di ordine 0 e 1; in figura F.2, invece, sono riportate le derivate prime
delle funzioni J0 (x), J1 (x), N0 (x) ed N1 (x).
Per completezza, riportiamo i comportamenti asintotici dei vari tipi di
funzioni di Bessel per valori molto grandi e molto piccoli dell’argomento. Per
semplicità indicheremo soltanto i termini dominanti dei rispettivi sviluppi:
Figura F.1:
• x << 1
Jν (x) →
Nν (x) →
1
Γ(ν+ 1)
2
π
h
ln
x
2
2
x
2
i
+ 0.5772 ...
− Γν
π
ν
2
x
ν = 0
ν 6= 0
(F.9)
In queste formule si assume che ν sia reale e non negativo.
• x >> 1, ν ≥ 0
Jν (x) →
Nν (x) →
q
2
πx
q
2
πx
cos x −
νπ
2
−
π
4
sin x −
νπ
2
−
π
4
(F.10)
La transizione dal comportamento per x piccolo alla forma asintotica per x
grande avviene nella regione x ≃ ν.
Dalle espressioni asintotiche (F.10) risulta chiaro che ciascuna delle
funzioni di Bessel, presentando un andamento oscillatorio attorno al valore
zero, ha un numero infinito di zeri; questo è visibile nella figura (F.1) per le
funzioni di prima e seconda specie di ordine 0 e 1, mentre dalla figura (F.2)
si può dedurre che anche le derivate prime delle summenzionate funzioni
godono della stessa proprietà. Consideriamo in particolare le radici di Jν (x):
Jν (xνm ) = 0
n = 1, 2, 3, ....
(F.11)
Figura F.2:
dove xνm è la radice m–esima di Jν (x). Per i primi tre valori di ν le prime
tre radici sono:
ν=0, x0n = 2.405, 5.520, 8.654, ...
ν=1, x1n = 3.832, 7.016, 10.173, ...
ν=2, x2n = 5.136, 8.417, 11.620, ...
(si noti che gli zeri risultano spaziati di circa π.)
Per gli zeri ulteriori la formula asintotica:
xνn ≃ nπ + (ν − 1/2)
π
2
(F.12)
dà una approssimazione sufficiente.
Le funzioni di Bessel di ordine intero (ν=n) vengono anche indicate come funzioni di Bessel cilindriche, mentre si indicano generalmente col
nome di funzioni di Bessel sferiche quelle ad indice semintero (ν= n+1/2).
Tali denominazioni derivano dalle simmetrie dei problemi che portano alla
considerazione di queste funzioni.
È invalso l’uso di definire le funzioni sferiche di Bessel e Hankel,
indicate con i simboli jl (x), hl (x) e nl (x), nel modo seguente:
π 1/2
Jl+1/2 (x)
2x
1/2
π
nl (x) =
Nl+1/2 (x)
2x
jl (x) =
(1,2)
hl (x)
=
π
2x
(2)
1/2 h
Jl+1/2 (x) ± iNl+1/2 (x)
(1)
i
(F.13)
Per x reale hl (x) è il complesso coniugato di hl (x).
Per i primi valori dell’indice l, le forme esplicite delle (F.13) sono:
j0 (x) = sinx x
n0 (x) = − cosx x
ix
(1)
h0 (x) = eix
x
j1 (x) = sin
− cosx x
x2
x
n1 (x) = − cos
− sinx x x2 ix
(1)
h1 (x) = − ex 1 + xi
j2 (x) = x33 − x1
n2 (x) = − x33 −
(1)
ix
x
sin x − 3 cos
x2
1
x
cos x − 3 sin
x
x2
h2 (x) = iex 1 + 3ix − x32
j3 (x) = x154 − x62 sin x − x153 −
n3 (x) = −
(1)
h3 (x)
eix
x
15
4
x
−
6
x2
6i
x
cos x −
15
x2
15
x3
15i
x3
1
x
−
cos x
1
x
sin x
1 +
−
−
=
in figura F.3 sono riportate j0 (x), n0 (x), j1 (x) e n1 (x).
Figura F.3:
Per piccoli valori di x si hanno le seguenti espressioni asintotiche:
xl
jl (x) →
(2l + 1) !!
x2
1 −
+ ...
2(2l + 3)
!
x2
1 −
+ ...
2(1 − 2l)
!
(2l − 1) !!
nl (x) → −
xl+1
(F.14)
Analogamente si ottengono le espressioni asintotiche per grandi valori di x:
!
1
lπ
jl (x) →
sin x −
x
2
!
lπ
1
nl (x) → − cos x −
x
2
eix
(1)
hl (x) → (−i)l+1
x
Le funzioni di Bessel sferiche soddisfano le relazioni ricorrenti:
2l + 1
zl (x) = zl−1 (x) + zl+1 (x)
x
′
zl (x) =
(F.15)
(F.16)
1
[lzl−1 (x) − (l + 1)zl+1 (x)]
2l + 1
(F.17)
(1)
(2)
dove zl (x) rappresenta una qualsiasi delle funzioni jl (x), nl (x), hl (x), hl (x).
Accenniamo, infine, alle funzioni di Bessel modificate. Esse sono
soluzioni dell’equazione differenziale:
d2 R
1 dR
+
−
2
dx
x dx
ν2
1+ 2 R = 0
x
!
(F.18)
e, come evidente, non sono altro che funzioni di Bessel con argomento immaginario puro. Ordinariamente, nella scelta di una coppia di soluzioni linearmente indipendenti, queste sono indicate come Iν (x) e Kν (x), e sono definite
dalle:
Iν (x) = i−ν Jν (ix)
Kν (x) =
(F.19)
π ν+1 (1)
i
Hν (ix)
2
(F.20)
che sono funzioni reali per x e ν reali. Le loro espressioni asintotiche per x
piccolo e per x grande, supponendo x reale e positivo o nullo, sono:
• x << 1
Iν (x) →
1
Γ(ν+ 1)
h
Kν (x) → − ln
x
2
Γν
2
ν
x
2
i
+ 0.5772 ...
ν
2
x
ν 6= 0
ν = 0
(F.21)
• x >> 1, ν ≥ 0
Iν (x) →
Kν (x) →
√1
2πx
q
π
2x
ex
e−x
(F.22)
In figura F.4 sono riportate I0 (x), K0 (x), I1 (x) e K1 (x).
Figura F.4:
Scarica