Problemi inversi in Ottica Geometrica studiati mediante due metodi

UNIVERSITÀ DEGLI STUDI DI CAGLIARI
FACOLTÀ DI SCIENZE
CORSO DI LAUREA MAGISTRALE IN MATEMATICA
Problemi inversi in Ottica Geometrica
studiati mediante due metodi
differenti: l’equazione iconale e
il principio di Fermat
TESI DI LAUREA DI:
Loredana Caddeo
RELATORE:
Dott. Francesco Demontis
Anno Accademico 2015/2016
Indice
Introduzione
i
1 Ottica fisica e ottica geometrica
1
Il Campo Elettromagnetico . . . . . . . . . . . . .
1.1
Le equazioni di Maxwell . . . . . . . . . .
1.2
Le equazioni d’onda e la velocità della luce
1.3
La teoria elementare della dispersione . . .
2
Fondamenti di ottica geometrica . . . . . . . . . .
2.1
L’equazione iconale . . . . . . . . . . . . .
2.2
L’equazione differenziale dei raggi di luce .
2.3
Le leggi di rifrazione e riflessione . . . . .
2.4
Raggi di congruenza e loro proprietà focali
2.5
Il principio di Fermat . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Problema inverso in tre dimensioni
1
Introduzione al problema . . . . . . . . . . . . . . . . .
1.1
Nozioni geometriche . . . . . . . . . . . . . . .
2
Primo metodo: il principio di Fermat . . . . . . . . . .
3
Risolubilità del sistema della distribuzione dell’indice di
4
Secondo metodo: l’equazione iconale . . . . . . . . . .
5
Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Esempio 1 . . . . . . . . . . . . . . . . . . . . .
5.2
Esempio 2 . . . . . . . . . . . . . . . . . . . . .
5.3
Esempio 3 . . . . . . . . . . . . . . . . . . . . .
5.4
Esempio 4 . . . . . . . . . . . . . . . . . . . . .
3 Problema inverso in due dimensioni
1
Equazione differenziale alle derivate
diante il principio di Fermat . . . .
2
Equazione differenziale alle derivate
diante l’equazione iconale . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
3
5
8
9
13
16
18
19
. . . . . .
. . . . . .
. . . . . .
rifrazione
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
23
25
27
29
34
36
37
40
42
45
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
51
parziali dell’indice di rifrazione
. . . . . . . . . . . . . . . . . .
parziali dell’indice di rifrazione
. . . . . . . . . . . . . . . . . .
i
trovata me. . . . . . .
trovata me. . . . . . .
52
54
3
Indici di rifrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Indici di rifrazione radiali . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
Indici di rifrazione omogenei . . . . . . . . . . . . . . . . . . . . . . . . .
55
55
57
A Sistemi di PDEs di primo ordine
1
Sistemi di equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Sistemi completi di Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Integrazione di sistemi completi . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
61
64
66
Conclusioni
69
Bibliografia
71
ii
Introduzione
L’ottica è la branca dell’elettromagnetismo che descrive il comportamento e le proprietà della
luce e l’interazione di questa con la materia. Esistono tre branche di ottica: l’ottica geometrica,
l’ottica fisica e l’ottica quantistica.
La tesi è quasi interamente dedicata all’ottica geometrica, ma verranno fornite le nozioni
principali dell’ottica fisica che verranno utilizzate per l’ottica geometrica (che è un suo caso
particolare)1 .
L’ottica fisica studia i fenomeni di interferenza, diffrazione, polarizzazione della luce e tutti
quei fenomeni per i quali è necessario ricorrere alla descrizione del carattere ondulatorio della
luce come radiazione elettromagnetica applicando quindi le equazioni di Maxwell2 .
L’ottica geometrica costituisce un’approssimazione dell’ottica fisica. Essa è valida quando la
luce interagisce solo con oggetti di dimensioni molto maggiori rispetto alla sua lunghezza d’onda.
Invece di parlare di direzione di propagazione dell’onda in ottica geometrica (si veda [1, 2, 3]) si
introduce il concetto di raggio. Utilizzando il concetto di raggio, gli unici fenomeni rilevanti sono
la propagazione rettilinea, la riflessione e la rifrazione ed è possibile spiegare il funzionamento di
specchi, prismi, lenti e dei sistemi ottici costruiti con essi.
L’ottica geometrica è basata sulle seguenti leggi3 :
• Legge di propagazione rettilinea
La legge afferma che nel vuoto la luce si propaga lungo linee rette. Tale comportamento
della luce viene mantenuto all’interno di un qualsiasi mezzo omogeneo.
• Leggi della riflessione
La riflessione è il fenomeno per cui una congruenza ortogonale4 di raggi che incide su una
superficie di discontinuità genera una nuova congruenza ortogonale di raggi. Le leggi della
riflessione affermano che tale nuovo raggio, detto raggio riflesso, si trova nel piano definito
dal raggio incidente e dalla perpendicolare alla superficie e nel punto di incidenza forma
con tale perpendicolare un angolo con la stessa ampiezza e verso opposto di quello formato
dal raggio incidente.
1
Per maggiori dettagli consultare [1, 2, 3].
Le equazioni di Maxwell verranno introdotte nel Capitolo 1.
3
Per maggiori dettagli consultare [1, 2, 3].
4
La definizione di congruenza ortogonale verrà data nel Capitolo 1.
2
iii
• Leggi della rifrazione (Legge di Snell)
La rifrazione è il fenomeno per cui una congruenza ortogonale di raggi che attraversa una
superficie di discontinuità (contatto tra due materiali diversi) viene deviata. Le leggi della
rifrazione affermano che:
1. Il raggio uscente si trova sul piano definito dal raggio entrante e dalla perpendicolare
alla superficie nel punto di contatto.
2. Le ampiezze degli angoli formati dai due raggi rispetto alla perpendicolare alla superficie sono collegati dalla relazione: n1 sin θ1 = n2 sin θ2 dove i coefficienti ni , i = 1, 2,
sono detti indici di rifrazione e dipendono dai materiali di cui sono costituiti i mezzi
e dalla frequenza.
L’indice di rifrazione di un materiale è una grandezza adimensionale che quantifica la diminuzione della velocità di propagazione della radiazione elettromagnetica quando attraversa
c
un materiale ed è definito dalla formula n = , dove c rappresenta la velocità della luce
v
nel vuoto e v è la velocità di propagazione del raggio di luce nel mezzo.
Nei fenomeni di rifrazione oltre al raggio rifratto, vi è sempre anche un raggio riflesso. Nel
caso in cui il raggio provenga dal mezzo con indice di rifrazione maggiore, con un angolo tale che l’angolo uscente dovrebbe essere maggiore di 90◦ (θ1 > arcsin( nn21 )), il raggio
rifratto non è presente e tutta la luce viene riflessa (riflessione totale).
Gli indici di rifrazione sono definiti dalla legge precedente a meno di una costante moltiplicativa. Essi sono determinati convenzionalmente assumendo uguale a 1 l’indice di rifrazione del
vuoto; sapendo che la velocità della luce è massima nel vuoto, ne segue che l’indice di rifrazione
di tutte le altre sostanze è maggiore di 1.
La variazione dell’indice di rifrazione in funzione della frequenza provoca il fenomeno della dispersione cromatica, cioè la separazione di un raggio di luce bianca nel suo spettro. La
dispersione cromatica è all’origine dell’arcobaleno5 e dell’aberrazione cromatica6 .
In ottica geometrica si presentano i seguenti due problemi:
• Problema diretto: Si suppone assegnato l’indice di rifrazione di un mezzo e si vuole
determinare la traiettoria seguita dai raggi di luce in tale mezzo.
• Problema inverso: Si suppone assegnata una famiglia di curve e si vuole costruire la
funzione n = n(x, y, z) -che rappresenta l’indice di rifrazione di un mezzo- in modo che la
luce si propaghi in tale mezzo lungo le curve della famiglia assegnate.
5
L’arcobaleno è un fenomeno ottico e meteorologico che produce uno spettro quasi continuo di luce nel cielo
quando la luce del Sole attraversa le gocce d’acqua rimaste in sospensione dopo un temporale, o presso una
cascata o una fontana.
6
L’aberrazione cromatica è un difetto nella formazione dell’immagine dovuta al diverso valore di rifrazione
delle diverse lunghezze d’onda che compongono la luce che passa attraverso il mezzo ottico. Questo si traduce in
immagini che presentano ai bordi dei soggetti aloni colorati.
iv
Nella tesi focalizzeremo la nostra attenzione sullo studio del problema inverso in ottica geometrica. Tale problema, come già detto, consiste nel trovare l’indice di rifrazione di un mezzo
supponendo di conoscere la traiettoria dei raggi di luce. L’indice di rifrazione è descritto da una
funzione delle coordinate cartesiane utilizzate n = n(x, y, z).
La tesi sarà cosı̀ strutturata :
• Capitolo 1: Ottica fisica e ottica geometrica
In questo capitolo verranno enunciate le principali nozioni dell’ottica fisica e le equazioni
di Maxwell. Mediante tali equazioni verranno trovate le equazioni fondamentali dell’ottica
geometrica: l’equazione iconale e l’equazione differenziale dei raggi di luce. Si dimostrerà
che l’indice di rifrazione non è una quantità costante ma bensı̀ dipendente dalla frequenza
(fenomeno di dispersione). Verrà enunciato e dimostrato il principio di Fermat.
• Capitolo 2: Problema inverso in tre dimensioni
In questo capitolo verrà descritto il seguente problema inverso in ottica geometrica in tre
dimensioni:
Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione
rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente,
isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della
conguenza assegnate.
Tale problema viene risolto mediante due approcci differenti: l’equazione iconale e il principio di Fermat. Entrambi gli approcci conducono ai medesimi risultati. Vengono discussi
quattro esempi i quali vengono risolti mediante l’equazione iconale.
• Capitolo 3: Problema inverso in due dimensioni
In questo capitolo verrà descritto il problema inverso in ottica geometrica in due dimensioni,
che risulta essere un caso particolare del problema tridimensionale. Come nel Capitolo 2
viene risolto sia mediante il principio di Fermat che mediante l’equazione iconale e viene
ricavata l’equazione dell’indice di rifrazione. Vengono discussi alcuni esempi nei quali viene
applicata la teoria sviluppata, ponendo delle condizioni restrittive sull’indice di rifrazione.
• Appendice: Sistemi di PDEs di primo ordine
In questa appendice verranno descritti i sistemi di PDEs di primo ordine. Verranno descritti
i sistemi completi e i sistemi Jacobiani e verrà studiata la loro risolubilità.
v
vi
Capitolo 1
Ottica fisica e ottica geometrica
In questo capitolo descriveremo le equazioni di Maxwell che stabiliscono la stretta connessione
tra campo elettrico e campo magnetico.
Verrà dimostrato, con semplici argomentazioni matematiche, che l’indice di rifrazione n non è
costante ma dipende dalla frequenza (dispersione).
Il principale oggetto di studio sarà l’ottica geometrica che nasce come caso limite quando la
lunghezza d’onda tende a diventare zero. Questo fa si che l’energia venga trasportata attraverso
raggi di luce e, quindi, che possano essere applicate considerazioni geometriche a fenomeni ottici.
Partendo dal problema diretto, in cui l’indice di rifrazione è noto, verranno derivate le equazioni
più importanti dell’ottica geometrica: l’equazione iconale e l’equazione dei raggi di luce. Verrà
infine descritto il principio di Fermat.
1
Il Campo Elettromagnetico
Il campo elettromagnetico interagisce nello spazio con cariche elettriche e può manifestarsi anche
in assenza di esse, trattandosi di un’entità fisica che può essere definita indipendentemente dalle
sorgenti che l’hanno generata. In assenza di sorgenti il campo elettromagnetico è detto onda
elettromagnetica, viene rappresentato da due vettori, E e B, chiamati rispettivamente campo
elettrico e campo magnetico, essi sono campi vettoriali solenoidali1 , eccetto nel punto occupato
dalla carica, in cui la divergenza del campo risulta infinita. Per descrivere l’effetto del campo su
oggetti materiali, è necessario introdurre un secondo set di vettori: la densità di corrente elettrica
j, l’induzione elettrica nella materia D, il campo magnetico nella materia H. La variazione
temporale di uno dei due campi (elettrico o magnetico) determina il manifestarsi dell’altro:
campo elettrico e campo magnetico sono caratterizzati da una stretta connessione che è stabilita
dalle quattro equazioni di Maxwell.
1
Un campo vettoriale C viene detto solenoidale quando la divC = 0 in ogni suo punto.
1
1.1
Le equazioni di Maxwell
Le derivate spaziali e temporali dei vettori E, B, H, D, j sono legate dalle equazioni di Maxwell,
che ricoprono tutti i punti dello spazio in cui le proprietà fisiche del mezzo sono continue2 :
4π
1
j,
rotH − Ḋ =
c
c
(1.1)
1
rotE + Ḃ = 0,
c
(1.2)
divD = 4πρ,
(1.3)
divB = 0.
(1.4)
dD
dB
dove Ḋ =
e Ḃ =
.
dt
dt
Vi sono poi due relazioni scalari:
L’equazione (1.3) può essere riguardata come una definizione della densità di carica elettrica ρ,
l’equazione (1.4) implica che non esistono monopoli magnetici. Dall’equazione (1.1) (e dal fatto
che div rot ≡ 0) segue che:
1
(1.5)
divj = − div Ḋ,
4π
derivando l’equazione (1.3) rispetto al tempo, ed eguagliando quanto trovato con la (1.5) si
ottiene:
∂ρ
+ divj = 0,
(1.6)
∂t
chiamata equazione di continuità.
Le equazioni di Maxwell connettono le cinque quantità base, E, H, B, D, j. Esse consentono
un’unica determinazione dei vettori di campo dati da una distribuzione di corrente e di cariche,
e devono essere integrate da relazioni che descrivono il comportamento delle sostanze sotto
l’influenza del campo. Queste relazioni sono conosciute come equazioni materiali, in generale
sono piuttosto complicate. Tuttavia, se valgono le seguenti ipotesi:
1. il campo varia con legge periodica sinusoidale,
2. i corpi sono a riposo o in movimento molto lento rispetto agli altri,
3. il materiale di cui è composto il mezzo è isotropo3 ,
2
Le quantità E, D, j, ρ sono misurate in unità elettrostatiche, le quantità H e B in unità magnetiche, la
costante c che indica la velocità della luce nel vuoto è approssimata a 3 × 1010 cm/s.
3
L’isotropia è una caratteristica fisica la quale indica l’indipendenza dalla direzione nella quale si analizza il
fenomeno.
2
allora esse generalmente assumono la forma relativamente semplice:
j = σE,
(1.7)
D = εE,
(1.8)
B = µH,
(1.9)
dove σ è la conducibilità specifica, ε è la costante dielettrica e µ è la permeabilità magnetica.
1.2
Le equazioni d’onda e la velocità della luce
Limiteremo la nostra attenzione a quella parte del campo che non contiene cariche o correnti
ossia : j = 0 e ρ = 0. Sostituiamo B con l’equazione materiale (1.9) nell’equazione (1.2),
dividendo entrambe le parti per µ e applicando l’operatore rotore si ottiene:
1
1
rot
rotE + rotḢ = 0.
(1.10)
µ
c
Differenziando rispetto al tempo l’equazione (1.1) e utilizzando l’equazione (1.8) per esprimere
D, si elimina rotḢ tra l’equazione risultante e (1.10) e si ottiene:
1
ε
rotE + 2 Ë = 0.
(1.11)
rot
µ
c
Utilizzando le identità rot(uv) = u rotv + grad u ∧ v e rot(rot) = grad(div) − ∇2 l’equazione
(1.11) diventa:
εµ
(1.12)
∇2 E − 2 Ë + (grad ln µ) ∧ rotE − grad(divE) = 0.
c
Inoltre utilizzando la relazione divD = 4πρ, l’equazione (1.8) per D e l’identità div(uv) =
u divv + v · grad u si trova:
ε divE + E · gradε = 0.
(1.13)
Dopo aver fatto queste considerazioni l’equazione (1.12) può essere riscritta nella forma:
∇2 E −
εµ
Ë + (grad ln µ) ∧ rotE − grad(E · grad ln ε) = 0.
c2
(1.14)
Effettuando passaggi simili si ottiene:
∇2 H −
εµ
Ḧ + (grad ln ε) ∧ rotH − grad(H · grad ln µ) = 0.
c2
(1.15)
Se il mezzo è omogeneo4 allora grad ln µ = grad ln ε = 0 e le equazioni (1.14) e (1.15) si riducono
a:
εµ
∇2 E − 2 Ë = 0,
(1.16)
c
4
Un mezzo si dice omogeneo, quando ε, µ e σ non dipendono dallo spazio percorso dall’onda elettromagnetica.
3
εµ
Ḧ = 0.
(1.17)
c2
1
In generale l’equazione tipica di un’onda è ∇2 u − 2 ü = 0 dove u(r, t) è una funzione della
v
posizione r e del tempo t, e v indica la velocità di propagazione dell’onda. Quindi le equazioni
(1.16) e (1.17) sono le equazioni standard del moto dell’onda e suggeriscono l’esistenza di onde
elettromagnetiche che si propagano con velocità data dalla seguente formula:
c
(1.18)
v=√ .
εµ
∇2 H −
Il valore di v non è determinato direttamente con una regola, ma solo relativamente a c, per
mezzo della legge di rifrazione. Secondo tale legge, se un’onda elettromagnetica piana cade
sulla regione di confine tra due mezzi omogenei, il seno dell’angolo θ1 , formato tra la normale
all’onda incidente e la normale alla superficie, sta in un rapporto costante con il seno dell’angolo
θ2 formato tra la normale all’onda rifratta e la superficie normale (Figura 1.1), questo rapporto
costante diventa uguale al rapporto tra le velocità v1 e v2 di propagazione dell’onda nei mezzi:
sin θ1
v1
= .
sin θ2
v2
(1.19)
Figura 1.1: La figura rappresenta la rifrazione di un’onda piana. La figura è stata presa dal [2].
Il valore costante nel rapporto è solitamente denotato con n12 ed è chiamato indice di rifrazione,
per la rifrazione dal mezzo 1 al mezzo 2. Si può anche definire l’indice di rifrazione assoluto di
un mezzo:
c
n= .
(1.20)
v
4
Mezzo
Aria
Idrogeno H2
Anidride carbonica CO2
Monossido di Carbonio CO
Metanolo CH3 OH
Alcool etilico C2 H5 OH
Acqua H2 O
n
1,000294
1,000138
1,000449
1,000340
1,34
1,36
1,33
√
ε
1,000295
1,000132
1,000473
1,000345
5,7
5,0
9,0
Tabella 1.1: Tabella nella quale vengono riportati gli indici di rifrazione di alcuni mezzi e le
costanti dielettriche statiche.
Se n1 e n2 sono gli indici di rifrazione assoluti di due mezzi, il relativo indice di rifrazione n12
per la rifrazione dal mezzo 1 al mezzo 2 è dato da :
v1
n2
= .
n12 =
n1
v2
Mettendo a confronto l’equazione (1.20) e l’equazione (1.18) si ottiene:
√
n = εµ,
(1.21)
chiamata formula di Maxwell. Dal momento che per tutte le sostanze di cui ci occuperemo µ
risulta unitario, l’indice di rifrazione è dato dalla radice della costante dielettrica del mezzo ε,
che è assunta come costante del materiale. Però, esperimenti sui colori prismatici, già noti dai
tempi di Newton5 , mostrano che l’indice di rifrazione dipende dalla frequenza della luce.
1.3
La teoria elementare della dispersione
Nella sezione §1.2 è stato osservato che l’indice di rifrazione non può essere una costante del
mezzo come suggerisce la nostra precedente trattazione formale, ma deve dipendere dalla frequenza. La variazione dell’indice di rifrazione in funzione della frequenza costituisce il fenomeno
di dispersione. Per uno studio adeguato della dispersione sarebbe necessario ricorrere alla teoria
atomica della materia6 : tuttavia è possibile dare un modello semplificato facendo uso di alcuni
risultati base riguardanti la struttura delle molecole.
In questa sezione dimostriamo, con semplici argomentazioni matematiche, la dipendenza dell’indice di rifrazione dalla frequenza. A tal fine, occorre determinare lo sposamento r7 per ogni
5
Isaac Newton fu il primo a dimostrare che la luce bianca era composta dalla luce di tutti i colori
dell’arcobaleno, che potevano essere separati in uno spettro completo di colori da un prisma di vetro.
6
Si veda [2] per maggiori dettagli.
7
Il calcolo rigoroso dello spostamento r dei nuclei e degli elettroni è un problema complicato di meccanica
quantistica. Tuttavia, è confermato dalla teoria che gli elettroni si comportano come se fossero soggetti all’azione
di una forza “elastica”Q = qr.
5
particella carica dalla sua posizione di equilibrio. Si può dimostrare8 che l’equazione di moto di
un elettrone avente carica e e massa m è:
mr̈ + qr = eÊ
(1.22)
4π
dove con Ê si indica il campo elettrico effettivo Ê = E +
P, essendo P la polarizzazione9
3
totale e con qr si rappresenta una forza di ripristino quasi elastica.
Si deve tener presente che ogni elettrone contribuisce alla polarizzazione con un momento pari
a p = er. Osserviamo che si dovrebbe tenere in considerazione anche il contributo dei nuclei.
Tuttavia, possiamo trascurare tale contributo perchè le masse dei nuclei sono grandi in confronto a quelle degli elettroni e quindi il loro contributo allo spostamento è trascurabile in prima
approssimazione. Sia ω la frequenza angolare del campo incidente:
Ê = Ê0 e−iωt
(1.23)
L’equazione (1.22) con Ê dato dalle (1.23) ammette la soluzione
r=
eÊ
,
m(ω02 − ω 2 )
(1.24)
r
q
è chiamata frequenza di risonanza. In accordo all’equazione (1.24) l’elettrone
m
oscilla con la frequenza del campo incidente. Si noti che nell’equazione (1.24) deve essere ω 6= ω0 .
Supponendo per il momento che vi sia un solo elettrone efficace in una molecola con frequenza
di risonanza ω0 si ottiene, per la polarizzazione totale P, l’espressione:
dove ω0 =
P = N p = N er = N
Ê
e2
,
2
m (ω0 − ω 2 )
(1.25)
dove con N si indica il numero di molecole per unità di volume. Dalla teoria della struttura
atomica della materia10 è noto che:
P = N αÊ,
(1.26)
sostituendo tale espressione nella (1.25), si trova:
Nα = N
e2
,
m(ω02 − ω 2 )
8
(1.27)
Per maggiori dettagli si veda il Capitolo 2 in [2].
La polarizzazione è una caratteristica delle onde elettromagnetiche ed indica la direzione di oscillazione del
campo elettrico durante la propagazione dell’onda nello spazio.
10
Per ulteriori dettagli si visioni il Capitolo 2 in [2].
9
6
che esprime la densità di polarizzazione in termini di parametri atomici. Pertanto risulta che la
3 ε − 1 11
, non è costante, dove ε nella sua espressione
quantità α, la cui espressione è α =
4πN ε + 2
denota la costante dielettrica statica. Questo porta ad introdurre la dipendenza della costante
dielettrica dalla frequenza ossia ε(ω) che è stata definita per mezzo delle equazioni di Maxwell
come ε = n2 , quindi anche l’indice di rifrazione n è funzione della frequenza n(ω). La costante
dielettrica statica assume il valore ε(0) = n2 (0); questo corrisponde, secondo la (1.26), al valore
limite N α(0) che viene trovato dalla (1.27) ponendo ω = 0:
N α(0) =
N e2
.
mω02
Per ω 6= 0, la funzione N α(ω) data dall’equazione (1.27), è monotona crescente rispetto a ω,
ma assume un valore infinito (punto di risonanza) quando ω tende a ω0 , infine per ω → ∞ la
funzione tende al valore zero. Sostituendo il valore di α nella (1.27) si trova:
n2 − 1
4π
N e2
=
.
n2 + 2
3 m(ω02 − ω 2 )
(1.28)
Per i gas il valore di n è vicino all’unità e si ottiene la seguente espressione (approssimata) della
dispersione:
4πN e2
n2 − 1 ∼ 4πN α =
.
(1.29)
m(ω02 − ω 2 )
Si osserva immediatamente che n è una funzione della frequenza. La dispersione è detta normale.
Inoltre, n ≷ 1 in base a ω ≶ ω0 e n si avvicina all’unità con l’incremento di ω (vedi Figura 1.2).
Alla frequenza di risonanza (ω = ω0 ) n è in realtà infinito, come risulta dalle formule (1.29)(si
veda anche il grafico continuo nella Figura 1.2).
La singolarità (corrispondente al termine ω0 − ω al denominatore nell’equazione (1.25)) sorge
in quanto si è trascurato l’effetto di smorzamento. Lo smorzamento è infatti un fattore essenziale
nell’intero processo in quanto gli elettroni vibrando emettono onde elettromagnetiche che sottraggono energia. Formalmente lo smorzamento può essere preso in considerazione aggiungendo
nell’equazione di moto (1.22) un termine g ṙ che rappresenta un forza resistente:
mr̈ + g ṙ + qr = eÊ.
(1.30)
La soluzione dell’equazione (1.30) è:
r=
m(ω02
eÊ
.
− ω) − iωg
(1.31)
Sostituendo (1.31) in (1.25) si osserva che la polarizzazione diventa una quantità complessa.
Dal grafico in Figura 1.2, si nota che la curva tratteggiata (che rappresenta la curva di dispersione
11
Si invita il lettore a consultare il Capitolo 2 in [2] per prendere visione del procedimento mediante il quale si
ottiene tale espressione.
7
Figura 1.2: Nella figura viene rappresentata la curva di dispersione per un gas. La linea continua
rappresenta la curva di dispersione data dalla (1.29) e la linea tratteggiata rappresenta la curva
di dispersione data dal modulo della (1.31). La figura è stata presa dal [2].
descritta dal modulo dalla (1.31)), ha un massimo in un valore di ω più piccolo di ω0 , e ha un
minimo in un valore più grande di ω0 ; tra il massimo e il minimo la funzione decresce con
l’incremento della frequenza, questa regione viene chiamata regione di dispersione anomala. I
raggi con una lunghezza d’onda piccola vengono rifratti meno rispetto a quelli di lunghezza
d’onda grande, questo si traduce nell’inversione della sequenza dei colori prismatici. L’indice di
rifrazione per la luce visibile è sempre più grande dell’unità.
2
Fondamenti di ottica geometrica
La branca dell’ottica in cui si trascura la lunghezza d’onda, cioè in corrispondenza al caso limite
λ0 → 0, è nota come ottica geometrica e in tale approssimazione le leggi ottiche possono essere
formulate come leggi geometriche. In particolare, l’energia può essere trasportata lungo curve
(raggi di luce).
Inoltre, per lunghezze d’onda piccole il campo ha lo stesso carattere di un’onda piana. All’interno
dell’approssimazione dell’ottica geometrica valgono i seguenti fatti:
• valgono le leggi di rifrazione e riflessione stabilite per onde piane incidenti su un confine
piano (Es. le superfici di una lente) che dividono il raggio incidente in un raggio riflesso e
un raggio trasmesso;
8
• la riflettività e trasmissività possono essere calcolate dalle corrispondenti formule per onde
piane.
Quindi, quando la lunghezza d’onda tende a zero, i fenomeni ottici possono essere dedotti da
considerazioni geometriche, determinando le traiettorie dei raggi di luce. Si possono formulare
leggi appropriate, considerando le implicazioni delle equazioni di Maxwell quando λ0 → 0.
Infine si sottolinea che la semplicità del modello dell’ottica geometrica deriva essenzialmente dal
fatto che, in generale, il campo si comporta localmente come un’onda piana.
Per la maggior parte dei problemi di ottica, l’ottica geometrica fornisce almeno un buon punto
di partenza per studi più approfonditi.
2.1
L’equazione iconale
In questa sezione deriviamo una delle equazioni più importanti dell’ottica geometrica: l’equazione
iconale.
Ricordando che nell’ottica geometrica i campi (elettrico e magnetico) hanno lo stesso andamento
di un’onda piana e, perciò, in un mezzo isotropo isolante possiamo scrivere:
(
E(r, t) = E0 (r)e−iωt ,
(1.32)
H(r, t) = H0 (r)e−iωt ,
dove E0 e H0 sono vettori complessi. I vettori E0 e H0 soddisfano le equazioni di Maxwell. In
regioni libere da corrente e da cariche, dove j = ρ = 0, tali equazioni assumono la forma:
rotH0 + ik0 εE0 = 0,
(1.33)
rotE0 − ik0 µH0 = 0,
(1.34)
div εE0 = 0,
(1.35)
div µH0 = 0,
(1.36)
2π
ω
=
, dove λ0 è la lunghezza d’onda nel vuoto.
c
λ0
Cerchiamo soluzioni delle equazioni (1.33), (1.34), (1.35), (1.36) della forma:
dove k0 =
E0 = e(r)eik0 S(r) ,
H0 = h(r)eik0 S(r) ,
(1.37)
dove S(r) è una funzione scalare reale della posizione, detta traiettoria ottica, e(r) e h(r) sono
vettori complessi. Sostituendo le (1.37) nelle equazioni di Maxwell (1.33), (1.34), (1.35), (1.36),
si ottiene un set di relazioni tra e, h e S.
Nel caso dell’ottica geometrica, che si ottiene quando λ0 è piccolo, si può dimostrare che queste
relazioni comportano che S soddisfi una certa equazione differenziale, la quale è indipendente
9
dai vettori e e h. Vogliamo ottenere questa equazione differenziale.
A tal fine, notiamo che, dalle equazioni (1.37) e usando le ben note identità vettoriali:
rotH0 = (roth + ik0 gradS ∧ h)eik0 S ,
(1.38)
divµH0 = (µdivh + h · gradµ + ik0 µh · gradS)eik0 S ,
(1.39)
e espressioni analoghe per rotE0 e divεE0 , le equazioni (1.33),(1.34),(1.35),(1.36) diventano:
gradS ∧ h + εe = −
1
roth,
ik0
(1.40)
1
rote,
ik0
(1.41)
gradS ∧ e − µh = −
1
(e · grad ln ε + dive),
ik0
(1.42)
1
(h · grad ln µ + divh).
ik0
(1.43)
e · gradS = −
h · gradS = −
Come già osservato, siamo interessati alla soluzione per valori di λ0 piccoli. Fintanto che il
1
è trascurabile, il fattore a secondo membro di tutte le equazioni può
fattore moltiplicativo
ik0
essere trascurato, e le equazioni si riducono a:
gradS ∧ h + εe = 0,
(1.44)
gradS ∧ e − µh = 0,
(1.45)
e · gradS = 0,
(1.46)
h · gradS = 0.
(1.47)
Le (1.44) e (1.45) possono essere viste come un sistema di sei equazioni scalari lineari e omogenee
per le componenti cartesiane ex , hx , ey , hy , ez , hz di e e h. Queste equazioni hanno soluzioni
non banali solo se il determinante della matrice dei coefficienti del sistema è nullo. Ricavando h
dalla (1.45) e sostituendo nella (1.44) si trova:
1
(e · gradS) gradS − e (gradS)2 + εe = 0.
µ
(1.48)
Grazie alle (1.46) il primo termine dentro la parentesi nella (1.48) si annulla, e l’equazione si
riduce, considerando che e non si annulla mai, a:
(gradS)2 = n2 ,
10
(1.49)
che si può scrivere esplicitamente come:
2 2 2
∂S
∂S
∂S
+
+
= n2 (x, y, z),
(1.50)
∂x
∂y
∂z
√
dove n = εµ è l’indice di rifrazione. L’equazione (1.50) è nota come equazione iconale; ed è
l’equazione fondamentale dell’ottica geometrica.
La superficie
S(r) = costante,
viene chiamata superficie d’onda geometrica (oppure il fronte d’onda geometrico).
I raggi di luce geometrici possono essere ora definiti come traiettorie ortogonali al fronte
d’onda geometrico S = costante. In particolare, si considerano come curve orientate la cui
direzione coincide, in ogni punto, con la direzione della media temporale del vettore di Poynting12 .
Il vettore di Poynting è una grandezza vettoriale che descrive il flusso di energia associato alla
propagazione del campo elettromagnetico, esso è definito tramite il prodotto vettoriale tra il
campo elettrico e il campo magnetico: S = E ∧ H. La media temporale indicata con hSi
è la media integrale calcolata in un intervallo di tempo tendente all’infinito, quindi la media
temporale del vettore di Poynting risulta:
Z T0
c
1
(E ∧ H)dt, per T 0 → ∞.
hSi :=
0
2T −T 0 4π
Utilizzando la (1.45) ed effettuando semplici calcoli, la media temporale del vettore di Poynting
risulta13 :
c
{(e · e? )gradS − (e · gradS)e? } .
(1.51)
hSi =
8πµ
gradS
L’ultimo termine è nullo per la (1.46). Secondo l’equazione iconale,
è un vettore unitario
n
chiamato t:
gradS
gradS
t=
=
.
(1.52)
n
|gradS|
Controntando le equazioni (1.51) e (1.52) si nota che t ha la stessa direzione della media temporale del vettore di Poynting. La media del vettore di Poynting è nella direzione della normale
al fronte d’onda geometrico.
Se r(s) denota il vettore posizione di un punto P su un raggio, considerato come funzione
dr
= t, l’equazione dei raggi può essere scritta come:
dell’ascissa curvilinea s del raggio, dove
ds
n
12
13
dr
= gradS.
ds
Questa definizione di raggi di luce è appropriata solo per mezzi isotropi.
Per maggiori dettagli si veda il Capitolo 3 in [2].
11
(1.53)
Dalle (1.46) e (1.47) si vede che i vettori elettrici e magnetici sono ortogonali al raggio in ogni
punto. Il significato della (1.53) risulta chiaramente dalle seguenti osservazioni. Si considerino
due fronti d’onda “infinitamente”vicini S = costante e S + dS = costante (vedi Figura 1.3).
Figura 1.3: La figura rappresenta il significato della formula ns = gradS. La figura è stata presa
dal [2].
Inoltre:
dr
dS
= gradS = n.
ds
ds
(1.54)
La distanza ds tra due punti posti alle estremità opposte di un taglio normale dei due fronti
c
d’onda risulta essere, ricordando la definizione n = , inversamente proporzionale all’indice di
v
R
rifrazione, cioè direttamente proporzionale a v. L’integrale C n ds calcolato lungo una curva C
è conosciuto come cammino ottico della curva, o lunghezza ottica. Denotando con le parentesi
quadre il cammino ottico di un raggio che passa per P1 e P2 , si ha:
Z
P2
n ds = S(P2 ) − S(P1 ),
[P1 P2 ] =
(1.55)
P1
e poichè
c
n ds = ds = c dt,
v
dove dt è il tempo che occorre all’energia per percorrere la distanza ds lungo il raggio, quindi:
Z
P2
[P1 P2 ] = c
dt,
(1.56)
P1
cioè la lunghezza ottica [P1 P2 ] è uguale al prodotto della velocità della luce nel vuoto per il
tempo impiegato dalla luce per viaggiare da P1 a P2 .
12
2.2
L’equazione differenziale dei raggi di luce
I raggi di luce sono stati definiti come traiettorie ortogonali al fronte d’onda geometrico S(x, y, z) =
costante e si è visto che, se r è un vettore posizione di un punto del raggio e s la lunghezza del
raggio misurata a partire da un punto fissato in esso, si ha:
n
dr
= gradS.
ds
(1.57)
Questa equazione specifica i raggi mediante la funzione S, ma si può facilmente ricavare un’equazione differenziale che specifica il raggio direttamente in termini della funzione indice di rifrazione
n(r). Differenziando (1.57) rispetto a s si ottiene:
dr
d
dr
d
n
= (gradS) =
· grad(gradS) =
ds
ds
ds
ds
cioè
1
1
1
gradS · grad(gradS) =
grad[(gradS)2 ] =
grad n2 ,
n
2n
2n
d
dr
n
= grad n.
ds
ds
(1.58)
Questa è la forma vettoriale delle equazioni differenziali dei raggi di luce.
Esempio 1 : In un mezzo omogeneo n = costante quindi la (1.58) si riduce a:
d2 r
= 0,
ds2
da cui:
r = sa + b,
(1.59)
dove a e b sono vettori costanti. L’equazione (1.59) è un’equazione vettoriale di una retta che
ha direzione del vettore a e passa per il punto b. Quindi si deduce che in un mezzo omogeneo i
raggi di luce assumono la forma di una linea retta.
Esempio 2 : In un mezzo il quale abbia una simmetria sferica, l’indice di rifrazione dipende
solo dalla distanza r da un punto fissato O:
n = n(r).
(1.60)
Questo caso è approssimativamente realizzato dall’atmosfera terrestre, quando viene presa in
considerazione la curvatura della terra14 .
14
Con curvatura della terra si intende la distanza tra un osservatore e la linea che separa cielo e terra, che
aumenta con la quota. Più in alto si sale, maggiore è la porzione di superficie terrestre che si può dominare con
lo sguardo (condizioni atmosferiche permettendo).
13
Considerando la variazione del vettore r ∧ [n(r)t] lungo un raggio. Si ha:
d
dr
d
(r ∧ nt) =
∧ nt + r ∧ (nt),
ds
ds
ds
(1.61)
dr
= t il primo termine a secondo membro si annulla. Il secondo termine, tenendo
ds
r dn
conto della (1.58), può essere scritto come r ∧ grad n, ma dalla (1.60) si ha grad n =
,e
r dr
quindi anche il secondo termine dell’equazione (1.61) si annulla. Quindi:
dato che
r ∧ nt = costante.
(1.62)
Questa relazione implica che tutti i raggi sono curve piane, situate in un piano passante per
l’origine, e lungo ogni raggio si ha:
nr sin φ = costante,
(1.63)
dove φ è l’angolo tra il vettore posizione r e la tangente al punto r sul raggio (Figura 1.4).
Osserviamo che r sin φ rappresenta la distanza perpendicolare d dall’origine alla tangente, perciò
(1.63) può essere riscritta come:
nd = costante.
(1.64)
Figura 1.4: La figura rappresenta la formula di Bouguer, nd = costante, per raggi in un mezzo
con simmetria sferica. La figura è stata presa dal [2].
Questa relazione usualmente viene chiamata formula di Bouguer e rappresenta l’analogo di una
nota formula in dinamica, che esprime la conservazione del momento angolare di una particella
14
che si muove sotto l’azione di forze centrali.
Per ottenere l’espressione esplicita dei raggi in un mezzo a simmetria sferica, è sufficiente richiamare poche nozioni di geometria elementare. Siano (r, θ) le coordinate polari di una curva piana,
e φ l’angolo tra il raggio vettore al punto P sulla curva e la tangente a P . L’angolo φ è dato da:
r(θ)
2 ,
dr
r2 (θ) +
dθ
sin φ = s
(1.65)
e dalle (1.63) e (1.65) si trova:
dr
r√ 2 2
=
n r − c2 ,
(1.66)
dθ
c
dove c è una costante. L’equazione dei raggi in un mezzo con una simmetria sferica si può
scrivere nella forma:
Z r
dr
√
.
(1.67)
θ=c
2
r n r 2 − c2
Torniamo ora al caso generale. Sia K il vettore curvatura15 del raggio, definito come segue:
K=
dt
1
= n,
ds
ρ
(1.68)
1
è il reciproco del raggio di curvatura16 , n è la normale principale. Dalla
ρ
(1.58) e (1.68) segue che:
dn
nK = grad n −
t.
(1.69)
ds
Questa relazione mostra che il gradiente dell’indice di rifrazione sta nel piano osculatore del
raggio. Se si moltiplica scalarmente la (1.69) per K, usando la (1.68) e sapendo che t è ortogonale
a K, si trova:
1
(1.70)
|K| = = n · grad ln n.
ρ
dove la grandezza
Essendo ρ è una quantità sempre positiva, la formula (1.70) implica che procedendo lungo la
normale principale l’indice di rifrazione cresce, cioè i raggi si piegano verso la regione con indice
di rifrazione più alto (Figura 1.5).
15
Il vettore curvatura K è ortogonale al vettore tangente t e ha la direzione della normale principale n del
triedro di Frenet t, n, b, in ogni punto della curva. La curvatura è il modulo della normale principale n,
intuitivamente indica la misura di quanto un determinato oggetto si discosta dall’avere un andamento rettilineo.
1
16
Il raggio di curvatura è il reciproco della curvatura:
, dove con K si è indicata la curvatura.
K
15
Figura 1.5: La figura rappresenta la curvatura di un raggio in un mezzo eterogeneo. La figura è
stata presa dal [2].
2.3
Le leggi di rifrazione e riflessione
Fino ad ora abbiamo assunto che la funzione indice di rifrazione n fosse continua. Discuteremo
ora il comportamento dei raggi quando attraversano una superficie separata da due mezzi omogenei con indici di rifrazioni diversi.
dr
chiamato raggio
Segue dalla (1.57), utilizzando l’identità rot grad ≡ 0, che il vettore nt = n
ds
vettore soddisfa la relazione:
rot nt = 0.
(1.71)
Sia T una superficie di discontinuità costituita da strati di transizione lungo la quale ε, µ e n
cambiano rapidamente ma continuamente e su T consideriamo un elemento piano di area i cui
lati P1 Q1 e P2 Q2 sono paralleli e con P1 P2 e Q1 Q2 perpedicolari a T (Figura 1.6). Sia inoltre b
Figura 1.6: La figura rappresenta le leggi di rifrazione e riflessione. La figura è stata presa dal
[2].
un vettore unitario normale a questa area. Integrando la (1.71) attraverso l’area e applicando il
16
teorema del rotore17 si trova:
Z
Z
(rot nt) · b dS =
nt · dr = 0,
(1.72)
dove il secondo integrale è preso sul contorno della curva P1 Q1 Q2 P2 rappresentata in Figura 1.6.
Seguendo l’orientazione del rettangolo in Figura 1.6, e tenendo conto che il vettore unitario b è
arbitrario, si ottiene:
n12 ∧ (n2 t2 − n1 t1 ) = 0
(1.73)
dove n12 è un vettore unitario normale al confine della superficie che punta dal primo al secondo
mezzo e t1 e t2 sono i vettori tangenti alla curva P1 Q1 Q2 P2 rispettivamente nel mezzo 1 e
nel mezzo 2 come rappresentato in Figura 1.6. La (1.73) implica che la componente tangente
del raggio vettore nt è continua attraversando la superficie, o equivalentemente, che il vettore
N12 = n2 t2 − n1 t1 è normale alla superficie.
Siano θ1 e θ2 gli angoli tra il raggio incidente e il raggio rifratto con la normale n12 alla superficie
(vedi Figura 1.7(a)). Segue dall’equazione (1.73) che:
Figura 1.7: La figura rappresenta le leggi di rifrazione (a) e di riflessione (b). La figura è stata
presa dal [2].
n2 (n12 ∧ t2 ) = n1 (n12 ∧ t1 ),
(1.74)
n2 sin θ2 = n1 sin θ1 .
(1.75)
e, conseguentemente,
L’equazione (1.74) implica che i raggi rifratti giacciono nello stesso piano dei raggi incidenti e della
normale alla superficie (il piano di incidenza) mentre l’equazione (1.75) mostra che il rapporto
n1
degli
tra il seno dell’angolo di rifrazione e il seno dell’angolo di incidenza è uguale al rapporto
n2
17
H
RR
Il teorema del rotore afferma che: Γ F · dΓ = S (rotF) · dS dove F è un campo vettoriale su R3 , S è una
superficie e Γ è una curva chiusa e semplice.
17
indici di rifrazione. Questi due risultati esprimono la legge di rifrazione o legge di Snell.
La presente analisi si applica alle onde e superfici rifrangenti sotto la condizione che la lunghezza
d’onda sia sufficientemente piccola (λ0 → 0). Questa condizione significa, in pratica, che i raggi
di curvatura dell’onda incidente e del confine di superficie devono essere grandi rispetto alla
lunghezza d’onda della luce incidente.
L’onda riflessa viene propagata di nuovo nel primo mezzo. Posto n2 = n1 in (1.74) e in (1.75)
(vedi Figura 1.7(b)), segue che i raggi riflessi giacciono nel piano di incidenza e sin θ1 = sin θ2 ,
quindi:
θ2 = π − θ1 .
(1.76)
Gli utlimi due risultati esprimono la legge di riflessione.
2.4
Raggi di congruenza e loro proprietà focali
La relazione (1.71) ossia:
rot nt = 0,
(1.77)
caratterizza tutti i raggi del sistema che possono essere realizzati in un mezzo isotropo e li
distingue da famiglie più generali di curve. In un mezzo omogeneo e isotropo n è costante, e la
(1.77) si riduce a:
rot t = 0.
(1.78)
I raggi in un mezzo isotropo omogeneo possono essere anche caratterizzati da una relazione
indipendente da n. Tale relazione si può ottenere applicando alla (1.77) l’identità rot nt =
n rott + (grad n) ∧ t e moltiplicando scalarmente per t. Segue che un sistema di raggi in un
qualsiasi mezzo isotropo, essendo (grad n ∧ t) · t = 0, deve soddisfare la relazione:
t · rot t = 0.
(1.79)
Un sistema di curve che occupa una porzione di spazio in modo che una singola curva passi
attraverso ciascun punto della regione è chiamato congruenza. Se esiste una famiglia di superfici
che taglia ogni curva ortogonalmente la congruenza viene detta normale; se non esiste tale
famiglia, la congruenza viene detta inclinata. Per l’ottica geometrica risultano essere interessanti
solo le congruenze normali. Se ogni curva della congruenza è una linea retta la congruenza si
chiama rettilinea. Le equazioni (1.79) e (1.78) esprimono rispettivamente le condizioni
necessarie e sufficienti affinchè le curve rappresentino una congruenza normale o
normale rettilinea.
Scegliamo un insieme di coordinate curvilinee u, v su una delle superfici ortogonali S(x, y, z) =
costante ad una data conguenza normale. Ad ogni punto Q(u, v) di questa superficie corrisponde
una curva di congruenza, cioè tale curva incontra S in Q. Sia r il vettore posizione relativo al
punto P sulla curva. Possiamo considerare r come una funzione delle coordinate (u, v) e della
lunghezza d’arco s tra Q e P , misurata lungo la curva (Figura 1.8). Si considerino due curve
“infinitamente”vicine di una congruenza passanti attraverso i punti (u, v) e (u + du, v + dv) su
18
Figura 1.8: La figura rappresenta la notazione relativa alla congruenza normale. La figura è
stata presa dal [2].
S, occorre verificare se vi sono punti su queste curve tali che la distanza tra loro è almeno di un
infinitesimo del secondo ordine (si dice che le curve sono tagliate a primo ordine in tali punti). I
punti aventi questa proprietà vengono chiamati fuochi e devono soddisfare le seguenti equazioni
al primo ordine:
r(u, v, s) = r(u + du, v + dv, s + ds).
(1.80)
Dalla (1.80) si ottiene:
ru du + rv dv + tds = 0,
(1.81)
dove ru e rv sono le derivate parziali rispetto a u e v. La (1.81) implica che ru , rv e t sono
complanari. Questo è equivalente all’annullarsi del prodotto misto dei tre vettori ru , rv e t :
(ru ∧ rv ) · t = 0.
(1.82)
Facendo variare u e v in modo che assumano tutti i valori consentiti, i fuochi descrivono una
superficie, rappresentata dall’equazione (1.82), detta superficie focale, o anche superficie caustica.
Qualsiasi curva della congruenza è tangente alla superficie focale in ogni fuoco della curva. Il
piano tangente in ogni punto della superficie focale viene chiamato piano focale.
2.5
Il principio di Fermat
Il principio di Fermat -conosciuto anche come il principio del più breve percorso ottico o come
principio di tempo minimo- afferma che la lunghezza ottica
Z P2
n ds,
(1.83)
P1
di un raggio luminoso (cioè la traiettoria percorsa dalla luce) tra due punti qualsiasi P1 e P2 è più
breve della lunghezza ottica di qualsiasi altra curva che unisce questi punti e che si trova in una
19
determinata zona regolare di esso. Per zona regolare si intende una zona che può essere rivestita
da raggi tali che almeno un raggio passa attraverso ciascun punto di essa. Tale rivestimento, ad
esempio, può essere formato dai raggi provenienti da una sorgente puntiforme P1 nel dominio
attorno a P1 dove i raggi a causa di riflessione o rifrazione o per via della loro curvatura non si
intersecano reciprocamente.
Prima di dimostrare questo principio osserviamo che è possibile formulare il principio di Fermat
in una forma più debole. Secondo questa formulazione il raggio effettivo si distingue dalle
altre curve perchè l’integrale lungo tale curva ha un valore stazionario. Per trovare le curve
che rendono stazionario l’integrale è necessario utlizzare il metodo generale del calcolo delle
variazioni, che consente di ridurre il calcolo di tale integrale al calcolo delle equazioni differenziali
di Eulero-Lagrange18 .
Il principio di Fermat verrà dimostrato (dimostrazione riportata nel Capitolo 3 in [2]) mediante l’utilizzo dell’integrale invariante di Lagrange . Per questo motivo richiamiamo preliminarmente l’integrale invariante di Lagrange. Prendiamo nuovamente in considerazione l’integrale
dell’equazione (1.72), preso su una qualsiasi superficie aperta. Tale equazione è:
I
nt · dr = 0.
(1.84)
L’integrale si estende lungo la curva chiusa C di contorno alla superficie (si veda Figura 1.9).
Figura 1.9: La figura rappresenta la derivazione dell’integrale invariante di Lagrange in presenza
di una superficie costituita da due mezzi omogenei aventi indici di rifrazioni differenti. La figura
è stata presa dal [2].
L’equazione (1.84) è nota come integrale invariante di Lagrange e implica che l’integrale
Z P2
nt · dr,
(1.85)
P1
18
Per ulteriori delucidazioni sulle equazioni di Eulero-Lagrange si veda [18].
20
calcolato tra due punti qualsiasi P1 e P2 nel campo di integrazione, è indipendente dal cammino
di integrazione.
Per dimostrare il principio di Fermat, si prenda un fascio di raggi e si confronti il segmento P1 P2
del raggio effettivo C̄ con una curva arbitraria C che connette P1 con P2 (vedi Figura 1.10).
Consideriamo due traiettorie del fascio (fronti d’onda), ortogonali e “vicine”, che intersecano il
Figura 1.10: La figura rappresenta il principio di Fermat. La figura è stata presa dal [2].
raggio C in Q1 e Q2 e il raggio C̄ in Q̄1 e Q̄2 . Sia inoltre Q02 il punto di intersezione tra Q2 Q̄2
con il raggio C̄ 0 che passa attraverso Q1 .
Applicando l’integrale invariante di Lagrange al triangolo Q1 Q2 Q02 , si ottiene:
(nt · dr)Q1 Q2 + (nt · dr)Q2 Q02 − (nds)Q1 Q2 = 0.
(1.86)
L’ultimo addendo dell’equazione precedente si riduce a (nds)Q1 Q2 poichè, partendo da (nt ·
dr
dr)Q1 Q02 , osservando la Figura 1.10 e ricordando che
= t, si ha:
ds
(nt · dr)Q1 Q02 = (nt · dr)Q1 Q2 + (nt · dr)Q2 Q02
e poichè t è ortogonale a dr sul fronte d’onda, si ha:
(nt · dr)Q2 Q02 = 0.
Si ottiene
(nt · dr)Q1 Q2 = (n|t||dr|)Q1 Q2 = (n|t|2 ds)Q1 Q2 ,
sapendo che t è un vettore unitario, si ottiene (nds)Q1 Q2 .
Dalla definizione di prodotto scalare segue:
(nt · dr)Q1 Q2 6 (nds)Q1 Q2 ,
21
Dalla (1.54) e tenendo conto che Q1 ,Q02 e Q̄1 ,Q̄2 sono i punti corrispondenti sui due fronti
d’onda, si ha:
(n ds)Q1 Q02 = (n ds)Q¯1 Q¯2 .
Sostituendo le ultime tre relazioni nella (1.86) si trova:
(n ds)Q¯1 Q¯2 6 (n ds)Q1 Q2
(1.87)
dalla relazione (1.87) si ottiene:
Z
Z
n ds.
n ds 6
(1.88)
C
C̄
Il segno di uguaglianza vale solo se la direzione di t e dr sono coincidenti su ogni punto di C,
cioè se la curva di confronto è un raggio effettivo. Questo caso è escluso dall’ipotesi che passa
al più un raggio in ogni punto della zona. Quindi la lunghezza ottica dei raggi è inferiore alla
lunghezza ottica della curva di confronto, che è esattamente il principio di Fermat.
I raggi di luce sono stati definiti come traiettorie ortogonali alle superfici d’onda S(x, y, z) =
costante, S è una soluzione dell’equazione iconale (1.50). Questa è una via naturale per introdurre i raggi di luce quando le leggi dell’ottica vengono dedotte dalle equazioni di Maxwell.
Storicamente, l’ottica geometrica è stata sviluppata come teoria Rdei raggi di luce definita in maniera differente, cioè come curve per le quali l’integrale di linea n ds ha un valore stazionario.
Seguendo questa via, l’ottica geometrica si può sviluppare puramente lungo le linee del calcolo
delle variazioni.
22
Capitolo 2
Problema inverso in tre dimensioni
In questo capitolo si considera il seguente problema inverso in ottica geometrica:
Data una famiglia di curve a due parametri -più precisamente una congruenza- costruire
l’indice di rifrazione rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale
trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve
della conguenza assegnata.
Si risolverà questo problema sviluppando due procedure differenti: applicando il principio di
Fermat e l’equazione iconale. In particolare, dalla prima di tali procedure, si otterrà un sistema
di due equazioni alle derivate parziali lineari non omogenee del primo ordine (in cui l’unica
incognita è la funzione che rappresenta l’indice di rifrazione n = n(x, y, z)).
Se invece, si segue la seconda procedura, si perverrà a un sistema di due equazioni differenziali
lineari omogenee del primo ordine la cui soluzione viene chiamata funzione iconale e rappresenta
il fronte d’onda geometrico S(x, y, z). Usando l’equazione iconale (1.50) del Capitolo 1 si è quindi
in grado di calcolare l’indice di rifrazione n = n(x, y, z). Conseguentemente si trovano tutte le
possibili funzioni che rappresentano l’indice di rifrazione. Vengono in fine discussi quattro esempi
in cui viene applicata la teoria sviluppata.
1
Introduzione al problema
In ottica geometrica si considera trascurabile la lunghezza d’onda (λ → 0). Nell’approssimazione
dell’ottica geometrica, le leggi dell’ottica, come già discusso nel Capitolo 1, possono essere formulate nel linguaggio della geometria, e l’energia può essere vista come trasportata lungo raggi
di luce.
Il mezzo più generale dove la luce si propaga, è tridimensionale, disomogeneo e non isotropo1 . In
questa tesi focalizziamo però l’attenzione sulla propagazione della luce in un mezzo trasparente,
che sia disomogeneo e isotropo. L’esempio tipico di un mezzo con queste proprietà è l’atmosfera
1
Per maggiori dettagli si consultino [1, 2, 3, 4].
23
terrestre2 . Non verranno considerati mezzi assorbenti o non isotropi come metalli o cristalli.
Supposto di aver fissato un riferimento cartesiano ortogonale e inerziale Oxyz, le proprietà ottiche
di un mezzo tridimensionale generico sono caratterizzate dalla funzione scalare,
n = n(r, λ),
(2.1)
che rappresenta l’indice di rifrazione. Si considereranno raggi di luce monocromatici con λ
parametro della funzione n. Poichè in ottica geometrica λ → 0, λ verrà omessa nella nostra
trattazione (nel senso che n = n(r)).
Il nostro obiettivo, come già spiegato nell’introduzione, è quello di risolvere il seguente problema
inverso3 :
Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione rappresentato
dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo
in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnate.
Al tal fine abbiamo la necessità di richiamare alcune nozioni di geometria differenziale.
Diremo che le due famiglie di curve assegnate in forma parametrica mediante le equazioni:
(Γ)
f (x, y, z) = c1 ,
g(x, y, z) = c2 ,
(2.2)
costituiscono una congruenza (Γ)4 , se con esse si riempie una porzione di spazio in modo tale
che ogni singola curva passi per ciascun punto (x0 , y0 , z0 ) della regione. Nell’equazione (2.2), c1
e c2 sono costanti lungo ciascuna curva fissata della famiglia, ma cambiano da curva a curva.
Se esiste una famiglia di superfici della forma:
S(x, y, z) = costante,
(2.3)
che taglia ognuna delle curve della congruenza ortogonalmente, la congruenza viene detta congruenza normale e verrà indicata con Γn , altrimenti la famiglia di curve viene detta congruenza
inclinata (si veda anche quanto esposto nel Capitolo 1). Nell’ottica geometrica sono di interesse
solo le congruenze normali di raggi, conosciute anche come sistemi ortogonali di raggi [9].
La famiglia di curve introdotta nell’equazione (2.2) rappresenta una congruenza normale Γn nello
spazio se e solo se è soddisfatta l’equazione (cfr. con l’equazione (1.79) del Capitolo 1)
t · rot t = 0.
(2.4)
Ci si riferirà alla condizione espressa nella (2.4) come la condizione di normalità della famiglia
(Γ). Se ogni curva della congruenza è una linea retta, la congruenza è detta rettilinea e deve
soddisfare la seguente condizione (cfr. con l’equazione (1.78) del Capitolo 1):
rot t = 0,
2
(2.5)
Per maggiori delucidazioni si consultino [2, 5, 6].
Il problema inverso si può trovare in [15, 16], è stato trattato in tre dimensioni con risultati parziali in [7] e
trattato completamente con i risultati descritti in questo capitolo in [8].
4
Per maggiori dettagli si veda [2].
3
24
Come già discusso nel Capitolo 1, l’ottica geometrica si occupa di raggi di luce, che possono
essere introdotti nei due seguenti modi:
1. Tramite il principio di Fermat:
In un mezzo trasparente, i raggi lungo i quali la luce viaggia da ogni punto P1 ad ogni
punto P2 , in una certa regione regolare del mezzo, sono dati da [1, 2, 3]:
Z P2
n ds = 0.
(2.6)
δ
P1
2. Tramite l’ottica ondulatoria, nella quale i raggi di luce vengono definiti come traiettorie
ortogonali al fronte d’onda geometrico S(x, y, z) = costante. Quindi un fascio di raggi,
nello spazio tridimensionale, deve essere una congruenza normale e i raggi di luce si devono
considerare come curve orientate, la cui direzione coincide, ovunque, con la direzione della
media temporale del vettore di Poynting (vedi Capitolo 1).
Osservazione: Dal principio di Fermat, non è evidente che, se si considera una famiglia di raggi,
questa famiglia deve essere una conguenza normale. Perciò uno dei risultati più interessanti che
stabiliremo consisterà nel mostrare che il principio di Fermat implica questa proprietà.
Lo scopo di questo capitolo, come già detto nella premessa, è duplice e consiste nel risolvere
il problema inverso sia utilizzando il principio di Fermat (che di solito non viene utilizzato a
questo fine) che l’equazione iconale. In entrambi i casi si perverrà ad un opportuno sistema di
PDEs5 , di cui verrà studiata l’integrabilità e si confronteranno i risultati ottenuti mediante le
due procedure. Il sistema ottenuto applicando l’equazione iconale, rispetto a quello ottenuto
utilizzando il principio di Fermat, risulta più semplice in quanto è omogeneo.
1.1
Nozioni geometriche
Consideriamo la congruenza Γ
(Γ)
f (x, y, z) = c1 ,
g(x, y, z) = c2 ,
(2.7)
dove c1 e c2 sono due parametri indipendenti.
Il vettore tangente unitario t alla generica curva della congruenza (2.7) può essere espresso
in termini delle funzioni f (x, y, z) e g(x, y, z) della famiglia di curve date dall’equazione (2.2).
Per tale scopo, si introducono i gradienti grad f = (fx , fy , fz ) e grad g = (gx , gy , gz ) che sono
ortogonali, rispettivamente, alle superfici f (x, y, z) = c1 e g(x, y, z) = c2 , per cui il prodotto
vettoriale
δ = grad f ∧ grad g,
(2.8)
5
Con tale acronimo vengono indicate le equazioni alle derivate parziali, dall’inglese “Partial Differential
Equation”.
25
è tangente in un punto alla generica curva della famiglia (2.2). Se δ1 , δ2 , δ3 sono le compontenti
cartesiane di questo vettore tangente, si ha:
δ3
δ2
(2.9)
δ = δ1 i + δ2 j + δ3 k = δ1 i + j + k ,
δ1
δ1
dove i, j, k sono i vettori unitari corrispondenti agli assi Ox, Oy, Oz rispettivamente, con
∂(f, g) fy fz δ1 =
=
= fy gz − fz gy ,
∂(y, z) gy gz ∂(f, g) fz fx =
δ2 =
= fz gx − fx gz ,
∂(z, x) gz gx (2.10)
∂(f, g) fx fy =
δ3 =
= fx gy − fy gx .
∂(x, y) gx gy Possiamo però considerare un altro vettore tangente:
ε=
δ2
δ3
δ
= i + j + k,
δ1
δ1
δ1
(2.11)
le cui componenti sono {1, α, β}. Dalla (2.10), discende immediatamente che le funzioni α(x, y, z)
e β(x, y, z) possono essere scritte come:
α(x, y, z) =
δ2
,
δ1
β(x, y, z) =
δ3
.
δ1
(2.12)
Parametrizzando ogni curva della famiglia (2.2), in funzione di x (questo significa che l’equazione
vettoriale parametrica di queste curve è r = xi + y(x)j + z(x)k) e differenziando le equazioni
(2.2) rispetto ad x si ottiene:
fx + fy y 0 + fz z 0 = 0,
gx + gy y 0 + gz z 0 = 0,
(2.13)
dove l’apice denota la derivata rispetto a x. Utilizzando le equazioni (2.12) e (2.13) si ottiene:
y 0 = α(x, y, z),
z 0 = β(x, y, z).
(2.14)
Ci si riferirà ad α e β come funzioni di “inclinazione”della famiglia (2.2).
Date le funzioni α(x, y, z) e β(x, y, z), la soluzione generale del sistema costituito dalle equazioni
ODEs6 (2.14) nelle funzioni incognite y = y(x) e z = z(x), introduce due costanti arbitrarie c1
6
Con tale acronimo vengono indicate le equazioni differenziali ordinarie dall’inglese “Ordinary Differential
Equation”.
26
e c2 e la soluzione generale è data dai due parametri dell’equazione (2.2). Si può esprimere il
vettore tangente t nel seguente modo:
t=
ε
ε
=
1 ,
2
|ε|
(1 + α + β 2 ) 2
(2.15)
quindi la condizione di normalità espressa dalla (2.4) si può scrivere come:
ε · rotε = 0,
αβx − βαx + αz − βy = 0.
oppure
(2.16)
Si osserva che l’ipotesi di regolarità posta per le curve della congruenza della (2.2) implica che
almeno una delle funzioni δ1 , δ2 , δ3 sia diversa dallo zero.
È immediato verificare che le seguenti proprietà risultano valide:
1. Se si definisce il vettore tangente come τ = grad g ∧ grad f , si ha che τ = −δ e i rapporti
(2.12) rimangono inalterati.
2. Supponiamo di rappresentare la famiglia a due parametri dell’equazione (2.2) mediante le
∂(F, G)
6= 0. Se si calcola la terna (δ1 , δ2 , δ3 )
equazioni F (f, g) = c1 e G(f, g) = c2 con
∂(f, g)
utilizzando l’equazione (2.10) e tenendo conto di quanto trovato nella (2.12), si nota che
le funzioni α(x, y, z) e β(x, y, z) rimangono invariate. Quindi sebbene la descrizione della
data famiglia di curve non sia unica, la sua rappresentazione tramite la coppia {α, β}
risulta unica.
3. La trasformazione x → x, y → z, z → y implica che δ1 → −δ1 , δ2 → −δ3 , δ3 → −δ2 .
2
Primo metodo: il principio di Fermat
In questa sezione risolveremo il problema inverso presentato nella sezione precedente utilizzando
il principio di Fermat.
Il principio di Fermat afferma (vedi [2]) che:
Z P2
δ
n ds = 0.
(2.17)
P1
L’elemento di linea ds, in coordinate cartesiane ortogonali è:
p
ds = dx2 + dy 2 + dz 2 .
(2.18)
Se si parametrizza ogni curva della famiglia (2.2) con x, l’equazione (2.17) diventa:
Z x2
p
δ
n(x, y, x) 1 + y 02 + z 02 dx = 0,
(2.19)
x1
27
dove con l’apice si sono indicate le derivate prime effettuate rispetto ad x. È ben noto che
l’equazione variazionale (2.17) può essere convertita nelle corrispondenti equazioni di EuleroLagrange. In questo caso si tratta di tre ODEs, ma a causa della parametrizzazione la prima
equazione risulta un’identità7 . Le due equazioni di Eulero-Lagrange sono:

"
#
0
p

d
ny

02
02


ny 1 + y + z − dx p1 + y 02 + z 02 = 0,
"
#
(2.20)
0
p

d
nz

02
02


nz 1 + y + z − dx p1 + y 02 + z 02 = 0.
Al meglio delle nostre conoscenze, il sistema (2.20) è stato usato solo per risolvere il problema
diretto dell’ottica geometrica che può essere formulato come segue:
Dato l’indice di rifrazione di un mezzo costruire le traiettorie seguite dalla luce in tale mezzo.
Il sistema dato dalle (2.20) può essere visto come un sistema di due equazioni differenziali
ordinarie non lineari del secondo ordine, nelle incognite y(x) e z(x), dove l’indice di rifrazione
n(x, y, z) è una funzione data. È chiaro che, specificando le condizioni iniziali (y0 , z0 , y00 , z00 ),
calcolate in x = x0 , si ottiene la traiettoria data dalle equazioni y(x), z(x) (ovvero un raggio di
luce).
Mostriamo come sia possibile trasformare il sistema (2.20), in modo da renderlo adatto a trattare
il problema inverso che, come riportato nella Sezione 1, consiste nel trovare l’indice di rifrazione
n(x, y, z) compatibile con la congruenza Γ data dall’equazione (2.2). A questo fine, si procede
come segue: tenendo conto dell’equazione
(2.14) e che il vettore tangente ε = {1, α, β} ad un
p
2
raggio generico ha lunghezza |ε| = 1 + α + β 2 , si ottiene:
y 00 = ε · grad α,
z 00 = ε · grad β.
Semplici calcoli consentono di riscrivere il sistema (2.20) come segue:

α(αα0 + ββ0 )

2

− α0 n,
αnx − (1 + β )ny + αβnz =
2
2
1+α +β
β(αα
+
ββ
)

0
0
2

− β0 n,
βnx + αβny − (1 + α )nz =
1 + α2 + β 2
(2.21)
(2.22)
dove si è posto:
α0 = ε · grad α,
β0 = ε · grad β.
(2.23)
Effettuando un’opportuna combinazione lineare tra le equazioni del sistema (2.22) si perviene al
seguente sistema:
(
αnx − ny = Ω1 n,
(2.24)
βnx − nz = Ω2 n,
7
Per maggiori dettagli si consultino [1, 2].
28
dove
Ω1 = −
ε · grad α
,
1 + α2 + β 2
Ω2 = −
ε · grad β
,
1 + α2 + β 2
(2.25)
e α, β sono funzioni assegnate delle tre variabili x, y, z. Il precedente sistema (2.24) di due PDEs
lineari del primo ordine nell’unica funzione incognita n(x, y, z) collega direttamente l’indice di
rifrazione con la famiglia di raggi di luce compatibile a tale funzione. Il sistema (2.24) è detto il
sistema della distribuzione dell’indice di rifrazione.
Il sistema (2.24) sintetizza la seguente
Proposizione 2.1 In un mezzo tridimensionale continuo, disomogeneo e isotropo, tutte le distribuzioni dell’indice di rifrazione n(x, y, z) -che permettono la creazione come raggi di luce
della data congruenza normale- devono soddisfare il sistema (2.24).
Osservazione 1: Si può verificare che il sistema (2.24) può anche essere derivato dalle ODEs
equivalenti all’equazione vettoriale (1.58) del Capitolo 1, ossia alle equazioni differenziali dei
raggi di luce. Infatti, scegliendo l’ascissa x come parametro di ogni curva della famiglia (2.2),
si può immediatamente verificare che la prima equazione scalare del sistema di ODEs diventa
un’identità, mentre le altre due equazioni coincidono con le equazioni del sistema (2.24).
3
Risolubilità del sistema della distribuzione dell’indice
di rifrazione
Per studiare la risolubilità del sistema (2.24), è conveniente introdurre la nuova funzione:
N (x, y, z) = log n(x, y, z),
cosı̀ che il sistema (2.24) può essere riscritto come:
(
F ≡ αNx − Ny − Ω1 = 0,
G ≡ βNx − Nz − Ω2 = 0.
(2.26)
(2.27)
Le (2.27) rappresentano un sistema di due PDEs indipendenti, lineari, non omogenee del primo
ordine nell’unica funzione incognita N (x, y, z). I coefficienti α, β, Ω1 , Ω2 che compaiono nel
sistema (2.27) sono funzioni note delle variabili x, y, z.
Osservazione 3: Le due equazioni sono indipendenti perchè, se si considera il sistema (2.24)
come unsistema algebrico lineare in tre incognite Nx , Ny , Nz , si verifica immediatamente che la
α −1 0 −1
matrice
ha rango due.
β 0 −1 −1
29
Ponendo:
x = x1 ,
y = x2 ,
z = x3 ,
Nx = p1 ,
il sistema (2.27) assume la forma:
(
F (x1 , x2 , x3 , p1 , p2 , p3 ) = 0,
G(x1 , x2 , x3 , p1 , p2 , p3 ) = 0.
Ny = p2 ,
Nz = p3 ,
(2.28)
Per i sistemi della forma (2.28) si può introdurre la Parentesi di Poisson tra le due funzioni F e
G come segue:
3 X
∂F ∂G ∂F ∂G
−
.
(2.29)
[F, G] :=
∂pi ∂xi ∂xi ∂pi
i=1
A questo punto diventa necessario richiamare alcune proprietà utili nella risoluzione di PDEs
lineari del primo ordine in un’unica funzione incognita. Molti approfondimenti su questo argomento possono essere trovati in [10], ma per comodità, è stata inserita un’appendice su tale
argomento.
Si focalizza l’attenzione al caso in cui il sistema assume la forma (2.28), cioè contenga m = 2
equazioni indipendenti in una funzione incognita N (x1 , x2 , x3 ) dipendente dalle n = 3 variabili
xi (i = 1, 2, 3).
Definizione 1 Il sistema di PDEs nella forma (2.28) è detto completo se si verifica uno dei
seguenti due casi:
a) la parentesi di Poisson [F, G] è una combinazione lineare delle funzioni F e G che compaiono a primo membro delle (2.28), cioè:
[F, G] = λ1 F + λ2 G,
dove λi (i = 1, 2) sono funzioni solo di x1 , x2 , x3 ;
b) la parentesi di Poisson è identicamente nulla:
[F, G] = 0.
Se si verifica il caso b) il sistema viene chiamato sistema Jacobiano.
Si noti che il concetto di sistema Jacobiano è un caso particolare del concetto di sistema completo.
È inoltre interessante osservare che è sempre possibile trasformare un sistema completo in un
sistema Jacobiano, ciò si può ottenere non in un unico modo (si veda l’Appendice A per maggiori
dettagli).
Come dettagliatamente discusso nell’Appendice A, le condizioni di risolubilità del sistema (2.28)
sono descritte dal seguente
30
Teorema 2.2 Ogni soluzione del sistema di PDEs (2.28) -nell’unica funzione incognita N (x1 , x2 , x3 )deve anche soddisfare la seguente PDEs:
[F, G] = 0.
(2.30)
Si possono presentare i seguenti due casi:
1. Se l’equazione [F, G] = 0 è una “nuova”PDE, cioè non è combinazione lineare delle due
PDEs del sistema (2.28), questo sistema ammette solo la soluzione banale N (x, y, z) =
costante. Questo giustifica il fatto che, in letteratura, ci si riferisce a questa situazione
dicendo che il sistema (2.28) è incompatibile.
2. Se l’equazione della parentesi di Poisson (2.30) è invece una combinazione lineare delle
due PDEs del sistema (2.28) o un’identità, il sistema (2.28) ammette soluzioni non banali.
In questo caso il sistema viene detto compatibile.
Siamo ora in grado di dimostrare la seguente notevole
Proposizione 2.3 Il sistema di PDEs (2.27) -proveniente dal principio di Fermat- ammette
soluzioni non banali (cioè esistono funzioni che rappresentano l’indice di rifrazione n(x, y, z)) se
la data famiglia di curve definita nella (2.2) è una congruenza normale, ovvero se la condizione
di normalità
αβx − βαx + αz − βy = 0,
è soddisfatta.
Dimostrazione. Calcoli diretti consentono di scrivere la parentesi di Poisson delle due
funzioni F e G nel seguente modo:
[F, G] = (αβx − βαx + αz − βy )Nx − (αΩ2x − βΩ1x + Ω1z − Ω2y ).
(2.31)
Sapendo che [F, G] = 0 si ha:
(αβx − βαx + αz − βy )Nx = αΩ2x − βΩ1x + Ω1z − Ω2y .
(2.32)
Possiamo considerare due casi distinti:
1. Se la data famiglia di curve è conguenza normale, allora, la condizione di normalità espressa
nella (2.16) è soddisfatta e il primo membro della (2.32) si annulla. Dimostriamo che, in
questo caso, anche il secondo membro è identicamente nullo, cioè:
αΩ2x − βΩ1x + Ω1z − Ω2y ≡ 0,
(2.33)
e quindi la parentesi di Poisson [F, G] = 0 è un’identità. Il sistema (2.27) è quindi un
sistema Jacobiano che, per il Teorema 2.2, ammette soluzioni non banali.
31
Rimane da dimostrare che l’equazione (2.33) è effettivamente un’identità. Per raggiungere questo obiettivo, differenziando l’equazione (2.16) rispetto a x, y, z, si ottengono,
rispettivamente, le seguenti relazioni:
−αβxx + βαxx − αxz + βxy = 0,
αβxy + αy βx − αx βy − βαxy + αyz − βyy = 0,
αβxz + αx βx − αx βz − βαxz + αzz − βyz = 0.
(2.34)
Inoltre, dall’equazione (2.25) si ottiene:
−(βxx + αx βy + αβxy + βx βz + ββxz )(1 + α2 + β 2 ) + (βx + αβy + ββz )(2ααx + 2ββx )
,
(1 + α2 + β 2 )2
−(αxx + αx αy + ααxy + βx αz + βαxz )(1 + α2 + β 2 ) + (αx + ααy + βαz )(2ααx + 2ββx )
=
,
(1 + α2 + β 2 )2
−(αxz + αz αy + ααyz + βz αz + βαzz )(1 + α2 + β 2 ) + (αx + ααy + βαz )(2ααz + 2ββz )
=
,
(1 + α2 + β 2 )2
−(βxy + αy βy + αβyy + βy βz + ββyz )(1 + α2 + β 2 ) + (βx + αβy + ββz )(2ααy + 2ββy )
.
=
(1 + α2 + β 2 )2
(2.35)
Ω2x =
Ω1x
Ω1z
Ω2y
Sostituendo le espressioni (2.35) nel primo membro dell’equazione (2.33) e tenendo conto
delle relazioni (2.34) e della condizione di normalità data dalla (2.16), si osserva che tutte
le derivate del secondo ordine nell’espressione (2.33) si annullano, e solo quelle del primo
ordine sono presenti. Esprimendo dalla (2.16) βy in termini di α, β, αx , αz , βx si ottiene che
il primo membro della (2.33) si annulla.
2. Se la famiglia di curve, è invece una congruenza semplice, l’equazione (2.32) non è un’identità, e, in accordo al Teorema 2.2, essa va aggiunta al sistema di PDEs. Quindi questo
sistema diventa un sistema completo di tre equazioni indipendenti in tre variabili, il quale
ammette solo la soluzione banale.
Tenendo conto della Proposizione 2.3 e del Teorema 2.2, si può affermare che si è fornita una
dimostrazione analitica del fatto che la famiglia di raggi, definita dal principio di Fermat, è una
congruenza normale. È importante sottolineare che non si può derivare questo fatto direttamente
dall’enunciato del principio di Fermat.
Rimane cosı̀ provato un altro importante risultato espresso dalla seguente
Proposizione 2.4 Il sistema di due PDEs (2.24), che risulta equivalente al sistema (2.27),
in un’unica funzione incognita n(x, y, z) derivata dal principio di Fermat è compatibile (cioè
ammette soluzioni non banali) se la famiglia di curve a due parametri nell’equazione (2.2) è una
congruenza normale.
32
Osservazione 4: Rimane quindi provato che il principio di Fermat può essere usato per risolvere
il problema inverso formulato nella Sezione 1. Ossia, si è trovato che tutti i profili dell’indice
di rifrazione, compatibili con la data famiglia di curve (2.2), sono dati da soluzioni non banali
del sistema (2.27). Ma, come conseguenza della Proposizione 2.4, il sistema (2.27) ammette
soluzioni non banali solo se la condizione di normalità αβx − βαx + αz − βy = 0 è soddisfatta.
Questo fatto risulta importante in quanto permette di dichiarare che la creazione della data
congruenza (come famiglia di raggi di luce monocromatica) è possibile solo se tale conguenza è
una congruenza normale, cioè solo se esiste una famiglia di superfici, che taglia ogni curva della
congruenza ortogonalmente. In altre parole, dal principio di Fermat si può dedurre l’esistenza
dei fronti d’onda, che possono essere considerati come superfici che tagliano ortogonalmente la
data congruenza normale. È interessante osservare che, nella teoria elettromagnetica, l’approccio
è opposto: dai fronti d’onda, si definiscono i raggi di luce come traiettorie ortogonali ai fronti
d’onda stessi e come conseguenza, si ottiene la condizione di normalità.
Osservazione 5: Il fatto che l’ottica geometrica può essere basata sul principio di Fermat è
ben noto. Tuttavia, tenendo conto delle considerazioni fatte nell’Osservazione 4, si vuole sottolineare che si può derivare l’intera ottica geometrica solo sulle basi della geometria delle congruenze
normali come necessaria conseguenza del principio di Fermat senza alcun riferimento alla teoria
elettromagnetica dell’ottica ondulatoria.
Infatti, si può partire con una congruenza normale Γn e definire i fronti d’onda geometrici come
famiglia di superfici mobili ortogonali ai raggi di Γn . L’equazione è φ(x, y, z, t) = 0, dove la variabile t rappresenta il tempo. Dalla teoria delle superfici, è nota [2], l’espressione della velocità
del fronte d’onda:
∂φ
1
ν,
(2.36)
v=−
|grad φ| ∂t
dove ν è il vettore unitario ortogonale ad un generico punto della superficie. Questo vettore
grad φ
unitario è definito come ν =
e quindi coincide con il vettore unitario tangente t a
|grad φ|
un raggio di luce (t ≡ ν). Senza perdita di generalità, si può assumere che le equazioni delle
superfici sono date nella forma φ(x, y, z, t) = S(x, y, z) − ct, dove c è la velocità della luce nel
vuoto [1]. In questo caso, la velocità delle onde può essere espressa come segue:
c
t.
(2.37)
v=−
|grad S|
Possiamo ora ricavare l’equazione iconale, in un modo molto semplice, attraverso l’uso della sola
geometria delle superfici mobili. Infatti, definendo l’indice di rifrazione di un mezzo isotropo
tramite il rapporto della velocità della luce nel vuoto e il modulo della velocità dell’onda nel
c
mezzo (vedi Capitolo 1), cioè n(x, y, z) =
, si ottiene immediatamente, dall’equazione
v(x, y, z)
(2.37):
2 2 2
∂S
∂S
∂S
2
|grad S| ≡
+
+
= n2 ,
(2.38)
∂x
∂y
∂z
33
che è l’equazione iconale (cfr. (1.50) del Capitolo 1). Si noti come l’equazione (2.38) implichi
che:
|grad S| = n.
(2.39)
Inoltre, dalla geometria differenziale, è ben noto che sussiste la seguente identità vettoriale:
d
grad S = grad|grad S|.
ds
(2.40)
Questa identità è essenzialmente l’equazione vettoriale dei raggi di luce. Infatti, tenendo conto
della (2.39), della relazione grad S = |grad S|s e della (2.40) si ottiene:
d
(ns) = grad n.
ds
(2.41)
In conclusione, usando solo il principio di Fermat e considerazioni geometriche appropriate, sono
state ottenute le equazioni fondamentali dell’ottica geometrica: l’equazione iconale e l’equazione
dei raggi di luce (cfr. con equazioni (1.50) e (1.58) del Capitolo 1).
4
Secondo metodo: l’equazione iconale
La propagazione della luce può anche essere spiegata nel contesto della teoria delle onde ed è
essenzialmente basata sull’equazione iconale:
∂S
∂x
2
+
∂S
∂y
2
+
∂S
∂z
2
= n2 .
(2.42)
Si vuole risolvere il problema inverso formulato nella Sezione 1 mediante l’utilizzo dell’equazione
(2.42). Per tale scopo, tenendo conto che tutti i raggi sono ortogonali a questa famiglia, dobbiamo
determinare l’equazione della famiglia dei fronti d’onda:
S(x, y, z) = costante.
(2.43)
Perciò, dopo aver assegnato una congruenza normale di curve Γn , in un mezzo tridimensionale,
isotropo e disomogeneo, in modo tale che la condizione di normalità (2.16) sia soddisfatta, si
devono trovare tutte le possibili distribuzioni della funzione n(x, y, z), che consente la creazione
della data congruenza normale come famiglia di raggi di luce monocromatici. Tenendo conto
che la data famiglia di curve a due parametri deve essere una famiglia ortogonale di raggi, si
conclude che i due vettori, grad S e ε, devono essere paralleli, e tale condizione comporta:
Sx
Sy
Sz
=
= .
1
α
β
34
(2.44)
L’equazione (2.44) contiene due PDEs lineari e omogenee del primo ordine nell’unica funzione
incognita S(x, y, z) che si possono scrivere come:
(
F1 ≡ αSx − Sy = 0,
(2.45)
G1 ≡ βSx − Sz = 0.
Si può discutere l’integrabilità di questo sistema nello stesso modo in cui si è discussa l’integrabilità del sistema (2.27). In particolare, vale il seguente importante risultato:
Proposizione 2.5 Il sistema dato dalla (2.45) è un sistema Jacobiano.
Dimostrazione.
Se si calcola la parentesi di Poisson [F1 , G1 ], si ottiene:
∂F1 ∂G1 ∂F1 ∂G1
∂F1 ∂G1 ∂F1 ∂G1
−
+
−
[F1 , G1 ] =
∂Sx ∂x
∂x ∂Sx
∂Sy ∂y
∂y ∂Sy
∂F1 ∂G1 ∂F1 ∂G1
−
= (αβx − βαx + αz − βy )Sx .
+
∂Sz ∂z
∂z ∂Sz
(2.46)
Poichè nella teoria ondulatoria la condizione di normalità αβx − βαx + αz − βy = 0 è soddisfatta,
dall’equazione (2.46) si ottiene [F1 , G1 ] ≡ 0 e questo, tenendo conto del Teorema 2.2, completa
la dimostrazione.
Si ottiene quindi il seguente risultato:
Proposizione 2.6 Data una congruenza normale Γn all’interno di un mezzo tridimensionale,
trasparente, continuo, disomogeneo e isotropo, la funzione iconale S(x, y, z) che definisce la
famiglia di fronti d’onda
S(x, y, z) = costante,
è la soluzione del seguente sistema di due PDEs lineari e omogenee del primo ordine:
(
α(x, y, z)Sx − Sy = 0,
β(x, y, z)Sx − Sz = 0.
(2.47)
Tutte le distibuzioni indici di rifrazione compatibili che permettono la crezione, come raggi di
luce, della congruenza normale data, sono dati dalla formula:
q
(2.48)
n(x, y, z) = Sx2 + Sy2 + Sz2 .
Osservazione 6: Dalla teoria delle PDEs è risaputo che la soluzione generale di un sistema di
PDEs, come il sistema (2.47), dipende da una funzione arbitraria. Perciò se S(x, y, z) è una
particolare funzione che soddisfa il sistema di PDEs (2.47), la soluzione generale è Φ(S(x, y, z)),
35
dove Φ(S) è una funzione arbitraria di S. Per questa ragione, i fronti d’onda possono essere rappresentati dall’equazione S(x, y, z) = costante, cosı̀ come dall’equazione Φ(S(x, y, z)) =
costante. Ma, globalmente, questi fronti d’onda ammettono la stessa traiettoria ortogonale (la
congruenza normale),
che è la stessa famiglia di raggi di luce generata dall’indice
p 2di rifrazione
p 2
2
2
n(x, y, z) = Sx + Sy + Sz , cosı̀ come dall’indice di rifrazione n(x, y, z) = ΦS Sx + Sy2 + Sz2 ,
dove ΦS è la derivata della funzione arbitraria Φ(S). Come conseguenza, per costruire un mezzo
che ammetta la data congruenza normale di curve Γn come raggi di luce, la scelta più naturale
per la funzione ΦS è quella di considerare ΦS = 1, (e questo implica che Φ(S) ≡ S). Ovviamente, se si impongono alcune condizioni al contorno sul mezzo o alcuni vincoli sull’espressione
analitica dell’indice di rifrazione, si determina univocamente la funzione Φ.
Osservazione 7: Si può concludere che il problema inverso dell’ottica geometrica, formulato
nella Sezione 1, può essere risolto mediante il principio di Fermat o mediante l’equazione iconale. L’uso del principio di Fermat conduce ad un sistema di due PDEs lineari non omogenee del
primo ordine (il sistema (2.27)) direttamente connesso alla funzione indice di rifrazione mentre
l’uso dell’equazione iconale conduce ad un sistema di due PDEs lineri del primo ordine e omogenee, direttamente connesse ai fronti d’onda. La teoria delle onde conduce a un sistema di PDEs
“più semplice”rispetto al sistema di PDEs ottenuto seguendo l’approccio corpuscolare. La teoria
delle onde richiede che la famiglia di raggi costituisca una congruenza normale. Applicando il
principio di Fermat, questa informazione non è necessaria, in quanto viene automaticamente
soddisfatta se si vuole che il sistema (2.27) ammetta soluzioni non banali. Naturalmente, le due
teorie devono condurre ai medesimi risultati e quindi è possibile validare i risultati ottenuti con
una di esse usando quelli prodotti dall’altra.
5
Esempi
In questa sezione verranno esaminati quattro esempi, che vengono studiati tramite il metodo
basato sull’equazione iconale. Questo approccio richiede di trovare la soluzione del sistema dato
dalla (2.47).
La procedura, che permette di risolvere il sistema di PDEs, verrà dettagliatamente spiegata
nell’Appendice A. Questa procedura è basata sui due passaggi seguenti:
1. Si risolve la prima equazione del sistema (2.47) trasformandola nel seguente sistema di
ODEs:
dy
dz
dS
dx
=
=
=
.
(2.49)
α(x, y, z)
−1
0
0
In tutti gli esempi di questa sezione, si adotta l’utile notazione usata nell’equazione (2.49)
dS
dz
dove appare zero al denominatore di due frazioni
e
. Questa convenzione sta a
0
0
significare che il corrispondente numeratore è nullo, cioè che, dS = 0 e dz = 0, e quindi
S = c1 e z = c2 , dove c1 , c2 sono delle costanti arbitrarie. Questa notazione la si trova
36
in [10, 11, 12, 13, 14] ed è generalmente accettata dai matematici che lavorano nel campo
delle PDEs.
2. Si impone che la soluzione ottenuta nel primo step soddisfi anche la seconda equazione del
sistema (2.47). In questo modo, si trova l’equazione della famiglia dei fronti d’onda data
dall’equazione (2.43), e applicando l’equazione (2.48), si ottengono le funzioni distribuzione
dell’indice di rifrazione compatibili con la congruenza normale data.
5.1
Esempio 1
Si consideri in uno spazio tridimensionale, la seguente famiglia di curve a due parametri (intersezione di due famiglie di cilindri iperbolici rappresentati in Figura 2.1):
f (x, y, z) ≡ xy = c1 ,
g(x, y, z) ≡ xz = c2 .
(2.50)
Le funzioni di “inclinazione”corrispondenti al sistema (2.50) sono date da:
z
β=− .
x
y
α=− ,
x
(2.51)
È facile verificare che la famiglia di curve date da (2.50) soddisfa l’equazione (2.16) e rappresenta
quindi una congruenza normale.
Come conseguenza del Teorema 2.2, il sistema (2.47) ammette soluzioni non banali. Tale sistema
può essere esplicitamente scritto come:
(
ySx + xSy = 0,
(2.52)
zSx + xSz = 0.
La prima equazione del sistema è equivalente alle seguenti ODEs:
dy
dz
dS
dx
=
=
=
.
y
x
0
0
(2.53)
Dal precedente sistema di ODEs, si ottiene:

S = c1 ,



z = c2 ,

 dx = dy ,

y
x
(2.54)
l’ultima equazione del sistema precendente risulta essere un’equazione differenziale a variabili
1
1
separabili la cui soluzione è x2 = y 2 + k.
2
2
37
Figura 2.1: Nella prima riga si è riportata la rappresentazione della famiglia di curve espressa
nell’equazione (2.50) con la scelta di c1 = 3, c2 = 2 , nella seconda riga si è riportata la
rappresentazione di tale famiglia con la scelta di c1 = −6, c2 = −5. La figura è stata creata con
Mathematica.
Quindi, la soluzione del sistema (2.53) è data da:


S = c 1 ,
z = c2 ,

 2
x − y 2 = c3 ,
(2.55)
dove c1 , c2 , c3 sono costanti arbitrarie. Quindi la soluzione generale della prima PDEs del sistema
(2.52) è dato da
S(x, y, z) = Φ(z, x2 − y 2 ) = c1 ,
(2.56)
essendo Φ una funzione arbitraria dei suoi argomenti.
Introducendo la nuova variabile u = x2 − y 2 , il primo membro della (2.56) si può vedere come
38
funzione delle due variabili z e u e si può scrivere come:
S(x, y, z) = Φ(z, u) = c1 .
(2.57)
È facile verificare che l’equazione (2.57), soddisfa la prima equazione del sistema (2.52). Occorre
ora imporre che la funzione Φ(z, u), data dalla (2.57), soddisfi la seconda equazione del sistema
(2.53). Imponendo questa condizione, si ottiene la seguente PDE:
2zΦu + Φz = 0,
(2.58)
che è equivalente al seguente sistema di ODEs:
dz
dΦ
du
=
=
.
2z
1
0
(2.59)
du
= dz è un’equazione differenziale a variabili separabili che ammette il seguente
2z
integrale generale z 2 − u = cost.
Si trova pertanto, tenendo conto che u = x2 − y 2 , la seguente soluzione delle (2.58):
(
Φ = k1 ,
(2.60)
x2 − y 2 − z 2 = k 2 ,
L’equazione
dove k1 e k2 sono costanti arbitrarie. Se si pone v = x2 − y 2 − z 2 = k2 , si può verificare come
S(x, y, z) = Φ(v) = Φ(x2 − y 2 − z 2 ),
(2.61)
sia la soluzione generale del sistema di PDEs (2.52).
La famiglia di fronti d’onda, che taglia ortogonalmente le curve della data congruenza normale
(2.50), assume la seguente forma:
S(x, y, z) = Φ(x2 − y 2 − z 2 ) = costante.
(2.62)
Tenendo conto delle equazioni (2.62) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza
normale (2.50), sono date dalla formula:
n(x, y, z) = 2Φv r,
(2.63)
p
dove Φv è la derivata della funzione arbitraria Φ(v) e r = x2 + y 2 + z 2 . Naturalmente la più
semplice soluzione si ottiene scegliendo Φv = 1 (vedi Osservazione 6 della sezione precedente).
Quindi la famiglia di fronti d’onda è data da (si veda la Figura 2.2):
S(x, y, z) = x2 − y 2 − z 2 = k,
(2.64)
dove k è una costante, e conseguentemente:
n(x, y, z) = 2
p
x2 + y 2 + z 2 = 2r.
Il mezzo presenta quindi una simmetria radiale.
39
(2.65)
Figura 2.2: La figura rappresenta i tre fronti d’onda ottenuti ponendo k = −5, k = 0, k = 5, nella
(2.64) e alcune curve della congruenza normale (2.50). La figura è stata creata con Mathematica.
5.2
Esempio 2
Si consideri nello spazio tridimensionale la famiglia di curve a due parametri, rappresentata in
Figura 2.3:
x−y
f (x, y, z) ≡
= c1 ,
g(x, y, z) ≡ (x − y)2 (x + y + z) = c2 ,
(2.66)
z−x
le cui funzioni di “inclinazione”(cfr. con equazioni (2.10) e (2.12)) sono:
x+y
x+z
,
β=
.
(2.67)
α=
y+z
y+z
Poichè la famiglia di curve considerata in questo esempio soddisfa la condizione di normalià
dell’equazione (2.16), costituisce una congruenza normale.
Facili calcoli mostrano che il sistema (2.47) può essere scritto, per questo esempio, come:
(
(x + z)Sx − (y + z)Sy = 0,
(2.68)
(x + y)Sx − (y + z)Sz = 0.
Il Teorema 2.2 garantisce che il sistema dato dalla (2.68) abbia soluzioni non banali. Per trovare
la soluzione generale di tale sistema, si osserva che la prima equazione del sistema (2.68) è
equivalente al seguente sistema di ODEs:
dy
dz
dS
dx
=
=
=
.
x+z
−(y + z)
0
0
Dal precedente sistema di ODEs, si ottiene:

S = c1 ,



z = c2 ,


 dy + y = − c2 ,
dx x + c2
x + c2
40
(2.69)
(2.70)
Figura 2.3: Nella prima riga si è riportata la rappresentazione della famiglia di curve espressa
nell’equazione (2.66) con la scelta di c1 = −1, c2 = −5, nella seconda riga si è riportata la
rappresentazione di tale famiglia con la scelta di c1 = 1, c2 = 6. La figura è stata creata con
Mathematica.
dove c1 ,c2 sono costanti arbitrarie. La terza equazione del sistema (2.70) è una equazione
differenziale lineare del primo ordine il cui integrale generale è:
y=
c3 − c2 x
.
x + c2
(2.71)
Risolvendo l’equazione (2.71) rispetto a c3 e tenendo conto che c2 = z, si ottiene:
xy + yz + xz = c3 .
(2.72)
Si può immediatamente verificare che la soluzione generale della prima equazione del sistema
(2.68) è:
S(x, y, z) = Φ(z, xy + yz + xz) = c1 ,
(2.73)
41
essendo Φ una funzione arbitraria.
Ponendo u = xy + yz + xz, si può scrvere l’equazione (2.73) nella forma:
S(x, y, z) = Φ(z, u),
(2.74)
è semplice verificare che la funzione Φ(z, u) soddisfa la prima equazione del sistema (2.68).
Occorre ora imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.68).
Dopo semplici calcoli si ottiene Φz = 0 e quindi la soluzione generale del sistema (2.68) è data
da:
S(x, y, z) = Φ(xy + yz + xz).
(2.75)
La famiglia dei fronti d’onda, che taglia ortogonalmente le curve della congruenza normale (2.66),
(si veda la Figura 2.4), assume la seguente forma:
S(x, y, z) = Φ(xy + yz + xz) = k1 .
(2.76)
Tenendo conto delle equazioni (2.76) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza
normale (2.66), sono date dalla formula:
p
(2.77)
n(x, y, z) = Φu (x + y)2 + (x + z)2 + (y + z)2 .
Ovviamente, la soluzione più semplice si ottiene scegliendo Φu = 1 nell’equazione (2.77).
Figura 2.4: La figura rappresenta i tre fronti d’onda ottenuti scegliendo Φ = 1 ponendo k1 = −5,
k1 = 0, k1 = 5 nell’equazione (2.76), e alcune curve della congruenza normale (2.66). La figura
è stata creata con Mathematica.
5.3
Esempio 3
Si consideri nello spazio tridimensionale la famiglia di curve a due parametri rappresentate in
Figura 2.5:
f (x, y, z) ≡
x2 + y 2 + z 2
= c1 ,
y
g(x, y, z) ≡
42
x2 + y 2 + z 2
= c2 .
z
(2.78)
Le funzioni di “inclinazione”corrispondenti alle equazioni (2.78) (cfr. con equazioni (2.10) e
Figura 2.5: Nella prima riga si riporta la rappresentazione della famiglia di curve espressa nell’equazione (2.78) con la scelta di c1 = −4, c2 = −5, nella seconda riga si riporta la rappresentazione
di tale famiglia con la scelta di c1 = 8, c2 = 6. La figura è stata creata con Mathematica.
(2.12)), sono date da:
α=
x2
2xy
,
− y2 − z2
β=
x2
2xz
.
− y2 − z2
Il sistema (2.47), per tale esempio, assume la seguente forma:
(
2xySx + (y 2 + z 2 − x2 )Sy = 0,
2xzSx + (y 2 + z 2 − x2 )Sz = 0.
(2.79)
(2.80)
Poichè la famiglia di curve data dalla (2.78) soddisfa la condizione di normalità (che significa
che è una congruenza normale) e tenendo conto del Teorema 2.2, il sistema (2.80) ammette
43
soluzioni non banali. Per trovare la soluzione generale di tale sistema, si utilizza la stessa
procedura utilizzata nella sezione precedente. La prima equazione del sistema (2.80) è equivalente
al seguente sistema di ODEs:
dy
dS
dz
dx
= 2
=
.
=
2
2
2xy
y +z −x
0
0
(2.81)
da cui immediatamente si ottiene:

S = c1 ,



z = c2 ,

1
c22 − x2 −1
 dy

=
y+
y ,
dx
2x
2x
(2.82)
dove c1 , c2 sono costanti arbitrarie. La terza equazione del sistema (2.82) è un’equazione
differenziale del primo ordine di Bernoulli il cui integrale generale è:
x2 + y 2 + z 2
= c3 ,
x
(2.83)
dove c3 è una costante arbitraria. Quindi la soluzione del sistema (2.81) è data da:

S = c1 ,



z = c2 ,

 x2 + y 2 + z 2

= c3 .
x
Si può scrivere la soluzione generale della prima PDE del sistema (2.80) come segue:
x2 + y 2 + z 2
S(x, y, z) = Φ z,
= c1 ,
x
essendo Φ una funzione arbitraria. Introducendo la nuova variabile u =
scrivere la soluzione (2.85) nella forma:
S(x, y, z) = Φ(z, u).
(2.84)
(2.85)
x2 + y 2 + z 2
, si può
x
(2.86)
È semplice verificare che l’equazione (2.86) soddisfa la prima equazione del sistema (2.80). Occorre ora imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.80). Imponendo tale condizione si ottiene Φz = 0 per cui la soluzione generale del sistema di PDEs (2.80)
è data da:
2
x + y2 + z2
S(x, y, z) = Φ(u) = Φ
.
(2.87)
x
44
La famiglia dei fronti d’onda che taglia ortogonalmente le curve della congruenza normale data
dall’equazione (2.78) (si veda la Figura 2.6), viene scritta come segue:
2
x + y2 + z2
= c1 .
(2.88)
S(x, y, z) = Φ(u) = Φ
x
Tenendo conto delle equazioni (2.87) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza
normale nell’equazione (2.78), sono date dalla formula:
y 2 z 2 n(x, y, z) = Φu 1 +
= Φu sec2 α,
(2.89)
+
x
x
dove α è l’angolo formato dal vettore posizione r con l’asse delle x. Ovviamente, si ottiene la
soluzione più semplice scegliendo Φu = 1 nell’equazione (2.89).
Figura 2.6: La figura rappresenta i due fronti d’onda ottenuti scegliendo Φ = 1 ponendo c1 = −5,
c1 = 5 nell’equazione (2.88), e alcune curve della congruenza normale (2.78). La figura è stata
creata con Mathematica.
5.4
Esempio 4
Si consideri nello spazio tridimensionale la famiglia di curve a due parametri, rappresentata in
Figura 2.7:
f (x, y, z) ≡ 2x2 − y 2 = c1 ,
g(x, y, z) ≡ 3y 2 + 2z 2 = c2 .
(2.90)
Le cui funzioni di “inclinazione”corrispondenti (cfr. con equazioni (2.10) e (2.12)) sono:
α=
2x
,
y
β=−
45
3x
.
z
(2.91)
Figura 2.7: La figura rappresenta nella prima riga il grafico con la scelta di c1 = 5, c2 = 5
nell’equazione (2.50), nella seconda riga il grafico delle curve corrispondenti alla scelta di c1 = −1,
c2 = 30. La figura è stata creata con Mathematica.
Il sistema (2.47), in questo caso, assume la seguente forma:
(
2xSx − ySy = 0,
3xSx + zSz = 0.
(2.92)
Poichè la famiglia di curve data dalla (2.90) soddisfa la condizione di normalità (che significa che
è una congruenza normale) il sistema (2.92) ammette soluzioni non banali in vista del Teorema
2.2. Per trovare la soluzione generale di tale sistema, si utilizza la stessa procedura utilizzata
nelle sezioni precedenti. La prima equazione del sistema (2.92) è equivalente al seguente sistema
di ODEs:
dx
dy
dz
dS
=
=
=
,
(2.93)
2x
−y
0
0
46
eseguendo facili calcoli si ottiene:

S = c1 ,



z = c2 ,


 dx = dy ,
2x
−y
(2.94)
dove c1 ,c2 sono costanti arbitrarie. Si noti che la terza equazione del sistema (2.94) è una
equazione differenziale a variabili separabili la cui soluzione è:
√
ln |y x| = c3 ,
dove c3 è una costante arbitraria. Quindi, la soluzione del sistema (2.93) è data da:


S = c 1 ,
z = c2 ,

√

ln |y x| = c3 ,
(2.95)
(2.96)
e la soluzione generale della prima PDEs del sistema (2.92) è:
√
S(x, y, z) = Φ(z, ln |y x|) = c1 ,
(2.97)
essendo Φ una funzione arbitraria.
√
Introducendo la nuova variabile u = ln |y x|, si può scrivere la soluzione (2.97) nella forma:
S(x, y, z) = Φ(z, u).
(2.98)
È semplice verificare che l’equazione (2.98) soddisfa la prima equazione del sistema (2.92). Occorre imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.92). Imponendo
questa condizione, si ottiene la seguente PDE:
3
Φu + zΦz = 0.
2
(2.99)
L’equazione (2.99) è equivalente al sistema di ODEs:
2
dz
dΦ
du =
=
,
3
z
0
Dal precedente sistema di ODEs, si ottiene:

Φ = k1 ,
2
dz
 du = .
3
z
47
(2.100)
(2.101)
La terza equazione è un’equazione differenziale a varibili separabili, la cui soluzione è
ln |z| + k2 .
Quindi la soluzione del sistema (2.100) è data da:

Φ = k1 ,
2
 u − ln |z| = k2 ,
3
2
u =
3
(2.102)
2
dove k1 e k2 sono costanti arbitrarie. Se si pone v = u − ln |z|, si può verificare come
3
!
p
3
|xy 2 |
2
S(x, y, z) = Φ(v) = Φ
u − ln |z| = Φ ln
,
(2.103)
3
|z|
sia la soluzione generale del sistema di PDEs (2.92).
La famiglia di fronti d’onda, che taglia ortogonalmente le curve della data congruenza normale
(2.90), assume la seguente forma (si veda la Figura 2.8):
!
p
3
|xy 2 |
= k1 .
(2.104)
S(x, y, z) = Φ ln
|z|
Tenendo conto delle equazioni (2.104) e (2.48), si ha che tutte le distribuzioni indici di rifrazione
n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza
normale nella equazione (2.90), sono date dalla formula:
r
1
4
1
n(x, y, z) = Φv
+
+
,
(2.105)
9x2 9y 2 z 2
dove Φv è la derivata della funzione arbitraria Φ(v). Si ha certamente, una soluzione più semplice
scegliendo Φv = 1.
48
Figura 2.8: La figura rappresenta i tre fronti d’onda ottenuti scegliendo Φ = 1 ponendo k1 = −1,
k1 = 0, k1 = 1 nell’equazione (2.104), e alcune curve della congruenza normale (2.90). La figura
è stata creata con Mathematica.
49
50
Capitolo 3
Problema inverso in due dimensioni
In questo capitolo studiamo il seguente problema inverso in ottica geometrica:
Data una famiglia di curve a un parametro -più precisamente una congruenza- costruire
l’indice di rifrazione rappresentato dalla funzione n = n(x, y) di un mezzo bidimensionale
trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve
della conguenza assegnata.
Tale problema risulta essere un caso particolare del problema tridimensionale studiato nel
capitolo precedente. Infatti, ponendo nelle equazioni (2.12) del Capitolo 2 β = 0 (o α = 0),
l’indice di rifrazione dipenderebbe solo da due variabili indipendenti. Per verificare questo fatto
si osservi che il sistema (2.24) del Capitolo 2 si ridurrebbe ad una sola equazione e se per
esempio β = 0, si ha per la seconda delle (2.25) del Capitolo 2 che Ω2 = 0, per cui dalla seconda
equazione del sistema (2.24) si ottiene nz = 0 e quindi che n = n(x, y). Considereremo dei raggi
che giacciono in piani perpendicolari all’asse z del sistema di riferimento cartesiano in modo che
l’indice di rifrazione n(x, y) risulti costante lungo le rette parallele all’asse z.
In generale, l’indice di rifrazione dipende dalla frequenza, e quindi dalla lunghezza d’onda
(vedi Introduzione). In questo capitolo si assume che tutti i raggi siano costituiti da una famiglia
monoparametrica (abbiano cioè la stessa frequenza). La funzione n(x, y, λ) descrive l’indice
di rifrazione che, in generale, dipende anche dalla lunghezza d’onda λ che risulta essere un
parametro comune a tutte le curve della famiglia. Ricordando che in ottica geometrica λ → 0
(cfr. Introduzione, Capitolo 1 e Capitolo 2), λ verrà omessa nella nostra trattazione.
Si utilizzeranno il principio di Fermat e l’equazione iconale per risolvere il problema inverso
in due dimensioni. In altre parole, data una famiglia di raggi di luce monocromatica in un mezzo
trasparente, disomogeneo e isotropo, f (x, y) = c0 , dove c0 è una costante lungo ogni raggio (che
varia da raggio a raggio), si vuole trovare l’indice di rifrazione in modo tale che la luce si propaghi
in tale mezzo lungo le curve della congruenza assegnata.
Si dimostrerà che la funzione n(x, y) che rappresenta l’indice di rifrazione è soluzione di
un’equazione differenziale lineare alle derivate parziali del primo ordine, chiamata equazione
dell’indice di rifrazione. Tale equazione verrà ricavata direttamente dal principio di Fermat ed
è equivalente a quella ottenuta dalle equazioni (2.24) del Capitolo precedente.
51
Inoltre, in analogia con quanto fatto nel Capitolo precedente, si presenterà anche un altro metodo,
basato sull’equazione iconale, che consente la ricostruzione dell’indice di rifrazione rappresentato
da n = n(x, y).
Si ritiene importante sottolineare che i problemi in due dimensioni furono i primi ad essere
risolti: in [17, 19, 20, 21] si è considerato il caso in cui il mezzo ottico giace su un piano, mentre
in [22, 23] si è analizzato il caso in cui il mezzo sia distribuito su una superficie di R3 , mentre la
soluzione del problema tridimensionale, discussa nel Capitolo precedente, è stata fornita in [8].
1
Equazione differenziale alle derivate parziali dell’indice
di rifrazione trovata mediante il principio di Fermat
In questa sezione risolveremo il problema inverso enunciato nella sezione precedente utilizzando
il principio di Fermat.
In particolare, ricordiamo che stiamo assumendo che i raggi di luce giacciano in piani perpendicolari all’asse z (del fissato sistema di riferimento) e che l’indice di rifrazione sia costante lungo
ogni retta parallela all’asse z. Assegnata, in tali piani, la famiglia monoparametrica di raggi di
luce -congruenza normale- (si suppone che il mezzo sia trasparente, isotropo ed disomogeneo)
tramite l’equazione:
f (x, y) = c0 ,
(3.1)
con c0 costante per ogni raggio, ma varia da raggio a raggio, si vuole determinare la funzione
-indice di rifrazione- n = n(x, y) in modo che la luce si propaghi lungo le curve della congruenza
assegnata.
Presentiamo la soluzione di questo problema facendo uso del principio di Fermat. Tale
principio (vedi Capitoli 1, 2 e [2]), ammette la seguente formulazione matematica
Z P2
δ
n ds = 0.
(3.2)
P1
L’elemento di linea ds, in coordinate cartesiane ortogonali, assume la forma:
p
ds = dx2 + dy 2 ,
(3.3)
quindi, parametrizzando in funzione di x, l’equazione (3.2) può essere riscritta come:
Z x2
p
δ
n(x, y) 1 + y 02 dx = 0.
(3.4)
x1
È ben noto [18] che l’equazione variazionale (3.4) è equivalente al sistema di due ODEs di
Eulero-Lagrange, ma a causa della parametrizzazione la prima equazione risulta un’identità, per
cui l’equazione variazionale assume la forma:
"
#
0
p
d
y
ny 1 + y 02 −
np
= 0.
(3.5)
dx
1 + y 02
52
Tramite semplici calcoli si ottiene:
y 00
y nx − ny +
n = 0.
1 + y 02
0
(3.6)
Questa è l’equazione differenziale dei raggi di luce. Se nell’epressione (3.6) si soppone assegnato
l’indice di rifrazione, ovvero è assegnata la funzione n = n(x, y), la funzione incognita risulta
essere la y = y(x) che fornisce la traiettoria dei raggi di luce (che è univocamente determinata
se viene assegnata la condizione iniziale y0 = y(x0 )).
Questo è il modo più semplice per utilizzare il principio di Fermat, ovvero applicandolo per
risolvere il problema diretto (vedi anche Introduzione).
Solo recentemente [17] è stato mostrato come sia possibile riformulare l’equazione (3.6) in
modo da renderla idonea a risolvere il problema inverso. A tal fine, differenziando l’equazione
della famiglia dei raggi di luce (3.1) rispetto a x, si ottiene:
y0 = −
fx
.
fy
(3.7)
Sia γ(x, y) la funzione di “inclinazione”delle traiettorie ortogonali alla famiglia (3.1), definite nel
seguente modo:
fy
γ(x, y) = .
(3.8)
fx
Si possono scrivere y 0 e y 00 come funzioni di γ:
1
y0 = − ,
γ
y 00 =
Ω
,
γ3
(3.9)
dove
Ω(x, y) = γγx − γy .
(3.10)
È importante notare che a ogni funzione f (x, y) corrisponde una funzione γ(x, y) e viceversa, ad
ogni γ(x, y) corrisponde una famiglia (3.1). Sostituendo (3.9) e (3.10) nella (3.6) e considerando
nx e ny come le derivate parziali dell’unica funzione incognita n(x, y), otteniamo:
∂n
∂n
+ γ(x, y)
= Ω1 (x, y)n,
∂x
∂y
con
(3.11)
Ω
.
(3.12)
1 + γ2
L’equazione (3.11) può essere chiamata equazione dell’indice di rifrazione. Si tratta di una PDE
del primo ordine nella funzione incognita n(x, y), la cui soluzione fornisce tutti i possibili indici
di rifrazione che permettono ai raggi di luce di propagarsi lungo la famiglia di raggi di luce
assegnata.
Nella sezione 3 applicheremo l’equazione (3.11) in alcuni importanti esempi.
Ω1 (x, y) =
53
2
Equazione differenziale alle derivate parziali dell’indice
di rifrazione trovata mediante l’equazione iconale
In questa sezione si formulerà il problema inverso utilizzando l’equazione iconale.
L’equazione iconale nel caso bidimensionale assume la seguente forma:
2 2
∂S
∂S
+
= n2 .
∂x
∂y
(3.13)
Si vuole risolvere il problema inverso mediante l’utilizzo dell’equazione (3.13). Per raggiungere
questo obiettivo, tenendo conto che tutti i raggi sono ortogonali alla famiglia di curve, dobbiamo
determinare l’equazione della famiglia dei fronti d’onda:
S(x, y) = costante.
(3.14)
In altre parole, assegnata una congruenza normale di curve, in un mezzo bidimensionale, isotropo
e disomogeneo, si devono trovare tutte le possibili distribuzioni della funzione n(x, y) (tramite
l’equazione (3.13)) che consente la creazione della data congruenza normale come famiglia di
raggi di luce monocromatici.
Si consideri un vettore tangente al fronte d’onda:
ε = fx i + fy j = i +
fy
j = i + γj,
fx
le cui componenti risultano essere {1, γ} (si è tenuto conto della definizione (3.8)). Tenendo conto
che la data famiglia di curve monoparametrica deve essere una famiglia ortogonale di raggi, si
conclude che i due vettori, grad S e ε, devono essere paralleli, e tale condizione comporta:
Sy
Sx
= .
1
γ
(3.15)
L’equazione (3.15) è una PDE lineare e omogenea del primo ordine nell’unica funzione incognita
S(x, y) che si può scrivere come:
F ≡ γSx − Sy = 0.
(3.16)
Abbiamo ottenuto quindi il seguente risultato:
Proposizione 3.1 Data una congruenza normale all’interno di un mezzo bidimensionale, trasparente, continuo, disomogeneo e isotropo, la funzione iconale S(x, y) che definisce la famiglia
di fronti d’onda
S(x, y) = costante,
è la soluzione della seguente PDE lineare e omogenea del primo ordine:
γ(x, y)Sx − Sy = 0.
54
(3.17)
Tutte le distibuzioni indici di rifrazione compatibili che permettono la crezione, come raggi di
luce, della congruenza normale data, sono dati dalla formula:
q
n(x, y) = Sx2 + Sy2 .
(3.18)
La procedura per risolvere la PDE è stata spiegata nel Capitolo 2.
3
Indici di rifrazione
In questa sezione si applicherà la teoria sviluppata in questo capitolo a due interessanti esempi.
In entrambi i casi, verrà imposta una particolare restrizione alla forma dell’indice di rifrazione
cercato.
3.1
Indici di rifrazione radiali
In questa sezione, anzichè utilizzare la famiglia di curve espressa nella forma (3.1), considereremo
la famiglia di curve in coordinate polari r e θ avente equazione:
f (r, θ) = c0 ,
(3.19)
la funzione di “inclinazione”corrispondente risulta essere definita come segue:
δ(r, θ) =
fθ
.
fr
(3.20)
Anche in questo caso vi è una corrispondenza biunivoca tra la famiglia monoparametrica (3.19)
e la funzione di inclinazione (3.20).
Si propone il seguente problema: data una famiglia di curve nella forma (3.19), trovare tutti
gli indici di rifrazione che dipendono solo dalla
p distanza r da un punto fissato O (indice di rifrazione a simmetria radiale) n = n(r), r = x2 + y 2 , e che sono compatibili con la famiglia
(3.19) di raggi di luce.
Risoluzione mediante il Principio di Fermat:
L’equazione dell’indice di rifrazione (3.11) assume la forma:
δ
Ψ
n = 0,
rnr + nθ + 1 + 2
r
δ + r2
(3.21)
dove
Ψ = δ 2 + r(δθ − δδr ),
55
(3.22)
Si vuole che la soluzione n sia funzione solo di r, cioè n = n(r), qualunque sia δ = δ(r, θ).
sı̀ che la soluzione della (3.21) assuma questa forma, dobbiamo avere necessariamente
Per far
Ψ
= 0 che conduce alla condizione:
2
δ + r2 θ
(r2 + δ 2 )(δδrθ − δθθ ) + [(r2 − δ 2 )δr + 2δδθ − 2rδ]δθ = 0.
(3.23)
In tal modo, si arriva alla seguente proposizione:
Proposizione 3.2 La funzione di “inclinazione”(3.20) di tutte le famiglie di curve (3.19) compatibili con l’indice di rifrazione radiale n = n(r) soddisfa la condizione differenziale (3.23).
Esempio 1:
Si può verificare che la famiglia di rami di coniche
√
f (r, θ) = −r cos θ + r2 cos2 θ − 4r + 4 = c0 ,
(3.24)
soddisfa la condizione (3.23) e quindi l’indice di rifrazione sarà una funzione radiale n = n(r).
La funzione di “inclinazione”risulta:
2
cos θ sin θ
r sin θ + √rr2 cos
fθ
2 θ−4r+4
.
=
δ=
2 θ−2
r
cos
fr
− cos θ + √r2 cos2 θ−4r+4
Più precisamente l’equazione (3.21) diventa:
q


32
(r − 2) 1r
√
1 1
nr + 
r − 2 n = 0.
3 −
2 r
2(r − 2) 2
Si verifica facilmente che la funzione
r
n = n(r) = n0
|r − 2|
,
r
dove n0 è una costante arbitraria, soddisfa tale equazione.
Risoluzione mediante l’equazione iconale:
Sia
f (r, θ) = −r cos θ +
√
r2 cos2 θ − 4r + 4 = c0 ,
la famiglia di curve, la funzione di “inclinazione”risulta:
2
cos θ sin θ
r sin θ + √rr2 cos
fθ
2 θ−4r+4
δ=
=
.
2 θ−2
r
cos
fr
− cos θ + √r2 cos2 θ−4r+4
56
L’equazione (3.17), in questo caso, assume la seguente forma:
r2 cos θ sin θ
r cos2 θ − 2
r sin θ + √
Sr + cos θ − √
Sθ = 0.
r2 cos2 θ − 4r + 4
r2 cos2 θ − 4r + 4
Che è equivalente al seguente sistema di ODEs:
dr
r sin θ +
√
r2
cos θ sin θ
r2 cos2 θ−4r+4
=
dθ
cos θ −
√
r cos2
θ−2
r2 cos2 θ−4r+4
=
dS
.
0
Dal precedente sistema di ODEs si ottiene:


S = c 1 ,
dr
dθ
=
.

2
2
 r sin θ + √ r cos θ sin θ
√ r cos θ−2
cos
θ
−
r2 cos2 θ−4r+4
r2 cos2 θ−4r+4
In questo caso l’integrazione della seconda equazione presenta notevoli difficoltà analitiche1 .
L’approccio basato sull’equazione (3.11) è quindi preferibile.
3.2
Indici di rifrazione omogenei
In questa sottosezione si vuole risolvere il seguente problema: Data una famiglia di raggi (3.1),
trovare
gli indici di rifrazione che soddisfano la seguente ulteriore richiesta n(x, y) =
y tutti
m
, ovvero sia una funzione omogenea2 di grado m.
x R
x
In particolare, consideriamo il seguente caso:
L’indice di rifrazione n sia una funzione omogenea di grado m, e γ è una funzione non omogenea
di grado zero.
Risoluzione mediante il principio di Fermat:
Abbiamo:
n(x, y) = xm R(z),
essendo z =
(3.25)
y
. L’equazione (3.11) in questo caso diventa:
x
mR − zR0 = xΩ1 R − γR0
1
(3.26)
Si potrebbe integrare tale equazione tramite un opportuno programma come Mathematica o Matlab.
Una funzione f (x1 , . . . , xn ) dicesi omogenea di grado m, essendo m un numero reale, se per ogni valore della
variabile t risulta f (tx1 , . . . , txn ) = tm f (x1 , . . . , xn ).
2
57
dove l’apice indica la derivata rispetto a z e Ω1 dato dalla (3.12).
Poichè γ è una funzione non omogenea di grado zero 3 , si ha:
xγx + yγy 6= 0.
(3.27)
Il secondo membro dell’equazione (3.26) deve essere una funzione di z, cioè omogeneo in x, y di
grado zero. Allora:
x(xΩ1 R − γR0 )x + y(xΩ1 R − γR0 )y = 0,
(3.28)
che conduce a:
R0
= ρ,
R
dove
ρ=
x(xΩ1x + yΩ1y + Ω1 )
.
xγx + yγy
(3.29)
(3.30)
Ma ρ(x, y) deve essere omogeneo di grado −14 , cioè:
xρx + yρy + ρ = 0
(3.31)
e questo conduce alla condizione per la data famiglia di curve:
(xγx + yγy )[x2 Ω1xx + 2xyΩ1xy + y 2 Ω1yy + 2(xΩ1x + yΩ1y )] =
(x2 γxx + 2xyγxy + y 2 γyy )(xΩ1x + yΩ1y + Ω1 ).
(3.32)
Allora si può affermare la seguente proposizione:
Proposizione 3.3 Qualunque famiglia di raggi γ(x, y) che soddisfa (3.27) e (3.32) è compatibile
con tutti gli indici di rifrazione omogenei (3.25) trovati dalla (3.29).
Esempio 2: Le funzioni
γ=
√
axm − 1,
(3.33)
soddisfano la condizione (3.32). Dalla (3.30) si ha ρ = 0, allora, dalle (3.29) e (3.25) si ottiene
R0
= 0,
R
il che implica
n = n 0 xm .
3
(3.34)
Si ricordi il teorema di Eulero sulle funzioni omogenee di cui si riporta l’enunciato:
Teorema di Eulero: Condizione necessaria e sufficiente affinchè una funzione f (x1 , . . . , xn ), continua con le
sue derivate prime nel suo insieme di definizione, sia omogenea di grado m, è che sia verificata identicamente la
∂f
∂f
relazione:
x1 + . . . +
xn = mf (x1 , . . . , xn ).
∂x1
∂xn
4
Si applichi di nuovo il teorema di Eulero per trovare l’equazione (3.31).
58
dove n0 è una costante arbitraria.
Risoluzione mediante l’equazione iconale:
√
Sia γ = axm − 1 la funzione di “inclinazione”. L’equazione (3.17), in questo caso, assume
la seguente forma:
√
axm − 1 Sx − Sy = 0.
Che è equivalente al seguente sistema di ODEs:
√
dS
dx
dy
=
.
=
m
−1
0
ax − 1
Dal precedente sistema di ODEs si ottiene:

S = c 1 ,
dx
dy
√
=
.
−1
axm − 1
Anche in questo caso l’integrazione della seconda equazione presenta notevoli difficoltà analitiche5 . L’approccio basato sull’equazione (3.11) è quindi preferibile.
5
Si potrebbe integrare tale equazione tramite un opportuno programma come Mathematica o Matlab.
59
60
Appendice A
Sistemi di PDEs di primo ordine
In questa appendice viene descritta la teoria relativa ai sistemi di PDEs di primo ordine. Si tratta
dei sistemi che si sono presentati nei Capitoli 2, 3 quando sono state derivate le equazioni che
consentono di risolvere i problemi inversi dell’ottica geometrica. Si rimanda a [10] per ulteriori
dettagli.
1
Sistemi di equazioni lineari
Si consideri un sistema di m equazioni lineari omogenee, in una sola funzione incognita u =
u(x1 , . . . , xn ), di n variabili x1 , . . . , xn


X1 (u) = a11 p1 + . . . + a1n pn = 0,
..
..
..
..
.
.
.
.


Xm (u) = am1 p1 + . . . + amn pn = 0,
(A.1)
dove si è posto pk = uxk , i coefficienti aik sono funzioni continue e derivabili con derivata continua
nelle variabili xs e Xk (u) denota il primo membro della k-esima equazione. Si deve trovare una
funzione u che soddisfi contemporaneamente tutte le equazioni del sistema (A.1). Si esclude dalla
soluzione del sistema (A.1) la soluzione banale u = costante che non presenta alcun interesse. Si
suppone che le equazioni del sistema (A.1) siano linearmente indipendenti, cioè che non esistano
fattori λk = λk (xs ), s = 1, . . . , n, con λk non tutti nulli tali che:
m
X
λk Xk (u) = 0,
k=1
identicamente rispetto a xs in un dominio di variazione di queste variabili e di ps .
Se questi λk esistessero, il primo membro di una delle equazioni del sistema (A.1) potrebbe essere
espresso come combinazione lineare dei primi membri delle altre equazioni. Questa equazione
61
sarebbe quindi conseguenza delle altre e potrebbe essere cancellata.
Supponiamo che m ≥ n e si considerino le prime n equazioni del sistema. Poichè queste equazioni
sono linearmente indipendenti, il determinante composto dai loro coefficienti deve essere non
nullo. Ma allora il sistema omogeneo rispetto a ps ha la sola soluzione nulla p1 = . . . = pn = 0 da
cui risulta u = costante, cioè per m ≥ n il sistema non ha soluzioni, tranne quella banale. Non è
quindi restrittivo supporre che m < n e d’ora in avanti ci atterremo sempre a questa condizione.
Stabiliamo alcune utili proprietà. Se u1 e u2 sono due funzioni qualsiasi delle variabili
indipendenti x1 , . . . xn , si hanno seguenti le due identità:
Xk (u1 + u2 ) = Xk (u1 ) + Xk (u2 ),
Xk (u1 u2 ) = u1 Xk (u2 ) + u2 Xk (u1 ).
(A.2)
Sostituendo nell’espressione Xi (u) la funzione u con il primo membro della k-esima equazione,
cioè con l’espressione di Xk (u) e tenendo conto delle identità (A.2) si ottiene:
Xi (Xk (u)) =
n
X
Xi (aks )uxs +
n
X
s=1
s=1
n
X
n
X
aks Xi (uxs ),
e analogamente
Xk (Xi (u)) =
Xk (ais )uxs +
ais Xk (uxs ).
s=1
s=1
È evidente che, ricorrendo alle derivate seconde della funzione u il secondo addendo a secondo
membro dell’equazione precedente, si può scrivere nel seguente modo:
n
X
aks Xi (uxs ) =
s=1
n
X
s=1
aks
n
X
ait uxs xt =
t=1
n
X
ait aks uxs xt ,
s,t=1
effettuando una permutazione degli indici i, k, l’ultima espressione rimane invariata, cioè:
n
X
ais Xk (uxs ) =
n
X
aks Xi (uxs ).
s=1
s=1
Si è ottuta cosı̀ la seguente formula:
Xi (Xk (u)) − Xk (Xi (u)) =
n
X
[Xi (aks ) − Xk (ais )] (uxs ),
(A.3)
s=1
nella quale il secondo membro rappresenta una funzione lineare omogenea di ps = uxs con
coefficienti dipendenti da xk .
62
Si può estendere la definizione di Parentesi di Poisson al caso in cui appaiono un numero
qualsiasi di variabili mediante la seguente formula:
[ϕ, ψ] =
n
X
(ϕpj ψxj − ϕxj ψpj ).
(A.4)
j=1
Sostituendo nella formula precedente ϕ = Xi (u) e ψ = Xk (u), si ottiene:
ϕpj = aij , ψxj =
n
X
∂aks
s=1
∂xj
p s , ϕ xj =
n
X
∂ais
s=1
∂xj
ps , ψpj = akj .
Ponendo quanto trovato nella (A.4), si ottiene:
[Xi (u), Xk (u)] =
n
n
X
X
s=1
ossia:
[Xi (u), Xk (u)] =
n
∂aks X
∂ais
aij
−
akj
∂xj
∂xj
j=1
j=1
n
X
!
ps ,
[Xi (aks ) − Xk (ais )] ps .
s=1
Confrontando quanto trovato con il secondo membro della (A.3), si giugne alla seguente importante identità:
[Xi (u), Xk (u)] = Xi (Xk (u)) − Xk (Xi (u)).
(A.5)
Se u verifica tutte le equazioni del sistema (A.1), cioè se
Xl (u) = 0
(l = 1, . . . , m),
deve verificare anche la seguente equazione linearmente omogenea:
[Xi (u), Xk (u)] = 0,
(A.6)
qualunque siano gli indici i e k. Al variare degli indici i e k con i, k = 1, . . . , m, si ottengono
m(m − 1)
nuove equazioni lineari omogenee che sono conseguenza del sistema (A.1). Alcune di
2
queste possono essere delle identità, cioè tutti i loro coefficienti in pk possono risultare nulli. Si
aggiungono le nuove equazioni che non risultano identità a quelle del sistema (A.1), verificando
ogni volta che l’equazione aggiunta non sia una combinazione lineare delle equazioni presenti.
In caso contrario, tali equazioni vengono omesse.
Procedendo in questo modo con tutte le equazioni, otteniamo un nuovo sistema in cui il numero
di equazioni può essere maggiore di m. Per il nuovo sistema verrà costruita la parentesi di Poisson
composta dai primi membri, senza ripetere, ovviamente, la parentesi di Poisson già costruita per
il sistema iniziale e aggiungendo le nuove equazioni ottenute al sistema.
Continuando questo procedimento si possono presentare due casi:
63
1. Se il numero di equazioni del sistema ottenuto è uguale a n, questo sistema ha la sola
soluzione banale u = costante e, di conseguenza, il sistema iniziale risulta avere come
unica soluzione quella banale.
2. Se il numero di equazioni del sistema ottenuto è inferiore a n, cioè per tutte le nuove equazioni costruibili mediante la parentesi di Poisson sono combinazioni lineari delle equazioni
del sistema stesso, esso viene detto sistema completo.
In tal modo, viste le considerazioni precedenti, segue che il sistema iniziale considerato o ha
la soluzione banale, oppure è equivalente ad un sistema completo, e si pone cosı̀ il problema
dell’integrazione dei sistemi completi.
Si può supporre, senza perdita di generalità, che il sistema iniziale (A.1) sia (già) un sistema
completo, cioè che tutte le parentesi di Poisson possibili [Xi (u), Xk (u)] siano combinazioni lineari
dei primi membri delle equazioni, come segue:
[Xi (u), Xk (u)] =
m
X
(i,k)
βl
Xl (u),
(A.7)
l=1
(i,k)
dove i coefficienti βl
mente.
2
sono funzioni di xk , oppure che queste parentesi si annullino identica-
Sistemi completi di Jacobi
In questa sezione vengono discusse alcune proprietà fondamentali dei sistemi completi.
Consideriamo le nuove variabili indipendenti:
yk = ϕk (x1 , . . . , xn )
(k = 1, . . . , n),
e supponiamo che questa trasformazione possa essere esplicitata rispetto a xk . Il sistema (A.1)
nelle nuove variabili indipendenti assumerà la forma:
Yj (u) = bj1
∂u
∂u
+ . . . + bjn
=0
∂y1
∂yn
(j = 1, . . . , m),
dove, per la regola di derivazione delle funzioni composte, si ha:
bjl =
n
X
s=1
ajs
∂ϕl
= Xj (yl ).
∂xs
(A.8)
Qualunque sia le funzione u si ha Yj (u) = Xj (u); il secondo membro viene espresso mediante le
variabili indipendenti xk , il primo membro mediante le variabili indipendenti yk . Di conseguenza,
qualunque siano gli indici i e k si ha:
Xi (Xk (u)) = Yi (Yk (u)),
64
e
Xi (Xk (u)) − Xk (Xi (u)) = Yi (Yk (u)) − Yk (Yi (u)).
Tenuto conto delle (A.5) e (A.7) si può scrivere:
Yi (Yk (u)) − Yk (Yi (u)) =
m
X
(i,k)
γl
Yl (u),
l=1
(i,k)
(i,k)
dove i coefficienti γl
si ottengono dai coefficienti βl
indipendenti. Abbiamo cosı̀ provato la seguente
con il passaggio alle nuove variabili
Proposizione A.1 Se il sistema (A.1) è completo, allora ogni sistema ottenuto per sostituzione
delle variabili indipendenti sarà ancora completo.
Dimostriamo ora un’altra proprietà dei sistemi completi. Costruiamo m combinazioni lineari dei
primi membri delle equazioni del sistema (A.1):
Zj (u) = dj1 X1 (u) + . . . + djm Xm (u)
(j = 1, . . . , m),
dove si suppone che i coefficienti djl siano dipendenti da xk e che il determinante di questi
coefficienti sia non nullo. Sotto tali ipotesi il sistema di equazioni:
Zj (u) = 0
(j = 1, . . . , m),
(A.9)
risulterà equivalente al sistema iniziale (A.1). Vale, inoltre, la seguente
Proposizione A.2 Se il sistema (A.1) è completo, allora ogni sistema equivalente ad esso (cfr.
come il sistema (A.9)) risulta completo.
Dimostrazione.
sioni della forma:
La parentesi di Poisson [Zi (u), Zk (u)] rappresenta una somma di espresdip Xp (dkq Xq (u)) − dkq Xq (dip Xp (u)),
ossia considerando quanto espresso dalla (A.2), una somma di espressioni della forma:
dip [Xp (dkq )Xq (u)) + dkq Xp (Xq (u))] − dkq [Xq (dip )Xp (u) + dip Xq (Xp (u))] =
dip Xp (dkq )Xq (u) − dkq Xq (dip )Xp (u) + dip dkq [Xp (Xq (u)) − Xq (Xp (u))].
Tenuto conto che tutte le espressioni Xp (Xq (u)) − Xq (Xp (u)) sono combinazioni lineari di Xj (u),
si vede che la parentesi di Poisson [Zi (u), Zk (u)] si esprime mediante Xj (u) e, di conseguenza,
mediante Zj (u), e questo dimostra la completezza del sistema (A.9).
Introduciamo ora una nuova nozione, che è un caso particolare della nozione di completezza
65
Definizione 2 Il sistema (A.1) si chiama sistema di Jacobi o sistema Jacobiano se tutte le
parentesi di Poisson [Xi (u), Xk (u)] si annullano identicamente, cioè se tutti i coefficienti di ps
in queste parentesi sono identicamente nulli.
Si può dimostrare che:
Proposizione A.3 Si può trasformare un sistema completo in un sistema Jacobiano mediante
operazioni algebriche elementari.
Dimostrazione. Si consideri il sistema iniziale (A.1) e lo si supponga completo. Poichè
le sue equazioni sono linearmente indipendenti, la matrice dei suoi coefficienti ha rango m e
possiamo risolvere le equazioni del sistema rispetto a m grandezze ps . Si può supporre, senza
perdita di generalità, che le equazioni del sistema siano esplicitabili rispetto a p1 , . . . , pm ; al posto
del sistema (A.1) si può scrivere un sistema nella forma:


p1 + c1,m+1 pm+1 + . . . + c1,n pn = 0,



p2 + c2,m+1 pm+1 + . . . + c2,n pn = 0,
(A.10)
..
..
..
..

.
.
.
.



p + c
p
+ . . . + c p = 0.
m
m,m+1 m+1
m,n n
Questo sistema, in accordo con la Proposizione A.2, è completo. Si dimostra che il sistema (A.10)
è anche un sistema Jacobiano. Per mostrare questo fatto procediamo come segue. Come fatto in
precedenza, si denotino con Xi (u) i membri dell’equazioni del sistema (A.10). Si deve dimostrare
(i,k)
che tutti i coefficienti βl presenti nella formula (A.7) siano identicamente nulli. Dalla forma del
sistema (A.10) e dalla definizione di parentesi di Poisson deriva immediatamente che l’espressione
a primo membro della (A.7) non contiene ps , per s ≤ m, e che a secondo membro il coefficiente
(i,k)
(i,k)
di ps , per s ≤ m, è uguale a βl . Ne segue immediatamente che tutti i coefficienti βl
devono
essere nulli, vale a dire che il sistema (A.10) è un sistema Jacobiano.
Osservazione: Un sistema Jacobiano non deve avere necessariamente la forma (A.10). Ma
considerando quanto è stato dimostrato precedentemente, un sistema completo ridotto alla forma
(A.10) risulta essere un sistema Jacobiano.
3
Integrazione di sistemi completi
In questa sezione mostreremo come sia possibile determinare la soluzione di un sistema completo.
In virtù della Proposizione A.3, invece di integrare il sistema completo (A.1) si può integrare il
sistema Jacobiano equivalente (A.10).
Si consideri la prima equazione di questo sistema e il corrispondente sistema di equazioni
differenziali ordinarie:
dx2
dxm
dxm+1
dxn
dx1
=
= ... =
=
= ... =
.
(A.11)
1
0
0
c1,m+1
c1,n
66
Si noti che la notazione usata nell’equazione (A.11), dove appare zero al denominatore di alcune
dx2
frazioni, sta a significare che il corrispondente numeratore è nullo, come ad esempio per
cioè
0
che, dx2 = 0, e quindi x2 = costante. Questa notazione la si trova in [10, 11, 12, 13, 14] ed è
generalmente accettata dai matematici che lavorano nel campo delle PDEs.
Il sistema (A.11) ammette i seguenti n − 1 integrali indipendenti:
ϕ2 (x1 , . . . , xn ) = C2 , . . . , ϕn (x1 , . . . , xn ) = Cn ,
e i primi membri delle equazioni scritte devono essere soluzioni della prima delle equazioni del
sistema (A.10). Si osservi che è possibile scrivere direttamente gli m − 1 integrali cioè:
x2 = costante, . . . , xm = costante.
Si considerino le n − 1 nuove variabili:
ys = ϕs (x1 , . . . , xn )
(s = 2, . . . , n).
(A.12)
Dal fatto che gli integrali sono indipendenti segue che le equazioni scritte devono essere esplicitabili rispetto alle n − 1 variabili xk , e si può considerare una funzione ϕ1 (x1 , . . . , xn ) tale che il
cambiamento di variabili
ys = ϕs (x1 , . . . , xn ) (s = 1, . . . , n).
si possa esplicitare rispetto a tutte le variabili xk . Se per esempio le equazioni del sistema (A.10)
sono esplicitabili rispetto a x1 , . . . , xn−1 è sufficiente considerare ϕ1 = xn .
Se si trasforma il sistema (A.10) nelle nuove variabili indipendenti, utilizzando la formula (A.8)
e tenendo conto che ϕ2 , . . . , ϕn sono soluzioni della prima delle equazioni del sistema (A.10),
∂u
= 0. Utilizzando questa equazione,
si vede che la prima equazione si riduce alla forma
∂y1
∂u
dalle altre m − 1 equazioni e, in vista della
possiamo cancellare tutti i termini contenenti
∂y1
∂u
loro indipendenza lineare, esplicitare queste rispetto ad alcune delle m − 1 derivate
. Si può
∂ys
supporre, senza perdita di generalità, che sia possibile esplicitare le suddette equazioni rispetto
∂u
∂u
a
,...,
. Il sistema assumerà, dunque, la seguente forma:
∂y2
∂ym

∂u


Y1 (u) =
= 0,


∂y1




Y2 (u) = ∂u + h2,m+1 ∂u + . . . + h2,n ∂u = 0,
∂y2
∂ym+1
∂yn
(A.13)
.
.
.
.
.


.
.
.
.
.

.
.
.
.
.



∂u
∂u
∂u


Ym (u) =
+ hm,m+1
+ . . . + hm,n
= 0.
∂ym
∂ym+1
∂yn
67
Il sistema iniziale era Jacobiano, di conseguenza, completo, e perciò il sistema trasformato deve
essere ancora completo. Ma poichè è esplicitabile rispetto alle derivate, esso deve essere un
sistema Jacobiano. Si deriva che la trasformazione di un sistema Jacobiano in nuove variabili
indipendenti, per la Proposizione A.1, conduce sempre ad un sistema Jacobiano.
La prima delle equazioni del sistema (A.13) mostra che la funzione u non dipende da y1 . È facile
dimostrare che i coefficienti presenti nelle altre equazioni del sistema (A.13) non contengono y1 .
Infatti, ogni espressione:
Y1 (Yi (u)) − Yi (Y1 (u)) =
∂hi,n ∂u
∂hi,m+1 ∂u
+ ... +
= 0,
y1 ∂ym+1
y1 ∂yn
deve annullarsi identicamente poichè il sistema (A.13) è Jacobiano, dimostrando l’affermazione
precedente. Si può dunque omettere la prima equazione nel sistema (A.13) e integrare le altre
supponendo che u sia indipendente da y1 . In questo modo si ottiene un sistema di m−1 equazioni
con n − 1 variabili indipendenti. Applicando a questo sistema l’operazione sopraindicata, si
ottiene un sistema di m − 2 equazioni in n − 2 variabili indipendenti e via di seguito. Infine,
si ottiene una sola equazione per la funzione u di n − m + 1 variabili indipendenti. Denotando
queste variabili con y1 , . . . , yn−m+1 si avrà un’equazione della forma:
∂u
∂u
∂u
+ g2
+ . . . + gn−m+1
= 0,
∂y1
∂y2
∂yn−m+1
dove le varibili indipendenti yj sono funzioni delle variabili indipendenti iniziali x1 , . . . , xn . Il
sistema di equazioni differenziali ordinarie corrispondente all’ultima equazione avrà gli n − m
integrali indipendenti:
ψ1 (y1 , . . . , yn−m+1 ) = C1 , . . . , ψn−m (y1 , . . . , yn−m+1 ) = Cn−m ,
e la cui soluzione generale avrà la forma:
u = Ψ(ψ1 , . . . , ψn−m ),
dove Ψ è una funzione arbitraria. La stessa formula fornisce la soluzione generale del sistema
iniziale (A.1).
68
Conclusioni
Nella tesi si è studiato il seguente problema inverso in ottica geometrica
Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione rappresentato
dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo
in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnate.
Tale problema è stato risolto facendo ricorso sia al principio di Fermat che all’equazione iconale
in un mezzo tridimensionale disomogeneo e isotropo. Un analogo problema inverso è stato
affrontato e risolto anche nel caso di un mezzo bidimensionale.
Nel caso tridimensionale, riportato nel Capitolo 2, abbiamo dimostrato che il principio di
Fermat implica che la famiglia di raggi di luce assegnata deve essere una congruenza normale e
abbiamo provato che la funzione che rappresenta l’indice di rifrazione deve soddisfare il sistema
(2.24).
Impostando il problema inverso con l’equazione iconale si ottiene invece un sistema di PDEs
lineari e omogenee in cui la funzione incognita è direttamente connessa ai fronti d’onda. La
determinazione di tale funzione consente, mediante l’utilizzo dell’equazione (2.48), di trovare la
funzione indice di rifrazione cercata.
Ovviamente entrambe le procedure devono condurre al medesimo risultato.
Nel caso tridimensionale, a illustrazione della teoria sviluppata, sono stati analizzati quattro
esempi mediante la procedura basata sull’equazione iconale.
Nel caso bidimensionale, riportato nel Capitolo 3, è stato affontato il problema sulla falsariga
del problema tridimensionale.
È importante tener presente che nel Capitolo 2 si è considerata la propagazione della luce in
un mezzo trasparente, continuo, disomogeneo e isotropo dalla prospettiva dell’ottica geometrica.
Per un lungo periodo tali studi hanno presentato un interesse puramente accademico. Questo
era principalmente dovuto alla difficoltà di costruire un mezzo di indice di rifrazione variabile
con un alto grado di accuratezza come richiede l’ottica. Negli utlimi 50 anni, la situazione è
cambiata grazie all’avvento della tecnica delle microonde e delle loro applicazioni e anche poichè i
mezzi disomogenei giocano un ruolo importante nell’ottica integrata e nella fibra ottica. A causa
di queste importanti applicazioni fisiche, lo studio svolto risulta particolarmente interessante.
Tuttavia l’integrazione delle equazioni (2.24) (o le analoghe (2.45)) presenta, in generale, notevoli
69
difficoltà analitiche e richiede, quindi, il ricorso a specifiche tecniche numeriche (ma questo tipo
di trattazione esula dagli obiettivi di questa tesi) .
70
Bibliografia
[1] R.K. Luneburg, Mathematical Theory of Optics, University of California, 1964.
[2] M.Born and E. Wolf, Principles of Optics, 7th edition, expanded edition (Cambridge
University,1999).
[3] M. Kline and I W. Kay, Electromagnetic Theory and Geometrical Optics, Interscience,
1965.
[4] Y.A. Kravtsov and Y.I. Orlov, Geometrical Optics of inhomogeneous media, in Springer
Series on Wave Phenomena, vol. 6, Springer-Verlag, 1990.
[5] A.Fletcher, T. Murphy and A. Young, Solutions of two optical problems, Proc. R. Soc.
Lond. Ser. A 223, 216-225, 1954.
[6] G. Toraldo di Francia, A family of perfect configuration lenses of revolution, Opt. Acta 1,
157-163, 1955.
[7] F. Borghero and G. Bozis, A 3-dimensional inverse problem of geometrical optics for continuous isotropic inhomogeneous media, in Preceedings Wascom 2007, 14th Conference on
Waves and Stability in Continuous Media, Scicli-Ragusa, Italy, 2007.
[8] F. Borghero and F. Demontis, Three dimensional inverse problem of geometrical optics: a
mathematical compatison between Fermat’s principle and the eikonal equation, in Journal
of the Optical Society of America, vol 33, September 2016.
[9] O. N. Stravoudis, The optics of Rays, Wavefronts, and Caustics, Academic, 1972.
[10] V.I. Smirnov, A course of Heigher Mathematics, vol IV, Pergamon, 1964.
[11] I. N. Sneddon, Elements of Partial Differential Equations, McGraw-Hill, 1957.
[12] I.G. Petrovki, Ordinary Differential Equations, Prentice-Hall, 1966.
[13] L.Elsgolts, Differential Equations and Calculus of Variations, Mir, 1973.
71
[14] G. L. Velazquez, Partial Differential Equations of First Order and Their Applications to
Physics, World Scientific Publishing, 2012.
[15] Baltes H P, Inverse Source Problems in Optics, Springer, Berlin, 1978.
[16] Ghosh Roy D N, Methods of Inverse Problem in Physics, Boca Raton, CRC Press, 1991.
[17] F. Borghero and G. Bozis, A two-dimensional inverse problem of geometrical optics,
Journal of Phisics, A 38, 175-184, 2005.
[18] Cornelius Lanczos, The variational principles of Mechanics, Third Edition, University of
Toronto Press Toronto, 1966.
[19] S. Nemoto and T. Makimoto, Refractive-index distribution for a prescribed ray path, J.
Opt. Soc. Am. 69, 450-454, 1979.
[20] J.C. Minãno, Refractive-index distribution in two-dimensional geometry for a given oneparameter manifold of rays, J. Opt. Soc. Am. A2, 1821-1825, 1985.
[21] F. Borghero and T. Kotoulas, Two solvable problems of planar geometrical optics, J.Opt.
Soc. Am. A 23, 3133-3138, 2006.
[22] F. Borghero and T. Kotoulas, Refractive-index distribution generating as light rays a given
family of curves lying on a surface, J.Opt. Soc. Am. A 28, 278-283, 2011.
[23] P. Russell and T.A. Birks, Hamiltonian optics of nonuniform photonic crystals, J.
Lightwave Technol. 17, 1982-1988, 1999.
72