UNIVERSITÀ DEGLI STUDI DI CAGLIARI FACOLTÀ DI SCIENZE CORSO DI LAUREA MAGISTRALE IN MATEMATICA Problemi inversi in Ottica Geometrica studiati mediante due metodi differenti: l’equazione iconale e il principio di Fermat TESI DI LAUREA DI: Loredana Caddeo RELATORE: Dott. Francesco Demontis Anno Accademico 2015/2016 Indice Introduzione i 1 Ottica fisica e ottica geometrica 1 Il Campo Elettromagnetico . . . . . . . . . . . . . 1.1 Le equazioni di Maxwell . . . . . . . . . . 1.2 Le equazioni d’onda e la velocità della luce 1.3 La teoria elementare della dispersione . . . 2 Fondamenti di ottica geometrica . . . . . . . . . . 2.1 L’equazione iconale . . . . . . . . . . . . . 2.2 L’equazione differenziale dei raggi di luce . 2.3 Le leggi di rifrazione e riflessione . . . . . 2.4 Raggi di congruenza e loro proprietà focali 2.5 Il principio di Fermat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Problema inverso in tre dimensioni 1 Introduzione al problema . . . . . . . . . . . . . . . . . 1.1 Nozioni geometriche . . . . . . . . . . . . . . . 2 Primo metodo: il principio di Fermat . . . . . . . . . . 3 Risolubilità del sistema della distribuzione dell’indice di 4 Secondo metodo: l’equazione iconale . . . . . . . . . . 5 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Esempio 1 . . . . . . . . . . . . . . . . . . . . . 5.2 Esempio 2 . . . . . . . . . . . . . . . . . . . . . 5.3 Esempio 3 . . . . . . . . . . . . . . . . . . . . . 5.4 Esempio 4 . . . . . . . . . . . . . . . . . . . . . 3 Problema inverso in due dimensioni 1 Equazione differenziale alle derivate diante il principio di Fermat . . . . 2 Equazione differenziale alle derivate diante l’equazione iconale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 3 5 8 9 13 16 18 19 . . . . . . . . . . . . . . . . . . rifrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 25 27 29 34 36 37 40 42 45 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 parziali dell’indice di rifrazione . . . . . . . . . . . . . . . . . . parziali dell’indice di rifrazione . . . . . . . . . . . . . . . . . . i trovata me. . . . . . . trovata me. . . . . . . 52 54 3 Indici di rifrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Indici di rifrazione radiali . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Indici di rifrazione omogenei . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 57 A Sistemi di PDEs di primo ordine 1 Sistemi di equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Sistemi completi di Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Integrazione di sistemi completi . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 64 66 Conclusioni 69 Bibliografia 71 ii Introduzione L’ottica è la branca dell’elettromagnetismo che descrive il comportamento e le proprietà della luce e l’interazione di questa con la materia. Esistono tre branche di ottica: l’ottica geometrica, l’ottica fisica e l’ottica quantistica. La tesi è quasi interamente dedicata all’ottica geometrica, ma verranno fornite le nozioni principali dell’ottica fisica che verranno utilizzate per l’ottica geometrica (che è un suo caso particolare)1 . L’ottica fisica studia i fenomeni di interferenza, diffrazione, polarizzazione della luce e tutti quei fenomeni per i quali è necessario ricorrere alla descrizione del carattere ondulatorio della luce come radiazione elettromagnetica applicando quindi le equazioni di Maxwell2 . L’ottica geometrica costituisce un’approssimazione dell’ottica fisica. Essa è valida quando la luce interagisce solo con oggetti di dimensioni molto maggiori rispetto alla sua lunghezza d’onda. Invece di parlare di direzione di propagazione dell’onda in ottica geometrica (si veda [1, 2, 3]) si introduce il concetto di raggio. Utilizzando il concetto di raggio, gli unici fenomeni rilevanti sono la propagazione rettilinea, la riflessione e la rifrazione ed è possibile spiegare il funzionamento di specchi, prismi, lenti e dei sistemi ottici costruiti con essi. L’ottica geometrica è basata sulle seguenti leggi3 : • Legge di propagazione rettilinea La legge afferma che nel vuoto la luce si propaga lungo linee rette. Tale comportamento della luce viene mantenuto all’interno di un qualsiasi mezzo omogeneo. • Leggi della riflessione La riflessione è il fenomeno per cui una congruenza ortogonale4 di raggi che incide su una superficie di discontinuità genera una nuova congruenza ortogonale di raggi. Le leggi della riflessione affermano che tale nuovo raggio, detto raggio riflesso, si trova nel piano definito dal raggio incidente e dalla perpendicolare alla superficie e nel punto di incidenza forma con tale perpendicolare un angolo con la stessa ampiezza e verso opposto di quello formato dal raggio incidente. 1 Per maggiori dettagli consultare [1, 2, 3]. Le equazioni di Maxwell verranno introdotte nel Capitolo 1. 3 Per maggiori dettagli consultare [1, 2, 3]. 4 La definizione di congruenza ortogonale verrà data nel Capitolo 1. 2 iii • Leggi della rifrazione (Legge di Snell) La rifrazione è il fenomeno per cui una congruenza ortogonale di raggi che attraversa una superficie di discontinuità (contatto tra due materiali diversi) viene deviata. Le leggi della rifrazione affermano che: 1. Il raggio uscente si trova sul piano definito dal raggio entrante e dalla perpendicolare alla superficie nel punto di contatto. 2. Le ampiezze degli angoli formati dai due raggi rispetto alla perpendicolare alla superficie sono collegati dalla relazione: n1 sin θ1 = n2 sin θ2 dove i coefficienti ni , i = 1, 2, sono detti indici di rifrazione e dipendono dai materiali di cui sono costituiti i mezzi e dalla frequenza. L’indice di rifrazione di un materiale è una grandezza adimensionale che quantifica la diminuzione della velocità di propagazione della radiazione elettromagnetica quando attraversa c un materiale ed è definito dalla formula n = , dove c rappresenta la velocità della luce v nel vuoto e v è la velocità di propagazione del raggio di luce nel mezzo. Nei fenomeni di rifrazione oltre al raggio rifratto, vi è sempre anche un raggio riflesso. Nel caso in cui il raggio provenga dal mezzo con indice di rifrazione maggiore, con un angolo tale che l’angolo uscente dovrebbe essere maggiore di 90◦ (θ1 > arcsin( nn21 )), il raggio rifratto non è presente e tutta la luce viene riflessa (riflessione totale). Gli indici di rifrazione sono definiti dalla legge precedente a meno di una costante moltiplicativa. Essi sono determinati convenzionalmente assumendo uguale a 1 l’indice di rifrazione del vuoto; sapendo che la velocità della luce è massima nel vuoto, ne segue che l’indice di rifrazione di tutte le altre sostanze è maggiore di 1. La variazione dell’indice di rifrazione in funzione della frequenza provoca il fenomeno della dispersione cromatica, cioè la separazione di un raggio di luce bianca nel suo spettro. La dispersione cromatica è all’origine dell’arcobaleno5 e dell’aberrazione cromatica6 . In ottica geometrica si presentano i seguenti due problemi: • Problema diretto: Si suppone assegnato l’indice di rifrazione di un mezzo e si vuole determinare la traiettoria seguita dai raggi di luce in tale mezzo. • Problema inverso: Si suppone assegnata una famiglia di curve e si vuole costruire la funzione n = n(x, y, z) -che rappresenta l’indice di rifrazione di un mezzo- in modo che la luce si propaghi in tale mezzo lungo le curve della famiglia assegnate. 5 L’arcobaleno è un fenomeno ottico e meteorologico che produce uno spettro quasi continuo di luce nel cielo quando la luce del Sole attraversa le gocce d’acqua rimaste in sospensione dopo un temporale, o presso una cascata o una fontana. 6 L’aberrazione cromatica è un difetto nella formazione dell’immagine dovuta al diverso valore di rifrazione delle diverse lunghezze d’onda che compongono la luce che passa attraverso il mezzo ottico. Questo si traduce in immagini che presentano ai bordi dei soggetti aloni colorati. iv Nella tesi focalizzeremo la nostra attenzione sullo studio del problema inverso in ottica geometrica. Tale problema, come già detto, consiste nel trovare l’indice di rifrazione di un mezzo supponendo di conoscere la traiettoria dei raggi di luce. L’indice di rifrazione è descritto da una funzione delle coordinate cartesiane utilizzate n = n(x, y, z). La tesi sarà cosı̀ strutturata : • Capitolo 1: Ottica fisica e ottica geometrica In questo capitolo verranno enunciate le principali nozioni dell’ottica fisica e le equazioni di Maxwell. Mediante tali equazioni verranno trovate le equazioni fondamentali dell’ottica geometrica: l’equazione iconale e l’equazione differenziale dei raggi di luce. Si dimostrerà che l’indice di rifrazione non è una quantità costante ma bensı̀ dipendente dalla frequenza (fenomeno di dispersione). Verrà enunciato e dimostrato il principio di Fermat. • Capitolo 2: Problema inverso in tre dimensioni In questo capitolo verrà descritto il seguente problema inverso in ottica geometrica in tre dimensioni: Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnate. Tale problema viene risolto mediante due approcci differenti: l’equazione iconale e il principio di Fermat. Entrambi gli approcci conducono ai medesimi risultati. Vengono discussi quattro esempi i quali vengono risolti mediante l’equazione iconale. • Capitolo 3: Problema inverso in due dimensioni In questo capitolo verrà descritto il problema inverso in ottica geometrica in due dimensioni, che risulta essere un caso particolare del problema tridimensionale. Come nel Capitolo 2 viene risolto sia mediante il principio di Fermat che mediante l’equazione iconale e viene ricavata l’equazione dell’indice di rifrazione. Vengono discussi alcuni esempi nei quali viene applicata la teoria sviluppata, ponendo delle condizioni restrittive sull’indice di rifrazione. • Appendice: Sistemi di PDEs di primo ordine In questa appendice verranno descritti i sistemi di PDEs di primo ordine. Verranno descritti i sistemi completi e i sistemi Jacobiani e verrà studiata la loro risolubilità. v vi Capitolo 1 Ottica fisica e ottica geometrica In questo capitolo descriveremo le equazioni di Maxwell che stabiliscono la stretta connessione tra campo elettrico e campo magnetico. Verrà dimostrato, con semplici argomentazioni matematiche, che l’indice di rifrazione n non è costante ma dipende dalla frequenza (dispersione). Il principale oggetto di studio sarà l’ottica geometrica che nasce come caso limite quando la lunghezza d’onda tende a diventare zero. Questo fa si che l’energia venga trasportata attraverso raggi di luce e, quindi, che possano essere applicate considerazioni geometriche a fenomeni ottici. Partendo dal problema diretto, in cui l’indice di rifrazione è noto, verranno derivate le equazioni più importanti dell’ottica geometrica: l’equazione iconale e l’equazione dei raggi di luce. Verrà infine descritto il principio di Fermat. 1 Il Campo Elettromagnetico Il campo elettromagnetico interagisce nello spazio con cariche elettriche e può manifestarsi anche in assenza di esse, trattandosi di un’entità fisica che può essere definita indipendentemente dalle sorgenti che l’hanno generata. In assenza di sorgenti il campo elettromagnetico è detto onda elettromagnetica, viene rappresentato da due vettori, E e B, chiamati rispettivamente campo elettrico e campo magnetico, essi sono campi vettoriali solenoidali1 , eccetto nel punto occupato dalla carica, in cui la divergenza del campo risulta infinita. Per descrivere l’effetto del campo su oggetti materiali, è necessario introdurre un secondo set di vettori: la densità di corrente elettrica j, l’induzione elettrica nella materia D, il campo magnetico nella materia H. La variazione temporale di uno dei due campi (elettrico o magnetico) determina il manifestarsi dell’altro: campo elettrico e campo magnetico sono caratterizzati da una stretta connessione che è stabilita dalle quattro equazioni di Maxwell. 1 Un campo vettoriale C viene detto solenoidale quando la divC = 0 in ogni suo punto. 1 1.1 Le equazioni di Maxwell Le derivate spaziali e temporali dei vettori E, B, H, D, j sono legate dalle equazioni di Maxwell, che ricoprono tutti i punti dello spazio in cui le proprietà fisiche del mezzo sono continue2 : 4π 1 j, rotH − Ḋ = c c (1.1) 1 rotE + Ḃ = 0, c (1.2) divD = 4πρ, (1.3) divB = 0. (1.4) dD dB dove Ḋ = e Ḃ = . dt dt Vi sono poi due relazioni scalari: L’equazione (1.3) può essere riguardata come una definizione della densità di carica elettrica ρ, l’equazione (1.4) implica che non esistono monopoli magnetici. Dall’equazione (1.1) (e dal fatto che div rot ≡ 0) segue che: 1 (1.5) divj = − div Ḋ, 4π derivando l’equazione (1.3) rispetto al tempo, ed eguagliando quanto trovato con la (1.5) si ottiene: ∂ρ + divj = 0, (1.6) ∂t chiamata equazione di continuità. Le equazioni di Maxwell connettono le cinque quantità base, E, H, B, D, j. Esse consentono un’unica determinazione dei vettori di campo dati da una distribuzione di corrente e di cariche, e devono essere integrate da relazioni che descrivono il comportamento delle sostanze sotto l’influenza del campo. Queste relazioni sono conosciute come equazioni materiali, in generale sono piuttosto complicate. Tuttavia, se valgono le seguenti ipotesi: 1. il campo varia con legge periodica sinusoidale, 2. i corpi sono a riposo o in movimento molto lento rispetto agli altri, 3. il materiale di cui è composto il mezzo è isotropo3 , 2 Le quantità E, D, j, ρ sono misurate in unità elettrostatiche, le quantità H e B in unità magnetiche, la costante c che indica la velocità della luce nel vuoto è approssimata a 3 × 1010 cm/s. 3 L’isotropia è una caratteristica fisica la quale indica l’indipendenza dalla direzione nella quale si analizza il fenomeno. 2 allora esse generalmente assumono la forma relativamente semplice: j = σE, (1.7) D = εE, (1.8) B = µH, (1.9) dove σ è la conducibilità specifica, ε è la costante dielettrica e µ è la permeabilità magnetica. 1.2 Le equazioni d’onda e la velocità della luce Limiteremo la nostra attenzione a quella parte del campo che non contiene cariche o correnti ossia : j = 0 e ρ = 0. Sostituiamo B con l’equazione materiale (1.9) nell’equazione (1.2), dividendo entrambe le parti per µ e applicando l’operatore rotore si ottiene: 1 1 rot rotE + rotḢ = 0. (1.10) µ c Differenziando rispetto al tempo l’equazione (1.1) e utilizzando l’equazione (1.8) per esprimere D, si elimina rotḢ tra l’equazione risultante e (1.10) e si ottiene: 1 ε rotE + 2 Ë = 0. (1.11) rot µ c Utilizzando le identità rot(uv) = u rotv + grad u ∧ v e rot(rot) = grad(div) − ∇2 l’equazione (1.11) diventa: εµ (1.12) ∇2 E − 2 Ë + (grad ln µ) ∧ rotE − grad(divE) = 0. c Inoltre utilizzando la relazione divD = 4πρ, l’equazione (1.8) per D e l’identità div(uv) = u divv + v · grad u si trova: ε divE + E · gradε = 0. (1.13) Dopo aver fatto queste considerazioni l’equazione (1.12) può essere riscritta nella forma: ∇2 E − εµ Ë + (grad ln µ) ∧ rotE − grad(E · grad ln ε) = 0. c2 (1.14) Effettuando passaggi simili si ottiene: ∇2 H − εµ Ḧ + (grad ln ε) ∧ rotH − grad(H · grad ln µ) = 0. c2 (1.15) Se il mezzo è omogeneo4 allora grad ln µ = grad ln ε = 0 e le equazioni (1.14) e (1.15) si riducono a: εµ ∇2 E − 2 Ë = 0, (1.16) c 4 Un mezzo si dice omogeneo, quando ε, µ e σ non dipendono dallo spazio percorso dall’onda elettromagnetica. 3 εµ Ḧ = 0. (1.17) c2 1 In generale l’equazione tipica di un’onda è ∇2 u − 2 ü = 0 dove u(r, t) è una funzione della v posizione r e del tempo t, e v indica la velocità di propagazione dell’onda. Quindi le equazioni (1.16) e (1.17) sono le equazioni standard del moto dell’onda e suggeriscono l’esistenza di onde elettromagnetiche che si propagano con velocità data dalla seguente formula: c (1.18) v=√ . εµ ∇2 H − Il valore di v non è determinato direttamente con una regola, ma solo relativamente a c, per mezzo della legge di rifrazione. Secondo tale legge, se un’onda elettromagnetica piana cade sulla regione di confine tra due mezzi omogenei, il seno dell’angolo θ1 , formato tra la normale all’onda incidente e la normale alla superficie, sta in un rapporto costante con il seno dell’angolo θ2 formato tra la normale all’onda rifratta e la superficie normale (Figura 1.1), questo rapporto costante diventa uguale al rapporto tra le velocità v1 e v2 di propagazione dell’onda nei mezzi: sin θ1 v1 = . sin θ2 v2 (1.19) Figura 1.1: La figura rappresenta la rifrazione di un’onda piana. La figura è stata presa dal [2]. Il valore costante nel rapporto è solitamente denotato con n12 ed è chiamato indice di rifrazione, per la rifrazione dal mezzo 1 al mezzo 2. Si può anche definire l’indice di rifrazione assoluto di un mezzo: c n= . (1.20) v 4 Mezzo Aria Idrogeno H2 Anidride carbonica CO2 Monossido di Carbonio CO Metanolo CH3 OH Alcool etilico C2 H5 OH Acqua H2 O n 1,000294 1,000138 1,000449 1,000340 1,34 1,36 1,33 √ ε 1,000295 1,000132 1,000473 1,000345 5,7 5,0 9,0 Tabella 1.1: Tabella nella quale vengono riportati gli indici di rifrazione di alcuni mezzi e le costanti dielettriche statiche. Se n1 e n2 sono gli indici di rifrazione assoluti di due mezzi, il relativo indice di rifrazione n12 per la rifrazione dal mezzo 1 al mezzo 2 è dato da : v1 n2 = . n12 = n1 v2 Mettendo a confronto l’equazione (1.20) e l’equazione (1.18) si ottiene: √ n = εµ, (1.21) chiamata formula di Maxwell. Dal momento che per tutte le sostanze di cui ci occuperemo µ risulta unitario, l’indice di rifrazione è dato dalla radice della costante dielettrica del mezzo ε, che è assunta come costante del materiale. Però, esperimenti sui colori prismatici, già noti dai tempi di Newton5 , mostrano che l’indice di rifrazione dipende dalla frequenza della luce. 1.3 La teoria elementare della dispersione Nella sezione §1.2 è stato osservato che l’indice di rifrazione non può essere una costante del mezzo come suggerisce la nostra precedente trattazione formale, ma deve dipendere dalla frequenza. La variazione dell’indice di rifrazione in funzione della frequenza costituisce il fenomeno di dispersione. Per uno studio adeguato della dispersione sarebbe necessario ricorrere alla teoria atomica della materia6 : tuttavia è possibile dare un modello semplificato facendo uso di alcuni risultati base riguardanti la struttura delle molecole. In questa sezione dimostriamo, con semplici argomentazioni matematiche, la dipendenza dell’indice di rifrazione dalla frequenza. A tal fine, occorre determinare lo sposamento r7 per ogni 5 Isaac Newton fu il primo a dimostrare che la luce bianca era composta dalla luce di tutti i colori dell’arcobaleno, che potevano essere separati in uno spettro completo di colori da un prisma di vetro. 6 Si veda [2] per maggiori dettagli. 7 Il calcolo rigoroso dello spostamento r dei nuclei e degli elettroni è un problema complicato di meccanica quantistica. Tuttavia, è confermato dalla teoria che gli elettroni si comportano come se fossero soggetti all’azione di una forza “elastica”Q = qr. 5 particella carica dalla sua posizione di equilibrio. Si può dimostrare8 che l’equazione di moto di un elettrone avente carica e e massa m è: mr̈ + qr = eÊ (1.22) 4π dove con Ê si indica il campo elettrico effettivo Ê = E + P, essendo P la polarizzazione9 3 totale e con qr si rappresenta una forza di ripristino quasi elastica. Si deve tener presente che ogni elettrone contribuisce alla polarizzazione con un momento pari a p = er. Osserviamo che si dovrebbe tenere in considerazione anche il contributo dei nuclei. Tuttavia, possiamo trascurare tale contributo perchè le masse dei nuclei sono grandi in confronto a quelle degli elettroni e quindi il loro contributo allo spostamento è trascurabile in prima approssimazione. Sia ω la frequenza angolare del campo incidente: Ê = Ê0 e−iωt (1.23) L’equazione (1.22) con Ê dato dalle (1.23) ammette la soluzione r= eÊ , m(ω02 − ω 2 ) (1.24) r q è chiamata frequenza di risonanza. In accordo all’equazione (1.24) l’elettrone m oscilla con la frequenza del campo incidente. Si noti che nell’equazione (1.24) deve essere ω 6= ω0 . Supponendo per il momento che vi sia un solo elettrone efficace in una molecola con frequenza di risonanza ω0 si ottiene, per la polarizzazione totale P, l’espressione: dove ω0 = P = N p = N er = N Ê e2 , 2 m (ω0 − ω 2 ) (1.25) dove con N si indica il numero di molecole per unità di volume. Dalla teoria della struttura atomica della materia10 è noto che: P = N αÊ, (1.26) sostituendo tale espressione nella (1.25), si trova: Nα = N e2 , m(ω02 − ω 2 ) 8 (1.27) Per maggiori dettagli si veda il Capitolo 2 in [2]. La polarizzazione è una caratteristica delle onde elettromagnetiche ed indica la direzione di oscillazione del campo elettrico durante la propagazione dell’onda nello spazio. 10 Per ulteriori dettagli si visioni il Capitolo 2 in [2]. 9 6 che esprime la densità di polarizzazione in termini di parametri atomici. Pertanto risulta che la 3 ε − 1 11 , non è costante, dove ε nella sua espressione quantità α, la cui espressione è α = 4πN ε + 2 denota la costante dielettrica statica. Questo porta ad introdurre la dipendenza della costante dielettrica dalla frequenza ossia ε(ω) che è stata definita per mezzo delle equazioni di Maxwell come ε = n2 , quindi anche l’indice di rifrazione n è funzione della frequenza n(ω). La costante dielettrica statica assume il valore ε(0) = n2 (0); questo corrisponde, secondo la (1.26), al valore limite N α(0) che viene trovato dalla (1.27) ponendo ω = 0: N α(0) = N e2 . mω02 Per ω 6= 0, la funzione N α(ω) data dall’equazione (1.27), è monotona crescente rispetto a ω, ma assume un valore infinito (punto di risonanza) quando ω tende a ω0 , infine per ω → ∞ la funzione tende al valore zero. Sostituendo il valore di α nella (1.27) si trova: n2 − 1 4π N e2 = . n2 + 2 3 m(ω02 − ω 2 ) (1.28) Per i gas il valore di n è vicino all’unità e si ottiene la seguente espressione (approssimata) della dispersione: 4πN e2 n2 − 1 ∼ 4πN α = . (1.29) m(ω02 − ω 2 ) Si osserva immediatamente che n è una funzione della frequenza. La dispersione è detta normale. Inoltre, n ≷ 1 in base a ω ≶ ω0 e n si avvicina all’unità con l’incremento di ω (vedi Figura 1.2). Alla frequenza di risonanza (ω = ω0 ) n è in realtà infinito, come risulta dalle formule (1.29)(si veda anche il grafico continuo nella Figura 1.2). La singolarità (corrispondente al termine ω0 − ω al denominatore nell’equazione (1.25)) sorge in quanto si è trascurato l’effetto di smorzamento. Lo smorzamento è infatti un fattore essenziale nell’intero processo in quanto gli elettroni vibrando emettono onde elettromagnetiche che sottraggono energia. Formalmente lo smorzamento può essere preso in considerazione aggiungendo nell’equazione di moto (1.22) un termine g ṙ che rappresenta un forza resistente: mr̈ + g ṙ + qr = eÊ. (1.30) La soluzione dell’equazione (1.30) è: r= m(ω02 eÊ . − ω) − iωg (1.31) Sostituendo (1.31) in (1.25) si osserva che la polarizzazione diventa una quantità complessa. Dal grafico in Figura 1.2, si nota che la curva tratteggiata (che rappresenta la curva di dispersione 11 Si invita il lettore a consultare il Capitolo 2 in [2] per prendere visione del procedimento mediante il quale si ottiene tale espressione. 7 Figura 1.2: Nella figura viene rappresentata la curva di dispersione per un gas. La linea continua rappresenta la curva di dispersione data dalla (1.29) e la linea tratteggiata rappresenta la curva di dispersione data dal modulo della (1.31). La figura è stata presa dal [2]. descritta dal modulo dalla (1.31)), ha un massimo in un valore di ω più piccolo di ω0 , e ha un minimo in un valore più grande di ω0 ; tra il massimo e il minimo la funzione decresce con l’incremento della frequenza, questa regione viene chiamata regione di dispersione anomala. I raggi con una lunghezza d’onda piccola vengono rifratti meno rispetto a quelli di lunghezza d’onda grande, questo si traduce nell’inversione della sequenza dei colori prismatici. L’indice di rifrazione per la luce visibile è sempre più grande dell’unità. 2 Fondamenti di ottica geometrica La branca dell’ottica in cui si trascura la lunghezza d’onda, cioè in corrispondenza al caso limite λ0 → 0, è nota come ottica geometrica e in tale approssimazione le leggi ottiche possono essere formulate come leggi geometriche. In particolare, l’energia può essere trasportata lungo curve (raggi di luce). Inoltre, per lunghezze d’onda piccole il campo ha lo stesso carattere di un’onda piana. All’interno dell’approssimazione dell’ottica geometrica valgono i seguenti fatti: • valgono le leggi di rifrazione e riflessione stabilite per onde piane incidenti su un confine piano (Es. le superfici di una lente) che dividono il raggio incidente in un raggio riflesso e un raggio trasmesso; 8 • la riflettività e trasmissività possono essere calcolate dalle corrispondenti formule per onde piane. Quindi, quando la lunghezza d’onda tende a zero, i fenomeni ottici possono essere dedotti da considerazioni geometriche, determinando le traiettorie dei raggi di luce. Si possono formulare leggi appropriate, considerando le implicazioni delle equazioni di Maxwell quando λ0 → 0. Infine si sottolinea che la semplicità del modello dell’ottica geometrica deriva essenzialmente dal fatto che, in generale, il campo si comporta localmente come un’onda piana. Per la maggior parte dei problemi di ottica, l’ottica geometrica fornisce almeno un buon punto di partenza per studi più approfonditi. 2.1 L’equazione iconale In questa sezione deriviamo una delle equazioni più importanti dell’ottica geometrica: l’equazione iconale. Ricordando che nell’ottica geometrica i campi (elettrico e magnetico) hanno lo stesso andamento di un’onda piana e, perciò, in un mezzo isotropo isolante possiamo scrivere: ( E(r, t) = E0 (r)e−iωt , (1.32) H(r, t) = H0 (r)e−iωt , dove E0 e H0 sono vettori complessi. I vettori E0 e H0 soddisfano le equazioni di Maxwell. In regioni libere da corrente e da cariche, dove j = ρ = 0, tali equazioni assumono la forma: rotH0 + ik0 εE0 = 0, (1.33) rotE0 − ik0 µH0 = 0, (1.34) div εE0 = 0, (1.35) div µH0 = 0, (1.36) 2π ω = , dove λ0 è la lunghezza d’onda nel vuoto. c λ0 Cerchiamo soluzioni delle equazioni (1.33), (1.34), (1.35), (1.36) della forma: dove k0 = E0 = e(r)eik0 S(r) , H0 = h(r)eik0 S(r) , (1.37) dove S(r) è una funzione scalare reale della posizione, detta traiettoria ottica, e(r) e h(r) sono vettori complessi. Sostituendo le (1.37) nelle equazioni di Maxwell (1.33), (1.34), (1.35), (1.36), si ottiene un set di relazioni tra e, h e S. Nel caso dell’ottica geometrica, che si ottiene quando λ0 è piccolo, si può dimostrare che queste relazioni comportano che S soddisfi una certa equazione differenziale, la quale è indipendente 9 dai vettori e e h. Vogliamo ottenere questa equazione differenziale. A tal fine, notiamo che, dalle equazioni (1.37) e usando le ben note identità vettoriali: rotH0 = (roth + ik0 gradS ∧ h)eik0 S , (1.38) divµH0 = (µdivh + h · gradµ + ik0 µh · gradS)eik0 S , (1.39) e espressioni analoghe per rotE0 e divεE0 , le equazioni (1.33),(1.34),(1.35),(1.36) diventano: gradS ∧ h + εe = − 1 roth, ik0 (1.40) 1 rote, ik0 (1.41) gradS ∧ e − µh = − 1 (e · grad ln ε + dive), ik0 (1.42) 1 (h · grad ln µ + divh). ik0 (1.43) e · gradS = − h · gradS = − Come già osservato, siamo interessati alla soluzione per valori di λ0 piccoli. Fintanto che il 1 è trascurabile, il fattore a secondo membro di tutte le equazioni può fattore moltiplicativo ik0 essere trascurato, e le equazioni si riducono a: gradS ∧ h + εe = 0, (1.44) gradS ∧ e − µh = 0, (1.45) e · gradS = 0, (1.46) h · gradS = 0. (1.47) Le (1.44) e (1.45) possono essere viste come un sistema di sei equazioni scalari lineari e omogenee per le componenti cartesiane ex , hx , ey , hy , ez , hz di e e h. Queste equazioni hanno soluzioni non banali solo se il determinante della matrice dei coefficienti del sistema è nullo. Ricavando h dalla (1.45) e sostituendo nella (1.44) si trova: 1 (e · gradS) gradS − e (gradS)2 + εe = 0. µ (1.48) Grazie alle (1.46) il primo termine dentro la parentesi nella (1.48) si annulla, e l’equazione si riduce, considerando che e non si annulla mai, a: (gradS)2 = n2 , 10 (1.49) che si può scrivere esplicitamente come: 2 2 2 ∂S ∂S ∂S + + = n2 (x, y, z), (1.50) ∂x ∂y ∂z √ dove n = εµ è l’indice di rifrazione. L’equazione (1.50) è nota come equazione iconale; ed è l’equazione fondamentale dell’ottica geometrica. La superficie S(r) = costante, viene chiamata superficie d’onda geometrica (oppure il fronte d’onda geometrico). I raggi di luce geometrici possono essere ora definiti come traiettorie ortogonali al fronte d’onda geometrico S = costante. In particolare, si considerano come curve orientate la cui direzione coincide, in ogni punto, con la direzione della media temporale del vettore di Poynting12 . Il vettore di Poynting è una grandezza vettoriale che descrive il flusso di energia associato alla propagazione del campo elettromagnetico, esso è definito tramite il prodotto vettoriale tra il campo elettrico e il campo magnetico: S = E ∧ H. La media temporale indicata con hSi è la media integrale calcolata in un intervallo di tempo tendente all’infinito, quindi la media temporale del vettore di Poynting risulta: Z T0 c 1 (E ∧ H)dt, per T 0 → ∞. hSi := 0 2T −T 0 4π Utilizzando la (1.45) ed effettuando semplici calcoli, la media temporale del vettore di Poynting risulta13 : c {(e · e? )gradS − (e · gradS)e? } . (1.51) hSi = 8πµ gradS L’ultimo termine è nullo per la (1.46). Secondo l’equazione iconale, è un vettore unitario n chiamato t: gradS gradS t= = . (1.52) n |gradS| Controntando le equazioni (1.51) e (1.52) si nota che t ha la stessa direzione della media temporale del vettore di Poynting. La media del vettore di Poynting è nella direzione della normale al fronte d’onda geometrico. Se r(s) denota il vettore posizione di un punto P su un raggio, considerato come funzione dr = t, l’equazione dei raggi può essere scritta come: dell’ascissa curvilinea s del raggio, dove ds n 12 13 dr = gradS. ds Questa definizione di raggi di luce è appropriata solo per mezzi isotropi. Per maggiori dettagli si veda il Capitolo 3 in [2]. 11 (1.53) Dalle (1.46) e (1.47) si vede che i vettori elettrici e magnetici sono ortogonali al raggio in ogni punto. Il significato della (1.53) risulta chiaramente dalle seguenti osservazioni. Si considerino due fronti d’onda “infinitamente”vicini S = costante e S + dS = costante (vedi Figura 1.3). Figura 1.3: La figura rappresenta il significato della formula ns = gradS. La figura è stata presa dal [2]. Inoltre: dr dS = gradS = n. ds ds (1.54) La distanza ds tra due punti posti alle estremità opposte di un taglio normale dei due fronti c d’onda risulta essere, ricordando la definizione n = , inversamente proporzionale all’indice di v R rifrazione, cioè direttamente proporzionale a v. L’integrale C n ds calcolato lungo una curva C è conosciuto come cammino ottico della curva, o lunghezza ottica. Denotando con le parentesi quadre il cammino ottico di un raggio che passa per P1 e P2 , si ha: Z P2 n ds = S(P2 ) − S(P1 ), [P1 P2 ] = (1.55) P1 e poichè c n ds = ds = c dt, v dove dt è il tempo che occorre all’energia per percorrere la distanza ds lungo il raggio, quindi: Z P2 [P1 P2 ] = c dt, (1.56) P1 cioè la lunghezza ottica [P1 P2 ] è uguale al prodotto della velocità della luce nel vuoto per il tempo impiegato dalla luce per viaggiare da P1 a P2 . 12 2.2 L’equazione differenziale dei raggi di luce I raggi di luce sono stati definiti come traiettorie ortogonali al fronte d’onda geometrico S(x, y, z) = costante e si è visto che, se r è un vettore posizione di un punto del raggio e s la lunghezza del raggio misurata a partire da un punto fissato in esso, si ha: n dr = gradS. ds (1.57) Questa equazione specifica i raggi mediante la funzione S, ma si può facilmente ricavare un’equazione differenziale che specifica il raggio direttamente in termini della funzione indice di rifrazione n(r). Differenziando (1.57) rispetto a s si ottiene: dr d dr d n = (gradS) = · grad(gradS) = ds ds ds ds cioè 1 1 1 gradS · grad(gradS) = grad[(gradS)2 ] = grad n2 , n 2n 2n d dr n = grad n. ds ds (1.58) Questa è la forma vettoriale delle equazioni differenziali dei raggi di luce. Esempio 1 : In un mezzo omogeneo n = costante quindi la (1.58) si riduce a: d2 r = 0, ds2 da cui: r = sa + b, (1.59) dove a e b sono vettori costanti. L’equazione (1.59) è un’equazione vettoriale di una retta che ha direzione del vettore a e passa per il punto b. Quindi si deduce che in un mezzo omogeneo i raggi di luce assumono la forma di una linea retta. Esempio 2 : In un mezzo il quale abbia una simmetria sferica, l’indice di rifrazione dipende solo dalla distanza r da un punto fissato O: n = n(r). (1.60) Questo caso è approssimativamente realizzato dall’atmosfera terrestre, quando viene presa in considerazione la curvatura della terra14 . 14 Con curvatura della terra si intende la distanza tra un osservatore e la linea che separa cielo e terra, che aumenta con la quota. Più in alto si sale, maggiore è la porzione di superficie terrestre che si può dominare con lo sguardo (condizioni atmosferiche permettendo). 13 Considerando la variazione del vettore r ∧ [n(r)t] lungo un raggio. Si ha: d dr d (r ∧ nt) = ∧ nt + r ∧ (nt), ds ds ds (1.61) dr = t il primo termine a secondo membro si annulla. Il secondo termine, tenendo ds r dn conto della (1.58), può essere scritto come r ∧ grad n, ma dalla (1.60) si ha grad n = ,e r dr quindi anche il secondo termine dell’equazione (1.61) si annulla. Quindi: dato che r ∧ nt = costante. (1.62) Questa relazione implica che tutti i raggi sono curve piane, situate in un piano passante per l’origine, e lungo ogni raggio si ha: nr sin φ = costante, (1.63) dove φ è l’angolo tra il vettore posizione r e la tangente al punto r sul raggio (Figura 1.4). Osserviamo che r sin φ rappresenta la distanza perpendicolare d dall’origine alla tangente, perciò (1.63) può essere riscritta come: nd = costante. (1.64) Figura 1.4: La figura rappresenta la formula di Bouguer, nd = costante, per raggi in un mezzo con simmetria sferica. La figura è stata presa dal [2]. Questa relazione usualmente viene chiamata formula di Bouguer e rappresenta l’analogo di una nota formula in dinamica, che esprime la conservazione del momento angolare di una particella 14 che si muove sotto l’azione di forze centrali. Per ottenere l’espressione esplicita dei raggi in un mezzo a simmetria sferica, è sufficiente richiamare poche nozioni di geometria elementare. Siano (r, θ) le coordinate polari di una curva piana, e φ l’angolo tra il raggio vettore al punto P sulla curva e la tangente a P . L’angolo φ è dato da: r(θ) 2 , dr r2 (θ) + dθ sin φ = s (1.65) e dalle (1.63) e (1.65) si trova: dr r√ 2 2 = n r − c2 , (1.66) dθ c dove c è una costante. L’equazione dei raggi in un mezzo con una simmetria sferica si può scrivere nella forma: Z r dr √ . (1.67) θ=c 2 r n r 2 − c2 Torniamo ora al caso generale. Sia K il vettore curvatura15 del raggio, definito come segue: K= dt 1 = n, ds ρ (1.68) 1 è il reciproco del raggio di curvatura16 , n è la normale principale. Dalla ρ (1.58) e (1.68) segue che: dn nK = grad n − t. (1.69) ds Questa relazione mostra che il gradiente dell’indice di rifrazione sta nel piano osculatore del raggio. Se si moltiplica scalarmente la (1.69) per K, usando la (1.68) e sapendo che t è ortogonale a K, si trova: 1 (1.70) |K| = = n · grad ln n. ρ dove la grandezza Essendo ρ è una quantità sempre positiva, la formula (1.70) implica che procedendo lungo la normale principale l’indice di rifrazione cresce, cioè i raggi si piegano verso la regione con indice di rifrazione più alto (Figura 1.5). 15 Il vettore curvatura K è ortogonale al vettore tangente t e ha la direzione della normale principale n del triedro di Frenet t, n, b, in ogni punto della curva. La curvatura è il modulo della normale principale n, intuitivamente indica la misura di quanto un determinato oggetto si discosta dall’avere un andamento rettilineo. 1 16 Il raggio di curvatura è il reciproco della curvatura: , dove con K si è indicata la curvatura. K 15 Figura 1.5: La figura rappresenta la curvatura di un raggio in un mezzo eterogeneo. La figura è stata presa dal [2]. 2.3 Le leggi di rifrazione e riflessione Fino ad ora abbiamo assunto che la funzione indice di rifrazione n fosse continua. Discuteremo ora il comportamento dei raggi quando attraversano una superficie separata da due mezzi omogenei con indici di rifrazioni diversi. dr chiamato raggio Segue dalla (1.57), utilizzando l’identità rot grad ≡ 0, che il vettore nt = n ds vettore soddisfa la relazione: rot nt = 0. (1.71) Sia T una superficie di discontinuità costituita da strati di transizione lungo la quale ε, µ e n cambiano rapidamente ma continuamente e su T consideriamo un elemento piano di area i cui lati P1 Q1 e P2 Q2 sono paralleli e con P1 P2 e Q1 Q2 perpedicolari a T (Figura 1.6). Sia inoltre b Figura 1.6: La figura rappresenta le leggi di rifrazione e riflessione. La figura è stata presa dal [2]. un vettore unitario normale a questa area. Integrando la (1.71) attraverso l’area e applicando il 16 teorema del rotore17 si trova: Z Z (rot nt) · b dS = nt · dr = 0, (1.72) dove il secondo integrale è preso sul contorno della curva P1 Q1 Q2 P2 rappresentata in Figura 1.6. Seguendo l’orientazione del rettangolo in Figura 1.6, e tenendo conto che il vettore unitario b è arbitrario, si ottiene: n12 ∧ (n2 t2 − n1 t1 ) = 0 (1.73) dove n12 è un vettore unitario normale al confine della superficie che punta dal primo al secondo mezzo e t1 e t2 sono i vettori tangenti alla curva P1 Q1 Q2 P2 rispettivamente nel mezzo 1 e nel mezzo 2 come rappresentato in Figura 1.6. La (1.73) implica che la componente tangente del raggio vettore nt è continua attraversando la superficie, o equivalentemente, che il vettore N12 = n2 t2 − n1 t1 è normale alla superficie. Siano θ1 e θ2 gli angoli tra il raggio incidente e il raggio rifratto con la normale n12 alla superficie (vedi Figura 1.7(a)). Segue dall’equazione (1.73) che: Figura 1.7: La figura rappresenta le leggi di rifrazione (a) e di riflessione (b). La figura è stata presa dal [2]. n2 (n12 ∧ t2 ) = n1 (n12 ∧ t1 ), (1.74) n2 sin θ2 = n1 sin θ1 . (1.75) e, conseguentemente, L’equazione (1.74) implica che i raggi rifratti giacciono nello stesso piano dei raggi incidenti e della normale alla superficie (il piano di incidenza) mentre l’equazione (1.75) mostra che il rapporto n1 degli tra il seno dell’angolo di rifrazione e il seno dell’angolo di incidenza è uguale al rapporto n2 17 H RR Il teorema del rotore afferma che: Γ F · dΓ = S (rotF) · dS dove F è un campo vettoriale su R3 , S è una superficie e Γ è una curva chiusa e semplice. 17 indici di rifrazione. Questi due risultati esprimono la legge di rifrazione o legge di Snell. La presente analisi si applica alle onde e superfici rifrangenti sotto la condizione che la lunghezza d’onda sia sufficientemente piccola (λ0 → 0). Questa condizione significa, in pratica, che i raggi di curvatura dell’onda incidente e del confine di superficie devono essere grandi rispetto alla lunghezza d’onda della luce incidente. L’onda riflessa viene propagata di nuovo nel primo mezzo. Posto n2 = n1 in (1.74) e in (1.75) (vedi Figura 1.7(b)), segue che i raggi riflessi giacciono nel piano di incidenza e sin θ1 = sin θ2 , quindi: θ2 = π − θ1 . (1.76) Gli utlimi due risultati esprimono la legge di riflessione. 2.4 Raggi di congruenza e loro proprietà focali La relazione (1.71) ossia: rot nt = 0, (1.77) caratterizza tutti i raggi del sistema che possono essere realizzati in un mezzo isotropo e li distingue da famiglie più generali di curve. In un mezzo omogeneo e isotropo n è costante, e la (1.77) si riduce a: rot t = 0. (1.78) I raggi in un mezzo isotropo omogeneo possono essere anche caratterizzati da una relazione indipendente da n. Tale relazione si può ottenere applicando alla (1.77) l’identità rot nt = n rott + (grad n) ∧ t e moltiplicando scalarmente per t. Segue che un sistema di raggi in un qualsiasi mezzo isotropo, essendo (grad n ∧ t) · t = 0, deve soddisfare la relazione: t · rot t = 0. (1.79) Un sistema di curve che occupa una porzione di spazio in modo che una singola curva passi attraverso ciascun punto della regione è chiamato congruenza. Se esiste una famiglia di superfici che taglia ogni curva ortogonalmente la congruenza viene detta normale; se non esiste tale famiglia, la congruenza viene detta inclinata. Per l’ottica geometrica risultano essere interessanti solo le congruenze normali. Se ogni curva della congruenza è una linea retta la congruenza si chiama rettilinea. Le equazioni (1.79) e (1.78) esprimono rispettivamente le condizioni necessarie e sufficienti affinchè le curve rappresentino una congruenza normale o normale rettilinea. Scegliamo un insieme di coordinate curvilinee u, v su una delle superfici ortogonali S(x, y, z) = costante ad una data conguenza normale. Ad ogni punto Q(u, v) di questa superficie corrisponde una curva di congruenza, cioè tale curva incontra S in Q. Sia r il vettore posizione relativo al punto P sulla curva. Possiamo considerare r come una funzione delle coordinate (u, v) e della lunghezza d’arco s tra Q e P , misurata lungo la curva (Figura 1.8). Si considerino due curve “infinitamente”vicine di una congruenza passanti attraverso i punti (u, v) e (u + du, v + dv) su 18 Figura 1.8: La figura rappresenta la notazione relativa alla congruenza normale. La figura è stata presa dal [2]. S, occorre verificare se vi sono punti su queste curve tali che la distanza tra loro è almeno di un infinitesimo del secondo ordine (si dice che le curve sono tagliate a primo ordine in tali punti). I punti aventi questa proprietà vengono chiamati fuochi e devono soddisfare le seguenti equazioni al primo ordine: r(u, v, s) = r(u + du, v + dv, s + ds). (1.80) Dalla (1.80) si ottiene: ru du + rv dv + tds = 0, (1.81) dove ru e rv sono le derivate parziali rispetto a u e v. La (1.81) implica che ru , rv e t sono complanari. Questo è equivalente all’annullarsi del prodotto misto dei tre vettori ru , rv e t : (ru ∧ rv ) · t = 0. (1.82) Facendo variare u e v in modo che assumano tutti i valori consentiti, i fuochi descrivono una superficie, rappresentata dall’equazione (1.82), detta superficie focale, o anche superficie caustica. Qualsiasi curva della congruenza è tangente alla superficie focale in ogni fuoco della curva. Il piano tangente in ogni punto della superficie focale viene chiamato piano focale. 2.5 Il principio di Fermat Il principio di Fermat -conosciuto anche come il principio del più breve percorso ottico o come principio di tempo minimo- afferma che la lunghezza ottica Z P2 n ds, (1.83) P1 di un raggio luminoso (cioè la traiettoria percorsa dalla luce) tra due punti qualsiasi P1 e P2 è più breve della lunghezza ottica di qualsiasi altra curva che unisce questi punti e che si trova in una 19 determinata zona regolare di esso. Per zona regolare si intende una zona che può essere rivestita da raggi tali che almeno un raggio passa attraverso ciascun punto di essa. Tale rivestimento, ad esempio, può essere formato dai raggi provenienti da una sorgente puntiforme P1 nel dominio attorno a P1 dove i raggi a causa di riflessione o rifrazione o per via della loro curvatura non si intersecano reciprocamente. Prima di dimostrare questo principio osserviamo che è possibile formulare il principio di Fermat in una forma più debole. Secondo questa formulazione il raggio effettivo si distingue dalle altre curve perchè l’integrale lungo tale curva ha un valore stazionario. Per trovare le curve che rendono stazionario l’integrale è necessario utlizzare il metodo generale del calcolo delle variazioni, che consente di ridurre il calcolo di tale integrale al calcolo delle equazioni differenziali di Eulero-Lagrange18 . Il principio di Fermat verrà dimostrato (dimostrazione riportata nel Capitolo 3 in [2]) mediante l’utilizzo dell’integrale invariante di Lagrange . Per questo motivo richiamiamo preliminarmente l’integrale invariante di Lagrange. Prendiamo nuovamente in considerazione l’integrale dell’equazione (1.72), preso su una qualsiasi superficie aperta. Tale equazione è: I nt · dr = 0. (1.84) L’integrale si estende lungo la curva chiusa C di contorno alla superficie (si veda Figura 1.9). Figura 1.9: La figura rappresenta la derivazione dell’integrale invariante di Lagrange in presenza di una superficie costituita da due mezzi omogenei aventi indici di rifrazioni differenti. La figura è stata presa dal [2]. L’equazione (1.84) è nota come integrale invariante di Lagrange e implica che l’integrale Z P2 nt · dr, (1.85) P1 18 Per ulteriori delucidazioni sulle equazioni di Eulero-Lagrange si veda [18]. 20 calcolato tra due punti qualsiasi P1 e P2 nel campo di integrazione, è indipendente dal cammino di integrazione. Per dimostrare il principio di Fermat, si prenda un fascio di raggi e si confronti il segmento P1 P2 del raggio effettivo C̄ con una curva arbitraria C che connette P1 con P2 (vedi Figura 1.10). Consideriamo due traiettorie del fascio (fronti d’onda), ortogonali e “vicine”, che intersecano il Figura 1.10: La figura rappresenta il principio di Fermat. La figura è stata presa dal [2]. raggio C in Q1 e Q2 e il raggio C̄ in Q̄1 e Q̄2 . Sia inoltre Q02 il punto di intersezione tra Q2 Q̄2 con il raggio C̄ 0 che passa attraverso Q1 . Applicando l’integrale invariante di Lagrange al triangolo Q1 Q2 Q02 , si ottiene: (nt · dr)Q1 Q2 + (nt · dr)Q2 Q02 − (nds)Q1 Q2 = 0. (1.86) L’ultimo addendo dell’equazione precedente si riduce a (nds)Q1 Q2 poichè, partendo da (nt · dr dr)Q1 Q02 , osservando la Figura 1.10 e ricordando che = t, si ha: ds (nt · dr)Q1 Q02 = (nt · dr)Q1 Q2 + (nt · dr)Q2 Q02 e poichè t è ortogonale a dr sul fronte d’onda, si ha: (nt · dr)Q2 Q02 = 0. Si ottiene (nt · dr)Q1 Q2 = (n|t||dr|)Q1 Q2 = (n|t|2 ds)Q1 Q2 , sapendo che t è un vettore unitario, si ottiene (nds)Q1 Q2 . Dalla definizione di prodotto scalare segue: (nt · dr)Q1 Q2 6 (nds)Q1 Q2 , 21 Dalla (1.54) e tenendo conto che Q1 ,Q02 e Q̄1 ,Q̄2 sono i punti corrispondenti sui due fronti d’onda, si ha: (n ds)Q1 Q02 = (n ds)Q¯1 Q¯2 . Sostituendo le ultime tre relazioni nella (1.86) si trova: (n ds)Q¯1 Q¯2 6 (n ds)Q1 Q2 (1.87) dalla relazione (1.87) si ottiene: Z Z n ds. n ds 6 (1.88) C C̄ Il segno di uguaglianza vale solo se la direzione di t e dr sono coincidenti su ogni punto di C, cioè se la curva di confronto è un raggio effettivo. Questo caso è escluso dall’ipotesi che passa al più un raggio in ogni punto della zona. Quindi la lunghezza ottica dei raggi è inferiore alla lunghezza ottica della curva di confronto, che è esattamente il principio di Fermat. I raggi di luce sono stati definiti come traiettorie ortogonali alle superfici d’onda S(x, y, z) = costante, S è una soluzione dell’equazione iconale (1.50). Questa è una via naturale per introdurre i raggi di luce quando le leggi dell’ottica vengono dedotte dalle equazioni di Maxwell. Storicamente, l’ottica geometrica è stata sviluppata come teoria Rdei raggi di luce definita in maniera differente, cioè come curve per le quali l’integrale di linea n ds ha un valore stazionario. Seguendo questa via, l’ottica geometrica si può sviluppare puramente lungo le linee del calcolo delle variazioni. 22 Capitolo 2 Problema inverso in tre dimensioni In questo capitolo si considera il seguente problema inverso in ottica geometrica: Data una famiglia di curve a due parametri -più precisamente una congruenza- costruire l’indice di rifrazione rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnata. Si risolverà questo problema sviluppando due procedure differenti: applicando il principio di Fermat e l’equazione iconale. In particolare, dalla prima di tali procedure, si otterrà un sistema di due equazioni alle derivate parziali lineari non omogenee del primo ordine (in cui l’unica incognita è la funzione che rappresenta l’indice di rifrazione n = n(x, y, z)). Se invece, si segue la seconda procedura, si perverrà a un sistema di due equazioni differenziali lineari omogenee del primo ordine la cui soluzione viene chiamata funzione iconale e rappresenta il fronte d’onda geometrico S(x, y, z). Usando l’equazione iconale (1.50) del Capitolo 1 si è quindi in grado di calcolare l’indice di rifrazione n = n(x, y, z). Conseguentemente si trovano tutte le possibili funzioni che rappresentano l’indice di rifrazione. Vengono in fine discussi quattro esempi in cui viene applicata la teoria sviluppata. 1 Introduzione al problema In ottica geometrica si considera trascurabile la lunghezza d’onda (λ → 0). Nell’approssimazione dell’ottica geometrica, le leggi dell’ottica, come già discusso nel Capitolo 1, possono essere formulate nel linguaggio della geometria, e l’energia può essere vista come trasportata lungo raggi di luce. Il mezzo più generale dove la luce si propaga, è tridimensionale, disomogeneo e non isotropo1 . In questa tesi focalizziamo però l’attenzione sulla propagazione della luce in un mezzo trasparente, che sia disomogeneo e isotropo. L’esempio tipico di un mezzo con queste proprietà è l’atmosfera 1 Per maggiori dettagli si consultino [1, 2, 3, 4]. 23 terrestre2 . Non verranno considerati mezzi assorbenti o non isotropi come metalli o cristalli. Supposto di aver fissato un riferimento cartesiano ortogonale e inerziale Oxyz, le proprietà ottiche di un mezzo tridimensionale generico sono caratterizzate dalla funzione scalare, n = n(r, λ), (2.1) che rappresenta l’indice di rifrazione. Si considereranno raggi di luce monocromatici con λ parametro della funzione n. Poichè in ottica geometrica λ → 0, λ verrà omessa nella nostra trattazione (nel senso che n = n(r)). Il nostro obiettivo, come già spiegato nell’introduzione, è quello di risolvere il seguente problema inverso3 : Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnate. Al tal fine abbiamo la necessità di richiamare alcune nozioni di geometria differenziale. Diremo che le due famiglie di curve assegnate in forma parametrica mediante le equazioni: (Γ) f (x, y, z) = c1 , g(x, y, z) = c2 , (2.2) costituiscono una congruenza (Γ)4 , se con esse si riempie una porzione di spazio in modo tale che ogni singola curva passi per ciascun punto (x0 , y0 , z0 ) della regione. Nell’equazione (2.2), c1 e c2 sono costanti lungo ciascuna curva fissata della famiglia, ma cambiano da curva a curva. Se esiste una famiglia di superfici della forma: S(x, y, z) = costante, (2.3) che taglia ognuna delle curve della congruenza ortogonalmente, la congruenza viene detta congruenza normale e verrà indicata con Γn , altrimenti la famiglia di curve viene detta congruenza inclinata (si veda anche quanto esposto nel Capitolo 1). Nell’ottica geometrica sono di interesse solo le congruenze normali di raggi, conosciute anche come sistemi ortogonali di raggi [9]. La famiglia di curve introdotta nell’equazione (2.2) rappresenta una congruenza normale Γn nello spazio se e solo se è soddisfatta l’equazione (cfr. con l’equazione (1.79) del Capitolo 1) t · rot t = 0. (2.4) Ci si riferirà alla condizione espressa nella (2.4) come la condizione di normalità della famiglia (Γ). Se ogni curva della congruenza è una linea retta, la congruenza è detta rettilinea e deve soddisfare la seguente condizione (cfr. con l’equazione (1.78) del Capitolo 1): rot t = 0, 2 (2.5) Per maggiori delucidazioni si consultino [2, 5, 6]. Il problema inverso si può trovare in [15, 16], è stato trattato in tre dimensioni con risultati parziali in [7] e trattato completamente con i risultati descritti in questo capitolo in [8]. 4 Per maggiori dettagli si veda [2]. 3 24 Come già discusso nel Capitolo 1, l’ottica geometrica si occupa di raggi di luce, che possono essere introdotti nei due seguenti modi: 1. Tramite il principio di Fermat: In un mezzo trasparente, i raggi lungo i quali la luce viaggia da ogni punto P1 ad ogni punto P2 , in una certa regione regolare del mezzo, sono dati da [1, 2, 3]: Z P2 n ds = 0. (2.6) δ P1 2. Tramite l’ottica ondulatoria, nella quale i raggi di luce vengono definiti come traiettorie ortogonali al fronte d’onda geometrico S(x, y, z) = costante. Quindi un fascio di raggi, nello spazio tridimensionale, deve essere una congruenza normale e i raggi di luce si devono considerare come curve orientate, la cui direzione coincide, ovunque, con la direzione della media temporale del vettore di Poynting (vedi Capitolo 1). Osservazione: Dal principio di Fermat, non è evidente che, se si considera una famiglia di raggi, questa famiglia deve essere una conguenza normale. Perciò uno dei risultati più interessanti che stabiliremo consisterà nel mostrare che il principio di Fermat implica questa proprietà. Lo scopo di questo capitolo, come già detto nella premessa, è duplice e consiste nel risolvere il problema inverso sia utilizzando il principio di Fermat (che di solito non viene utilizzato a questo fine) che l’equazione iconale. In entrambi i casi si perverrà ad un opportuno sistema di PDEs5 , di cui verrà studiata l’integrabilità e si confronteranno i risultati ottenuti mediante le due procedure. Il sistema ottenuto applicando l’equazione iconale, rispetto a quello ottenuto utilizzando il principio di Fermat, risulta più semplice in quanto è omogeneo. 1.1 Nozioni geometriche Consideriamo la congruenza Γ (Γ) f (x, y, z) = c1 , g(x, y, z) = c2 , (2.7) dove c1 e c2 sono due parametri indipendenti. Il vettore tangente unitario t alla generica curva della congruenza (2.7) può essere espresso in termini delle funzioni f (x, y, z) e g(x, y, z) della famiglia di curve date dall’equazione (2.2). Per tale scopo, si introducono i gradienti grad f = (fx , fy , fz ) e grad g = (gx , gy , gz ) che sono ortogonali, rispettivamente, alle superfici f (x, y, z) = c1 e g(x, y, z) = c2 , per cui il prodotto vettoriale δ = grad f ∧ grad g, (2.8) 5 Con tale acronimo vengono indicate le equazioni alle derivate parziali, dall’inglese “Partial Differential Equation”. 25 è tangente in un punto alla generica curva della famiglia (2.2). Se δ1 , δ2 , δ3 sono le compontenti cartesiane di questo vettore tangente, si ha: δ3 δ2 (2.9) δ = δ1 i + δ2 j + δ3 k = δ1 i + j + k , δ1 δ1 dove i, j, k sono i vettori unitari corrispondenti agli assi Ox, Oy, Oz rispettivamente, con ∂(f, g) fy fz δ1 = = = fy gz − fz gy , ∂(y, z) gy gz ∂(f, g) fz fx = δ2 = = fz gx − fx gz , ∂(z, x) gz gx (2.10) ∂(f, g) fx fy = δ3 = = fx gy − fy gx . ∂(x, y) gx gy Possiamo però considerare un altro vettore tangente: ε= δ2 δ3 δ = i + j + k, δ1 δ1 δ1 (2.11) le cui componenti sono {1, α, β}. Dalla (2.10), discende immediatamente che le funzioni α(x, y, z) e β(x, y, z) possono essere scritte come: α(x, y, z) = δ2 , δ1 β(x, y, z) = δ3 . δ1 (2.12) Parametrizzando ogni curva della famiglia (2.2), in funzione di x (questo significa che l’equazione vettoriale parametrica di queste curve è r = xi + y(x)j + z(x)k) e differenziando le equazioni (2.2) rispetto ad x si ottiene: fx + fy y 0 + fz z 0 = 0, gx + gy y 0 + gz z 0 = 0, (2.13) dove l’apice denota la derivata rispetto a x. Utilizzando le equazioni (2.12) e (2.13) si ottiene: y 0 = α(x, y, z), z 0 = β(x, y, z). (2.14) Ci si riferirà ad α e β come funzioni di “inclinazione”della famiglia (2.2). Date le funzioni α(x, y, z) e β(x, y, z), la soluzione generale del sistema costituito dalle equazioni ODEs6 (2.14) nelle funzioni incognite y = y(x) e z = z(x), introduce due costanti arbitrarie c1 6 Con tale acronimo vengono indicate le equazioni differenziali ordinarie dall’inglese “Ordinary Differential Equation”. 26 e c2 e la soluzione generale è data dai due parametri dell’equazione (2.2). Si può esprimere il vettore tangente t nel seguente modo: t= ε ε = 1 , 2 |ε| (1 + α + β 2 ) 2 (2.15) quindi la condizione di normalità espressa dalla (2.4) si può scrivere come: ε · rotε = 0, αβx − βαx + αz − βy = 0. oppure (2.16) Si osserva che l’ipotesi di regolarità posta per le curve della congruenza della (2.2) implica che almeno una delle funzioni δ1 , δ2 , δ3 sia diversa dallo zero. È immediato verificare che le seguenti proprietà risultano valide: 1. Se si definisce il vettore tangente come τ = grad g ∧ grad f , si ha che τ = −δ e i rapporti (2.12) rimangono inalterati. 2. Supponiamo di rappresentare la famiglia a due parametri dell’equazione (2.2) mediante le ∂(F, G) 6= 0. Se si calcola la terna (δ1 , δ2 , δ3 ) equazioni F (f, g) = c1 e G(f, g) = c2 con ∂(f, g) utilizzando l’equazione (2.10) e tenendo conto di quanto trovato nella (2.12), si nota che le funzioni α(x, y, z) e β(x, y, z) rimangono invariate. Quindi sebbene la descrizione della data famiglia di curve non sia unica, la sua rappresentazione tramite la coppia {α, β} risulta unica. 3. La trasformazione x → x, y → z, z → y implica che δ1 → −δ1 , δ2 → −δ3 , δ3 → −δ2 . 2 Primo metodo: il principio di Fermat In questa sezione risolveremo il problema inverso presentato nella sezione precedente utilizzando il principio di Fermat. Il principio di Fermat afferma (vedi [2]) che: Z P2 δ n ds = 0. (2.17) P1 L’elemento di linea ds, in coordinate cartesiane ortogonali è: p ds = dx2 + dy 2 + dz 2 . (2.18) Se si parametrizza ogni curva della famiglia (2.2) con x, l’equazione (2.17) diventa: Z x2 p δ n(x, y, x) 1 + y 02 + z 02 dx = 0, (2.19) x1 27 dove con l’apice si sono indicate le derivate prime effettuate rispetto ad x. È ben noto che l’equazione variazionale (2.17) può essere convertita nelle corrispondenti equazioni di EuleroLagrange. In questo caso si tratta di tre ODEs, ma a causa della parametrizzazione la prima equazione risulta un’identità7 . Le due equazioni di Eulero-Lagrange sono: " # 0 p d ny 02 02 ny 1 + y + z − dx p1 + y 02 + z 02 = 0, " # (2.20) 0 p d nz 02 02 nz 1 + y + z − dx p1 + y 02 + z 02 = 0. Al meglio delle nostre conoscenze, il sistema (2.20) è stato usato solo per risolvere il problema diretto dell’ottica geometrica che può essere formulato come segue: Dato l’indice di rifrazione di un mezzo costruire le traiettorie seguite dalla luce in tale mezzo. Il sistema dato dalle (2.20) può essere visto come un sistema di due equazioni differenziali ordinarie non lineari del secondo ordine, nelle incognite y(x) e z(x), dove l’indice di rifrazione n(x, y, z) è una funzione data. È chiaro che, specificando le condizioni iniziali (y0 , z0 , y00 , z00 ), calcolate in x = x0 , si ottiene la traiettoria data dalle equazioni y(x), z(x) (ovvero un raggio di luce). Mostriamo come sia possibile trasformare il sistema (2.20), in modo da renderlo adatto a trattare il problema inverso che, come riportato nella Sezione 1, consiste nel trovare l’indice di rifrazione n(x, y, z) compatibile con la congruenza Γ data dall’equazione (2.2). A questo fine, si procede come segue: tenendo conto dell’equazione (2.14) e che il vettore tangente ε = {1, α, β} ad un p 2 raggio generico ha lunghezza |ε| = 1 + α + β 2 , si ottiene: y 00 = ε · grad α, z 00 = ε · grad β. Semplici calcoli consentono di riscrivere il sistema (2.20) come segue: α(αα0 + ββ0 ) 2 − α0 n, αnx − (1 + β )ny + αβnz = 2 2 1+α +β β(αα + ββ ) 0 0 2 − β0 n, βnx + αβny − (1 + α )nz = 1 + α2 + β 2 (2.21) (2.22) dove si è posto: α0 = ε · grad α, β0 = ε · grad β. (2.23) Effettuando un’opportuna combinazione lineare tra le equazioni del sistema (2.22) si perviene al seguente sistema: ( αnx − ny = Ω1 n, (2.24) βnx − nz = Ω2 n, 7 Per maggiori dettagli si consultino [1, 2]. 28 dove Ω1 = − ε · grad α , 1 + α2 + β 2 Ω2 = − ε · grad β , 1 + α2 + β 2 (2.25) e α, β sono funzioni assegnate delle tre variabili x, y, z. Il precedente sistema (2.24) di due PDEs lineari del primo ordine nell’unica funzione incognita n(x, y, z) collega direttamente l’indice di rifrazione con la famiglia di raggi di luce compatibile a tale funzione. Il sistema (2.24) è detto il sistema della distribuzione dell’indice di rifrazione. Il sistema (2.24) sintetizza la seguente Proposizione 2.1 In un mezzo tridimensionale continuo, disomogeneo e isotropo, tutte le distribuzioni dell’indice di rifrazione n(x, y, z) -che permettono la creazione come raggi di luce della data congruenza normale- devono soddisfare il sistema (2.24). Osservazione 1: Si può verificare che il sistema (2.24) può anche essere derivato dalle ODEs equivalenti all’equazione vettoriale (1.58) del Capitolo 1, ossia alle equazioni differenziali dei raggi di luce. Infatti, scegliendo l’ascissa x come parametro di ogni curva della famiglia (2.2), si può immediatamente verificare che la prima equazione scalare del sistema di ODEs diventa un’identità, mentre le altre due equazioni coincidono con le equazioni del sistema (2.24). 3 Risolubilità del sistema della distribuzione dell’indice di rifrazione Per studiare la risolubilità del sistema (2.24), è conveniente introdurre la nuova funzione: N (x, y, z) = log n(x, y, z), cosı̀ che il sistema (2.24) può essere riscritto come: ( F ≡ αNx − Ny − Ω1 = 0, G ≡ βNx − Nz − Ω2 = 0. (2.26) (2.27) Le (2.27) rappresentano un sistema di due PDEs indipendenti, lineari, non omogenee del primo ordine nell’unica funzione incognita N (x, y, z). I coefficienti α, β, Ω1 , Ω2 che compaiono nel sistema (2.27) sono funzioni note delle variabili x, y, z. Osservazione 3: Le due equazioni sono indipendenti perchè, se si considera il sistema (2.24) come unsistema algebrico lineare in tre incognite Nx , Ny , Nz , si verifica immediatamente che la α −1 0 −1 matrice ha rango due. β 0 −1 −1 29 Ponendo: x = x1 , y = x2 , z = x3 , Nx = p1 , il sistema (2.27) assume la forma: ( F (x1 , x2 , x3 , p1 , p2 , p3 ) = 0, G(x1 , x2 , x3 , p1 , p2 , p3 ) = 0. Ny = p2 , Nz = p3 , (2.28) Per i sistemi della forma (2.28) si può introdurre la Parentesi di Poisson tra le due funzioni F e G come segue: 3 X ∂F ∂G ∂F ∂G − . (2.29) [F, G] := ∂pi ∂xi ∂xi ∂pi i=1 A questo punto diventa necessario richiamare alcune proprietà utili nella risoluzione di PDEs lineari del primo ordine in un’unica funzione incognita. Molti approfondimenti su questo argomento possono essere trovati in [10], ma per comodità, è stata inserita un’appendice su tale argomento. Si focalizza l’attenzione al caso in cui il sistema assume la forma (2.28), cioè contenga m = 2 equazioni indipendenti in una funzione incognita N (x1 , x2 , x3 ) dipendente dalle n = 3 variabili xi (i = 1, 2, 3). Definizione 1 Il sistema di PDEs nella forma (2.28) è detto completo se si verifica uno dei seguenti due casi: a) la parentesi di Poisson [F, G] è una combinazione lineare delle funzioni F e G che compaiono a primo membro delle (2.28), cioè: [F, G] = λ1 F + λ2 G, dove λi (i = 1, 2) sono funzioni solo di x1 , x2 , x3 ; b) la parentesi di Poisson è identicamente nulla: [F, G] = 0. Se si verifica il caso b) il sistema viene chiamato sistema Jacobiano. Si noti che il concetto di sistema Jacobiano è un caso particolare del concetto di sistema completo. È inoltre interessante osservare che è sempre possibile trasformare un sistema completo in un sistema Jacobiano, ciò si può ottenere non in un unico modo (si veda l’Appendice A per maggiori dettagli). Come dettagliatamente discusso nell’Appendice A, le condizioni di risolubilità del sistema (2.28) sono descritte dal seguente 30 Teorema 2.2 Ogni soluzione del sistema di PDEs (2.28) -nell’unica funzione incognita N (x1 , x2 , x3 )deve anche soddisfare la seguente PDEs: [F, G] = 0. (2.30) Si possono presentare i seguenti due casi: 1. Se l’equazione [F, G] = 0 è una “nuova”PDE, cioè non è combinazione lineare delle due PDEs del sistema (2.28), questo sistema ammette solo la soluzione banale N (x, y, z) = costante. Questo giustifica il fatto che, in letteratura, ci si riferisce a questa situazione dicendo che il sistema (2.28) è incompatibile. 2. Se l’equazione della parentesi di Poisson (2.30) è invece una combinazione lineare delle due PDEs del sistema (2.28) o un’identità, il sistema (2.28) ammette soluzioni non banali. In questo caso il sistema viene detto compatibile. Siamo ora in grado di dimostrare la seguente notevole Proposizione 2.3 Il sistema di PDEs (2.27) -proveniente dal principio di Fermat- ammette soluzioni non banali (cioè esistono funzioni che rappresentano l’indice di rifrazione n(x, y, z)) se la data famiglia di curve definita nella (2.2) è una congruenza normale, ovvero se la condizione di normalità αβx − βαx + αz − βy = 0, è soddisfatta. Dimostrazione. Calcoli diretti consentono di scrivere la parentesi di Poisson delle due funzioni F e G nel seguente modo: [F, G] = (αβx − βαx + αz − βy )Nx − (αΩ2x − βΩ1x + Ω1z − Ω2y ). (2.31) Sapendo che [F, G] = 0 si ha: (αβx − βαx + αz − βy )Nx = αΩ2x − βΩ1x + Ω1z − Ω2y . (2.32) Possiamo considerare due casi distinti: 1. Se la data famiglia di curve è conguenza normale, allora, la condizione di normalità espressa nella (2.16) è soddisfatta e il primo membro della (2.32) si annulla. Dimostriamo che, in questo caso, anche il secondo membro è identicamente nullo, cioè: αΩ2x − βΩ1x + Ω1z − Ω2y ≡ 0, (2.33) e quindi la parentesi di Poisson [F, G] = 0 è un’identità. Il sistema (2.27) è quindi un sistema Jacobiano che, per il Teorema 2.2, ammette soluzioni non banali. 31 Rimane da dimostrare che l’equazione (2.33) è effettivamente un’identità. Per raggiungere questo obiettivo, differenziando l’equazione (2.16) rispetto a x, y, z, si ottengono, rispettivamente, le seguenti relazioni: −αβxx + βαxx − αxz + βxy = 0, αβxy + αy βx − αx βy − βαxy + αyz − βyy = 0, αβxz + αx βx − αx βz − βαxz + αzz − βyz = 0. (2.34) Inoltre, dall’equazione (2.25) si ottiene: −(βxx + αx βy + αβxy + βx βz + ββxz )(1 + α2 + β 2 ) + (βx + αβy + ββz )(2ααx + 2ββx ) , (1 + α2 + β 2 )2 −(αxx + αx αy + ααxy + βx αz + βαxz )(1 + α2 + β 2 ) + (αx + ααy + βαz )(2ααx + 2ββx ) = , (1 + α2 + β 2 )2 −(αxz + αz αy + ααyz + βz αz + βαzz )(1 + α2 + β 2 ) + (αx + ααy + βαz )(2ααz + 2ββz ) = , (1 + α2 + β 2 )2 −(βxy + αy βy + αβyy + βy βz + ββyz )(1 + α2 + β 2 ) + (βx + αβy + ββz )(2ααy + 2ββy ) . = (1 + α2 + β 2 )2 (2.35) Ω2x = Ω1x Ω1z Ω2y Sostituendo le espressioni (2.35) nel primo membro dell’equazione (2.33) e tenendo conto delle relazioni (2.34) e della condizione di normalità data dalla (2.16), si osserva che tutte le derivate del secondo ordine nell’espressione (2.33) si annullano, e solo quelle del primo ordine sono presenti. Esprimendo dalla (2.16) βy in termini di α, β, αx , αz , βx si ottiene che il primo membro della (2.33) si annulla. 2. Se la famiglia di curve, è invece una congruenza semplice, l’equazione (2.32) non è un’identità, e, in accordo al Teorema 2.2, essa va aggiunta al sistema di PDEs. Quindi questo sistema diventa un sistema completo di tre equazioni indipendenti in tre variabili, il quale ammette solo la soluzione banale. Tenendo conto della Proposizione 2.3 e del Teorema 2.2, si può affermare che si è fornita una dimostrazione analitica del fatto che la famiglia di raggi, definita dal principio di Fermat, è una congruenza normale. È importante sottolineare che non si può derivare questo fatto direttamente dall’enunciato del principio di Fermat. Rimane cosı̀ provato un altro importante risultato espresso dalla seguente Proposizione 2.4 Il sistema di due PDEs (2.24), che risulta equivalente al sistema (2.27), in un’unica funzione incognita n(x, y, z) derivata dal principio di Fermat è compatibile (cioè ammette soluzioni non banali) se la famiglia di curve a due parametri nell’equazione (2.2) è una congruenza normale. 32 Osservazione 4: Rimane quindi provato che il principio di Fermat può essere usato per risolvere il problema inverso formulato nella Sezione 1. Ossia, si è trovato che tutti i profili dell’indice di rifrazione, compatibili con la data famiglia di curve (2.2), sono dati da soluzioni non banali del sistema (2.27). Ma, come conseguenza della Proposizione 2.4, il sistema (2.27) ammette soluzioni non banali solo se la condizione di normalità αβx − βαx + αz − βy = 0 è soddisfatta. Questo fatto risulta importante in quanto permette di dichiarare che la creazione della data congruenza (come famiglia di raggi di luce monocromatica) è possibile solo se tale conguenza è una congruenza normale, cioè solo se esiste una famiglia di superfici, che taglia ogni curva della congruenza ortogonalmente. In altre parole, dal principio di Fermat si può dedurre l’esistenza dei fronti d’onda, che possono essere considerati come superfici che tagliano ortogonalmente la data congruenza normale. È interessante osservare che, nella teoria elettromagnetica, l’approccio è opposto: dai fronti d’onda, si definiscono i raggi di luce come traiettorie ortogonali ai fronti d’onda stessi e come conseguenza, si ottiene la condizione di normalità. Osservazione 5: Il fatto che l’ottica geometrica può essere basata sul principio di Fermat è ben noto. Tuttavia, tenendo conto delle considerazioni fatte nell’Osservazione 4, si vuole sottolineare che si può derivare l’intera ottica geometrica solo sulle basi della geometria delle congruenze normali come necessaria conseguenza del principio di Fermat senza alcun riferimento alla teoria elettromagnetica dell’ottica ondulatoria. Infatti, si può partire con una congruenza normale Γn e definire i fronti d’onda geometrici come famiglia di superfici mobili ortogonali ai raggi di Γn . L’equazione è φ(x, y, z, t) = 0, dove la variabile t rappresenta il tempo. Dalla teoria delle superfici, è nota [2], l’espressione della velocità del fronte d’onda: ∂φ 1 ν, (2.36) v=− |grad φ| ∂t dove ν è il vettore unitario ortogonale ad un generico punto della superficie. Questo vettore grad φ unitario è definito come ν = e quindi coincide con il vettore unitario tangente t a |grad φ| un raggio di luce (t ≡ ν). Senza perdita di generalità, si può assumere che le equazioni delle superfici sono date nella forma φ(x, y, z, t) = S(x, y, z) − ct, dove c è la velocità della luce nel vuoto [1]. In questo caso, la velocità delle onde può essere espressa come segue: c t. (2.37) v=− |grad S| Possiamo ora ricavare l’equazione iconale, in un modo molto semplice, attraverso l’uso della sola geometria delle superfici mobili. Infatti, definendo l’indice di rifrazione di un mezzo isotropo tramite il rapporto della velocità della luce nel vuoto e il modulo della velocità dell’onda nel c mezzo (vedi Capitolo 1), cioè n(x, y, z) = , si ottiene immediatamente, dall’equazione v(x, y, z) (2.37): 2 2 2 ∂S ∂S ∂S 2 |grad S| ≡ + + = n2 , (2.38) ∂x ∂y ∂z 33 che è l’equazione iconale (cfr. (1.50) del Capitolo 1). Si noti come l’equazione (2.38) implichi che: |grad S| = n. (2.39) Inoltre, dalla geometria differenziale, è ben noto che sussiste la seguente identità vettoriale: d grad S = grad|grad S|. ds (2.40) Questa identità è essenzialmente l’equazione vettoriale dei raggi di luce. Infatti, tenendo conto della (2.39), della relazione grad S = |grad S|s e della (2.40) si ottiene: d (ns) = grad n. ds (2.41) In conclusione, usando solo il principio di Fermat e considerazioni geometriche appropriate, sono state ottenute le equazioni fondamentali dell’ottica geometrica: l’equazione iconale e l’equazione dei raggi di luce (cfr. con equazioni (1.50) e (1.58) del Capitolo 1). 4 Secondo metodo: l’equazione iconale La propagazione della luce può anche essere spiegata nel contesto della teoria delle onde ed è essenzialmente basata sull’equazione iconale: ∂S ∂x 2 + ∂S ∂y 2 + ∂S ∂z 2 = n2 . (2.42) Si vuole risolvere il problema inverso formulato nella Sezione 1 mediante l’utilizzo dell’equazione (2.42). Per tale scopo, tenendo conto che tutti i raggi sono ortogonali a questa famiglia, dobbiamo determinare l’equazione della famiglia dei fronti d’onda: S(x, y, z) = costante. (2.43) Perciò, dopo aver assegnato una congruenza normale di curve Γn , in un mezzo tridimensionale, isotropo e disomogeneo, in modo tale che la condizione di normalità (2.16) sia soddisfatta, si devono trovare tutte le possibili distribuzioni della funzione n(x, y, z), che consente la creazione della data congruenza normale come famiglia di raggi di luce monocromatici. Tenendo conto che la data famiglia di curve a due parametri deve essere una famiglia ortogonale di raggi, si conclude che i due vettori, grad S e ε, devono essere paralleli, e tale condizione comporta: Sx Sy Sz = = . 1 α β 34 (2.44) L’equazione (2.44) contiene due PDEs lineari e omogenee del primo ordine nell’unica funzione incognita S(x, y, z) che si possono scrivere come: ( F1 ≡ αSx − Sy = 0, (2.45) G1 ≡ βSx − Sz = 0. Si può discutere l’integrabilità di questo sistema nello stesso modo in cui si è discussa l’integrabilità del sistema (2.27). In particolare, vale il seguente importante risultato: Proposizione 2.5 Il sistema dato dalla (2.45) è un sistema Jacobiano. Dimostrazione. Se si calcola la parentesi di Poisson [F1 , G1 ], si ottiene: ∂F1 ∂G1 ∂F1 ∂G1 ∂F1 ∂G1 ∂F1 ∂G1 − + − [F1 , G1 ] = ∂Sx ∂x ∂x ∂Sx ∂Sy ∂y ∂y ∂Sy ∂F1 ∂G1 ∂F1 ∂G1 − = (αβx − βαx + αz − βy )Sx . + ∂Sz ∂z ∂z ∂Sz (2.46) Poichè nella teoria ondulatoria la condizione di normalità αβx − βαx + αz − βy = 0 è soddisfatta, dall’equazione (2.46) si ottiene [F1 , G1 ] ≡ 0 e questo, tenendo conto del Teorema 2.2, completa la dimostrazione. Si ottiene quindi il seguente risultato: Proposizione 2.6 Data una congruenza normale Γn all’interno di un mezzo tridimensionale, trasparente, continuo, disomogeneo e isotropo, la funzione iconale S(x, y, z) che definisce la famiglia di fronti d’onda S(x, y, z) = costante, è la soluzione del seguente sistema di due PDEs lineari e omogenee del primo ordine: ( α(x, y, z)Sx − Sy = 0, β(x, y, z)Sx − Sz = 0. (2.47) Tutte le distibuzioni indici di rifrazione compatibili che permettono la crezione, come raggi di luce, della congruenza normale data, sono dati dalla formula: q (2.48) n(x, y, z) = Sx2 + Sy2 + Sz2 . Osservazione 6: Dalla teoria delle PDEs è risaputo che la soluzione generale di un sistema di PDEs, come il sistema (2.47), dipende da una funzione arbitraria. Perciò se S(x, y, z) è una particolare funzione che soddisfa il sistema di PDEs (2.47), la soluzione generale è Φ(S(x, y, z)), 35 dove Φ(S) è una funzione arbitraria di S. Per questa ragione, i fronti d’onda possono essere rappresentati dall’equazione S(x, y, z) = costante, cosı̀ come dall’equazione Φ(S(x, y, z)) = costante. Ma, globalmente, questi fronti d’onda ammettono la stessa traiettoria ortogonale (la congruenza normale), che è la stessa famiglia di raggi di luce generata dall’indice p 2di rifrazione p 2 2 2 n(x, y, z) = Sx + Sy + Sz , cosı̀ come dall’indice di rifrazione n(x, y, z) = ΦS Sx + Sy2 + Sz2 , dove ΦS è la derivata della funzione arbitraria Φ(S). Come conseguenza, per costruire un mezzo che ammetta la data congruenza normale di curve Γn come raggi di luce, la scelta più naturale per la funzione ΦS è quella di considerare ΦS = 1, (e questo implica che Φ(S) ≡ S). Ovviamente, se si impongono alcune condizioni al contorno sul mezzo o alcuni vincoli sull’espressione analitica dell’indice di rifrazione, si determina univocamente la funzione Φ. Osservazione 7: Si può concludere che il problema inverso dell’ottica geometrica, formulato nella Sezione 1, può essere risolto mediante il principio di Fermat o mediante l’equazione iconale. L’uso del principio di Fermat conduce ad un sistema di due PDEs lineari non omogenee del primo ordine (il sistema (2.27)) direttamente connesso alla funzione indice di rifrazione mentre l’uso dell’equazione iconale conduce ad un sistema di due PDEs lineri del primo ordine e omogenee, direttamente connesse ai fronti d’onda. La teoria delle onde conduce a un sistema di PDEs “più semplice”rispetto al sistema di PDEs ottenuto seguendo l’approccio corpuscolare. La teoria delle onde richiede che la famiglia di raggi costituisca una congruenza normale. Applicando il principio di Fermat, questa informazione non è necessaria, in quanto viene automaticamente soddisfatta se si vuole che il sistema (2.27) ammetta soluzioni non banali. Naturalmente, le due teorie devono condurre ai medesimi risultati e quindi è possibile validare i risultati ottenuti con una di esse usando quelli prodotti dall’altra. 5 Esempi In questa sezione verranno esaminati quattro esempi, che vengono studiati tramite il metodo basato sull’equazione iconale. Questo approccio richiede di trovare la soluzione del sistema dato dalla (2.47). La procedura, che permette di risolvere il sistema di PDEs, verrà dettagliatamente spiegata nell’Appendice A. Questa procedura è basata sui due passaggi seguenti: 1. Si risolve la prima equazione del sistema (2.47) trasformandola nel seguente sistema di ODEs: dy dz dS dx = = = . (2.49) α(x, y, z) −1 0 0 In tutti gli esempi di questa sezione, si adotta l’utile notazione usata nell’equazione (2.49) dS dz dove appare zero al denominatore di due frazioni e . Questa convenzione sta a 0 0 significare che il corrispondente numeratore è nullo, cioè che, dS = 0 e dz = 0, e quindi S = c1 e z = c2 , dove c1 , c2 sono delle costanti arbitrarie. Questa notazione la si trova 36 in [10, 11, 12, 13, 14] ed è generalmente accettata dai matematici che lavorano nel campo delle PDEs. 2. Si impone che la soluzione ottenuta nel primo step soddisfi anche la seconda equazione del sistema (2.47). In questo modo, si trova l’equazione della famiglia dei fronti d’onda data dall’equazione (2.43), e applicando l’equazione (2.48), si ottengono le funzioni distribuzione dell’indice di rifrazione compatibili con la congruenza normale data. 5.1 Esempio 1 Si consideri in uno spazio tridimensionale, la seguente famiglia di curve a due parametri (intersezione di due famiglie di cilindri iperbolici rappresentati in Figura 2.1): f (x, y, z) ≡ xy = c1 , g(x, y, z) ≡ xz = c2 . (2.50) Le funzioni di “inclinazione”corrispondenti al sistema (2.50) sono date da: z β=− . x y α=− , x (2.51) È facile verificare che la famiglia di curve date da (2.50) soddisfa l’equazione (2.16) e rappresenta quindi una congruenza normale. Come conseguenza del Teorema 2.2, il sistema (2.47) ammette soluzioni non banali. Tale sistema può essere esplicitamente scritto come: ( ySx + xSy = 0, (2.52) zSx + xSz = 0. La prima equazione del sistema è equivalente alle seguenti ODEs: dy dz dS dx = = = . y x 0 0 (2.53) Dal precedente sistema di ODEs, si ottiene: S = c1 , z = c2 , dx = dy , y x (2.54) l’ultima equazione del sistema precendente risulta essere un’equazione differenziale a variabili 1 1 separabili la cui soluzione è x2 = y 2 + k. 2 2 37 Figura 2.1: Nella prima riga si è riportata la rappresentazione della famiglia di curve espressa nell’equazione (2.50) con la scelta di c1 = 3, c2 = 2 , nella seconda riga si è riportata la rappresentazione di tale famiglia con la scelta di c1 = −6, c2 = −5. La figura è stata creata con Mathematica. Quindi, la soluzione del sistema (2.53) è data da: S = c 1 , z = c2 , 2 x − y 2 = c3 , (2.55) dove c1 , c2 , c3 sono costanti arbitrarie. Quindi la soluzione generale della prima PDEs del sistema (2.52) è dato da S(x, y, z) = Φ(z, x2 − y 2 ) = c1 , (2.56) essendo Φ una funzione arbitraria dei suoi argomenti. Introducendo la nuova variabile u = x2 − y 2 , il primo membro della (2.56) si può vedere come 38 funzione delle due variabili z e u e si può scrivere come: S(x, y, z) = Φ(z, u) = c1 . (2.57) È facile verificare che l’equazione (2.57), soddisfa la prima equazione del sistema (2.52). Occorre ora imporre che la funzione Φ(z, u), data dalla (2.57), soddisfi la seconda equazione del sistema (2.53). Imponendo questa condizione, si ottiene la seguente PDE: 2zΦu + Φz = 0, (2.58) che è equivalente al seguente sistema di ODEs: dz dΦ du = = . 2z 1 0 (2.59) du = dz è un’equazione differenziale a variabili separabili che ammette il seguente 2z integrale generale z 2 − u = cost. Si trova pertanto, tenendo conto che u = x2 − y 2 , la seguente soluzione delle (2.58): ( Φ = k1 , (2.60) x2 − y 2 − z 2 = k 2 , L’equazione dove k1 e k2 sono costanti arbitrarie. Se si pone v = x2 − y 2 − z 2 = k2 , si può verificare come S(x, y, z) = Φ(v) = Φ(x2 − y 2 − z 2 ), (2.61) sia la soluzione generale del sistema di PDEs (2.52). La famiglia di fronti d’onda, che taglia ortogonalmente le curve della data congruenza normale (2.50), assume la seguente forma: S(x, y, z) = Φ(x2 − y 2 − z 2 ) = costante. (2.62) Tenendo conto delle equazioni (2.62) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza normale (2.50), sono date dalla formula: n(x, y, z) = 2Φv r, (2.63) p dove Φv è la derivata della funzione arbitraria Φ(v) e r = x2 + y 2 + z 2 . Naturalmente la più semplice soluzione si ottiene scegliendo Φv = 1 (vedi Osservazione 6 della sezione precedente). Quindi la famiglia di fronti d’onda è data da (si veda la Figura 2.2): S(x, y, z) = x2 − y 2 − z 2 = k, (2.64) dove k è una costante, e conseguentemente: n(x, y, z) = 2 p x2 + y 2 + z 2 = 2r. Il mezzo presenta quindi una simmetria radiale. 39 (2.65) Figura 2.2: La figura rappresenta i tre fronti d’onda ottenuti ponendo k = −5, k = 0, k = 5, nella (2.64) e alcune curve della congruenza normale (2.50). La figura è stata creata con Mathematica. 5.2 Esempio 2 Si consideri nello spazio tridimensionale la famiglia di curve a due parametri, rappresentata in Figura 2.3: x−y f (x, y, z) ≡ = c1 , g(x, y, z) ≡ (x − y)2 (x + y + z) = c2 , (2.66) z−x le cui funzioni di “inclinazione”(cfr. con equazioni (2.10) e (2.12)) sono: x+y x+z , β= . (2.67) α= y+z y+z Poichè la famiglia di curve considerata in questo esempio soddisfa la condizione di normalià dell’equazione (2.16), costituisce una congruenza normale. Facili calcoli mostrano che il sistema (2.47) può essere scritto, per questo esempio, come: ( (x + z)Sx − (y + z)Sy = 0, (2.68) (x + y)Sx − (y + z)Sz = 0. Il Teorema 2.2 garantisce che il sistema dato dalla (2.68) abbia soluzioni non banali. Per trovare la soluzione generale di tale sistema, si osserva che la prima equazione del sistema (2.68) è equivalente al seguente sistema di ODEs: dy dz dS dx = = = . x+z −(y + z) 0 0 Dal precedente sistema di ODEs, si ottiene: S = c1 , z = c2 , dy + y = − c2 , dx x + c2 x + c2 40 (2.69) (2.70) Figura 2.3: Nella prima riga si è riportata la rappresentazione della famiglia di curve espressa nell’equazione (2.66) con la scelta di c1 = −1, c2 = −5, nella seconda riga si è riportata la rappresentazione di tale famiglia con la scelta di c1 = 1, c2 = 6. La figura è stata creata con Mathematica. dove c1 ,c2 sono costanti arbitrarie. La terza equazione del sistema (2.70) è una equazione differenziale lineare del primo ordine il cui integrale generale è: y= c3 − c2 x . x + c2 (2.71) Risolvendo l’equazione (2.71) rispetto a c3 e tenendo conto che c2 = z, si ottiene: xy + yz + xz = c3 . (2.72) Si può immediatamente verificare che la soluzione generale della prima equazione del sistema (2.68) è: S(x, y, z) = Φ(z, xy + yz + xz) = c1 , (2.73) 41 essendo Φ una funzione arbitraria. Ponendo u = xy + yz + xz, si può scrvere l’equazione (2.73) nella forma: S(x, y, z) = Φ(z, u), (2.74) è semplice verificare che la funzione Φ(z, u) soddisfa la prima equazione del sistema (2.68). Occorre ora imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.68). Dopo semplici calcoli si ottiene Φz = 0 e quindi la soluzione generale del sistema (2.68) è data da: S(x, y, z) = Φ(xy + yz + xz). (2.75) La famiglia dei fronti d’onda, che taglia ortogonalmente le curve della congruenza normale (2.66), (si veda la Figura 2.4), assume la seguente forma: S(x, y, z) = Φ(xy + yz + xz) = k1 . (2.76) Tenendo conto delle equazioni (2.76) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza normale (2.66), sono date dalla formula: p (2.77) n(x, y, z) = Φu (x + y)2 + (x + z)2 + (y + z)2 . Ovviamente, la soluzione più semplice si ottiene scegliendo Φu = 1 nell’equazione (2.77). Figura 2.4: La figura rappresenta i tre fronti d’onda ottenuti scegliendo Φ = 1 ponendo k1 = −5, k1 = 0, k1 = 5 nell’equazione (2.76), e alcune curve della congruenza normale (2.66). La figura è stata creata con Mathematica. 5.3 Esempio 3 Si consideri nello spazio tridimensionale la famiglia di curve a due parametri rappresentate in Figura 2.5: f (x, y, z) ≡ x2 + y 2 + z 2 = c1 , y g(x, y, z) ≡ 42 x2 + y 2 + z 2 = c2 . z (2.78) Le funzioni di “inclinazione”corrispondenti alle equazioni (2.78) (cfr. con equazioni (2.10) e Figura 2.5: Nella prima riga si riporta la rappresentazione della famiglia di curve espressa nell’equazione (2.78) con la scelta di c1 = −4, c2 = −5, nella seconda riga si riporta la rappresentazione di tale famiglia con la scelta di c1 = 8, c2 = 6. La figura è stata creata con Mathematica. (2.12)), sono date da: α= x2 2xy , − y2 − z2 β= x2 2xz . − y2 − z2 Il sistema (2.47), per tale esempio, assume la seguente forma: ( 2xySx + (y 2 + z 2 − x2 )Sy = 0, 2xzSx + (y 2 + z 2 − x2 )Sz = 0. (2.79) (2.80) Poichè la famiglia di curve data dalla (2.78) soddisfa la condizione di normalità (che significa che è una congruenza normale) e tenendo conto del Teorema 2.2, il sistema (2.80) ammette 43 soluzioni non banali. Per trovare la soluzione generale di tale sistema, si utilizza la stessa procedura utilizzata nella sezione precedente. La prima equazione del sistema (2.80) è equivalente al seguente sistema di ODEs: dy dS dz dx = 2 = . = 2 2 2xy y +z −x 0 0 (2.81) da cui immediatamente si ottiene: S = c1 , z = c2 , 1 c22 − x2 −1 dy = y+ y , dx 2x 2x (2.82) dove c1 , c2 sono costanti arbitrarie. La terza equazione del sistema (2.82) è un’equazione differenziale del primo ordine di Bernoulli il cui integrale generale è: x2 + y 2 + z 2 = c3 , x (2.83) dove c3 è una costante arbitraria. Quindi la soluzione del sistema (2.81) è data da: S = c1 , z = c2 , x2 + y 2 + z 2 = c3 . x Si può scrivere la soluzione generale della prima PDE del sistema (2.80) come segue: x2 + y 2 + z 2 S(x, y, z) = Φ z, = c1 , x essendo Φ una funzione arbitraria. Introducendo la nuova variabile u = scrivere la soluzione (2.85) nella forma: S(x, y, z) = Φ(z, u). (2.84) (2.85) x2 + y 2 + z 2 , si può x (2.86) È semplice verificare che l’equazione (2.86) soddisfa la prima equazione del sistema (2.80). Occorre ora imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.80). Imponendo tale condizione si ottiene Φz = 0 per cui la soluzione generale del sistema di PDEs (2.80) è data da: 2 x + y2 + z2 S(x, y, z) = Φ(u) = Φ . (2.87) x 44 La famiglia dei fronti d’onda che taglia ortogonalmente le curve della congruenza normale data dall’equazione (2.78) (si veda la Figura 2.6), viene scritta come segue: 2 x + y2 + z2 = c1 . (2.88) S(x, y, z) = Φ(u) = Φ x Tenendo conto delle equazioni (2.87) e (2.48), si ha che tutte le distribuzioni degli indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza normale nell’equazione (2.78), sono date dalla formula: y 2 z 2 n(x, y, z) = Φu 1 + = Φu sec2 α, (2.89) + x x dove α è l’angolo formato dal vettore posizione r con l’asse delle x. Ovviamente, si ottiene la soluzione più semplice scegliendo Φu = 1 nell’equazione (2.89). Figura 2.6: La figura rappresenta i due fronti d’onda ottenuti scegliendo Φ = 1 ponendo c1 = −5, c1 = 5 nell’equazione (2.88), e alcune curve della congruenza normale (2.78). La figura è stata creata con Mathematica. 5.4 Esempio 4 Si consideri nello spazio tridimensionale la famiglia di curve a due parametri, rappresentata in Figura 2.7: f (x, y, z) ≡ 2x2 − y 2 = c1 , g(x, y, z) ≡ 3y 2 + 2z 2 = c2 . (2.90) Le cui funzioni di “inclinazione”corrispondenti (cfr. con equazioni (2.10) e (2.12)) sono: α= 2x , y β=− 45 3x . z (2.91) Figura 2.7: La figura rappresenta nella prima riga il grafico con la scelta di c1 = 5, c2 = 5 nell’equazione (2.50), nella seconda riga il grafico delle curve corrispondenti alla scelta di c1 = −1, c2 = 30. La figura è stata creata con Mathematica. Il sistema (2.47), in questo caso, assume la seguente forma: ( 2xSx − ySy = 0, 3xSx + zSz = 0. (2.92) Poichè la famiglia di curve data dalla (2.90) soddisfa la condizione di normalità (che significa che è una congruenza normale) il sistema (2.92) ammette soluzioni non banali in vista del Teorema 2.2. Per trovare la soluzione generale di tale sistema, si utilizza la stessa procedura utilizzata nelle sezioni precedenti. La prima equazione del sistema (2.92) è equivalente al seguente sistema di ODEs: dx dy dz dS = = = , (2.93) 2x −y 0 0 46 eseguendo facili calcoli si ottiene: S = c1 , z = c2 , dx = dy , 2x −y (2.94) dove c1 ,c2 sono costanti arbitrarie. Si noti che la terza equazione del sistema (2.94) è una equazione differenziale a variabili separabili la cui soluzione è: √ ln |y x| = c3 , dove c3 è una costante arbitraria. Quindi, la soluzione del sistema (2.93) è data da: S = c 1 , z = c2 , √ ln |y x| = c3 , (2.95) (2.96) e la soluzione generale della prima PDEs del sistema (2.92) è: √ S(x, y, z) = Φ(z, ln |y x|) = c1 , (2.97) essendo Φ una funzione arbitraria. √ Introducendo la nuova variabile u = ln |y x|, si può scrivere la soluzione (2.97) nella forma: S(x, y, z) = Φ(z, u). (2.98) È semplice verificare che l’equazione (2.98) soddisfa la prima equazione del sistema (2.92). Occorre imporre che la funzione Φ(z, u) soddisfi la seconda equazione del sistema (2.92). Imponendo questa condizione, si ottiene la seguente PDE: 3 Φu + zΦz = 0. 2 (2.99) L’equazione (2.99) è equivalente al sistema di ODEs: 2 dz dΦ du = = , 3 z 0 Dal precedente sistema di ODEs, si ottiene: Φ = k1 , 2 dz du = . 3 z 47 (2.100) (2.101) La terza equazione è un’equazione differenziale a varibili separabili, la cui soluzione è ln |z| + k2 . Quindi la soluzione del sistema (2.100) è data da: Φ = k1 , 2 u − ln |z| = k2 , 3 2 u = 3 (2.102) 2 dove k1 e k2 sono costanti arbitrarie. Se si pone v = u − ln |z|, si può verificare come 3 ! p 3 |xy 2 | 2 S(x, y, z) = Φ(v) = Φ u − ln |z| = Φ ln , (2.103) 3 |z| sia la soluzione generale del sistema di PDEs (2.92). La famiglia di fronti d’onda, che taglia ortogonalmente le curve della data congruenza normale (2.90), assume la seguente forma (si veda la Figura 2.8): ! p 3 |xy 2 | = k1 . (2.104) S(x, y, z) = Φ ln |z| Tenendo conto delle equazioni (2.104) e (2.48), si ha che tutte le distribuzioni indici di rifrazione n(x, y, z) compatibili che permettono la creazione come raggi di luce della data congruenza normale nella equazione (2.90), sono date dalla formula: r 1 4 1 n(x, y, z) = Φv + + , (2.105) 9x2 9y 2 z 2 dove Φv è la derivata della funzione arbitraria Φ(v). Si ha certamente, una soluzione più semplice scegliendo Φv = 1. 48 Figura 2.8: La figura rappresenta i tre fronti d’onda ottenuti scegliendo Φ = 1 ponendo k1 = −1, k1 = 0, k1 = 1 nell’equazione (2.104), e alcune curve della congruenza normale (2.90). La figura è stata creata con Mathematica. 49 50 Capitolo 3 Problema inverso in due dimensioni In questo capitolo studiamo il seguente problema inverso in ottica geometrica: Data una famiglia di curve a un parametro -più precisamente una congruenza- costruire l’indice di rifrazione rappresentato dalla funzione n = n(x, y) di un mezzo bidimensionale trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnata. Tale problema risulta essere un caso particolare del problema tridimensionale studiato nel capitolo precedente. Infatti, ponendo nelle equazioni (2.12) del Capitolo 2 β = 0 (o α = 0), l’indice di rifrazione dipenderebbe solo da due variabili indipendenti. Per verificare questo fatto si osservi che il sistema (2.24) del Capitolo 2 si ridurrebbe ad una sola equazione e se per esempio β = 0, si ha per la seconda delle (2.25) del Capitolo 2 che Ω2 = 0, per cui dalla seconda equazione del sistema (2.24) si ottiene nz = 0 e quindi che n = n(x, y). Considereremo dei raggi che giacciono in piani perpendicolari all’asse z del sistema di riferimento cartesiano in modo che l’indice di rifrazione n(x, y) risulti costante lungo le rette parallele all’asse z. In generale, l’indice di rifrazione dipende dalla frequenza, e quindi dalla lunghezza d’onda (vedi Introduzione). In questo capitolo si assume che tutti i raggi siano costituiti da una famiglia monoparametrica (abbiano cioè la stessa frequenza). La funzione n(x, y, λ) descrive l’indice di rifrazione che, in generale, dipende anche dalla lunghezza d’onda λ che risulta essere un parametro comune a tutte le curve della famiglia. Ricordando che in ottica geometrica λ → 0 (cfr. Introduzione, Capitolo 1 e Capitolo 2), λ verrà omessa nella nostra trattazione. Si utilizzeranno il principio di Fermat e l’equazione iconale per risolvere il problema inverso in due dimensioni. In altre parole, data una famiglia di raggi di luce monocromatica in un mezzo trasparente, disomogeneo e isotropo, f (x, y) = c0 , dove c0 è una costante lungo ogni raggio (che varia da raggio a raggio), si vuole trovare l’indice di rifrazione in modo tale che la luce si propaghi in tale mezzo lungo le curve della congruenza assegnata. Si dimostrerà che la funzione n(x, y) che rappresenta l’indice di rifrazione è soluzione di un’equazione differenziale lineare alle derivate parziali del primo ordine, chiamata equazione dell’indice di rifrazione. Tale equazione verrà ricavata direttamente dal principio di Fermat ed è equivalente a quella ottenuta dalle equazioni (2.24) del Capitolo precedente. 51 Inoltre, in analogia con quanto fatto nel Capitolo precedente, si presenterà anche un altro metodo, basato sull’equazione iconale, che consente la ricostruzione dell’indice di rifrazione rappresentato da n = n(x, y). Si ritiene importante sottolineare che i problemi in due dimensioni furono i primi ad essere risolti: in [17, 19, 20, 21] si è considerato il caso in cui il mezzo ottico giace su un piano, mentre in [22, 23] si è analizzato il caso in cui il mezzo sia distribuito su una superficie di R3 , mentre la soluzione del problema tridimensionale, discussa nel Capitolo precedente, è stata fornita in [8]. 1 Equazione differenziale alle derivate parziali dell’indice di rifrazione trovata mediante il principio di Fermat In questa sezione risolveremo il problema inverso enunciato nella sezione precedente utilizzando il principio di Fermat. In particolare, ricordiamo che stiamo assumendo che i raggi di luce giacciano in piani perpendicolari all’asse z (del fissato sistema di riferimento) e che l’indice di rifrazione sia costante lungo ogni retta parallela all’asse z. Assegnata, in tali piani, la famiglia monoparametrica di raggi di luce -congruenza normale- (si suppone che il mezzo sia trasparente, isotropo ed disomogeneo) tramite l’equazione: f (x, y) = c0 , (3.1) con c0 costante per ogni raggio, ma varia da raggio a raggio, si vuole determinare la funzione -indice di rifrazione- n = n(x, y) in modo che la luce si propaghi lungo le curve della congruenza assegnata. Presentiamo la soluzione di questo problema facendo uso del principio di Fermat. Tale principio (vedi Capitoli 1, 2 e [2]), ammette la seguente formulazione matematica Z P2 δ n ds = 0. (3.2) P1 L’elemento di linea ds, in coordinate cartesiane ortogonali, assume la forma: p ds = dx2 + dy 2 , (3.3) quindi, parametrizzando in funzione di x, l’equazione (3.2) può essere riscritta come: Z x2 p δ n(x, y) 1 + y 02 dx = 0. (3.4) x1 È ben noto [18] che l’equazione variazionale (3.4) è equivalente al sistema di due ODEs di Eulero-Lagrange, ma a causa della parametrizzazione la prima equazione risulta un’identità, per cui l’equazione variazionale assume la forma: " # 0 p d y ny 1 + y 02 − np = 0. (3.5) dx 1 + y 02 52 Tramite semplici calcoli si ottiene: y 00 y nx − ny + n = 0. 1 + y 02 0 (3.6) Questa è l’equazione differenziale dei raggi di luce. Se nell’epressione (3.6) si soppone assegnato l’indice di rifrazione, ovvero è assegnata la funzione n = n(x, y), la funzione incognita risulta essere la y = y(x) che fornisce la traiettoria dei raggi di luce (che è univocamente determinata se viene assegnata la condizione iniziale y0 = y(x0 )). Questo è il modo più semplice per utilizzare il principio di Fermat, ovvero applicandolo per risolvere il problema diretto (vedi anche Introduzione). Solo recentemente [17] è stato mostrato come sia possibile riformulare l’equazione (3.6) in modo da renderla idonea a risolvere il problema inverso. A tal fine, differenziando l’equazione della famiglia dei raggi di luce (3.1) rispetto a x, si ottiene: y0 = − fx . fy (3.7) Sia γ(x, y) la funzione di “inclinazione”delle traiettorie ortogonali alla famiglia (3.1), definite nel seguente modo: fy γ(x, y) = . (3.8) fx Si possono scrivere y 0 e y 00 come funzioni di γ: 1 y0 = − , γ y 00 = Ω , γ3 (3.9) dove Ω(x, y) = γγx − γy . (3.10) È importante notare che a ogni funzione f (x, y) corrisponde una funzione γ(x, y) e viceversa, ad ogni γ(x, y) corrisponde una famiglia (3.1). Sostituendo (3.9) e (3.10) nella (3.6) e considerando nx e ny come le derivate parziali dell’unica funzione incognita n(x, y), otteniamo: ∂n ∂n + γ(x, y) = Ω1 (x, y)n, ∂x ∂y con (3.11) Ω . (3.12) 1 + γ2 L’equazione (3.11) può essere chiamata equazione dell’indice di rifrazione. Si tratta di una PDE del primo ordine nella funzione incognita n(x, y), la cui soluzione fornisce tutti i possibili indici di rifrazione che permettono ai raggi di luce di propagarsi lungo la famiglia di raggi di luce assegnata. Nella sezione 3 applicheremo l’equazione (3.11) in alcuni importanti esempi. Ω1 (x, y) = 53 2 Equazione differenziale alle derivate parziali dell’indice di rifrazione trovata mediante l’equazione iconale In questa sezione si formulerà il problema inverso utilizzando l’equazione iconale. L’equazione iconale nel caso bidimensionale assume la seguente forma: 2 2 ∂S ∂S + = n2 . ∂x ∂y (3.13) Si vuole risolvere il problema inverso mediante l’utilizzo dell’equazione (3.13). Per raggiungere questo obiettivo, tenendo conto che tutti i raggi sono ortogonali alla famiglia di curve, dobbiamo determinare l’equazione della famiglia dei fronti d’onda: S(x, y) = costante. (3.14) In altre parole, assegnata una congruenza normale di curve, in un mezzo bidimensionale, isotropo e disomogeneo, si devono trovare tutte le possibili distribuzioni della funzione n(x, y) (tramite l’equazione (3.13)) che consente la creazione della data congruenza normale come famiglia di raggi di luce monocromatici. Si consideri un vettore tangente al fronte d’onda: ε = fx i + fy j = i + fy j = i + γj, fx le cui componenti risultano essere {1, γ} (si è tenuto conto della definizione (3.8)). Tenendo conto che la data famiglia di curve monoparametrica deve essere una famiglia ortogonale di raggi, si conclude che i due vettori, grad S e ε, devono essere paralleli, e tale condizione comporta: Sy Sx = . 1 γ (3.15) L’equazione (3.15) è una PDE lineare e omogenea del primo ordine nell’unica funzione incognita S(x, y) che si può scrivere come: F ≡ γSx − Sy = 0. (3.16) Abbiamo ottenuto quindi il seguente risultato: Proposizione 3.1 Data una congruenza normale all’interno di un mezzo bidimensionale, trasparente, continuo, disomogeneo e isotropo, la funzione iconale S(x, y) che definisce la famiglia di fronti d’onda S(x, y) = costante, è la soluzione della seguente PDE lineare e omogenea del primo ordine: γ(x, y)Sx − Sy = 0. 54 (3.17) Tutte le distibuzioni indici di rifrazione compatibili che permettono la crezione, come raggi di luce, della congruenza normale data, sono dati dalla formula: q n(x, y) = Sx2 + Sy2 . (3.18) La procedura per risolvere la PDE è stata spiegata nel Capitolo 2. 3 Indici di rifrazione In questa sezione si applicherà la teoria sviluppata in questo capitolo a due interessanti esempi. In entrambi i casi, verrà imposta una particolare restrizione alla forma dell’indice di rifrazione cercato. 3.1 Indici di rifrazione radiali In questa sezione, anzichè utilizzare la famiglia di curve espressa nella forma (3.1), considereremo la famiglia di curve in coordinate polari r e θ avente equazione: f (r, θ) = c0 , (3.19) la funzione di “inclinazione”corrispondente risulta essere definita come segue: δ(r, θ) = fθ . fr (3.20) Anche in questo caso vi è una corrispondenza biunivoca tra la famiglia monoparametrica (3.19) e la funzione di inclinazione (3.20). Si propone il seguente problema: data una famiglia di curve nella forma (3.19), trovare tutti gli indici di rifrazione che dipendono solo dalla p distanza r da un punto fissato O (indice di rifrazione a simmetria radiale) n = n(r), r = x2 + y 2 , e che sono compatibili con la famiglia (3.19) di raggi di luce. Risoluzione mediante il Principio di Fermat: L’equazione dell’indice di rifrazione (3.11) assume la forma: δ Ψ n = 0, rnr + nθ + 1 + 2 r δ + r2 (3.21) dove Ψ = δ 2 + r(δθ − δδr ), 55 (3.22) Si vuole che la soluzione n sia funzione solo di r, cioè n = n(r), qualunque sia δ = δ(r, θ). sı̀ che la soluzione della (3.21) assuma questa forma, dobbiamo avere necessariamente Per far Ψ = 0 che conduce alla condizione: 2 δ + r2 θ (r2 + δ 2 )(δδrθ − δθθ ) + [(r2 − δ 2 )δr + 2δδθ − 2rδ]δθ = 0. (3.23) In tal modo, si arriva alla seguente proposizione: Proposizione 3.2 La funzione di “inclinazione”(3.20) di tutte le famiglie di curve (3.19) compatibili con l’indice di rifrazione radiale n = n(r) soddisfa la condizione differenziale (3.23). Esempio 1: Si può verificare che la famiglia di rami di coniche √ f (r, θ) = −r cos θ + r2 cos2 θ − 4r + 4 = c0 , (3.24) soddisfa la condizione (3.23) e quindi l’indice di rifrazione sarà una funzione radiale n = n(r). La funzione di “inclinazione”risulta: 2 cos θ sin θ r sin θ + √rr2 cos fθ 2 θ−4r+4 . = δ= 2 θ−2 r cos fr − cos θ + √r2 cos2 θ−4r+4 Più precisamente l’equazione (3.21) diventa: q 32 (r − 2) 1r √ 1 1 nr + r − 2 n = 0. 3 − 2 r 2(r − 2) 2 Si verifica facilmente che la funzione r n = n(r) = n0 |r − 2| , r dove n0 è una costante arbitraria, soddisfa tale equazione. Risoluzione mediante l’equazione iconale: Sia f (r, θ) = −r cos θ + √ r2 cos2 θ − 4r + 4 = c0 , la famiglia di curve, la funzione di “inclinazione”risulta: 2 cos θ sin θ r sin θ + √rr2 cos fθ 2 θ−4r+4 δ= = . 2 θ−2 r cos fr − cos θ + √r2 cos2 θ−4r+4 56 L’equazione (3.17), in questo caso, assume la seguente forma: r2 cos θ sin θ r cos2 θ − 2 r sin θ + √ Sr + cos θ − √ Sθ = 0. r2 cos2 θ − 4r + 4 r2 cos2 θ − 4r + 4 Che è equivalente al seguente sistema di ODEs: dr r sin θ + √ r2 cos θ sin θ r2 cos2 θ−4r+4 = dθ cos θ − √ r cos2 θ−2 r2 cos2 θ−4r+4 = dS . 0 Dal precedente sistema di ODEs si ottiene: S = c 1 , dr dθ = . 2 2 r sin θ + √ r cos θ sin θ √ r cos θ−2 cos θ − r2 cos2 θ−4r+4 r2 cos2 θ−4r+4 In questo caso l’integrazione della seconda equazione presenta notevoli difficoltà analitiche1 . L’approccio basato sull’equazione (3.11) è quindi preferibile. 3.2 Indici di rifrazione omogenei In questa sottosezione si vuole risolvere il seguente problema: Data una famiglia di raggi (3.1), trovare gli indici di rifrazione che soddisfano la seguente ulteriore richiesta n(x, y) = y tutti m , ovvero sia una funzione omogenea2 di grado m. x R x In particolare, consideriamo il seguente caso: L’indice di rifrazione n sia una funzione omogenea di grado m, e γ è una funzione non omogenea di grado zero. Risoluzione mediante il principio di Fermat: Abbiamo: n(x, y) = xm R(z), essendo z = (3.25) y . L’equazione (3.11) in questo caso diventa: x mR − zR0 = xΩ1 R − γR0 1 (3.26) Si potrebbe integrare tale equazione tramite un opportuno programma come Mathematica o Matlab. Una funzione f (x1 , . . . , xn ) dicesi omogenea di grado m, essendo m un numero reale, se per ogni valore della variabile t risulta f (tx1 , . . . , txn ) = tm f (x1 , . . . , xn ). 2 57 dove l’apice indica la derivata rispetto a z e Ω1 dato dalla (3.12). Poichè γ è una funzione non omogenea di grado zero 3 , si ha: xγx + yγy 6= 0. (3.27) Il secondo membro dell’equazione (3.26) deve essere una funzione di z, cioè omogeneo in x, y di grado zero. Allora: x(xΩ1 R − γR0 )x + y(xΩ1 R − γR0 )y = 0, (3.28) che conduce a: R0 = ρ, R dove ρ= x(xΩ1x + yΩ1y + Ω1 ) . xγx + yγy (3.29) (3.30) Ma ρ(x, y) deve essere omogeneo di grado −14 , cioè: xρx + yρy + ρ = 0 (3.31) e questo conduce alla condizione per la data famiglia di curve: (xγx + yγy )[x2 Ω1xx + 2xyΩ1xy + y 2 Ω1yy + 2(xΩ1x + yΩ1y )] = (x2 γxx + 2xyγxy + y 2 γyy )(xΩ1x + yΩ1y + Ω1 ). (3.32) Allora si può affermare la seguente proposizione: Proposizione 3.3 Qualunque famiglia di raggi γ(x, y) che soddisfa (3.27) e (3.32) è compatibile con tutti gli indici di rifrazione omogenei (3.25) trovati dalla (3.29). Esempio 2: Le funzioni γ= √ axm − 1, (3.33) soddisfano la condizione (3.32). Dalla (3.30) si ha ρ = 0, allora, dalle (3.29) e (3.25) si ottiene R0 = 0, R il che implica n = n 0 xm . 3 (3.34) Si ricordi il teorema di Eulero sulle funzioni omogenee di cui si riporta l’enunciato: Teorema di Eulero: Condizione necessaria e sufficiente affinchè una funzione f (x1 , . . . , xn ), continua con le sue derivate prime nel suo insieme di definizione, sia omogenea di grado m, è che sia verificata identicamente la ∂f ∂f relazione: x1 + . . . + xn = mf (x1 , . . . , xn ). ∂x1 ∂xn 4 Si applichi di nuovo il teorema di Eulero per trovare l’equazione (3.31). 58 dove n0 è una costante arbitraria. Risoluzione mediante l’equazione iconale: √ Sia γ = axm − 1 la funzione di “inclinazione”. L’equazione (3.17), in questo caso, assume la seguente forma: √ axm − 1 Sx − Sy = 0. Che è equivalente al seguente sistema di ODEs: √ dS dx dy = . = m −1 0 ax − 1 Dal precedente sistema di ODEs si ottiene: S = c 1 , dx dy √ = . −1 axm − 1 Anche in questo caso l’integrazione della seconda equazione presenta notevoli difficoltà analitiche5 . L’approccio basato sull’equazione (3.11) è quindi preferibile. 5 Si potrebbe integrare tale equazione tramite un opportuno programma come Mathematica o Matlab. 59 60 Appendice A Sistemi di PDEs di primo ordine In questa appendice viene descritta la teoria relativa ai sistemi di PDEs di primo ordine. Si tratta dei sistemi che si sono presentati nei Capitoli 2, 3 quando sono state derivate le equazioni che consentono di risolvere i problemi inversi dell’ottica geometrica. Si rimanda a [10] per ulteriori dettagli. 1 Sistemi di equazioni lineari Si consideri un sistema di m equazioni lineari omogenee, in una sola funzione incognita u = u(x1 , . . . , xn ), di n variabili x1 , . . . , xn X1 (u) = a11 p1 + . . . + a1n pn = 0, .. .. .. .. . . . . Xm (u) = am1 p1 + . . . + amn pn = 0, (A.1) dove si è posto pk = uxk , i coefficienti aik sono funzioni continue e derivabili con derivata continua nelle variabili xs e Xk (u) denota il primo membro della k-esima equazione. Si deve trovare una funzione u che soddisfi contemporaneamente tutte le equazioni del sistema (A.1). Si esclude dalla soluzione del sistema (A.1) la soluzione banale u = costante che non presenta alcun interesse. Si suppone che le equazioni del sistema (A.1) siano linearmente indipendenti, cioè che non esistano fattori λk = λk (xs ), s = 1, . . . , n, con λk non tutti nulli tali che: m X λk Xk (u) = 0, k=1 identicamente rispetto a xs in un dominio di variazione di queste variabili e di ps . Se questi λk esistessero, il primo membro di una delle equazioni del sistema (A.1) potrebbe essere espresso come combinazione lineare dei primi membri delle altre equazioni. Questa equazione 61 sarebbe quindi conseguenza delle altre e potrebbe essere cancellata. Supponiamo che m ≥ n e si considerino le prime n equazioni del sistema. Poichè queste equazioni sono linearmente indipendenti, il determinante composto dai loro coefficienti deve essere non nullo. Ma allora il sistema omogeneo rispetto a ps ha la sola soluzione nulla p1 = . . . = pn = 0 da cui risulta u = costante, cioè per m ≥ n il sistema non ha soluzioni, tranne quella banale. Non è quindi restrittivo supporre che m < n e d’ora in avanti ci atterremo sempre a questa condizione. Stabiliamo alcune utili proprietà. Se u1 e u2 sono due funzioni qualsiasi delle variabili indipendenti x1 , . . . xn , si hanno seguenti le due identità: Xk (u1 + u2 ) = Xk (u1 ) + Xk (u2 ), Xk (u1 u2 ) = u1 Xk (u2 ) + u2 Xk (u1 ). (A.2) Sostituendo nell’espressione Xi (u) la funzione u con il primo membro della k-esima equazione, cioè con l’espressione di Xk (u) e tenendo conto delle identità (A.2) si ottiene: Xi (Xk (u)) = n X Xi (aks )uxs + n X s=1 s=1 n X n X aks Xi (uxs ), e analogamente Xk (Xi (u)) = Xk (ais )uxs + ais Xk (uxs ). s=1 s=1 È evidente che, ricorrendo alle derivate seconde della funzione u il secondo addendo a secondo membro dell’equazione precedente, si può scrivere nel seguente modo: n X aks Xi (uxs ) = s=1 n X s=1 aks n X ait uxs xt = t=1 n X ait aks uxs xt , s,t=1 effettuando una permutazione degli indici i, k, l’ultima espressione rimane invariata, cioè: n X ais Xk (uxs ) = n X aks Xi (uxs ). s=1 s=1 Si è ottuta cosı̀ la seguente formula: Xi (Xk (u)) − Xk (Xi (u)) = n X [Xi (aks ) − Xk (ais )] (uxs ), (A.3) s=1 nella quale il secondo membro rappresenta una funzione lineare omogenea di ps = uxs con coefficienti dipendenti da xk . 62 Si può estendere la definizione di Parentesi di Poisson al caso in cui appaiono un numero qualsiasi di variabili mediante la seguente formula: [ϕ, ψ] = n X (ϕpj ψxj − ϕxj ψpj ). (A.4) j=1 Sostituendo nella formula precedente ϕ = Xi (u) e ψ = Xk (u), si ottiene: ϕpj = aij , ψxj = n X ∂aks s=1 ∂xj p s , ϕ xj = n X ∂ais s=1 ∂xj ps , ψpj = akj . Ponendo quanto trovato nella (A.4), si ottiene: [Xi (u), Xk (u)] = n n X X s=1 ossia: [Xi (u), Xk (u)] = n ∂aks X ∂ais aij − akj ∂xj ∂xj j=1 j=1 n X ! ps , [Xi (aks ) − Xk (ais )] ps . s=1 Confrontando quanto trovato con il secondo membro della (A.3), si giugne alla seguente importante identità: [Xi (u), Xk (u)] = Xi (Xk (u)) − Xk (Xi (u)). (A.5) Se u verifica tutte le equazioni del sistema (A.1), cioè se Xl (u) = 0 (l = 1, . . . , m), deve verificare anche la seguente equazione linearmente omogenea: [Xi (u), Xk (u)] = 0, (A.6) qualunque siano gli indici i e k. Al variare degli indici i e k con i, k = 1, . . . , m, si ottengono m(m − 1) nuove equazioni lineari omogenee che sono conseguenza del sistema (A.1). Alcune di 2 queste possono essere delle identità, cioè tutti i loro coefficienti in pk possono risultare nulli. Si aggiungono le nuove equazioni che non risultano identità a quelle del sistema (A.1), verificando ogni volta che l’equazione aggiunta non sia una combinazione lineare delle equazioni presenti. In caso contrario, tali equazioni vengono omesse. Procedendo in questo modo con tutte le equazioni, otteniamo un nuovo sistema in cui il numero di equazioni può essere maggiore di m. Per il nuovo sistema verrà costruita la parentesi di Poisson composta dai primi membri, senza ripetere, ovviamente, la parentesi di Poisson già costruita per il sistema iniziale e aggiungendo le nuove equazioni ottenute al sistema. Continuando questo procedimento si possono presentare due casi: 63 1. Se il numero di equazioni del sistema ottenuto è uguale a n, questo sistema ha la sola soluzione banale u = costante e, di conseguenza, il sistema iniziale risulta avere come unica soluzione quella banale. 2. Se il numero di equazioni del sistema ottenuto è inferiore a n, cioè per tutte le nuove equazioni costruibili mediante la parentesi di Poisson sono combinazioni lineari delle equazioni del sistema stesso, esso viene detto sistema completo. In tal modo, viste le considerazioni precedenti, segue che il sistema iniziale considerato o ha la soluzione banale, oppure è equivalente ad un sistema completo, e si pone cosı̀ il problema dell’integrazione dei sistemi completi. Si può supporre, senza perdita di generalità, che il sistema iniziale (A.1) sia (già) un sistema completo, cioè che tutte le parentesi di Poisson possibili [Xi (u), Xk (u)] siano combinazioni lineari dei primi membri delle equazioni, come segue: [Xi (u), Xk (u)] = m X (i,k) βl Xl (u), (A.7) l=1 (i,k) dove i coefficienti βl mente. 2 sono funzioni di xk , oppure che queste parentesi si annullino identica- Sistemi completi di Jacobi In questa sezione vengono discusse alcune proprietà fondamentali dei sistemi completi. Consideriamo le nuove variabili indipendenti: yk = ϕk (x1 , . . . , xn ) (k = 1, . . . , n), e supponiamo che questa trasformazione possa essere esplicitata rispetto a xk . Il sistema (A.1) nelle nuove variabili indipendenti assumerà la forma: Yj (u) = bj1 ∂u ∂u + . . . + bjn =0 ∂y1 ∂yn (j = 1, . . . , m), dove, per la regola di derivazione delle funzioni composte, si ha: bjl = n X s=1 ajs ∂ϕl = Xj (yl ). ∂xs (A.8) Qualunque sia le funzione u si ha Yj (u) = Xj (u); il secondo membro viene espresso mediante le variabili indipendenti xk , il primo membro mediante le variabili indipendenti yk . Di conseguenza, qualunque siano gli indici i e k si ha: Xi (Xk (u)) = Yi (Yk (u)), 64 e Xi (Xk (u)) − Xk (Xi (u)) = Yi (Yk (u)) − Yk (Yi (u)). Tenuto conto delle (A.5) e (A.7) si può scrivere: Yi (Yk (u)) − Yk (Yi (u)) = m X (i,k) γl Yl (u), l=1 (i,k) (i,k) dove i coefficienti γl si ottengono dai coefficienti βl indipendenti. Abbiamo cosı̀ provato la seguente con il passaggio alle nuove variabili Proposizione A.1 Se il sistema (A.1) è completo, allora ogni sistema ottenuto per sostituzione delle variabili indipendenti sarà ancora completo. Dimostriamo ora un’altra proprietà dei sistemi completi. Costruiamo m combinazioni lineari dei primi membri delle equazioni del sistema (A.1): Zj (u) = dj1 X1 (u) + . . . + djm Xm (u) (j = 1, . . . , m), dove si suppone che i coefficienti djl siano dipendenti da xk e che il determinante di questi coefficienti sia non nullo. Sotto tali ipotesi il sistema di equazioni: Zj (u) = 0 (j = 1, . . . , m), (A.9) risulterà equivalente al sistema iniziale (A.1). Vale, inoltre, la seguente Proposizione A.2 Se il sistema (A.1) è completo, allora ogni sistema equivalente ad esso (cfr. come il sistema (A.9)) risulta completo. Dimostrazione. sioni della forma: La parentesi di Poisson [Zi (u), Zk (u)] rappresenta una somma di espresdip Xp (dkq Xq (u)) − dkq Xq (dip Xp (u)), ossia considerando quanto espresso dalla (A.2), una somma di espressioni della forma: dip [Xp (dkq )Xq (u)) + dkq Xp (Xq (u))] − dkq [Xq (dip )Xp (u) + dip Xq (Xp (u))] = dip Xp (dkq )Xq (u) − dkq Xq (dip )Xp (u) + dip dkq [Xp (Xq (u)) − Xq (Xp (u))]. Tenuto conto che tutte le espressioni Xp (Xq (u)) − Xq (Xp (u)) sono combinazioni lineari di Xj (u), si vede che la parentesi di Poisson [Zi (u), Zk (u)] si esprime mediante Xj (u) e, di conseguenza, mediante Zj (u), e questo dimostra la completezza del sistema (A.9). Introduciamo ora una nuova nozione, che è un caso particolare della nozione di completezza 65 Definizione 2 Il sistema (A.1) si chiama sistema di Jacobi o sistema Jacobiano se tutte le parentesi di Poisson [Xi (u), Xk (u)] si annullano identicamente, cioè se tutti i coefficienti di ps in queste parentesi sono identicamente nulli. Si può dimostrare che: Proposizione A.3 Si può trasformare un sistema completo in un sistema Jacobiano mediante operazioni algebriche elementari. Dimostrazione. Si consideri il sistema iniziale (A.1) e lo si supponga completo. Poichè le sue equazioni sono linearmente indipendenti, la matrice dei suoi coefficienti ha rango m e possiamo risolvere le equazioni del sistema rispetto a m grandezze ps . Si può supporre, senza perdita di generalità, che le equazioni del sistema siano esplicitabili rispetto a p1 , . . . , pm ; al posto del sistema (A.1) si può scrivere un sistema nella forma: p1 + c1,m+1 pm+1 + . . . + c1,n pn = 0, p2 + c2,m+1 pm+1 + . . . + c2,n pn = 0, (A.10) .. .. .. .. . . . . p + c p + . . . + c p = 0. m m,m+1 m+1 m,n n Questo sistema, in accordo con la Proposizione A.2, è completo. Si dimostra che il sistema (A.10) è anche un sistema Jacobiano. Per mostrare questo fatto procediamo come segue. Come fatto in precedenza, si denotino con Xi (u) i membri dell’equazioni del sistema (A.10). Si deve dimostrare (i,k) che tutti i coefficienti βl presenti nella formula (A.7) siano identicamente nulli. Dalla forma del sistema (A.10) e dalla definizione di parentesi di Poisson deriva immediatamente che l’espressione a primo membro della (A.7) non contiene ps , per s ≤ m, e che a secondo membro il coefficiente (i,k) (i,k) di ps , per s ≤ m, è uguale a βl . Ne segue immediatamente che tutti i coefficienti βl devono essere nulli, vale a dire che il sistema (A.10) è un sistema Jacobiano. Osservazione: Un sistema Jacobiano non deve avere necessariamente la forma (A.10). Ma considerando quanto è stato dimostrato precedentemente, un sistema completo ridotto alla forma (A.10) risulta essere un sistema Jacobiano. 3 Integrazione di sistemi completi In questa sezione mostreremo come sia possibile determinare la soluzione di un sistema completo. In virtù della Proposizione A.3, invece di integrare il sistema completo (A.1) si può integrare il sistema Jacobiano equivalente (A.10). Si consideri la prima equazione di questo sistema e il corrispondente sistema di equazioni differenziali ordinarie: dx2 dxm dxm+1 dxn dx1 = = ... = = = ... = . (A.11) 1 0 0 c1,m+1 c1,n 66 Si noti che la notazione usata nell’equazione (A.11), dove appare zero al denominatore di alcune dx2 frazioni, sta a significare che il corrispondente numeratore è nullo, come ad esempio per cioè 0 che, dx2 = 0, e quindi x2 = costante. Questa notazione la si trova in [10, 11, 12, 13, 14] ed è generalmente accettata dai matematici che lavorano nel campo delle PDEs. Il sistema (A.11) ammette i seguenti n − 1 integrali indipendenti: ϕ2 (x1 , . . . , xn ) = C2 , . . . , ϕn (x1 , . . . , xn ) = Cn , e i primi membri delle equazioni scritte devono essere soluzioni della prima delle equazioni del sistema (A.10). Si osservi che è possibile scrivere direttamente gli m − 1 integrali cioè: x2 = costante, . . . , xm = costante. Si considerino le n − 1 nuove variabili: ys = ϕs (x1 , . . . , xn ) (s = 2, . . . , n). (A.12) Dal fatto che gli integrali sono indipendenti segue che le equazioni scritte devono essere esplicitabili rispetto alle n − 1 variabili xk , e si può considerare una funzione ϕ1 (x1 , . . . , xn ) tale che il cambiamento di variabili ys = ϕs (x1 , . . . , xn ) (s = 1, . . . , n). si possa esplicitare rispetto a tutte le variabili xk . Se per esempio le equazioni del sistema (A.10) sono esplicitabili rispetto a x1 , . . . , xn−1 è sufficiente considerare ϕ1 = xn . Se si trasforma il sistema (A.10) nelle nuove variabili indipendenti, utilizzando la formula (A.8) e tenendo conto che ϕ2 , . . . , ϕn sono soluzioni della prima delle equazioni del sistema (A.10), ∂u = 0. Utilizzando questa equazione, si vede che la prima equazione si riduce alla forma ∂y1 ∂u dalle altre m − 1 equazioni e, in vista della possiamo cancellare tutti i termini contenenti ∂y1 ∂u loro indipendenza lineare, esplicitare queste rispetto ad alcune delle m − 1 derivate . Si può ∂ys supporre, senza perdita di generalità, che sia possibile esplicitare le suddette equazioni rispetto ∂u ∂u a ,..., . Il sistema assumerà, dunque, la seguente forma: ∂y2 ∂ym ∂u Y1 (u) = = 0, ∂y1 Y2 (u) = ∂u + h2,m+1 ∂u + . . . + h2,n ∂u = 0, ∂y2 ∂ym+1 ∂yn (A.13) . . . . . . . . . . . . . . . ∂u ∂u ∂u Ym (u) = + hm,m+1 + . . . + hm,n = 0. ∂ym ∂ym+1 ∂yn 67 Il sistema iniziale era Jacobiano, di conseguenza, completo, e perciò il sistema trasformato deve essere ancora completo. Ma poichè è esplicitabile rispetto alle derivate, esso deve essere un sistema Jacobiano. Si deriva che la trasformazione di un sistema Jacobiano in nuove variabili indipendenti, per la Proposizione A.1, conduce sempre ad un sistema Jacobiano. La prima delle equazioni del sistema (A.13) mostra che la funzione u non dipende da y1 . È facile dimostrare che i coefficienti presenti nelle altre equazioni del sistema (A.13) non contengono y1 . Infatti, ogni espressione: Y1 (Yi (u)) − Yi (Y1 (u)) = ∂hi,n ∂u ∂hi,m+1 ∂u + ... + = 0, y1 ∂ym+1 y1 ∂yn deve annullarsi identicamente poichè il sistema (A.13) è Jacobiano, dimostrando l’affermazione precedente. Si può dunque omettere la prima equazione nel sistema (A.13) e integrare le altre supponendo che u sia indipendente da y1 . In questo modo si ottiene un sistema di m−1 equazioni con n − 1 variabili indipendenti. Applicando a questo sistema l’operazione sopraindicata, si ottiene un sistema di m − 2 equazioni in n − 2 variabili indipendenti e via di seguito. Infine, si ottiene una sola equazione per la funzione u di n − m + 1 variabili indipendenti. Denotando queste variabili con y1 , . . . , yn−m+1 si avrà un’equazione della forma: ∂u ∂u ∂u + g2 + . . . + gn−m+1 = 0, ∂y1 ∂y2 ∂yn−m+1 dove le varibili indipendenti yj sono funzioni delle variabili indipendenti iniziali x1 , . . . , xn . Il sistema di equazioni differenziali ordinarie corrispondente all’ultima equazione avrà gli n − m integrali indipendenti: ψ1 (y1 , . . . , yn−m+1 ) = C1 , . . . , ψn−m (y1 , . . . , yn−m+1 ) = Cn−m , e la cui soluzione generale avrà la forma: u = Ψ(ψ1 , . . . , ψn−m ), dove Ψ è una funzione arbitraria. La stessa formula fornisce la soluzione generale del sistema iniziale (A.1). 68 Conclusioni Nella tesi si è studiato il seguente problema inverso in ottica geometrica Data una famiglia di curve -congruenza normale- costruire l’indice di rifrazione rappresentato dalla funzione n = n(x, y, z) di un mezzo tridimensionale trasparente, isotropo e disomogeneo in modo che la luce si propaghi in tale mezzo lungo le curve della conguenza assegnate. Tale problema è stato risolto facendo ricorso sia al principio di Fermat che all’equazione iconale in un mezzo tridimensionale disomogeneo e isotropo. Un analogo problema inverso è stato affrontato e risolto anche nel caso di un mezzo bidimensionale. Nel caso tridimensionale, riportato nel Capitolo 2, abbiamo dimostrato che il principio di Fermat implica che la famiglia di raggi di luce assegnata deve essere una congruenza normale e abbiamo provato che la funzione che rappresenta l’indice di rifrazione deve soddisfare il sistema (2.24). Impostando il problema inverso con l’equazione iconale si ottiene invece un sistema di PDEs lineari e omogenee in cui la funzione incognita è direttamente connessa ai fronti d’onda. La determinazione di tale funzione consente, mediante l’utilizzo dell’equazione (2.48), di trovare la funzione indice di rifrazione cercata. Ovviamente entrambe le procedure devono condurre al medesimo risultato. Nel caso tridimensionale, a illustrazione della teoria sviluppata, sono stati analizzati quattro esempi mediante la procedura basata sull’equazione iconale. Nel caso bidimensionale, riportato nel Capitolo 3, è stato affontato il problema sulla falsariga del problema tridimensionale. È importante tener presente che nel Capitolo 2 si è considerata la propagazione della luce in un mezzo trasparente, continuo, disomogeneo e isotropo dalla prospettiva dell’ottica geometrica. Per un lungo periodo tali studi hanno presentato un interesse puramente accademico. Questo era principalmente dovuto alla difficoltà di costruire un mezzo di indice di rifrazione variabile con un alto grado di accuratezza come richiede l’ottica. Negli utlimi 50 anni, la situazione è cambiata grazie all’avvento della tecnica delle microonde e delle loro applicazioni e anche poichè i mezzi disomogenei giocano un ruolo importante nell’ottica integrata e nella fibra ottica. A causa di queste importanti applicazioni fisiche, lo studio svolto risulta particolarmente interessante. Tuttavia l’integrazione delle equazioni (2.24) (o le analoghe (2.45)) presenta, in generale, notevoli 69 difficoltà analitiche e richiede, quindi, il ricorso a specifiche tecniche numeriche (ma questo tipo di trattazione esula dagli obiettivi di questa tesi) . 70 Bibliografia [1] R.K. Luneburg, Mathematical Theory of Optics, University of California, 1964. [2] M.Born and E. Wolf, Principles of Optics, 7th edition, expanded edition (Cambridge University,1999). [3] M. Kline and I W. Kay, Electromagnetic Theory and Geometrical Optics, Interscience, 1965. [4] Y.A. Kravtsov and Y.I. Orlov, Geometrical Optics of inhomogeneous media, in Springer Series on Wave Phenomena, vol. 6, Springer-Verlag, 1990. [5] A.Fletcher, T. Murphy and A. Young, Solutions of two optical problems, Proc. R. Soc. Lond. Ser. A 223, 216-225, 1954. [6] G. Toraldo di Francia, A family of perfect configuration lenses of revolution, Opt. Acta 1, 157-163, 1955. [7] F. Borghero and G. Bozis, A 3-dimensional inverse problem of geometrical optics for continuous isotropic inhomogeneous media, in Preceedings Wascom 2007, 14th Conference on Waves and Stability in Continuous Media, Scicli-Ragusa, Italy, 2007. [8] F. Borghero and F. Demontis, Three dimensional inverse problem of geometrical optics: a mathematical compatison between Fermat’s principle and the eikonal equation, in Journal of the Optical Society of America, vol 33, September 2016. [9] O. N. Stravoudis, The optics of Rays, Wavefronts, and Caustics, Academic, 1972. [10] V.I. Smirnov, A course of Heigher Mathematics, vol IV, Pergamon, 1964. [11] I. N. Sneddon, Elements of Partial Differential Equations, McGraw-Hill, 1957. [12] I.G. Petrovki, Ordinary Differential Equations, Prentice-Hall, 1966. [13] L.Elsgolts, Differential Equations and Calculus of Variations, Mir, 1973. 71 [14] G. L. Velazquez, Partial Differential Equations of First Order and Their Applications to Physics, World Scientific Publishing, 2012. [15] Baltes H P, Inverse Source Problems in Optics, Springer, Berlin, 1978. [16] Ghosh Roy D N, Methods of Inverse Problem in Physics, Boca Raton, CRC Press, 1991. [17] F. Borghero and G. Bozis, A two-dimensional inverse problem of geometrical optics, Journal of Phisics, A 38, 175-184, 2005. [18] Cornelius Lanczos, The variational principles of Mechanics, Third Edition, University of Toronto Press Toronto, 1966. [19] S. Nemoto and T. Makimoto, Refractive-index distribution for a prescribed ray path, J. Opt. Soc. Am. 69, 450-454, 1979. [20] J.C. Minãno, Refractive-index distribution in two-dimensional geometry for a given oneparameter manifold of rays, J. Opt. Soc. Am. A2, 1821-1825, 1985. [21] F. Borghero and T. Kotoulas, Two solvable problems of planar geometrical optics, J.Opt. Soc. Am. A 23, 3133-3138, 2006. [22] F. Borghero and T. Kotoulas, Refractive-index distribution generating as light rays a given family of curves lying on a surface, J.Opt. Soc. Am. A 28, 278-283, 2011. [23] P. Russell and T.A. Birks, Hamiltonian optics of nonuniform photonic crystals, J. Lightwave Technol. 17, 1982-1988, 1999. 72