- E.3 - MANUALE DI OTTICA per la classe quinta (tecnico) a cura dei docenti dell'IIS G.Galilei - Milano Settembre 2008 - E.4 - - E.5 - J - LE ONDE Sappiamo che la luce, del cui studio si occupa, l'Ottica, è costituita da onde elettromagnetiche. I concetti di onda e di “propagazione di onde” sono talmente importanti che ad essi si dedica una parte a sé stante della fisica, che comprende oltre all'Ottica anche l'Acustica, ossia lo studio delle onde sonore, che sono elastiche che si propagano nei mezzi materiali. Trattere mo prima la propagazione delle onde in generale, poi la propagazione delle onde luminose. 1. Le onde: esempi e classificazione Sono molti i fenomeni che nella vita quotidiana ci presentano moti ondulatori. La superficie del mare o quella di un lago, per esempio, ci appaiono solcate da onde che generalmente si propagano dal largo verso la riva. Se gettiamo nell’acqua un sasso vediamo apparire una serie di onde circolari che, come anelli concentrici, si propagano a partire dal punto in cui il sasso ha toccato la superficie dell’acqua. Se pizzichiamo un elastico teso o la corda tesa di una chitar ra otteniamo un moto oscillatorio molto rapido. Ma molti altri fenomeni, ancora più comuni di quelli appena ricordati, come il suono, la luce o la trasmissione di segnali attraverso apparecchi radiofonici o televisivi, si basano sulla propagazione di onde, anche se per le loro caratteristiche non siamo in grado di evidenziarne la natura ondulatoria con i nostri sensi. Figura 1. Onde che si propagano sulla superficie dell’acqua. Figura 2. Le corde di una chitarra oscillano con un moto ondulatorio. - E.6 Tutti questi fenomeni presentano due caratteristiche comuni: - sono generati, in un punto di un mezzo materiale continuo o anche del vuoto, da una perturbazione che non rimane confinata in quel punto ma si propaga ai punti adiacenti; quando per esempio un sasso, cadendo sulla superficie dell’acqua ed entrandovi, la abbassa in quel punto, questa variazione del livello dell’acqua si trasmette ai punti vicini propagandosi verso l’esterno; - si ha una trasmissione di informazione senza che vi sia un trasporto di materia; quando si osservano delle onde che raggiungono la riva di un lago, se ne può dedurre che in qualche punto la superficie dell’acqua è stata perturbata: o perché vi è stato gettato un sasso, o dal vento, o dal passaggio di una barca…; non vi è però spostamento di acqua dal punto in cui è caduto il sasso fino alla riva, come si può verificare osservando il moto di un corpo galleggiante sull’acqua, che viene fatto oscillare verticalmente dall’onda ma non la segue mentre essa si propaga in direzione orizzontale. La classificazione delle onde secondo la loro natura fisica La grande varietà di fenomeni diversi nei quali si ha propagazione di onde impone una loro classificazione. Un primo tipo di classificazione corrisponde alla natura fisica della perturbazione che si propaga. Quando la perturbazione riguarda un corpo elastico, come nel caso delle vibrazioni di una corda tesa o di una lastra metallica, si parla di onde elastiche. Quando invece la perturbazione riguarda il campo elettromagnetico, come nel caso della luce, si parla di onde elettromagnetiche. Le onde elettromagnetiche possono propagarsi in un mezzo materiale, ma anche nel vuoto. Le onde elastiche, invece, si propagano solamente nei mezzi materiali. Un esempio di onde elastiche: le onde trasversali in una corda tesa Supponiamo di tenere con una mano un’estremità di una lunga corda tesa orizzontalmente, che abbia l’altra estremità fissata a una parete. Se imprimiamo con la mano una leggera oscillazione verticale, l’oscillazione si propaga lungo la corda, comunicandosi alle sue successive porzioni che via via si mettono in movimento: abbiamo generato un’onda che si propaga lun go la corda. v v v v Figura 3. Se imprimiamo con una mano un’oscillazione verticale a una corda orizzontale fissata a una parete, si propaga un’onda trasversale lungo la corda. - E.7 Perché l’onda si propaga lungo la corda? Quando l’estremo della corda viene spostato, per esempio verso l’alto, tende a trascinare con sé la porzione di corda più vicina, esercitando su di essa una forza. Ma a causa della sua massa questa porzione di corda oppone una resi stenza alla forza: si sposta anch’essa verticalmente, ma con un certo ritardo. A sua volta essa comunica il movimento verticale a una successiva porzione della corda, e così via. Quanto maggiore è la distanza dal punto in cui inizia il movimento, tanto maggiore è il ritardo con cui la corda inizia a oscillare. La perturbazione impiega un certo tempo a comunicarsi alle varie porzioni della corda, e quindi l’onda si propaga lungo la corda con una velocità v finita (figura 3). L’onda che si propaga lungo la corda tesa è un esempio di onda elastica, perché le forze che determinano la sua propagazione sono di natura elastica: ogni porzione della corda tesa resiste alla perturbazione con una forza che è proporzionale alla perturbazione stessa. Mentre l’onda si propaga nella direzione della corda, le singole porzioni della corda oscillano muovendosi in direzione trasversale rispetto a quella individuata dalla corda. Quando, come in questo caso, il movimento oscillatorio avviene in direzione perpendicolare rispetto alla direzione di propagazione dell’onda, si dice che l’onda è un’onda trasversale. Le onde elastiche che si propagano in una corda tesa sono quindi onde trasversali. Come vedremo, anche le onde elettromagnetiche di cui è composta la luce sono onde trasversali. Un secondo esempio di onde elastiche: le onde sonore Quando un’onda trasversale si propaga lungo una corda tesa facendola oscillare, spesso udiamo un suono. Questo avviene, per esempio, con molti strumenti musicali, come la chitarra, il violino o il pianoforte, nei quali il suono è prodotto appunto dalla vibrazione di corde tese. In altri casi il suono può essere prodotto dalla vibrazione di una membrana tesa, come per esempio nel caso del tamburo. Qual è il legame tra la vibrazione della corda (o della membrana) e il suono che viene prodotto? Consideriamo una piccola porzione di una membrana tesa verticalmente, come quella mostrata nella figura 4. A un certo istante la membrana inizia a muoversi alternativamente avan ti e indietro. Si muove prima in avanti di un breve tratto: gli strati di aria più vicini alla membrana vengono compressi; la pressione e la densità in questi strati risultano maggiori che nell’aria cir costante, e questa perturbazione si comunica agli strati di aria adiacenti, dando origine a un im pulso di compressione che si propaga allontanandosi dalla membrana. Nel suo moto oscillatorio la membrana torna poi rapidamente indietro, determinando una rarefazione degli strati di aria adiacenti alla sua superficie; la pressione e la densità in questi strati sono minori che nell’aria circostante, questa perturbazione si comunica agli strati di aria adiacenti e si produce un impulso di rarefazione che segue il precedente strato di compressione. a) b) c) d) Figura 4. La vibrazione di una membrana produce nell’aria circostante un’onda sonora, ossia un’onda longitudinale costituita da successive compressioni e rarefazioni che si propagano allontanandosi dalla membrana. - E.8 Oscillando in modo continuo, la membrana dà origine a una successione continua di compressioni e di rarefazioni che costituiscono un’onda sonora. Se quest’onda sonora raggiunge un’altra membrana tesa tende a comunicarle lo stesso moto oscillatorio: è quanto avviene con il timpano del nostro orecchio o con la membrana di un microfono, che si mettono a vibrare quando sono raggiunti da un’onda sonora e permettono quindi di rivelarla. Le onde sonore, ossia le onde generate nell’aria o in un altro mezzo materiale dalla vibrazione di sorgenti sonore come corde, piastre o membrane, sono quindi onde elastiche. Più precisamente, si considerano onde sonore quelle onde che abbiano una frequenza di oscillazione compresa tra 20 e 20.000 Hz, compresa cioè entro i limiti di udibilità dell’orecchio umano (limiti che normalmente sono diversi da persona a persona: solo persone molto giovani possono udire i suoni con frequenza agli estremi di questo intervallo). Percepiamo come suoni acuti le onde sonore di frequenza molto alta e come suoni gravi le onde sonore di bassa frequenza. Le onde elastiche che si propagano in un mezzo materiale con una frequenza inferiore a 20 Hz prendono il nome di infrasuoni, mentre a frequenze superiori a 20.000 Hz si hanno gli ultrasuoni. La velocità con cui si propagano le onde sonore nell’aria è di circa 340 m/s. In altri materiali le onde sonore si propagano con velocità diversa. Poiché le onde sonore sono onde elastiche, possono propagarsi soltanto all’interno di un mezzo materiale, come l’aria o un altro mezzo gassoso, liquido o solido. Le onde sonore non si possono dunque propagare nel vuoto, come può essere provato ponendo una sorgente sonora all’interno di una campana di vetro dalla quale venga estratta l’aria mediante una pompa: una volta ottenuto il vuoto, il suono della sorgente sonora non viene più percepito. La propagazione di onde elastiche corrisponde sempre a qualche movimento oscillatorio delle particelle che compongono il mezzo materiale entro cui l’onda si propaga. Come si può notare considerando il moto di oscillazione della membrana tesa che produce l’onda sonora o quello della membrana che la rivela, questo moto oscillatorio avviene nella stessa direzione in cui si propaga l’onda sonora. Un’onda di questo tipo, nella quale il movimento oscillatorio avviene nella stessa direzione di propagazione dell’onda, è un’onda longitudinale. Le onde sonore sono quindi onde longitudinali. Esistono altri esempi di onde longitudinali. Consideriamo per esempio una molla tesa verticalmente, con l’estremo inferiore fissato al pavimento (figura 5). Con un brusco movimento facciamo oscillare verso l’alto e verso il basso l’estremo superiore della molla. Le spire della molla iniziano a vibrare verso l’alto e verso il basso, dando luogo lungo la molla a un’onda di compressione e rarefazione, mentre ogni singola spira oscilla nella stessa direzione in cui si propaga l’onda. Anche l’onda che si propaga lungo la molla, quindi, è un’onda longitudinale. v v v v Figura 5. Se imprimiamo con una mano un’oscillazione verticale a una molla posta verticalmente con l’estremo inferiore fissato a terra, si propaga un’onda longitudinale lungo la corda. - E.9 Un terzo esempio di onde elastiche: le onde di superficie Consideriamo ora un’onda che si propaga sulla superficie di un liquido, per esempio l’onda circolare generata sulla superficie di uno specchio d’acqua da un sasso che vi cade dal l’alto. Entrando nell’acqua il sasso sposta un certo volume d’acqua. Poiché l’acqua è praticamente incomprimibile, un poco di acqua deve spostarsi per far posto al sasso, determinando un innalzamento del livello dell’acqua nella zona circostante il punto di caduta del sasso (figura 6.a). L’acqua così accumulata “ricade” nell’acqua sottostante, spostandola a sua volta in una re gione via via più esterna: si dà così origine a un’onda che si propaga verso l’esterno (figure 6.b e 6.c). Nel caso delle onde che si propagano sulla superficie di un liquido incomprimibile, quindi, il moto delle particelle del mezzo in cui l’onda si propaga avviene sia in direzione verticale (le varie porzioni di acqua interessate dall’onda vengono prima innalzate e poi ricadono verso il basso) sia orizzontale (per far posto alle porzioni di acqua sovrastanti che ricadono verso il basso, l’acqua sottostante viene spostata lateralmente): quando passa l’onda, un corpo galleggiante acquista un moto a forma di ellisse, corrispondente alle due componenti del moto oscillatorio (figura 7). a) b) c) Figura 6. a) Quando un sasso cade nell’acqua ne sposta una certa porzione, provocando un innalzamento dell’acqua intorno a sé (porzioni evidenziate in blu); b) queste porzioni di acqua, ricadendo a loro volta verso il basso, spostano e innalzano altra acqua (porzioni evidenzaite in rosso); c) il moto delle porzioni di acqua continua dando luogo a una serie di anelli concentrici che si propagano verso l’esterno. Figura 7. Le onde che si propagano sulla superficie dell’acqua hanno movimenti allo stesso tempo trasversali e longitudinali, che si compongono dando luogo a un movimento ellittico. - E.10 Onde monodimensionali, bidimensionali e tridimensionali Gli esempi di onde che abbiamo considerato comprendono casi di onde che si propagano in un mezzo caratterizzato da un’unica dimensione, come per esempio la corda tesa; onde che si propagano su una superficie a due dimensioni, come le onde sulla superficie dell’acqua; e onde che si propagano in un mezzo tridimensionale, come le onde sonore nell’aria. Si parla allora rispettivamente di onde monodimensionali, bidimensionali e tridimensionali. cresta gola Figura 8. Le linee che individuano la cresta e le gole di un’onda bidimensionale. a) b) Figura 9. a) I fronti d’onda paralleli di un’onda piana; b) i fronti d’onda concentrici di un’onda sferica: si osservi come una piccola porzione di un’onda sferica lontana dalla sorgente (in colore più scuro) può essere approssimata da un’onda piana. In un’onda bidimensionale che si propaga sulla superficie di uno specchio d’acqua chiamiamo cresta dell’onda la linea che, a un dato istante, congiunge tutti i punti in cui l’onda assume la massima altezza, e gola la linea che congiunge i punti in cui l’onda assume la massima - E.11 depressione (figura 8). In modo analogo si può parlare di creste e di gole anche nel caso di onde monodimensionali o tridimensionali. L’insieme dei punti contigui che in un dato istante pre sentano una perturbazione dello stesso valore è detto fronte d’onda. Nelle onde bidimensionali e tridimensionali la direzione di propagazione dell’onda è sempre perpendicolare ai fronti d’onda. Casi particolari di onde tridimensionali sono le onde piane, nelle quali la perturbazione si propaga in ogni punto nella stessa direzione e con la stessa velocità e i fronti d’onda sono piani paralleli (figura 9.a), e le onde sferiche, nelle quali la perturbazione si propaga con la stessa velocità in tutte le direzioni a partire da una sorgente puntiforme centrale e i fronti d’onda sono superfici sferiche concentriche (figura 9.b). Una piccola porzione di un’onda sferica lontana dalla sorgente può essere approssimata da un fronte d’onda piano. 2. La descrizione matematica di un’onda monodimensionale È necessario passare da una descrizione solo qualitativa della propagazione delle onde, come quella presentata nel paragrafo precedente, a una trattazione quantitativa. Ci proponiamo quindi, in questo paragrafo, di descrivere la propagazione di un’onda in termini mate matici. Le equazioni matematiche che descrivono la propagazione di un’onda tridimensionale qualsiasi sono piuttosto complesse, e presuppongono nozioni di matematica di livello superiore. Affronteremo quindi in modo dettagliato la trattazione matematica della propagazione di un’onda limitandoci a considerare il caso di un’onda monodimensionale che si propaga in un mezzo omogeneo. Nel far questo, considereremo successivamente: a) come la forma che l’onda assume in un determinato istante può essere descritta mediante una funzione matematica; b) come la propagazione di quest’onda al variare del tempo può essere descritta mediante una funzione matematica; c) qual è la legge del moto di ogni singolo punto del mezzo materiale in cui l’onda si propaga. La forma dell’onda Come è possibile esprimere in termini matematici la “forma” dell’onda, ossia l’aspetto che presenterebbe il mezzo nel quale l’onda si propaga se ne facessimo una fotografia a un determinato istante t? Consideriamo un’onda trasversale che si propaga lungo una corda tesa coincidente con l’asse x di un sistema di assi cartesiani, e supponiamo che la vibrazione della corda avvenga nella direzione dell’asse y (figura 10). Consideriamo la forma della corda in un determinato istante t, per esempio t0 = 0. Essa può essere descritta mediante una funzione matematica. y = f(x) (1) Si possono presentare diverse situazioni. Se la perturbazione riguarda solo una piccola porzione della corda, come nel caso della figura 10.a, l’onda prende il nome di impulso. Se la perturbazione riguarda tutta la corda, come nel caso rappresentato nella figura 10.b, si parla di treno d’onde. Se l’andamento della funzione f(x) è periodico, ossia se la forma dell’onda si ripete in successive porzioni della corda come nel caso mostrato nella figura 10.c, si ha un treno d’onde periodico. In un treno d’onde periodico le oscillazioni si ripetono uguali in punti della corda distanziati da una distanza λ: questa distanza si dice lunghezza d’onda. Il caso più semplice di funzione periodica è la funzione sinusoidale y = ym sen(kx) - E.12 - a) impulso v b) treno d’onde v c) treno d’onde periodico v λ creste gole d) onda armonica semplice λ v Figura 10. Vari tipi di onde, in relazione alla loro forma e periodicità. Per le onde periodiche si definisce una lunghezza d’onda λ, pari alla distanza tra due gole o due creste successive. o più in generale, nel caso in cui il valore della perturbazione nell’origine x = 0 non sia nullo, y = ym sen(kx + ϕ0) (2) dove ϕ0 è una costante scelta in modo opportuno. Un treno d’onde rappresentato dalla funzione (2) si dice onda armonica semplice (figura 10.d). La figura 11 mostra come varia la forma dell’onda al variare dei valori dei vari para metri che compaiono nella formula (2): la costante ym rappresenta l’ampiezza della sinusoide che corrisponde al massimo spostamento della corda dalla posizione non perturbata, mentre k prende il nome di numero d’onda. Il valore che assume l’argomento della funzione seno si dice fase dell’onda, mentre la costante ϕ0 è la costante di fase. Essa rappresenta la fase dell’onda nell’origine x = 0. Nel Sistema Internazionale la fase e la costante di fase si misurano in radianti. Per la periodicità della funzione seno, a un incremento di 2 π radianti della fase dell’onda corrisponde, sull’asse x, uno spostamento ∆x pari a una lunghezza d’onda λ. Poiché per l’incremento della fase dell’onda si ha ∆(kx + ϕ0) = k∆x, vale la seguente relazione tra la lunghezza d’onda λ e il numero d’onda k: k∆x = kλ = 2π ossia k = 2π λ (3) La funzione (2) può quindi essere scritta nella forma 2π y = y m sen x+ ϕ 0 λ (4) Lo studio delle onde armoniche semplici descritte dalla funzione sinusoidale nella forma (2) o (4) è particolarmente importante perché, come vedremo più avanti, un’onda periodica qualsiasi può essere descritta come somma di onde armoniche semplici. - E.13 - a) λ y ym x 0 y = ym sen(kx) b) λ y y'm = 0,5 ym x 0 y = 0,5 ymsen(kx) λ' = λ/ 2 y c) ym x 0 y = ym sen(2kx) y d) ym sen(ϕ0) ym x 0 y = ym sen(kx + ) ϕ0 Figura 11. La rappresentazione di un’onda armonica y = y m sen (kx + ϕ0) che si propaga lungo l’asse x. Il valore di ym determina l’ampiezza dell’onda (b), il valore del numero d’onda k determina la lunghezza d’onda λ (c), mentre il valore della costante di fase ϕ0 determina la posizione dell’onda rispetto all’origine degli assi (d). - E.14 La propagazione dell’onda Consideriamo ora come è possibile esprimere matematicamente la propagazione di quest’onda al passare del tempo. Supponiamo che l’onda si propaghi lungo la corda con velocità v costante senza cambiare forma. Queste ipotesi corrispondono effettivamente a quanto si verifica se la corda è omogenea e perfettamente flessibile. All’istante t ogni cresta dell’onda si troverà spostata di un tratto vt rispetto alla sua posizione iniziale, come è mostrato nella figura 12. La funzione che descrive la forma dell’onda sarà ora y = f(x – vt) (1a) che si ottiene dalla funzione (1) y = f(x) (1) sostituendo (x – vt) alla variabile x. Al tempo t la funzione (1a) ha infatti nel punto x = vt lo stesso valore y = f(0) che la funzione (1) aveva nel punto x = 0 al tempo t = 0. Qualsiasi funzione che abbia la forma (1a) descrive un’onda che si propaga lungo la corda nel verso dell’asse x, così come qualsiasi funzione che abbia la forma y = f(x + vt) (1b) descrive un’onda che si propaga lungo la corda nel verso opposto a quello dell’asse x, ossia con velocità –v. a) y t=0 x xmax b) y vt t xmax x Figura 12. a) La forma di un impulso che si propaga con velocità v lungo una corda può essere descritta, in un determinato istante, da una funzione y = f(x), con un massimo nella posizione xmax. b) Dopo un tempo t, l’impulso si è spostato di un tratto pari a vt, e la funzione che descrive la forma dell’onda è y = f (x – vt). Una generica funzione y = f(x – vt) può quindi descrivere un impulso o un treno d’onde di forma qualsiasi che si propaga nel verso dell’asse x lungo la corda. Se la funzione f è periodica, essa descrive un treno d’onde periodico. Un’onda periodica descritta dalla formula (4) si dice onda armonica semplice. La funzione che descrive la propagazione di un’onda armonica semplice assume quindi la forma: 2π ( x − vt ) + ϕ 0 y = y m sen λ (5) Questa formula rappresenta l’espressione generale di un’onda armonica monodimensionale che si propaga nel verso positivo dell’asse x del sistema di riferimento. Poiché v è la velocità con cui si muovono lungo l’asse x punti caratterizzati da un valore di fase costante (per esempio, le creste dell’onda), essa si dice velocità di fase. - E.15 L’espressione matematica dell’onda al variare del tempo Se anziché la forma che l’onda assume in un determinato istante t, espressa dalle formule (1a) o (1b), ci interessasse esprimere come un determinato punto x della corda si muove, ossia ci interessasse la sua legge oraria, come potremmo procedere? Consideriamo un‘onda armonica semplice come quella descritta dalla formula (5). Se ci poniamo in un punto x0 fisso avremo: 2π ( x0 − vt ) + ϕ 0 = y = y m sen λ 2π v 2π = y m sen x0 − t + ϕ 0 = λ λ 2π v 2π = y m sen − t+ x0 + ϕ 0 λ λ Se scegliamo opportunamente il punto x0 questa espressione può essere semplificata e resa più chiara. Poniamo per esempio x0 = λ/4. Si ha allora: 2π v 2π y = y m sen − t+ x0 + ϕ 0 = λ λ 2π v 2π λ = y m sen − t+ + ϕ 0 = λ λ 4 2π v π = y m sen − t − ϕ 0 = λ 2 (6) 2π v = y m cos t − ϕ 0 λ Poniamo ora ω = 2π v λ (7) e sostituiamo nella formula (6), in modo da ottenere y = y m cos(ω t − ϕ 0 ) (8) Questa equazione è la legge oraria per un moto armonico di ampiezza ym e pulsazione ω (si veda un ripasso sul moto armonico nel prossimo paragrafo). Quando la forma dell’onda è sinusoidale, quindi, ogni elemento della corda si muove di moto armonico con la stessa ampiez za dell’onda. Diciamo che l’onda ha una pulsazione ω e, come nel caso del moto armonico, definiamo la frequenza ν dell’onda come ν = ω 2π (9) e il periodo T dell’onda come l’inverso della frequenza ν: T = 1 2π = ν ω (10) - E.16 Come nel caso del moto armonico, la pulsazione ω si misura nel Sistema Internazionale in radianti al secondo, la frequenza ν in hertz e il periodo T in secondi. Sostituendo la relazione (7) nella (9) si ricava: ν = 1 2π v v = 2π λ λ o, equivalentemente, νλ = v (11) Questa è la relazione fondamentale tra la velocità di propagazione v, la frequenza ν e la lunghezza d’onda λ di un’onda. Può essere espressa dicendo che il prodotto della frequenza di un’onda per la sua lunghezza d’onda è pari alla velocità di propagazione dell’onda. Questa relazione vale non solo per le onde armoniche, ma per qualsiasi treno d’onde periodico. Notiamo infine che la definizione del numero d’onda k e della pulsazione ω permettono di scrivere la funzione (5) 2π ( x − vt ) + ϕ 0 y = y m sen λ (5) in una forma particolarmente concisa. Si ha infatti 2π ( x − vt ) + ϕ 0 = y m sen 2π x − 2π v t + ϕ 0 y = y m sen λ λ λ Quindi, tenendo conto della definizione (3) del numero d’onda e della definizione (7) della pulsazione, si ha: k = 2π λ (3) ω = 2π v λ (7) Possiamo allora esprimere un’onda sinusoidale che si propaga lungo la corda nel verso positivo dell’asse x con l’espressione y = y m sen( kx − ω t + ϕ 0 ) (12a) Per un’onda sinusoidale che si propaga lungo la corda in verso contrario all’asse x si ha invece y = y m sen( kx + ω t + ϕ 0 ) (12b) Problema 1. Un’onda armonica si propaga lungo una corda tesa con un’ampiezza di 3,0 cm, un periodo di 0,25 s e una velocità di 5,0 m/s. Un sistema di riferimento cartesiano è disposto con l’asse x nella direzione della corda, diretto nel verso di propagazione dell’onda. All’istante t = 0 l’ampiezza dell’onda nell’origine del sistema di riferimento è y = 1,5 cm. Scrivere la funzione che descrive l’onda, utilizzando unità di misura del Sistema Internazionale. Dato che conosciamo il periodo T = 0,25 s e la velocità di fase v = 5,0 m/s, mediante la formule (11) e (10) possiamo calcolare la lunghezza d’onda: λ = v = vT = (5,0 × 0,25) m = 1,25 m ν Dalla formula (3) ricaviamo allora il numero d’onda: - E.17 - 2π 2 × 3,14 -1 = m = 5,0 m -1 λ 1,25 k = La formula (7) ci fornisce invece la pulsazione: ω = 2π v 2 × 3,14 × 5,0 = rad s -1 = 25 rad s -1 λ 1,25 Poiché l’onda si propaga nel verso positivo dell’asse x, la funzione che la descrive avrà la forma (12a). Ponendo l’ampiezza ym = 3,0 cm = 0,030 m si ha: y = y m sen( kx − ω t + ϕ 0 )= 0,030 sen(5,0 x − 25t + ϕ 0 ) Il valore della costante di fase ϕ0 è determinato dalla condizione che per x = 0 e t = 0 si abbia y = 1,5 cm = 0,015 m. Inserendo questi valori nella funzione d’onda si ha: 0,015 = 0,030 sen ϕ0 ossia sen ϕ0 = 0,50 e quindi ϕ0 = π/6 = 0,52 rad L’equazione dell’onda è quindi y = 0,030 sen(5,0 x − 25t + 0,52) Le figure 13.a e 13.b mostrano i grafici corrispondenti alla forma dell’onda per t = 0 e alla legge oraria del punto della corda di coordinata x = 0. Occorre sempre tenere presente, in questo caso come in tutti gli altri casi che si presenteranno nel seguito, che questi due grafici hanno un aspetto simile ma un significato essenzialmente diverso: il grafico della figura 13.a rappresenta la forma che assume la corda in un determinato istante, mentre il grafico della figura 13.b rappresenta la legge oraria di un punto della corda, e descrive quindi il moto di un punto della corda in funzione del tempo. b) y (m) a) 0,04 y (m) 0,04 0,03 0,03 0,02 0,02 0,01 0,01 0 0 -0,01 -0,01 -0,02 -0,02 -0,03 -0,03 -0,04 -0,04 0 1 x (m) 2 3 0 1 t (s) 2 3 Figura 13. a) Rappresentazione dell’onda armonica al tempo t = 0, in funzione della posizione x lungo la corda. b) Legge oraria del punto x = 0. - E.18 - 3. Il moto circolare uniforme e il moto armonico (ripasso) Sono frequenti gli esempi di moto lungo una traiettoria circolare. Un punto di una ruota che gira intorno al suo asse, un pianeta che ruota intorno al Sole lungo un’orbita circolare, una persona sul seggiolino di una giostra in movimento, sono esempi di corpi in moto circolare. Il caso più semplice di moto circolare è quello del moto circolare uniforme, nel quale il modulo v della velocità del punto materiale resta costante. Prima però conviene dare alcune utili definizioni. Il moto circolare uniforme ha una caratteristica che lo distingue dal moto rettilineo (uniforme o accelerato): un punto materiale che si muove lungo una traiettoria circolare ripassa più volte nello stesso punto della traiettoria. La valvolina della ruota della bicicletta, per esempio, nel sistema di riferimento della bicicletta ripassa a ogni giro nel punto più basso della sua traiettoria, in corrispondenza del punto di contatto della ruota con il terreno. Il moto circolare uniforme è quindi un esempio di moto periodico, ossia di un moto nel quale un punto materiale ripassa periodicamente, a intervalli regolari di tempo, in ogni punto della sua traiettoria. Definizione di periodo e di frequenza Nel caso di un moto periodico si dice periodo e si indica generalmente con la lettera T maiuscola l’intervallo di tempo compreso tra due successivi passaggi nello stesso punto della traiettoria. L’unità di misura del periodo è ovviamente la stessa utilizzata per misurare gli intervalli di tempo, ossia il secondo. Il numero di passaggi nell’unità di tempo nello stesso punto della traiettoria si dice frequenza, e si indica generalmente con la lettera greca ν. Nel caso del moto circolare, la frequenza corrisponde al numero di giri al secondo. Tra la frequenza ν e il periodo T si ha la seguente relazione: ν = 1 T (13) Un corpo che fa un giro in un secondo (T = 1 s), infatti, passa 1 volta al secondo nello stesso punto della traiettoria; un corpo che fa un giro in mezzo secondo (T = 0,5 s), passa 2 volte nello stesso punto della traiettoria, ecc. La frequenza è quindi l’inverso del periodo. L’unità di misura della frequenza, ossia la frequenza di un moto periodico con periodo T = 1 s, corrisponde all’inverso del secondo (s -1) e nel Sistema Internazionale si dice hertz (simbolo Hz), dal nome del fisico tedesco Heinrich Rudolph Hertz (1857-1894). La velocità angolare Come possiamo descrivere il moto di un punto materiale P che si muove di moto circolare? Il modo più semplice è ricorrere a un sistema di coordinate polari, con l’origine O nel centro della circonferenza di raggio r corrispondente alla traiettoria del punto materiale P. La distanza ρ di P dall’origine O sarà ovviamente sempre uguale al raggio r della traiettoria circolare. L’angolo θ tra la posizione di P e l’asse x sarà invece una funzione del tempo, che dipende da come il punto materiale si muove lungo la traiettoria circolare (figura 14). In un dato intervallo di tempo ∆t, l’angolo che descrive la posizione di P varierà di ∆θ. In analogia con quanto abbiamo fatto quando abbiamo definito la velocità media e la velocità istantanea, chiamiamo velocità angolare media nell’intervallo di tempo ∆t il rapporto ω m = ∆θ ∆t (14) - E.19 e velocità angolare istantanea, o semplicemente velocità angolare, il limite della velocità angolare media quando l’intervallo di tempo su cui è calcolata tende a zero: ω = lim ∆ t→ 0 ∆θ ∆t (15) L’unità di misura della velocità angolare nel Sistema Internazionale è il radiante al secondo (rad/s). Normalmente il sistema di coordinate polari è scelto in modo che la velocità an golare risulta positiva per un moto in senso antiorario, e negativa per un moto in senso orario. P r ∆θ O x Figura 14. Scelto un sistema di coordinate polari con l’origine O nel centro della traiettoria circolare di raggio r di un punto materiale P, la distanza di P dall’origine O è sempre uguale al raggio r della traiettoria circolare. La posizione di P è quindi specificata dall’angolo θ tra la posizione di P e l’asse x, che dipende da come il punto materiale si muove lungo la traiettoria circolare. La legge oraria del moto circolare uniforme Consideriamo allora il caso più semplice di moto circolare, ossia il moto circolare uniforme: è definito come il moto di un punto materiale che si muove su una traiettoria circolare di raggio r con velocità v costante in modulo (la velocità, intesa come vettore, in questo caso non è costante, perché essendo la traiettoria circolare la direzione del vettore velocità v cambia continuamente). Qual è la legge oraria di un punto materiale P che si muova di moto circolare uniforme? Consideriamo prima il caso più semplice in cui il punto materiale P si trovi al tempo t = 0 sull’asse polare x. Poiché il modulo v della velocità è costante, la distanza l che il corpo P percorre in un intervallo di tempo t, misurata lungo la circonferenza, risulta proporzionale a t: l = vt (16) Ricordiamo che la misura in radianti di un angolo θ corrisponde al rapporto tra la lunghezza l dell’arco ad esso associato e il raggio r della circonferenza: θ = l r (17) Sostituendo in questa formula il valore di l dato dalla relazione (16), otteniamo la relazione che esprime come nel moto circolare uniforme l’angolo θ varia in funzione del tempo t: θ = v t = ωt r (18) Il rapporto costante ω = v r (19) - E.20 tra la velocità del punto materiale e il raggio della traiettoria circolare è in questo caso sempre uguale alla velocità angolare definita dalla formula (14). Possiamo convincercene, riscrivendo questa relazione per un intervallo di tempo qualsiasi ∆t = t2 – t1: ∆θ = θ2 – θ1 = ω (t2 – t1) = ω ∆t e quindi ω = ∆θ ∆t che coincide con la definizione (14) di velocità angolare. La formula (18) è quindi la legge oraria per un punto materiale P che si muove di moto circolare uniforme e che si trova al tempo t = 0 sull’asse polare x (nel moto circolare la legge oraria si esprime quindi nella forma θ = θ(t) anziché con x = x(t) come nel caso del moto rettilineo). Se poi la posizione del punto materiale P al tempo t = 0 non coincide con l’asse polare x, ma è data da un angolo θ0, allora la legge oraria assume la forma più generale θ = θ0 + ωt (20) Conviene anche ricavare alcune utili relazioni che legano tra loro le grandezze caratteristiche del moto circolare uniforme. Se è nota la velocità angolare ω di un corpo in moto circolare uniforme lungo una traiettoria di raggio r, dalla formula (19) si ricava immediatamente la velocità v, che per evitare confusioni, è detta a volte velocità tangenziale: v = rω (21) Poiché inoltre il periodo T è il tempo impiegato a percorrere l’intera lunghezza della circonferenza l = 2πr, la velocità tangenziale v è uguale anche a v = 2π r = 2π ν r T (22) e la velocità angolare ω risulta quindi data anche da ω = 2π = 2π ν T (23) Il moto armonico è strettamente legato al moto circolare uniforme. Anche il moto armonico si incontra spesso in natura: le piccole oscillazioni di un pendolo, il moto delle onde sulla superficie del mare, le vibrazioni dell’aria che percepiamo come suoni, sono tutti esempi di moti armonici. Il moto armonico è definito come la proiezione del moto circolare uniforme su un diametro della circonferenza. Consideriamo la figura 15. Il punto P si muove di moto circolare uniforme su una circonferenza di raggio r e centro O. Il punto Q, proiezione di P sull’asse delle ascisse x, si muove allora di moto armonico. La legge oraria del punto Q che si muove di moto armonico può essere ricavata in modo semplice sempre considerando la figura 15. Indichiamo con θ l’angolo formato con l’asse x dalla retta uscente da O e passante per P. L’ascissa x di Q è data, come sappiamo, dal prodotto del raggio r della traiettoria circolare per il coseno dell’angolo θ: x = r cos θ (24) - E.21 y r yP P θ -r O Q r x r cos θ -r Figura 15. Dato un punto materiale P che si muove di moto circolare uniforme, il moto armonico è definito come il moto della sua proiezione Q su un diametro della circonferenza. Ricordiamo ora che nel moto circolare uniforme con posizione iniziale θ0 coincidente con l’asse x l’angolo θ è dato dalla formula (18): θ = ωt (18) Sostituendo la formula (18) nella formula (24) si ottiene allora x = xm cos (ωt) (25) dove con xm abbiamo indicato l’ascissa massima raggiunta da Q nel suo moto, uguale al raggio r della traiettoria circolare di P. Questa equazione è la legge oraria del moto armonico. Se il punto materiale P, anziché partire dalla posizione iniziale θ0 = 0, si trova al tempo t0 in una posizione θ0 qualsiasi, l’equazione del moto del punto Q assume la forma più generale x = xm cos (ωt + θ0) (26) Anche nel caso del moto armonico si parla di un periodo T, ossia del tempo necessario perché il corpo ritorni nella stessa posizione, muovendosi nello stesso verso; e di una frequenza ν = 1/T, corrispondente al numero di oscillazioni complete nell’unità di tempo. La quantità ω = 2πν, corrispondente alla velocità angolare del moto circolare uniforme, nel caso del moto armo nico prende il nome di pulsazione. L’argomento della funzione coseno si dice fase dell’oscillazione e quindi l’angolo θ0 costituisce la fase iniziale. La quantità xm, infine, si dice ampiezza del moto armonico. 4. L’intensità di un’onda elastica Ogni volta che si propaga un’onda, un corpo compie del lavoro su altri corpi che si pos sono anche trovare in punti molto lontani; ciò avviene sia nel caso delle onde elastiche, sia nel caso delle onde elettromagnetiche come la luce. Consideriamo per esempio una corda tesa a cui sia legata, a metà della sua lunghezza, una massa m. La corda è inizialmente ferma e l’energia cinetica della massa m è nulla. Diamo quindi un leggero colpo a un estremo della corda, generando un impulso che si propaga lungo di essa. Quando l’impulso raggiunge la massa m, le imprime un moto oscillatorio: nel momento in cui la massa inizia a muoversi con una velocità v, ha acquistato un’energia cinetica ½mv2 che le è stata trasmessa dall’onda. Possiamo quindi dire che si ha una propagazione di energia da un punto della corda a un altro punto della corda. Anche nel caso delle onde elettromagnetiche, come per esempio la luce, si ha un trasporto di energia: un corpo esposto al Sole si scalda, perché assorbe parte dell’energia trasportata dalla luce emessa dalla superficie calda del Sole. - E.22 Possiamo enunciare un risultato generale, valido per qualsiasi tipo di onde: la quantità di energia trasportata da un’onda nell’unità di tempo (ossia la potenza dell’onda) è diret tamente proporzionale al quadrato dell’ampiezza dell’onda e al quadrato della sua frequenza. Nel caso di un’onda trasversale che si propaga lungo una corda tesa, per esempio, la potenza P dell’onda risulta data da P= 1 2 µ vω 2 y m 2 (27) dove µ è la densità lineare di massa della corda, ossia la sua massa per unità di lunghezza, v è la velocità di propagazione dell’onda, ym l’ampiezza dell’onda e ω la pulsazione legata alla frequenza ν dell’onda dalla relazione ω = 2πν. La potenza trasmessa dall'onda risulta quindi proporzionale al quadrato della sua ampiezza. L’intensità di un’onda tridimensionale Consideriamo ora il caso di un’onda che si propaga nello spazio a partire da una sor gente S puntiforme, ossia da una sorgente che abbia dimensioni trascurabili rispetto alle altre distanze considerate. L’onda viene emessa in maniera tale che la sua energia è distribuita in uguale misura in tutte le direzioni (figura 16). Supponiamo che non vi siano effetti dissipativi e che quindi l’energia dell’onda si mantenga costante, senza perdite, man mano che l’onda si pro paga. S Figura 16. Un’onda sferica si propaga da una sorgente S di dimensioni trascurabili con la stessa intensità in tutte le direzioni. Più che all’energia complessivamente trasportata dall’onda, in molti casi pratici siamo interessati alla quantità di energia che nell’unità di tempo attraversa una superficie posta a una distanza r dalla sorgente. Definiamo allora l’intensità I di un’onda come la quantità di energia che nell’unità di tempo attraversa un’unità di superficie perpendicolare alla direzione di propagazione dell’onda. Nel Sistema Internazionale l’unità di misura dell’intensità è il watt al metro quadrato (W/m2). Dalla definizione dell’intensità I, risulta chiaro che se l’onda si propaga uniformemente in tutte le direzioni la sua intensità I a una distanza r dalla sorgente S si ottiene dividendo la potenza P complessivamente emessa dalla sorgente S per l’area A = 4πr2 del guscio sferico di raggio r: - E.23 - I= P P = A 4π r 2 (28) L’intensità di un’onda sferica che si propaga senza effetti dissipativi diminuisce quindi al crescere della distanza r dalla sorgente come l’inverso del quadrato della distanza r. In funzione dell’ampiezza ym dell’onda e della sua pulsazione ω l’intensità I di un’onda elastica tridimensionale è espressa da una formula molto simile alla formula (27) relativa alla potenza trasmessa da un’onda che si propaga lungo una corda tesa. Si ha infatti I= 1 2 ρ vω 2 y m 2 (29) dove ρ è la densità del mezzo in cui l’onda si propaga. L'intensità dell'onda risulta quindi propor zionale al quadrato della sua ampiezza. Ciò è vero non solo nel caso delle onde elastiche, ma anche per le onde elettromagnetiche come la luce. Problema 2. Nel problema 1 abbiamo ricavato la funzione che descrive un’onda armonica che si propaga lungo una corda tesa con un’ampiezza di 3,0 cm, un periodo di 0,25 s e una velocità di 5,0 m/s. Supponendo che la corda sia lunga 8,0 m e abbia una massa di 0,40 kg, calcola re la potenza trasmessa dall’onda. Possiamo calcolare la potenza P trasmessa dall’onda utilizzando la formula (8) nella quale poniamo i seguenti valori: m 0,40 = kg/m = 0,050 kg/m l 8,0 - densità lineare di massa della corda µ = - velocità v = 5,0 m/s - pulsazione ω = - ampiezza ym = 3,0 cm = 0,030 m 2π 2 × 3,14 -1 = s = 25 s -1 T 0,25 La potenza trasmessa dall’onda è quindi P = 1 1 2 µ vω 2 y m = × 0,050 × 5,0 × 25 2 × 0,030 2 W = 0,070 W 2 2 Problema 3. Una sorgente emette un’onda sferica tridimensionale con una potenza P = 500 W. Qual è l’intensità dell’onda a una distanza di 300 m dalla sorgente? Per calcolare l’intensità I dell’onda a una distanza r = 300 m dalla sorgente è necessario applicare la formula (28), dividendo la potenza P emessa dalla sorgente per l’area A della superficie sferica di raggio r = 300 m. Si ha quindi: I= P P 500 = = W/m 2 = 4,42 × 10 − 4 W/m 2 2 A 4π r 2 4 × 3,14 × 300 - E.24 - Esercizi 1. Che cosa si intende per lunghezza d'onda della luce, e come è correlata con la frequen za e la velocità di propagazione? 2. Scrivere l'equazione fondamentale per la propagazione delle onde. Data la velocità della luce nell'aria di 3 × 108 m/s, determinare la lunghezza d'onda della luce rossa, gialla e blu di frequenze pari a rosso giallo blu 395 × 1012 Hz 509 × 1012 Hz 617 × 1012 Hz Esprimere le lunghezza d'onda in nanometri, micron e metri. 3. Una serie di onde di lunghezza d'onda pari a 100 cm si propaga lungo una corda tesa su cui tre nodi A, B e C oscillano rispettivamente alle distanze di 1,5, 2,25 e 3,8 m da un punto dato. In che direzione ogni nodo si muove quando una cresta dell'onda passa per il punto dato? Indicare anche per ogni nodo se si trova sopra o sotto la sua posizione media. 4. Che cosa si intende per moto armonico semplice? Definire i termini periodo, ampiezza e fase. 5. Disegnare il grafico del moto armonico semplice rappresentato da y = 3 sen 2π t . 8 6. Una particella è animata simultaneamente lungo la stessa linea retta da due moti armo 2π t π 2π t − . Disegnare un granici semplici rappresentati da y = 3 sen e y = 5 sen 2 6 8 fico che mostri il moto risultante. 7. Trovare graficamente il moto risultante di una particella animata da due moti armonici semplici perpendicolari di uguale periodo e ampiezza, che differiscono in fase di: (a) (b) (c) (d) (e) (f) 0 π/4 π/2 3π/4 π 3π/2 8. Ripetere la costruzione grafica dell'esercizio 7 nel caso in cui uno dei due moti abbia ampiezza doppia dell'altro. 9. Una particella B che si muove di moto armonico semplice dato dall'espressione y = 8 sen 6πt emette onde in un mezzo continuo che si propagano alla velocità di 200 cm/s. Trovare lo spostamento di una particella che si trova a 150 cm da B un secondo dopo che è iniziata l'oscillazione di B. 10. Se un piccolo galleggiante sulla superficie di un lago si vede oscillare su e giù con una frequenza di 2,5 Hz, a che velocità si propagano le onde sull'acqua se la loro lunghezza d'onda è 700 mm? 11. Un'onda trasversale è descritta dall'equazione y = 5,0 sen (0,02πx + 4,0πt) dove x e y sono in millimetri e t in secondi. Calcolare: - E.25 (a) la frequenza dell'onda (b) l'ampiezza dell'onda (c) la lunghezza d'onda 12. Una particella che si muove di moto armonico semplice dato dall'equazione y = 3 sen (2t/6 + α) è spostata di 2 unità quando t = 0. Trovare: (a) la fase α quando t = 0 (b) la differenza di fase tra due posizioni qualsiasi separate in tempo di 1 s (c) il tempo necessario per raggiungere uno spostamento di 2,5 13. Quattro moti armonici semplici della stessa ampiezza e frequenza sono sovrapposti. Se la differenza di fase tra due moti successivi è sempre la stessa, trovare la differenza di fase per la quale l'effetto risultante è nullo. 14. Un’onda armonica è descritta dalla funzione y = 37 sen(5x – 8t). Indicare a) il numero d’onda, b) la pulsazione, c) la costante di fase. (Si utilizzano unità del Sistema Internazionale) 15. Un’onda armonica è descritta dalla funzione y = 5 sen(2x + 3t + 1). Indicare a) l’ampiezza, b) la pulsazione, c) la costante di fase. (Si utilizzano unità del Sistema Internazionale) 16. Un’onda armonica è descritta dalla funzione y = 2 sen(4x – 3t + 2). Qual è la lunghezza d’onda? (Si utilizzano unità del Sistema Internazionale) 17. Un’onda armonica è descritta dalla funzione y = 45 sen(0,14x + 65t). Qual è la frequenza dell’onda? (Si utilizzano unità del Sistema Internazionale) 18. Un’onda armonica è descritta dalla funzione y = 30 sen(40x + 3t + 1). Qual è la velocità di fase dell’onda? (Si utilizzano unità del Sistema Internazionale) 19. Un’onda armonica è descritta dalla funzione y = 8 sen(0,56x – 45t + 0,34). Qual è la velocità di fase dell’onda? (Si utilizzano unità del Sistema Internazionale) 20. Un’onda sonora che si propaga con una velocità di fase di 340 m/s ha una frequenza di 1.500 Hz. Qual è la sua lunghezza d’onda? 21. Un’onda si propaga lungo una corda tesa con una velocità di fase di 1,5 m/s. La frequenza è di 3,7 Hz. Qual è la sua lunghezza d’onda? 22. Sulla superficie del mare si propagano con una velocità di 2,4 m/s onde che hanno una lunghezza di 20 m. Qual è la loro frequenza? 23. Le onde elettromagnetiche che percepiamo come luce verde hanno una lunghezza d’onda di circa 500 nm e si propagano nel vuoto con una velocità di 3 × 108 m/s. Qual è la loro frequenza? 24. Su una corda tesa viene generata un’onda con una frequenza di 3,6 Hz. La lunghezza d’onda risulta pari a 2,6 m. Qual è la velocità di fase dell’onda? 25. Viene generata un’onda sonora con una frequenza di 2.500 Hz in un gas, e si misura una lunghezza d’onda di 12,6 cm. Qual è la velocità del suono nel gas? 26. Un’onda armonica si propaga lungo una corda tesa con un’ampiezza di 2,5 cm, un periodo di 0,12 s e una velocità di 7,0 m/s. Un sistema di riferimento cartesiano è disposto con l’asse x nella direzione della corda, diretto nel verso di propagazione dell’onda. All’istante t = 0 l’ampiezza dell’onda nell’origine del sistema di riferimento è y = 0,50 cm. - E.26 Scrivere la funzione che descrive l’onda, utilizzando unità di misura del Sistema Internazionale. 27. Un’onda armonica si propaga lungo un filo di acciaio teso con un’ampiezza di 1,3 cm, un periodo di 0,034 s e una velocità di 12,0 m/s. Un sistema di riferimento cartesiano è disposto con l’asse x nella direzione della corda, diretto nel verso di propagazione dell’onda. All’istante t = 0 l’ampiezza dell’onda nell’origine del sistema di riferimento è y = 0,35 cm. Scrivere la funzione che descrive l’onda, utilizzando unità di misura del Sistema Internazionale. 28. La membrana di un altoparlante vibra con un moto armonico di ampiezza pari a 3,0 × 10-3 mm e una frequenza di 2.000 Hz. All’istante t = 0 si trova nella posizione di massimo spostamento. Scrivere l’equazione che descrive il moto delle particelle di aria a una distanza di 40 cm dall’altoparlante, supponendo che l’ampiezza dell’onda resti costante e che la velocità del suono sia di 340 m/s. Utilizzare unità di misura del Sistema Internazionale. 29. La membrana di un altoparlante vibra con un moto armonico di ampiezza pari a 2,5 × 10-3 mm e una frequenza di 1.200 Hz. All’istante t = 0 si trova nella posizione di massimo spostamento. Scrivere l’equazione che descrive il moto delle particelle di aria a una distanza di 50 cm dall’altoparlante, supponendo che l’ampiezza dell’onda resti costante e che la velocità del suono sia di 340 m/s. Utilizzare unità di misura del Sistema Internazionale. 30. Una corda tesa vibra con una frequenza di 30 Hz e un’ampiezza di 3,5 cm. La velocità di propagazione dell’onda è di 15 m/s. Un sistema di riferimento cartesiano è disposto con l’asse x nella direzione della corda, diretto nel verso di propagazione dell’onda. All’istante t = 0 nell’origine del sistema di riferimento si ha una cresta dell’onda. Scrivere la funzione che descrive la forma dell’onda all’istante t = 2 s, utilizzando unità di misura del Sistema Internazionale. 31. Una corda tesa vibra con una frequenza di 120 Hz e un’ampiezza di 0,63 cm. La velocità di propagazione dell’onda è di 56 m/s. Un sistema di riferimento cartesiano è disposto con l’asse x nella direzione della corda, diretto nel verso di propagazione dell’onda. All’istante t = 0 nell’origine del sistema di riferimento lo spostamento della corda rispetto alla posizione di equilibrio è nullo. Scrivere la funzione che descrive la forma dell’onda all’istante t = 0,23 s, utilizzando unità di misura del Sistema Internazionale. 32. Una corda che ha una massa di 50 g per ogni metro di lunghezza viene fatta oscillare con un’ampiezza di 10 cm e una frequenza di 2 Hz. Sapendo che la velocità dell’onda è di 30 m/s, qual è la potenza necessaria per mantenere in oscillazione la corda? 33. Una corda di chitarra con una densità di massa di 0,80 g/m viene tenuta in vibrazione alla frequenza di 120 Hz con un’ampiezza di 0,3 cm. Se la velocità di propagazione dell’onda è di 192 m/s, qual è la potenza necessaria per mantenere in vibrazione la corda? 34. Un motore elettrico con una potenza di 200 W viene utilizzato per far oscillare, con un’ampiezza di 10,0 cm, una corda che ha una densità lineare di 15 g/cm e che è stata tesa con una tensione tale che le onde trasversali si propagano con una velocità di 50 m/s. Qual è la massima frequenza con cui il motore può far oscillare la corda? 35. Un altoparlante ha una potenza di 50 W. Qual è l’intensità dell’onda sonora a una di stanza di 10 m, se si suppone che l’emissione sia isotropa (ossia distribuita in modo uniforme in tutte le direzioni) e non ci siano effetti dissipativi? 36. La potenza dell’impianto di amplificazione utilizzato in un concerto rock all’aperto può arrivare a 10.000 W. Se l’orecchio umano, in condizioni ideali, può percepire suoni con un’intensità di 10-12 W/m2, a quale distanza si potrebbe in teoria udire il suono prodotto - E.27 dal concerto, se non ci fossero effetti dissipativi, supponendo che l’onda si propaghi in modo uniforme in tutte le direzioni? 37. Una trasmittente radio ha una potenza di 3,00 MW. Quale intensità minima deve poter rilevare un apparecchio ricevente, per sintonizzarsi su questa trasmittente a una distanza di 150 km? 38. Quale potenza deve avere una trasmittente radio, per raggiungere una distanza di 15 km con un segnale che abbia un’intensità di 0,10 mW/m 2? - E.44 - K - L'INTERFERENZA DELLE ONDE È raro che un’onda possa propagarsi indisturbata: prima o poi incontra un ostacolo da cui può essere deviata, riflessa o assorbita. Onde emesse da diverse sorgenti possono sovrapporsi e interferire una con l’altra, rafforzandosi o indebolendosi. Ci occuperemo quindi ora dei fenomeni che accompagnano la propagazione delle onde. Considereremo prima ciò che avviene quando due o più onde si sovrappongono e interferiscono tra loro. Esamineremo poi i fenomeni che si producono quando un’onda incontra sul suo per corso un ostacolo. 1. Il principio di sovrapposizione Possiamo constatare in molte situazioni che due o più onde possono passare contemporaneamente in uno stesso punto senza disturbarsi a vicenda. Possiamo ascoltare due persone che parlano contemporaneamente, riuscendo a distinguere la voce di ciascuna di esse, o percepire separatamente il suono emesso dai distinti strumenti che compongono un’orchestra. Lo stesso avviene per le onde circolari prodotte lanciando sassi sulla superficie dell’acqua: i vari cerchi, allargandosi, si incrociano e proseguono poi indisturbati il loro cammino. Sappiamo che le onde sono dovute a perturbazioni del mezzo in cui esse si propagano. In tutti i casi in cui un punto è raggiunto da due o più onde, la perturbazione risultante è sempli cemente la somma delle perturbazioni che sarebbero prodotti separatamente dalle singole onde separatamente. Questo fatto è noto come principio di sovrapposizione: in ogni punto dello spazio dove due o più onde si sovrappongono la perturbazione istantanea è data dalla somma delle perturbazioni che sarebbero prodotte da ciascuna delle onde separatamente. Se la perturbazione è di una grandezza scalare la somma ovviamente è una somma scalare (per esempio la variazione di pressione del mezzo in cui si propaga un'onda sonora), mentre se la perturbazione è di una grandezza vettoriale la somma sarà vettoriale. La perturbazione ottica è di una grandezza vettoriale. Problema 1. Determinare l’onda risultante dalla sovrapposizione di due onde armoniche di diversa frequenza e uguale ampiezza ym = 0,05 m che si propagano con la stessa velocità e verso contrario lungo una corda tesa, descritte rispettivamente dalle seguenti funzioni y1 = 0,05 sen(5x – 20t) y2 = 0,05 sen(9x + 36t) Le figura 1.a mostra la forma che assumerebbe la corda all’istante t = 0 se fosse percorsa solamente dalla prima onda y1 (linea blu) o dalla seconda onda y2 (traccia rossa piena). La forma che la corda assume per la presenza contemporanea delle due onde è mostrata nella figura 1.b (linea rossa spessa) dove appare chiaro che in ogni punto lo spostamento della corda dalla posizione di equilibrio è pari alla somma degli spostamenti dovuti a ciascuna delle due onde originarie: y = y1 + y2 = 0,05 sen(5x – 20t) + 0,05 sen(9x + 36t) Dall’esempio del problema 1 si nota che in generale l’onda risultante dalla sovrapposizione di due onde armoniche non è un’onda armonica. Lo stesso vale per il caso più generale di sovrapposizione di due onde tridimensionali, nel quale si dovrà operare una somma vettoriale degli spostamenti, anziché una semplice somma algebrica come nel caso monodimensionale. - E.45 Si possono presentare diversi casi notevoli di sovrapposizione di onde: si può avere so vrapposizione di onde che hanno la stessa frequenza o di onde con frequenze diverse, di onde che si propagano nella stessa direzione e nello stesso verso o in verso contrario, ecc. Molti di questi casi danno luogo a situazioni interessanti, che considereremo nelle pagine che seguono. a) 0,8 y 0,4 0 -0,4 -0,8 0 y 0,1 1,2 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 x 1 b) 0,8 0,4 0 -0,4 -0,8 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 x 1 Figura 1. La traccia rossa spessa nel grafico (b) è il profilo dell’onda risultante dalla sovrapposizione delle due onde armoniche rappresentate nel grafico (a). 2. L’interferenza di onde di uguale ampiezza Nel problema 1 abbiamo considerato un esempio di sovrapposizione di due onde armoniche con differenti frequenze. Ma che cosa avviene se le onde armoniche che si sovrappongono hanno la stessa frequenza, o come si dice, sono onde omogenee? Si tratta del caso più semplice di sovrapposizione di due onde armoniche, che dà luogo al fenomeno dell’interferenza. Considereremo innanzitutto la sovrapposizione di due onde armoniche con la stessa ampiezza e la stessa frequenza ma diversa costante di fase. Supponiamo di avere due onde armoniche che si propagano nella stessa direzione con la stessa ampiezza e la stessa frequenza e lunghezza d’onda, ma che differiscono per la co stante di fase. Dimostreremo che l’effetto dell’interferenza di questi due treni d’onde, ossia della loro sovrapposizione, è ancora un’onda armonica che si propaga nella stessa direzione con la stessa frequenza e lunghezza d’onda delle onde componenti, con ampiezza e fase che dipendono dalla differenza di fase tra le onde iniziali. Indichiamo con y1 e y2 due onde armoniche con uguale ampiezza ym, numero d’onda k e pulsazione ω: y1 = ym sen(kx – ωt + ϕ1) y2 = ym sen(kx – ωt + ϕ2) - E.46 L’onda risultante è data dalla loro somma: Y = ym sen(kx – ωt + ϕ1) + ym sen(kx – ωt + ϕ2) (1) L’espressione (1) può essere semplificata utilizzando la formula di prostaferesi relativa alla somma di seni: sen α + senβ = 2sen α + β α − β cos 2 2 (2) Nel nostro caso abbiamo α = kx – ωt + ϕ1 e β = kx – ωt + ϕ2, e quindi: ϕ + ϕ α + β = kx − ω t + 1 2 2 2 e ϕ −ϕ α − β = 1 2 2 2 Sostituendo nella formula (1) si ha dunque: Y = y m [ sen ( kx − ω t + ϕ 1 )+ sen ( kx − ω t + ϕ 2 )] = ϕ +ϕ 2y m sen kx − ω t + 1 2 2 ϕ −ϕ cos 1 2 2 Riscrivendo questa formula nella forma Y = 2y m cos ϕ1− ϕ 2 2 ϕ + ϕ sen kx − ω t + 1 2 2 ϕ +ϕ = Ym sen kx − ω t + 1 2 2 (3) dove Ym = 2y m cos ϕ1− ϕ 2 2 (4) è una costante, si ricava che l’onda risultante dalla somma delle due onde armoniche è ancora un’onda armonica, con la stessa frequenza e la stessa lunghezza d’onda, che differisce in fase dalle due onde iniziali e che ha un’ampiezza pari appunto a Ym. Consideriamo i vari casi possibili. - Se le due onde che interferiscono hanno la stessa costante di fase, ϕ1 = ϕ2, si ha ϕ −ϕ2 cos 1 = cos 0 = 1 e quindi Ym = 2ym; l’onda risultante ha ampiezza doppia ri2 spetto all’ampiezza delle due onde iniziali, che quindi si rafforzano una con l’altra, dando luogo a una interferenza costruttiva. - Se le due onde che interferiscono sono in opposizione di fase, ossia sono sfasate ϕ −ϕ2 π = cos = 0 e nel tempo di mezzo periodo essendo ϕ1 = π + ϕ2, si ha cos 1 2 2 quindi Ym = 0; l’onda risultante ha ampiezza nulla. Le due onde iniziali si annullano una con l’altra, dando luogo a una interferenza distruttiva. - Se le due onde che interferiscono hanno valori diversi delle costanti di fase ϕ1 e ϕ2, l’ampiezza dell’onda risultante sarà compresa tra 0 e 2ym e dipenderà dal valore di ϕ1 – ϕ2. - E.47 - 3 2 1 0 -1 -2 -3 Figura 2. Interferenza costruttiva di due onde armoniche con uguale ampiezza, frequenza e costante di fase: l’onda risultante è un’onda armonica con ampiezza doppia di quella delle onde che interferiscono (disegnate in rosso e in blu nella figura, con una piccola differenza di fase per permettere di distinguerle). 1,5 1 0,5 0 -0,5 -1 -1,5 Figura 3. Interferenza distruttiva di due onde armoniche con uguale ampiezza e frequenza, in opposizione di fase: l’onda risultante (in nero nella figura) ha ampiezza nulla. 1,5 1 0,5 0 -0,5 -1 -1,5 Figura 4. Interferenza di due onde armoniche con uguale ampiezza e frequenza e diversa costante di fase: l’onda risultante (in nero nella figura) è un’onda armonica con la stessa frequen- - E.48 za, con ampiezza che dipende dalla differenza di fase tra le due onde che interferiscono (in questo caso ϕ2 - ϕ1 = (4/5)π rad = 144°). Problema 2. Si determini la funzione che descrive l’onda risultante dalla sovrapposizione delle due onde di equazione y1(x, t) = 35 sen(4x – 10t + 2) e y2(x, t) = 35 sen(4x – 10t – 0,5) Le due onde hanno la stessa ampiezza, la stessa frequenza e la stessa lunghezza d’onda, mentre le costanti di fase sono rispettivamente ϕ1 = 2 rad e ϕ2 = –0,5 rad. L’onda risultante dalla loro sovrapposizione avrà quindi pure la stessa frequenza e lunghezza d’onda, mentre la sua ampiezza sarà data dall’equazione (4) Y m = 2y m cos ϕ1− ϕ 2 2 = 2 × 35 × cos 2 + 0,5 = 22,1 2 e la sua costante di fase da: ϕ1+ ϕ 2 2 = 2 − 0,5 rad = 0,75 rad 2 L’equazione (3) ci dà quindi la sua equazione: Y ( x, t ) = 2y m cos ϕ1− ϕ 2 2 ϕ +ϕ sen kx − ω t + 1 2 2 = 22,1sen( 4 x − 10t + 0,75 ) 3. L’interferenza di onde di diversa ampiezza Il fenomeno dell’interferenza si verifica anche nel caso di sovrapposizione di onde di uguale frequenza e lunghezza d’onda ma diversa ampiezza. In questo caso, però, se le due onde che interferiscono sono in opposizione di fase, l’ampiezza dell’onda risultante sarà ridotta rispetto a quella delle onde iniziali, ma non completamente annullata (figura 5). Consideriamo due onde armoniche con uguale numero d’onda k e pulsazione ω, ma diversa ampiezza ym: y1(x, t) = ym1 sen(kx – ωt + ϕ1) y2(x, t) = ym2 sen(kx – ωt + ϕ2) 1,5 1 0,5 0 -0,5 -1 -1,5 - E.49 Figura 5. Interferenza distruttiva di due onde armoniche con uguale frequenza e diversa ampiezza, in opposizione di fase: l’ampiezza dell’onda risultante (in nero nella figura) è pari alla dif ferenza tra le ampiezze delle due onde che interferiscono. L’onda risultante è data dalla loro somma Y(x, t) = ym1 sen(kx – ωt + ϕ1) + ym2 sen(kx – ωt + ϕ2) (5) che non può più essere sviluppata come nel caso dell’espressione (1), perché ora i coefficienti che compaiono davanti alle funzioni seno sono diversi. Possiamo però ricavare la funzione Y con due metodi distinti: 1) applicando direttamente il principio di sovrapposizione; 2) ricorrendo alle regole per la somma dei vettori. Consideriamo il primo metodo, ossia l'applicazione diretta del principio di sovrapposizione. Se indichiamo con θ l’espressione (kx – ωt), possiamo riscrivere la formula (5) come Y = ym1 sen(θ + ϕ1) + ym2 sen(θ + ϕ2) (6) Sviluppando l'espressione abbiamo Y = ym1 sen θ cos ϕ1 + ym1 cos θ sen ϕ1 + ym2 sen θ cos ϕ2 + ym2 cos θ sen ϕ2 = = sen θ (ym1 cos ϕ1 + ym2 cos ϕ2) + cos θ (ym1 sen ϕ1 + ym2 sen ϕ2) In questa espressione ym1, ym2, ϕ1 e ϕ2 sono termini noti. Poniamo ora Ym sen ϕ = y m1sen ϕ 1 + y m 2 sen ϕ 2 Ym cos ϕ = y m1cos ϕ 1 + y m 2 sen ϕ 2 (7) e sostituiamo questi valori nella relazione (6) ottenendo Y = Ym sen θ cos ϕ + Ym cos θ sen ϕ (8) cioè Y = Ym sen(θ + ϕ) (9) Quest'ultima è l'equazione dell'onda risultante. Anche in questo caso si verifica che la somma di funzioni sinusoidali è ancora una funzione sinusoidale. I valori di Ym e di ϕ possono essere ricavati dal sistema (7). Dividendo membro a membro le due relazioni di questo sistema si ottiene tg ϕ = y m1sen ϕ 1 + y m 2 sen ϕ 2 y m1cos ϕ 1 + y m 2 sen ϕ 2 (10) Il secondo metodo, ossia il metodo vettoriale, permette di ricavare in modo immediato l'ampiezza dell'onda risultante. Ciascuno dei due addendi nella formula (6) è la componente lungo l’asse y di un vettore di modulo ym che forma un angolo θ + ϕ con l’asse x (vedi figura 6). La formula (6) fornisce allora la componente lungo l’asse y della somma di questi due vettori, ossia di un vettore di modulo Ym che forma un angolo θ + ϕ’ con l’asse x. I valori di Ym e ϕ’ possono essere ricavati con le regole per il calcolo della somma di due vettori. Man mano che passa il tempo, il valore di θ varia e tutti i vettori della figura 6 ruotano con la stessa velocità angolare ω. Le loro posizioni relative restano quindi le stesse e i valori di Ym e ϕ’ non cambiano: l’onda risultante è ancora un’onda armonica di pulsazione ω. - E.50 L'ampiezza dell'onda risultante si ricava applicando il teorema di Carnot al triangolo formato dai tre vettori Ym , y m1 e y m 2 (figura 6). L'angolo compreso tra i due vettori y m1 e y m 2 è ϕ2 - ϕ1. Si ha allora Ym2 = ym12 + ym22 - 2 ym1 ym2 cos (ϕ2 - ϕ1) (11) La quantità che più interessa è il quadrato Ym2 dell'ampiezza risultante, perché è legata all'intensità I; essa risulta dipendente solo dalla differenza ϕ2 - ϕ1, che è detta differenza di fase. y Ym sen(θ + ϕ ’) ym2 sen ( θ + ϕ 2) y m2 Ym θ + ϕ ’ y m1 θ +ϕ1 θ +ϕ2 ym1 sen ( θ + ϕ 1) x Figura 6. Costruzione vettoriale che permette di ricavare ampiezza e costante di fase dell’onda risultante dall’interferenza di due onde armoniche qualsiasi di uguale frequenza. Problema 3. Si determini la funzione che descrive l’onda risultante dalla sovrapposizione delle due onde di equazione y1(x, t) = 15 sen(2x – 20t – 0,7) e y2(x, t) = 8 sen(2x – 20t – 1,3) Le due onde hanno la stessa frequenza e la stessa lunghezza d’onda, mentre le loro ampiezze sono rispettivamente ym1 = 15 e ym2 = 8 e le costanti di fase ϕ1 = –0,7 rad e ϕ2 = –1,3 rad. L’onda risultante dalla loro sovrapposizione avrà quindi pure la stessa frequenza e lunghezza d’onda. Per ricavare la sua ampiezza e la sua costante di fase consideriamo, perθ = kx – ωt = 0, i due vettori r1 di modulo r1 = 15 inclinato di = –0,7 rad rispetto all’asse x, e r2 di modulo r2 = 8 inclinato di = –1,3 rad rispetto all’asse x (figura 7). Le componenti di questi vettori rispetto ai due assi x e y sono: x1 = 15 cos (–0,7) = 11,47 y1 = 15 sen (–0,7) = –9,66 x2 = 8 cos (–1,3) = 2,14 y2 = 8 sen (–1,3) = –7,71 e le componenti del vettore R = r1 + r2 sono quindi: X = x1 + x2 = 11,47 + 2,14 = 13,61 Y = y1 + y2 = –9,66 + (–7,71) = –17,37 Il modulo di questo vettore è R= X2 + Y2 = 13,612 + ( − 17,37)2 = 22,07 - E.51 - y θ +ϕ’ ym1 sen ( θ + ϕ 1) x r1 θ + ϕ 1 Ym sen(θ + ϕ ’) R r2 θ +ϕ2 ym2 sen ( θ + ϕ 2) Figura 7. Costruzione vettoriale (problema 3). mentre la sua inclinazione α rispetto all’asse x è data da: arctg α = Y − 17,37 = = − 1,276 X 13,61 ossia α = -0,906 rad. Ricordando che l’ampiezza Ym dell’onda risultante è pari al modulo R di questo vettore, e che la sua costante di fase ϕ’ è pari alla sua inclinazione, ricaviamo la funzione richiesta: Y ( x, t ) = Ym sen( kx − ω t + ϕ ') = 22,07 sen( 2 x − 20t − 0,906 ) 4. L’espressione matematica di un’onda periodica qualsiasi Consideriamo ora due onde armoniche che si propagano nel verso positivo di un asse x con uguale ampiezza ym e uguale numero d’onda k, la prima con frequenza ν1 (e pulsazione ω1 = 2πν1) e la seconda con frequenza ν2 = 2ν1 doppia della frequenza della prima (e quindi con pulsazione ω1 = 2πν2 = 2ω1). Supponiamo che le costanti di fase delle due onde siano entrambe nulle: ϕ1 = ϕ2 = 0. La funzione matematica delle due onde ha allora la forma y1 = ym sen(kx – ω1t) y2 = ym sen(kx – ω2t) mentre l’onda risultante dalla loro sovrapposizione ha come espressione matematica la funzione y = ym sen(kx – ω1t) + ym sen(kx – ω2t) (12) Poiché la frequenza delle due onde è differente, l’onda risultante dalla loro sovrapposizione ha una forma che non corrisponde più a quella di un’onda armonica e, come mostra la figura 8, si tratta di un’onda con una frequenza pari a quella dell’onda di frequenza minore ν1. Se le due onde avessero avuto ampiezza diversa, dalla loro sovrapposizione si sarebbe an cora ottenuto un’onda di frequenza pari a ν1, ma con una forma diversa da quella rappresentata nella figura 8. - E.52 - 2 1,5 1 0,5 0 -0,5 -1 -1,5 -2 Figura 8. L’onda di forma complessa rappresentata dalla curva nera più spessa è ottenuta dalla sovrapposizione dell’onda armonica disegnata in blu e dell’onda armonica di frequenza doppia disegnata in rosso. Si può dimostrare che lo stesso vale non solo quando si sovrappongono due onde di frequenza doppia una dell’altra, ma ogni volta che si sovrappongono onde le cui frequenze sono multipli interi di una stessa frequenza fondamentale: se la frequenza di una delle due onde fosse stata non doppia, ma tripla, o quadrupla, di quella della prima, si sarebbe ancora ottenuto un’onda risultante di frequenza pari alla frequenza fondamentale ν1, ogni volta con una forma diversa. Sommando onde armoniche di diversa ampiezza e frequenza si possono quindi ottenere onde di forme diverse. Ma si può dire di più: qualsiasi onda periodica, qualunque sia la sua forma, può essere ottenuta come somma di onde armoniche. La dimostrazione di questa importante affermazione fu ottenuta dal matematico francese Jean-Baptiste Fourier (17691830): ogni funzione periodica y(t) può essere scritta nella forma: y (t ) = ∞ ∑ [A n sen(ω n t ) + B n cos(ω n t )] (13) n= 1 dove il primo valore della pulsazione, ω1, corrisponde al periodo T della funzione ω 1 = 2π T (14) I successivi valori sono i multipli interi di questa pulsazione fondamentale: ω n = nω 1 = n 2π T (15) Scegliendo in maniera opportuna i valori dei coefficienti An e Bn si può ottenere, come si diceva, un’onda di forma qualsiasi. Le figure 9, 10 e 11 mostrano come si possano ottenere, dalla sovrapposizione di onde armoniche, onde di forma particolare: un’onda a dente di sega (fi gura 9), un’onda quadra (figura 10) e un’onda triangolare (figura 11). In generale, per ottenere onde di questo tipo è necessario utilizzare un grande numero di componenti: quanto maggiore è il numero di componenti considerate, tanto migliore sarà l’approssimazione della forma dell’onda calcolata con il profilo desiderato. - E.53 - 2 1,5 1 0,5 0 -0,5 -1 -1,5 -2 Figura 9. L’onda con un profilo a forma di denti di sega è ottenuta con A n = 1/n per n = 1,…,10 (la linea più sottile è ottenuta utilizzando solo i primi 5 termini). 1,5 1 0,5 0 -0,5 -1 -1,5 Figura 10. L’onda con un profilo quadro è ottenuta con A n = 1/n per n = 1,3,5,7,9 (la linea più sottile è ottenuta utilizzando solo i primi 3 termini). 1,5 1 0,5 0 -0,5 -1 -1,5 - E.54 Figura 11. L’onda con un profilo triangolare è ottenuta con A n = (-1)(n-1)/2/n2 per n = 1,3,5,7,9 (la linea più sottile è ottenuta utilizzando solo i primi 2 termini). Il procedimento con il quale si scompone un’onda di forma qualsiasi nelle sue componenti armoniche è detto analisi di Fourier o analisi armonica. L’onda con pulsazione più bassa ω1 è detta armonica fondamentale o prima armonica, e le onde armoniche con pulsazioni ω2 = 2ω1, ω3 = 3ω1, ω4 = 4ω1, … sono dette rispettivamente seconda, terza, quarta, … armonica. Il procedimento con il quale si compone un’onda periodica a partire dalle sue armoniche è detto invece sintesi armonica. 5. L’interferenza di onde bidimensionali e tridimensionali Nel caso di onde bidimensionali o tridimensionali la descrizione del fenomeno dell’interferenza risulta più complessa che nel caso monodimensionale. Il fenomeno può essere studiato attraverso un dispositivo sperimentale, detto ondoscopio, che permette di evidenziare la propagazione di onde bidimensionali sulla superficie dell’acqua. L’ondoscopio è costituito essenzialmente da una vasca piena d’acqua, con il fondo di vetro, illuminata in modo che, se la superficie dell’acqua è percorsa da onde, queste possano essere osservate su uno schermo sul quale è proiettata la luce che attraversa la superficie dell’acqua: più intensa nei punti corrispondenti alle creste delle onde, perché i raggi luminosi vengono concentrati attraversando la superficie convessa dell’acqua che agisce come una lente convergente, meno intensa nei punti corrispondenti alle gole delle onde. Le onde sono prodotte da una o più palette o punte metalliche che, tenute in moto armonico da un opportuno meccani smo, toccano la superficie dell’acqua. Figura 12. L’ondoscopio mostrato nella figura è costituito da una vasca di vetro piena d’acqua, illuminata dal di sotto. Una o più punte o palette azionate da un apposito motore producono onde sulla superficie dell’acqua, la cui immagine viene proiettata su uno schermo. - E.55 - S1 S2 Figura 13. L’interferenza tra le onde prodotte sulla superficie dell’acqua da due sorgenti punti formi che oscillano con uguale ampiezza, frequenza e costante di fase. Sono evidenziate in ros so le linee nodali, ossia le linee che congiungono i punti di minima ampiezza di oscillazione. Nella figura 13 sono evidenziate in rosso le linee che congiungono i punti di minima am piezza di oscillazione, ossia i punti in cui si ha interferenza distruttiva. Consideriamo un ondoscopio su un lato del quale siano poste due sorgenti puntiformi di onde in moto armonico con la stessa frequenza e la stessa ampiezza. A partire da ciascuna delle due sorgenti si propaga sulla superficie dell’acqua un treno di onde circolari. I due treni d’on de interferiscono dando luogo a una complessa figura di interferenza (figura 13). La stessa situazione è rappresentata schematicamente nella figura 14, nella quale le sorgenti sono indicate con B1 e B2, le creste delle onde sono rappresentate da linee continue e le gole da linee tratteggiate. - E.56 - Figura 14. Interferenza tra due treni di onde circolari. Ogni punto della superficie dell’acqua oscilla con la stessa frequenza, con un’ampiezza che dipende dalla sua distanza dalle due sorgenti: nei punti in cui una cresta della prima onda incontra una cresta della seconda onda si avrà interferenza costruttiva e l'ampiezza dell'onda ri sultante sarà amplificata; lo stesso nei punti in cui una gola della prima onda incontra una gola della seconda onda. Questi punti si trovano nella figura 14 lungo le linee segnate con cerchi. Dove invece una cresta della prima onda incontra una gola della seconda onda si avrà interferenza distruttiva e le due perturbazioni si annulleranno lasciando l'acqua tranquilla. Questi punti si trovano nella figura 14 lungo le linee segnate con croci. Si definiscono punti nodali o nodi quei punti che, nella zona di sovrapposizione delle onde, sono in quiete. I punti di quiete rimangono tali anche con il passare del tempo. Infatti se in un certo punto l'acqua è ferma perché vi si incontrano una cresta proveniente da una sorgente e una gola proveniente dall'altra sorgente, dopo una frazione di periodo gli spostamenti sono diminuiti in valore assoluto, ma hanno ancora la stessa intensità e verso opposto. In questi punti le onde saranno sempre, come si è soliti dire, in opposizione di fase. Cerchiamo di individuare le posizioni in cui si ha interferenza costruttiva e le posizioni in cui si ha interferenza distruttiva (ossia le linee nodali). Consideriamo un qualsiasi punto P equidistante dalle due sorgenti S1 e S2, ossia un punto della perpendicolare al segmento che congiunge S1 e S2 passante per il suo punto medio. Poiché le due sorgenti oscillano con la stessa frequenza, la stessa ampiezza e la stessa fase, le due onde si propagano con la stessa velocità, e il punto P si trova alla stessa distanza dalle due sorgenti, le due onde si ritrovano in P con la stessa fase (dopo aver compiuto lo stesso numero di oscillazioni) e danno luogo a interferen za costruttiva. Lo stesso avviene per tutti i punti P per i quali le distanze dalle due sorgenti sono esattamente uguali a un multiplo intero della lunghezza d’onda λ dell'onda: anche in questo caso, infatti, le due onde giungono in P con la stessa fase (dopo aver compiuto un diverso numero di oscillazioni) dando sempre luogo a interferenza costruttiva. Se invece le distanze dalle due sorgenti differiscono di mezza lunghezza d’onda, le due onde giungono in P in opposizione di fase, sfasate di π, e interferiscono distruttivamente. Lo stesso avviene se le distanze dalle due sorgenti differiscono di un numero dispari qualsiasi di semilunghezze d’onda: (1/2) λ, (3/2)λ, (5/2)λ, ecc. - E.57 Si ha quindi interferenza costruttiva nei punti per i quali la differenza tra le distan ze D2 - D1 dalle due sorgenti differisce di un multiplo intero della lunghezza d’onda: D2 - D1 = mλ (16) e interferenza distruttiva dove la differenza tra le distanze D2 - D1 dalle due sorgenti è pari a un multiplo dispari di mezza lunghezza d’onda: D2 − D1 = ( 2m − 1) λ 2 (17) Le linee nodali congiungono quindi tutti quei punti per i quali la differenza delle distanze da due punti fissi (le sorgenti) è costante. Ricordiamo dalle geometria analitica che questa pro prietà è quella che definisce l'iperbole: l'iperbole è infatti il luogo geometrico dei punti del piano per i quali è costante la differenza delle distanze da due punti fissi detti fuochi. Le linee nodali sono quindi, in questo caso in cui si hanno due sorgenti che oscillano in fase, iperboli con i fuo chi nelle posizioni in cui si trovano le sorgenti. Nel caso di più di due sorgenti le linee nodali as sumono forme più complesse. 6. L’interferenza da fenditure sottili Interferenza da due fenditure sottili Consideriamo l’esperimento di interferenza della luce realizzato per la prima volta da Thomas Young nel 1801. Fu questo esperimento, con il quale per la prima volta si osservò il fenomeno dell'interferenza della luce, che dimostrò la natura ondulatoria della luce. Fino a quel momento, infatti, non era stato possibile verificare se la luce fosse costituita da un flusso di particelle o corpuscoli, come era stato proposto più di un secolo prima da Newton, o da onde, come sosteneva Huygens. L'esperimento è schematizzato nella figura 15. La luce monocromatica che raggiunge lo schermo A e attraversa il forellino S0 si allarga per diffrazione e raggiunge un secondo schermo B nel quale vi sono due forellini S1 e S2. La luce che attraversa questi due forellini è nuovamente allargata dalla diffrazione e raggiunge uno schermo C, sul quale non si osserva una illuminazione uniforme, ma una serie di frange luminose intervallate da zone oscure , simile a quella mostrata nella parte destra della figura e riprodotte nella figura 16 (che si riferisce, precisiamo, al caso in cui le sorgenti luminose sono fenditure parallele e non forellini). ∆r = 2 λ S2 S0 ∆r = λ H’ ∆ r = 0 H ∆ r = -λ S1 A B ∆ r = -2λ C Figura 15. Schema dell'esperimento di interferenza di Young. - E.58 - Figura 16. Frange di interferenza formate da due fenditure parallele illuminate con luce mono cromatica. Per spiegare ciò che si osserva, ricordiamo che la luce è costituita da onde. Supponia mo che le linee continue nella figura 15 corrispondano alle creste dei fronti d’onda delle onde lu minose. Nella regione a sinistra dello schermo A i fronti d’onda, provenienti da una sorgente distante, sono piani. Nella regione compresa tra lo schermo A e lo schermo B si ha un fronte d’onda sferico prodotto dal forellino S0. Nella regione compresa tra lo schermo B e lo schermo C, infine, si ha la sovrapposizione di due onde sferiche prodotte dai due forellini S1 e S2. Se i due forellini S1 e S2 sono equidistanti da S0, vengono raggiunti allo stesso tempo dai fronti d’onda emessi da S0 e quindi le oscillazioni delle onde luminose che li attraversano sono in fase. Consideriamo ora i punti corrispondenti al segmento HH’ tratteggiato al centro di questa regione: poiché essi sono equidistanti dalle due sorgenti S1 e S2, le onde luminose vi giungono in fase e si ha interferenza costruttiva: sullo schermo si osserva un massimo di intensità luminosa. Lo stesso avviene per le altre linee tratteggiate nella figura, corrispondenti rispettivamente ai punti per i quali le distanze r1 e r2 dalle sorgenti S1 e S2 differiscono di 1, 2, 3… lunghezze d’onda. Nei punti per i quali invece la differenza di distanza dalle due sorgenti S1 e S2 è pari a un multiplo dispari di mezza lunghezza d’onda si ha interferenza distruttiva, e sullo schermo C si produce un minimo di intensità luminosa. La figura 17 rappresenta lo spazio compreso tra lo schermo B su cui si trovano i due forellini S1 e S2 e lo schermo C su cui vengono osservate le frange luminose prodotte dall’interferenza. La distanza D tra i due schermi è molto più grande della distanza d tra i due forellini. D r2 S2 P θ x r1 d S1 P’ B ∆ r ≈ d sen θ C Figura 17. Dettaglio della regione compresa tra i forellini S 1 e S2 e lo schermo C sul quale si osservano le frange di interferenza. - E.59 Consideriamo un punto P dello schermo C, posto a distanza x dall’asse mediano che separa i due forellini S1 e S2. La differenza di distanza delle due fenditure da P è data da: ∆ r = r1 − r2 ≈ d sen θ ≈ d tg θ = d x D (18) Si produce interferenza costruttiva quando la differenza di percorso delle due onde è pari a un multiplo intero di lunghezze d’onda: ∆r = mλ (19) Uguagliando le due espressioni (18) e (19) si ricava che i successivi massimi di intensi tà sullo schermo C si trovano nei punti alle distanze x m = mλ D d (20) Misurando i valori di xm si può quindi ottenere, se sono note le due distanze d e D, la lunghezza d’onda λ della luce. Si trovano valori molto piccoli: per esempio, per la luce gialla emessa da una lampada al sodio si ha λ = 5,89 × 10-7 m = 589 nm. Notiamo che per mettere in evidenza l’interferenza tra onde luminose è necessario che la distanza tra i due forellini sia mol to piccola. Se per esempio si usa luce gialla emessa da una lampada al sodio e la distanza del lo schermo C è D = 5,0 m, dalla formula (20) si ricava che per avere una separazione tra le frange di interferenza ∆x = 3 mm la distanza d tra i due forellini S1 e S2 deve essere di meno di 1 mm. Nella descrizione di questo esperimento abbiamo richiesto luce monocromatica per semplificare i calcoli e anche per avere più nitida la figura di interferenza. Se avessimo utilizzato luce bianca avremmo ottenuto la frangia centrale bianca, ma ai bordi si sarebbero visti i vari colori, prima il violetto e infine il rosso. A questo punto si può misurare la lunghezza d'onda dei vari colori e provare l'ipotesi fatta considerando la dispersione cromatica, che a ogni colore corrisponde una diversa lunghezza d'onda. Si trova anche che la lunghezza d’onda della luce corrispondente ai diversi colori spettrali aumenta passando dal violetto al rosso: l’estremo violetto dello spettro della luce visibile ha una lunghezza d’onda di circa 400 nm, mentre l’estremo rosso ha una lunghezza d’onda di circa 700 nm. Dalla formula (18) si ricava che la differenza di fase ∆ϕ tra le onde che raggiungono un punto dello schermo C a distanza x dall’asse del sistema, espressa in radianti, è data da: ∆ ϕ = 2π ∆r d x = 2π λ λ D (21) Supponiamo che le onde emergenti dalle due fenditure abbiano in corrispondenza dello schermo C la stessa ampiezza A0. L’ampiezza dell’onda risultante nel punto x dello schermo è data dalla formula (3) relativa all’interferenza tra due onde di uguale frequenza, che possiamo scrivere in questo caso come: A( x ) = 2 A0 cos ∆ϕ d x = 2 A0 cos π 2 λ D (22) L’intensità di un’onda è proporzionale al quadrato della sua ampiezza. Se quindi indichiamo con I0 l’intensità di radiazione che produrrebbe sullo schermo ciascuna delle due fenditure separatamente, l’intensità di radiazione I risultante nel punto x dall’interferenza delle due onde si ricava elevando al quadrato la formula (22): d x I ( x ) = 4I 0 cos 2 π λ D (23) L’andamento della funzione I(x) è rappresentato nella figura 18. I massimi della funzione I(x) si hanno per d x cos π = ±1 λ D e quindi per π d x = nπ λ D ossia x = nλ D d - E.60 In corrispondenza di tutti questi massimi l’intensità di radiazione è la stessa, pari a 4I0. 5 4 3 I (x )/I 0 2 1 0 -2 -1 0 1 2 xd /λ D Figura 18. L’intensità di radiazione delle frange di interferenza prodotte da due fenditure sottili, in funzione della posizione x sullo schermo. Interferenza da molte fenditure sottili Le frange di interferenza con l'andamento mostrato nella figura 18 corrispondono all'interferenza tra onde emesse da due sorgenti puntiformi o da due fenditure sottili. A causa della larghezza delle frange è difficile misurarne la posizione con grande precisione, per esempio, con una precisione pari a un millesimo della loro distanza. E' possibile ottenere frange di interferenza più strette usando più di due fenditure sottili. Consideriamo allora il caso di tre fenditure sottili, come nella figura 19. Nel punto x dello schermo C posto a distanza D dalle fenditure si sovrappongono ora tre onde armoniche di pari ampiezza A0 con uno sfasamento tra la prima e la seconda e tra la seconda e la terza dato dalla formula (21). Per ricavare l’ampiezza dell’onda risultante possiamo utilizzare il metodo vettoriale utilizzato per il calcolo dell’interferenza di onde di diversa ampiezza. Quando lo sfasamento ∆ϕ è nullo o è pari a un multiplo intero di 2 π, ossia nei punti individuati dalla relazione (20), i vettori che rappresentano le tre onde luminose hanno la stessa direzione e lo stesso verso (figura 20.a), l’ampiezza A(x) dell’onda risultante è 3A0 e l’intensità di radiazione I è pari a 9I0. D S3 d P r3 x r2 S2 d S1 B r1 C - E.61 Figura 19. Interferenza da tre fenditure sottili a distanza d una dall’altra. a) A0 ∆ϕ = 0 A0 A0 3A 0 b) ∆ϕ ∆ϕ = 2 π /3 A 0 ∆ϕ A0 A0 c) ∆ϕ ∆ ϕ = π /2 A0 A0 A0 ∆ϕ A0 Figura 20. Interferenza da tre fenditure sottili: costruzione geometrica dell’ampiezza risultante. Quando invece lo sfasamento ∆ϕ è pari a (2/3)π o (4/3)π (figura 20.b), la somma dei vettori che rappresentano le tre onde luminose è nulla: nei punti in cui si verifica questa condi zione si hanno due minimi di intensità. Tra di essi, per uno sfasamento pari a π/2 (figura 20.c), si ha un massimo secondario nell’intensità di radiazione, per il quale l’ampiezza dell’onda è A0 e l’intensità di radiazione I0. L’andamento della funzione I(x) è mostrato nella figura 21. 10 9 8 7 6 I (x )/I 0 5 4 3 2 1 0 -2 -1 0 1 2 xd / D Figura 21. L’intensità di radiazione delle frange di interferenza prodotte da tre fenditure sottili, in funzione della posizione x sullo schermo. Se si hanno quattro fenditure anziché tre (figura 22), si procede in modo analogo. An che in questo caso quando lo sfasamento ∆ϕ è nullo o è pari a 2mπ, ossia nei punti individuati dalla relazione (20), i vettori che rappresentano le quattro onde luminose hanno la stessa direzione e lo stesso verso (figura 23.a), l’ampiezza A(x) dell’onda risultante è 4A0 e l’intensità di radiazione I è pari a 16I0. Quando invece lo sfasamento ∆ϕ è pari a π/2 o π o (3/2)π (figura 23.b), la somma dei vettori che rappresentano le tre onde luminose è nulla: si hanno quindi tre minimi - E.62 di intensità. Tra di essi si hanno due massimi secondari dell’intensità di radiazione, per i quali l’ampiezza dell’onda è circa A0 e l’intensità di radiazione circa I0. L’andamento della funzione I(x) è mostrato nella figura 24. S3 D r4 r3 S4 d P x r2 d S2 r1 d S1 C B Figura 22. Interferenza da quattro fenditure sottili a distanza d una dall’altra. a) A0 ∆ϕ = 0 A0 A0 A0 4 A0 b) ∆ϕ ∆ ϕ = π /2 Figu A0 ∆ϕ A0 A0 ∆ϕ A0 ra 23. Interferenza da quattro fenditure sottili: costruzione geometrica dell’ampiezza risultante. 18 16 14 12 I (x )/I 0 10 8 6 4 2 0 -2 -1 0 1 2 xd /Π D Figura 24. L’intensità di radiazione delle frange di interferenza prodotte da quattro fenditure sot tili, in funzione della posizione x sullo schermo. - E.63 Aumentando il numero di fenditure, quindi, si ottengono figure di interferenza con picchi principali sempre più stretti e pronunciati, aumenta il numero dei massimi secondari e diminuisce la loro ampiezza relativamente ai massimi principali. Se il numero N di fenditure è molto grande, e si utilizza una sorgente di luce monocromatica, si otterrà allora una figura di interferenza costituita da una serie di strette righe luminose poste nelle posizioni individuate dalla for mula (20) D d x m = mλ (20) intervallate da spazi scuri. La formula che esprime l'intensità della radiazione in funzione dell'angolo di osservazione θ e che è stata utilizzata per ricavare le figure 21 e 24 è: 2 Nd ϕ sen π sen θ sen λ 2 = I I = I0 0 ∆ϕ d sen θ sen π sen 2 λ 2 (24) Per ϕ/2 = mπ (m ≠ 0) l’intensità di radiazione I si annulla. I vettori corrispondenti alle N sorgenti elementari, infatti, in questo caso si dispongono formando un poligono chiuso in modo che si ha interferenza distruttiva e l’ampiezza dell’onda risultante è nulla. Le direzioni corrispondenti si ottengono ponendo π Nd sen θ = mπ λ (m ≠ ±nN) ossia sen θ = mλ Nd (m ≠ ±nN) (25) La larghezza dei massimi principali (quelli che si hanno per n = 0, ±1, ±2...), ossia la distanza tra i due minimi a destra e a sinistra di essi, è data da sen ∆ θ = tg θ nN (26) Un dispositivo che sfrutta il restringimento delle frange nell'interferenza tra molte sorgenti è l'interferometro di Fabry-Perot. E' costituito da due lamine di vetro o di quarzo con superfici rigorosamente piane tenute parallele a piccola distanza da un cilindro cavo di invar o di quarzo, come è mostrato nella figura 25. Le superfici interne delle due lamine sono rivestite con un coating (si veda più avanti) che conferisce loro un alto valore di riflettività e le lamine sono leggermente prismatiche per evitare effetti di interferenza la loro interno. Quando la luce proveniente da una sorgente monocromatica è collimata e passa attraverso gli specchi le riflessioni multiple producono frange circolari molto fini su uno sfondo scuro. Se nella sorgente sono presenti diverse lunghezze d'onda possono essere facilmente distinte anche se differiscono di meno di 0,1 nm. Figura 25. Interferometro di Fabry-Perot. - E.64 - 7. Sorgenti di luce coerenti e sorgenti di luce incoerenti Perché non osserviamo il fenomeno dell’interferenza delle onde luminose tutte le volte che le onde emesse da due diverse sorgenti luminose si sovrappongono, come per esempio quando in una stanza sono accese contemporaneamente due o più lampade? E perché, se po niamo al posto dei due forellini S1 e S2 dell’esperimento di Young due piccole lampadine uguali, osserviamo sullo schermo un’illuminazione uniforme anziché l’alternanza di zone luminose e di zone scure prodotta dall’interferenza delle due onde? Affinché si possa osservare il fenomeno dell’interferenza è necessario non solo che le due onde luminose abbiano la stessa frequenza, ma anche che mantengano nel tempo una differenza di fase costante. Se questo non avviene, nei vari punti dello spazio in cui le due onde si sovrappongono l’ampiezza dell’onda risultante andrà variando continuamente per effetto della rapida alternanza di interferenza costruttiva e distruttiva, e ogni strumento che come il nostro occhio registra l’intensità luminosa su intervalli di tempo lunghi rispetto al periodo delle onde luminose osserverà semplicemente un’illuminazione media costante. Vedremo più avanti che nella maggior parte delle sorgenti luminose la luce viene emessa dagli atomi quando un elettrone passa da uno stato dotato di maggiore energia a uno stato di minore energia. Questa transizione dura circa 10 -8 s. Poiché una sorgente luminosa è normalmente costituita da un enorme numero di atomi, ognuno dei quali emette radiazione indipendentemente dagli altri, la luce che noi osserviamo è costituita da una successione di treni d’onde, ognuno della durata di circa 10-8 s, che non sono in fase uno con l’altro. Una sorgente di luce di questo tipo si dice incoerente. Una sorgente di luce coerente è invece una sorgente che emette treni d’onda tutti con la stessa fase. È una sorgente di luce coerente il laser (acronimo di “light amplification by stimulated emission of radiation), un dispositivo realizzato per la prima volta nel 1958 da Arthur L. Schawlow e Charles H. Townes e utilizzato in molte applicazioni tecnologiche. Nel laser gli atomi di un gas sono forzati a emettere onde luminose coerenti tra loro. La luce prodotta dai laser è anche monocromatica e concentrata in un’unica direzione o, come si dice, collimata. Sono coerenti anche le onde elettromagnetiche emesse nella banda delle onde radio dalle normali antenne utilizzate per le trasmissioni radio e televisive. Si dice anche che due raggi luminosi sono coerenti tra loro se mantengono una differenza di fase costante. È praticamente impossibile ottenere due sorgenti di luce tra loro coerenti se non ricorrendo alla tecnica di suddividere in due parti l’onda luminosa emessa da una singola, piccola sorgente. È quanto si è fatto nell’esperimento di Young nel quale dalla luce emessa dal forellino S0 si ricavano le due onde luminose provenienti dai forellini S1 e S2: se la fase dell’onda luminosa emessa da S0 cambia, questa variazione viene trasmessa simultaneamente a S1 e S2, in modo che le onde emesse da queste due sorgenti hanno sempre una differenza di fase costante e sono quindi coerenti tra loro. Le due onde sono ricavate, in questo caso, ottenendole da due diversi punti di uno stesso fronte d'onda: si dice allora che le due onde coerenti tra loro sono ottenute "per divisione del fronte d'onda". Se invece le due onde sono ricavate sempre da un'unica sorgente ma per suddivisione di una parte riflessa e di una parte rifratta allorché la luce incide su una lamina, allora si dice che le due sorgenti coerenti sono ottenute "per divisione di ampiezza". Questa espressione è giustificata dal fatto che l'onda riflessa e l'onda rifratta non avranno in generale la stessa ampiezza, mentre comunque la somma delle loro ampiezze dà l'ampiezza dell'onda incidente. Notiamo che due onde ricavate in questo modo da un unico fronte d'onda risultano mutuamente coerenti solo in punti per i quali sia lo stesso il cammino ottico dalla sorgente, in modo che non ci sia differenza di fase tra le due onde. Se c'è differenza di fase, significa che le due onde hanno lasciato la sorgente in istanti diversi. Se in questo intervallo di tempo l'emissione della sorgente è variata, non si ha più coerenza tra le due onde. La massima differenza di tem po ammissibile per ogni data sorgente è detta tempo di coerenza della sorgente. Moltiplicando il tempo di coerenza per la velocità della luce si ottiene la lunghezza di coerenza. - E.65 Il tempo di coerenza dipende da quanto una sorgente è monocromatica. Se la sorgente è una lampada a incandescenza munita di filtro la lunghezza di coerenza è di pochi micrometri. Con una lampada spettrale a mercurio si possono avere lunghezze di coerenza di 20-30 cm. Un laser può avere lunghezze di coerenza di parecchi metri. 8. Interferenza per divisione del fronte d'onda Esistono diversi dispositivi che, oltre a quello utilizzato per l'esperienza di Young, permettono di sdoppiare un’onda luminosa in modo da osservare l’interferenza della luce. Il più semplice è noto come specchio di Lloyd (figura 26). La luce emessa da una sottile sorgente monocromatica è indirizzata radente a uno specchio piano, in modo che su uno schermo perpendicolare allo specchio giunge contemporaneamente la luce diretta della sorgente e quella riflessa dallo specchio. Poiché il raggio diretto e quello riflesso percorrono un cammino di differente lunghezza, giungono sullo schermo sfasati tra loro e producono quindi le frange luminose dovute all’interferenza. Nel punto dello schermo a contatto con lo specchio si osserva una frangia scura corrispondente a un minimo di illuminazione, anziché una frangia chiara come ci si aspetterebbe dato che la differenza di cammino tra i due raggi è nulla e quindi si dovrebbe avere interferenza costruttiva. La spiegazione sta nel fatto che la riflessione della luce sullo specchio sfasa l'onda di 180°: l'onda che raggiunge lo schermo dopo essere stata riflessa dallo specchio risulta quindi in opposizione di fase rispetto all'onda che raggiunge lo schermo diretta mente, e tra le due onde si ha interferenza distruttiva. Figura 26. Specchio di Lloyd: l’osservatore posto in S osserva l’interferenza tra le onde provenienti dalla sorgente B e dalla sua immagine B’. Si può effettivamente dimostrare mediante la teoria elettromagnetica che si ha un cambiamento di 180° nella fase dell'onda ogni volta che essa si riflette sulla superficie di separazione con un mezzo in cui la velocità di propagazione dell’onda è minore (per esempio, nel caso di un'onda che si propaga in aria e si riflette su una superficie di vetro). Non si ha invece nessun cambiamento di fase nella riflessione sulla superficie di separazione con un mezzo in cui la velocità di propagazione dell'onda è maggiore (per esempio, nel caso di un'onda che si propaga in un pezzo di vetro e si riflette sulla superficie di separazione tra il vetro e l'aria). Ciò è analogo al caso verificabile facilmente con due funi elastiche di massa lineare differente unite tra loro: se l'onda passa dalla fune più leggera a quella più pesante si hanno due onde, una diritta trasmessa nella fune più pesante e una capovolta che torna indietro (riflessa) nella fune più leggera (cambio di fase di 180°). Se invece l'onda passa dalla fune più pesante alla fune più leggera sia l'onda trasmessa che l'onda riflessa sono dirette (nessun cambiamento di fase). Perciò un’onda luminosa viene capovolta e quindi sfasata di 180° quando si riflette sulla superficie di un mezzo come il vetro in cui la sua velocità di propagazione è mi nore che nel vuoto o nell’aria. Un altro dispositivo, simile al precedente, che pure permette di evidenziare le frange di interferenza tra due raggi luminosi è costituito dagli specchi di Fresnel (figura 27.a). In questo caso la luce prodotta da una sorgente monocromatica B è riflessa da due specchi piani AC e CD leggermente inclinati l'uno rispetto all’altro. Nella regione S raggiunta dai raggi riflessi da entrambi gli specchi, che hanno percorso un cammino di diversa lunghezza, si osserva interferenza costruttiva o distruttiva a seconda che i raggi luminosi giungano in fase o in opposizione di fase. Non si nota un cambiamento di fase tra i due raggi, perché entrambi lo subiscono nel riflettersi sugli specchi. - E.66 Un dispositivo simile è costituito dal biprisma di Fresnel (figura 27.b), nel quale una parte del fronte d'onda attraversa una faccia di un sottile biprisma isoscele e una parte l'altra. Si hanno così due sorgenti virtuali in fase e le onde si sovrappongono dando luogo a interferenza nella regione centrale. Figura 27. Specchi di Fresnel (in alto): un osservatore posto in S osserva l’interferenza tra le onde luminose provenienti dalle immagini B1 e B2 della stessa sorgente B riflessa dai due specchi CD e CD. Biprisma di Fresnel (in basso). La bilente di Billet, infine, si compone di una lente piano-convessa tagliata in due parti simmetriche allontanate di poco tra loro (figura 28). Ciascuna delle due parti dà un'immagine reale della sorgente puntiforme S posta sull'asse di simmetria. E' utile schermare con uno schermo opaco K la luce diretta della sorgente S passante tra le due metà della lente, in modo da avere un contrasto maggiore nella figura di interferenza. In tutti questi casi otteniamo frange di interferenza non localizzate, perché possono essere osservate in un punto qualsiasi del campo di interferenza, rappresentato nelle figura 26, 27 e 28 dalla zona tratteggiata. C L2 S1 O2 K S L1 S2 O1 Figura 28. Bilente di Billet: sullo schermo C si osserva l’interferenza tra le onde luminose provenienti dalle immagini S1 e S2 della stessa sorgente S rifratte dalle due semilenti L 1 e L2. - E.67 - 9. Interferenza per divisione di ampiezza In molte occasioni, quando osserviamo strati molto sottili di materiali trasparenti come una sostanza oleosa distribuita su una superficie d’acqua o la superficie di una bolla di sapone, possiamo notare la presenza di bande variamente colorate che mutano di aspetto rapidamente. Anche questo fenomeno è dovuto all’interferenza delle onde luminose. Interferenza per riflessioni multiple Consideriamo una lamina a facce piane e parallele. Un'onda incidente su un punto di essa si divide in un'onda riflessa e un'onda rifratta. Se l'onda incidente ha ampiezza A e il coefficiente di riflessione di quella superficie è ρ l'onda riflessa avrà ampiezza A1 = Aρ e quella rifratta avrà ampiezza A2 = A(1 - ρ). Nell'interferenza con lamine per riflessione si considera l'interferenza tra l'onda riflessa dalla prima superficie (R1 nella figura 29) e l'onda rifratta e poi subito riflessa dalla seconda su perficie della lamina (R2), o più precisamente, dato che l'interferenza è per riflessioni multiple, bisogna considerare anche tutte le onde che dopo aver subito un numero dispari di riflessioni all'interno della lamina escono dalla sua superficie superiore (R3, ecc.). Nell'interferenza con lamine per trasmissione si considera invece l'interferenza tra l'onda che viene trasmessa senza riflessioni interne e tutte le onde che sopo aver subito un numero pari di riflessioni interne escono dalla superficie inferiore della lamina. Consideriamo ora una lamina di indice di rifrazione n, immersa per semplicità in aria, di spessore d, a facce rigorosamente piane e parallele, e prendiamo un raggio che incide su di essa con un angolo d'incidenza i fissato. La differenza di fase delle onde dipende in questo caso dalla differenza di cammino ottico e non di cammino reale, in quanto vi sono diversi mezzi. La differenza di cammino ottico ∆l tra il raggio riflesso e il primo raggio rifratto e poi riflesso risulta (figura 30) ∆l = n (AE + EC + CB) - AD S (27) R1 R2 R3 d Figura 29. Interferenza di due raggi luminosi riflessi dalle due facce di una lamina sottile in aria. - E.68 - S i D B A C d E d i' G Figura 30. Schema dell'interferenza di due raggi luminosi riflessi dalle due facce di una lamina sottile in aria. Costruiamo il segmento perpendicolare compreso tra A ed EB, cioè AC. Per l'uguaglianza dei cammini ottici tra due fronti d'onda (e sia DB che AC lo sono) avremo AD = n CB (28) Prolunghiamo BC fino a incontrare la normale in A alla superficie della lamina. Per costruzione AE = GE, ma il triangolo AGC è retto in C e AGˆ E = i ′ , per cui GC = AE + EC; dalla figura si ottiene GC = AG cos i' cioè GC = 2d cos i' (29) Sostituendo questi valori nella formula (23) si ha ∆l = n (AE + EC) + n CB - AD = n GC e quindi ∆l = 2nd cos i' (30) Avevamo già trovato (formule 16 e 17) che si hanno frange scure (interferenza distruttiva) per differenza di cammino pari a ∆ l = ( 2m + 1) λ 2 e frange chiare (interferenza costruttiva) per differenza di cammino pari a ∆l = mλ Nella situazione che stiamo esaminando però siamo nel caso in cui una sola onda subisce una riflessione da un mezzo meno denso a un mezzo più denso e perciò si ha per essa una variazione di fase di 180°, che equivale a un cambiamento di cammino ottico di λ/2. Perciò le condizioni di cammino tra frange chiare e scure si invertono. Infatti dove le onde arrivano in fase senza la riflessione per un'onda, uno spostamento di 180° di una di esse le farà arrivare in op posizione di fase; cioè dove prima avevamo interferenza costruttiva (chiaro) ora si ha un'interferenza distruttiva (scuro) e viceversa. Quindi in definitiva si ha - E.69 2nd cos i' = mλ 2nd cos i ′ = ( 2m + 1) λ 2 (minimo; frangia scura) (31) (massimo; frangia chiara) (32) In questa trattazione non abbiamo tenuto conto che le onde riflesse e rifratte hanno di solito ampiezza diversa. Non ci sono problemi per la frangia chiara, che si avrà in ogni caso, ma si ottiene una frangia scura effettivamente nera? Se si considera solo il primo raggio riflesso-rifratto, come abbiamo fatto finora, la rispo sta è no. Ma poiché la differenza di cammino ottico ∆l tra due raggi successivi che si hanno per riflessioni multiple è costante ed uguale a quella che abbiamo calcolato, e poiché tutti questi raggi hanno una differenza di fase di 180° con il primo raggio, essi interferiranno costruttivamente con il primo raggio riflesso-rifratto e si dimostra che l'onda risultante ha esattamente la stessa ampiezza dell'onda solamente riflessa. Così si ha effettivamente una frangia nera e l'in tensità della frangia chiara è quadrupla di quella che si avrebbe con la sola sorgente. La trattazione dell'interferenza per trasmissione è analoga. In questo caso però nessuna onda ha un cambiamento di fase per la riflessione e perciò si avranno le condizioni di massimo e di minimo esattamente seguendo le regole generali. Le frange così ottenute sono complementari di quelle ottenute per riflessioni multiple. L'interferenza tra i due raggi luminosi dà luogo a frange che possono essere osservate o con l'occhio a riposo oppure mediante un cannocchiale focalizzato all'infinito, cosicché i raggi paralleli uscenti dalla lamina si incontrano sul piano focale dell'obiettivo con una differenza di fase δ = k ∆l Si vedrà così una frangia di interferenza per un determinato angolo della sorgente; se l'asse dell'obiettivo è perpendicolare alla lamina si osserverà una circonferenza. Se la sorgente è estesa si potrà vedere più di una frangia, poiché la differenza di cammino ∆l dipende da i' e quindi da i e nel caso di una sorgente estesa si avranno più angoli di incidenza. E' chiaro allora perché le frange così ottenute vengono dette localizzate all'infinito e di uguale inclinazione. Lamine sottili a cuneo Consideriamo ora una lamina sottile le cui facce non siano perfettamente parallele. Il suo spessore sarà perciò variabile anche se di valori molto piccoli. Sia S una sorgente puntiforme monocromatica che invia i suoi raggi su una di queste lamine di indice n immersa in aria. I raggi riflessi vengono raccolti da una lente L posta parallelamente alla lamina (figura 31). Consideriamo in particolare due raggi: il raggio 1-1' che incide in C, viene riflesso-rifratto ed esce in P, ed il raggio 2-2' che incide e viene riflesso in P. Dopo P i due raggi vengono fatti convergere dalla lente L sul piano immagine loro corrispondente con uguali cammini ottici e quindi con la stessa differenza di fase che avevano in P. Vediamo di calcolarla. Poiché la differenza di fase è legata alla differenza di cammino ottico ∆l, calcoliamo prima quest'ultimo. Avremo ∆l = SC + n(CE + EP) - SP (33) - E.70 S L 2 1' 1 i 2' H P C i' E Figura 31. Schema dell'interferenza di due raggi luminosi riflessi dalle due facce di una lamina sottile a cuneo in aria. Prendiamo su SP il il punto H tale che SP - SC = HP, cioè SH = SC. Poiché la lamina è molto sottile, C e P sono molto vicini, si ha CP << SC e si può quindi considerare l'angolo SHˆ C praticamente retto. Avremo allora HP = PC sen i, ma PC = 2d tg i', dove d è lo spessore della lamina nel punto considerato. Sostituendo abbiamo HP = 2d sen i sen i ′ cos i ′ (34) Applicando la legge di Snell nel caso in cui il primo mezzo è aria si ha sen i = n sen i', da cui si ha sen 2 i ′ cos i ′ Infine, poiché HP = 2dn n (CE + EP ) = 2nCE = si ha ∆l= (35) 2nd cos i ′ ( ) 2nd 2nd sen 2 i ′ 2nd 1 - sen 2 i ′ 2nd cos 2 i ′ − = = cos i ′ cos i ′ cos i ′ cos i ′ cioè ∆l = 2nd cos i' (36) Si ricava cioè la stessa relazione ricavata esattamente per le frange di uguale inclinazione, ma in questo caso si è introdotta un'approssimazione valida solo se lo spessore è piccolo. In particolare se i raggi incidono perpendicolarmente sulla lamina in P si ha cos i' = 1 per cui ∆l = 2nd (37) Ricordando che un raggio subisce un cambiamento di fase (è quello riflesso sulla prima superficie) si ha 2nd = mλ (minimo; frangia scura) (38) λ (massimo; frangia chiara) (39) 2 E' possibile allora ricavare lo spessore della lamina in quel punto. Se c'è una frangia scura lo spessore dovrà soddisfare l'equazione 2nd = ( 2m + 1) - E.71 - d= mλ m = λm 2n 2 (40) dove con λm si è indicata la lunghezza d'onda in quel mezzo della luce monocromatica che è stata utilizzata. Questa relazione può essere anche scritta come d = 2m λm 4 (41) cioè lo spessore per dare una frangia scura deve essere un multiplo pari di λm/4. Se invece otteniamo una frangia chiara si dovrà soddisfare l'equazione d = ( 2m + 1) λ λ = ( 2m + 1) m 4n 4 (42) e quindi lo spessore dovrà essere un multiplo dispari di λm/4. Per ricavare la differenza di fase nei due casi basta ricordare che δ = k ∆l. Avendo di solito la lamina spessori variabili si osservano massimi e minimi di interferenza. Queste frange sono anche visibili sulla lamina direttamente in quanto l'occhio funge da lente. Esse sono dette frange di uguale spessore perché le linee in cui lo spessore è costante presentano un'illuminazione uniforme: se per esempio un certo spessore soddisfa l'equazione della frangia scura si avrà una linea scura. Il fenomeno, se la sorgente è puntiforme, è localizzato solo su quella parte di lamina in cui i raggi incidono e vengono riflessi e quindi entrano nella lente (o nell'occhio). Se invece si vogliono avere frange su tutta la lamina occorre utilizzare una sorgente estesa. Queste, frange, come si è visto, sono localizzate sulla lamina. Quando la lamina è illuminata da luce bianca risultante dalla sovrapposizione di componenti spettrali di diversa lunghezza d’onda, si avrà interferenza costruttiva per alcune lunghezza d’onda, e interferenza distruttiva per altre. La lamina appare allora di un colore corrispondente alla sovrapposizione delle lunghezze d’onda per le quali si ha interferenza costruttiva. Un esempio di lamina di questo tipo è costituito dalle pareti di una bolla di sapone, che in luce bianca appaiono variamente colorate per lo spessore differente delle sue varie porzioni. Poiché lo spessore della bolla di sapone inoltre va continuamente diminuendo man mano che l’acqua evapora, cambiano progressivamente anche i colori osservati in ogni punto della bolla. Quando, un attimo prima che la bolla scoppi, il suo spessore è divenuto minore di un quarto del la lunghezza d’onda λm della luce viola (circa 0,3 µ), allora per tutti i colori dello spettro visibile si ha interferenza distruttiva e la bolla di sapone appare nera! Se anziché la parete di una bolla di sapone consideriamo una sottile lamina di olio distribuita su una superficie d’acqua (figura 32), sia la riflessione sulla faccia anteriore della lami na sia quella sulla faccia posteriore provocano uno sfasamento di 180° dell’onda, perché in questo caso l’indice di rifrazione della lamina (nolio = 1,30) è minore dell’indice di rifrazione del materiale sottostante (nacqua = 1,3333) e quindi la velocità di propagazione della luce nella lamina è maggiore che nell’acqua sottostante. La differenza di fase tra i due raggi dipende ora solo dalla differenza di percorso, e se lo spessore della lamina è molto piccolo si ha interferenza co struttiva: la lamina appare quindi sempre variamente colorata. - E.72 - S R1 R2 olio acqua Figura 32. Interferenza di due raggi luminosi riflessi dalle due facce di una lamina sottile disposta sopra un mezzo più rifrangente. Anelli di Newton Newton osservò gli effetti di interferenza prodotti da una lamina sottile a cuneo, senza riuscire a interpretarli nell'ambito della sua teoria corpuscolare della luce, ponendo una lente convessa di piccola curvatura a contatto con una lastra piana di vetro, come mostrato nella figu ra 33. Lo strato di aria nelle vicinanze del punto di contatto A risulta estremamente sottile e il suo spessore aumenta gradualmente allontanandosi dal punto di contatto. I punti di uguale spessore formano circonferenze concentriche al punto A. Illuminata con luce monocromatica la lamina, osservata per riflessione, apparirà scura nel punto di contatto, circondato da anelli con centrici alternativamente chiari e scuri, detti anelli di Newton, mostrati nella figura 34. Se la lamina è illuminata con luce bianca gli anelli appariranno colorati con colori che finiscono col con fondersi tra loro a una distanza di sette o otto anelli dal centro. I colori appaiono nel seguente ordine andando dal centro verso l'esterno: 1° anello: nero, blu, bianco, giallo, rosso 2° anello: violetto, blu, verde, giallo, rosso 3° anello: porpora, blu, verde, giallo, rosso 4° anello: verde, rosso 5° anello: verde-blu, rosso 6° anello: verde-blu, rosso pallido 7° anello: verde-blu, rosa Questa sequenza è nota come scala di Newton dei colori. Figura 33. Anelli di Newton. - E.73 - Figura 34. Anelli di Newton prodotti da luce monocromatica. Consideriamo un raggio di luce incidente sulla seconda superficie della lente in D2 (figura 33). Esso in parte verrà riflesso e in parte trasmesso nella lamina d'aria sottostante. Quest'ultimo raggio verrà a sua volta in parte riflesso dalla lastra di vetro in D1 e in parte penetrerà in essa. Consideriamo i due raggi riflessi uno dalla seconda superficie della lente e l'altro, dopo aver percorso lo straterello d'aria, dalla lastra di vetro. La loro differenza di cammino è 2 t, avendo indicato con t lo spessore dello straterello di aria in quel punto. Indichiamo con r il raggio della superficie sferica della lente e con y la distanza del punto D1 dal punto di contatto A. Per il teorema di Pitagora avremo CH = r 2 − y2 e quindi t = r − CH = r − r 2 − y2 ossia r− t= r 2 − y2 che elevata al quadrato dà r 2 + t 2 − 2rt = r 2 − y 2 e infine y2 = 2rt - t2 = t(2r - t) (43) Essendo t << r possiamo trascurarlo nella somma e quindi abbiamo y2 = 2rt (44) Conoscendo la differenza di cammino tra i raggi e ponendo le condizioni d i massimo e minimo, ricordando che un solo raggio viene riflesso su una sostanza otticamente più densa, si ha - E.74 - 2t = ( 2m + 1) λ 2 2t = mλ massimi (45) minimi (46) Ricavando t in queste due formule e ponendo tale valore nella formula (40) si ottengono i raggi rispettivamente degli anelli chiari e di quelli scuri: y= 1 m + λ r 2 massimi (47) y= mλ r minimi (48) Dalla formula (44) conoscendo il raggio di curvatura r della superficie sferica della lente e misurando il raggio y di un anello si può determinare lo spessore dello strato di aria ad esso sottostante. Se, anziché una lente, utilizziamo due lamine di vetro piane con un sottile foglio di carta posto tra di esse in corrispondenza di un bordo, otteniamo una lamina di aria a cuneo che pro duce le frange di Fizeau. Le linee di uguale spessore della lamina d'aria sono parallele ai bordi delle lamine di vetro che si trovano a contatto. Quindi quando il dispositivo è illuminato con luce monocromatica si osserva una serie di frange scure. Se le due lastre hanno superfici rigorosamente piane le frange sono dritte e distanziate in modo regolare. 10. Applicazioni dell'interferenza Studio dei difetti di forma delle superfici ottiche Nella fabbricazione degli elementi ottici è importante conoscere con precisione la curvatura delle superfici e anche le variazioni di curvatura sulla superficie. Un metodo tradizionale, in trodotto da Fraunhofer, è basato sull'uso di piani campione e sul principio degli anelli di Newton. Per lo studio della planarità di una superficie si utilizza una superficie di vetro rigorosamente piana (detta piano campione) e su di essa si appoggia la superficie in esame. Viene inviata dall'alto luce monocromatica sul dispositivo e se la superficie è esattamente piana si dovrebbe vedere un'illuminazione uniforme. Se invece esiste uno strato di aria o più strati di aria di diverso spessore tra l due superfici si vedono delle frange di uguale spessore più o meno regolari a seconda della variazione dello spessore d'aria esistente. Se ad esempio si vedono due frange, la lamina d'aria presenta un'irregolarità dell'ordine di λ, in quanto tra due frange consecutive scure o chiare vi è una differenza di cammino appunto di λ. Per correggere le irregolarità è necessario sapere se esse corrispondono a delle sporgenze o a delle rientranze, si esercita allora una leggera pressione sulla lamina in esame in modo da far variare lo spessore dello strato di aria sottostante e, poiché le frange migrano verso strati di aria a spessore maggiore, si può decidere in proposito. Utilizzando un piano campione possiamo anche controllare la sfericità di una superficie concava o convessa. Si appoggia tale superficie sul piano campione e si osservano gli anelli di Newton. Se essi sono regolari la superficie è effettivamente sferica, altrimenti non lo è. Nonostante tutte le precauzioni impiegate, è possibile graffiare le lenti quando vengono messe a contatto con un piano campione. Possono anche restare tra le due superfici granelli di polvere che impediscono un perfetto contatto tra di esse. Per questo si preferisce utilizzare interferometri con i quali la superficie da esaminare e la superficie di riferimento non sono a con tatto tra loro. La figura 35 mostra lo schema dell'interferometro di Michelson. Uno specchio semitrasparente A è utilizzato per dividere la luce proveniente da una sorgente S in due fasci mutua- - E.75 mente coerenti che sono riflessi dagli specchi M1 e M2. Lo specchio semitrasparente A riunisce poi i fasci di luce riflessi da M1 e M2. Anche se parte della luce è persa perché ritorna verso la sorgente, ciò che appare all'occhio dell'osservatore E è che le due superfici riflettenti appaiono molto vicine ed eventualmente sovrapposte in M1 e M'2. La luce riflessa da M1 passa due volte attraverso il supporto di vetro dello specchio semiriflettente A. L'aberrazione cromatica dovuta a ciò può essere compensata una lastra di vetro identica in C. Quando le posizioni di M1 e M2 sono tali che i cammini ottici sono identici, le due sorgenti apparentemente si sovrappongono. Se si ha un piccolo angolo tra gli specchi, possono essere viste frange di interferenza anche con luce bianca. Le differenti lunghezze d'onda producono figure di interferenza con spaziature proporzionali a λ, ma con una frangia centrale coincidente per tutti i colori dove la differenza di fase è nulla per tutti i colori. Da entrambe le parti di questa frangia si hanno alcune frange variamente colorate che si fondono poi dando illuminazione uniforme dove le frange dovute ai diversi colori si sovrappongono. Questo effetto che si ha con luce bianca può essere molto utile per identificare il punto di effettiva coincidenza dei due specchi, e fu utilizzato da Michelson per correlare la lunghezza d'onda di varie sorgenti di luce monocromatica al metro campione usato come unità di lunghezza. Figura 35. Interferometro di Michelson. - E.76 Figura 36. Interferometro di Twyman-Green. L'interferometro di Michelson è stato modificato da Twyman e Green per realizzare uno strumento per l'esame delle superfici ottiche. Lo schema dell'interferometro di Twyman e Green è mostrato nella figura 36. Può essere utilizzato per l'esame di lenti e di prismi e specchi. Nella figura 36.a l'interferometro è disposto in modo da esaminar un prisma. Se lo specchio M2 è sostituito da uno specchio da esaminare, si ottiene un confronto interferometrico con lo specchio M1. Per esaminare la superficie di una lente si deve usare la disposizione mostrata nella figura 36.b, nella quale L è una lente che produce un fascio di luce convergente. La superficie M da esaminare è posta in modo che rifletta il fascio di luce in modo che venga ricollimato da L per interferire con il fascio di luce riflesso da M1. A seconda della posizione della superficie M possono essere controllati diversi raggi di curvatura. Per superfici concave la lente L deve essere divergente. Il risultato è in ogni caso una figura di interferenza in cui lo scostamento delle frange da circonferenze o linee rette indica imperfezioni nelle superfici esaminate. Trattamento antiriflettente delle superfici ottiche Gli effetti di interferenza di lamine sottili come gli anelli di Newton o l'interferenza di Fi zeau hanno un'utilità che va oltre il controllo della forma delle superfici ottiche. E' possibile con trollare lo spessore della lamina per ottenere un particolare livello di riflettività che è uniforme sulla superficie di una lente o di un altro elemento ottico se lo spessore della lamina è uniforme. Questo effetto è stato notato per la prima volta da Fraunhofer che riuscì a ridurre la riflettività di una superficie di vetro mediante un sottile strato di ossido sviluppato sulla superficie del vetro esposta all'aria. I metodi moderni sono basati sull'evaporazione di particolari sostanze in camere ad alto vuoto. Il rivestimento che così si ottiene è indicato spesso con il termine inglese "coating". Per ridurre la perdita di luce per riflessione sulle varie superfici di un sistema di lenti o di prismi, si fa depositare su di esse una sottile pellicola trasparente di spessore e indice di rifra zione tali che per un determinato valore di λ si abbia interferenza distruttiva tra i raggi riflessi sullo strato di rivestimento e sulla superficie di vetro. Affinché i raggi considerati si neutralizzino, in aggiunta al fatto che i loro cammini soddisfino alla condizione di minimo, essi devono avere anche la stessa ampiezza. La frazione di ampiezza della luce incidente riflessa a incidenza normale dalla superficie di separazione tra due mezzi con indici di rifrazione n e n' è data dall'espressione di Fresnel n − n′ n + n′ (49) Quando una pellicola è depositata sul vetro, sulla superficie superiore della pellicola vi è aria (n = 1) e se nf è l'indice di rifrazione della pellicola la frazione di ampiezza della luce incidente riflessa sarà 1 − nf 1 + nf (50) La superficie inferiore della pellicola è a contatto con il vetro con indice di rifrazione ng. La frazione di ampiezza della luce riflessa è nf − n g nf + n g (51) Perché le intensità della luce riflessa dalle due superfici della pellicola siano uguali si deve avere - E.77 - 2 n − ng 1 − nf = f nf + n g 1 + nf 2 (52) da cui si ricava nf = ng (53) Poiché la riflessione avviene entrambe le volte sulla superficie di separazione tra un mezzo meno denso e un mezzo più denso, la riflessione non introduce differenza di fase tra le due onde. Perché vi sia distruzione di una determinata lunghezza d'onda λ per incidenza normale lo spessore t della pellicola deve essere 1 λ nf t = m + 2 2 (54) Lo spessore ottico nft deve quindi pari a un numero dispari di quarti di lunghezza d'onda. Normalmente lo spessore è pari un quarto di lunghezza d'onda. Non tutte le sostanze evaporano facilmente o si depositano sul vetro formando una pellicola resistente. La tabella 1 dà una breve lista di materiali comunemente usati con i loro indici di rifrazione. Indice di rifrazione Fluoruro di magnesio MgF2 1,38 Biossido di silicio SiO2 1,45 Ossido di alluminio Al2O3 1,65 Monossido di silicio SiO 2,0 Solfuro di zinco ZnS 2,3 Biossido di titanio TiO2 2,35 Per ottenere interferenza completamente distruttiva con vetro crown sarebbe necessaria una pellicola con indice di rifrazione pari a 1,52 = 1,233 , ma l'indice di rifrazione minore tra quelli dei materiali utilizzabili è quello del fluoruro di magnesio, pari a 1,38. Usando l'espressione (50) si trova che l'ampiezza riflessa dalla superficie aria/coating è 0,159. Dall'espressione (51) si trova che l'ampiezza riflessa dall'interfaccia coating/vetro è 0,048. Queste ampiezze sono in opposizione di fase per uno spessore del coating di un quarto di lunghezza d'onda, e quindi l'ampiezza risultante è 0,159 - 0,048 = 0,111. Il quadrato di questo valore dà la frazione dell'intensità dell'onda incidente che viene riflessa, che è 0,012 o 1,2%. Anche se questa intensità non è nulla è un miglioramento considerevole rispetto al valore per il vetro non trattato, pari al 4% come risulta elevando al quadrato l'equazione (49) con n = 1 e n' = 1,52. Anche se l'indice di rifrazione del fluoruro di magnesio è troppo alto per il vetro crown, con vetri con indice di rifrazione più elevato la situazione migliora. Con un vetro con indice di rifrazione pari a 1,9 è teoricamente possibile ottenere riflettività nulla dato che 1,9 = 1,38 . Questi valori della riflettività sono calcolati assumendo incidenza normale e si riferiscono alla lunghezza d'onda a cui sono misurati gli indici di rifrazione e per la quale la pellicola ha uno spessore ottico di un quarto di lunghezza d'onda. Ad altre lunghezze d'onda il risultato è inferiore e perciò solitamente si sceglie una lunghezza d'onda di riferimento vicina al centro della banda visibile, per esempio 510 nm. Ciò significa che è riflessa più luce agli estremi rosso e blu dello spettro, il che dà la colorazione porpora che normalmente hanno le lenti con rivestimento antiriflesso. Ad angoli diversi rispetto all'incidenza normale l'espressione per lo spessore ottico - E.78 contiene il termine cos i e l'espressione di Fresnel cambia. La figura 37 mostra i valori di riflettività che si ottengono a differenti angoli di incidenza per differenti lunghezze d'onda. L'importanza del rivestimento antiriflesso è duplice. In rimo luogo la riduzione in riflettivi tà dà un equivalente aumento in trasmissione dato che l'assorbimento della pellicola è trascurabile. Ciò potrebbe non sembrare importante per una superficie singola, ma nel caso per esempio di un obiettivo fotografico con sei lenti separate vi sono 12 superfici. Se ogni superficie trasmette solo il 96% della luce incidente, la trasmissione complessiva dell'obiettivo è (0,96) 12 = 61%. Per superfici trattate che trasmettono il 98,8%, la trasmissione complessiva diventa l'87%. Il secondo vantaggio delle superfici trattate è che quella porzione pari al 40% della luce incidente che è riflessa dalle superfici nell'esempio di cui sopra è riflessa all'interno dell'obiettivo e può finire sul piano immagine formando raggi o riflessi luminosi. Con lenti trattate questi riflessi sono molto ridotti. Figura 37. Valori di riflettività per un rivestimento monostrato di fluoruro di magnesio su vetro crown. Rivestimenti multistrato Lo svantaggio del rivestimento antiriflesso monostrato sta nel fatto che non sono dispo nibili materiali con indice di rifrazione adatto a vetri con indice di riflessione minore di 1,9. Si ha un maggior grado di libertà se si utilizzano due strati. E' in questo caso possibile ottenere un va lore di ampiezza vicino a zero per l'onda riflessa disponendo in modo opportuno i due strati. Se, per esempio, si dispone uno strato con indice di rifrazione 1,7 come quello del fluoruro di piombo tra il vetro (1,52) e il fluoruro di magnesio (1,38) le tre ampiezze di riflessione sono Aria/MgF2 0,159 MgF2/PbF2 0,105 PbF2/vetro 0,056 Se li disponiamo in modo che gli ultimi due siano in opposizione di fase con il primo, il risultato è 0,002, che dà un valore di riflettività trascurabile alla lunghezza d'onda di riferimento. Si deve ricordare che la riflessione tra aria e MgF2 e la riflessione tra MgF2 e PbF2 danno un cambiamento di fase di π, ma quella tra PbF2 e vetro no, e che quindi i due strati al quarto di lunghezza d'onda disposti come nella figura 31 danno le fasi richieste. Il risultato per varie lunghezze d'onda (figura 38) mostra un'estinzione completa della riflessione solo alla lunghezza d'onda di riferimento, e che la riflettività aumenta più rapidamente che nel caso di un solo strato al variare la lunghezza d'onda. E' possibile con due strati ottenere anche riflettività nulla a due diverse lunghezze d'onda scegliendo gli spessori in modo che i vettori di fase risultino disposti in modo da formare un triangolo. - E.79 - Figura 38. Rivestimento antiriflesso a due strati. Se si considera un rivestimento a tre strati, il numero di gradi di libertà diviene ancora maggiore. Possono essere presi in considerazione altri vincoli, come per esempio la resistenza dei materiali utilizzati per i rivestimenti. La risposta spettrale più stretta del rivestimento antiriflesso a due strati e quella ancora più stretta di quelli a tre strati hanno relazione con il restringimento delle frange di interferenza che si ha nell'interferometria con più di due sorgenti. In generale, maggiore è il numero delle onde che interagiscono, più stretto è l'effetto sulle intensità riflesse o trasmesse al variare della lunghezza d'onda. Si possono costruire filtri spettrali stretti con 10, 20 o anche 40 strati di materiali alternati tra loro, disposti in modo che le onde luminose riflesse siano alternativamente in opposizione di fase per una determinata lunghezza d'onda. La trasmissione del filtro risulta ele vata (dell'ordine del 60-70%) per quella lunghezza d'onda, ma per le altre lunghezze d'onda le onde riflesse non si cancellano tra loro e ne risultano alti valori di riflettività (99%). Con filtri composti da 20 strati di materiale l'ampiezza della banda spettrale trasmessa può essere di 5 nm o anche meno. Filtri di questo tipo sono detti Vi possono essere bande di trasmissione anche ad altre lunghezze d'onda, ma possono essere escluse facilmente utilizzando un filtro ad assorbimento. Questi filtri sono noti come filtri bandpass. La figura 39 mostra la risposta di un filtro bandpass utilizzato in una telecamera per selezionare il canale blu; la banda di trasmissione nel rosso è eliminata mediante un filtro ad assorbimento. - E.80 Figura 39. Risposta di un filtro bandpass (blu) per una telecamera. Altri tipi di sistemi multi-strato trasmettono la luce per lunghezze d'onda maggiori di un certo valore e la riflettono per quelle inferiori, o viceversa. Un'applicazione di questo tipo di filtri si ha nei sistemi di controllo del calore emesso dalle lampade a incandescenza. Il calore è in gran parte dovuto alla parte dello spettro nell'infrarosso vicino e può danneggiare gravemente le pellicole di diapositive o di altro materiale utilizzate in un proiettore. Tra la lampada e la pellicola è posto un filtro (hot mirror) che riflette la radiazione infrarossa lasciando passare la luce visibile. Spesso dietro alle lampade dei proiettori sono posti specchi per concentrare il flusso lumino so. Questi specchi sono trattati per riflettere la luce visibile e lasciar passare la radiazione infrarossa (cold mirrors). Tutti i sistemi multi-strato sono molto sensibili all'angolo di incidenza della luce. I cam biamenti di temperatura possono provocare cambiamenti di spessore degli strati e in alcuni casi è necessario mantenere i filtri a temperatura costante. Si possono anche progettare sistemi multi-strato che funzionino per angoli di incidenza diversi dall'incidenza normale, ma possono avere problemi se la riflettività delle superfici varia con la polarizzazione della luce. Uno dei materiali più facili da far evaporare è l'alluminio, che quando viene depositato su una superficie di vetro lucidata forma un'ottima superficie riflettente sia per la luce che incide direttamente sulla pellicola di alluminio sia per la luce che la raggiunge dopo aver attraversato lo strato di vetro di supporto. Nel primo caso si ottengono specchi a riflessione frontale che hanno il vantaggio di non avere effetti cromatici dato che il vetro non viene attraversato dalla luce e che possono essere utilizzate anche lunghezze d'onda nell'ultravioletto che altrimenti sarebbero assorbite dal vetro. Si possono ottenere valori di riflettività del 90%. Il difetto di questi specchi è che l'alluminio tende a ossidarsi e può essere graffiato facilmente. Per evitarlo si evapora sopra all'alluminio uno strato di biossido di silicio, anche se questo riduce la riflettività alla luce blu. La riflettività dell'alluminio può essere aumentata fino al 99% su un intervallo ristretto di lunghezze d'onda applicando sull'alluminio rivestimenti di spessore pari a mezza lunghezza d'onda. In questo caso, nel quale è necessario aumentare la riflettività, è necessario utilizzare coppie di materiali con indici di rifrazione il più possibile diversi. Depositando sull'alluminio uno strato di fluoruro di magnesio (n = 1,38) e poi uno strato di solfuro di zinco (n = 2,35) si ottiene una riflettività del 97%. Con un'altra coppia di strati si arriva al 99%. Esercizi 1. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 0,500 cm, le cui costanti di fase sono rispettivamente 0,20 e 0,40 rad. 2. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 1,20 cm, le cui costanti di fase sono rispettivamente 0,05 e 0,78 rad. 3. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 1,25 mm, le cui costanti di fase sono rispettivamente 0,45 e 3,14 rad. 4. Quale deve essere la differenza tra le costanti di fase di due onde armoniche che hanno la stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 0,50 cm, perché l’onda risultante dalla loro sovrapposizione abbia ampiezza di 0,35 cm? 5. Quale deve essere la differenza tra le costanti di fase di due onde armoniche che hanno la stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 3,25 mm, perché l’onda risultante dalla loro sovrapposizione abbia ampiezza di 0,35 cm? - E.81 6. Quale deve essere la differenza tra le costanti di fase di due onde armoniche che hanno la stessa frequenza e lunghezza d’onda, ciascuna con ampiezza di 1,00 cm, perché l’onda risultante dalla loro sovrapposizione abbia ampiezza di 1,80 cm? 7. Due onde armoniche hanno rispettivamente equazione y = 3,5 sen (45x – 7,4t + 0,23) e y = 3,5 sen (45x – 7,4t + 2,05). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 8. Due onde armoniche hanno rispettivamente equazione y = 48 sen (5,7x – 5,9t + 1,45) e y = 48 sen (5,7x – 5,9t – 1,45). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 9. Due onde armoniche hanno rispettivamente equazione y = 10 sen (25x – 5,0t + 0,50) e y = –10 sen (25x – 5,0t + 1,50). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 10. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, le cui ampiezze sono rispettivamente 0,500 cm e 0,200 cm e le cui costanti di fase sono 0,20 e 0,40 rad. 11. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, le cui ampiezze sono rispettivamente 1,20 cm e 2,30 cm e le cui costanti di fase sono 0,05 e 0,78 rad. 12. Calcolare l’ampiezza dell’onda risultante dalla sovrapposizione di due onde armoniche della stessa frequenza e lunghezza d’onda, le cui ampiezze sono rispettivamente 1,25 mm e 0,80 mm e le cui costanti di fase sono 0,45 e 3,14 rad. 13. Due onde armoniche hanno rispettivamente equazione y = 3,5 sen (45x – 7,4t + 0,23) e y = 2,5 sen (45x – 7,4t + 2,05). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 14. Due onde armoniche hanno rispettivamente equazione y = 48 sen (5,7x – 5,9t + 1,45) e y = 24 sen (5,7x – 5,9t – 1,45). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 15. Due onde armoniche hanno rispettivamente equazione y = 10 sen (25x – 5,0t + 0,50) e y = 25 sen (25x – 5,0t + 1,50). Scrivere l’equazione dell’onda risultante dalla loro sovrapposizione. 16. Viene eseguito l’esperimento di Young utilizzando due fenditure sottili distanti una dal l’altra 0,50 mm, illuminate dalla luce prodotta da una lampada al sodio con una lunghezza d’onda di 589 nm. Uno schermo è disposto parallelamente alle fenditure a una distanza di 3,0 m. Qual è la distanza tra i massimi successivi della figura di interferenza? 17. Uno schermo dista 1,2 m da due fenditure sottili illuminate con una sorgente di luce monocromatica. La distanza tra le fenditure è 0,030 mm. La frangia chiara del secondo or dine si trova a 4,5 cm dalla frangia centrale. Qual è la lunghezza d’onda della luce? 18. Un massimo del terzo ordine nella figura di interferenza di Young si trova a 4,2 mm dal massimo centrale. La distanza tra le fenditure è pari a 200 volte la lunghezza d’onda della luce incidente. Qual è la distanza tra il piano delle fenditure e lo schermo? 19. Una sorgente di luce monocromatica illumina due fenditure distanti tra loro 1.000 volte la lunghezza d’onda della luce incidente. Si trovi la distanza tra due massimi adiacenti della figura di interferenza che si forma su uno schermo posto a una distanza di 4 m dalle fenditure. - E.82 20. Si dispone di un laser all’elio-neon che emette luce di lunghezza d’onda pari a 633 nm, di uno schermo alto 0,50 m posto a una distanza di 10 m da un piano, parallelo allo schermo, contenente due fenditure orizzontali parallele, poste a un’altezza di 0,25 m e a una distanza d una dall’altra. Si determini il valore di d per il quale su tutto lo schermo si possono osservare cinque massimi, compreso quello centrale. 21. Una lente di vetro con una superficie sferica con un raggio di curvatura di 50 cm viene appoggiata a una lastra di vetro piana. La lente viene illuminata dall’alto con la luce emessa da un laser all’elio-neon, che ha una lunghezza d’onda di 633 nm. Qual è la distanza dal punto di contatto tra la lente e la lastra di vetro a cui si osservano i primi tre massimi di intensità degli anelli di Newton? 22. Spiegare le condizioni necessarie perché si abbia interferenza tra due fasci di luce, e descrivere due metodi che si possono utilizzare per produrre queste condizioni. 23. L'effetto in un dato punto di due fasci di luce mutuamente coerenti dipende dalla diffe renza di fase tra le due onde quando raggiungono quel punto. Mostrare che la differenza di fase può essere espressa in termini di differenza di cammino dalla relazione Differenza di fase = (2π/λ) × differenza di cammino 24. Che sorgenti puntiformi che emettono onde di lunghezza d'onda pari a 6 mm in un pia no orizzontale distano 2 cm. Disegnare le linee lungo cui non c'è differenza di fase e quelle lungo cui c'è differenza di fase di 1, 2 e 3 lunghezza d'onda. 25. Descrivere un metodo di laboratorio per ottenere frange di interferenza in un modo basato sull'esperimento di Young. Spiegare quali misure devono essere fatte e quali calcoli devono essere eseguiti per determinare con questo esperimento la lunghezza d'onda della luce. 26. Una fenditura sottile illuminata con la luce emessa da una lampada al sodio ( λ = 589 nm) è posta a 15 cm da un biprisma che ha un angolo al vertice di 179° e indice di rifra zione 1,5. Trovare la separazione tra le frange di interferenza scure su uno schermo a 1 m dal prisma. 27. Un biprisma di Fresnel (n = 1,5) con angoli ai bordi di 0,5° viene usato per produrre interferenza. E' posto 10 cm davanti a una fenditura illuminata e le frange di interferenza che si producono su uno schermo a 1 m dal prisma hanno una separazione di 0,8 mm. Qual è la lunghezza d'onda della luce? Spiegare che cosa avverrebbe se una sottile lamina di vetro fosse posta sul percorso della luce davanti a una metà del prisma. 28. Due fenditure sottili distanziate di 0,5 mm sono illuminate con luce con una lunghezza d'onda di 600 nm e formano frange di interferenza su uno schermo a 1 m di distanza. (a) Quanto distano l'una dall'altra (da centro a centro) le frange scure? (b) Una lamina sottile dello spessore di 0,1 mm e indice di rifrazione 1,6 è posta davanti a una fenditura. Di quanto si spostano le frange sullo schermo, e in che direzione? 29. La luce proveniente da una fenditura passa attraverso due fenditure sottili distanziate di 0,2 mm. Le bande di interferenza che si formano su uno schermo distante 100 cm risultano distanziate di 3,29 mm. Qual è la lunghezza d'onda della luce? Descrivere un altro metodo per determinare con questo dispositivo la lunghezza d'onda della luce. 30. Vengono prodotte frange di interferenza con un biprisma con luce di una lampada al so dio (λ = 589 nm). Una lamina di acqua saponata (n = 1,33) è posta sul percorso di uno dei due fasci di luce che interferiscono e la banda centrale luminosa si muove fino alla posizione precedentemente occupata dalla terza banda. Qual è lo spessore della lamina? - E.83 31. Una lente convessa è posta su una superficie piana di vetro e viene illuminata con incidenza normale con la luce di una lampada al sodio ( λ = 589 nm). Se il diametro del decimo anello nero è 1,5 cm, qual è la curvatura della superficie? 32. Si formano anelli di Newton tra una superficie piana di vetro e una lente. Il diametro del terzo anello nero è 1 cm quando la luce di una lampada al sodio ( λ = 589 nm) è indirizzata con un angolo tale che la luce passa attraverso la lamina di aria con un angolo di 30° rispetto alla normale. Trovare il raggio di curvatura della lente. 33. Si formano anelli di Newton nella lamina di aria presente tra una superficie piana e una superficie di raggio r, con incidenza normale. Calcolare la posizione dei primi sei anelli luminosi e scuri per luce di tre lunghezze d'onda, 680, 589 e 450 nm. Fare un grafico dei risultati con curve sinusoidali che mostrano la variazione dell'intensità della luce dal centro verso l'esterno e quindi dedurre in modo approssimato le prime serie della scala dei colori di Newton. 34. Spiegare la produzione di anelli di Newton da parte di luce trasmessa da una lamina sottile trasparente. Perché questi anelli sono di colori complementari rispetto a quelli osservati per riflessione dallo stesso spessore della lamina? 35. Spiegare perché è difficile ottenere frange di interferenza per riflessione con una lamina di spessore apprezzabile illuminata con luce bianca. Come cambia la situazione se si usa: (a) luce emessa da una lampada al sodio? (b) luce emessa da un laser HeNe? 36. Due lamine piane di vetro sono a contatto lungo un bordo e sono separate in un punto distante 20 cm dal bordo da un filo del diametro di 0,05 mm. Di quanto sono distanziate le frange di interferenza scure che si formano quando luce di lunghezza d'onda di 589 nm incide normalmente sullo strato di aria racchiuso tra le lamine? 37. Descrivere brevemente, con un disegno illustrativo, lo schema ottico dell'interferometro di Michelson. Lo strumento è disposto in modo da osservare bene frange di interferenza con luce monocromatica. Se lo specchio mobile è spostato di 0,015 mm di osserva uno spostamento di 50 frange. Qual è la lunghezza d'onda della luce? 38. Un interferometro di Michelson è sistemato in modo da ottenere frange della massima intensità possibile usando come sorgente una lampada al sodio, che emette luce a due lunghezze d'onda (589,0 e 589,6 nm). Muovendo uno degli specchi si trova una posizione nella quale le frange scompaiono, perché il massimo di uno dei due sistemi di frange coincide con il minimo dell'altro. Di quanto si è spostato lo specchio rispetto alla posizione originale? 39. Si producono frange di interferenza con un biprisma di Fresnel. Se si introduce una sottile lamina di vetro sul percorso di uno dei due fasci di luce che interferiscono, la frange si spostano lateralmente. Spiegare, con un disegno, perché ciò avviene e in che direzione si ha lo spostamento. Se l'indice di rifrazione della lamina di vetro è 1,5, la lunghezza d'onda della luce è 600 nm e la banda centrale luminosa si muove nella posizione precedentemente occupata dalla quinta frangia, qual è lo spessore della lamina di vetro? 40. Si applicano rivestimenti antiriflettenti alle superfici delle lenti e degli elementi ottici per ridurre la quantità di luce riflessa e aumentare la luce trasmessa. Spiegare in dettaglio come si ottiene questo effetto, mettendo in evidenza il ruolo dello spessore e dell'indice di rifrazione della pellicola. Fare un disegno. 41. Spiegare che cosa si intende per "specchio a riflessione frontale". Come si può ottenere una riflettività del 98%? - E.84 42. Si producono anelli di Newton con una lente la cui superficie inferiore non è sferica ma conica; si ha il contatto con la lastra di vetro piana in una piccola porzione piana della lente ottenuta spianando il vertice del cono. Qual è la forma delle frange di interferenza e come sono distanziate tra loro? Contando le frange radialmente verso l'esterno e osservandole normalmente si trovano 10 frange in una distanza di 1 cm. Qual è l'angolo tra la superficie conica e il piano se la lunghezza d'onda della luce è 600 nm? 43. Un semplice filtro a interferenza è realizzato usando una lamina di aria delimitata da su perfici piane parallele riflettenti per ottenere un picco di trasmissione a 546 nm. Calcolare lo spessore della lamina richiesto per uso a incidenza normale e determinare lo spo stamento in lunghezza d'onda del picco di massima trasmissione quando l'angolo di in cidenza della luce è (a) 10 ° e (b) 30°. 44. Si deposita fluoruro di magnesio con indice di rifrazione 1,38 su vetro flint pesante con indice di rifrazione 1,7 per produrre una superficie non riflettente per una lunghezza d'onda di 500 nm. Che spessore deve avere il rivestimento? Perché il fluoruro di magnesio non produce una superficie non riflettente altrettanto efficace se è depositato su vetro con indice di rifrazione 1,5? 45. Un rivestimento con indice di rifrazione 1,4 è depositato su vetro con indice di rifrazione 1,6 per avere minima riflessione a incidenza normale a una lunghezza d'onda di 500 nm. Calcolare lo spessore del rivestimento e i coefficienti di riflessione alle lunghezze d'onda di 500, 400 e 600 nm. Dedurre quale sarà il colore della luce riflessa dalla superfici, supponendola illuminata con luce bianca con incidenza normale, e assumendo che non vi sia variazione dell'indice di rifrazione con la lunghezza d'onda. 46. Una bolla di sapone ha uno spessore di 1,0 µ. Qual è la lunghezza d’onda corrispondente ai colori visibili la cui riflessione dà luogo a interferenza costruttiva? (Utilizzare l’indice di rifrazione dell’acqua pari a 1,33.) 47. Quale deve essere lo spessore dello strato di fluoruro di magnesio (indice di rifrazione assoluto 1,38) che deve essere posto sulla superficie di una lente perché non venga riflessa la luce azzurra con una lunghezza d’onda di 450 nm? 48. Uno strato di olio con uno spessore di circa 1 µ galleggia sulla superficie dell’acqua. Viene illuminato dall’alto con la luce emessa da un laser all’elio-neon, che ha una lunghezza d’onda di 633 nm. Non viene riflessa luce dalla lamina. Qual è lo spessore esat to della lamina? - E.3 - L - LA DIFFRAZIONE (I) Abbiamo esaminato finora situazioni nelle quali due o più onde si sovrappongono dando luogo a fenomeni di interferenza. Vi sono molte situazioni nelle quali un’onda viene deviata in contrando un ostacolo lungo il suo percorso. Uno dei fenomeni più comuni tra quelli che si pre sentano in questo caso è la riflessione, di cui abbiamo già studiato le leggi. Un altro fenomeno comune nella propagazione di un’onda attraverso materiali diversi, che pure abbiamo già studiato, è la rifrazione, nella quale viene deviata la direzione di propagazione dell’onda. Se però l’onda incontra un ostacolo di dimensioni paragonabili alla sua lunghezza d’onda ha luogo il fe nomeno della diffrazione, con il quale l’onda viene sparpagliata in varie direzioni, e di cui ci occuperemo ora. 1. La diffrazione delle onde Nel considerare la riflessione di un’onda che si propaga su una superficie o nello spazio, avevamo implicitamente assunto che l’ostacolo contro il quale l’onda si riflette sia di grandi dimensioni. Se questo non è vero, e più precisamente se l’ostacolo che si frappone all’onda ha dimensioni paragonabili o minori della lunghezza d’onda λ, allora l’onda non si riflette, ma prosegue il suo moto praticamente indisturbata, passando intorno all’ostacolo. È quello che avviene quando un’onda sulla superficie del mare, con una lunghezza d’onda λ di qualche decina di metri, incontra i pali su cui si regge un pontile, che hanno un diametro di qualche decina di cen timetri, molto piccolo rispetto alla lunghezza delle onda: le onde passano al di là dei pali praticamente indisturbate. In modo analogo, se un’onda incontra un ostacolo che presenta una fenditura larga ri spetto alla lunghezza d’onda λ, la parte dell’onda che passa attraverso la fenditura può proseguire senza essere praticamente disturbata. È quello che si osserva nella figura 1, che rappresenta un’onda piana che si propaga sulla superficie dell’acqua (diretta nella figura dall’alto verso il basso) e incontra un ostacolo con una fenditura che ha una larghezza d = 6λ. L’onda si propaga al di là dell’ostacolo mantenendo un fronte d’onda approssimativamente rettilineo. Figura 1. Diffrazione di un’onda attraverso una fenditura in un ostacolo rappresentato in arancio nella figura: l’onda piana proveniente dall’alto si propaga quasi indisturbata dopo essere passata attraverso una fenditura di ampiezza pari a 6 volte la lunghezza d’onda λ. - E.4 Se però la lunghezza d’onda è paragonabile alle dimensioni della fenditura, come nella figura 2 dove d = 1,6 λ, l’onda viene significativamente allargata e raggiunge anche zone che non sono allineate, rispetto alla fenditura, con la direzione di propagazione dell’onda incidente. Se poi la lunghezza d’onda è più grande delle dimensioni della fenditura, come nella figura 3 dove d = 0,6 λ, dalla fenditura emerge un’onda praticamente circolare: la fenditura si comporta come se fosse una sorgente puntiforme. Figura 2. Diffrazione di un’onda attraverso una fenditura in un ostacolo rappresentato in arancio nella figura: l’onda piana proveniente dall’alto è diffratta da una fenditura di ampiezza pari a 1,6 volte la lunghezza d’onda λ con un angolo di diffrazione di circa 30°. Figura 3. Diffrazione di un’onda attraverso una fenditura in un ostacolo rappresentato in arancio nella figura: l’onda piana proveniente dall’alto è diffratta da una fenditura di ampiezza pari a 0,6 volte la lunghezza d’onda λ con un angolo di diffrazione praticamente di 90°. - E.5 È a causa di questo fenomeno, che prende il nome di diffrazione, che possiamo udire suoni che sono emessi da sorgenti sonore che si trovano dietro ostacoli, come per esempio la voce di una persona che si trova dietro un muro. Le onde sonore hanno lunghezze d’onda di parecchi metri per le tonalità più basse, e possono quindi “aggirare” ostacoli di queste dimensioni. Figura 4. Poiché un’onda sonora può “aggirare”, per il fenomeno della diffrazione, un ostacolo di dimensioni paragonabili o più piccole della sua lunghezza d’onda, possiamo udire suoni emessi dietro una parete. Praticamente negli stessi anni in cui venivano elaborate la teoria corpuscolare di Newton e la teoria ondulatoria di Huygens il bolognese Francesco Maria Grimaldi (1618-1663) scoprì il fenomeno della diffrazione della luce. Frapponendo un oggetto sottile come la punta di un ago o un filo di ragnatela alla luce solare che filtrava attraverso un sottile forellino in una camera oscura, Grimaldi aveva osservato delle sottili frange colorate attorno all’ombra dell’oggetto (figura 5). Si tratta di un fenomeno che presenta caratteristiche simile all’analogo fenomeno della diffrazione delle onde elastiche: più piccolo è l’ostacolo che si frappone alla propagazione della luce e maggiore è lo “sparpagliamento” della luce che ne risulta. Figura 5. Diffrazione di luce bianca da parte dei bordi di una lametta da barba. - E.6 - Q S R Figura 6. Il principio di Huygens applicato alla diffrazione da un piccolo forellino S: a sinistra dello schermo QR si propaga un’onda piana; l’onda sferica che si propaga a destra dello schermo corrisponde all’onda elementare emessa dalla sorgente puntiforme coincidente con il forellino S. Per spiegare la diffrazione della luce nell’ambito della teoria corpuscolare si ipotizzò che le particelle luminose venissero deviate dall’attrazione gravitazionale esercitata dall’ostacolo, ma non era chiaro perché questa attrazione si manifestasse solo con oggetti di piccolissime di mensioni e in misura differente per la luce di colori diversi. Il principio di Huygens permetteva invece di spiegare in maniera molto semplice la diffrazione di un’onda da parte di un ostacolo di piccole dimensioni. Supponiamo che un’onda pia na incida su una superficie opaca, nella quale si trovi un forellino di dimensioni piccole rispetto alla lunghezza dell’onda incidente (figura 6). Tutti i punti dell’onda piana sono intercettati dall’o stacolo, tranne quello che corrisponde alla fenditura. Al di là dell’ostacolo si propaga allora solo l’onda sferica emessa da questo punto del fronte d’onda incidente, e la luce che emerge dal forellino risulta quindi sparpagliata in tutte le direzioni. Il fenomeno della diffrazione della luce co stituisce quindi un'altra prova della natura ondulatoria dei raggi luminosi. I vari casi di diffrazione della luce vengono suddivisi, per comodità, in due gruppi: a) quelli nei quali sorgente e schermo sono posti a grande distanza (teoricamente infinita) dalle fenditure e dagli ostacoli. La diffrazione così ottenuta viene chiamata "in campo lonta no" o diffrazione di Fraunhofer. b) quelli nei quali sia la sorgente che lo schermo sono posti a distanza finita dalla fenditura o dagli ostacoli. La diffrazione così ottenuta è chiamata "in campo vicino" o diffrazione di Fresnel. Anche se il secondo gruppo rappresenta il caso più generale, in quanto contiene in sé come casi limite tutti i tipi del primo gruppo, si preferisce fare questa distinzione in quanto è più semplice matematicamente trattare la diffrazione di Fraunhofer. 2. Diffrazione di Fraunhofer da una singola fenditura larga Quando abbiamo trattato nel capitolo precedente il fenomeno dell'interferenza della luce, e abbiamo considerato esperienze come quella di Young nelle quali venivano fatte interferire le onde luminose provenienti da una o più fenditure, abbiamo sempre supposto che le fendi ture fossero sottili, ossia molte strette rispetto alla lunghezza d'onda della luce. Vogliamo ora considerare invece il caso in cui l'onda luminosa proveniente da una sorgente monocromatica di lunghezza d'onda λ incontra una fenditura di larghezza d paragonabile con la lunghezza d'onda λ, ossia una fenditura larga. Supponiamo inoltre che la sorgente o lo schermo si trovino molto lontano dalla fenditura, in modo che l'onda possa essere considerata piana (diffrazione di Frau nhofer). La situazione è rappresentata nella figura 7. L’onda luminosa emergente dalla fenditura non sarà diretta soltanto lungo la direzione dell’onda piana incidente, ma risulterà sparpagliata entro un angolo θ, che risulterà tanto più piccolo quanto più larga è la fenditura. - E.7 - D P x d C B Figura 7. Diffrazione da una fenditura larga: la fenditura può essere considerata la somma di N sorgenti equidistanti (i punti allineati lungo la fenditura) ognuna delle quali contribuisce con un’onda elementare all’ampiezza dell’onda prodotta nel punto P dello schermo C. Si trova, come dimostreremo nelle pagine che seguono, che l'intensità della radiazione emergente dalla fenditura a un angolo di osservazione θ è data da: 2 d ϕ sen π sen θ sen λ 2 = I0 I = I0 d ϕ π sen θ λ 2 2 (1) dove ϕ, come vedremo fra poco, è lo sfasamento tra onde provenienti dai bordi della fenditura. L’andamento dell’intensità di radiazione I è rappresentato nella figura 8. I valori di posizione, ampiezza e intensità delle prime tre frange sono dati dalla tabella 1. 1,2 1 0,8 I (x )/I 0 0,6 0,4 0,2 0 -16 -12 -8 -4 0 4 8 12 16 (rad) Figura 8. L’intensità di radiazione delle frange di diffrazione prodotte da una fenditura larga, in funzione dello sfasamento massimo ϕ. - E.8 Tabella 1. Diffrazione di Fraunhofer da una fenditura rettangolare. Differenza di fase Ampiezza Intensità n. frangia 0 1 1 0 2π 0 0 minimo 2,86π 0,217 0,047 1 4π 0 0 minimo 4,92π 0,125 0,017 2 6π 0 0 minimo 6,94π 0,091 0,008 3 8π 0 0 minimo Per ϕ/2 = mπ (m ≠ 0) l’intensità di radiazione I si annulla. Le direzioni corrispondenti si ottengono ponendo π d sen θ = mπ λ (n ≠ 0) ossia sen θ = mλ d (m ≠ 0) (2) I punti corrispondenti sullo schermo si ricavano moltiplicando per la distanza D dello schermo e si ottiene x m = mλ D d (n ≠ 0) (3) Confrontando la relazione (3) che fornisce le posizioni dei minimi della fenditura larga con la relazione (20) del capitolo precedente che fornisce le posizioni dei massimi di interferenza di un sistema di fenditure sottili, vediamo che ad eccezione del punto centrale (m = 0) essi coincidono esattamente. La distanza angolare del primo minimo di intensità dall’asse, che si ottiene per n = 1, è pari a θ min ≈ sen θ min = λ d (4) ed è rappresentativa di quanto l’onda luminosa viene diffratta dalla presenza della fenditura. Si noti che la lunghezza d’onda λ della luce visibile, compresa tra 4 × 10-7 m e 7 × 10-7 m, è molto piccola rispetto alle dimensioni degli oggetti con cui abbiamo a che fare nella vita quotidiana, e gli angoli di diffrazione risultano quindi pure molto piccoli. Un oggetto delle dimensioni di 1 cm, per esempio, frapposto a un’onda luminosa produce un angolo di diffrazione θ = 5 × 10-5 rad, pari a circa 1/300 di grado: quest’angolo di diffrazione corrisponde, a una distanza di 1 m, a una deviazione dei raggi luminosi pari solamente a 1/20 di millimetro. Per questo non notiamo ordinariamente il fenomeno della diffrazione della luce. Diffrazione di Fraunhofer da una singola fenditura larga - dimostrazione Vogliamo ora ricavare la formula (1). Procederemo con lo stesso metodo vettoriale utilizzato nel capitolo precedente per ricavare la figura di interferenza prodotta da una serie di fen diture sottili. La fenditura larga può essere pensata come la sovrapposizione di un grande numero N di fenditure sottili affiancate. Per il principio di Huygens, l’onda luminosa emergente dalla fenditura corrisponde alla sovrapposizione delle onde sferiche elementari emesse ciascuna di queste sorgenti, indicate nella figura 7 da una serie di punti. - E.9 Abbiamo detto che possiamo ottenere la distribuzione sullo schermo C della luce emessa da queste sorgenti elementari con il metodo vettoriale. Indichiamo con a = d/N la distanza tra le successive sorgenti elementari e con A’ l’ampiezza dell’onda emessa da ciascuna sorgente elementare quando raggiunge lo schermo C. Poiché la distanza D dello schermo dalla fenditura è molto più grande della larghezza d della fenditura, possiamo considerare paralleli i raggi luminosi che dai vari punti della fenditura giungono in uno stesso punto x dello schermo. La differenza di fase ∆ϕ tra le onde emesse dalle successive sorgenti elementari quando raggiungono lo schermo C è allora data dalla relazione (21) del capitolo precedente, nella quale sostituiamo alla distanza d tra le fenditure la distanza a tra le sorgenti elementari: ∆ ϕ = 2π a x d x = 2π λ D λ ND (5) Consideriamo il punto x = 0 sull’asse dello schermo, per il quale si ha ∆ϕ = 0. I vettori corrispondenti alle N sorgenti sono tutti paralleli (figura 9.a) e l’ampiezza A0 dell’onda risultante è pari a NA’. Se ci spostiamo un poco da questo punto sullo schermo, si avranno valori via via crescenti della differenza di fase ∆ϕ, e i vettori corrispondenti alle N sorgenti avranno come somma il vettore A indicato nella figura 39.b, che per N molto grande è la corda di un arco di circonferenza di lunghezza A0 = NA’ e angolo al centro ϕ = N∆ϕ (l’angolo al centro BOˆ D è infatti supplementare all’angolo BCˆ D , perché si tratta di due angoli interni del quadrilatero BODC che ha gli altri due angoli retti; l’angolo BCˆ D è a sua volta supplementare all’angolo esterno a D che per costruzione ha ampiezza ϕ = N∆ϕ). La lunghezza della corda è pari a A = 2r sen ϕ 2 (6) A’ a) ∆ ϕ = 0 A’ A’ A’ A’ A’ A’ A’ A0 = NA’ b) ∆ϕ ≠ 0 D ϕ = N∆ ϕ A’ O A ϕ A’ ϕ /2 A’ r A’ A’ A’ c) A’ ∆ϕ B A’ C A’ ∆ ϕ = 2nπ /N A’ r A’ A’ A’ A’ A’ A’ Figura 9. Diffrazione da una fenditura larga: costruzione geometrica per il calcolo dell’ampiezza dell’onda risultante. - E.10 mentre la lunghezza A0 = NA’ dell’arco di circonferenza può essere espressa in funzione del raggio r e dell’angolo al centro ϕ come: A0 = rϕ (7) Ricavando r dalla relazione (7) e sostituendo nella (6) si ottiene allora: A ϕ A = 2 0 sen = A0 ϕ 2 sen ϕ 2 ϕ 2 (8) o, in termini di intensità di radiazione I (proporzionale al quadrato dell’ampiezza A dell’onda) ϕ sen 2 I = I0 ϕ 2 2 (9) che è la formula che volevamo dimostrare. 3. Diffrazione di Fraunhofer da un'apertura circolare Il sistema di frange di diffrazione prodotte da un'apertura circolare presenta molte delle caratteristiche già viste nel caso di una fenditura rettangolare. Invece di un sistema di frange parallele, però, la figura di diffrazione consiste in un disco luminoso circondato da corone anulari alternativamente chiare e scure come indicato nella figura 10, detto disco di Airy dal nome dell'astronomo che per la prima volta nel 1834 studiò la distribuzione della luce nell'immagine di una sorgente puntiforme prodotta da una lente. Figura 10. Figura di diffrazione prodotta da un'apertura circolare (centrica o disco di Airy). La legge matematica che esprime la dipendenza dell'intensità luminosa dal centro della figura di diffrazione è in questo caso più complessa che nel caso della fenditura rettangolare che abbiamo trattato nel paragrafo precedente, e per esprimerla è necessario utilizzare delle funzioni matematiche di livello superiore dette funzioni di Bessel. L'andamento dell'intensità luminosa in funzione della distanza dal centro della figura è illustrato dalla figura 11, mentre la figura 12 mostra un confronto tra la figura di interferenza prodotta da un'apertura circolare e quel la prodotta da una fenditura rettangolare. Risulta che se D è il diametro dell'apertura circolare, l'angolo θ corrispondente alla prima corona anulare scura, espresso in radianti, è dato dalla re lazione - E.11 - θ ≈ sen θ = 1,22 λ D (10) che corrisponde alla relazione (4) valida per la fenditura rettangolare a parte il fattore numerico 1,22. I valori di posizione, ampiezza e intensità delle prime tre frange sono dati dalla tabella 2. La quantità di luce concentrata nel disco centrale della figura di diffrazione è pari all'86,7 per cento del totale; il primo anello contiene il 6,9 per cento del totale della luce, il secondo il 2,6 per cento, e così via. Figura 11. Curve di ampiezza (tratteggiata) e di intensità (continua) per la diffrazione di Fraun hofer da un'apertura circolare. Figura 12. Confronto tra le figure di diffrazione prodotte da un'apertura rettangolare (linea punteggiata) e un'apertura circolare (linea continua). - E.12 Tabella 2. Diffrazione di Fraunhofer da un'apertura circolare. Differenza di fase Ampiezza Intensità n. frangia 0 1 1 0 2,44π 0 0 minimo 3,27π 0,132 0,0175 1 4,47π 0 0 minimo 5,36π 0,065 0,0042 2 6,48π 0 0 minimo 7,40π 0,040 0,0016 3 8,48π 0 0 minimo 4. Il potere risolutivo di uno strumento ottico Il potere risolutivo di un cannocchiale Supponiamo che nella figura 13 B e Q siano due punti luminosi distanti, per esempio due stelle, che sottendono un angolo ω rispetto al punto nodale oggetto dell'obiettivo di un cannocchiale; le loro immagini B' e Q' sottendono lo stesso angolo rispetto al punto nodale immagine dell'obiettivo, e la separazione tra le immagini dipende da questo angolo e dalla focale dell'o biettivo. Se l'obiettivo del cannocchiale non è di grande qualità le aberrazioni saranno tali da sovrastare l'effetto della diffrazione. Se invece l'obiettivo ha aberrazioni residue trascurabili rispetto all'effetto della diffrazione, si dice che è al limite della diffrazione. Ogni immagine sarà costituita allora da una figura di diffrazione e quando la separazione delle immagini è grande rispetto al diametro dei dischi di Airy la distribuzione della luce sarà quella mostrata nella figura 13. In queste condizioni non vi è difficoltà per vedere le due immagini separate, ossia per "risolvere" gli oggetti. Se l'angolo ω si riduce le immagini si avvicinano, mentre il diametro dei dischi resta lo stesso, e quando l'angolo è ridotto al di sotto di un certo valore i due dischi si so vrappongono in modo tale che l'occhio li vede come un'unica macchia luminosa e non è più in grado di interpretare l'immagine come composta da due oggetti puntiformi. Il minimo valore del l'angolo ω per il quale i due punti possono essere ancora distinti è il potere risolutivo ed è di grande importanza per quegli strumenti come l'occhio, il cannocchiale o il microscopio utilizzati per osservare oggetti con dettagli fini o oggetti puntiformi separati da piccoli angoli. Figura 13. Immagini di due punti separati. - E.13 - Figura 14. Curve di intensità di due sorgenti puntiformi al limite della risoluzione. Per ottenere un'espressione per il potere risolutivo è necessario adottare un criterio relativamente alla separazione dei dischi di Airy che permetta di osservare i due oggetti come di stinti. Si assume solitamente che con un sistema otticamente perfetto possono essere risolti due punti se il centro di una delle figure di diffrazione cade sul primo anello scuro dell'altro, os sia se l'angolo ω è uguale a θ come mostra la figura 14. Si ha allora dall'equazione (10) che ω = 1,22 λ D (11) Quindi perché un cannocchiale abbia un elevato potere risolutivo è necessario che il diametro D della sua apertura sia il più grande possibile. Nel ricavare in questo modo il potere risolutivo di un cannocchiale si è assunto che i cammini ottici di tutti i raggi che giungono al fuoco immagine siano uguali, ossia che il fronte d'onda emergente sia sferico. In pratica uno strumento non può arrivare a questo livello di perfezione ottica, ma Lord Rayleigh (1842-1919) ha dimostrato nel 1878 che questa condizione può essere soddisfatta se la differenza tra il cammino ottico maggiore e il cammino ottico minore non supera nel fuoco dello strumento il quarto di lunghezza d'onda. Esempio Un cannocchiale con un obiettivo che ha un diametro di 40 mm è messo a fuoco su un oggetto distante 1000 m; qual è il minimo dettaglio che può essere visibile con questo strumento? Se l'occhio può risolvere due punti che sottendono un angolo di 100", qual è l'ingrandimento per osservare questo dettaglio nell'immagine? (Considerare una lunghezza d'onda di 550 nm.) Dall'equazione (11) si ricava l'angolo minimo che può essere risolto: ω = 1,22 λ 1,22 × 0,00055 = = 0,0000168 rad D 40 - E.14 Poiché l'angolo è piccolo possiamo porre ω = h/l, dove h è la dimensione dell'oggetto e l la sua distanza. Quindi h = ωl = 0,0000168 × 1000 m = 0,0168 m = 16,8 mm Se si vuole che l'immagine fornita dal cannocchiale sottenda un angolo di 100" = 100/206000 rad, l'ingrandimento richiesto è 100 = 29 206000 × 0,0000168 Il potere risolutivo di un microscopio Nel caso del microscopio, è utile esprimere il diametro D dell'obiettivo in funzione della sua apertura angolare β (figura 15) visto dalla posizione del suo fuoco oggetto e della focale oggetto f: D = 2f tg β (12) Figura 15. Geometria di un obiettivo da microscopio. Con questa sostituzione la formula (11) diventa ω = 0,61 λ f tg β (13) Quello che interessa è la distanza r tra due punti osservati sul piano AA', che è inclinato di un angolo β rispetto alla direzione dei raggi incidenti sull'obiettivo. Per tenerne conto si dovrà introdurre un fattore cos β in modo che r = fθ λ λ = 0,61 = 0,61 cos β tg β cos β sen β (14) Bisogna poi ricordare che in un mezzo con indice di rifrazione n la lunghezza d'onda si riduce a λ/n. Si deve tener conto di ciò in particolare nel caso degli obiettivi per microscopio a immersione omogenea, con i quali viene interposto tra il coprivetrino e l'obiettivo un liquido con indice di rifrazione n. La minima distanza tra due punti che possono essere distinti in questo caso è data da r = 0,61 λ n sen β (15) Come fu proposto da Abbe, il prodotto n sen β è detto apertura numerica dell'obiettivo e può raggiungere il valore 1,4 negli obiettivi a immersione omogenea. In luce bianca ( λ = 555 - E.15 nm = 5,55 × 10-7 m), quindi, un microscopio con obiettivo a immersione omogenea con apertura numerica pari a 1,4 può separare punti distanti l'una dall'altro r = 0,61× 5,55 × 10 − 7 m = 2,4 × 10 − 7 m = 0,24 μm 1,4 Questa distanza è pari a circa metà della lunghezza d'onda della luce. Si tenga presente che finora si è supposto che la risultante delle due curve mostrate nella figura 14 si ottenga sommando le intensità delle due figure di diffrazione e si è quindi assunto che le due sorgenti luminose non siano mutuamente coerenti. Si tratta del caso normale quando si tratta di un cannocchiale, usato per esempio per osservare due stelle distinte. Il caso del microscopio è però più difficile, dato che gli oggetti che si osservano sono illuminati da una stessa sorgente luminosa che, anche se non coerente di per sé, può dare condizioni di coeren za parziale per oggetti vicini tra loro, se i fronti d'onda che essi diffondono risultano in fase l'uno con l'altro. In questo caso l'immagine risultante si ottiene sommando le ampiezze anziché le intensità. Risulta allora che, nelle condizioni in cui è possibile risolvere sorgenti non coerenti, può non essere invece risolta la figura di diffrazione prodotta da due sorgenti coerenti. Un confronto tra le due figure di diffrazione è dato dalla figura 16, nella quale si assume che le due sorgenti coerenti siano in fase. Se le due sorgenti coerenti sono invece in opposizione di fase la figura di diffrazione può essere facilmente risolta. Figura 16. Curve di intensità risultanti per oggetti vicini. - E.16 - 5. Diffrazione di Fraunhofer da più fenditure larghe Consideriamo ora N fenditure, ciascuna di larghezza d, poste a distanza a, come mostra la figura 17. Per ogni direzione θ abbiamo ora N sistemi di onde diffratte provenienti dalle diverse fenditure, e ciò che osserviamo è il risultato dell'interferenza di queste onde. Abbiamo quindi una combinazione di diffrazione e interferenza. a a d d d a d r4 r3 S4 S3 D P x r2 S2 r1 S1 C B Figura 17. Sezione trasversale di un sistema di fenditure di larghezza d separate da una distanza a. Poiché la separazione tra le diverse sorgenti è a, il fattore di interferenza per l'intensità dell'onda risultante è lo stesso trovato nel caso dell'interferenza da più fenditure sottili dato dall'espressione (24) del capitolo precedente, che ora assume la forma: Na sen π sen θ λ a sen θ sen π λ 2 mentre il fattore di diffrazione, dato dall'espressione (1), è d sen π sen θ λ d π sen θ λ 2 L'intensità risultante è quindi d sen π sen θ λ I = I 0 d π sen θ λ 2 Na sen θ sen π λ a π sen θ λ (16) Un esempio è mostrato dalla figura 18, nella quale sono confrontati i grafici corrispondenti alla diffrazione da una sola fenditura, da due fenditure e da quattro fenditure, mentre la figura 19 mostra una fotografia delle figure di diffrazione corrispondenti a questi grafici. - E.17 - Figura 18. Curve di intensità per diffrazione di Fraunhofer da una, due e quattro fenditure. Figura 19. Immagini delle frange di diffrazione di Fraunhofer da una, due e quattro fenditure. - E.18 Se il numero N di fenditure è grande, l'intensità dei massimi secondari diviene così piccola rispetto a quella dei massimi principali che i massimi secondari non vengono più osservati: ciò che si osserva è una serie di frange luminose sottili corrispondenti ai massimi principali della figura di interferenza, che sono dati dall'espressione sen θ = mλ a (17) dove m = 0, ±1, ±2, ..., con le loro intensità modulate dal fattore di diffrazione, come mostra la figura 20 che rappresenta il caso N = 15 e a = 3d. Quando N è molto grande le frange che si osservano sono così sottili che possono essere considerate immagini della fenditura utilizzata come sorgente luminosa. 250 200 150 I (x )/I 0 100 50 0 -10 -8 -6 -4 -2 0 2 4 6 8 10 ϕ (rad) Figura 20. L'intensità di radiazione prodotta da una serie di N = 15 fenditure larghe con a = 3d. Si ottiene così un reticolo di diffrazione. Esso consiste, nella sua forma più semplice, di un grande numero di fenditure parallele uguali estremamente sottili separate da spazi opachi che hanno normalmente lo stesso spessore delle fenditure. I primi reticoli di diffrazione, realizzati da Fraunhofer intorno al 1820, erano formati da fili sottilissimi vicini. In seguito Rowland (1848-1901) produsse reticoli incidendo linee sottili vicine su una superficie di vetro mediante una sottile punta di diamante: i graffi prodotti dal diamante possono essere considerati spazi opachi tra fenditure trasparenti. I reticoli utilizzati attualmente hanno fino a 10.000 linee per cen timetro. Vengono riprodotti ricoprendo uno stampo con una sottile pellicola di polimero che viene poi montata su una lamina di vetro. Reticoli prodotti in questo modo possono avere imperfe zioni che danno luogo a immagini fantasma. Un tipo di reticolo che non presenta questo proble ma è realizzato formando frange di interferenza sottili in un materiale fotosensibile, che una volta sviluppato presenta un profilo che riproduce la figura di interferenza. I reticoli di questo tipo sono detti reticoli olografici. Quando luce monocromatica proveniente da una fenditura lontana o da una fenditura posta davanti a un collimatore passa attraverso un reticolo di diffrazione ed è focalizzata da una lente su uno schermo o osservata mediante un cannocchiale, si forma un'immagine centrale brillante della fenditura con frange meno luminose da entrambe le parti separate da spazi scuri. Se il numero delle fenditure è grande le frange corrispondenti ai vari massimi sono ben definite e ben separate. Tranne che per l'immagine centrale, le posizioni dei massimi dipendono dalla lunghezza d'onda. Se quindi, anziché utilizzare una sorgente di luce monocromatica, si utilizza luce bianca, in corrispondenza di ciascuna lunghezza d’onda λ presente nella luce incidente si avrà una serie di righe nelle posizioni individuate dalla formula (17), che insieme danno origine - E.19 a una sequenza di spettri (figura 21): per n = 0 si ottiene una riga bianca risultante dalla sovrapposizione di luce di tutti i colori; per n = 1 si ha una coppia di spettri che vengono detti del primo ordine, per n = 2 una seconda coppia di spettri (del secondo ordine), e così via. n =2 n =0 n =1 Figura 21. Spettri di ordine 0, 1 e 2 della luce bianca ottenuti con un reticolo di diffrazione. La superficie di un CD-ROM appare iridescente perché i sottilissimi solchi che vi sono tracciati agiscono come un reticolo di diffrazione per la luce bianca che vi si riflette. Per lo stes so motivo appare iridescente una superficie di madreperla. Utilizzando un reticolo di diffrazione è possibile realizzare spettrometri, ossia strumenti che permettono di ricavare lo spettro di una sorgente luminosa e misurare la lunghezza d’onda delle sue diverse componenti, che presentano diversi vantaggi rispetto ad analoghi strumenti realizzati sfruttando la rifrazione della luce in un prisma: - in un reticolo di diffrazione la luce non deve attraversare uno spessore di vetro nel quale viene parzialmente assorbita, come nel caso del prisma; - dagli spettri prodotti da un reticolo di diffrazione è semplice ricavare la lunghezza d’onda corrispondente ai diversi colori spettrali, perché la posizione di ogni colore spettrale è semplicemente proporzionale alla sua lunghezza d’onda, mentre per uno spettro prodotto da un prisma la relazione tra posizione e lunghezza d’onda dipende dalla più complessa dipendenza dell’indice di rifrazione del vetro dalla lunghezza d’onda; - utilizzando reticoli di diffrazione con una densità di fenditure sufficientemente elevata è possibile disperdere i vari colori spettrali molto più che con un prisma, riuscendo quindi a distinguere più chiaramente la struttura fine degli spettri delle sorgenti luminose. 6. Il potere risolutivo di uno spettroscopio a reticolo Il potere risolutivo di uno strumento che forma un'immagine, ad esempio un microscopio o un telescopio, è dato dalla minima distanza angolare o lineare tra due punti oggetto vicini che possono ancora essere risolti. La funzione di uno strumento analizzatore, quale uno spettrografo, è invece di risolvere due immagini della stessa fenditura, formate da onde di lunghezza l'onda leggermente differente, e il suo potere risolutivo di può definire come la minima lunghez za d'onda necessaria affinché le immagini siano risolte. Il criterio di Rayleigh che abbia considerato nel caso dei cannocchiali è valido anche per questo tipo di strumenti. La figura 22 rappresenta un fascio di luce da analizzare proveniente da una fenditura e reso parallelo da un collimatore, dopo il quale vi sono un reticolo di diffrazione e un callocchiale. La figura mostra le immagini della fenditura formate nello spettro del primo ordine da due lunghezze d'onda leggermente differenti, λ e λ + ∆λ. Se le due immagini devono essere risolte, la distanza tra i centri dovrà essere almeno pari alla semilarghezza angolare di ognuna di esse. Determiniamo ora la distanza tra i centri. La deviazione angolare θ del centro della figura di diffrazione formata nello spettro di ordine m da luce di lunghezza d'onda λ è data dalla formula (17): - E.20 - fenditura collimatore reticolo cannocchiale schermo β ∆θ Figura 22. Potere risolutivo di un reticolo. sen θ = m nλ a (17) dove a è il passo del reticolo, ossia la distanza tra due tratti successivi. Dobbiamo valutare la variazione ∆θ dell'angolo θ quando la lunghezza d'onda λ varia di una piccola quantità ∆λ. Differenziamo perciò i due membri dell'espressione (17) ottenendo cos θ ∆ θ = m ∆λ a (18) Affinché le due figure di diffrazione siano separate è necessario che la semilarghezza angolare β di ciascuna di esse sia minore della loro separazione angolare ∆θ. La semilarghezza angolare delle figure di diffrazione è data dalla formula (26) del capitolo precedente, che riscriviamo in questo modo: β ≈ sen β = tg θ mN (19) dove N è il numero totale di tratti del reticolo e l'approssimazione è valida perché l'angolo β è molto piccolo. Per valutare il potere risolutivo del reticolo dobbiamo porre quindi ∆θ = β e perciò, sostituendo nella formula (19), cos θ tg θ m = ∆λ mN a Ma cos θ tg θ = sen θ = mλ a e perciò ∆λ = λ mN (20) Quindi la minima differenza ∆λ di lunghezza d'onda che si può risolvere con un reticolo è direttamente proporzionale alla lunghezza d'onda λ, ed inversamente proporzionale all'ordine dello spettro e al numero totale N di linee del reticolo. Si noti che tale risultato è indipendente dal passo a del reticolo. Naturalmente i diametri del collimatore e del telescopio devono coprire l'intera area del reticolo in modo che siano utilizzati tutti i tratti del reticolo. - E.21 Esempio Le lunghezza d'onda delle righe D del sodio sono rispettivamente 589,593 nm e 588,996 nm. Determinare il minimo numero di tratti che deve avere un reticolo per separare tali righe nello spettro del primo ordine. Dalla formula (20) si ricava N= λ m∆ λ Dai dati si ha ∆λ = 589,593 nm - 588,996 nm = 0,597 nm Quindi, per m = 1, si ha N= 589 = 980 tratti 0,597 Esercizi 1. Ricavare l'espressione sen θ = λ/b per la posizione della prima frangia scura nel caso della diffrazione da parte di un'apertura rettangolare posta davanti all'obiettivo di un cannocchiale. Calcolare il potere risolutivo dell'obiettivo di un cannocchiale con un'apertura circolare di 4 cm, assumendo λ = 560 nm e che due stelle possono essere risolte quando il massimo centrale di un'immagine cade sul primo anello scuro dell'altra. 2. Si osserva diffrazione di Fraunhofer usando un foro quadrato del lato di 2 mm. Spiegare qualitativamente che differenza si osservano quando è sostituito da un foro circolare del diametro di 3 mm. 3. Spiegare, con un disegno, la formazione della figura di diffrazione al fuoco dell'obiettivo di un cannocchiale. Da che cosa dipendono le dimensioni della figura e come sono associate al potere risolutivo dello strumento? 4. Che cosa si intende per potere risolutivo di un cannocchiale? Come può essere espres so e da che cosa dipende? Assumendo che due stelle possano essere risolte quando il massimo centrale di un'immagine cade sul primo anello scuro dell'altra, calcolare il potere risolutivo dell'obiettivo di un cannocchiale con un'apertura di 7,5 cm e una focale di 75 cm. Si assuma λ = 560 nm. Se il limite di risoluzione dell'occhio per una visione confortevole è di 100", trovare la focale dell'oculare necessario per risolvere in modo chiaro l'immagine con quel cannocchiale. 5. Trattando l'occhio come un sistema ottico perfetto con un potere di 60 D, un'apertura di 3,5 mm e indice di rifrazione dell'umore vitreo 1,33, calcolare il raggio del primo anello scuro del disco di Airy formato da una sorgente distante ( λ = 560 nm). Assumendo che il diametro dei coni della fovea sia di 0,0025 mm, commentare il fatto che l'occhio è capace di distinguere due stelle separate da meno di un minuto d'arco. 6. Spiegare come la diffrazione limita i dettagli che possono essere osservati attraverso uno strumento ottico. Perché un microscopio che utilizza luce ultravioletta fornisce prestazioni migliori di un microscopio funzionante con luce normale? 7. La separazione angolare tra due stelle è 1,5". Trovare la minima apertura che deve avere l'obiettivo di un cannocchiale perché le due stelle possano essere risolte. Assumere λ = 560 nm. - E.22 8. La focale dell'obiettivo di un cannocchiale è 150 mm e l'ingrandimento che fornisce è di otto volte. Considerando che il potere risolutivo dell'occhio perché si abbia una visione confortevole è 100", trovare le dimensioni angolari del dettaglio più fine che l'occhio e l'oculare possono risolvere e quindi la minima apertura che deve avere l'obiettivo. ( λ = 560 nm). Perché probabilmente in pratica si userà un'apertura maggiore? 9. Calcolare il raggio del primo anello scuro nella figura di diffrazione prodotta da un tele scopio con un'apertura di 70 cm e una focale di 7,8 m, λ = 560 nm. Assumendo che due stelle possano essere risolte quando il massimo centrale dell'immagine di una cade sul primo anello scuro dell'altra, calcolare il potere risolutivo di questo obiettivo. Quando dovrebbe essere ingrandita l'immagine dall'oculare perché l'occhio la possa risolvere? Si può assumere che il limite di risoluzione dell'occhio per una visione confortevole sia di 1,5'. 10. Spiegare il funzionamento di un reticolo di diffrazione. Illustrare i vantaggi e gli svantag gi dell'uso di un reticolo per produrre uno spettro rispetto all'uso di un prisma. 11. Spiegare la produzione di spettri da parte di un reticolo di diffrazione. Descrivere un esperimento per determinare la lunghezza d'onda della luce per mezzo di un reticolo, indicando chiaramente quali quantità devono essere misurate e come devono essere eseguiti i calcoli. 12. Quale sarà la separazione angolare delle due righe del sodio ( λ = 589,0 nm, λ = 589,6 nm) nello spettro del primo ordine prodotto da un reticolo di diffrazione con 5215 linee per centimetro, con la luce che incide normalmente sul reticolo? 13. Raggi di luce paralleli provenienti da una lampada a vapori di mercurio incidono normalmente su un reticolo di diffrazione piano avente 4000 linee per centimetro. La luce diffratta è focalizzata su uno schermo da una lente con una focale di 37,5 cm. Trovare le distanze nello spettro del primo ordine tra le righe corrispondenti alle lunghezze d'onda di 579,1, 577,0, 546, 0 e 435,8 nm. 14. Spiegare brevemente che cosa si intende per diffrazione della luce. Fare un esempio, che si incontri nella vita quotidiana, di diffrazione nel caso di: (a) onde sull'acqua; (b) onde sonore; (c) onde luminose. In che cosa uno spettro prodotto da un reticolo differisce da uno spettro prodotto da un prisma? 15. Se si guarda attraverso un pezzo di garza con 40 fili per centimetro una sorgente punti forme, che emette luce a una lunghezza d'onda di 600 nm, posta a 4 m dalla garza, quale sarà la separazione lineare tra l'immagine centrale e la prima immagine diffratta? Descrivere i vantaggi e gli svantaggi dell'uso del reticolo di diffrazione per produrre uno spettro rispetto all'uso di un prisma. 16. Derivare un'espressione per la posizione delle righe spettrali prodotte da un reticolo di diffrazione a trasmissione, assumendo incidenza normale. Che cosa influenza l'ampiezza di queste righe? Quale effetto ha l'ampiezza di ciascuno degli spazi chiari sulle righe? Un reticolo ha 600 linee per millimetro. Se lo spettro visibile si estende da 400 a 700 nm, trovare la separazione lineare di queste lunghezze d'onda nel secondo ordine nel piano focale dell'obiettivo di un cannocchiale che ha una focale di 25 cm. 17. Definire la diffrazione di Fraunhofer. Un fascio parallelo di luce monocromatica incide su un reticolo di diffrazione piano con un angolo di 30° rispetto alla normale. Se il reticolo ha 3000 linee per centimetro e la lunghezza d'onda della radiazione è 632,8 nm, deter minare gli angoli di tutti gli ordini trasmessi. - E.23 18. La diffrazione di Fraunhofer da parte di una fenditura doppia può essere spiegata come segue: la luce proveniente dalle due fenditure subisce interferenza per produrre frange del tipo ottenute con due fasci, ma le intensità di queste frange sono limitate dalla quantità di luce che arriva in ogni punto dello schermo a motivo della diffrazione che avviene su ogni fenditura. Spiegare questa affermazione, disegnare la figura di diffrazione prodotta da una doppia fenditura e commentare come dipende dalla larghezza delle fenditure e dalla loro separazione. La figura di Fraunhofer prodotta da una doppia fenditura composta da fenditure ciascuna larga 0,5 mm e separate da una distanza d = 20 mm, prodotta con luce di una lampada al sodio ( λ = 589,3 nm) è osservata su uno schermo. Quante frange si trovano all'interno del massimo di diffrazione centrale? 19. Una sorgente di luce di lunghezza d’onda pari a 580 nm illumina una fenditura larga 0,30 mm. Si trovi la larghezza della frangia centrale chiara della figura di diffrazione formata su uno schermo posto a una distanza di 2 m. 20. Una sorgente di luce monocromatica illumina una fenditura larga 0,75 mm. A una distanza di 108,5 cm dalla fenditura viene posto uno schermo su cui si forma una figura di diffrazione il cui massimo ha una larghezza di 1,7 mm. Calcolare la lunghezza d’onda della luce. 21. Una sorgente di luce di lunghezza d’onda pari a 633 nm illumina una fenditura larga 0,25 mm. A quale distanza dalla fenditura si dovrebbe mettere uno schermo per osservare il primo minimo della figura di diffrazione a 1,85 mm dal centro? 22. Un reticolo di diffrazione ha 2.750 righe per centimetro. Si calcoli la distanza a cui deve essere posto uno schermo affinché lo spettro del secondo ordine della luce visibile (lunghezza d’onda tra 400 nm e 700 nm) sia limitato in uno spazio di 1,75 cm. 23. Una luce contenente due componenti di lunghezza d’onda differente incide su un reticolo di diffrazione. La prima componente ha una lunghezza d’onda di 440 nm. Determina re la lunghezza d’onda della seconda componente sapendo che la sua immagine del secondo ordine coincide con quella del terzo ordine della prima componente. 24. Un’onda luminosa piana che si propaga nel vuoto con una frequenza di 5,0 × 1014 Hz incontra uno schermo sul quale è praticato un foro circolare con un raggio di 1,0 mm. Qual è il raggio del primo minimo di intensità della figura di diffrazione prodotta su uno schermo parallelo al primo, posto a una distanza di 10 m da esso? - E.3 - M - LA DIFFRAZIONE - II Proseguiamo in questo capitolo lo studio della diffrazione, affrontando il caso più com plesso della diffrazione di Fresnel ed esaminando poi alcune applicazioni di questo fenomeno. 1. Approfondimento sul principio di Huygens Finora abbiamo utilizzato il principio di Huygens, secondo il quale ogni punto di un fronte d'onda è assunto essere il centro di un sistema di onde secondarie e il nuovo fronte d'onda è l'inviluppo di queste onde secondarie, in una sua forma semplificata. Fresnel, per spiegare i diversi effetti che si osservano nel fenomeno della diffrazione, dovette riformulare il principio di Huygens tenendo conto dell'interferenza che si ha tra le diverse onde secondarie. Una teoria più generale fu poi sviluppata da Kirchhoff. La descrizione della diffrazione fornita da Fresnel si basa sulla considerazione delle onde secondarie derivanti da ciascun punto del fronte d'onda. La figura 1 mostra un fronte d'onda proveniente dalla sorgente S. Fresnel suppose che l'effetto in P potesse essere trovato dividendo il fronte d'onda in piccole porzioni ciascuna delle quali diventa sorgente di un'onda se condarie, come W1 e W2. Gli effetti in P di tutte le onde secondarie possono essere sommati d'accordo con il principio di sovrapposizione in modo da ottenere l'effetto totale in P del fronte d'onda. Utilizzando questo metodo è possibile calcolare l'effetto in P che si ha se parte del fronte d'onda è oscurato da ostacoli o aperture. Figura 1. Onde secondarie e zone di Fresnel. Nella sua analisi Fresnel ipotizzò che l'ampiezza dell'effetto di ogni onda secondaria in P fosse: 1. Proporzionale all'ampiezza di quella parte del fronte d'onda; 2. Proporzionale all'area dell'elemento di fronte d'onda che genera l'onda secondaria; 3. Inversamente proporzionale alla distanza del centro dell'onda secondaria da P (e quindi l'intensità inversamente proporzionale alla distanza); 4. Soggetta a un fattore di obliquità legato all'angolo θ, che va da zero quando θ è 90° a un massimo quando θ è 0°, ed è dato da (1 + cos θ)/2. In questo modo si spiega la non esistenza di un'onda regressiva diretta all'indietro. - E.4 Questa teoria, ancora semplificata, ha qualche difficoltà di interpretazione e di giustificazione, in particolare l'ultima ipotesi. Comunque nell'analisi di Fresnel non è richiesto l'uso dell'espressione matematica precisa del fattore di obliquità dato che l'effetto principale che influisce sulla somma delle onde in P è la loro differenza di fase, che è trattata correttamente dalla teoria di Fresnel. Ritornando alla figura 1 consideriamo la minima distanza d0 dal fronte d'onda a P (ossia OP). Le altre parti del fronte d'onda causeranno in P perturbazioni che non sono in fase con quella prodotta dalla parte più vicina (ossia da O) perché il percorso più lungo dà una differenza di cammino ottico. Questa differenza di cammino ottico può essere analizzata costruendo una sfera con centro in P e raggio d0 + λ/2. Questa sfera taglia in fronte d'onda in una circonferenza che ha il segmento SP come asse e passa sul fronte d'onda in F1. All'interno di questa circonferenza la fase delle perturbazioni che arrivano in P varia tra 0 e π. Si può costruire un'altra circonferenza usando una sfera con centro in P e raggio d0 + λ. Questa circonferenza è pure centrata su SP e passa per F2. Le perturbazioni che arrivano in P dall'anello compreso tra queste due circonferenze hanno fasi che variano tra π e 2π. Possono essere costruiti altri anelli o zone, ciascuna con un effetto in P che varia di 18° in fase. Queste zone sono note come zone di Fresnel o zone di semiperiodo. E' chiaro che la dimensione di queste zone dipende dalla lunghezza d'onda della luce e dalla distanza del punto P. Si può verificare facilmente che quando il fronte d'onda è sferico o piano e la lunghezza d'onda è piccola rispetto alla distanza d0, le aree delle zone sono tutte all'incirca uguali a πd0λ, e i raggi dei loro contorni sono proporzionali alla radice quadrata dei numeri naturali. Poiché la lunghezza d'onda della luce è molto piccola, le zone di mezzo periodo sono pure molto piccole. Se d0 è 500 mm e la lunghezza d'onda è 6 × 10-4 mm l'area di ogni zona è 0,942 mm 2 e il raggio della prima zona è 0,548 mm se il fronte d'onda è piano. Poiché l'area di ogni zona è la stessa si può assumere che ognuna di esse emetta un uguale numero di onde secondarie, a poiché la distanza di P e anche il fattore di obliquità aumentano man mano che ci allontaniamo dalla zona centrale, l'ampiezza in P dovuta alle zone successive diminuisce progressivamente. Per il modo in cui sono state costruite le zone è evidente che l'effetto in P da ogni zona è esattamente opposto in fase rispetto a quello delle zone adiacenti. E' quindi necessario trovare l'ampiezza risultante che deriva da un numero di effetti sovrapposti di ampiezza gradualmente decrescente e con differenze di fase di π tra ognuno e il successivo. Indichiamo con a1, a2, a3 ecc. le ampiezze in P che risultano dalle successive zone. Poiché la fase media dell'oscillazione dovuta a zone adiacenti differisce di π, alle ampiezze a2, a4 ecc. si possono dare valori negativi per mostrare che lo spostamento è in direzione opposta rispetto a quello di a1, a3 ecc. Quindi l'ampiezza totale sarà A = a1 - a2 + a3 - a4 + a5 ... Poiché le ampiezze dovute a zone adiacenti, anche se progressivamente decrescenti, sono quasi uguali, possiamo porre a2 = a1 + a3 2 a4 = a3 + a5 2 ecc. Si può allora scrivere A nella forma A= a a a a1 a1 + − a2 + 3 + 3 − a4 + 5 + ... 2 2 2 2 2 - E.5 dove ogni termine entro parentesi è uguale a zero. L'espressione, se viene calcolata proseguendo con i termini a sufficienza perché l'ampiezza dovuta alle zone più esterne diventi trascu rabile, diventa A= a1 2 Quindi, se si considera un numero di zone sufficientemente grande, l'ampiezza totale in un punto P dovuta alle onde secondarie emesse da tutti i punti del fronte d'onda è uguale a metà dell'ampiezza dovuta all'onda secondaria emessa dalla sola zona di semiperiodo centrale. Siamo arrivati a questo risultato considerando l'ampiezza e la fase dell'effetto dovuto a ogni zona di semiperiodo presa come un tutto. In realtà c'è un cambiamento continuo di fase da 0 a π lungo la zona. Questo cambiamento di fase può essere analizzato in modo più facile con il metodo grafico che abbiamo già utilizzato sia per lo studio dell'interferenza sia per lo studio della diffrazione da una fenditura larga. Per fare ciò ogni zona può essere suddivisa in anelli più piccoli aventi uguale area ma fase leggermente diversa. L'ampiezza di queste zone diminuirà solo di pochissimo a motivo del cambiamento di distanza e del fattore di obliquità. Il risultato della somma operata per via grafica è mostrato nella figura 2, prima per zone finite aventi uguale differenza di fase l'una rispetto alla successiva, poi nel limite in cui queste zone diventano infinitamente piccole. In questo caso la prima zona di semiperiodo è rappresentata dall'arco ABC, che è praticamente una semicirconferenza, e l'ampiezza risultante è data dalla lunghezza AC. In modo analogo la seconda zona di semiperiodo è data da CDE è l'ampiezza risultante dovuta a entrambe le zone è data dal segmentino AE. Se si continua la costruzione per un grande numero di zone la curva diventa una spirale e tende al punto O. Quindi la risultante da tutte le zone che formano il fronte d'onda è uguale a AO che è all'incirca uguale a AC/2, come si è già visto. Figura 2. Somma vettoriale delle ampiezza per un fronte d'onda sferico. Se ci si riferisce a un generico punto G del fronte d'onda la differenza di cammino rispetto a P è data approssimativamente, usando le formule per le frecce delle calotte sferiche, da Differenza di cammino = c2 c2 a+ d + = c2 2a 2d 2ad Si ha perciò una differenza di fase a+ d 2 ϕ = π c adλ - E.6 che è sufficientemente approssimata se c, come si ha di solito, è molto piccolo rispetto a a e a d. La suddivisione del fronte d'onda in zone di Fresnel verrà utilizzata nel seguito per l'analisi dei principali effetti di diffrazione. 2. Effetti diffrattivi Si è visto che nel caso della luce le zone di semiperiodo sono molto piccole, e che un grande numero di esse risulta contenuto in una piccola area intorno al punto centrale O. La porzione efficace del fronte d'onda si può quindi considerare confinata in questa piccola area, e l'effetto delle zone esterne sarà trascurabilmente piccolo rispetto a quello della porzione centrale. Un oggetto ordinariamente considerato piccolo ha comunque dimensioni grandi rispetto alla lunghezza d'onda della luce e coprirà un considerevole numero di zone; l'ampiezza risultante dell'oscillazione in un punto P (figura 2) dietro di esso provocata dalle zone del fronte d'onda che non sono schermate sarà quindi inapprezzabile, e perciò l'effetto in P sarà come se la luce viaggiasse dalla sorgente lungo la linea retta OP. Tranne che per gli effetti di diffrazione intorno al bordo dell'ombra, l'affermazione che la luce si propaga in linea retta risulta approssimativamente vera; ed è perfettamente legittimo in pratica accettare la propagazione rettilinea della luce come una legge su cui si basa il funzionamento degli strumenti ottici e impiegare quindi l'idea di "raggi" di luce nell'ottica geometrica. I risultati ottenuti considerando il fronte d'onda come nel paragrafo precedente sono confermati dai risultati ottenuti dagli esperimenti. Piccola apertura circolare La luce proveniente da una sorgente puntiforme lontana viene fatta passare attraverso un'apertura circolare di 1 o 2 mm di diametro, e la luce è raccolta su uno schermo, o meglio mediante un oculare. Poiché l'area delle zone di mezzo periodo dipende dalla distanza d dello schermo o dell'oculare, il numero di zone contenute nell'apertura può essere variato modificando la distanza d. A una certa distanza sufficientemente grande l'apertura contiene solo una zona, e l'illuminazione al centro della macchia luminosa è massima, dato che A = a1. Se l'oculare è spostato verso l'apertura in modo da comprendere due zone, la parte centrale diventa scu ra, perché ora A = a1 + a2 = 0 (approssimativamente). Spostando l'oculare ancora più vicino fino a comprendere tre zone, il punto centrale diventa di nuovo luminoso, dato che A = a1 + a2 + a3 = 0 (approssimativamente). Man mano che l'oculare è spostato verso l'apertura si trova alternativamente una serie di punti centrali chiari e scuri. Piccolo ostacolo circolare Una delle principali obiezioni alla teoria di Fresnel al momento della sua pubblicazione fu avanzata da Poisson, che mostrò che, secondo la teoria, ci sarebbe dovuta essere una certa quantità di illuminazione al centro dell'ombra di un piccolo oggetto circolare. Poiché le aree delle zone sono approssimativamente uguali, un piccolo ostacolo circolare che intercetta poche zone centrali ha poco effetto sulla perturbazione complessiva che raggiunge il punto P da tutto il fronte d'onda, e ci sarebbe dovuto essere un punto luminoso al centro dell'ombra. Arago (17861853) mostrò sperimentalmente che è effettivamente così. L'esperimento si realizza come segue. Un oggetto opaco circolare, come una moneta dal bordo liscio o una sferetta di acciaio lucidata del diametro di 10 mm, è sospeso sul percorso della luce proveniente da un forellino distante 2 o 3 m. Si monta un oculare al centro dell'ombra a una distanza circa uguale dall'oggetto, e si vedrà un piccolo punto brillante di luce nel campo dell'oculare (figura 3). (Vengono coperte in questo caso circa 20 zone di semiperiodo.) Rimuovendo l'oggetto si avrà poco differenza nella luminosità osservata. E' importante che l'oggetto sia perfettamente circolare e con bordi lisci, perché altrimenti verranno esposte porzioni irregolari di un certo numero di zone e il risultato sarà confuso. - E.7 - Figura 3. Fotografia che mostra la luce diffratta che forma un punto luminoso al centro di un'ombra circolare. Se l'occhio, posto al centro dell'ombra, osserva l'oggetto senza l'oculare, si vede il bordo dell'oggetto come un anello luminoso brillante, mostrando così che la luce che entra nell'ombra si propaga come se si originasse sul bordo dell'ostacolo. Un esempio interessante dello stesso fenomeno può essere spesso visto in zone di montagna. Se ci si trova appena all'interno dell'ombra di una montagna o di una collina vicina prima che il sole sia sorto sopra il suo bordo e appena dopo che è tramontato, gli alberi sullo sfondo del cielo appaiono circondati da un'intensa luminosità, mentre gli uccelli o anche gli insetti, troppo piccoli per essere normalmente osservati a quella distanza, appaiono come punti di luce brillanti. 3. La diffrazione di Fresnel La maggior parte dei fenomeni di diffrazione si osservano meglio se la sorgente ha la forma di una fenditura molto sottile. In questo caso i fronti d'onda possono essere considerati cilindrici, e l'ampiezza risultante lungo una linea che passa per un punto P parallela alla fenditura può essere trovata dividendo il fronte d'onda in strisce anziché in zone circolari. La costruzione di questi elementi di mezzo periodo è simile a quella delle zone di mezzo periodo. Se d è la distanza di P dal punto più vicino del fronte d'onda, le distanze di P dai bordi esterni dei successivi elementi di semiperiodo sono d + λ/2, d + 2λ/2, d + 3λ/2 e così via. Essendo uguale la lunghezza di queste strisce, le loro aree a differenza di quelle delle zone di mezzo periodo, diminuiscono rapidamente all'inizio ma più lentamente man mano che la distanza dal centro aumenta, con le strisce più esterne che sono praticamente tutte di uguale area. Le ampiezze dovute a queste strisce esterne, essendo approssimativamente uguali ma con fasi alternate, si annullano l'un l'altra, e l'effetto di tutto il fronte d'onda è dovuto praticamente solo a pochi elementi centrali. Gli effetti di queste strisce centrali non sono comunque uguali, come nel caso delle zone circolari, che hanno uguali aree. Poiché, per un fronte d'onda cilindrico, le aree delle strisce di semiperiodo non sono uguali, ma risultano proporzionali alla loro larghezza, decrescono velocemente allontanandosi dalla striscia centrale. Tale diminuzione è accentuata dall'effetto del fattore di obliquità. Vediamo allora di costruire la curva di oscillazione. Suddividiamo prima ogni striscia di semiperiodo in un numero finito, per esempio n = 9 nella figura 4, di parti diverse tra loro, ma tali che la differenza di cammino tra due parti consecutive sia λ/2n. In tale modo la differenza di fase, che per due strisce consecutive era sempre di π, sarà per due parti consecutive di ogni - E.8 striscia sempre uguale a π/n. Sommiamo ora le ampiezza dovute per esempio alla metà superiore del fronte d'onda: otteniamo una spezzata e formano tra loro un angolo uguale a π/n e che si concatenano a spirale verso un punto che chiamiamo Z. Figura 4. Somma vettoriale delle ampiezze di oscillazione per un fronte d'onda cilindrico. Figura 5. La spirale di Cornu. Figura 6. Costruzione della variabile v. - E.9 La risultante sarà il vettore | OZ |= A . Per rendere esatto questo procedimento occorre aumentare il numero di parti all'infinito. La linea spezzata diventa allora una linea continua detta spirale di Cornu. Naturalmente per l'onda non ostruita occorre considerare tutto il fronte d'onda e si ottiene perciò una doppia spirale come mostra la figura 5. E' utile per la spirale di Cornu introdurre una variabile detta v che essendo adimensionale permette l'uso di una sola spirale per i vari valori delle variabili che dipendono dalle caratteristiche della situazione fisica a cui ci si riferisce. Occorre calcolare la differenza di cammino ∆l = QR (figura 6) che l'onda partente da un generico punto Q ha rispetto all'onda partente da O punto centrale del fronte quando ambedue arrivano in P. Indichiamo con s la distanza di Q da SP; essa è sempre molto piccola rispetto ad a e a b e si può quindi considerare vera l'uguaglianza ∆l = QR = KO + OH Ma KO e OH sono le frecce dei due archi OQ e OR; segue dalla formula della freccia che s2 s2 a+ b + = s2 2a 2b 2ab ∆l = (1) ma poiché δ = 2π∆l si ha δ = 2π ∆l λ si ha δ = π s2 a+ b π 2 = v abλ 2 (2) dove v è definito da v= s 2( a + b ) abλ (3) Poiché l'ampiezza dell'onda che un elemento di fronte compreso tra s e s + ds ha quando arriva in P con un ritardo di fase δ = (π/2)v2 è proporzionale a ds, essa sarà anche proporzionale a dv che per l'equazione (3) è proporzionale a ds. E' possibile quindi usare v come variabile lungo la spirale di Cornu. Dalla formula (2) risulta inoltre evidente che la spirale è caratteriz zata dal fatto che l'angolo che essa forma con l'asse x, cioè δ, è proporzionale al quadrato della distanza dall'origine misurata lungo la curva, cioè v. Avremo in particolare, per v = 1, δ = π/2, ossia v = 1 corrisponde a metà zona di semiperiodo, mentre v = 2 e v = 2 corrispondono rispettivamente a una e due strisce di semiperiodo. Per calcolare l'ampiezza dovuta solo a una parte del fronte d'onda, quando cioè l'onda viene ostruita, basterà calcolare la lunghezza della corda relativa al segmento di spirale che corrisponde alla parte di fronte d'onda che avanza. Il quadrato dell'ampiezza sarà naturalmente proporzionale all'intensità. Occorre però notare che, poiché i punti Z e Z' risultano avere coordinate rispettivamente Z (1/2; 1/2) e Z'(-1/2; -1/2), l'ampiezza dovuta a ognuna delle due metà del fronte d'onda vale 2 / 2 . Si avrà allora che l'intensità dell'onda non ostruita sarà 2 2 2 I0 = + = 2 2 ( 2) 2 = 2 e perciò in genere avendo trovato un'ampiezza per l'onda ostruita, l'intensità sarà - E.10 - I 1 = A2 I0 2 (4) Osserviamo infine che si se si vuole conoscere esattamente la orma della spirale di Cornu e quindi calcolare esattamente il valore dell'ampiezza nei vari punti dello schermo occorre usare, invece del metodo grafico da noi adoperato, gli integrali di Fresnel che esprimono quantitativamente le coordinate della spirale, e sono definiti dalle formule x= ∫ v 0 cos π v2 dv 2 y= ∫ v 0 sen (5a) π v2 dv 2 (5b) In realtà sono state formulate prima con un metodo matematico rigoroso le equazioni di Fresnel, e poi è stata ricavata la descrizione geometrica da Cornu nel 1874. Ostacolo con bordo dritto Questo è il caso più semplice in cui si può adoperare la spirale di Cornu per il calcolo dell'ampiezza. Supponiamo che il bordo dell'ostacolo sia parallelo alla fenditura e vediamo come varia l'ampiezza a seconda del punto dello schermo che consideriamo. Prendiamo prima in conside razione il punti P0 al limite dell'ombra geometrica (figura 7). Facciamo la suddivisione in strisce di semiperiodo: il punto M0 cadrà sul limite N dell'ostacolo. E' evidente che passerà solo la metà superiore del fronte d'onda e perciò la risultante sulla spirale sarà il segmento OZ di lunghezza 2 / 2 (figura 9). L'intensità dell'onda sarà allora 1/2, cioè 1/4 dell'intensità dell'onda non ostrui ta. Figura 7. Ostacolo con bordo dritto - punto al limite dell'ombra geometrica. Diversa è la situazione per i punti sopra P0. Prendiamo per esempio il punto P' (figura 8). M0 ora non coincide con N perché deve essere sul segmento SP': è evidente ora che oltre a passare tutta la metà superiore del fronte d'onda, passeranno una o più strisce di semiperiodo della parte inferiore. L'ampiezza risultante avrà ancora la punta del vettore in Z, ma la coda si sposterà sulla spirale inferiore a seconda dei vari punti P' considerati. Nella figura 31 è rappresentato A = |OZ| per il punto P0, A = |BZ| per il punto P' per cui passa una striscia di semiperiodo e A = |CZ| per un altro punto P' per cui passano due strisce di semiperiodo. E' evidente che l'ampiezza ha in questa parte dello schermo dei massimi e dei minimi (diversi da zero però), os sia delle frange di diffrazione, a seconda che la coda del vettore sia sulla parte superiore o su quella inferiore del ramo inferiore della spirale. All'aumentare delle strisce di semiperiodo che - E.11 passano, cioè allontanandosi da P0, i massimi e i minimi diventano meno rilevabili e l'ampiezza tende asintoticamente al valore A = 2 / 2 , ossia a quello dell'onda non ostruita (A = |ZZ'|. Figura 8. Ostacolo con bordo dritto - punto al di fuori dell'ombra geometrica. Figura 9. Ostacolo con bordo dritto - spirale di Cornu. Figura 10. Ostacolo con bordo dritto - punto all'interno dell'ombra geometrica. - E.12 Consideriamo infine un punto P" appartenente all'ombra geometrica, ossia posto sotto P0 (figura 10). M0 sarà sulla congiungente SP" e perciò verrà bloccata tutta la parte inferiore del fronte d'onda più alcune strisce di quella superiore. Il vettore ampiezza avrà ancora come punta il punto Z ma la coda si sposterà sul ramo superiore della spirale allontanandosi da O e perciò diminuendo di lunghezza. In conclusione, i profili dell'ampiezza e dell'intensità calcolati con la spirale di Cornu avranno l'andamento rappresentato nella figura 11 e l'aspetto delle frange di in terferenza sarà quello mostrato dalla fotografia della figura 12. Figura 11. Profilo delle frange di diffrazione da un ostacolo con bordo dritto (ampiezza e inten sità). Figura 12. Ombra di un ostacolo con bordo dritto con le frange di diffrazione di Fresnel. Fenditura singola e striscia opaca Lo stesso procedimento usato nel caso dell'ostacolo con bordo dritto può essere usato per la fenditura singola. Anche in questo caso considereremo il punto centrale P0 e poi altri punti P. In questo caso, però, data la simmetria della disposizione rispetto alla linea centrale SP0 (figura 13), otterremo una figura di diffrazione simmetrica. E' evidente che per P0 l'ampiezza sarà un vettore aventi estremi in due punti simmetrici dei rami della spirale. Occorrerà considerare una lunghezza sulla spirale legata alla larghezza - E.13 della fenditura ∆s = MN dalla formula (3). Per esempio, per a = 100 cm, b = 400 cm, λ = 400 nm e ∆s = 0,02 cm si ottiene ∆v = 0,5. Figura 13. Fenditura singola - punto sull'asse. Consideriamo adesso un altro punto P' (figura 14). Poiché M0 è sulla congiungente SP' saranno diverse le strisce di semiperiodo che passano per la metà superiore e per quella inferiore. Però poiché ∆s rimane costante, rimane costante la lunghezza ∆v della spirale da considerare. Per punti non molto vicini a P0 questo ∆v dovrà essere preso o tutto sul ramo superiore (P' sotto P0) o tutto sul ramo inferiore (P' sopra P0), come mostra la figura 15. Spostandosi gradualmente l'ampiezza avrà dei massimi e dei minimi pur mantenendosi diversa da zero. Solo per punti lontani da P0 l'ampiezza si ridurrà a zero. L'aspetto della figura di diffrazione ottenuta, pur presentando questi massimi e minimi nella parte centrale, varia sensibilmente al variare del la larghezza della fenditura e delle altre variabili in gioco, come mostra la figura 16. Per esem pio, per ∆v = 1,5 si ha una figura di diffrazione simile a quella della fenditura singola, mentre per ∆v maggiori si hanno profili più complessi. Figura 14. Fenditura singola - punto fuori asse. - E.14 - Figura 15. Fenditura singola - spirale di Cornu. Figura 16. Profili delle figure di diffrazione per diversi valori di ∆v. Figura 17. Ombra di una striscia opaca con le frange di diffrazione di Fresnel. Se infine vogliamo prendere in considerazione l'ombra di una striscia opaca, è evidente che occorrerà considerare tutta la spirale di Cornu eccetto una parte di lunghezza costante che corrisponderebbe alla parte da tenere presente per una fenditura di uguale larghezza della stri scia. Si hanno, qualunque sia la posizione dell'elemento di lunghezza ∆v da togliere, due vettori distinti che occorre sommare vettorialmente. Un esempio della figura di diffrazione ottenuta è mostrato dalla fotografia della figura 17. Le figure di diffrazione ottenute nel caso della striscia opaca si possono ricavare anche direttamente dalle figura di diffrazione della fenditura complementare, tenendo presente il prin- - E.15 cipio di Babinet. Questo afferma che a somma vettoriale dell'ampiezza prodotta da uno schermo e dallo schermo complementare, per ogni punto, è uguale all'ampiezza dell'onda non ostruita A0 = A1 + A2 (6) Ricordiamo però che, essendo A0 diverso da zero, A1 e A2 non sono uguali e opposti e perciò non è immediato ricavare le figure di diffrazione da quelle della fenditura complementa re, anche se si può fare. 4. L'ottica diffrattiva Il reticolo di diffrazione è solitamente utilizzato in spettroscopia per disperdere la luce. Però questo elemento ottico può essere devia anche la luce, come un prisma, e può essere usato per deviare un fascio di luce oltre che per dividerlo nelle lunghezze d'onda che lo compongono. La figura 18 mostra schematicamente un confronto tra l'azione di un reticolo di diffra zione e quella di un prisma oftalmico. La differenza principale è che la dispersione è maggiore e in direzione opposta rispetto a quella del prisma. Figura 18. Confronto tra un prisma oftalmico e rifrazione e un reticolo di diffrazione. Quando si è studiato l'effetto convergente di una lente sottile, si era visto che essa può essere considerata equivalente a una serie di prismi a rifrazione di angolo al vertice crescente. Allo stesso modo una serie di reticoli diffrazione con passo decrescente può essere considerata come una lente a diffrazione. Per ottenere un effetto simile a quello di una lente convergente si dovranno avere cerchi concentrici più vicini l'uno all'altro alla periferia che al centro. Il funzionamento di una lente diffrattiva può essere analizzato considerando di nuovo il diagramma che avevamo mostrato nella figura 2, e che riproduciamo nella figura 19. Ricordia mo che i successivi semicerchi della spirale (ABC, CDE, ecc.) si riferiscono alle successive zone di semiperiodo in cui viene suddiviso il fronte d'onda sferico emesso dalla sorgente lumi nosa. Se si impedisce alle perturbazioni corrispondenti a zone di semiperiodo alternate (per esempio tutte quelle pari) di raggiungere il punto P dello schermo su cui si osserva l'immagine, le perturbazioni prodotte dalle altre zone arrivano tutte con la stessa fase e si sommano dando luogo a un'illuminazione molto più intensa in quel punto. Nel dispositivo originale inventato da Lord Rayleigh nel 1871 le zone di semiperiodo erano rese alternativamente opache come mo stra la figura 20. Uno sviluppo di questo dispositivo è la lente diffrattiva a modulazione di fase mostrata nella figura 21, nella quale varia lo spessore del materiale trasparente in ogni zona di semiperio- - E.16 do in modo da introdurre un cambiamento di fase di π. Tutta la superficie della lente è trasparente e il dispositivo è quindi più efficiente. Figura 19 (come figura 2). Somma vettoriale delle ampiezza per un fronte d'onda sferico. Figura 20. Lente diffrattiva a modulazione di ampiezza (vista di fronte e in sezione). Sono mostrate cinque zone intere e mezzo. La metà interna di ogni zona è trasparente e la metà esterna opaca. - E.17 - Figura 21. Lente diffrattiva a modulazione di fase (vista di fronte e in sezione). Sono mostrate cinque zone intere e mezzo. La metà interna di ogni zona ritarda la luce in modo diverso che la metà esterna introducendo una differenza di fase di π. Prendendo l'immagine del primo ordine come immagine di riferimento la possiamo utilizzare per definire la focale di questi dispositivi. L'immagine è formata da un fronte d'onda che ha una lunghezza d'onda di differenza tra ogni zona intera della lente. La distanza f del punto F' in cui le onde si sommano costruttivamente è quella per la quale si ha una differenza di esattamente una lunghezza d'onda tra il centro della lente e i bordi esterni delle successive zone circolari complete. Indicando con ρ il raggio delle successive zone circolari, applicando la formula della freccia a ciascuna zona si trova s1 − s0 = s2 − s1 = altre zone = ρ 12 − ρ 02 ρ 22 − ρ 12 = = altre zone 2f 2f = (7) in modo che ρ 12 − ρ 02 = ρ 22 − ρ 12 = altre zone = 2fλ (8) Se ρ0 = 0 (e s0 = 0) al centro della lente, si ha ρ 12 = 2fλ ρ1 = ossia Si ha poi ( ) ( ) ρ 22 − ρ 02 = ρ 22 − ρ 12 + ρ 12 − ρ 02 = 2( 2fλ e quindi ρ2 = [ 2( 2fλ ) ] = ρ3 = [ 3( 2fλ ) ] = [ 3[ 2fλ (9) ) ] 2fλ ] 2 2fλ e perciò il raggio della n-esima zona è dato da ρn = n [ ] 2fλ = n volte il raggio della prima zona (10) - E.18 Perciò gli anelli mostrati nelle figura 42 e 43 hanno raggi proporzionali alla radice qua drata di 1, 2, 3, 4 ecc. La focale f per un dispositivo per il quale ρ1 = 0,5 mm risulta, per una lunghezza d'onda di 555 nm, di f = ρ 12 0,25 = mm = 227 mm 2λ 0,0011 In questo modo si genera un elemento ottico con un potere di circa 4 D con un sistema diffrattivo con zone intere del diametro di 1 mm, 1,4 mm, 1,73 mm, 2 mm, 2,24 mm, 2,5 mm, 2,65 mm, 2,8 mm ecc. La focale per altre lunghezze d'onda sarà però diversa. Per esempio, per luce blu di 400 nm la focale sarà di 312 mm e per luce rossa di 650 nm la focale sarà di 192 mm. Inoltre, gli altri ordini di diffrazione generano focali minori a cui corrispondono altre immagi ni. Figura 22. Lente diffrattiva asimmetrica. Uno sviluppo ulteriore è costituito dalla lente diffrattiva asimmetrica (figura 22), nella quale le zone sono zone di un periodo intero e la differenza di fase è introdotta in maniera conti nua. La luce di quella lunghezza d'onda λ0 per la quale il gradino presente al bordo di ogni zona introduce una differenza di fase di 2π viene diretta interamente nell'immagine del primo ordine. Le altre lunghezze d'onda hanno però parte della loro energia nelle immagini di ordine superiore; la luce di lunghezza d'onda sufficientemente corta per avere una differenza di fase di 4 π (ossia λ0/2) verrà diretta tutta nell'immagine del secondo ordine. Poiché però la focale (del primo ordine) per questa lunghezza d'onda più corta è doppia di quella relativa alla lunghezza d'onda λ0, l'immagine del secondo ordine per λ0/2 coincide con l'immagine del primo ordine per λ0. Il cambiamento di focale con la lunghezza d'onda e la divisione della luce in più di un ordine sono una caratteristica intrinseca degli elementi diffrattivi che di fatto limitano la loro applicazione a sistemi ottici che operano con luce monocromatica. Un'applicazione non ovvia usando luce bianca è costituita dalle lenti a contatto bifocali diffrattive. Normalmente le lenti a contatto bifocali rifrattive usano differenti porzioni o segmenti della lente per fornire differenti poteri per la visione da lontano e da vicino. Spesso questi segmenti interagiscono con la pupilla dell'occhio dando qualità di visione variabile. Usando la diffrazione è possibile suddividere la luce incidente in più di un'immagine in ogni punto dell'apertura della lente. Con una lente diffrattiva asimmetrica è possibile dirigere la maggior parte della luce dello spettro visibile in una immagine di potere nullo e in un'altra immagine di potere positivo. Ciò si ottiene con una lente per la quale λ0, la lunghezza d'onda per la quale si ha uno sfasamento di 2 π, si trovi fuori dallo spettro visibile nell'ultravioletto. Ciò significa che per la luce visibile vicino al picco della curva di ri sposta visuale quasi tutta l'energia è suddivisa tra le immagini del primo ordine e dell'ordine - E.19 zero (potere nullo). Con la luce rossa la suddivisione è spostata verso l'ordine zero e con la luce blu verso il primo ordine. Comunque l'immagine del primo ordine fornisce una addizione per vicino la cui intensità è indipendente dalle dimensioni della pupilla. L'immagine del primo ordine soffre di aberrazione cromatica in modo tale che per un'addizione di +2,0 D nel verde, si ha un'addizione di circa +2,3 nel rosso e di +1,7 nel blu. L'occhio ha però un'aberrazione cromatica intrinseca di circa 1,0 D in senso opposto, e perciò per l'immagine da vicino questa aberrazione cromatica risulta parzialmente corretta. Figura 23. Elementi diffrattivi e i loro fronti d'onda. La figura 23 mostra la generazione dei fronti d'onda multipli associati a una lente diffrattiva a modulazione di ampiezza, a una lente diffrattiva a modulazione di fase e a una lente a contatto diffrattiva bifocale asimmetrica. La maggior parte di coloro che utilizzano lenti a contatto necessita anche di potere rifrattivo per correggere la visione da lontano ma l'immagine di ordine zero della componente diffrattiva non influisce su di esso. L'addizione per la visione da vici no è fornita interamente dall'effetto diffrattivo. 5. La funzione di trasferimento I reticoli di diffrazione possono essere considerati come elementi di sistemi ottici ma ci si può porre anche il problema di ottenere immagini di oggetti così fini. Ciò fu considerato per la prima volta da Abbe nel 1904 nel derivare la sua teoria del microscopio. Abbe prese un reticolo di diffrazione a trasmissione illuminato da un fascio di raggi di luce paralleli come oggetto per un obiettivo L (figura 24), per ottenerne un'immagine su uno schermo. Se l'obiettivo L ha apertura limitata non tutti i fasci diffratti passano attraverso di esso. Supponendo che i primi ordini siano accettati dall'obiettivo, essi formeranno tre immagini punti formi nel suo piano focale. Queste immagini agiscono come sorgenti coerenti per fornire effetti di interferenza nel piano immagine finale, che costituisce l'immagine del reticolo. - E.20 - Figura 24. Immagine di un reticolo. Se i fasci diffratti del primo ordine non riescono a passare attraverso l'obiettivo, non si vedrà nessun immagine del reticolo dato che la "sorgente" di ordine zero in F' non ha niente con cui interferire. Se quindi si riduce il passo del reticolo e l'angolo formato dai raggi del primo ordine aumenta, si arriva a una frequenza di linee per millimetro alla quale l'immagine del reticolo si perde. Con illuminazione coerente quindi si trova che l'immagine del reticolo svanisce rapidamente appena viene usata come oggetto una struttura sufficientemente fine. Nello studio di questa scomparsa dell'immagine è normale definire la finezza del reticolo in termine della sua frequenza spaziale, ossia del numero di fenditure per unità di lunghezza. Si misura comunemente in cicli per millimetro o numero di coppie di linee per millimetro. Solo se il reticolo ha una variazione sinusoidale di trasmissione si può dire propriamente che ha una frequenza, d'accordo con la teoria di Fourier, e anche in questo caso la mancanza di tra smissione negativa rende ciò meno esatto. Comunque spesso è un'approssimazione sufficiente considerare che i reticoli formati da linee e spazi abbiano una sola frequenza spaziale. Quando si forma con un obiettivo un'immagine di un reticolo di questo genere, si trova che la diffrazione e le aberrazioni si combinano riducendo la chiarezza delle linee dell'immagine. Il rapporto tra il contrasto dell'immagine e il contrasto dell'oggetto è generalmente chiamato funzione di trasferimento ottico (OTF) o "modulation transfer function" (MTF) dell'obiettivo. Si assume normalmente che questo parametro valga uno per basse frequenze di reticolo e un grafico della variazione di modulazione rispetto alla frequenza per illuminazione coerente apparirà come la curva A della figura 25. Figura 25. Curva di qualità dell'immagine. Dalla condizione di Abbe che il primo ordine debba passare attraverso l’obiettivo per formare l’immagine abbiamo che - E.21 a sen δ = λ (dall’equazione (17) del capitolo precedente), dove a è il passo del reticolo e θ deve essere posto uguale a β, che è l’angolo di accettazione dell’obiettivo. Quindi, con luce coerente, si ha che la massima frequenza del reticolo che può essere risolta è data da 1 sen ω NA = fC = = a λ λ (11) Nel ricavare questa equazione si è assunto che la luce proveniente dalle varie fenditure del reticolo sia mutuamente coerente. Ciò è generalmente vero nel caso del microscopio, ma se il reticolo è luminoso di per sé o è illuminato con l’immagine di una sorgente estesa, il calcolo di viene differente e un piuttosto più complicato. Ci si può fare un’idea considerando la minima separazione h’ per due punti risolti data dall’equazione (10) del capitolo precedente o per un’aper tura rettangolare dall’equazione (4) sempre del capitolo precedente. Anche se ciò non è esattamente corretto, la frequenza del reticolo può essere considerata uguale a 1/h’ e la massima frequenza risolta, fI, è allora 2 sen ω’/λ nel piano immagine o 2 sen ω/λ nel piano oggetto. Comunque con luce incoerente la variazione di modulazione con la frequenza è molto più graduale e la curve B e C della figura mostrano rispettivamente il risultato tipico per un obiettivo circolare perfetto al limite della diffrazione e per un obiettivo con aberrazione. Sono disponibili diversi sistemi per misurare la funzione di trasferimento ottico di un obiettivo, che consistono nel presentare all’obiettivo diversi reticoli e misurare elettronicamente la modulazione dell’immagine. Quando abbiamo considerato nel capitolo 7 le aberrazioni dei sistemi ottici siamo rimasti nell’ambito dell’ottica geometrica senza tener conto dell’effetto della diffrazione. Questo modo di procedere può essere utilizzato per sistemi ottici di bassa qualità, ma se le aberrazioni sono ridotte l’effetto della diffrazione diviene importante. In particolare, il tracciamento dei raggi geometrico mostrerebbe che la qualità dell’immagine continua a migliorare con piccoli cambiamenti delle curvature, delle separazioni, ecc., quando in realtà è l’effetto della diffrazione che è diventato il fattore limitante. Nella situazione intermedia di media qualità, gli effetti della diffrazione si aggiungono ai difetti delle immagini previsti dal tracciamento dei raggi geometrico. Quando le aberrazioni sono praticamente eliminate, il sistema ottico diventa limitato dalla diffrazione, in modo che l’immagine di un oggetto puntiforme ha una distribuzione come quella mostrata nella figura 11 del capitolo precedente. Quando ci si avvicina a questa situazione l’intensità del massimo centrale risulta ridotta perché parte della sua energia è trasferita agli anelli che lo circondano, allargando quindi le dimensioni dell’immagine. Il rapporto tra l’intensità ridotta del massimo centrale e quella del caso in cui non siano per nulla presenti aberrazioni è detto rapporto di intensità di Strehl e si è dimostrato un parametro molto utile per caratterizzare la qualità di un sistema. Il profilo di questa immagine non puntiforme di un oggetto puntiforme prodotto dagli effetti combinati delle aberrazioni e della diffrazione è detto point spread function (PSF). Se, anziché misurare il profilo dell'immagine di un oggetto puntiforme, si misura il profilo dell'immagine di una linea sottile, ortogonalmente alla linea stessa, si ottiene invece un profilo detto line spread function (LSF). Nella progettazione degli obiettivi fotografici moderni è spesso possibile rendere le aberrazioni residue così piccole che l'effetto della diffrazione è solo di poco modificato dalle aberrazioni, soprattutto quando l'obiettivo lavora a piccola apertura. In situazioni come questa, le prestazioni del sistema ottico vengono caratterizzate mediante la funzione di trasferimento ottico (MTF). Normalmente si costruisce un grafico con la frequenza spaziale sull'asse delle ascisse e il contrasto relativo sull'asse delle ordinate, come nella figura 25. La figura 26 mostra il risultato per diversi tipi di obiettivi. Appare chiaro che, mentre è possibile avvicinarsi al limite della diffrazione per oggetti posti sull'asse ottico, è molto difficile mantenere queste prestazioni su un campo di vista ampio. - E.22 - Figura 26. Curve di MTF per diversi obiettivi. La figura 26a mostra le prestazioni di un piccolo cannocchiale astronomico con grande apertura relativa ma piccolo campo di vista, che non richiede prestazioni elevate fuori asse. Il fatto che per l'immagine fuori asse vi siano due curve distinte, una per il piano radiale e l'altra per il piano tangenziale, è dovuto alla presenza di astigmatismo obliquo, per il quale si ha differente modulazione sui due piani. La frequenza di taglio fC data dalla formula (11) corrisponde, per un'apertura di F/3 (NA = 0,166) a un passo di 0,5 µm. Nel caso dell'obiettivo fotografico (figura 26b) le prestazioni ai bordi dell'immagine sono abbastanza simili a quelle sull'asse ottico, anche se è ancora presente un poco di astigmatismo. Nel caso dell'obiettivo per telecamera mostrato nella figura 26c, infine, l'esigenza è di avere il massimo di luminosità anziché un'elevata risposta ad alte frequenza spaziali, e il progetto è tale da massimizzare la risposta alle frequenze spaziali che sono effettivamente utilizzate. Quando un obiettivo fotografico (figura 26b) viene diaframmato a un'apertura più piccola, la sua curva di risposta mostra normalmente un miglioramento. La curva del limite di diffra - - E.23 zione però risulta peggiorata, e se le prestazioni dell'obiettivo si avvicinano al limite della diffrazione la riduzione dell'apertura provoca un peggioramento delle prestazioni. Notiamo infine che per ricavare direttamente la curva di MTF di un sistema ottico mediante l'analisi delle immagini di reticoli è necessaria una quantità notevole di lavoro. Un metodo più rapido consiste nel riprendere elettronicamente l'immagine di una fenditura sottile prodotta dall'obiettivo che si sta esaminando e ricavarne la line spread function (LSF). E' possibile poi calcolare a partire da questa la curva di MTF mediante opportuni programmi di computer. 6. L'olografia I principi fondamentali dell'olografia furono sviluppati da Dennis Gabor nel 1948, molto prima che fosse inventato il laser, che cercò di applicarli utilizzando lampade a vapori di mercurio come sorgenti di luce coerente. La normale fotografia ricrea un oggetto nei toni chiari e scuri dell'emulsione fotografica, ma Gabor considerò che quando un osservatore vede un oggetto reale egli riceve solo il fronte d'onda della luce diffusa che lascia l'oggetto e raggiunge l'occhio. Tutta l'informazione ottica deve trovarsi nelle fasi, intensità e lunghezza d'onda di quel fronte d'onda, che è estremamente complesso anche per oggetti semplici. Registrare questo fronte d'onda per ricostruirlo poi è normalmente impossibile. Nell'olografia è essenziale la semplificazione costituita dall'illuminazione monocromatica, ma anche in questo caso non è possibile registrare direttamente i valori di fase del fronte d'onda perché essi non sono rilevati da rivelatori ottici come le emulsioni fotografiche o i sistemi elettronici. Per registrare gli effetti delle fasi è necessario aggiungere al sistema un fascio di riferimento coerente, che interferisce con il fronte d'onda diffuso in modo che le differenze di fase emergano come differenze di intensità. Leith e Upatnieks nel 1961 introdussero questo fascio di riferimento disponendolo con un angolo grande rispetto al fascio diffuso. In questo modo si ottengono finissime frange di interferenza su una lastra fotografica. Una volta che questa è stata sviluppata e ricollocata nella sua posizione originale il fascio di riferimento da solo "ricostruisce" il fascio diffuso dall'oggetto per effetto della diffrazione del fascio da parte del reticolo costituito dalle frange di interferenza sulla lastra fotografica sviluppata. Si creano diversi ordini dell'immagine come con il reticolo di diffrazione. Alcune sono immagini reali e altre immagini virtuali. L'immagine virtuale del primo ordine può essere vista da un osservatore posto come nella figura 28 come un'immagine che ha notevole chiarezza di dettagli e di ombre ed è tridimensionale. L'aspetto tridimensionale della ricostruzione è inerente al fatto che viene ricreato il fronte d'onda anziché una rappresentazione piatta dell'oggetto. Gli occhi usano solo due piccole porzioni del fronte d'onda in ogni istante. Quando la testa si muove sono usate altre porzioni del fronte d'onda e l'oggetto è visto "in tondo". Il fronte d'onda è ricostruito solo sull'area delle fran ge di interferenza sulla lastra fotografica in modo che l'oggetto ricostruito è visibile solo attraverso la lastra, che costituisce come una finestra della scena. La potenza limitata delle sorgenti laser utilizzate ha limitato le dimensioni degli oggetti di ologrammi a poche decine di centimetri, anche se con tecniche speciali si sono ottenuti ologrammi di stanze intere. E' necessario impedire che luce incoerente raggiunga l'oggetto o la lastra. - E.24 - Figura 27. Olografia di Fresnel - produzione dell'ologramma. Figura 28. Olografia di Fresnel - ricostruzione. La maggior parte degli ologrammi sono realizzati in camera oscura e generalmente è necessario montare i componenti su una superficie protetta da vibrazioni. Se l'ologramma sviluppato è mosso o ruotato rispetto alla sua posizione originale rispetto al fascio di riferimento la ricostruzione è distorta e si perdono dettagli. Se è usato un fascio di riferimento di lunghezza d'onda differente l'oggetto si vede ancora ma con un ingrandimento dato dal rapporto tra le lunghezza d'onda. Questo tipo di ologrammi sono detti ologrammi di Fresnel. E' possibile produrre anche ologrammi di Fraunhofer. Si ottengono quando la lastra fotografica è distante dall'oggetto in confronto alle sue dimensioni o nella realtà o perché si usa una lente per collimare la luce diffusa dall'oggetto. La figura 29 mostra la disposizione utilizzata in questo caso. Nel caso particolare in cui la lastra fotografica e l'oggetto si trovano nei fuochi della lente l'ologramma che si ottiene è detto ologramma a trasformata di Fourier, perché l'intensità dell'ologramma a ogni data distanza dall'asse ottico è collegata all'intensità di una data frequenza spaziale dell'oggetto. Questi ologrammi possono essere utilizzati per una elaborazione ottica delle immagini, eliminando o amplificando frequenze spaziali dell'immagine. Un altro tipo di ologrammi si può ottenere quando la lente della figura 29 è disposta in modo da formare un'immagine dell'oggetto vicino al piano della lastra fotografica. Questi ologrammi focalizzati sono molto tolleranti rispetto alla coerenza, specialmente nella fase di ricostruzione, e sono usati nelle applicazioni visive. Se si usa un'emulsione spessa sulla lastra foto grafica è possibile a motivo degli effetti di interferenza entro l'emulsione ottenere un ologramma che risponde in maniera differente ai diversi colori nel fascio di ricostruzione, ottenendo così ologrammi a colori. - E.25 - Figura 29. Olografia a trasformata di Fourier. L'immagine risulta quindi dalla ricostruzione del fronte d'onda. Se l'oggetto è ancora al suo posto quando l'ologramma è rimesso nella sua posizione originale, è possibile ottenere interferenza tra l'oggetto reale e l'immagine ricostruita purché siano illuminate dallo stesso laser: quindi se l'oggetto si è mosso un poco o si è deformato si vedono chiaramente frange di interferenza. Questa tecnica di olografia interferenziale è diventata comune nelle prove meccaniche e nell'analisi delle vibrazioni. Quando un ologramma ricostruisce un'immagine complessa da un fascio di riferimento, si trova che un cambiamento nell'angolo o nella collimazione del fascio di riferimento muove e distorce l'immagine. Se, anziché una scena complessa, si usa un singolo punto di luce coerente, si trova che, una volta sviluppato, l'ologramma agisce sul fascio di riferimento focalizzandolo in un'immagine puntiforme. L'ologramma agisce in questo caso come una lente diffrattiva. Il fa scio di illuminazione della figura 27 può essere inviato direttamente sulla lastra fotografica allo stesso modo del fascio di riferimento (figura 30). Una volta sviluppata la lente olografica produce un'immagine di una sorgente puntiforme posta nell'origine R0 del fascio di riferimento nell'origine I0 del fascio di illuminazione. Non è necessario che la sorgente di riferimento sia coerente. Figura 30. Lente olografica. Esercizi 1. Quale deve essere il diametro dell'apertura circolare su uno schermo opaco perché essa possa trasmettere due zone di Fresnel a un punto distante 2 m? Quale sarà l'intensità approssimata della luce in quel punto? ( λ = 589 nm) 2. Mostrare che, per un fronte d'onda piano, quando la lunghezza d'onda è piccola le aree delle zone di semiperiodo per un punto a una distanza d dal fronte d'onda sono tutte praticamente uguali a πdλ. - E.26 3. Trovare il diametro delle prime quattro zone chiare (con il centro opaco) di una lente diffrattiva che mete a fuoco luce incidente parallela con λ = 600 nm a 50 cm dalla lente. 4. Le frange di diffrazione all'estremità dell'ombra di un oggetto opaco diminuiscono in ampiezza dall'ombra verso l'esterno; spiegare perché. Quando si usa luce bianca queste bande sono colorate; indicare quale deve essere l'ordine dei colori. 5. Spiegare brevemente le frange di diffrazione prodotte su uno schermo dalla luce emessa da una fenditura stretta che incontra un bordo rettilineo parallelo alla fenditura. Trovare l'intensità approssimata di illuminazione al bordo geometrico dell'ombra, nella prima frangia luminosa e nella prima frangia scura. Disegnare un grafico della variazione di intensità. 6. Quando è filo sottile è illuminato dalla luce emessa da una fenditura sottile monocroma tica la sua ombra su uno schermo è vista attraversata da frange chiare e scure alternate e parallele alla lunghezza del filo. Spiegare la formazione di queste frange. In un esperimento la distanza tra le bande luminose è di 0,7 mm quando lo schermo è a 1 m di distanza del filo. Qual è lo spessore del filo? (λ = 650 nm). 7. Spiegare come può essere usata la spirale di Cornu per calcolare le figure di diffrazione. A quale tipo di situazioni si può applicare? 8. Un reticolo illuminato proiettando su di esso l'immagine di una sorgente luminosa è al limite della risoluzione di un microscopio. Il condensatore viene poi cambiato sostituendolo con una lente che collima luce provenente da una sorgente puntiforme. Spiegare perché il reticolo non è più risolto. 9. Spiegare perché è possibile studiare in modo approfondito la teoria degli obiettivi e in generale degli strumenti ottici sulla base di una trattazione geometrica anziché mediante l'uso della teoria ondulatoria della propagazione della luce. In quali situazioni trascurare gli aspetti ondulatori introduce gravi errori? Spiegare perché l'immagine di una stella vista attraverso un telescopio appare più piccola quando l'apertura del telescopio è aumentata. 10. Una lente a contatto bifocale diffrattiva ha un potere di -6,00 D e un'addizione bifocale di +2,50 D. Se l'area diffrattiva ha un diametro di 4,8 mm calcolare quante zone contiene e il diametro della zona centrale assumendo che la lente sia progettata per una lunghezza d'onda di 555 nm. - E.107 - N - LA POLARIZZAZIONE DELLA LUCE L’esperimento di Young mise in evidenza l’interferenza della luce e dimostrò che la luce è costituita da onde. Ma né Young, né nessuno dei suoi contemporanei aveva un’idea di quale tipo di onda si trattasse. I risultati ottenuti da Young non permettevano di riconoscere se la luce fosse costituita da onde longitudinali, come il suono, o da onde trasversali. Nel 1810 il francese Etienne-Luis Malus (1775-1812) scoprì il fenomeno della polarizzazione della luce, che fu spiegato nel 1821 da Fresnel ipotizzando che la luce fosse costituita da onde trasversali. Vediamo in dettaglio come andarono le cose. 1. La scoperta della polarizzazione della luce Quando si indirizza un raggio luminoso su un cristallo, spesso si osservano al suo interno due raggi rifratti distinti. Per uno di questi due raggi rifratti si ha un indice di rifrazione fisso che dipende solo dalla sostanza di cui è costituito il cristallo: questo raggio si dice raggio ordinario. Per l’altro raggio, che si dice raggio straordinario, si ha invece un indice di rifrazione che dipende dall’orientazione del raggio incidente rispetto al cristallo. Se si guarda un oggetto in trasparenza attraverso il cristallo, si osservano due immagini distinte (figura 1). Questo fenome no, detto birifrangenza, si presenta con tutti i cristalli, esclusi quelli del sistema monometrico, e con altre sostanze come il cellofan e il nastro adesivo trasparente. Fu scoperto dal chimico da nese Erasmus Bartholinus nel 1669 e studiato da Huygens, ma né Huygens con la sua teoria ondulatoria della luce, né Newton con la sua teoria corpuscolare, furono in grado di spiegarlo. Figura 1. L’immagine osservata attraverso un cristallo birifrangente di calcite appare sdoppiata. Nel 1810 Malus scoprì casualmente che, osservando attraverso un cristallo birifrangente i raggi solari riflessi dal vetro di una finestra, anziché le due immagini distinte era presente soltanto l’immagine ordinaria, o quella straordinaria, a seconda dell’orientamento del cristallo. Malus notò che avviene lo stesso con la luce riflessa da qualsiasi altro corpo che non sia un metallo. Cercò di spiegare questi fenomeni nell’ambito della teoria corpuscolare della luce, ipotizzando che le particelle luminose possiedano due poli magnetici che nella riflessione si dispongono perpendicolarmente alla direzione dei raggi luminosi, e per questo dette al fenomeno il nome di polarizzazione della luce, rimasto in uso anche dopo l’abbandono della teoria corpuscolare della luce. Fu, come abbiamo detto, Fresnel a interpretare questi fenomeni nell’ambito della teoria ondulatoria della luce come manifestazione del fatto che la luce è costituita da onde trasversali. Quando poi nel 1859 Maxwell presentò la sua teoria delle onde elettromagnetiche, di cui ci oc cuperemo in un capitolo successivo, risultò chiaro che la luce è dovuta a oscillazioni dei vettori campo elettrico E e campo magnetico B che si mantengono sempre perpendicolari tra loro nel piano trasversale alla direzione di propagazione dell’onda. Nel seguito di questo capitolo considereremo i diversi modi di polarizzazione di un’onda trasversale, ed esamineremo quindi alcuni fenomeni in cui si ha a che fare con luce polarizzata. - E.108 Giungeremo così a spiegare quale sia la relazione della polarizzazione della luce con il fenomeno della riflessione e con quello della birifrangenza. 2. I diversi tipi di polarizzazione della luce Sappiamo che la luce emessa da una normale sorgente luminosa è costituita da un grande numero di treni d’onda. Ciascuno di essi deriva dalla transizione di un elettrone tra due distinti livelli energetici all’interno di un atomo. Poiché ogni atomo emette radiazione in modo indipendente dagli altri atomi, le fasi di questi treni d’onda sono distribuite casualmente: la luce osservata è quindi incoerente. Anche le direzioni di vibrazione degli elettroni che emettono i singoli treni d’onda sono orientate in modo casuale nello spazio, e lo sono quindi anche le direzioni del campo elettrico corrispondenti ai singoli treni d’onda. Consideriamo allora un’onda piana emessa da una sor E gente di questo tipo che si propaga lungo la direzione dell’asse z di un sistema di riferimento cartesiano (figura 2): la vibrazione del campo elettrico E , pur mantenendosi sempre perpendicolare alla direzione di propagazione z, sarà diretta per un primo treno d’onde come AA’, per un secondo treno d’onde come BB’, per un terzo treno d’onde come CC’, ecc. In ogni dato istante si osserverà una diversa direzione di oscillazione: la luce non è polarizzata. y a) A B A’ C y b) A A’ A C’ B’ A B A x y c) x B’ R C’ R z z x A’ A’ R A’ C z Figura 2. Un raggio luminoso R si propaga lungo l’asse z di un sistema di riferimento cartesiano: a) se la luce non è polarizzata il vettore campo elettrico può oscillare in qualsiasi direzione perpendicolare a z; b) se è polarizzata linearmente il vettore campo elettrico oscilla in una direzione fissa perpendicolare a a; c) se è polarizzata circolarmente la direzione di oscillazione del vettore campo elettrico ruota con velocità angolare costante. Se invece la direzione di oscillazione del vettore E è sempre la stessa, per esempio la direzione AA’, si dice che l’onda ha una polarizzazione lineare. Può avvenire anche che la direzione di oscillazione del vettore E vari nel tempo, ma in modo che il suo estremo ruoti descrivendo una circonferenza: si ha allora una polarizzazione circolare. In generale, le componenti Ex ed Ey del vettore E di un’onda elettromagnetica monocromatica che si propaga lungo l’asse z di un sistema di riferimento cartesiano sono date da: E x = E x 0 sen( kz − ω t ) E y = E y 0 sen( kz − ω t + ϕ (1a) ) (1b) dove ϕ è la differenza di fase fra le due componenti. Se la differenza di fase ϕ varia nel tempo l’onda non è polarizzata. Se invece la differenza di fase ϕ è costante l’onda è polarizzata. In particolare, se la differenza di fase è nulla l’onda è polarizzata linearmente lungo la direzione che forma con l’asse x un angolo θ dato da tg θ = y/x = Ey0/Ex0. Se invece la differenza di fase è diversa da zero la polarizzazione si dice ellittica. Infatti dall'equazione (1a) si ha - E.109 - Ex = sen( kz − ω t ) E x0 (2) e dall'equazione (1b) E y = E y 0 [ sen( kz − ω t ) cos ϕ + cos( kz − ω t ) sen ϕ ] e cioè Ey Ey0 = sen( kz − ω t ) cos ϕ + cos( kz − ω t ) sen ϕ e si ha Ey Ey0 = (3) Sostituendo in quest'ultima relazione il valore di sen (kx - ωt) ottenuto con la formula (3) Ex cos ϕ + cos( kz − ω t ) sen ϕ Ex0 ossia Ey Ey0 − Ex cos ϕ = cos( kz − ω t ) sen ϕ E x0 (4) Eleviamo ora al quadrato entrambi i membri e sviluppiamo: E y2 E y20 + E x2 E x20 cos 2 ϕ − 2E y E x E y 0E x 0 cos ϕ = cos 2 ( kz − ω t ) sen 2 ϕ (5) Sappiamo però che cos 2 ( kz − ω t ) = 1 - sen 2 ( kz − ω t ) e ricordando la formula (2) essa si ha cos 2 ( kz − ω t ) = 1- E y2 E y20 E x2 (6) E x20 Sostituiamo questo valore nella formula (5) e otteniamo 2E y E x E2 E2 + 2x cos 2 ϕ − cos ϕ = 1 − 2x sen 2 ϕ E y 0E x 0 E x0 E x 0 ossia E y2 E y20 + E x2 E x20 cos 2 ϕ − 2E y E x E y 0E x 0 cos ϕ = sen 2 ϕ − E x2 E x20 sen 2 ϕ da cui si ha E y2 E y20 + E x2 E x20 cos 2 ϕ + E x2 E x20 sen 2 ϕ − 2E y E x E y 0E x 0 cos ϕ = sen 2 ϕ - E.110 e infine E y2 E y20 + E x2 E x20 − 2E y E x E y 0E x 0 cos ϕ = sen 2 ϕ (7) Questa è l'equazione generale di un'ellisse per le due variabili Ex ed Ey. L'estremo del vettore campo elettrico giace quindi su un'ellisse, la cui forma dipende dalla differenza di fase ϕ. Se ϕ varia istante per istante in modo casuale la forma dell'ellisse continua a cambiare e non è prevedibile la direzione e l'ampiezza del vettore risultante: siamo in presenza di luce non polarizzata. Se invece ϕ rimane costante nel tempo la forma dell'ellisse è determinata e la luce risulta polarizzata ellitticamente. In generale gli assi dell'ellisse non sono allineati con gli assi x e y; l'ellisse è contenuta in un rettangolo di lati 2Ex0 e 2Ey0, come mostra la figura 3. Figura 3. Composizione di due moti armonici semplici eseguiti in direzioni ortogonali. Se in particolare la differenza di fase è pari a un multiplo dispari di π/2, ossia se si ha ϕ = ( 2m + 1) π 2 (8) la formula (7) diviene E y2 E y20 + E x2 E x20 = 1 (9) L'ellisse ha ora i semiassi allineati con gli assi x e y. Se oltre alla condizione (8) le due onde componenti hanno uguale ampiezza, ossia se Ex0 = Ey0, l'ellisse degenera in una circonferenza e la luce si dice polarizzata circolarmente. La formula (9) diviene infatti E y2 E y20 cioè + E x2 E y20 = 1 - E.111 - E y2 + E x2 = E y20 (10) che è l'equazione di una circonferenza con centro sull'asse z e avente il raggio uguale a Ey0. Se infine nella formula (7) poniamo ϕ = mπ, l'ellisse degenera in una retta. Si ha infatti E y2 E y20 + E x2 E x20 2E y E x − E y 0E x 0 = 0 ossia Ey E − x E y 0 E x0 2 = 0 e quindi Ey Ey 0 − Ex = 0 E x0 (11) da cui si ottiene Ey = Ey0 E x0 Ex (12) cioè l'equazione di una retta con coefficiente angolare uguale a Ey0/Ex0. L'onda risultante è detta in questo caso polarizzata linearmente. Per definizione viene chiamato piano di polarizzazione quello perpendicolare al piano in cui avvengono le oscillazioni del vettore campo elettrico. La figura 4 mostra i moti risultanti per uguali valori di Ey0 e Ex0 e diverse differenze di fase. - E.112 Figura 4. Composizione di moti armonici semplici ortogonali di uguale ampiezza e frequenza con differenze di fase ϕ1 = 0° (o 180°, 360°, ecc.), ϕ2 = 22,5° (o 157,5°, 202,5°, ecc.), ϕ3 = 45° (o 135°, 225°, ecc.), ϕ4 = 90° (o 270°, 450°, ecc.). 3. La polarizzazione della luce per assorbimento La maggior parte dei materiali ottici sono solidi amorfi come il vetro. Ciò significa che le molecole sono disposte in modo casuale. Se in questi materiali esiste una qualche struttura cristallina, essa non si ripete se non per poche molecole. Perciò un fascio di luce che attraversa un materiale di questo tipo subisce in media lo stesso effetto per tutte le orientazioni di oscillazione. I solidi cristallini trasparenti si comportano invece in un modo differente. Essi infatti reagiscono in modo differente alle oscillazioni con diverse orientazioni e sono perciò detti anisotropi. Ciò produce effetti di polarizzazione sulla luce che li attraversa. Un raggio di luce non polarizzata può essere polarizzato facendolo passare attraverso un materiale trasparente anisotropo che assorba soltanto le onde luminose le cui oscillazioni avvengono in una determinata direzione. La direzione perpendicolare a questa, corrispondente alla direzione di oscillazione delle onde che attraversano il materiale senza essere assorbite, si dice asse ottico del materiale. Per molto tempo furono utilizzati come polarizzatori cristalli di tormalina, un borosilicato di alluminio. Si tratta di cristalli che hanno una struttura a piani allungati, disposti paralleli l’uno rispetto agli altri. Ciò significa che il materiale assorbe un fascio di luce che passa attraverso di esso in un modo che dipende dalla direzione del fascio e dall’orientazione del piano di oscilla zione rispetto all’asse del cristalli. Se da un cristallo di tormalina si taglia una lamina con l’asse ottico parallelo alle sue superfici, un fascio di luce non polarizzata che passa attraverso la lami na avrà una componente dei suoi vettori elettrici nell’asse ottico e l’altra componente perpendicolare ad esso. Nella tormalina il campo elettrico che oscilla perpendicolarmente all’asse ottico è fortemente assorbito mentre il campo elettrico nella direzione dell'asse ottico lo è molto meno. Perché il fascio emergente sia fortemente polarizzato è sufficiente che la lamina sia spessa po chi millimetri. Questi effetti dipendono molto anche dalla lunghezza d’onda della luce e quindi la tormalina cambia colore a seconda dell’angolo con cui è osservata. Cristalli di questo tipo sono detti cristalli dicroici, ossia “di due colori”. Se invece la lamina viene tagliata in modo che la luce che la attraversa viaggi lungo l’asse ottico, non si ha nessun effetto perché l’assorbimento è lo stesso per le due componenti. I cristalli di tormalina hanno l'inconveniente di essere leggermente colorati e per questo non vengono usati negli strumenti ottici. Un altro cristallo dicroico è la herapatite (iodio-solfato di chinino), così chiamata dal nome di W.B. Herapath, che nel 1852 riuscì a produrre dei piccoli cristalli di questo composto organico. Il difetto di questi cristalli è di essere molto fragili e quindi difficili da conservare in di mensioni utili. Nel 1934 l’americano Edwin H. Land riuscì a orientare cristalli di herapatite paral lelamente l'un l'altro inserendoli tra due sottili lamine di vetro. Nascevano così le pellicole polaroid. In luogo delle lamine di vetro ora si usano sottili lamine di celluloide. Un’alternativa ai cristalli allungati è costituita da lunghi fili paralleli a forma di griglia. Quando un fascio di luce non polarizzato incide sulla griglia le componenti dei vettori elettrici paralleli alla griglia inducono correnti nei fili muovendo gli elettroni di conduzione nei fili. Questi elettroni di conduzione perdono energia sia urtando gli ioni del reticolo, e in questo caso la luce è assorbita, sia reirraggiando all’indietro, e in questo caso la luce è riflessa. Le componenti dei vettori elettrici che sono perpendicolari alla griglia non possono invece generare correnti di elettroni lungo i fili (se questi sono sufficientemente sottili) e vengono quindi trasmesse (figura 5). Si noti che, se si considerano i vettori elettrici, vengono trasmesse le componenti che sono ortogonali al reticolo. L’efficienza di questo sistema per polarizzare la luce dipende in modo critico dal rapporto tra la lunghezza d’onda della luce incidente e il passo del reticolo. La figura 6 mostra che d, il passo del reticolo, deve essere almeno quattro volte minore della lunghezza d’onda della luce. Il polarizzatore lineare ora più comune non è il Polaroid dicroico de scritto sopra ma uno sviluppo successivo, che è l’analogo molecolare del reticolo di fili. Si tratta di un foglio di alcol polivinilico che viene riscaldato e stirato in una direzione. In questo modo si - E.113 allineano le lunghe molecole di idrocarburi. Quando il foglio viene immerso in una soluzione di iodio lo iodio si attacca alle lunghe molecole di idrocarburi, formando lunghi canali conduttori al lineati, che agiscono come fili elettrici. Sono separati da distanze di ordine molecolare in modo che viene polarizzata la luce visibile anche se con minore efficienza all’estremità blu dello spettro. Figura 5. L'azione di una griglia polarizzatrice. Figura 6. L'effetto polarizzatore di una griglia. Consideriamo quindi un fascio di luce non polarizzata che si propaga lungo l’asse z di un sistema di riferimento cartesiano e che incide su una lamina di polaroid il cui asse di trasmissione sia orientato lungo come l’asse y, come nella figura 7. Questo fascio di luce incidente non polarizzato è composto da treni d’onda i cui vettori E oscillano in direzioni orientate in modo ca suale. Il vettore E di ogni treno d’onde può essere scomposto nelle due componenti Ex = E sen θ perpendicolare all’asse di trasmissione ed Ey = E cos θ parallela all’asse di trasmissione. Solo la componente Ey viene trasmessa dalla lamina. Poiché l’intensità dell’onda luminosa è proporzionale al quadrato della sua ampiezza E, l’intensità del fascio di luce emergente dalla lamina risulterà ridotta di un fattore pari al valore medio di cos2 θ, ossia un mezzo. 1 Quindi, metà dell’intensità della luce incidente è assorbita dal1 Le due funzioni cos2 α e sen2 α hanno lo stesso grafico con uno sfasamento di π/2. Perciò il loro valore medio calcolato su un periodo è lo stesso. Poiché cos 2 α + sen2 α = 1, il valore medio di cos 2 α è uguale a ½, come quello di sen 2 - E.114 la lamina di polaroid, e metà è trasmessa nel fascio di luce polarizzata emergente. L’intensità I1 della luce polarizzata che emerge dalla lamina di polaroid è allora legata all’intensità I della luce incidente non polarizzata da: I1 = ½ I (13) E y E I0 y ϕ I1 = ½ I0 y’ E 2 z I2 = I0 cos ϕ Figura 7. Un fascio di luce non polarizzata (a sinistra) viene polarizzato passando attraverso un cristallo polarizzatore con asse di trasmissione (diretto come l’asse y). L’intensità del fascio polarizzato è metà dell’intensità del fascio incidente. L’intensità del fascio di luce viene ulteriormente ridotta di un fattore cos2 ϕ quando passa attraverso un cristallo analizzatore il cui asse di trasmissione (diretto come l’asse y’) forma un angolo ϕ con l’asse di trasmissione del cristallo polarizzatore. Supponiamo ora che il raggio di luce polarizzata incida su una seconda lamina di pola roid, con l’asse di trasmissione ruotato di un angolo ϕ rispetto alla direzione y dell’asse di trasmissione della prima lamina di polaroid. Possiamo indicare con y’ la direzione dell’asse di tra smissione della seconda lamina di polaroid. Il vettore E di un treno d’onda di luce polarizzata che incide su questa lamina, che oscilla nella direzione di y, può essere anch’esso scomposto in due componenti Ex’ = E sen ϕ ed Ey’ = E cos ϕ rispettivamente perpendicolare e parallela all’asse di trasmissione della seconda lamina di polaroid. Solo la componente Ey’ viene trasmessa. L’intensità I2 della luce polarizzata che emerge dalla seconda lamina di polaroid è quindi data da: I2 = I1 cos2 ϕ = ½ I cos2 ϕ (14) Se dunque le due lamine di polaroid sono incrociate ( ϕ = 90°) non viene trasmessa luce. In una configurazione come quella illustrata, la prima lamina di polaroid prende il nome di polarizzatore, e la seconda di analizzatore (quando viene ruotata, infatti, permette di individuare la direzione di polarizzazione della luce trasmessa dal polarizzatore, corrispondente alla dire zione per la quale si osserva la massima intensità luminosa). La relazione (13) è nota come legge di Malus. 4. La polarizzazione della luce per diffusione Consideriamo ora gli effetti di polarizzazione che non dipendono dalla struttura anisotropa dei cristalli. L’asimmetria necessaria per ottenere la polarizzazione deriva in questi casi da effetti geometrici. La luce può essere diffusa da atomi, molecole e particelle che possono vibrare in condizioni di risonanza o di quasi-risonanza con la frequenza della luce. L’interazione è ge neralmente tra l’energia luminosa e la nube elettronica nell’atomo o nella molecola. Le caratteristiche delle nubi elettroniche alle frequenze della luce incidente sono molto variabili nel caso dei solidi e determinano se la luce è riflessa, rifratta o assorbita. α. - E.115 Nel caso dei gas l’interazione più probabile è la collisione elastica, che porta alla diffusione. Più è vicina la frequenza della luce alla risonanza, maggiore è la diffusione. La maggior parte dei gas risuona nell’ultravioletto e perciò l’atmosfera diffonde più all’estremità blu dello spettro, dando luogo all’azzurro del cielo e, dato che la luce blu è diffusa via dal fascio di luce, al rosso del tramonto. Se consideriamo un fascio di luce non polarizzata che raggiunge un mezzo diffusore in A (figura 8), le oscillazioni quasi-risonanti negli atomi del mezzo sono trasversale rispetto alla direzione di incidenza. Consideriamo un osservatore in B che si rende conto delle oscillazioni in A a motivo della luce diffusa. E’ chiaro della geometria che non ci sono oscillazioni nella direzione del fascio incidente – la luce diffusa è quindi polarizzata linearmente (lo stesso avviene in C). Se si utilizza un analizzatore per osservare una zona di cielo blu a circa 90° dal Sole, si può osservare la polarizzazione della luce diffusa ruotandolo. La diffusione multipla, ossia la diffusione successiva della luce già diffusa una volta, tende a depolarizzare il fascio di luce ma in circostanze favorevoli si può trovare una polarizzazione residua del 70-80%. Figura 8. Polarizzazione per diffusione. 5. La polarizzazione della luce per riflessione e rifrazione Si è detto che Malus scoprì la polarizzazione della luce osservando attraverso un cristallo birifrangente la luce solare riflessa dal vetro di una finestra. Effettivamente, la riflessione costituisce un secondo metodo per ottenere luce polarizzata: quando un raggio di luce non polarizzata incide su una superficie riflettente, il raggio riflesso risulta parzialmente polarizzato e il grado di polarizzazione dipende dall’angolo di incidenza della luce e dagli indici di rifrazione del mezzo in cui si propaga la luce e del mezzo su cui avviene la riflessio ne. È per questo motivo che gli occhiali da sole che hanno una lamina di polaroid inserita nel vetro delle lenti (normalmente con asse ottico in direzione verticale) riducono grandemente i riflessi abbaglianti: l’intensità della luce solare non polarizzata è dimezzata, d’accordo con la for mula (12), mentre l’intensità della luce riflessa da superfici di vetro o da altri materiali riflettenti, che è polarizzata, è ridotta in misura maggiore d’accordo con la formula (13). La figura 9 ci aiuta a capire perché la luce riflessa risulta polarizzata. La figura rappre senta un raggio luminoso non polarizzato che si propaga nell’aria e, incidendo su una superficie piana di vetro, viene in parte riflesso e in parte rifratto all’interno del vetro. Il piano di incidenza, che contiene il raggio incidente e la normale alla superficie riflettente nel punto di incidenza, coincide con il piano del foglio. Nella figura è rappresentata anche la direzione di oscillazione del campo elettrico E dell’onda luminosa: le freccette rappresentano il campo elettrico che oscilla nel piano di incidenza, mentre i cerchietti rappresentano il campo elettrico che oscilla in direzione perpendicolare al piano di incidenza. Nel raggio incidente non polarizzato le ampiezze di queste due componenti sono uguali. Il raggio rifratto risulta invece polarizzato in direzione pa - - E.116 rallela al piano di incidenza, mentre il raggio riflesso è polarizzato nella direzione perpendicolare al piano di incidenza. In generale il raggio riflesso è solo parzialmente polarizzato. Nel 1812, però, il fisico scozzese David Brewster scoprì che per ogni materiale che sia un isolante elettrico esiste un angolo di incidenza, detto angolo di polarizzazione iˆp , per il quale è nulla la componente parallela del raggio riflesso, che risulta polarizzato totalmente. Brewster scoprì che per ogni materiale l’angolo di polarizzazione iˆp è quello per il quale il raggio rifratto e il raggio riflesso sono perpendicolari tra loro. Si ha quindi la relazione iˆ′ = 90° − iˆp (14) dove con iˆ′ si è indicato l’angolo di rifrazione. Se inseriamo la relazione (14) nella seconda leg ge della rifrazione otteniamo sen iˆp sen iˆp sen iˆp n ′ = = = n sen iˆ′ sen 90° − iˆp cos iˆp ( ) ossia tg iˆp = n′ n (15) che è nota come legge di Brewster: la tangente dell’angolo di polarizzazione per la riflessione tra due mezzi trasparenti è uguale all’indice di rifrazione relativo tra i due mezzi. Figura 9. La polarizzazione della luce per riflessione. Le freccette indicano la componente della luce polarizzata nella direzione del foglio, mentre i pallini indicano la componente della luce polarizzata in direzione perpendicolare al foglio. Quando l’angolo di incidenza è uguale all’angolo di polarizzazione ip il raggio riflesso è totalmente polarizzato. Per comprendere come la riflessione possa produrre luce polarizzata è necessario ricorrere alla teoria del campo elettromagnetico sviluppata da Maxwell verso la metà del XIX se colo. Le particelle dotate di carica elettrica presenti nel mezzo in cui si propaga la luce (per esempio nel vetro) vengono fatte oscillare dal campo elettrico E del raggio rifratto nella direzio- - E.117 ne di oscillazione del campo elettrico stesso. A loro volta, queste cariche elettriche oscillanti emettono radiazione elettromagnetica (il raggio riflesso) con un campo elettrico E oscillante nella loro stessa direzione di oscillazione. Ma, poiché la luce è costituita da onde trasversali, risultano efficaci nella produzione del raggio riflesso solo le particelle che oscillano in direzione perpendicolare rispetto alla direzione di propagazione del raggio riflessostesso. Quindi nel raggio riflesso prevale la componente perpendicolare del campo elettrico E , che costituisce la totalità del raggio riflesso se esso è perpendicolare al raggio rifratto. Questo fenomeno può essere messo in evidenza utilizzando la riflessione di un fascio del fascio di luce riflesso da una lamina di vetro su una seconda lamina di vetro con lo stesso indice di rifrazione. Si faccia incidere la luce sulla prima lamina con un angolo di incidenza uguale all'angolo di polarizzazione, che per il vetro con indice di rifrazione n = 1,5 è pari a ip = 57°. Se le due lamine sono parallele tra loro la luce incide sulla seconda lamina con un angolo ancora di 57° e con tale angolo viene riflessa. Se ora facciamo ruotare la seconda lamina attor no all'asse di rotazione definito dal fascio riflesso dalla prima lamina, si osserva che la luce ri flessa dalla seconda lamina diminuisce fino ad annullarsi per una rotazione di 90° rispetto alla posizione iniziale, per ricomparire e raggiungere un massimo di intensità dopo una rotazione di 180°. Ciò significa che la luce riflessa dalla prima lamina è polarizzata linearmente. Nella figura 9 sono indicati con frecce i vettori campo elettrico che oscillano nel piano del foglio, e con cerchietti pieni i vettori che oscillano in direzione perpendicolare al foglio. S iusa indicare le due orientazioni con le lettere p ed s, che derivano dal tedesco “parallel” e “senkrecht”. La luce che raggiunge C è di tipo s, dato che ha il vettore elettrico che oscilla in un piano perpendicolare al piano di incidenza. Per calcolare le ampiezze relative dei raggi riflesso e rifratto nei due piani di oscillazione principali si utilizzano le equazioni di Fresnel. Facendone il quadrato otteniamo le intensità relative che per la riflessione sono: IR tg2 i−i ' = 2 =Coefficiente di riflessione ,R p I I p tg ii ' (16) IR sen2 i −i ' = =Coefficiente diriflessione ,R s I I s sen2 i i ' (17) E’ evidente che l’equazione (16) dà Rp = 0 all’angolo di Brewster dato dall’equazione (15). Per incidenza normale si ha i = i’ = 0 e le equazioni diventano indeterminate. Tuttavia, se espandiamo i termini del seno, e ricordiamo che sen = tg per angoli piccoli, abbiamo R p =Rs = sen i cosi ' −cos i sen i ' sen i cosi ' cos i sen i ' 2 (per angoli piccoli) (18) Usando la legge di Snell e il fatto che i coseni tendono a uno per piccoli angoli, si ha R p =R s = n ' −n n ' n 2 (19) Quando i supera l’angolo critico queste equazioni semplificate non possono più essere applicate direttamente ed è necessario utilizzare una trattazione più completa che considera anche le fasi relative delle oscillazioni. I grafici della figura 10 mostrano i coefficienti di riflessione per tre indici di rifrazione e per riflessione interna ed esterna. Le intensità dei raggi trasmessi sono date dai coefficienti Tp = 1 - Rp (20) - E.118 e Ts = 1 – Rs (21) se si assume che non ci sia assorbimento. Se c’è assorbimento nel materiale ciò influisce sia sul fascio riflesso che su quello rifratto. La cosa più importante è che la riflettività per il fascio p non si riduce a zero, anche se la forma generale della curva resta la stessa. Con i rivestimenti metallici degli specchi gli effetti indesiderati di polarizzazione normalmente non sono rilevanti, ma con rivestimenti dielettrici multistrato si hanno invece seri problemi per angoli di incidenza non normali. Se invece sono richiesti effetti di polarizzazione, si può effettivamente ricorrere alla riflessione. Con una singola superficie riflettente di acqua la luce riflessa è polarizzata più dell’80% per un intervallo di angoli di incidenza compreso tra 40° e 70°, cosa che spiega l’effica cia degli occhiali da sole polarizzanti al mare o in presenza di pioggia. Gli assi di un polarizzato re possono essere individuati osservando attraverso di esso una scena riflessa da una superficie liquida o da vetro con incidenza vicina all’angolo di Brewster e ruotando il polarizzatore fino ad avere minima trasmissione. - E.119 Figura 10. Coefficienti di riflessione alle superfici di contatto di mezzi non assorbenti. Con una lamina a facce piano parallele di vetro vi sono due superfici. Gli angoli di Brewster interno e esterno sono legati dalla legge di Snell e quindi la polarizzazione massima si ha sulle due superfici per lo stesso angolo di incidenza. La riflessione della componente polarizzata s va per questo angolo da circa 7,5% per una superficie singola a 13% per la lamina (per n = 1,52). Con due lamine si arriva al 20%, e con quattro lamine al 28%. Quando un grande numero di lamine sono impacchettate con piccoli intervalli di aria tra di esse, si può ottenere una riflessione massima di circa il 35%. Anche il fascio trasmesso diviene più polarizzato. Questo principio può essere sfruttato utilizzando sottili pellicole trasparenti con indice di rifrazione rispetto al vetro tale da avere un angolo di Brewster di 45° per una data lunghezza d’onda. Ad altri angoli l’effetto è meno pronunciato, come ad altre lunghezze d’onda. Le figure 11 e 12 mostrano lo schema e le prestazioni di un divisore di fascio polarizzante di questo tipo. Figura 11. Schema di divisore di fascio a polarizzazione a sette strati. Figura 12. Prestazioni in funzione della lunghezza d'onda del divisore di fascio della figura 11. La lunghezza d'onda di progetto è 540 nm. 5. La birifrangenza Concludiamo il paragrafo tornando al punto da cui lo abbiamo iniziato, ossia al fenomeno della birifrangenza, che ora siamo in grado di mettere in relazione con la polarizzazione della luce. La birifrangenza si presenta con molti cristalli che hanno una struttura anisotropa, ossia che presentano proprietà diverse nelle diverse direzioni. Dalla mineralogia si ricava che queste sostanze possono essere suddivise in tre gruppi, mentre le varie forme cristalline possono essere a loro volte suddivise in altri sette raggruppamenti, detti sistemi cristallini, caratterizzati da particolari elementi di simmetria. Ecco uno schema generale: - E.120 Gruppo monometrico - Gruppo dimetrico - Sistema cubico Sistema esagonale Sistema trigonale - Sistema tetragonale Sistema rombico Sistema monoclino Gruppo trimetrico Sistema triclino I cristalli appartenenti al sistema cubico, come per esempio il cloruro di sodio (NaCl) sono otticamente isotropi. Invece i cristalli sia del gruppo dimetrico che trimetrico sono anisotropi, cioè l'indice di rifrazione o, se si vuole, la velocità di un'onda, non è la stessa in tutte le dire zioni. In essi si verifica il fenomeno della birifrangenza: un raggio di luce incidente si sdoppia, in generale, dando luogo a due raggi rifratti polarizzati perpendicolarmente l'uno rispetto all'altro. Uno di questi raggi viene detto raggio ordinario, in quanto segue la legge di Snell ed è più intenso, l'altro viene detto raggio straordinario. La figura 13 mostra come un fascio di luce non polarizzata che incide in direzione normale su una faccia di un cristallo di calcite è rifratto in due raggi. Il raggio ordinario si comporta come se il materiale fosse isotropo, come nel caso del ve tro. Il raggio straordinario si comporta in modo completamente differente, perché cambia di direzione entrando nel cristallo anche se la luce incidente è normale alla superficie. Figura 13. Doppia rifrazione da parte della calcite di un fascio di luce non polarizzata che incide normalmente nella sezione che contiene l'asse ottico. Il motivo che lega il fenomeno della birifrangenza alla polarizzazione della luce è quindi che il raggio ordinario e il raggio straordinario sono entrambi polarizzati, in direzione mutuamente perpendicolari. Se un fascio di luce non polarizzata incide su un cristallo birifrangente può essere sdoppiato nei due raggi polarizzati, ma se la luce incidente è già polarizzata nella direzione di polarizzazione del raggio ordinario o in quella del raggio straordinario non si ha nessuno sdoppiamento, e nel cristallo si propaga solamente il raggio ordinario o, rispettivamente, il raggio straordinario. È questo il motivo per il quale Malus, osservando attraverso un cristallo birifrangente la luce del Sole riflessa dal vetro di una finestra, non osservava nessuno sdoppiamento dell’immagine: perché, per quelle particolari orientazioni del cristallo, la luce osservata ri sultava polarizzata per riflessione dal vetro della finestra nelle direzioni corrispondenti rispettivamente alle direzioni di polarizzazione del raggio ordinario o del raggio straordinario del cristal lo. Nei cristalli dimetrici esiste una direzione secondo la quale il cristallo si comporta come monorifrangente, poiché il raggio ordinario e il raggio straordinario si sovrappongono; questa di - - E.121 rezione è detta asse ottico del cristallo. Per tale motivo i cristalli dimetrici vengono chiamati "uniassici". Nei cristalli trimetrici, invece, esistono due direzioni secondo le quali i due raggi ri fratti, che qui vengono chiamati entrambi straordinari, coincidono; si hanno cioè due assi ottici e perciò questi cristalli vengono chiamati "biassici". Di solito i due raggi rifratti sono così vicini che non sono facilmente distinguibili. Solo in alcuni casi, per esempio nello spato di Islanda, ossia il cristallo di calcite (CaCO 3) e nel cristallo di quarzo (SiO2) il fenomeno è evidente. Entrambi appartengono al gruppo dimetrico e sono quindi uniassici. La calcite cristallizza in romboedri come mostrato nella figura 14. Tutte le facce sono parallelogrammi con angoli di 78° e 102°. Tutti i vertici tranne due contengono entrambi i tipi di angoli. Due vertici meno acuti degli altri contengono solo angoli di 102°. In un cristallo ta gliato in modo da avere le facce uguali i due vertici meno acuti sono uniti da un asse di simme tria che è l’asse ottico. In questa direzione il cristallo appare simmetrico e quindi apparentemente isotropo. Tutte le altre direzioni sono asimmetriche e il cristallo è anisotropo lungo di esse. Figura 14. Cristallo di calcite romboedrica con indicato un vertice meno acuto, l'asse ottico e il cubo di riferimento (tratteggiato). Le facce superiore e inferiore del cubo di riferimento sono co planari con le facce del romboedro. L’anisotropia si manifesta con la presenza di due indici di rifrazione. Quando un oggetto vicino, come un piccolo foro in un cartoncino, è osservato attraverso un rombo di calcite, si ve dono due immagini e ruotando il rombo intorno alla direzione di osservazione un’immagine resta ferma mentre l’altra si muove attorno ad essa. La linea che congiunge le due immagini è sem pre parallela alla direzione dell’asse ottico. Se i vertici “piatti” sono tagliati da facce piane in modo che sia possibile osservare un oggetto lungo la direzione dell’asse ottico, si osserverà un sola immagine perché non si ha doppia rifrazione della luce che viaggia lungo l’asse ottico. Misurando gli angoli di rifrazione dei raggio ordinario e del raggio straordinario per differenti angoli di incidenza troviamo che sen i / sen i’ è costante per il raggio ordinario ma varia per il raggio straordinario. Se ne conclude quindi che la velocità della luce e l’indice di rifrazione del cristallo sono costanti in tutte le direzioni per il raggio ordinario ma differiscono in differenti dire zioni per il raggio straordinario. Solo lungo l’asse ottico del cristallo le due velocità sono uguali. Il principio di Huygens, con gli sviluppi attuati da Fresnel, può essere utilizzato per spiegare la propagazione dei fronti d’onda nei mezzi anisotropi. In cristalli uniassici come la calcite il fronte d’onda associato al raggio ordinario è costruito mediante onde secondarie che hanno la stessa velocità in tutte le direzioni; si tratta quindi di onde sferiche. Per i raggi straordinari le onde secondarie sono ellissoidi di rivoluzione che coincidono con le sfere delle onde secondarie ordinarie lungo l’asse ottico, dove le loro velocità sono uguali. La figura 15 mostra però che la - E.122 velocità del raggio straordinario può essere maggiore o minore di quella del raggio ordinario, dando luogo, come è mostrato dalla figura, a cristalli uniassici positivi o negativi. Nella figura 16 è mostrata la forma generale (sfera-ellissoide) dell’onda secondaria di un cristallo uniassico positivo. La figura mostra anche la forma dell’onda secondaria per un cristallo biassico, ossia per un cristallo che ha due assi: si tratta di ellissoidi con due distorsioni. L’ellissoide interno è schiacciato verso l’esterno mentre l’ellissoide esterno è deformato in modo che i punti di coincidenza siano nello stesso piano che contiene gli assi ottici, anche se non coincidono con essi perché gli assi ottici definiscono identiche velocità e direzioni. Normalmente non vengono utilizzati cristalli fortemente biassici e non ne tratteremo qui. Figura 15. Sezioni di onde secondarie per un cristallo uniassico. Figura 16. Onde secondarie per un cristallo uniassico e per un cristallo biassico. - E.123 - Figura 17. Costruzioni di Huygens per il fronte d'onda ordinario (o) e per il fronte d'onda straordinario (e) e direzioni dei raggi. Nella figura 17 è mostrato un fascio di raggi di luce paralleli che incidono su una faccia di un cristallo di calcite, con l’asse ottico nel piano del foglio. Quando un fronte d’onda piano incontra la superficie AD, onde secondarie come quelle descritte sopra viaggiano nel cristallo a partire da ogni punto della superficie; nella figura sono mostrate quelle che si originano in A e in D. I fronti d’onda rifratti della luce ordinaria M oNo e PoQo sono tangenti alle sfere, mentre quelli della luce straordinaria MeNe e PeQe sono tangenti agli ellissoidi. Si vede che, in questo caso, i due insiemi di fronti d’onda sono paralleli l’uno all’altro, ma i raggi del fascio straordinario non sono perpendicolari ai fronti d’onda, e possono non giacere nel piano di incidenza; il raggio straordinario è quindi deviato dalla normale. I raggi del fascio ordinario sono perpendicolari ai fronti d’onda come in un mezzo isotropo. Altri esempi con la luce incidente che raggiunge la superficie con vari angoli di incidenza possono essere risolti con costruzioni grafiche simili. E’ ovvio che quando la luce incide nella direzione dell’asse ottico il raggio ordinario e il raggio straordinario coincidono, dato che la sfera e l’ellissoide sono in contatto proprio in questa direzione. - E.124 - Figura 18. Costruzione di Huygens per asse ottico perpendicolare al piano di incidenza. Si ha un caso importante quando l’asse ottico è perpendicolare al piano di incidenza e parallelo alla faccia del cristallo. Nella costruzione grafica che si riferisce a questo caso (figura 18), dato che l’asse ottico è perpendicolare al piano del foglio, le sezioni sia delle onde elementari ordinarie sia di quelle straordinarie saranno delle circonferenze. Quindi, in questo piano, la velocità della luce straordinaria è la stessa in tutte le direzioni, e il valore sen i / sen i’ è costante. Per questa ragione l’indice di rifrazione ne di un cristallo per il fascio straordinario è definito come il rapporto tra la velocità della luce in aria e la velocità del raggio straordinario in un piano perpendicolare all’asse ottico. I valori per gli indici di rifrazione per i raggi ordinari e quelli straordinari per la riga D per alcuni tra i più importanti tra i cristalli uniassici sono dati nella tabella 1. La birifrangenza lineare di un cristallo uniassico è definita come la differenza tra gli indici di rifrazione straordinario e ordinario, ne – no. Pochi tra i cristalli che si trovano in natura hanno una birifrangenza lineare maggiore di quella della calcite (negativa). Tabella 1. Indici di rifrazione per cristalli birifrangenti no Cristalli positivi Quarzo Ghiaccio Mica (leggermente biassica) Cristalli negativi Calcite Tormalina Nitrato di sodio ne 1,5442 1,309 1,561 1,5533 1,313 1,594 1,6585 1,669 1,5874 1,4864 1,638 1,5461 6. Prismi polarizzatori Come è mostrato nella figura 13, i due fasci emergenti di luce sono polarizzati linear mente in direzioni ortogonali. Il raggio ordinario ha la direzione di oscillazione sempre perpendicolare all’asse ottico. Il piano di vibrazione del raggio straordinario, invece, contiene il raggio tra- - E.125 smesso e l’asse ottico. Questo piano è detto sezione principale (le figure 13 e 17 sono sezioni principali). La polarizzazione è totale, ossia ciascuno dei due fasci è totalmente polarizzato linearmente. Anche nel caso dell’elevata birifrangenza lineare della calcite, l’angolo tra i due raggi non è molto grande e quindi è necessario qualche accorgimento addizionale per separarli. William Nicol nel 1828 ricavò da un cristallo di calcite un prisma polarizzatore eliminan do per riflessione totale uno dei due raggi rifratti. Nicol non riuscì mai a capire come funzionas se il suo dispositivo. Egli tagliò le basi del cristallo naturale di calcite con un angolo di 68°. Divise poi il cristallo in due parti uguali lungo un piano perpendicolare alla sezione principale. Ottenne così due prismi triangolari con un angolo retto. Incollò poi tali parti con del balsamo del Ca nadà, che ha un indice di rifrazione maggiore di quello del raggio straordinario e minore di quello del raggio ordinario. Se si fa incidere il raggio ordinario sulla superficie del balsamo con un angolo uguale o superiore all'angolo limite, esso viene totalmente riflesso, ed emerge quindi dal prisma solo il raggio straordinario (figura 19). Il prisma di Nicol è molto usato in quanto l'intensità della luce polarizzata uscente raggiunge anche valori del 45% dell'intensità della luce incidente. luce incidente non polarizzata raggio straordinario polarizzato raggio ordinario Figura 19. Il prisma di Nicol agisce come polarizzatore separando il raggio ordinario dal raggio straordinario in una coppia di cristalli birifrangenti. Il prisma di Glan-Taylor utilizza lo stesso principio, ma con le due componenti orientate in modo differente, in modo che il raggio incidente e il raggio straordinario uscente sono entrambi perpendicolari alle facce di entrata e di uscita del prisma (figura 20). E' particolarmente efficace nel trasmettere il raggio polarizzato nella direzione del raggio straordinario perché il fascio di luce passa attraverso le basi dei due prismi con un angolo di incidenza vicino all'angolo di Brewster. Figura 20. Prisma di Glan-Taylor. Con A è indicata la direzione dell'asse ottico. Nel prisma di Glan-Taylor i due prismi componenti sono disposti con gli assi ottici nella stessa direzione nel piano di incidenza dei raggi sulle basi del prisma. Nel prisma di GlanThompson, invece, gli assi ottici dei due prismi componenti, ancora paralleli tra loro, sono però ortogonali al piano di incidenza dei raggi (figura 21). Il prisma di Glan-Thompson ha un campo angolare maggiore di quello del prisma di Glan-Taylor. - E.126 - Figura 21. Prisma di Glan-Thompson. Con A è indicata la direzione dell'asse ottico. Il prisma di Rochon (figura 22) è un prisma di calcite incollato a un prisma di vetro che compensa la rifrazione e la dispersione del raggio ordinario nel prisma di calcite. Quindi il raggio ordinario passa attraverso il prisma senza essere deviato mentre il raggio straordinario è deviato. Figura 22. Prisma di Rochon. Con A è indicata la direzione dell'asse ottico nella componente di calcite. Anche il prisma di Wollaston a sdoppiamento di immagine utilizza due prismi componenti disposti in modo che entrambi i raggi sono trasmessi, ma i due prismi componenti sono entrambi di calcite, con gli assi ottici ortogonali tra loro in modo da rendere massimo l'angolo tra i due raggi all'uscita dal prisma (figura 23). La prima componente del prisma è ricavata da materiale birifrangente in modo che l’asse ottico sia parallelo alla superficie di incidenza AC e giaccia nella sezione del prisma, mentre il secondo componente del prisma ha l’asse ottico parallelo alla superficie di uscita ma perpendicolare all’asse ottico del primo componente. Figura 23. Prisma polarizzatore di Wollaston a sdoppiamento di immagine. I raggi sono designati in relazione al secondo prisma. Entrando nel primo prisma la luce si divide in un raggio ordinario e un raggio straordinario, che viaggiano lungo lo stesso percorso ma con velocità differenti, dato che hanno differenti indici di rifrazione. Quando raggiungono la superficie inclinata, che deve essere ben incollata o in ottimo contatto ottico per evitare che si abbia riflessione totale, la qualifica dei due raggi cam bia. Poiché gli assi ottici dei due prismi sono perpendicolari l’un l’altro, il raggio ordinario del pri- - E.127 mo prisma diventa il raggio straordinario del secondo prisma, e viceversa. Perciò un raggio vede una superficie di separazione tra no e ne, mentre l’altro raggio vede una superficie di separazione tra ne e no. Quindi un raggio è rifratto verso la normale alla superficie di separazione, mentre l’altro raggio è allontanato dalla normale. Ciascun raggio subisce poi un’altra rifrazione alla superficie di uscita. In questo modo si ottiene una considerevole separazione angolare tra i due raggi, mentre la dispersione in un prisma è praticamente annullata da quella nell’altro prisma. Prismi di questo genere sono stati usati per sdoppiare l’immagine in strumenti di misura, nei quali il fatto che la luce sia polarizzata (come nella figura 23) non ha importanza; per esem pio nel cheratometro o oftalmometro di Javal-Schoitz. 7. Lamine ritardanti Il primo componente del prisma di Wollaston è un cristallo birifrangente tagliato con la superficie di incidenza parallela all’asse ottico. In questa direzione il cristallo presenta la massi ma differenza tra gli indici di rifrazione del raggio ordinario e del raggio straordinario e, quindi, tra le velocità della luce e le fasi. Se si taglia in questa direzione una lamina a facce piano-parallele di cristallo, i due raggi emergono senza cambiamento di direzione ma con uno dei due raggi ritardato rispetto all’altro. Se ii fascio incidente non è polarizzato non ne deriva nessun effetto, poiché la somma di due oscillazioni casuali continua ad essere casuale. Se invece il raggio incidente è polarizzato linearmente, i due raggi emergenti saranno coerenti ma il vettore campo elettrico di uno sarà ritardato rispetto a quello dell’altro. In queste condizioni si ha interferenza tra i due raggi. La luce emergente che ne risulta dipende dalle am piezze relative e dalle fasi relative del raggio ordinario e del raggio straordinario. L’ampiezza re lativa dipende dall’orientamento del piano di oscillazione del fascio incidente rispetto all’asse ot tico del ritardatore, e la fase relativa ∆ϕ dipende dalla differenza di indice di rifrazione e dallo spessore t della lamina ritardatrice: = 2 n o −n e t o (22) dove λ0 è la lunghezza d’onda nel vuoto e no e ne sono gli indici di rifrazione rispetto al vuoto. Nella maggior parte dei casi il risultato sarà un’ellisse, e infatti la luce polarizzata ellitticamente può essere considerata come la forma generale della luce polarizzata, mentre la luce polarizzata linearmente e la luce polarizzata circolarmente sono casi particolari. L’ultimo caso (luce polarizzata circolarmente) si ha quando le ampiezze sono uguali e la differenza di fase relativa è 90°, ossia π/2. Una lamina ritardante di questo spessore è detto lamina al quarto d’onda: =n o −n e t 4 (23) Chiaramente non è possibile realizzare una semplice lamina ritardante che sia una lamina al quarto d’onda per tutte le lunghezze d’onda. La figura 24 mostra come la forma della polarizzazione cambia man mano che la luce passa attraverso una lamina ritardatrice per luce incidente polarizzata con direzione di oscilla zione a 45° rispetto all’asse ottico (in modo da avere componenti uguali) e a 30°. Si vede che una lamina di spessore doppio produce luce polarizzata linearmente con una orientazione differente. Una tale lamina a mezz’onda introduce una differenza di fase di 180° tra le componenti e quindi per ogni orientazione rispetto all’asse ottico il fascio emergente avrà orientazione capo volta, come è mostrato nella figura. La luce polarizzata circolarmente può essere prodotta a partire da luce non polarizzata montando un polarizzatore lineare davanti a una lamina al quarto d’onda con il piano di trasmissione delle oscillazioni a 45° rispetto all’asse ottico della lamina. Una combinazione di questo tipo si dice polarizzatore circolare; ovviamente lavora con luce incidente su una sola delle sue facce. - E.128 - Figura 24. Passaggio della luce polarizzata attraverso una lamina ritardatrice: (a) direzione di oscillazione a 45° rispetto all'asse ottico; (b) direzione di oscillazione a 30° rispetto all'asse otti co. vibrazione straordinaria polarizzatore asse ottico 45° vibrazione ordinaria lamina di cristallo birifrangente Figura 25. Lamina a mezz’onda: una lamina di cristallo birifrangente è utilizzata per variare di 90° la direzione di polarizzazione di un fascio di luce polarizzata. Se su una lamina di cristallo incide luce polarizzata con direzione di polarizzazione parallela o perpendicolare all’asse ottico del cristallo essa si trasmette nel cristallo rispettivamente solo come raggio straordinario o come raggio ordinario, e lo attraversa senza che venga variata la sua direzione di polarizzazione. Ma se su una lamina a mezz'onda incide luce polarizzata con direzione di polarizzazione inclinata di 45° rispetto all’asse ottico, essa si suddivide nel cristallo in un raggio ordinario e in un raggio straordinario di uguale intensità, che emergono con uno sfasamento mutuo di 180°: la direzione di polarizzazione della luce che emerge dal cristallo risulta quindi variata di 90° rispetto alla direzione di polarizzazione della luce incidente, come mostra la figura 25. Anche materiali plastici come il cellofan sono birifrangenti. Due polaroid incrociati, illuminati da luce bianca dal retro, risultano oscuri, perché la luce polarizzata dal primo polaroid viene assorbita dal secondo. Ma se tra i due polaroid viene inserito un sottile foglio di cellofan trasparente, si osservano in trasparenza figure colorate, perché il cellofan ruota il piano di polarizzazione della luce, che viene quindi in parte trasmessa dal secondo polaroid. A seconda del suo - E.129 spessore, il foglio di cellofan si comporta come una lamina a mezz’onda per la luce di una determinata frequenza, corrispondente al colore trasmesso. 8. Applicazioni della luce polarizzata L’applicazione più comune della luce polarizzata è costituita dagli occhiali da sole polarizzatori ed è già stata considerata nei paragrafi precedenti. La polarizzazione per riflessione può essere utilizzata anche per lo studio delle superfici, in particolare nel caso di materiali che possono essere lucidati otticamente. La riflessione di luce polarizzata linearmente o circolarmente è accompagnata da un cambiamento di fase delle componenti che dà un fascio riflesso polarizzato ellitticamente. Sono usati strumenti chiamati ellissometri che possono misurare effetti di superficie corrispondenti a spessori pari a una piccola frazione di lunghezza d’onda. Molti tessuti organici hanno proprietà polarizzanti e per studiarli si usano microscopi a polarizzazione. Non sono molto differenti da un microscopio ordinario tranne che per la possibilità di montare un polarizzatore e un analizzatore su supporti girevoli. Le lenti devono essere particolarmente esenti da tensioni interne. Se una lastra di normale vetro isotropo viene compressa agisce come un cristallo uniassico negativo. L’asse ottico è nella direzione della tensione. Ciò significa che per luce incidente perpendicolarmente a questa direzione il vetro agisce come una lamina ritardante. Questa birifrangenza indotta dalla tensione è detta fotoelasticità. Nella maggior parte dei casi si trova che la birifrangenza è proporzionale alla tensione, e la costante di proporzionalità viene detta coefficiente di tensione ottica. L’effetto polarizzatore di una tensione può essere messo in evidenza ponendo il materiale tra due polarizzatori lineari, o tra due polarizzatori circolari. Nella progettazione di strutture meccaniche o edili possono essere costruiti modelli che poi vengono caricati in modo da osservare la distribuzione delle tensioni interne. Un metodo simile può essere utilizzato con il vetro ottico per verificare l’assenza di tensioni interne che si ha in caso di buona omogeneità e di iso tropicità. D’altra parte il vetro, che è molto resistente alla compressione, può essere rafforzato generando zone di tensione e di compressione in modo che la regione di compressione corrisponde a tutta la superficie mentre la parte centrale è in tensione. Ciò può essere ottenuto sia raffreddando rapidamente la parte superficiale con un getto di aria fredda, sia con metodi chimici. L’occhio umano può rilevare la luce polarizzata. Ciò fu notato per la prima volta nel 1844 da Haidinger e il fenomeno è noto come spazzole di Haidinger. Quando un foglio di materiale polarizzatore è tenuto tra l’osservatore e uno sfondo uniforme bianco, e il foglio polarizzatore è ruotato rapidamente di 90°, appare una debole immagine gialla con la forma di due coni uniti per le punte, con un angolo di circa 2°. L'orientazione dell'immagine, che scompare nel giro di pochi secondi, dipende dal piano di oscillazione del polarizzatore. Si ha un effetto simile ma più debole con la luce polarizzata circolarmente. L'immagine è gialla perché il fenomeno è limitato alla luce blu: se questa è eliminata con un filtro, l'immagine non appare. Il fenomeno dell'attività ottica consiste nel fatto che alcuni materiali hanno la proprietà di ruotare il piano di polarizzazione di un'onda monocromatica incidente polarizzata linearmen te. Per misurare l'attività ottica si fa uso del polarimetro, che è costituito da un polarizzatore e un analizzatore distanziati in modo da poter porre tra di essi la sostanza da analizzare. Prima di introdurre la sostanza da analizzare si pongono il polarizzatore e l'analizzatore incrociati, in modo che non vi sia luce all'uscita dello strumento. Se quindi si pone fra i due il campione da esaminare, otteniamo una certa luminosità che scompare di nuovo se si ruota l'analizzatore di un angolo opportuno. E' evidente che la sostanza introdotta ha fatto ruotare il piano di polarizza zione della luce su di essa incidente. Se si assume come misura dell'attività ottica l'angolo α di cui si è dovuto ruotare l'analizzatore per ripristinare le condizioni iniziali. Per le soluzioni vale la legge di Biot: α = ρcl (24) - E.130 dove si è indicato con ρ il potere rotatorio, ossia l'angolo di rotazione che si ottiene per uno spessore unitario, con c la concentrazione e con l lo spessore dello strato di soluzione attraversato dalla luce. Per le sostanze solide l'attività ottica è data semplicemente dalla relazione α = ρl (25) Secondo la teoria di Fresnel, questo fenomeno può essere spiegato considerando un'onda polarizzata linearmente come la risultante di due onde polarizzate circolarmente, i cui rispettivi vettori ottici ruotano, in un mezzo isotropo, l'uno in senso contrario dell'altro con la stessa velocità, in modo che il vettore risultante vibri sempre nello stesso piano. Le sostanze otticamente attive ritardano uno dei due vettori ruotanti, rispetto all'altro, per cui all'uscita si ha in generale una variazione del piano di polarizzazione dell'onda risultante. Ciò è dovuto a caratteristiche strutturali di tali sostanze. Per ogni sostanza il potere rotatorio dipende dalla lunghezza d'onda ed è approssimativamente proporzionale a λ-2. Con luce bianca, quindi, si ha estinzione per ogni data posizione dell'analizzatore solo per una lunghezza d'onda, e si osserva luce di differenti colori man mano che viene ruotato l'analizzatore. Alcuni materiali sono sia birifrangenti sia otticamente attivi (per esempio il quarzo), altri sono birifrangenti senza essere otticamente attivi (per esempio la calcite), altri ancora sono otticamente attivi senza essere birifrangenti (per esempio le soluzioni zuccherine). La rotazione può essere positiva o negativa, a seconda che l'analizzatore debba essere ruotato in senso antiorario o orario per un osservatore che guarda attraverso di esso verso il polarizzatore. Esercizi 1. Spiegare che cosa si intende per luce polarizzata linearmente e descrivere due metodi con cui può essere prodotta. 2. Mostrare che, quando i + i' = 90°, tg i = n. Qual è la differenza tra la luce incidente e la luce riflessa per questo particolare angolo di incidenza? 3. Usando le leggi della riflessione di Fresnel disegnare le curve che mostrano la variazione dell'intensità della luce riflessa con la variazione dell'angolo di incidenza quando la luce è riflessa dalla superficie di un mezzo con indice di rifrazione 1,6, per oscillazioni che hanno luogo (a) parallelamente e (b) perpendicolarmente al piano di incidenza. Dalle curve determinare l'angolo di polarizzazione. 4. L'angolo di incidenza di un fascio di raggi di luce bianca paralleli sulla superficie piana lucidata di un blocco di vetro con indice di rifrazione 1,760 è 60° 24'. Qual è l'angolo tra il fascio riflesso e il fascio rifratto nel vetro? Spiegare in dettaglio tutte le differenza che si hanno nella natura della luce incidente, riflessa e rifratta. 5. Spiegare che cosa si intende per "angolo di polarizzazione" quando ci si riferisce alla luce incidente dall'aria sulla superficie di una lamina piana di vetro. Mostrare che se l'in dice di rifrazione della lamina è n la tangente dell'angolo di polarizzazione è uguale a n. 6. Quando vengono usate lenti polarizzatrici negli occhiali da sole, sono orientate in modo da ricevere la luce polarizzata in una particolare direzione. Quale direzione viene normalmente scelta e perché? 7. Una persona usa un pezzo di polaroid per minimizzare i riflessi provenienti dalla superficie calma di un lago. A che angolo di vista rispetto alla superficie ottiene la migliore estinzione dei riflessi? 8. Spiegare che cosa si intende per lamina al quarto d'onda. Se gli indici di rifrazione della mica sono 1,561 (ordinario) e 1,594 (straordinario), quale deve essere lo spessore di - E.131 una lamina di mica per ottenere una lamina al quarto d'onda per la luce di una lampada al sodio (λ = 589 nm)? 9. (a) Spiegare come può essere prodotta luce polarizzata circolarmente con una lamina al quarto d'onda. (b) Spiegare come può essere usata una lamina a mezz'onda per ottenere una rotazione determinata qualsiasi del piano di oscillazione della luce polarizzata linearmente. 10. Un fascio di luce polarizzata linearmente di lunghezza d'onda 540 nm incide normalmente su una sottile lamina di quarzo tagliata in maniera tale che l'asse ottico giaccia sulla sua superficie. Se gli indici di rifrazione del raggio ordinario e del raggio straordinario sono rispettivamente 1,544 e 1,553, trovare per quale spessore della lamina la differenza di fase tra il raggio ordinario e il raggio straordinario è π rad all'uscita dalla lamina. 11. Due polaroid incrociati di 45° vengono illuminati con un fascio di luce non polarizzata che ha un’intensità di 0,50 W/sr. Qual è l’intensità del fascio di luce che emerge dai po laroid? 12. Un polaroid viene esposto alla luce solare. Di che angolo deve essere ruotato un secondo polaroid posto dietro di esso perché la l’intensità della luce trasmessa sia ridotta al 10 per cento di quella della luce incidente? 13. Un raggio di luce non polarizzata viene fatto incidere sulla superficie di un cristallo di vetro flint con indice di rifrazione assoluto pari a 1,605. Quale deve essere l’angolo di incidenza, perché il raggio riflesso sia completamente polarizzato? 14. Un raggio di luce non polarizzata incide su una superficie di vetro con un angolo di incidenza di 60° 35’. Un polaroid è posto, con l’asse di polarizzazione parallelo al piano di incidenza, sul percorso del raggio riflesso, che viene completamente assorbito. Qual è l’indice di rifrazione del vetro? 15. Un raggio di luce non polarizzata incide su una superficie di un recipiente contenente acqua (indice di rifrazione 1,33). Un polaroid è posto all’interno dell’acqua, con l’asse di polarizzazione perpendicolare al piano di incidenza, sul percorso del raggio rifratto, che viene completamente assorbito. Qual è l’angolo di incidenza? 16. Tre polaroid uguali, ciascuno in grado di produrre luce totalmente polarizzata, sono di sposti lungo il percorso di un raggio di luce con un angolo di 30° tra gli assi di polarizzazione del primo e del secondo e di altri 30° tra gli assi di polarizzazione del secondo e del terzo. Di quanto risulta ridotta l’intensità della luce che emerge dal terzo polaroid? 17. Un fascio di luce non polarizzata incide su un polaroid che è in grado di ridurre solo del 50 per cento l’ampiezza delle onde luminose con direzione di oscillazione perpendicolare al suo asse di polarizzazione. Di quanto risulta ridotta l’intensità della luce che emer ge dal polaroid? 18. Quale deve essere lo spessore di un cristallo di calcite (indice di rifrazione per il raggio ordinario 1,66, per il raggio straordinario in direzione perpendicolare all’asse ottico 1,49) perché possa funzionare come lamina a mezz’onda per la luce emessa da una lampada al sodio con lunghezza d’onda di 589 nm? - E.107 - O - IL MODELLO ELETTROMAGNETICO DELLA LUCE 1. La natura elettromagnetica della luce Intorno alla metà del XIX secolo la teoria ondulatoria della luce era ormai accettata da tutti i fisici. Il contributo decisivo per l'accettazione della teoria fu dovuto a Thomas Young (17731829), che osservò per la prima volta l'interferenza tra i fasci di luce prodotti da due fenditure sottili e spiegò i colori osservati nelle pellicole sottili, e a Agustin Fresnel (1788-1827), che sviluppò la teoria della diffrazione e ipotizzando che la luce fosse costituita da onde trasversali riu scì a spiegare tutti i casi di polarizzazione della luce. Si era riusciti a misurare anche la velocità di propagazione delle onde luminose, che nel vuoto risultava pari a 3,00 × 108 m/s. Non era chiaro, a questo punto, quale fosse la natura di queste onde, capaci di propagarsi anche nello spazio vuoto. Nello stesso periodo erano stati studiati, da scienziati come Coulomb, Öersted, Ampere e Faraday, tutti i fenomeni elettrici e magnetici fondamentali. E' a questo punto che si inserisce l'opera di James Clerk Maxwell (1831-1879), il fisico scozzese che riuscì a sintetizzare tutto l’elettromagnetismo in un’unica teoria espressa da un sistema di semplici formule matematiche. Maxwell riuscì a riassumere tutta la teoria del campo elettrico e del campo magnetico in un sistema di quattro equazioni note come equazioni di Maxwell. Le equazioni di Maxwell mostrano che nel caso di fenomeni dipendenti dal tempo non è possibile considerare il campo elettrico e il campo magnetico come entità indipendenti l’una dall’altra, ma si deve parlare piuttosto di campo elettromagnetico. Il sistema di equazioni proposto da Maxwell era basato su alcune intuizioni che avevano un carattere ipotetico, e sarebbe rimasto tale se non fosse stato confermato, come effettivamente avvenne, da adeguate verifiche sperimentali. Maxwell dedusse una conseguenza molto importante dalle sue equazioni: una perturbazione del campo elettrico o del campo magnetico si propaga nello spazio sotto forma di onde trasversali. Maxwell ricavò anche la velocità v di propagazione di queste onde elettromagnetiche, dimostrando che essa risulta legata alle costanti caratteristiche del campo elettromagnetico (la costante dielettrica ε e la permeabilità magnetica µ) dalla relazione 1 v= (1) εµ Nel vuoto si ottiene un valore: 1 ε 0µ 0 = 1 8,85 × 10 − 12 2 −1 C N m −2 × 4π × 10 −7 NC −2 2 s = 3,00 × 10 8 m/s Quindi, la velocità di propagazione delle onde elettromagnetiche nel vuoto è uguale alla velocità della luce! (Le unità di misura delle due costanti ε0 e µ0, indicate esplicitamente nella formula, mostrano che, effettivamente, il risultato dell’espressione (1) ha le dimensioni di una velocità.) Quando Maxwell sviluppò, tra gli anni 1862 e 1864, la teoria delle onde elettromagneti che, era già stata misurata con sufficiente precisione la velocità della luce nel vuoto. Come abbiamo visto, dallo studio dei fenomeni di interferenza e diffrazione si conosceva la natura ondu latoria della luce, e il fenomeno della polarizzazione della luce aveva anche indicato che le onde di cui la luce è costituita sono onde trasversali. La coincidenza tra il valore della velocità della luce nel vuoto e la velocità delle onde elettromagnetiche rendeva allora naturale ipotizzare che la luce fosse costituita da onde elettromagnetiche. Maxwell predisse anche che dovessero esistere onde elettromagnetiche di frequenza molto inferiore e molto superiore a quella della luce, come effettivamente, negli anni successivi, si poté verificare. - E.108 Non dimostreremo le equazioni di Maxwell, perché ciò richiederebbe un'esposizione piuttosto dettagliata dei principi di elettricità e di magnetismo che esula dai nostri scopi e può essere trovata altrove. Mostreremo solo alcune delle caratteristiche principali delle onde elettromagnetiche. Come abbiamo visto, le onde elettromagnetiche sono costituite da oscillazioni del cam po elettrico e del campo magnetico che si propagano nello spazio. Il vettore campo elettrico E e il vettore induzione magnetica B corrispondenti a queste oscillazioni non sono indipendenti tra loro, ma sono legati da alcune importanti relazioni: 2 (a) Il vettore campo elettrico E e il vettore induzione magnetica B di un’onda elettromagnetica sono perpendicolari alla direzione di propagazione dell’onda: l’onda elettromagnetica è quindi un’onda trasversale. (b) Il vettore campo elettrico E e il vettore induzione magnetica B di un’onda elettromagnetica sono perpendicolari tra loro. Il verso di questi vettori può essere ricavato con la "regola della mano destra": risulta infatti tale che, posto il pollice della mano destra nella direzione del campo elettrico E e l’indice nella direzione del campo magnetico B , il medio indica il verso di propagazione dell’onda (figura 1). B E Figura 1. Direzione di propagazione di un’onda elettromagnetica (in verde) e direzione e verso dei vettori campo elettrico e campo magnetico, individuati con la regola della mano destra. (c) Il vettore campo elettrico E e il vettore induzione magnetica B di un’onda elettromagnetica sono in fase: nei punti in cui il campo elettrico è nullo, è nullo anche il campo magnetico, mentre dove il campo elettrico ha un’intensità massima è massimo anche il campo magnetico. Come sappiamo dallo studio delle onde, il tipo più semplice di onda è costituito da un’onda armonica il cui profilo è dato da una funzione sinusoidale. Ricordiamo che, in generale, un’onda armonica che si propaga nel verso positivo di un asse x è espressa da una funzione A(x, t) = A0 sen (kx - ωt + ϕ0) (2) dove A0 è l’ampiezza dell’onda, k è il numero d’onda, ω la pulsazione (pari a 2 π volte la frequenza ν) e ϕ0 la costante di fase. Il numero d’onda k è legato alla lunghezza d’onda λ dalla relazione 2 Queste proprietà valgono rigorosamente per il cosiddetto “campo di radiazione”, ossia per il campo che si osserva a una distanza dalla sorgente molto più grande della lunghezza d’onda della radiazione. La configurazione del campo nelle vicinanze della sorgente (il cosiddetto “campo prossimo”) è più complessa. - E.109 - k = 2π λ (3) Ricordiamo anche che la funzione A(x, t) assume lo stesso valore ogni volta che l’argomento della funzione seno ha uno stesso valore ϕ, ossia ogni volta che kx - ωt + ϕ0 = ϕ (4) da cui si ricava x= ϕ −ϕ k 0 + ω t k (5) Questa equazione, che descrive il moto dei punti dell’onda di uguale fase, rappresenta un moto rettilineo uniforme con una velocità v data da: v = ω = λν k (6) Consideriamo allora un’onda elettromagnetica armonica che si propaghi anch’essa nel verso positivo dell’asse x di un sistema di coordinate cartesiano xyz. Per la proprietà (a) il vetto re campo elettrico E dell’onda dovrà trovarsi sempre nel piano yz perpendicolare alla direzione di propagazione dell’onda: supponiamo, per semplicità, che esso sia sempre diretto nella dire zione dell’asse y. Il vettore induzione magnetica B dell’onda, che per la proprietà (a) dovrà trovarsi anch’esso nel piano yz, per la proprietà (b) dovrà essere diretto come l’asse z. La proprietà (c) ci dice infine che la costante di fase ϕ0 che compare nelle espressioni del campo elettrico e del campo magnetico deve essere la stessa. L’espressione matematica dell’onda sarà allora data dalle due funzioni: Ey(x, t) = E0 sen (kx - ωt + ϕ0) (7a) Bz(x, t) = B0 sen (kx - ωt + ϕ0) (7b) Sappiamo che un’onda elettromagnetica di questo tipo, nella quale il vettore campo elettrico oscilla sempre nella stessa direzione, si dice polarizzata linearmente. Una sua rappresentazione è mostrata nella figura 2. - E.110 - y E z B x Figura 2. Il campo elettrico e il campo magnetico di un’onda elettromagnetica polarizzata li nearmente che si propaga nella direzione dell’asse x. Maxwell sviluppò una teoria elettromagnetica completa a partire da ipotesi che avevano giustificazioni di carattere puramente teorico. A partire da questa ipotesi arrivò a prevedere l’esi stenza di onde elettromagnetiche, e notando la coincidenza tra la velocità di propagazione della luce e quella delle onde elettromagnetiche previste dalla sua teoria, Maxwell ipotizzò che la luce fosse costituita da onde elettromagnetiche, e che dovessero esistere anche onde elettromagnetiche di frequenza minore e maggiore di quella della luce. Tutto ciò fu considerato dagli scienziati dell’epoca come qualcosa di puramente ipotetico finché nel 1887, diversi anni dopo la morte di Maxwell, il fisico tedesco Heinrich Hertz (1857-1894) non pubblicò i primi risultati dei suoi espe rimenti che confermavano l’esistenza di onde elettromagnetiche di bassa frequenza. Usando un circuito oscillante Hertz generò onde elettromagnetiche di grande lunghezza d'onda (onde radio), poté verificare che le onde elettromagnetiche così prodotte venivano riflesse da schermi metallici e riuscì a produrre onde stazionarie. Misurando la distanza tra i successivi nodi di que ste onde stazionarie ricavò la lunghezza d’onda, che risultava pari a 66 cm, e quindi anche la velocità di propagazione delle onde così generate, che risultò di 3,2 × 108 m/s, in ottimo accordo, tenuto conto delle incertezze sperimentali, con il valore della velocità della luce e con le previsioni della teoria di Maxwell. 2. Le onde radio e lo spettro elettromagnetico Molti ricercatori si dedicarono allo studio delle onde elettromagnetiche negli anni immediatamente successivi alla pubblicazione dei risultati ottenuti Hertz. L’italiano Augusto Righi (1850-1821) riuscì a produrre onde elettromagnetiche della lunghezza d’onda di 10 cm, studiandone le proprietà. Nel 1893, negli Stati Uniti, Nikola Tesla costruì il primo apparecchio radio, col legando un’antenna costituita da un filo metallico isolato a un circuito LCR oscillante. Gugliemo Marconi (1874-1937) costruì il suo primo apparecchio radio nel 1895, e negli anni successivi si dedicò a perfezionarne le caratteristiche riuscendo a realizzare, il 12 dicembre 1901, la prima trasmissione radio attraverso l’oceano Atlantico. Un’antenna è sostanzialmente un filo metallico isolato nel quale viene indotta una corrente alternata con una frequenza ν e un periodo T =1/ν. Supponiamo che a un certo istante t = 0 l’antenna sia elettricamente neutra: il campo elettrico E in un punto P posto sull’asse orizzontale dell’antenna è allora nullo (figura 3a). - E.111 - a) t = 0 E=0 P ∼ x e) t = T - + ∼ - E ∼ P P x x E d) t = 3T/4 + ∼ E=0 P b) t = T/4 x c) t = T/2 Figura 3. Il campo elettrico in un punto P sull’asse di un’antenna percorsa da corrente alternata, a intervalli di un quarto del periodo T di oscillazione. Dopo un tempo T/4 la distribuzione delle cariche elettriche nell’antenna è tale che il suo estremo inferiore è positivo mentre l’estremo superiore è negativo: l’antenna risulta equivalente a un dipolo elettrico rivolto verso il basso e nel punto P si ha un campo elettrico E diretto verticalmente verso l’alto (figura 3b). All’istante t = T/2 l’antenna è di nuovo elettricamente neutra e il campo elettrico E in P è nullo (figura 3c). Per t = 3T/4 l’estremo inferiore dell’antenna è negativo e l’estremo superiore è positivo: l’antenna è equivalente a un dipolo elettrico rivolto verso l’al to e il campo elettrico E in P è diretto verticalmente verso il basso (figura 3d). Per t = T, infine, si ritorna alla situazione iniziale (figura 3e). Si ha quindi, nel punto P, un campo elettrico E variabile nel tempo. Sappiamo però che un campo elettrico variabile nel tempo si propaga nello spazio sotto forma di onda elettromagnetica. L’andamento del campo elettrico lungo l’asse orizzontale dell’antenna assume quindi un andamento sinusoidale, e i punti dove l’intensità del campo elettrico E è massima si allontanano dall’antenna con velocità c, come mostra la figura 4. La corrente che percorre l’antenna genera in P anche un campo magnetico B le cui linee di campo sono circonferenze nel piano perpendicolare all’antenna. Anche questo campo magnetico varia al variare dell’intensità e del verso della corrente che percorre l’antenna, e il profilo del campo magnetico B si propaga anch’esso verso l’esterno con velocità c, mantenen dosi sempre perpendicolare al campo elettrico E . L’antenna produce quindi un’onda elettromagnetica che ha la stessa frequenza ν della corrente che la percorre. - E.112 - a) c ∼ b b) c a x f e ∼ direzione di propagazione dell’onda a x f d b e direzione di propagazione dell’onda d c) Figura 4. a) Andamento del campo elettrico lungo l’asse di un’antenna di dipolo; b) illustrazione schematica delle linee di flusso del campo elettrico prodotte da un’antenna di dipolo; c) configurazione del campo elettromagnetico prodotto da un’antenna di dipolo. Se una seconda antenna è raggiunta da quest’onda elettromagnetica, in essa viene indotta una corrente alternata di frequenza ν. L’intensità di questa corrente può essere rilevabile se all’antenna è collegato un circuito oscillante che abbia un’induttanza L e una capacità C tali che la frequenza caratteristica di oscillazione del circuito ν c = 1 2π LC (8) sia uguale alla frequenza ν dell’onda elettromagnetica. In un apparecchio radioricevente la frequenza caratteristica νc di questo circuito può essere variata modificando la capacità C di un condensatore variabile, in modo da poter ricevere i segnali emessi da diverse stazioni trasmittenti a differenti frequenze. Si realizza così la trasmissione e la ricezione delle onde radio. L’in tervallo di frequenze utilizzato in pratica è compreso approssimativamente tra qualche decina di kHz e qualche GHz, corrispondenti a lunghezze d’onda comprese tra circa 10 km e 10 cm, ed è suddiviso in bande utilizzate per i diversi tipi di trasmissioni come è indicato nella tabella 1. Tabella 1. Principali bande di frequenza dello spettro radio. Le frequenze di cui non è indicata l’assegnazione sono utilizzate principalmente per servizi vari e usi militari. Banda di frequenze Assegnazione 70 – 140 kHz Comunicazioni radio tra navi 150 – 280 kHz Trasmissioni radio AM onde lunghe - E.113 530 – 1600 kHz 6 – 8 MHz 47 – 68 MHz 88 – 108 MHz 108 – 117 MHz 174 – 230 MHz 470 – 862 MHz 917 – 960 MHz 1,900 – 2,025 GHz 10,7 – 12,5 GHz Trasmissioni radio AM onde medie Trasmissioni radio AM onde corte Trasmissioni TV banda I Trasmissioni radio FM Comunicazioni radio tra aerei Trasmissioni TV banda VHF Trasmissioni TV banda UHF Telefoni cellulari TACS e GSM Telefoni cellulari UMTS Trasmissioni TV da satellite È importante notare un’interessante circostanza. Le onde radio si propagano nel vuoto, come la luce, in direzione rettilinea. Ci si aspetterebbe quindi che le trasmissioni emesse da una stazione trasmittente possano essere captate da un apparecchio ricevente solo se la sua antenna “vede” l’antenna trasmittente, così come una sorgente luminosa può essere vista da un os servatore solo se non è interposto nessun ostacolo. 36.000 km Ionosfera (80-100 km) ν > 20 MHz ν < 20 MHz Figura 5. Le onde radio con frequenza inferiore a 20 MHz vengono riflesse dalla ionosfera e possono raggiungere ogni punto della superficie terrestre. Le onde radio con frequenza superiore a 20 MHz possono superare ostacoli solo mediante ripetitori posti in posizione elevata o su satelliti artificiali. La teoria prevede però che tutte le onde elettromagnetiche possano essere riflesse dalla superficie di un materiale conduttore se la densità di elettroni liberi al suo interno è sufficientemente elevata: la luce, per esempio, è riflessa da una superficie metallica. Gli strati più elevati dell’atmosfera terrestre sono ionizzati dalla radiazione ultravioletta proveniente dal Sole. La densità di elettroni liberi in questa regione, detta ionosfera, è tale che essa si comporta come un conduttore riflettente per onde elettromagnetiche di frequenza inferiore a circa 20 MHz. Le onde radio corrispondenti alle trasmissioni in modulazione di ampiezza (AM) vengono quindi riflesse dalla ionosfera e possono raggiungere ogni punto della superficie terrestre (figura 5). Le trasmissioni radio in modulazione di frequenza (FM) e le trasmissioni televisive utilizzano invece onde elettromagnetiche di frequenza più elevata e non vengono riflesse dalla ionosfera: per questo per la ricezione di trasmissioni provenienti da stazioni trasmittenti lontane è necessario l’uso di ripetitori posti su montagne elevate o su satelliti artificiali. La luce e le onde radio costituiscono solo una parte dello spettro elettromagnetico, che si estende ben oltre questi limiti, come mostra la tabella 2. La luce visibile rappresenta un piccolissimo intervallo nella gamma delle radiazioni elettromagnetiche. Aumentando la lunghezza d’onda oltre quella della luce rossa si ha prima la banda dei raggi infrarossi, poi quella delle microonde (lunghezze d’onda all’incirca tra 0,3 mm e 10 cm) e quindi quella delle onde radio (lunghezze d’onda maggiori di circa 10 cm), mentre per lunghezze d’onda inferiori a quella della luce viola si hanno prima i raggi ultravioletti, poi i raggi X (lunghezze d’onda comprese all’incirca tra 100 nm e 0,003 nm, dell’ordine delle dimensioni degli atomi), quindi i raggi γ (lunghezze d’onda inferiori a circa 0,003 nm). - E.114 Tabella 2. Lo spettro elettromagnetico Frequenza Lunghezza d’onda > 1,2 mm < 2,5 × 1011 Hz 2,5 × 1011 – 2,5 × 1013 Hz 1,2 mm – 12 µm 2,5 × 1013 – 4,4 × 1014 Hz 12 µm – 0,7 µm 4,4 × 1014 – 7,1 × 1014 Hz 0,7 – 0,4 µm 7,1 × 1014 – 3,0 × 1016 Hz 400 – 10 nm 3,0 × 1016 – 3,0 × 1019 Hz 10 – 0,1 nm < 0,1 nm > 3,0 × 1019 Hz Radio Microonde Infrarosso Visibile Ultravioletto Raggi X Raggi γ 3. Lo spettro del corpo nero Con lo sviluppo della teoria elettromagnetica risultava ormai chiaro agli scienziati della fine del XIX secolo tutto ciò che si riferisce alla propagazione della luce e a tutti i fenomeni che ne derivano: riflessione e rifrazione, interferenza e diffrazione, polarizzazione, ecc. Esistevano però ancora grosse difficoltà nell'interpretazione dell'interazione della radiazione luminosa con la materia, ossia nella spiegazione di come le onde luminose vengono prodotte dalle sorgenti luminose, e di come esse vengono assorbite dai mezzi materiali. I problemi riguardavano in particolare l'interpretazione dello spettro del corpo nero, di cui ci occuperemo in questo paragrafo, e dell'effetto fotoelettrico, a cui sarà dedicato il paragrafo successivo. La soluzione di questi pro blemi portò allo sviluppo della teoria quantistica. L’emissione e l’assorbimento della luce da parte di sostanze materiali presenta caratteristiche diverse a seconda che si tratti di corpi solidi o di gas rarefatti. Un corpo solido come un metallo, riscaldato a una temperatura sufficientemente elevata, emette radiazione luminosa con una distribuzione continua di frequenze, ossia uno spettro continuo simile a quello che, come già si sapeva dai tempi di Newton, è caratteristico della luce bianca emessa dal Sole. Se illuminato, un corpo solido opaco assorbe la radiazione luminosa di tutte le frequenze. Un gas rarefatto riscaldato o eccitato dal passaggio di una corrente elettrica, invece, emette soltanto luce ad alcune frequenze ben determinate, caratteristiche del gas in questione, e assorbe in modo efficace solo alcune di queste frequenze. Qui è bene chiarire dapprima un concetto importante: quello di spettro. Per spettro si in tende la distribuzione di intensità di energia di una radiazione in funzione della frequenza o, più comunemente, della lunghezza d'onda ad essa collegata. Gli spettri vengono poi classificati, in base alla loro origine, in spettri di emissione e di assorbimento. Entrambi possono poi essere suddivisi in vari tipi: spettri continui, se coprono tutte le lunghezze d'onda, come nel caso della radiazione luminosa emessa da un corpo caldo, o spettri a bande o a righe, se l'emissione o l'assorbimento della radiazione è limitato ad alcune lunghezze d'onda. Un corpo riscaldato a una temperatura sufficientemente elevata (600 °C o più) emette luce di colore rosso-arancio (diciamo che è “incandescente”): “irraggia” una radiazione luminosa. Il filamento di tungsteno di una lampadina, riscaldato a una temperatura di circa 3.000 °C dalla corrente elettrica che lo percorre, irraggia un’intensa luce di colore bianco-giallastro. Quanto maggiore è la temperatura di un corpo, tanto più è luminoso, con una luce di colore diverso man mano che aumenta la temperatura: la superficie del Sole, che ha una temperatura di 5.800 K, emette luce bianca. Anche i corpi che si trovano a temperature inferiori a quelle degli esempi considerati emettono radiazioni, o più precisamente onde elettromagnetiche infrarosse, che il nostro occhio non può percepire (figura 6 e 7). - E.115 - Figura 6. Le lampadine ad incandescenza emettono luce per irraggiamento da un sottile filamento di tungsteno riscaldato a circa 3.000 K per effetto Joule dal passaggio della corrente elettrica. Figura 7. In questa immagine all’infrarosso di un’automobile, in cui l’intensità dell’emissione è rappresentata con colori fittizi, appaiono evidenti, in colore giallo o rosso, le zone più calde: il cofano del motore, il radiatore e i fari, e in colore blu o verde le zone più fredde. Tutti i solidi quando sono alla stessa temperatura emettono radiazione all'incirca con lo stesso spettro continuo, che approssima il cosiddetto "spettro di corpo nero". I fisici chiamano corpo nero un corpo che assorbe tutta la radiazione elettromagnetica incidente. In pratica un corpo nero può essere costituito da una cavità realizzata in un blocco di un materiale opaco: se le pareti interne della cavità sono riscaldate a una temperatura uniforme, si ha una situazione di equilibrio nella quale tutta la radiazione emessa, che non può sfuggire dalla cavità, viene riassorbita. La radiazione presente all’interno della cavità può essere osservata attraverso un piccolo forellino, di dimensioni tali da non alterare la situazione di equilibrio presente nella cavità (fi gura 8). Lo spettro della radiazione elettromagnetica che è presente in una tale cavità, ossia la distribuzione dell’energia della radiazione per unità di lunghezza d’onda, fu misurato accuratamente per la prima volta da Otto Lummer (1860-1925) e Ernst Pringsheim (1859-1917) nel 1897 per diverse temperature comprese tra 1.000 °C e 1650 °C. Le curve da loro trovate sono mostrate nella figura 9. Il massimo dell’emissione si trova a una lunghezza d’onda λmax il cui valore è inversamente proporzionale alla temperatura assoluta T secondo la legge di spostamento di Wien: λmaxT = 2,898 × 10-3 m K (9) - E.116 La lunghezza d’onda alla quale si ha la massima emissione da parte, per esempio, di un corpo nero riscaldato alla temperatura di fusione del ferro (T = 1536 °C = 1809 K) è quindi λmax = 1,60 × 10-6 m, nella banda infrarossa dello spettro elettromagnetico, mentre per un corpo nero a una temperatura T = 5.800 K, corrispondente a quella della fotosfera del Sole, si ha λmax = 5,00 × 10-7 m, che è la lunghezza d’onda della luce verde. Figura 8. Le pareti interne di una cavità a temperatura uniforme si comportano come un corpo nero qualunque sia il materiale di cui sono composte: tutta la radiazione emessa, che non può sfuggire dalla cavità, dopo un certo numero di riflessioni viene riassorbita. Un piccolo foro permette di osservare la radiazione presente nella cavità. 2,5 infrarosso (103 W/m4) 1,5 1 visibile du/d ultravioletto 2 T = 1.650 °C T = 1.450 °C 0,5 T = 1.260 °C 0 0 500 1000 1500 2000 2500 3000 3500 4000 (nm) Figura 9. La figura mostra lo spettro, ossia la distribuzione in funzione della lunghezza d’onda λ, della radiazione elettromagnetica emessa da corpi a differenti temperature. Le due linee verticali indicano la banda della luce visibile. Si noti che l’emissione è quasi totalmente nell’infrarosso. Solo a temperature di diverse migliaia di gradi si ha una considerevole emissione di luce visibile. Diversi fisici si erano dedicati senza successo, negli ultimi anni del XIX secolo, a cerca re di spiegare lo spettro della radiazione emessa da un corpo nero basandosi sui principi della fisica classica. Il più importante tra questi tentativi fu quello che portò alla formulazione della cosiddetta legge di Rayleigh-Jeans. I due fisici inglesi John William Strutt, noto con il titolo di Lord Rayleigh (1842-1919), e James Jeans (1877-1946) calcolarono il numero di onde stazio narie monocromatiche che, per ogni intervallo di lunghezza d’onda, può stabilirsi all’interno di una cavità tridimensionale dalle pareti perfettamente riflettenti. In accordo con la teoria elettromagnetica classica, Rayleigh e Jeans ipotizzarono che le onde elettromagnetiche presenti nella cavità potessero avere qualsiasi frequenza ν e quindi qualsiasi lunghezza d’onda λ = c/ν, e che ogni onda stazionaria monocromatica presente all’interno della cavità potesse essere trattata come un oscillatore armonico. Applicarono poi alla ra diazione elettromagnetica presente nella cavità il principio di equipartizione dell’energia, che aveva già avuto successo nello sviluppo della teoria cinetica dei gas e che si riteneva potesse - E.117 essere utilizzato per descrivere qualsiasi sistema fisico in equilibrio, e ottennero così la seguente formula per la densità di energia presente all’interno della cavità per intervallo di lunghezza d’onda: du 8π kT = dλ λ4 luta. (10) In questa formula k = 1,38 × 10-23 J/K è la costante di Boltzmann e T è la temperatura asso- La formula di Rayleigh-Jeans rappresenta bene, come si vede dalle curve tratteggiate nella figura 10, l’andamento degli spettri del corpo nero per grandi valori della lunghezza d’onda. È però in completo disaccordo con quanto osservato per piccoli valori della lunghezza d’on da: la legge di Rayleigh-Jeans prevede infatti un andamento monotonicamente decrescente man mano che aumenta la lunghezza d’onda, mentre gli spettri osservati presentano un massimo e tendono quindi a zero per piccoli valori della lunghezza d’onda. 5 4,5 infrarosso 3,5 du/dλ (103 W/m4) 3 2,5 2 ultravioletto visibile 4 1,5 T = 1.650 °C T = 1.450 °C 1 0,5 T = 1.260 °C 0 0 2000 4000 6000 8000 10000 λ (nm) Figura 10. Le distribuzioni previste dalla legge di Rayleigh-Jeans (le linee tratteggiate che divergono all’infinito) confrontate con gli spettri osservati, per le stesse temperature a cui si riferi sce la figura 9. Oltre a prevedere spettri differenti da quelli osservati, la formula di Rayleigh-Jeans presenta un altro grave problema: la somma dell’energia emessa a tutte le lunghezze d’onda secondo la legge di Rayleigh-Jeans darebbe infatti un valore infinito per qualsiasi valore della tem peratura T diverso da zero, e l’energia totale irradiata nell’unità di tempo da un corpo nero sa rebbe quindi infinita. È chiaro che questa conclusione è completamente falsa. Poiché la maggior parte dell’energia dovrebbe essere irradiata a basse lunghezze d’onda, nella parte ultravioletta dello spettro elettromagnetico, i fisici iniziarono a riferirsi al fallimento della teoria classica dello spettro del corpo nero come alla “catastrofe ultravioletta”. La teoria quantistica dell’irraggiamento termico Una spiegazione dello spettro del corpo nero fu comunicata dal fisico tedesco Max Planck (1858-1947) alla Società di Fisica di Berlino il 14 dicembre 1900. Planck fece le seguenti ipotesi: - Gli atomi del corpo nero si comportano come oscillatori armonici che possono vibrare a tutte le frequenze ν. - Ogni oscillatore può emettere o assorbire radiazione elettromagnetica solo alla sua frequenza di oscillazione ν. - E.118 - Ogni oscillatore può emettere o assorbire energia sotto forma di radiazione elettromagnetica solo in quantità proporzionali alla sua frequenza ν: E = hν (11) dove h è la stessa costante di proporzionalità per tutti gli oscillatori. A queste unità discrete di energia Planck diede il nome di quanti. Le prime due ipotesi erano in accordo con quanto allora si sapeva degli atomi e con la teoria elettromagnetica di Maxwell, ma la terza ipotesi era rivoluzionaria: secondo la fisica classica, infatti, un sistema fisico può emettere o assorbire quantità qualsiasi di energia, non so lamente quantità discrete come ipotizzato da Planck. Conseguenza di questa terza ipotesi è che l’energia degli atomi del corpo nero può aumentare o diminuire solamente di quantità pari a hν, e che quindi l’energia degli atomi è quantizzata: supposto un valore minimo E = 0, essa può assumere solo i valori E0 = 0, E1 = hν, E2 = 2hν, ecc. Se, come ipotizzato da Planck, ogni quanto possiede una quantità di energia proporzionale alla frequenza, è più facile che un atomo irradi a bassa frequenza che ad alta frequenza, perché è più facile che un atomo possieda abbastanza energia per emettere un quanto a bassa frequenza che ad alta frequenza: se un atomo non possiede abbastanza energia per emettere un quanto ad alta frequenza, non può irraggiare a quella frequenza. Il numero di onde monocro matiche stazionarie che possono essere presenti all’interno della cavità risulta perciò minore di quello calcolato da Rayleigh e Jeans in misura tanto più rilevante quanto più grande è la frequenza, e quindi quanto minore è la lunghezza d’onda. Planck calcolò che la densità di energia all’interno della cavità, in ogni intervallo di lunghezza d’onda λ, risulta data dalla seguente legge du 8π hc 1 = dλ λ 5 e hc λ kT − 1 (12a) che può essere espressa anche, in funzione della frequenza ν, come: du 8π hν = dν c3 3 1 e hν kT −1 (12b) La legge di Planck corrisponde molto bene agli spettri osservati sperimentalmente, dai quali si ricava il valore della costante di Planck: h = 6,6262 × 10-34 J s. Oggi sappiamo che il metodo utilizzato da Planck per spiegare lo spettro del corpo nero non è corretto, perché basato su un modello atomico non realistico (gli atomi non si comportano come oscillatori armonici) e su una descrizione insoddisfacente della radiazione elettromagnetica. Solo molti anni dopo il problema è stato risolto in modo adeguato. La legge di Planck descrive perfettamente, però, lo spettro del corpo nero. Per questo l’ipotesi di Planck, che per la prima volta estese l’idea di atomicità, o quantizzazione, oltre che alla struttura della materia anche al l’energia, determinò lo sviluppo della meccanica quantistica, nella quale anche le altre grandezze fisiche caratteristiche del mondo microscopico risultano quantizzate. 4. L’effetto fotoelettrico L’assorbimento della radiazione elettromagnetica da parte della superficie di un metallo è accompagnato, in determinate condizioni, dall’emissione di elettroni da parte del metallo. Lo studio di questo fenomeno, detto effetto fotoelettrico, ha costituito, come ora vedremo, un passo importante nello sviluppo della teoria dei quanti. Le leggi sperimentali dell’effetto fotoelettrico La prima osservazione sperimentale dell’effetto fotoelettrico risale al 1887 quando Hertz, nel corso dei suoi esperimenti sulle onde elettromagnetiche, osservò che una scintilla scocca - E.119 più facilmente tra due elettrodi se questi sono illuminati con luce ultravioletta. L’anno successivo il fisico tedesco Wilhelm Hallwachs (1859-1922) scoprì che un metallo carico negativamente perde la sua carica elettrica se viene illuminato con luce ultravioletta, mentre l’illuminazione non ha nessun effetto su un metallo carico positivamente. La luce ultravioletta deve quindi indurre l’emissione di particelle cariche negativamente da parte della superficie del metallo. Nel 1899 il tedesco Philip Lenard (1862-1942) studiò l’effetto fotoelettrico con un dispositivo simile a quello con cui Thompson aveva scoperto l’elettrone. Il dispositivo utilizzato da Lenard è rappresentato nella figura 11. In presenza di campo magnetico la misura della corrente raccolta dall’elettrodo D al variare della differenza di potenziale ∆V presente tra il catodo C e l’anodo A permise a Lenard di determinare il rapporto q/m tra la carica elettrica e la massa delle particelle emesse: il valore ottenuto corrispondeva con quello trovato da Thomson per i raggi catodici, e ciò provava che le particelle emesse dalla superficie del metallo erano elettroni. - + A ∆V D C E B Figura 11. Schema del dispositivo utilizzato da Lenard per lo studio dell’effetto fotoelettrico. La luce ultravioletta entra nel tubo a vuoto attraverso la finestra di quarzo B e raggiunge il catodo metallico C. Gli elettroni emessi da C vengono accelerati dalla differenza di potenziale presente tra il catodo e l’anodo A, nel quale vi è un piccolo foro, e proseguono nella regione compresa nella circonferenza tratteggiata, dove può essere generato un campo magnetico in direzione perpendicolare alla direzione del foglio. D e E sono gli elettrodi di due elettroscopi che permettono di misurare il flusso di elettroni rispettivamente in presenza e in assenza di campo magnetico. In assenza di campo magnetico, invece, il dispositivo permetteva a Lenard di misurare l’energia con cui questi elettroni vengono emessi dalla superficie del catodo. La figura 12 mostra l’andamento della corrente raccolta dall’elettrodo E al variare della differenza di potenziale ∆V presente tra il catodo e l’anodo, per diverse intensità di illuminazione ma sempre con luce della stessa frequenza. Per valori positivi della differenza di potenziale ∆V (quando cioè l’anodo è positivo rispetto al catodo e gli elettroni emessi dal catodo vengono accelerati verso l’anodo) l’intensità della corrente raccolta non dipende dalla differenza di potenziale ∆V ma risulta direttamente proporzionale all’intensità dell’illuminazione: tutti gli elettroni emessi dal catodo vengono accelerati attraverso l’anodo e il loro numero aumenta, come è logico aspettarsi, aumentando l’illuminazione. Quando invece la differenza di potenziale ∆V è negativa (quando cioè l’anodo è negativo rispetto al catodo e respinge gli elettroni emessi dal catodo) solo gli elettroni con ve locità più elevata riescono a superare questo potenziale ritardante. Le curve della figura 12 mostrano che la velocità con cui gli elettroni sono emessi dal catodo è compresa tra 0 e un valore massimo vm corrispondente a un’energia cinetica Ek = ½ mvm2 = e ∆V0 (13) dove ∆V0 è detto potenziale di arresto ed e è il valore assoluto della carica elettrica dell’elettrone. Il valore del potenziale d’arresto ∆V0, e quindi quello della velocità massima vm degli elettro- - E.120 ni, non dipende dall’intensità di illuminazione, ma dipende invece dalla frequenza della luce e dal tipo di metallo di cui è composta la superficie del catodo, come mostrano le figure 13 e 14. Nel corso dei suoi esperimenti, Lenard trovò quindi che la velocità con cui gli elettroni emergono dalla superficie del metallo è compresa tra zero e un valore massimo vm, il cui valore non dipende dall’intensità della luce ma solo dalla sua frequenza e dal tipo di metallo utilizzato; se la frequenza ν della luce è minore di un valore minimo ν0 detto frequenza di soglia, che dipende dal metallo utilizzato, non si ha emissione di elettroni. Trovò inoltre che, indipendentemente dall’intensità della luce, l’effetto fotoelettrico ha un inizio praticamente istantaneo non appena il metallo viene illuminato con luce di frequenza superiore al valore minimo ν0. flusso di elettroni I3 I2 I1 -∆ V0 0 potenziale ritardante ∆V potenziale accelerante Figura 12. Flusso di elettroni in funzione della differenza di potenziale ∆V, per diverse intensità di illuminazione (i1 < i2 < I3) con luce della stessa frequenza ν. flusso di elettroni ν3 ν2 ν1 0 potenziale ritardante ∆V potenziale accelerante Figura 13. Flusso di elettroni in funzione della differenza di potenziale ∆V, per illuminazione di uguale intensità con luce di diverse frequenze ( ν1 < ν2 < ν3). - E.121 - 6 5 4 Emax 3 (eV) Sodio 2 Zinco 1 Platino 0 0 5 10 15 20 ν (1014 Hz) Figura 14. L’energia cinetica massima Emax degli elettroni emessi per effetto fotoelettrico da tre diversi metalli, in funzione della frequenza della luce incidente. Per ciascun metallo si ha una frequenza di soglia ν0 al di sotto della quale non si ha emissione di elettroni. Le esperienze compiute da Lenard furono ripetute con un’apparecchiatura perfezionata da Millikan tra il 1912 e il 1916 per verificare la teoria dell’effetto fotoelettrico che nel frattempo era stata formulata da Einstein. I risultati ottenuti da Millikan confermarono in pieno quanto già trovato da Lenard e costituirono la verifica sperimentale della correttezza delle ipotesi di Ein stein. La teoria di Einstein dell’effetto fotoelettrico Sappiamo che all’interno dei metalli è presente un “gas” di elettroni liberi, grazie ai quali è possibile il passaggio della corrente elettrica in un conduttore metallico. Per estrarre questi elettroni dalla superficie del metallo è necessario fornire ad essi una quantità di energia pari al lavoro di estrazione we, il cui valore dipende dal metallo considerato. Si potrebbe pensare che, quando un’onda elettromagnetica raggiunge la superficie di un metallo, gli elettroni lì presenti si mettano in movimento assorbendo gradualmente energia fino ad accumularne una quantità pari al lavoro di estrazione we e sfuggire quindi dal metallo. Vi sono però almeno tre caratteristiche dell’effetto fotoelettrico che non si accordano facilmente con questa spiegazione. - Se gli elettroni del metallo acquistassero gradualmente energia da onde elettromagnetiche di qualsiasi frequenza, si dovrebbe poter ottenere emissione di elettroni con luce di qualsiasi frequenza; l’effetto fotoelettrico si verifica invece solo con luce di frequenza superiore a una frequenza minima ν0. - Si dovrebbe inoltre poter ottenere emissione di elettroni con energia cinetica grande a piacere, aumentando l’intensità della luce incidente; l’energia cinetica degli elettroni emessi nell’effetto fotoelettrico è invece praticamente indipendente dall’intensità della luce incidente. - Se l’intensità della luce incidente è debole, per ottenere l’emissione di elettroni si dovrebbe attendere che questi abbiano accumulato una sufficiente quantità di energia; l’effetto fotoelettrico è invece praticamente istantaneo, indipendentemente dall’intensità della luce incidente. - E.122 La teoria dell’effetto fotoelettrico fu presentata da Einstein nel 1905. Einstein osservò che l’energia cinetica massima degli elettroni emessi da un dato metallo varia linearmente con la frequenza secondo la seguente legge, nota ora come legge fotoelettrica di Einstein: ½mvm2 = hν - we (14) In questa formula ½mvm2 è l’energia cinetica massima degli elettroni, ν è la frequenza della luce incidente, we è il lavoro di estrazione degli elettroni dal metallo e h è un coefficiente di proporzionalità il cui valore risultava uguale, entro gli errori sperimentali, a quello della costante di Planck. Einstein calcolò che in alcuni degli esperimenti eseguiti il raggio luminoso era così debole che, se la sua energia si distribuiva in modo uniforme su un fronte d’onda sferico, sarebbe ro state necessarie diverse ore perché una quantità di energia pari al lavoro di estrazione we cadesse su un singolo atomo. L’effetto fotoelettrico invece iniziava in modo praticamente istantaneo. Einstein allora ipotizzò che l’energia dell’onda luminosa non fosse distribuita uniformemente, ma fosse concentrata in quanti di luce, che furono poi chiamati fotoni, ciascuno dei quali ha un’energia E pari alla sua frequenza ν moltiplicata per la costante di Planck, allo stesso modo dei quanti ipotizzati da Planck per spiegare lo spettro del corpo nero: E = hν (11) Un fotone è praticamente simile a un proiettile che viaggia alla velocità della luce: quan do urta un elettrone, gli cede la sua energia. Se essa è maggiore del lavoro di estrazione we, ossia se la frequenza ν del fotone è maggiore della frequenza di soglia ν 0 = we h (15) allora l’elettrone può uscire dal metallo e l’energia in eccesso, pari a hν – we, si presenta come energia cinetica dell’elettrone. Se invece la frequenza del fotone è minore della frequenza di so glia ν0 e quindi la sua energia è minore del lavoro di estrazione we, non si può avere emissione di elettroni, qualunque sia l’intensità della radiazione luminosa incidente. L’ipotesi che l’energia di un raggio luminoso sia concentrata in fotoni risolve tutte le difficoltà incontrate nell’interpretare l’effetto fotoelettrico. Infatti: - l’effetto fotoelettrico si verifica soltanto se i fotoni incidenti hanno ciascuno un’energia superiore al lavoro di estrazione del metallo, e quindi una frequenza superiore alla frequenza di soglia ν0; - un aumento di intensità della luce incidente corrisponde a un aumento del numero di fotoni incidenti, ma non dell’energia di ciascuno di essi, e quindi produce un aumento del numero di elettroni emessi ma non della loro energia cinetica massima; - l’effetto fotoelettrico, infine, è istantaneo perché l’energia incidente sul metallo non è dispersa sul fronte dell’onda luminosa, ma è concentrata nei singoli fotoni. Sia Planck sia Einstein ipotizzarono l’esistenza di quanti di luce di energia E = hν. Vi è però una differenza importante tra la teoria quantistica del corpo nero di Planck e la teoria dell’effetto fotoelettrico di Einstein. Nella teoria di Planck la quantizzazione riguarda solo il momen to dell’emissione o dell’assorbimento del quanto di luce, ma non la sua propagazione. Nella teo ria di Einstein, invece, il fotone è sempre quantizzato, sia quando viene emesso o assorbito, sia durante la sua propagazione. La teoria di Einstein costituisce quindi un passo successivo, nello sviluppo della meccanica quantistica, rispetto alla teoria di Planck. - E.123 - 5. Il modello atomico di Bohr L’emissione e l’assorbimento della radiazione luminosa da parte di un gas rarefatto presenta caratteristiche distinte rispetto al caso di un corpo solido: la radiazione viene infatti emes sa e assorbita solamente a frequenze ben determinate, caratteristiche di quel particolare gas, anziché con uno spettro continuo. La scoperta di righe di assorbimento nello spettro della luce solare (figura 15) fu effettuata nel 1802 da William H. Wollaston (1766-1828) e confermata nel 1817 da Joseph von Fraunhofer (1787-1826), che osservò analoghe righe anche nello spettro di alcune stelle. A partire dal 1859, quando Kirchhoff inventò lo spettrometro a prisma, iniziò la raccolta di una grande quantità di dati sugli spettri emessi dai diversi gas ad alta temperatura. Con i dati così raccolti Kirchhoff poté stabilire una legge fondamentale relativa all’assorbimento e all’emissione di radiazione luminosa: un corpo è capace di assorbire radiazione solamente a lunghezze d’onda alle quali è anche capace di emettere radiazione. Quindi un gas a temperatura ambiente, attraversato da un’onda luminosa con uno spettro continuo, assorbe radiazione solo a lunghezze d’onda alle quali lo stesso gas, riscaldato, può emettere radiazione. Fu, come ora vedremo, il tentativo di interpretare i dati ottenuti sull’emissione e l’assor bimento della radiazione luminosa da parte dei gas che portò allo sviluppo dei modelli relativi alla distribuzione degli elettroni intorno al nucleo degli atomi. Figura 15. Spettro della luce solare con l’indicazione delle principali righe di assorbimento. Figura 16. Spettro di emissione dell’idrogeno nel visibile, con la serie di Balmer. - E.124 Lo spettro dell’atomo di idrogeno L’elemento che emette luce con lo spettro più semplice è l’idrogeno. Come mostra la figura 16, nella regione visibile il suo spettro è composto da quattro righe, a cui è stato dato il nome di Hα (a una lunghezza d’onda di 656,28 nm), Hβ (a 486,13 nm), Hγ (a 434,05 nm) e Hδ (a 410,17 nm). La spettro si estende nell’ultravioletto con altre righe a lunghezze d’onda sempre più ravvicinate. Nonostante la semplicità dello spettro emesso dall’idrogeno, si dovette attendere fino al 1885 perché lo svizzero Johann Jakob Balmer (1825-1898) scoprisse che le lunghezze d’onda delle diverse righe osservate sono legate da una relazione semplice 1 1 1 = RH 2 − 2 λ 2 n (16) dove RH è una costante, chiamata costante di Rydberg, il cui valore è pari a RH = 1,09677 × 107 m-1, mentre n è un numero intero che assume i valori 3, 4, 5, 6,… per le successive righe Hα, Hβ, Hγ, Hδ,… dello spettro. Si scoprirono poi, in altre bande spettrali, altre serie di righe nello spettro di emissione dell’idrogeno, corrispondenti a una legge più generale della forma 1 1 1 = RH 2 − 2 λ n m (n > m) (17) 1 visibile ultravioletto dove m è un altro numero intero minore di n: Theodore Lyman (1874-1954) osservò la serie corrispondente a m = 1 (serie di Lyman) nell’ultravioletto, mentre nell’infrarosso Louis Carl Paschen (1865-1947) scoprì la serie corrispondente a m = 3 (serie di Paschen), Frederick Brackett (1896-1980) quella corrispondente a m = 4 (serie di Brackett) e Hermann Pfund (1879-1949) quella corrispondente a m = 5 (serie di Pfund). Nel caso degli atomi degli altri elementi lo spettro di emissione è più complesso, ma comunque l’inverso della lunghezza d’onda di ogni riga spettrale corrisponde alla differenza tra due termini, come nel caso dell’atomo di idrogeno. Questo fatto è noto come principio di combinazione di Ritz. infrarosso 0 0 1000 2000 3000 4000 5000 6000 7000 8000 λ (nm) Figura 17. Spettro di emissione dell’idrogeno dall’ultravioletto all’infrarosso. Le righe appartenenti alle diverse serie sono rappresentate con colori differenti: in azzurro la serie di Lyman, nell’ultravioletto; in bianco la serie di Balmer, nel visibile e nell’ultravioletto; in giallo la serie di Paschen, in arancio la serie di Brackett e in rosso la serie di Pfund, nell’infrarosso. Si noti la parziale sovrapposizione delle righe della varie serie nell’infrarosso. - E.125 Il modello di Bohr dell’atomo di idrogeno La scoperta del nucleo atomico da parte di Rutherford aveva portato a immaginare l’atomo come qualcosa di simile a un sistema planetario, con gli elettroni disposti su orbite circolari intorno al nucleo. I principi dell’elettromagnetismo classico applicati a questo modello dell’atomo, però, portavano a una grave difficoltà. Secondo la teoria elettromagnetica, un elettrone in moto su un’orbita circolare deve emettere un’onda elettromagnetica di frequenza pari alla frequenza con cui l’elettrone percorre la sua orbita. Emettendo radiazione, l’elettrone perde energia in modo continuo, e quindi il raggio dell’orbita deve diminuire: in un tempo brevissimo, dell’ordine di un miliardesimo di secondo, l’elettrone cadrebbe sul nucleo. Poiché durante questo processo cambia anche il periodo orbitale, man mano che l’elettrone si avvicina al nucleo dovrebbe cambiare la frequenza della radiazione emessa. Quindi secondo la teoria elettromagnetica classica gli atomi dovrebbero essere instabili e dovrebbero emettere radiazione elettromagnetica con uno spettro continuo, non con uno spettro a righe. Per superare questa difficoltà e spiegare lo spettro dell’atomo di idrogeno, il fisico danese Niels Bohr (1885-1962) propose nel 1913 un modello dell’atomo basato su tre ipotesi. - Esistono per gli elettroni che si muovono intorno al nucleo dell’atomo alcune orbite circolari, nelle quali essi possono rimanere per un tempo indefinito senza emettere onde elettromagnetiche. - Queste orbite sono quelle per le quali il momento della quantità di moto è un multiplo intero di h/2π, dove h è la costante di Planck. - Un elettrone può muoversi da una di queste orbite a un’altra emettendo o assorbendo energia sotto forma di un fotone di energia E = hν, dove ν è la frequenza della radiazione. Si tratta di tre ipotesi che contraddicono la teoria classica dell’elettromagnetismo. Le prime due ipotesi formulate da Bohr, per le quali si elaborò poi una base teorica, avevano l’unica giustificazione nel fatto che permettevano di dedurre correttamente lo spettro della radiazione emessa dall’atomo di idrogeno. La terza ipotesi trovava invece la sua giustificazione nei risultati ottenuti da Planck e da Einstein riguardo allo spettro del corpo nero e all’effetto fotoelettrico. Consideriamo allora un elettrone di massa m e carica elettrica –e che percorre un’orbita circolare di raggio r intorno a un nucleo di carica elettrica Ze (dove Z è il numero atomico, pari a 1 per l’idrogeno). Supponiamo che il nucleo sia fermo. Perché l’orbita sia circolare la forza elettrostatica esercitata dal nucleo sull’elettrone deve corrispondere alla forza centripeta, ossia si deve avere 1 Ze 2 mv 2 = 4π ε 0 r 2 r F = (18) e quindi il raggio r dell’orbita deve essere legato alla velocità v dell’elettrone dalla relazione r = 1 Ze 2 4π ε 0 mv 2 (19) Ricordiamo che, se si pone uguale a zero l’energia potenziale Ep del sistema costituito da due cariche elettriche q1 e q2 quando la loro distanza è infinita, per una distanza r si ha Ep = 1 q1q 2 4π ε 0 r (20) e nel caso del sistema costituito da un elettrone di carica elettrica -e e un nucleo di carica elettrica Ze - E.126 - Ep = − 1 Ze 2 4π ε 0 r (21) L’energia totale del sistema, pari alla somma dell’energia potenziale e dell’energia cinetica dell’elettrone, è allora: 1 1 Ze 2 mv 2 − 2 4π ε 0 r E = Ek + E p = (22) Sostituendo il valore di r dato dall’espressione (19) si ha: E = 1 1 Ze 2 1 mv 2 − = − mv 2 2 4π ε 0 r 2 (23) Introduciamo ora la seconda ipotesi di Bohr, ossia che il momento della quantità di moto dell’elettrone sia quantizzato. Essa si può esprimere come L = mvr = n h 2π (24) dove n è un numero intero positivo che viene detto numero quantico principale dell’elettrone. Sostituendo anche in questa espressione il valore di r dato dalla formula (19) si ricava il valore della velocità v dell’elettrone nell’ennesima orbita: v = 1 Ze 2 2ε 0 nh (25) Sostituendo poi questo valore della velocità nell’espressione (23) che fornisce l’energia dell’elettrone si trova: E = − 1 Z 2e 4 m mv 2 = − 2 8ε 02 n 2 h 2 (26) La differenza di energia tra due orbite stabili a cui corrispondono i valori n1 e n2 del numero quantico principale, ossia l’energia E = hν del fotone irradiato o assorbito quando l’elettrone compie una transizione tra le due orbite, risulta quindi pari a: Z 2 e 4 m 1 1 − 2 2 2 2 8ε 0 h n1 n 2 E 2 − E 1 = hν = (27) o, in termini dell’inverso della lunghezza d’onda λ, 1 ν Z 2 e 4 m 1 1 = = − 2 2 3 2 λ c 8ε 0 h c n1 n 2 (28) Ma questa espressione ha esattamente la stessa forma della formula (17) che fornisce la lunghezza d’onda delle righe dello spettro emesso dall’atomo di idrogeno. Il valore del termi ne costante che compare nella formula (28) è R= Z 2e 4 m 8ε 2 3 0h c ( ) = 1,09737 × 10 7 Z 2 m -1 (29) - E.127 che per Z = 1 corrisponde quasi esattamente al valore della costante di Rydberg RH ricavata dallo spettro dell’idrogeno. La corrispondenza diviene esatta se si tiene conto che l’elettrone non orbita intorno a un nucleo fermo, ma che entrambi orbitano intorno al centro di massa co mune. Se si tiene conto di ciò, la formula che esprime la costante di Rydberg per un atomo il cui nucleo ha massa M diviene infatti: R= Z 2e 4m (30) 8ε 02 h 3 c (1 + m M ) La teoria elaborata da Bohr riesce quindi a spiegare molto bene lo spettro della radiazione emessa dall’atomo di idrogeno. Anche le dimensioni degli atomi vengono previste correttamente dalla teoria. Se infatti sostituiamo nella formula (19) che fornisce il raggio r dell’orbita dell’elettrone il valore della velocità v dato dalla formula (25), otteniamo: r = 2 ε 0h2 n 2 5,29 × 10 − 11 n m = Z π e2m Z (31) Il raggio dell’orbita di minore energia (n = 1) per l’atomo di idrogeno (Z = 1) è quindi di 0,0529 nm, e corrisponde quindi molto bene alle dimensioni atomiche ricavate dal valore del nu mero di Avogadro. La formula (31) ci dice che il raggio delle orbite elettroniche aumenta proporzionalmente a n2, come è mostrato nella figura 18. Le successive orbite, a partire dalla prima, sono indicate con le lettere K, L, M, N, O, P,… P O N Lyman Balmer M Hβ Hδ Hγ Hα L Paschen K Brackett Pfund Figura 18. Schema del modello di Bohr per l’atomo di idrogeno e delle transizioni corrispondenti alle varie righe spettrali. L’emissione e l’assorbimento di onde elettromagnetiche da parte degli atomi Vediamo ora come il modello atomico di Bohr permette di spiegare l’assorbimento e l’emissione di radiazione elettromagnetica da parte degli atomi. - E.128 Il livello energetico fondamentale dell’atomo di idrogeno corrisponde all’orbita K, per la quale si ha n = 1. L’atomo di idrogeno può assorbire fotoni di frequenza corrispondente alla serie di Lyman, ossia alla formula (28) con Z = 1, n1 = 1 e n2 = 2, 3, …, e portarsi in uno stato eccitato nel quale l’elettrone si trova in una delle orbite L, M, ecc. L’atomo può anche assorbire un fotone di energia E = hν maggiore dell’energia di ionizzazione Ei che si ottiene dalla formula (26) per n2 tendente all’infinito: Ei = e 4m 8ε 02 h 2 = 2,19 × 10 − 18 J = 13,6 eV (32) In questo caso l’atomo resta ionizzato, perdendo l’elettrone che si allontana con un’energia cinetica pari a E – Ei. L’emissione di fotoni da parte dell’atomo avviene invece quando un elettrone passa da un livello energetico superiore a un livello inferiore. L’elettrone può portarsi direttamente al livello fondamentale emettendo un fotone di frequenza corrispondente a una delle righe spettrali della serie di Lyman. Se invece l’elettrone si porta al secondo livello energetico corrispondente all’orbita L, per la quale si ha n = 2, viene emesso un fotone a una frequenza corrispondente alle righe spettrali della serie di Balmer. Le transizioni ai livelli M (n = 3), N (n = 4) e O (n = 5) danno origine alle serie di Paschen, di Brackett e di Pfund. L’assorbimento e l’emissione di fotoni da parte di atomi più complessi può presentare una maggiore varietà di transizioni perché sono presenti più elettroni, ma lo schema fondamentale è lo stesso che si ha nel caso dell’atomo di idrogeno. ionizzazione E=0 E = -0,8 eV E = -1,5 eV Paschen E = -3,4 eV E = -13,6 eV Balmer Lyman n=∞ n=4 n=3 n=2 n=1 Figura 19. Schema dei livelli energetici e delle transizioni corrispondenti alle varie righe spettra li nel modello di Bohr per l’atomo di idrogeno. - E.129 - P – I LASER Col nome laser3 si indica un dispositivo che genera e amplifica energia elettromagnetica coerente (cioè monocromatica e direzionale) nella gamma delle frequenze ottiche; in altre parole è una sorgente di luce di un singolo colore, a raggi paralleli, estremamente bril lante. Il suo principio di funzionamento è del tutto analogo a quello del maser4, che storicamente è stato il precursore del laser: mentre però questo – come si è detto – funziona nella gamma delle frequenze ottiche, il maser funziona nella gamma di frequenza delle microonde. L'importanza del laser sta nell'enorme varietà di applicazioni che già ne sono state fatte o che si può ragionevolmente supporre di farne nel futuro. Scopo di questo capitolo è di dare una semplice trattazione dei laser che venga ad articolarsi nei seguenti punti: 1. principio di funzionamento dei laser, con illustrazione elementare delle leggi di tipo quantistico che ne sono alla base; 2. proprietà che caratterizzano le radiazioni laser; 3. descrizione sintetica dei vari tipi di laser e cenni storici del loro sviluppo; 4. accenno ai campi di utilizzazione dei laser. 1. Introduzione Per introdurre l'argomento dei laser è bene fare un rapido richiamo introduttivo sulla natura della luce. Sappiamo che, nel secolo diciassettesimo, sono state formulate due teorie relative alla natura della luce e cioè: 1. la teoria corpuscolare della luce, enunciata da Newton, secondo cui la luce era costituito da un insieme di piccolissime particelle emesse con grandissima velocità dai corpi luminosi e soggette alle normali leggi della meccanica; 2. la teoria ondulatoria della luce, enunciata da Huygens, secondo cui la luce era dovuta ad un moto analogo a quello che propaga il suono, cioè ad un moto vibratorio rapidissimo della sorgente luminosa che si trasmette alle particelle del mezzo circostante, propagandosi in tale mezzo per onde. Tali due teorie sono coesistite per due secoli e solo l'esperienza di Foucault del 1862, che portò alla conclusione che la velocità della luce è tanto minore quanto più un mezzo è rifrangente, diede il colpo di grazia alla teoria corpuscolare e il necessario sostegno alla teoria ondulatoria. Questa era in grado di spiegare anche il fenomeno della polarizzazione della luce, con l’ipotesi che le onde luminose non fossero, come quelle sonore, longitudinali (cioè con dire zione di vibrazione coincidente con la direzione di propagazione), ma trasversali (cioè con dire zione di vibrazione perpendicolare alla direzione di propagazione). Nel 1865 Maxwell enunciò la teoria elettromagnetica della luce, secondo cui la luce è un particolare fenomeno elettromagnetico, essendo dovuta a vibrazioni di cariche elettriche che si propagano, anche nel vuoto, sotto forma di onde elettromagnetiche (cioè onde caratterizzate da un campo elettrico e magnetico, oscillanti simultaneamente ad altissima frequenza). 3 Da «light amplification by stimulated emission of radiation», cioè «amplificazione di luce mediante emissione sti molata di radiazione». 4 Da «microwave amplification by stimulated emission of radiation». - E.130 La necessità di spiegare alcuni fenomeni, come l'effetto fotoelettrico e l'effetto Compton, hanno portato al successivo affiancamento alla teoria elettromagnetica della teoria quantistica, elaborata nel 1900 da Planck e poi perfezionata da Einstein. Secondo tale teoria, la luce irraggiata da una sorgente è dovuta a sciami di granuli luminosi, detti «fotoni» o «quanti di luce», emessi dalla sorgente stessa: tali fotoni possiedono una ben determinata quantità di energia la quale dipende dalla frequenza della radiazione luminosa e che viene dai fotoni ceduta agli elettroni dei corpi da essa colpiti. Precisamente una radiazione luminosa monocromatica, di frequenza ν, è costituita da un certo numero di fotoni aventi tutti la stessa energia: E = hν (1) dove h = 6,62 × 10-34 J s è la costante di Planck. In base alla teoria quantistica, quindi, l'energia luminosa irradiata e assorbita dai corpi non può variare arbitrariamente, ma risulta sempre uguale o multipla della quantità finita di energia associata ad un fotone, espressa dalla formula (1): in altre parole, l’irraggiamento e l'assorbimento di energia da parte degli atomi dei corpi non avviene nel modo continuo che prevede la Fisica classica, ma in modo «quantizzato». L'apparente contrasto tra la teoria ondulatoria elettromagnetica di Maxwell e la teoria quantistica di Planck ed Einstein è stato per Io meno in parte eliminato dalla meccanica ondulatoria elaborata verso il 1920 da De Broglie, il quale sostenne il duplice e inscindibile aspetto corpuscolare ed ondulatorio posseduto dai fenomeni fisici, considerati in scala atomica. Successivamente molti fisici si sono preoccupati di integrare e completare reciprocamente le due teorie ondulatorie e corpuscolari, tramite l'elaborazione e il graduale perfezionamento della meccanica quantistica: tra questi è da ricordare in particolare Heisenberg e il suo principio di indeterminazione. I contributi iniziali allo sviluppo del laser hanno le loro radici proprio nelle basi stesse della meccanica quantistica, quali la teoria sull'emissione del corpo nero di Planck (1901), le idee di Bohr (1913) sugli stati quantici dell'atomo, la teoria di Einstein (1917) sull'emissione in dotta della luce, il metodo di trattare statisticamente le proprietà dei quanti di luce del fisico indiano Bose (1924) e la conseguente nascita della statistica dei fotoni di Bose-Einstein. Il laser quindi – come vedremo nel prossimo paragrafo analizzandone il principio di funzionamento – è da considerarsi la realizzazione fondamentale dell'Elettronica Quantistica. 2. Principio di funzionamento dei laser Le sorgenti convenzionali di luce, come il Sole, la fiamma, le lampade incandescenti e le lampade fluorescenti, emettono luce in modo disordinato e casuale: tali sorgenti vengono chiamate sorgenti incoerenti. Come si è detto, gli atomi che compongono la sorgente emettono luce in piccole unità, dette fotoni; nelle sorgenti incoerenti l'emissione dei fotoni avviene spontaneamente e quindi prende il nome di emissione spontanea: precisamente i fotoni sono emessi casualmente nel tempo e come direzione e coprono una vasta gamma di frequenze (figura 1a). Nel caso dei laser invece l'emissione di luce avviene in maniera estremamente ordina ta, mediante raggi paralleli di luce monocromatica, estremamente brillante (figura 1b ): si dice che i laser costituiscono delle sorgenti coerenti. Questa regolarità nella luce prodotta deriva dal fatto che essa non è dovuta ad emissione spontanea, ma – come vedremo meglio in seguito – è dovuta ad un processo di emissione stimolata che avviene nel laser per l'azione di una luce stimolante (o il passaggio di intense - E.131 correnti elettriche) su di una appropriata sostanza gassosa, solida o liquida (mezzo attivo), contenuta in un apposita cavità risonante. Sono proprio l'intensità e la coerenza della luce emessa dal laser che ne consentono applicazioni così numerose ed utili. Nella figura 1 viene data una rappresentazione schematica delle differenze esistenti tra una radiazione incoerente ed una radiazione coerente, per quanto riguarda le loro caratteristi che di frequenza, temporale e spaziale. Per vedere di spiegare, in maniera appena più approfondita e comprensibile, il principio di funzionamento dei laser, è necessario esporre le leggi di tipo quantistico che ne sono alla base. È appunto quello che ci proponiamo di fare, in maniera molto sintetica ed elementare, nei prossimi paragrafi. Figura 1 - FREQUENZA - La radiazione incoerente, come quella delle lampade comuni, contiene parecchie frequenze, a ciascuna delle quali la luce presenta una differente intensità. La radiazione coerente, come quella di un laser, è praticamente costituita da una singola frequenza (luce monocromatica). TEMPO - La radiazione incoerente fluttua casualmente col tempo: le onde di luce della stessa frequenza non sono in fase l'una con l'altra, né ovviamente lo possono essere le onde di luce di differenti frequenze. La radiazione coerente è costituita da onde di una singola frequenza, tutte in fase: il diagramma non subisce fluttuazioni nei tempo. SPAZIO - La radiazione incoerente è caratterizzata nello spazio da onde con creste e avvallamenti in punti casuali, onde non correlate tra di loro e che frequentemente si intersecano l'un l'altra. La radiazione coerente è caratterizzata da onde esattamente simili tra di loro, con creste e avvallamenti che danno luogo ad un diagramma uniforme. Modello atomico di Bohr. l livelli energetici Consideriamo la sostanza (gassosa, solida o liquida) che costituisce il mezzo attivo contenuto nella cavità risonante del laser e vediamo come, secondo la meccanica quantistica, è possibile descrivere la struttura elettronica di tale sostanza. Per questo è necessario fare riferimento al modello dell'atomo dovuto a Niels Bohr (1913), a cui già abbiamo accennato nel capitolo precedente. Secondo tale modello, l'atomo di un elemento generico X, avente numero atomico Z e numero di massa A, ha nucleo (rappresen tato simbolicamente come AZX) contenente Z protoni e A-Z neutroni. Attorno al nucleo (che ha dimensioni dell'ordine di 10-13 cm) ruotano, quando l'atomo è neutro, Z elettroni. - E.132 L'energia di ciascuno di questi elettroni non può – come per la meccanica classica – assumere valori qualsiasi, ma solo certi ben determinati valori: in corrispondenza ai valori di energia posseduti dai suoi elettroni, l'atomo ha la possibilità di venirsi a trovare in un ben determinato numero di livelli energetici o stati energetici, che vengono detti stati quantici dell'atomo. Precisamente gli stati quantici dell'atomo si possono determinare supponendo che gli elettroni si possano muovere attorno al nucleo solo su orbite ben determinate, dette strati, cia scuna delle quali ha raggio espresso in cm dalla relazione: r n =0,529×10−8 2 n cm Z (2) dove n = 1, 2, ... rappresenta il numero d'ordine dell'orbita. 5 Si è soliti individuare ciascuno strato, a partire dal più vicino al nucleo, con le lettere K, L, M, N, ecc. Gli strati sono caratterizzati ciascuno da una ben determinata energia che un elettrone possiede nel percorrerli, detta energia di legame, la quale rappresenta appunto l'energia necessaria per strappare l'elettrone dallo strato stesso; l'energia relativa allo strato n-esimo è espressa in eV dalla formula:6 2 E n =−13,6 Z eV 2 n (3) e risulta quindi tanto minore (in valore assoluto tanto maggiore) quanto più lo strato è vicino al nucleo. Ciascuno strato poi, in base ad un principio enunciato da W. Pauli, non può contenere un numero qualsiasi di elettroni, ma un certo numero ben determinato (2 nello strato K, 8 nello strato L ecc.). Riportiamo nella figura 2, a titolo di esempio, i livelli energetici dell'atomo di idrogeno (nella figura sono indicate le serie spettroscopiche, cioè i vari tipi di radiazioni luminose emesse dall'atomo, nel passaggio da un livello energetico superiore a un livello inferiore). Figura 2. Livelli energetici dell'atomo di idrogeno. 5 Per l'idrogeno (per cui è Z = 1), l'orbita più interna, cioè quella con n = 1, ha raggio: r1 = 0,529 × 10-8 cm ed ha quindi dimensioni dell’ordine di 105 volte più grandi di quelle del nucleo. 6 Notiamo che l’energia totale di un elettrone risulta dalla somma della sua energia cinetica (positiva) e della sua energia potenziale (negativa). Ora i valori positivi dell'energia totale corrispondono, in meccanica classica, ad orbite iperboliche (non periodiche), mentre i valori negativi ad orbite ellittiche che, essendo periodiche, si prestano appunto ad essere quantizzare in meccanica quantistica. - E.133 Facciamo osservare che per atomi più pesanti la struttura dei livelli è molto più com plessa. In tutti i modi è mediante questa trattazione quantistica basata sui livelli energetici degli atomi delle varie sostanze che si possono spiegare i valori delle frequenze delle onde elettromagnetiche irradiate dalle sostanze stesse (e quindi, in particolare, anche i loro spettri di emissione e di assorbimento) e ci si può rendere conto del funzionamento dei laser. Stato fondamentale e stato eccitato di un atomo. Densità di popolazione dei livelli energetici Gli elettroni, data l'attrazione su di essi esercitata dal nucleo, tendono ad occupare le orbite più vicine al nucleo ancora libere: si esprime questo fatto dicendo che l'atomo, in condizioni normali (cioè senza che gli sia stata comunicata energia con alcun mezzo), tende a portar si al livello di energia minima, detto stato fondamentale. Non è detto però che ogni atomo si debba sempre trovare nello stato fondamentale. Può darsi infatti che per un qualche motivo uno degli elettroni che si trovano nell'orbita più lontana dal nucleo venga a passare in una delle orbite libere ancora più esterne, caratterizzata da un'energia più elevata: quando si verifica una tale situazione si dice che l'atomo si trova in uno stato eccitato. Nel caso dell'atomo di idrogeno, che possiede un solo elettrone, lo stato fondamentale si ha quando l'elettrone occupa lo strato più interno, caratterizzato da n = 1, cioè – come si deduce dalla formula (3) – l'anello cui compete l'energia minima di -13,6 eV (vedi figura 2). Stati eccitati dell'atomo sono invece quelli in cui l'elettrone occupa anelli caratterizzati da n = 2, 3, ..., a cui corrispondono livelli di energia maggiori. E’ bene evidenziare che la distribuzione degli elettroni – ed in particolare quella degli elettroni più esterni – nell'uno o nell'altro strato caratteristico degli atomi di una sostanza (e la conseguente maggiore o minore energia posseduta dagli atomi stessi) non è casuale, ma dipende dalla temperatura della sostanza. Considerando due diversi livelli energetici (che identifichiamo con livello 1 e livello 2) a cui si può trovare l'atomo (o la molecola) della sostanza ed indicando con E1 ed E2 i corrispondenti valori di energia e con N1 ed N2 il numero di sistemi atomici che possiedono rispettivamente i suddetti valori di energia, si giungerebbe mediante valutazioni termodinamiche a dimostrare che, in condizioni di equilibrio termico, N1 ed N2 sono legati tra di loro dalla seguente legge statistica, detta legge di Boltzmann: − N 2 =N 1 e E 2−E 1 kT (4) dove k è la costante di Boltzmann (pari a 1,38 × 10-23 J/K) e T è la temperatura assoluta della sostanza. Riportiamo tale legge esponenziale nel diagramma della figura 3: la curva è tratteggiata perché i sistemi atomici possiedono solo i livelli quantizzati di energia E1 ed E2, quindi in realtà di tale curva esistono solo i due punti di coordinate (E1, N1) ed (E2, N2). Dalla legge (4) – e dal diagramma della figura 3 – si vede che il numero N2 di sistemi atomici che possiedono energia E2 (detto anche popolazione del livello 2) è minore del numero N1 di sistemi atomici che possiedono energia E1 (detto anche popolazione del livello 1). Se ne deduce quindi che: il livello più popolato è il livello fondamentale e la popolazione diminuisce all'aumentare dell'energia dei livelli. Dalla formula (4) si vede anche che, all'aumentare della temperatura, il rapporto N2/N1 aumenta, ma non raggiunge mai un valore unitario, cioè la popolazione del livello 2, anche aumentando la temperatura, resta sempre inferiore alla popolazione del livello 1. - E.134 - Figura 3. Andamento esponenziale della densità di popolazione dei livelli energetici (in figura si fa riferimento alla distribuzione di popolazione tra due livelli energetici di energia rispettiva E 1 ed E2). Assorbimento, emissione spontanea ed emissione stimolata di fotoni da parte della materia Vogliamo ora analizzare i tre tipi di fenomeni che possono avvenire come interazione dei fotoni con la materia. Per questo consideriamo una radiazione luminosa monocromatica di frequenza ν e intensità I che incide su di un mezzo costituito da atomi di cui, per semplicità, consideriamo due soli livelli energetici: il livello fondamentale, cui compete un'energia E1 ed un livello eccitato, cui compete un'energia E2. La radiazione luminosa si può materializzare – per quanto detto nel paragrafo 1 – con un certo numero di fotoni aventi tutti la stessa energia: E = hν mentre l'intensità luminosa della radiazione si può considerare proporzionale al numero di fotoni che la costituiscono. Se si verifica che l'energia E di ciascun fotone sia esattamente uguale alla differenza di energia tra i due livelli, cioè – in altre parole – se la frequenza della radiazione incidente è tale da soddisfare la relazione: E1 – E2 = hν (5) può accadere che un certo numero di atomi del mezzo passino dal livello fondamentale al livello eccitato, in quanto appunto viene a loro fornita, da parte dei fotoni incidenti, l'energia necessaria alla transizione di livello: si dice che è avvenuto un processo di assorbimento 7 (figura 4). Figura 4. Schematizzazione del processo di assorbimento: un fotone, di energia h ν, incide su di un atomo che si trova nello stato fondamentale caratterizzato dall'energia E 1 e gli comunica l'energia necessaria per portarsi nello stato eccitato caratterizzato dall'energia E 2. 7 Si noti che, come vedremo in seguito, il processo di assorbimento di una radiazione è uno, ma non l'unico mezzo con cui si può fare avvenire la transizione di un atomo dallo stato fondamentale ad uno stato eccitato. - E.135 Si è detto che tale processo, qualora la luce incidente abbia frequenza tale da verificare la formula (5), può accadere per un certo numero di atomi del mezzo colpito dalla radiazione. È necessario quindi definire una probabilità di assorbimento, che si indica con W12, mediante la seguente relazione:8 N1 =−W 12 N 1 t (6) dove N1 è il numero di atomi che ad un certo istante si trova al livello fondamentale e ∆N1 è il numero di atomi che, in un intervallo di tempo ∆t piccolissimo, immediatamente successivo all'istante considerato, subisce la transizione dal livello fondamentale al livello eccitato. La probabilità di assorbimento è proporzionale all'intensità I della luce incidente (cioè anche al numero di fotoni associabili a tale radiazione) tramite una costante γ12 che dipende solo dalle caratteristiche del mezzo, cioè è: W12 = γ12l (7) Ponendo la formula (7) nella (6), si ottiene quindi anche che il processo di assorbimento è rappresentabile mediante la formula: N1 =−12 I N 1 t (8) Supponiamo ora di considerare uno degli N2 atomi del mezzo che, a seguito del precedente processo di assorbimento (o per una qualunque altra causa), si trova ad un certo istante nello stato eccitato caratterizzato dal livello di energia E2. L 'esperienza dimostra che dopo un tempo più o meno lungo, in maniera del tutto casuale, il suddetto atomo ritorna spontaneamente dallo stato eccitato allo stato fondamentale caratterizzato dall'energia E1; durante tale transizione l'atomo emette la differenza di energia E2 – E1 sotto forma di una radiazione di frequenza ν espressa dalla formula: = E 2−E 1 h (9) Il suddetto processo prende il nome di emissione spontanea (figura 5).9 Figura 5. Schematizzazione del processo di emissione spontanea: un atomo che si trova nello stato eccitato caratterizzato dall'energia E2 si diseccita ad un certo istante, cioè passa allo stato fondamentale, emettendo un fotone di energia pari ad E 2 – E1. Se N2 è il numero di atomi del mezzo che ad un certo istante si trovano nello stato eccitato, il numero ∆N2 di atomi che, in un intervallo di tempo ∆t piccolissimo, immediatamente suc8 Si noti che questa relazione è valida rigorosamente solo per ∆t tendente a zero, cioè quando l'intervallo di tempo considerato è infinitesimo. Inoltre osserviamo che al secondo membro c'è il segno - perché il primo membro è negativo; infatti al crescere del tempo (∆t > 0) diminuisce il numero di atomi che si trovano nel livello fondamentale (∆N1 < 0) e quindi il rapporto ∆N1/∆t è negativo. 9 La completa casualità temporale secondo cui avviene, nei vari atomi di una sostanza che si trovano in uno stato eccitato, il processo di emissione spontanea sopra descritto, rende ora meglio conto di come la luce emessa secondo un tale processo sia una radiazione incoerente. - E.136 cessivo all'istante considerato, subisce la transizione dal livello eccitato al livello fondamentale è dato dalla relazione: N2 =−A N2 t (10) dove la costante A, che dipende solo dalle caratteristiche del mezzo, prende il nome di coefficiente di emissione spontanea. Supponiamo ora che su di un atomo eccitato, cioè che si trova al livello di energia E2, incida un fotone di energia hν pari sempre alla differenza di energia E2 – E1 esistente tra il livello eccitato e il livello fondamentale. In tal caso si ha la contemporaneità di due fenomeni: 1. l'atomo eccitato viene stimolato dal fotone incidente a diseccitarsi, cioè a passare allo stato fondamentale, e lo fa emettendo un fotone di energia: hν = E2 – E1; 2. contemporaneamente viene emesso da!l'atomo anche il fotone incidente, avente la stessa energia hν. Come risultato quindi di un tale processo. che prende il nome di emissione stimolata, si ha che, per ogni fotone incidente, due fotoni lasceranno l'atomo (figura 6). Tali due fotoni sono identici tra di loro, e questo è un fatto di fondamentale importanza. Figura 6. Schematizzazione del processo di emissione stimolata: un fotone, di energia h ν, incide su di un atomo che si trova allo stato eccitato caratterizzato dall'energia E 2 e lo stimola a diseccitarsi, con la conseguente emissione di un fotone di energia E 2 – E1 = hν; simultaneamente viene emesso dall'atomo anche il fotone incidente. Si è quindi messo in evidenza che il suddetto processo di emissione stimolata – che, come vedremo, è alla base del funzionamento del laser – consiste in un'amplificazione coerente della radiazione su scala atomica.10 Si può, in maniera analoga a quanto fatto per i processi precedenti, definire una probabilità di emissione stimolata, che si indica con W21, mediante la seguente relazione: N2 =−W 21 N2 t (11) dove N2 è il numero di atomi del mezzo che ad un certo istante si trovano nello stato eccitato e ∆N2 è il numero di atomi che, in un intervallo di tempo piccolissimo ∆t immediatamente successivo all'istante considerato, subisce la transizione dal livello eccitato al livello fondamentale. La probabilità di emissione stimolata è proporzionale all'intensità I della luce incidente tramite una costante γ21 che dipende solo dalle caratteristiche del mezzo, cioè è: 10 Questo fenomeno di amplificazione coerente della radiazione che avviene, a livello atomico, nel processo di emissione stimolata sopra descritto, può già fin da ora far meglio comprendere come sia possibile in linea di principio che l'a zione di una opportuna luce stimolante su di un mezzo attivo, contenente atomi in uno stato eccitato, possa dar luogo all'emissione di un'intensa sorgente di luce coerente. Vedremo nel seguito quali sono gli accorgimenti da adottare per ché, valendosi del processo dell'emissione stimolata. Si possa effettivamente realizzare un laser. - E.137 W21 = γ21 I (12) Ponendo la formula (12) nella (11), si ottiene quindi anche che il processo di emissione stimolata è rappresentabile mediante la formula: N2 =−21 I N 2 t (13) Inversione di popolazione dei livelli energetici Abbiamo visto nel paragrafo precedente come l'interazione tra fotoni e materia dia luogo a tre diversi tipi di fenomeni, cioè assorbimento, emissione spontanea ed emissione stimolata di fotoni da parte della materia. Supponiamo di considerare un materiale che sia composto da atomi dotati di due livelli energetici (di energie rispettive E1 ed E2) e che sia investito da una radiazione luminosa monocromatica in risonanza col materiale stesso, cioè di frequenza ν tale che risulti: = E 2−E 1 h Vogliamo vedere quali caratteristiche debbono essere verificate dal materiale perché esso si comporti come un amplificatore della radiazione luminosa. Per questo consideriamo nel materiale uno straterello di spessore ∆x, su cui la radiazione incide perpendicolarmente con intensità l; sia I + ∆I l'intensità della radiazione all'uscita del materiale (figura 7). Figura 7. È evidente che perché il materiale si comporti da amplificatore della radiazione dovrà risultare ∆I > 0 (se invece risultasse ∆I < 0 il materiale si comporterebbe da assorbitore della radiazione). Dei tre tipi di fenomeni elementari considerati nell'interazione fotone-materia chiaramente quelli che contribuiscono ad un aumento dell'intensità luminosa all'uscita del materiale sono l'emissione spontanea (emissione di un fotone, senza un suo contemporaneo assorbimento: figura 5) e l'emissione stimolata (emissione di due fotoni, come conseguenza dell'assorbimento di un solo fotone: figura 6); mentre l'assorbimento (nessuna emissione di fotoni, come conseguenza di un fotone incidente: figura 4) contribuisce ad una diminuzione dell'intensità luminosa all'uscita del materiale. Tenendo presente che i tre suddetti fenomeni elementari avvengono contemporaneamente e che: 1. il termine ∆N1/∆t – definito dal valore assoluto del secondo membro della formula (6) o della (8) – rappresenta il numero di atomi che, nell'unità di tempo, subisce la transizione dal livello fondamentale al livello eccitato in seguito all'assorbimento ciascuno di un fotone di energia hν; - E.138 2. il termine ∆N2/∆t – definito dal valore assoluto del secondo membro della formula (10) – rappresenta il numero di atomi che, nell'unità di tempo, subisce la transizione dal livello eccitato al livello fondamentale, con la conseguente emissione spontanea ciascuno di un fotone di energia hν; 3. il termine ∆N2/∆t – definito dal valore assoluto del secondo membro della formula (11) o della (13) – è il numero di atomi che, nell'unità di tempo, subisce la transizione dal livello eccitato al livello fondamentale in seguito all'assorbimento ciascuno di un fotone di energia hν e con la conseguente emissione stimolata ciascuno di due fotoni uguali di energia hν, si ha che la variazione ∆I dell'intensità del fascio incidente nell'attraversare lo straterello di spessore ∆x è espressa dal seguente bilancio energetico:11 N2 N2 I −N 1 = h h h x t t spont t stim (14) Introducendo nella formula (14) i valori assoluti dei secondi membri delle relazioni (8), (10) e (13), si ottiene:12 I =−12 I N 1 h AN 2 h 21 I N 2 h x (15) E’ stato dimostrato da Einstein nel 1917 che è la stessa la probabilità di assorbimento e la probabilità di emissione stimolata, cioè: W12 = W21 e quindi, in base alla formula (7) e alla (12), hanno lo stesso valore le due costanti γ12 e γ21, valore che indichiamo con γ. Inoltre per elevati valori dell'intensità l della radiazione incidente – come si ha effettivamente nei laser – il termine di emissione spontanea è trascurabile rispetto al termine di emissione stimolata, nel secondo membro della formula (15). La formula (15) stessa si può porre allora nella forma: I =−I N 2 −N1 h x (16) Da questa relazione si vede che, perché risulti ∆I > 0, cioè perché il materiale si comporti da amplificatore della radiazione, deve risultare N2 > N1, cioè la densità di popolazione del livello energetico più elevato deve risultare maggiore di quella del livello fondamentale. Ma abbiamo invece visto che per un mezzo a due livelli energetici, in condizioni di equilibrio termodinamico, lo stato di normale distribuzione degli elettroni tra i due livelli energetici è tale da avere N2 < N1 (vedi figura 3) e quindi un mezzo in condizioni normali si comporta da assorbitore della radiazione. 11 Si ricordi che l'intensità luminosa fisicamente è una potenza; è ovvio del resto che per un certo materiale debba esistere una proporzionalità diretta tra la variazione ∆I dell'intensità del fascio incidente causata dallo straterello di materiale e lo spessore ∆x dello straterello stesso e che quindi si possa definire un gradiente ∆I/∆x costante lungo il suo spessore. 12 Si noti che si utilizzano i valori assoluti perché ora è necessario, in sede di bilancio energetico, specificare quali fenomeni danno un contributo positivo e quali un contributo negativo all'intensità luminosa. Nelle suddette relazioni oc correva invece mettere in evidenza che i vari fenomeni davano luogo a un decremento della popolazione del livello fondamentale (caso dell'assorbimento) o a un decremento della popolazione del livello eccitato (caso dell'emissione spon tanea e dell'emissione stimolata). - E.139 Per potere costruire un amplificatore delle radiazioni a frequenze ottiche, quale è il laser, bisogna quindi fare in modo di ottenere nel mezzo disponibile quella che si chiama una inversione di popolazione dei livelli energetici: tale inversione, come vedremo nel paragrafo seguente, è ottenuta mediante una procedura che si chiama pompaggio. Attivazione di un mezzo mediante l'operazione di pompaggio Abbiamo visto nel paragrafo precedente che per potere costruire un laser è necessario ottenere un'inversione di popolazione dei livelli energetici, cioè la condizione N2 > N1, nel mezzo di cui il laser dispone: tale inversione di popolazione infatti dà luogo ad un'attivazione del mez zo, cioè lo rende idoneo ad avere più emissioni stimolate che assorbimenti e lo dota quindi del voluto comportamento di amplificatore delle radiazioni a frequenze ottiche. Questa inversione di popolazione è ottenuta con una procedura cui si dà il nome di pompaggio. Interessiamoci del pompaggio ottico, cioè del pompaggio ottenuto con un'intensa radiazione luminosa che investe il mezzo. Consideriamo quindi un mezzo caratterizzato da due livelli energetici (di energie E1 ed E2) e investiamolo con un'intensa radiazione luminosa in risonanza col mezzo stesso, cioè di frequenza: = E 2−E 1 h Poiché, come si è detto, la densità di popolazione del livello 1 del mezzo è, in condizioni di equilibrio termodinamico, superiore alla densità di popolazione del livello 2, si avrà che la radiazione luminosa incidente tenderà a portare più atomi dal livello 1 al livello 2 che il viceversa: in altre parole il processo di assorbimento verrà a prevalere sul processo di emissione stimolata, con la conseguenza che N1 diminuirà a vantaggio di N2. Non appena però risultasse N2 = N1, si verificherebbe l'impossibilità di procedere nell'azione di pompaggio ottico, perché il processo di assorbimento e il processo di emissione stimolata avverrebbero con uguale frequenza (tanti sarebbero gli atomi che passano dal livello 1 al li vello 2, quanto quelli che fanno il passaggio inverso): in altre parole il mezzo diventerebbe tra sparente alla radiazione incidente. Perché il pompaggio ottico possa procedere fino all'inversione della popolazione dei due livelli 1 e 2, è necessario allora valersi di un mezzo a 3 livelli13 (figura 8). In tal caso si investe il mezzo con una radiazione luminosa in risonanza con i due livelli 1 e 3, cioè con una radia zione di frequenza: = E 3−E 1 h più elevata della frequenza ν relativa alla radiazione che si vuole amplificare. Figura 8. Rappresentazione schematica dell'attivazione di un materiale a 3 livelli e della sua conseguente possibilità di amplificare le radiazioni a frequenze ottiche. Se il mezzo ha caratteristiche opportune, un atomo che dallo stato fondamentale sia portato al livello 3 a seguito della radiazione incidente, decade poi rapidamente al livello 2: in tal 13 II laser che utilizza un tale mezzo prende il nome di laser a 3 livelli. - E.140 modo si riesce ad effettuare un'operazione di pompaggio che ha come risultato finale il passaggio di atomi del mezzo dal livello 1 al livello 2. Ottenuta un'inversione di popolazione, cioè ottenuto un mezzo attivo per cui è verificata la condizione N2 > N1, è ora possibile investirlo con una radiazione luminosa di frequenza ν in risonanza con i due livelli 1 e 2, col risultato che tale radiazione darà luogo nel mezzo ad una prevalenza del processo di emissione stimolata sul processo di assorbimento. Ma questo comporta che la radiazione luminosa di frequenza ν subisca un'amplificazione da parte del mezzo e che quindi si sia verificato il presupposto che abbiamo visto necessario ad un'emissione laser. Si noti che è possibile ottenere un'inversione di popolazione anche con un mezzo a più di 3 livelli, ad esempio con un mezzo a 4 livelli14: lo schema di principio secondo cui si realizza l'inversione di popolazione e l'azione laser viene rappresentato nella figura 9 ed è del tutto analogo a quello che si ha in un mezzo a 3 livelli, solo con l'aggiunta di un decadimento rapido al termine dell'emissione stimolata. Figura 9. Rappresentazione schematica dell'attivazione di un materiale a 4 livelli e della sua conseguente possibilità di amplificare le radiazioni a frequenze ottiche. Esistono anche laser che per ottenere l'inversione di popolazione non utilizzano il pompaggio ottico, ma una diversa modalità di pompaggio. Ad esempio nei laser a semiconduttore l'inversione di popolazione è ottenuta mediante intense correnti elettriche che attraversano il diodo laser (pompaggio elettrico); mentre in molti laser a gas l'inversione di popolazione è ottenuta facendo avvenire una scarica nel gas, con conseguenti collisioni elettrone-atomo o atomo-atomo (pompaggio collisionale). Impiego dei laser come oscillatori ottici. Cavità risonante Benché i laser possano essere usati per amplificare segnali esterni di luce, secondo le modalità analizzate nel paragrafo precedente, il loro impiego più frequente è come oscillatori ottici, cioè sorgenti di luce. Perché un laser funzioni da oscillatore ottico, è necessario l'impiego di un dispositivo ottico che dia luogo ad un'amplificazione dell'emissione stimolata lungo una particolare direzione del campo di radiazione. A temperature normali infatti, per le radiazioni elettromagnetiche di frequenza ottica, l'emissione spontanea è prevalente sull'emissione stimolata 15: si comprende allora che se si vuole 14 Il laser che utilizza un tale mezzo prende il nome di laser a 4 livelli. 15 Ci si può rendere conto di questo tenendo presente che, facendo il rapporto delle formule (13) e (10), si ottiene: N 2 t stim 21 = I N2 A t spont (17) e che il rapporto γ21/A (che dipende solo dalle caratteristiche degli atomi emettitori) ha a frequenze ottiche e a tem peratura ambiente valori estremamente bassi. - E.141 ottenere una sorgente di luce di elevata intensità che sia coerente, risulta indispensabile provvedere alla suddetta amplificazione. Essa viene ottenuta mediante un dispositivo ottico che prende il nome di cavità risonante, il quale viene realizzato inserendo il mezzo attivo del laser tra due specchi piani e paralleli, di cui uno non completamente riflettente, in maniera tale da consentire l'uscita dalla cavità del fascio laser (figura 10). Figura 10. Rappresentazione schematica della cavità risonante. All'interno della cavità si innesca un processo di emissione spontanea il quale, se è ve rificata una opportuna condizione (condizione di soglia), dà luogo all'insorgere di una oscillazione persistente. Precisamente perché un laser funzioni come oscillatore bisogna che il guadagno ottico che gli deriva dall'inversione di popolazione prodotta dal pompaggio (con conseguente emissione stimolata) superi le perdite incontrate nella cavità risonante per varie cause come la diffrazione (tendenza intrinseca di un raggio di luce a divergere) e la non completa riflessione degli specchi. Scrivendo un'equazione relativa al bilancio del numero di atomi che subiscono assorbimento od emissione di energia ed un'altra relativa al numero dei fotoni assorbiti o emessi, si ottiene un sistema da cui si ricava che, perché l'intensità della radiazione luminosa nella cavità ri sonante vada aumentando nel tempo, deve essere verificata la condizione: N2 – N1 ≥ Nc (18) dove N2 è il numero di atomi del mezzo che ad un certo istante si trovano nello stato eccitato, N1 è il numero di atomi del mezzo che si trovano nello stato fondamentale (o, ad ogni modo, ad uno stato di energia minore); Nc è un termine che tiene conto delle perdite nella cavità e si può esprimere come: N c= 1−r c l (19) dove: γ = γ12 = γ21 = costante che dipende solo dalle caratteristiche del mezzo, definita mediante la formula (7) e la formula (12); r = coefficiente di riflettività degli specchi; l = lunghezza della cavità risonante; c = velocità della luce. La condizione (18) è la condizione di soglia. Perché essa sia verificata, bisogna appunto che il percorso ottico della radiazione luminosa attraverso il mezzo del laser avvenga prolungatamente in una sola direzione: a questo pensano le superfici riflettenti degli specchi, disposti in maniera tale da rimandare la luce avanti e indietro lungo questa direzione. Mentre la luce subisce le successive riflessioni, la sua intensità aumenta, fino a stabilizzarsi ad un ben determinato valore 16, che è appunto l'intensità dell'oscillazione persistente: tale oscillazione è costituita da un sistema di onde stazionarie aventi sede solo lungo la suddetta direzione. 16 Si può dimostrare che questo valore è tanto più elevato quanto più viene superata la condizione di soglia (cioè quanto più il primo membro della formula (18) risulta superiore al secondo membro). - E.142 Variando opportunamente la distanza tra i due specchi, si può ottenere la realizzazione, all'interno della cavità risonante, di una sola onda stazionaria e monocromatica: si dice che in tali condizioni il laser oscilla su un singolo modo di cavità. La forma della cavità risonante e il basso valore della lunghezza d'onda della luce (che fa sì che la sua diffrazione sia limitata) riducono l'emissione laser ad un sottile pennello di luce che emerge dalla cavità risonante attraverso lo specchio non completamente riflettente. 3. Proprietà delle radiazioni laser A queste proprietà si è già accennato confrontando le caratteristiche che contraddistinguono l'emissione stimolata delle sorgenti coerenti, rispetto a quelle che contraddistinguono l'emissione spontanea delle sorgenti incoerenti. I raggi laser, come si è detto, costituiscono delle sorgenti coerenti, cioè la loro emissio ne avviene mediante raggi paralleli di luce monocromatica, estremamente brillante. Vediamo di riesaminare le loro proprietà, con un po’ più di dettaglio. Monocromaticità delle radiazioni laser Si è detto che le radiazioni laser sono monocromatiche: è bene però a tal proposito fare alcune precisazioni. Una radiazione luminosa monocromatica è una radiazione caratterizzata da una singola frequenza ν espressa dalla relazione: = E 2−E 1 h (20) dove E2 ed E1 sono i due livelli energetici tra i quali avviene la diseccitazione degli atomi che co stituiscono la sorgente, con conseguente emissione di fotoni. Una tale radiazione esiste però solo teoricamente, perché in pratica anche la sorgente di luce più monocromatica – come il laser – dà sempre luogo ad un'emissione caratterizzata da una banda di frequenze di una certa ampiezza ∆ν, centrata attorno ad una frequenza ν espressa dalla formula (20). Questo fatto viene rivelato da un esame spettroscopico: nessuna sorgente luminosa, compreso il laser, se esaminata con uno spettroscopio sufficientemente dispersivo dà mai luogo ad una riga così stretta da potersi considerare in pratica di larghezza nulla (come dovrebbe essere se la luce fosse effettivamente monocromatica), ma tutt'al più approssima soltanto una radiazione monocromatica, dando luogo ad una riga di una certa larghezza (e questo è appunto indice del fatto che la radiazione è caratterizzata da un certo intervallo ∆ν di frequenze). Senza approfondire l'esame delle varie cause che determinano l'allargamento delle righe spettrali, diciamo solo che tale fenomeno è addebitabile al fatto che l'emissione di luce avviene mediante la successione di tanti singoli atti elementari (transizioni degli atomi della sorgente dal livello di energia E2 al livello di energia E1 e conseguente emissione di fotoni): l'energia dei fotoni emessi (e quindi la frequenza ad essi associata dalla formula (20)) non è però mai rigorosamente la stessa, perché i due livelli sono caratterizzati da energie che possono subire fluttuazioni attorno ai rispettivi valori più probabili, E2 ed El.17 17 Infatti, in base al principio di indeterminazione di Heisemberg, ogni atomo, in un certo stato, può possedere un'energia che si discosta di ∆E dall'energia E più probabile di quello stato; il suddetto scostamento è legalo alla vita media (tempo medio di esistenza) ∆t dell'atomo in quello stato dalla relazione: E t =− h 2 dove h è la costante di Planck. (21) - E.143 Notiamo poi per inciso che il fatto che ad ogni fotone non sia associabile una certa energia (e quindi una certa frequenza) ben determinata, ma un certo intervallo di energie (e di frequenze), porta alla necessità di una trattazione statistica delle proprietà dei fotoni, cioè alla definizione della probabilità che un fotone abbia una certa energia (e quindi una certa frequenza); lo sviluppo di una tale trattazione ha portato al nascere della accennata statistica dei fotoni di Bose-Einstein. Si può dire ad ogni modo che la luce laser costituisce una notevolissima ap prossimazione del concetto di luce monocromatica: basti infatti pensare che si possono ottenere raggi laser per cui l'estensione di frequenza ∆ν risulta dell'ordine di 10-13 volte il valore della frequenza ν della luce emessa. Coerenza temporale delle radiazioni laser Si è detto nel paragrafo 2 che le radiazioni laser possiedono coerenza temporale, cioè sono radiazioni costituite da onde di una sola frequenza (monocromatiche) e tutte in fase tra di loro: esse pertanto sono rappresentabili mediante un diagramma che non subisce fluttua zioni nel tempo. Questo a differenza di quanto avviene per le sorgenti di luce incoerenti, le quali sono costituite da onde che: – o hanno la stessa frequenza (essendo dovute alla transizione di atomi della sorgen te tra gli stessi due livelli energetici), però sono sfasate tra di loro (avvenendo le singole transizioni – e le conseguenti emissioni di fotoni – in maniera casuale, cioè scoordinata nel tempo) (figura 11); – o hanno diversa frequenza, e allora necessariamente debbono essere sfasate tra di loro e il loro sfasamento varierà da istante a istante (figura 12). Pertanto la sorgente incoerente, risultando dalla sovrapposizione casuale di onde quali quelle schematizzate nelle figura 11 e 12, darà luogo ad un diagramma risultante che subisce fluttuazione nel tempo. Da quanto detto, è evidente che la coerenza temporale di una radiazione è intimamente legata alla sua monocromaticità. Se infatti una radiazione non è monocromatica, cioè se essa è costituita da onde luminose di diversa frequenza, necessariamente tali onde saranno sfasate tra di loro, con uno sfasamento variabile nel tempo: per cui la radiazione subirà una fluttuazione nel tempo, cioè non avrà coerenza temporale. Figura 11. Rappresentazione schematica di due onde che hanno la stessa frequenza ν = ω/2π, ma diversa fase. La prima onda è rappresentabile come: y = A m sen (ωt + ϕ1), mentre la seconda onda è rappresentabile come: y = B m sen (ωt + ϕ2). Lo sfasamento tra le due onde vale: ∆ϕ = (ωt + ϕ1) - (ωt + ϕ2) = ϕ1 - ϕ2, cioè è una quantità costante nel tempo. - E.144 - Figura 12. Rappresentazione schematica di due onde che hanno diversa frequenza ( ν1 = ω1/2π e ν2 = ω2/2π) e quindi necessariamente diversa fase. La prima onda è rappresentabile come: y = Am sen (ω1t + ϕ1), mentre la seconda onda è rappresentabile come: y = B m sen (ω2t + ϕ2). Lo sfasamento tra le due onde vale: ∆ϕ = (ω1t + ϕ1) - (ω2t + ϕ2) = (ω1 - ω2)t + ϕ1 - ϕ2 e, come si vede, è una quantità che varia nel tempo. Figura 13. Verifica della coerenza spaziale di una radiazione laser. Chiaramente, quindi, anche la radiazione laser non è completamente coerente nel tempo, in quanto non è esattamente monocromatica: però la minima ampiezza della sua banda di frequenze e la non casualità temporale con cui avviene il processo di emissione dei fotoni (pro vocato dall'eccitazione stimolata del mezzo) fanno sì che la radiazione laser costituisca una no tevolissima approssimazione del concetto di luce a coerenza temporale. Coerenza spaziale delle radiazioni laser Si è detto nel paragrafo 2 che le radiazioni laser possiedono coerenza spaziale e si è data, di tale caratteristica, una spiegazione quanto mai elementare ed intuitiva: si è detto cioè che le radiazioni laser, in quanto sorgenti coerenti, sono caratterizzate da onde esattamente si mili tra di loro, che dispongono nello spazio le loro creste e i loro avvallamenti in maniera tale da dare luogo ad una distribuzione spaziale uniforme. Se si vuole dare una definizione più rigorosa e misurabile alla coerenza spaziale di una radiazione, bisogna prelevare, mediante due fenditure, due pennelli del fascio di radiazione, in - E.145 maniera tale che le fenditure vengano a costituire esse stesse due sorgenti luminose separate (figura 13): si dirà che la radiazione possiede coerenza spaziale quando i due pennelli del fascio, sovrapposti in una certa zona dello spazio, danno luogo ad effetti di interferenza. 18 La radiazione avrà una coerenza spaziale tanto maggiore quanto più saranno visibili sullo schermo le frange di interferenza, cioè anche quanto più prossimo all'unità risulterà il rapporto:19 I max −I min I max I min (22) dove lmax e Imin sono rispettivamente la intensità di luce massima e minima che si possono misurare sullo schermo. Per i laser che oscillano su di un singolo modo di cavità la coerenza spaziale è pressoché perfetta, cioè il rapporto (22) è praticamente di valore unitario. Direzionalità della radiazione laser Un'altra proprietà che è direttamente legata alla coerenza spaziale della radiazione laser è la sua elevata direzionalità. La direzionalità di una sorgente viene misurata tramite la sua divergenza angolare: pre cisamente, se si considera una sorgente luminosa circolare, di diametro D, che emette un'onda piana monocromatica (di lunghezza d'onda λ) e spazialmente coerente, si ha che, a seguito del fenomeno di diffrazione, l'emissione avviene in maniera tale che il fronte d'onda va allargandosi man mano che aumenta la distanza dalla superficie emittente. Si può allora definire una diver genza angolare θ della sorgente (figura 14), divergenza che risulta direttamente proporzionale alla lunghezza d'onda λ della luce emessa e inversamente proporzionale al diametro D della sorgente emittente. Figura 14. Divergenza angolare di una sorgente luminosa. Nel caso del laser, l'elevata coerenza spaziale della luce emessa dà luogo ad un valore di divergenza angolare che può anche essere la metà rispetto a quello di un'analoga sorgente luminosa convenzionale: si può quindi effettivamente affermare che la luce laser possiede un'elevata direzionalità. Brillanza delle radiazioni laser Le radiazioni laser sono caratterizzate da valori elevatissimi di brillanza del fascio emesso: anzi è proprio la brillanza della luce emessa – più che il suo flusso luminoso o la sua intensità – che differenzia le sorgenti laser dalle sorgenti luminose convenzionali. 18 Si sa che, perché avvenga il fenomeno dell'interferenza, le due sorgenti separate debbono essere omogenee (cioè vibrare con la stessa ampiezza e la stessa frequenza) e coerenti (ossia avere .la stessa fase o, per lo meno, avere una differenza di fase che resta costante al variare del tempo). Si intuisce quindi come il fatto che avvenga il fenomeno dell'interferenza tra i due pennelli del fascio sia una verifica di quella «distribuzione spaziale uniforme» delle onde costituenti una radiazione con coerenza spaziale, cui si era accennato nel paragrafo 2 (e che si era schematicamente rappresentata nella figura 1). 19 Si noti che se sullo schermo non si rilevano frange di interferenza, cioè è Imax = Imin, il rapporto (22) vale zero; viceversa le frange saranno perfettamente visibili quando è lmin = 0, ed in tal caso il rapporto (22) vale 1. - E.146 Si ricordi che: – il flusso luminoso Φ emesso da una sorgente corrisponde alla potenza luminosa emessa: per tener conto della risposta dell'occhio alla luce, anziché misurarlo in watt lo si misura in lumen (unità derivata da quella di intensità luminosa); – I' intensità luminosa I di una sorgente in una data direzione è il flusso luminoso che la sorgente invia nell'angolo solido unitario avente per asse tale direzione: I= ; si misura in candele; – la luminanza (o brillanza) L di una sorgente in una data direzione è l'intensità luminosa emessa dall'unità di area apparente della sorgente: 20 I L= = A A si misura in candele per metro quadrato (un tempo questa unità era detta nit). Confortando ad esempio la brillanza di un laser a rubino con quella della superficie del Sole, si trova che il laser ha una brillanza circa 50.000 volte superiore. L'estrema brillanza del fascio laser è dovuta al fatto che – come si è descritto nel paragrafo 2 – gli atomi eccitati del mezzo sono stimolati ad emettere in una direzione specifica, piuttosto che seguire la loro consueta modalità di emissione in tutte le direzioni. Questa proprietà del fascio laser può essere sfruttata per ottenere – previa una sua op portuna focalizzazione – una concentrazione tale di energia da renderlo idoneo a fondere, e addirittura a sublimare, anche gli acciai di maggiore durezza. 4. Vari tipi di laser La distinzione fra i vari tipi di laser può essere fatta: 1. a seconda della natura del materiale che costituisce il mezzo attivo del laser: si parla allora di laser a gas, laser solidi, laser liquidi e plastici; 2. a seconda del metodo di eccitazione degli atomi o delle molecole che costituiscono il mezzo attivo del laser: si parla allora di laser a pompaggio ottico, a pompaggio elettrico, a pompaggio collisionale; 3. a seconda della maniera con cui la luce esce dal laser, se per impulsi di luce o in maniera continua: si parla allora rispettivamente di laser a funzionamento impulsivo o di laser a funzionamento continuo. Poiché l'azione laser è stata osservata in una grandissima varietà di materiali (comprendente i gas, i vapori, i plasmi, i cristalli isolanti, i cristalli semiconduttori, i vetri, i liquidi e le plastiche) la classificazione che appare più significativa – delle tre sopra riportate – è la prima. Nel seguito quindi accenneremo brevemente ai vari tipi di laser secondo questa classificazione, specificando eventualmente di volta in volta quale è il metodo di eccitazione e in quale maniera il laser emette luce. 20 L'area apparente A della sorgente è l'area della proiezione della superficie della sorgente su di un piano perpendicolare alla direzione rispetto a cui si considera la luminanza. - E.147 Laser solidi I laser solidi sono laser in cui gli atomi da eccitare fanno parte di un materiale che si trova allo stato solido. Si possono a loro volta classificare in: a) laser a cristallo isolante; b) laser a vetro; c) laser a cristallo semiconduttore I laser a cristallo isolante sono laser che come mezzo attivo si valgono di un cristallo duro, trasparente, «drogato» con una piccola quantità di un altro elemento (solitamente una terra rara) che possiede i livelli di energia usati nell'emissione laser. Un tale cristallo emette nella gamma visibile o prossima all'infrarosso e spesso, per funzionare, richiede di essere raffreddato molto al di sotto della temperatura ambiente. Esso inoltre necessita di un intenso pompaggio ot tico per cui, solitamente, il laser che lo utilizza ha funzionamento impulsivo, onde assicurare un adeguato raffreddamento del cristallo tra un impulso e l'altro. Questi laser normalmente non possono subire apprezzabili sintonizzazioni di frequenza, cioè non possono emettere luce di frequenza variabile in una certa gamma. Il più diffuso fra i laser a cristallo isolante è il laser a rubi no (figura 15), la cui notorietà è dovuta anche al fatto che la prima azione laser è stata ottenuta nel 1960 appunto su di un tale cristallo. Figura 15. Rappresentazione schematica di un laser a rubino. Il materiale attivo del laser è costituito da un cilindro di rubino sintetico, che è un ossido di alluminio cristallino contenente un piccolo tenore di cromo; il cilindro è circondato da una lam pada flash a spirale, in maniera che la luce emessa dalla lampada vada ad incidere sulla super ficie del rubino. Precisamente il funzionamento del laser avviene in questo modo: la lampada flash, riempita di xenon, funziona ad una tensione di circa 3000 V (fornita da un banco di condensato ri) e viene innescata da un impulso di 20 o 30 kV (fornito da un trasformatore elevatore di ten sione) che comanda un elettrodo trigger; il lampo di luce, verde e violetta, prodotto dalla lampada, dà luogo ad una eccitazione degli atomi di cromo contenuti nell'asta di rubino, cioè al loro passaggio da un livello di energia inferiore ad un livello di energia superiore; quando gli atomi di cromo si diseccitano, emettono luce di una specifica lunghezza d'onda: questa luce, riflettendosi sui due specchi (uno a riflessione totale e uno a riflessione parziale) collocati alle due estremità del cilindro, viaggia avanti e indietro, subendo una notevole amplificazione prima di passare come un raggio rosso (lunghezza d'onda di 694,3 nm a temperatura ambiente) attraverso lo specchio parzialmente riflettente. A causa dell'elevato valore di energia luminosa richiesto per portare gli atomi di cromo allo stato eccitato e produrre la condizione di inversione di popolazione, il laser a rubino inizial mente poteva avere solo un funzionamento di tipo impulsivo; attualmente però si è riusciti an che ad ottenere un funzionamento di tipo continuo, a temperatura ambiente. - E.148 Un importante perfezionamento del laser a rubino consiste nel regolarizzare l'effetto di pompaggio per cercare di ottenere l'inversione massima di popolazione: per questo si ha inte resse a migliorare la qualità della cavità risonante. In particolare, l'impiego di celle dette «celle di Kerr» permette di raggiungere il massimo di inversione di popolazione: questa cella è opaca durante il pompaggio del cristallo, ma poi subitaneamente, allorché l'inversione di popolazione raggiunge il massimo, la cella, a seguito di un impulso elettrico, diviene trasparente, facendo sì che tutta l'energia immagazzinata sia emessa in un breve flash. L'effetto laser si manifesta allora con un «impulso gigante», che può raggiungere, pressoché istantaneamente, livelli di potenza enormi (sono stati ottenuti livelli di potenza superiori a 10 12 watt durante flashes di durata dell'ordine di 10-11 secondi). Altri laser a cristallo che meritano di essere ricordati sono il laser a granato d'ittrio e allu minio, drogato con neodimio (laser Y.A.G.), che può avere un funzionamento continuo a tempe ratura ambiente, con una lampada incandescente di 100 watt per il pompaggio; e il laser a nichel, drogato con fluoruro di magnesio, che è in grado, tramite aggiustamenti della cavità risonante, di effettuare sintonizzazioni in frequenza del 10%, dal momento che la sua inversione di popolazione gli consente di irraggiare in una banda di frequenza molto ampia. I laser che utilizzano vetri drogati con atomi di neodimio hanno proprietà molto simili a quelle dei laser a cristallo isolante, col vantaggio che ovviano alla gravosa necessità della pro duzione di ampi cristalli con elevata qualità ottica. II laser a vetro può avere un funzionamento di tipo continuo a temperatura ambiente, mentre in un funzionamento di tipo impulsivo raggiunge un rendimento di circa il 3% 21. Esso inoltre presenta un notevole interesse per l'ottenimento di grandi potenze: si pensi che sono realizzabili potenze dell'ordine di 1016 watt per cm2 di materiale attivo. Una categoria del tutto particolare di laser solidi è quella dei laser a cristallo semiconduttore, che utilizzano come materiale sensibile dei cristalli di arseniuro (o fosfuro) di gallio, di arseniuro (o fosfuro) di indio, di tellururo di piombo ecc. La proprietà più notevole di questi laser a semiconduttore – oltre al loro piccolo ingombro (ciascuna dimensione dell'ordine del mm) – è il loro elevato rendimento (che può raggiungere valori attorno al 50%), in quanto nei cristalli semiconduttori si realizza la conversione diretta di corrente in luce22: tali cristalli infatti possono condurre corrente elettrica e quindi è possibile ottenere un'inversione di popolazione tramite un pompaggio elettrico effettuato direttamente nel cristallo. Senza addentrarci troppo nello spiegare come sia possibile l'emissione laser da parte di un cristallo semiconduttore, diciamo semplicemente che, mediante opportuni «drogaggi» con impurità di elementi donatori o di elementi accettori, si produce nel cristallo una giunzione p-n analoga a quella che viene realizzata nei diodi a semiconduttore: quando la giunzione viene polarizzata direttamente (cioè viene applicata una tensione positiva alla zona di tipo p e una tensione negativa alla zona di tipo n), si manifesta una corrente dovuta a un doppio flusso di cariche, cioè elettroni che passano dalla zona di tipo n a quella di tipo p e lacune che effettuano il passaggio inverso. Ora l'effetto laser della giunzione p-n non è basato sulle transizioni tra livelli discreti di energia (come avviene per gli atomi costituenti il materiale attivo degli altri tipi di laser), ma sulle transizioni tra bande di energia. Precisamente, richiamandosi alla teoria delle bande, si ha che un semiconduttore è caratterizzato da bande di livelli energetici, separate da bande interdette (così chiamate perché una carica non si viene mai a collocare in tali zone energetiche): perché si manifesti l'effetto laser, bisogna allora che si verifichi un'inversione di popolazione tra una banda di energia superiore (che viene detta banda di conduzione e rappresenta lo stato superiore di energia per il laser) e una banda di energia inferiore (che viene detta banda di valenza e 21 Il rendimento è dato dal rapporto tra l'energia luminosa prodotta e l'energia elettrica spesa nell'eccitazione. 22 Non è quindi necessaria, come per i cristalli isolanti, una loro preventiva illuminazione tramite una lampada flash, cioè una preventiva conversione – all'esterno del cristallo – da corrente in luce. - E.149 rappresenta lo stato inferiore di energia per il laser), tra le quali si situa una banda interdetta, la cui ampiezza è variabile a seconda del tipo di materiale (figura 16). Figura 16. Rappresentazione schematica delle bande di energia di un cristallo semiconduttore impiegato per l'emissione laser. Tale inversione di popolazione deve essere effettuata mediante un'operazione di pompaggio che conduca sufficienti elettroni dalla banda di valenza alla banda di conduzione: il metodo più semplice per ottenere questa transizione tra le due bande è appunto quello di un pompaggio elettrico, realizzato mediante un iniettore di cariche che applica al semiconduttore un im pulso di corrente di breve durata e di notevole intensità, in modo da generare coppie elettronilacune23 (figura 17). Conseguentemente a questa inversione di popolazione avviene l'emissione laser, solitamente nel rosso o in prossimità dell'infrarosso. Figura 17. Rappresentazione schematica del pompaggio elettrico e dell'emissione laser in un diodo semiconduttore. Le prime strutture realizzative di semiconduttori ad emissione laser, quale la semplice giunzione p-n considerata, necessitavano di elevatissime densità di corrente (dell'ordine di qualche decina di kA per cm 2) perché si innescasse l'effetto laser; esse non potevano funzionare che in maniera impulsiva alla temperatura ambiente – onde consentire un adeguato raffreddamento del semiconduttore tra un impulso e l'altro – oppure potevano funzionare in maniera con tinua, ma alla temperatura dell'azoto liquido. In seguito al successivo miglioramento del processo di emissione laser, ottenuto mediante una sempre maggiore complessità delle strutture (sono state realizzate strutture «a wafer», ottenendo nel cristallo varie zone con diverso drogaggio, onde potere modificare opportunamente la banda di interdizione), si è conseguita una notevole riduzione della densità di corrente necessaria (meno di 1 kA/cm 2): per cui è oggi possibile ottenere laser a semiconduttore che funzionano in regime continuo alla temperatura ambiente. I laser a semiconduttore sono anche interessanti poiché possono essere realizzati in maniera tale da emettere radiazioni a quasi tutte le lunghezze d'onda comprese entro un'ampia gamma. La lunghezza d'onda della radiazione laser è determinata dall'intervallo di energia che separa la banda di conduzione dalla banda di valenza del cristallo: essa può essere variata con 23 La polarizzazione diretta della giunzione dà luogo ad un campo elettrico che, se portato a superare un valore tale da predominare sul campo elettrico di origine interna, è in grado di liberare elettroni dagli atomi del reticolo cristallino, consentendone la diffusione nel cristallo e quindi, sostanzialmente, portandoli ad un livello di energia corrispondente a quello della banda di conduzione. - E.150 continuità realizzando composti a base di due semiconduttori, come I'arseniuro di indio e il fosfuro di indio. Il risultato è che si possono ottenere laser che emettono radiazioni a lunghezze d'onda comprese tra 0,9 µm e 3 µm, che sono le lunghezze d'onda proprie dei due singoli componenti. Laser a gas I laser a gas sono laser in cui gli atomi da eccitare, contenuti nella cavità risonante, fan no parte di un mezzo che si trova allo stato gassoso. Perché avvenga l'emissione laser bisogna che tale mezzo gassoso contenga coppie di livelli energetici (caratteristici degli atomi da cui è costituito) tra i quali viene prodotta un'inversione di popolazione, onde ottenere una densità di popolazione maggiore per il livello caratterizzato da energia maggiore. Il pompaggio che produ ce l'inversione di popolazione viene ottenuto normalmente facendo avvenire una scarica elettri ca all'interno del gas (pompaggio collisionale): la cavità risonante non è quindi altro che un tubo a scarica, le cui estremità sono chiuse da due specchi (piani o sferici). A seconda che il mezzo attivo sia costituito da atomi neutri, da molecole o da atomi io nizzati, i laser a gas si possono a loro volta classificare in: a) laser atomici; b) laser molecolari; c) laser ionici. I laser atomici sono laser in cui il mezzo attivo è un gas costituito da atomi neutri. L'inversione di popolazione – provocata da una scarica elettrica nel gas – può quindi avvenire semplicemente a seguito di collisioni elettrone-atomo: esiste circa un centinaio di gas che utilizza questo tipo di pompaggio collisionale per produrre emissioni laser (e tra questi ricordiamo il neon, lo xenon, il monossido di carbonio), oltre ad alcuni vapori (come il vapore d'acqua e il vapore di mercurio). Tali laser hanno generalmente un funzionamento continuo, con potenza compresa tra il µW e alcuni mW. Il laser atomico che ha avuto la maggior diffusione, in quanto di più facile messa a punto, è però il laser a elio-neon, che utilizza appunto una miscela dei due gas, posta in un tubo a scarica di pirex. In questo laser il meccanismo di pompaggio è più complesso ed è dovuto alla coincidenza di particolari livelli di energia negli atomi di elio e di neon; esso si può sintetizzare (figura 18) dicendo che: – nel corso della scarica elettrica, gli atomi di elio si eccitano per collisione con gli elettroni di scarica; – successivamente avviene un trasferimento risonante di energia tra gli atomi eccitati di elio e gli atomi di neon, a seguito delle loro reciproche collisioni: è questo trasferimento di energia che dà luogo all'inversione di popolazione negli atomi di neon; – la diseccitazione (stimolata dai fotoni che viaggiano avanti e indietro nel tubo a scarica) degli atomi di neon, dà luogo infine all'emissione laser, che avviene quindi sulle fre quenze proprie del neon. Nel primo laser a elio-neon, costruito da Javan nel 1961, gli specchi alle estremità del risonatore erano posti al suo interno; si è in seguito visto che è spesso più conveniente porre gli specchi all'esterno del tubo, ed in tal caso si pongono alle estremità del tubo delle finestrelle an tiriflessione. Il primo laser elio-neon emetteva nella parte dello spettro prossima all'infrarosso (1,15 µm di lunghezza d'onda); si è in seguito visto che con minime modifiche apportate alla cavità risonante di questo laser si può ottenere una radiazione nella parte rossa dello spettro (632,8 nm - E.151 di lunghezza d'onda) e anche un'altra radiazione di lunghezza d'onda compresa nell'infrarosso (3,39 µm). elio neon stato metastabile E3 urti E2 luce laser E1 pompaggio (scarica elettrica) E0 Figura 18. Schema di funzionamento a quattro livelli di un laser a elio-neon. Questo tipo di laser è costituito da un tubo di vetro contenente una miscela di elio (80%) e neon (20%). Il tubo è dotato di due elettrodi attraverso il quali può essere prodotta nel gas una scarica elettrica. Questa scarica elettrica eccita gli atomi di elio a un livello eccitato metastabile che ha un’energia E 3 = 20,61 eV. Questa energia è molto vicina a quella di un livello del neon per il quale si ha E 2 = 20,66 eV: può allora avvenire con facilità che gli atomi di elio eccitati al livello E 3, urtando gli atomi di neon, cedano ad essi la loro energia eccitandoli al livello E 2. Si ha quindi un’inversione di popolazione tra il livello E2 del neon e il sottostante livello che ha energia E 1 = 18,70 eV. La luce laser è prodotta dal decadimento del neon dal livello E 2 al livello E1. L’atomo di neon si porta poi rapidamente allo stato fondamentale attraverso altri passaggi intermedi. Le potenze ottenute con questo tipo di laser sono comprese tra il µW e il decimo di watt, con un rendimento dell'ordine di 10-4. I laser molecolari sono laser in cui il mezzo attivo è un gas allo stato molecolare. Sono caratterizzati, contrariamente ai laser atomici, da un rendimento elevato: mentre infatti nei laser atomici le emissioni stimolate si producono tra due livelli elettronici dell'atomo, nei laser molecolari si sfruttano i livelli vibrazionali caratteristici delle molecole nel loro stato elettronico fondamentale. Precisamente, allorché una molecola riceve energia, il suo stato energetico si traduce in vibrazioni: allorché l'energia aumenta, queste vibrazioni si amplificano e si può giungere fino ad una rottura dei legami atomici, cioè alla dissociazione della molecola in ioni. I laser molecolari però impiegano un'eccitazione del gas tale da produrne solo vibrazioni, perché è proprio il livello energetico a cui le molecole vibrano che costituisce il livello superiore del gas: questo livello può con facilità essere fortemente popolato. Infatti la durata di vibrazione di una molecola è parecchie volte maggiore delle durate che caratterizzano le transizioni elettroniche (parecchi millisecondi, contro frazioni di microsecondi) e questo comporta appunto che si pos sono ottenere delle ben più elevate concentrazioni di molecole in uno stato vibrazionale di quanto siano le concentrazioni di atomi ottenibili in un livello elettronico eccitato. Le emissioni prodotte dai laser molecolari, a seguito di queste transizioni tra livelli vibra zionali, sono costituite da radiazioni elettromagnetiche nella zona dell'infrarosso 24. Cercando ai ottenere laser molecolari con la massima potenza di emissione possibile, si è realizzato il laser ad anidride carbonica, che emette una radiazione di 10,6 µm di lunghezza d'onda e che, in funzionamento impulsivo, produce una potenza dal kW alla decina di kW, mentre in funzionamento continuo produce una potenza di qualche centinaio di watt, con rendimenti ottimi (dal 10 al 20%). 24 È stato proposto di chiamare questo tipo di laser «lraser» (lnfrared amplification by stimulated emission of radio- tion). - E.152 Normalmente questo laser contiene una miscela di anidride carbonica e di azoto: la molecola di anidride carbonica vibra, mentre la presenza di azoto arricchisce la popolazione del li vello eccitato (azoto eccitato in maniera vibrazionale si può infatti produrre con estrema facilità durante la scarica e per di più il suo tempo di vita è estremamente grande). Alla miscela dei due suddetti gas si può aggiungere anche l'elio, che migliora notevolmente le caratteristiche del laser, in quanto confina la luminescenza della scarica al centro del tubo. I laser ionici sono laser in cui il mezzo attivo è un gas costituito da atomi ionizzati, cioè atomi a cui l'elevata densità della corrente di scarica nel tubo laser ha sottratto uno o più elettroni: un gas in questo stato viene detto un plasma. Moltissimi sono i gas in grado fornire raggi laser per transizione tra i livelli ionici dei ri spettivi atomi: tra di essi ve ne sono una ventina appartenenti ad elementi semplici. I più studiati sotto questo aspetto sono stati i «gas rari», per cui i tipi di laser ionico di più comune realizzazione sono il laser ad argon, ed anche il laser a kripton e il laser a neon. Uno dei vantaggi più apprezzabili dei laser a ioni è la loro possibilità di funzionamento su molte lunghezze d'onda. Infatti essi forniscono raggi che coprono lo spettro visibile e ultravioletto (con una preferenza per la parte blu-verde della zona visibile); con sistemi idonei (ad esempio per mezzo di un prisma inserito nella cavità risonante, prisma la cui posizione può essere ruotata tramite una manopola esterna) è poi possibile effettuare una selezione delle lun ghezze d'onda di uscita ed ottenere quindi una sintonizzazione del laser su frequenze luminose comprese in una gamma abbastanza ampia. I laser ionici funzionano principalmente in regime impulsivo. Si pensi infatti che per otte nere un'emissione nell'ultravioletto, a lunghezza d'onda oltre i 300 nm, è necessario che la cor rente eccitante di scarica sia costituita da impulsi superiori a 2.000 A, e ciò corrisponde a delle densità di corrente fino a 3.000 A/cm 2:25 non esiste alcun materiale di cui può essere fatto il tubo laser che sia in grado di resistere al calore prodotto da una tale densità di corrente, mentre invece è in grado di farlo per alcuni microsecondi un qualsiasi tubo in vetro. Non di meno si è riusciti, con opportuni accorgimenti, a realizzare anche laser ionici funzionanti in regime continuo. Precisamente, per ottenere una densità ionica apprezzabile, si mantiene nel gas a bassa pressione, posto in un tubo capillare, una scarica ad arco. Si riesce poi ad aumentare notevolmente il rendimento del laser ponendo l'arco in un campo magnetico assiale (cioè con le linee di forza parallele all'asse del tubo), in quanto tale campo magnetico ha l'effetto di diminuire la diffusione degli elettroni di scarica verso la parete del tubo e di aumenta re quindi il numero di collisioni utili. Le potenze emesse dai laser ionici in regime continuo sono comprese tra una frazione di watt e più di una decina di watt (ottenuti nel laser a ioni d'argon, che emette un raggio di 488,0 nm di lunghezza d' onda, con un rendimento di circa lo 0,1%) ; mentre i laser ionici in re gime impulsivo possono emettere potenze anche fino al kW (come accade nel laser a ioni d'argon fatto funzionare con impulsi della durata di 2 microsecondi). Laser liquidi I laser liquidi sono laser in cui il mezzo attivo è costituito da una sostanza liquida. Si possono a loro volta classificare in: a) laser liquidi organici; b) laser liquidi non organici 25 Densità di correnti così elevate sono necessarie per due motivi: - perché una certa parte degli atomi di gas si deve mantenere nello stato ionizzato; - perché il processo di eccitazione in grado di realizzare un'inversione di popolazione richiede diverse eccitazioni successive, fino a raggiungere i livelli energetici più elevati del gas ionizzato: solo da questi livelli possono infatti avveni re transizioni in grado di produrre emissioni laser. - E.153 I laser liquidi organici sono laser in cui il mezzo attivo è costituito da una soluzione diluita di un colorante organico disciolto in un opportuno solvente: vengono quindi indicati solita mente come laser a colorante26. La possibilità di impiego nei laser di questi coloranti organici è dovuta al fatto che le loro molecole possiedono la caratteristica essenziale di un notevole assorbimento di luce nello spet tro visibile; per di più, se opportunamente eccitate tramite un pompaggio ottico, 27 sono in grado di emettere un lascio luminoso coerente. Il loro funzionamento è di tipo impulsivo. L 'esatta analisi del meccanismo secondo cui è possibile ottenere dai coloranti organici questa emissione di luce coerente richiederebbe considerazioni complesse. Ci limitiamo ad una sua sinteticissima descrizione dicendo che le molecole organiche possiedono almeno uno stato eccitato caratterizzato da un'energia superiore a quella del livello fondamentale: è appunto la transizione delle molecole tra il livello fondamentale e un livello eccitato che sta alla base dell'effetto laser. È da puntualizzare il fatto che lo spettro di irraggiamento di un colorante organico pre senta parecchi massimi ed ha un'estensione tale da coprire un'ampia gamma di lunghezze d'onda (ampiezza della gamma variabile tra 0,2 e 0,3 µm): questa larga banda deriva dal fatto che il livello eccitato si suddivide in numerosi sottoIivelli eccitati in cui si possono collocare le molecole organiche. Questo comporta che: – eccitando una molecola con un fotone di energia E, si può portare la molecola a un livello sufficientemente elevato per cui, una volta che essa ritorni allo stato stabile, non eccitato, libera l'energia E sotto forma di radiazione luminosa; – esiste per di più tutto un insieme di valori nell'intorno di E, prossimi gli uni agli altri, in corrispondenza a cui la molecola può vibrare ed emettere luce quando ritorna stabile. Poiché l'energia e la frequenza della radiazione luminosa emessa sono proporzionali tra di loro, si avrà quindi anche tutto un insieme di lunghezze d'onda di valore prossimo l'uno all'al tro, e quindi la rilevazione di uno spettro a bande, caratteristico per tali coloranti organici. Sotto molti aspetti le caratteristiche dei laser a colorante risultano superiori a quelle dei laser a cristallo con funzionamento impulsivo. Diamo un elenco delle loro più interessanti proprietà: a) È possibile ottenere, tramite i laser a colorante, l'emissione di un raggio luminoso di una qualsivoglia lunghezza d'onda: infatti l'effetto laser è specifico di ogni colorante, che emette su di una determinata lunghezza d'onda (o meglio, come si è detto, su di una determinata banda di lunghezza d'onda); però il numero di coloranti è molto grande e quindi è possibile, caso per caso, la scelta del colorante più idoneo ad emettere nella voluta zona dello spettro. Si tenga presente che con i coloranti attualmente impiegabili si realizzano laser che coprono un campo di lunghezza d'onda da 330 a 1.170 nm. b) È possibile accordare in frequenza un laser a colorante, cioè variarne la lunghezza d'onda di emissione, mediante la variazione di uno o più parametri che lo caratterizzano (tipo di solvente, concentrazione del colorante e sua temperatura, lunghezza della cavità e riflettività degli specchi, durata dell'impulso di pompaggio). Questa proprietà è molto interessante, però le variazioni di lunghezza d'onda ottenibili sono piuttosto limitate. c) L'impiego di un liquido come mezzo attivo comporta una maggiore uniformità delle proprietà ottiche del mezzo e il suo più agevole raffreddamento quando si hanno elevate frequenze di funzionamento impulsivo del laser. 26 Si tenga presente che per far funzionare un laser a colorante non è indispensabile utilizzare un solvente liquido: si sono infatti realizzati anche laser a colorante in cui il mezzo attivo è costituito da una soluzione di colorante dispersa in un materiale plastico. 27 Il pompaggio ottico può essere realizzato mediante un altro laser (generalmente un laser a rubino) o mediante una lampada flash. - E.154 d) Il rendimento dei laser a colorante è molto prossimo a quello dei laser solidi ed è, ad ogni modo, molto superiore a quello dei laser a gas. e) Il costo della soluzione di colorante è notevolmente inferiore a quello di un qualsiasi altro mezzo attivo. I laser liquidi inorganici sono nati dal tentativo di imitare, valendosi di un mezzo attivo liquido, i processi che avvengono in un laser solido. Precisamente nei laser solidi l'emissione della luce è dovuta a degli atomi attivi (solitamente di terre rare) dispersi in un reticolo cristallino o amorfo (vetro); nei laser liquidi inorganici si realizza l'emissione laser valendosi degli stessi atomi attivi, posti però in una soluzione. Ad esempio un laser di questo tipo è stato realizzato valendosi dell'elemento europio – che è una terra rara – fissato in certe molecole chiamate «chelati», le quali sono disciolte in un opportuno solvente (o vengono disperse in un plastico). Un tale laser emette luce rossa ed è in grado di funzionare anche alla temperatura ambiente, ma solo in maniera impulsiva. Questo laser ha il difetto che solo una piccola parte del materiale contenuto nella cavità risonante prende parte all'azione laser, per cui l'energia del fascio risulta molto minore di quella di un laser solido convenzionale. 5. Cenno sui campi di utilizzazione dei laser Per concludere l'argomento dei laser, facciamo una breve panoramica su quelli che sono i suoi principali campi di utilizzazione. Applicazioni scientifiche Il laser costituisce un mezzo sperimentale efficacissimo nello studio sia dell'interazione della luce con la materia sia della struttura stessa della materia. In campo chimico il laser può essere impiegato per influenzare e controllare reazioni chimiche. Mediante eccitazione di stati vibrazionali solo in alcune molecole di una sostanza, si può agire in modo selettivo sulla reazione chimica. I laser sono stati impiegati per studiare alcuni cambiamenti di fase, come il congelamento, o per produrre alcune reazioni fotochimiche. In parecchi esperimenti di spettroscopia è vantaggioso sostituire le sorgenti di luce convenzionali con i laser. I laser a impulso gigante sono stati impiegati per determinare la densità e l'effettiva tem peratura degli elettroni in un plasma, cioè in quello stato ionizzato della materia di fondamentale importanza nelle ricerche relative alla fusione nucleare. I laser sono in grado di produrre plasmi. Un laser a rubino ad impulso gigante, focalizzato con una semplice lente in aria, può ionizzare l'aria e dar luogo alla produzione di una scintilla. Un intenso raggio laser, focalizzato su opportune sostanze assorbenti, è in grado di vaporizzarle, consentendo così lo studio di vari fenomeni che si manifestano ad elevata temperatura, come i frammenti molecolari e gli atomi fortemente ionizzati. Un laser è anche la sorgente di luce ideale per potere effettuare misure molto precise di lunghezza, mediante un interferometro. L 'intensità e la coerenza del raggio laser consentono di fare determinazioni interferometriche su distanze molto più ampie di quanto fosse precedentemente possibile (telemetria a laser). Mediante telemetri a laser – misuranti i tempi di andata e ri torno di un impulso luminoso diretto su un satellite e da questo riflesso – è stato possibile stu diare con grande precisione le traiettorie dei satelliti e da queste risalire alla esatta conoscenza del campo gravitazionale terrestre, cioè anche alla determinazione della forma della Terra e alla distribuzione interna delle sue masse. Applicazioni tecnologiche Tramite una telemetria a laser, è possibile misurare, controllare e comandare, a qualche decimo di micron, il movimento delle macchine utensili. A causa della ottima direzionalità e della piccolissima divergenza angolare della sua emissione, che rendono il fascio laser una linea retta ideale, il laser viene utilizzato con successo per risolvere problemi di allineamento nelle co - - E.155 struzioni (accoppiato con livelle ottiche, teodoliti od altri sistemi di controllo); esso ha infatti diversi vantaggi sui sistemi di allineamento convenzionali, come la facilità di installazione e di impiego, la possibilità di effettuare osservazioni anche al buio o di notte, il fatto di costituire una linea effettivamente visibile ed individuabile lungo tutto il suo percorso: questo con una precisio ne di allineamento ottenibile che può arrivare a 5 mm su 360 m. Tra le utilizzazioni più diffuse del laser come sistema di allineamento si debbono ricordare quello dell'allineamento dei binari dei treni, quello della determinazione della direzione e dell'inclinazione di gallerie, scavi, dragaggi ecc. Una delle applicazioni che ha maggiormente contribuito alla pubblicità del laser è l'esecuzione di fori di elevatissima precisione (anche in materiali di notevole durezza) e di ridottissimo diametro. Con impulsi laser ad alta potenza si riesce a forare il diamante in tempi brevi. Fori di precisione si possono realizzare anche su pietre, denti e perfino oggetti tanto delicati quanto un capello umano. Anche la microsaldatura rappresenta un'altra importante applicazione dell'effetto laser, in quanto consente di saldare insieme fili di diametro dell'ordine dei micron, come per esempio nei circuiti elettronici integrati. Come lettore ottico il laser è impiegato nei computer per leggere, scrivere, memorizzare informazioni. Nei compact disc (CD) e nei DVD l'informazione è scritta da un laser che traccia un microsolco nel disco in modo che localmente, punto per punto, la profondità del solco deter mini una variazione della riflettività del disco. Il laser usato come lettore ottico dell'informazione ha una potenza inferiore al laser usato come scrittore. Il lettore ottico invia un pennello luminoso sul microsolco e registra le variazioni locali di riflettività che verranno ritrasformate elettronicamente nell'informazione originaria. Applicazioni mediche Oltre che per la fotodecomposizione dei tessuti, i laser sono impiegati anche per il trat tamento di alcuni tumori, come per esempio il melanoblastoma, che è un tumore fortemente pigmentato della pelle. L'impiego del laser in sostituzione del bisturi consente di intervenire in modo selettivo sulle cellule tumorali senza danneggiare le cellule sane (ablazione termica). Oltre all'azione termica e chimica i laser sono impiegati anche per il loro effetto meccanico in quanto in determinate condizioni generano onde d'urto in grado di provocare la frantumazione di depositi calcarei come i calcoli renali. Nella diagnostica il laser è sfruttato perché eccita la fluorescenza delle cellule pigmentate e così ne favorisce l'identificazione. Il laser può essere impiegato come “pinzetta ottica” per lo studio delle cellule. Per esempio il laser è in grado di immobilizzare come in una trappola ottica alcune cellule oppure rimuoverle dal loro sito. Impiego del laser in oftalmologia L'assorbimento selettivo dell'energia luminosa da parte dei tessuti biologici rende il laser particolarmente efficace in campo oftalmico in quanto può attraversare strutture delicatissime (cornea, cristallino) e raggiungere la retina senza provocare danni alle zone attraversate: – Fotocoagulazione della retina. Nei casi di distacco retinico può essere eseguita con un laser a rubino la saldatura della retina facendo passare il fascio attraverso la cornea e il foro pupillare e intervenendo direttamente sui punti da saldare. – Cheratoctomia fotorifrattiva (PRK). E' un intervento chirurgico sulla cornea consistente nell'esecuzione di piccole incisioni radiali eseguite in prossimità della periferia corneale e quindi la riduzione del vizio rifrattivo (miopia). Un altro metodo consiste nel rimodellare la curvatura della superficie corneale utilizzando il laser per asportare il tessuto corneale. – Rimozione della cataratta. Si tratta di un intervento necessario per sopravvenuta opacizzazione della capsula che contiene il cristallino. Si interviene con un laser impulsato al neodimio-YAG. In questo caso si sfrutta un effetto non termico del laser. Le onde d'urto - E.156 provocate dagli impulsi laser ad altissima densità di energia che incidono sul tessuto biolo gico a intervalli di circa 10 ns possono provocare la rimozione della cataratta con ripristino della visione quasi istantaneo. – Oftalmoscopia laser. Si tratta di una tecnica diagnostica che consiste nell'ispezione della retina mediante un laser elio-neon di bassissima potenza (circa 40 milionesimi di watt). - E.157 - Q - LE FIBRE OTTICHE 1. La storia delle fibre ottiche L'idea delle comunicazioni ottiche è molto antico. L'invio di messaggi per mezzo della luce è certamente altrettanto antico quanto i primi segnali con fuochi o con nuvole di fumo e si è trasformato in tempi più recenti nell'uso di lampade di segnalazione per le comunicazioni tra navi in navigazione. Tuttavia, i primi brevetti per sistemi di comunicazioni ottiche si hanno solo nel 1880. In quel periodo, Alexander Graham Bell ottenne brevetti per il suo fotofono e dimostrò la possibilità di comunicazioni su un fascio di luce a una distanza di 200 metri. Il fotofono, illustrato nella figura 1, utilizzava una cellula fotosensibile al selenio per rivelare variazioni di intensità in un fascio di luce. Tuttavia, questo, come pure tutti i metodi sopra ricordati, dipendono dall'atmosfera e dal mezzo in cui avviene la trasmissione, e chiunque abbia mai guidato in mez zo alla nebbia o in una giornata con molta foschia sa bene come ci si possa fare ben poco affi damento. Figura 1. Rappresentazione schematica del fotofono di Alexander G. Bell. Una guida d'onda fatta di materiale non conduttore dell'elettricità (un dielettrico) che sia in grado di trasmettere la luce, quale vetro o plastica, costituirebbe un mezzo di trasmissione ben più affidabile in quanto non è soggetto alle variazioni dell'atmosfera. Anche questa idea di guidare la luce attraverso un dielettrico non è affatto nuova. Nel 1870 John Tyndall mostrò che la luce poteva essere guidata lungo un flusso d'acqua. L'esperimento di Tyndall è illustrato nella figura 2. Una teoria delle guide d'onda dielettriche venne invece sviluppata nel 1910 da Hondros e Debye. Figura 2. L'esperimento di Tyndall che mostrò che una corrente d'acqua può guidare un flusso di luce. - E.158 Il passo decisivo che ha reso le guide d'onda in fibra ottica il principale antagonista del filo di rame come mezzo di trasmissione dell'informazione è stato propiziato da due eventi. Il primo fu la dimostrazione del primo laser funzionante avvenuta nel 1960. Il secondo fu un calcolo effettuato nel 1966 da una coppia di scienziati, Charles Kao e George A. Hockham, secondo il quale le guide d'onda in fibra ottica avrebbero potuto competere con i cavi coassiali esistenti usati per le telecomunicazioni se le fibre avessero potuto trasmettere l'1% della luce per una distanza di 1 chilometro. E' importante notare che in quel periodo l'energia luminosa che poteva essere trasmessa scendeva all'1% del suo valore iniziale dopo appena 20 metri nelle fibre di migliore qualità esistenti e che nessun esperto in tecnologia dei materiali avrebbe potuto prevedere che questa alta qualità di trasmissione si sarebbe mai potuta raggiungere. Molti gruppi di ricerca cominciarono però a lavorare attivamente in vista di questa possibilità. Nel 1970 la Corning Glass studiò la possibilità di usare vetri di silice per le fibre ottiche e fu la prima a ottenere una trasmissione maggiore dell'1% su una distanza di 1 km. Il gruppo del la Corning aumentò poi la potenzialità di trasmissione a più del 40% su un 1 km. Oggi sono state raggiunte trasmissioni del 95-96% su un 1 km. Per fare un confronto, se l'acqua dell'oceano avesse un potere di trasmissione di circa il 79% per ogni chilometro di profondità sarebbe possi bile vedere il fondo dei più profondi abissi dell'oceano ad occhio nudo. La curva in figura 3 illustra i progressi della trasmissione attraverso le fibre ottiche. Figura 3. I progressi nella trasmissione in fibre ottiche. Gli ultimi due punti sono vicini ai limiti teorici per la trasmissione a 0,85 e 1,55 µm. Il raggiungimento di capacità di trasmissione con bassa perdita, insieme ai tradizionali vantaggi di trasportare una grande quantità di informazione, cioè grande capacità di trasmissio ne, insensibilità ai disturbi elettromagnetici e piccole dimensioni e peso, ha prodotto la nascita di una tecnologia completamente nuova. Le fibre ottiche sono divenute il mezzo più diffuso per le applicazioni nelle telecomunicazioni. Per esempio, il sistema TAT-8 (Trans-Atlantic Telephone 8), completato nel 1988, è un collegamento di 6500 km, tutto in fibra ottica, che ha portato la ca pacità di trasmissione transatlantica all'equivalente di 20.000 canali telefonici. Questo dato è da confrontare con TAT-1, completato nel 1955, che trasportava 50 canali telefonici su cavo coassiale. Anche la Pacific Bell ha convertito tutti i suoi cavi coassiali in cavi a fibra ottica e prevede la conversione completa del sistema di telecomunicazioni entro il 2025. Le fibre ottiche sono ampiamente usate anche nelle reti locali di computer (LAN, Local Area Network) usate per la trasmissione di dati e di voce all'interno di uno stesso edificio o tra edifici diversi. Molti nuovi edifici vengono attualmente costruiti con reti di fibre ottiche incorporate nelle loro strutture per poter essere utilizzate in future LAN. - E.159 Le fibre ottiche sono usate anche in applicazioni in cui costituiscono parti essenziali di sensori (sensori a fibre ottiche) dove la loro alta sensibilità, le basse perdite e l'impossibilità di interferenze con radiazioni elettromagnetiche possono essere sfruttate a fondo. Le fibre ottiche sono versatili ed è possibile progettare sensori per rivelare molti parametri fisici, quali temperatura, pressione, tensione e intensità di campi elettrici e magnetici, attraverso le proprietà di trasmissione di potenza delle fibre multimodali o le proprietà di sensibilità alla fase delle fibre monomodali. Un'altra applicazione delle fibre ottiche consiste nella produzione di fasci luminosi per usi medici. I laser utilizzati in chirurgia e in diagnostica vengono accoppiati a fibre ottiche per fornire fasci luminosi in posizioni altrimenti inaccessibili all'interno del corpo umano. 2. Ottica geometrica e fibre ottiche La luce come campo elettromagnetico Come sappiamo la luce, attraverso la quale vediamo il mondo attorno a noi, è una parte dell'intervallo, o spettro, di onde elettromagnetiche che si estende dalle onde radio ai raggi gam ma di alta energia (figura 4). Queste onde, una combinazione di campi elettrici e magnetici, che possono propagarsi anche nel vuoto, hanno come principale caratteristica la lunghezza d'onda e la frequenza di oscillazione. L'intervallo di lunghezze d'onda della luce visibile va da 400 nanometri (nm) a circa 700 nanometri. (Un nanometro è un miliardesimo di metro). Nella maggior parte delle applicazioni delle fibre ottiche, le sorgenti di radiazione elettromagnetica più utilizza te emettono appena al di fuori del visibile, nel vicino infrarosso con lunghezze d'onda di circa 800 e circa 1500 nanometri. Figura 4. Lo spettro elettromagnetico. Può essere difficile seguire ciò che accade in un sistema a fibre ottiche se si rappresenta la propagazione della luce nel sistema in termini di moto ondulatorio della luce. Nei casi più semplici è più facile pensare alla luce che si propaga in termini di una serie di raggi che si muovono nello spazio. Un esempio familiare della luce intesa come costituita da un insieme di raggi è fornita dalla luce del Sole che dardeggia attraverso le nuvole in una giornata parzialmente co perta. Nel vuoto, la luce si propaga alla velocità di circa 3x10 8 metri al secondo. Nei mezzi materiali, come l'aria, l'acqua o il vetro, la sua velocità è minore; per l'acqua la riduzione è di circa il 25%; nel vetro la riduzione di velocità può variare dal 30% a quasi il 50% . La luce nei materiali Nel maggior parte dei casi il risultato dell'interazione della luce con i mezzi materiali può essere espresso da un unico numero, l'indice di rifrazione del mezzo: L'indice di rifrazione è il rapporto tra la velocità della luce nel vuoto, c, e la velocità della luce nel mezzo, v. n = c/v. (1) Poiché la velocità della luce nei mezzi è sempre minore della velocità nel vuoto, l'indice di rifrazione è sempre maggiore di 1. Nell’aria il suo valore è molto vicino a 1; nell'acqua è di cir ca 4/3 (n =1,33); nei vetri varia da circa 1,44 a circa 1,9. - E.160 Ci sono alcune precisazioni da fare per completare il semplice quadro appena delineato. Innanzitutto, l'indice di rifrazione varia al variare della lunghezza d'onda della luce. Questo fenomeno è detto dispersione d'onda. In secondo luogo, non solo il mezzo rallenta la luce, ma può anche assorbire parte della luce che lo attraversa. In un mezzo omogeneo, cioè in un mezzo che ha indice di rifrazione costante in tutta la sua estensione, la luce si muove in linea retta. La luce si discosta dalla sua direzione iniziale solo quando incontra una variazione, o discontinuità, nell'indice di rifrazione. Nel caso di variazione dell'indice di rifrazione di un mezzo, il comportamento della luce è governato dal modo in cui l'indice varia nello spazio. Per esempio, l'aria appena sopra una strada riscaldata dal Sole è meno densa dell'aria che sta più in alto. In questo caso si parla di gradiente dell'indice di rifrazione; il sistema è equivalente a un grande prisma posto sopra la strada con il vertice diretto verso il basso (vedi figura 5). La luce proveniente da un oggetto posto sulla strada si dirige solo in parte direttamente verso l'occhio dell'osservatore, mentre un'altra parte della luce proveniente dall'oggetto che normalmente sarebbe assorbita dalla strada si piega verso l'osservatore. Il risultato è che una persona che guarda verso la strada vede un'im magine riflessa, ovvero un miraggio, di un oggetto distante che si trovi sulla strada, come se questo si riflettesse in uno specchio d'acqua. Questo graduale piegarsi della luce per effetto di un gradiente dell'indice di rifrazione è usato nelle fibre ottiche per accrescere la capacità delle fibre di trasportare informazione e per ottenere lenti molto compatte utilizzabili nei sistemi a fibre ottiche. Figura 5. Deflessione dei raggi di luce in presenza di un gradiente dell'indice di rifrazione. Un esempio sono i miraggi che si osservano sulle strade riscaldate dal sole. Se la variazione dell'indice di rifrazione non è graduale, come nel caso del gradiente di indice di rifrazione sopra descritto, ma consiste invece in un improvviso cambiamento del tipo che si ha nel passaggio dal vetro all'aria, la direzione di propagazione della luce è retta dalla leggi dell'ottica geometrica. Se l'angolo di incidenza θi di un raggio è l'angolo formato dal raggio incidente e una retta perpendicolare alla superficie di separazione nel punto in cui il raggio inci de sulla superficie (figura 6), allora: 1. L'angolo di riflessione, θr, misurato anch'esso rispetto alla perpendicolare (normale), è uguale all'angolo di incidenza: θr = θi (2) 2. L'angolo formato dal raggio trasmesso con la normale (angolo di rifrazione) è dato dalla relazione: nt sen(θt) = ni sen(θi) (3) - E.161 La prima di queste relazioni è la ben nota legge della riflessione; la seconda è la legge della rifrazione, o legge di Snell. Figura 6. Geometria delle riflessione e della rifrazione. Figura 7. Geometria della riflessione totale. Il raggio 1 ha un angolo di incidenza minore dell'angolo limite; il raggio 2 incide con angolo di incidenza uguale all'angolo limite; il raggio 3 è riflesso totalmente. Generalmente, un materiale che ha indice di rifrazione maggiore di quello di un altro viene detto più denso (cioè otticamente più denso) del secondo. Pertanto, un raggio di luce viene spostato verso la normale quando passa in un mezzo meno denso, mentre la luce che entra in un mezzo meno denso viene allontanata dalla normale. Nella figura 7 una serie di raggi di luce che si muovono in mezzo più denso incidono con angoli diversi sulla superficie di separazione con un mezzo meno denso. Il raggio 1 viene rifratto sulla superficie di separazione con un mezzo meno denso secondo la legge di Snell. Il raggio 2 incide con un angolo tale che viene rifratto a 90°. Il raggio 3 incide con un angolo ancora più grande. Se l'angolo di incidenza del raggio 3 fosse inserito nella legge di Snell, il seno dell'angolo di rifrazione risulterebbe maggiore di 1! E ciò non può essere. Accade invece che tutta la luce viene riflessa nel mezzo di partenza. Non vi è luce trasmessa nel secondo mezzo. Si dice che la luce viene riflessa totalmente (riflessione totale interna). Per tutti gli angoli maggiori di un angolo limite, si ha quindi il fenomeno della riflessione totale interna. Questo angolo limite si ha in corrispondenza dell'angolo di incidenza per il quale il raggio trasmesso viene rifratto parallelamente alla superficie di separa- - E.162 zione tra i due mezzi (è il caso illustrato per il raggio 2). Prendendo l'angolo di rifrazione pari a 90°, l'angolo limite, θcrit, si trova per mezzo dell'equazione (3): sen(θcrit) = nt/ni (4) Nella rappresentazione dei raggi, il concetto di riflessione totale rende la superficie di separazione uno specchio perfetto. Se il processo viene analizzato in termini di propagazione ondulatoria, la teoria prevede, e l'esperienza conferma, che nel mezzo meno denso esiste un debole campo elettromagnetico, che però si annulla rapidamente all'aumentare della distanza dalla superficie di separazione e nel mezzo meno denso non viene trasmessa energia. Questo campo è detto campo evanescente. Tuttavia, se molto vicino (più o meno a una distanza dell'ordine di una lunghezza d'onda) al materiale in cui si presenta la riflessione totale fosse posto un altro mezzo otticamente denso, una parte dell'energia luminosa potrebbe sfuggire dal primo mezzo denso e passare nel secondo mezzo denso attraverso la piccola intercapedine occupata dal mezzo meno denso. Questo processo è detto riflessione totale frustrata, poiché la normale riflessione viene frustrata dal posizionamento del secondo mezzo denso in prossimità della superficie di separazione. Alla riflessione totale frustrata è dovuto il funzionamento di un compo nente per sistemi in fibra ottica chiamato accoppiatore bidirezionale, che studieremo più avanti. La luce nelle fibre ottiche Una volta capito il fenomeno della riflessione totale interna, si capisce anche il flusso d'acqua luminoso illustrato nella figura 2. La luce che si muove attraverso l'acqua viene riflessa sulla superficie di separazione acqua-aria e intrappolata all'interno del flusso. Lo stesso feno meno si presenta su un'asta o su un filo di vetro. Le fibre ottiche sono però un po' più comples se. Se si utilizza una fibra fatta solo di un filo di vetro o di plastica, la luce potrebbe andare perduta in ogni punto in cui la fibra tocca una superficie di supporto. Pertanto la quantità di luce che potrebbe essere trasmessa dipenderebbe dal metodo utilizzato per sostenere la fibra e dai movimenti della fibra. Per eliminare questi inconvenienti, la porzione centrale della fibra destinata al trasporto della luce, chiamata nucleo (core), viene circondata da una regione cilindrica, chiamata mantello (cladding) (figura 8). Il mantello è ricoperto di un rivestimento (buffer) cilindrico protettivo di plastica. Figura 8. Fibra con indice a gradino. A destra è mostrato il profilo dell'indice di rifrazione. - E.163 Poiché la differenza tra gli indici di rifrazione del nucleo e del mantello è minore di quella che si avrebbe con il nucleo in aria, l'angolo limite è molto più grande per la fibra rivestita. L'indice del mantello, ncl, è minore dell'indice del nucleo, ncore, perché la riflessione totale si ha solo se ncore>ncl. Se si considera una sezione longitudinale della fibra, come nella figura 8, si vede che il cono di raggi che viene accettato dalla fibra è determinato dalla differenza tra gli indici di rifrazione del nucleo e del mantello. La variazione relativa degli indici di rifrazione è data da ∆ = (ncore - ncl)/ncore (5) Poiché l'indice di rifrazione del nucleo è costante e l'indice cambia bruscamente alla superficie di separazione nucleo-mantello, il tipo di fibra illustrato nella figura 8 è detto fibra step index (con indice a gradino). Per trovare le dimensioni del cono di luce che può essere accettato da una fibra ottica con una determinata variazione relativa degli indici di rifrazione si usa la definizione di angolo limite. Nella figura 8 è indicato un raggio che incide sulla superficie di separazione nucleomantello con un angolo pari all'angolo limite. Se l'angolo di apertura del cono è θc, allora la legge di Snell porta a: ni sen θc = ncore sen θt = ncore sen (90 - θcrit) = ncore cos(θcrit) = ncore (1 – sen2(θcrit))1/2 Dall'equazione (4), sen(θcrit) = ncl/ncore, si ha: ni sen θc = (ncore2 – ncl2)1/2 (6) L'apertura numerica, AN, è una misura della quantità di luce che può essere raccolta da un sistema ottico, sia che si tratti di una fibra ottica, sia che si tratti dell'obiettivo di un micro scopio o di una macchina fotografica. E' data dal prodotto dell'indice di rifrazione del mezzo di provenienza dei raggi luminosi per il seno del massimo angolo con il quale i raggi possono penetrare nel sistema AN = ni sen(θmax) (7) Nella maggior parte dei casi, la luce proviene dall'aria ed ni = 1. In questo caso, l'apertura numerica di una fibra step index (con indice a gradino) risulta, dalle equazioni (6) e (7), AN = (ncore2 – ncl2)1/2 (8) Se ∆ << 1, l'equazione (8) può essere approssimata da: AN = [(ncore + ncl)(ncore - ncl)]1/2 = ((2ncore)(ncore ∆))1/2 = ncore(2∆)1/2 (9) La condizione per cui ∆ << 1 è chiamata approssimazione della guida debole. La dispersione modale Nella figura 9 sono illustrati due raggi. Uno, il raggio assiale, viaggia lungo l'asse della fibra; l'altro, il raggio marginale, viaggia lungo un cammino vicino all'angolo limite per la superficie di separazione nucleo-mantello ed è il raggio con il maggior angolo che consenta ancora la propagazione all'interno della fibra. Nel punto in cui il raggio marginale incide sulla superficie di separazione, il raggio ha percorso un cammino L2, mentre il raggio parassiale ha percorso un cammino L1. Sulla base di semplici considerazioni geometriche, si trova che sen(θcrit) = ncl/ncore = L1/L2 (10) - E.164 Nel caso della figura, la lunghezza L2 è più grande di L1 per un fattore ncore/ncl. Per qualunque lunghezza L della fibra la distanza in più percorsa dal raggio marginale è data da: δL = (ncore - ncl)L/ncl (11) L'equazione (11) può essere semplificata ponendo δL = L∆. Il tempo in più impiegato dalla luce a viaggiare lungo il raggio marginale è dt = dL/v = L∆ncore/c (12) Figura 9. Schema per la derivazione del ritardo differenziale di tempo in una fibra step-index. Pertanto, un impulso di lunghezza t rappresentante un bit di informazione sarà allungato a t + dt. Questo ritardo differenziale di tempo tra raggi assiali e marginali fa sì che gli impulsi perdano di nitidezza e limita così il numero di impulsi al secondo che possono essere tra smessi su una fibra e che possono giungere distinti all'altra estremità della fibra. In tal caso, il sistema può risultare limitato non tanto dalla velocità con la quale può essere commutata la sorgente, o dalla velocità di risposta del rivelatore, ma dal ritardo differenziale di tempo della fibra. Questa perdita di nitidezza degli impulsi viene detta dispersione modale. La conseguenza della dispersione modale è la degradazione della forma dell'impulso. Poiché il massimo ritardo dipende dalla lunghezza della fibra, risulta che la deformazione è tanto maggiore quanto più lunga è la fibra. Dalla formula (12) si ricava per esempio che per una fibra con ∆ = 0,1 e ncore = 1,5 l'allargamento di un impulso dovuto alla dispersione modale è pari a 0,5 µs per chilometro di lunghezza della fibra. La dispersione modale può essere evitata con l'uso di fibre a indice graduato o di fibre monomodali. Si è già fatto notare che i raggi luminosi possono essere deviati da variazioni dell'indice di rifrazione del mezzo in cui si propagano o dall'incontro improvviso con la superficie di separazione tra due mezzi a indice diverso. Vi sono numerosi metodi per produrre gradienti di indice controllati. Alcuni prevedono l'introduzione di impurità in strati sottili di vetro mentre vengono deposti su un substrato. Questo non è un processo continuo poiché l'indice di rifrazione di ciascuno strato è quasi costante. Le corrispondenti variazioni di indice di rifrazione in una fibra asso migliano a una serie di anelli concentrici del tipo che si osservano sezionando un tronco d'albero e non sono affatto variazioni graduali dell'indice. Altre tecniche sono basate sulla rimozione di materia dalla base di vetro mediante qualche tipo di trattamento chimico. Le fibre il cui nucleo ha un tale indice graduato sono dette fibre a indice graduato. Nella trattazione che segue non si farà distinzione tra i diversi procedimenti, ma si assumerà che le fibre a indice graduato siano - E.165 sottili ed esattamente conformi alla teoria. Nelle fibre ottiche a indice graduato reali ciò può non essere vero e la differenza rispetto al gradiente teorico di indice può condizionarne l'effettivo funzionamento. Una volta che si sappia controllare il gradiente dell'indice di rifrazione nel processo di produzione, è compito del progettista di fibre ottiche determinare i più utili profili di indice di rifrazione, n(r), cioè la variazione con la distanza radiale all'interno del core. Generalmente si assumono i seguenti profili di indice: n2(r) = n02 [1 - 2∆(r/a)α] (13) in cui n0 è l'indice di rifrazione al centro del core e ∆ è la variazione relativa degli indici di rifrazione definita nell'equazione (5), in cui però ora vi è n0 al posto di ncore. Il parametro α è l'esponente che determina la forma del profilo della fibra a indice graduato. Per α = ∞, il profilo è quello di una fibra con indice a gradino (step index). Per α = 2, il profilo è parabolico (figura 10). Si tratta del profilo utilizzato nella maggior parte di fibre ottiche per telecomunicazioni, in quanto elimina il ritardo tra raggi marginali e raggi assiali. L'apertura numerica di una fibra a indice graduato è la stessa di quella di una fibra con indice a gradino solo per i raggi che entrano nella fibra lungo l'asse. Per raggi che entrano in altri punti del nucleo, l'apertura numerica locale è minore perché nell'equazione (8) si deve utilizzare l'indice locale, n(r). Nel caso di una fibra a indice graduato parabolico, la quantità totale di luce che può essere raccolta è metà di quella che può essere raccolta da una fibra step index con lo stesso . Figura 10. Fibra a indice graduato. A destra è mostrato il profilo dell'indice di rifrazione. I raggi divergenti sono rifocalizzati in un punto successivo della fibra. Senza dover effettuare la trattazione matematica che permette di dimostrare che le fibre a indice graduato con profilo parabolico eliminano il ritardo differenziale, è possibile vedere qualitativamente come possa esser ridotto l'allargamento degli impulsi che si propagano in tali fibre. Nelle fibre a indice graduato, i raggi non subiscono sulla superficie di separazione nucleo-mantello la riflessione netta che si ha nelle fibre step index, ma descrivono cammini con curvature non brusche. In quelle a profilo parabolico, questo cammino è sinusoidale, cioè può essere de scritto come una funzione con andamento sinusoidale in funzione dello spazio. I percorsi che hanno grande ampiezza radiale siano comunque più lunghi di quelli in prossimità dell'asse della fibra, ma, a causa del gradiente dell'indice di rifrazione, la velocità della luce al centro della fibra è minore della velocità in prossimità del bordo del core. Per quanto la luce che si muove in prossimità del bordo percorra un tratto maggiore, essa si muove più velocemente e arriva alla fine della fibra nello stesso istante della luce che viaggia vicino all'asse. Se la lunghezza della fibra è L e la velocità della luce nel centro della fibra è v = c/n0, allora il tempo impiegato da un impulso a raggiungere l'estremità della fibra sarà t = L/v =n0L/c. Per la luce che descrive un percorso si- - E.166 nusoidale, il tratto percorso sarà L" e il tempo impiegato a raggiungere l'estremità della fibra sarà t = n(r, z)L"/c. Il prodotto del cammino geometrico per l'indice di rifrazione è detto cammino ottico. Se il cammino ottico, n(r)L, è lo stesso per tutti i cammini geometrici, allora non ci sarà ritardo per i diversi raggi che percorrono tutta la fibra. Perché i cammini ottici siano uguali, il profilo deve essere parabolico (α = 2). Lenti a indice graduato Una cosa importante da notare nella figura 10 è che i raggi iniettati in un punto di una fibra a indice graduato si sparpagliano e poi tornano a incrociarsi in uno stesso punto dell'asse proprio come accade per i raggi provenienti da un punto che vengono focalizzati da una lente in un punto, immagine del punto oggetto. La distanza percorsa da un raggio per effettuare un intero percorso sinusoidale (ciclo) è detto passo della fibra. La lunghezza del passo è determinata da ∆, la variazione relativa degli indici di rifrazione. Se una fibra a indice graduato con profilo parabolico viene tagliata con una lunghezza pari a un quarto del passo, essa diventa una lente estremamente compatta (detta talvolta lente GRIN, cioè lente a indice graduato) per applicazioni sulle fibre ottiche (figura 11). Posizionando l'uscita di una fibra sulla faccia di questo spezzone di fibra, la luce proveniente dalla lente sarà collimata, proprio come è collimato il fascio divergente proveniente dal fuoco di una lente. Poi ché le sue proprietà derivano dalla sua lunghezza, questa lente a indice graduato viene detta generalmente lente a quarto di passo o lente 0,25 pitch. Figura 11. Lenti a indice graduato: a) 0,25 pitch; b) 0,29 pitch. In alcuni casi, non è richiesta la collimazione di fasci luminosi, ma la focalizzazione del la luce uscente dalla fibra su rivelatori di piccole dimensioni, oppure la focalizzazione dell'uscita di una sorgente sul nucleo di una fibra. Il modo più semplice di ottenere ciò è di aumentare leg germente la lunghezza della lente GRIN sino a 0,29 pitch (figura 11). Questo consente al progettista del sistema a fibre ottiche di allontanare la sorgente dalla lente e di avere la luce tra- - E.167 smessa in un punto al di là della lente. Questo accorgimento è particolarmente utile per accoppiare le sorgenti alle fibre e le fibre ai rivelatori. La dispersione cromatica Un'altra causa di degradazione degli impulsi di luce immessi in una fibra ottica è la dispersione cromatica. Poiché il materiale di cui è composta la fibra ottica (vetro) ha un diverso indice di rifrazione per le diverse lunghezze d'onda della luce, i raggi luminosi di diverse lunghezze d'onda si propagano nella fibra con velocità differenti. Un impulso di luce composto da radiazioni di diverse lunghezze d'onda giungerà quindi all'estremità della fibra allargato rispetto all'impulso di origine. Per poter determinare la dispersione cromatica si definisce il suo coefficiente (m) come il rapporto m= d d in cui dτ/dλ rappresenta la derivata del ritardo rispetto alla lunghezza d'onda. Si usa esprimere il coefficiente m in unità di [ps/nm km]. Nota la larghezza dello spettro cromatico della sorgente si può calcolare l'allargamento temporale dell'impulso (∆tc) all'estremità più lontana della fibra alla distanza L tramite la relazione ∆tc = m L ∆λ Si noti che alla lunghezza d'onda di 1.300 nm (infrarosso) per il vetro di silice corrispon de un valore del coefficiente di dispersione cromatica m nullo. Questo valore della lunghezza d'onda si può considerare un riferimento, perché, come si vedrà, presenta anche il minimo valore dell'attenuazione. Supponiamo che la larghezza dello spettro della sorgente (∆λ) sia 70 nm per un impulso centrato alla lunghezza d'onda di 1.200 nm, e che la fibra utilizzata abbia un coefficiente di dispersione cromatica, a quella lunghezza d'onda, m = 15 ps/nm km. L'allargamento dell'impulso dovuto alla dispersione cromatica risulta allora di 70 × 15 × 10-12 s/km = 1 ns/km circa. Quindi per ogni chilometro di lunghezza della fibra si avrà un allargamento dell'impulso di 1 ns. La dispersione cromatica può essere ridotta impiegando sorgenti con stretta larghezza spettrale, per esempio sorgenti monocromatiche (laser) che presentano larghezza di banda tra 1 e 3 nm, anziché sorgenti pluricromatiche (LED) che presentano larghezze di banda comprese tra 40 e 70 nm. 3. Ottica ondulatoria e modi nelle fibre ottiche Anche se la descrizione basata sull'ottica dei raggi semplifica lo studio della propagazione della luce nelle fibre ottiche, essa non rivela alcune interessanti proprietà della propagazione della luce nelle fibre, particolarmente in quelle fibre in cui la dimensione del nucleo è dell'ordine di grandezza della lunghezza d'onda della luce. Campi d’onda in una fibra ottica Le leggi che governano la propagazione della luce all'interno delle fibre ottiche sono quelle descritte dalle equazioni di Maxwell, sono cioè le stesse leggi che descrivono la propaga zione della luce nel vuoto o in un mezzo materiale. Quando le informazioni relative alle costanti del mezzo quali gli indici di rifrazione e le condizioni al contorno per la geometria cilindrica del nucleo e del mantello sono incorporate nelle equazioni di Maxwell, esse possono venire combinate per ottenere un'equazione d'onda che può essere risolta per quelle distribuzioni di campo elettromagnetico che si propagano nella fibra. Le distribuzioni consentite del campo elettromagnetico all'interno della fibra sono dette modi della fibra. Questi sono simili ai modi che si trovano nelle cavità a microonde e nelle cavità laser. Quando il numero di modi consentiti diventa grande, come nel caso di fibre con nucleo di grande diametro, la rappresentazione basata sul l'ottica geometrica fornisce una descrizione adeguata della propagazione della luce nelle fibre. - E.168 La descrizione dei modi che si propagano in una fibra si trova risolvendo l'equazione d'onda in coordinate cilindriche per il campo elettrico della luce nella fibra. Il sistema di coordi nate cilindriche per una fibra è illustrato nella figura 12. Le soluzioni nello spazio e nel tempo, che sono funzioni armoniche (funzioni seno e coseno), sono della forma E(r, ϕ, z) = f(r) cos(ωt – ßz + γ) cos(qϕ) (14) in cui ω è la pulsazione della luce in radianti al secondo (ω = 2πν, con ν la frequenza in hertz), ß è la costante di propagazione, espressa in radianti per unità di distanza, γ è una costante di fase che fornisce l'ampiezza corretta al tempo t = 0 e nel punto z = 0, e q è un numero intero. Il parametro ß è importante per specificare come la luce si propaga nelle fibre. Nella descrizione dell'ottica geometrica, ß è la proiezione del vettore di propagazione sull'asse z; l'ampiezza di questo vettore è k = 2πn/λ0, in cui λ0 è la lunghezza d'onda della luce nel vuoto. Per evitare pericolose confusioni, è importante distinguere tra l'ampiezza del vettore propagazione, k, e la costante di propagazione ß, che è la componente di questo vettore sull'asse z. Figura 12. Sistema di coordinate utilizzato per i modi di una fibra ottica. Sostituendo l'equazione 14 nell'equazione d'onda si ottengono soluzioni per ß, f(r) e q. Le soluzioni dipendono dalla particolare geometria della fibra in considerazione e dal profilo dell'indice di rifrazione, inclusi sia il nucleo sia il mantello. Il profilo dell'indice di rifrazione delle fibre step index è uno dei pochi profili di indice di rifrazione che consentono di ottenere soluzioni esatte. In questo caso le soluzioni f(r) sono funzioni di Bessel. (Le funzioni di Bessel sono funzioni matematiche di livello avanzato, che trovano applicazione in molti casi nella descrizione della propagazione delle onde. Le normali funzioni trigonometriche sono familiari perché studiate nel corso della scuola media superiore, ma è difficile trovare un'onda sinusoidale nella vita quotidiana. Il moto della corda di una chitarra è approssimativamente sinusoidale, ma è difficile da osservare a causa dell'alta frequenza delle vibrazioni. Le funzione di Bessel, invece, si trovano più frequentemente, perché descrivono le oscillazioni di una superficie che si possa muovere liberamente, delimitata da una superficie cilindrica: per esempio, le onde circolari che si propagano sulla superficie del liquido contenuto in una tazzina di caffè). Una grandezza importante per determinare quali modi di un campo elettromagnetico possono essere supportati da un fibra ottica è il parametro chiamato parametro caratteristico di guida d'onda, o anche numero d'onda normalizzato, o, semplicemente numero V della fibra. Viene scritto come V = kf a AN, (15) in cui kf è il numero d'onda di campo libero, 2πn/λ0, a il raggio del nucleo e AN è l'apertura numerica della fibra. - E.169 Quando si riportano le costanti di propagazione (ß) dei modi della fibra in funzione del numero V (si ricordi: ogni numero V rappresenta un particolare prodotto del numero d'onda per il diametro del nucleo per l'apertura numerica), è facile determinare il numero di modi che pos sono propagarsi in una data fibra. Nella figura 13 è riportato un tale grafico per alcuni dei modi di ordine più basso. Il numero dei modi di propagazione è determinato dal numero di curve che incrociano una retta verticale in corrispondenza al numero V della fibra. Si noti che per fibre con V < 2,405, nella fibra può propagarsi solo un modo. Questa è la regione monomodale. La lunghezza d'onda alla quale V = 2,405 è detta lunghezza d'onda di taglio, indicata con lc, poiché, per un particolare prodotto del diametro del core per l'apertura numerica, al crescere della lun ghezza d'onda della radiazione, questa è la lunghezza d'onda alla quale tutti i modi di propaga zione di ordine più alto vengono tagliati e nella fibra si propaga un solo modo. Una fibra che faccia propagare solo il modo HE11 è detta fibra monomodale. Per esempio, la fibra Newport FSV ha un diametro del core di 4 µm e un'apertura numerica di 0,11. Secondo l'equazione (14), questa fibra ha un numero V di 2,19 per luce di 633 nm, valori che la pongono ben all'interno della regione monomodale. Figura 13. Modi di ordine basso in una fibra ottica. Il grafico mostra il valore della costante di propagazione (ß) nella fibra in funzione del numero-V della fibra.. Ogni numero-V rappresenta una determinata configurazione della fibra o una determinata lunghezza d'onda in una fibra di determinata configurazione. Nell'approssimazione di guida debole (∆ << 1), le soluzioni esatte della guida d’onda, HEmn, possono essere sostituite da un’insieme di modi linearmente polarizzati, chiamati modi LP. (I particolari della polarizzazione delle onde nelle fibre ottiche saranno discussi più avanti). I modi LP sono combinazioni dei modi che si trovano con la teoria esatta della guida d'onda. Questi modi linearmente polarizzati possono essere caratterizzati da due suffissi m e n. Il primo suffisso, m, dà il numero di nodi (zeri) azimutali, o angolari, che si presentano nella distribuzione del campo elettrico dei modi; il secondo deponente, n, dà il numero di nodi radiali. Questi possono essere identificati da configurazioni su uno schermo illuminato dall'uscita della fibra. Queste configurazioni sono simmetriche attorno al centro del fascio e presentano regioni luminose separate da regioni scure (i nodi che determinano i numeri d'ordine m e n). Alcune di queste configurazioni sono illustrate nella figura 14. Si assume che il campo nullo sul bordo esterno della distribuzione del campo sia contata come un nodo, cosicché n > 1. Per i nodi azimutali m > 0. Il nodo di ordine più basso HE 11 consiste di due modi LP01 con polarizzazioni ad angolo retto tra loro. La figura 15 mostra le costanti di propagazione di questi modi in funzione del numero V. (Si confronti questa figura con le soluzioni esatte riportate in figura 13). Quando il numero V è maggiore di 2,405 (il valore al quale si ha il primo zero della funzione di Bessel di ordine zero), la fibra ammette il successivo modo polarizzato linearmente, - E.170 LP11, cosicché si possono propagare entrambi i modi LP 01 e LP11. Per una fibra con valore V pari a 3,832 (corrispondente al primo zero della funzione di Bessel di primo ordine), si possono pro pagare due modi polarizzati linearmente: i modi LP 21 e LP02. Cambiando la posizione e l'angolo di un fascio incidente in una fibra multimodale con basso numero V, si possono lanciare nella fibra singoli modi polarizzati linearmente e osservarne l'uscita. Figura 14. Figure di irradiazione per alcuni modi polarizzati linearmente di ordine basso. Figura 15. Modi polarizzati linearmente di ordine basso in una fibra ottica. Da confrontare con la figura 13. I modi nelle fibre multimodali - E.171 Le fibre multimodali usate nelle telecomunicazioni possono avere a = 25 µm e AN = 0,20, oppure a = 50 µm e AN = 0,30, cosicché per luce di 633 nm il numero V risulta di circa 50 o 150, rispettivamente. Ciò significa che la fibra può accettare un gran numero di modi. Per una fibra multimodale il numero M di modi è dato approssimativamente dalla relazione 2 M= 2 a AN 2 La quantità di luce trasportata da ogni modo sarà determinata dall'ingresso, cioè dalle condizioni di lancio. Per esempio, se lo sparpagliamento angolare dei raggi provenienti dalla sorgente è maggiore dello sparpagliamento angolare che può essere accettato dalla fibra (l'apertura numerica della radiazione in ingresso è maggiore dell'apertura numerica della fibra) e il raggio del fascio in ingresso è maggiore del raggio del nucleo della fibra, allora la fibra è detta overfilled (sopracoperta) (figura 16a). In altri termini, una parte della luce che la sorgente indirizza nella fibra non può propagarsi in quest'ultima. Inversamente, quando l'apertura numerica del fascio in ingresso è minore dell'apertura numerica della fibra e il raggio del nucleo è minore del raggio del fascio, la fibra è detta underfilled (sottocoperta) (figura 16b) e nella fibra vengono eccitati solo i modi di ordine più basso (i raggi con piccola angolazione, nella figura). Queste due distribuzioni portano alla misura di diversi valori dell'attenuazione e nel caso della sovracopertura si ha una perdita maggiore che nel caso della sottocopertura. Figura 16. Condizioni di lancio in una fibra ottica multimodale: a) overfilled; b) underfilled. Nella descrizione basata sull'ottica geometrica, i raggi di ordine maggiore restano più tempo in prossimità della superficie di separazione nucleo-mantello e hanno una parte maggiore del loro campo evanescente che si estende nel mantello, ciò che porta a una maggiore atte nuazione. Inoltre, se la fibra viene piegata, i raggi che formano un grande angolo con l'asse del la fibra non possono più soddisfare le condizioni dell'angolo limite e non subiscono riflessione totale. Poiché l'energia di questi modi viene irradiata nel mantello e contribuisce ad aumentare l'attenuazione, questi modi vengono denominati modi di radiazione. C'è un'altra classe di modi, chiamata modi di colaggio (leaky modes). Questi modi hanno parte della loro distribuzione di energia elettromagnetica nel nucleo e parte nel mantello, ma nessuna parte della distribu zione dell'energia si trova nella superficie di separazione nucleo-mantello. L'energia del nucleo "cola" nel mantello con un processo di meccanica quantistica denominato effetto tunnel. I modi - E.172 di colaggio non sono veri modi di guida, ma non possono venire attenuati completamente prima che la luce abbia percorso grandi distanze. Dopo che la luce è stata lanciata in una fibra e ha percorso distanze considerevoli (che possono essere anche di diversi chilometri), nel nucleo della fibra si sviluppa una distribuzione di energia che è essenzialmente indipendente dalla successiva distanza di propagazione. Si ha cioè la cosiddetta distribuzione stabile dei modi. Per generare un'approssimazione di distribuzione stabile dei modi che non possa essere modificata da piccoli piegamenti e torsioni nell'orientamento della fibra, viene usata una tecnica detta di filtraggio dei modi. Il filtraggio dei modi può essere realizzato attraverso l'uso del mode scrambling (aggrovigliamento dei modi). Il "mode scrambling" si realizza piegando la fibra con una serie di corrugamenti, come indicato nella figura 17. L'effetto di questi piegamenti è di disaccoppiare la luce nei modi di radiazione e di colaggio e una porzione della luce nei modi permessi di ordine più alto e di distribuire la luce restante tra i modi guidati della fibra, producendo un'approssimazione della distribuzione stabile dei modi. Il "mode scrambling" consente di effettuare in laboratorio misurazioni ripetibili e accurate dell'attenuazione della fibra, anche con piccoli tratti di fibra. Figura 17. "Mode scrambler". Le pieghe tendono a disaccoppiare i modi di ordine più elevato e i modi di radiazione e in questo modo si distribuisce la luce in una distribuzione di modi che ri mane stabile su grandi distanze. Polarizzazione delle onde Il campo elettromagnetico è una grandezza vettoriale. Entrambe le componenti, intensità di campo elettrico, E, e intensità di campo magnetico, H, sono vettori ad angolo retto tra loro ed entrambe sono, nella maggior parte dei casi, perpendicolari al vettore propagazione della luce, come illustrato nella figura 18. Quando si conosce il vettore propagazione, la cui componente sull'asse z è ß e la cui direzione lungo il raggio luminoso è nota, tutto ciò che è richiesto per definire completamente il campo nel mezzo è la conoscenza del campo elettrico (il campo magnetico può essere determinato dal campo elettrico). La direzione del campo elettrico determina la polarizzazione dell'onda. - E.173 Figura 18. Componenti di un campo elettromagnetico. In molte sorgenti luminose, la direzione e lo stato di polarizzazione della luce varia in modo casuale; si tratta di sorgenti non polarizzate. Altre sorgenti, per esempio i fasci di luce in uscita dai laser, sono polarizzate linearmente. Quando la luce è polarizzata linearmente, il campo elettrico mantiene un orientamento spaziale costante, come illustrato nella figura 19a. Poiché il campo elettrico è un vettore, se ne possono risolvere le componenti lungo due assi perpendicolari. Se tra la due componenti c'è un ritardo di tempo, che può essere tradotto in uno sfasamento, si possono verificare altre forme di polarizzazione. Per esempio, se la differenza di tempo tra le due componenti ortogonali è 1/4 di ciclo (che corrisponde a 1/4 di lunghezza d'on da), la differenza di fase tra le due componenti è di 90°. Il vettore intensità di campo elettrico dell'onda è la risultante delle due componenti e descrive un'ellisse nello spazio (figura 19b). Per questa ragione la luce è detta polarizzata ellitticamente. Come caso particolare, se le due componenti sono uguali e sfasate di 90°, l'onda è polarizzata circolarmente, come illustrato nella figura 19c. Nel caso delle fibre ottiche, a seconda della fibra utilizzata, la polarizzazione della luce trasmessa può essere conservata invariata oppure può essere mescolata alla rinfusa in modo da fornire luce non polarizzata. Figura 19. Forme di polarizzazione della luce: a) polarizzazione lineare; b) polarizzazione ellitti ca; c) polarizzazione circolare. - E.174 Figura 20. Diffusione della luce da un campo polarizzato linearmente (dipolo). La luce è fortemente diffusa ad angoli retti rispetto alla direzione del dipolo, ma non è diffusa per nulla nella direzione del vettore campo elettrico. Quando la luce interagisce con un determinato mezzo, gli elettroni del mezzo vengono posti in movimento. La maggior parte della luce viene trasmessa attraverso il mezzo, ma una piccola parte viene diffusa dagli elettroni e dai difetti del mezzo. Se la luce è non è polarizzata, essa viene diffusa in tutte le direzioni. Se invece è polarizzata linearmente, la luce diffusa nella direzione di polarizzazione è molto poca. La maggior parte viene diffusa in corrispondenza o in prossimità del piano perpendicolare alla direzione di polarizzazione, come illustrato nella figura 20. Ciò significa che se inviamo luce polarizzata attraverso un dato mezzo che ne modifichi la direzione di polarizzazione, ma non ne provochi un rimescolamento casuale, possiamo seguire l'orientamento della polarizzazione attraverso il mezzo (figura 21). Figura 21. Diffusione della luce da parte di un mezzo in cui la direzione della polarizzazione li neare cambia con la posizione. W significa diffusione debole dato che la direzione di osservazione è lungo la direzione di polarizzazione. S significa forte diffusione dato che è perpendicolare alla direzione di polarizzazione. In una fibra perfettamente simmetrica, circolare, le due componenti polarizzate del modo HE11 (il modo LP01 con stati di polarizzazione ortogonali) viaggiano alla stessa velocità, poiché hanno costanti di propagazione identiche. Se la fibra non è perfettamente simmetrica, essa è birifrangente, poiché le due componenti polarizzate hanno costanti di propagazione differenti. Per esempio, delle fibre con nucleo ellittico producono birifrangenza in quanto gli assi veloce e lento sono lungo l'asse maggiore e l'asse minore dell'ellisse, rispettivamente. Questa ellitticità può essere accidentale, dovuta a errori di fabbricazione, oppure intenzionale, come parte del progetto della fibra. Se la birifrangenza deve essere controllata, la maggior parte delle volte viene creata inserendo all'interno della fibra regioni di tensione, come illustrato nella fibra birifrangente "bow-tie" illustrata nella figura 22. Qui l'asse lento è parallelo all'asse di massimo sforzo del bow tie (parallelo al bow tie) e l'asse veloce è perpendicolare all'asse di massimo sforzo. - E.175 - Figura 22. Sezione trasversale di una fibra a polarizzazione invariante. Le regioni di tensione esterne al nucleo forniscono l'asimmetria che produce birifrangenza nel nucleo della fibra. Fibre a sezione ellittica danno lo stesso effetto. Se la luce viene lanciata con un componente lineare lungo ciascun asse ottico, la diffe renza tra i valori delle costanti di propagazione fa sì che il vettore risultante delle due polarizza zioni vari periodicamente con la distanza lungo la fibra. Quando le due componenti sono in fase, la luce è polarizzata linearmente. Mentre la luce si propaga le due componenti vanno però fuori fase, lo stato di polarizzazione passa da lineare a ellittico e poi di nuovo a polarizzazione lineare e poi a una differenza di fase di 180°. Quando le due componenti della luce polarizzata sono rese di uguale ampiezza lanciando luce polarizzata linearmente a 45° con gli assi ottici, la polarizzazione passa da lineare a ellittica, a circolare, a ellittica e poi di nuovo a lineare in un piano che è ad angolo retto con il piano dell'originaria polarizzazione lineare. Questa sequenza con la quale si alternano i diversi stati di polarizzazione si ripete per tutta la lunghezza della fibra. La distanza L0 lungo la quale la polarizzazione ruota di 360° è denominata lunghezza di battimento della fibra. (Proprio come l'alternarsi di focalizzazioni e defocalizzazioni in un una fibra a indice graduato dà luogo a un passo, così una fibra birifrangente dà luogo a una lunghezza di battimento). La lunghezza di battimento è legata alla birifrangenza, δn = nlento - nveloce, dalla relazione Lp =2π/δβ (16) in cui δβ= 2πδn/λ. Questa lunghezza di battimento può essere osservata visualmente lanciando nella fibra la luce di un laser elio-neon con la direzione di polarizzazione orientata a un angolo di 45° con l'asse veloce della fibra. Come è stato già discusso in precedenza in questo paragrafo, la diffusione da centri illuminati di luce polarizzata linearmente varia da zero a un va lore massimo al variare dell'angolo di osservazione da una posizione parallela alla direzione di polarizzazione a una posizione perpendicolare a essa. Pertanto, quando la luce avanza in una fibra birifrangente, la quantità di luce diffusa ad angoli retti varia con il variare dello stato di pola rizzazione in ciascun punto. Nel caso di una fibra in grado di conservare lo stato di polarizzazio ne (polarization-preserving fiber), con condizioni di lancio del tipo già descritto, la polarizzazione passa ciclicamente da lineare a circolare e di nuovo a lineare. Questa situazione è leggermente differente da quella illustrata nella figura 21, che invece si riferisce alla rotazione di una polarizzazione lineare. Tuttavia, nei punti in cui la polarizzazione è lineare, la luce diffusa è più debole o più intensa (a seconda della direzione di osservazione) che nelle posizioni di polarizzazione circolare. Misurando le distanze di ripetizione per la variazione delle intensità di luce diffusa, si può determinare la distanza di battimento della fibra. Quando si lancia luce polarizzata linearmente con il vettore di polarizzazione parallelo all'asse veloce o all'asse lento, il fascio in uscita sarà ancora polarizzato linearmente anche se la fibra subirà piegamenti. Queste fibre che mantengono la polarizzazione (polarization-preserving fiber) sono quindi meno sensibili all'ambiente. Per altre condizioni di lancio, tuttavia, questo non è più vero. La fibra agirà invece nel senso di cambiare lo stato di polarizzazione della luce; l’effetto sulla luce polarizzata in ingresso sarà determinato dalle condizioni di lancio, dalla lunghezza di battimento e dalla lunghezza della fibra. Le fibre che mantengono la polarizzazione vengono utilizzate ogniqualvolta è necessario che lo stato di polarizzazione della luce trasmes- - E.176 sa sia stabile e ben definito. Queste applicazioni comprendono fibre per sensori interferometrici, fibre giroscopiche e sistemi di rivelazione a eterodina. 4. Trasmissione di energia nelle fibre ottiche Attenuazione nelle fibre ottiche In tutta la trattazione precedente si è assunto che la luce viaggi attraverso la fibra senza alcuna perdita, oltre a quelle dovute ai modi di radiazione e di colaggio e ai modi di ordine superiore che si disperdono nel mantello. Quando la luce passa attraverso un mezzo assorbente, la sua intensità diminuisce però esponenzialmente con la distanza alla quale avviene la trasmissione. Questa relazione, detta legge di Beer, può essere espressa nella forma: I(z) = I(0)e-Γz (17) in cui I(z) è la densità di flusso radiante a una distanza z da un punto di ascissa z = 0 e Γ è il coefficiente di attenuazione (o coefficiente di assorbimento) espresso in unità reciproche delle unità di z (cioè in metri-1). In alcuni settori della fisica e della chimica, in cui si misura accuratamente l'assorbimento da parte di un mezzo, l'entità dell'assorbimento a una particolare lunghezza d'onda per un particolare percorso, diciamo 1 cm, può essere usato per misurare la concentrazione del materiale assorbente in una soluzione. Anche se il coefficiente di assorbimento può essere espresso in unità inverse della lunghezza per una diminuzione esponenziale, nel campo delle fibre ottiche, così come nella maggior parte dei settori delle telecomunicazioni, l'assorbimento è espresso in dB/km (dB sta per decibel, decimi di unità logaritmiche). In questo caso, la caduta esponenziale è espressa mediante la base 10 anziché mediante la base e (= 2,7182818...) I(z) = I(0) 10-Γz/10 (18) in cui z è in chilometri e Γ è ora espresso in decibel al chilometro (dB/km). Pertanto una fibra della lunghezza di un chilometro, con un coefficiente di assorbimento di 10 dB/km consente di trasmettere I(z)/I(0) = 10-10/10 = 0,10 ovvero il 10% della potenza in ingresso. Nelle fibre ottiche, la perdite dipendono dalla lunghezza d'onda, cioè luci di diversa lun ghezza d'onda introdotte nella stessa fibra subiscono assorbimento differente. La figura 23 mostra l'assorbimento in dB/km di una tipica fibra ottica in funzione della lunghezza d'onda. - E.177 - Figura 23. Attenuazione in una fibra ottica in funzione della lunghezza d'onda. La stessa dipendenza esponenziale descritta per le perdite per assorbimento vale anche per altre fonti di perdita nelle fibre. Le perdite nella trasmissione ottica nelle fibre sono dovute a vari meccanismi. Primo, le fibre ottiche sono limitate nella regione delle lunghezze d'onda brevi (verso il visibile e l'ultravioletto) da bande di assorbimento del materiale e da diffusione su disomogeneità dell'indice di rifrazione della fibra. Queste disomogeneità sono dovute a fluttua zioni termiche che si producono quando la fibra si trova allo stato fuso. Quando la fibra solidifica queste fluttuazioni causano variazioni dell'indice di rifrazione su scala minore della variazione parabolica imposta alle fibre a indice graduato. La diffusione da parte delle disomogeneità è nota con il nome di diffusione di Rayleigh ed è proporzionale a λ−4, in cui λ è la lunghezza d'onda della luce. (A questo fenomeno è dovuto il colore del cielo. La massima intensità della diffusione della luce a lunghezza d'onda corte conferisce al cielo il suo colore blu.) Nella regione delle lunghezze d'onda maggiori, sono le bande di assorbimento del materiale a limitare l'estremità dello spettro utilizzabile a lunghezze d'onda di circa 1600 nm. Questi due meccanismi costituiscono il limite ultimo delle perdite nelle fibre ottiche. Le fibre di migliori qualità sono spesso caratterizzate dall'indicazione di quanto si avvicinino al limite di Rayleigh, che è a circa 0,017 dB/km a 1550 nm. Un tempo la fonte principale di assorbimento era costituita da impurezze sotto forma di ioni metallici. E' stata appunto l'eliminazione di questi ioni a consentire l'introduzione delle fibre ottiche a bassa perdita. Oggi, l'unica impurità che abbia importanza nelle fibre ottiche è costituita dall'acqua sotto forma di ioni ossidrile (OH -), le cui bande di assorbimento a 950, 1250 e 1380 nm dominano le perdite in eccesso delle fibre ottiche attuali. Queste bande sono chiara mente visibili nello spettro di assorbimento rappresentato nella figura 23. Sulla base di queste considerazioni, è stato stabilito che i sistemi di trasmissione ottici operino su tre intervalli di lunghezze d'onda, detti finestre, indicati nella tabella 1, per i quali ri sultano minimi gli effetti dell'attenuazione. Le finestre derivano dalle tre zone delimitate dai tre picchi di massimo assorbimento (950 nm, 1250 nm e 1400 nm). Le fibre monomodali operano nella seconda e terza finestra, mentre le fibre multimodali operano nella prima e nella seconda finestra. Tabella 1. - E.178 - Spettro Lunghezza d'onda Impiego prima finestra 800 – 900 nm Primi sistemi ottici, collegamenti urbani senza ripetitori seconda finestra 1250 - 1350 nm Sistemi a larga banda (m = 0), collegamenti fino a 100 km senza ripetitori terza finestra Sistemi a lunga distanza 1500 – 1550 nm Sorgenti luminose per fibre ottiche Per quanto una fibra ottica possa trasmettere luce di molte diverse lunghezze d'onda e con gradi differenti di coerenza, solo alcune specifiche sorgenti luminose risultano sufficientemente convenienti ed efficaci per l'accoppiamento con fibre ottiche. Le piccole luci rosse di segnalazione che vediamo nei segnalatori di fumo e nei pannelli elettronici sono costituite da diodi a emissione di luce (LED). Il nome descrive molto efficacemente queste sorgenti luminose in quanto non si tratta d'altro che di diodi semiconduttori speciali che emettono luce. Sono costituiti da semiconduttori, per esempio da arseniuro di gallio, ai quali sono state aggiunte impurità atomiche per aumentarne la conduttività. Il portatore della corrente elettrica può essere sia un elettrone sia una buca (o lacuna, cioè l'assenza di un elettrone). I materiali in cui i portatori maggioritari sono gli elettroni sono detti di tipo n, quelli in cui sono le buche sono detti di tipo p. Un diodo è costituito da due pezzi di materiale uno di tipo n e l'altro di tipo p a contatto, come nella figura 24. La zona di interfaccia tra i due materiali è detta giunzione. Quando attraverso la giunzione si applica una differenza di potenziale in modo che il diodo conduca la corrente, questo emette luce che è una radiazione derivante dalla ricombinazione di elettroni e di buchi. Questa radiazione è detta appropriatamente radiazione di ricombinazione. La quantità di luce in uscita è proporzionale al numero di coppie elettrone-buca che si ricombinano nel diodo e questo numero è proporzionale alla corrente che si ha nel diodo. Pertanto, la curva che dà la potenza luminosa in funzione della corrente nei LED è una retta. La lunghezza d'onda della radiazione emessa dai LED dipende dalla differenza tra le energie degli elettroni nei materiali di tipo n e l'energia delle buche nei materiali di tipo p. La larghezza di banda della radiazione è però grande rispetto a quella delle sorgenti laser. Per quanto la costruzione di diodi laser a iniezione di corrente (ILD, current injection laser diode) sia molto più complessa di quella dei LED, i due dispositivi sono molto simili. Sia nella struttura sia nei principi di funzionamento hanno infatti molti punti in comune. In entrambi la corrente viene iniettata nel diodo applicando una differenza di potenziale attraverso il diodo stesso. Tuttavia le densità di corrente sono sensibilmente più grandi nel dispositivo ILD che nel LED. Anziché avere coppie di buche e di elettroni che si ricombinano spontaneamente come nel LED, nell'ILD un enorme flusso di corrente stimola le coppie a emettere coerentemente, creando un flusso luminoso in uscita con una larghezza di banda minore che nel caso del LED. E' questo il processo dell'emissione stimolata. La curva flusso-corrente dell'ILD è molto differente che per il LED in quanto la corrente deve raggiungere un valore di soglia prima che si possa avere l'effetto laser. Raggiunta questa condizione il flusso luminoso in uscita aumenta rapidamente all'aumentare dell'intensità della corrente. Questo processo di emissione stimolata viene esaltato dalle superfici del cristallo semiconduttore che fanno da specchi parzialmente riflettenti che riflettono indietro il fascio laser verso la regione della giunzione. Questi specchi fanno anche sì che l'uscita dell'ILD sia parzialmente collimata, anche se la diffrazione della luce sui bordi della regione di giunzione fa sì che la luce si diriga con un fascio a ventaglio con una divergen za che va tipicamente da 15° a 30°. L'angolo di divergenza maggiore è nella direzione perpendicolare al piano della giunzione, come illustrato nella figura 24. - E.179 - Figura 24. Schema di un diodo semiconduttore a emissione di luce. I diodi laser hanno uno schema di base simile, anche se con una struttura considerevolmente più complessa. Figura 25. Schema di un laser a elio-neon. Al contrario del mezzo costituito da un semiconduttore (stato solido), il mezzo laser del laser elio-neon (He-Ne) è una miscela di elio e neon, che sono gas, eccitati da una corrente elettrica che crea una scarica luminosa simile a quelle che si ha nelle insegne luminose al neon. La differenza tra queste ultime e il laser elio-neon è data dalle proporzioni tra le quantità dei gas nella miscela, dalla sottigliezza del percorso della scarica nel tubo di vetro e dalle estremità speculari riflettenti, come illustrato nella figura 25. L'uscita luminosa del laser elio-neo è generalmente luce con lunghezza d'onda di 633 nm, per quanto possano essere ottenute emissioni in altre lunghezze d'onda nel visibile e nel vicino infrarosso usando diversi tipi di specchi con mag giori coefficienti di riflessione in corrispondenza delle lunghezze d'onda consentite. L'uscita del laser elio-neon è molto più collimata di quella dell'ILD. Per un tipico laser elio-neo la divergenza del fascio è di circa 1 milliradiante (mrad), ovvero di 0,06°. La polarizzazione della radiazione in un sistema a fibre ottiche dipende dal tipo di sorgente utilizzata. Alcuni laser elio-neon possiedono un alto grado di polarizzazione lineare: altri non sono polarizzati. La loro polarizzazione è generalmente determinata dalle caratteristiche costruttive del dispositivo laser. L'uscita di un LED non è polarizzata, mentre quella di un ILD è po larizzata parallelamente al piano della giunzione p-n. La polarizzazione di una sorgente può essere riconosciuta osservando la variazione dell'intensità su un rivelatore quando si fa ruotare un polarizzatore davanti alla sorgente. Una sorgente polarizzata linearmente mostrerà grandi variazioni dell'intensità trasmessa al ruotare del polarizzatore mentre una radiazione non polarizzata o polarizzata circolarmente mostrerà una piccola o nessuna variazione. La separazione della - E.180 luce non polarizzata da quella polarizzata circolarmente richiede l'uso di un componente ottico chiamato lamina d'onda. In un sistema a fibre ottiche si potrebbero considerare anche altre sorgenti: il sole, lam pade al tungsteno, lampade a fluorescenza quali le lampade al neon, archi elettrici ecc. Tutta via, la maggior parte di queste sorgenti sono sorgenti estese. Hanno, cioè, una superficie di emissione di grandi dimensioni rispetto a quella delle sorgenti appena discusse. L'introduzione in una fibra ottica di luce da queste sorgenti richiede la costruzione di sistemi ottici per focalizzare la sorgente nell'estremità della fibra. Quanto più grande e divergente è la sorgente tanto più difficile risulta l'accoppiamento della sua luce con il sistema. Accoppiamento tra sorgenti e fibre ottiche Un obiettivo comune a qualunque sistema a fibre ottiche è quello di inserirvi quanta più potenza è possibile con la minima perdita possibile. Ciò consente l'uso di sorgenti di potenza più bassa riducendo i costi e aumentandone l'affidabilità, poiché così non è necessario far funzionare la sorgente vicino alla sua potenza massima di esercizio. L'attenzione prestata all'accoppiamento della sorgente alla fibra viene ripagata da un sistema più affidabile e meno costoso. Nello studio delle fibre ottiche deve essere considerata la direzione lungo la quale viene emessa la luce di una sorgente in quanto questa radiazione deve essere raccolta e concentrata su un'estremità della fibra. Le sorgenti possono andare da quelle isotrope (che emettono in tutte le direzioni) a quelle collimate (che emettono in un'unica direzione). In generale la distribuzione angolare della sorgente può essere data dall'espressione: B(θ)=B0 (cosθ)m, θ < θmax, (19) in cui θmax è il massimo angolo con la normale al quale viene emessa la luce, angolo determinato dalla geometria della sorgente. Se nell'equazione (19) m = 1, la sorgente è detta sorgente lambertiana. Molte sorgenti non laser approssimano molto bene una sorgente lambertiana. Per una sorgente collimata m è invece molto grande. Nei casi intermedi, la sorgente deve essere considerata parzialmente collimata. La capacità di una fibra di accogliere radiazione può essere caratterizzata dalla sua apertura numerica. La definizione del massimo angolo della sorgente non è altrettanto facilmente determinabile come lo è l'angolo limite di una fibra, poiché la luce può essere emessa in un ventaglio di angoli che non hanno necessariamente un valore di taglio ben definito. In alcuni casi la luce della sorgente è così divergente e la sorgente è così grande che bisogna formarne un'immagine sull'estremità terminale della fibra con una lente di corta focale. Per una tale sorgente la zona di copertura è maggiore della superficie della lente e i raggi marginali, quelli sul bordo del cono di luce, sono determinati dalle dimensioni della lente utilizzata. In questo caso l'apertura numerica della sorgente è data da ANestesa = n senθ (20) in cui θ= arctg(r/d), dove r è il raggio della lente e d è la distanza dell'immagine, come illustrato nella figura 26. Per sorgenti laser collimate, la lente non è generalmente coperta completamente se viene posta vicino alla sorgente. La luce viene inoltre concentrata sul fuoco della lente stessa. Il fascio ha quindi un semiangolo di divergenza che è approssimativamente uguale al rapporto tra il raggio della minima sezione del fascio prima della lente, r0, e la focale della lente. Pertanto l'AN del fascio è data da - E.181 - Figura 26. Calcolo dell'apertura numerica di una sorgente estesa. ANfascio = n sen(r0/f) (21) L'efficienza dell'accoppiamento sorgente-fibra è determinata da quattro parametri: le aperture numeriche della sorgente e della fibra e le dimensioni della sorgente e del nucleo della fibra. Si può mostrare che il prodotto del diametro della sorgente per la sua apertura numerica è costante, indipendentemente dalla focale della lente che ne fornisce un'immagine. Confrontando questo valore con il prodotto del diametro del nucleo per l'apertura numerica della fibra è possibile determinare se si può scegliere una lente che fornisca un'immagine della sorgente sul nucleo della fibra senza uscire dalle dimensioni della fibra. L'eccedenza di copertura è determinata da un'apertura numerica che è maggiore dell'apertura numerica della fibra. Se il prodotto del diametro della sorgente per la sua AN è maggiore del corrispondente prodotto per la fibra, la riduzione dell'apertura numerica della sorgente per uguagliarla a quella della fibra non migliora l'accoppiamento poiché ciò aumenta anche il diametro dell'immagine della sorgente sulla faccia della fibra. Pertanto un'attenta considerazione dei prodotti diametro per apertura numerica (d × AN) potrà eventualmente dissuadere dal tentare l'impossibile. Questo stesso approccio può es sere applicato anche all'accoppiamento tra fibre di differenti dimensioni e differenti aperture nu meriche. 5. Applicazioni La maggior parte delle applicazioni dei sistemi in fibra ottica ricade in una delle seguenti tre categorie: comunicazioni, sensori e distribuzione di energia. In questo paragrafo le descriveremo brevemente tutte e tre. L'uso più diffuso delle fibre ottiche è di gran lunga nel campo delle telecomunicazioni. Questo settore comprende collegamenti brevi tra computer e dispositivi per telecomunicazioni, le cosiddette reti locali LAN (Local Area Network) e, all'altro estremo, le connessioni su grandi distanze che comprendono quelle tra aree metropolitane e quelle transoceaniche. Quando si deve inviare informazione lungo una fibra ottica, l'informazione viene codificata sull'onda luminosa cambiando l'intensità (densità di flusso radiante) in funzione del tempo. Questo procedimento di far variare il livello di luminosità è detto modulazione. Vi sono due tipi di modulazione: analogica e digitale. La modulazione analogica consiste nel modificare il livello di luminosità in modo continuo. Nella modulazione digitale, invece, l'informazione viene codificata attraverso una serie di impulsi separati da spazi, come illustrato nella figura 27. La presenza o l'assenza di un impulso in un dato punto del flusso di impulsi rappresenta un elemento, o bit, di informazione. - E.182 - Figura 27. Due tipi di modulazione di un segnale: a) analogica; b) digitale. La bontà di un sistema che utilizzi la modulazione analogica dipende dalla fedeltà con la quale riproduce il segnale e dal più piccolo segnale che può essere trasmesso, che è limitato dai disturbi (rumore), casuali o dovuti all'esterno, presenti nel sistema. Parte di questi disturbi sono dovuti al tipo di rivelatore usato per riconvertire il segnale luminoso modulato in un segnale elettrico e parte sono dovuti al sistema stesso. Il rapporto tra il segnale rivelato e il più piccolo segnale che può essere distinto dai disturbi è detto rapporto segnale/rumore. Nel caso di sistemi digitali, non è richiesta una riproduzione fedele del livello del segnale, fatto che rende questi sistemi superiori a quelli analogici in presenza di sorgenti di rumore. Tutto ciò che è richiesto è che gli impulsi vengano trasmessi con potenza sufficiente per poter essere rivelati e che siano presenti dispositivi elettronici per determinare la presenza o l'assenza di impulsi. La qualità dei sistemi digitali è data in termini di rapporto bit/errore (BER, bit error rate), definito come rapporto tra il numero di bit inviati che sono stati verificati come errati e il numero complessivo di bit inviati, determinato per confronto con l'informazione digitale originale. Per poter essere considerato di alta qualità, un sistema di telecomunicazioni digitale in fibre ottiche deve avere un BER minore di 10-9. Un'altra applicazione riguarda l'uso di sensori in fibra ottica per misurare parametri fisici. Per il loro piccolo diametro, i sensori in fibra ottica possono essere utilizzati in geometrie per i quali i sensori convenzionali sarebbero troppo grandi. Inoltre, poiché il mezzo di cui è fatta la fibra ottica non è conduttore elettrico, i sensori in fibra ottica possono essere usati in situazioni di pericolo, quali quelle che si hanno in atmosfere esplosive. Questi sensori possono essere usati per misurare parametri fisici quali temperature e pressioni e per ottenere informazioni tecniche quali livelli di liquidi e valori di distanze. Chi non ha dimestichezza con le fibre ottiche tende a pensarle come specie di condutture idrauliche. Ma, come abbiamo visto, le condizioni di lancio, l'apertura numerica della fibra, la distribuzione dei modi nella fibra e l'assorbimento e le perdite per diffusione sono tutti fattori che contribuiscono a ridurre l'utilizzabilità delle fibre come conduttori di energia luminosa. Vi sono tuttavia certi campi in cui le fibre ottiche si sono dimostrate utili per trasmettere energia luminosa. Nel campo della medicina, la possibilità di inserire fibre ottiche in tubi cavi sottili che vengono spinti attraverso piccole incisioni all'interno del corpo umano ha consentito numerosi procedimenti chirurgici che non richiedono massicci tagli di tessuti e forniscono anche un mezzo per intervenire su parti malate del corpo tramite l'uscita luminosa di fibre ottiche. Parallelamente alla fibra per la trasmissione di energia si utilizza generalmente un secondo tubo con molti trefoli di fibra ottica disposti in un modo determinato in modo da portare luce per illuminazione nel luo - - E.183 go in cui si deve effettuare l'intervento e trasportare un'immagine dal luogo dell'intervento al chirurgo che lo sta effettuando. Uno dei più interessanti sottoprodotti della tecnologia delle fibre ottiche è costituito da una fibra ottica che dovrebbe trasportare grandi quantità di radiazione infrarossa generata da un laser a biossido di carbonio. L'uscita focalizzata di questo laser costituisce un bisturi ideale, ma nel breve termine non si prevedono ancora fibre di flessibilità sufficiente, di basso costo e di basso assorbimento alla lunghezza d'onda del laser a CO 2 che possa rendere diffusa questa specifica applicazione. Vi sono numerose applicazioni anche nel campo della tecnologia dei materiali, campo in cui lo sviluppo di energia proveniente da laser in posizioni determinate potrebbe costituire il metodo ideale di procedere. La sostituzione di sistemi ottici a molte lenti per la liberazione di energia laser con sistemi a fibre ottiche si rivela utile in ambienti polverosi e poco accessibili, grazie alla riduzione dei tempi di riparazione e di manutenzione. Generalmente l'uscita divergente della fibra deve essere focalizzata per mezzo di una lente in modo da produrre l'intensità necessaria per il trattamento termico, per la fusione o per la vaporizzazione di una zona del materiale su cui si opera. I valori massimi di energia che possono essere erogati con questo sistema dipendono dalla lunghezza d'onda della radiazione utilizzata e dal tipo di fibra impiegato.