Energia di vuoto ed Effetto Casimir

UNIVERSITÀ DEGLI STUDI DEL SALENTO
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Fisica
Tesi di laurea triennale
Energia di vuoto
ed Effetto Casimir
Relatore:
Prof. Claudio Corianò
Candidato:
Federica Cataldini
Anno accademico 2011-2012
Ai miei nonni
ii
“Muss es sein? Es muss sein!”
Ludwig van Beethoven
iii
Prefazione
Lo sviluppo della meccanica quantistica ha fornito una descrizione della realtà che spesso
esula da ogni logica e previsione classica. Uno dei risultati più importanti, legato tutt’oggi
a problematiche non risolte, è l’esistenza di un’energia di vuoto. In elettrodinamica classica non vi è motivo per cui nel vuoto debba esserci radiazione elettromagnetica, ma già
nel 1912 Planck, concentrato sullo studio dello spettro del corpo nero, trovò un’energia
di punto zero, partendo dalla sola ipotesi che la radiazione fosse costituita da quanti discreti e indistinguibili di energia. Da quel momento, in un susseguirsi di eventi, la teoria
quantistica prese forma e fu dalla quantizzazione del campo elettromagnetico che riemerse
l’energia di vuoto.
La presente tesi si propone di esporre gli aspetti salienti dei fenomeni ad essa legati, con
particolare attenzione per l’effetto Casimir, i cui risvolti abbracciano vasti ambiti della
fisica.
Il primo capitolo richiama le proprietà fondamentali dell’elettromagnetismo classico, presupposto essenziale per l’analisi quantistica. Verranno introdotte e illustrate le trasformazioni di gauge e si adopererà in particolare la gauge di Coulomb per dimostrare che, nel
vuoto, il potenziale vettore e i campi elettromagnetici soddisfano l’equazione di D’Alembert e dunque si rappresentano in termini di sovrapposizione di onde piane polarizzate.
Risolvendo poi l’equazione delle onde per il potenziale vettore entro un volume cubico,
si dimostrerà che l’hamiltoniana del campo coincide con quella di un sistema di infiniti
oscillatori armonici disaccoppiati. Ogni frequenza di oscillazione del campo elettromagnetico sarà rappresentata da un oscillatore armonico, a cui si attribuisce il nome di modo
normale. A questo punto, sfruttando il principio di corrispondenza, si procederà con la
quantizzazione del campo elettromagnetico. Come nel caso dell’oscillatore, verranno definiti gli operatori di creazione e annichilazione, i quali consentiranno di rappresentare
1
l’energia in termini di quantità discrete, i fotoni; si giungerà ad un’espressione dei campi analoga a quella classica, dove le ampiezze saranno sostituite dai due operatori citati.
Dalla trattazione emergerà uno spettro discreto per l’energia del campo, corrispondente
alla quello di infiniti oscillatori armonici, e fluttuazioni non nulle nello stato fondamentale,
lo stato di vuoto. L’origine del punto zero dell’energia risiede nella non commutabilità
degli operatori di creazione e annichilazione, e in virtù del principio di indeterminazione,
le fluttuazioni di vuoto si potranno associare a fotoni virtuali che si annichilano a vicenda.
La comparsa in elettrodinamica quantistica dell’energia di vuoto rappresentò un punto di
svolta nella fisica teorica, giacchè essa è responsabile della divergenza dell’hamiltoniana di
un qualunque sistema a infiniti gradi di libertà. La presenza di queste quantità infinite
è cruciale, infatti se, da un punto di vista formale, l’energia di vuoto può essere eliminata tramite un riordinamento normale, non si può ignorare la sua presenza in fenomeni
puramente quantistici quali il Lamb shift e l’effetto Casimir. Il cuore della descrizione
teorica dei due fenomeni consisteva proprio nel rendere finita una quantità che, a causa
dell’energia di punto zero, non poteva convergere. La risoluzione del ‘dilemma’ aprı̀ le
porte alla teoria quantistica dei campi.
Il terzo capitolo è dedito all’approfondimento di tali aspetti e alla descrizione dei due
fenomeni citati. Il Lamb shift fornisce una correzione alla struttura fine dell’atomo di
idrogeno, dovuta all’interazione fra l’elettrone amico e le fluttuazioni di vuoto del campo elettromagnetico interno. L’effetto Casimir è un fenomeno di natura quantistica ma
che si manifesta nella realtà macroscopica: esso appare nel momento in cui si impongono
condizioni al contorno al campo elettromagnetico quantizzato. Più precisamente si tratta
di una forza, attrattiva nella maggior parte dei casi, che si esercita fra due lastre piane
infinite e perfettamente conduttrici. Quest’interazione è la manifestazione macroscopica
delle fluttuazioni di vuoto vincolate dai confini materiali del sistema fisico in esame. L’effetto Casimir si manifesta anche su scala atomica, provocando l’attrazione fra due atomi
o molecole neutre vicine; si parla in questo di forza di Casimir-Polder, è una forza a lungo
raggio, strettamente legata ad un’altra interazione quantistica, la forza di Van der Waals,
che invece si manifesta fino a distanze di pochi nanometri.
La verifica sperimentale di questi due fenomeni arrivò diversi anni dopo la loro formulazione teorica e, mentre il Lamb shift è stato determinato con l’ausilio della spettroscopia,
lo studio dell’effetto Casimir è ancora oggi sul palcoscenico della comunità scientifica.
Dal quarto capitolo in poi, si cercherà dunque di porre le basi per la comprensione dell’attività sperimentale legata alla forza di Casimir. Per la misura di tale forza si utilizzano dei
2
condensati di Bose-Einstein, oggetti macroscopici con caratteristiche quantistiche (stati
coerenti), che obbediscono alla statistica di Bose-Einstein. Lo sviluppo teorico di questi
due elementi sarà infine seguito dalla descrizione dei più significativi esperimenti che hanno
confermato l’esistenza dell’effetto Casimir. Le difficoltà pratiche legate alla configurazione
di parallelismo di due lastre conduttrici, hanno fatto sı̀ che nel corso degli anni, la misura
della forza di Casimr fosse stata effettuata prima sfruttando geometrie diverse. Si è scelto
di illustrare esperienze che si differenziassero per tecniche di indagine, geometria del sistema e portata storica. In particolare verranno descritti due esperimenti in cui si verificò
l’esistenza di un’attrazione fra un conduttore sferico e una lastra metallica piana; in un
caso l’obiettivo fu raggiunto misurando la forza di richiamo di un pendolo a torsione su cui
era posizionata la sfera, nella seconda esperienza invece si utilizzò un microscopio a forza
atomica. Si esporrà poi il recente lavoro, in cui fu dimostrata l’azione della forza di Casimir fra due lastre parallele: attraverso un interferometro a fibra ottica, si ricavò la forza
misurando la variazione di frequenza indotta in una microleva all’avvicinarsi di un’altra
superficie conduttrice. Infine, si descriverà la misura della forza di Casimir-Polder che si
manifesta attraverso la variazione delle oscillazioni del centro di massa di un condensato
di Bose-Einstein, posto in prossimità di una superficie piana metallica.
3
Indice
1 La teoria elettromagnetica
5
1.1
Le equazioni di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.2
I potenziali elettromagnetici e le trasformazioni di gauge . . . . . . . . . . .
8
1.3
Il campo elettromagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Quantizzazione del campo elettromagnetico
19
2.1
I modi normali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2
Il campo elettromagnetico quantizzato . . . . . . . . . . . . . . . . . . . . . 26
3 Effetti delle fluttuazioni di vuoto
32
3.1
Lamb shift . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2
Effetto Casimir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4 Stati coerenti
49
4.1
Definizione e proprietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2
Rappresentazione nello spazio delle fasi
. . . . . . . . . . . . . . . . . . . . 57
5 Condensazione di Bose-Einstein
59
5.1
Matrice densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.2
Le distribuzioni statistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.3
Condensazione di Bose-Einstein . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.4
Condensato di Bose-Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6 Verifiche sperimentali dell’effetto Casimir
75
Bibliografia
84
4
Capitolo 1
La teoria elettromagnetica
L’esposizione della teoria elettromagnetica classica è doverosa, oltre che propedeutica, per
ben comprendere ed apprezzare quelli che saranno i risultati della formulazione quantistica.
L’analisi che segue verte ad analizzare alcuni dei punti salienti di tale teoria, partendo dal
pilastro dell’elettrodinamica, le equazioni di Maxwell. Introducendo i potenziali elettromagnetici si dimostrerà che l’intero studio di un sistema è condensato nell’equazione delle
onde e che la dinamica dipende da due soli gradi di libertà, coincidenti con le componenti
trasversali del campo elettrico e del campo magnetico. La descrizione delle trasformazioni
di gauge consentirà poi di esporre, in una formulazione elegante, degli interessanti casi di
simmetria per la teoria elettromagnetica. Infine sfruttando la teoria della trasformata di
Fourier, si giungerà ad uno dei punti cardinali della fisica, la dimostrazione che la radiazione è esprimibile come una sovrapposizione di onde piane, soluzione dell’equazione di
D’Alembert.
5
1 – La teoria elettromagnetica
1.1
Le equazioni di Maxwell
L’elettrodinamica classica è interamente descritta dalle equazioni di Maxwell , che espresse
nel sistema c.g.s assumono la forma
~ x,t) = 4πρ(~x,t)
∇ · E(~
(1.1)
~ x,t) = 0
∇ · B(~
(1.2)
~
~ x,t) + 1 ∂ B(~x,t) = 0
∇ ∧ E(~
c ∂t
~
~ x,t) − 1 ∂ E(~x,t) = 4π ~j(~x,t),
∇ ∧ B(~
c ∂t
c
(1.3)
(1.4)
dove ρ(~x,t) è la densità di carica e ~j(~x,t) è la densità di corrente, legate dall’equazione di
continuità
∂ρ
= 0,
(1.5)
∂t
che esprime la legge di conservazione della carica elettrica. Fra le equazioni di Maxwell ,
∇ · ~j +
le ultime due, note rispettivamente come Legge di Faraday-Neumann e Legge di Ampère,
~ x,t) e del campo magnetico
rappresentano le equazioni del moto del campo elettrico E(~
~ x,t), mentre le prime due costituiscono delle condizioni al contorno che devo essere
B(~
soddisfatte dai campi stessi e che quindi consentono di ridurre il numero di gradi di libertà
del sistema. Scomponendo ciascun vettore in una parte trasversale, a rotore nullo, e in
una lungitudinale, a divergenza nulla,
~ =B
~L + B
~T
B
~ =E
~L + E
~T
E
(1.6)
dove
~ L = 0,
∇∧E
~ T = 0,
∇·E
(1.7)
~ L = 0,
∇∧B
~ T = 0,
∇·B
(1.8)
si dimostra che la dinamica del sistema dipende soltanto dalle componenti trasversali dei
campi. Infatti, dalla Legge di Gauss (1.1), per la proprietà di additività della divergenza,
si ricava
~ =∇·E
~ L = 4πρ,
∇·E
(1.9)
mentre dalla (1.2) si nota che anche la componente longitudinale del campo magnetico è
solenoidale
~ L = 0,
∇·B
6
(1.10)
1 – La teoria elettromagnetica
e dunque, essendo anche irrotazionale, si conclude che
~L = 0
B
(1.11)
e che il campo magnetico è puramente trasverso
~ ≡B
~T .
B
(1.12)
Inoltre separando anche la densità di corrente nelle sue due componenti, l’equazione di
continuità si esprime esclusivamente in termini di ~jL
∂ρ
= 0.
∇ · J~L +
∂t
(1.13)
Derivando rispetto al tempo la legge di Gauss (1.9) si ricava
∇·
da cui
~L
∂ρ
∂E
= 4π
= −4π∇ · ~jL ,
∂t
∂t
(1.14)
~
∂ EL
~
+ 4π jL = 0.
∇·
∂t
(1.15)
~L
∂E
∂t
+ 4π~jL è solenoidale, ma esso
~ e ~j, dunque
è anche irrotazionale, perchè coinvolge solo le componenti longitudinali di E
Quest’ultima relazione evidenzia che il campo vettoriale
soddisfa l’equazione di Laplace
~
~
~
∂ EL
∂ EL
2 ∂ EL
~
~
~
∇
+ 4π jL = ∇ ∇ ·
+ 4π jL
−∇∧ ∇∧
+ 4π jL
= 0. (1.16)
∂t
∂t
∂t
Ora, un campo vettoriale a laplaciano nullo che vada all’infinito in maniera sufficientemente
rapida è nullo ovunque:
~L
∂E
+ 4π~jL = 0
∂t
ossia
~L
∂E
= −4π~jL .
(1.17)
∂t
Dalle proprietà appena esposte è immediato dedurre che sia la legge di Ampère (1.4) che la
legge di Faraday-Neumann (1.3), si esprimono in termini delle sole componenti trasversali:
e
~
~ T − 1 ∂ ET = 4π ~jT ,
∇·B
c ∂t
c
(1.18)
~
~ T + 1 ∂ BT = 0.
∇∧E
c ∂t
(1.19)
7
1 – La teoria elettromagnetica
Riassumendo, le equazioni di Maxwell (1.1)-(1.4), si scindono in due gruppi: le equazioni
per i campi trasversali, (1.18) e (1.19), che descrivono la dinamica del campo elettromagnetico e le equazioni (1.9) e (1.10), che fissano istante per istante le componenti longitudinali
~L e B
~ T . I gradi di libertà dinamici si riducono ai due campi trasversi E
~T e
dei campi E
~T .
B
1.2
I potenziali elettromagnetici e le trasformazioni di gauge
Come si è visto nell’equazione (1.2), il campo magnetico è solenoidale, dunque in uno spazio
~ x,t)
semplicemente connesso, esso si può esprimere come il rotore di un campo vettoriale A(~
~ = ∇ ∧ A.
~
B
(1.20)
L’equazione di Faraday-Neumann (1.3) pertanto si scrive come
~=0
~ + 1 ∂ ∇∧A
∇∧E
c ∂t
(1.21)
~+1∂A
~ = 0,
∇∧ E
c ∂t
(1.22)
o equivalentemente
~ + 1 ∂t A
~ è irrotazionale e in una regione semplicemente connessa esiste
per cui la quantità E
c
una funzione scalare φ(~r,t) tale che
~+1∂A
~ = −∇φ.
E
c ∂t
(1.23)
~ x,t) e φ(~x,t) sono chiamati potenziali elettromagnetici,
Gli oggetti matematici introdotti A(~
~ x,t) è detto potenziale vettore, o potenziale magnetico, mentre la funzione
in particolare A(~
scalare φ(~x,t) è denominata potenziale scalare, o potenziale elettrico. Le definizioni dei
~ x,t) e B(~
~ x,t) in termini dei potenziali elettromagnetici A(~
~ x,t) e φ(~x,t)
campi E(~
~ =∇∧A
~
B
e
~ − ∇φ.
~ = −1 ∂ A
E
c ∂t
(1.24)
sono tali da soddisfare le due equazioni di Maxwell omogenee (1.2) e (1.3).
~ e φ si ottengono dalle restanti due equazioni non omogenee (1.1) e (1.4),
I potenziali A
8
1 – La teoria elettromagnetica
che, sfruttando le (1.20), (1.24), divengono
~
1
∂A
∇2 φ + ∇ ·
= −4πρ
c
∂t
(1.25)
2~
~ + 1 ∂ ∇φ + 1 ∂ A = 4π ~j
∇∧ ∇∧A
c ∂t
c2 ∂t2
c
(1.26)
per la legge di Gauss, e
per l’equazione di Ampère; servendosi dell’identità
~
~ = ∇(∇ · A)
~ − ∇2 A,
∇ ∧ (∇ ∧ A)
(1.27)
~
1 ∂2A
4π
1 ∂φ
~
~
∇ A− 2 2 −∇ ∇·A+
= − ~j.
c ∂t
c ∂t
c
(1.28)
si ottiene in definitiva
2
L’introduzione dei potenziali elettromagnetici ha consentito dunque di ridurre il sistema delle equazioni di Maxwell da quattro a due, tuttavia le (1.25) e (1.28) sono ancora
equazioni accoppiate. Per disaccoppiarle si ricorre all’arbitrarietà insita nelle definizioni dei potenziali: nella relazione (1.20) il potenziale vettore è determinato a meno del
~ e B,
~ ad essi corrigradiente di una qualche funzione scalare χ, cosicchè, dati i campi E
spondono infiniti potenziali elettromagnetici. Tale indeterminazione consente di definire
delle trasformazioni per i potenziali elettromagnetici, dette trasformazioni di gauge, che
lasciano invariati i campi e le equazioni di Maxwell , determinando cosı̀ una simmetria
per l’elettromagnetismo. In particolare, se si considera la trasformazione del potenziale
vettore
~ x,t) −→ A
~ 0 (~x,t) = A(~
~ x,t) + ∆χ(~x,t)
A(~
(1.29)
dove χ(~x,t) è una generica funzione scalare, il campo magnetico non varia:
~ −→ B
~0 = ∇ ∧ A
~0 = ∇ ∧ A
~ + ∇ ∧ ∇χ = ∇ ∧ A
~=B
~
B
(1.30)
essendo ∇ ∧ ∇χ = 0. Il campo elettrico (1.24) invece si trasforma come
~0
~
~ − 1 ∂ ∇χ.
~ −→ E
~ 0 = −∇φ − 1 ∂ A = −∇φ − 1 ∂ A − 1 ∂ ∇χ = E
E
c ∂t
c ∂t
c ∂t
c ∂t
(1.31)
Pertanto affinchè neppure il campo elettrico cambi è necessario che la trasformazione (1.29)
sia contemporanea alla trasformazione del potenziale scalare
φ(~x,t) −→ φ0 (~x,t) = φ(~x,t) −
9
1∂
∇χ,
c ∂t
(1.32)
1 – La teoria elettromagnetica
in questo caso infatti si ha
~0
~ −→ E
~ 0 = −∇φ0 − 1 ∂ A
E
c ∂t
~
1 ∂χ 1 ∂ A
1∂
= −∇φ + ∇
−
−
∇χ
c ∂t
c ∂t
c ∂t
~
1 ∂A
~
= −∇φ −
=E
c ∂t
(1.33)
Le relazioni (1.29) e (1.32) sono le trasformazioni di gauge sopra citate e l’invarianza dei
campi che da esse discende è detta invarianza di gauge. Si può ora dimostrare che oltre ai
~ eB
~ è gauge invariante anche la componente trasversale del potenziale vettore,
campi E
infatti è noto che
~=A
~L + A
~T ,
A
(1.34)
~ si trasformano come
dunque le componenti di A
~0 = A
~T
A
T
(1.35)
~0 = A
~ L + ∇χ,
A
L
(1.36)
essendo ∇χ puramente lungitudinale. Questo evidenzia che il potenziale vettore trasverso
~ T è un invariante di gauge, le sue componenti sono gradi di libertà dinamici e quindi
A
~ L e il potenziale scalare φ, dipenineliminabili. Invece il potenziale vettore longitudinale A
dono da χ e dunque dalla scelta di gauge. A seconda delle condizioni che si impongono su
~ e su φ si ottengono diverse situazioni.
A
La gauge temporale richiede
φ = 0,
(1.37)
pertanto le equazioni dei potenziali divengono semplicemente
∂
~ = −4πρ,
∇·A
∂t
2~
~ − 1 ∂ A − ∇(∇ · A)
~ = − 4π ~j.
∇2 A
c2 ∂t2
c
(1.38)
(1.39)
Una gauge usata molto frequentemente, perchè invariante per sistemi di riferimento
inerziali, è la gauge di Lorentz la quale impone la condizione
~ + 1 ∂φ = 0.
∇·A
c ∂t
10
(1.40)
1 – La teoria elettromagnetica
Sotto questa ipotesi, le equazioni (1.28) e (1.25) si disaccoppiano e si riconducono alle
equazioni di D’Alembert non omogenee
~−
∇2 A
~
4π
1 ∂2A
= − ~j,
c ∂t2
c
(1.41)
~
1 ∂2φ
= −4πρ
c ∂t2
(1.42)
per la prima, e
~−
∇2 φ
per l’ultima. Ovviamente, in assenza di sorgenti le suddette equazioni coincidono con
l’equazione delle onde.
L’equazione (1.40) dunque consente di esprimere una delle quattro variabili φ, Ax , Ay , Az
in funzione delle restanti, ma è possibile ridurre ulteriormente i gradi di libertà, mediante
una trasformazione di gauge generata da una funzione scalare χ che soddisfa l’equazione
delle onde
∇2 χ −
1 ∂2χ
= 0.
c ∂t2
(1.43)
~ 0 e φ0 soddisfano ancora la condizione di Lorentz (1.40).
I nuovi potenziali cosı̀ ottenuti, A
È particolarmente importante ricordare anche la gauge di Coulomb, che a differenza di
quella di Lorentz ha il vantaggio, sotto opportune ipotesi, di essere unica. Inoltre dipende
dal sistema inerziale in cui si opera e, come la gauge precedente, conduce all’equazione di
D’Alembert non omogenea per il potenziale vettore. La condizione di gauge di Coulomb è
~ = 0,
∇·A
(1.44)
Essa impone la trasversalità del potenziale vettore, infatti, come visto per il campo magnetico, l’essere soleinoidale della componente longitudinale di un vettore, comporta il suo
annullarsi se anche la sua divergenza è nulla. Si conclude che
~L = 0
A
dunque
~=A
~T .
A
(1.45)
In questo frangente l’equazione (1.25)
∇2 φ +
1∂
~ = −4πρ
∇·A
c ∂t
(1.46)
si semplifica come
∇2 φ = −4πρ,
11
(1.47)
1 – La teoria elettromagnetica
~ T irrotazionale per definizione. Si nota quindi che in questa gauge, il potenziale
essendo A
vettore è solenoidale e il potenziale scalare soddisfa l’equazione di Poisson (1.47), la quale,
in assenza di superfici di contorno al finito, ammette come soluzione
Z
ρ(~x0 ,t) 3 0
φ(~x,t) =
d ~x ;
|~x − ~x0 |
(1.48)
quest’ultimo risultato consente di identificare φ con il potenziale di Coulomb istantaneo
dovuto alla densità di carica ρ(~x,t).
Derivando rispetto al tempo la (1.47) e sfruttando l’equazione di continuità ∇ · ~jL = −∂t ρ,
si ottiene
∂ρ
∂ 2
∇ φ = −4π
= 4π∇ · ~j
∂t
∂t
(1.49)
da cui, invertendo l’ordine fra la derivata temporale e il laplaciano al primo membro,
∂φ
~
− 4π j = 0.
(1.50)
∇· ∇
∂t
Ricordando che ∇ ∧ ~jL = 0 e che il rotore di un gradiente è nullo, la quantità in parentesi
nell’ultima relazione è sia solenoidale che irrotazionale, di conseguenza anche il suo laplaciano è nullo e, nell’ipotesi che φ e ~jL si annullino all’infinito in modo sufficientemente
rapido, si può concludere che
∇
∂φ
− 4π~j = 0
∂t
(1.51)
Ora, imponendo la condizione di Coulomb (1.44), l’equazione (1.28) diviene
~−
∇2 A
~
1 ∂2A
1 ∂φ
4π
− ∇
= − ~j
2
2
c ∂
c ∂t
c
(1.52)
o analogamente
~
1 ∂2A
4π
1 ∂φ
= − ~j + ∇ ,
c2 ∂ 2
c
c ∂t
che in virtù della (1.50) e della scomposizione ~j = ~jL + ~jT si semplifica in
~−
∇2 A
~−
∇2 A
~
1 ∂2A
4π
= − ~jT .
2
2
c ∂
c
(1.53)
(1.54)
Come anticipiato, anche il gauge di Coulomb consente di descrivere la dinamica del
potenziale vettore attraverso l’equazione di D’Alembert. Inoltre una trasformazione di
gauge
~ −→ A
~0 = A
~ + ∇χ
A
12
(1.55)
1 – La teoria elettromagnetica
generata da una funzione χ a laplaciano nullo
∇2 χ = 0
(1.56)
~0 = ∇ · A
~ + ∇ · ∇χ = ∇ · A
~ + ∇2 χ = ∇ · A;
~
∇·A
(1.57)
soddisfa ancora la condizione (1.44)
se si richiede che la trasformazione di gauge sia ovunque regolare, l’unica classe di soluzioni
~=A
~ 0 . La gauge di Coulomb in questo
della (1.56) è χ = costante, di conseguenza si avrà A
caso è unica.
In assenza di sorgenti, ρ = 0 l’equazione (1.54) per il potenziale vettore non è che
l’equazione delle onde
~
1 ∂2A
= 0.
(1.58)
2
2
c ∂
In tale situazione si può richiedere di soddisfare contemporaneamente due condizioni
~−
∇2 A
~ = 0,
∇·A
φ = 0,
(1.59)
è questa la gauge di radiazione.
Si dimostra ora che le richieste (1.59) sono consistenti con l’ipotesi ρ = 0. Dati dei generici
~ e φ, si consideri una trasformazione di gauge
potenziali elettromagnetici A
~0 = A
~ + ∇χ
A
1 ∂χ
φ0 = φ −
,
c ∂t
(1.60)
(1.61)
generata dalla funzione
Z
t
χ(~x,t) = c
φ(~x,t0 ) dt0 .
(1.62)
t0
Derivando la funzione χ, la (1.61) coincide con la condizione della gauge temporale
Z t
∂
0
φ =φ−
φ(~x,t0 ) dt0 = 0.
(1.63)
∂t t0
Si effettui ora un’ulteriore trasformazione di gauge
~ 00 = A
~ 0 + ∇χ0
A
1 ∂χ0
φ00 = φ −
,
c ∂t
(1.64)
(1.65)
~ 00
con l’ulteriore richiesta su A
~ 00 = ∇ · A
~ 0 + ∇2 χ0 = 0.
∇·A
13
(1.66)
1 – La teoria elettromagnetica
La soluzione di quest’ultima equazione, altrimenti formulata come l’equazione di Poisson
per χ0
~ 0,
∇2 χ0 = −∇ · A
(1.67)
è, ricordando la (1.38) e che ∇0 ≡ ∂/∂~x0 ,
χ0 (~x0 ,t) =
1
4π
~ 0 (~x0 ,t)
∇0 · A
d3 ~x0 .
0
|~x − ~x|
Z
(1.68)
Ancora, la gauge temporale φ0 = 0 ottenuta, fornisce l’omogenea dell’equazione (1.38) per
il potenziale vettore
∂
~ 0 = 0,
∇·A
∂t
che sostituita nella soluzione (1.68) comporta
∂χ0
=0
∂t
(1.69)
(1.70)
Quindi, in definitiva si ricava
φ00 = φ0 −
1 ∂χ0
= φ0 = 0,
c ∂t
(1.71)
confermando che in assenza di sorgenti, possono essere scelti dei potenziali elettromagnetici
che soddisfino la gauge di radiazione (1.59).
1.3
Il campo elettromagnetico
Da quanto appena illustrato risulta che la gauge di radiazione si rivela efficace per la
descrizione del campo elettromagnetico nello spazio vuoto, privo di sorgenti e consente
di sintetizzare le quattro equazioni di Maxwell (1.1)-(1.4), in un’unica equazione per il
~
potenziale vettore A
2~
~ − 1 ∂ A = 0,
(1.72)
∇2 A
c2 ∂ 2
l’equazione delle onde.
In generale ogni funzione f (~x,t) a quadrato integrabile rispetto ad ~x, cioè appartenente
allo spazio L2 (R3 ) per ogni t, se soddisfa l’equazione
∇2 f (~x,t) −
1 ∂ 2 f (~x,t)
= 0,
c ∂2t
può essere rappresentata mediante un integrale di Fourier
Z
1
~
d3~k F(~k,t) eik·~x ,
f (~x,t) =
3/2
(2π)
14
(1.73)
(1.74)
1 – La teoria elettromagnetica
dove
F(~k,t) =
1
(2π)3/2
Z
~
d3 ~x e−ik·~x f (~x,t)
∈ L2 (R3 )
(1.75)
è la sua trasformata inversa; sostituendo la (1.74) nella (1.73) si ottiene
1
(2π)3/2
=−
1 i~k·~x ∂ 2 F(~k,t)
2 i~k·~
x
~
d k F(k,t) ∇ e
− 2e
c
∂2t
Z
1 ∂ 2 F(~k,t) i~k·~x
d3~k ~k 2 F(~k,t) − 2
e
= 0,
c
∂2t
Z
1
(2π)3/2
3~
che è vera se e solo se
∂ 2 F(~k,t)
− ω 2 F(~k,t) = 0,
∂2t
(1.76)
(1.77)
dove si è posto ω = c~k 2 = ck.
La soluzione generale di quest’ultima equazione è della forma
F(~k,t) = c1 (~k)e−iωt + c2 (~k)eiωt ,
per cui l’equazione delle onde (1.73) ammette soluzioni del tipo
Z
1
3~
~k)ei(~k·~x−ωt) + c2 (~k)ei(~k·~x+ωt)
f (~x,t) =
d
k
c
(
1
(2π)3/2
~
o equivalentemente, sostituendo nel secondo membro ~k con −k,
Z
1
~
~
f (~x,t) =
d3~k c1 (~k)ei(k·~x−ωt) + c2 (~k)e−i(k·~x−ωt) .
3/2
(2π)
Dunque, il potenziale vettore, soluzione della (1.72) è
Z
1
~
~
~
A(~x,t) =
d3~k ~a(~k) ei(k·~x−ωt) + ~ã(~k) e−i(k·~x−ωt) ;
3/2
(2π)
(1.78)
(1.79)
(1.80)
(1.81)
~ sia reale si ha
imponendo che A
~ã(~k) = ~a∗ (~k),
(1.82)
ottendendo in definitiva
~ x,t) =
A(~
1
(2π)3/2
Z
~
~
d3~k ~a(~k) ei(k·~x−ωt) + ~a∗ (~k) e−i(k·~x−ωt) .
Per convenienza formale si usa rinormalizzare l’ultima relazione come segue
r
Z
1
2πc2 ~ i(~k·~x−ωt)
~
3~
~ x,t) =
A(~
d
k
~a(k) e
+ ~a∗ (~k) e−i(k·~x−ωt) .
3/2
ω
(2π)
15
(1.83)
(1.84)
1 – La teoria elettromagnetica
~ cosı̀ ricavata è di fatto la sovrapposizione di onde piane
L’espressione di A
~
~a(~k) e±i(k·~x−ωt)
(1.85)
di ampiezza ~a(~k), pulsazione ω e numero d’onda ~k, quest’ultime legate dalla relazione
~ = 0 implica
ω = c k. Si tratta in particolare di onde trasversali, infatti, la condizione ∇ · A
che le ampiezze delle onde siano perpendicolari alla direzione di propagazione:
~k · ~a(~k) = 0.
(1.86)
La trasversalità delle onde si esplicita ulteriormente introducendo i versori di polarizza~ definiti come segue
zione ˆ1 (~k) e ˆ2 (k),
ˆ1 (~k) · ˆ2 (~k) = ˆ1 (~k) · ~k = ˆ2 (~k) · ~k = 0
~k
ˆ1 (~k) ∧ ˆ2 (~k) = .
k
(1.87)
(1.88)
Le ampiezze ~a(~k) allora si esprimono in termini dei versori di polarizzazione
~a(~k) = a1 (~k)ˆ
1 (~k) + a2 (~k)ˆ
2 (~k),
(1.89)
dunque anche l’espressione (1.84) del potenziale vettore si modifica in
r
2 Z
X
1
2πc2
3~
~k) aλ (~k) ei(~k·~x−ωt) + a∗ (~k) e−i(~k·~x−ωt) ;
~ x,t) =
A(~
d
k
ˆ
(
λ
λ
ω
(2π)3/2 λ=1
(1.90)
come anticipato, la trasversalità delle onde piante è ancora più evidente in questa espressione, dal momento che, secondo la definizione (1.87) i versori ˆi , i = 1,2, sono ortogonali
al vettore di propagazione ~k.
Si dimostra ora che, non solo il potenziale vettore, ma anche il campo elettrico e il campo
magnetico, soddisfano l’equazione di D’Alembert. Si considerino a tal fine le equazioni di
Maxwell nel vuoto
~ x,t) = 0
∇ · E(~
(1.91)
~ x,t) = 0
∇ · B(~
~ x,t)
1 ∂ B(~
=0
c ∂t
~
~ x,t) − 1 ∂ E(~x,t) = 0;
∇ ∧ B(~
c ∂t
~ x,t) +
∇ ∧ E(~
16
(1.92)
1 – La teoria elettromagnetica
applicando alla legge di Faraday-Neumann l’operatore rotore e sfruttando l’identità
~
~ = ∇(∇ · E)
~ − ∇2 E,
∇ ∧ (∇ ∧ E)
(1.93)
~ + 1 ∂ ∇∧B
~ − ∇2 E
~ = 0,
∇(∇ · E)
c ∂t
(1.94)
si ottiene
ed infine dalle leggi di Gauss (1.91) e di Ampère (1.92) nel vuoto si conclude
~−
∇2 E
~
1 ∂2E
= 0.
c2 ∂t2
(1.95)
~
Al medesimo risultato si giunge applicando l’operatore rotore alla divergenza di B:
~−
∇2 B
~
1 ∂2B
= 0.
c2 ∂t2
(1.96)
~ anche
è immediato dedurre che, analogamente a quanto visto per il potenziale vettore A,
~ eB
~ si possono esprimere come una sovrapposizione di onde piane del tipo
i campi E
1
~ x,t) =
E(~
(2π)3/2
~ x,t) =
B(~
1
(2π)3/2
r
2πc2 h ~ ~ i(~k·~x−ωt) ~ ∗ ~ −i(~k·~x−ωt) i
,
E (k) e
+ E (k) e
ω
r
Z
i
2πc2 h ~ ~ i(~k·~x−ωt)
3~
~ ∗ (~k) e−i(~k·~x−ωt) ;
d k
B(k) e
+B
ω
Z
d3~k
(1.97)
(1.98)
anche in questo caso, le espressioni appena illustrate devono essere coerenti con le equazioni
di Maxwell le quali impongono l’ortogonalità fra i campi e il vettore d’onda ~k
~k · E~ (~k) = 0
~ ~k) = 0,
~k · B(
(1.99)
e, tramite la Legge di Faraday (1.3), la perpendicolarità fra i campi stessi
~
~ ~k) = k ∧ E~ (~k).
B(
k
(1.100)
~ costituiscono una terna di vettori perpendicolari.
Si conclude dunque che i vettori ~k, E~ e B
Inoltre ricordando le relazioni che legano campo elettrico e campo magnetico al potenziale
vettore nella gauge di radiazione
~
~ = − 1 ∂A
E
c ∂t
~
~
B =∇∧A
17
1 – La teoria elettromagnetica
si ricavano analoghe formule per le ampiezze dei tre vettori
ω
E~ (~k) = i ~a(~k)
c
~
~
~
B(k) = ik ∧ ~a(~k).
(1.101)
(1.102)
~ eB
~ nel vuoto, scaturiscono da poche ultime conLe espressioni definitive per i campi E
~ , dunque sostituendo le (1.101),
siderazioni: le ampiezze dei campi sono uguali E~ = B
(1.102) negli integrali di Fourier (1.97) e (1.98) e tenendo conto della relazione (1.89), si
ottiene
r
2 Z
2
X
1
3
~k 2πc iω ˆλ (~k) aλ (~k) ei(~k·~x−ωt) − a∗ (~k) e−i(~k·~x−ωt) ,
~ x,t) =
E(~
d
λ
ω c
(2π)3/2 λ=1
(1.103)
~ x,t) =
B(~
1
(2π)3/2
2
X
Z
r
d3~k
λ=1
2πc2 ~
~
~
i[k ∧ ˆλ (~k)] aλ (~k) ei(k·~x−ωt) − a∗λ (~k) e−i(k·~x−ωt) .
ω
(1.104)
Ecco dimostrato quanto auspicato: la radiazione elettromagnetica è data da una sovrapposizione di infinite onde piane.
Anticipando sinteticamente quanto verrà di seguito illustrato, si può affermare che anche
nella teoria quantistica il campo elettromagnetico è ottenibile in termini di onde viaggianti, la sua energia coinciderà con quella di infiniti oscillatori armonici, e soprattutto sarà
quantizzata.
18
Capitolo 2
Quantizzazione del campo
elettromagnetico
Sul finire del diciannovesimo secolo, Max Planck, percorreva una strada che avrebbe condotto all’avvento della meccanica quantistica. Egli infatti era dedito allo studio della
termodinamica ed in particolare i suoi sforzi erano concentrati sulla determinazione dello
spettro energetico del corpo nero. Il corpo nero, un oggetto ideale capace di assorbire
completamente la radiazione incidente, aveva attratto per mezzo secolo l’attenzione dei
più insigni fisici dell’epoca, Boltzmann, Stefan, Wien, finchè Rayleigh e Jeans non si spinsero fino ai limiti della fisica classica. La teoria del calore e della radiazione fino a quel
momento poggiava sull’opera di Maxwell e Boltzmann: era noto che ogni corpo materiale
riscaldato emette onde elettromagnetiche con vibrazioni di tutte le frequenze e lunghezze
d’onda, che per ogni data temperatura esiste una particolare distribuzione di energia fra
le diverse frequenze e che vi è una frequenza di vibrazione predominante a cui l’intensità
è massima, frequenza che cresce all’aumentare della temperatura. La meccanica statistica inoltre aveva come principio fondamentale il Teorema di Equipartizione dell’energia, il
quale afferma che l’energia totale di un sistema costituito da un gran numero di particelle,
che scambiano energia tra loro per mezzo di urti reciproci, si ripartisce ugualmente (in
media) fra tutte le particelle. Lord Rayleigh e Sir Jeans cercarono di estendere il metodo
statistico ai problemi della radiazione termica, ipotizzando che l’energia raggiante totale
disponibile sia ugualmente distribuita fra tutte le possibili frequenze di vibrazione. In tale
assunzione risiede il limite della fisica classica: il numero di molecole di un gas in uno
spazio chiuso, seppur grandissimo, è sempre finito, mentre il numero di vibrazioni possibili
19
2 – Quantizzazione del campo elettromagnetico
nello stesso spazio è infinito, dunque per il Teorema di Equipartizione si concluderà che
ad ogni singola vibrazione spetterà una quantità di energia infinitamente piccola. Inoltre
Raylaigh e Jeans determinarono l’omonima distribuzione per la densità di energia della
radiazione termica
8πν 2 kT,
c3
ρ(ν) =
(2.1)
dunque la densità di energia totale
∞
Z
ρ(ν)dν
u=
(2.2)
0
diverge all’aumentare della frequenza ν, da cui il nome catastrofe ultravioletta.
Nel dicembre 1900, ad una riunione della Società Tedesca di Fisica, Planck sostenne che
il pericolo della catastrofe ultravioletta poteva essere evitato se si postulava che l’energia
delle onde elettromagnetiche può esistere solo sotto forma di pacchetti discreti di energia
indistinguibili fra loro. Ciascun pacchetto, o quanto, possiede una quantità di energia ben
definita ed in particolare proporzionale alla sua frequenza ν secondo la relazione
= hν.
(2.3)
Planck aprı̀ cosı̀ le porte alla meccanica quantistica. L’idea che la luce, ed in genere la
radiazione elettromagnetica, si possa considerare come un continuo treno d’onde, lasciò il
passo ad una concezione del campo elettromagnetico quantizzato.
La costante h è una costante universale chiamata costante di Planck ; nel sistema internazionale il valore della costante di Planck è 6,626 · 10−34 Js, dunque un valore cosı̀ piccolo
suggerisce che la teoria classica conserva intatta la sua validità su grande scala, cedendo
alla teoria quantistica il compito di descrivere la realtà su scala atomica.
Circa trent’anni dopo la rivoluzionaria intuizione di Planck, la teoria della meccanica
quantistica era pressocchè completa, e la quantizzazione del campo elettromagnetico si
ottenne formalmente dallo studio quantistico di un oscillatore armonico, che è di fatto,
matematicamente equivalente ad un campo elettromagnetico monocromatico con stessa
frequenza di vibrazione.
2.1
I modi normali
L’Hamiltoniana quantistica di un oscillatore armonico ha la stessa forma di quella classica,
a patto di sostituire le variabili canoniche con i corrispondenti operatori hermitiani definiti
20
2 – Quantizzazione del campo elettromagnetico
nello spazio di Hilbert. Pertanto, se m è la massa della particella, l’Hamiltoniana del
sistema è
H=
1
(p2 + m2 ω 2 q2 ),
2m
(2.4)
dove q e p corrispondono rispettivamente alle coordinate q e ad i momenti coniugati p,
per i quali vale la relazione
[q,p] = i~.
(2.5)
Si usa introdurre gli operatori non-hermitiani (dunque non corrispondenti ad alcun osservabile) di annichilazione a e creazione a†
a= √
1
(ωq + ip)
2~ω
a† = √
1
(ωq − ip),
2~ω
(2.6)
i quali sono l’uno il complesso coniugato dell’altro e soddisfano la relazione di commutazione
[a,a† ] = 1;
(2.7)
p e q in funzione di tali operatori son dati dalle relazioni
r
r
~
m~ω †
†
(a + a )
p=i
(a − a).
q=
2mω
2
(2.8)
Definendo inoltre l’operatore hermitiano N = a† a l’Hamiltoniana è esprimibile come
1
H = ~ω(N + ).
2
(2.9)
Pertanto la determinazione di autovalori e autostati per l’Hamiltoniana si traduce nella
ricerca degli autovalori e autostati di N che soddisfano l’equazione
N |ni = n |ni ,
(2.10)
accompagnati condizione di normalizzazione hn | ni = 1. Si trova che gli autovalori dell’energia sono
1
En = ~ω(n + )
2
con
n = 0,1,2, . . .
(2.11)
mentre autostati e autofunzioni sono determinati a partire dallo stato fondamentale |0i,
in corrispondenza del quale l’oscillatore armonico possiede la minima energia:
1
|ni = √ (a† )n |0i
n!
1
ψn = √ (a† )n ψ0
n!
21
(2.12)
2 – Quantizzazione del campo elettromagnetico
con |0i = ψ0 .
Tali autostati formano un insieme ortonormale completo che fornisce una base per lo spazio
di Hilbert.
Si considerino ora le equazioni di Maxwell per un campo elettromagnetico nel vuoto, cioè
si escluda la presenza di dielettrici o sorgenti esterne. Nel sistema c.g.s. esse sono:
~ =0
∇·E
(2.13)
~ =0
∇·B
(2.14)
~
∇∧E
~
∇∧B
~
1 ∂B
=−
c ∂t
~
1 ∂E
=
.
c ∂t
(2.15)
(2.16)
(2.17)
Riprendendo le argomentazioni sviluppate nel capitolo precedente, si esprimono il campo
~ e il campo magnetico B
~ in funzione dei potenziali elettromagnetici A
~eφ
elettrico E
~ =∇∧A
~
B
~
~ + 1 ∂ A = −∇φ;
E
c ∂t
~ = 0 e φ = 0,
Inoltre, la scelta della gauge di Coulomb, in assenza di sorgenti esterne, ∇ · A
conduce alle espressioni dei campi tramite il potenziale vettore che soddisfa, sotto queste
ipotesi, l’equazione delle onde nel vuoto (1.73)
~−
∇2 A
~
1 ∂2A
= 0.
c2 ∂t2
(2.18)
Come dimostrato nel capitolo precedente, il potenziale vettore, soluzione della (2.18), è
rappresentato da un insieme continuo di sovrapposizione di onde piane polarizzate linearmente. Tuttavia, il processo di quantizzazione del campo elettromagnetico risulta più
agevole se si esprime il campo in funzione di un numero infinito ma discreto di variabili,
in modo da poter stabilire una corrispondenza fra di esse e gli operatori dello spazio di
Hilbert. A tal fine è necessario risolvere l’equazione delle onde (2.18) con appropriate
condizioni al contorno, in altre parole è necessario immaginare il campo contenuto in una
regione finita dello spazio.
Si supponga dunque che il campo elettromagnetico sia contenuto in un cubo di lato L,
privo tuttavia di confini materiali; ciò si traduce nella condizione di periodicità
~ r,t) = A(~
~ r + L,t),
A(~
22
(2.19)
2 – Quantizzazione del campo elettromagnetico
dove ~r = (x,y,z) e L si ipotizza molto grande rispetto alle dimensioni di interesse fisico.
L’equazione delle onde si risolve per separazioni delle variabili, assumendo come soluzione
una funzione della forma
~ r,t) = A
~ 0 (~r)ψ(t),
A(~
(2.20)
che sostituita nella (2.18) conduce all’equazione
~ 0 (~r) −
ψ(t) ∇2 A
∂ 2 ψ(t)
1 ~
A
(~
r
)
= 0,
0
c2
∂2t
(2.21)
1 1 ∂ 2 ψ(t)
= 0.
c2 ψ(t) ∂ 2 t
(2.22)
~ 0 (~r)ψ(t) si ottiene
dividendo per A
1
~ 0 (~r)
A
~ 0 (~r) −
∇2 A
Il membro a destra dell’ultima equazione dipende esclusivamente dalle variabili spaziali,
quello a sinistra dalla variabile temporale, poichè i due gruppi di variabili sono indipendenti, i due membri devono essere identicamente uguali ad una costante. Pertanto, indicata
per convenienza tale costante con −k 2 , la (2.22) si scinde in due equazioni
ψ̈(t) = −k 2 c2 ψ(t)
(2.23)
∇2 A~0 (~r) = −k 2 A~0 (~r),
(2.24)
~ 0 (~r) = 0
~ 0 (~r) + k 2 A
∇2 A
(2.25)
e
che espressa nella forma
prende il nome di Equazione di Helmholtz. L’equazione differenziale temporale (2.23)
ammette come soluzione la funzione
ψ(t) = αk (0)e∓ickt = αk (0)e∓iωk t ,
(2.26)
mentre l’integrale generale dell’equazione di Helmholtz è
~
A~0 (~r) = βe±ik·~r = a cos ~k · ~r ± i b sin ~k · ~r,
(2.27)
k = |~k| e ωk = ck e a e b costanti reali, ~k è evidentemente il vettore d’onda. Combinando
~ = 0 imposta dalla
ora la condizione al contorno (2.19) per ~r = 0, con la richiesta ∇ · A
~0
gauge di Coulomb, si ricava per la componente x di A
dA0x (Lx )
dA0x (0)
=
= 0,
dx
dx
23
(2.28)
2 – Quantizzazione del campo elettromagnetico
che si esplicita come
b=0
e
sin kx Lx = 0,
(2.29)
ossia kx = nx Lπx con nx = ±1, ± 2, ± 3,....
Tale procedimento si estende alle restanti componenti.
~ = 0 e quella di normalizzazione
Inoltre, per soddisfare la condizione di transversalità ∇ · A
Z
~ 0 (~r)2 = 1,
d3~r A
(2.30)
V
con V =
L3 ,
si sceglie come soluzione particolare dell’equazione di Helmholtz (2.25), per
ogni fissato ~k
~ kλ (~r) = V − 12 êkλ ei~k·~r ,
A
(2.31)
dove êkλ è un vettore unitario, assunto reale, che garantisce la transversalità del potenziale vettore; per ogni ~k è possibile scegliere solo due versori perpendicolari fra loro e
perpendicolari a ~k
~k · êkλ = 0,
êkλ · êkλ0 = δλλ0 ,
(2.32)
con λ = 1,2. Cosı̀ definito, êkλ specifica una delle due possibili polarizzazioni del campo
ed è pertanto noto come vettore di polarizzazione.
In definitiva, in virtù della linearità delle equazioni di Maxwell, il potenziale vettore,
soluzione dell’equazione (2.18) è
X
∗
∗
~
~
~
A(~r,t) =
ψk (t)Akλ (~r) + ψk (t)Akλ (~r)
~kλ
= V
− 12
X
−i(ωk t−~k·~
r)
αk (0) e
+
~
αk∗ (0) ei(ωk t−k·~r)
êkλ
~kλ
= V
− 12
X
αk (t) e
i~k·~
r
+
~
αk∗ (t) e−ik·~r ,
êkλ
(2.33)
~kλ
dove il vettore d’onda può assumere solo valori discreti
~k = nx π , ny π , nz π
con nx,y,z = 0, ± 1, ± 2, ± 3, . . .
Lx Ly Lz
Il campo elettrico e magnetico assumono di conseguenza la forma
i X
i~k·~
r
∗
−i~k·~
r
~
E(~r,t) = 1
ωk αk (t) e
− αk (t) e
êkλ
V 2 ~kλ
X
i
~
~
i
k·~
r
∗
−i
k·~
r
~k ∧ êkλ
~ r,t) = 1
αk (t) e
− αk (t) e
B(~
V 2 ~kλ
24
(2.34)
(2.35)
(2.36)
2 – Quantizzazione del campo elettromagnetico
mentre per l’energia elettromagnetica del campo si ottiene l’espressione
Z
X k2 1
~2 + B
~2 =
αk (t)2 ,
d3~r E
H=
8π V
2π
(2.37)
~kλ
dove l’integrale è esteso all’intero volume del cubo contenente il campo.
Definendo le quantità reali
1 αk (t) + αk∗ (t)
qkλ (t) = √
c 4π
ik ∗
pkλ (t) = √
αk (t) − αk (t)
4π
(2.38)
(2.39)
si ricava, fissato ~k, quanto annunciato, ossia un’espressione per l’Hamiltoniana del campo
elettrico formalmente equivalente a quella di un oscillatore armonico di ugual frequenza
ωk
1 2
2
.
pkλ + ωk2 qkλ
2
Inoltre ricordando che αk (t) = αk (0)e−iωt e che ωk = kc, si verifica
Hkλ =
q̇ =
=
=
1 √
−iωk αk + iωk αk∗
c 4π
iω √ k αk∗ − αk
c 4π
ick ∗
√
αk − αk = p
c 4π
(2.40)
(2.41)
e
ik √
iωk αk∗ + iωk αk
4π
k ωk ∗
= − √
αk + αk
c 4π
= −ωk2 q,
ṗ =
(2.42)
cioè qkλ (t) e pkλ (t) soddisfano le equazioni di Hamilton classiche rispetto all’Hamiltoniana
(2.40), ossia equivalgono a tutti gli effetti alle variabili canoniche coniugate, coordinate e
impulsi rispettivamente.
Pertanto, l’Hamiltoniana totale del sistema
X1
2
H=
p2kλ + ωk2 qkλ
2
(2.43)
kλ
corrisponde a quella di un insieme discreto di infiniti oscillatori armonici disaccoppiati,
ciascuno oscillante con frequenza ωk . Ogni oscillazione prende il nome di modo normale.
25
2 – Quantizzazione del campo elettromagnetico
2.2
Il campo elettromagnetico quantizzato
Partendo dall’ultimo risultato ottenuto e sfruttando le proprietà quantistiche dell’oscillatore armonico precedentemente esposte, si può procedere con la quantizzazione del campo
elettromagnetico.
In primo luogo, da un confronto fra le relazioni (2.8) e le (2.38)-(2.39), si può notare che
nel processo di quantizzazione, le ampiezze del campo, α e α† sono state sostituite, a
meno di un fattore di proporzionalità, dagli operatori di creazione e distruzione a e a† e
che l’operatore N = a† a, rappresentante il numero di fotoni del sistema, ha preso il posto
della quantità |α|2 . Sostituendo alle variabili canoniche e al vettore d’onda i corrispondenti
operatori nello spazio di Hilbert q, p e k, vi è consistenza fra le (2.8) e le (2.38)-(2.39) se
si pone
s
αk −→
2π~c2
ωk
s
akλ
αk∗ −→
e
2π~c2 †
a kλ ,
ωk
per cui, per ogni k, si introducono gli operatori coordinata e impulso
s
2π~c2
qkλ =
(akλ + a† kλ )
ωk
s
2π~c2 †
pkλ =
(a kλ − akλ ).
ωk
(2.44)
(2.45)
(2.46)
La definizione degli operatori di creazione e annichilazione, seppur con diverso significato
fisico, resta invariata
1
1
akλ = √
(ωk qkλ + ipkλ ),
a† kλ = √
(ωk qkλ − ipkλ ),
2~ωk
2~ωk
cosı̀ come è immutata la regola di commutazione
(2.47)
3
[akλ (t),a† k0 λ0 (t)] = δkk
0 δλλ0 ,
(2.48)
[akλ (t),ak0 λ0 (t)] = [a† kλ (t),a† k0 λ0 (t)] = 0
(2.49)
a cui si aggiungono le relazioni
che scaturiscono dall’indipendenza dei diversi modi del campo elettromagnetico.
In virtù della sostituzione (2.44) si ricavano anche il campo elettrico e il campo magnetico
1
X 2π~ωk 2 E(r,t) = i
akλ (t) eik·r − a† kλ (t) e−ik·r ekλ
(2.50)
V
kλ
1
X 2π~ c2 2 B(r,t) = i
akλ (t) eik·r − a† kλ (t)e−ik·r k ∧ ekλ ,
(2.51)
ωk V
kλ
26
2 – Quantizzazione del campo elettromagnetico
dove ogni osservabile è stata sostituita dal rispettivo operatore; essi si ottengono dal
potenziale vettore
1
X 2π~ c2 2 A(r,t) =
akλ (t) eik·r − a† kλ (t)e−ik·r ekλ
ωk V
(2.52)
kλ
che soddisfa la condizione di normalizzazione
Z
3
d3 r Akλ (r) · A∗k0 λ0 (r) = δkk
0 δλλ0 .
(2.53)
V
A questo punto è evidente che l’Hamiltoniana del campo elettromagnetico nel vuoto è
X
1
†
H=
~ωk a kλ akλ +
;
(2.54)
2
kλ
essa corrisponde all’Hamiltoniana di un sistema costituito da infiniti oscillatori armonici
quantizzati indipendenti fra loro, dunque è ottenuta dalla somma infinita delle hamiltoniane di singolo oscillatore, ciascuno corrispondente ad un modo normale k. Ogni modo
del campo ha uno spettro discreto di energia, costituito da livelli energetici equidistanti
1
con nkλ = 0,1,2,...
(2.55)
Enkλ = ~ωk nkλ +
2
dove nkλ è l’autovalore dell’operatore N kλ = a† kλ akλ , cui appartiene l’autostato |nkλ i:
N kλ |nkλ i = nkλ |nkλ i .
(2.56)
L’autovalore nkλ rappresenta il numero di quanti di energia, i fotoni, presenti per un
particolare modo k; il numero totale di fotoni del campo è dato di conseguenza dalla
somma del numero di fotoni di ogni modo
X
nkλ .
(2.57)
kλ
Gli autovalori di H si ottengono, in virtù dell’indipendenza dei modi vibrazionali, come la
somma degli autovalori Enkλ
En =
X
~ωkλ nkλ +
kλ
1
,
2
(2.58)
gli autostati invece son dati dal prodotto tensoriale degli autostati dell’Hamiltoniana di
singolo oscillatore
|ni =
O
|nkλ i = |nk1 λ i ⊗ |nk2 λ i ⊗ |nk3 λ i ⊗ . . . .
kλ
27
(2.59)
2 – Quantizzazione del campo elettromagnetico
Per ogni modo k, gli autostati |nkλ i costituiscono un insieme completo ortonormale per
lo spazio di Hilbert Hkλ cui essi appartengono; l’intero sistema è dunque definito in uno
spazio di Hilbert H ottenuto a sua volta dal prodotto tensoriale dei sottospazi Hkλ
O
H =
Hkλ .
(2.60)
kλ
è opportuno ricordare a questo punto che la teoria quantistica si fonda sul principio di
corrispondenza, che sancisce un legame formale con la teoria classica, eppure le conclusioni
a cui le due teorie conducono sono tutt’altro che scontate. Nell’espressione dell’energia del
campo elettromagnetico (2.58) sono sintetizzati alcuni dei risultati più sorprendenti della
meccanica quantistica. In primo luogo è evidente la nota quantizzazione dell’energia, precedentemente ricavata per l’oscillatore armonico e qui generalizzata al caso di un sistema
a infiniti gradi di libertà: l’energia del campo elettromagnetico è strettamente legata al
numero di fotoni che lo compongono, ciascuno dei quali ha energia ~ω. Ad ogni frequenza
di vibrazione del campo ωk è associato uno spettro energetico, la cui energia è data dalla
somma dell’energia dei quanti caratterizzati dalla medesima ωk ; poichè i modi del campo
sono indipendenti l’un l’altro, l’energia totale è data dalla somma dell’energia di ciascuno
spettro. Nel caso di un campo elettromagnetico confinato in un certo volume, lo spettro
energetico è discreto e l’energia complessiva è espressa dalla (2.58); se il campo si trovasse
nel vuoto, in assenza di alcun confine, i suoi livelli energetici formerebbero uno spettro
continuo. In ogni caso, comunque, non tutti i valori dell’energia sono consentiti, come
invece è vero in elettrodinamica classica.
Il secondo punto di rottura con la teoria classica si manifesta ponendo nella (2.55) nkλ = 0,
ossia assumendo che in un certo stato |nkλ i, con k fissato, non ci siano fotoni; tale stato
è chiamato vacuum state, stato di vuoto, ed indicato con |0i. Seppur in assenza di fotoni,
il campo elettromagnetico ha energia ~ωkλ /2, definita zero-point energy, energia di punto
zero . Quanto appena affermato è indubbiamente sbalorditivo, considerando che secondo
la centenaria visione classica della realtà, nello stato di vuoto, anche detto stato di minima energia, il campo si annulla in ogni punto; ma cè di più. Nel particolare caso in
esame, cioè quando si ha a che fare con un sistema a infiniti gradi di libertà, l’esistenza
del energia di punto zero comporta la divergenza dell’Hamiltoniana del sistema (2.54): la
P
somma kλ 12 ~ωk evidentemente non converge. L’infinito emerso è la somma dei punti
zero dell’energia degli infiniti modi normali che costituiscono il campo elettromagnetico.
Estendendo ora l’attenzione agli altri autostati dell’energia |ni si evidenziano ulteriori
proprietà degne di nota. Si può ad esempio dimostrare che i valori medi dei campi sugli
28
2 – Quantizzazione del campo elettromagnetico
stati stati stazionari |ni sono nulli.
L’azione degli operatori di creazione e annichilazione sul generico stato |nkλ i, con k fissato,
è definita dalle formule di ricorrenza
a† kλ |nkλ i =
akλ |nkλ i =
con
√
√
nkλ + 1 |nkλ + 1i
(2.61)
nkλ |nkλ − 1i
(2.62)
akλ |0i = 0,
(2.63)
ed inoltre un generico autostato |nkλ i si ottiene applicando più volte allo stato di vuoto
l’operatore di creazione a† kλ
(a† kλ )nkλ
√
|0i .
nkλ !
Ora, dalla (2.50) si ricava il modo del campo elettrico di frequenza ωk
|nkλ i =
E kλ (r,t) = iεkλ [akλ (t)Akλ (r) − a† kλ (t)A†kλ (r)],
(2.64)
(2.65)
1
1
dove εkλ = (2π~ωk ) 2 e Akλ (r) = V − 2 eik·r ekλ , dunque per ogni k, si ha
hnkλ | E kλ (r,t) |nkλ i = hnkλ | iεkλ (akλ Akλ − a† kλ A†kλ ) |nkλ i
= iεkλ Akλ hnkλ | akλ |nkλ i − A†kλ hnkλ | a† kλ |nkλ i
√
√
= iεkλ Akλ nkλ hnkλ | nkλ − 1i − A†kλ nkλ + 1 hnkλ | nkλ + 1i
= 0;
(2.66)
Dall’ortogonalità degli autostati del campo e dalle relazioni (2.50) e (2.59) si evince che il
valore medio del campo elettrico sugli autostati dell’energia è nullo
hn|E(r,t)|ni = 0,
(2.67)
con analogo procedimento, considerando la (2.51), si dimostra un medesimo risultato anche
per il campo magnetico
hn|B(r,t)|ni = 0.
(2.68)
Diverso è tuttavia il risultato per il valor medio di E 2 (r,t):
2
hnkλ | E 2 (r,t) |nkλ i = −ε2kλ [A2kλ a2kλ + a† kλ A2kλ − |Akλ |2 (akλ a† kλ + a† kλ akλ )]
2
= −ε2kλ A2kλ hnkλ | a2kλ |nkλ i + A2kλ hnkλ | a† kλ |nkλ i +
− |Akλ |2 hnkλ | 1 + 2a† a |nkλ i
= ε2kλ |Akλ |2 (2nkλ + 1)
r
h
1 i2
,
= εkλ |Akλ | nkλ +
2
29
(2.69)
2 – Quantizzazione del campo elettromagnetico
per ogni k, quindi
r
Xh
1 i2
hn|E 2 (r,t)|ni =
εkλ |Akλ | nkλ +
.
2
(2.70)
kλ
Pertanto non nullo è anche lo scarto quadratico medio che fornisce una stima delle fluttuazioni del campo
∆E =
Xq
hE 2kλ i
−
hE 2kλ i
Xq
=
hE 2kλ i
kλ
kλ
=
X
=
X
kλ
r
εkλ |Akλ | nkλ +
1
2
√
εkλ |Akλ | nkλ + hE 2kλ i0 ,
(2.71)
kλ
dove hE 2kλ i0 = εkλ |Akλ | 21 è la dispersione del campo elettrico rispetto allo stato di vuoto
|0i. Il risultato appena ottenuto è una conseguenza della non commutabilità di N kλ e
E kλ su cui si fonda un altro pilastro della meccanica quantistica, il principio di indeterminazione, in virtù del quale è impossibile conoscere contemporaneamente e con precisione
il campo elettrico e il numero di fotoni che lo compongono. Tale proprietà essendo valida
per tutti gli stati del campo lo è anche per lo stato di vuoto , a dimostrazione che anche in
assenza di fotoni il campo elettromagnetico presenta delle fluttuazioni. L’energia di vuoto
del campo elettromagnetico si associa a particelle virtuali che compaiono e scompaiono
nello stato fondamentale |0i. Da un punto di vista formale, le fluttuazioni di vuoto contribuiscono con costanti aggiuntive alle misure dei valori medi, costanti che non alterano
il significato fisico delle misure; si possono dunque inglobare le fluttuazioni di vuoto nella
definizione dell’Hamiltoniana, senza perdere alcuna informazione fisica
X 1
1
†
~ωk akλ a kλ − ~ωk
HF = H − h0| H |0i =
2
2
kλ
X 1
1
†
~ωk 2a kλ akλ + 1 − ~ωk
=
2
2
kλ
X
=
~ωk a† kλ akλ .
(2.72)
kλ
La ridefinizione dell’Hamiltoniana, (2.72), è chiamata normal order e consente di eliminare formalmente l’energia di punto zero perchè implicita nella definizione stessa. Ciò
nonstante, come verrà dimostrato a breve, l’energia di vuoto ha una realtà fisica che non
può essere ignorata e che anzi è alla base di numerosi fenomeni quantistici. Per concludere, è opportuno aprire una parentesi sulla fase del campo elettromagnetico. Fin qui si è
30
2 – Quantizzazione del campo elettromagnetico
assunto senza indugio, che, come per le altre osservabili, anche alla fase fosse associato un
operatore hermitiano; in realtà la sua stessa esistenza è tutt’ora argomento di discussione.
Vari sono stati i tentativi di dare forma a tale operatore: Dirac, per primo, ipotizzò una
decomposizione in forma polare degli operatori di annichilazione e creazione
√
a = eiφ N
a† =
√
N e−iφ
(2.73)
di modo che l’operatore dell’esponenziale della fase eiφ fosse unitario (condizione necessaria
per essere hermitiano).
Susskind e Glogower dimostrarono che tale decomposizione non è attuabile e ne proposero
una alternativa, introducendo gli operatori E ed E † , detti operatori SG
1
1
E = (N + 1)− 2 a = (aa† )− 2 a
1
(2.74)
1
E † = a† (N + 1)− 2 = a† (aa† )− 2 ,
(2.75)
che di fatto corrispondono proprio all’operatore esponenziale e±iφ . Una volta determinati
gli autostati |φi di E che soddisfano l’equazione
E |φi = eiφ |φi ,
(2.76)
quindi, autostati della fase, li utilizzarono per costruire una sorta di distribuzione della
fase P (φ) per un arbitrario stato |ψi del campo
P (φ) =
1
| hφ | ψi |2 .
2π
(2.77)
Ad un risultato simile giunsero anche Pegg e Barnett, i quali però definirono prima un
operatore di fase approssimativo in uno spazio ristretto, finito-dimensionale, dello spazio
di Hilbert, per poi ottenere proprio, come limite, la distribuzione (2.77).
31
Capitolo 3
Effetti delle fluttuazioni di vuoto
La teoria quantistica della radiazione, attraverso la quantizzazione del campo elettromagnetico, ha evidenziato l’esistenza di un’energia di punto zero, ossia l’esistenza di uno stato
con numero di fotoni nullo e fluttuazioni del campo finite. I risvolti di tale risultato furono
notevoli: diversi fenomeni infatti, fra cui il Lamb shift e l’effetto Casimir, non possono
essere spiegati secondo la fisica classica perchè ascrivibili a interazioni puramente quantistiche.
In particolare, dall’analisi sperimentale dell’atomo di idrogeno, apparvero distinti, dei livelli energetici che la teoria prevedeva essere degeneri. La separazione è, per l’appunto,
dovuta all’interazione dell’elettrone con le fluttuazioni di vuoto del campo elettromagnetico interno all’atomo.
L’effetto Casimir invece si manifesta come un’interazione fra due conduttori, legata alle
condizioni al contorno imposte dal sistema al campo magnetico quantizzato. Casimir, predisse teoricamente il fenomeno studiando due lastre infinte perfettamente conduttrici; egli
determinò l’esistenza di una forza attrattiva fra i due oggetti, indipendente dal materiale,
che attribuı̀ alla pressione dell’energia di punto zero delle onde elettromagnetiche. Su scala
atomica, fra un atomo e una superficie conduttrice, le fluttuazioni di vuoto generano una
forza attrattiva nota come forza di Casimir-Polder.
3.1
Lamb shift
L’atomo di idrogeno, nella sua rappresentazione più semplice e stilizzata, è costituito
da un protone e un elettrone soggetti a un potenziale centrale. Dal momento che la
32
3 – Effetti delle fluttuazioni di vuoto
massa del protone è molto più grande di quella dell’elettrone, è possibile descrivere il
sistema assumendo che l’elettrone ruoti attorno al protone immaginato fisso nel centro del
sistema di riferimento in cui si opera. Questa approssimazione consente di ridurre l’analisi
dell’atomo allo studio della funzione d’onda del solo elettrone.
Sotto queste ipotesi dunque, l’Hamiltoniana del sistema è
H0 =
e2
p
− ,
2m
r
(3.1)
dove naturalmente p, m, −e sono rispettivamente impulso, massa non relativistica e carica
dell’elettrone, e r è la distanza dal protone. Per un sistema a potenziale centrale di questo
tipo, le funzioni d’onda si esprimono come il prodotto di un’autofunzione radiale e di una
angolare
ψ(r,ϑ,ϕ) = Rn (r) Ylm (ϑ,ϕ)
(3.2)
essendo n, l, m i numeri quantici legati agli autovalori degli operatori H0 , L2 , Lz
H0 |ψi = En |ψi
con n = 0,1,2, . . .
(3.3)
L2 |ψi = ~ l(l + 1) |ψi
con l = 0, . . . ,n − 1
(3.4)
Lz |ψi = ~ m |ψi
con m = −l, . . . , + l,
(3.5)
dove |ψi è l’autostato associato all’autofunzione ψ.
L’equazione di Schrödinger indipendente dal tempo
H0 ψ = E ψ
(3.6)
fornisce gli autovalori dell’energia, che in questa rappresentazione dell’atomo di idrogeno,
dipendono esclusivamente dal numero quantico principale n:
1 1
= −13,6 2 eV,
En = −α2 mc2
2
2n
n
dove n può assumere solo valori interi non negativi, come prima indicato, e α =
(3.7)
e2
~c
'
1
137
è la costante di struttura fine. Inoltre, tenendo presente l’intervallo di variazione dei tre
numeri quantici, si osserva che per n fissato, ogni livello energetico ha degenerazione n2 :
n−1
X
(2l + 1) = n2 ,
(3.8)
l=0
il che significa che per ogni n, esistono n2 autostati aventi la medesima energia En .
Le discrepanze fra i risultati sperimentali e le predizioni teoriche sono tuttavia notevoli, in
33
3 – Effetti delle fluttuazioni di vuoto
particolare lo spettro energetico dell’atomo presenta più livelli energetici di quanti il modello ne predica. Una descrizione più accurata si ottiene ricordando che l’energia cinetica
classica è il limite, per basse velocità, dell’energia relativistica, e che l’elettrone possiede
un momento angolare intrinseco, lo spin. Ciò si traduce nell’aggiungere all’Hamiltoniana
H0 opportuni termini correttivi: la correzione relativistica è rappresentata dal termine
!
1
p4 ,
(3.9)
Hrel = −
8m3 c2
il contributo di spin invece è espresso come
Hso =
e2
S
·
L
,
2m2 c2 r3
(3.10)
con S e L, rispettivamente spin e momento angolare orbitale dell’elettrone. Il termine
(3.9), come detto, scaturisce dalla definizione dell’energia nella relatività ristretta
T =
p
p2 c2 + m2 c4 − mc2
(3.11)
che all’ordine più basso è approssimato da
T =
p2
p4
−
+ ....
2m 8m3 c2
(3.12)
Esso consente di ricavare la deviazione, negativa, rispetto all’energia E 0 , autovalore dell’Hamiltoniana imperturbata H0 :
E rel
"
#
2n
1
3
= −α4 mc2 2
−
.
4n l + 21
2
(3.13)
Poichè Erel è proporzionale alla quarta potenza di α, fornisce una correzione di un circa
un fattore 10−4 .
Il termine (3.10) è legato all’interazione spin-orbita fra il momento di dipolo µS associato
allo spin dell’elettrone e il campo magnetico B che il protone genera ruotando attorno
all’elettrone. La scelta del sistema di riferimento è infatti totalmente arbitraria, quindi
immaginando una descrizione dell’atomo in cui l’elettrone è a riposo
1
e il protone gli
orbita attorno, il campo magnetico B è legato al momento angolare L dell’elettrone dalla
relazione
B=
e
L.
mcr3
1
(3.14)
Si tratta di un sistema non inerziale, dunque per ottenere il termine di interazione W nel sistema di
riferimento inerziale originario, sarà necessario dividere per due. [5]
34
3 – Effetti delle fluttuazioni di vuoto
Inoltre, il momento di dipolo magnetico µS si definisce come
e
S,
mc
(3.15)
W = −µS · B
(3.16)
µS = −
dunque l’energia di interazione
si esprime in funzione del prodotto scalare S · L, e nel sistema di riferimento originario è
e2
S·L ,
2
2
3
2m c r
W =
(3.17)
da cui la (3.10).
La deviazione dall’energia E 0 dovuta all’interazione spin-orbita è data da
#
j(j
+
1)
−
l(l
+
1)
−
3/4
.
Eso = α2 mc2
4n3 l(l + 1)(l + 172)
(3.18)
La hamiltoniana totale del sistema a seguito di tali correzioni diviene
H = H0 + Hrel + Hso ,
(3.19)
combinando infine le (3.13) e (3.18) si ricava la correzione all’energia E 0 da cui ha luogo
la struttura fine dell’atomo di idrogeno
Ef s
dove j = l − 12 , . . . , l +
1
2
"
#
1
2n
3
= −α mc
−
4n2 j + 21
2
4
2
(3.20)
e’ il numero quantico associato al momento angolare totale
J = L + S che in presenza dell’interazione spin-orbita si conserva (invece non si conservano più L e S).
Dalla relazione (3.20) è evidente che le correzioni apportate hanno abbassato i livelli energetici associati all’hamiltoniana imperturbata H0 e hanno rimosso parzialmente la degenerazione degli stati con ugual numero quantico n e diverso j; infatti confrontando l’intervallo
di variabilità di i e l si deduce che j ha numero di degenerazione n, potendo assumere i
valori
1
1
j = , ... n − .
(3.21)
2
2
Dunque ogni livello En si scinde in n sottolivelli distinti la cui energia dipende dal momento angolare totale j.
Ancora una volta però l’esperienza è in disaccordo con la teoria. La relazione (3.20) sostiene che i livelli energetici 2s1/2 e 2p1/2 siano degeneri, ma nel 1947 Lamb e Retherford
35
3 – Effetti delle fluttuazioni di vuoto
misurarono una piccola separazione fra di essi: il livello 2s1/2 si trovava circa 1000 MHz
più in alto del livello 2p1/2 . L’effetto prese il nome di Lamb shift.
L’inadeguatezza della struttura fine dell’atomo di idrogeno è dovuta al trattamento classico che si è riservato al il campo magnetico H. Nell’espressione del potenziale centrale
V (r) = − re2 si riconosce infatti la legge di Coulomb, e lo stesso campo magnetico lo si è
ottenuto dalla legge di Biot-Savart
ev
,
(3.22)
cr2
dove e, v sono rispettivamente carica e velocità orbitale del protone e r la distanza radiale
B=
rispetto all’elettrone posto al centro del sistema di riferimento non inerziale. Esprimendo
la velocità v in funzione del momento angolare dell’elettrone L = rmv si è giunti alla
(3.14). La chiave di volta del Lamb Shift è dunque la quantizzazione del campo magnetico
visto dall’elettrone nel suo sistema di riferimento non inerziale.
A questo punto sembrerebbe ridondante ripetere che una descrizione quanto più possibile
veritiera della realtà è imprescindibile da un approccio quantistico, ma probabilmente ai
tempi di Lamb non era ancora cosı̀ ovvio, dal momento che Dirac, nel 1989, ricordò la
scoperta di Lamb e Retherford e l’interpretazione del fenomeno, come una svolta nella
storia della fisica teorica.
Lo stesso Dirac ritenne che l’elemento mancante della trattazione precedente fosse l’accoppiamento fra l’elettrone e il campo elettromagnetico di vuoto.
2
In questa prospettiva,
l’elettrone dell’atomo, interagente con il campo elettromagnetico quantizzato, ha energia
2
1
p − ec A , ed è soggetto a
cinetica espressa dal termine di accoppiamento minimo, 2m
potenziale eφ, dove p è il momento della particella, A e φ potenziale vettore e potenR 3
1
d r (E 2 + B 2 ). Dunque per
ziale scalare rispettivamente. L’energia del campo è 8π
l’hamiltoniana del sistema si ha
Z
e 2
1 1
H =
p − A + eφ +
d3 r (E 2 + B 2 )
2m
c
8π
p2
e
e
e2
=
−
(A · p) −
(p · A) +
A2 + eφ +
2m 2mc
2mc
2mc2
p2
e
e
e2
=
+ eφ −
(A · p) −
(p · A) +
A2 +
2m
2mc
2mc
2mc2
e
e
e2
= HA + HF −
(A · p) −
(p · A) +
A2 ,
2mc
2mc
2mc2
Z
1
d3 r (E 2 + B 2 )
8π
Z
1
d3 r (E 2 + B 2 )
8π
(3.23)
dove HA è l’hamiltoniana dell’elettrone atomico e HF l’hamiltoniana del campo. Inoltre
ipotizzando che la lunghezza d’onda del campo λ sia molto maggiore del raggio di Bohr
2
Per una trattazione più dettagliata si rimanda a [3]
36
3 – Effetti delle fluttuazioni di vuoto
a0 , λ a0 si pù operare sfruttando l’approssimazione di dipolo elettrico, il quale consente di trascurare la dipendenza spaziale del potenziale vettore A. Sotto queste ipotesi,
l’hamiltoniana è in definitiva
H = HA + HF −
e
e2
(A · p) +
A2 .
mc
2mc2
(3.24)
La teoria delle perturbazioni stazionarie consente di valutare gli effetti dell’interazione fra
elettrone e campo elettromagnetico, racchiusa negli ultimi due termini dell’hamiltoniana
(3.23). In realtà l’unico termine che modifica i livelli energetici dell’atomo di idrogeno
è quello proporzionare a A · p, in quanto l’altro,
e2
2mc2
A2 , non dipende dagli operatori
atomici.
Ricordando l’espressione (3.40) ricavata per il potenziale vettore nel processo di quantizzazione del campo elettromagnetico
1
X 2π~ c2 2 akλ (t) eik·r − a† kλ (t)e−ik·r ekλ ,
A(r,t) =
ωk V
kλ
si può ottenere al secondo ordine perturbativo, lo spostamento dell’n-esimo livello energee
(A · p)
tico dell’atomo di idrogeno, dovuto alla presenza dal termine di interazione − mc
∆En =
X X hm, 1kλ | hkλ |n, vaci2
m
dove
hkλ = −
kλ
En − Em − ~ωk
,
e 2π~c2 21 †
a kλ (ekλ · p).
mc ωk V
(3.25)
(3.26)
Lo stato |n, vaci corrisponde alla situazione in cui l’atomo si trova nel suo autostato stazionario |ni e il campo nello stato di vuoto. Lo stato |m, 1kλ i rappresenta invece l’atomo nello
stato |mi e un solo fotone nel modo (kλ). La presenza di |m, 1kλ i è giustificata dall’azione
degli operatori di creazione e di distruzione a† kλ e akλ , che compaiono nell’espressione di
A, e che agiscono sullo stato di vuoto del campo secondo le definizioni:
a† kλ |vaci = |1kλ i .
akλ |vaci = 0
(3.27)
Dal momento che
hm, 1kλ | hkλ |n, vaci = −
e 2π~c2 12
pmn · ekλ ,
mc ωk V
37
(3.28)
3 – Effetti delle fluttuazioni di vuoto
lo spostamento dello stato |n vaci è dato dalla relazione
2
e2 2π~c2 X X pmn · ekλ ∆En =
m2 c2 ωk V m
En − Em − ~ωk
kλ
2
2πe2 1 X X 1 pmn · ekλ =
,
m2 V m
ωk ωnm − ωk
(3.29)
kλ
dove si è posto ~ωnm = En − Em . Inoltre, a parte il fattore numerico, esplicitando il
termine
hm, 1kλ | hkλ |n, vaci2 = hm, 1kλ | a† kλ (p · ekλ ) |n, vaci2
= hn, vac| akλ (p · ekλ ) |m, 1kλ i hm, 1kλ | a† kλ (p · ekλ ) |n, vaci ,
(3.30)
si osserva che la causa dello spostamento ∆En può essere ricondotta al processo di emissione n −→ m + γ, seguito da un processo di riassorbimento m + γ −→ n di un fotone
virtuale γ da parte dello stato di vuoto del campo.
Figura 3.1. Rappresentazione della relazione (3.30). Interpretazione del Lamb shift in
termini dell’emissione e assorbimento di un fotone virtuale
Tale procedimento conduce, però, ad un risultato che costituı̀ un vero e proprio dilemma
per i fisici dell’epoca. Maneggiando la relazione (3.29) e assumendo i modi del campo
continui e infiniti, si ottiene
∆En =
=
Z ∞
2e2 X
ωdω
2
|p
|
mn
3πm2 c3 m
ω
nm − ω
0
Z
∞
2α 1 2 X
EdE
|pmn |2
.
3π mc
E
−
Em − E
n
0
m
(3.31)
L’integrale diverge, dunque lo spostamento del livello n-esimo, che probabilmente corrispondeva al Lamb shift, risultava essere infinito, mentre sperimentalmente era stato
38
3 – Effetti delle fluttuazioni di vuoto
misurato un valore piccolo, ma finito.
La soluzione alla questione fu trovata da Bethe attorno al 1947, il quale sfruttò un procedimento noto come mass renormalization, ispirandosi ai lavori di Kramers e Weisskopf.
L’idea di base fu quella di sottrarre allo spostamento ∆En (3.31), la variazione dell’energia
del livello n-esimo dovuta all’accoppiamento fra l’elettrone libero e il campo elettromagnetico. Inoltre egli assunse che l’interazione fra l’elettrone e lo stato di vuoto responsabile
del Lamb shift, avvenisse per frequenze del campo sufficientemente basse da giustificare un
approccio non relativistico; in quest’ottica Bethe limitò superiormente l’intervallo di integrazione della (3.31), assumendo come limite superiore non più infinito, ma mc2 . L’intuito
ebbe un esito brillante: Bethe ottenne per il livello energetico 2s dell’atomo di idrogeno
uno spostamento di circa 1040M Hz, in eccellente accordo con la misura effettuata da
Lamb e Retherford.
Circa un anno dopo, nel 1948, Welton giunse alla stessa conclusione di Bethe, individuando
la causa del Lamb shift nelle fluttuazioni della posizione dell’elettrone, dovute all’energia
di vuoto del campo. Egli inoltre riuscı̀ a svincolarsi dal procedimento rinormalizzazione della massa, fondamentale nell’operato di Bethe, imponendo come estremo superiore
dell’intervallo di integrazione il valore mc2 e come estremo inferiore l’energia media di
eccitazione dell’elettrone.
Un’ulteriore interpretazione del Lamb shift, firmata Richard Feynman, riprende in qualche
modo il principio ispiratore di Bethe. Feynman considerò un gas diluito in una grande
scatola costituito a N atomi. Il Lamb shift fu ricavato sottraendo allo spostamento energetico ∆En degli atomi del gas, quello ottenuto considerando gli elettroni atomici come
particelle libere ∆Enf ree ; la differenza ∆En − ∆Enf ree , condusse ad un risultato che nel
caso limite di gas costituito da un solo atomo, riproduceva l’espressione finale di Bethe
ottenuta a seguito della rinormalizzazione della massa.
Successivi studi hanno dimostrato che le correzioni allo spettro dell’atomo di idrogeno dovute al Lamb shift, dipendono dal numero quantico l. In particolare, se l = 0, la deviazione
è
∆ELamb = α5 mc2
1
{k(n,0)},
4n3
(3.32)
dove {k(n,0)} è un fattore numerico che varia gradualmente al variare del numero quantico
n assumendo i valori 12,7 (per n = 0) e 13,2 (quando n → ∞) ; se invece l 6= 0 si ha
∆ELamb
(
)
1
1
= α5 mc2 3 k(n,l) ±
,
4n
π(j + 21 )(l + 12 )
39
(3.33)
3 – Effetti delle fluttuazioni di vuoto
dove k(n,l) ha valore minore di 0,05 e varia lentamente con n e l. La dipendenza del
termine di Lamb shift dal numero quantico l rimuove la degenerazione per gli stati caratterizzati dalla stessa coppia di n e l.
Infine, è necessario menzionare il fatto che il solo Lamb shift non completa la descrizione
dello spettro dell’atomo di idrogeno. Come l’elettrone, anche il nucleo, infatti, è dotato di
spin. Ciò comporta un accoppiamento fra gli spin dell’elettrone e del nucleo e un’interazione dovuta all’azione del campo elettromagnetico, prodotto dal moto orbitale dell’elettrone,
sul momento intrinseco del protone (la si può immaginare come un’interazione spin-orbita
nucleare). Inoltre la differenza di massa fra elettrone e protone, si ripercuote in una differenza di ordini di grandezza fra i rispettivi momenti di dipolo, pertanto le interazioni
dovute alla presenza di µp sono meno intense rispetto a quelle responsabili della struttura
fine. Il risultato complessivo è la rimozione della degenerazione anche rispetto al numero
quantico di momento angolare totale j: ogni livello energetico con n, l e j, è scisso in due
sottolivelli. Tale rappresentazione dello spettro energetico dell’atomo di idrogeno prende
il nome di struttura iperfine.
3.2
Effetto Casimir
“Bohr mumbled something about zero-point energy.”
H. Casimir [6]
Le radici dell’effetto Casimir risiedono nell’attrazione di Van der Waals che si manifesta
fra due atomi o molecole vicine, anche se si tratta di molecole apolari. Questo tipo di
interazione si estende anche a corpi neutri macroscopici e ha origine nel moto delle cariche elettriche che li compongono, le quali generano campi elettromagnetici fluttuanti nella
regione di spazio fra i due oggetti. Tali campi inducono dei momenti di dipolo transienti
nelle molecole, provocandone l’interazione. Nella formulazione quantistica dell’interazione
di Van der Waals, sviluppata da Fritz London, si verifica ciò che è stato visto precedentemente per il campo elettromagnetico: il valore medio degli operatori associati ai momenti
di dipolo degli atomi o molecole apolari è nullo, ma i momenti di dipolo istantanei indotti
fanno sı̀ che lo scarto quadratico medio sia diverso da zero. In altri termini, la forza di
Van der Waals è da intendersi come una conseguenza delle fluttuazioni di vuoto del campo
elettromagnetico, dal momento che il campo intermolecolare si può interpretare come una
serie di oscillazioni dell’energia di punto zero. Ne consegue pertanto che l’interazione di
40
3 – Effetti delle fluttuazioni di vuoto
Van der Waals è puramente quantistica; il lavoro di London conferma questa asserzione e
la completa, dimostrando che si tratta di un effetto non relativistico, dal momento che i
risultati da lui ottenuti dipendono dalla costante di Planck h, ma non dalla velocità della
luce nel vuoto c.
Quanto detto è vero nel limite in cui due atomi, molecole o corpi macroscopici si possano
definire vicini. Una forza di Van der Waals quantistica e non relativistica si manifesta
infatti se i due oggetti si trovano a distanza di pochi nanometri, distanza che consente ad
un fotone virtuale emesso da un atomo, di raggiungere l’altro in un arco di tempo minore
o uguale al suo tempo di vita. In queste condizioni le oscillazioni prodotte dall’emissione,
o assorbimento, del fotone, inducono momenti di dipolo istantanei in entrambi gli atomi;
si parla di nonretarded Van der Waals force. Se invece gli atomi sono situati a distanza
tale da non consentire al fotone virtuale di essere trasferito dall’uno all’altro, l’attrazione
dovuta alla forza non ritardata di Van der Waals non sussiste. Tuttavia, anche in questo
caso la dispersione del campo elettromagnetico risulta essere non nulla. Ciò comporta il
sorgere di momenti di dipolo e di una forza attrattiva fra i due atomi. Tale interazione può
essere interpretata come una manifestazione su larghe distanze della forza non ritardata
di Van der Waals, che prende il nome di forza di Casimir-Polder. Essa è un’interazione
ovviamente quantistica, ma, al contrario della precedente, è relativistica e dipende dalla
polarizzabilità degli atomi.
Su scala macroscopica, Casimir predisse l’esistenza di una forza attrattiva fra due lastre
neutre parallele e perfettamente conduttrici, poste nel vuoto. Quest’interazione, l’effetto
Casimir, è dunque un’estensione della forza di Casimir-Polder entro confini materiali.
La dimostrazione, per ora teorica, dell’esistenza della forza di Casimir si ricava considerando un campo elettromagnetico all’interno di un parallelepipedo di lati Lx ≡ Ly = L
e Lz , costituito da due piastre perfettamente conduttrici di area L2 ciascuna e poste a
distanza d ≡ Lz .
Le equazioni di Maxwell nel vuoto impongono la trasversalità del campo elettrico e del
campo magnetico, la scelta della guauge di Coulomb la impone anche per il potenziale
vettore A(r,t). Inoltre, la condizione di perfetta conducibilità è soddisfatta se le componenti tangenziali del campo elettrico si annullano sulle pareti del parallelepipedo; analoga
limitazione sussiste dunque anche per il potenziale vettore, le cui componenti spaziali,
41
3 – Effetti delle fluttuazioni di vuoto
soluzioni dell’equazione di Helmholtz, sono del tipo
1
Ax (r) = (8/V ) 2 ax cos (kx x) sin (ky y) sin (kz z)
1
2
Ay (r) = (8/V ) ay sin (kx x) cos (ky y) sin (kz z)
1
2
Az (r) = (8/V ) az sin (kx x) sin (ky y) cos (kz z),
(3.34)
(3.35)
(3.36)
dove a2x + a2y + a2z = 1, V = L2 Lz e il vettore d’onda k soddisfa le condizioni al contorno
(2.34)
k=
n π n π n π y
x
z
,
,
L L Lz
con
nx,y,z = 0,1,2,...
Immancabile è ovviamente la condizione di normalizzazione
Z
2
d3 r A(r)
1 =
V
Z L
Z L
Z Lz
dz[A2x (r) + A2y (r) + A2z (r)].
dx
dy
=
0
0
(3.37)
(3.38)
0
La trasversalità richiesta dalla gauge di Coulomb ∇ · A = 0 si traduce nella relazione
kx Ax + ky Ay + kz Az =
π
π
(nx Ax + ny Ay ) +
(nz Az ) = 0,
L
Lz
(3.39)
dunque se nxyz 6= 0 ci sono due possibili polarizzazioni indipendenti, se uno dei tre valori
invece si annulla c’è un’unica direzione di polarizzazione.
Ora, dalla (3.37) si evince che all’interno del parallelepipedo solo alcune frequenze sono
ammesse:
ωkn
1
2
n2y
n2z 2
nx
= c|kn | = πc 2 + 2 + 2 .
L
L
Lz
(3.40)
Pertanto l’energia di punto zero all’interno del volume è data dalla somma dei punti zero
dei modi del campo caratterizzati da frequenze ωkn
X
n
1
2
X
n2y
1
n2z 2
nx
0 (2) ~ωkn =
0 π~c 2 + 2 + 2 ,
2
L
L
Lz
n n n
(3.41)
x y z
in cui il fattore 2 prende in considerazione le due possibili polarizzazioni nel caso in cui
nxyz 6= 0, mentre l’apostrofo implica il fattore
1
2
nel caso in cui uno degli interi nxyz si
annulli, in qual caso si ha un’unica polarizzazione.
Immaginando di far tendere all’infinito le dimensioni delle superfici laterali, ossia immaginando che le lastre conduttrici diventino infinitamente grandi, pur mantenendo fissa la
distanza d fra esse, i modi possibili nelle direzioni x e y diventano infiniti, dunque nella
42
3 – Effetti delle fluttuazioni di vuoto
(3.41), la somma rispetto a nx e ny è sostituita da un integrale, mentre i valori di nz
continuano ad essere discreti:
X
nxyz
X L 2 Z Z
0
→
dkx dky .
π
n
(3.42)
z
L’energia di punto zero (3.41) in questa configurazione risulta
1
Z ∞
X Z ∞
n2z π 2 2
L2
2
2
dky kx + ky + 2
dkx
0
E(d) = 2 (~c)
π
d
0
0
n
(3.43)
z
quindi una quantità infinita in un volume finito.
Se ora, rendendo infinite le dimensioni delle due piastre, anche la distanza d diventa
infinita, nz potrà assumere valori continui; di conseguenza nell’intero spazio vuoto, tutte
le frequenze di vibrazione sono consentite. Anche la somma su nz diviene un integrale e
l’energia di punto zero nell’intero spazio si ottiene dall’integrale triplo
Z
Z ∞
Z ∞
1
L2
d ∞
E(∞) = 2 (~c)
dkx
dky
dkz (k2x + k2y + k2z ) 2 ,
π
π 0
0
0
(3.44)
che anche in questo caso fornisce una quantità infinita.
Stando a quanto finora dimostrato, l’energia potenziale del sistema nella configurazione
iniziale, cioè con le due piastre poste a distanza d è una differenza fra due infiniti (figura
(3.2)). Essa infatti è l’energia necessaria per portare le due piastre dall’infinito a distanza
d, dunque
"
1
Z ∞
Z ∞
n2z π 2 2
L2 ~c X
2
2
0
dkx
dky kx + ky + 2
U (d) =
π2
d
0
0
nz
#
Z
Z ∞
Z ∞
d ∞
2
2
2 12
−
dkx
dky
dkz (kx + ky + kz ) .
π 0
0
0
(3.45)
La forza di Casimir si ottiene rendendo finita questa quantità. Ciò è possibile attraverso
un’appropriata funzione di cut-off, che prende in considerazione il limite di conducibilità
delle lastre, ossia il fatto che tale proprietà non è più vera a grandi frequenze, o in altri
termini, a lunghezze d’onda dell’ordine delle dimensioni atomiche.
L’energia potenziale (3.45) in coordinate polari u, ϑ nel piano kx ,ky > 0 assume la forma
"
1
Z ∞
n2z π 2 2
L2 ~c π X
2
0
du u u + 2
U (d) =
π2 2 n
d
0
z
#
Z ∞
Z ∞
1
d
−
dkz
du u(u2 + kz2 ) 2 ,
(3.46)
π
0
0
43
3 – Effetti delle fluttuazioni di vuoto
dove dkx dky = u dudϑ, con 0 < ϑ < π/2. La funzione di cutoff è definita come
1
f (k) = f ([u2 + kz2 ] 2 ),
(3.47)
di modo che, posto km ≈ 1/a0 , dove a0 è il raggio di Bohr, risulti
f (k) = 1
per k << km
(3.48)
f (k) = 0
per k >> km .
(3.49)
e
In queste approssimazioni l’effetto Casimir risulta essere essenzialmente proprio delle basse
frequenze, caratterizzato da energia potenziale
"
1
Z ∞
1
n2z π 2 2
L2 ~c π X
2
du u u + 2
0
f ([u2 + kz2 ] 2 )
U (d) =
2
π 2 n
d
0
z
#
Z ∞
Z ∞
d
2
2 21
2
2 21
dkz
−
du u(u + kz ) f ([u + kz ] ) ,
π
0
0
che effettuando il cambio di variabili x = u2 d2 /π 2 e k = kz d/π diviene
"
Z ∞
1
1
π
L2 ~c π X
0
dx (x + n2z ) 2 f [x + n2z ] 2
U (d) =
2
π 2 n
d
0
z
#
Z ∞
Z ∞
π
2 12
2 12
−
dk
dx (x + k ) f ( [x + k ]
.
d
0
0
(3.50)
(3.51)
Applicando ora la formula Eulero-Maclaurin
∞
X
n=1
Z
F (n) −
0
∞
1
1
1 000
dk F (k) = − F (0) − F 0 (0) +
F (0) . . .
2
12
720
alla funzione
Z
F (k) ≡
0
∞
1
1
π
dx (x + k2 ) 2 f ( [x + k2 ] 2 ,
d
con F (k) → 0 per k → ∞, l’espressione di U si semplifica ulteriormente in
#
2 "
Z ∞
∞
X
π ~c
2 1
U (d) =
L
F (0) +
F (n) −
dk F (k) .
4d2
2
0
(3.52)
(3.53)
(3.54)
n=1
Inoltre la funzione F (k) si può riscrivere come
Z ∞
√
π√ F (k) =
u ,
du u f
d
k2
44
(3.55)
3 – Effetti delle fluttuazioni di vuoto
la cui derivata di primo ordine è
π
F 0 (k) = −2k2 f ( k),
d
(3.56)
F 0 (0) = 0 F 000 (0) = −4
(3.57)
pertanto risulta
mentre tutte le derivate di ordine superiore sono nulle se si suppone che tutte le derivate
della funzione di cutoff si annullino per k = 0. In conclusione si ha
∞
X
Z
∞
F (n) −
0
n=1
4
1
dk F (k) = − F (0) −
2
720
(3.58)
e conseguentemente
U (d) =
π2~ c 4d3
L2
π2~ c =−
L2 .
720
720 d3
−4 (3.59)
Si è quindi estrapolato un valore finito dell’energia potenziale e indipendente dalla funzione
di cutoff; ne risulta una forza attrattiva fra le due lastre
F (d) = −
π2~ c
240 d4
(3.60)
per unità di area. È proprio questa forza di Casimir, a dimostrazione che le fluttuazioni
di vuoto del campo elettromagnetico possono essere finite e osservabili.
Figura 3.2. Due lastre parallele conduttrici nel vuoto. All’interno è consentito un numero
discreto di oscillazioni, all’esterno un numero infinito.
45
3 – Effetti delle fluttuazioni di vuoto
Si è detto che l’energia di vuoto può essere associata alla presenza di fotoni virtuali
nello stato di vuoto, ebbene, nel 1988 Milonni interpretò la forza di Casimir come il risultato della pressione esercitata dalle fluttuazioni di vuoto sulle superfici conduttrici, o
in altri termini, come la pressione dovuta alla riflessione di queste particelle virtuali sulle
lastre.
!"
!"
!"
!"
!"
!"
!"
cavitywall
!"
!"
!"
!"
!"
!"
!"
!"
cavitywall
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
FIG. 4: Casimir force can be thought of as originating in
d
pressure differences caused by reflections of virtual photons
Figura 3.3. La forza
di Casimir si può attribuire alla pressione esercitata dai fotoni virtuali
on conducting surfaces.
FIG. 6: Two dipoles at a small distance
dello stato di vuoto sulle lastre conduttrici
harmonic oscillators.
Quando un’onda di frequenza ω incide normalmente su una superficie perfettamente
pressure of
conduttrice esercita una pressione
pout
p̃ωn = ~|kn |j,
"
" ∞
!c ! ∞
=
dkx
dky #
dπ 2 n 0
0
(3.61)
The expression for the total inward
dove ~|k| è l’energia del singolo fotone virtuale incidente e j è la densitàlar.
di The
corrente
di sum just has to b
remaining
integral.
particelle. Se ρ è la densità di fotoni, j = cρ = c/V , dunque
c~|k|
p̃ωn =
.
V
FIG. 5: Reduced wall area and reduced
normal component of
the wave vector if a wave penetrates under an angle θ
pin =
" ∞
"
" ∞
!c ∞
dk
dkz #
dk
y
x
π 3 (3.62)
0
0
0
The Casimir force per unit area ca
Nel caso più generale in cui la radiazione di vuoto
non incida normalmente alla superficie,
.
subtracting equations (17) and (16
Euler-Maclaurin formula [11] as in c
la pressione esercitata sulle lastre, per ogni frequenza ωkn è
where j is the current density of photons. Using
π
pin − pout = pc = −
(3.63)
2
c 2 ϑ,
pωn = p̃ωn cos
j = cρ =
V
This is exactly the same result as
Casimir force was calculated from ze
ferences.
dove ϑ è l’angolo diwith
incidenza.
the density of photons ρ yields
La pressione netta che agisce sulle lastre si c!|k|
ottiene con un procedimento di sottrazione
ṕω =
(13)
V è data dalla differenza fra la pressione
analogo a quanto visto precedentemente: essa
Theinterna
pressureesercitata
acting ondagli
the plates
the capacitor
esterna e la pressione
infinitiofmodi
di puntoper
zero.
mode ω (again we assume a two plate geometry) is
IV.
CASIMIR AND VAN D
INTERACTION
Per ottenere la pressione sulle superfici esterne, si può passare ad un insieme di frequenze
pω = ṕω cos2 θ
(14)
46 because the effective wall
The two factors cos θ occur
area and the normal component of the wave vector (with
respect to the plate) are each reduced by a factor cos θ if
the wave is penetrating at an angle θ. This is illustrated
k2
in fig. 5. Using kz2 = cos2 θ and the following relations
ω = c|k|
πn
kz =
d
2
(15a)
(15b)
London and van der Waals calcula
that, at first glance, differs from Ca
considered two identical dipole oscill
distance d, as shown in fig. 6. The dip
to the electrostatic dipole fields. On
of coupled differential equations
ẍ1 + ω02 x1 = Kx2
ẍ2 + ω02 x2 = Kx1
with the dipole coupling
e2
3
!"
!"
!"
!"
!"
cavitywall
!"
!"
!"
!"
!"
!"
!"
!"
!"
cavitywall
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
!"
3 – Effetti delle fluttuazioni di vuoto
FIG. 4: Casimir force can be thought of as originating in
pressure differences caused by reflections of virtual photons
on conducting surfaces.
d
FIG. 6: Two dipoles at a small distance d regarded as coupled
harmonic oscillators.
pressure of
pout =
"
" ∞
2
( nπ
!c ! ∞
d )
dkx
dky #
dπ 2 n 0
2
2
0
k + k + ( nπ )2
x
FIG. 5: Reduced wall area and reduced normal component of
the wave vector if a wave penetrates under an angle θ
.
Figura 3.4.
y
d
(16)
The expression for the total inward pressure looks similar. The remaining sum just has to be replaced by a third
integral.
" ∞
"
" ∞
kz2
!c ∞
dky
dkz #
pin = 3
dkx
(17)
π 0
0
0
kx2 + ky2 + kz2
The Casimir force per unit area can be calculated by
subtracting equations (17) and (16). Using again the
Euler-Maclaurin formula [11] as in chapter 2 we obtain:
Incidenza di un fotone virtuale sulla superficie conduttrice
where j is the current density of photons. Using
pin − pout = pc = −
c
V
j = cρ =
π 2 !c
240d4
(18)
This is exactly the same result as in (11) where the
Casimir force was calculated from zero point energy differences.
con componenti del vettore d’onda
kx e ofkphotons
Trascurando la polarizzazione, questa
y continue.
with the density
ρ yields
c!|k|
assunzione consente di sostituire le sommeṕ con
gli integrali(13)
=
V
on the
plates
The pressure acting
Z ofZthe capacitor per
X
X
mode ω (again
we assume
L a 2two plate geometry) is
→
dkx dk(14)
y.
p = ṕ cos θ
π
n
n
ω
ω
Dunque, osservando che cos2 ϑ =
con d ≡ Lz , si deduce che
pout
2
ω
z
xyz
The two factors cos θ occur because the effective wall
area and the normal component of the wave vector (with
respect to2the plate) are each reduced by a factor cos θ if
kz penetrating at an angle
2 θ. This is illustrated
the wave is
2
k2
in fig. 5.kUsing kz2 = cos2 θ and the following relations
IV.
CASIMIR AND VAN DER WAALS
INTERACTIONS
London and van der Waals calculated a vacuum force
that, at first glance, differs from Casimir force.[2] They
considered two identical dipole oscillators at a very tiny
distance d, as shown in fig. 6. The dipoles are coupled due
to the electrostatic dipole fields. One obtains a system
of coupled differential equations
, che V = L d e ricordando le relazioni (3.37) e (3.40),
ω = c|k|
πn
kz =
d
∞
V = L2 d
dkx,y L
=
0 π
Z
Z
~c X ∞
=
dkdnx
dπ 2 n 0
x,y
(15a)
(15b)
nz π
(15c)
ẍ1 + ω02 x1 = Kx2
ẍ2 + ω02 x2 = Kx1
with the dipole coupling
2
K∝
e2
(20)
md
d
dky q
.atomic mass and
(3.64)
(15d)
where m isthe
e is the electron charge.
2
nπ
The eigenfrequencies
of this system are
k2x + k2y +
d
#
z
Inserting everything into (14) and replacing two sums
by integrals (in analogy to (9)), gives to a total outward
ω± =
3
ω02 ± K
Analogamente, la pressione interna alle due lastre si ottiene immaginando di rendere infi-
nite le tre dimensioni del sistema e dunque anche la somma su nz viene sostituita da un
integrale, ottenendo
pin
~c
= 3
π
Z
∞
Z
dkx
0
∞
Z
∞
dky
0
0
k2z
dkz q
.
k2x + k2y + k2z
(3.65)
Si è giunti ad una differenza di infiniti. Anche in questo caso la convergenza è garantita
introducendo la funzione di cutoff e sfruttando lo sviluppo in serie di Eulero-Maclaurin; il
valore finito che si ricava coincide esattamente con la forza di Casimir (3.60):
pin − pout = −
π 2 ~c
.
240 d4
(3.66)
L’infinità di frequenze di radiazione consentite all’esterno del condensatore è di ordine
maggiore rispetto all’infinità di frequenze possibili all’interno; intuitivamente, si può dunque attribuire l’attrazione fra le due lastre al fatto che la pressione esercitata dall’esterno
sia maggiore di quella esercitata internamente.
47
(19a)
(19b)
3 – Effetti delle fluttuazioni di vuoto
Prima di concludere è opportuno osservare che la forza di Casimir è strettamente legata
all’interazione fra le fluttuazioni di vuoto del campo e geometria del sistema. In altre
parole, poichè generata dalla differenza di due infiniti, uno dovuto alla radiazione esterna
alle due lastre, l’altro alla radiazione interna ad esse, la forza di Casimir appare come la
manifestazione macroscopica delle condizioni al contorno imposte dai confini materiali del
sistema al campo elettromagnetico. Nello spazio libero, dove le fluttuazioni di vuoto sono
isotropiche, l’effetto Casimir non ha modo di verificarsi, pertanto se ne deduce che esso
dipende fortemente dalla geometria del sistema.
Infine, è interessante notare dall’espressione (3.60), che sebbene la forza di Casimir sia
prodotta dal campo elettromagnetico, la carica elettrica non compare nella sua definizione.
Compare invece il prodotto ~c, il che consente di ribadire quanto affermato nell’introdurre
l’effetto: la forza di Casimir è prettamente quantistica, oltre che relativistica, e non ha
alcuna controparte classica.
48
Capitolo 4
Stati coerenti
Nell’introdurre la quantizzazione del campo elettromagnetico, è stata evidenziata la distinzione di intenti fra la meccanica quantistica e la meccanica classica, la prima necessaria per
descrivere la realtà atomica, la seconda, suo limite macroscopico. Tuttavia, la separazione
fra i due mondi e le rispettive teorie è tutt’altro che netta e definibile: esistono infatti
dei sistemi fisici macroscopici che possono essere ben descritti in termini quantistici. Gli
elementi di raccordo fra meccanica classica e meccanica quantistica sono gli stati coerenti.
Anche in questo caso, la descrizione quantistica dell’oscillatore armonico consentirà di definire tali stati, di cui verranno illustrate le proprietà più importanti, e di esporre ulteriori
peculiarità della radiazione quantizzata.
4.1
Definizione e proprietà
La definizione degli statu coerenti è strettamente legata all’analisi dell’oscillatore armonico precedentemente affrontata; brevemente, è stato dimostrato che l’Hamiltoniana di un
oscillatore armonico dipende dalla sua frequenza di oscillazione ω e si esprime in termini
dell’operatore N = a† a
1
,
H = ~ω N +
2
di conseguenza i suoi autostati e autovalori sono connessi con quelli di N . Gli autovalori
dell’energia sono
1
En = ~ω n +
,
2
a cui corrisponde l’autostato
1
|ni = √ (a† )n |0i
n!
49
(4.1)
4 – Stati coerenti
espresso in funzione dello stato di vuoto |0i.
Ebbene, si definisce stato coerente, ogni autostato |αi dell’operatore di annichilazione a
a |αi = α |αi
(4.2)
√
dove α è un arbitrario numero complesso. Usando la formula di ricorrenza a |ni = n |n − 1i
P∞
ed espandendo |αi in funzione degli autostati dell’oscillatore armonico |αi =
n=0 cn |ni,
si ottiene
a |αi =
∞
X
∞
X
√
cn n |n − 1i = α
cn−1 |ni
n=0
(4.3)
n=0
confrontando i coefficienti di |ni di ambo i membri
√
cn n = αcn−1
(4.4)
da cui
αα
αn
α
cn−2 = · · · = √ c0 .
cn = √ cn−1 = √ √
n
n n−1
n!
La costante c0 si ottiene imponendo la condizione di normalizzazione hα | αi = 1
hα | αi = 1 = |c0 |2
1
∞
X X (α† )n αm
X
|α|2n
2
√
hn | mi = |c0 |2
= |c0 |2 e|α| ,
n!
n!m!
n m
n=0
(4.5)
(4.6)
2
che implica c0 = e− 2 |α| . In definitiva, uno stato coerente normalizzato |αi è definito dalla
relazione
− 21 |α|2
|αi = e
∞
X
αn
n=0
n!
|ni .
(4.7)
Per comprendere in che senso gli stati coerenti si trovino al confine fra la meccanica classica
e quella quantistica si può analizzare l’evoluzione temporale dell’oscillatore armonico. Si
considerino a tal fine le equazioni del moto di Heisenberg per p e q
dp
dt
dq
dt
= −mω 2 q
(4.8)
p
m
(4.9)
=
Da cui si ottengono, tenendo presente le definizioni di a e a† , le due seguenti equazioni
differenziali
r
da
mω p
=
( − iωq) = −iωa
dt
2~ m
e
†
da
= iωa†
dt
50
(4.10)
(4.11)
(4.12)
4 – Stati coerenti
che ammettono come soluzioni, rispettivamente
a(t) = a(0)e−iωt
a† (t) = a† (0)eiωt .
e
(4.13)
Sfruttando le definizioni di a e a† (2.6) si possono ottenere le equazioni del moto per q e
p
q(t) +
p(0) −iωt
ip(t)
= q(0)e−iωt + i[
]e
mω
mω
(4.14)
ip(t)
p(0) iωt
= q(0)eiωt − i[
]e ,
mω
mω
(4.15)
e
q(t) −
infine eguagliando le parti reali e complesse di ambo i membri di una delle due equazioni
si ottiene
q(t) = q(0) cos ωt + [
p(0)
] sin ωt
mω
(4.16)
e
p(t) = −mωq(0) sin ωt + p(0) cos ωt.
(4.17)
è evidente la somiglianza delle equazioni del moto appena ottenute con quelle classiche,
cosı̀ come è evidente che anche nel caso quantistico p e q, intese come operatori, oscillino
con frequenza ω. Tuttavia sarebbe affrettato dedurre da ciò che anche hpi e hqi manifestino
lo stesso comportamento oscillatorio. Proprio nei valori medi, infatti, è celata l’anomalia
quantistica: il valore medio di p(t) o di q(t) su un qualunque autostato |ni dell’oscillatore
armonico è nullo.
Tenendo conto delle formule di ricorrenza
a|ni =
a† |ni =
√
√
n |n − 1i
(4.18)
n + 1 |n + 1i ,
(4.19)
per le coordinate si verifica come segue
r
~ h
cos ωt(hn| a(0) |ni + hn| a† (0) |ni) + i sin ωt(hn| a† (0) |ni
hn| q(t) |ni =
2mω
− hn| a(0) |ni)]
r
√
√
~ =
cos ωt( n hn | n − 1i + n + 1 hn | n + 1i)
2mω
√
√
+i sin ωt( n + 1 hn | n + 1i − n hn | n − 1i)
= 0
(4.20)
51
4 – Stati coerenti
Con il medesimo procedimento si ottiene lo stesso risultato anche per p(t).
L’annullarsi dei valori medi di q(t) e p(t) è dovuto, come si può notare all’azione degli
operatori di annichilazione e creazione e all’ortogonalità degli autostati dell’oscillatore armonico; del resto a tale conclusione si giunge immediatamente notando che per t = 0,
hq(0)i e hp(0)i son nulli per le suddette ragioni, e ricordando che i valori medi di osservabili su stati stazionari, quali appunto gli autostati |ni non variano nel tempo, dunque lo
stesso risultato si ottiene qualunque sia t.
A questo punto entrano in scena gli stati coerenti: per come sono stati definiti, essi risultano essere una sovrapposizione di autostati dell’energia e di conseguenza non stazionari,
pertanto il valore medio degli operatori q(t) e p(t) calcolato rispetto ad uno stato coerente non si annullerà, ma presenterà anch’esso un comportamento oscillante. Infatti, per la
definizione di stato coerente |αi, si ha
r
hα| q(t) |αi =
~ h
cos ωt(hα| a(0) |αi + hα| a† (0) |αi)
2mω
i
+i sin ωt(hα| a† (0) |αi − hα| a(0) |αi)
r
~
[cos ωt(α + α∗ ) + i sin ωt(α∗ − α)] .
=
2mω
(4.21)
Altre peculiarità degli stati coerenti consistono nel fatto che, sebbene, come visto, siano legati agli autostati dell’oscillatore armonico che costituiscono un insieme ortonormale
completo dello spazio di Hilbert, essi non godono né della proprietà di ortogonalità né
formano un insieme completo, ma supercompleto: sono in numero maggiore rispetto a
quanti ne servirebbero per esprimere un generico stato come loro combinazione lineare, in
altre parole, non sono tutti linearmente indipendenti. Quest’ultima caratteristica deriva
dalla dipendenza degli stati coerenti da un parametro complesso, il quale provoca un passaggio da uno spettro discreto, di autostati |ni, ad uno spettro continuo, che difficilmente
si presta ad essere una base per lo spazio di Hilbert. A dimostrazione di ciò, si considerino
due generici stati coerenti |αi e |βi
1
|αi = e− 2 |α|
2
∞
X
αn
n=0
n!
1
|βi = e− 2 |β|
|ni
2
∞
X
βm
|mi
m!
m=0
52
4 – Stati coerenti
per il loro prodotto scalare si ha
1
1
2
hβ | αi = e− 2 |α| e− 2 |β|
= e
2
− 21 |α|2 − 12 |β|2
e
1
= e 2 (β
† α−βα† )
X X (β † )m αn
√
hm | ni
m!n!
m n
∞
X
(β † α)m
√
m!
m=0
1
2
e− 2 |β−α| ;
(4.22)
ora, poichè il primo termine è una fase complessa, risulta
1
2
| hβ | αi |2 = e− 2 |β−α| 6= 0
(4.23)
pertanto l’asserzione è verificata; ovviamente all’aumentare dell’argomento |β − α|2 , l’esponenziale tenderà a zero e quindi i due stati coerenti tenderanno all’ortogonalità. Per
quanto riguarda la relazione di completezza, essa nel caso di stati coerenti assume la forma:
Z
|αi hα|
d2 α
= 1,
π
(4.24)
dove d2 α = dRe(α)dIm(α), e l’integrale è esteso a tutto l’α-piano complesso. Si può a
questo punto verificare la supercompletezza che caratterizza tali stati
d2 α
|αi hα | βi
π
1
d2 α
2 1
2
†
|αi e− 2 |α| − 2 |β| +α β .
π
Z
|βi =
=
(4.25)
Si conclude pertanto, come annunciato, che gli stati coerenti non costituiscono una base ortonormale per lo spazio di Hilbert. Un’altra caratteristica che contraddistingue gli
stati coerenti dai generici stati quantistici, a tal punto da essere sfruttata come definizione alternativa, è il loro render minimo il principio di indeterminazione, ossia soddisfare
l’uguaglianza
∆p∆q =
~
.
4
(4.26)
Si consideri infatti un generico stato |βi e gli operatori impulso p e coordinata q espressi
in funzione degli operatori a e a†
r
q=
r
~
(a + a† )
2ω
p = −i
53
~ω
(a − a† )
2
(4.27)
4 – Stati coerenti
Si ricavano i seguenti valori medi:
hβ| q2 |βi = k hβ| (a + a† )2 |βi
2
= k hβ| a2 + a† + a† a + aa† |βi
2
= k hβ| a2 + a† + 2a† a + 1 |βi
= k[(β + β ∗ )2 + 1],
e
hβ| q |βi =
√
k hβ| a + a† |βi =
(4.28)
p
β + β∗
(4.29)
dove si è posto k = ~/2ω. Perciò
∆q = hβ| q2 |βi − (hβ| q |βi)2 = k(β + β ∗ )2 + k − k(β + β ∗ )2 = k =
~
2ω
(4.30)
Analogamente, per l’impulso si ottiene
hβ| p2 |βi = t2 hβ| (a − a† )2 |βi
2
= t hβ| a† + a2 − 2a† a − 1 |βi
= t(1 − (β ∗ − β)2 )
(4.31)
hβ| p |βi = t hβ| a − a† |βi = t(β ∗ − β)
(4.32)
e
q
con t = −i ~ω
2 . Quindi
∆p = hβ| p2 |βi − (hβ| p |βi)2 =
In definitiva
∆p∆q = (
~ω
.
2
~ ~ω
~2
)( ) = .
2ω 2
4
(4.33)
(4.34)
Si è inoltre visto che la quantizzazione dei livelli energetici dell’oscillatore armonico conduce
alla quantizzazione del campo elettromagnetico, dal momento che un’onda monocromatica
è formalmente equivalente ad un oscillatore armonico di massa unitaria. Tale analogia
consente di evidenziare caratteristiche degli stati coerenti che fanno di loro ”i più classici
fra gli stati quantistici”.
Si consideri a tal fine un campo elettrico di frequenza ωk e polarizzazione fissata in una
buca di potenziale, la cui espressione si ottiene dalla (2.50)
1
2π~ωk 2 E(r,t) = i
a(t) eik·r − a† (t) e−ik·r
V
54
(4.35)
4 – Stati coerenti
In maniera del tutto analoga al caso dell’oscillatore armonico, si definisce lo stato coerente
− 21 |α|2
|αi = e
∞
X
αn
√ |ni,
n!
n=0
(4.36)
autostato dell’operatore di annichilazione
a|αi = α|αi,
(4.37)
con α = |α|eiϕ numero complesso.
Il valore medio di E su un generico stato coerente |αi non è nullo ma è formalmente simile
all’espressione classica del campo elettrico, infatti
1
2π~ω 2 ik·r
αe
− α∗ e−ik·r
hα|E(r,t)|αi = i
V
1
2π~ω 2 = i
|α| ei(k·r+ϕ) − |α| e−i(k·r+ϕ)
V
1
2π~ω 2
=
2|α| sin (k · r + ϕ);
V
(4.38)
inoltre
2π~ω
2
hα|E 2 (r,t)|αi = −
hα| a2 e2ik·r + a† e−2ik·r − 2aa† − 1 |αi
V
2π~ω 2 2ik·r
= −
α e
+ α∗2 e−2ik·r − 2|α|2 − 1
V
2π~ω (α eik·r − α∗ e−ik·r )2 − 1
= −
V
2π~ω 2 i(k·r+ϕ)
= −
|α| (e
− e−i(k·r+ϕ) )2 − 1
V
2π~ω 2
= −
|α| (2i sin2 (k · r + ϕ)) − 1
V
2π~ω =
4|α|2 sin2 (k · r + ϕ) + 1 ,
V
(4.39)
dunque lo scarto quadratico medio è
1
q
2π~ω 2
2
2
∆E = hE i − hEi =
,
V
(4.40)
che corrisponde alle fluttuazioni di vuoto, in analogia con quanto trovato nella relazione
(2.71) ponendo nkλ = 0. Da tale risultato si evince il primo elemento di quasi-classicità:
55
4 – Stati coerenti
un valore medio classico che manifesta fluttuazioni quantistiche.
Ancora, si dimostra che le fluttuazioni del numero di fotoni n ottenute dallo scarto quadratico medio relativo, diminuiscono all’aumentare del valore medio di N .
Innanzitutto si deve notare che il modulo quadro di α, |α|2 , è proprio il numero medio di
fotoni del campo, infatti, essendo N = a† a, si ricava
hN i = hα| N |αi = hα| a† a |αi = |α|2 ;
inoltre hN 2 i = hα| N 2 |αi = |α|4 + |α|2 , dunque
q
p
hN 2 i − hN i2
|α|2
1
∆N
=
=
=p
,
hN i
hN i
hN i
hN i
(4.41)
(4.42)
come era intenzione dimostrare.
Infine, nonostante le controversie a suo riguardo, la fase del campo si può determinare
sempre con maggior precisione, all’aumentare del valor medio di N .
Anche in questo caso è opportuno sottolineare un’altra importante proprietà degli stati
coerenti: ad ogni stato coerente non corrisponde un numero definito di fotoni n, dal
momento che essi non sono autostati dell’operatore N , invero la probabilità di trovare n
fotoni a seguito di una misura su uno stato |αi, è regolata dalla distribuzione di Poisson
con valore medio N , infatti
Pn = | hn | αi |2
2
0
∞
|α|2 X
αn 0 − 2
√
n n = e
n0 !
n0 =0
|α|2 αn 2
= e− 2 √ n!
n
2n
−|α|2 |α|
−N N
= e
=e
.
n!
n!
(4.43)
Ora, la distribuzione della fase per uno stato coerente è
P (φ) =
=
1
| hφ | αi |2
2π
∞
2
1 −|α|2 X in(φ−θ) |α|n √ ;
e
e
n=o
2π
n! (4.44)
ma per valori grandi di α la distribuzione di Poisson è approssimabile da una Gaussiana
−|α|2 |α|2n
1
−(n − |α|2 )2
2
−|α|
2
−
e
,
(4.45)
e 2
≈ (2π|α| ) 2 exp
n!
2|α|2
56
4 – Stati coerenti
dunque per la distribuzione della fase si ha
P (φ) ≈
2|α|2
π
12
exp[−2|α|2 (φ − θ)2 ].
(4.46)
P (φ) è dunque rappresentata da una Gaussiana centrata per φ = θ, per cui all’aumentare
di hN i = |α|2 il picco diventa sempre più stretto e la fase sempre meglio determinata.
4.2
Rappresentazione nello spazio delle fasi
Analizzata la ‘classicità’ degli stati coerenti, si può andare oltre e pensare di attribuir loro
una certa rappresentazione nello spazio delle fasi; proposito non semplice, dal momento
che, le coordinate x e gli impulsi p non commutano fra loro e dunque, in virtù del principio
di indeterminazione, lo stato di un sistema quantistico non può essere ben localizzato, come
invece accade in meccanica classica. Va ricordato però che gli stati coerenti sono stati di
3.6 Phase-space pictures of coherent states
minima indeterminazione.
Introducendo gli operatori di quadratura
57
Fig. 3.5. Phase-space
portrait of a coherent
state of amplitude |α| and
phase angle θ . Note the
error circle is the same for
all coherent states. Note
that as |α| increases, the
phase uncertainty #θ
decreases, as would be
expected in the “classical
limit”.
Figura 4.1.
Rappresentazione di un generico stato coerente |αi =
a + a†
2
a − a†
X2 =
,
2i
X1 =
Fig. 3.6. Phase-space
portrait of the quantum
iθ
|α|e
nello
spazio delle
vacuum
state.
fasi.
(4.47)
(4.48)
si ha che gli scarti quadratici medi rispetto ad un generico stato coerente |αi con α = |α|eiθ ,
sono
(∆X1 )2 = (∆X2 )2 =
57
1
4
(4.49)
Fig. 3.7. Phase-space
portrait of the number
state |n!. The uncertainty
in the photon number is
#n = 0 while the phase is
entirely random.
4 – Stati coerenti
phase angle θ . Note the
error circle is the same for
all coherent states. Note
that as |α| increases, the
phase uncertainty #θ
decreases, as would be
expected in the “classical
limit”.
Fig. 3.6. Phase-space
portrait of the quantum
vacuum state.
Figura 4.2.
Rappresentazione dello stato di vuoto,
mentre
i
[X1 ,X2 ] = .
2
Fig. 3.7. Phase-space
portrait of the number
corrispondente
al caso in cui |α| = 0.
state |n!. The uncertainty
in the photon number is
#n = 0 while the phase is
entirely random.
(4.50)
Risulta quindi soddisfatta, in uguaglianza, la relazione di indeterminazione di Heisenberg
1
∆X1 2 ∆X2 2 = |h[X1 ,X2 ]i|,
4
(4.51)
Infine valori medi di X1 e X2 sempre rispetto allo stato |αi sono:
A number state |n! can be represented in phase space as a 1circle of radius
n, the
hX1 iα = (α + α∗ ) = <α
2
uncertainty in n being zero and the uncertainty in phase again
being 2π, as in
1
Fig. 3.7. It must be understood that these pictures are qualitative
but
hX2 iα = (α − in
α∗nature
) = =α.
2i of noise in various
are useful as a graphical way of visualizing the distribution
quantum states of the field. As most quantum states of the field have no classical
(4.52)
(4.53)
Dunque se, a parte una costante moltiplicativa, la parte reale e quella immaginaria di α
assumono il ruolo delle coordinate e degli impulsi rispettivamente, vi è equivalenza fra lo
spazio delle fasi e il piano complesso α. In questo nuovo sistema di riferimento, lo stato
coerente |αi è rappresentato da un vettore di lunghezza α che forma un angolo θ con l’asse
di X1 , mentre l’incertezza di cui esso è affetto è rappresentata da un disco il cui centro
p
si trova a distanza |α| = hni dall’origine e che forma lo stesso angolo θ; la variazione
∆θ rappresenta l’incertezza sulla fase dello stato coerente e diminuisce all’aumentare di
α: per |α| = 0, il disco è centrato nell’origine degli assi e l’indeterminazione sulla fase è
massima, ∆θ = 0.
58
Capitolo 5
Condensazione di Bose-Einstein
Negli anni venti, in India, Bose era intento all’elaborazione di un modello statistico che
descrivesse il comportamento dei quanti di luce, studi da cui nacque la cosiddetta Statistica
di Bose-Einstein; in questo quadro egli predisse la possibilità di transizioni di fase di un
gas costituito da atomi non interagenti fra loro. Il lavoro a quattro mani di Einstein e Bose,
condusse alla conclusione che quando un gas di bosoni, particelle a spin intero, si trova
a temperature prossime allo zero assoluto parte di esse si porta nello stato quantistico di
minima energia; tale fenomeno prese il nome di condensazione di Bose-Einstein (BEC). È
opportuno contestualizzare il fenomeno all’interno di descrizione generale della meccanica
statistica, con particolare attenzione per le distribuzioni quantistiche.
5.1
Matrice densità
Nella maggior parte dei casi, quando ci si accinge allo studio di un sistema fisico, lo
stato in cui tale sistema si trova non è perfettamente determinato, di conseguenza si
hanno a disposizione solo informazioni parziali. D’altro canto, la meccanica quantistica
ha di per se un carattere probabilistico. Lo strumento matematico che consente di trarre
informazioni quanto più complete possibili, raccordando le sue proprietà quantistiche e la
sua indeterminazione intrinseca è l’operatore densità.
Spesso lo stato del sistema in esame è uno stato misto, ossia una miscela statistica di stati
|ψi =
X
n
59
pn |ψn i
(5.1)
5 – Condensazione di Bose-Einstein
con 0 ≤ p1 , p2 ,... ≤ 1 e
X
pn = 1,
(5.2)
n
dove i coefficienti p1 , p2 , p3 , . . . rappresentano la probabilità che il sistema si trovi, rispettivamente, nello stato |ψ1 i, |ψ2 i, |ψ3 i, . . . . È doveroso notare la distinzione fra lo stato
misto (5.1) e uno stato |ϕi ottenuto da una sovrapposizione di stati |ϕn i
X
|ϕi =
cn |ϕn i .
(5.3)
n
In quest’ultimo caso il sistema ha probabilità |cn |2 di trovarsi nello stato |ϕn i e le varie
ampiezze di probabilità possono interferire fra loro dando luogo a termini cn c∗n0 , nello stato
misto (5.1), rappresentato dalla somma pesata di probabilità, invece, fra gli stati |ψn i non
vi è interferenza. Inoltre lo stato misto è affetto da una duplice indeterminazione: quella
puramente quantistica che si manifesta nelle misure di osservabili, legata al principio di
Heisenberg, e l’indeterminazione statistica, in virtù della quale non si conosce la situazione
iniziale del sistema.
Una situazione particolarmente fortunata si ha se è noto lo stato in cui si trova il sistema,
ossia se nella (5.1) tutte le probabilità pk sono nulle tranne una; in questo caso si dice
che il sistema si trova in uno stato puro. Se {|un i} è una base ortonormale, è noto che il
sistema in un particolare istante t si trova nello stato
X
|ψ(t)i =
cn (t) |un i ,
(5.4)
n
2
dove le ampiezze di probabilità cn (t) sono tali che
X
cn (t)2 = 1,
(5.5)
n
inoltre, se H(t) è l’Hamiltoniana del sistema, l’evoluzione temporale di |ψ(t)i è descritta
dall’equazione di Schrödinger
i~
d
|ψ(t)i = H(t) |ψ(t)i .
dt
(5.6)
Il valore medio di un generico osservabile A rispetto allo stato |ψ(t)i è
X
X
hAi(t) = hψ(t)| A |ψ(t)i =
c∗n (t)cm (t) hun | A |um i =
c∗n (t)cm (t)Anm ,
n,m
(5.7)
n,m
in cui Anm sono gli elementi della matrice hun | A |um i che rappresenta l’operatore A
rispetto alla base {|un i}. Ebbene, si definisce operatore densità ρ, quell’operatore dello
60
5 – Condensazione di Bose-Einstein
spazio di Hilbert che nella base {|un i} è rappresentato da una matrice i cui elementi sono
c∗n (t)cm (t). Nel caso attuale in cui il sistema si trova nello stato puro |ψ(t)i, l’operatore
densità è definito come
ρ(t) = |ψ(t)i hψ(t)| ,
(5.8)
i suoi elementi di matrice sono infatti
ρ(t)mn = hum | ρ |un i = hum | ψ(t)i hψ(t) | un i = c∗n (t)cm (t).
(5.9)
La matrice di densità ρ(t) è dunque un operatore hermitiano ρ = ρ† . La sua conoscenza
consente di calcolare la media di qualsiasi grandezza che caratterizza il sistema e le probabilità dei diversi valori della grandezza.
Si dimostrano facilmente alcune proprietà della matrice densità:
X
X
cn (t)2 =
ρnn (t) = T rρ(t) = 1
n
(5.10)
n
la matrice densità ha dunque traccia unitaria; inoltre il valore medio di un osservabile A,
considerando la (5.7) e sfruttando la relazione di completezza per gli elementi della base
{|un i}, si esprime come
hAi(t) =
X
hum | ρ |un i hun | A |um i
m,n
=
X
hum | ρ(t)A |um i
M
= T r{ρ(t)A}.
(5.11)
L’evoluzione temporale dell’operatore ρ(t) si ricava dall’equazione di Schrödinger
!
!
d
d
d
ρ(t) =
|ψ(t)i hψ(t)| + |ψ(t)i
hψ(t)|
dt
dt
dt
=
=
1
1
H(t) |ψ(t)i hψ(t)| +
|ψ(t)i hψ(t)| H(t)
i~
(−i~)
1
H(t), ρ(t) .
i~
(5.12)
Estendendo ora l’argomentazione al caso più generale in cui il sistema si trovi in uno stato
misto (5.1), la definizione della matrice densità si tramuta in
ρ=
X
pn ρn =
X
n
n
61
pn |ψn i hψn | .
(5.13)
5 – Condensazione di Bose-Einstein
Anche in questo caso, la matrice densità del sistema è hermitiana, essendo i coefficienti
pn reali, ed inoltre persistono invariate le proprietà precedentemente esposte, riassumendo
brevemente
T rρ = 1
(5.14)
hAi = T r{ρA}
d
i~ ρ(t) = H(t), ρ(t) .
dt
(5.15)
(5.16)
Inoltre se si richiede che l’operatore ρ sia stazionario, l’ultima equazione, che ne descrive l’evoluzione temporale, conduce all’equivalente teorema quantistico del Teorema di
Liouville:
H(t),ρ(t) = 0,
(5.17)
la condizione di stazionarietà si traduce per la matrice densità nell’avere forma diagonale.
Infine, sia |ai un generico stato, dalla definizione (5.13), si ha
hu| ρ |ui =
X
pn hu| ρn |ui =
n
X
2
pn hu | ψn i
(5.18)
n
dunque
hu| ρ |ui ≥ 0,
(5.19)
ossia, ρ è un operatore definito positivo.
5.2
Le distribuzioni statistiche
Si consideri un corpo macroscopico isolato, suddiviso in un gran numero di sottosistemi,
anch’essi macroscopici, in equilibrio termico fra loro. Sebbene l’energia totale del sistema sia costante, le particelle costituenti il corpo si scambiano vicendevolmente energia
urtandosi l’un l’altra, dunque l’energia di ciascun singolo sottosistema è variabile; inoltre
il numero stesso di particelle in ogni sottosistema non è costante, ma fluttua oscillando
attorno ad un valore medio. Con l’ulteriore ipotesi che il sistema sia costituito da particelle identiche, si concentri l’attenzione su un particolare sottosistema. La probabilità
che tale sottosistema si trovi in uno stato quantistico caratterizzato da energia En e da N
particelle è descritta dalla matrice densità che in tali condizioni assume la forma
Ω + Φ − En,N
ρn,N = exp
kT
62
(5.20)
5 – Condensazione di Bose-Einstein
e prende il nome di distribuzione gran canonica. La probabilità dunque dipende oltre che
dall’energia En , anche dal potenziale di Gibbs Φ = N µ, dove µ è il potenziale chimico,
dal potenziale termodinamico Ω = F − Φ, essendo F l’energia libera del sottosistema, e
ovviamente dalla temperatura T . Poichè il sistema si trova in equilibrio, la temperatura T
e il potenziale chimico µ sono ovunque costanti, mentre il potenziale Ω e l’energia libera F
sono caratteristici del sottosistema in esame. k è la costante di Boltzmann. La condizione
di normalizzazione
XX
N
ρn,N = eΩ/kT
n
i
Xh
X
eN µ/kT
e−En,N /kT = 1
(5.21)
n
N
impone che sia uguale a uno il risultato della sommatoria di ρn,N prima su tutti gli stati
quantistici n, per N fissato, e poi su tutti i valori del numero di particelle N . Da essa si
ottiene
eΩ/kT
X
eN µ/kT
X
e−En,N /kT = 1,
(5.22)
n
N
applicando il logaritmo ad ambo i membri si ottiene
#
"
X
X
Ω
−En,N /kT
N µ/kT
=0
e
+ ln
e
kT
n
(5.23)
N
ossia
"
Ω = −kT ln
X
e
N µ/kT
X
e
−En,N /kT
#
.
(5.24)
n
N
La funzione
Z=
i
X
Xh
eN µ/kT
e−En,N /kT
(5.25)
n
N
è detta funzione di ripartizione, la quale consente di determinare tutte le variabili termodinamiche d’interesse, una volta ricavato il potenziale Ω.
Dalla distribuzione gran canonica appena illustrata, valida per un generico sistema macroscopico in equilibrio termico, si può derivare la distribuzione di probabilità per un gas
perfetto. Con gas perfetto si intende un gas in cui l’interazione fra le molecole costituenti
è talmente debole da poter essere trascurata. Fisicamente tale sistema si realizza se la
densità del gas è sufficientemente bassa cioè, in altre parole, se il gas è molto rarefatto;
in questo caso la distanza fra le molecole è maggiore del raggio di azione delle forze intermolecolari e dunque l’interazione sufficientemente piccola. Di conseguenza, poichè si
ipotizza che le molecole siano sostanzialmente indipendenti le une dalle altre, l’energia
totale del gas è data dalla somma dell’energia di ciascuna di esse. Per semplificare la
63
5 – Condensazione di Bose-Einstein
trattazione, si può ulteriormente assumere che il gas sia costituito da particelle identiche
(molecole dello stesso tipo), di conseguenza esse avranno tutte lo stesso spettro energetico
e la determinazione dei livelli energetici En dell’intero sistema si riduce alla ricerca dei livelli energetici di una singola particella εi , dove l’indice i rappresenta l’insieme dei numeri
quantici che caratterizzano lo stato in cui si trova la molecola. Sia inoltre ni il numero di
particelle nello stato i-esimo, tale valore prende il nome di numero di occupazione dello
stato quantistico ed il suo valore medio è determinato dalla distribuzione di Boltzmann.
Se il gas è in equilibrio, la distribuzione di Boltzmann per il sottosistema del gas costituito
dalle particelle che si trovano nello stato i-esimo si ricava dalla distribuzione gran canonica
(5.20), che adattata all’attuale circostanza assume la forma
Ω + µni − εi ni
ρi,ni = exp
kT
(5.26)
ed è accompagnata dalla condizione di normalizzazione
X
ρi,ni = 1.
(5.27)
ni
Il valore medio di ni è, per definizione
hni i =
X
ni ρi,ni ;
(5.28)
ni
invero, siccome si opera sotto l’ipotesi di gas ideale, gas molto rarefatto, il numero medio di
particelle per stato dev’essere molto piccolo, di conseguenza è necessario che sia soddisfatta
la condizione
hni i 1.
(5.29)
Ora, la richiesta di convergenza della serie (5.28) imposta dalla (5.29) deve combinarsi con
la condizione di normalizzazione (5.27):
ρ0,n0 + ρ1,n1 + ρ2,n2 + ρ3,n3 + · · · = 1
(5.30)
ρ1,n1 + 2ρ2,n2 + 3ρ3,n3 + · · · 1
(5.31)
ρ0,n0 = eΩ/kT ∼ 1
(5.32)
di conseguenza dev’essere
e
ρi,ni 1
con ni = 1,2,3,. . . .
64
(5.33)
5 – Condensazione di Bose-Einstein
Per il valore medio (5.28) si ha dunque
hni i = e (µ−εi )/kT + 2 e 2(µ−εi )/kT + 3 e 3(µ−εi )/kT + . . .
2
3
= e (µ−εi )/kT + 2 e (µ−εi )/kT + 3 e (µ−εi )/kT + · · · 1
(5.34)
è allora evidente che il termine predominante della somma è il primo e che i successivi
possono essere trascurati; si ottiene cosı̀ la annunciata distribuzione di Boltzmann
µ − ε i
.
(5.35)
hni i = exp
kT
Si ribadisce che essa fornisce il numero medio di particelle presenti nello stato i-esimo la
cui energia è εi , pertanto se la si applica ad ogni stato quantistico del sistema, si ottiene
la distribuzione nei diversi stati delle molecole identiche di un gas perfetto in equilibrio
termico. Tuttavia è necessario sottolineare che la statistica di Boltzmann-Maxwell, di cui
la distribuzione (5.35) è colonna portante, fu elaborata in un contesto classico: le particelle
del sistema erano infatti assunte come identiche ma distinguibili. Il carattere probabilistico
della meccanica quantistica invece priva ogni particella della propria identità: il principio di indeterminazione di Heisenberg non consente di assegnare ad una particella delle
coordinate spaziali ben definite e lo strumento di localizzazione è la sua funzione d’onda,
il cui modulo quadro rappresenta, appunto, la probabilità che essa ha di trovarsi in una
regione finita dello spazio. In un sistema di molte particelle, le funzioni d’onda possono sovrapporsi fra loro, dunque diventa impossibile individuare per ogni particella la rispettiva
funzione d’onda e viceversa. Nella descrizione quantistica di un sistema è necessario tener
conto dell’indistinguibilità di particelle identiche e di conseguenza i risultati delle misure
devono essere invariati per scambio di particelle. Questo si traduce in specifiche proprietà
di simmetria per le funzioni d’onda: un sistema di particelle a spin intero, i bosoni, dev’essere descritto da una funzione d’onda simmetrica rispetto allo scambio di due bosoni;
invece un sistema di particelle a spin 21 , i fermioni, è ulteriormente vincolato dal principio
di esclusione di Pauli, che impedisce a due particelle di trovarsi in uno stato quantistico
caratterizzato dagli stessi numeri quantici, ciò è garantito se e solo se la funzione d’onda
del sistema è antisimmetrica.
è inoltre doveroso concentrare l’attenzione sulla questione energetica: come è stato detto in precedenza la rottura di fondo fra la meccanica classica e la meccanica quantistica
risiede nella quantizzazione dell’energia. Nelle distribuzioni statistiche classiche, l’energia
può variare con continuità e assumere qualunque valore, mentre le distribuzioni quantistiche, che saranno esposte a breve, poggiano sull’ipotesi imprescindibile che l’energia del
65
5 – Condensazione di Bose-Einstein
sistema sia quantizzata e che dunque solo alcuni valori siano consentiti. La distribuzione
gran canonica e la distribuzione di Boltzmann, essendo nate come distribuzioni classiche,
assumono, nella loro formulazione originale, l’energia come una variabile continua; nell’esporre le due distribuzioni in forma quantistica (5.20) e (5.35), l’ipotesi di quantizzazione
dell’energia è implicita e la loro validità anche in ambito quantistico è indubbia, a meno
della precisazione sull’indistiguibilità delle particelle appena esposta.
Come anticipato il mondo bosonico è descritto dalla statistica di Bose-Einstein, quello
fermionico dalla statistica di Fermi-Dirac. Le distribuzioni dei due sistemi si ricavano dal
potenziale termodinamico (5.24).
Si consideri dunque un gas ideale in equilibrio alla temperatura T , costituito da bosoni o
fermioni non interagenti fra loro. Il potenziale termodinamico Ωi per il sottoinsieme del
gas costituito da tutte le particelle che si trovano nello stato quantistico i-esimo è
#
"
µn
X
εi n i i
.
(5.36)
−
Ωi = −kT ln
exp
kT
kT
n
i
dove εi è l’energia del livello in esame e ni il suo numero di occupazione che assume valori
differenti a seconda che le particelle del gas siano fermioni o bosoni, in particolare
ni = 1,2,3, . . .
ni = 0,1
per un sistema di bosoni
(5.37)
per un sistema di fermioni
(5.38)
Si ha
"
Ωi = −kT ln
X
ni
"
= −kT ln
X
ni
(µ − εi )ni
exp
kT
#
#
µ − ε n i
i
exp
.
kT
(5.39)
Noto il potenziale termodinamico Ωi , il numero medio di particelle dell’i-esimo stato
quantistico hni i, si ricava dalla relazione
∂Ωi
hni i = −
∂µ
!
.
(5.40)
T,V
A questo punto, considerando la condizione (5.38) si ottiene
h
i
ΩFi = −kT ln 1 + e(µ−εi )/kT ,
66
(5.41)
5 – Condensazione di Bose-Einstein
dunque
∂ΩFi
hni iF = −
∂µ
!
e(µ−εi )/kT
1
e(µ−εi )/kT
=
1 + e(µ−εi )/kT kT
1 + e(µ−εi )/kT
= kT
T,V
(5.42)
e finalmente
hni iF =
1
e(εi −µ)/kT
+1
.
(5.43)
È questa la distribuzione di Fermi-Dirac valida per un gas perfetto di fermioni, in cui il
potenziale chimico µ può assumere tutti i valori da −∞ a +∞. Essa è normalizzata dalla
condizione
X
hni iF = N
(5.44)
i
ossia
1
X
i
e(εi −µ)/kT
+1
=N
(5.45)
dove N è il numero totale di fermioni presenti nel gas. Inoltre il potenziale termodinamico
dell’intero sistema si ottiene sommando su tutti gli stati quantistici:
ΩF =
X
ΩFi = −kT
i
h
ln 1 + e(µ−εi )/kT .
X
i
(5.46)
i
Con analogo procedimento, si ricava la distribuzione per un gas di bosoni, il cui potenziale
termodinamico relativo allo stato i-esimo, tenendo conto della (5.37), è
"
ΩB
i = −kT ln
X
ni
#
µ − εi ni
exp
;
kT
(5.47)
la serie di quest’ultima relazione è una serie geometrica che converge se e solo se
eµ−εi /kT = eµ/kT e −εi /kT < 1,
(5.48)
in altre parole, il potenziale termodinamico ΩB
i converge se e solo se è soddisfatta la
condizione
µ ≤ 0,
(5.49)
in qual caso si ha
h
ΩB
=
−kT
ln
i
1
i
1 − e(µ−εi )/kT
67
h
i
= kT ln 1 − e(µ−εi )/kT .
(5.50)
5 – Condensazione di Bose-Einstein
Infine, il numero medio di bosoni nello stato i-esimo e aventi energia εi è
!
∂ΩB
−e(µ−εi )/kT 1
e(µ−εi )/kT
i
hniB = −
= −kT
=
∂µ
1 − e(µ−εi )/kT kT
1 − e(µ−εi )/kT
(5.51)
T,V
da cui, la distribuzione di Bose-Einstein, valida per un gas ideale di bosoni
hniB =
1
e(εi −µ)/kT
−1
.
(5.52)
Se N è il numero totale di bosoni che costituiscono il gas ideale, la condizione di normalizzazione anche in questo caso è
1
X
i
e(εi −µ)/kT
−1
= N,
(5.53)
e il potenziale termodinamico del sistema
ΩB = kT
X
i
h
ln 1 − e(µ−εi )/kT .
(5.54)
i
Tenendo ben presenti le due distribuzioni quantistiche appena determinate, (5.43) e (5.52),
sono d’obbligo alcune riflessioni. Innanzitutto osservando la distribuzione di Fermi (5.43)
si osserva che per ogni stato quantistico, il numero di fermioni che esso contiene è 0 ≤
hniF ≤ 1, nel rispetto del principio di esclusione di Pauli, mentre per un gas di bosoni, il
numero di occupazione per ogni stato quantistico varia da zero a infinito, 0 ≤ hniB ≤ ∞, a
dimostrazione che per particelle a spin intero, la presenza di un bosone in un determinato
stato quantistico, non inibisce l’arrivo di un’ulteriore presenza. Inoltre, da un confronto
fra le distribuzioni di Bose-Einstein e Fermi-Dirac
hni iB =
1
e(εi −µ)/kT − 1
hni iF =
1
e(εi −µ)/kT + 1
con la distribuzione di Boltzmann
hni i = e(µ−εi )/kT
è evidente che se exp[(εi − µ)/kT ] 1 ed in particolare se µ −→ −∞, le distribuzioni quantistiche approssimano la distribuzione di Boltzmann, fornendo lo stesso numero
medio di particelle per stato hniBoltz ∼ hniB ∼ hniF 1. Tale limite si ritrova anche
nel caso di temperature piuttosto alte, quando la distribuzione di Boltzmann prevede un
numero di occupazione molto minore di uno, di conseguenza la possibilità di trovare due
o più particelle nello stesso stato è molto bassa, le differenze fra fermioni e bosoni sono
68
5 – Condensazione di Bose-Einstein
irrilevanti e dunque le predizioni statistiche delle tre distribuzioni coincidono. Al contrario, a temperature molto basse i loro comportamenti quantistici non possono più essere
ignorati: il principio di esclusione di Pauli, per bocca della distribuzione di Fermi, vieta
la presenza di due fermioni nello stesso stato, mentre vi è libera possibilità, per i bosoni,
di convivere nel medesimo stato. In particolare, allo zero assoluto, T = 0, la distribuzione
di Fermi-Dirac è rappresentata da una funzione a gradini

0
µ > εi
hni iF =
1
µ < εi
la quale, inoltre, assume il valore
1
2
(5.55)
se µ = εi ; fisicamente ciò significa che per T = 0,
le particelle del gas si dispongono nei diversi stati quantistici in modo tale che l’energia
totale del gas abbia il valore minimo possibile. Dunque, a partire dallo stato fondamentale
ε0 = 0, occupano i soli stati con energia minore di εi (ogni stato è ovviamente occupato
da un unico fermione), mentre gli stati con energia superiore risultano vuoti. I livelli
energetici che ospitano i fermioni costituiscono la cosiddetta sfera di Fermi nello spazio
degli impulsi e l’energia che ne delimita il confine, cioè quella che caratterizza l’ultimo
stato occupato, è detta energia di Fermi.
5.3
Condensazione di Bose-Einstein
La descrizione di un gas di bosoni allo zero assoluto, consente invece di introdurre il
fenomeno di condensazione di Bose. Si consideri a tal fine un sistema di particelle a spin
intero, non relativistiche e non interagenti fra loro, contenute in una scatola cubica di
lato L e volume V , posta nello spazio libero, non soggetta ad alcun campo esterno. Dal
momento che il gas è contenuto in una regione finita, l’autofunzione di ogni particella è
soggetta a condizioni al contorno che ne impongono la forma
!
!
!
8
2πny
2πnz
2πnx
sin
x sin
y sin
z .
ψ=
V
L
L
L
(5.56)
L’insieme degli stati consentiti ha la forma di una griglia rettangolare nello spazio dei
vettori d’onda k. La densità media di stati per unità di volume è V /8π 3 ; se il volume
V è molto grande rispetto alle dimensioni della griglia, allora la distribuzione degli stati
permessi si può assumere continua. Analogamente la densità di stati per unità di volume
nello spazio dei momenti p = ~k è V /(2π~)3 . Tutti gli stati quantistici aventi un impulso
69
5 – Condensazione di Bose-Einstein
p variabile nell’intervallo [p, p + dp], sono contenuti di una sfera 4πp2 dp nello spazio degli
impulsi e sono in numero
!
V
(4πp2 ) dp
= g
(2π~)3
dτ
= g
V
p2 dp
2π 2 ~3
(5.57)
dove il fattore g = 2s+1 contiene la degenerazione dell’impulso p rispetto allo spin s di ogni
bosone. Inoltre, poichè si considera particelle di massa m libere, non relativistiche, la loro
energia è dovuta esclusivamente alla loro componente cinetica ε = p2 /2m, di conseguenza
pm
dp
√m
dε = 2mε , ossia dp =
2ε dε. Si può cosı̀ affermare che il numero di stati aventi energia
ε compresa nell’intervallo [ε, ε + dε] è
dτε
!
r
V
m
(2mε)
dε
= g
2π 2 ~3
2ε
V m3/2 √
= g√
ε dε.
2π 2 ~3
(5.58)
La distribuzione di Bose-Einstein (5.52) consente allora di determinare il numero di bosoni
nel suddetto intervallo energetico
√
ε
V m3/2
dNε = hnε idτε = g √
dε,
(ε−µ)/kT
2
3
−1
2π ~ e
(5.59)
e il numero totale di particelle del gas
Z
N=
0
∞
V m3/2
dNε = g √
2π 2 ~3
Z
0
∞
√
ε
e(ε−µ)/kT
−1
dε.
(5.60)
Quest’ultima è una relazione generale, valida per qualunque temperatura di equilibrio T ,
con potenziale chimico variabile fra −∞ e 0. La situazione diventa interessante quando la
temperatura T diminuisce progressivamente, mediante una successione di stati di equilibrio
termico, pur restando costante la densità N/V . In questo caso l’integrale
Z
I(T,µ) =
0
∞
f (ε)
dε
e(ε−µ)/kT − 1
(5.61)
che compare nella relazione (5.60), è una funzione monotona crescente, dunque affinchè
N/V resti costante, al diminuire di T il potenziale chimico µ dovrà necessariamente aumentare, cioè dovrà diminuire in modulo. Esso raggiungerà il valore limite µ = 0 alla
70
5 – Condensazione di Bose-Einstein
temperatura, detta temperatura di degenerazione, T = T0 che si ricava dalla relazione
(5.60)
N
m3/2
= g√
V
2π 2 ~3
∞
Z
√
ε
dε.
−1
eε/kT0
0
(5.62)
La sostituzione z = ε/kT0 consente di esprimere la densità do bosoni come
N
V
(kmT0 )3/2
= g √
2π 2 ~3
Z
∞
√
z
dz
−1
!3 Z
∞ √
ez
0
)3/2
2π
(kmT0
z
√
dz
z
2
h
e −1
2π
0
!3
√
Z ∞ √
Z ∞ √
2
2πmkT0
z
g 2
z
√
= g
dz = 3 √
dz,
z
z
h
λ
π 0 e −1
π 0 e −1
= g
(5.63)
√
dove λ = h/ 2πmkT è la lunghezza d’onda di de Broglie. La soluzione di quest’ultimo
integrale si ottiene sfruttando la relazione
Z
0
∞
z x−1
dz = ζ(x)Γ(x),
ez − 1
(5.64)
dove ζ(x) è la funzione zeta di Riemann e Γ(x) è la funzione gamma di Eulero; si nota
infatti che
∞
1
3
∞
z 2 −1
dz = ζ(3/2) Γ(3/2),
(5.65)
ez − 1
0
0
√
dunque sapendo che ζ(3/2) ≈ 2,612 e Γ(3/2) = π/2, la densità (5.63) risulta essere
Z
z2
dz =
z
e −1
Z
√
g
N
= 3 ζ(3/2) = g
V
λ
2πmkT0
h
!3
ζ(3/2),
(5.66)
da cui si ricava la temperatrua T0
h2
T0 = g −2/3
2πm
N
V ζ(3/2)
!2/3
.
(5.67)
A questo punto, la temperatura del sistema non potrebbe ulteriormente diminuire perchè
altrimenti il potenziale chimico µ assumerebbe valori positivi, il che non è consentito nella
statistica di Bose-Einstein. La contraddizione a cui si è giunti ha le sue radici nel passaggio,
non completamente lecito, da stati discreti a stati continui. Infatti, nel sostituire la somma
(5.53) con l’integrale (5.59), si ha perdita di informazione circa lo stato fondamentale ε0 = 0
71
5 – Condensazione di Bose-Einstein
che nell’integrale scompare:
√
ε = 0 per ε = 0. Inoltre, alla temperatura T0 , quando il
potenziale chimico si annulla, la (5.53) diviene
N=
X
i
1
eεi /kT0
−1
=
1
eε0 /kT0
−1
+
1
eε1 /kT0
−1
+
1
eε2 /kT0
−1
+ ...,
(5.68)
in questa circostanza, i termini corrispondenti agli stati eccitati, εi 6= 0, tendono ad un
valore finito, mentre il primo termine, relativo allo stato fondamentale, caratterizzato
quindi da energia nulla, ε0 = 0, diverge. Per ovviare a questo inconveniente, si può far
tendere µ non a zero, ma ad una quantità infinitesima, garantendo cosı̀ la convergenza
di ciascun termine della sommatoria. Allora per T < T0 ci saranno particelle negli stati
eccitati, con ε > 0, distribuite al variare dell’energia secondo la (5.59), con µ = 0, e il cui
numero totale è
√
Z ∞
ε
V m3/2
dε
Nε>0 = g √
ε/kT
2
3
e
−1
2π ~ 0
√
Z
V (mT )3/2 ∞
z
= g √
dz
z
e −1
2π 2 ~3
0
!3
T 2
.
= N
T0
(5.69)
Invece, le particelle ad energia nulla saranno
"
N0 = N − Nε>0 = N 1 −
T
T0
!3 #
2
.
(5.70)
Quanto appena esposto illustra come avvicinandosi allo zero assoluto, oltre la temperatura
di degenerazione T0 , i bosoni del gas perfetto convoglieranno tutti nello stato energetico
fondamentale; in tale configurazione le funzioni d’onda dei bosoni si sovrappongono l’un
l’altra dando luogo ad un nuovo oggetto, una sorta di “superatomo”. È questa la ragione
per cui si è dato al fenomeno il nome di condensazione di Bose-Einstein .
5.4
Condensato di Bose-Einstein
“È nuovo stato della materia. Ha un comportamento completamente diverso da qualunque
altro materiale”. Sono queste le parole di Carl Wieman che, nel 1995, accompagnarono
verso le luci della ribalta il primo condensato di Bose-Einstein. Si tratta di una piccolissima palla di atomi di rubidio, dal diametro di circa 20 micrometri, realizzata all’interno
72
5 – Condensazione di Bose-Einstein
di un contenitore di vetro a forma di carota, ad una temperatura di circa 170 nanokelvin,
la minima temperatura mai raggiunta fino ad allora. Il lavoro, compiuto nei laboratori
JILA, congiunti con l’Università del Colorado a Boulder, valse il premio Nobel, nel 2001,
ai suoi artefici Carl Wieman, Eric Cornell e Wolfgang Ketterle.
Il processo che conduce al condensato di Bose si compone sostanzialmente di due stadi, la
cattura e il raffreddamento di un gas, costituito da atomi di rubidio, attraverso cosiddette
laser e magnetic traps. La prima di queste ‘trappole’ si ottiene disponendo una serie di
laser di modo che gli atomi del gas siano bombardati in ogni direzione da fasci di luce; cosı̀
facendo, come spiegò Weiman, “è come se gli atomi si trovassero all’interno di una forte
grandinata”, per cui essi vengono incessantemente colpiti da fotoni, indipendentemente
dalla direzione in cui si muovono. Tale flusso costante di luce produce un gran numero
di urti fra fotoni e atomi di Rb, cosicchè quest’ultimi perdono energia, rallentano e si
raffreddano, raggiungendo una temperatura di circa 10 milionesimi di grado sopra lo zero.
Nel provocare questo temporale di fotoni, è necessario tener presente l’effetto Doppler,
che induce in inganno gli atomi, i quali andando incontro ai fotoni ne ‘vedono’ una lunghezza d’onda più spostata verso il rosso. Lo spostamento dipende inoltre dalla velocità
dell’atomo incidente, ed in particolare esso è maggiore per gli atomi più lenti; è necessario
dunque regolare la lunghezza d’onda del fotone in modo che esso possa interagire solo con
gli atomi più veloci.
Un’insidia sorge nel momento in cui gli atomi, rallentando, variano la propria lunghezza
d’onda, non risentono più della presenza del fascio luminoso, e muovendosi indisturbati
potrebbero urtare contro le pareti di vetro ed acquistare nuovamente energia. Per evitare
quest’incombenza, si avvolge l’ampolla di vetro con due bobine percorse da corrente che
circolano in verso opposto: si crea dunque un campo magnetico la cui intensità è massima ai bordi del contenitore e diminuisce verso l’interno. Esso agisce sui fotoni dei laser
facendo variare la loro lunghezza d’onda man mano che gli atomi rallentano; di conseguenza persistono urti fra fotoni ed atomi e quest’ultimi, respinti nella zona centrale del
contenitore, sono in trappola. La possibilità di ridurre la temperatura del gas sfruttando la trappola laser è però limitata dall’energia dei fotoni stessi, energia che, per quanto
piccola, viene trasferita agli atomi che dunque continueranno a muoversi. Si procede pertanto spegnendo i laser e applicando un ulteriore campo magnetico, più intenso di quello
utilizzato nella laser trap, ma con ugual obiettivo: tener lontani gli atomi dalla parete di
vetro. Ora però il campo è talmente intenso da agire direttamente sui momenti di dipolo
magnetici degli atomi, costringendoli al centro dell’ampolla senza la luce dei laser attorno.
73
BEC: How is BEC made? The Introduction
http://www.colorado.edu/physics/2000/bec/how_its_made.html
5 – Condensazione di Bose-Einstein
È questa la cosiddetta magnetic trap. Essa introduce l’ultima fase dell’esperimento, cioè il
raffreddamento per evaporazione,
Lavorando un po’ di fantasia, si può
How is evaporative
BEC made?cooling.
The Introduction
paragonare tale meccanismo
con70
quanto
accade
una tazza
di caffè
It took
years to
realizeadEinstein's
concept
of calda: le molecole di
Bose-Einstein
in a gas.
was first
caffè più energetiche riescono
a sfuggirecondensation
dalla superficie
del It
liquido
sotto forma di vapore,
accomplished by Eric Cornell and Carl Wieman in
sottraendo una certa quantità
di calore
alleinmolecole
rimaste
Boulder,
Colorado
1995. They
did it all’interno
by cooling della tazzina, che
to a much
lower temperature
than
been di Boulder è stata quella
di conseguenza si atoms
raffreddano.
Analogamente,
l’idea
delhad
gruppo
previously achieved. Their technique used laser light to
di selezionare e mandar
viaand
dalla
magnetica
gli atomi
caldi, cercando però di
first cool
holdtrappola
the atoms,
and then these
atomspiù
were
further
cooled
by
something
called
evaporative
cooling.
conservare all’interno, dove la temperatura aveva raggiunto i 170 nanokelvin, una densità
sufficientemente alta di atomi di Rb per poter ottenere l’ambito condensato.
It looks like a pretty simple piece of equipment for
such Figura
an important
experiment. Is that really all there
5.1. Apparato sperimentale
was?
Not exactly.
There
a table fullilluminato
of equipment
La mattina del 5 giungo 1995
lo scopo
era is
raggiunto:
da un’intensa luce rossa,
associated with the lasers, and they needed to
Cornell e colleghi osservarono
materializzarsi
sulcolor
fondo
dell’ampolla
produce
exactly the right
of light.
Also theredi vetro un piccolo
is a Per
computer
bunch
of other electronic
e denso grumo di materia.
poco and
piùadi
15 secondi,
circa duemila atomi di rubidio
equipment for controlling everything and making
diedero forma al primo condensato di Bose-Einstein.
1 di 2
21/01/12 14:13
74
Capitolo 6
Verifiche sperimentali dell’effetto
Casimir
La forza di Casimir e un condensato di Bose-Einstein sono accomunati da una peculiarità:
fungono da ponte fra realtà quantistica e realtà classica. Sinteticamente la forza di Casimir può essere definita come una forza di origine quantistica che si manifesta nel mondo
macroscopico; un condensato di Bose-Einstein è un corpo macroscopico regolato da leggi
quantistiche o, più precisamente, uno stato coerente macroscopico. Inoltre i condensati di
Bose sono utilizzati in molti degli esperimenti atti alla misurazione della forza di Casimir.
La storia sperimentale dell’effetto Casimir inizia circa un decennio dopo la sua formulazione teorica per mano del fisico olandese. Il fenomeno tuttavia tardò ad avere riscontri
nei laboratori del periodo. Numerosi furono i tentativi in questa direzione, ma molto poco
soddisfacenti i risultati. Le principali difficoltà incontrate riguardavano non tanto la misura effettiva della forza di Casimir, essendo questa relativamente intensa entro distanze
dell’ordine di pochi micrometri, quanto piuttosto la perfetta calibrazione e disposizione
dell’apparato sperimentale.
Nel corso degli anni la strumentazione, sempre più efficiente e sofisticata, ha consentito
di raggiungere traguardi significativi. Gli esperimenti condotti si distinguono l’un l’altro
oltre che per strumenti e metodologie, anche per la geometria del sistema di conduttori.
Il primo tentativo di misura della forza nella configurazione originale illustrata da Casimir (due lastre conduttrici parallele), fu effettuato da Sparnaay [12] nel 1958; sebbene
nei suoi esperimenti emerse una forza attrattiva, i risultati erano affetti da un’incertezza
del 100% che non consentiva di ergerli a prova sperimentale, ma almeno, come spiegò
75
6 – Verifiche sperimentali dell’effetto Casimir
Sparnaay, “non contraddicevano le predizioni teoriche di Casimir”. Successivamente Blokland e Oveerbeek, era il 1978, pensarono misurare la forza di Casimir fra una superficie
piana conduttrice e un conduttore sferico, in modo da svincolarsi dal problema di parallelismo delle lastre emerso nell’operazione dei predecessori. I risultati furono positivi, ma
l’incertezza di cui erano affetti i risultati era ancora piuttosto alta, del 25%.
Il primo risultato entusiasmante emerse a Seattle, all’Università di Washington, nel
1995. Lamoreaux alla guida del progetto, annunciò che “l’azione delle fluttuazioni di
vuoto fra due superfici conduttrici era finalmente stata dimostrata” [14]. Nel processo di
misurazione fu utilizzato un sistema elettromeccanico basato su un pendolo a torsione.
Anche a Seattle, la scelta fu quella di una lastra piana di quarzo, di larghezza 2,54 cm
e spessore 0,5 cm, e una lente sferica di 4 cm di diametro; la prima posizionata su un
braccio del pendolo, la seconda su un sistema di microposizionamento piezoelettrico che
consentiva di variare con alta precisione la distanza fra i due conduttori. Tale configurazione geometrica comporta una correzione all’espressione della forza di Casimir, dovuta
all’introduzione della cosı̀ detta proximity force approximation (PFA), la quale deriva dall’interazione coulombiana, e richiede che le superfici conduttrici siano separate da una
distanza molto più piccola della loro curvatura. Se R è il raggio della sfera e d la distanza
dalla lastra, la forza di Casimir, in modulo, è
FC =
π 3 ~c R
,
360 d3
(6.1)
valida se R d.
Il primo passo dell’esperimento fu quello di cercare di eliminare gli effetti di viscosità,
portando il sistema ad una situazione di vuoto di 10−4 torr, ma la fase cruciale dell’esperienza consisteva nel mantenere il pendolo ad un angolo fisso. L’obiettivo fu raggiunto
utilizzando un sistema di feedback, costituito da due piastre compensatrici poste ai due
lati del pendolo a formare un condensatore. La posizione del pendolo veniva calibrata di
volta in volta misurando le capacità dei compensatori e verificando che esse fossero uguali,
qualora ciò non era verificato, si applicava ad essi una piccola tensione correttiva.
Nello stadio di preparazione alla misura, la calibrazione del sistema avveniva attraverso
misure elettriche basate sulla variazione della capacità del condensatore costituito dai due
conduttori, in funzione della distanza fra di essi. Tra i due conduttori, a causa dell’apparecchiatura interna del circuito di cui facevano parte, era presente un potenziale di 430
mV che fu eliminato applicando una tensione esterna in modo da lasciare solo una minimo
potenziale δV assunto come ‘zero’. La presenza di un potenziale intrinseco cosı̀ intenso
76
6 – Verifiche sperimentali dell’effetto Casimir
fu inoltre la causa di una sovrapposizione di forze elettrostatiche alla forza di Casimir e
dunque fu necessario utilizzare particolari tecniche di sottrazione che eliminassero il contributo di tali forze, facendo emergere esclusivamente l’interazione di interesse.
La forza di Casimir fu misurata variando di una quantità discreta per volta la tensione
applicata al sistema piezoelettrico e ricavando, ad ogni passo, la forza di richiamo del
VOLUME 81, NUMBER 21
PHYSICAL REVIEW LETTERS
23 NOVEMBER 1998
pendolo attraverso la misura della variazione della quantità δV necessaria per mantenere
Ar is the average roughness amplitude, and equal
in Fig. 1). This force and the corresponding cantilever
l’angolo fisso. Ogni misurawhere
risultava
affetta da un’accuratezza di 0,01
µm. Lo spostamenroughness for both surfaces has been assumed. There
deflection are related by Hooke’s law: F ! kDz, where k
are also corrections due to the finite temperature [12,18]
is the force constant, and Dz is the cantilever deflection.
to massimo a 92V fu di 12,3
corrispondente
givenµm,
by mentre lo spostamento medio misurato,
The piezoextension
with applied voltage was calibrated
"
#
with height standards, and its hysteresis was measured.
(2% linear
correction) and cantilever deflection (to be discussed
3
superfici conduttrici da 0,6where
µm a 6f!j"µm,
sulle
misure.
later)
were applied
to the sphere-plate separations in all
! !jcon
#2p"zun’accuratezza
!3" 2 !j 4 p 2 #45",
jdel
! 5%
collected data.
2pkB Td#hc ! 0.131 3 1023 d nm21 for T ! 300 ±K,
I punti deboli dell’esperienza
Lamoreaux
consistevano
nel fatto
che non
furono
To measure
the Casimir
force vabetween the sphere and
and z !3" !di
1.202
. . . , is the Riemann
zeta function, and
plate they are grounded together with the AFM. The
kB is the Boltzmann constant.
plate
then moved
towards the sphere in 3.6 nm steps
We use
a standard da
AFMquella
to measure
the force
belutate le deviazioni della forza
misurata
ideale,
dovute
allais finita
conducibilità
and the corresponding photodiode difference signal was
tween a metallized sphere and flat plate at a pressure of
measured
(approachMohideen
curve). The signal
mTorr and at A
room
temperature.
A schematic
diadei conduttori ed alla loro 50ruvidezza.
tale
mancanza
cerarono
di
sopperire
e obtained for a
typical scan is shown in Fig. 3(a). Here “0” separation
gram of the experiment is shown in Fig. 1. Polystyrene
stands for contact of the sphere and plate surfaces. It
spheres of 200 6 4 mm diameter were mounted on the tip
Roy [15] nel 1998 a Riverside.
does not take into account the absolute average separation
of 300 mm long cantilevers with Ag epoxy. A 1.25 cm
$120
due to the Essi
20 nm utilizAu#Pd layer (transparent at
optically polishedambiente
sapphire disk eis pressione
used as the di
L’esperimento fu realizzatodiameter
a temperatura
50nmmTorr.
these separations [20]) and the 35 nm roughness of the Al
plate. The cantilever (with sphere) and plate were then
coating on each surface. Region 1 shows that the force
coated with
300 nm of
Al in
an evaporator.
zarono un microscopio a forza
atomica
per
misurare
la Aluminum
forza di Casimir
fra una sfera di
curve at large separations is dominated by a linear signal.
is used because of its high reflectivity for wavelengths
This is due to increased coupling of scattered light into the
(sphere-plate separations) .100 nm and good representapolistirene, dal diametro dition196
µm, e un disco di zaffiro di diametro
cm.
La sfera
fu
diodes1,25
from the
approaching
flat surface.
Embedded in
of its reflectivity in terms of a plasma wavelength
the signal is a long range attractive electrostatic force from
lp $ 100 nm [19]. Both surfaces are then coated with
collocata sulla punta della amicroleva
del
microscopio
e
il
tutto,
disco
compreso,
ricoperto
the contact potential difference between the sphere and the
less than 20 nm layer of 60% Au#40% Pd (measured
plate and the Casimir force (small at such large distances).
at . 90% transparency for l , 300 nm [20]). This was
di alluminio per garantire un
altoto potere
al sistema.
In region 2 (absolute separations between contact and
necessary
prevent anyriflessivo
space charge effects
due to patch
350 nm) the Casimir force is the dominant characteristic
oxidation of the Al coating. A scanning electron microLa fase di calibrazione dell’apparato
sperimentale,
fu with
simile
descritta
nella errors
si- (the electrostatic
far exceeding
all the systematic
scope (SEM) image
of the coated cantilever
spherea quella
force is less than 3% of the Casimir force in this region).
attached is shown in Fig. 2. The sphere diameter was
3 is the flexing
the cantilever resulting from
tuazione precedente: un potenziale
applicato
per Region
compensare
la oftensione
measured usingesterno
the SEM toveniva
be 196 mm.
The average
the continued extension of the piezo after contact of
roughness amplitude of the metallized surfaces was meathe two a
surfaces.
the distance moved by the flat
sured usingquando
an AFM to ibedue
35 nm.conduttori erano messi
interna, di circa 30 mV, presente
terra.Given
Il processo
plate (x axis), the difference signal of the photodiodes
In the AFM, the force on a cantilever is measured by
can sfera
be calibrated
to a cantilever deflection
the deflection
of itsincidere
tip. A laser un
beamfascio
is reflected
off thesulla
di misura fu effettuato invece
facendo
laser
e raccogliendo
il in nanometers
using the slope of the curve in region 3. The deflection
cantilever tip to measure its deflection. A force on the
of the cantileverprovocata
leads to a decrease
sphere
result in a cantilever
deflection leading
to microleva,
raggio riflesso per mezzo di
duewould
fotodiodi.
La deflessione
della
dalin the sphere-plate
a difference signal between photodiodes A and B (shown
R
a 5,75V, risultò essere 0,75 µm. FL’intervallo
di 720
indagine
ricoprı̀
unacorrections
distanza
frathelepiezohysteresis
due
f!j" ,
(4)
The
due to
c !d" ! Fc !d" 1 1
2
p
FIG. 1. Schematic diagram of the experimental setup. Application of voltage to the piezo results in the movement of the
plate towards the sphere. The experiments were done at a presFIG. 2. Scanning electron microscope image of the metallized
suremicroscopio
of 50 mTorr and ataroom
temperature.
mounted on
a AFM per
cantilever.
del
forza
atomica sfruttato da sphere
Mohideen
e Roy
Figura 6.1. Schema
misurare la forza di Casimir.
4550
77
6 – Verifiche sperimentali dell’effetto Casimir
fascio laser, induceva una variazione nei segnali rivelati dai due fotodiodi; valutando tale
variazione si poteva risalire alla deflessione e la forza fra i due conduttori veniva ottenuta
sfruttando semplicemente la legge di Hooke F = k∆z, dove k è la costante della forza e ∆z
la deflessione della microleva. L’operazione fu ripetuta numerose volte, facendo avvicinare
di 3,6 nm per misura, il disco alla sfera.
Nell’analizzare i dati registrati, il gruppo californiano riuscı̀ a stimare numerosi fattori di
disturbo esterni: la conducibilità finita, la ruvidezza del materiale, e la temperatura finita.
Inoltre essi riuscirono a valutare l’errore sistematico nella misura effettiva della distanza
fra le due superfici, dovuto alla flessione della microleva stessa e alla presenza di una forza
elettrostatica, generata dal potenziale residuo presente fra i due conduttori. Grazie alla
precisione degli strumenti utilizzati, dovuta in particolare al grande raggio di curvatura e
all’utilizzo del laser, Mohideen e Roy furono in grado di misurare la forza di Casimir per
distanze comprese fra 0,1 e 0,9 µm, con l’1% di accuratezza.
La geometria sferico-planare fu adottata in successivi esperimenti, ad Harvard ed ai
laboratori Bell, accompagnata dall’utilizzo di materiali e strumenti d’indagine ovviamente
diversi, ma contemporaneamente vennero analizzate anche altre strutture geometriche, ad
esempio è stata osservata la forza di Casimir fra due cilindri incrociati (Ederth) e fra due
emisferi. L’ultimo caso è di particolare rilevanza perchè ebbe un risultato non contemplato teoricamente, ossia una forza di Casimir repulsiva. Fu invece in Italia, che l’idea
di Casimir trovò compimento. Dopo Spanraay, nessun tentativo di misurare la forza fra
due piastre parallele andò a buon fine, soprattutto a causa di quel perfetto parallelismo
estremamente difficile da realizzare. All’Università di Padova, nel 2002, il problema fu
risolto utilizzando come strumento per la misura dello spostamento un interferometro a
fibra ottica e riducendo sensibilmente i fattori di disturbo ambientali.
Il gruppo di ricerca, guidato da Onofrio e Bressi, osservò l’effetto attrattivo fra le due
lastre, con distanze di separazione comprese tra 0,5 e 3,0 µm, ottenendo risultati con precisione al 15%.
Le due superfici parallele fra cui si esercitava la forza erano quelle di una microleva, posizionata su una base di rame e libera di oscillare attorno al proprio perno, e la faccia, ad
essa opposta, di un’altra leva rigida più sottile (chiamata sorgente). Ciascuna era collegata
ad un motorino che permetteva di ruotarle, in modo da garantire la condizione di parallelismo, la sorgente inoltre era fissa su un sistema piezoelettrico lineare in ceramica, che
consentiva di controllare e modificare opportunamente la distanza fra di esse. Entrambe
le leve erano di silicone, ricoperte da un sottile strato di cromo e avevano le dimensioni di
78
6 – Verifiche sperimentali dell’effetto Casimir
SEM Vacuum Enclosure
Optical Fiber
Interferometer
Detection
Fiber
Linear PZT
Capacitance
Meter
Source
Switch
Cantilever
Spectrum
Analyzer
Precision
Voltage
Calibrator
Support
Figura 6.2.
Schematizzazione dell’apparato sperimentale utilizzato nell’esperimento di Padova
1,9 cm × 1,2 mm con spessore di 50 nm per la sorgente e di 47 µm per l’altra.
Nella prima fase dell’esperimento si utilizzarono particolari tecniche per eliminare le particelle di polvere dalle due superfici, per poi procedere con la determinazione del parallelismo. Questo si raggiungeva massimizzando la capacità del sistema alla minima distanza
ottenibile: si ricavò un valore di 22 pF corrispondente ad una separazione fra le due leve
pari a 0,4 µm.
Inoltre furono valutate le deviazioni rispetto alla neutralità elettrica delle due superfici,
determinando il potenziale V0 dovuto alla presenza di diversi materiali metallici presenti
nel circuito. Questo fu possibile applicando, per varie distanze fra le piastre, un campo
esterno Vc e misurando, di volta in volta, l’inclinazione della microleva che ne conseguiva;
si ottenne un valore di V0 di circa -68 mV. Fu possibile stimare la forza di Casimir misurando con un interferometro a fibra ottica la variazione della frequenza della microleva
all’avvicinarsi della sorgente (ciò che in realtà si misurava era la variazione della distanza
fra la microleva e la fibra ottica). Infatti ogni forza che ha dipendenza spaziale, induce una
variazione ∆ν nella frequenza di oscillazione della microleva, dunque, considerando che oltre alla forza di Casimir, l’interazione fra le due superfici era dovuta anche alla presenza
del potenziale residuo Vr = V0 − Vc , ∆ν si è potuta determinare dall’espressione
∆ν 2 (d) = ν 2 − ν02 = −Cel
Vr2 Ccas
− 5 ,
d3
d
(6.2)
con Cel = (0 S)/(4πmef f ) e Ccas = (Kc S)/(πmef f ), dove 0 è la costante dielettrica del
79
6 – Verifiche sperimentali dell’effetto Casimir
vuoto, S l’area effettiva delimitata dalle due superfici interagenti e mef f la massa effettiva
della microleva. Per separare i contributi dovuti all’interazione elettrostatica e alla forza
di Casimir, furono effettuate diverse misure facendo variare la tensione Vc . Si determinò
Ccas = (2,34 ± 0,34) · 10−28 Hz 2 m5 , coerentemente con la previsione di una forza attrattiva
(il segno di ∆ν è negativo) e dunque un coefficiente della forza di Casimir
Kc =
0 Ccas
= (1,22 ± 0,18) · 10−27 N m2 .
4 Cel
(6.3)
Il valore di Kc cosı̀ ottenuto coincide, entro la banda di errore, con quello determinato
teoricamente, pertanto il lavoro di Onofrio fu la prima verifica sperimentale dell’esistenza
della forza di Casimir.
Parallelamente alla ricerca attorno alla forza di Casimir, si è sviluppato nel corso degli
anni lo studio sperimentale su scala atomica, in cui fa da controparte la forza di CasimirPolder, che si manifesta fra un atomo e una superficie.
Fu per primo Sukenik ad individuare e misurare l’incrocio fra il raggio di azione della forza
di Van der Waals e quello forza di Casimir-Polder; nel caso di un sistema composto da un
atomo di rubidio e una superficie piana, l’incontro avviene ad una distanza di separazione
fra di essi di circa 0,1µm. Al di sotto di tale distanza prevale l’interazione di Van der Waals
che dipende dalla distanza d come 1/d3 , per separazioni maggiori invece è preponderante
la forza di Casimir-Polder proporzionale a 1/d4 .
Recentemente la forza di Casimir-Polder è stata misurata in una serie di esperimenti
condotti da Eric Cornell nei laboratori JILA [13]. Essi utilizzarono un condensato di
Bose-Einstein di rubidio e verificarono l’esistenza dell’interazione attrattiva misurando
le variazioni della frequenza di oscillazione del centro di massa del condensato, dovute
alla presenza di una superficie conduttrice. Tale superficie altera la trappola magnetica
a cui son soggetti gli atomi di rubidio, causando lo spostamento del centro di massa
dei singoli atomi e l’oscillazione del centro di massa, detta anche oscillazione di dipolo,
dell’intero sistema. Gli spostamenti singoli non furono misurati perchè inferiori rispetto
alla sensibilità della strumentazione usata, mentre l’oscillazione di dipolo fu il parametro
necessario per la determinazione della forza di Casimir-Polder.
La superficie fu posta sopra il condensato, parallelamente ad esso, e la distanza determinata
applicando un campo magnetico uniforme nella direzione verticale (direzione x̂ nella figura
(6.3)). Con opportune semplificazioni e approssimazioni, la variazione della frequenza
di oscillazione di dipolo, nella direzione x̂, γx , si ottiene a partire dalla frequenza di
80
the surface, we can translate the trap to measure surfa
Thomas-Fermi radii of 85.9 #m and 2.40 #m in the axial
forces at many different locations on our 5 " 8 mm surfac
and radial directions, respectively. See Fig. 1#a$ for the coFinally, we can adjust the angle of the ẑ trap axis to
ordinate definitions and orientations of the surface and conparallel with respect to the surfaces. Using the surface refle
densate in the experiment.
tion images, we have verified that the deviation from paral
The surfaces for study are located '1 mm above #+x̂ diis $0.25°.
rection$ where evaporation occurs. To position the condenTo excite a condensate dipole oscillation in the x̂ dire
sate near the surface, a vertical #x̂-direction$ magnetic field is
tion, we apply an oscillating magnetic field of the form
applied. This uniform magnetic field acts to displace the
2 2
magnetic
minimumsperimentali
of the trapping field.
By applying
a care6 – Verifiche
dell’effetto
Casimir
Bx#t$ % e−#t − t0$ /& cos#'xt$,
#
fully controlled field ramp, we are able to move the atoms
&
is
the
time
width
of
the
pulse
#10
ms
in
this
expe
where
arbitrarily close to the surface without exciting mechanical
ment$ and t0 is the time of the peak of the pulse. In frequen
oscillations of the condensate, and the condensate can be
space, this excitation is centered on the radial trap frequen
held there
for many seconds.
oscillazione in assenza della
superficie,
ωx , e dalla frequenza ωx0 perturbata:
'x and contains no dc or high-frequency components; th
To measure the distance between the condensate and the
prevents excitation of unwanted internal condensate mod
surface, we use an absorption imaging technique
described in
0
ωthex atoms
− ωxwith a beam perpen- Similarly, dipole oscillations can be excited in the ŷ and
!15,17" where we illuminate
γx =
.
(6.4)
directions.
dicular to the long axis
of the ω
condensate.
This beam imx
Expansion
of
the
oscillating
condensate is accomplish
pinges on the surface with a slight grazing incidence angle of
by a microwave adiabatic rapid passage to the %F =
'2.4° such that when the condensate is within '100 #m of
~ oscillante
which
is antitrapped, followed by '5 ms
mF = −2& state,di
Per misurare γx fu applicato
un both
campo
magnetico
B
con frequenza
normalizthe surface,
a direct
absorption image
and a reflected
rapid antitrapped expansion !14". The antitrapped expansi
absorption image of the condensate appear. Measuring the
acts to push atoms away from the magnetic minimum, a
because of gravitational sag, the condensate begins the e
pansion below the magnetic minimum, so the condensate
pushed away from the surface during expansion. Additio
ally, the antitrapped expansion acts to amplify the radial d
pole oscillation amplitude by approximately 20-fold, perm
ting straightforward measurement of the oscillation
expansion. For example, see Fig. 1#b$. Finally, the conde
sate is simultaneously imaged through absorption along bo
the ŷ and ẑ directions, allowing us to monitor the position
Figura 6.3. Misura della forza di Casimir-Polder. the condensate in all three directions.
The typical experiment is performed as follows. First
surface calibration set is taken to determine the magne
zazione ωx . Le oscillazioni indotte sul centro di massa del condensato
fieldfurono
necessarymisurate
to position sia
the condensate the desired d
tance from the surface. Second, a vertical oscillation data s
alla distanza d, in esame, fra condensato e superficie, sia a distanza dis0taken
, usata
ottenere
at theper
desired
trap-center to surface distance d, typ
cally 6 – 12 #m. Interspersed with these data are vertical o
la frequenza ωx . Il valore di γx fu ottenuto dal confronto dei valori dicillation
oscillazione
data taken misurati
at d0, the distance we use to obtain t
normalization frequency 'x. Data points and normalizati
in d e in d0 , secondo la relazione (6.4). Il gruppo di Boulder riuscı̀ apoints
misurare
la
di during the course of the da
were randomlyforza
alternated
set in order to prevent trap frequency drift from affecting o
Casimir-Polder fino a una separazione di circa 5 µm, risultato fino admeasurement.
allora maiForraggiunto.
this experiment d0 = 15 #m. A distance
FIG. 1. #Color online$ #a$ Diagram, to scale, illustrating the
15 #m is far away enough such that surface forces will n
aspect ratio of the condensate and typical oscillation position relaaffect the frequency; the normalized dipole frequency sh
tive to the surface. The coordinate axis orientation and the direction
−6
from the
of
gravity
are
also
indicated.
#b$
Typical
data
showing
the
radial
I tentativi di misuradipole
della
forza di Casimir sono in continua crescita
ed Casimir-Polder
evoluzione.force
La is less than 10 at this d
oscillation after expansion away from the surface.
tance. By comparing the frequency measured at d to th
prospettiva è quella di riuscire a verificare il fenomeno a distanze inferiori, con strumenti
033610-2
di maggiore precisione, cercando anche di valutare e limitare i fattori di non idealità.
81
Conclusioni
Il lavoro di tesi ha consentito di affrontare uno dei temi d’avanguardia tanto nell’ambito
della fisica teorica, quanto in quello sperimentale.
Risolvendo l’equazione di D’Alembert nel vuoto, con appropriate condizioni al contorno,
si è giunti alla formulazione quantistica del campo elettromagnetico, la cui peculiarità
consiste nella presenza di una energia non nulla nello stato di vuoto. Si è visto che le
fluttuazioni di vuoto non sono un semplice risultato matematico, ma hanno una realtà
fisica. Nell’atomo di idrogeno, l’elettrone interagisce con le fluttuazioni di vuoto del campo elettromagnetico generato dal protone, eliminando la degenerazione di livelli energetici
caratterizzati dalla stessa coppia di numeri quantici n ed l. Il Lamb shift dunque ha
condotto alla struttura iperfine dell’atomo di idrogeno, verificata sperimentalmente con
tecniche spettroscopiche. È stato inoltre illustrato il ruolo delle fluttuazioni di vuoto nel
mondo macroscopico: fra due atomi o molecole apolari, esse inducono dei momenti di
dipolo momentanei che ne causano l’attrazione (forza di Casimir-Polder); analogamente,
i fotoni virtuali presenti nello stato di vuoto, esercitano una pressione sulle superfici di
due lastre conduttrici vicine che, di conseguenza, si attraggono (forza di Casimir). La
dimostrazione sperimentale dell’effetto Casimir è stata descritta in diverse configurazioni
e geometrie, con precisione dei risultati crescente. Tale descrizione, oltre che la quantizzazione del campo, ha fornito l’occasione per introdurre e analizzare gli stati coerenti
e la condensazione di Bose-Einstein. I primi sono elementi basilari in ottica quantistica
e fungono da raccordo fra la meccanica classica e la meccanica quantistica: definiti come gli autostati dell’operatore di annichilazione, essi sono stati quantistici con proprietà
classiche. In particolare soddisfano, con l’uguaglianza, il principio di indeterminazione
di Heisenberg e fanno emergere importanti caratteristiche del campo elettrico. Infatti il
valore medio del campo su stati coerenti conduce all’espressione classica del campo stesso
82
6 – Verifiche sperimentali dell’effetto Casimir
e, contemporaneamente, lo scarto quadratico medio corrisponde alle fluttuazioni di vuoto quantistiche. Oltrepassato il confine quantistico, il mondo sperimentale macroscopico
necessita una descrizione statistica. Una trattazione panoramica delle distribuzioni quantistiche quali la distribuzione di Fermi-Dirac e di Bose-Einstein ha consentito dunque di
introdurre il condensato di Bose-Einstein, con il cui ausilio è stata determinata sperimentalmente la forza di Casimir.
La ricerca sperimentale e teorica attorno all’effetto Casimir e all’energia di vuoto offre
prospettive di ampio respiro, vaste sono infatti le applicazioni nelle nanotecnologie, in
chimica e biofisica, fino agli orizzonti della cosmologia. Come dire, il sipario non è ancora
calato.
83
Bibliografia
[1] Vincenzo Barone, Relatività, Bollati Boringheri (2004)
[2] P. Caldirola, R. Cirelli, G. M. Prosperi, Introduzione alla fisica teorica, UTET (1982)
[3] Peter. W. Milonni,
The Quantum Vacuum:
an introduction to quantum
electrodynamics, Academic Press, Inc. (1994)
[4] P. Lambropoulos, D. Petrosyan, Foundamentals of Quantum Optics and Quantum
Information, Springer (2007)
[5] David Griffiths, Introduction to Elementary Particles, John Wiley & sons, Inc. (1987)
[6] H. B. G. Casimir, Comments Mod. Phys. 5-6, 175 (2000)
[7] Christopher C. Gerry and Peter L. Knight, Introductory Quantum Optics, Cambridge
University Press (2005)
[8] M. Bordag, G. L. Klimchitskaya, U. Mohideen, V. M. Mostepanenko, Advances in
the Casimir Effect, Oxford University Press (2009)
[9] James P. Sethna, Statistical Mechanics: Entropy, Order Parameters and Complexity,
Oxford University Press (2006)
[10] C. Cohen-Tannoudji, B. Diu, F. Laloë, Quantum Mechanics, John Wiley & sons
(1977)
[11] L. D. Landau, E. M. Lifsits, L. P. Pitaevskij, Fisica Statistica, Editori Riuniti, Edizioni
Mir (1986)
[12] M. J. Sparnaay, Physica (Utrecht) 24, 751 (1958)
[13] D. B. Harber, J. M. Obrecht, J. M. McGuirk and E. A. Cornell, Phys. Rev. A 72,
033610 (2005)
[14] S. K. Lamoreaux, Phys. Rev. Lett. 78, 5 (1997)
[15] U. Mohideen and Anushree Roy, Phys. Rev. Lett. 81, 21 (1998)
[16] G. Bressi, G. Carugno, R. Onofrio and G. Ruoso, Phys. Rev. Lett. 88, 041804 (2002)
[17] Roberto Onofrio, New Journal of Physics 8, 237 (2006)
84
Bibliografia
[18] www.colorado.edu
85