Statistical Field Theory

F.Gliozzi
Statistical Field Theory
a.a. 2008/2009
1 Superfluidità
Nella fisica degli stati condensati si conoscono sistemi che manifestano effetti
quantistici su scala macroscopica. Un prototipo di tale natura fu previsto da Einstein nel lontano 1926: per effetto del principio di indistinguibilità di particelle
identiche un gas perfetto di bosoni (cioè composto da bosoni non interagenti) al
di sotto di una temperatura critica subisce una transizione di fase, caratterizzata
dal fatto che una frazione macroscopica di molecole va ad occupare lo stato di
minima energia. L’insieme di queste molecole costituisce il condensato di BoseEinstein, un fluido con proprietà quantistiche quali ad esempio fenomeni di interferenza tipiche della propagazione ondosa. Un fluido quantistico è caratterizzato dal fatto che la lunghezza d’onda λ di De Broglie associata alle particelle
che lo compongono è maggiore della loro mutua distanza. Poichè λ è inversamente proporzionale alla velocità e d’altro canto la velocità quadratica media è
legata alla temperatura del fluido, si trova che la temperatura a cui avviene la
condensazione di Bose-Einstein è tanto più bassa quanto più bassa è la densità.
È quindi molto difficile osservare questo fenomeno perchè un gas reale soddisfa
l’approssimazione di gas perfetto solo se è molto rarefatto, il che comporta una
temperatura di transizione estremamente bassa. Il primo condensato fu ottenuto
solo nel 1995 ad una temperatura dell’ordine di un milionesimo di grado Kelvin
per opera degli americani Eric Cornell e Carl E. Wieman del National Institute of
Standards & Technology e del tedesco Wolfgang Ketterle del MIT che nel 2001
ricevettero il premio Nobel per la fisica in riconoscimento del loro lavoro.
Un fluido quantistico molto più facile da produrre è l’He4 , il gas nobile piu’
leggero, il cui nucleo atomico è formato da due protoni e due neutroni e lo spin
totale è zero, dunque un gas di Bose debolmente interagente.
L’ He4 fu liquefatto per la prima volta nel 1908 per opera di Kamerlingh
Onnes (premio Nobel nel 1913)nel suo laboratorio di Leida a una temperatura di
4.215 o K alla pressione di 1 atmosfera. Pochi anni dopo (1911) si scoprı́ una
seconda fase fluida, nota come He II, che è stabile per T compreso tra 0 e circa
2.17 o K (il valore preciso del punto di transizione tra la fase HeI e HeII dipende
dalla pressione) mentre la fase solida appare solo al di sopra di 25 atm. Fin dai
primi esperimenti si osservo’ che questa nuova fase fluida manifestava proprieta’ molto strane: il liquido riusciva a defluire da screpolature dei recipienti cosı́
microscopiche che neppure l’He gassoso riusciva ad attraversarle; analogamente
poteva scorrere attraverso capillari ultrasottili apparentemente senza nessuna resistenza come un fluido di viscosità nulla. Fluidi con queste proprietà si dicono
superfluidi.
1
C’è qualche analogia tra la condensazione di Bose-Einstein e la transizione
alla fase II (cioè superfluida) dell’He4 liquido. In particolare, mettendo i parametri
dell’ elio nella formula per Tc (cioè la massa m degli atomi e la densità del fluido) si ottiene Tc ∼ 3.13 o K, che non è lontanissimo da To = 2.17 o K che è la
temperatura di transizione nella fase II a pressione nulla.
La dipendenza di CV da T è pero’ diversa a bassa temperatura.
La forma di CV = CV (T ) ha suggerito il nome di punto λ per questo punto di
transizione dalla fase di HeI (fluido normale) alla fase di He II (superfluido).
6
...
......
.... .....
.. ..
CV
.. ...........
..........................................
....
..
.....
....
....
.
.
.
.
...
......
.......
.
.
.
.
.
.
.
.
....
............
.................
Tc
T
L’elio liquido non è in realtà approssimabile in nessun modo a un gas perfetto
perchè è un liquido (= alta densità) e le interazioni interatomiche non sono trascurabili. Studiando il potenziale interatomico si vede che gli atomi di He4 si comportano come sferette impenetrabili del diametro di 2.7 Å . Alla densità ordinaria ogni
atomo ha a disposizione un volume di ∼ 45 Å 3 , quindi gli atomi sono piuttosto
vicini.
perchè l’ elio è l’unica sostanza liquida anche a 0 Kelvin? Partendo dal reticolo
cristallino ( stabile a una pressione maggiore di 25 atm) e calcolando l’energia di
punto zero dovuta alla vibrazione degli atomi attorno alla posizione di equilibrio si trova che l’ampiezza di oscillazione è dell’ordine della distanza reticolare.
Cio’ accade perchè l’elio è molto leggero (= alta frequenza) ed è un gas nobile
(interazione chimica molto debole).
Proprietà dell’HeII . Tre proprietà fondamentali:
• conduttività termica infinita
• effetto meccano-calorico: due recipienti contenenti HeII, comunicanti attraverso un capillare sottilissimo e mantenuti a una differenza di pressione
∆P assumono due diverse temperature tali che ∆P = ρs∆T , dove s è
l’entropia specifica e ρ la densità
• superfluidità (è la proprietà piu’ importante): l’HeII fluisce attraverso i capillari senza apparente resistenza: la sua viscosità sembra nulla.
2
1.1 Calcolo della velocità critica
La viscosità è la manifestazione macroscopica dello scambio di energia tra un fluido in scorrimento e la parete lungo cui scorre. Poichè questo scambio avviene
per quanti (queste eccitazioni elementari sono dette quasiparticelle) può succedere
che per ragioni cinematiche un fluido a temperatura zero che scorre a una velocità
inferiore a un valore critico non puo’ produrre quasiparticelle nell’interazione con
la parete, quindi non perde energia ed ha allora viscosità nulla (è superfluido). Il
tutto dipende dalla forma della curva di dispersione, cioè dalla relazione tra impulso p e energia ǫ(p) delle quasiparticelle. Nell’elio superfluido, la diffusione
con fasci di neutroni permette di stabilire che la curva di dispersione ha approssimativamente la seguente forma
6
ǫ
......
..
.............. ..............
....
.........
...
....
......
.
.
.
.
.
.
.
.
.
...
...
....
....
....
.....
.....................
.....
.
.
.
.
...
....
....
-
p
curva di dispersione
Per piccoli valori di p (grandi lunghezze d’onda) si ha ǫ(p) = c p , dove c è la
velocità del suono. Eccitazioni di questo tipo sono dette fononi : sono i quanti
del suono (classicamente onde di compressione e rarefazione). Vedremo che i
fononi sono le eccitazioni più importanti per il comportamento termico del fluido
a T ≤ 0.5 o K. Al di sopra di questa temperatura entra in gioco un altro tipo
di quasiparticelle, dette rotoni , corrispondenti al minimo locale nella curva di
dipersione (le altre eccitazioni dello spettro non sono stabili).
Vediamo ora quali sono i vincoli cinematici nella produzione di una particella
di impulso p e energia ǫ(p) da parte del fluido di massa M che scorre lungo una
parete con velocità ~v.
M=massa del fluido ~v =velocità iniziale v~′=velocità finale ~p=impulso della
quasiparticella ǫ(p) = energia della quasiparticella.
• Conservazione dell’impulso: M~v = M v~′ + p~
1
1
1
p2
′2
2
2
⇒ Mv =
(M~v − ~p) = Mv − ~v · p~ +
2
2M
2
2M
3
(1.1)
• Conservazione dell’energia: 21 Mv 2 ≥ 21 Mv ′2 + ǫ(p)
Inserendo la (1.1) nella disuguaglianza
p2
⇒ ~v · p~ −
≥ ǫ(p)
2M
ǫ(p)
.
p
Dunque affinchè il processo di produzione di pseudoparticelle sia cinematicamente possibile la velocità dell HeII non può essere arbitrariamente piccola: al
di sotto della velocità critica
M → ∞ ⇒ ~v · p~ > ǫ(p) ⇒ v >
vcrit. = minp ǫ(p)
p
il fluido scorre senza attrito, dunque η = 0 a T = 0.
In conclusione, ogni sostanza che
• è liquida a T = 0
• ha uno spettro di eccitazioni formato a bassa energia da fononi
è necessariamente superfluida a T = 0, perchè esiste una velocità critica vcr > 0.
Cosa succede per T > 0? Il ragionamento precedente continua a valere, ma
ora il liquido contiene un gas di fononi ( o piu’ in generale di quasiparticelle) che
possono interagire con le pareti dando luogo a un comportamento viscoso, come
vedremo nel prossimo paragrafo.
1.2 Effetto di trascinamento sul gas di quasiparticelle
Supponiamo che una massa M di elio nella fase II a una temperatura T > 0 si stia
muovendo a una velocità ~v. Nel suo moto esso trascina il gas di fononi e rotoni
che descrive le eccitazioni termiche del sistema. Come cambia la distribuzione
dei livelli energetici del gas per effetto del trascinamento? Per rispondere a questa
domanda, supponiamo che nel liquido in moto si crei un’eccitazione di energia
ǫ(p) ed impulso ~p a spese dell’energia cinetica del fluido, senza scambio di energia
con le pareti. Utilizzando nuovamente la conservazione dell’impulso [eq.(1.1)] e
dell’energia, si ha, per M molto grande,
1
1
Mv′2 + ǫ(p) ≃ Mv 2 − p~ · ~v + ǫ(p) .
2
2
4
Quindi la creazione di una eccitazione di momento ~p nel fluido in moto corrisponde a un contributo in energia pari a εv (p) = ǫ(p) − p~ · ~v .
Possiamo allora concludere che il moto del gas di eccitazioni a una velocità ~v
genera uno shift dei livelli energetici 1 pari a ǫ(p) − ~p · ~v.
Calcoliamo l’impulso totale del gas di fononi, supponendo ~v molto piccolo
(si trascurano i termini di ordine v 2 ) Indicando con P~ l’impulso totale del gas di
fononi e con hn(ǫ)i il numero di fononi nel livello ǫ, si ha
Z
Z
Z
dhni
3
3
P~ = d p ~p hn(ǫ − ~v · ~p)i = d p ~p hn(ǫ)i − d3 p ~p
(~v · p~) + O(v 2 ) .
dǫ
Il primo integrale è nullo perchè è la somma (o l’integrale) di vettori che puntano
uniformemente in tutte le direzioni (lo si vede anche esprimendo ~p in coordinate
sferiche). Nel secondo integrale dà un contributo solo la componente di p~ lungo
~v . Posto ~p = v~v2 (~p · ~v ) + ~ni (~p · ~ni ) (~ni , (i = 1, 2) indica una coppia di versori
ortogonali a ~v ), si ha, in coordinate sferiche,
~v
~p = p cos θ + ~n1 p sin θ cos φ + ~n2 p sin θ sin φ
v
L’integrazione su φ elimina la componente lungo ~ni
Z +1
Z ∞
dhni
~
⇒ P = −~v
d(− cos θ)2π
p2 dp p2 cos2 θ
dǫ
−1
o
Z
4π ∞ 4 dhni
p dp
.
= −~v
3 o
dǫ
Poichè stiamo considerando un gas di fononi, si ha ǫ(p) = pc
Z ∞
Z ∞
4π
dhni
16π
4
⇒ P~ = −~v
p dp
= ~v
p3 hn(ǫ)idp
3c o
dp
3c o
Z
Z Z Z
16π ∞ 2
4U
4
= ~v 2
d3 pǫhn(ǫ)i = ~v 2 ,
p dpǫhn(ǫ)i = ~v 2
3c o
3c
3c
U = energia interna per un gas di fononi (vedi il caso del corpo nero)
U=
π 2 κ4 T 4 V
= V uo .
30 ~3 c3
1
il fluido che si muove rigidamente alla velocità ~v descrive, nel limite M → ∞, un sistema
inerziale e lo shift in questione descrive il modo di trasformarsi dell’energia per effetto di una
trasformazione (galileiana) da un sistema di riferimento ad un altro.
5
Questa formula va paragonata con l’impulso per unità di volume trasportato da un
fluido ordinario che si muove alla velocità ~v : P~ /V = ρ~v . ⇒ In conclusione, il
gas di fononi trascinato dall’He II in moto si comporta come un fluido ordinario
di densità
4
16π 5 κ4 T 4
ρ = 2 uo =
,
3c
45h3 c5
quindi l’impulso trasportato dal fluido non è più tutto concentrato nelle molecole
che si trovano nello stato fondamentale, ma si suddivide tra queste molecole e il
gas di fononi. La frazione di impulso trasportata dai fononi cresce proporzionalmente a T 4 . Per temperature maggiori di ∼ 0.5 o K il contributo dei rotoni non
è piu’ trascurabile ed il gas delle eccitazioni va trattato come un gas di fononi e
rotoni. La curva di dispersione ǫ(p) in prossimità del minimo rotonico in po si
puo’ parametrizzare nella forma seguente
ǫ(p) ≃ ∆ +
(p − po )2
2µ
dove ∆k ≃ 8.6 o K , µ ≃ 0.16mHe , po /~ ≃ 1.9 Å −1 . Il numero totale di rotoni,
come quello dei fononi, non è fissato, quindi possiamo scegliere il potenziale
chimico µ ≃ 0 (⇒ z ≃ 1).
Il numero medio di rotoni nel livello energetico ǫ(p) sarà allora:
hn(ǫ)i =
eǫβ
1
−1
Nell’intervallo di temperatura in cui l’He è superfluido (0 ≤ T ≤ 2.17
parametri del rotone implicano ǫβ ≥ 4, quindi eǫβ ≫ 1
o
K) i
⇒ hn(ǫ)i ∼ e−ǫβ .
Quindi il rotone si comporta quasi come un sistema classico. Ripetiamo ora il
conto che avevamo fatto per il gas di fononi per calcolare la densità effettiva associata ai rotoni. L’impulso complessivo trasportato da un gas di rotoni alla velocità
~v è dunque
Z
4π ∞ 4 dhni
~
P = −~v
p dp
.
3 o
dǫ
Poichè n(ǫ) = e−ǫβ
4π
⇒ P~ = ~v β
3
Z
∞
p4 dphn(ǫ)i = ~v
o
6
β X 2 −βǫ
p e
=
3 ǫ
P
β
β ǫ p2 e−βǫ X −βǫ
P −βǫ
e
= ~v hp2 iN̄ ,
= ~v
3
3
ǫe
ǫ
P
dove si è posto N̄ = ǫ hnǫ i. Con buona approssimazione si ha hp2 i = p2o , quindi
p2o
i rotoni si comportano come particelle di massa effettiva 3κT
in apparente accordo
p2o
3
col teorema di equipartizione: 2m = 2 κT Calcoliamoci ora il numero medio N̄
di rotoni per unitá di volume in funzione di β:
Z
(p−po )2
4π ∞ 2
p dp e−β(∆+ 2µ )
N̄ = 3
h o
Introduciamo la variabile adimensionale x2 =
⇒ p = (x + xo )
4πe−β∆
N̄ =
h3
2µ
β
32 Z
∞
r
2µ
, xo =
β
s
2 −x2
dx(x+xo ) e
−xo
β(p−po )2
2µ
;
β
po , dp =
2µ
4π e−β∆
≃
h3
r
2µ
β
2µ
dx
β
32 Z
∞
2
dx(x+xo )2 e−x .
−∞
Utilizzando il fatto che l’integrale di una funzione dispari su un intervallo simmetrico è nullo, si ha
s
!2
Z ∞
Z
Z ∞
β
β 2 ∞
2
−x2
2
−x2
=
po e
x dxe
+ po
dxe−x ;
dx x +
2µ
2µ
−∞
∞
−∞
e dalle note relazioni:
r
Z ∞
Z
Z ∞
√
π
d ∞
2
−x2 t
2
−x2
dxe
=
,
dxe−tx |t=1 = π/2 ,
x dxe
=−
t
dt −∞
−∞
−∞
si ottiene
e−β∆
N̄ = 2 3
h
2πµ
β
32
e−β∆ 2
+ 4π 3 po
h
2πµ
β
12
.
1
e−β∆ p2o ( 2πµ
)2 .
Poichè numericamente si verifica che p2o ≫ 2µκT , ⇒ N̄ ∼ 4π
h3
β
Inserendo questo valore nella formula che ci dà l’impulso per unitá di volume
trasportato da un gas di rotoni in movimentosi ha:
1
4π
P~ = ~v 3 e−β∆ p4o (2πµβ) 2 ,
3h
7
quindi il gas di rotoni si comporta come un fluido di densità
ρrot =
1
4π −β∆ 4
2
e
p
(2πµβ)
o
3h3
Da questa relazione si desume, come avevamo anticipato, che la densità dei rotoni
è trascurabile per T ≤ 0.5 o K e diventa dominante in prossimità del punto lambda.
L’He II appare composto da due fluidi che si compenetrano senza attrito: una
componente superfluida di densità ρs formata dall’elio nello stato fondamentale
e una componente normale di densità ρn = ρf on + ρrot . In particolare, ρn (T =
0) = 0 e tutta la massa è superfluida. Al crescere della temperatura la frazione ρρn
(ρ = ρn + ρs = densità dell’ He II) cresce ed è 1 al λ-point, dove tutto il fluido
diventa normale (ed è dominato dalla componente rotonica).
Inserendo i valori dei parametri nell’espressione che abbiamo trovato per ρrot
si ottiene ρρn ∼ 1 per Tc = 2.8 o K, che non è lontanissimo da 2.17 o K (valore
sperimentale del λ-point).
La componente normale, essendo formata da eccitazioni che si muovono in
tutte le direzioni, ha ovviamente uno scambio di impulso con la parete, quindi il
suo moto è viscoso, per cui non riesce a passare attraverso i capillari molto sottili,
cosa che invece può fare la componente superfluida. Si spiega cosi’ facilmente
l’effetto meccano-calorico: se due recipienti di HeII inizialmente alla stessa T
sono posti in comunicazione con un capillare e sono mantenuti con una differenza
di pressione costante ∆P
________________
__________________
|
|
|
|
|
A
|
|
B
|
|
|
|
|
|
==========
|
|
P+DP
|
|
P
|
|
|
|
|
--------------------------------in modo che ci sia un flusso da A a B ⇒ il fluido in B si raffredda perchè attraverso
il capillare fluisce solo la componente superfluida ( che è a entropia 0 e quindi a
T = 0).
Con lo stesso meccanismo si spiega anche l’effetto termomeccanico: se A e B
inizialmente alla stessa P sono mantenuti a una differenza di temperatura ∆T , si
genera un flusso nel capillare che determina una ∆P ∝ ∆T .
8
1.3 Conducibilità termica infinita e secondo suono
Le variazioni di temperatura in un sistema omogeneo ordinario si propagano nel
mezzo in accordo con l’equazione di propagazione del calore (di cui si è parlato
più diffusamente nel capitolo sul moto browniano negli appunti di Meccanica Statistica )
1 ∂u
∆u =
,
(1.2)
D ∂t
dove ∆ è il Laplaciano e u = u(~x, t) denota la temperatura nel punto ~x al tempo
t.
Nell’ He II la condicibilità termica D è infinita, quindi l’equazione precedente
non è più valida. Si può pensare che il membro di destra dell’eq.(1.2) sia in realtà
il primo termine di uno sviluppo in serie di Taylor in t. se il primo termine è
zero, il termine successivo con la derivata seconda non è più trascurabile, perciò
2
ci si aspetta che l’equazione venga modificata nel modo seguente ∆u = v12 ∂∂t2u ,
che rappresenta la propagazione per onde delle variazioni di temperatura. Dunque
nell’He II ci si aspettano due tipi di propagazioni per onde:
1. Il suono, cioè propagazione di onde di pressione o di densità descritta dall’
eq. di d’Alembert
1 ∂2ρ
∆ρ = 2 2
c ∂t
dove c è la velocità del suono che nell’HeII vale ∼ 238 m/sec.
2. Il secondo suono, cioè la propagazione di fluttuazioni di ρn a ρ costante.
Una variazione locale di ρn corrisponde a una variazione locale della temperatura, quindi il secondo suono è un’onda di temperatura.
Nell’ambito della teoria dei due fluidi, è facile derivare l’equazione di propagazione
del secondo suono nel caso del gas di fononi (cioè nel caso dell’He II al di sotto
di 0.5 o K).
Indichiamo con ε = VU l’ energia per unità di volume del gas di fononi.
L’equazione della meccanica F = ma si traduce in un fluido nell’equazione fondamentale dell’idrodinamica:
~
p~˙ = −∇P
(p = impulso per unità di volume, P = pressione)
9
D’altra parte, la conservazione dell’energia (eq. di continuità) si scrive:
1
ε̇ + div p~ = 0 ,
c2
2
da cui si ha ddt2ε = −c2 div p~˙ = c2 ∆P . Ma in un gas di fononi (o di fotoni) abbiamo
già visto che la pressione è legata alla densità di energia da P = 3ǫ
⇒
d 2 ǫ c2
− ∆ǫ = 0
dt2
3
Questa è di nuovo un’ equazione di d’Alembert che descrive la propagazione di
un’onda alla velocità
u=
√c
3
che è appunto la velocità del secondo suono. Sperimentalmente la velocità del
secondo suono coincide con questa predizione teorica di Landau in un ampio intervallo di temperatura, per poi decrescere rapidamente in prossimità del punto
lambda.
1.4 Teoria microscopica di Feynman
Questo è un approccio qualitativo che intende dare un fondamento microscopico al fenomeno della superfluidità ed è basato semplicemente sullo studio delle
proprietà della funzione d’onda che descrive l’elio.
Cominciamo col vedere le proprietà della f. d’onda che descrive lo stato fondamentale. La funzione d’onda si puo’ pensare come una mappa φ che assegna ad
~2 , ..R~n (R
~i =
ogni configurazione dell’elio, individuata da 3N coordinate R~1 , R
raggio vettore dell’iesimo atomo) un’ampiezza di probabilità
~1 , R~2 , . . . R~N → φ(R
~1 , R~2 , . . . R~N ).
R
L’He4 è un liquido di Bose-Einstein ⇒ φ è simmetrica rispetto a tutte le permutazioni delle molecole.
Proprietà fondamentale: φ è reale e non ha nodi, percio’ si puo’ sempre
scegliere con lo stesso segno (ad es. positiva).
10
Infatti φ soddisfa l’ equazione di Schrödinger
!
X
~2 X
−
△i +
V (rij ) φ = Uφ.
2m i
ij
Essendo l’eq. lineare e reale, anche φ∗ è una soluzione. Possiamo quindi scrivere
∗
∗
o φ−φ
.
tutte le soluzioni in forma reale: φ+φ
2
2i
La soluzione corrispondente allo stato fondamentale minimizza l’energia:
R h2 P
P
R
2
2
~
N~
(∇
φ)
+
dN R
V
(r
)φ
i
ij
i
ij
2m
φHφd R
=
hEi = R
R
~
~
φ2 d N R
φ2 d N R
Si puo’ dimostrare che, essendo H un operatore ad elementi di matrice positivi, la
f. d’onda dello stato fondamentale non ha nodi (Teorema di Perron Frobenius).
Argomento di plausibilità: sia x una delle coordinate. Se φ ha un nodo ⇒ la
funzione |φ| dà a hEi lo stesso contributo di φ, tranne nel nodo (φ = 0), dove
∂|φ|
è singolare, per cui φ e |φ| hanno approssimativamente la stessa energia, ma
∂x
è chiaro che si puo’ rendere meno spigolosa
|φ| con un arrotondamento |φ| → ...φ̃
:
...
.......
....
.............
.........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.........
...
.........
.....
.....
|φ| 6 .....................
....
....
.
.
.
.
.
... ..
....
... ..
.....
... ...
.....
......
....
-
x
φ̃
....
............
..........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
............. .............
.....
....
6 ..................
....
.
.
.
.
.
.
.
.
... ..
....
... ..
......
... ...
......
.. ..
... ..
..
x
che dà un minor contributo di ( ∂|φ|
)2 e quindi l’energia di φ̃ è minore, contraria∂x
mente all’ipotesi che l’energia fosse minima ⇒ φ non ha nodi.
⇒ Lo stato di energia piu’ bassa non è degenere: se ci fossero due diverse
autofunzioni φ1 e φ2 di minima energia, esisterebbe allora una combinazione
µ1 φ1 + µ2 φ2 con un nodo, quindi l’energia non potrebbe essere minima.
Se φ è l’autof. di energia minima, il contributo di (∇i φ)2 deve essere il minimo
possibile, quindi φ deve variare il minimo possibile; ⇒ una configurazione con
qualche atomo molto vicino ad un altro (v. figura) è molto improbabile perchè una
piccola variazione della sua posizione provoca una grande variazione di φ:
11
Esempio:
___________
|
o
o |
| o o
|
|
o o o |
| o
o o |
----------φ>0
___________
|
o o |
| o
o o |
|
o
o|
o |
o← |o
----------φ∼0
⇒ le conf. piu’ probabili nello stato fondamentale sono quelle in cui gli atomi
sono distribuiti approssimativamente in modo uniforme.
Stati eccitati: vediamo di dimostrare che le uniche eccitazioni dell’He di grande
lunghezza d’onda non possono che essere dei Rfononi (= onde di compressione).
Sia ψ la f. d’onda del I stato eccitato. Poichè φψd3N R = 0 e φ > 0 , ⇒ ψ
ha un nodo ed è positiva per metà delle configurazioni e negativa per l’altra metà.
Supponiamo che ψ sia un’eccitazione di grande lunghezza d’onda che non sia
un fonone. ⇒ ψ non è associata a un cambiamento di densità. Sia A la conf. in
cui ψ è massima (positiva) e B quella in cui ψ è minima (negativa). A e B sono
indistinguibili e interscambiabili, perchè ψ → −ψ è una simmetria che scambia
configurazioni di tipo A con quelle di tipo B. Indichiamo con o la posizione
degli atomi in A e con × la posizione nella configurazione B. Le posizioni ×
occuperanno gli interstizi lasciati dalla configurazione A
In condizioni stazionarie il sistema si evolve nel tempo oscillando tra le due
configurazioni A e B. Se ψ descrive un’eccitazione di grande lunghezza d’onda,
si deve realizzare la trasformazione da A a B con spostamenti di atomi su grande
scala. Esempio:
e
×
×
×e
e ←→ ×
e
×
e
e
@
e×
≡ l
×
@
e
R
@
e ←→ ×
e
×
×
e
e
×
e e
× ×e ×
× e×
12
Si sono indicate due transizioni di larga scala da una posizione o a una posizione ×. Le due transizioni sono scelte in modo che la densità media delle
conf A e B non si alteri, perciò se una molecola passa dallo stato o allo stato ×
(rappresentata dai due quadrati in linea continua), ci sarà in prossimità un’altra
molecola che passerà dallo stato × allo stato o ( quadrati tratteggiati) Ma queste
due transizioni si possono decomporre nella seguente maniera:
• a) i due atomi in posizione o a grande distanza sono scambiati tra di loro,
ma i due atomi sono indistinguibili, quindi questa trasf. non dà effetti osservabili.
• b) l’atomo in posizione o passa nella posizione × a lui vicina, quindi l’effetto
della transizione è in realtà un effetto su scala molto piu’ piccola (è in
sostanza la scala delle distanze interatomiche).
In conclusione, il fatto che l’ He4 soddisfa la statistica di Bose-Einstein impedisce il manifestarsi di eccitazioni su larga scala che non siano fononi (variazioni di densità).
• Funzione d’onda del fonone:
Sia ρ(x) la densità dell’elio. Sviluppando in serie di Fourier (cioè in modi normali
di vibrazione), si ha
X
qk e−ik·x .
ρ=
k
In prima approssimazione, l’Hamiltoniana del sistema è
X 1
1
H=
( q̇k2 + k 2 c2 qk2 )
2
2
k
( c = velocità del suono ) L’energia del livello n−esimo dell’oscillatore k si puo’
scriver al solito nella forma Ek = ~kc(n + 12 ). La f.d’onda dello stato fondamentale è
Y kc qk2
Φ=
e− 2~
k
( nota Φ > 0) Un fonone d’impulso ~k è il primo stato eccitato (n = 1) dell’oscillatore
armonico k. La sua f.d’onda ψk è esprimibile con il polinomio di Hermite di primo
grado H1 (x) = x
−
⇒ ψk = qk e
2
kc qk
2~
Y
k ′ 6=k
13
−
e
k′ c q 2 ′
k
2~
= qk Φ
Φ non è la vera f.d’onda φ dello stato fondamentale (non contiene i dettagli delle
interazioni tra atomi a corte distanze). La forma corretta della funzione d’onda
del fonone è ψ = qk φ, dove φ è la funzione d’onda vera dello stato fondamentale.
Approssimando gli atomi con dei punti materiali di massa m:
X
~ j)
ρ(~x) = m
δ (3) (~x − R
j
⇒ qk =
Z
eik·x ρ(~x)d3 x = m
X
eik·Rj ;
j
in conclusione,
ψk =
P
j
eik·Rj φ .
• Funzione d’onda del rotone
Si è visto che la funzione d’onda che ha per massimo la conf. con tutti gli atomi
nella posizione o e per minimo la conf. con tutti gli atomi in posizione × descrive
un’eccitazione a corta lunghezza d’onda ( dell’ordine della distanza interatomica).
Questa eccitazione è il rotone.
Supponiamo, per semplificare in maniera drastica, che gli atomi possano occupare solo le posizioni o o ×. Sia No il numero di atomi nella posiz. o e N× il
numero nella posizione ×. Una funzione d’onda che interpola tra la conf. A e B
è
ψ = (No − N× ) φ.
Pochè N = No + N× , è facile verificare che ψ è ”ortogonale” a φ:
(ψ, φ) =
X
conf ig.
ψφ =
N
X
No =0
(2No − N)φ2 = 0.
In maniera piu’ precisa, conviene introdurre per ogni atomo una funzione interpolante f (R) che vale +1 se l’atomo si trova nella posizione o e −1 se si trova in
posizione ×.
X
⇒ψ=
f (Ri )φ .
i
14
La forma precisa di f si puo’ ottenere da un calcolo variazionale ottenuto imponendo che ψ abbia energia minima. Si dimostra che f ha ancora la forma
f (x) = eik·x come nel caso del fonone, ma il valore dell’energia associata ǫ(k) è
diverso ed è esprimibile in funzione delle proprietà dello stato fondamentale (v.
Feynman, Statistical Mechanics).
1.5 Vortici nell’ HeII
Sia φ la f.d’onda dell’HeII nello stato fondamentale a riposo.
⇒ φ > 0. Se il fluido si muove macroscopicamente a una velocità ~v, ogni
imv·Ri
atomo i contribuisce con un fattore di fase e ~ e la f.d’onda diventa
m
Φ = ei ~
P
j
Rj ·v
φ = ei
P
P ·R
~
φ,
Rj
j
dove P~ = Nm~v è l’impulso totale e R = N
denota le coordinate del centro
di massa. Tale formula continua a valere anche nel caso in cui la velocità non è
costante ma varia lentamente. In questa ipotesi la variazione di fase δθ tra configurazioni che differiscono per ”piccoli” spostamenti delle molecole (piccoli rispetto
alla scala di variazione delle velocità) è data da
Xm
δθ =
vj · δRj
~
j
Questa è ad esempio la variazione della fase se si fotografa la configurazione degli
atomi ad istanti successivi.
Consideriamo una successione di atomi i = 1, . . . k disposti ad anello, e degli
spostamenti δRj che mandino circolarmente 1 → 2 → 3 . . . i → i + 1 . . . k → 1.
Poichè gli atomi sono indistinguibili, questa permutazione non puo’ dare effetti
osservabili, per cui δθ = 2nπ. Per un anello molto grande si puo’ sostituire alla
somma un integrale. E’ inportante ora osservare che ogni moto macroscopico
dell’HeII può essere realizzato a livello microscopico con una serie di permutazioni delle molecole, quindi non deve dare effetti osservabili nella fase della
funzione d’onda. Quindi per ogni cammino chiuso γ si può scrivere
I
nh
2nπ~
=
, (n = 0, ±1, ±2 . . . )
~v · d~l =
m
m
γ
Questo è il teorema della circuitazione di Feynman. Nell’approssimazione in cui
il campo ~v(R) è un campo vettoriale continuo, una piccola variazione del circuito
15
h
γ → γ + δγ non puo’ comportare una variazione della quantità n m
I
⇒
~v · d~l = 0 ;
δγ
ma δγ è il bordo di una superficie semplicemente connessa Σ. Si puo’ allora
applicare il lemma di Green:
I
Z
~
~
⇒
~v · dl =
rot ~v · dΣ
δγ
Σ
⇒ rot ~v = 0 (condizione di Landau)
Quindi la velocità dell’HeII in movimento è un campo irrotazionale. Ne consegue che in una regione semplicemente connessa si puo’ trovare una funzione
~ tale che
scalare Θ(R)
~v = ∇Θ .
Bisogna ammettere che l’argomentazione usata, pur essendo suggestiva, è piuttosto artificiosa, soprattutto per quanto riguarda la commistione di argomenti microscopici con altri macroscopici.
Vediamo ora di trovare un’altra argomentazione più solida, basata su un’interpretazione
~
microscopica (cioè in termini di funzione d’onda) di Θ(R).
La f. d’onda dell’He nello stato fondamentale si puo’ scrivere nella forma
fattorizzata
N
Y
~ 1, R
~2 . . . R
~N) =
~ i)
Φ(R
ψ(R
i=1
che soddisfa tutte le proprietà di simmetria della f. d’onda bosonica. Questa
proprietà di fattorizzazione è del tutto generale per un sistema bosonico nello stato
~
fondamentale. L’ informazione che ora ci occorre è che se il fluido è in moto ψ(R)
2
~
~
è complessa. Inoltre normalizziamo ψ in modo che | ψ(R) | = n(R) rappresenti
il numero di molecole per unità di volume.
~
~ = eiθ(R)
~ (φ∗ = φ),
è ora facile verificare che, posto ψ(R)
φ(R),
~v =
~
~
∇θ(R)
m
16
Infatti, poichè l’operatore impulso è dato da ~p̂ = −i~∇, la densità di impulso si
ottiene, come è noto, da
℘
~=~
ψ ∗ ∇ψ − ψ∇ψ ∗
= ~|ψ|2∇θ
2i
~ v = n(R)m~
~ v , si ote poichè nella formulazione macroscopica si ha ℘
~ = ρo (R)~
tiene l’equazione per ~v incorniciata, che è appunto la descrizione del campo delle
velocità ~v(R) in termini microscopici.
Se si continua ad utilizzare l’approssimazione del limite continuo è facile convincersi chei vortici si possono avere solo per regioni non semplicemente connesse. Infatti in questo caso la fase θ può essere una funzione polidroma Consideriamo un recipiente formato dall’intercapedine tra un cilindro esterno di raggio
b e uno interno di raggio a, entrambi di altezza l non necessariamente coassiali.
Consideriamo un sistema di coordinate cilindriche rispetto all’asse del cilindro più
interno. Si ha θ = θ(ρ, z, α), dove 0 ≤ z ≤ l, ρ > a e α è l’angolo polare attorno
all’asse. Quando compiamo un giro attorno a quest’asse α → α + 2π e la fase θ
non ritorna necessariamente al suo valore iniziale, ma poich‘e ψ è a un sol valore,
la forma funzionale di θ è
θ = f (ρ, z, α) + n α ,
dove f è un’arbitaria funzione periodica in α (f (ρ, z, α + 2π) = f (ρ, z, α)) e n è
un numero intero relativo. Se ora utilizziamo la formula incoriniciata per calcolare
la circuitazione di ~v ritroviamo il teorema della circuitazione di Feynman: dunque
la quantizzazione dei vortici è una conseguenza della richiesta che la funzione
d’onda sia a un sol valore.
Studiamo ora il caso in cui gli assi dei due cilindri siano coincidenti, cosicchè
il problema acquista una simmetria cilindrica. Per la simmetria e per il fatto che
non ci sono nè pozzi, nè sorgenti, le linee di flusso sono dei cerchi concentrici.
'$
#
b
ta
"!
&%
Poichè le superfici equipotenziali θ =costante sono necessariamente ortogonali
alle linee di flusso, formano un fascio di piani uscenti dall’asse dei cilindri. In
coordinate polari (ρ, α) si avrà
θ = f (α)
17
dove f è una funzione che ora cerchiamo di determinare. Si ha ∇θ =
Ponendo α = arctan xy , si ottiene
 ∂α  

−y/ρ2
∂x
 ,
∇α =   = 
∂α
2
x/ρ
∂y
df
∇α.
dα
quindi ∇α è, come c’era da aspettarsi, un campo tangenziale e |∇α| = 1/ρ.
Poichè per la simmetria del problema |~v | è solo funzione di ρ, il modulo dell’equazione
df
~ df
| dα | |∇α|, ci dice che dα
=costante, quindi
incorniciata, |~v| = m
θ = kα
Poichè la f. d’onda ψ è a un sol valore ⇒ k è un intero positivo negativo o nullo;
per k 6= 0 si ha un vortice e il campo delle velocità è dato da


−y/ρ2
~
 .
~v = k 
m
2
x/ρ
Calcolando la circuitazione del campo delle velocità lungo un cammino chiuso γ
concatenato con il vortice si ottiene nuovamente il teorema della circuitazione di
Feynman:
I
kh
~v · d~l =
, (k = 0, ±1, ±2, . . . )
m
γ
Calcoliamoci ora l’energia del vortice per unità di lunghezza:
Z
Z
Z b
1
ρo ~2
ρo h2
b
E
dρ
2
= dα
ρo v ρdρ =
2π
=
log(
),
l
2
2 m2
4π m2
a
a ρ
dove ρo è la densità dell’elio.
Se a è dell’ordine della distanza interatomica ( pochi Å) la descrizione continua non è piu’ giustificata, il campo di velocità ~v non è in realtà singolare al
centro del vortice ⇒ i vortici quantizzati si possono formare anche nelle regioni
connesse. L’asse del vortice non è necessariamente una retta, ma una linea che
puo’ finire ai bordi del sistema o puo’ richiudersi su se stessa: vortex ring o vortice ad anello. Questi modi collettivi sono delle pseudoparticelle perchè hanno,
come vedremo, energia ed impulso fissati.
I vortex ring sono soluzioni a energia finita delle equazioni del moto dell’elio
superfluido. A causa della quantizzazione della circuitazione di ~v (Teorema di
18
Feynman), queste soluzioni sono stabili: non possono perdere energia per dissipazione 2 . Ma come fa un flusso irrotazionale a generare un vortice? Come puo’
nascere la discontinuità necessaria?
Supponiamo che esista una superficie Σ che separi l’HeII in due parti: una
che scorre a velocità ~v sopra la superf. e l’altra che è a ~v = 0
He II
He II
→
→
→
→
Σ
~v
~v = 0
Se si toglie la parete di separazione Σ (in assenza di ogni perturbazione) abbiamo
P
~
v ·Rj
un sistema descritto da due f. d’onda: eim j ~ φ e φ. C’è una discontinuità tra
P ~v·Ri
le due pareti, tranne nei punti in cui eim i ~ = 1
La circuitazione attorno al cammino punteggiato
← discontinuità
è 6= 0 ⇒ possono formarsi dei vortici.
1.6 Flusso irrotazionale
Vediamo ora che forma ha il flusso irrotazionale da un orifizio di un microcapillare
che immette HeII alla velocità ~v in un recipiente con HeII in quiete. Utilizzando
l’analogia con il campo elettrico (che è irrotazionale) ci si convince facilmente che
per avere un moto irrotazionale le linee di flusso all’uscita dal capillare devono
disporsi a raggera (il campo delle velocità ha la stessa forma di un campo elettrico
generato da una sorgente puntiforme posta all’uscita del capillare, quindi ~v ∝ r~r3 ),
il che comporta forti accelerazioni all’uscita del capillare e il coinvolgimento di
tutto il fluido che inizialmente era in quiete (perche’ la velocità diminuisce in
modulo come il quadrato della distanza dall’orifizio, sempre in analogia a quanto
2
Le soluzioni stabili di energia finita delle equazioni del moto di un sistema dinamico qualsiasi
(classico o quantistico) si dicono solitoni. Ne vedremo altri esempi in altri sistemi.
19
succede per il campo elettrico). In conclusione il flusso irrotazionale è una configurazione di energia elevata.
He II
1.7 Velocità critica con i vortex rings
Dal punto di vista energetico è piu’ conveniente un flusso a getto cosicchè ci sono
le condizioni per la formazione dei vortici.
Sezione di un vortex ring
'$
'$
#
#
↑
↑ri
ri
"!
"!
&%
&%
← 2 r→
L’anello si muove in direzione perpendicolare al suo piano a una velocità
~
2mr
(Basta calcolare la velocità del centro del vortice di destra provocato dal campo di
velocità del vortice di sinistra). L’energia trasportata dal vortice si puo’ calcolare
approssimativamente applicando la formula del vortice a simmetria cilindrica per
un cilindro di lunghezza l = 2πr
v=
ρo h2
r
r log
2
2m
a
Quando l’He scorre con una velocità v lungo un capillare di raggio R puo’ produrre dei vortici di raggio r < R purchè
⇒ ǫ(r) =
v ≥ vcrit = min(ǫ/p) ( condizione di Landau) .
20
Per calcolare l’impulso p del vortice usiamo il fatto che la derivata della curva di
dispersione nel punto p coincide con la velocità della corrispondente quasiparticella 3 :
dǫ
~
=v=
dp
2mr
⇒
dp
dp dr
2mr
=
=
dǫ
dr dǫ
~
D’altra parte
ρo h2
r ρo h2
dǫ
=
log
+
dr
2 m2
a
2 m2
2mr dǫ
h
r
dp
=
= ρo 2π (r log + r) .
⇒
dr
~ dr
m
a
Integrando rispetto a r da a a R si ottiene 4
h r2
h r2
r2
a2
r r 2 a2
p = 2πρo
= 2πρo
.
log r + (1 − 2 log a) −
log +
−
m 2
4
4
m 2
a
4
4
Trascurando il termine
a2
4
che è microscopico si ha
~
ǫ
=
p
mr
⇒ vcrit
1
2
log ar
.
+ log ar
log Ra
~
.
=
√
mR log( e Ra )
La forma funzionale della dipendenza della velocità critica in un capillare è in
accordo con i dati sperimentali, anche se il valore è leggermente piu’ grande. C’è
un effetto correttivo dovuto ai vortici di dimensioni paragonabili al diametro del
capillare.
3
questa è una proprietà generale legata alla definizione di energia e impulso. È immediato
p2
o per o
verificarla per l’energia cinetica di una particella puntiforme non relativistica E = 2m
p
relativistica E = c (mc)2 R+ p2
R
4
Si fa uso dell’integrale x log xdx = 41 log(x2 )d(x2 ) = 14 [R2 log R2 − R2 ]
21
Pr es sione
solido
supersolido
He I
He II
gas
Temperatura
Figure 1: Forma schematica del diagramma delle fasi dell’He4.
1.8 Elio supersolido
Per oltre 40 anni si è molto discusso sulla possibile esistenza di solidi quantistici
con comportamento analogo ai superfluidi e detti perciò supersolidi. Solo molto
di recente si è riusciti ad ottenere la prova sperimentale dell’esistenza di questo
nuovo stato della materia per opera di due ricercatori coreani (E.Kim e M.H.W.
Chan, 2004). Essi costruirono un dispositivo formato da un piccolo anello di He4
solido di raggio di 1 cm in rotazione attorno al suo asse di simmetria (l’elio può
esistere allo stato cristallino solo a presioni dell’ordine di 25 bar o superiori e a
bassa temperatura, v. Fig.1 ). Essi osservarono al di sotto della temperatura di 175
mK (millikelvin) una improvvisa riduzione del momento di inerzia del dispositivo,
purchè la velocità di rotazione fosse minore di un valore critico vc = 300 µm/sec,
come se una parte del solido non venisse più trascinata dalla rotazione dell’anello.
Questa frazione di solido è appunto il supersolido, mentre la parte rotante costituisce il solido normale. La frazione supersolida risultò essere dell’ordine di 5 - 25
10−3 .
L’interpretazione teorica più accreditata di questo fenomeno è la seguente.
L’He4 solido a queste temperature è un solido quantistico in cui importanti effetti tunnel fanno fluttuare il numero degli atomi in ogni sito reticolare. Questo
porta all’esistenza di atomi di elio delocalizzati, che possono essere descritti solo
22
attraverso una funzione d’onda che è diversa da zero in un intervallo di alcuni
passi reticolari. Gli atomi delocalizzati costituiscono le quasiparticelle, cioè le
eccitazioni elementari del sistema, definite da stati di impulso ed energia fissati (
la curva di dispersione sembra essere ǫ = ǫo sin(k a), dove a è il passo reticolare).
L’insieme di queste quasiparticelle forma un gas bosonico che al di sotto di una
temperatura critica subisce la condensazione di Bose -Einstein. Si genera cosı̀ un
condensato, formato dalle quasiparticelle nello stato fondamentale, che costituisce la componente supersolida del cristallo. Sia la temperatura di condensazione
che la velocità critica, data da min(ǫ/k), riproducono con buona approssimazione
i dati sperimentali.
23
2 Transizioni di fase e singolarita’ di F
Molti sistemi fisici al variare della temperatura o di qualche altra variabile termodinamica (per esempio la pressione o il campo magnetico) subiscono una transizione di fase. Esempi tipici sono i cambiamenti di stato (liquefazione dei gas, solidificazione dei liquidi, transizione He I - He II) e le transizioni ordine-disordine
dei sistemi magnetici. Le transizioni di fase sono fenomeni cooperativi che richiedono un numero infinito di gradi di libertà. Dal punto di vista della meccanica
statistica esse corrispondono a singolarità dell’energia libera. Questo capitolo è
dedicato allo studio di queste singolarità. Useremo come sistema di riferimento il
modello di Ising (vedi gli appunti di MS).
2.1 Zeri della funzione di partizione
Le transizioni di fase si manifestano come singolarità dell’energia libera, ossia
singolarità del logaritmo della funzione di partizione Z. Questa è in generale
una funzione olomorfa dei parametri β e h. In particolare per ogni reticolo di
dimensione finita si può scrivere ( come vedremo esplicitamente tra poco) come un
polinomio ( a coefficienti positivi) nelle variabili exp(−2β) e exp(−2h). Dunque
le possibili singolarità di log Z sono gli zeri della funzione di partizione. Poichè
i coefficienti di questi polinomi sono positivi gli zeri cadono per valori complessi
di β e di h.
Partendo da queste considerazioni Lee e Yang, in due famosi lavori apparsi nel
1952, proposero un nuovo punto di vista nello studio delle transizioni di fase. Essi
congetturarono che gli zeri dela funzione di partizione si accumulino su linee del
piano complesso e la densita’ di questi zeri aumnenti all’aumentare della taglia del
sistema. Nel limite termodinamico queste linee si dovrebbero maninifestare come
tagli della funzione energia libera nel piano complesso di exp −2β e exp −2h. Le
singolarità sono dunque i punti di diramazione associati a questi tagli. Quando il
sistema è prossimo a una transizione di fase questi punti di diramazione si avvicinano all’asse reale in coppia dal di sotto e dal di sopra e lo toccano proprio al punto
di transizione. Dunque dal punto di vista delle proprietà di analiticità le singolarità associate alle transizioni di fase sarebbero dunque dovute a un fenomeno di
pinching che rende impossibile la continuazione analitica tra fasi diverse. Queste
congetture hanno avuto numerosissime conferme da analisi numeriche e analitiche
e sono ormai universalmente accettate. Nel caso particolare degli zeri nel piano
complesso di h Lee e Yang provarono un teorema di grande generalità sugli zeri
della funzione di partizione del modello di Ising che rafforza notevolmente queste
24
congetture:
2.2 Teorema di Lee e Yang
Gli zeri della funzione di partizione di un modello di Ising ad accoppiamento
ferromagnetico definito su un grafo qualsiasi cadono tutti sull’asse immaginario
di h.
Per dimostrare questo teorema, scriviamo esplicitamente la funzione di partizione Z su un grafo arbitrario formato da N nodi e L links e supponiamo per il
momento che il campo magnetico possa variare da punto a punto
X P
P
P
Z=
e hiji βSi Sj + i hi Si = eLβ+ i hi P (τ, ρi) , (τ = e−2β , ρi = e−2hi ),
{Sk =±1}
(2.1)
dove
P (τ, ρi) =
X
P
e
hiji
β(Si Sj −1)+
P
i
hi (Si −1)
{Sk =±1}
è un polinomio in τ e ρi . In particolare è al massimo di grado L in τ e di
primo grado in ogni variabile ρi e complessivamente di grado N nelle variabili
ρi . P (τ, ρi ) si può anche considerare come la grand partition function di un gas
reticolare (o lattice gas) in cui il generico nodo i è occupato (Si = −1) o vuoto
(Si = +1; nel primo caso ρi (che funge da fugacità) compare alla prima potenza,
mentre nel secondo caso la potenza è zero. Per esempio, per un grafo composto da
un singolo nodo associato alla variabile ρ il polinomio corrispondente è P = 1+ρ.
Similmente per un grafo g formato da due nodi uniti da un link si ha
t
ρ1
t
ρ2
P12 (g) = 1 + τ (ρ1 + ρ2 ) + ρ1 ρ2 .
Se G è un grafo arbitrario contenente il nodo a si avrà Pa (G) = A+ + A− ρa ,
dove A+ è il contributo di tutte quelle configurazioni in cui Sa = +1 e A− è il
contributo delle ltre con Sa = −1. Se G e G′ sono due grafi disgiunti conteneti
rispettivamente il nodo a e il nodo b è facile convincersi che il polinomio relativo
al grafo G ∪ G′ (non connesso) formato da entrambi è il prodotto dei relativi
polinomi:
Pa,b (G∪G′ ) = (A+ +A− ρa )(B+ +B− ρb ) = A++ +A−+ ρa +A+− ρb +A−− ρa ρb ,
25
dove nella seconda uguaglianza si è scritta la forma generale del polinomio relativo alle due variabili ρa e ρb valida anche nel caso di un grafo connesso. Supponiamo ora di fondere i due nodi a e b in un unico nodo ab associato alla variabile ρab .
Le configurazioni in cui i due nodi a e b avevano segni diversi sono ovviamente
eliminate dal conteggio mentre tutte le altre contribuiscono con lo stesso numero.
Perciò dopo la fusione il polinomio precedente diventa
Pa,b → Pab = A++ + A−− ρab .
È chiaro che ogni grafo G può essere ottenuto da un numero sufficiente di fusioni del grafo elementare g formato da due nodi e un link disegnato qualche riga
precedente, quindi per dimostrare il teorema basta
1. provare che è vero per g;
2. applicare il principio dell’induzione completa, facendo vedere che questa
proprietà sopravvive alla fusione.
Ponendo P12 (g) = 0 si ha
ρ2 = −
1 + τ ρ1
,
τ + ρ1
da cui si può facilmente dimostrare che se |ρ1 | < 1 segue |ρ2 | > 1 5 . Perciò, se
ρ1 = ρ2 = e−2h come vuole l’ipotesi del teorema di Lee e Yang, le due soluzioni
di P12 (g) = 0 hanno h immaginario, come vuole la tesi. Ne consegue che se entrambi i ρ sono all’interno del cerchio unitario P12 (g) non si annulla. Supponiamo
ora che questa proprietà sia vera per un generico grafo G con N nodi, cioè che
P (G) 6= 0 per |ρi | < 1 i = 1, . . . , N. Vogliamo dimostrare che questa proprietà
sopravvive all’ operazione di fusione di due nodi qualsiasi. Siano a e b i nodi che
vogliamo fondere. Prima della fusione la dipendenza da ρa e ρb di P (G) è al solito
Pa,b (G) = A++ + A−+ ρa + A+− ρb + A−− ρa ρb .
Per le ipotesi fatte , se poniamo 6 ρa = ρb = x, le due soluzioni dell’equazione
A−− x2 + x(A−+ + A+− ) + A++ = 0
5
Infatti, ricordando che τ < 1, se |ρ1 | < 1, poichè il prodotto di due numeri di modulo inferiore
a uno ha modulo ancora più piccolo, si ha |ρ1 |2 (1−τ 2 ) < (1−τ 2 ), da cui 1+τ 2 |ρ1 |2 > |ρ1 |2 +τ 2 .
2
|ρ1 |2 +2τ ℜeρ1
D’altra parte, prendendo il modulo quadro di ρ2 si ha |ρ2 |2 = 1+τ
. Inserendo la
τ 2 +|ρ|21 +2τ ℜeρ1
disuguaglianza trovata nel numeratore di questa frazione si ha appunto |ρ2 | > 1, cvd.
6
Attenzione, questo non significa aver fuso i due nodi!.
26
T >T
1
c
T>T>T
1
2
c
T=T c
Figure 2: arco di condensazione degli zeri di Lee e Yang nel piano complesso di
ρ = e−2h per due diverse temperature della fase calda e per la temperatura critica.
hanno modulo > 1, perciò |A++ /A−− | > 1. Questa disuguaglianza implica
che dopo la fusione il corrispondente polinomio A++ + A−− ρab si annulla solo
per |ρab | > 1. In conclusione, se non c’erano zeri all’interno del cerchio unitario prima della fusione non ci sono neache dopo la fusione. Utilizziamo ora
l’ovvia simmetria Z(β, h) = Z(β, −h) della funzione di partizione del modello di Ising per riscrivere l’eq.(2.1) nella forma Z(β, h) = eLβ e−hN P (τ, ρ) =
eLβ eN h P (τ, 1/ρ) , ossia
P (τ, 1/ρ) = ρN P (τ, ρ) ,
che ci permette di concludere che non ci sono radici neppure all’esterno del disco
unitario e che per ogni radice sulla circonferenza della forma ρ = eiho ce n’è
un’altra con ho → −ho . Questo completa la dimostrazione.
E’ facile verificare il teorema in due casi limite. A T = 0 tutti i nodi devono avere lo stesso valore e dunque ci sono solo due stati possibili e si ha
PN (τ = 0) = 1 + ρN . Gli zeri sono le radici ennesime di -1 e sono quindi distribuiti omogeneamente sul cerchio unitario; nel limite termodinamico N → ∞
ricoprono densamente tutta la circonferenza.
Nell’altro limite T = ∞, ogni nodo è indipendente da ogni altro ed è come
aver messo a zero il numero dei link. Il polinomio associato è dunque PN (τ =
1) = (1 + ρ)N che ha un unico zero di molteplicità N in ρ = −1.
Al discendere della temperatura, sempre nel limite termodinamico, l’arco su
cui si condensano gli zeri diventa sempre più ampio ed è simmetrico rispetto
all’asse reale, come riflesso della simmetria h → −h. Se il sistema ha un punto
critico per T = Tc l’arco di condensazione si chiude e coincide con l’intera circonferenza proprio a Tc (v. Fig.2). Avviene quindi il fenomeno di pinching delle
singolaritá, che divide il piano complesso di ρ, e quindi anche di h, in due regioni
disgiunte, che segnalano l’esitenza di due fasi distinte.
27
2.3 Il punto di diramazione di Lee e Yang
Nel limite termodinamico le linee di condensazione degli zeri non si manifestano
come zeri ma come tagli della funzione di partizione. Una delle ragioni è che la
funzione di partizione è in generale una funzione analitica con al più delle singolarità isolate, quindi i suoi zeri non possono formare un insieme denso.Le singolarità che sopravvivono nel limite termodinamico sono i punti terminali delle
linee di condensazione degli zeri, che si manifestano come punti di diramazione
(o branch points). D’altra parte è noto che il luogo dei punti in cui l’autovalore
più grande della transfer matrix coincide con l’autovalore successivo corrisponde
a singolarità dell’energia libera (è immediato verificarlo scrivendo la funzione di
partizione in funzione di questi autovalori e facendo poi il limite termodinamico). Quindi nel caso si conosca la forma analitica di questi autovalori si possono
studiare le singolarità nel piano complesso dei parametri in gioco.
Applichiamo queste considerazioni al modello di Ising unidimensionale in
campo magnetico, la cui transfer matrix è stata descritta nel corso di Meccanica
Statistica, i cui autovalori λi , i = 1, 2 sono
q
β
λi = e cosh h ± e2β cosh2 h − 2 sinh 2β .
I due autovalori coincidono quando si annulla il discriminante sotto radice, che
fornisce l’equazione
sinh2 h = −e−4β ,
da cui si evince che nel piano complesso di h le singolarità giaciono sul’asse
immaginario, come vuole la teoria di Lee e Yang. Per h in modulo molto piccolo
si ha
hc ≃ ±ie−2β ,
quindi il pinching tra le due singolarità avviene solo per T = 0 come c’era da
aspettarsi.
Possiamo fare un’altra verifica della teoria di Lee e Yang utilizzando l’approssimazione di campo medio (MFA), che in prossimità della transizione di fase porta
all’equazione fondamentale della MFA che riscriviamo per comodità nella forma
h = t m + u m3 ,
dove t è la temperatura ridotta e u una costante positiva. Essendo un’equazione di
terzo grado essa ha sempre tre soluzioni reali o complesse. C’è da aspettarsi che
le singolarità del’energia libera vadano ricercate nel luogo dei punti dove due di
28
queste soluzioni coincidono, luogo che si ottiene studiando le soluzioni comuni
tra tale equazione e la sua derivata
t + 3u m2 = 0 .
4 3
Eliminando m tra queste due equazioni si ottiene h2 = − 27u
t che nella fase
calda ( t > 0 ) ha solo le due soluzioni simmetriche e puramente immaginarie
r
4 3
hc = ±i
t2 ,
27u
in accordo con la teoria di Lee e Yang. Quest’equazione definisce un nuovo esponente critico che descrive il il modo in cui questa coppia di singolarità si avvicina
all’asse reale all’approssimarsi del punto critico t → 0.
29
3 Il legame tra la meccanica statistica e le teorie quantistiche di campo
Svilupperemo in questo capitolo un formalismo che consente di riformulare ogni
problema di meccanica quantistica o di teoria quantistica dei campi in un problema
di meccanica statistica classica (e viceversa).
3.1 Modello di Landau-Ginzburg
In prossimita’ di Tc l’approssimazione di campo medio non dipende dai dettagli
microscopici del modello di Ising. Tutta (o quasi) l’informazione e’ contenuta
nell’eq. di campo medio
m t + um3 = B
(3.1)
dove t è la temperatura ridotta t = (T − Tc )/Tc Gli esponenti critici dipendono
solo dal fatto che il coefficiente di m è proporzionale a T − Tc e che il coeff. di
m3 e’ positivo. Cerchiamo di costruire un’ Hamiltoniana effettiva che riproduca
l’eq. di campo medio come condizione di equilibrio termico, cioè come minimo del’energia libera del sistema. Questa Hamiltoniana sarà la base di partenza
per una descrizione piu’ accurata del sistema attorno al punto critico. Poiche’ la
struttura microscopica del sistema non deve giocare un ruolo importante conviene
sostituire la variabile di Ising Si = ±1 tipica di una descrizione microscopica con
una variabile continua φi(−∞ < φi < ∞) che descrive la magnetizzazione di
una regione, non necessariamente infinitesima, centrata in i. In questo modo si
descrive meglio il fatto che a Tc non c’e’ nessuna scala naturale in gioco. φ è
la magnetizzazione media di un intorno di i le cui dimensioni effettive non sono
a priori fissate. Lavoriamo momentaneamento su un solo sito. Poniamo per ora
H(φ) = 12 r0 φ2 + 4!1 u0 φ4 con u0 > 0 r0 =∝ t
Z
Z
1
1
2
4
−H(φ)+Bφ
Z = dφe
= dφe− 2 r0 φ − 4! u0 φ +Bφ
β e µ sono stati riassorbiti nella variabile di integrazione φ. Approssimazione
di Landau: la somma sulle configurazioni è rimpiazzata dalla (o dalle) configurazione(i) che minimizza(no) l’energia libera, che in questa approssimazione,
coincide con l’Hamiltoniana:
Z = e−H(φ0 )+Bφ0 , φ0 : H ′ (φ0 ) = B
30
H ′(φ0 ) = B ⇒ B = r= φ0 +
µ0 3
φ
3! 0
m = hφi = φ0
⇒ il minimo di H riproduce l’approssimazione di campo medio in prossimita’ di
Tc , quindi si ricavano gli stessi esponenti critici.
Nell’approssimazione di un solo sito i minimi secondari di H non sono trascurabili rispetto al minimo assoluto ⇒ non c’è in realtà rottura spontanea della simmetria. Occorre generalizzare il modello a N siti (nodi di un reticolo (iper)cubico
d-dimensionale). Il modello di Ising suggerisce un accoppiamento ferromagnetico
tra i primi vicini: −φi φi+µ (µ= versore in una delle d direzioni) Con una opportuna ridefinizione
di r0 possiamo introdurre questo accoppiamento con un termine
Pd
1
del tipo 2 µ=1 (∇µ φi )2 dove ∇µ φi ≡ φi+µ − φi . Di conseguenza la funzione di
partizione del modello di Landau- Ginzburg si puo’ scrivere nella forma
Z Y
P
Z=
dφi e−HGL (φ)+ i Bi φi
i
HGL
"
X 1X
1
1
(∇µ φ)2 + r0 (T )φ2i + u0 φ4i
= ad
2 µ
2
4!
i
#
a = passoPreticolare
R (è introdotto per rendere piu’ comodo il pasaggio al limite
continuo: i → dd x). Approssimazione di Landau:
Z ∼ e−HGL [φi0 ]+
P
i
Bi φi0
,
GL [φi ]
.
dove φ0 è definito dalla condizione: φi0 : Bi = ∂H∂φ
i
Si puo’ ora capire come il limite N → ∞ puo’generare la rottura spontanea
della simmetria: poniamo Bi = B ⇒. Il sistema e’ ora invariante per traslazioni
⇒ φi0 = φ0 . Definiamo la magnetizzazione spontanea m come il doppio limite
lim
lim hφi ≃ φ0 ,
B→0+ N →∞
dove ≃ sta ad indicare l’approssimazione di Landau. Se T < Tc e B > 0, la
dipendenza di H da φ è grosso modo della forma seguente
31
6
H
.
...
.........
...
.. .. ...........
.
.
.......
.....
.
..
.......
..
....
........... ........
..
...
.
.............
.
...
...
...
...
φ′0
...
...
.
.
... ...
...........
φ0
-
φ
dove φ′0 è un minimo relativo e φ0 il minimo assoluto. Si ha H(φ′0 )−H(φ0 ) = N c,
dove c è la differenza di energia per il singolo sito, quindi
′
′
⇒ Z ≃ e−HGL (φ0 )+Bφ0 + e−HGL (φ0 )+Bφ0 →N →∞ e−HGL (φ0 )+Bφ0
e dunque
′
′
φ0 e−HGL +Bφ0 + φ′0 e−HGL (φ0 )+Bφ0
= φ0 + O(e−N c ) ,
hφi ≃
Z
quindi nel limite termodinamico si ha rottura spontanea della simmetria.
3.1.1 Derivata funzionale e calcolo variazionale su reticolo
Nel limite continuo HGL [φ] è un funzionale di φ(x). La derivata funzionale
δI[φ]
δHLG [φ]
, o, piu’ in generale, δφ(x)
(dove I e’ un funzionale qualsiasi) si puo’ calδφ(x)
colare ricorrendo alla definizione su reticolo, in base alla regola seguente
δI
1 ∂I
= lim d
,
δφ(xi ) a→0 a ∂φi
dove φi = è la variabile dinamica associata al sito i di coordinata xi .
Esempi:
Z
X
δI
= p f (x)φp−1(x)
fk φpk ⇒
I[φ] = dy f (y)φp (y) = lim a
a→0
δφ(x)
k
Z
⇓
δI
= V ′ (φ(x)) .
δφ(x)
2
Z
X 1
∂φ
= lim a
(φk+1 − φk )2
J = dy
2
a→0
∂y
a
k
I[φ] =
⇒
dy V (φ(y)) ⇒
∂J
2
2
= 2 [(φi − φi+1 ) + (φi − φi−1 )] = − 2 (∇φi − ∇φi−1 )
a∂φi
a
a
32
⇓
δJ
∂2φ
= −2 2 .
δφ(x)
∂x
δφ(y)
1
= lim δij = δ(y − x) ,
δφ(x) a→0 a
dove l’ultima δ è la delta di Dirac, infatti
lim
a→0
X
k
1
a f (xk ) δki = f (xi ) =
a
Z
f (y)δ(y − x)f (x)d y .
3.1.2 Energia libera di Helmholz e di Gibbs
Prima di procedere oltre, conviene sviluppare una conseguenza importante del
teorema fluttuazione risposta. L’energia libera di Helmholtz F e’ definita da
e−βF = Z. F e’ una funzione di β e B (o β e V nei gas), inoltre:
∂F
∂F
, M=−
S=−
∂T B
∂B
dove M è la magnetizzazione totale, M = M V . Il differenziale totale di F si
può allora scrivere nella forma
dF =
∂F
∂F
dT +
dB = −SdT − MdB .
∂T
∂B
Definiamo la seguente trasformazione di Legendre: Γ = F + MB, detta energia
libera di Gibbs
magnetico variabile da punto a punto si ha
R campo
P (nel caso di un
d
Γ = F + i Bi hφi i = F + d x B(x)hφ(x)i)
⇒
∂Γ
dΓ = −SdT + BdM ⇒ Γ = Γ(β, M) ,
inoltre B = ∂M T . Poniamo β = µ = 1 per semplificare la notazione. Abbiamo
già visto che il correlatore Gij si puo’ scrivere nella forma:
Gij =
δ δ
δ2
log Z = −
F.
δBi δBj
δBi δBj
33
Scegliendo un campo B(x) della
P forma B(xi ) = λi B , d ove i λi sono dei numeri
∂ log Z
reali arbitrari, si ha ∂B = λi hφi i e quindi
2
∂ log Z
=
∂B 2
X
ij
*"
X
i
λi φ i −
X
j
λj hφj i
#2 +
=
X
λi λj Gij > 0 .
ij
P
Una matrice Aij che gode della proprieta’ ( ij λi λj Aij > 0) si dice positiva. Le
matrice positive non hanno autovalori nulli (anzi, sono tutti positivi) ed è percio’
invertibile; se infatti avesse un autovalore nullo e detto x = (x1 , x2 , . . . ) il suo
autovettore ⇒ xi xj Aij = 0 contrariamente all’ipotesi.
2Γ
δM
δ2 log Z
è
l’inversa
di
G
=
= δBij infatti
Teorema: la matrice Aij = δMδi δM
ij
δBi δBj
j
Aij Gjk =
δBi δMj
= δik ; cvd.
δMj δBk
(3.2)
Esercizio: calcoliamoci l’energia libera di Gibbs nell’approssimazione di Landau
Z = e−HLG [φ0 ]+
R
dd x B(x)φ0 (x)
[φ0 ]
Dove φ0 è la configurazione che minimizza HLG , cioè φ0 (x) : δHδφLG
= B(x).
0 (x)
Si ha
Z
F = HLG [φ0 ] − dd x B(x)φ0 (x) ⇒ Γ[φ0 ] = HLG [φ0 ]
Γ[φ] =
Z
1
u0
1
(∇φ)2 + r0 φ2 + φ4
d x
2
2
4!
d
Soluzione uniforme: φ0 (x) = M ⇒ Γ(M) = V ( 21 r0 M 2 + u4!0 M 4 ). Poiche’
∂T
B = V1 ∂M
⇒ B = r0 M + u60 M 3 che e’ proprio l’equazione del campo medio,
per cui si derivano gli stessi esponenti critici.
3.1.3 Calcolo dei correlatori nel modello di LG
Nell’approssimazione di Landau si ha
Z
1
r0 2 u 0 4
D
2
Γ[φ] = d x (∇φ) + φ + φ
2
2
4!
⇒ B(x) ≡
u0
δΓ
= −∆φ + r0 φ + φ3 .
δφ(x)
6
34
= G(x, y). Nel caso di campo magnetico costante
D’altra parte si ha δhφ(x)i
δB(y)
l’invarianza traslazionale ci dice che G(x, y) = G(x − y) ⇒ differenziamo
δΓ
rispetto a B(y) si ha
l’equazione B(x) = δφ(x)
δ (d) (x − y) = −∆GLG (x − y) + ξ −2 GLG (x − y) ,
con
ξ −2 = r0 +
u0 2
m,
2
(3.3)
(3.4)
dove si è posto m = hφi .
ξ è la lunghezza di correlazione. Usando le solite condizioni di minimo dell’energia
libera a campo magnetico nullo ro φ + u60 φ3 = 0 si ha, sia nella fase fredda che in
quella calda,
1
ξ −2 ∝ t ⇒ ν =
(3.5)
2
La sua trasformata di Fourier dà
1
1
,
(3.6)
G̃LG (k) = p
u
2
(2π)d k + r0 + 20 M 2
da cui
Z
1
dd k e−ik·x
GLG (x) ≡
,
(2π)d
k 2 + r0 + u20 M 2
esattamente come nel caso gaussiano (cfrt. eq.(4.4)). Si e’ gia’ visto (vedi gli
appunti di MS) che G(x) in prossimità di Tc ha la forma funzionale seguente :
Z
g(r/ξ)
g(r/ξ)
1
h(k ξ)
dd x eik·x d+η−2 = 2−η
G(r) = d+η−2 , ⇒ G̃(k) = p
r
r
k
(2π)d
dove h(k ξ) è una funzione adimensionale ottenuta integrando sulla variabile adimensionale r/ξ.
1
T = Tc ⇒ G̃(k) ∝ 2−η .
k
ma a T = Tc si ha r0 = 0 , M = 0, quindi la (3.6) diventa GLG (k) = k12
⇒ η=0.
In teoria di campo l’indice critico η e’ la dimensione anomala del campo φ.
L’origine di questo termine si può capire dalle seguenti considerazioni dimensionali. Poichè Z = e−H[φ] , ⇒ H e’ adimensionale
Z
1
H = dd x (∇φ)2 + . . .
2
35
[H] = [dd x] + 2[∇] + 2[φ]
[H] = 0 ⇒ [φ] =
2−d
2
D’altra parte [G(x, y)] = 2[φ], perciò
[G̃] = 2[φ] + d = 2 .
Se η 6= 0 queste considerazioni dimensionali evidentemente non valgono più: per
effetto dell’interazione il campo φ acquista una dimensione anomala che si puo’
calcolare utilizzando il gruppo di rinormalizzazione.
Esercizio: calcoliamoci la forma esatta del correlatore in d = 3 nella teoria di
Landau-Ginzburg
Z
eik·x
d3 k
.
G(x) =
(2π)3 k 2 + ξ −2
Poniamo k · x = kr cos θ d3 k = −k 2 dk dφ d cos θ
Z
Z ∞
Z 1
1
1 1 ∞ k dk
k 2 dk
−ikr cos θ
G(x) =
2 sin kr
e
d cos θ =
(2π)2 0 k 2 + ξ −2 −1
(2π)2 r 0 k 2 + ξ 2
1 1
= 2 ℑm
4π r
Z
∞
−∞
kdkeikr
k 2 + ξ −2
Per il lemma di Jordan si ha, “chiudendo di sopra”,
I
Z ∞
kdkeikr
keikr
kdkeikr
=
= 2πi Res
2
−2
2
−2
k 2 + ξ −2 k=iξ−1
γ k +ξ
−∞ k + ξ
= 2πi lim−1(k − iξ −1 )
k→iξ
⇒ ℑm
Z
∞
−∞
keikr
= iπe−r/ξ
(k − iξ −1 )(k + iξ −1 )
1 −r/ξ
kdkeikr
−r/ξ
=
πe
⇒
G(~
x
)
=
G(r)
=
e
k 2 + ξ −2
4πr
3.1.4 Criterio di consistenza di Ginzburg
Il correlatore è una grandezza fisica strettamente legata alle fluttuazioni. Nel modello di Landau-Ginzburg si ha, comme si è già visto
G(x, y) = hδφ(x) δφ(y)i
36
con δφ(x) = φ(x) − m(x) ≡ φ(x) − hφ(x)i. Nell’approssimazione di Landau
m(x) = φo (x), dove φo (x) è la configurazione che minimizza l’Hamiltoniana.
Poiché in questa approssimazione, come nella Mean Field Approximation (MFA),
si trascurano in una certa misura le fluttuazioni, affinché quest’approccio sia consistente occorre che le fluttuazioni siano piccole rispetto alle altre quantità valutate
nella stessa approssimazione. La fluttuazione del campo in un punto x influenza
la regione circostante di volume V ∝ ξ d , per cui un parametro che misura la
consistenza interna della MFA è
R d R d
d x V d yhδφ(x) δφ(y)i
δM2
= V
, V ≃ ξd .
(3.7)
2
M
φ2o V 2
L’approssimazione è consistente solo se in prossimità del punto critico (ξ →
2
∞) il parametro δM
non diverge. Questa richiesta costituisce il Criterio di Ginzburg.
M2
Calcoliamoci questo parametro. Si ha, come abbiamo visto più volte, φ2o ∝
t ∝ ξ −2 (si veda ad es. l’eq. (3.4)). D’altra parte
Z
2
δM = V
dd xG(x) = G̃(k = 0) = V ξ 2 .
V
2
Applicando il criterio di Ginzburg limξ→∞ δM
< ∞ si ottiene un importante
M2
vincolo sulle dimensioni d dello spazio in cui gli esponenti critici derivati nella
MFA sono affidabili:
ξ 4−d < c
dove c è un’opportuna costante. Si vede chiaramente che , se d < 4 (che è ovviamente il caso sperimentalmente importante nei sistemi considerati dalla meccanica statistica), quando il sistema si avvicina al punto critico la lunghezza di
correlazione cresce sempre fino a un valore in cui il criterio di Ginzburg è violato,
quindi per d < 4 la descrizione del comportamento critico data dall’approssimazione
del campo medio non è corretta. Ciò non toglie che per molti sistemi (compresi i
superconduttori di cui ci occuperemo in seguito) la costante c è molto grande, per
cui questa descrizione è accurata anche in prossimità di Tc .
Lo strumento adatto per studiare il comportamento critico dei sistemi a d < 4
è il gruppo di rinormalizzazione, che ora applicheremo al modello di LandauGinzburg.
37
Il minimo numero di dimensioni d necessarie affinchè l’ approssimazione di
campo medio descriva correttamente il comportamento critico di un sistema è noto
come dimensione critica superiore. Dunque il modello di Ising ( e quindi anche
il modello di L-G con accoppiamento quartico) ha dimensione critica superiore
d = 4.
Esercizio: verificare che la dimensione critica superiore in una teoria di LG
contenente un’interazione cubica del tipo vφ3 è d = 6.
3.2 Integrali di cammino ( Feynman path integrals)
Siano P e Q gli operatori impulso e posizione di una particella di massa m
soggetta a un potenziale V = V (Q) Hamiltoniana:
H=
P2
+ V (Q) , [Q, P ] = i~
2m
H
H
Nella rappresentazione di Heisenberg si ha Q(t) = e−it ~ Qeit ~ . Sia |q, ti = un
−iHt
autostato dell’operatore posizione all’istante t; ⇒ Q|qi = q|qi , |q, ti = e ~ |qi.
Si usa la normalizzazione standard
hq ′ , t|q, ti = δ(q ′ − q). Analogamente |pi =
qp R
autostato di P , hp|qi = √12π ei ~ , dp|pi hp| = 1.
Problema: calcolare l’ampiezza di probabilita’ hq ′ , t′ |q, ti
iH(t′ −t)
~
hq ′ , t′ |q, ti = hq ′ |e
|qi
Poniamo per il momento ~ = 1, supponiamo ∆t = t′ − t ≪ 1 e trascuriamo i
P2
P2
termini di ordine (∆t)2 . Si ha allora eiH∆t ≡ ei( 2m +V (Q))∆t = ei 2m ∆t eiV (Q)∆t (1 +
O[(∆t)2 ]) 7
Z ∞
p2
′ ′
⇒ hq , t |q, ti =
dphq ′|ei 2m ∆t |pihp|eiV (q)∆t |qi + O(∆t2 )
Z
∞
−∞
Posto ǫ =
−∞
′
Z
7
i 2m ∆t
dphq |e
−i∆t
,
2m
∞
−∞
p2
iV (q)∆t
|pihp|e
|qi =
Z
∞
−∞
dp −i(q′ −q)p+ ip2 ∆t iV (q)∆t
2m
e
e
2π
si ha
dp −i(q′ −q)p−ǫp2
e
=
2π
Z
∞
−∞
dp −
e
2π
1
Si e usata la proprieta’ eA eB = eA+B+ 2 [A,B]+...
38
h √
i2
′
2
′
p ǫ− i(q2√−q)
− (q −q)
4ǫ
ǫ
=
=
e
−i(q ′ −q)2 m
2∆t
√
1
2π
ǫ
Z
∞
dx e
=e
−i(q ′ −q)2 m
2∆t
2π
−∞
quindi
′
−x2
′
hq , t |q, ti =
r
√
π
q
−i∆t
2m
−i(q ′ −q)2 m
2∆t
e
= q
−i2π∆t
m
im −i(∆q)2 m +iV (q)∆t
+ O(∆t2 ) .
e 2∆t
2π∆t
Se (∆t)2 non e’ trascurabile, dividiamo l’intervallo t′ − t in un numero N sufficientemente grande di intervalli uguali t = to < t1 < t2 · · · < tN = t′ e poniamo
∆t = ti+1 − ti . Si ha l’ovvia identità
Z
Z
′ ′
′ ′
hq , t |q, ti = hq , t | dqN −1 |qN −1 , tN −1 ihtN −1 , qN −1 | . . . dq1 |q1 , t1 iht1 , q1 |q, ti =
=
Z
−1
∞ N
Y
dqi
−∞ i=1
r
im −i PNj=1 [(∆qj )2 m −V (qj )∆t]
2∆t
+ O ∆t2 ,
e
2π∆t
dove si e’ potuto scrivere un unico esponenziale perche’ gli esponenti non sono
piu’ operatori ma numeri. Nel limite ∆t → 0 l’esponente diventa l’integrale
seguente
N X
(∆qj )2 m
j=1
2∆t
Z
− V (qj )∆t →
t
t′
dt
mq̇ 2
− V (q)
2
= S[q, q̇] ,
dove il funzionale S[q, q̇] denota l’azione del punto materiale in esame.
In definitiva, reintroducendo la costante di Planck, si ha
r
Z Y
Z
N
−iS
im −i S[q̇,q]
′ ′
hq , t |q, ti =
dqj
e~
≡ Dq e ~ ,
2π∆t
1
(3.8)
che esprime l’ampiezza di probabilita’ mediante un integrale di cammino: l’ampiezza
di probabilita’hq ′, t′ |q, ti e’ la somma dei contributi dei cammini che partono all’
istante t da q e raggiungono all’istante t′ la posizione q ′ ; ogni cammino q(t) con−iS[q̇,q]
tribuisce con un ”peso” e ~ .
Il massimo contributo e’ dato dalla traiettoria classica, cioe’ quella che minimizza l’azione: δS = 0. Per i cammini molto diversi della traiettoria classica,
una piccola variazione del cammino provoca una grande variazione di S e quindi
−iS
una rapida oscillazione di e ~ ; viceversa i cammini vicini alla traiettoria classica,
39
cioè tali che |S − Scl | ≤ ~, danno il contributo dominante. In molti casi si puo’
tenere conto di queste fluttuazioni quantistiche sviluppando in serie di potenze di
~: il termine di ordine 0 e’ dato dalla traiettoria classica.
Il modello ora descritto si puo’ ovviamente generalizzare a traiettorie in uno
spazio di dimensioni qualsiasi qi (t), i = 1 . . . D. Vedremo tra poco un altro tipo
di generalizzazione non piu’ di un modello di meccanica quantistica, ma uno di
teoria dei campi.
Q
Il limite N → ∞ nell’integrale di cammino j dqj e−iS/~ non e’ matematicamente ben definito, perchè è difficile caratterizzare topologicamente il fattore
S
oscillante e−i ~ . Si ricorre allora a una continuazione analitica a tempi immaginari
t → iτ.
Con questa continuazione analitica il fattore di fase diventa reale, il che consente di porre il path integral in una forma matematicamente rigorosa, che Wiener
aveva sviluppato nei primi anni ′ 40 per descrivere il moto browniano. Qui ci
contentiamo di vedere le modificazioni subite dall’azione S per effetto della sostituzione
2
dq
dq ˙2
dq
t → iτ ⇒ dt → idτ , q̇ ≡
= −i , q = −
dt
dτ
dτ
"
#
Z τ ′ 2
Z t′
m
dq
mq˙2
− V (q))dt = −
+ V (q) dτ = −SE
(
⇒ −i
2
dτ
2
τ
t
SE e’ detta ”azione euclidea” e la rappresentazione di hq ′ , t′ |q, ti mediante integrali di cammino diventa
Z
SE [q̇,q]
′
′
hq , τ |q , τ i = D q e− ~
(3.9)
che ha la stessa forma della funzione di partizione di un sistema di meccanica
statistica unidimensionale con le sostituzioni H ↔ SE e κT ↔ ~.
Vediamo ora qualche proprieta’ generale dei cammini che contribuiscono maggiormente all’integrale di cammino (3.8). L’analisi diventa particolarmente semplice se poniamo V (q) = 0 (modello gaussiano). Riscriviamo la (3.8) in forma
discreta 8
Z Y
N
−
dqi αi e
P
2
j m(qj+1 −qj )
2~∆t
1
8
∆t e’ in realta’ ∆τ in questa descrizione euclidea
40
, αi =
r
m
2π∆t
(3.10)
e calcoliamoci il valor medio
2
h(qj+1 − qj ) i ≡
R QN
1
dqi αi (qj+1 − qj )2 e−
hq ′ , τ ′ |q, τ i
SE
~
, dove c
Poiche’ tutti gli integrali sono gaussiani, si ha h(qj+1 − qj )2 i = c 2~∆t
m
9
2
e’ una costante numerica opportuna In altri termini h(qj+1 − qj ) i ∝ ∆t ⇒ I
cammini che contribuiscono all’integrale (3.8) sono in media continui (perche’
h(q
−q )2 i
1
∆t → 0 ⇒ qj+1 → qj ), ma non differenziabili (perche’ lim∆t→0 j+1∆t2 j ∝ ∆t
non e’ finito). Si puo’ infatti dimostrare che i cammini differenziabili formano un
sottoinsieme di misura nulla nello spazio dei cammini che contribuiscono al path
integral (3.8). Si potrebbe inoltre far vedere che il set di cammini che contribuiscono maggiormente all’integrale in questione coincide con il set delle traiettorie
di una particella soggetta al moto browniano.
E’ da notare che una proprieta’ caratteristica del moto browniano e’, come
vedremo, che√la distanza media percorsa da una particella in un tempo ∆t e’ proporzionale a ∆t e parallelamente dalla (3.10) si ricava, con la stessa procedura
usata per (qj+1 − qj )2 , che
h(qj − qk )2 i ∝ ∆t, ∀j e k ∈ 1, 2 . . . N
In altri termini, la distanza media tra due punti qualsiasi della traiettoria e’ proporzionale alla radice quadrata della scala dei tempi. Questa non e’ una proprieta’
delle usuali curve continue, ma piuttosto delle strutture frattali.
3.3 La mappa tra MS e QFT
Torniamo ora all’eq. (3.8):
′
′
hq , τ |q, τ i =
Z
Dqe−
R τ′
τ
dq 2 m
[( dτ
) 2 +V (q)]dτ /~
(3.11)
√
Ponendo φ(τ ) = m q(τ ) la (3.11) e’, con un’opportuna scelta di V (q), nient’altro
che il modello di Landau-Ginzburg in una dimensione: basta porre V (q) = r2o φ2 +
uo 4
φ . Gli stati iniziale e finale |q, τ i e |q ′, τ ′ i individuano le condizioni al contorno
4!
del segmento [τ ′ , τ ] dove e’ definita la teoria. Il limite termodinamico si ottiene
ponendo τ → −∞ e τ ′ → +∞ . E’ utile anche considerare condizioni al contorno
9
c=
R QN
1
dxi αi (xj+1 − xj )2 e−
P
k (xk+1 −xk )
41
2
/
R QN
1
dxi αi e−
P
k (xk+1 −xk )
2
periodiche, che comportano la somma su tutte le traiettorie chiuse: a tal fine basta
porre nella (3.11) q = q ′ e integrare ancora su q. In questo caso la corrispondente
teoria euclidea sul reticolo unidimensionale è invariante per traslazioni multiple
del passo reticolare ∆τ .
Ritornando al formalismo operatoriale e al tempo reale si ha
Z
Z
H(t′ −t)
H(t′ −t)
′
dqhq, t |q, ti = dqhq|ei ~ |qi ≡ tr ei ~
E’ ora facile dimostrare, con la continuazione analitica nel tempo immaginario,
che la densita’ f di energia libera tende, nel limite termodinamico, all’energia
τ ′ −τ
dello stato fondamentale. Infatti, identificando la f. di partizione Z con tr e−H ~
τ ′ −τ
e ponendo Z = e−f ~ dove f e’ la densita’ di energia libera (Energia libera per
unita’ di volume, che è una costante perchè il sistema è invariante per traslazioni)
e introducendo un set completo di autostati dell’energia {|ni} : H|ni = En |ni, si
ha
X
(τ ′ −τ )
τ ′ −τ
τ ′ −τ
hn|e−En ~ |ni → h0|e−Eo ~ |0i
tr e−H ~ =
n
f = Eo
c.v.d.
In teoria quantistica dei campi un ruolo importante e’ giocato dal prodotto
cronologico o T −prodotto. Siano A(t) e B(t) due operatori dipendenti dal tempo
t e definiamo il T − prodotto di A e B nel modo seguente
(
A(t1 )B(t2 ) se t1 > t2
T (A(t1 )B(t2 )) =
B(t2 )A(t1 ) se t1 < t2
E’ facile ottenere una rappresentazione con integrali di cammino del T − prodotto
degli operatori di posizione:
Z
S
′ ′
hq , t |T (Q(t1 )Q(t2 ))|q, ti = Dq q(t1 )q(t2 )e−i ~ .
(3.12)
Infatti il ruolo del T − prodotto e’ proprio quello di far comparire gli operatori
Q(ti ) nella posizione giusta quando si suddivide l’intervallo t′ −t in N intervallini
∆t.
L’equazione (3.12) mostra che il valore di attesa del T − prodotto corrisponde
al correlatore nel linguaggio della meccanica statistica. Inoltre si dimostra con
42
un ragionamento analogo a quello sull’energia libera, che il limite termodinamico
della (3.12) coincide con il valore di attesa nel vuoto del T − prodotto, cioe’
hq ′ , t′ |q(t1 )q(t2 )|q, ti
= h0|T (Q(t1 )Q(t2 )) |0i
t −t→∞
hq ′, t′ |q, ti
lim
′
Abbiamo usato come modello illustrativo un modello particolarmente semplice
descritto da una sola coordinata lagrangiana Q(t). In realta’ il procedimento e’
di grande generalita’. Per esempio in una teoria di campo scalare in d dimensioni spaziali, detto |φ, ti lo stato che descrive una data configurazione iniziale
φ(xi , t) (i = 1 . . . d) e |φ′ , t′ i una conf.finale e S[φ] l’azione della teoria, si puo’
dimostrare facilmente che vale la seguente rappresentazione di path integral
Z
S
′ ′
hφ , t |φ, ti = Dφ e−i ~
dove Dφ e’ l’integrazione funzionale, o somma sulle configurazioni, come e’ stata
definita per il modello di Landau-Ginzburg. L’integrazione funzionale e’ particolarmente semplice se la teoria e’ posta su un reticolo. La trascrizione su reticolo
si puo’ fare solo se ξ ≫ a (a = passo reticolare) ⇒ le teorie quantistiche di
campo nel limite continuo corrispondono a teorie su reticolo in prossimita’ di una
transizione del II ordine. In conclusione, la rappresentazione di path integral delle
ampiezze di transizione e la continuazione analitica a tempi immaginari (rotazione
di Wick) consente di trascrivere ogni modello di meccanica quantistica o di teoria dei campi quantistica in un sistema di meccanica statistica classica. Possiamo
stabilire il seguente dizionario tra le due formulazioni:
teoria quantistica
meccanica
di campo
statistica classica
integrazione funzionale
somma sulle configurazioni
d dimensioni spaziali
D = d + 1 dimensioni spaziali
Azione euclidea SE
Hamiltoniana H
~
κT
Ampiezza di transizione
Funzione di partizione
Valore di attesa nel vuoto del T -prodotto
Funzioni di correlazione
Energia dello stato fondamentale
Densita’ di energia libera
Massa della particella piu’ leggera
Inverso della lunghezza di correlazione
43
3.4 Limite continuo
Nelle teorie quantistiche di campo il reticolo che abbiamo introdotto è semplicemente un artificio per dare un significato preciso all’integrazione funzionale, ma le
proprietà fisiche non possono dipendere dal valore del passo reticolare a. Quindi
questa procedura è giustificata solo se tutte le scale fisiche in gioco, quando sono
espresse in unità di lunghezza, sono molto più grandi del passo reticolare. Dal
punto di vista del corrispondente modello di meccanica statistica classica, questo
equivale alla condizione che la lunghezza di correlazione ξ sia molto più grande
del passo reticolare, il che corrisponde a richiedere che il sistema sia vicino a un
punto critico. Quindi la vera corrispondenza stabilita è tra un sistema di teoria
dei campi quantistica nel continuo e un corrispondente sistema statistico classico
vicino al punto critico.
Il modello di Landau-Ginzburg è un buon esempio di questo tipo perchè descrive il comportamento di un sistema (ferromagnetico) in prossimita’ del punto
critico dove ξ ≫ a, per cui la struttura reticolare non gioca alcun ruolo. Per
rendere piu’ spedite le manipolazioni successive conviene usare la notazione del
continuo, facendo formalmente il limite a → 0:
Z
1
1
1
d
2
2
4
⇒ HGL [φ] → d x (∇φ(x)) + r0 φ (x) + u0 φ (x)
2
2
4!
In realta’ questo e’ solo un limite formale, utile per semplificare la notazione, per
rendere piu’ agevole la condizione ξ ≫ a. E’ da notare infatti che la definizione
esatta di Z coinvolge, come abbiamo visto nel paragrafo precedente, un’integrazione
per ogni sito
Z Y
Z=
dφie−HLG (φ) .
i
Quindi, a rigore, non c’e’ nessuna condizione di continuita’ che leghi in qualche
modo il valore di φ per due siti vicini (che giustificherebbe la sostituzione della
differenza finita φ(x + µ) − φ(x) con la derivata ∂µ φ). Formalmente si puo’ porre
Z
R d 1P
1
2 1
2
4
Z = Dφe− d x[ 2 µ (∇µ φ) + 2 r0 φ + 4! u0 φ ]
dove, in accordo col paragrafo precedente,
Q si è introdotto il simbolo di integrazione funzionale Dφ = lima→0 N (a) i dφi . N (a) e’ un fattore di scala
introdotto per rendere finito il limite; tuttavia il limite continuo è ben definito
solo se è ben definita l’integrazione funzionale (come si è visto nel caso dello
studio delle proprietà frattali degli integrali di cammino nel caso gaussiano). Lo
strumento di elezione per studiare questo limite è il gruppo di rinormalizzazione.
44
3.5
Sistemi quantici in equilibrio con un termostato
Un sistema quantistico in equilibrio con un termostato alla temperatura T è descritto dalla funzione di partizione
Z = tr e−β H ,
(3.13)
dove H è operatore Hamiltoniano che descrive il sistema e la traccia indica la
somma sun un set completo di stati.
Nel caso specifico di una particella materiale di massa m che si muove in un
P2
+V (Q) , [Q, P ] = i~, dove le notazioni
potenziale assegnato V (Q) si ha H = 2m
sono le stesse di §3.2. Si ha
Z
Z = dqhq|e−β H |qi.
Questa è un’espressione molto simile a quella studiata nell’introduzione degli integrali di cammino. Infatti avevamo trovato (vedi l’eq.(3.9)) che
Z
Z
R ′
iH(t′ −t)
−i t
−iS
′ ′
′
L(
q̇,q)dt
hq , t |q, ti ≡ hq |e ~ |qi = Dq e ~ t
≡ Dq e ~ .
(3.14)
è dunque chiaro che se noi facciamo una rotazione di Wick t → iτ e poniamo
i(t′ −t)
= −β e q ′ = q (cosicchè consideriamo soltanto camminiR chiusi) e infine
~
aggiungiamo un’ulteriore integrazione all’integrale sui cammini Dq, integrando
sulla posizione del punto iniziale q(τ ) = punto finale q(τ ′ = τ + β), otteniamo
una rappresentazione con integrali di cammino della funzione di partizione del
sistema quantico:
Z
Z=
D[q] e−
Rβ
0
LE (q̇,q)dτ
,
dove D[q] denota ora la somma su tutti i cammini chiusi e LE è la lagrangiana
euclidea, ottenuta con la rotazione di Wick.
Come avevamo fatto per gli integrali di cammino, cosı̀ anche questa rapprsentazione si puo’ estendere a sistemi con un numero arbitrario di gradi di libertà.
Supponiamo ad esempio, in analogia a quanto avevamo fatto nello studio dei sistemi di Landau-Ginzburg, che il sistema quantico sia un sistema in D dimensioni
spaziali e che le sue possibili configurazioni siano descritte da un campo scalare
φ(~x), dove ~x è un vettore D-dimensionale. Per descrivere il sistema in equilibrio
alla temperatura T = 1/β mediante un integrale funzionale, occorre supporre che
45
il campo φ dipenda anche dalla variabile τ ( tempo immaginario) e che sia una
funzione periodica di periodo β, cioè
φ(~x, τ ) = φ(~x, τ + β) .
(3.15)
Utilizzando queste configurazioni periodiche la funzione di partizione del sistema
quantico D-dimensionale ammette la seguente rappresentazione in termini di integrazione funzionale di un sistema in D+1 dimensioni
Z
Rβ
−β H
Z ≡ tr e
= D[φ] e− 0 LE [φ]dτ ,
(3.16)
dove ora D[φ] indica la somma su tutte le configurazioni periodiche definite dalla
(3.15) e la lagrangiana LE è ora un funzionale della configurazione φ. Un altro
modo più generale per legare il sistema quantico a un equivalente sistema classico
si basa su una identità operatoriale che si può costruire nella maniera seguente:
si suddivida l’intervallo β in N intervallini di lunghezza δτ = β/N. Sfruttando
il noto limite limN →∞ (1 − x/N)N = e−x si può ottenere la seguente identità
operatoriale
tr e−βH = lim tr [(1 − δτ H)(1 − δτ H) . . . (1 − δτ H)] ,
δτ →0
(3.17)
dove la parentesi quadra contiene N = β/δτ fattori. Questa identità, nota come
formula di Trotter, può essere reinterpretata come il limite continuo della funzione
di partizione di un sistema della meccanica statistica classica associato alla matrice di trasferimento T = 1 − δτ H che ne descrive l’evoluzione nella direzione
β in un reticolo con passo reticolare δτ , per cui Z = tr T N (si vedano ad es.
gli appunti di MS)). Dunque la (3.16) e la (3.17) mostrano in due modi differenti
che la funzione di partizione un sistema quantico in D dimensioni spaziali coincide con la funzione di partizione canonica di un opportuno sistema classico in
D+1 dimensioni, in cui la dimensione aggiuntiva ha un’ estensione finita β e le
condizioni al contorno lungo questa direzione sono periodiche.
In particolare la funzione di partizione di un sistema quantistico D-dimensionale
a T = 0 è esattamente equivalente alla funzione di partizione di un opportuno
sistema classico in D+1 dimensioni nel limite termodinamico. La temperatura
del sistema quantistico non ha nulla a che fare con quella del sistema classico
corrispondente, che dipende invece dalle costanti di accoppiamento del sistema
quantistico.
46
3.5.1 Catena lineare di spin in campo trasverso
Un’applicazione illuminante della formula di Trotter è fornita dal sistema quantistico costituito da una catena lineare di spin immerso in campo trasverso h, definito
dall’Hamiltoniana
X
z
b
H(λ,
h) = −
λ σnz σn+1
+ h σnx ,
(3.18)
n
dove le σ sono matrici di Pauli associate ai nodi di un reticolo unidimensionale.
Matrici appartenenti a nodi diversi commutano, mentre quelle associate allo stesso
nodo anticommutano:
z
(σnz )2 = (σnx )2 = 1 ; {σnx , σnz } = 0 ; [σnx , σm6
=n ] = 0 .
(3.19)
Vogliamo calcolare Z = Tre−βH con la formula di Trotter. Utilizziamo come set
completo di stati gli autostati di σnz , cioè il set di configurazioni di spin associati
ai nodi |{Si }i = . . . |Sn i |Sn+1i . . . , con Sn = ±1. σnx non è diagonale in questa
base e si ha, per via delle proprietà di anticommutazione, σnx |Sn i = | − Sn i.
Scriviamo ora la transfer matrix della formula di Trotter nella forma
!
X
z z
x
b = 1 + δτ h
T ≡ 1 − δτ H
σn eδτ λ σn σn+1 + O(δτ 2 ) =
n
=
√
hδτ
Y
n
con
√
1
hδτ
+
√
hδτ σnx
eK1
K1 = δτ λ .
P
n
Sn,j Sn+1,j
+ O(δτ 2 ) ,
(3.20)
Si e’ aggiunta l’etichetta j alla configurazione e si interpreta l’espressione racchiusa in parentesi quadre come l’operatore che fa evolvere dalla configurazione
j alla j + 1. Si interpreta poi questa nuova configurazione come la conf. di una
nuova catena orizzontale spostata di un passo reticolare in direzione verticale ( si
veda la figura sottostante).
n,j+1
n−1,j+1
n+1,j+1
n−1,j
n,j
n+1,j
47
E’ immediato verificare che l’azione del termine in parentesi quadre si puo’
riscrivere nella forma
hSn,j+1| √
1
hδτ
+
√
hδτ σnx |Sn,j i = eK2 Sn,j Sn,j+1
con
eK2 = √
1
(3.21)
hδτ
Si genera cosi’ un reticolo quadrato su cui è definito un modello di Ising standard senza campo magnetico e con accoppiamenti molto asimmetrici nelle due
direzioni. Si ottiene dunque l’equivalenza
b
−β H
Tre
=
1
hδτ
N/2 X
P
e
x,y (K1 Sx,y Sx+1,y +K2 Sx,y Sx,y+1 )
,
(3.22)
{Sx,y }
con β = Nδτ . Nonostante gli accoppiamenti asimmetrici, è facile verificare che
il sistema è autoduale rispetto alla trasformazione di Kramers e Wannier e la relazione tra le costanti di accoppiamento della versione duale è un’ovvia generalizzazione di quella simmetrica:
sinh 2K̃1 = 1/ sinh 2K2 ; sinh 2K̃2 = 1/ sinh 2K1 .
Ne consegue che il modello di Ising in questione possiede una linea di punti critici
data dalla relazione
sinh 2K1 sinh 2K2 = 1 .
Inserendo in questa la (3.20) e la (3.21) si ottiene che la catena di spin in questione
ha una transizione di fase ordine-disordine del II ordine per h = λ e per ogni
valore di β.
Esercizio: Dimostrare esplicitamente le precedenti affermazioni.
Cerchiamo ora di comprendere per una via completamente diversa il fatto che
la catena di spin in questione ha una transizione di fase per λ = h.
Le proprietà fisiche di questo modello di spin non dipendono certo dalla rappresentazione usata per le matrici di Pauli, ma solo dalle loro proprita’ algebriche.
Introduciamo ora un nuovo set di operatori che hanno esttamente le stesse propriz
eta’ delle σnx e σm
, ma sono esprimibili in forma composta e non locale in termini
delle σ:
Y
z
σjx .
(3.23)
µxn = σnz σn+1
; µzn =
j≤n
48
È semplice verificare che questi operatori soddisfano esattamente tutte le proprietà
delle σ elencate in (3.19), perciò la catena di spin descritta dall’Hamiltoniana
b
b
H(λ,
h) = −
X
λ µzn µzn+1 + h µxn
n
b
ha esattamente le stesse proprietà di quella descritta da H(λ,
h). Ma esprimendo
le µ in funzione delle σ si ottiene
b
b
b
H(λ,
h) = H(h,
λ) ;
Dunque la teoria è simmetrica rispetto allo scambio λ ↔ h.
b
Nell’hamiltoniana H(λ,
h) il termine in λ è un accoppiamento ferromagnetico
che tende ad ordinare gli spin , mentre il termine in h tende a disordinare il sistema, perchè cambia di segno gli spin su cui agisce. Perciò, se il sistema ha una
transizione di fase per h/λ = ρo , la fase ordinata con hσnz i =
6 0 occupa la regione
h/λ < ρo . Ma se ρo 6= 1, esiste , per via della simmetria λ ↔ h, un’altra transizione ordine-disordine per h/λ = 1/ρo ; quindi, se supponiamo che la transizone
di fase sia unica deve valere ρo = 1, come richiede la trasformazione di Kramers
e Wannier. Valgono ovviamente le doppie implicazioni
hσnz i =
6 0 ⇔ hµzn i = 0 ; hσnz i = 0 ⇔ hµzn i =
6 0.
Se hσ z i è il parametro d’ordine, hµz i è il parametro di disordine e viceversa. È
facile verificare infine che la trasformazione (3.23) è una trasformazione involutiva. Si ha infatti
Y
x
z
σn+1
= µzn µzn+1 ; σn+1
=
µxj .
j≤n
49
Sistemi critici in prossimità di d = 4
4
4.1 Il teorema di Wick
Uno degli ingredienti tecnici più utili in teoria di campo, come abbiamo già avuto
modo di vedere, è l’uso degli integrali gaussiani. Vediamone ora alcune proprietà
generali. Abbiamo più volte usato il noto risultato
r
Z ∞
2π 1 B2
2 +Bφ
φ
−A
e 2A ,
=
dφ e 2
A
−∞
che può anche essere riscritto nella forma
1
2
heBφ i = e 2A B ,
dove la media è fatta rispetto alla misura gaussiana con B = 0. È immediato estendere il risultato al caso di N variabili φx (x = 1, . . . N) e al caso dell’integrazione
funzionale con un’Hamiltoniana gaussiana molto generale della forma
Z
Z
1X
1
d
H=
φx Ax y φy =
d x dd y φ(x)A(x, y)φ(y) ,
2 x,y
2
dove Ax y è una qualunque matrice invertibile. Si ottiene
P Bx φx −1
1 P
e x
= e 2 x,y Bx Ax y By ,
(4.1)
possiamo quindi riscrivere l’eq.(4.1) nella forma seguente
P Bx φx 1 P
e x
= e 2 x,y Bx hφx φy iBy .
(4.2)
dove A−1 è la matrice inversa : A A−1 = 1. Confrontando questa formula con
l’eq.(3.2) si constata che A−1
x y altro non è che il correlatore Gx y , ma verifichiamo
il fatto direttamente:
P
δ2
δ2
B
φ
x
x
|B=0 = A−1
Gx y = hφx φy iB=0 =
log Z|B=0 =
e x
xy ;
δBx δBy
δBx δBy
L’identità (4.2) può essere utilizzata anche per calcolare il valore di aspettazione del prodotto di un numero arbitrario di campi 10
hφx1 φx2 . . . φx2n iB=0 =
10
−1
1 P
δ 2n
e 2 x,y Bx Ax y By |B=0 .
δBx1 δBx2 . . .
Naturalmente se il numero di campi è dispari il correlatore è zero se B=0.
50
È chiaro che ogni qual volta δBδ x agisce sull’esponenziale abbassa un fattore A−1
x y By ,
quindi la metà delle variazioni devono agire su questi fattori, al fine di ottenere un
risultato 6= 0 quando si pone B = 0. Ne segue che questo valore di aspettazione
deve essere la somma di tutti prodotti di correlatori che si ottengono accoppiando
( o contraendo, come si dice in teoria dei campi) in tutte le maniere possibili i
campi φxi cioè
X
hφx1 φx2 . . . φx2n iB=0 =
Gα1 α2 Gα3 α4 . . . Gα2n−1 α2n ,
(4.3)
{αi }
dove la somma è fatta sulle permutazioni α1 , α2 , . . . α2n degli indici che danno
contrazioni distinte. L’eq.(4.3) costituisce il teorema di Wick, che è uno strumento
indispensabile in teoria dei campi.
Esercizio: Verificare l’identità seguente applicando il teorema di Wick
hφx1 φx2 φx3 φx4 i = Gx1 x2 Gx3 x4 + Gx1 x3 Gx2 x4 + Gx1 x4 Gx2 x3 .
A conclusione di questo paragrafo è utile osservare che nel limite continuo il
fatto che il correlatore è l’inverso della matrice cinetica si può scrivere nella forma
Z
dd zA(x, z) G(z, y) = δ (d) (x − y) ;
per un sistema invariante per traslazioni il correlatore G(x, y) e la matrice cinetica
A(x, y) sono funzioni solo della differenza x − y e l’equazione precedente diventa
una convoluzione. La trasformata di Fourier è data come è noto dal prodotto delle
trasformate, perciò
1
.
G̃(k) = p
(2π)d Ã(k)
Nelle usuali teorie gaussiane A(k) = k 2 +m2 , quindi il correlatore (o propagatore)
ammette la seguente importante rappresentazione integrale
Z
e−ik·x
1
d
d
k
,
(4.4)
G(x) =
(2π)d
k 2 + m2
dove il dominio di integrazione dipende dal reticolo utilizzato. Nelle nostre applicazioni basterà in genere porre per semplicità k ≤ 1/a, dove a è il passo reticolare.
51
4.2 Il modello gaussiano
Studiamo un modello puramente gaussiano su reticolo,
XcX
r0 X 2
H=
(φx+µ − φx )2 +
φ
2 µ
2 x x
x
dove, per maggior generalita’, si e’ introdotta una P
costanteR c anche nella parte cinetica. Adottiamo la notazione del limite continuo x → dd x/ad e supponiamo
che le costanti c e r0 siano adimensionali, mentre il campo φ ha una dimesione
[φ] = −xφ da determinare. Con queste convenzioni l’Hamiltoniana avrà la forma
Z
1
dd x c a2xφ −d+2 (∇φ)2 + r0 a2xφ −d φ2 ,
H=
2
dove il passo reticolare a ha solo il ruolo di unità lunghezza di riferimento. Conviene passare alla trasformata di Fourier, cosi’ la teoria diventa la somma dei contributi dei modi normali di vibrazione che sono oscillatori armonici disaccoppiati
ed e’ piu’ facile implementare le trasformazioni del gruppo di rinormalizzazione
(RGT ).
Se la teoria e’ su reticolo i vettori d’onda permessi sono minori di una scala di
cut-off Λ ≃ a1
k≤Λ
Si ha
1
H=
2
Z
dd k(r0 + ck 2 a2 )a2xφ −d φ̃(k)φ̃(−k) .
k≤Λ
Se il campo φ(x) è reale si ha φ̃(−k) = φ̃(k)∗ , per cui
Z
1
H=
dd k(r0 + ck 2 a2 )a2xφ −d |φ̃(k)|2
2 k≤Λ
(4.5)
Da cui si evince che
[φ̃] = −xφ + d .
Ora si può scrivere
Z Y
Z Y
1
2 2xφ −d |φ̃(k)|2
−H
Z=
dφ̃(k)e
=
e− 2 (r0 +c(ak) )a
dφ̃(k)
k≤Λ
k≤Λ
52
(4.6)
La RGT di parametro s comporta l’integrazione sui modi normali di vibrazione
compresi tra Λ/s e Λ:
Y Z
dφ̃(k)e−H ,
Λ
≤k≤Λ
s
che genera semplicemente una costante inessenziale H → H ′ + C, con
Z
1
′
H =
dd k ′ (r0 + c(ak ′ )2 )a2xφ −d |φ̃(k ′ )|2 .
2
k′ ≤ Λ
s
Vogliamo riscrivere H ′ nella forma originaria (4.5), e perciò poniamo k ′ = k/s.
Si ha
Z
dd k 1
c
(r0 + 2 (ak)2 )a2xφ −d |φ̃(k/s)|2 .
d
s
k≤Λ s 2
Dalla (4.6) si ha φ̃(k/s) = s−xφ +d φ̃(k), perciò
Z
a2 2 a 2xφ −d
d 1
|φ̃(k)|2 .
d k r0 + c 2 k
2
s
s
k≤Λ
In conclusione, se vogliamo che H ′ coincida con H quando il cut-off Λ → Λ/s
occorre che anche le costanti di acoppiamento varino, in modo da cancellare la
dipendenza da s
⇒ r0′ = sd−2xφ r0 ;
c′ = sd−2−2xφ c
(4.7)
⇒ punti fissi della RGT
1. c = 0 , xφ = d2 ,
2. xφ =
d−2
,
2
r0 arbitrario;
c arbitrario.
Nel caso 1) il termine cinetico (∇φ)2 e’ irrilevante ⇒ i siti diventano, nel limite
s → ∞, indipendenti uno dall’altro ⇒ ξ = 0 (questo e’ il punto fisso banale
a T = ∞). Il caso 2) e’ piu’ interessante: in prossimità del punto fisso si ha
RGT : c′ = c , r0′ = s2 r0 Dunque r0 e’ un campo rilevante con y = 2 ⇒ ν = 21 ,
quindi in particolare ξ = ∞; inoltre dalla relazione xφ = d−2
⇒ η = 0. Questi
2
coincidono con i valori dell’approssimazione di Landau nel modello
P Pd di L-G.
Osservazione: se ci fosse in H un termine del tipo w0 k ( i=1 ki4 )|φ̃(k)|2
(che quindi non è invariante per rotazione) ⇒ w0′ = s−2 w0 ⇒ campo irrilevante
⇒ in prossimita’ del punto fisso 2) (ξ ∼ ∞) l’invarianza per rotazioni viene
ristabilita.
53
4.3 I punti fissi del modello di Landau-Ginzburg
Conviene sempre supporre che le costanti di accoppiamento r0 , u0 e h del modello
di L-G siano adimensionali. Allora il passo reticolare a compare esplicitamente
nell’Hamiltoniana HLG . Supponendo, in accordo col paragrafo precedente, che
,
nel limite continuo il campo scalare φ abbia dimensione [φ] = −xφ ,Rcon xφ = d−2
2
l’integrale funzionale del modello di L-G assume la forma Z = Dφ exp −H
con
Z
1
u0 d−4 4
d
2
−2 r0 2
−d/2−1
H=
d x (∇φ) + a
φ + a φ + ha
φ .
(4.8)
2
2
4!
Ma, come si è già visto, il passo reticolare compare in maniera implicita anche
nell’integrazione funzionale11 . Quindi l’effetto sulle costanti di accoppiamento di
una trasformazione del gruppo di rinormalizzazione che cambia il passo reticolare
da a a a′ = sa (e naturalmente lascia invariante Z) sarà la somma dei contributi
dovuti alla variazione di a in HLG (il cui risultato è immediatamente calcolabile)
e alla variazione inplicita in Dφ, che richiederà qualche strumento tecnico in più.
Vediamo intanto il primo contributo. Se a → sa, anche le costanti di accoppiamento devono variare in modo da lasciare l’Hamiltoniana invariante. Si ha allora
h′ = sd/2+1 h , r0′ = s2 r0 , u′0 = s4−d u0 ,
(4.9)
che ha come punto fisso h = r0 = u0 = 0 che corrisponde all’hamiltoniana di
punto fisso con il solo termine cinetico
Z
1
∗
H =
dd x(∇φ)2
(4.10)
2
ed è perciò detto punto fisso gaussiano. Rispetto a questo punto h e ro ∝ t sono
accoppiamenti (o scaling variables) rilevanti (come sapevamo gia’ dalle proprietà
generali del gruppo di rinormalizzazione (RG)). Gi autovalori termico e magnetico
sono rispettivamente (come si legge dall’eq.(4.9)) yt = 2 e yh = 1+d/2. A partire
da questi autovalori possiamo calcolarci attraverso le note formule gli esponenti
critici e costruire la seguente tabella che mette a confronto questi esponenti con
quelli calcolati nell’approssimazione di campo medio
11
in un reticolo di volume fissato il numero dei nodi (e quindi delle integrazioni) dipende dal
passo reticolare.
54
campo
medio
punto
fisso
gauss.
α
β
γ
δ
η
ν
0
1
2
1
3
0
1
2
d−2
4
1
d+2
d−2
0
1
2
2−
d
2
C’è perfetto accordo solo per d = 4. Per d > 4 l’approssimazione di campo
medio dà un comportamento critico piu’ singolare rispetto a quello previsto dal
punto fisso gaussiano. Una delle ragioni è che, pur esendo u0 in questa regione
irrilevante (yu0 = 4 − d), non può essere posto uguale a 0, come vorrebbe il
flusso del RG del punto gaussiano, perchè, come si è già
qvisto, la magnetizzazione
0
. Accoppiamenti di
spontanea contiene u0 a denominatore: hφi = φ0 = − 6r
u0
questo tipo si dicono pericolosamente irrilevanti. Per d < 4 u0 diventa un ulteriore accoppiamento rilevante, quindi il punto fisso gaussiano non può descivere il
comportamento critico a d < 4 di un sistema magnetico, dove sappiamo che gli
accoppiamenti rilevanti sono solo h e t12 .
Esercizio: Mostrare
P che in prossimità del punto fisso gaussiano il termine cinetico (∇φ)2 ≡ ( µ φ(x+aµa)−φ(x) )2 tende, per effetto del gruppo di rinormalizzazione, al limite continuo ∂µ φ(x)∂ µ φ(x).
(Suggerimento: sviluppare in serie di Taylor φ(x + aµ ) e mostrare che tutti i
termini che contengono derivate superiori alla prima sono irrilevanti.)
4.4 OPE
In prossimità di un punto critico l’Hamiltoniana assume la forma
X X
H = H∗ +
gi
φi (x) axi ,
(4.11)
x
i
dove H∗ è l’Hamiltoniana del punto fisso, la costanti adimensionali gi sono le
variabili di scala (cioè quelle combinazioni lineari delle costanti di accoppiamento
che si trasformano con un fattore di scala per effetto di una trasformazione del
12
Infatti gli operatori rilevanti controllano l’effettiva distanza del sistema dal punto critico,
d’altra parte la funzione di partizione del modello di Ising o di un generico modello magnetico
è solo funzione della temperatura e del campo magnetico.
55
gruppo di rinormalizzazione) e gli operatori φi (x) sono i corrispondenti operatori
di scala o scaling operators ed hanno dimensione di una (lunghezza)−xi . Il passo
reticolare a entra esplicitamente nell’eq. (4.11) per ragioni dimensionali. Gli
scaling operators hanno funzioni di correlazione che sono delle pure potenze. In
particolare
c
hφi (x)φi (y)i =
.
|x − y|2xi
Consideriamo ora dei correlatori più generali, della forma
hφi(x)φj (y) Φi ,
dove Φ rappresenta un prodotto arbitrario di operatori di scala situati in punti
molto distanti dai due punti x e y. Sotto condizioni molto generali si dimostra (o
in qualche caso si congettura) che si può rimpiazzare il prodotto dei due operatori
φi e φj con una combinazione lineare di operatori di scaling i cui coefficienti sono
opportune potenze della distanza |x − y|, cioè
X
x+y
hφi (x)φj (y) Φi =
Cijk (x − y)hφk (
) Φi ,
2
k
dove, per ragioni dimensionali, si ha
Cijk (x) =
cijk
|x|xi +xj −xk
e i coefficienti cijk sono numeri puri. È importante osservare che le funzioni
Cijk (x) non dipendono dagli operatori Φ, quindi si puo’ scrivere
φi (x) φj (y) =
X
k
Cijk (x − y) φk (
x+y
),
2
(4.12)
dove il segno di uguaglianza va inteso in senso debole, cioè vale quando è inserita in un valore di aspettazione del tipo h. . . Φi. L’eq. (4.12) è detta sviluppo
del prodotto operatoriale o operator product expansion (OPE). Vedremo che nei
rapporti dei coefficienti cijk (di solito numeri razionali) sono codificate molte proprietà universali del comportamento del sistema attorno al punto critico. Per mettere in luce questo particolare aspetto dell’OPE si suole riscriverla nella forma
piu’ schematica
X
cijk φk ,
(4.13)
φi × φj =
k
56
nota come algebra di fusione degli operatori.
Vediamo ora come si dermina l’OPE nel caso semplice, ma particolarmente
importante, del punto fisso gaussiano. È chiaro dalle eq.(4.8) e (4.10) che il modello di LG in prossimità del punto critico ha proprio la forma (4.11) in cui gli
scaling operators sono potenze del campo scalare φ(x). In particolare il campo
stesso è associato alla perturbazione magnetica del sistema ( legata alla variabile
di scala h), φ(x)2 è la perturbazione termica ( corrispondente alla variabile di scala
ro ∝ t) e φ(x)4 è associato alla variabile di scala u. Essendo
hφ(x) φ(y)i =
1
|x − y|d−2
divergente per x → y, gli operatori φ(x)n non sono ben definiti: conviene applicare il cosiddetto point-splitting method, che consiste nel rimpiazzarli con
φ(x)n → φ(x + ε1 ) φ(x + ε2 ) . . . φ(x + εn ) ,
dove ε1 , . . . εn sono degli spostamenti infinitesimi. Le proprietà fisiche del sistema
non dipendono da εi.
Nel caso del punto fisso gaussiano l’OPE è una diretta conseguenza del teorema di Wick. Per esempio, indicando con una linea la contrazione di due campi,
si ha, per l’OPE del prodotto φ(x) φ2 (y),
hφ(x) φ2 (y) Φi → hφ(x) φ(y − ε) φ(y + ε) Φi =
= hφ(x) φ(y − ε) φ(y + ε) + φ(x) φ(y − ε) φ(y + ε) + φ(x) φ(y − ε) φ(y + ε) Φi
+hφ(x) φ(y − ε) φ(y + ε) Φ i
che dà origine alla seguente legge di fusione
φ × φ2 = 3 φ + φ3 .
Dovendo applicare queste tecniche di calcolo al gruppo di rinormalizzazione, che
studia l’effetto di un riscalamento delle distanze fisiche in gioco x → sx , y →
57
sy, è chiaro che gli splitting εi non devono giocare nessun ruolo in questo riscalamento. Conviene allora cambiare la base degli scaling operators ridefinendo gli
operatori in modo da sottrarre le parti non connesse: φ1 (x) = φ(x) − hφi ,
φ2 (x) = φ2 (x) − hφ2 i , ecc.. È facile verificare che in questa nuova base le regole
di contrazione sono modificate dall’ulteriore regola di trascurare le contrazioni di
operatori che derivano dallo splitting di un singolo punto. Quindi nell’esempio
precedente si trascura il terzo termine e la regola di fusione diventa
φ1 × φ2 = 2 φ1 + φ3 .
(4.14)
Analogamente è facile verificare che
φ1 × φ1 = 1 + φ2
φ1 × φ4 = 4 φ3 + . . .
φ2 × φ2 = 2 + 4 φ2 + φ4
φ2 × φ4 = 12 φ2 + 8φ4 + . . .
φ4 × φ4 = 24 + 96 φ2 + 72 φ4 + . . .
(4.15)
(4.16)
(4.17)
(4.18)
(4.19)
I puntini stanno ad indicare operatori di grado superiore al quarto.
4.5 Le equazioni del gruppo di rinormalizzazione
In prossimità del punto fisso, utilizzando la (4.11), si vede subito che la funzione
di partizione assume la forma
X Z dd x
X
X
−H
−H∗
1−
gi
Z=
e
=
e
φi (x) axi +
d
a
i
conf.
conf.
= Zo
(
1−
1X
gi gj
2 ij
X
i
gi
Z
Z Z
dd x
ad
dd x dd y
xi+xj
φ
(x)
φ
(y)
a
+
.
.
.
=
i
j
a2d
1X
gj
hφi i axi −
2 j
Z
(4.20)
dd y
hφi (x) φj (y)i axi+xj + . . .
ad
La funzione integranda hφi(x) φj (y)i, che può essere rimpiazzata dal suo sviluppo
operatoriale (4.12), è divergente per x → y (questa è una tipica divergenza ultravioletta della teoria quantistica dei campi). Nella formulazione su reticolo questa
divergenza non c’è, perchè la distanza minima tra i campi in giocoè data dal passo
58
!)
reticolare a. La relazione precedente appare divergente semplicemente perchè
abbiamo rimpiazzato la somma sui nodi del reticolo con un integrale. Tuttavia
conviene continuare ad utilizzare la notazione continua e regolarizzare l’integrale
limitando l’integrazione multipla alla regione |x − y| > a. Questo non cambia il
risultato finale ma rende più spediti i calcoli.
Applichiamo ora una RGT infinitesima che cambi il passo reticolare (= UV
cut-off) di un fattore s : a → s a = (1 + δt)a e chiediamoci come devono cambiare le costanti di accoppiamento gi affinchè Z rimanga invariata. È da notare che
la dipendenza da a compare sia esplicitamente nell’Hamiltoniana sia nel dominio
di integrazione per il fatto che |x − y| > a. La prima dipendenza dà, come si è già
visto nel caso del modello di LG,
gi → gi′ = sd−xi gi ≃ gi + (d − xi )gi δt.
(4.21)
La variazione di a nel dominio d’integrazione contribuisce ai termini di second’ordine nelle costanti di accoppiamento. Ponendo
Z Z
Z Z
Z Z
−
,
=
|x−y|>s a
|x−y|>a
a>|x−y|>(1+δt)a
il primo integrale ridà il termine di partenza in Z. Il secondo integrale si può
valutare esplicitamente utilizzando l’OPE e passando alle variabili di integrazione
:
u = x − y e z = x+y
2
Z Z
dd xdd y 12 cijk hφk iaxi +xj
gi gj
(4.22)
a2d |x − y|xi+xj −xk
a>|x−y|>s a
Z d
dz
cijk
hφk iaxk Ωd δt + O(δt2 ) ,
= gi gj
2
ad
d/2
2π
dove Ωd = Γ(d/2)
è l’angolo solido in d dimensioni. Questo termine può essere
riassorbito da una corrispondente variazione di gk :
1 X
gk → gk′ = gk − Ωd
cijk gi gj δt
(4.23)
2
ij
Combinando assieme le (4.21) e (4.23) si ha
d
1 X
dgk
≡ s gk = (d − xk )gk − Ωd
cijk gi gj
dt
ds
2
ij
Moltiplicando tutte le costanti di accoppiamento per il fattore 12 Ωd in definitiva
si ha
59
d
s ds
gk = (d − xk ) gk −
P
ij
cijk gi gj + O(gl3)
che è la forma standard delle equazioni del gruppo di rinormalizzazione al secondo
ordine perturbativo.
4.6 Il punto fisso di Wilson-Fisher
Possiamo applicare le equazioni del gruppo di rinormalizzazione testè ottenute al
modello di LG (4.8) utilizzando l’algebra di fusione (4.14-4.19) e ponendo, per
semplicità di notazione, t = r2o (che può essere identificata con la temperatura
ridotta) e u = uo /4!. Si ha, trascurando i termini del terz’ordine,
d
d+2
h=
h − 4ht + . . .
2
ds
d
s t = 2t − h2 − 4t2 − 24tu − 96u2 + . . .
ds
d
s u=
ǫu − t2 − 16tu − 72u2 + . . .
ds
s
(4.24)
(4.25)
(4.26)
dove ǫ = 4−d. Cerchiamo ora di vedere se, all’ordine perturbativo considerato, ci
sono altri punti fissi oltre a quello gaussiano (h = t = u = 0), cercando ulteriori
zeri dei secondi membri di queste equazioni. La prima dà h ≃ 0 13 . La seconda
dà, per successive iterazioni,
t = 48u2 + 12ut + O(t2 ) = 48u2 + 12u(48u2 + 12u(48u2 + · · · = O(u2) .
Inserendo questo risultato nella terza equazione si ottiene , se ǫ è piccolo, u∗ =
C’è dunque un nuovo punto fisso a
h = 0 , t = O(ǫ2 ) , u∗ =
ǫ
.
72
ǫ
72
Sviluppando le ultime due equazioni attorno a questo nuovo punto fisso, noto
come punto fisso di Wilson-Fisher, si ha, ponendo u = u∗ + δu e sviluppando al
prim’ordine in δu e t,
s
13
ǫ
d
t = 2t − 24u∗ t + · · · = (2 − ) t + . . .
ds
3
L’altra soluzione, t =
d+2
2 ,
ovviamente non è nel range perturbativo considerato.
60
(4.27)
d
u = −ǫδu + . . . ,
(4.28)
ds
il che ci permette di concludere che per d < 4 u è un accoppiamento irrilevante per il nuovo punto fisso, che dunque controlla, in base alla discussione del
§4.3, il comportamento a grande distanza del sistema critico per d < 4. Inoltre
dalla (4.27) si legge l’autovalore termico yt e quindi anche l’indice critico della
lunghezza di correlazione ν = 1/yt che dunque è
s
1
ǫ
+
+ O(ǫ2 ) .
2 12
Questa relazione è il primo termine di uno sviluppo perturbativo in ǫ (noto come
ǫ− expansion) che costituisce un metodo sistematico e molto potente per calcolare
gli indici critici. è stato calcolato finora lo sviluppo fino al quinto ordine. Ecco il
risultato per D = 2 e D = 3 per l’indice ν
ν=
D
2
3
ǫ−expansion
migliore stima
0.99 ± 0.04
1 (esatto)
0.6305 ± 0.0025 0.6330 ± 0.0013
Esercizio: Dimostrare che la costante di accoppiamento del termine φ6 in 4 − ǫ
dimensioni è irrilevante (al I ordine in ǫ) non solo rispetto al punto fisso gaussiano,
ma anche rispetto a quello di Wilson-Fisher.
4.7 Operatori ridondanti
Dall’analisi dell’algebra di fusione dei campi gaussiani (4.19) si vede che al secondo ordine nelle costanti di accoppiamento si sviluppa nell’equazioni del gruppo
di rinormalizzazione un termine di interazione φ3 che non era presente nell’Hamiltoniana originaria di LG.È immediato verificare che questo operatore è rilevante
per D = 4 dimensioni (vedere anche l’esercizio al § 3.1.4). Come mai questo
termine è stato trascurato? il motivo è una conseguenza di un principio elementare ma importante nella teoria dei campi quantistica e in meccanica statistica:
I campi che compaiono nell’Hamiltoniana sono semplicemente delle variabili di
integrazione, quindi possono essere rimpiazzate da una trasformazione di variabili
qualunque, detta field redefinition, purchè lo Jacobiano della trasformazione sia 1
e i limiti di integrazione nell’integrale funzionale siano gli stessi. È ora chiaro che
possiamo eliminare nell’Hamiltoniana del tipo
Z
Z
ro 2 v 3 u 4
d 1
2
H = d x[ (∇φ) + hφ + φ + φ + φ ] = dd xH ,
2
2
3
4
61
il termine φ3 con una semplice traslazione del tipo φ → φ + α dove α è una
costante opportuna, ridefinendo le costanti di accoppiamento ro e h.
Più in generale qualunque field redefinition comporta una ridefinizione e un riarrangiamento delle costanti di accoppiamento in gioco. Poichè queste ridefinizioni
non cambiano la fisica del sistema descritto, ciò implica che nello spazio delle
costanti di accoppiamento ci sono delle varietà generate dal gruppo di queste
trasformazioni i cui punti descrivono lo stesso stato fisico. Per esempio, se nella
trasformazione φ → φ + α supponiamo che il parametro di traslazione sia infinitesimo, la variazione al prim’ordine in α della densità Hamiltoniana H è δH =
α(h+ro φ(x)+vφ2 (x)+uφ3 (x)) che corrisponde alla seguente ridefinizione delle
costanti di accoppiamento:
h → h + αro , ro → ro + αv , v → v + αu .
Questa trasformazione infinitesima genera una curva (=varietà unidimensionale
dipendente dal parametro α) lungo cui la fisica del sistema rimane costante. la
tangente a questo tipo di curve è nota come variabile di scaling ridondante. Similmente l’operatore a cui si accoppia questa tangente (nel nostro caso δH) è detto
scaling operator ridondante.
4.7.1 Singolarità logaritmiche a D=4
Esattamente a D=4 l’equazione del gruppo di rinormalizzazione per u diventa, per
h = 0 e t = 0,
u̇ = −72 u2
(4.29)
dove si è posto u̇ = ddℓu con ℓ = log(s). Quet’equazione dice che u è marginalmente irrilevante rispetto al punto gaussiano, cioè va a zero molto lentamente.
Questa proprietà genera delle caratteristiche singolarità logaritmiche nelle funzioni termodinamiche per tutti i punti critici che non sono punti fissi, cioè t =
h = 0, ma u > 0. Per vederle spostiamoci leggermente sal punto critico considerando l’equazione
ṫ = 2t − 24 ut ,
(4.30)
dove i termini trascurati sono inessenziali.
E’ noto che la parte singolare della densità di energia libera soddisfa l’importante
equazione funzionale
f (t, u) = s−d f (t(s), u(s)) ,
62
da cui si ricavano tutte le leggi di scala delle funzioni termodinamiche. Scegliamo
ora il parametro ℓ = log(s) in modo che to = t(so ) = O(1) sia fuori dalla regione
critica. Qui si può usare l’approssimazione di campo medio (o di Landau) e porre
f (to , u(so) = V (ϕo ) = −
Perciò
f (t, u) = −
t2o
.
u(so )
t2o
.
s4o u(so )
Bisogna ora esprimere so e u(so) come funzioni di u e t. L’integrazione della
(4.29) dà
u
u(so ) =
1 + cℓo
dove si è posto c = 72u e ℓo = log so . Inserendo questa soluzione nella (4.30) si
ottiene
1
to
log = 2ℓo − log(1 + cℓo ) .
t
3
Questa equazione trascendente si può risolvere iterativamente, tenendo conto che
to
si può prendere grande a piacere (perchè?). Si ha
t
2ℓo = log
to 1
c
to
+ log(1 + log ) + . . .
t
3
2
t
Inserendo questo nell’espressione trovata per f (t, u) si ha
f (t, u) ∝ −t2 (1 +
to 1
c
log ) 3
2
t
e quindi il calore specifico è
C=−
1
d2
f (t, u) ≃ | log(t/to )| 3 .
dt
Dunque ha una singolarità logaritmica. È da notare che questa singolarità è prec
sente solo se u = 72
6= 0, cioè solo se il punto critico non coincide con il punto
fisso.
Queste singolarità logaritmiche hanno lo stesso carattere di universalità degli
indici critici e sono segnali tipici delle dimensioni critiche superiori.
63
5 Rottura spontanea di simmetrie continue
In fisica classica, l’invarianza dell’azione per effetto di un gruppo di Lie di trasformazioni (dette impropriamente nella letteratura fisica simmetrie continue, cioè
dipendenti con continuità da uno o più parametri reali) è strettamente legato all’esistenza di leggi di conservazione. Questo è particolarmente evidente nella teoria
dei campi classica, dove il teorema di Noether (v. §5.1) associa una corrente
conservata ad ogni generatore infinitesimo della simmetria. Queste leggi di conservazione non sono necessariamente valide nei corrispondenti sistemi quantistici
per due ordini di motivi. Innanzitutto, affinchè una simmetria classica sia elevata
a simmetria della teoria quantistica, occorre che anche la misura di integrazione
dell’integrale funzionale sia invariante. Se questo non succede, si dice che c’è
un’anomalia nella teoria e la simmetria in questione di fatto non vale per il sistema reale (cioè quantistico).
Il secondo motivo che può non permettere di associare una legge di conservazione a una simmetria è il fenomeno della rottura spontanea di una simmetria di
Lie. In questo caso, pur essendo la teoria invariante per queste trasformazioni
anche a livello quantistico (assenza di anomalie), alcune delle cariche conservate classicamente non sono ben definite quantisticamente, per la presenza nello
spettro della fase a simmetria spontaneamente rotta di eccitazioni di massa nulla
(modi di Goldstone, v. §5.2). La presenza di queste eccitazioni di massa nulla
è un fenomeno molto generale che si osserva sia nei sistemi descritti dalla teoria
quantistica dei campi, sia nei sistemi statistici.
5.1 Teorema di Noether
Consideriamo nello spazio di Minkowski un’ azione S = S[φa ] di un arbitrario
sistema fisico invariante rispetto a un gruppo di Lie G di ordine n che trasforma
il campo o parametro d’ordine φa come un multipletto di una rappresentazione
irriducibile di dimensione m di G (per esempio: G = O(N), n = N(N − 1)/2,
φa vettore di O(N), a = 1, . . . N ≡ m). Una trasformazione infinitesima di
parametro ǫi (i = 1, . . . n) mappa φa in φ′a = φa (x) + δφa (x) , (a = 1, . . . m)
con
δφa (x) = ǫi Tai b φb (x) ,
(5.1)
dove T i denota un generatore infinitesimo del gruppo G. Poichè per ipotesi questa
trasformazione è una simmetria, la corrispondente variazione δS dell’azione è
nulla. Se però assumo che ǫi anzichè essere costante è una funzione arbitraria di
64
x l‘azione non è più invariante. Se come al solito S dipende solo da φa e dalle sue
derivate prime, δS ha necessariamente la forma
Z
Z
4 µ
i
δS = dx ∂ ǫi (x)jµ = − dx4 ǫi (x)∂ µ jµi .
E’ facile ora verificare che se si utilizzano le equazioni del moto la corrente jµi
è conservata. Infatti tali equazioni implicano δS = 0 per una variazione δφ
arbitraria del campo φ , e quindi in particolare per una variazione del tipo (5.1).
Poichè ǫi (x) è una funzione arbitraria di x, si hanno le leggi di conservazione
∂ µ jµi = 0 ,
dalle quali si possono ottenere n costanti del moto (Teorema di Noether)
Z
i
Q = d3 x joi .
(5.2)
(5.3)
5.2 Modi di Goldstone
Consideriamo in particolare una teoria invariante rispetto a un gruppo O(N) in
cui il parametro d’ordine e’ un campo φa (a = 1, . . . N) che si trasforma come un
vettore di O(N). Accendiamo nel sistema un ”campo magnetico” esterno ha che
provoca una rottura esplicita della simmetria. Indichiamo
con Ho [φ] l’Hamiltoniana
R
del sistema invariante e con H[φ, h] = Ho [φ] − dxd φa (x)ha l’Hamiltoniana perturbata. Poichè la funzine di partizione
Z Y
Z=
Dφa e−βH = e−βF
a
non dipende dalle variabili di integrazione φa , l’energia libera di Helmoltz F
dipende solo dal campo esterno ha . Vista la forma con cui appare il campo esterno
nell’Hamiltoniana pertubata è chiaro che se noi associamo ad ogni rotazione del
parametro d’ordine φa un’ analoga rotazione del campo esterno, il sistema complessivo è ancora O(N) invariante 14 . Quindi, se ha e’ costante, F non puo’ che
Il campo esterno ha fa parte dell’apparato che misura la risposta del sistema ad una perturbazione che rompe esplicitamente la simmetria. Il gruppo O(N ) che ruota simultaneamente φa e
ha è quindi una simmetria del sistema + apparato di misura.
14
65
qP
N
2
dipendere dal modulo |h| =
a=1 ha . La densita’ di energia libera f = F/V
avra’ uno sviluppo in serie di Taylor del tipo
1
f = f (h) = f (0) − |h|m − χL |h|2 + O(|h|3)
2
dove m e’ la magnetizzazione spontanea che per comodita’ scegliamo nella di∂f
) e χL e’ la suscettivita’ nella stessa
rezione N (m = hφN i ⇒ m = − ∂h
N
direzione. Supponiamo ora di raggiungere la fase a simmetria spontaneamente
rotta nel modo seguente
hN = h, ha = 0, a 6= N, h → 0+
⇒ hφa i = mδaN .
Vogliamo ora far vedere che nella fase a simmetria spontaneamente rotta esistono delle eccitazioni di massa nulla (cioe’ caratterizzate una lunghezza di correlazione ξ → ∞). Poiche’ la suscettivita’ diverge in presenza di eccitazioni
di massa nulla (come si e’ gia’ osservato nei sistemi magnetici), calcoliamoci la
suscettivita’ χab , definita dalla relazione:
χab ≡ −
χab
∂
=−
∂ha
Poiche’ ha = hδaN ⇒
⇓
ha hb ∂ 2 f
∂f
∂ hb
=− 2
−
=
2
|h| ∂|h|
∂ha |h| ∂|h|
ha hb ′′
ha hb 1 ′
= − 2 f − δab −
f
|h|
|h|2 |h|
hb ∂f
|h| ∂|h|
∂2f
∂ha ∂hb
χab = −f ′′ δaN δbN − (δab − δaN δbN )
= δab [χL + χT (1 − δaN )]
1 ′
f
|h|
m
1
χL = −f ′′ , χT = − f ′ =
h
h
In altre parole, la suscettivita’ trasversa χT = χaa , (a 6= N) diverge per h →
0+ , m 6= 0. Dunque nella fase a simmetria spontaneamente rotta, fuori dal punto
66
critico (m 6= 0) ci sono delle correlazioni a lungo raggio (χT → ∞ ⇒ ξ →
∞) corrispondenti a eccitazioni o quasiparticelle di massa nulla (ξ → ∞) con i
numeri quantici del sottogruppo di stabilita’ O(N − 1) (cioe’ la parte di simmetria
non spontaneamente rotta).15
Le eccitazioni a massa nulla che abbiamo individuato si dicono bosoni o modi
di Goldstone. Questo fenomeno che ora abbiamo descritto e’ del tutto generale:
ogni qual volta una simmetria continua si rompe spontaneamente, in tutta la fase
a simmetria spontaneamente rotta si propagano delle eccitazioni a massa nulla.
Ad esempio i fononi di un cristallo possono essere considerati come i bosoni di
Goldstone della rottura spontanea dell’invarianza per traslazioni del sistema nella
fase solida.
Vediamo di capire in modo piu’ intuitivo l’origine di questo fenomeno: quando
la simmetria spontaneamente rotta e’ un gruppo continuo, gli stati fondamentali
( o vuoti) della teoria sono degeneri e formano un insieme continuo che si puo’
etichettare con i parametri del gruppo. Consideriamo come esempio una semplice
generalizzazione del modello di Landau-Ginzburg, in cui il parametro d’ordine,
anziche’ essere un campo reale φ(x) e’ un campo complesso ψ(x) e scriviamo
l’Hmiltoniana nella forma
Z
1
3
2
2
HLG [ψ] = d x
|∇ψ| + V (|ψ| ) .
2
In questo caso il gruppo di simmetria e’ il gruppo U(1) generato dalle trasformazioni
ψ(x) → ψ ′ (x) = eiα ψ(x) .
Nel caso di rottura spontanea di questa simmetria ogni vuoto puo’ essere etichettato con un parametro angolare α:
hψi = ψo = ρo eiα
HLG [ψ] e’ minimo per ψ = ψo .
Consideriamo ora una configurazione che interpoli tra due vuoti differenti:
supponiamo ad esempio che ψ(x) = ρo per x1 ≪ −A e ψ(x) = ρeiαo per x1 ≫
A, dove x1 è una delle coordinate del sistema.
Possiamo interpolare queste due configurazioni ponendo
ψ(x) = ρo eiθ(x)
L’identita’ che abbiamo trovato tra χT e m
h e’ un tipico esempio di identita’ di Ward, cioe’
identita’ tra funzioni di correlazione che derivano dall’invarianza rispetto a un gruppo di trasformazioni; queste identita’ giocano un ruolo molto importante nella teoria quantistica dei campi.
15
67
con θ(x) come opportuna funzione interpolante.
Se inseriamo questa configurazione nell’Hamiltoniana, l’unico termine che
risente della presenza di θ(x) e’ il termine cinetico |∇ψ|2 . Tutti gli altri termini
dell’eq. di LG sono funzioni di |ψ(x)| = ρo . Poiche’ ∇ψ(x) = ρo eiθ(x) ∇θ(x), si
ha
Z
Z
ρ2o
3 1
2
HLG [ψ] − HLG [ψo ] = d x |∇ψ(x)| =
d3 x(∇θ(x))2 = ∆E . (5.4)
2
2
Quindi nella fase a simmetria spontaneamente rotta (ρ > 0), quanto piu’ A e’
grande16 , tanto piu’ il gradiente di θ puo’ essere reso piccolo, ⇒ esistono delle
eccitazioni che interpolano tra diversi vuoti che hanno un’energia ∆E tanto piu’
piccola quanto piu’ grande e’ la loro lunghezza d’onda 17 : sono questi i bosoni
di Goldstone. Detto in altri termini, θ(x) descrive un campo di massa nulla, in
quanto θ contribuisce a HGL solo con il termine cinetico (∇θ)2 .
Vediamo ora un approccio piu’ sistematico: Scriviamo esplicitamente l’Hamiltoniana HGL per una teoria O(N) invariante
)
( N
Z
X
X
X
X
r
u
1
o
o
(∇φa )2 + (
φ2a ) + (
φ2a )2 −
ha φa
HGL [φa ] = dD x
2 a
2 a
4! a
a
Sia φao una configurazione di minimo; ponendo ha = hδaN si ha:
hφa i = φo δaN , ro φo +
uo 3
φ = h (condizione di minimo)
3! o
Per studiare lo spettro delle eccitazioni (quantistiche) di energia piu’ bassa basta
porre φ(x)a = φao + φ̄a (x), dove φ̄a descrive una perturbazione dello stato fondamentale. Poiche’HGL ha un minimo per φ(x) = φo , non compaiono termini
lineari in φ̄.
HGL [φ] = HGL [φo ] + H̃GL [φ̄]
Separiamo le N direzioni in una longitudinale a = N e N − 1 trasversali t =
1, 2 . . . N − 1
X
X
(∇φ̄a )2 =
(∇φ̄t )2 + (∇φ̄N )2
a
X
a
t
(φ̄a )2 =
X
(φ̄t )2 + φ̄2N
t
16
Qui la scala delle lunghezze dipende dal valore della differenza di fase αo tra i due vuoti.
La trasformata di Fourier del gradiente ∇ e’ il numero d’onda k = 2π/λ, dove λ ∝ A e’ la
lunghezza d’onda dell’eccitazione che interpola tra i due vuoti.
17
68
(
X
φ2a )2 = (
a
φ4N
X
φ̄2t )2 + 2
t
4
= (φo + φ̄N (x)) =
4φ̄N (x)φ3o
X
φ̄2t φ2N + φ4N
t
+
φ4o
+ 6φ2o φ̄2N (x) + 4φo φ̄3N (x) + φ̄4N
I termini lineari si devono cancellare per la proprieta’ di minimo di H.
Z
h1
µ2 X 2
1X
µ2
D
(∇φ̄t )2 + T
φ̄ +
⇒ H̄GL [φ̄] = d x (∇φ̄N )2 + L φ̄2N +
2
2
2 t
2 t t
+
dove
X
g3
uo
uo X 2 2 i
g3
φ̄N
φ̄2t + φ̄3N + φ̄4N + (
φ̄a )
3!
3!
4!
4!
t
a
1
1
µ2L = ro + uo φ2o , µ2T = ro + uo φ2o , g3 = uoφo .
2
3!
Utilizzando la condizione di minimo
ro φ o +
uo 3
φ =h
3! o
h
h
− 2ro , µ2T =
φo
φo
Poiche’ nella fase a simmetria spontaneamente rotta ro < 0, si ha µL > µT . Nel
limite uo → 0 possiamo utilizzare i risultati del modello gaussiano: la teoria e’ la
somma di un campo libero longitudinale che ha un correlatore, nello spazio degli
impulsi, della forma
1
GL (p) = 2
p + µ2L
⇒ µ2L = 3
e N − 1 campi di correlatore
GT (p) =
1
1
=
2
p2 + µ T
p2 + h/φo
Nel limite h → 0 questi N − 1 campi descrivono eccitazioni di massa 0 dette
appunto bosoni di Goldstone. Si dice teorema di Goldstone l’affermazione che la
fase a simmetria spontaneamente rotta di un gruppo continuo contiene eccitazioni
di massa nulla. Il metodo che abbiamo usato è un metodo molto generale che si
puo’ applicare ogniqualvolta si sappiano trattare perturbativamente le fluttuazioni
attorno a un vuoto della teoria.
69
5.3 Dimensione critica inferiore
È noto (v. la parte del corso sui sistemi critici) che l’approssimazione di campo
medio e’ tanto migliore quanto piu’ la dimensionalita’ dello spazio e’ alta , e si
definisce dimensione critica superiore la dimensione spaziale in cui la descrizione
del comportamento critico data dal campo medio è esatta. Al contrario, le fluttuazioni di un sistema attorno una configurazione di equilibrio sono tanto piu’
importanti quanto piu‘ la dimensione dello spazio è bassa. Queste fluttuazioni
tendono ovviamente a disordinare il sistema e quindi ad abbassare la temperatura
di transizione verso la fase ordinata; se la dimensione è minore o uguale a un
valore critico dc detto dimensione critica inferiore la temperatura di transizione
si riduce a zero, per cui il sistema non possiede una fase a simmetria spontaneamente rotta. Per il modello di Ising e per tutti modelli con una simmetria discreta
e con interazioni a corto raggio si ha dc = 1, mentre per i modelli con simmetria
continua risulta dc = 2.
Benchè le afferamzioni precedenti si possano dimostrare rigorosamente, qui
ci si contenta di darne una giustificazione plausibile con dei semplici argomenti
intutivi basati sul costo necessario, in termini di energia libera F = E − T S, per
disordinare una fase ordinata.
Consideriamo come primo esempio un modello
di Ising unidimensionale su
P
reticolo, definito dall’ hamiltoniana H = −J i σi σi+1 e supponiamo che il sistema sia in una fase ordinata con σ = +1. Qual’e’ il costo in energia libera per
creare un domino di dimensione ℓ di magnetizzazione opposta attorno a un dato
sito j in cui si è posto σj = −1 ? Ognuno dei due estremi del dominio contribuisce
con un energia E = 2J, ma il domino puo’ occupare ℓ posizioni diverse attorno
a j, percio’ ∆S = κ log ℓ e quindi ∆F ∼ 4J − κT log ℓ. In conclusione, la formazione di in tale dominio per ℓ sufficientemente grande e T arbitrario produce
sempre un abbassamento di F per ogni valore di T e la fase ordinata non puo’
essere stabile. Viceversa in due dimensioni l’energia di un dominio di perimetro ℓ
è E ∼ 2Jℓ. Per calcolarne l’entropia consideriamo il bordo del dominio come un
cammino casuale chiuso che ad ogni passo, nel reticolo quadrato, ha al massimo
tre possibilità (perchè non può tornare su se stesso), perciò il numero possibile di
configurazioni è circa cℓ , con c < 3. Quindi ∆F = 2Jℓ − κT ℓ log c e a temperature sufficientemente basse la fase ordinata è stabile rispetto alla formazione di
domini di spin opposto.
Se la simmetria è continua il discorso è un po’ diverso. Possiamo, per fare
un esempio concreto, considerare un modello con simmetria O(3), sostituendo
nell’ hamiltoniana di Ising al posto del segno σi un vettore σ~i . Se si forma un
70
dominio di dimensione ℓ che possiede al centro uno spin di verso opposto rispetto
a quelli della frontiera, gli spin intermedi hanno a disposizione una distanza O(ℓ)
per interpolare, col minor costo energetico possibile, lo spin al centro con quelli
alla frontiera. L’angolo relativo tra due spin contigui (che è la grandezza che interviene nell’ hamiltoniana) è dell’ordine di π/ℓ e la densità di energia (che è
∝ (∇θ)2 , vedi l’eq.(5.4)) è O(1/ℓ2). Questa dà un’energia totale, in d dimensioni, E = O(ℓd−2 ) per un dominio il cui volume è O(ℓd ), da compararsi con
O(ℓd−1 ) nel caso di simmetria discreta. Questo significa che gli effetti entropici
sono sempre dominanti per d ≤ 2.
L’argomento intuitivo precedente è corroborato dal teorema di Mermin- WagnerHohenberg (noto in teoria dei campi come teorema di Coleman) che stabilisce in
modo rigoroso che a temperatura 6= 0 non ci puo’ essere rottura spontanea di una
simmetria continua (cioè con un valore di aspettazione non nullo del parametro
d’ordine) in dimensioni d ≤ 2 nei modelli con accoppiamenti a corto raggio.
Una motivazione semplice per giustificare questo teorema da un altro punto di
vista è che non possono esistere modi di Goldstone in d ≤ 2 dimensioni. Infatti il
correlatore di un campo di massa nulla in d = 2 soddisfa l’eq. (3.3) che nel limite
limite continuo diventa
−∆G(x, y) = δ(x)δ(y)
1
la cui unica soluzione a simmetria radiale18 è G(x, y) = c − 2π
log r, (c è una
costante arbitraria) che è divergente a grandi distanze (divergenza infrarossa) ed
è sorgente di inconsistenze, perchè come si è già visto al § 3.1.2 ,il correlatore
dovrebbe essere sempre positivo. Analogamente in una dimensione il correlatore
soddisfa l’equazione
d2
G(x) = −δ(x) ,
dx2
è anch’essa divergente infrarossa. In conclusione
la cui soluzione G(x) = c − |x|
2
i modi di Goldstone in d ≤ 2 dimensioni non possono esistere e quindi neanche il
vuoto in cui si propagano, cioè una fase a simmetria spontaneamente rotta, la cui
esistenza richiede necessariamente anche quella dei modi di Goldstone.
2
∂
∂
∂
Infatti il laplaciano in coordinate polari (r, φ) è ∆f = 1r ∂r
(r ∂r
f )+ r12 ∂φ
2 f , da cui, ponendo
1 d
1
∂
∂φ G = 0, si ha G(r) ∝ log r. Poichè ∆ log r = r dr θ(r) = r δ(r), si ha δ(x)δ(y)dxdy =
18
δ(r)dr dφ
2π , come si puo’ verificare integrando su una funzione di prova entrambi i membri. Si
ottiene la normalizzazione riportata nel testo
71
5.4 Il modello XY bidimensoniale
Il modello XY è un modello con simmetria U(1)=O(2) ottenuto assegnando ad
ogni nodo j di un reticolo in d dimensioni un vettore unimodulare bidimensionale
Sj = eiθj ≡ (xj = cos θj , yj = sin θj ) ; il suo nome deriva banalmente dal fatto
che le componenti cartesiane che definiscono in ogni nodo il vettore sono x e y. È
una generalizzazione diretta del modello di Ising, che si otterrebbe limitando θ ai
due valori 0 e π, mentre i questo modello 0 ≤ θ ≤ 2π. L’Hamiltoniana è
X
KX
Si Sj⋆ + Si⋆ Sj = −K
cos(θi − θj ) .
(5.5)
H=−
2
hiji
hiji
in d=3 il modello ha una transizione ordine-disordine che è nella stessa classe di
universalità del punto lambda dell’elio superfluido.
Qui studiamo il caso in due dimensioni, che è di grande interesse teorico per
vari motivi.
Innanzi tutto questo modello bidimensionale, in base al teorema di MerminWagner - Hohenberg, non può avere una rottura spontanea di simmetria, il che
non esclude che abbia una transizone di fase. La funzione di partizione è
Z 2π Y
Z=
dθj e−H
(5.6)
0
j
dove la temperatura è inglobata in K ∝ 1/T . A bassissima temperatura, cioè K
molto grande, il sistema tende ad ordinarsi e gli angoli θi − θj sono molto piccoli,
per cui, a parte una costante moltiplicativa, la funzione di partizione è dominata
dal termine gaussiano nello sviluppo del coseno. che nella notazione del continuo
diventa
Z
1
K X
∂α θ(x)∂ α θ(x) − (∂α θ(x)∂ α θ(x))2 + . . .
(5.7)
H = d2 x
2 α=1,2
4!
D’accordo con la (4.7), K è un accoppiamento marginale, ma non può essere
riassorbito in una ridefinizione del campo θ che è un angolo e quindi varia da 0 a
2π; dunque l’equazione del gruppo di rinormalizzazione par essere
a
d
K ≡ K̇ = 0 .
da
(5.8)
È anche facile verificare, utilizzando il metodo usato per ricavare la (4.9), che i
termini di ordine superiore nello sviluppo (5.7) corrispondono a costanti di accoppiamento irrilevanti, dunque per ogni valore di K (purchè abbastanza grande,
72
come vedremo) le traiettorie del gruppo di rinormalizzazione fanno fluire il sistema verso un punto fisso gaussiano. L’Hamiltoniana di punto fisso è
Z
K
⋆
(5.9)
H = d2 x ∂α θ∂ α θ .
2
Cominciamo col calcolarci il correlatore
hSx Sy⋆ i = heiθx −iθy i = eG(x−y)−G(0) ,
dove si è usata la (4.2) con Bx = −By = i. Ricordando poi che il correlatore
gaussiano bidimensionale è dato da 19
hθx θy i ≡ G(x − y) = c −
si ha
hSx Sy⋆ i =
1
log |x − y| ,
2πK
C
.
|x − y|1/2πK
(5.10)
Questa legge di potenza mostra che il sistema è critico e l’esponente magnetico
η=
1
2πK
(5.11)
varia con continuità con K, il che corrisponde ad un comportamento molto diverso
rispetto ai sistemi fisici finora studiati.
Ci sono però delle configurazioni in θ di cui lo sviluppo (5.7) non tiene conto:
i vortici. Come avevamo già visto nell’elio superfluido, nel limite continuo un
vortice centrato nel punto (xo , yo ) di un sistema di riferimento cartesiano è dato
da
θ(x, y) = n α = n arctan[(y − yo)/(x − xo )] ,
dove l’intero relativo n è la vorticità e α è l’angolo delle coordinate polari con
origine nel centro del vortice. A grande distanza dal suo centro un vortice è lentamente variabile e quindi contribuisce a (5.7) e per una semplice ragione topologica
più volte discussa, questa configurazione è stabile e non si può trascurare il suo
contributo alla funzione di partizione anche quando K è grande, nonostante in
prossimità del suo centro vari rapidamente.
19
La costante K davanti al logaritmo è dovuta al fatto che l’Hamiltoniana gaussiana non ha la
normalizzazione canonica 12 ma K
2 .
73
Con un conto analogo a quello fatto per l’elio superfluido si può facilmente
calcolare l’energia di un vortice tenendo conto che dall’equazione precedente si
ha ∂α θ(~x)∂ α θ(~x) = 1/r 2 dove r è la distanza di x dal centro del vortice si ha
E = n2 πK log L/b ,
(5.12)
dove L è la dimensione lineare del vortice e b è un parametro che fissa la scala
microscopica al di sotto della quale le considerazioni topologiche sulle condizioni
di continuità del vortice non valgono più. Perchè l’energia totale sia finita occorre
che la vorticità totale sia zero. Vediamo ora quando le configurazioni di vortice
sono termodinamicamente stabili. Supponiamo che il sistema possa essere descritto da un gas rarefatto di vortici e che ogni vortice abbia a disposizione un
dominio di area L2 . Il numero di configurazioni a sua disposizione è L2 /a2 dove
a è il passo reticolare;la sua energia è data dalla (5.12), dunque la variazione di
energia libera dovuta alla creazione di un vortice è
∆F
= n2 Kπ log L/b − 2 log L/a ,
κT
(5.13)
dunque per K ≤ KKT ≡ π2 i vortici di vorticità 1 sono stabili. Questo valore
critico di K, detto punto di Kosterlitz-Thouless (KT), è il punto teminale della
linea di punti fissi gaussiani e il sistema per K > KKT si comporta in maniera
diversa come ora vedremo.
Per tener conto anche della presenza dei vortici, conviene passare al formalismo gran canonico, con una grand partition function Q che dipende oltre che da
K anche dalla fugacità yo che controlla il numero di vortici
Q = Zgauss + Z2 yo2 + Z4 yo4 + . . .
dove il termine del prim’ordine in yo non c’è per la condizione sulla vorticità totale
nulla. Possiamo riscrivere l’equazione precedente in forma più dettagliata:
Z
2
Q = Zgauss + yo d2 x d2 ye−E(x,y) + . . .
(5.14)
dove E(x, y) è l’energia (libera) di due vortici con vortcità opposta con centro in
x e y. La dimensione di questi vortici è dell’ordine della loro mutua distanza e
la loro energia totale è, per grandi distanze, approssimativamente la somma delle
loro energie
E(x, y) = 2π K log |x − y|/c ,
74
dove c è una costante opportuna. Si può osservare una forte somiglianza della
(5.14) con la (4.20) e la (4.22) che consente di leggere le dimensioni di scala xyo
di yo . Possiamo riassorbire tutte le varie costanti moltiplicative in gioco nella
nuova fugacità y, per cui, utilizzando la (4.21), possiamo scrivere
a
d
y ≡ ẏ = (2 − xy ) y = (2 − πK) y = x y ,
da
dove x è la costante di accoppiamento che conviene usare al posto di K, dato che si
annulla proprio a KKT . L’equazione precedente ci dice che y diventa rilevante per
K > KKT e quindi i vortici vengono prodotti in coppia e il sistema si comporta
nell’infrarosso come un gas di vortici. È da notare che i vortici di vorticità n > 1
corrispondono a costanti di accoppiamento irrilevanti a KKT , come si verifica
immediatamente dalle formule precedenti. Continuando con l’analogia alle (4.20)
e (4.22) e la corrispondente OPE, si vede che la fusione di due operatori locali che
descrivono la creazione di vortici genera come operatore φk l’identità, che può
essere riassorbito con una modifica (infinitesima) della normalizzazione, e quindi
in una mdifica di K e dunque di x. La (4.21) suggerisce quindi ẋ = A y 2 dove A è
una costante positiva. In conclusione le equazioni del gruppo di rinormalizzazione
nell’intorno del punto KT si possono scrivere nella forma
ẏ = x y
ẋ = A y 2
(5.15)
(5.16)
Queste sono le equazioni di Kosterlitz. E’ importante la simmetria rispetto a y →
−y che assicura che i vortici siano prodotti in coppia ed esclude la presenza di
altri termini del secondo ordine in queste equazioni.
Dividendo membro a membro le due equazioni possiamo ricavare la forma
generale delle traiettorie del RG
ẏ/ẋ ≡
dy
x
=
⇒ A y 2 − x2 = c ,
dx
Ay
che chiaramente formano un fascio di iperboli. Per c < 0 esse tagliano l’asse
delle x. Nel semipiano x < 0 il verso di percorrenza è verso il basso, come vuole
la (5.15), e terminano lungo la semiretta y = 0, x ≤ 0 formata dai punti fissi
gaussiani. La traiettoria
√
A y + x = 0, y ≤ 0
(5.17)
è la linea di separazione tra la regione critica (ξ = ∞) controllata dalla linea di
punti fissi e il resto, controllato da un punto fisso ad alta temperatura che non si
75
ξ<∞
y
ξ=∞
KT
x
Figure 3: Le traiettorie del gruppo di rinormalizzazione di Kosterlitz
76
può rappresentare nello stesso diagramma dei flussi, che è valido solo per x e y
piccoli. Il punto fisso di KT, rappresentato dall’origine nel piano xy, è caratterizzato da valori razionali degli esponenti critici η e δ, infatti ponendo K = KKT
nella (5.11) e ricordando che δ = (d+2−η)/(d−2+η) si ottiene η = 41 e δ = 15.
Viceversa ν non è definito (o vale ∞) perchè la legge con cui diverge ξ non è una
legge di potenza. Per studiare con che legge ξ diverge, scegliamo un dato modello
XY di partenza, ad es. quello definito dalla (5.5). Pochè questo modello dipende
da un sol parametro, esso sarà rappresentato da una curva nel piano xy (si veda
la linea tratteggiata in figura). Poniamoci subito al di sopra della linea critica di
KT (5.17); in questa regione le traiettorie si possono descrivere con le iperboli
Ay 2 − x2 = αt, dove t ha il ruolo di temperatura ridotta, in quanto il sistema
diventa critico a t = 0. Queste traiettorie possono far evolvere il sistema da un
valore iniziale x = x(0) negativo a un valore finale x(ℓ = log s) > 0 che conviene scegliere dell’ordine O(1). L’equazione (5.16) lungo la suddetta traiettoria
dà
dx
ẋ = α t + x2 , ⇒ dℓ = 2
,
x + αt
da cui
Z ∞
Z ℓ
Z x(ℓ)
dz
1
π
dx
≃√
= √ , (t → 0) .
dℓ =
2
2
α t −∞ z + 1
αt
0
x(0) x + α t
Combinando questo risultato con la nota equazione funzionale per ξ
ξ(x(ℓ), y(ℓ)) ≡ ξo = ξ(x(0), y(0))/ exp[ℓ] ≡ ξ/s
si ha
√
ξ = ξo eπ/
αt
,
(5.18)
dunque ξ diverge secondo una precisa legge esponenziale.
5.4.1 Trasformazione di dualità
Il fattore di Boltzmann associato ai link nel modello XY è una funzione periodica
di periodo 2π, e quindi si può sviluppare in serie trigonometrica. In particolare
per il modello (5.5) si ha
X
eK cos(θi −θj )) =
Imij (K) ei mij (θi −θj )
(5.19)
mij ∈Z
77
j2
mij2
h1
h2
j3
mij3
i
h3
j1
mij1
h4
mij4
j4
Figure 4: I quattro link incidenti sul nodo i e i quatto siti del reticolo duale le cui
variabili consentono di risolvere il vincolo (5.22)
dove le In (z) = I−n (z) sono le funzioni di Bessel modificate. Per i nostri scopi ci
basta sapere che per K grande
In (K)/I0 (K) ∼ e−n
2 /2K
, (K ≫ 1) .
(5.20)
Inserendo questo sviluppo nella funzione di partizione (5.6) si possono integrare
esplicitamente tutte le θ; infatti la variabile θi compare solo nei quattro link che
incidono sul nodo i (si veda la figura)
( P
Z 2π
0
mijn 6= 0
dθi eiθi (mij1 +mij2 +mij2 +mij3 +mij4 ) =
(5.21)
Pn
1
0
n mijn = 0
Integrando su tutti i nodi si può riscrivere la Z nella forma
Z=
′
Y X
hiji mij ∈Z
Imij (K) ∼
I0links
′
Y X
hiji mij ∈Z
2
emij /2K (K ≫ 1)
dove ora le configurazioni su cui si somma sono i numeri interi relativi mij associati ai link e l’apice nella somma sta ad indicare che queste somme non sono
libere, ma devono soddisfare in accordo con la (5.21) il vincolo
4
X
n=1
mijn = 0 , ∀ i .
78
(5.22)
Un modo semplice per risolvere automaticamente questo vincolo su tutti i nodi
nel reticolo quadrato infinito consiste nel prendere in considerazione il reticolo
duale (che è costuito asegnando un nodo al centro di ogni quadrato elementare del
reticolo diretto) e di assegnare ad uno dei suoi nodi un intero arbitrario e quindi
assegnare ad ogni altro nodo un intero hj scelto in modo che la differenza hj − hl
coincida con l’intero mjl associato al link corrispondente del reticolo diretto. Per
esempio nel caso rappresentato in figura si ha mijn = hn − hn−1 . È immediato
verificare che
1. In un reticolo infinito si ha per ogni configurazione {mij } di tutti i link del
reticolo diretto una configurazione {hl } associata ai nodi del reticolo duale,
definita a meno di una costante additiva che è il valore arbitrario del primo
nodo duale scelto
2. Il vincolo (5.22) è automaticamente soddisfatto per ogni nodo del reticolo
diretto
3. La funzione di partizione si può scrivere nella forma
Z=
∞
Y
Y X
i
hi =−∞ hiji
Ihi −hj (K)
4. In questa nuova forma la simmetria manifesta del modello non è più U(1),
ma Z.
5. Interpretando hi come la distanza del quadrato elementare di posizione i =
(x, y) dal piano z = 0, ogni configurazione {hj } rappresenta una superficie
h = f (x, y).
6. A bassa temperatura (K grande) il fattore di Boltzmann è dominato in base
alla (5.20) dal termine gaussiano
e−
P
2
hiji (hi −hj ) /2K
,
quindi per K grande anche la differenza hi − hj può essere grande, perciò
le configurazioni dominanti sono rappresentate da superfici molto rugose
o rough. Tutta la regione critica del modello XY, caratterizzata da una
variabile θ lentamente variabile corrisponde alla fase rough delle superfici.
Viceversa la regione non critica, dove vengono liberati i vortici corrisponde
a superfici lisce o smooth. La transizione di KT viene detta in questo linguaggio roughening transition.
79
Questa transizione è ubiquitaria i natura. Si può osservare ad esempio nella superficie di crescita dei cristalli o nelle interfacce di separazione tra fasi differenti.
Un esempio concreto e molto studiato si ha nel modello di Ising tridimensionale
a bassa temperatura. Supponiamo di fissare le condizioni al bordo in modo che
nel piano z = ∞ tutti gli spin siano S = +1 e nel piano z = −∞ siano invece S = −1; si formerà necessariamente un’interfaccia che separa le due fasi
con magnetizzazione opposta. A T → 0 l’interfaccia che minimizza l’energia
libera sarà un piano ortogonale all’asse z; l’energia non dipende dalla posizione
dell’interfaccia. Man mano che la temperatura aumenta cominceranno a contribuire anche le interfacce formate da superfici lentamente variabili: la loro energia interna aumenta ma aumenta anche la loro entropia. Ad un valore critico
TR della temperatura, che è notevolmente più basso della temperatura di smagnetizzazione di Curie Tc , avviene la transizione di roughening, caratterizzata da
interfacce rapidamente variabili e fluttuanti.
Alcune osservazioni finali:
• La trasformazione di dualità è una tipica trasformazione dei modelli con
simmetria abeliana che generalizza la trasformazione di Kramers-Wannier
già vista nel modello di Ising bidimensionale.
• Essa consiste essenzialmente nel rimpiazzare le variabili di gruppo con variabili associate alle rappresentazioni irriducibili.
• Solo nei gruppi abeliani il duale G⋆ di un gruppo G, cioè l’insieme delle sue
rappresentazioni irriducibili, forma a sua volta un gruppo (necesariamente
abeliano).
• (G⋆ )⋆ = G
• U(1)⋆ = Z, Z⋆N = ZN , R∗ = R
5.5 Il modello O(n > 2) in 2 dimensioni
La transizione di KT non è una transizione ordine-disordine, ma è prodotta dalla
presenza di vortici, cioè di configurazioni non banali e topologicamente stabili.
Un vortice è caratterizzato dal fatto che un cammino chiuso γ nel piano π in cui
è definito il modello nel limite continuo è mappato nel cerchio trigonometrico S1
dei possibili valori della variabile di spin in un cammino chiuso Γn che avvolge n
volte S1 , con n 6= 0:
γ ⊂ π → Γn ⊂ S1 n 6= 0 .
80
Poichè Γn non è omotopo a zero (cioè non può essere ridotto con continuità a un
punto) i vortici son stabili.
La situazione è molto diversa quando il gruppo di simmtria del modello bidimensionale è O(n) con n > 2. Consideriamo un modello bidimensionale definito
dall’Hamiltoniana
Z
n
X
1
2
H=
dx
∂α φa ∂ α φa
(5.23)
2T
a=1
dove φa sono le n componenti di un vettore unitario:
n
X
φa (x)2 = 1 .
(5.24)
a=1
Ogni vettore individua un punto della sfera unitaria Sn−1 che è una varietà semplicemente connessa per ogni n > 2, cioè ogni cammino chiuso Γ ⊂ Sn−1 è
omotopo a zero, dunque il sistema non possiede configurazioni topologiche stabili e non ci si aspettano transizioni di fase a T > 0. Per via del vincolo (5.24)
non tutti le componenti di φ possono essere piccole. Conviene risolvere il vincolo
ponendo
p
p
φi = ti , (i = 1, . . . n − 2) , φn−1 = 1 − ti ti cos θ , φn = 1 − ti ti sin θ .
Quindi la funzione di partizione diventa
Z Y
Z
Z=
Dti Dθe−H
i
con
1
H=
2T
Z
2
dx
n−2
X
i=1
∂α ti ∂ α ti + (1 − ti ti )∂α θ ∂ α θ + . . .
Dove i puntini indicano i termini in cui la derivata ∂α agisce sulla radice e che
si puo’ dimostrare essere trascurabili. Con questa approssimazione, integrando
prima sui campi gaussiani trasversi ti , si ottiene
Z
Z
1
−Hef f
d2 x(1 − hti ti i) ∂α θ ∂ α θ ,
(5.25)
Z = Dθ e
, Hef f =
2T
dove i valori medi sono calcolati rispetto alla misura gaussiana. Quindi questa
teoria è equivalente al modello XY con due importanti differenze:
81
• La costante di accoppiamento effettiva è
Kef f = (1 − hti ti i)/T
(5.26)
• Non ci sono vortici, per cui l’equazione del gruppo di rinormalizzazione è
semplicemente
d
a
Kef f ≡ K̇ef f = 0 .
(5.27)
da
Per scriverla in forma esplicita bsisogna calcolarsi il correlatore gaussiano
j
hti (0) t (0)i =
δij
T
(2π)2
Z
1
a
1
L
d2 k
T
= δij
log L/a ,
2
k
2π
dove si è usata la solita rappresentazione integrale del correlatore gaussiano (4.4).
Essendo la teoria in due dimensioni, oltre al cut-off ultravioletto 1/a si deve introdurre anche un cut-off infrarosso 1/L per i noti problemi del correlatore gaussiano bidimensionale nel limite termodinamico. Inserendo questa espressione
nella (5.27) si ha subito
n−2 2
Ṫ =
T .
(5.28)
2π
Quest’equazione è simile, ma di segno opposto all’eq.(4.29) per l’accopppiamento
u della teoria φ4 , quindi T è marginalmente rilevante, cioè T cresce al crescere
del passo reticolare, dunque T si annulla nel limite continuo. Quests proprietá,
che riveste grande importanza nella teoria quantistica dei campi, è detta libertà
asintotica o asymptotic freedom.
Un’altra proprietà importante di questo modello bidimensionale è che la sua
Hamiltoniana (5.23) è invariante di scala e non contiene nessun parametro dimensionale. Eppure T che è adimensionale, dipende esplicitamnete dal passo reticolare (altrimenti l’equazione (5.28) sarebbe invece banalmente Ṫ = 0). L’unico
modo in cui la quantità dimensionale a può apparire in T è attraverso la combinazione adimensinale T = T (aΛ), dove Λ è una costante che ha le dimensioni
dell’inverso di una lunghezza (ossia di una massa), ma non dipende dal dal cut-off
a
d
Λ=0.
(5.29)
a
da
Dunque Λ è una grandezza dimensionale e fisica perchè indipendente dal cut-off
che non c’era nella teoria classica di partenza, che è invariante di scala. La comparsa di questa scala fisica è dunque un fenomeno prodotto dalla formulazione
82
dela teoria mediante l’integrazione funzionale (somma sulle configurazioni) e
quindi è un fenomeno quantistico. detto trasmutazione dimensionale.
La dipendenza della scala fisica Λ da T si ottiene osservando che per ragioni
)
dimensionali, essendo a l’unica scala della teoria regolarizzata, Λ = f (T
, dove
a
f (T ) è una funzione adimensionale da determinare. La (5.29) dà
−f (T ) +
df
df
Ṫ = 0 , ⇒
=
dT
f
dT
n−2 2
T
2π
da cui, indicando con C la costante di integrazione,
2π
f (T ) = C e− (n−2) T .
(5.30)
Naturalmente questa forma funzionale vale per ogni grandezza fisica della teoria.
In particolare l’inverso della lunghezza di correlazione ξ −1 ∝ f (T ), a conferma
che in questo modello la transizone di fase avviene solo a T = 0 e la lunghezza di
correlazione cresce con una legge esponenziale.
5.5.1 Il modello O(n) in 2+ǫ dimensioni
Il calcolo precedente si può facilmente adattare in d = 2 + ǫ dimensioni nel limite
ǫ → 0. È importante tener conto che i gradi di libertà “lenti” che rimangono
dopo l’integrazione sui gradi di libertà trasversi ( si veda la (5.25)) continuano
ad essere gli angoli θ(x), dunque sono adimensionali anche in 2 + ǫ dimensioni,
quindi l’Hamiltoniana è ora 20
1
H=
2T
Z
n
dd x X
∂α φa ∂ α φa
aǫ a=1
(5.31)
per cui l’equazione del gruppo di rinormalizzazione (5.27) diventa
K̇ef f = ǫ Kef f .
(5.32)
D’altra parte il correlatore gaussiano dei campi trasversi è ora
j
hti (0) t (0)i =
δij
T
(2π)d
Z
1
a
0
dd k
2π d/2
Ωd
jT
=
δ
,
Ω
=
d
i
k2
ǫ (2π)d aǫ
Γ(d/2)
20
Si noti che la dipendenza dal passo reticolare è diversa rispetto al caso gaussiano, per cui il
coefficiente del termine cinetico non è marginale.
83
T =0
T⋆
T
Figure 5: Il flusso del gruppo di rinormalizzazione in una teoria con simmetria
O(n) in 2 + ǫ dimension.
da cui
T
hti t i =
ǫ
i
n−2
+ O(ǫ)
2π
che inserita nella (5.32) dà
Ṫ = −ǫ T +
n−2 2
T
2π
(5.33)
che ha due punti fissi (v. Figura), T = 0 (punto fisso stabile, cioè T irrilevante) e
2π
T ⋆ = ǫ n−2
che è un punto fisso instabile, infatti linearizzando l’equazione precedente ponendo T = T ⋆ + δT si trova, con lo stesso calcolo fatto per la teoria φ4 in
4 − ǫ dimensioni (si veda il § (4.6)), che δT ha autovalore x = ǫ > 0 ed è quindi
rilevante.
In conclusione il sistema con simmetria O(n), in base al flusso delle traiettorie
del RG determinata dai punti fissi, ha una fase ordinata nell’intervallo T ≤ T ⋆ ;
questa fase si riduce a 0 nel limite ǫ → 0, come previsto dal valore delle dimensioni critiche inferiori di un sistema con simmetria continua.
84
6 Simmetrie locali
6.1 Il fenomeno di Higgs
Il teorema di Goldstone non vale per la rottura spontanea di una simmetria locale
( cioe’ una simmetria i cui parametri sono funzioni arbitrarie dello spazio-tempo)
come la simmetria di gauge.
Vedremo che si manifesta un nuovo fenomeno. Consideriamo il modello di
Landau-Ginsburg per un campo scalare carico, cioe’ sostituiamo al campo scalare
reale φ(x) che abbiamo considerato nei sistemi magnetici un campo scalare complesso ψ(x). Per maggiore generalita’ consideriamo una teoria dipendente anche
dal tempo. Essendo ψ un campo carico, si accoppia al campo elettromagnetico.
Questo accoppiamento si ottiene semplicemente sostituendo alla derivata ∂µ le
derivate covarianti Dµ :
ie
Aµ (x),
~c
dove Aµ (x) e’ il potenziale o campo di gauge. Con questa sostituzione la densita’
Lagrangiana
1
Lψ = (D µ ψ)∗ (Dµ ψ) − V (|ψ|) ,
2
dove V è il potenziale di Landau-Ginzburg: V (|ψ|) = r2o |ψ|2 + u4!o |ψ|4 , è invariante
per trasformazioni locali di gauge
∂µ → Dµ = ∂µ +
e
ψ(x) → e−i ~c ω ψ(x) = ψ ′ (x)
Aµ (x) → Aµ (x) + ∂µ ω(x) = A′µ ,
(6.1)
(6.2)
dove ω(x) è una funzione (derivabile) arbitraria di xµ .
L’invarianza di L è una immediata conseguenza del fatto che V (|ψ ′ |) = V (|ψ|)
e che la derivata covariante si trasforma nel modo seguente:
e
ie ′
ie
′
Dµ ψ(x) → ∂µ + Aµ (x) ψ (x) = ∂µ +
(Aµ (x) + ∂µ ω) e−i ~c ω ψ(x)
~c
~c
e
= e−i ~c ω Dµ ψ(x) ,
per cui |Dµ ψ|2 e’ invariante. Poiche’ ψ si accoppia al campo elettromagnetico, la
densità Lagrangiana completa contiene anche il contributo del campo elettromagnetico
Z Z
Z
1 µ
1 µ
1
µν
4
ν
4
Fµν F dx =
A Aµ − A ∂µ ∂ν A dx4
Lem dx = −
4
2
2
85
d2
−△
dt2
= ∂µ Aν − ∂ν Aµ
=
Fµν
1
E k = F ko , B k = − ǫijk Fij
2
L = Lem + Lψ
Le equazioni del moto per i campi ψ e Aµ si ottengono imponendo la stazionarieta’
dell’azione
δL
δL
δL
=0,
=
=0.
δAµ
δψ
δψ ∗
Nella fase a simmetria spontaneamente rotta (detta anche fase ordinata) possiamo
utilizzare l’invarianza di gauge per fare in modo che ψ(x) sia reale per ogni x.
Infatti, poiche’ in generale il campo ψ si puo’ parametrizzare nella forma ψ(x) =
e
ω(x) = θ(x) per avere
φ(x)eiθ(x) , dove φ(x) e’ un campo reale, basta scegliere ~c
′
ψ (x) = φ(x). Questa scelta di gauge e’ nota come gauge unitario.21 In questo
gauge e’ facile verificare che le eq. del moto assumono la forma
∂µ F µν (x) = −
e2 2
δLφ
=−
φ (x)Aν (x)
δAν
(~c)2
δ
uo
uo
V (φ) = −ro φ − φ3 = φ(x)[φ2o − φ2 (x)] ,
δφ
6
6
dove φo e’ il minimo del potenziale nella fase in cui la simmetria e’ spontaneao
. Lo stato fondamentale corrisponde alla configurazione
mente rotta: φ2o = − 6r
uo
φ(x) = φo , Aµ (x) = 0.
Per studiare lo spettro delle eccitazioni attorno allo stato fondamentale possiamo utilizzare un metodo molto generale, che consiste nel considerare piccole
perturbazioni della configurazione di campo corrispondente allo stato fondamentale. Le equazioni del moto linearizzate di queste perturbazioni forniscono direttamente lo spettro della teoria. Nel caso in questione poniamo φ(x) = φo + φ̄(x)
e consideriamo φ̄(x) e Aµ (x) delle piccole fluttuazioni, in modo da poter linearizzare le eq. del moto:
e2 2 ν
∂µ F µν (x) = −
φA
(~c)2 o
D µ Dµ φ(x) = −
21
E’ importante osservare che il gauge unitario è ben definito solo nella fase ordinata, dove
φ(x) 6= 0 e quindi θ(x) è sempre ben definita. Viceversa nei punti in cui ψ si annulla, θ non è
necessariamente definita e quindi la trasformazione di gauge cercata è singolare o non esiste.
86
uo 2
φ φ̄ + O(φ̄2 )
3 o
Poiche’ F µν = −F νµ , ⇒ ∂µ ∂ν F µν = 0, e dalla prima eq. ⇒ ∂ ν Aν = 0, quindi
∂µ F µν = Aν , e le eq. del moto delle fluttuazioni attorno alla config dello stato
fondamentale si possono scrivere nella forma:
e2 2
+
φ Aµ (x) = 0
(6.3)
(~c)2 o
uo (6.4)
+ φ2o φ̄(x) = 0
3
Quindi non ci sono piu’eccitazioni di massa nulla, ma il fotone (descritto dal
e
campo Aµ ) acquista una massa mg = ~c
φo e descrive quindi la propagazione di
una eccitazione massiva dipspin 1 e il campo φ̄(x) descrive un’eccitazione scalare
(spin 0) di massa mH = u3o φo , detta particella di Higgs. E’ importante notare
che se applichiamo lo stesso procedimento per studiare le perturbazioni attorno al
vuoto simmetrico (φo = 0), si trova che il campo Aµ descrive la propagazione di
una particella di massa nulla con solo due stati di polarizzazione, quindi bastano
le due componenti A1 (x) e A2 (x) per descriverla. Dunque nella fase simmetrica
i campi che descrivono le eccitazioni del sistema sono A1 , A2 , ψ e ψ ∗ ,22 mentre
nella fase ordinata φo 6= 0 sono sostituiti da A1 , A2 , A3 e φ̄. Si puo’ quindi dire
che la natura locale della simmetria U(1) trasforma il potenziale bosone di Goldstone nella 3a componente (quella a polarizzazione longitudinale) del campo di
gauge massivo.
Il meccanismo attraverso il quale un campo di gauge acquista una massa non
nulla e’ detto meccanismo o fenomeno di Higgs. Puo’avvenire anche per simmetrie di gauge non abeliane ed e’ alla base della teoria delle interazioni elettrodeboli. Il fenomeno di Higgs per il campo scalare che abbiamo descritto fornisce
una teoria fenomenologica accurata della superconduttivita’ come ora vedremo.
∂ µ ∂µ φ̄(x) ≡ φ̄(x) = −
22
Nella fase simmetrica non si puo’ usare il gauge unitario per la ragione esposta nella nota
precedente
87
7 Superconduttività
Moltissimi conduttori non ferromagnetici, al di sotto di una temperatura critica
(che di solito è molto bassa: qualche decina di o K) subiscono una transizione a
uno stato superconduttore, in cui il sistema ha una resistenza sperimentalmente
nulla: la corrente elettrica fluisce attraverso il superconduttore senza sviluppare
calore Joule. La prima osservazione sperimentale della superconduttività risale al
1911, quando Kamerlingh Onnes osservò che la resistenza elettrica del mercurio,
al di sotto di 4.2 o K, cade bruscamente a zero.
In condizioni stazionarie non ci puo’ essere un campo elettrico non nullo nel
superconduttore, in quanto ogni differenza di potenziale implica una resistenza
non nulla.
Ci sono molti effetti associati a questo comportamento, principalmente legati
al campo magnetico.
Siccome un campo magnetico variabile genera un campo elettrico, un conduttore senza resistenza non puo’ contenere un campo magnetico variabile. Questo
spiega i due fenomeni seguenti:
• Se un superconduttore di forma sferica viene posto in un campo magnetico,
le sue linee di flusso sono spinte fuori dal superconduttore.
• Se un anello superconduttore è posto in un campo magnetico, il flusso magnetico concatenato con l’anello rimane invariato anche dopo lo spengimento
del campo magnetico esterno: poichè la resistenza elettrica dell’ anello è
nulla c’è una corrente che continua a circolare indefinitamente per mantenere il flusso magnetico concatenato a un valore costante.
Infine si osserva che, se un conduttore è posto in un campo magnetico B è raffreddato fino allo stato superconduttivo, il campo magnetico è espulso dal superconduttore. Quest’ultimo fenomeno, detto effetto Meissner, mostra che il superconduttore è un perfetto diamagnete, e non è semplicemente riconducibile al fatto
che il superconduttore ha resistenza nulla.
Se l’intensità dell campo magnetico esterno B supera una soglia critica Bcrit
l’effetto Meissner non puo’ avvenire e il sistema non diventa superconduttivo (cio’
spiega perchè il ferro e gli altri conduttori ferromagnetici non diventano superconduttori).
88
7.1 Teoria di London dell’effetto Meissner
Si consideri il conduttore come un gas di elettroni liberi. Detta n il numero di
elettroni per unità di volume , −e la loro carica, m la loro massa, classicamente si
ha
~ = m d~v , ~j = −n e ~v (t) ,
−eE
dt
dove ~j è la densità di corrente elettrica.
~ si ha
In un campo elettromagnetico generato dal potenziale vettore A
~ =− ∂ A
~, B
~ =∇∧A
~ ≡ rotA
~
E
c∂t
percio’
m d~
d ~
ne2 ~
e∂ ~
A=−
A(~x, t) = 0 ,
j⇒
j(~x, t) +
c ∂t
n e dt
dt
mc
2
~ x, t) + A
~ o (~x)], dove A
~ o (~x), funzione solo di ~x,
[A(~
da cui si ottiene ~j(~x, t) = − ne
mc
~ o ≡ 0 all’interno dei superconè la costante di integrazione. Secondo London A
duttori:
2
~ x, t) (equazione di London)
~j(~x, t) = − ne A(~
(7.1)
mc
Il fatto che la componente di ~j normale alla superficie del superconduttore deve
essere nulla (gli elettroni non fuoriescono) si puo’ imporre scegliendo il gauge
~ = 0. Di conseguenza div~j = 0 (⇒ le linee di flusso sono
”trasverso” div A
chiuse)
L’equazione di Maxwell
~ ≡∇∧B
~ =
rotB
~j
c
diventa
~ ≡ ∇(divA)
~ − △A
~=
∇ ∧ (∇ ∧ A)
~j
c
Combinando queste eq. con l’equazione di London si ha
~=
△A
ne2 ~
A
mc2
~ tende esponenzialmente a zero, come
Quindi all’interno del superconduttore A
ora verifichiamo considerando una geometria particolarmente semplice:
89
Supponiamo che il superconduttore si trovi nel semispazio x ≥ 0. Dalla sim~ è solo funzione di x
metria del problema si ha che A
2
d
ne2 ~
⇒
A=0
−
dx2 mc2
~
~ −x/λ
⇒ A(x)
= Ce
p c
. In conclusione, il campo magnetico penetra nel superconduttore
dove λ = m
n e
per uno spessore ∼ λ. Questa è una buona descrizione del comportamento reale
dei superconduttori, ma l’equazione di London che è all’origine non è giustificata
e non è invariante di gauge.
7.2 La teoria BCS
Dopo piu’ di 50 anni dalla scoperta della superconduttività Bardeen, Cooper e
Schrieffer posero le basi per una teoria microscopica della superconduttività, fondata sul fatto che elettroni di un superconduttore, interagendo con i fononi del reticolo cristallino in cui sono immersi, formano (nonostante la repulsione coulombiana) delle coppie con spin antiparallelo dette coppie di Cooper 23 che si comportano come eccitazioni (o quasi particelle) bosoniche; queste coppie che trasportano
una carica e = 2q, dove q è la carica dell’elettrone, possono essere descritte da una
funzione d’onda o campo scalare carico ψ, in interazione col campo elettromagnetico, quindi la teoria è invariante per la simmetria U(1) di gauge. In analogia
a quanto avevamo fatto per l’elio liquido, supponiamo che ψ sia normalizzata in
modo che |ψ(x)|2 rappresenti la densità di coppie di Cooper nel punto x. Dal
punto di vista della meccanica statistica, il campo ψ è un parametro d’ordine che
ha un ruolo analogo alla magnetizzazione spontanea nei sistemi magnetici; il suo
valore di attesa hψ(x)i è zero nella fase simmetrica ad alta temperatura; viceversa
la fase ordinata è caratterizzata da un valore di attesa diverso da zero che denota la
rottura spontanea della simmetria di gauge. Si puo’ dimostrare che nella fase ordinata una frazione finita delle coppie di Cooper occupano lo stato fondamentale;
in altri termini, la rottura spontanea della simmetria di gauge 24
hψi =
6 0
23
Queste coppie sono elettroni che sono vicini non nello spazio delle coordinate, ma nello spazio
degli impulsi, quindi sono coppie di elettroni che pur non essendo fiscamente molto vicini (e quindi
la repulsione coulombiana è schermata) viaggiano alla stessa velocità.
24
La rottura spontanea della simmetria ha un significato non ambiguo solo nel gauge unitario
90
corrisponde alla condensazione delle coppie di Cooper. Quindi la superconduttività, come la superfluidità nell’elio liquido è un fenomeno quantico macroscopico, in cui una frazione finita dei costituenti del sistema è nello stesso stato fondamentale.
Gli ingredienti fondamentali di una teoria fenomenologica della superconduttività sono i due seguenti:
• Le coppie di Cooper sono descritte da un campo scalare complesso ψ(x)
(quindi la teoria ha una simmetria U(1) locale e si accoppia col campo elettromagnetico).
• Condensazione delle coppie di Cooper, cioè hψi =
6 0 al di sotto di una
temperatura critica Tc , quindi il potenziale V (|ψ|) del campo ψ puo’ essere
descritto da una teoria di Landau-Ginzburg.
Queste condizioni mostrano che questa teoria fenomenologica non e’ altro che il
modello di Higgs precedentemente descritto, cioe’ un modello di Landau-Ginzburg
per il campo complesso ψ accoppiato minimalmente (cioè mediante la derivata covariante) al campo elettromagnetico. Questa formulazione e’ nota come modello
di Landau-Ginzburg della superconduttivita’.
7.3 Modello di L-G della superconduttività
In condizioni di equilibrio l’Hamiltoniana di L-G puo’ essere scritta nella forma
H = He.m. + Hψ
Z
1
He.m. = d3 x E 2 + B 2
2
Z
1 ~ 2
3
Hψ = d x
|Dψ| + V (|ψ|)
2
~ V (|ψ|) = 1 ro |ψ|2 + uo |ψ|4
~ = ∇ + ie A,
D
~c
2
4!
E’ facile verificare direttamente (v. §6.1) che questo modello è invariante per
trasformazioni di gauge:
e
ψ(x) → e−i ~c ω ψ(x) = ψ ′ (x)
e
′
ψ ∗ (x) → ei ~c ω ψ ∗ (x) = ψ ∗ (x)
91
~
~
~′ ,
A(x)
→ A(x)
+ ∇ω(x) = A
dove ω(x) è una funzione (derivabile) arbitraria di xµ . Per comodità scegliamo
un gauge in cui il potenziale scalare Ao è zero (questo è sempre possibile in condizioni statiche).
Nella fase a simmetria spontaneamente rotta (detta anche fase ordinata) possiamo utilizzare questa invarianza di gauge per fare in modo che ψ(x) sia reale
per ogni x. Infatti, poichè il campo ψ si puo’ sempre parametrizzare nella forma
e
ψ(x) = φ(x)eiθ(x) , dove φ(x) è un campo reale, basta scegliere ~c
ω(x) = θ(x)
per avere
ψ ′ (x) = φ(x)
e
~
~′ = A
~ + ~c ∇θ ≡ Â
A
.
e
Questa scelta di gauge è nota come gauge unitario.25
~ B,
~ φ(x)
Con questa scelta di gauge la teoria è espressa in termini di campi E,
~
e Â(x)
Z
1 e2 ~ˆ 2 2
1
2
3
Aφ + V (φ)
(∇φ) +
⇒ H = He.m. + d x
2
2 (~c)2
Lo stato di equilibrio termico del sistema corrisponde al minimo dell’energia libera di Helmoltz. Nell’approssimazione di Landau (che è stata già utilizzata nella
descrizione dei sistemi magnetici) l’energia libera coincide con l’Hamiltoniana,
quindi lo stato di equilibrio termico corrisponde alle configurazioni di minima energia. 26 In questa approssimazione il valore di minimo del campo φ coincide con
il suo valore di attesa, cioè
hφi = φ
Le condizioni di minimo o, meglio, di stazionarietà dell’Hamiltoniana sono
δH
=0,
δφ
25
E’ importante osservare che il gauge unitario è ben definito solo nella fase ordinata, dove
φ(x) 6= 0 e quindi θ(x) è sempre ben definita. Viceversa nei punti in cui ψ si annulla, θ non è
necessariamente definita e quindi la trasformazione di gauge cercata è singolare o non esiste.
26
In condizioni statiche la densità hamiltoniana è uguale alla densità lagrangiana cambiata di
~ e φ indipendenti dal tempo ci possono fornire direttasegno, per cui le equazioni del moto di A
mente le condizioni di minimo dell’energia.
92
δH
=0.
~
δ Â
~ = − 1 ∂ Â~ = 0
Avendo posto Âo = 0 e osservando che in condizioni stazionarie E
c ∂t
si ha27
2
~
~ + e φ2 (x)Â
rot B
=0
(7.2)
2
(~c)
e2
dV
Â2 φ +
=0
(7.3)
2
(~c)
dφ
Per un conduttore molto grande, lontano dai bordi, il sistema è invariante per
~ = 0, percio’ il sistema di condizioni di equilibrio
traslazioni, ⇒ ∆φ = rot B
diventa un sistema algebrico:
~
φ2 Â = 0
−△φ +
e2
dV
e2
uo
2
Â
φ
+
=
Â2 φ + ro φ + φ3 = 0
2
2
(~c)
dφ
(~c)
6
~
da cui discende che la soluzione φ = 0 esiste sempre, e in questo caso Â è indeter~ è arbitrario ⇒ non c’è effetto Meissner.
minato, 28 quindi il campo magnetico B
Viceversa,
(
~ =0
B
(effetto Meissner)
~
se φ = φo 6= 0 ⇒ Â = 0 ⇒
φo : dV
=0
dφ
quindi la fase a simmetria spontaneamente rotta del modello di LG corrisponde
proprio allo stato superconduttore.
c
Notare che φo 6= 0 solo per ro < 0, dove al solito si avrà ro = T −T
.
Tc
~
~ = − e2 2 φ2 (x)Â
Confrontando l’eq. di minima energia per il campo magnetico rot B
(~c)
con l’equazione di Maxwell
~
~ =j
rot B
c
si ha
2
~
~j = − ce φ2 Â
(~c)2
R
R
~ˆ · ∇ ∧ B).
~
utilizzando ad esempio l’identità 12 d3 x B 2 = 21 d3 x (A
28
In questo caso va però osservato che il gauge unitario non è ben definito e occorrerebbe
scrivere le condizioni di minimo in forma invariante di gauge, come faremo in seguito per altri
scopi.
27
93
che nella configurazione di stato fondamentale φ = φo coincide in forma con
l’equazione di London.
• Effetti di bordo
In prossimità dei bordi non possiamo piu’ supporre che il sistema sia invariante per
traslazioni e quindi i campi diventano funzioni della distanza dal bordo. Quindi
il bordo introduce una perturbazione dello stato fondamentale (che è invariante
per traslazioni). Questa perturbazione è in genere piccola, per cui possiamo porre
nelle condizioni di equilibrio (7.2) e (7.3)
φ(x) = φo + φ̄(x)
~
e considerare solo i termini lineari in φ̄ e Â. In questa approssimazione dalla
~
~ ∝ Â.
prima equazione si ha rot B
Poichè la divergenza di un rotore è identi~
camente nulla, si ha div Â = 0 e quindi, come già visto nella teoria di London,
~
~ = −△Â.
rot B
Di conseguenza le condizioni di equilibrio diventano
(~c)2
~
(−△ + λ−2 )Â(x) = 0, λ2 = 2 2
e φo
(−△ + ξ −2)φ̄(x) = 0, ξ 2 =
3
uo φ2o
dove mG = 1/λ e mH = 1/ξ non sono altro che le masse del fotone massivo e
del campo di Higgs introdotte nel § 6.1.
Consideriamo un conduttore che idealmente riempia omogeneamente tutto il
semispazio x > 0
superconduttore
φo = 0
φo 6= 0
In queste condizioni il sistema è solo funzione della variabile x ⇒ △ =
e le soluzioni delle eq. precedenti si possono scrivere nella forma:
~
~ o e− λx ,
Â(x) = A
x
φ(x) = φo 1 − e− ξ .
94
d2
dx2
λ è la lunghezza di penetrazione già discussa nel modello di London. ξ è nota
come lunghezza di coerenza. λ e ξ sono le due scale che intervengono nella descrizione della superconduttività. Queste due scale descrivono anche la lunghezza
di correlazione delle eccitazioni che si possono propagare in un superconduttore
omogeneo. Infatti è noto che per studiare lo spettro delle eccitazioni di un dato
sistema occorre valutare i correlatori dei campi in gioco; dalla legge di decadimento esponenziale si puo’ leggere la lunghezza di correlazione delle possibili
eccitazioni. Nel sistema in esame si possono definire due tipi di correlatori: quello
~ A(~
~ r)i. Si
tra i campi di materia hφ(0)φ(~r)i e quello tra i campi di gauge hA(0)
puo’ dimostrare che il comportamento asintotico di questi correlatori è lo stesso
di quello prodotto dall’effetto dei bordi, cioè
r
hφ(0)φ(~r)i → ce− ξ ,
r
~ ~
hÂ(0)Â(~r)i → c′ e− λ .
Percio’ lo spettro contiene un singoletto, legato al campo di materia φ, associato
~ di
alla lunghezza di correlazione ξ e un tripletto, associato al campo di gauge A,
lunghezza di correlazione λ.
Vedremo che molte proprietà del sistema dipendono dal rapporto di queste due
scale. Si trovano in natura due tipi di superconduttori:
• 1) ξ > λ Superconduttore di tipo I: c’è uno schermaggio totale del campo
magnetico a B = 0 e un valore critico Bc al di sopra del quale si ha una fase
normale con penetrazione completa di B.
• 2) ξ < λ Superconduttore di tipo II: schermaggio completo a B = 0, una
prima transizione a una fase mista a Bc1 e una seconda transizione a una
fase normale a Bc2 , con Bc1 < Bc < Bc2 . La fase mista è caratterizzata dal
fatto che il superconduttore ha resistenza nulla ma non è piu’ un perfetto
diamagnete: il campo magnetico riesce a penetrare.
Per studiare questo comportamento dobbiamo calcolarci la funzione di energia
libera di Gibbs.
7.4 Funzione di energia libera di Gibbs
L’energia libera di Helmoltz coincide, nell’approssimazione di Landau che stiamo
di fatto usando, con l’Hamiltoniana per lo stato fondamentale. Percio’ trascurando
95
gli effetti di bordo si ha, utilizzando il fatto che il valore del potenziale nel minimo
è dato da V (φo ) = r4o φ2o ,
Fnormal =
B2
V,
2
Fsuper =
ro 2
B2
φo V +
V
4
2
~ è il campo magnetico indotto dal
dove V è il volume del superconduttore e B
~ = ~jφ /c dove
campo di materia φ, e abbiamo già visto che δF~ = 0 ⇒ ∇ ∧ B
δÂ
~
e2 2
abbiamo posto ~jφ = − c~
2 φ (x)Â.
Introduciamo ora un campo magnetico esterno, che per comodità indichiamo
~ H
~ è associato a una densità di corrente esterna ~jext da
con H.
~ = ~jext /c
∇∧H
~ soddisferà l’equazione
⇒ Il campo magnetico totale B
~ = ~jtot /c = (~jφ + ~jext )/c
∇∧B
(7.4)
Si è già visto (nei sistemi magnetici) che le condizioni di equilibrio in presenza
di un campo esterno si ottengono non dalla variazione di F ma dalla variazione
dell’energia libera di Gibbs Γ. La definizione di Γ nei sistemi diamagnetici (come
i superconduttori) è diversa da quella utilizzata per i sistemi magnetici. E’ immediato verificare che ponendo
~ · HV,
~
Γ=F −B
si ha, imponendo
δΓ
~
δÂ
F = Hφ +
B2
V
2
= 0,
δH[φ]
δ Â
~ −∇∧H
~ =0
+∇∧B
che coincide con la (7.4). Quindi Γ puo’ essere considerata l’energia libera di
Gibbs Γ ed in condizioni di equilibrio termico è una funzione di T e B.29
~ =H
~
Nella fase normale (φo = 0) non c’è campo magnetico indotto ⇒ B
29
Nei gas l’energia libera di Gibbs è funzione di T e di P ; nel nostro caso la pressione può
essere identificata con l’energia per unità di volume necessaria per espellere il campo magnetico,
quindi P = 12 B 2 .
96
Γnormal = H[φ = 0] −
B2
V
2
2
= − B2 V
Nella fase superconduttrice (φ = φo ) il campo B è completamente schermato
~ = 0, percio’
⇒B
Γsuper = H[φo] =
ro 2
φV
4 o
2
= − 32 uroo V
Poichè Γ è un potenziale termodinamico che per trasformazioni a T e B
costanti è minimo per le configurazioni in equilibrio termico, per valori di T e B
sufficientemente piccoli il sistema si troverà nella fase superconduttrice e quindi
Γsuper < Γnormal ; la linea di transizione alla fase normale sarà allora data da
Γsuper (T, Bcrt ) = Γnormal (T, Bcrt ) ,
6
......................................
.....
.......
.....
.....
.
.
.
....
...
....
......
T
...
.
...
....
...
.
.
...
.
...
...
.
... Γ
....
... super > Γnormal
.
.
....
Γsuper < Γnormal .......
.
...
...
..
... normal
..
...
....
...
...
supercond.
...
.
..
B
Dall’equazione precedente si ha
Γsuper = −
2
Bcrt
=−
2
Bcrt
V
2
ro 2 3ro2
φ =
∝ (Tc − T )2
2 o
uo
Sperimentalmente si osserva
"
Bcrt = Bo 1 −
97
T
Tc
2 #
(7.5)
La predizione teorica di Landau -Ginzburg è in accordo con la legge sperimentale
solo per T ∼ Tc .
7.5 La fase mista
La trattazione precedente non tiene in considerazione gli effetti di bordo e delle
fluttuazioni del campo φ. Questa approssimazione è giustificata nei superconduttori di tipo I, in cui quando φ ha raggiunto il suo valore asintotico φo , il campo B
è già completamente schermato:
6
B
φ
6
...
...
...
...................
...
..................
..................
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.... .............
............
................
.
.
.
.
.
...........
.
.
.
.
.
................
..
.............................
.....
..............
...
B
φ
-
....
....
.....
.....
......
...............
.........................................................................
..... ........
.
.
.
.
.
.
.......
....
.......
.....
........
....
.
.........
.
.
...............
....
...........................
..
.....
...
r
r
Tipo I
Tipo II
Nei superconduttori di tipo II bisogna tener conto degli effetti di bordo, perchè
le regioni del conduttore in cui per effetto di fluttuazioni statistiche si sviluppa una
fase normale (φ ∼ 0) possono essere circondate da un alone in cui il campo magnetico puo’ penetrare; questo alone è nella fase mista. In particolare consideriamo
un superconduttore a forma di parallelepipedo, immerso in un campo magnetico
perpendicolare a due facce opposte . In queste condizioni acquistano particolare
importanza quelle fluttuazioni statistiche del campo φ che formano dei filamenti
che attraversano il superconduttore lungo cui φ ∼ 0. Attorno a tali filamenti si
forma un alone di campo magnetico non nullo. Per un valore sufficientemente
grande Bc1 di B questi filamenti accompagnati dai rispettivi aloni possono diventare le configurazioni di equilibrio stabile. Queste configurazioni sono note
come vortici di Abrikosov; la loro struttura microscopica sarà descritta nel § successivo. In queste condizioni il superconduttore si può riempire di questi filamenti
e tutto il sistema transisce nella fase mista.
Per valutare approssimativamente il valore Bc1 di transizione dalla fase superconduttrice alla fase mista, consideriamo un cilindro superconduttore di base
S = πR2 e altezza L con un piccolo canale lungo l’asse di simmetria lungo cui
puo’ penetrare un campo magnetico questo canale rappresenta il filamento lungo
cui φ = 0:
98
-
← λ→
.......................................
.......
............
......
......
.
.
.
.
....
...
....
.. ...
...
...
...
.
.
.
.
.
.
.
.......... ...............
.
.
.
.
...
....
.. ......................... .....
.
.
.
.... ..
. ..
...
... ...
.... ....
....
... ..
ξ
. ..
.
. .
t ...... ......
-.....
... ...
....
.. ...
HH
. ..
... ...
...
j
... ..
R.....
... .....
...
.... ......... ............. ......
...... ..... .....
...
........................... λ
..
...
...
.
....
.
..
.....
....
......
......
........
.
.
.
.
.
.
..
...............
..............................
6
L
?
ξ
posto Γ = γV = γSL dove γ denota la densità di energia libera, si ha, per la fase
mista
Γmix = Lγsuper (S − πξ 2) + Lγnormal πλ2
B2
2
dove γnormal = − B2 e γsuper = − 2crt Il valore critico Bc1 di transizione dalla
fase superc. alla fase mista è dato dall’eq.
Γmix (T, Bc1 ) = Γsuper (T, Bc1 )
(7.6)
ξ
Bcrt < Bcrt
λ
Il rapporto χ = λξ è detto parametro di L − G. L’equazione (7.6) esprime la
condizione per cui una fluttuazione del mezzo verso una fase mista è in equilibrio termico con la fase superconduttrice. Poichè Bc1 deve essere minore di Bcrt
(altrimenti il sistema è già passato nella fase normale) si ha transizione alla fase
mista se χ > 1. Per valutare approssimativamente il valore Bc2 del campo necessario per la transizione dallo stato misto a quello normale conviene fare qualche
approssimazione delle eq. di equilibrio (7.2, 7.3):
(
~
~ + e2 2 φ2 Â
=0
rotB
(~c)
2
⇒ ξ 2 Bcrt
− λ2 Bc21 = 0, Bc1 =
−∆φ +
e2
Â2 φ
(~c)2
+
dV
dφ
=0
Se il sistema è nella fase mista e prossimo a transire nella fase normale, φ è vicino
a zero e quindi possiamo trascurare il termine φ4 del potenziale. D’altra parte in
queste condizioni il campo magnetico può penetrare in tutto il conduttore e quindi
~ costante. Consideriamo quindi un corpo superconduttore
possiamo considerare B
~ costante
a simmetria cilindrica nella fase mista immerso in un campo magnetico B
~
orientato lungo l’asse z del cilindro. Allora A si puo’ scegliere come un campo
tangenziale nel piano x, y:
99
y
6
~
'$
I A
@
@
i
-Ai =
x
&%
 
 
−y
0
B 
~
~

x
⇒ ∇ ∧ A = B = 0
2
0
B
L’equazione per il campo φ diventa
−∆φ +
e2 B 2 2
(x + y 2)φ = −ro φ
(~c)2 4
Questa equazione puo’ essere letta come l’equazione di Schrödinger stazionaria
Hφ = Eφ
per un oscillatore armonico bidimensionale di Hamiltoniana
H=
mω 2 r 2
−~2 ∆ mω 2 r 2
P2
+
=
+
2m
2
2m
2
con
eB
−~2 ro
, E=
.
2mc
2m
Questo sistema ha due tipi di soluzione: o φ = 0 (fase normale), o φ 6= 0 (fase
mista) e E = ~ω(n1 + 12 + n2 + 12 )) = ~ωn con n = 1, 2, . . . . Scrivendo
l’espressione esplicita di ω si ottiene un vincolo sui valori permessi del campo B:
~c
Bn = −ro ne
.
Quindi il valore massimo permesso per il campo B è B1 = −ro ~c
che posq e
siamo identificare con Bc2 . Dall’eq. (7.5) si ha Bcrt = −ro u3o , e poichè
p
, possiamo scrivere Bc2 = χBcrt .
χ ≡ λξ = u3o ~c
e
In conclusione, nei superconduttori di tipo II (χ > 1) esiste una fase (detta
fase mista) in cui il sistema, pur essendo superconduttore (φ 6= 0), non è un
perfetto diamagnete. Questa fase è caratterizzata dalla comparsa di ”difetti” in cui
il campo magnetico puo’ penetrare. La fase mista compare in presenza di campi
magnetici compresi tra Bc1 e Bc2 , con
q
Bc1 = χ1 Bcrt , Bc2 = χBcrt , χ = λξ , Bcrt = −ro u3o
ω=
dove Bcrt è il campo critico di transizione dalla fase superconduttrice alla fase
normale.
100
7.6 Vortici di Abrikosov
I vortici di Abrikosov possono essere considerati delle configurazioni di equilibrio
di energia finita (rispetto all’energia dello stato fondamentale).
Una soluzione a energia finita (detta anche solitoneRdel modello di L − G deve
2
soddisfare le condizioni Hψ − Hφo < ∞ e He.m. = d3 x B2 < ∞, quindi per
3
ogni coordinata x → ∞ si ha B 2 = o(x−3 ), ossia B = o(x− 2 )
1
1
~ = puro gauge + o(x− 2 ) = ∇ω + o(x− 2 )
⇒A
Analogamente per il campo di materia si ha
3
V (ψ) − V (φo ) = o(x−3 ) ⇒ ψ = φo eiθ(x) + o(x− 2 )
Consideriamo ora una sezione piana del nostro sistema. Prendendo in questo
piano un cerchio C(R) di raggio R molto grande, non essendoci nessuna direzione
privilegiata, la fase θ(x) dipenderà solo dall’angolo α di un sistema di coordinate
polari ρ, α, perciò poniamo θ = θ(α) e quindi
3
ψ = ψ(θ) + o(x− 2 ) .
Il comportamento all’∞ del campo ψ stabilisce una mappa α → θ tra il cerchio
all’infinito e la fase θ. Poichè ψ è a un sol valore, ⇒ ψ(α) = ψ(α + 2π) ⇒
θ(α + 2π) = 2nπ + θ(α) possiamo in generale porre θ(α) = nα + β(α), con
n = 0, ±1, ±2, . . . e β(α + 2π) = β(α) è una funzione periodica regolare. Se
n 6= 0 e ψ non è singolare (come deve essere se l’energia è finita) esiste almeno un
punto, nel piano in cui giace il cerchio C(R), per cui ψ si annulla; infatti al variare
del raggio R, n non puo’ cambiare se ψ è una f. continua e quindi, riducendo il
raggio di questo cerchio c’è almeno un punto in cui la fase di ψ non puo’ essere
definita e percio’ in quel punto ψ si annulla (esempio: ψ = (x + iy)2 = rei2α
⇒ n = 2 e ψ(0) = 0). Il punto (o i punti) in cui ψ = 0 rappresenta(no)
l’intersezione dei filamenti di cui si è parlato nel § precedente con la sezione
piana in esame.
Il numero intero n è un invariante topologico: nessuna deformazione continua
puo’ modificare n, percio’ le fluttuazioni del parametro d’ordine ψ non possono
alterare n. Se n 6= 0 c’è qualche problema col gauge unitario, perchè partendo da
~ regolare, il potenziale trasformato
un potenziale A
~′ = A
~ − n ~c ∇α
A
e
101
è singolare nell’origine, dove α è indeterminato. Solo la parte regolare β(α) della
fase θ puo’ essere assorbita da una trasformazione di gauge. Poichè il caso n 6= 0
non puo’ essere trattato nel gauge unitario, dobbiamo utilizzare le equazioni di
equilibrio (7.2) e (7.3) nella loro forma piu’ generale, cioè gauge invariante:
2
dV
ie ~
=0
(7.7)
− ∇+ A ψ+
~c
dψ ∗
~ = − e ℑm(ψ ∗ Dψ)
~
∇∧B
(7.8)
~c
Quest’ultima equazione fornisce un legame, nella soluz. a energia finita, tra la
~ che compare nella forma
fase θ del campo ψ e il parametro ω del potenziale A
asintotica
~ = ∇ω + o(r − 21 )
A
~ = o(x− 52 ), inoltre
poichè sappiamo che per x → ∞ ∇ ∧ B
1
ie ~
e
∗~
−iθ(x)
∇ + A φo eiθ(x) = i |ψ|2∇ θ(x) + ω(x) + o(x− 2 ) .
ψ Dψ → φo e
~c
~c
5
Poichè il I membro dell’eq.(7.8) è o(x− 2 ), ci deve essere una cancellazione tra il
primo e il secondo termine, cioè
1
e
∇ θ(x) + ω(x) = o(x− 2 )
~c
1
∇θ(x) + o(x− 2 )
ossia ∇ω(x) = − ~c
e
~
A(x)
→ − ~c
∇θ(x)
e
⇒
ψ(x) → φo eiθ(x)
Quindi
I
C(R)
~
A(x)
· d~l ≡
Z Z
~ · dΣ = − ~c (θ(2π) − θ(0)) = − hc n
B
e
e
Σ
⇒ Il flusso del campo magnetico è quantizzato. E’ importante notare che all’infinito
non c’è campo magnetico, ma il numero quantico n 6= 0 contiene l’informazione
102
che da qualche parte al finito c’è un campo magnetico non nullo. Queste configurazioni sono appunto i vortici di Abrikosov. Sperimentalmente si osservano
questi vortici con un valore minimo del flusso magnetico corrispondente a ~c
,
2q
dove q è la carica elettrica di un elettrone. Questo conferma che il campo ψ che
stiamo studiando descrive eccitazioni di carica e = 2q corrispondenti alle coppie
di Cooper.
Il fatto che il flusso magnetico nei superconduttori sia quantizzato ha una importante conseguenza di carattere generale. Supponiamo che da qualche parte
nell’universo ci sia un monopolo magnetico di carica g, cioe’ il flusso magnetico
R
~ ·
uscente da qualunque superficie chiusa Σ contenente questo monopolo è B
~ = g. L’esistenza in natura dei superconduttori implica che g non puo’ essere
dΣ
arbitrario. Infatti, se supponiamo di immergere il monopolo in un superconduttore, il flusso magnetico uscente da dal monopolo è necessariamente suddiviso in
uno o più vortici di Abrikosov ed è quindi quantizzato:
⇒ g=
u
hc
n
e
g flusso magnetico
Vedremo nel prossimo § una derivazione più generale e una discussione di questa
celebre relazione, nota come condizione di quantizzazione di Dirac.
Vediamo ora di studiare in dettaglio la soluzione delle equazioni del moto
corrispondente a un vortice di Abrikosov a simmetria cilindrica, posto lungo l’asse
z di un sistema di assi cartesiani.
A causa della simmetria cilindrica il modulo del campo
p di materia |ψ| e il
~
campo magnetico B sono solo funzioni della distanza r = x2 + y 2 dall’asse di
simmetria. Possiamo percio’ scrivere
ψ(~x) = φ(r)eiθ(~x) ,
dove
lim θ(~x) = nα .
r→∞
Poichè per ipotesi θ è definita ovunque nel piano x, y, tranne che nell’origine,
dove c’è il centro del vortice, e quindi
φ(0) = 0 ,
103
possiamo scrivere
θ(~x) = nα + β(~x)
dove β è una funzione regolare ovunque. Possiamo allora sceglere un gauge che
riassorba la funzione β e quindi in definitiva possiamo parametrizzare ovunque il
campo ψ nella forma
ψ(~x) = φ(r) einα .
~ = ~k B(r) si può scegliere
Analogamente, per riprodurre un campo magnetico B
~ = ~tA(r) ,
A
dove ~t è il versore tangenziale che abbiamo già introdotto in diverse occasioni:
 y
−r
~t =  x  = r ∇α .
r
0
~ di questa forma soddisfa automaticaE‘ immediato verificare che un campo A
mente il gauge di Coulomb:
~ =0.
∇·A
Poniamo
n~c
(F (r) − 1),
er
~ → − ~c n∇α.
dove la f. incognita F (r) si deve annullare all’infinito affinche’ A
e
Inoltre, poichè il versore ~t non è definito nell’origine, li deve annularsi A(r).
Quindi F (r) soddisfa le due condizioni ai bordi:
A(r) =
F (0) = 1 ,
Si ha

~i
~ ≡∇∧A
~ =  ∂x
B
− yr A(r)
lim F (r) = 0 .
r→∞

~k
~j
1 d
(rA(r))
∂y
∂z  = ~k
r dr
x
A(r) 0
r
~ = ~kB(r), B(r) = n~c F ′ (r)
⇒B
er
e
∗
~ = − ℑm ψ (∇+ ie A)ψ
~ si semplifica notevolLa condizione di equilibrio ∇∧ B
~c
~c
mente utilizzando le identità seguenti
′
F
~c
d
d
~
∇ ∧ B = −~t B(r) = −n ~t
dr
e dr r
104
D’altra parte
~t
inF
ie ~
~
~
φeinα + einα ∇φ(r)
Dψ = ∇ + A ψ = in∇α − in + t
~c
r
r
nF 2~
∗~
∗ inF ~
⇒ ℑm ψ Dψ = ℑm ψ
φt
tψ =
r
r
Percio’ la condizione di equilibrio per F diventa
F ′′ −
F′
r
−
e2
φ2 (r)F
(~c)2
(7.9)
=0
Poiche’ per r → ∞ φ → φo risolviamo l’equazione in forma asintotica
F ′′ −
√
ponendo F (r) = G(r) r si ha
G′′ −
F′
e2
− 2 φ2o F = 0
r
~c
e2 2
3
φo G − 2 G = 0 .
2
(~c)
4r
Sarebbe facile verificare che la soluzione generale di questa equazione è esprimibile in termini di funzioni di Bessel di argomento immaginario. Nel limite r → ∞
l’equazione si semplifica ulteriormente:
G′′ −
percio’ G = ce−r
eφo
~c
e2 φ2o
G≃0,
(~c)2
√
r
⇒ F (r) → c re− λ ,
dove al solito λ denota la lunghezza di penetrazione. Studiamo ora la condizione
di stabilità del campo ψ:
2
dV
ie ~
= 0.
∇+ A ψ−
~c
dψ
Utilizzando la (7.9) si ha, sfruttando il fatto che ∇f (r) · ∇α = 0,
ie
∇ + A(r)~t · einα ∇φ(r) + i~tnF (r)ψ
~c
105
n2
F
n2
△φ − F φ + (1 − F ) φ
=e
r
r
r
2
d
tenendo inoltre conto che in coordinate polari ∆f (r) = dr
2 +
ottiene:
inα
φ′′ + 1r φ′ −
n2 F 2
φ
r2
−
dV
dφ
1 d
r dr
f (r) , si
=0
dove al solito dV
= ro φ + u6o φ3 .
dφ
Nell’intorno dell’origine, essendo φ regolare (config. a energia finita) ⇒
2
2 2
φ(r) = φ(0) + φ′ (0)r + φ′′ (0) r2 , . . . se φ(0) 6= 0 il termine n rF2 φ diverge
per r → 0 ⇒ φ(0) = 0 ⇒ φ(r) = cr µ + . . . . Poiche’ F (0) = 1 ⇒
(µ(µ − 1) + µ − n2 )cr µ−2 + O(r µ−1 ) = 0 ⇒ µ = |n| : il campo di Higgs
φ(r) ha uno zero di ordine |n| sull’asse del vortice. Inserendo nell’eq. per F il
′
suo sviluppo di Taylor nell’intorno dell’origine si vede che affinche’ Fr (e quindi
~ non diverga F ′ |r=0 = 0, ⇒ F (r) = 1 + O(r 2) Quindi
B)
B=
n~c ′′
F (0) + O(r)
e
(r → 0).
6
B
.............................
.............
...................................
.....
.
.
φ
.............
.
.......... .......
........
... ...
..... ........
.....
.....
.
.
.
.
.......
.....
.........
.
.
.
.
.
............
.....
.
................
.
.
.
.
.
.
.
.
.
............................
.
.
.
.
.
..........
-
r
7.7 Confinamento dei monopoli magnetici
Il centro dei vortici di Abrikosov si comporta come un conduttore normale :φ(0) =
0 e B(0) 6= 0. Poiche’ la configurazione di un vortice differisce dal vuoto in una
regione a forma cilindrica di raggio ∼ λ, l’energia del vortice e’ proporzionale alla
sua lunghezza. Se esistono in natura monopoli magnetici, c’è un’importante conseguenza di questa proprietà. Il campo magnetico generato nel vuoto da una coppia monopolo anti-monopolo ha esattamente la stessa forma del campo elettrico
106
generato da una coppia di cariche, quindi l’energia potenziale V (R) tra questa
2
coppia di monopoli è di tipo Coulombiano: V (R) = − gR . Supponiamo ora di
immergere questa coppia monopolo-antimonopolo in un superconduttore. La distribuzione del campo cambia drasticamente e tutto il flusso magnetico è concentrato in un vortice di Abrikosov che congiunge i due monopoli:
vuoto.................................ordinario
......
.
g
.....
.
....
....
....
...
....
...
...
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
.
.
.
.
.
.
.. ..
..........
.....
...
......
... ..........
.
.....
.. . .....
.
..... .....
.... ...
.... .....
.... ..
.. .....
.... ...
... ...
.... ...
.... ..
.. ..
.......
.. ..
..
.. .
.............................................................
....... .............................
................ ..........
............. ....
................
.........
.........
......................
.
.
.
..... .............
.
.
.
.
.
.
.
.
.
.
.
....
..................
....
.....
.....................................................................
....
.......
.
.. ...
.
.
... ..
... ..
... ....
.... ..
.... ..
... ....
.... ..
... .....
.... ....
.
.
... .....
.
... ......
...... .....
.....
.......
.
...
........................................
...
...
...
...
....
...
...
.
....
.
.
....
...
.....
....
........
......
.....................
u
superconduttore
e
u
-g
e
Quindi l’energia potenziale della coppia di monopoli in un superconduttore è
proporzionale alla loro distanza : V (R) = σR, dove σ è l’energia per unità di
lunghezza del vortice di Abrikosov. In queste condizioni la coppia di monopoli rimane permamente legata : ci vorrebbe un’energia infinita per allontanarli
all’infinito. questa è la proprietà di confinamento dei monopoli magnetici in un
superconduttore.
Oggi si hanno buone ragioni per ritenere che un meccanismo analogo valga
per i quark (cioè i costituenti elementari dei nucleoni e dei mesoni) nel vuoto ordinario, in quanto l’energia di una coppia di quark è proporzionale alla distanza.
Nei superconduttori ordinari il confinamento dei monopoli è prodotto dalla condensazione delle coppie di Cooper. Si ritiene che nella Cromodinamica quantistica
(che è la teoria che descrive le interazioni dei quark) il confinamento dei quark sia
dovuto alla condensazione dei monopoli magnetici.
107
8 Effetti topologici in elettrodinamica
In elettrodinamica classica la conoscenza di Fµν determina completamente le proprieta’ del campo elettromagnetico. Il potenziale Aµ ha il ruolo di uno strumento comodo per semplificare il formalismo, ma non e’ una quantita’ misurabile, perche’ non e’ invariante rispetto alle trasformazioni di gauge. Abbiamo
visto che questa affermazione non e’ piu’ del tutto vera nei sistemi quantistici: i
vortici di Abrikosov mostrano che e’ possibile estrarre delle informazioni fisiche
sul campo elettromagnetico anche da regioni in cui Fµν = 0. Infatti a grande
distanza dal vortice di Abrikosov si ha Fµν = 0, quindi il sistema e’ nel vuoto
elettromagnetico, ma per ogni cammino chiuso γ concatenato con il vortice si ha
I
~ · d~l = hc n
A
e
γ
e quindi si ha un’informazione fisica (cioe’ invariante di gauge); questo e’ dovuto
al fatto che esistono configurazioni di gauge corrispondenti al puro vuoto Fµν = 0
~ = ∇θ del § precedente) che per ragioni topologiche non possono essere
( come A
ricondotte con trasformazioni di gauge non singolari nella configurazione banale
Aµ ≡ 0. In conclusione, la conoscenza di Fµν non e’ sufficiente, nelle teorie quantistiche, a caratterizzare il comportamento del sistema. Una conseguenza sperimentalmente ossevabile di queste considerazioni e’ l’effetto Aharonov-Bohm.
Vedremo infatti che non e’ necessario ricorrere alla superconduttivita’ per sco~
prire effetti osservabili legati a A.
8.1 Effetto Aharonov-Bohm
Premessa: se ψo (x) e’ la f. d’onda che descrive un elettrone in assenza di campo
elettromagnetico, quella che descrive l’elettrone in interazione col campo e’ data
da
Rx
e
~ ~
ψ(x) = e−i ~c γ A·dl ψo (x)
(8.1)
dove γ e’ un cammino qualsiasi che congiunge il punto x a un punto all’infinito.
È infatti facile da verificare che una trasformazione di gauge sul potenziale
~→A
~′ = A
~ + ∇ω
A
induce la corretta trasfomazione di fase su ψ:
e
ψ → ψ ′ = e−i ~c ω ψ ;
108
inoltre la derivata ordinaria di ψo si trasforma nella derivata covariante:
e
e−i ~c
Rx
γ
~ ~l
A·d
∇ ψo (x) = {∇ + i
e ~
A}ψ(x)
~c
Una deformazione di γ (γ → γ + δγ) genera una variazione della fase di ψ pari a
I
e
~ · d~l .
δθ =
A
~c δγ
Nel vuoto banale, cioè in una regione semplicemente connessa in cui B ≡ 0 si
ha ovviamente δθ = 0.
Consideriamo la propagazione di un fascio di elettroni intorno a un sottile
~ parsolenoide rettilineo di sezione di area Σ in cui ci sia un campo magnetico B
allelo al solenoide che genera un flusso Φ = BΣ. Fuori dal solenoide il campo e’
nullo. Poiche’ la regione in cui si propagano gli elettroni non e’ semplicemente
connessa, i cammini γ si dividono in due classi di omotopia distinte, a seconda se
passano a sinistra o a destra del solenoide:
γ
......................................................................................................
......................................
........................................
...............................
..................
............................
.............
...........................
........
.
.
.
.
..............
....
.................
..
..................
....
...................
.....
....................
......
.....................
......
′
........................
.
.
.
.
.
.
.
.
.
..
...........................
....................................
...............
.................................................................................................
Σm
γ
Cammini appartenenti a classi distinte generano una differenza di fase
I
e
~ · d~l = e BΣ .
δθ =
A
~c δγ
~c
Se δθ 6= 2nπ si formano delle frange di interferenza previste da Aharonov e
Bohm nel 1959 e osservate sperimentalmente nel 1962. Questo effetto dimostra
che il potenziale elettromagnetico produce degli effetti osservabili anche quando
il campo elettromagnetico e’ nullo.
8.2 Dualita’ elettromagnetica
Le equazioni di Maxwell nel vuoto
~ =0 , ∇·B
~ =0 ,
∇·E
109
~
~
~ − ∂E = 0 , ∇ ∧ E
~ + ∂B = 0 ,
∇∧B
c∂t
c∂t
non sono solo invarianti, come è noto, per trasformazioni di Lorentz. Sono anche
invarianti per trasformazioni di dualità:
~ → cos α E
~ + sin α B
~ ,
E
~ → cos α B
~ − sin α E
~.
B
In particolare, se poniamo α = π2 , otteniamo la trasformazione discreta di dualità
~ →B
~ , B
~ → −E
~.
E
~ + iB
~ la trasformazione di dualità si puo’
Introducendo il vettore complesso E
scrivere in forma più compatta
−α ~
~
~
~
E + iB .
E + iB → e
Notare che la densità di energia E e di impulso ℘ del campo elettromagnetico, che
si possono scrivere nella forma
∗ 1 ~
~ + iB
~ ∧ E
~ 2 = 1 E2 + B2 , ℘ = 1 E
~ + iB
~ =E
~ ∧B
~,
+ iB|
E = |E
2
2
2i
sono invarianti per trasformazioni di dualità.
La simmetria per dualità delle equazioni di Maxwell viene distrutta quando si
accende l’interazione aggiungendo alle equazioni la densità di carica elettrica ρe
e la relativa densità di corrente ~je . Se si volesse preservare questa simmetria occorrerebbe introdurre parallelamente una densità di carica e di corrente magnetica
ρm e ~jm . Le equazioni di Maxwell diventerebbero allora
~
~
∇ · E + iB = ρe + iρm ,
~ + iB
~ = 1 ~je + i~jm ,
~ + iB
~ − ∂ E
−i∇ ∧ E
c∂t
c
e sono ancora invarianti per dualità, purchè le densità si trasformino nel modo
seguente
ρe + iρm → e−iα (ρe + iρm ) ,
~je + i~jm → e−iα ~je + i~jm .
110
Nella trattazione usuale dell’elettromagnetismo questa formulazione più simmetrica non la si fa per la buona ragione che i monopoli magnetici non sono (ancora)
stati osservati in natura.. Non c’ è però nessuna ostruzione concettuale che permetta di concludere che i monopoli magnetici non possono esistere. Anzi, come
vedremo, la loro esistenza consentirebbe di spiegare (Dirac, 1931) in maniera
semplice il fatto sperimentale che la carica elettrica di ogni particella è un multiplo intero di quella dell’elettrone. Vedremo che una teoria con cariche elettriche
e magnetiche è quantisticamente consistente solo se vale la condizione di quantizzazione di Dirac eg
= 2πn. Questa relazione non è invariante rispetto alla più
~c
~ → B,
~
generale trasformazione di dualità, ma solo rispetto alla dualità discreta E
~ → −E,
~ che implica
B
e → g , g → −e .
8.3 Derivazione semiclassica della condizione di quantizzazione
di Dirac
Consideriamo una particella classica puntiforme di massa m e carica e immersa
nel campo magnetico generato da un monopolo puntiforme di carica g (perciò
~ = g ~r3 ). L’equazione del moto è
B
4π r
ge ˙
~r˙ ~
d2
=
~r ∧ ~r .
m 2 ~r = e ∧ B
dt
c
4πcr 3
La variazione di momento angolare è
d2~r
eg
d ˙ ∧ ~r ,
~r ∧ m~r˙ = m~r ∧ 2 =
~
r
∧
~
r
dt
dt
4πcr 3
quindi, nonostante il sistema sia soggetto a una forza centrale il momento angolare
orbitale non è conservato. Tuttavia, poichè
~r˙
ṙ
d ~r
1
˙
,
~r ∧ ~r ∧ ~r = − ~r 2 =
r3
r
r
dt r
si ha che il momento angolare totale conservato è
eg ~r
~r ∧ m~r˙ −
4cπ r
111
C’è quindi un contributo del momento angolare totale lungo la congiungente delle
due particelle. Essendo il momento angolare quantizzato in multipli interi o semiinteri di ~ si ha
n
eg
= ~
4cπ
2
che è nuovamente la condizione di quantizzazione di Dirac. 30
8.4 Derivazione di Dirac
Supponiamo di deformare il cammino γ dell’eq.(8.1) del § 8.1 , tenendo fissi i
punti x e ∞, facendo descrivere a γ una superficie chiusa Σ. Quando γ torna nella
posizione di partenza, la variazione δθ della fase di ψ(x) deve essere un multiplo
intero di 2π perche’ ψ(x) e’ a un sol valore.
Z Z
e
~ · dΣ
~ = ΦΣ (B) e = 2nπ
B
⇒ δθ =
~c
~c
Σ
~ = 0, il flusso di B
~ attraverso
In base alle equazioni di Maxwell, poiche’ div B
ogni superficie chiusa e’ nullo. Se pero’ ci fosse all’interno di Σ un monopolo
magnetico di carica g si avrebbe g = ΦΣ (B) = eg
= 2πn, che e’ la condizione
~c
di quantizzazione della carica magnetica di Dirac (1931). E’ sufficiente che in
un punto qualunque dell’universo ci sia un monopolo magnetico di carica g per
assicurare, in base al ragionamento precedente, che la carica elettrica di ogni par. Se in natura esistono particelle di
ticella deve essere un multiplo intero di hc
g
carica elettrica ei (i = 1, 2 . . . ) e monopoli di carica magnetica gj (j = 1, 2, . . . ),
ogni coppia carica - monopolo soddisfa la condizione
ei gj
= nij ,
hc
dove nij è un opportuno intero. Quindi ogni carica elettrica è un multiplo intero di
hc
. Per un dato gj sia noj il massimo comun divisore di n1j , n2j , . . . Allora ogni
gj
Questa e’ una
carica elettrica è un multiplo della carica elementare eo = noj hc
gj
spiegazione semplice e generale della quantizzazione della carica elettrica.
In questa formulazione elementare le cariche elettriche e magnetiche sono trattati come particelle puntiformi che sono introdotte a mano nella teoria. E’ da notare pero’ che esistono delle teorie di campo che sono semplici generalizzazioni
30
E’ curioso che per riprodurre questa condizione sia necessario ricorrere anche ai multipli
semi-interi di ~, come se il sistema monopolo-carica elettrica fosse un fermione.
112
non- abeliane del modello di Landau-Ginzburg della superconduttività, utilizzate
per descrivere le interazioni fondamentali delle particelle elementari, in cui necessariamente esistono delle soluzioni a energia finita che sono identificabili come
monopoli magnetici dotati di una struttura interna e di una massa finita (monopolo
di ’t Hooft- Polyakov, 1974), quindi l’ipotesi di esistenza di monopoli magnetici
in natura non solo non è contraddittoria, ma esistono modelli delle interazioni
fondamentali che la richiedono.
8.5 Stringa di Dirac
Mostriamo ora che la presenza di un monopolo magnetico genera necessariamente
~ e che la forma minimale di questa
una singolarita’ non fisica nel potenziale A
singolarità è una linea continua di forma arbitraria che congiunge il monopolo
magnetico all’infinito.
~ regolare in ogni regione semplicemente connessa31
È noto che esiste un campo A
~ non è singolare e ∇ · B
~ = 0 . Supponiamo che ci sia un
dello spazio in cui B
monopolo magnetico puntiforme di carica g nell’origine di un sistema di riferimento cartesiano. Il campo magnetico da esso generato avrà la forma a simmetria
radiale seguente
~ mono = g ~r .
B
4π r 3
Si ha ∇ · Bmono = gδ (3) (~r) e quindi la regione senza cariche magnetiche non
è semplicemente connessa; se però escludiamo dalla regione una linea continua
qualunque Γ che congiunga il monopolo all’infinito, la regione rimanente è sem~ è ivi regolare. Facciamo ora vedere che A
~ è necesplicemente connessa e quindi A
sariamente singolare su Γ. Consideriamo una sfera S2 di raggio arbitrario centrata
sul monopolo e supponiamo che Γ intersechi la sfera nel polo Sud; consideriamo
ora una calotta Nord di questa sfera di area Σ il cui bordo sia un parallelo γ. Il
flusso magnetico uscente dalla calotta ΦΣ è ovviamente proporzionale all’angolo
solido Ω del cono con vertice sul monopolo e base sulla calotta
I
g
~ · d~l
ΦΣ =
Ω= A
4π
γ
Ampliamo ora la calotta facendo scorrere γ sulla famiglia di paralleli da Nord a
Sud. Quando γ si riduce a un cerchiolino infinitesimo ε attorno al polo Sud, la
31
Cioè una regione in cui ogni superficie chiusa si puo’ deformare con continuità in un punto
senza uscirne fuori.
113
H
~ · d~l = g. Un
superficie Σ coincide con la sfera bucata, quindi Ω = 4π e ε A
integrale finito lungo un cammino infinitesimo implica che la funzione integranda
~ è singolare su Γ. Questa è una singolarità non fisica, perchè
sia singolare, quindi A
~ mono su Γ è regolare. Non è quindi possibile costruire un A
~ mono ben definito e
B
~ mono = ∇ ∧ A
~ mono anche su Γ.
tale che valga la relazione B
Vediamo ora un modo concreto per trattare questa singolarita’. Si puo’ pensare di realizzare un monopolo magnetico supponendo che esso sia il polo di un
sottilissimo solenoide filiforme, detto stringa di Dirac, che dalla posizione del
monopolo raggiunga un punto all’infinito sovrapponendosi alla curva Γ. Il flusso
magnetico che scorre nel solenoide è
I
~ · d~l = g
Φ= A
γ
dove γ è un circuito microscopico concatenato ad esso. Questa linea corrisponde
~ ed è quindi una singolarità fisica, ma se il solenoide è
a una singolarita’ di B
infinitamente sottile non c’è, per lo meno dal punto di vista della fisica classica,
nessun modo operativo per osservarla sperimentalmente.
Supponendo che la stringa di Dirac sia diretta lungo il semiasse z negativo, la
~ generata dalla stringa si può scrivere nella forma
singolarità in B
~ string = Bstring~k = gθ(−z)δ(x)δ(y)~k
B
da cui si ha subito32
~ string = ∂ Bstring = −g δ (3) (~x) ,
∇·B
∂z
~ =B
~ mono + B
~ string è solenoidale (cioè ∇· B
~ =
perciò il campo magnetico totale B
~ regolare corrispondente
0 ovunque) ed è quindi possibile costruire un potenziale A
~ = ∇∧A
~ ovunque.33 Viceversa non
al sistema monopolo-solenoide tale che B
~ string .
può esistere nessun potenziale il cui rotore riproduca unicamente il campo B
34
( ) Quindi
d
θ(t) = δ(t).
Utilizzando la nota proprietà dt
33
~
~ lo è.
Naturalmente A è singolare dove anche B
34
Se invece il solenoide filiforme occupasse tutto l’asse z o, più in generale un qualsiasi cam~ In particolare, se
mino Γ senza estremi, il campo del solenoide è dato dal rotore di un opportuno A.
Γ coincide con tutto l’asse z, utilizzando le considerazioni già sviluppate nella trattazione dei vor~ string = ∇ ∧ A
~ sing , con A
~ sing = g ∇α,
tici dell’elio superfluido o di Abrikosov, si ha che che B
2π
dove α è l’angolo di un sistema di coordinate cilindriche il cui asse coincide con l’asse z.
32
114
~ mono = ∇ ∧ A − gθ(−z)δ(y)δ(x)~k
B
6
@
I
@
@s @
@
R
@
?
=
6
@
I
@
@s @
@
R
@
-
È importante notare che la stringa di Dirac ha come unico ruolo di cancellare
la singolarità del potenziale e non deve produrre effetti fisicamente osservabili.
Quindi il sistema monopolo-stringa di Dirac deve essere fisicamente indistinguibile da quello con il solo monopolo. Di conseguenza lo sfasamento δθ prodotto
dall’effetto di Aharonov-Bohm (v. § 8.1) attorno alla stringa di Dirac deve essere
un multiplo intero di 2π:
I
e
~ · d~l = e g = 2nπ ,
A
δθ =
~c γ
~c
si ritrova cosı́ la condizione di quantizzazione di Dirac.
La forma Γ della stringa di Dirac può essere chiaramente scelta ad arbitrio.
Facciamo vedere che due configurazioni che differiscono per la scelta della stringa
~
~ mono + B
~ str (Γ)
di Dirac sono legate da una trasformazione di gauge: se B(Γ)
=B
′
′
~ )=B
~ mono + B
~ str (Γ ) sono i campi magnetici prodotti da due diverse cone B(Γ
~
~ ′) = B
~ str (Γ) −
figurazioni della stringa di Dirac, la loro differenza è B(Γ)
− B(Γ
~ str (Γ′ ) = ∇∧ A
~ sing , dove A
~ sing è il gradiente di una variabile angolare ( 34 ) che è
B
singolare solo sul cammino senza estremi ΓΓ′−1 , quindi queste due configurazioni
differiscono per una trasformazione di gauge (singolare).
115