F.Gliozzi Statistical Field Theory a.a. 2008/2009 1 Superfluidità Nella fisica degli stati condensati si conoscono sistemi che manifestano effetti quantistici su scala macroscopica. Un prototipo di tale natura fu previsto da Einstein nel lontano 1926: per effetto del principio di indistinguibilità di particelle identiche un gas perfetto di bosoni (cioè composto da bosoni non interagenti) al di sotto di una temperatura critica subisce una transizione di fase, caratterizzata dal fatto che una frazione macroscopica di molecole va ad occupare lo stato di minima energia. L’insieme di queste molecole costituisce il condensato di BoseEinstein, un fluido con proprietà quantistiche quali ad esempio fenomeni di interferenza tipiche della propagazione ondosa. Un fluido quantistico è caratterizzato dal fatto che la lunghezza d’onda λ di De Broglie associata alle particelle che lo compongono è maggiore della loro mutua distanza. Poichè λ è inversamente proporzionale alla velocità e d’altro canto la velocità quadratica media è legata alla temperatura del fluido, si trova che la temperatura a cui avviene la condensazione di Bose-Einstein è tanto più bassa quanto più bassa è la densità. È quindi molto difficile osservare questo fenomeno perchè un gas reale soddisfa l’approssimazione di gas perfetto solo se è molto rarefatto, il che comporta una temperatura di transizione estremamente bassa. Il primo condensato fu ottenuto solo nel 1995 ad una temperatura dell’ordine di un milionesimo di grado Kelvin per opera degli americani Eric Cornell e Carl E. Wieman del National Institute of Standards & Technology e del tedesco Wolfgang Ketterle del MIT che nel 2001 ricevettero il premio Nobel per la fisica in riconoscimento del loro lavoro. Un fluido quantistico molto più facile da produrre è l’He4 , il gas nobile piu’ leggero, il cui nucleo atomico è formato da due protoni e due neutroni e lo spin totale è zero, dunque un gas di Bose debolmente interagente. L’ He4 fu liquefatto per la prima volta nel 1908 per opera di Kamerlingh Onnes (premio Nobel nel 1913)nel suo laboratorio di Leida a una temperatura di 4.215 o K alla pressione di 1 atmosfera. Pochi anni dopo (1911) si scoprı́ una seconda fase fluida, nota come He II, che è stabile per T compreso tra 0 e circa 2.17 o K (il valore preciso del punto di transizione tra la fase HeI e HeII dipende dalla pressione) mentre la fase solida appare solo al di sopra di 25 atm. Fin dai primi esperimenti si osservo’ che questa nuova fase fluida manifestava proprieta’ molto strane: il liquido riusciva a defluire da screpolature dei recipienti cosı́ microscopiche che neppure l’He gassoso riusciva ad attraversarle; analogamente poteva scorrere attraverso capillari ultrasottili apparentemente senza nessuna resistenza come un fluido di viscosità nulla. Fluidi con queste proprietà si dicono superfluidi. 1 C’è qualche analogia tra la condensazione di Bose-Einstein e la transizione alla fase II (cioè superfluida) dell’He4 liquido. In particolare, mettendo i parametri dell’ elio nella formula per Tc (cioè la massa m degli atomi e la densità del fluido) si ottiene Tc ∼ 3.13 o K, che non è lontanissimo da To = 2.17 o K che è la temperatura di transizione nella fase II a pressione nulla. La dipendenza di CV da T è pero’ diversa a bassa temperatura. La forma di CV = CV (T ) ha suggerito il nome di punto λ per questo punto di transizione dalla fase di HeI (fluido normale) alla fase di He II (superfluido). 6 ... ...... .... ..... .. .. CV .. ........... .......................................... .... .. ..... .... .... . . . . ... ...... ....... . . . . . . . . .... ............ ................. Tc T L’elio liquido non è in realtà approssimabile in nessun modo a un gas perfetto perchè è un liquido (= alta densità) e le interazioni interatomiche non sono trascurabili. Studiando il potenziale interatomico si vede che gli atomi di He4 si comportano come sferette impenetrabili del diametro di 2.7 Å . Alla densità ordinaria ogni atomo ha a disposizione un volume di ∼ 45 Å 3 , quindi gli atomi sono piuttosto vicini. perchè l’ elio è l’unica sostanza liquida anche a 0 Kelvin? Partendo dal reticolo cristallino ( stabile a una pressione maggiore di 25 atm) e calcolando l’energia di punto zero dovuta alla vibrazione degli atomi attorno alla posizione di equilibrio si trova che l’ampiezza di oscillazione è dell’ordine della distanza reticolare. Cio’ accade perchè l’elio è molto leggero (= alta frequenza) ed è un gas nobile (interazione chimica molto debole). Proprietà dell’HeII . Tre proprietà fondamentali: • conduttività termica infinita • effetto meccano-calorico: due recipienti contenenti HeII, comunicanti attraverso un capillare sottilissimo e mantenuti a una differenza di pressione ∆P assumono due diverse temperature tali che ∆P = ρs∆T , dove s è l’entropia specifica e ρ la densità • superfluidità (è la proprietà piu’ importante): l’HeII fluisce attraverso i capillari senza apparente resistenza: la sua viscosità sembra nulla. 2 1.1 Calcolo della velocità critica La viscosità è la manifestazione macroscopica dello scambio di energia tra un fluido in scorrimento e la parete lungo cui scorre. Poichè questo scambio avviene per quanti (queste eccitazioni elementari sono dette quasiparticelle) può succedere che per ragioni cinematiche un fluido a temperatura zero che scorre a una velocità inferiore a un valore critico non puo’ produrre quasiparticelle nell’interazione con la parete, quindi non perde energia ed ha allora viscosità nulla (è superfluido). Il tutto dipende dalla forma della curva di dispersione, cioè dalla relazione tra impulso p e energia ǫ(p) delle quasiparticelle. Nell’elio superfluido, la diffusione con fasci di neutroni permette di stabilire che la curva di dispersione ha approssimativamente la seguente forma 6 ǫ ...... .. .............. .............. .... ......... ... .... ...... . . . . . . . . . ... ... .... .... .... ..... ..................... ..... . . . . ... .... .... - p curva di dispersione Per piccoli valori di p (grandi lunghezze d’onda) si ha ǫ(p) = c p , dove c è la velocità del suono. Eccitazioni di questo tipo sono dette fononi : sono i quanti del suono (classicamente onde di compressione e rarefazione). Vedremo che i fononi sono le eccitazioni più importanti per il comportamento termico del fluido a T ≤ 0.5 o K. Al di sopra di questa temperatura entra in gioco un altro tipo di quasiparticelle, dette rotoni , corrispondenti al minimo locale nella curva di dipersione (le altre eccitazioni dello spettro non sono stabili). Vediamo ora quali sono i vincoli cinematici nella produzione di una particella di impulso p e energia ǫ(p) da parte del fluido di massa M che scorre lungo una parete con velocità ~v. M=massa del fluido ~v =velocità iniziale v~′=velocità finale ~p=impulso della quasiparticella ǫ(p) = energia della quasiparticella. • Conservazione dell’impulso: M~v = M v~′ + p~ 1 1 1 p2 ′2 2 2 ⇒ Mv = (M~v − ~p) = Mv − ~v · p~ + 2 2M 2 2M 3 (1.1) • Conservazione dell’energia: 21 Mv 2 ≥ 21 Mv ′2 + ǫ(p) Inserendo la (1.1) nella disuguaglianza p2 ⇒ ~v · p~ − ≥ ǫ(p) 2M ǫ(p) . p Dunque affinchè il processo di produzione di pseudoparticelle sia cinematicamente possibile la velocità dell HeII non può essere arbitrariamente piccola: al di sotto della velocità critica M → ∞ ⇒ ~v · p~ > ǫ(p) ⇒ v > vcrit. = minp ǫ(p) p il fluido scorre senza attrito, dunque η = 0 a T = 0. In conclusione, ogni sostanza che • è liquida a T = 0 • ha uno spettro di eccitazioni formato a bassa energia da fononi è necessariamente superfluida a T = 0, perchè esiste una velocità critica vcr > 0. Cosa succede per T > 0? Il ragionamento precedente continua a valere, ma ora il liquido contiene un gas di fononi ( o piu’ in generale di quasiparticelle) che possono interagire con le pareti dando luogo a un comportamento viscoso, come vedremo nel prossimo paragrafo. 1.2 Effetto di trascinamento sul gas di quasiparticelle Supponiamo che una massa M di elio nella fase II a una temperatura T > 0 si stia muovendo a una velocità ~v. Nel suo moto esso trascina il gas di fononi e rotoni che descrive le eccitazioni termiche del sistema. Come cambia la distribuzione dei livelli energetici del gas per effetto del trascinamento? Per rispondere a questa domanda, supponiamo che nel liquido in moto si crei un’eccitazione di energia ǫ(p) ed impulso ~p a spese dell’energia cinetica del fluido, senza scambio di energia con le pareti. Utilizzando nuovamente la conservazione dell’impulso [eq.(1.1)] e dell’energia, si ha, per M molto grande, 1 1 Mv′2 + ǫ(p) ≃ Mv 2 − p~ · ~v + ǫ(p) . 2 2 4 Quindi la creazione di una eccitazione di momento ~p nel fluido in moto corrisponde a un contributo in energia pari a εv (p) = ǫ(p) − p~ · ~v . Possiamo allora concludere che il moto del gas di eccitazioni a una velocità ~v genera uno shift dei livelli energetici 1 pari a ǫ(p) − ~p · ~v. Calcoliamo l’impulso totale del gas di fononi, supponendo ~v molto piccolo (si trascurano i termini di ordine v 2 ) Indicando con P~ l’impulso totale del gas di fononi e con hn(ǫ)i il numero di fononi nel livello ǫ, si ha Z Z Z dhni 3 3 P~ = d p ~p hn(ǫ − ~v · ~p)i = d p ~p hn(ǫ)i − d3 p ~p (~v · p~) + O(v 2 ) . dǫ Il primo integrale è nullo perchè è la somma (o l’integrale) di vettori che puntano uniformemente in tutte le direzioni (lo si vede anche esprimendo ~p in coordinate sferiche). Nel secondo integrale dà un contributo solo la componente di p~ lungo ~v . Posto ~p = v~v2 (~p · ~v ) + ~ni (~p · ~ni ) (~ni , (i = 1, 2) indica una coppia di versori ortogonali a ~v ), si ha, in coordinate sferiche, ~v ~p = p cos θ + ~n1 p sin θ cos φ + ~n2 p sin θ sin φ v L’integrazione su φ elimina la componente lungo ~ni Z +1 Z ∞ dhni ~ ⇒ P = −~v d(− cos θ)2π p2 dp p2 cos2 θ dǫ −1 o Z 4π ∞ 4 dhni p dp . = −~v 3 o dǫ Poichè stiamo considerando un gas di fononi, si ha ǫ(p) = pc Z ∞ Z ∞ 4π dhni 16π 4 ⇒ P~ = −~v p dp = ~v p3 hn(ǫ)idp 3c o dp 3c o Z Z Z Z 16π ∞ 2 4U 4 = ~v 2 d3 pǫhn(ǫ)i = ~v 2 , p dpǫhn(ǫ)i = ~v 2 3c o 3c 3c U = energia interna per un gas di fononi (vedi il caso del corpo nero) U= π 2 κ4 T 4 V = V uo . 30 ~3 c3 1 il fluido che si muove rigidamente alla velocità ~v descrive, nel limite M → ∞, un sistema inerziale e lo shift in questione descrive il modo di trasformarsi dell’energia per effetto di una trasformazione (galileiana) da un sistema di riferimento ad un altro. 5 Questa formula va paragonata con l’impulso per unità di volume trasportato da un fluido ordinario che si muove alla velocità ~v : P~ /V = ρ~v . ⇒ In conclusione, il gas di fononi trascinato dall’He II in moto si comporta come un fluido ordinario di densità 4 16π 5 κ4 T 4 ρ = 2 uo = , 3c 45h3 c5 quindi l’impulso trasportato dal fluido non è più tutto concentrato nelle molecole che si trovano nello stato fondamentale, ma si suddivide tra queste molecole e il gas di fononi. La frazione di impulso trasportata dai fononi cresce proporzionalmente a T 4 . Per temperature maggiori di ∼ 0.5 o K il contributo dei rotoni non è piu’ trascurabile ed il gas delle eccitazioni va trattato come un gas di fononi e rotoni. La curva di dispersione ǫ(p) in prossimità del minimo rotonico in po si puo’ parametrizzare nella forma seguente ǫ(p) ≃ ∆ + (p − po )2 2µ dove ∆k ≃ 8.6 o K , µ ≃ 0.16mHe , po /~ ≃ 1.9 Å −1 . Il numero totale di rotoni, come quello dei fononi, non è fissato, quindi possiamo scegliere il potenziale chimico µ ≃ 0 (⇒ z ≃ 1). Il numero medio di rotoni nel livello energetico ǫ(p) sarà allora: hn(ǫ)i = eǫβ 1 −1 Nell’intervallo di temperatura in cui l’He è superfluido (0 ≤ T ≤ 2.17 parametri del rotone implicano ǫβ ≥ 4, quindi eǫβ ≫ 1 o K) i ⇒ hn(ǫ)i ∼ e−ǫβ . Quindi il rotone si comporta quasi come un sistema classico. Ripetiamo ora il conto che avevamo fatto per il gas di fononi per calcolare la densità effettiva associata ai rotoni. L’impulso complessivo trasportato da un gas di rotoni alla velocità ~v è dunque Z 4π ∞ 4 dhni ~ P = −~v p dp . 3 o dǫ Poichè n(ǫ) = e−ǫβ 4π ⇒ P~ = ~v β 3 Z ∞ p4 dphn(ǫ)i = ~v o 6 β X 2 −βǫ p e = 3 ǫ P β β ǫ p2 e−βǫ X −βǫ P −βǫ e = ~v hp2 iN̄ , = ~v 3 3 ǫe ǫ P dove si è posto N̄ = ǫ hnǫ i. Con buona approssimazione si ha hp2 i = p2o , quindi p2o i rotoni si comportano come particelle di massa effettiva 3κT in apparente accordo p2o 3 col teorema di equipartizione: 2m = 2 κT Calcoliamoci ora il numero medio N̄ di rotoni per unitá di volume in funzione di β: Z (p−po )2 4π ∞ 2 p dp e−β(∆+ 2µ ) N̄ = 3 h o Introduciamo la variabile adimensionale x2 = ⇒ p = (x + xo ) 4πe−β∆ N̄ = h3 2µ β 32 Z ∞ r 2µ , xo = β s 2 −x2 dx(x+xo ) e −xo β(p−po )2 2µ ; β po , dp = 2µ 4π e−β∆ ≃ h3 r 2µ β 2µ dx β 32 Z ∞ 2 dx(x+xo )2 e−x . −∞ Utilizzando il fatto che l’integrale di una funzione dispari su un intervallo simmetrico è nullo, si ha s !2 Z ∞ Z Z ∞ β β 2 ∞ 2 −x2 2 −x2 = po e x dxe + po dxe−x ; dx x + 2µ 2µ −∞ ∞ −∞ e dalle note relazioni: r Z ∞ Z Z ∞ √ π d ∞ 2 −x2 t 2 −x2 dxe = , dxe−tx |t=1 = π/2 , x dxe =− t dt −∞ −∞ −∞ si ottiene e−β∆ N̄ = 2 3 h 2πµ β 32 e−β∆ 2 + 4π 3 po h 2πµ β 12 . 1 e−β∆ p2o ( 2πµ )2 . Poichè numericamente si verifica che p2o ≫ 2µκT , ⇒ N̄ ∼ 4π h3 β Inserendo questo valore nella formula che ci dà l’impulso per unitá di volume trasportato da un gas di rotoni in movimentosi ha: 1 4π P~ = ~v 3 e−β∆ p4o (2πµβ) 2 , 3h 7 quindi il gas di rotoni si comporta come un fluido di densità ρrot = 1 4π −β∆ 4 2 e p (2πµβ) o 3h3 Da questa relazione si desume, come avevamo anticipato, che la densità dei rotoni è trascurabile per T ≤ 0.5 o K e diventa dominante in prossimità del punto lambda. L’He II appare composto da due fluidi che si compenetrano senza attrito: una componente superfluida di densità ρs formata dall’elio nello stato fondamentale e una componente normale di densità ρn = ρf on + ρrot . In particolare, ρn (T = 0) = 0 e tutta la massa è superfluida. Al crescere della temperatura la frazione ρρn (ρ = ρn + ρs = densità dell’ He II) cresce ed è 1 al λ-point, dove tutto il fluido diventa normale (ed è dominato dalla componente rotonica). Inserendo i valori dei parametri nell’espressione che abbiamo trovato per ρrot si ottiene ρρn ∼ 1 per Tc = 2.8 o K, che non è lontanissimo da 2.17 o K (valore sperimentale del λ-point). La componente normale, essendo formata da eccitazioni che si muovono in tutte le direzioni, ha ovviamente uno scambio di impulso con la parete, quindi il suo moto è viscoso, per cui non riesce a passare attraverso i capillari molto sottili, cosa che invece può fare la componente superfluida. Si spiega cosi’ facilmente l’effetto meccano-calorico: se due recipienti di HeII inizialmente alla stessa T sono posti in comunicazione con un capillare e sono mantenuti con una differenza di pressione costante ∆P ________________ __________________ | | | | | A | | B | | | | | | ========== | | P+DP | | P | | | | | --------------------------------in modo che ci sia un flusso da A a B ⇒ il fluido in B si raffredda perchè attraverso il capillare fluisce solo la componente superfluida ( che è a entropia 0 e quindi a T = 0). Con lo stesso meccanismo si spiega anche l’effetto termomeccanico: se A e B inizialmente alla stessa P sono mantenuti a una differenza di temperatura ∆T , si genera un flusso nel capillare che determina una ∆P ∝ ∆T . 8 1.3 Conducibilità termica infinita e secondo suono Le variazioni di temperatura in un sistema omogeneo ordinario si propagano nel mezzo in accordo con l’equazione di propagazione del calore (di cui si è parlato più diffusamente nel capitolo sul moto browniano negli appunti di Meccanica Statistica ) 1 ∂u ∆u = , (1.2) D ∂t dove ∆ è il Laplaciano e u = u(~x, t) denota la temperatura nel punto ~x al tempo t. Nell’ He II la condicibilità termica D è infinita, quindi l’equazione precedente non è più valida. Si può pensare che il membro di destra dell’eq.(1.2) sia in realtà il primo termine di uno sviluppo in serie di Taylor in t. se il primo termine è zero, il termine successivo con la derivata seconda non è più trascurabile, perciò 2 ci si aspetta che l’equazione venga modificata nel modo seguente ∆u = v12 ∂∂t2u , che rappresenta la propagazione per onde delle variazioni di temperatura. Dunque nell’He II ci si aspettano due tipi di propagazioni per onde: 1. Il suono, cioè propagazione di onde di pressione o di densità descritta dall’ eq. di d’Alembert 1 ∂2ρ ∆ρ = 2 2 c ∂t dove c è la velocità del suono che nell’HeII vale ∼ 238 m/sec. 2. Il secondo suono, cioè la propagazione di fluttuazioni di ρn a ρ costante. Una variazione locale di ρn corrisponde a una variazione locale della temperatura, quindi il secondo suono è un’onda di temperatura. Nell’ambito della teoria dei due fluidi, è facile derivare l’equazione di propagazione del secondo suono nel caso del gas di fononi (cioè nel caso dell’He II al di sotto di 0.5 o K). Indichiamo con ε = VU l’ energia per unità di volume del gas di fononi. L’equazione della meccanica F = ma si traduce in un fluido nell’equazione fondamentale dell’idrodinamica: ~ p~˙ = −∇P (p = impulso per unità di volume, P = pressione) 9 D’altra parte, la conservazione dell’energia (eq. di continuità) si scrive: 1 ε̇ + div p~ = 0 , c2 2 da cui si ha ddt2ε = −c2 div p~˙ = c2 ∆P . Ma in un gas di fononi (o di fotoni) abbiamo già visto che la pressione è legata alla densità di energia da P = 3ǫ ⇒ d 2 ǫ c2 − ∆ǫ = 0 dt2 3 Questa è di nuovo un’ equazione di d’Alembert che descrive la propagazione di un’onda alla velocità u= √c 3 che è appunto la velocità del secondo suono. Sperimentalmente la velocità del secondo suono coincide con questa predizione teorica di Landau in un ampio intervallo di temperatura, per poi decrescere rapidamente in prossimità del punto lambda. 1.4 Teoria microscopica di Feynman Questo è un approccio qualitativo che intende dare un fondamento microscopico al fenomeno della superfluidità ed è basato semplicemente sullo studio delle proprietà della funzione d’onda che descrive l’elio. Cominciamo col vedere le proprietà della f. d’onda che descrive lo stato fondamentale. La funzione d’onda si puo’ pensare come una mappa φ che assegna ad ~2 , ..R~n (R ~i = ogni configurazione dell’elio, individuata da 3N coordinate R~1 , R raggio vettore dell’iesimo atomo) un’ampiezza di probabilità ~1 , R~2 , . . . R~N → φ(R ~1 , R~2 , . . . R~N ). R L’He4 è un liquido di Bose-Einstein ⇒ φ è simmetrica rispetto a tutte le permutazioni delle molecole. Proprietà fondamentale: φ è reale e non ha nodi, percio’ si puo’ sempre scegliere con lo stesso segno (ad es. positiva). 10 Infatti φ soddisfa l’ equazione di Schrödinger ! X ~2 X − △i + V (rij ) φ = Uφ. 2m i ij Essendo l’eq. lineare e reale, anche φ∗ è una soluzione. Possiamo quindi scrivere ∗ ∗ o φ−φ . tutte le soluzioni in forma reale: φ+φ 2 2i La soluzione corrispondente allo stato fondamentale minimizza l’energia: R h2 P P R 2 2 ~ N~ (∇ φ) + dN R V (r )φ i ij i ij 2m φHφd R = hEi = R R ~ ~ φ2 d N R φ2 d N R Si puo’ dimostrare che, essendo H un operatore ad elementi di matrice positivi, la f. d’onda dello stato fondamentale non ha nodi (Teorema di Perron Frobenius). Argomento di plausibilità: sia x una delle coordinate. Se φ ha un nodo ⇒ la funzione |φ| dà a hEi lo stesso contributo di φ, tranne nel nodo (φ = 0), dove ∂|φ| è singolare, per cui φ e |φ| hanno approssimativamente la stessa energia, ma ∂x è chiaro che si puo’ rendere meno spigolosa |φ| con un arrotondamento |φ| → ...φ̃ : ... ....... .... ............. ......... . . . . . . . . . . . . . . . . . . . . . . ......... ... ......... ..... ..... |φ| 6 ..................... .... .... . . . . . ... .. .... ... .. ..... ... ... ..... ...... .... - x φ̃ .... ............ .......... . . . . . . . . . . . . . . . . . . . . ... ............. ............. ..... .... 6 .................. .... . . . . . . . . ... .. .... ... .. ...... ... ... ...... .. .. ... .. .. x che dà un minor contributo di ( ∂|φ| )2 e quindi l’energia di φ̃ è minore, contraria∂x mente all’ipotesi che l’energia fosse minima ⇒ φ non ha nodi. ⇒ Lo stato di energia piu’ bassa non è degenere: se ci fossero due diverse autofunzioni φ1 e φ2 di minima energia, esisterebbe allora una combinazione µ1 φ1 + µ2 φ2 con un nodo, quindi l’energia non potrebbe essere minima. Se φ è l’autof. di energia minima, il contributo di (∇i φ)2 deve essere il minimo possibile, quindi φ deve variare il minimo possibile; ⇒ una configurazione con qualche atomo molto vicino ad un altro (v. figura) è molto improbabile perchè una piccola variazione della sua posizione provoca una grande variazione di φ: 11 Esempio: ___________ | o o | | o o | | o o o | | o o o | ----------φ>0 ___________ | o o | | o o o | | o o| o | o← |o ----------φ∼0 ⇒ le conf. piu’ probabili nello stato fondamentale sono quelle in cui gli atomi sono distribuiti approssimativamente in modo uniforme. Stati eccitati: vediamo di dimostrare che le uniche eccitazioni dell’He di grande lunghezza d’onda non possono che essere dei Rfononi (= onde di compressione). Sia ψ la f. d’onda del I stato eccitato. Poichè φψd3N R = 0 e φ > 0 , ⇒ ψ ha un nodo ed è positiva per metà delle configurazioni e negativa per l’altra metà. Supponiamo che ψ sia un’eccitazione di grande lunghezza d’onda che non sia un fonone. ⇒ ψ non è associata a un cambiamento di densità. Sia A la conf. in cui ψ è massima (positiva) e B quella in cui ψ è minima (negativa). A e B sono indistinguibili e interscambiabili, perchè ψ → −ψ è una simmetria che scambia configurazioni di tipo A con quelle di tipo B. Indichiamo con o la posizione degli atomi in A e con × la posizione nella configurazione B. Le posizioni × occuperanno gli interstizi lasciati dalla configurazione A In condizioni stazionarie il sistema si evolve nel tempo oscillando tra le due configurazioni A e B. Se ψ descrive un’eccitazione di grande lunghezza d’onda, si deve realizzare la trasformazione da A a B con spostamenti di atomi su grande scala. Esempio: e × × ×e e ←→ × e × e e @ e× ≡ l × @ e R @ e ←→ × e × × e e × e e × ×e × × e× 12 Si sono indicate due transizioni di larga scala da una posizione o a una posizione ×. Le due transizioni sono scelte in modo che la densità media delle conf A e B non si alteri, perciò se una molecola passa dallo stato o allo stato × (rappresentata dai due quadrati in linea continua), ci sarà in prossimità un’altra molecola che passerà dallo stato × allo stato o ( quadrati tratteggiati) Ma queste due transizioni si possono decomporre nella seguente maniera: • a) i due atomi in posizione o a grande distanza sono scambiati tra di loro, ma i due atomi sono indistinguibili, quindi questa trasf. non dà effetti osservabili. • b) l’atomo in posizione o passa nella posizione × a lui vicina, quindi l’effetto della transizione è in realtà un effetto su scala molto piu’ piccola (è in sostanza la scala delle distanze interatomiche). In conclusione, il fatto che l’ He4 soddisfa la statistica di Bose-Einstein impedisce il manifestarsi di eccitazioni su larga scala che non siano fononi (variazioni di densità). • Funzione d’onda del fonone: Sia ρ(x) la densità dell’elio. Sviluppando in serie di Fourier (cioè in modi normali di vibrazione), si ha X qk e−ik·x . ρ= k In prima approssimazione, l’Hamiltoniana del sistema è X 1 1 H= ( q̇k2 + k 2 c2 qk2 ) 2 2 k ( c = velocità del suono ) L’energia del livello n−esimo dell’oscillatore k si puo’ scriver al solito nella forma Ek = ~kc(n + 12 ). La f.d’onda dello stato fondamentale è Y kc qk2 Φ= e− 2~ k ( nota Φ > 0) Un fonone d’impulso ~k è il primo stato eccitato (n = 1) dell’oscillatore armonico k. La sua f.d’onda ψk è esprimibile con il polinomio di Hermite di primo grado H1 (x) = x − ⇒ ψk = qk e 2 kc qk 2~ Y k ′ 6=k 13 − e k′ c q 2 ′ k 2~ = qk Φ Φ non è la vera f.d’onda φ dello stato fondamentale (non contiene i dettagli delle interazioni tra atomi a corte distanze). La forma corretta della funzione d’onda del fonone è ψ = qk φ, dove φ è la funzione d’onda vera dello stato fondamentale. Approssimando gli atomi con dei punti materiali di massa m: X ~ j) ρ(~x) = m δ (3) (~x − R j ⇒ qk = Z eik·x ρ(~x)d3 x = m X eik·Rj ; j in conclusione, ψk = P j eik·Rj φ . • Funzione d’onda del rotone Si è visto che la funzione d’onda che ha per massimo la conf. con tutti gli atomi nella posizione o e per minimo la conf. con tutti gli atomi in posizione × descrive un’eccitazione a corta lunghezza d’onda ( dell’ordine della distanza interatomica). Questa eccitazione è il rotone. Supponiamo, per semplificare in maniera drastica, che gli atomi possano occupare solo le posizioni o o ×. Sia No il numero di atomi nella posiz. o e N× il numero nella posizione ×. Una funzione d’onda che interpola tra la conf. A e B è ψ = (No − N× ) φ. Pochè N = No + N× , è facile verificare che ψ è ”ortogonale” a φ: (ψ, φ) = X conf ig. ψφ = N X No =0 (2No − N)φ2 = 0. In maniera piu’ precisa, conviene introdurre per ogni atomo una funzione interpolante f (R) che vale +1 se l’atomo si trova nella posizione o e −1 se si trova in posizione ×. X ⇒ψ= f (Ri )φ . i 14 La forma precisa di f si puo’ ottenere da un calcolo variazionale ottenuto imponendo che ψ abbia energia minima. Si dimostra che f ha ancora la forma f (x) = eik·x come nel caso del fonone, ma il valore dell’energia associata ǫ(k) è diverso ed è esprimibile in funzione delle proprietà dello stato fondamentale (v. Feynman, Statistical Mechanics). 1.5 Vortici nell’ HeII Sia φ la f.d’onda dell’HeII nello stato fondamentale a riposo. ⇒ φ > 0. Se il fluido si muove macroscopicamente a una velocità ~v, ogni imv·Ri atomo i contribuisce con un fattore di fase e ~ e la f.d’onda diventa m Φ = ei ~ P j Rj ·v φ = ei P P ·R ~ φ, Rj j dove P~ = Nm~v è l’impulso totale e R = N denota le coordinate del centro di massa. Tale formula continua a valere anche nel caso in cui la velocità non è costante ma varia lentamente. In questa ipotesi la variazione di fase δθ tra configurazioni che differiscono per ”piccoli” spostamenti delle molecole (piccoli rispetto alla scala di variazione delle velocità) è data da Xm δθ = vj · δRj ~ j Questa è ad esempio la variazione della fase se si fotografa la configurazione degli atomi ad istanti successivi. Consideriamo una successione di atomi i = 1, . . . k disposti ad anello, e degli spostamenti δRj che mandino circolarmente 1 → 2 → 3 . . . i → i + 1 . . . k → 1. Poichè gli atomi sono indistinguibili, questa permutazione non puo’ dare effetti osservabili, per cui δθ = 2nπ. Per un anello molto grande si puo’ sostituire alla somma un integrale. E’ inportante ora osservare che ogni moto macroscopico dell’HeII può essere realizzato a livello microscopico con una serie di permutazioni delle molecole, quindi non deve dare effetti osservabili nella fase della funzione d’onda. Quindi per ogni cammino chiuso γ si può scrivere I nh 2nπ~ = , (n = 0, ±1, ±2 . . . ) ~v · d~l = m m γ Questo è il teorema della circuitazione di Feynman. Nell’approssimazione in cui il campo ~v(R) è un campo vettoriale continuo, una piccola variazione del circuito 15 h γ → γ + δγ non puo’ comportare una variazione della quantità n m I ⇒ ~v · d~l = 0 ; δγ ma δγ è il bordo di una superficie semplicemente connessa Σ. Si puo’ allora applicare il lemma di Green: I Z ~ ~ ⇒ ~v · dl = rot ~v · dΣ δγ Σ ⇒ rot ~v = 0 (condizione di Landau) Quindi la velocità dell’HeII in movimento è un campo irrotazionale. Ne consegue che in una regione semplicemente connessa si puo’ trovare una funzione ~ tale che scalare Θ(R) ~v = ∇Θ . Bisogna ammettere che l’argomentazione usata, pur essendo suggestiva, è piuttosto artificiosa, soprattutto per quanto riguarda la commistione di argomenti microscopici con altri macroscopici. Vediamo ora di trovare un’altra argomentazione più solida, basata su un’interpretazione ~ microscopica (cioè in termini di funzione d’onda) di Θ(R). La f. d’onda dell’He nello stato fondamentale si puo’ scrivere nella forma fattorizzata N Y ~ 1, R ~2 . . . R ~N) = ~ i) Φ(R ψ(R i=1 che soddisfa tutte le proprietà di simmetria della f. d’onda bosonica. Questa proprietà di fattorizzazione è del tutto generale per un sistema bosonico nello stato ~ fondamentale. L’ informazione che ora ci occorre è che se il fluido è in moto ψ(R) 2 ~ ~ è complessa. Inoltre normalizziamo ψ in modo che | ψ(R) | = n(R) rappresenti il numero di molecole per unità di volume. ~ ~ = eiθ(R) ~ (φ∗ = φ), è ora facile verificare che, posto ψ(R) φ(R), ~v = ~ ~ ∇θ(R) m 16 Infatti, poichè l’operatore impulso è dato da ~p̂ = −i~∇, la densità di impulso si ottiene, come è noto, da ℘ ~=~ ψ ∗ ∇ψ − ψ∇ψ ∗ = ~|ψ|2∇θ 2i ~ v = n(R)m~ ~ v , si ote poichè nella formulazione macroscopica si ha ℘ ~ = ρo (R)~ tiene l’equazione per ~v incorniciata, che è appunto la descrizione del campo delle velocità ~v(R) in termini microscopici. Se si continua ad utilizzare l’approssimazione del limite continuo è facile convincersi chei vortici si possono avere solo per regioni non semplicemente connesse. Infatti in questo caso la fase θ può essere una funzione polidroma Consideriamo un recipiente formato dall’intercapedine tra un cilindro esterno di raggio b e uno interno di raggio a, entrambi di altezza l non necessariamente coassiali. Consideriamo un sistema di coordinate cilindriche rispetto all’asse del cilindro più interno. Si ha θ = θ(ρ, z, α), dove 0 ≤ z ≤ l, ρ > a e α è l’angolo polare attorno all’asse. Quando compiamo un giro attorno a quest’asse α → α + 2π e la fase θ non ritorna necessariamente al suo valore iniziale, ma poich‘e ψ è a un sol valore, la forma funzionale di θ è θ = f (ρ, z, α) + n α , dove f è un’arbitaria funzione periodica in α (f (ρ, z, α + 2π) = f (ρ, z, α)) e n è un numero intero relativo. Se ora utilizziamo la formula incoriniciata per calcolare la circuitazione di ~v ritroviamo il teorema della circuitazione di Feynman: dunque la quantizzazione dei vortici è una conseguenza della richiesta che la funzione d’onda sia a un sol valore. Studiamo ora il caso in cui gli assi dei due cilindri siano coincidenti, cosicchè il problema acquista una simmetria cilindrica. Per la simmetria e per il fatto che non ci sono nè pozzi, nè sorgenti, le linee di flusso sono dei cerchi concentrici. '$ # b ta "! &% Poichè le superfici equipotenziali θ =costante sono necessariamente ortogonali alle linee di flusso, formano un fascio di piani uscenti dall’asse dei cilindri. In coordinate polari (ρ, α) si avrà θ = f (α) 17 dove f è una funzione che ora cerchiamo di determinare. Si ha ∇θ = Ponendo α = arctan xy , si ottiene ∂α −y/ρ2 ∂x , ∇α = = ∂α 2 x/ρ ∂y df ∇α. dα quindi ∇α è, come c’era da aspettarsi, un campo tangenziale e |∇α| = 1/ρ. Poichè per la simmetria del problema |~v | è solo funzione di ρ, il modulo dell’equazione df ~ df | dα | |∇α|, ci dice che dα =costante, quindi incorniciata, |~v| = m θ = kα Poichè la f. d’onda ψ è a un sol valore ⇒ k è un intero positivo negativo o nullo; per k 6= 0 si ha un vortice e il campo delle velocità è dato da −y/ρ2 ~ . ~v = k m 2 x/ρ Calcolando la circuitazione del campo delle velocità lungo un cammino chiuso γ concatenato con il vortice si ottiene nuovamente il teorema della circuitazione di Feynman: I kh ~v · d~l = , (k = 0, ±1, ±2, . . . ) m γ Calcoliamoci ora l’energia del vortice per unità di lunghezza: Z Z Z b 1 ρo ~2 ρo h2 b E dρ 2 = dα ρo v ρdρ = 2π = log( ), l 2 2 m2 4π m2 a a ρ dove ρo è la densità dell’elio. Se a è dell’ordine della distanza interatomica ( pochi Å) la descrizione continua non è piu’ giustificata, il campo di velocità ~v non è in realtà singolare al centro del vortice ⇒ i vortici quantizzati si possono formare anche nelle regioni connesse. L’asse del vortice non è necessariamente una retta, ma una linea che puo’ finire ai bordi del sistema o puo’ richiudersi su se stessa: vortex ring o vortice ad anello. Questi modi collettivi sono delle pseudoparticelle perchè hanno, come vedremo, energia ed impulso fissati. I vortex ring sono soluzioni a energia finita delle equazioni del moto dell’elio superfluido. A causa della quantizzazione della circuitazione di ~v (Teorema di 18 Feynman), queste soluzioni sono stabili: non possono perdere energia per dissipazione 2 . Ma come fa un flusso irrotazionale a generare un vortice? Come puo’ nascere la discontinuità necessaria? Supponiamo che esista una superficie Σ che separi l’HeII in due parti: una che scorre a velocità ~v sopra la superf. e l’altra che è a ~v = 0 He II He II → → → → Σ ~v ~v = 0 Se si toglie la parete di separazione Σ (in assenza di ogni perturbazione) abbiamo P ~ v ·Rj un sistema descritto da due f. d’onda: eim j ~ φ e φ. C’è una discontinuità tra P ~v·Ri le due pareti, tranne nei punti in cui eim i ~ = 1 La circuitazione attorno al cammino punteggiato ← discontinuità è 6= 0 ⇒ possono formarsi dei vortici. 1.6 Flusso irrotazionale Vediamo ora che forma ha il flusso irrotazionale da un orifizio di un microcapillare che immette HeII alla velocità ~v in un recipiente con HeII in quiete. Utilizzando l’analogia con il campo elettrico (che è irrotazionale) ci si convince facilmente che per avere un moto irrotazionale le linee di flusso all’uscita dal capillare devono disporsi a raggera (il campo delle velocità ha la stessa forma di un campo elettrico generato da una sorgente puntiforme posta all’uscita del capillare, quindi ~v ∝ r~r3 ), il che comporta forti accelerazioni all’uscita del capillare e il coinvolgimento di tutto il fluido che inizialmente era in quiete (perche’ la velocità diminuisce in modulo come il quadrato della distanza dall’orifizio, sempre in analogia a quanto 2 Le soluzioni stabili di energia finita delle equazioni del moto di un sistema dinamico qualsiasi (classico o quantistico) si dicono solitoni. Ne vedremo altri esempi in altri sistemi. 19 succede per il campo elettrico). In conclusione il flusso irrotazionale è una configurazione di energia elevata. He II 1.7 Velocità critica con i vortex rings Dal punto di vista energetico è piu’ conveniente un flusso a getto cosicchè ci sono le condizioni per la formazione dei vortici. Sezione di un vortex ring '$ '$ # # ↑ ↑ri ri "! "! &% &% ← 2 r→ L’anello si muove in direzione perpendicolare al suo piano a una velocità ~ 2mr (Basta calcolare la velocità del centro del vortice di destra provocato dal campo di velocità del vortice di sinistra). L’energia trasportata dal vortice si puo’ calcolare approssimativamente applicando la formula del vortice a simmetria cilindrica per un cilindro di lunghezza l = 2πr v= ρo h2 r r log 2 2m a Quando l’He scorre con una velocità v lungo un capillare di raggio R puo’ produrre dei vortici di raggio r < R purchè ⇒ ǫ(r) = v ≥ vcrit = min(ǫ/p) ( condizione di Landau) . 20 Per calcolare l’impulso p del vortice usiamo il fatto che la derivata della curva di dispersione nel punto p coincide con la velocità della corrispondente quasiparticella 3 : dǫ ~ =v= dp 2mr ⇒ dp dp dr 2mr = = dǫ dr dǫ ~ D’altra parte ρo h2 r ρo h2 dǫ = log + dr 2 m2 a 2 m2 2mr dǫ h r dp = = ρo 2π (r log + r) . ⇒ dr ~ dr m a Integrando rispetto a r da a a R si ottiene 4 h r2 h r2 r2 a2 r r 2 a2 p = 2πρo = 2πρo . log r + (1 − 2 log a) − log + − m 2 4 4 m 2 a 4 4 Trascurando il termine a2 4 che è microscopico si ha ~ ǫ = p mr ⇒ vcrit 1 2 log ar . + log ar log Ra ~ . = √ mR log( e Ra ) La forma funzionale della dipendenza della velocità critica in un capillare è in accordo con i dati sperimentali, anche se il valore è leggermente piu’ grande. C’è un effetto correttivo dovuto ai vortici di dimensioni paragonabili al diametro del capillare. 3 questa è una proprietà generale legata alla definizione di energia e impulso. È immediato p2 o per o verificarla per l’energia cinetica di una particella puntiforme non relativistica E = 2m p relativistica E = c (mc)2 R+ p2 R 4 Si fa uso dell’integrale x log xdx = 41 log(x2 )d(x2 ) = 14 [R2 log R2 − R2 ] 21 Pr es sione solido supersolido He I He II gas Temperatura Figure 1: Forma schematica del diagramma delle fasi dell’He4. 1.8 Elio supersolido Per oltre 40 anni si è molto discusso sulla possibile esistenza di solidi quantistici con comportamento analogo ai superfluidi e detti perciò supersolidi. Solo molto di recente si è riusciti ad ottenere la prova sperimentale dell’esistenza di questo nuovo stato della materia per opera di due ricercatori coreani (E.Kim e M.H.W. Chan, 2004). Essi costruirono un dispositivo formato da un piccolo anello di He4 solido di raggio di 1 cm in rotazione attorno al suo asse di simmetria (l’elio può esistere allo stato cristallino solo a presioni dell’ordine di 25 bar o superiori e a bassa temperatura, v. Fig.1 ). Essi osservarono al di sotto della temperatura di 175 mK (millikelvin) una improvvisa riduzione del momento di inerzia del dispositivo, purchè la velocità di rotazione fosse minore di un valore critico vc = 300 µm/sec, come se una parte del solido non venisse più trascinata dalla rotazione dell’anello. Questa frazione di solido è appunto il supersolido, mentre la parte rotante costituisce il solido normale. La frazione supersolida risultò essere dell’ordine di 5 - 25 10−3 . L’interpretazione teorica più accreditata di questo fenomeno è la seguente. L’He4 solido a queste temperature è un solido quantistico in cui importanti effetti tunnel fanno fluttuare il numero degli atomi in ogni sito reticolare. Questo porta all’esistenza di atomi di elio delocalizzati, che possono essere descritti solo 22 attraverso una funzione d’onda che è diversa da zero in un intervallo di alcuni passi reticolari. Gli atomi delocalizzati costituiscono le quasiparticelle, cioè le eccitazioni elementari del sistema, definite da stati di impulso ed energia fissati ( la curva di dispersione sembra essere ǫ = ǫo sin(k a), dove a è il passo reticolare). L’insieme di queste quasiparticelle forma un gas bosonico che al di sotto di una temperatura critica subisce la condensazione di Bose -Einstein. Si genera cosı̀ un condensato, formato dalle quasiparticelle nello stato fondamentale, che costituisce la componente supersolida del cristallo. Sia la temperatura di condensazione che la velocità critica, data da min(ǫ/k), riproducono con buona approssimazione i dati sperimentali. 23 2 Transizioni di fase e singolarita’ di F Molti sistemi fisici al variare della temperatura o di qualche altra variabile termodinamica (per esempio la pressione o il campo magnetico) subiscono una transizione di fase. Esempi tipici sono i cambiamenti di stato (liquefazione dei gas, solidificazione dei liquidi, transizione He I - He II) e le transizioni ordine-disordine dei sistemi magnetici. Le transizioni di fase sono fenomeni cooperativi che richiedono un numero infinito di gradi di libertà. Dal punto di vista della meccanica statistica esse corrispondono a singolarità dell’energia libera. Questo capitolo è dedicato allo studio di queste singolarità. Useremo come sistema di riferimento il modello di Ising (vedi gli appunti di MS). 2.1 Zeri della funzione di partizione Le transizioni di fase si manifestano come singolarità dell’energia libera, ossia singolarità del logaritmo della funzione di partizione Z. Questa è in generale una funzione olomorfa dei parametri β e h. In particolare per ogni reticolo di dimensione finita si può scrivere ( come vedremo esplicitamente tra poco) come un polinomio ( a coefficienti positivi) nelle variabili exp(−2β) e exp(−2h). Dunque le possibili singolarità di log Z sono gli zeri della funzione di partizione. Poichè i coefficienti di questi polinomi sono positivi gli zeri cadono per valori complessi di β e di h. Partendo da queste considerazioni Lee e Yang, in due famosi lavori apparsi nel 1952, proposero un nuovo punto di vista nello studio delle transizioni di fase. Essi congetturarono che gli zeri dela funzione di partizione si accumulino su linee del piano complesso e la densita’ di questi zeri aumnenti all’aumentare della taglia del sistema. Nel limite termodinamico queste linee si dovrebbero maninifestare come tagli della funzione energia libera nel piano complesso di exp −2β e exp −2h. Le singolarità sono dunque i punti di diramazione associati a questi tagli. Quando il sistema è prossimo a una transizione di fase questi punti di diramazione si avvicinano all’asse reale in coppia dal di sotto e dal di sopra e lo toccano proprio al punto di transizione. Dunque dal punto di vista delle proprietà di analiticità le singolarità associate alle transizioni di fase sarebbero dunque dovute a un fenomeno di pinching che rende impossibile la continuazione analitica tra fasi diverse. Queste congetture hanno avuto numerosissime conferme da analisi numeriche e analitiche e sono ormai universalmente accettate. Nel caso particolare degli zeri nel piano complesso di h Lee e Yang provarono un teorema di grande generalità sugli zeri della funzione di partizione del modello di Ising che rafforza notevolmente queste 24 congetture: 2.2 Teorema di Lee e Yang Gli zeri della funzione di partizione di un modello di Ising ad accoppiamento ferromagnetico definito su un grafo qualsiasi cadono tutti sull’asse immaginario di h. Per dimostrare questo teorema, scriviamo esplicitamente la funzione di partizione Z su un grafo arbitrario formato da N nodi e L links e supponiamo per il momento che il campo magnetico possa variare da punto a punto X P P P Z= e hiji βSi Sj + i hi Si = eLβ+ i hi P (τ, ρi) , (τ = e−2β , ρi = e−2hi ), {Sk =±1} (2.1) dove P (τ, ρi) = X P e hiji β(Si Sj −1)+ P i hi (Si −1) {Sk =±1} è un polinomio in τ e ρi . In particolare è al massimo di grado L in τ e di primo grado in ogni variabile ρi e complessivamente di grado N nelle variabili ρi . P (τ, ρi ) si può anche considerare come la grand partition function di un gas reticolare (o lattice gas) in cui il generico nodo i è occupato (Si = −1) o vuoto (Si = +1; nel primo caso ρi (che funge da fugacità) compare alla prima potenza, mentre nel secondo caso la potenza è zero. Per esempio, per un grafo composto da un singolo nodo associato alla variabile ρ il polinomio corrispondente è P = 1+ρ. Similmente per un grafo g formato da due nodi uniti da un link si ha t ρ1 t ρ2 P12 (g) = 1 + τ (ρ1 + ρ2 ) + ρ1 ρ2 . Se G è un grafo arbitrario contenente il nodo a si avrà Pa (G) = A+ + A− ρa , dove A+ è il contributo di tutte quelle configurazioni in cui Sa = +1 e A− è il contributo delle ltre con Sa = −1. Se G e G′ sono due grafi disgiunti conteneti rispettivamente il nodo a e il nodo b è facile convincersi che il polinomio relativo al grafo G ∪ G′ (non connesso) formato da entrambi è il prodotto dei relativi polinomi: Pa,b (G∪G′ ) = (A+ +A− ρa )(B+ +B− ρb ) = A++ +A−+ ρa +A+− ρb +A−− ρa ρb , 25 dove nella seconda uguaglianza si è scritta la forma generale del polinomio relativo alle due variabili ρa e ρb valida anche nel caso di un grafo connesso. Supponiamo ora di fondere i due nodi a e b in un unico nodo ab associato alla variabile ρab . Le configurazioni in cui i due nodi a e b avevano segni diversi sono ovviamente eliminate dal conteggio mentre tutte le altre contribuiscono con lo stesso numero. Perciò dopo la fusione il polinomio precedente diventa Pa,b → Pab = A++ + A−− ρab . È chiaro che ogni grafo G può essere ottenuto da un numero sufficiente di fusioni del grafo elementare g formato da due nodi e un link disegnato qualche riga precedente, quindi per dimostrare il teorema basta 1. provare che è vero per g; 2. applicare il principio dell’induzione completa, facendo vedere che questa proprietà sopravvive alla fusione. Ponendo P12 (g) = 0 si ha ρ2 = − 1 + τ ρ1 , τ + ρ1 da cui si può facilmente dimostrare che se |ρ1 | < 1 segue |ρ2 | > 1 5 . Perciò, se ρ1 = ρ2 = e−2h come vuole l’ipotesi del teorema di Lee e Yang, le due soluzioni di P12 (g) = 0 hanno h immaginario, come vuole la tesi. Ne consegue che se entrambi i ρ sono all’interno del cerchio unitario P12 (g) non si annulla. Supponiamo ora che questa proprietà sia vera per un generico grafo G con N nodi, cioè che P (G) 6= 0 per |ρi | < 1 i = 1, . . . , N. Vogliamo dimostrare che questa proprietà sopravvive all’ operazione di fusione di due nodi qualsiasi. Siano a e b i nodi che vogliamo fondere. Prima della fusione la dipendenza da ρa e ρb di P (G) è al solito Pa,b (G) = A++ + A−+ ρa + A+− ρb + A−− ρa ρb . Per le ipotesi fatte , se poniamo 6 ρa = ρb = x, le due soluzioni dell’equazione A−− x2 + x(A−+ + A+− ) + A++ = 0 5 Infatti, ricordando che τ < 1, se |ρ1 | < 1, poichè il prodotto di due numeri di modulo inferiore a uno ha modulo ancora più piccolo, si ha |ρ1 |2 (1−τ 2 ) < (1−τ 2 ), da cui 1+τ 2 |ρ1 |2 > |ρ1 |2 +τ 2 . 2 |ρ1 |2 +2τ ℜeρ1 D’altra parte, prendendo il modulo quadro di ρ2 si ha |ρ2 |2 = 1+τ . Inserendo la τ 2 +|ρ|21 +2τ ℜeρ1 disuguaglianza trovata nel numeratore di questa frazione si ha appunto |ρ2 | > 1, cvd. 6 Attenzione, questo non significa aver fuso i due nodi!. 26 T >T 1 c T>T>T 1 2 c T=T c Figure 2: arco di condensazione degli zeri di Lee e Yang nel piano complesso di ρ = e−2h per due diverse temperature della fase calda e per la temperatura critica. hanno modulo > 1, perciò |A++ /A−− | > 1. Questa disuguaglianza implica che dopo la fusione il corrispondente polinomio A++ + A−− ρab si annulla solo per |ρab | > 1. In conclusione, se non c’erano zeri all’interno del cerchio unitario prima della fusione non ci sono neache dopo la fusione. Utilizziamo ora l’ovvia simmetria Z(β, h) = Z(β, −h) della funzione di partizione del modello di Ising per riscrivere l’eq.(2.1) nella forma Z(β, h) = eLβ e−hN P (τ, ρ) = eLβ eN h P (τ, 1/ρ) , ossia P (τ, 1/ρ) = ρN P (τ, ρ) , che ci permette di concludere che non ci sono radici neppure all’esterno del disco unitario e che per ogni radice sulla circonferenza della forma ρ = eiho ce n’è un’altra con ho → −ho . Questo completa la dimostrazione. E’ facile verificare il teorema in due casi limite. A T = 0 tutti i nodi devono avere lo stesso valore e dunque ci sono solo due stati possibili e si ha PN (τ = 0) = 1 + ρN . Gli zeri sono le radici ennesime di -1 e sono quindi distribuiti omogeneamente sul cerchio unitario; nel limite termodinamico N → ∞ ricoprono densamente tutta la circonferenza. Nell’altro limite T = ∞, ogni nodo è indipendente da ogni altro ed è come aver messo a zero il numero dei link. Il polinomio associato è dunque PN (τ = 1) = (1 + ρ)N che ha un unico zero di molteplicità N in ρ = −1. Al discendere della temperatura, sempre nel limite termodinamico, l’arco su cui si condensano gli zeri diventa sempre più ampio ed è simmetrico rispetto all’asse reale, come riflesso della simmetria h → −h. Se il sistema ha un punto critico per T = Tc l’arco di condensazione si chiude e coincide con l’intera circonferenza proprio a Tc (v. Fig.2). Avviene quindi il fenomeno di pinching delle singolaritá, che divide il piano complesso di ρ, e quindi anche di h, in due regioni disgiunte, che segnalano l’esitenza di due fasi distinte. 27 2.3 Il punto di diramazione di Lee e Yang Nel limite termodinamico le linee di condensazione degli zeri non si manifestano come zeri ma come tagli della funzione di partizione. Una delle ragioni è che la funzione di partizione è in generale una funzione analitica con al più delle singolarità isolate, quindi i suoi zeri non possono formare un insieme denso.Le singolarità che sopravvivono nel limite termodinamico sono i punti terminali delle linee di condensazione degli zeri, che si manifestano come punti di diramazione (o branch points). D’altra parte è noto che il luogo dei punti in cui l’autovalore più grande della transfer matrix coincide con l’autovalore successivo corrisponde a singolarità dell’energia libera (è immediato verificarlo scrivendo la funzione di partizione in funzione di questi autovalori e facendo poi il limite termodinamico). Quindi nel caso si conosca la forma analitica di questi autovalori si possono studiare le singolarità nel piano complesso dei parametri in gioco. Applichiamo queste considerazioni al modello di Ising unidimensionale in campo magnetico, la cui transfer matrix è stata descritta nel corso di Meccanica Statistica, i cui autovalori λi , i = 1, 2 sono q β λi = e cosh h ± e2β cosh2 h − 2 sinh 2β . I due autovalori coincidono quando si annulla il discriminante sotto radice, che fornisce l’equazione sinh2 h = −e−4β , da cui si evince che nel piano complesso di h le singolarità giaciono sul’asse immaginario, come vuole la teoria di Lee e Yang. Per h in modulo molto piccolo si ha hc ≃ ±ie−2β , quindi il pinching tra le due singolarità avviene solo per T = 0 come c’era da aspettarsi. Possiamo fare un’altra verifica della teoria di Lee e Yang utilizzando l’approssimazione di campo medio (MFA), che in prossimità della transizione di fase porta all’equazione fondamentale della MFA che riscriviamo per comodità nella forma h = t m + u m3 , dove t è la temperatura ridotta e u una costante positiva. Essendo un’equazione di terzo grado essa ha sempre tre soluzioni reali o complesse. C’è da aspettarsi che le singolarità del’energia libera vadano ricercate nel luogo dei punti dove due di 28 queste soluzioni coincidono, luogo che si ottiene studiando le soluzioni comuni tra tale equazione e la sua derivata t + 3u m2 = 0 . 4 3 Eliminando m tra queste due equazioni si ottiene h2 = − 27u t che nella fase calda ( t > 0 ) ha solo le due soluzioni simmetriche e puramente immaginarie r 4 3 hc = ±i t2 , 27u in accordo con la teoria di Lee e Yang. Quest’equazione definisce un nuovo esponente critico che descrive il il modo in cui questa coppia di singolarità si avvicina all’asse reale all’approssimarsi del punto critico t → 0. 29 3 Il legame tra la meccanica statistica e le teorie quantistiche di campo Svilupperemo in questo capitolo un formalismo che consente di riformulare ogni problema di meccanica quantistica o di teoria quantistica dei campi in un problema di meccanica statistica classica (e viceversa). 3.1 Modello di Landau-Ginzburg In prossimita’ di Tc l’approssimazione di campo medio non dipende dai dettagli microscopici del modello di Ising. Tutta (o quasi) l’informazione e’ contenuta nell’eq. di campo medio m t + um3 = B (3.1) dove t è la temperatura ridotta t = (T − Tc )/Tc Gli esponenti critici dipendono solo dal fatto che il coefficiente di m è proporzionale a T − Tc e che il coeff. di m3 e’ positivo. Cerchiamo di costruire un’ Hamiltoniana effettiva che riproduca l’eq. di campo medio come condizione di equilibrio termico, cioè come minimo del’energia libera del sistema. Questa Hamiltoniana sarà la base di partenza per una descrizione piu’ accurata del sistema attorno al punto critico. Poiche’ la struttura microscopica del sistema non deve giocare un ruolo importante conviene sostituire la variabile di Ising Si = ±1 tipica di una descrizione microscopica con una variabile continua φi(−∞ < φi < ∞) che descrive la magnetizzazione di una regione, non necessariamente infinitesima, centrata in i. In questo modo si descrive meglio il fatto che a Tc non c’e’ nessuna scala naturale in gioco. φ è la magnetizzazione media di un intorno di i le cui dimensioni effettive non sono a priori fissate. Lavoriamo momentaneamento su un solo sito. Poniamo per ora H(φ) = 12 r0 φ2 + 4!1 u0 φ4 con u0 > 0 r0 =∝ t Z Z 1 1 2 4 −H(φ)+Bφ Z = dφe = dφe− 2 r0 φ − 4! u0 φ +Bφ β e µ sono stati riassorbiti nella variabile di integrazione φ. Approssimazione di Landau: la somma sulle configurazioni è rimpiazzata dalla (o dalle) configurazione(i) che minimizza(no) l’energia libera, che in questa approssimazione, coincide con l’Hamiltoniana: Z = e−H(φ0 )+Bφ0 , φ0 : H ′ (φ0 ) = B 30 H ′(φ0 ) = B ⇒ B = r= φ0 + µ0 3 φ 3! 0 m = hφi = φ0 ⇒ il minimo di H riproduce l’approssimazione di campo medio in prossimita’ di Tc , quindi si ricavano gli stessi esponenti critici. Nell’approssimazione di un solo sito i minimi secondari di H non sono trascurabili rispetto al minimo assoluto ⇒ non c’è in realtà rottura spontanea della simmetria. Occorre generalizzare il modello a N siti (nodi di un reticolo (iper)cubico d-dimensionale). Il modello di Ising suggerisce un accoppiamento ferromagnetico tra i primi vicini: −φi φi+µ (µ= versore in una delle d direzioni) Con una opportuna ridefinizione di r0 possiamo introdurre questo accoppiamento con un termine Pd 1 del tipo 2 µ=1 (∇µ φi )2 dove ∇µ φi ≡ φi+µ − φi . Di conseguenza la funzione di partizione del modello di Landau- Ginzburg si puo’ scrivere nella forma Z Y P Z= dφi e−HGL (φ)+ i Bi φi i HGL " X 1X 1 1 (∇µ φ)2 + r0 (T )φ2i + u0 φ4i = ad 2 µ 2 4! i # a = passoPreticolare R (è introdotto per rendere piu’ comodo il pasaggio al limite continuo: i → dd x). Approssimazione di Landau: Z ∼ e−HGL [φi0 ]+ P i Bi φi0 , GL [φi ] . dove φ0 è definito dalla condizione: φi0 : Bi = ∂H∂φ i Si puo’ ora capire come il limite N → ∞ puo’generare la rottura spontanea della simmetria: poniamo Bi = B ⇒. Il sistema e’ ora invariante per traslazioni ⇒ φi0 = φ0 . Definiamo la magnetizzazione spontanea m come il doppio limite lim lim hφi ≃ φ0 , B→0+ N →∞ dove ≃ sta ad indicare l’approssimazione di Landau. Se T < Tc e B > 0, la dipendenza di H da φ è grosso modo della forma seguente 31 6 H . ... ......... ... .. .. ........... . . ....... ..... . .. ....... .. .... ........... ........ .. ... . ............. . ... ... ... ... φ′0 ... ... . . ... ... ........... φ0 - φ dove φ′0 è un minimo relativo e φ0 il minimo assoluto. Si ha H(φ′0 )−H(φ0 ) = N c, dove c è la differenza di energia per il singolo sito, quindi ′ ′ ⇒ Z ≃ e−HGL (φ0 )+Bφ0 + e−HGL (φ0 )+Bφ0 →N →∞ e−HGL (φ0 )+Bφ0 e dunque ′ ′ φ0 e−HGL +Bφ0 + φ′0 e−HGL (φ0 )+Bφ0 = φ0 + O(e−N c ) , hφi ≃ Z quindi nel limite termodinamico si ha rottura spontanea della simmetria. 3.1.1 Derivata funzionale e calcolo variazionale su reticolo Nel limite continuo HGL [φ] è un funzionale di φ(x). La derivata funzionale δI[φ] δHLG [φ] , o, piu’ in generale, δφ(x) (dove I e’ un funzionale qualsiasi) si puo’ calδφ(x) colare ricorrendo alla definizione su reticolo, in base alla regola seguente δI 1 ∂I = lim d , δφ(xi ) a→0 a ∂φi dove φi = è la variabile dinamica associata al sito i di coordinata xi . Esempi: Z X δI = p f (x)φp−1(x) fk φpk ⇒ I[φ] = dy f (y)φp (y) = lim a a→0 δφ(x) k Z ⇓ δI = V ′ (φ(x)) . δφ(x) 2 Z X 1 ∂φ = lim a (φk+1 − φk )2 J = dy 2 a→0 ∂y a k I[φ] = ⇒ dy V (φ(y)) ⇒ ∂J 2 2 = 2 [(φi − φi+1 ) + (φi − φi−1 )] = − 2 (∇φi − ∇φi−1 ) a∂φi a a 32 ⇓ δJ ∂2φ = −2 2 . δφ(x) ∂x δφ(y) 1 = lim δij = δ(y − x) , δφ(x) a→0 a dove l’ultima δ è la delta di Dirac, infatti lim a→0 X k 1 a f (xk ) δki = f (xi ) = a Z f (y)δ(y − x)f (x)d y . 3.1.2 Energia libera di Helmholz e di Gibbs Prima di procedere oltre, conviene sviluppare una conseguenza importante del teorema fluttuazione risposta. L’energia libera di Helmholtz F e’ definita da e−βF = Z. F e’ una funzione di β e B (o β e V nei gas), inoltre: ∂F ∂F , M=− S=− ∂T B ∂B dove M è la magnetizzazione totale, M = M V . Il differenziale totale di F si può allora scrivere nella forma dF = ∂F ∂F dT + dB = −SdT − MdB . ∂T ∂B Definiamo la seguente trasformazione di Legendre: Γ = F + MB, detta energia libera di Gibbs magnetico variabile da punto a punto si ha R campo P (nel caso di un d Γ = F + i Bi hφi i = F + d x B(x)hφ(x)i) ⇒ ∂Γ dΓ = −SdT + BdM ⇒ Γ = Γ(β, M) , inoltre B = ∂M T . Poniamo β = µ = 1 per semplificare la notazione. Abbiamo già visto che il correlatore Gij si puo’ scrivere nella forma: Gij = δ δ δ2 log Z = − F. δBi δBj δBi δBj 33 Scegliendo un campo B(x) della P forma B(xi ) = λi B , d ove i λi sono dei numeri ∂ log Z reali arbitrari, si ha ∂B = λi hφi i e quindi 2 ∂ log Z = ∂B 2 X ij *" X i λi φ i − X j λj hφj i #2 + = X λi λj Gij > 0 . ij P Una matrice Aij che gode della proprieta’ ( ij λi λj Aij > 0) si dice positiva. Le matrice positive non hanno autovalori nulli (anzi, sono tutti positivi) ed è percio’ invertibile; se infatti avesse un autovalore nullo e detto x = (x1 , x2 , . . . ) il suo autovettore ⇒ xi xj Aij = 0 contrariamente all’ipotesi. 2Γ δM δ2 log Z è l’inversa di G = = δBij infatti Teorema: la matrice Aij = δMδi δM ij δBi δBj j Aij Gjk = δBi δMj = δik ; cvd. δMj δBk (3.2) Esercizio: calcoliamoci l’energia libera di Gibbs nell’approssimazione di Landau Z = e−HLG [φ0 ]+ R dd x B(x)φ0 (x) [φ0 ] Dove φ0 è la configurazione che minimizza HLG , cioè φ0 (x) : δHδφLG = B(x). 0 (x) Si ha Z F = HLG [φ0 ] − dd x B(x)φ0 (x) ⇒ Γ[φ0 ] = HLG [φ0 ] Γ[φ] = Z 1 u0 1 (∇φ)2 + r0 φ2 + φ4 d x 2 2 4! d Soluzione uniforme: φ0 (x) = M ⇒ Γ(M) = V ( 21 r0 M 2 + u4!0 M 4 ). Poiche’ ∂T B = V1 ∂M ⇒ B = r0 M + u60 M 3 che e’ proprio l’equazione del campo medio, per cui si derivano gli stessi esponenti critici. 3.1.3 Calcolo dei correlatori nel modello di LG Nell’approssimazione di Landau si ha Z 1 r0 2 u 0 4 D 2 Γ[φ] = d x (∇φ) + φ + φ 2 2 4! ⇒ B(x) ≡ u0 δΓ = −∆φ + r0 φ + φ3 . δφ(x) 6 34 = G(x, y). Nel caso di campo magnetico costante D’altra parte si ha δhφ(x)i δB(y) l’invarianza traslazionale ci dice che G(x, y) = G(x − y) ⇒ differenziamo δΓ rispetto a B(y) si ha l’equazione B(x) = δφ(x) δ (d) (x − y) = −∆GLG (x − y) + ξ −2 GLG (x − y) , con ξ −2 = r0 + u0 2 m, 2 (3.3) (3.4) dove si è posto m = hφi . ξ è la lunghezza di correlazione. Usando le solite condizioni di minimo dell’energia libera a campo magnetico nullo ro φ + u60 φ3 = 0 si ha, sia nella fase fredda che in quella calda, 1 ξ −2 ∝ t ⇒ ν = (3.5) 2 La sua trasformata di Fourier dà 1 1 , (3.6) G̃LG (k) = p u 2 (2π)d k + r0 + 20 M 2 da cui Z 1 dd k e−ik·x GLG (x) ≡ , (2π)d k 2 + r0 + u20 M 2 esattamente come nel caso gaussiano (cfrt. eq.(4.4)). Si e’ gia’ visto (vedi gli appunti di MS) che G(x) in prossimità di Tc ha la forma funzionale seguente : Z g(r/ξ) g(r/ξ) 1 h(k ξ) dd x eik·x d+η−2 = 2−η G(r) = d+η−2 , ⇒ G̃(k) = p r r k (2π)d dove h(k ξ) è una funzione adimensionale ottenuta integrando sulla variabile adimensionale r/ξ. 1 T = Tc ⇒ G̃(k) ∝ 2−η . k ma a T = Tc si ha r0 = 0 , M = 0, quindi la (3.6) diventa GLG (k) = k12 ⇒ η=0. In teoria di campo l’indice critico η e’ la dimensione anomala del campo φ. L’origine di questo termine si può capire dalle seguenti considerazioni dimensionali. Poichè Z = e−H[φ] , ⇒ H e’ adimensionale Z 1 H = dd x (∇φ)2 + . . . 2 35 [H] = [dd x] + 2[∇] + 2[φ] [H] = 0 ⇒ [φ] = 2−d 2 D’altra parte [G(x, y)] = 2[φ], perciò [G̃] = 2[φ] + d = 2 . Se η 6= 0 queste considerazioni dimensionali evidentemente non valgono più: per effetto dell’interazione il campo φ acquista una dimensione anomala che si puo’ calcolare utilizzando il gruppo di rinormalizzazione. Esercizio: calcoliamoci la forma esatta del correlatore in d = 3 nella teoria di Landau-Ginzburg Z eik·x d3 k . G(x) = (2π)3 k 2 + ξ −2 Poniamo k · x = kr cos θ d3 k = −k 2 dk dφ d cos θ Z Z ∞ Z 1 1 1 1 ∞ k dk k 2 dk −ikr cos θ G(x) = 2 sin kr e d cos θ = (2π)2 0 k 2 + ξ −2 −1 (2π)2 r 0 k 2 + ξ 2 1 1 = 2 ℑm 4π r Z ∞ −∞ kdkeikr k 2 + ξ −2 Per il lemma di Jordan si ha, “chiudendo di sopra”, I Z ∞ kdkeikr keikr kdkeikr = = 2πi Res 2 −2 2 −2 k 2 + ξ −2 k=iξ−1 γ k +ξ −∞ k + ξ = 2πi lim−1(k − iξ −1 ) k→iξ ⇒ ℑm Z ∞ −∞ keikr = iπe−r/ξ (k − iξ −1 )(k + iξ −1 ) 1 −r/ξ kdkeikr −r/ξ = πe ⇒ G(~ x ) = G(r) = e k 2 + ξ −2 4πr 3.1.4 Criterio di consistenza di Ginzburg Il correlatore è una grandezza fisica strettamente legata alle fluttuazioni. Nel modello di Landau-Ginzburg si ha, comme si è già visto G(x, y) = hδφ(x) δφ(y)i 36 con δφ(x) = φ(x) − m(x) ≡ φ(x) − hφ(x)i. Nell’approssimazione di Landau m(x) = φo (x), dove φo (x) è la configurazione che minimizza l’Hamiltoniana. Poiché in questa approssimazione, come nella Mean Field Approximation (MFA), si trascurano in una certa misura le fluttuazioni, affinché quest’approccio sia consistente occorre che le fluttuazioni siano piccole rispetto alle altre quantità valutate nella stessa approssimazione. La fluttuazione del campo in un punto x influenza la regione circostante di volume V ∝ ξ d , per cui un parametro che misura la consistenza interna della MFA è R d R d d x V d yhδφ(x) δφ(y)i δM2 = V , V ≃ ξd . (3.7) 2 M φ2o V 2 L’approssimazione è consistente solo se in prossimità del punto critico (ξ → 2 ∞) il parametro δM non diverge. Questa richiesta costituisce il Criterio di Ginzburg. M2 Calcoliamoci questo parametro. Si ha, come abbiamo visto più volte, φ2o ∝ t ∝ ξ −2 (si veda ad es. l’eq. (3.4)). D’altra parte Z 2 δM = V dd xG(x) = G̃(k = 0) = V ξ 2 . V 2 Applicando il criterio di Ginzburg limξ→∞ δM < ∞ si ottiene un importante M2 vincolo sulle dimensioni d dello spazio in cui gli esponenti critici derivati nella MFA sono affidabili: ξ 4−d < c dove c è un’opportuna costante. Si vede chiaramente che , se d < 4 (che è ovviamente il caso sperimentalmente importante nei sistemi considerati dalla meccanica statistica), quando il sistema si avvicina al punto critico la lunghezza di correlazione cresce sempre fino a un valore in cui il criterio di Ginzburg è violato, quindi per d < 4 la descrizione del comportamento critico data dall’approssimazione del campo medio non è corretta. Ciò non toglie che per molti sistemi (compresi i superconduttori di cui ci occuperemo in seguito) la costante c è molto grande, per cui questa descrizione è accurata anche in prossimità di Tc . Lo strumento adatto per studiare il comportamento critico dei sistemi a d < 4 è il gruppo di rinormalizzazione, che ora applicheremo al modello di LandauGinzburg. 37 Il minimo numero di dimensioni d necessarie affinchè l’ approssimazione di campo medio descriva correttamente il comportamento critico di un sistema è noto come dimensione critica superiore. Dunque il modello di Ising ( e quindi anche il modello di L-G con accoppiamento quartico) ha dimensione critica superiore d = 4. Esercizio: verificare che la dimensione critica superiore in una teoria di LG contenente un’interazione cubica del tipo vφ3 è d = 6. 3.2 Integrali di cammino ( Feynman path integrals) Siano P e Q gli operatori impulso e posizione di una particella di massa m soggetta a un potenziale V = V (Q) Hamiltoniana: H= P2 + V (Q) , [Q, P ] = i~ 2m H H Nella rappresentazione di Heisenberg si ha Q(t) = e−it ~ Qeit ~ . Sia |q, ti = un −iHt autostato dell’operatore posizione all’istante t; ⇒ Q|qi = q|qi , |q, ti = e ~ |qi. Si usa la normalizzazione standard hq ′ , t|q, ti = δ(q ′ − q). Analogamente |pi = qp R autostato di P , hp|qi = √12π ei ~ , dp|pi hp| = 1. Problema: calcolare l’ampiezza di probabilita’ hq ′ , t′ |q, ti iH(t′ −t) ~ hq ′ , t′ |q, ti = hq ′ |e |qi Poniamo per il momento ~ = 1, supponiamo ∆t = t′ − t ≪ 1 e trascuriamo i P2 P2 termini di ordine (∆t)2 . Si ha allora eiH∆t ≡ ei( 2m +V (Q))∆t = ei 2m ∆t eiV (Q)∆t (1 + O[(∆t)2 ]) 7 Z ∞ p2 ′ ′ ⇒ hq , t |q, ti = dphq ′|ei 2m ∆t |pihp|eiV (q)∆t |qi + O(∆t2 ) Z ∞ −∞ Posto ǫ = −∞ ′ Z 7 i 2m ∆t dphq |e −i∆t , 2m ∞ −∞ p2 iV (q)∆t |pihp|e |qi = Z ∞ −∞ dp −i(q′ −q)p+ ip2 ∆t iV (q)∆t 2m e e 2π si ha dp −i(q′ −q)p−ǫp2 e = 2π Z ∞ −∞ dp − e 2π 1 Si e usata la proprieta’ eA eB = eA+B+ 2 [A,B]+... 38 h √ i2 ′ 2 ′ p ǫ− i(q2√−q) − (q −q) 4ǫ ǫ = = e −i(q ′ −q)2 m 2∆t √ 1 2π ǫ Z ∞ dx e =e −i(q ′ −q)2 m 2∆t 2π −∞ quindi ′ −x2 ′ hq , t |q, ti = r √ π q −i∆t 2m −i(q ′ −q)2 m 2∆t e = q −i2π∆t m im −i(∆q)2 m +iV (q)∆t + O(∆t2 ) . e 2∆t 2π∆t Se (∆t)2 non e’ trascurabile, dividiamo l’intervallo t′ − t in un numero N sufficientemente grande di intervalli uguali t = to < t1 < t2 · · · < tN = t′ e poniamo ∆t = ti+1 − ti . Si ha l’ovvia identità Z Z ′ ′ ′ ′ hq , t |q, ti = hq , t | dqN −1 |qN −1 , tN −1 ihtN −1 , qN −1 | . . . dq1 |q1 , t1 iht1 , q1 |q, ti = = Z −1 ∞ N Y dqi −∞ i=1 r im −i PNj=1 [(∆qj )2 m −V (qj )∆t] 2∆t + O ∆t2 , e 2π∆t dove si e’ potuto scrivere un unico esponenziale perche’ gli esponenti non sono piu’ operatori ma numeri. Nel limite ∆t → 0 l’esponente diventa l’integrale seguente N X (∆qj )2 m j=1 2∆t Z − V (qj )∆t → t t′ dt mq̇ 2 − V (q) 2 = S[q, q̇] , dove il funzionale S[q, q̇] denota l’azione del punto materiale in esame. In definitiva, reintroducendo la costante di Planck, si ha r Z Y Z N −iS im −i S[q̇,q] ′ ′ hq , t |q, ti = dqj e~ ≡ Dq e ~ , 2π∆t 1 (3.8) che esprime l’ampiezza di probabilita’ mediante un integrale di cammino: l’ampiezza di probabilita’hq ′, t′ |q, ti e’ la somma dei contributi dei cammini che partono all’ istante t da q e raggiungono all’istante t′ la posizione q ′ ; ogni cammino q(t) con−iS[q̇,q] tribuisce con un ”peso” e ~ . Il massimo contributo e’ dato dalla traiettoria classica, cioe’ quella che minimizza l’azione: δS = 0. Per i cammini molto diversi della traiettoria classica, una piccola variazione del cammino provoca una grande variazione di S e quindi −iS una rapida oscillazione di e ~ ; viceversa i cammini vicini alla traiettoria classica, 39 cioè tali che |S − Scl | ≤ ~, danno il contributo dominante. In molti casi si puo’ tenere conto di queste fluttuazioni quantistiche sviluppando in serie di potenze di ~: il termine di ordine 0 e’ dato dalla traiettoria classica. Il modello ora descritto si puo’ ovviamente generalizzare a traiettorie in uno spazio di dimensioni qualsiasi qi (t), i = 1 . . . D. Vedremo tra poco un altro tipo di generalizzazione non piu’ di un modello di meccanica quantistica, ma uno di teoria dei campi. Q Il limite N → ∞ nell’integrale di cammino j dqj e−iS/~ non e’ matematicamente ben definito, perchè è difficile caratterizzare topologicamente il fattore S oscillante e−i ~ . Si ricorre allora a una continuazione analitica a tempi immaginari t → iτ. Con questa continuazione analitica il fattore di fase diventa reale, il che consente di porre il path integral in una forma matematicamente rigorosa, che Wiener aveva sviluppato nei primi anni ′ 40 per descrivere il moto browniano. Qui ci contentiamo di vedere le modificazioni subite dall’azione S per effetto della sostituzione 2 dq dq ˙2 dq t → iτ ⇒ dt → idτ , q̇ ≡ = −i , q = − dt dτ dτ " # Z τ ′ 2 Z t′ m dq mq˙2 − V (q))dt = − + V (q) dτ = −SE ( ⇒ −i 2 dτ 2 τ t SE e’ detta ”azione euclidea” e la rappresentazione di hq ′ , t′ |q, ti mediante integrali di cammino diventa Z SE [q̇,q] ′ ′ hq , τ |q , τ i = D q e− ~ (3.9) che ha la stessa forma della funzione di partizione di un sistema di meccanica statistica unidimensionale con le sostituzioni H ↔ SE e κT ↔ ~. Vediamo ora qualche proprieta’ generale dei cammini che contribuiscono maggiormente all’integrale di cammino (3.8). L’analisi diventa particolarmente semplice se poniamo V (q) = 0 (modello gaussiano). Riscriviamo la (3.8) in forma discreta 8 Z Y N − dqi αi e P 2 j m(qj+1 −qj ) 2~∆t 1 8 ∆t e’ in realta’ ∆τ in questa descrizione euclidea 40 , αi = r m 2π∆t (3.10) e calcoliamoci il valor medio 2 h(qj+1 − qj ) i ≡ R QN 1 dqi αi (qj+1 − qj )2 e− hq ′ , τ ′ |q, τ i SE ~ , dove c Poiche’ tutti gli integrali sono gaussiani, si ha h(qj+1 − qj )2 i = c 2~∆t m 9 2 e’ una costante numerica opportuna In altri termini h(qj+1 − qj ) i ∝ ∆t ⇒ I cammini che contribuiscono all’integrale (3.8) sono in media continui (perche’ h(q −q )2 i 1 ∆t → 0 ⇒ qj+1 → qj ), ma non differenziabili (perche’ lim∆t→0 j+1∆t2 j ∝ ∆t non e’ finito). Si puo’ infatti dimostrare che i cammini differenziabili formano un sottoinsieme di misura nulla nello spazio dei cammini che contribuiscono al path integral (3.8). Si potrebbe inoltre far vedere che il set di cammini che contribuiscono maggiormente all’integrale in questione coincide con il set delle traiettorie di una particella soggetta al moto browniano. E’ da notare che una proprieta’ caratteristica del moto browniano e’, come vedremo, che√la distanza media percorsa da una particella in un tempo ∆t e’ proporzionale a ∆t e parallelamente dalla (3.10) si ricava, con la stessa procedura usata per (qj+1 − qj )2 , che h(qj − qk )2 i ∝ ∆t, ∀j e k ∈ 1, 2 . . . N In altri termini, la distanza media tra due punti qualsiasi della traiettoria e’ proporzionale alla radice quadrata della scala dei tempi. Questa non e’ una proprieta’ delle usuali curve continue, ma piuttosto delle strutture frattali. 3.3 La mappa tra MS e QFT Torniamo ora all’eq. (3.8): ′ ′ hq , τ |q, τ i = Z Dqe− R τ′ τ dq 2 m [( dτ ) 2 +V (q)]dτ /~ (3.11) √ Ponendo φ(τ ) = m q(τ ) la (3.11) e’, con un’opportuna scelta di V (q), nient’altro che il modello di Landau-Ginzburg in una dimensione: basta porre V (q) = r2o φ2 + uo 4 φ . Gli stati iniziale e finale |q, τ i e |q ′, τ ′ i individuano le condizioni al contorno 4! del segmento [τ ′ , τ ] dove e’ definita la teoria. Il limite termodinamico si ottiene ponendo τ → −∞ e τ ′ → +∞ . E’ utile anche considerare condizioni al contorno 9 c= R QN 1 dxi αi (xj+1 − xj )2 e− P k (xk+1 −xk ) 41 2 / R QN 1 dxi αi e− P k (xk+1 −xk ) 2 periodiche, che comportano la somma su tutte le traiettorie chiuse: a tal fine basta porre nella (3.11) q = q ′ e integrare ancora su q. In questo caso la corrispondente teoria euclidea sul reticolo unidimensionale è invariante per traslazioni multiple del passo reticolare ∆τ . Ritornando al formalismo operatoriale e al tempo reale si ha Z Z H(t′ −t) H(t′ −t) ′ dqhq, t |q, ti = dqhq|ei ~ |qi ≡ tr ei ~ E’ ora facile dimostrare, con la continuazione analitica nel tempo immaginario, che la densita’ f di energia libera tende, nel limite termodinamico, all’energia τ ′ −τ dello stato fondamentale. Infatti, identificando la f. di partizione Z con tr e−H ~ τ ′ −τ e ponendo Z = e−f ~ dove f e’ la densita’ di energia libera (Energia libera per unita’ di volume, che è una costante perchè il sistema è invariante per traslazioni) e introducendo un set completo di autostati dell’energia {|ni} : H|ni = En |ni, si ha X (τ ′ −τ ) τ ′ −τ τ ′ −τ hn|e−En ~ |ni → h0|e−Eo ~ |0i tr e−H ~ = n f = Eo c.v.d. In teoria quantistica dei campi un ruolo importante e’ giocato dal prodotto cronologico o T −prodotto. Siano A(t) e B(t) due operatori dipendenti dal tempo t e definiamo il T − prodotto di A e B nel modo seguente ( A(t1 )B(t2 ) se t1 > t2 T (A(t1 )B(t2 )) = B(t2 )A(t1 ) se t1 < t2 E’ facile ottenere una rappresentazione con integrali di cammino del T − prodotto degli operatori di posizione: Z S ′ ′ hq , t |T (Q(t1 )Q(t2 ))|q, ti = Dq q(t1 )q(t2 )e−i ~ . (3.12) Infatti il ruolo del T − prodotto e’ proprio quello di far comparire gli operatori Q(ti ) nella posizione giusta quando si suddivide l’intervallo t′ −t in N intervallini ∆t. L’equazione (3.12) mostra che il valore di attesa del T − prodotto corrisponde al correlatore nel linguaggio della meccanica statistica. Inoltre si dimostra con 42 un ragionamento analogo a quello sull’energia libera, che il limite termodinamico della (3.12) coincide con il valore di attesa nel vuoto del T − prodotto, cioe’ hq ′ , t′ |q(t1 )q(t2 )|q, ti = h0|T (Q(t1 )Q(t2 )) |0i t −t→∞ hq ′, t′ |q, ti lim ′ Abbiamo usato come modello illustrativo un modello particolarmente semplice descritto da una sola coordinata lagrangiana Q(t). In realta’ il procedimento e’ di grande generalita’. Per esempio in una teoria di campo scalare in d dimensioni spaziali, detto |φ, ti lo stato che descrive una data configurazione iniziale φ(xi , t) (i = 1 . . . d) e |φ′ , t′ i una conf.finale e S[φ] l’azione della teoria, si puo’ dimostrare facilmente che vale la seguente rappresentazione di path integral Z S ′ ′ hφ , t |φ, ti = Dφ e−i ~ dove Dφ e’ l’integrazione funzionale, o somma sulle configurazioni, come e’ stata definita per il modello di Landau-Ginzburg. L’integrazione funzionale e’ particolarmente semplice se la teoria e’ posta su un reticolo. La trascrizione su reticolo si puo’ fare solo se ξ ≫ a (a = passo reticolare) ⇒ le teorie quantistiche di campo nel limite continuo corrispondono a teorie su reticolo in prossimita’ di una transizione del II ordine. In conclusione, la rappresentazione di path integral delle ampiezze di transizione e la continuazione analitica a tempi immaginari (rotazione di Wick) consente di trascrivere ogni modello di meccanica quantistica o di teoria dei campi quantistica in un sistema di meccanica statistica classica. Possiamo stabilire il seguente dizionario tra le due formulazioni: teoria quantistica meccanica di campo statistica classica integrazione funzionale somma sulle configurazioni d dimensioni spaziali D = d + 1 dimensioni spaziali Azione euclidea SE Hamiltoniana H ~ κT Ampiezza di transizione Funzione di partizione Valore di attesa nel vuoto del T -prodotto Funzioni di correlazione Energia dello stato fondamentale Densita’ di energia libera Massa della particella piu’ leggera Inverso della lunghezza di correlazione 43 3.4 Limite continuo Nelle teorie quantistiche di campo il reticolo che abbiamo introdotto è semplicemente un artificio per dare un significato preciso all’integrazione funzionale, ma le proprietà fisiche non possono dipendere dal valore del passo reticolare a. Quindi questa procedura è giustificata solo se tutte le scale fisiche in gioco, quando sono espresse in unità di lunghezza, sono molto più grandi del passo reticolare. Dal punto di vista del corrispondente modello di meccanica statistica classica, questo equivale alla condizione che la lunghezza di correlazione ξ sia molto più grande del passo reticolare, il che corrisponde a richiedere che il sistema sia vicino a un punto critico. Quindi la vera corrispondenza stabilita è tra un sistema di teoria dei campi quantistica nel continuo e un corrispondente sistema statistico classico vicino al punto critico. Il modello di Landau-Ginzburg è un buon esempio di questo tipo perchè descrive il comportamento di un sistema (ferromagnetico) in prossimita’ del punto critico dove ξ ≫ a, per cui la struttura reticolare non gioca alcun ruolo. Per rendere piu’ spedite le manipolazioni successive conviene usare la notazione del continuo, facendo formalmente il limite a → 0: Z 1 1 1 d 2 2 4 ⇒ HGL [φ] → d x (∇φ(x)) + r0 φ (x) + u0 φ (x) 2 2 4! In realta’ questo e’ solo un limite formale, utile per semplificare la notazione, per rendere piu’ agevole la condizione ξ ≫ a. E’ da notare infatti che la definizione esatta di Z coinvolge, come abbiamo visto nel paragrafo precedente, un’integrazione per ogni sito Z Y Z= dφie−HLG (φ) . i Quindi, a rigore, non c’e’ nessuna condizione di continuita’ che leghi in qualche modo il valore di φ per due siti vicini (che giustificherebbe la sostituzione della differenza finita φ(x + µ) − φ(x) con la derivata ∂µ φ). Formalmente si puo’ porre Z R d 1P 1 2 1 2 4 Z = Dφe− d x[ 2 µ (∇µ φ) + 2 r0 φ + 4! u0 φ ] dove, in accordo col paragrafo precedente, Q si è introdotto il simbolo di integrazione funzionale Dφ = lima→0 N (a) i dφi . N (a) e’ un fattore di scala introdotto per rendere finito il limite; tuttavia il limite continuo è ben definito solo se è ben definita l’integrazione funzionale (come si è visto nel caso dello studio delle proprietà frattali degli integrali di cammino nel caso gaussiano). Lo strumento di elezione per studiare questo limite è il gruppo di rinormalizzazione. 44 3.5 Sistemi quantici in equilibrio con un termostato Un sistema quantistico in equilibrio con un termostato alla temperatura T è descritto dalla funzione di partizione Z = tr e−β H , (3.13) dove H è operatore Hamiltoniano che descrive il sistema e la traccia indica la somma sun un set completo di stati. Nel caso specifico di una particella materiale di massa m che si muove in un P2 +V (Q) , [Q, P ] = i~, dove le notazioni potenziale assegnato V (Q) si ha H = 2m sono le stesse di §3.2. Si ha Z Z = dqhq|e−β H |qi. Questa è un’espressione molto simile a quella studiata nell’introduzione degli integrali di cammino. Infatti avevamo trovato (vedi l’eq.(3.9)) che Z Z R ′ iH(t′ −t) −i t −iS ′ ′ ′ L( q̇,q)dt hq , t |q, ti ≡ hq |e ~ |qi = Dq e ~ t ≡ Dq e ~ . (3.14) è dunque chiaro che se noi facciamo una rotazione di Wick t → iτ e poniamo i(t′ −t) = −β e q ′ = q (cosicchè consideriamo soltanto camminiR chiusi) e infine ~ aggiungiamo un’ulteriore integrazione all’integrale sui cammini Dq, integrando sulla posizione del punto iniziale q(τ ) = punto finale q(τ ′ = τ + β), otteniamo una rappresentazione con integrali di cammino della funzione di partizione del sistema quantico: Z Z= D[q] e− Rβ 0 LE (q̇,q)dτ , dove D[q] denota ora la somma su tutti i cammini chiusi e LE è la lagrangiana euclidea, ottenuta con la rotazione di Wick. Come avevamo fatto per gli integrali di cammino, cosı̀ anche questa rapprsentazione si puo’ estendere a sistemi con un numero arbitrario di gradi di libertà. Supponiamo ad esempio, in analogia a quanto avevamo fatto nello studio dei sistemi di Landau-Ginzburg, che il sistema quantico sia un sistema in D dimensioni spaziali e che le sue possibili configurazioni siano descritte da un campo scalare φ(~x), dove ~x è un vettore D-dimensionale. Per descrivere il sistema in equilibrio alla temperatura T = 1/β mediante un integrale funzionale, occorre supporre che 45 il campo φ dipenda anche dalla variabile τ ( tempo immaginario) e che sia una funzione periodica di periodo β, cioè φ(~x, τ ) = φ(~x, τ + β) . (3.15) Utilizzando queste configurazioni periodiche la funzione di partizione del sistema quantico D-dimensionale ammette la seguente rappresentazione in termini di integrazione funzionale di un sistema in D+1 dimensioni Z Rβ −β H Z ≡ tr e = D[φ] e− 0 LE [φ]dτ , (3.16) dove ora D[φ] indica la somma su tutte le configurazioni periodiche definite dalla (3.15) e la lagrangiana LE è ora un funzionale della configurazione φ. Un altro modo più generale per legare il sistema quantico a un equivalente sistema classico si basa su una identità operatoriale che si può costruire nella maniera seguente: si suddivida l’intervallo β in N intervallini di lunghezza δτ = β/N. Sfruttando il noto limite limN →∞ (1 − x/N)N = e−x si può ottenere la seguente identità operatoriale tr e−βH = lim tr [(1 − δτ H)(1 − δτ H) . . . (1 − δτ H)] , δτ →0 (3.17) dove la parentesi quadra contiene N = β/δτ fattori. Questa identità, nota come formula di Trotter, può essere reinterpretata come il limite continuo della funzione di partizione di un sistema della meccanica statistica classica associato alla matrice di trasferimento T = 1 − δτ H che ne descrive l’evoluzione nella direzione β in un reticolo con passo reticolare δτ , per cui Z = tr T N (si vedano ad es. gli appunti di MS)). Dunque la (3.16) e la (3.17) mostrano in due modi differenti che la funzione di partizione un sistema quantico in D dimensioni spaziali coincide con la funzione di partizione canonica di un opportuno sistema classico in D+1 dimensioni, in cui la dimensione aggiuntiva ha un’ estensione finita β e le condizioni al contorno lungo questa direzione sono periodiche. In particolare la funzione di partizione di un sistema quantistico D-dimensionale a T = 0 è esattamente equivalente alla funzione di partizione di un opportuno sistema classico in D+1 dimensioni nel limite termodinamico. La temperatura del sistema quantistico non ha nulla a che fare con quella del sistema classico corrispondente, che dipende invece dalle costanti di accoppiamento del sistema quantistico. 46 3.5.1 Catena lineare di spin in campo trasverso Un’applicazione illuminante della formula di Trotter è fornita dal sistema quantistico costituito da una catena lineare di spin immerso in campo trasverso h, definito dall’Hamiltoniana X z b H(λ, h) = − λ σnz σn+1 + h σnx , (3.18) n dove le σ sono matrici di Pauli associate ai nodi di un reticolo unidimensionale. Matrici appartenenti a nodi diversi commutano, mentre quelle associate allo stesso nodo anticommutano: z (σnz )2 = (σnx )2 = 1 ; {σnx , σnz } = 0 ; [σnx , σm6 =n ] = 0 . (3.19) Vogliamo calcolare Z = Tre−βH con la formula di Trotter. Utilizziamo come set completo di stati gli autostati di σnz , cioè il set di configurazioni di spin associati ai nodi |{Si }i = . . . |Sn i |Sn+1i . . . , con Sn = ±1. σnx non è diagonale in questa base e si ha, per via delle proprietà di anticommutazione, σnx |Sn i = | − Sn i. Scriviamo ora la transfer matrix della formula di Trotter nella forma ! X z z x b = 1 + δτ h T ≡ 1 − δτ H σn eδτ λ σn σn+1 + O(δτ 2 ) = n = √ hδτ Y n con √ 1 hδτ + √ hδτ σnx eK1 K1 = δτ λ . P n Sn,j Sn+1,j + O(δτ 2 ) , (3.20) Si e’ aggiunta l’etichetta j alla configurazione e si interpreta l’espressione racchiusa in parentesi quadre come l’operatore che fa evolvere dalla configurazione j alla j + 1. Si interpreta poi questa nuova configurazione come la conf. di una nuova catena orizzontale spostata di un passo reticolare in direzione verticale ( si veda la figura sottostante). n,j+1 n−1,j+1 n+1,j+1 n−1,j n,j n+1,j 47 E’ immediato verificare che l’azione del termine in parentesi quadre si puo’ riscrivere nella forma hSn,j+1| √ 1 hδτ + √ hδτ σnx |Sn,j i = eK2 Sn,j Sn,j+1 con eK2 = √ 1 (3.21) hδτ Si genera cosi’ un reticolo quadrato su cui è definito un modello di Ising standard senza campo magnetico e con accoppiamenti molto asimmetrici nelle due direzioni. Si ottiene dunque l’equivalenza b −β H Tre = 1 hδτ N/2 X P e x,y (K1 Sx,y Sx+1,y +K2 Sx,y Sx,y+1 ) , (3.22) {Sx,y } con β = Nδτ . Nonostante gli accoppiamenti asimmetrici, è facile verificare che il sistema è autoduale rispetto alla trasformazione di Kramers e Wannier e la relazione tra le costanti di accoppiamento della versione duale è un’ovvia generalizzazione di quella simmetrica: sinh 2K̃1 = 1/ sinh 2K2 ; sinh 2K̃2 = 1/ sinh 2K1 . Ne consegue che il modello di Ising in questione possiede una linea di punti critici data dalla relazione sinh 2K1 sinh 2K2 = 1 . Inserendo in questa la (3.20) e la (3.21) si ottiene che la catena di spin in questione ha una transizione di fase ordine-disordine del II ordine per h = λ e per ogni valore di β. Esercizio: Dimostrare esplicitamente le precedenti affermazioni. Cerchiamo ora di comprendere per una via completamente diversa il fatto che la catena di spin in questione ha una transizione di fase per λ = h. Le proprietà fisiche di questo modello di spin non dipendono certo dalla rappresentazione usata per le matrici di Pauli, ma solo dalle loro proprita’ algebriche. Introduciamo ora un nuovo set di operatori che hanno esttamente le stesse propriz eta’ delle σnx e σm , ma sono esprimibili in forma composta e non locale in termini delle σ: Y z σjx . (3.23) µxn = σnz σn+1 ; µzn = j≤n 48 È semplice verificare che questi operatori soddisfano esattamente tutte le proprietà delle σ elencate in (3.19), perciò la catena di spin descritta dall’Hamiltoniana b b H(λ, h) = − X λ µzn µzn+1 + h µxn n b ha esattamente le stesse proprietà di quella descritta da H(λ, h). Ma esprimendo le µ in funzione delle σ si ottiene b b b H(λ, h) = H(h, λ) ; Dunque la teoria è simmetrica rispetto allo scambio λ ↔ h. b Nell’hamiltoniana H(λ, h) il termine in λ è un accoppiamento ferromagnetico che tende ad ordinare gli spin , mentre il termine in h tende a disordinare il sistema, perchè cambia di segno gli spin su cui agisce. Perciò, se il sistema ha una transizione di fase per h/λ = ρo , la fase ordinata con hσnz i = 6 0 occupa la regione h/λ < ρo . Ma se ρo 6= 1, esiste , per via della simmetria λ ↔ h, un’altra transizione ordine-disordine per h/λ = 1/ρo ; quindi, se supponiamo che la transizone di fase sia unica deve valere ρo = 1, come richiede la trasformazione di Kramers e Wannier. Valgono ovviamente le doppie implicazioni hσnz i = 6 0 ⇔ hµzn i = 0 ; hσnz i = 0 ⇔ hµzn i = 6 0. Se hσ z i è il parametro d’ordine, hµz i è il parametro di disordine e viceversa. È facile verificare infine che la trasformazione (3.23) è una trasformazione involutiva. Si ha infatti Y x z σn+1 = µzn µzn+1 ; σn+1 = µxj . j≤n 49 Sistemi critici in prossimità di d = 4 4 4.1 Il teorema di Wick Uno degli ingredienti tecnici più utili in teoria di campo, come abbiamo già avuto modo di vedere, è l’uso degli integrali gaussiani. Vediamone ora alcune proprietà generali. Abbiamo più volte usato il noto risultato r Z ∞ 2π 1 B2 2 +Bφ φ −A e 2A , = dφ e 2 A −∞ che può anche essere riscritto nella forma 1 2 heBφ i = e 2A B , dove la media è fatta rispetto alla misura gaussiana con B = 0. È immediato estendere il risultato al caso di N variabili φx (x = 1, . . . N) e al caso dell’integrazione funzionale con un’Hamiltoniana gaussiana molto generale della forma Z Z 1X 1 d H= φx Ax y φy = d x dd y φ(x)A(x, y)φ(y) , 2 x,y 2 dove Ax y è una qualunque matrice invertibile. Si ottiene P Bx φx −1 1 P e x = e 2 x,y Bx Ax y By , (4.1) possiamo quindi riscrivere l’eq.(4.1) nella forma seguente P Bx φx 1 P e x = e 2 x,y Bx hφx φy iBy . (4.2) dove A−1 è la matrice inversa : A A−1 = 1. Confrontando questa formula con l’eq.(3.2) si constata che A−1 x y altro non è che il correlatore Gx y , ma verifichiamo il fatto direttamente: P δ2 δ2 B φ x x |B=0 = A−1 Gx y = hφx φy iB=0 = log Z|B=0 = e x xy ; δBx δBy δBx δBy L’identità (4.2) può essere utilizzata anche per calcolare il valore di aspettazione del prodotto di un numero arbitrario di campi 10 hφx1 φx2 . . . φx2n iB=0 = 10 −1 1 P δ 2n e 2 x,y Bx Ax y By |B=0 . δBx1 δBx2 . . . Naturalmente se il numero di campi è dispari il correlatore è zero se B=0. 50 È chiaro che ogni qual volta δBδ x agisce sull’esponenziale abbassa un fattore A−1 x y By , quindi la metà delle variazioni devono agire su questi fattori, al fine di ottenere un risultato 6= 0 quando si pone B = 0. Ne segue che questo valore di aspettazione deve essere la somma di tutti prodotti di correlatori che si ottengono accoppiando ( o contraendo, come si dice in teoria dei campi) in tutte le maniere possibili i campi φxi cioè X hφx1 φx2 . . . φx2n iB=0 = Gα1 α2 Gα3 α4 . . . Gα2n−1 α2n , (4.3) {αi } dove la somma è fatta sulle permutazioni α1 , α2 , . . . α2n degli indici che danno contrazioni distinte. L’eq.(4.3) costituisce il teorema di Wick, che è uno strumento indispensabile in teoria dei campi. Esercizio: Verificare l’identità seguente applicando il teorema di Wick hφx1 φx2 φx3 φx4 i = Gx1 x2 Gx3 x4 + Gx1 x3 Gx2 x4 + Gx1 x4 Gx2 x3 . A conclusione di questo paragrafo è utile osservare che nel limite continuo il fatto che il correlatore è l’inverso della matrice cinetica si può scrivere nella forma Z dd zA(x, z) G(z, y) = δ (d) (x − y) ; per un sistema invariante per traslazioni il correlatore G(x, y) e la matrice cinetica A(x, y) sono funzioni solo della differenza x − y e l’equazione precedente diventa una convoluzione. La trasformata di Fourier è data come è noto dal prodotto delle trasformate, perciò 1 . G̃(k) = p (2π)d Ã(k) Nelle usuali teorie gaussiane A(k) = k 2 +m2 , quindi il correlatore (o propagatore) ammette la seguente importante rappresentazione integrale Z e−ik·x 1 d d k , (4.4) G(x) = (2π)d k 2 + m2 dove il dominio di integrazione dipende dal reticolo utilizzato. Nelle nostre applicazioni basterà in genere porre per semplicità k ≤ 1/a, dove a è il passo reticolare. 51 4.2 Il modello gaussiano Studiamo un modello puramente gaussiano su reticolo, XcX r0 X 2 H= (φx+µ − φx )2 + φ 2 µ 2 x x x dove, per maggior generalita’, si e’ introdotta una P costanteR c anche nella parte cinetica. Adottiamo la notazione del limite continuo x → dd x/ad e supponiamo che le costanti c e r0 siano adimensionali, mentre il campo φ ha una dimesione [φ] = −xφ da determinare. Con queste convenzioni l’Hamiltoniana avrà la forma Z 1 dd x c a2xφ −d+2 (∇φ)2 + r0 a2xφ −d φ2 , H= 2 dove il passo reticolare a ha solo il ruolo di unità lunghezza di riferimento. Conviene passare alla trasformata di Fourier, cosi’ la teoria diventa la somma dei contributi dei modi normali di vibrazione che sono oscillatori armonici disaccoppiati ed e’ piu’ facile implementare le trasformazioni del gruppo di rinormalizzazione (RGT ). Se la teoria e’ su reticolo i vettori d’onda permessi sono minori di una scala di cut-off Λ ≃ a1 k≤Λ Si ha 1 H= 2 Z dd k(r0 + ck 2 a2 )a2xφ −d φ̃(k)φ̃(−k) . k≤Λ Se il campo φ(x) è reale si ha φ̃(−k) = φ̃(k)∗ , per cui Z 1 H= dd k(r0 + ck 2 a2 )a2xφ −d |φ̃(k)|2 2 k≤Λ (4.5) Da cui si evince che [φ̃] = −xφ + d . Ora si può scrivere Z Y Z Y 1 2 2xφ −d |φ̃(k)|2 −H Z= dφ̃(k)e = e− 2 (r0 +c(ak) )a dφ̃(k) k≤Λ k≤Λ 52 (4.6) La RGT di parametro s comporta l’integrazione sui modi normali di vibrazione compresi tra Λ/s e Λ: Y Z dφ̃(k)e−H , Λ ≤k≤Λ s che genera semplicemente una costante inessenziale H → H ′ + C, con Z 1 ′ H = dd k ′ (r0 + c(ak ′ )2 )a2xφ −d |φ̃(k ′ )|2 . 2 k′ ≤ Λ s Vogliamo riscrivere H ′ nella forma originaria (4.5), e perciò poniamo k ′ = k/s. Si ha Z dd k 1 c (r0 + 2 (ak)2 )a2xφ −d |φ̃(k/s)|2 . d s k≤Λ s 2 Dalla (4.6) si ha φ̃(k/s) = s−xφ +d φ̃(k), perciò Z a2 2 a 2xφ −d d 1 |φ̃(k)|2 . d k r0 + c 2 k 2 s s k≤Λ In conclusione, se vogliamo che H ′ coincida con H quando il cut-off Λ → Λ/s occorre che anche le costanti di acoppiamento varino, in modo da cancellare la dipendenza da s ⇒ r0′ = sd−2xφ r0 ; c′ = sd−2−2xφ c (4.7) ⇒ punti fissi della RGT 1. c = 0 , xφ = d2 , 2. xφ = d−2 , 2 r0 arbitrario; c arbitrario. Nel caso 1) il termine cinetico (∇φ)2 e’ irrilevante ⇒ i siti diventano, nel limite s → ∞, indipendenti uno dall’altro ⇒ ξ = 0 (questo e’ il punto fisso banale a T = ∞). Il caso 2) e’ piu’ interessante: in prossimità del punto fisso si ha RGT : c′ = c , r0′ = s2 r0 Dunque r0 e’ un campo rilevante con y = 2 ⇒ ν = 21 , quindi in particolare ξ = ∞; inoltre dalla relazione xφ = d−2 ⇒ η = 0. Questi 2 coincidono con i valori dell’approssimazione di Landau nel modello P Pd di L-G. Osservazione: se ci fosse in H un termine del tipo w0 k ( i=1 ki4 )|φ̃(k)|2 (che quindi non è invariante per rotazione) ⇒ w0′ = s−2 w0 ⇒ campo irrilevante ⇒ in prossimita’ del punto fisso 2) (ξ ∼ ∞) l’invarianza per rotazioni viene ristabilita. 53 4.3 I punti fissi del modello di Landau-Ginzburg Conviene sempre supporre che le costanti di accoppiamento r0 , u0 e h del modello di L-G siano adimensionali. Allora il passo reticolare a compare esplicitamente nell’Hamiltoniana HLG . Supponendo, in accordo col paragrafo precedente, che , nel limite continuo il campo scalare φ abbia dimensione [φ] = −xφ ,Rcon xφ = d−2 2 l’integrale funzionale del modello di L-G assume la forma Z = Dφ exp −H con Z 1 u0 d−4 4 d 2 −2 r0 2 −d/2−1 H= d x (∇φ) + a φ + a φ + ha φ . (4.8) 2 2 4! Ma, come si è già visto, il passo reticolare compare in maniera implicita anche nell’integrazione funzionale11 . Quindi l’effetto sulle costanti di accoppiamento di una trasformazione del gruppo di rinormalizzazione che cambia il passo reticolare da a a a′ = sa (e naturalmente lascia invariante Z) sarà la somma dei contributi dovuti alla variazione di a in HLG (il cui risultato è immediatamente calcolabile) e alla variazione inplicita in Dφ, che richiederà qualche strumento tecnico in più. Vediamo intanto il primo contributo. Se a → sa, anche le costanti di accoppiamento devono variare in modo da lasciare l’Hamiltoniana invariante. Si ha allora h′ = sd/2+1 h , r0′ = s2 r0 , u′0 = s4−d u0 , (4.9) che ha come punto fisso h = r0 = u0 = 0 che corrisponde all’hamiltoniana di punto fisso con il solo termine cinetico Z 1 ∗ H = dd x(∇φ)2 (4.10) 2 ed è perciò detto punto fisso gaussiano. Rispetto a questo punto h e ro ∝ t sono accoppiamenti (o scaling variables) rilevanti (come sapevamo gia’ dalle proprietà generali del gruppo di rinormalizzazione (RG)). Gi autovalori termico e magnetico sono rispettivamente (come si legge dall’eq.(4.9)) yt = 2 e yh = 1+d/2. A partire da questi autovalori possiamo calcolarci attraverso le note formule gli esponenti critici e costruire la seguente tabella che mette a confronto questi esponenti con quelli calcolati nell’approssimazione di campo medio 11 in un reticolo di volume fissato il numero dei nodi (e quindi delle integrazioni) dipende dal passo reticolare. 54 campo medio punto fisso gauss. α β γ δ η ν 0 1 2 1 3 0 1 2 d−2 4 1 d+2 d−2 0 1 2 2− d 2 C’è perfetto accordo solo per d = 4. Per d > 4 l’approssimazione di campo medio dà un comportamento critico piu’ singolare rispetto a quello previsto dal punto fisso gaussiano. Una delle ragioni è che, pur esendo u0 in questa regione irrilevante (yu0 = 4 − d), non può essere posto uguale a 0, come vorrebbe il flusso del RG del punto gaussiano, perchè, come si è già qvisto, la magnetizzazione 0 . Accoppiamenti di spontanea contiene u0 a denominatore: hφi = φ0 = − 6r u0 questo tipo si dicono pericolosamente irrilevanti. Per d < 4 u0 diventa un ulteriore accoppiamento rilevante, quindi il punto fisso gaussiano non può descivere il comportamento critico a d < 4 di un sistema magnetico, dove sappiamo che gli accoppiamenti rilevanti sono solo h e t12 . Esercizio: Mostrare P che in prossimità del punto fisso gaussiano il termine cinetico (∇φ)2 ≡ ( µ φ(x+aµa)−φ(x) )2 tende, per effetto del gruppo di rinormalizzazione, al limite continuo ∂µ φ(x)∂ µ φ(x). (Suggerimento: sviluppare in serie di Taylor φ(x + aµ ) e mostrare che tutti i termini che contengono derivate superiori alla prima sono irrilevanti.) 4.4 OPE In prossimità di un punto critico l’Hamiltoniana assume la forma X X H = H∗ + gi φi (x) axi , (4.11) x i dove H∗ è l’Hamiltoniana del punto fisso, la costanti adimensionali gi sono le variabili di scala (cioè quelle combinazioni lineari delle costanti di accoppiamento che si trasformano con un fattore di scala per effetto di una trasformazione del 12 Infatti gli operatori rilevanti controllano l’effettiva distanza del sistema dal punto critico, d’altra parte la funzione di partizione del modello di Ising o di un generico modello magnetico è solo funzione della temperatura e del campo magnetico. 55 gruppo di rinormalizzazione) e gli operatori φi (x) sono i corrispondenti operatori di scala o scaling operators ed hanno dimensione di una (lunghezza)−xi . Il passo reticolare a entra esplicitamente nell’eq. (4.11) per ragioni dimensionali. Gli scaling operators hanno funzioni di correlazione che sono delle pure potenze. In particolare c hφi (x)φi (y)i = . |x − y|2xi Consideriamo ora dei correlatori più generali, della forma hφi(x)φj (y) Φi , dove Φ rappresenta un prodotto arbitrario di operatori di scala situati in punti molto distanti dai due punti x e y. Sotto condizioni molto generali si dimostra (o in qualche caso si congettura) che si può rimpiazzare il prodotto dei due operatori φi e φj con una combinazione lineare di operatori di scaling i cui coefficienti sono opportune potenze della distanza |x − y|, cioè X x+y hφi (x)φj (y) Φi = Cijk (x − y)hφk ( ) Φi , 2 k dove, per ragioni dimensionali, si ha Cijk (x) = cijk |x|xi +xj −xk e i coefficienti cijk sono numeri puri. È importante osservare che le funzioni Cijk (x) non dipendono dagli operatori Φ, quindi si puo’ scrivere φi (x) φj (y) = X k Cijk (x − y) φk ( x+y ), 2 (4.12) dove il segno di uguaglianza va inteso in senso debole, cioè vale quando è inserita in un valore di aspettazione del tipo h. . . Φi. L’eq. (4.12) è detta sviluppo del prodotto operatoriale o operator product expansion (OPE). Vedremo che nei rapporti dei coefficienti cijk (di solito numeri razionali) sono codificate molte proprietà universali del comportamento del sistema attorno al punto critico. Per mettere in luce questo particolare aspetto dell’OPE si suole riscriverla nella forma piu’ schematica X cijk φk , (4.13) φi × φj = k 56 nota come algebra di fusione degli operatori. Vediamo ora come si dermina l’OPE nel caso semplice, ma particolarmente importante, del punto fisso gaussiano. È chiaro dalle eq.(4.8) e (4.10) che il modello di LG in prossimità del punto critico ha proprio la forma (4.11) in cui gli scaling operators sono potenze del campo scalare φ(x). In particolare il campo stesso è associato alla perturbazione magnetica del sistema ( legata alla variabile di scala h), φ(x)2 è la perturbazione termica ( corrispondente alla variabile di scala ro ∝ t) e φ(x)4 è associato alla variabile di scala u. Essendo hφ(x) φ(y)i = 1 |x − y|d−2 divergente per x → y, gli operatori φ(x)n non sono ben definiti: conviene applicare il cosiddetto point-splitting method, che consiste nel rimpiazzarli con φ(x)n → φ(x + ε1 ) φ(x + ε2 ) . . . φ(x + εn ) , dove ε1 , . . . εn sono degli spostamenti infinitesimi. Le proprietà fisiche del sistema non dipendono da εi. Nel caso del punto fisso gaussiano l’OPE è una diretta conseguenza del teorema di Wick. Per esempio, indicando con una linea la contrazione di due campi, si ha, per l’OPE del prodotto φ(x) φ2 (y), hφ(x) φ2 (y) Φi → hφ(x) φ(y − ε) φ(y + ε) Φi = = hφ(x) φ(y − ε) φ(y + ε) + φ(x) φ(y − ε) φ(y + ε) + φ(x) φ(y − ε) φ(y + ε) Φi +hφ(x) φ(y − ε) φ(y + ε) Φ i che dà origine alla seguente legge di fusione φ × φ2 = 3 φ + φ3 . Dovendo applicare queste tecniche di calcolo al gruppo di rinormalizzazione, che studia l’effetto di un riscalamento delle distanze fisiche in gioco x → sx , y → 57 sy, è chiaro che gli splitting εi non devono giocare nessun ruolo in questo riscalamento. Conviene allora cambiare la base degli scaling operators ridefinendo gli operatori in modo da sottrarre le parti non connesse: φ1 (x) = φ(x) − hφi , φ2 (x) = φ2 (x) − hφ2 i , ecc.. È facile verificare che in questa nuova base le regole di contrazione sono modificate dall’ulteriore regola di trascurare le contrazioni di operatori che derivano dallo splitting di un singolo punto. Quindi nell’esempio precedente si trascura il terzo termine e la regola di fusione diventa φ1 × φ2 = 2 φ1 + φ3 . (4.14) Analogamente è facile verificare che φ1 × φ1 = 1 + φ2 φ1 × φ4 = 4 φ3 + . . . φ2 × φ2 = 2 + 4 φ2 + φ4 φ2 × φ4 = 12 φ2 + 8φ4 + . . . φ4 × φ4 = 24 + 96 φ2 + 72 φ4 + . . . (4.15) (4.16) (4.17) (4.18) (4.19) I puntini stanno ad indicare operatori di grado superiore al quarto. 4.5 Le equazioni del gruppo di rinormalizzazione In prossimità del punto fisso, utilizzando la (4.11), si vede subito che la funzione di partizione assume la forma X Z dd x X X −H −H∗ 1− gi Z= e = e φi (x) axi + d a i conf. conf. = Zo ( 1− 1X gi gj 2 ij X i gi Z Z Z dd x ad dd x dd y xi+xj φ (x) φ (y) a + . . . = i j a2d 1X gj hφi i axi − 2 j Z (4.20) dd y hφi (x) φj (y)i axi+xj + . . . ad La funzione integranda hφi(x) φj (y)i, che può essere rimpiazzata dal suo sviluppo operatoriale (4.12), è divergente per x → y (questa è una tipica divergenza ultravioletta della teoria quantistica dei campi). Nella formulazione su reticolo questa divergenza non c’è, perchè la distanza minima tra i campi in giocoè data dal passo 58 !) reticolare a. La relazione precedente appare divergente semplicemente perchè abbiamo rimpiazzato la somma sui nodi del reticolo con un integrale. Tuttavia conviene continuare ad utilizzare la notazione continua e regolarizzare l’integrale limitando l’integrazione multipla alla regione |x − y| > a. Questo non cambia il risultato finale ma rende più spediti i calcoli. Applichiamo ora una RGT infinitesima che cambi il passo reticolare (= UV cut-off) di un fattore s : a → s a = (1 + δt)a e chiediamoci come devono cambiare le costanti di accoppiamento gi affinchè Z rimanga invariata. È da notare che la dipendenza da a compare sia esplicitamente nell’Hamiltoniana sia nel dominio di integrazione per il fatto che |x − y| > a. La prima dipendenza dà, come si è già visto nel caso del modello di LG, gi → gi′ = sd−xi gi ≃ gi + (d − xi )gi δt. (4.21) La variazione di a nel dominio d’integrazione contribuisce ai termini di second’ordine nelle costanti di accoppiamento. Ponendo Z Z Z Z Z Z − , = |x−y|>s a |x−y|>a a>|x−y|>(1+δt)a il primo integrale ridà il termine di partenza in Z. Il secondo integrale si può valutare esplicitamente utilizzando l’OPE e passando alle variabili di integrazione : u = x − y e z = x+y 2 Z Z dd xdd y 12 cijk hφk iaxi +xj gi gj (4.22) a2d |x − y|xi+xj −xk a>|x−y|>s a Z d dz cijk hφk iaxk Ωd δt + O(δt2 ) , = gi gj 2 ad d/2 2π dove Ωd = Γ(d/2) è l’angolo solido in d dimensioni. Questo termine può essere riassorbito da una corrispondente variazione di gk : 1 X gk → gk′ = gk − Ωd cijk gi gj δt (4.23) 2 ij Combinando assieme le (4.21) e (4.23) si ha d 1 X dgk ≡ s gk = (d − xk )gk − Ωd cijk gi gj dt ds 2 ij Moltiplicando tutte le costanti di accoppiamento per il fattore 12 Ωd in definitiva si ha 59 d s ds gk = (d − xk ) gk − P ij cijk gi gj + O(gl3) che è la forma standard delle equazioni del gruppo di rinormalizzazione al secondo ordine perturbativo. 4.6 Il punto fisso di Wilson-Fisher Possiamo applicare le equazioni del gruppo di rinormalizzazione testè ottenute al modello di LG (4.8) utilizzando l’algebra di fusione (4.14-4.19) e ponendo, per semplicità di notazione, t = r2o (che può essere identificata con la temperatura ridotta) e u = uo /4!. Si ha, trascurando i termini del terz’ordine, d d+2 h= h − 4ht + . . . 2 ds d s t = 2t − h2 − 4t2 − 24tu − 96u2 + . . . ds d s u= ǫu − t2 − 16tu − 72u2 + . . . ds s (4.24) (4.25) (4.26) dove ǫ = 4−d. Cerchiamo ora di vedere se, all’ordine perturbativo considerato, ci sono altri punti fissi oltre a quello gaussiano (h = t = u = 0), cercando ulteriori zeri dei secondi membri di queste equazioni. La prima dà h ≃ 0 13 . La seconda dà, per successive iterazioni, t = 48u2 + 12ut + O(t2 ) = 48u2 + 12u(48u2 + 12u(48u2 + · · · = O(u2) . Inserendo questo risultato nella terza equazione si ottiene , se ǫ è piccolo, u∗ = C’è dunque un nuovo punto fisso a h = 0 , t = O(ǫ2 ) , u∗ = ǫ . 72 ǫ 72 Sviluppando le ultime due equazioni attorno a questo nuovo punto fisso, noto come punto fisso di Wilson-Fisher, si ha, ponendo u = u∗ + δu e sviluppando al prim’ordine in δu e t, s 13 ǫ d t = 2t − 24u∗ t + · · · = (2 − ) t + . . . ds 3 L’altra soluzione, t = d+2 2 , ovviamente non è nel range perturbativo considerato. 60 (4.27) d u = −ǫδu + . . . , (4.28) ds il che ci permette di concludere che per d < 4 u è un accoppiamento irrilevante per il nuovo punto fisso, che dunque controlla, in base alla discussione del §4.3, il comportamento a grande distanza del sistema critico per d < 4. Inoltre dalla (4.27) si legge l’autovalore termico yt e quindi anche l’indice critico della lunghezza di correlazione ν = 1/yt che dunque è s 1 ǫ + + O(ǫ2 ) . 2 12 Questa relazione è il primo termine di uno sviluppo perturbativo in ǫ (noto come ǫ− expansion) che costituisce un metodo sistematico e molto potente per calcolare gli indici critici. è stato calcolato finora lo sviluppo fino al quinto ordine. Ecco il risultato per D = 2 e D = 3 per l’indice ν ν= D 2 3 ǫ−expansion migliore stima 0.99 ± 0.04 1 (esatto) 0.6305 ± 0.0025 0.6330 ± 0.0013 Esercizio: Dimostrare che la costante di accoppiamento del termine φ6 in 4 − ǫ dimensioni è irrilevante (al I ordine in ǫ) non solo rispetto al punto fisso gaussiano, ma anche rispetto a quello di Wilson-Fisher. 4.7 Operatori ridondanti Dall’analisi dell’algebra di fusione dei campi gaussiani (4.19) si vede che al secondo ordine nelle costanti di accoppiamento si sviluppa nell’equazioni del gruppo di rinormalizzazione un termine di interazione φ3 che non era presente nell’Hamiltoniana originaria di LG.È immediato verificare che questo operatore è rilevante per D = 4 dimensioni (vedere anche l’esercizio al § 3.1.4). Come mai questo termine è stato trascurato? il motivo è una conseguenza di un principio elementare ma importante nella teoria dei campi quantistica e in meccanica statistica: I campi che compaiono nell’Hamiltoniana sono semplicemente delle variabili di integrazione, quindi possono essere rimpiazzate da una trasformazione di variabili qualunque, detta field redefinition, purchè lo Jacobiano della trasformazione sia 1 e i limiti di integrazione nell’integrale funzionale siano gli stessi. È ora chiaro che possiamo eliminare nell’Hamiltoniana del tipo Z Z ro 2 v 3 u 4 d 1 2 H = d x[ (∇φ) + hφ + φ + φ + φ ] = dd xH , 2 2 3 4 61 il termine φ3 con una semplice traslazione del tipo φ → φ + α dove α è una costante opportuna, ridefinendo le costanti di accoppiamento ro e h. Più in generale qualunque field redefinition comporta una ridefinizione e un riarrangiamento delle costanti di accoppiamento in gioco. Poichè queste ridefinizioni non cambiano la fisica del sistema descritto, ciò implica che nello spazio delle costanti di accoppiamento ci sono delle varietà generate dal gruppo di queste trasformazioni i cui punti descrivono lo stesso stato fisico. Per esempio, se nella trasformazione φ → φ + α supponiamo che il parametro di traslazione sia infinitesimo, la variazione al prim’ordine in α della densità Hamiltoniana H è δH = α(h+ro φ(x)+vφ2 (x)+uφ3 (x)) che corrisponde alla seguente ridefinizione delle costanti di accoppiamento: h → h + αro , ro → ro + αv , v → v + αu . Questa trasformazione infinitesima genera una curva (=varietà unidimensionale dipendente dal parametro α) lungo cui la fisica del sistema rimane costante. la tangente a questo tipo di curve è nota come variabile di scaling ridondante. Similmente l’operatore a cui si accoppia questa tangente (nel nostro caso δH) è detto scaling operator ridondante. 4.7.1 Singolarità logaritmiche a D=4 Esattamente a D=4 l’equazione del gruppo di rinormalizzazione per u diventa, per h = 0 e t = 0, u̇ = −72 u2 (4.29) dove si è posto u̇ = ddℓu con ℓ = log(s). Quet’equazione dice che u è marginalmente irrilevante rispetto al punto gaussiano, cioè va a zero molto lentamente. Questa proprietà genera delle caratteristiche singolarità logaritmiche nelle funzioni termodinamiche per tutti i punti critici che non sono punti fissi, cioè t = h = 0, ma u > 0. Per vederle spostiamoci leggermente sal punto critico considerando l’equazione ṫ = 2t − 24 ut , (4.30) dove i termini trascurati sono inessenziali. E’ noto che la parte singolare della densità di energia libera soddisfa l’importante equazione funzionale f (t, u) = s−d f (t(s), u(s)) , 62 da cui si ricavano tutte le leggi di scala delle funzioni termodinamiche. Scegliamo ora il parametro ℓ = log(s) in modo che to = t(so ) = O(1) sia fuori dalla regione critica. Qui si può usare l’approssimazione di campo medio (o di Landau) e porre f (to , u(so) = V (ϕo ) = − Perciò f (t, u) = − t2o . u(so ) t2o . s4o u(so ) Bisogna ora esprimere so e u(so) come funzioni di u e t. L’integrazione della (4.29) dà u u(so ) = 1 + cℓo dove si è posto c = 72u e ℓo = log so . Inserendo questa soluzione nella (4.30) si ottiene 1 to log = 2ℓo − log(1 + cℓo ) . t 3 Questa equazione trascendente si può risolvere iterativamente, tenendo conto che to si può prendere grande a piacere (perchè?). Si ha t 2ℓo = log to 1 c to + log(1 + log ) + . . . t 3 2 t Inserendo questo nell’espressione trovata per f (t, u) si ha f (t, u) ∝ −t2 (1 + to 1 c log ) 3 2 t e quindi il calore specifico è C=− 1 d2 f (t, u) ≃ | log(t/to )| 3 . dt Dunque ha una singolarità logaritmica. È da notare che questa singolarità è prec sente solo se u = 72 6= 0, cioè solo se il punto critico non coincide con il punto fisso. Queste singolarità logaritmiche hanno lo stesso carattere di universalità degli indici critici e sono segnali tipici delle dimensioni critiche superiori. 63 5 Rottura spontanea di simmetrie continue In fisica classica, l’invarianza dell’azione per effetto di un gruppo di Lie di trasformazioni (dette impropriamente nella letteratura fisica simmetrie continue, cioè dipendenti con continuità da uno o più parametri reali) è strettamente legato all’esistenza di leggi di conservazione. Questo è particolarmente evidente nella teoria dei campi classica, dove il teorema di Noether (v. §5.1) associa una corrente conservata ad ogni generatore infinitesimo della simmetria. Queste leggi di conservazione non sono necessariamente valide nei corrispondenti sistemi quantistici per due ordini di motivi. Innanzitutto, affinchè una simmetria classica sia elevata a simmetria della teoria quantistica, occorre che anche la misura di integrazione dell’integrale funzionale sia invariante. Se questo non succede, si dice che c’è un’anomalia nella teoria e la simmetria in questione di fatto non vale per il sistema reale (cioè quantistico). Il secondo motivo che può non permettere di associare una legge di conservazione a una simmetria è il fenomeno della rottura spontanea di una simmetria di Lie. In questo caso, pur essendo la teoria invariante per queste trasformazioni anche a livello quantistico (assenza di anomalie), alcune delle cariche conservate classicamente non sono ben definite quantisticamente, per la presenza nello spettro della fase a simmetria spontaneamente rotta di eccitazioni di massa nulla (modi di Goldstone, v. §5.2). La presenza di queste eccitazioni di massa nulla è un fenomeno molto generale che si osserva sia nei sistemi descritti dalla teoria quantistica dei campi, sia nei sistemi statistici. 5.1 Teorema di Noether Consideriamo nello spazio di Minkowski un’ azione S = S[φa ] di un arbitrario sistema fisico invariante rispetto a un gruppo di Lie G di ordine n che trasforma il campo o parametro d’ordine φa come un multipletto di una rappresentazione irriducibile di dimensione m di G (per esempio: G = O(N), n = N(N − 1)/2, φa vettore di O(N), a = 1, . . . N ≡ m). Una trasformazione infinitesima di parametro ǫi (i = 1, . . . n) mappa φa in φ′a = φa (x) + δφa (x) , (a = 1, . . . m) con δφa (x) = ǫi Tai b φb (x) , (5.1) dove T i denota un generatore infinitesimo del gruppo G. Poichè per ipotesi questa trasformazione è una simmetria, la corrispondente variazione δS dell’azione è nulla. Se però assumo che ǫi anzichè essere costante è una funzione arbitraria di 64 x l‘azione non è più invariante. Se come al solito S dipende solo da φa e dalle sue derivate prime, δS ha necessariamente la forma Z Z 4 µ i δS = dx ∂ ǫi (x)jµ = − dx4 ǫi (x)∂ µ jµi . E’ facile ora verificare che se si utilizzano le equazioni del moto la corrente jµi è conservata. Infatti tali equazioni implicano δS = 0 per una variazione δφ arbitraria del campo φ , e quindi in particolare per una variazione del tipo (5.1). Poichè ǫi (x) è una funzione arbitraria di x, si hanno le leggi di conservazione ∂ µ jµi = 0 , dalle quali si possono ottenere n costanti del moto (Teorema di Noether) Z i Q = d3 x joi . (5.2) (5.3) 5.2 Modi di Goldstone Consideriamo in particolare una teoria invariante rispetto a un gruppo O(N) in cui il parametro d’ordine e’ un campo φa (a = 1, . . . N) che si trasforma come un vettore di O(N). Accendiamo nel sistema un ”campo magnetico” esterno ha che provoca una rottura esplicita della simmetria. Indichiamo con Ho [φ] l’Hamiltoniana R del sistema invariante e con H[φ, h] = Ho [φ] − dxd φa (x)ha l’Hamiltoniana perturbata. Poichè la funzine di partizione Z Y Z= Dφa e−βH = e−βF a non dipende dalle variabili di integrazione φa , l’energia libera di Helmoltz F dipende solo dal campo esterno ha . Vista la forma con cui appare il campo esterno nell’Hamiltoniana pertubata è chiaro che se noi associamo ad ogni rotazione del parametro d’ordine φa un’ analoga rotazione del campo esterno, il sistema complessivo è ancora O(N) invariante 14 . Quindi, se ha e’ costante, F non puo’ che Il campo esterno ha fa parte dell’apparato che misura la risposta del sistema ad una perturbazione che rompe esplicitamente la simmetria. Il gruppo O(N ) che ruota simultaneamente φa e ha è quindi una simmetria del sistema + apparato di misura. 14 65 qP N 2 dipendere dal modulo |h| = a=1 ha . La densita’ di energia libera f = F/V avra’ uno sviluppo in serie di Taylor del tipo 1 f = f (h) = f (0) − |h|m − χL |h|2 + O(|h|3) 2 dove m e’ la magnetizzazione spontanea che per comodita’ scegliamo nella di∂f ) e χL e’ la suscettivita’ nella stessa rezione N (m = hφN i ⇒ m = − ∂h N direzione. Supponiamo ora di raggiungere la fase a simmetria spontaneamente rotta nel modo seguente hN = h, ha = 0, a 6= N, h → 0+ ⇒ hφa i = mδaN . Vogliamo ora far vedere che nella fase a simmetria spontaneamente rotta esistono delle eccitazioni di massa nulla (cioe’ caratterizzate una lunghezza di correlazione ξ → ∞). Poiche’ la suscettivita’ diverge in presenza di eccitazioni di massa nulla (come si e’ gia’ osservato nei sistemi magnetici), calcoliamoci la suscettivita’ χab , definita dalla relazione: χab ≡ − χab ∂ =− ∂ha Poiche’ ha = hδaN ⇒ ⇓ ha hb ∂ 2 f ∂f ∂ hb =− 2 − = 2 |h| ∂|h| ∂ha |h| ∂|h| ha hb ′′ ha hb 1 ′ = − 2 f − δab − f |h| |h|2 |h| hb ∂f |h| ∂|h| ∂2f ∂ha ∂hb χab = −f ′′ δaN δbN − (δab − δaN δbN ) = δab [χL + χT (1 − δaN )] 1 ′ f |h| m 1 χL = −f ′′ , χT = − f ′ = h h In altre parole, la suscettivita’ trasversa χT = χaa , (a 6= N) diverge per h → 0+ , m 6= 0. Dunque nella fase a simmetria spontaneamente rotta, fuori dal punto 66 critico (m 6= 0) ci sono delle correlazioni a lungo raggio (χT → ∞ ⇒ ξ → ∞) corrispondenti a eccitazioni o quasiparticelle di massa nulla (ξ → ∞) con i numeri quantici del sottogruppo di stabilita’ O(N − 1) (cioe’ la parte di simmetria non spontaneamente rotta).15 Le eccitazioni a massa nulla che abbiamo individuato si dicono bosoni o modi di Goldstone. Questo fenomeno che ora abbiamo descritto e’ del tutto generale: ogni qual volta una simmetria continua si rompe spontaneamente, in tutta la fase a simmetria spontaneamente rotta si propagano delle eccitazioni a massa nulla. Ad esempio i fononi di un cristallo possono essere considerati come i bosoni di Goldstone della rottura spontanea dell’invarianza per traslazioni del sistema nella fase solida. Vediamo di capire in modo piu’ intuitivo l’origine di questo fenomeno: quando la simmetria spontaneamente rotta e’ un gruppo continuo, gli stati fondamentali ( o vuoti) della teoria sono degeneri e formano un insieme continuo che si puo’ etichettare con i parametri del gruppo. Consideriamo come esempio una semplice generalizzazione del modello di Landau-Ginzburg, in cui il parametro d’ordine, anziche’ essere un campo reale φ(x) e’ un campo complesso ψ(x) e scriviamo l’Hmiltoniana nella forma Z 1 3 2 2 HLG [ψ] = d x |∇ψ| + V (|ψ| ) . 2 In questo caso il gruppo di simmetria e’ il gruppo U(1) generato dalle trasformazioni ψ(x) → ψ ′ (x) = eiα ψ(x) . Nel caso di rottura spontanea di questa simmetria ogni vuoto puo’ essere etichettato con un parametro angolare α: hψi = ψo = ρo eiα HLG [ψ] e’ minimo per ψ = ψo . Consideriamo ora una configurazione che interpoli tra due vuoti differenti: supponiamo ad esempio che ψ(x) = ρo per x1 ≪ −A e ψ(x) = ρeiαo per x1 ≫ A, dove x1 è una delle coordinate del sistema. Possiamo interpolare queste due configurazioni ponendo ψ(x) = ρo eiθ(x) L’identita’ che abbiamo trovato tra χT e m h e’ un tipico esempio di identita’ di Ward, cioe’ identita’ tra funzioni di correlazione che derivano dall’invarianza rispetto a un gruppo di trasformazioni; queste identita’ giocano un ruolo molto importante nella teoria quantistica dei campi. 15 67 con θ(x) come opportuna funzione interpolante. Se inseriamo questa configurazione nell’Hamiltoniana, l’unico termine che risente della presenza di θ(x) e’ il termine cinetico |∇ψ|2 . Tutti gli altri termini dell’eq. di LG sono funzioni di |ψ(x)| = ρo . Poiche’ ∇ψ(x) = ρo eiθ(x) ∇θ(x), si ha Z Z ρ2o 3 1 2 HLG [ψ] − HLG [ψo ] = d x |∇ψ(x)| = d3 x(∇θ(x))2 = ∆E . (5.4) 2 2 Quindi nella fase a simmetria spontaneamente rotta (ρ > 0), quanto piu’ A e’ grande16 , tanto piu’ il gradiente di θ puo’ essere reso piccolo, ⇒ esistono delle eccitazioni che interpolano tra diversi vuoti che hanno un’energia ∆E tanto piu’ piccola quanto piu’ grande e’ la loro lunghezza d’onda 17 : sono questi i bosoni di Goldstone. Detto in altri termini, θ(x) descrive un campo di massa nulla, in quanto θ contribuisce a HGL solo con il termine cinetico (∇θ)2 . Vediamo ora un approccio piu’ sistematico: Scriviamo esplicitamente l’Hamiltoniana HGL per una teoria O(N) invariante ) ( N Z X X X X r u 1 o o (∇φa )2 + ( φ2a ) + ( φ2a )2 − ha φa HGL [φa ] = dD x 2 a 2 a 4! a a Sia φao una configurazione di minimo; ponendo ha = hδaN si ha: hφa i = φo δaN , ro φo + uo 3 φ = h (condizione di minimo) 3! o Per studiare lo spettro delle eccitazioni (quantistiche) di energia piu’ bassa basta porre φ(x)a = φao + φ̄a (x), dove φ̄a descrive una perturbazione dello stato fondamentale. Poiche’HGL ha un minimo per φ(x) = φo , non compaiono termini lineari in φ̄. HGL [φ] = HGL [φo ] + H̃GL [φ̄] Separiamo le N direzioni in una longitudinale a = N e N − 1 trasversali t = 1, 2 . . . N − 1 X X (∇φ̄a )2 = (∇φ̄t )2 + (∇φ̄N )2 a X a t (φ̄a )2 = X (φ̄t )2 + φ̄2N t 16 Qui la scala delle lunghezze dipende dal valore della differenza di fase αo tra i due vuoti. La trasformata di Fourier del gradiente ∇ e’ il numero d’onda k = 2π/λ, dove λ ∝ A e’ la lunghezza d’onda dell’eccitazione che interpola tra i due vuoti. 17 68 ( X φ2a )2 = ( a φ4N X φ̄2t )2 + 2 t 4 = (φo + φ̄N (x)) = 4φ̄N (x)φ3o X φ̄2t φ2N + φ4N t + φ4o + 6φ2o φ̄2N (x) + 4φo φ̄3N (x) + φ̄4N I termini lineari si devono cancellare per la proprieta’ di minimo di H. Z h1 µ2 X 2 1X µ2 D (∇φ̄t )2 + T φ̄ + ⇒ H̄GL [φ̄] = d x (∇φ̄N )2 + L φ̄2N + 2 2 2 t 2 t t + dove X g3 uo uo X 2 2 i g3 φ̄N φ̄2t + φ̄3N + φ̄4N + ( φ̄a ) 3! 3! 4! 4! t a 1 1 µ2L = ro + uo φ2o , µ2T = ro + uo φ2o , g3 = uoφo . 2 3! Utilizzando la condizione di minimo ro φ o + uo 3 φ =h 3! o h h − 2ro , µ2T = φo φo Poiche’ nella fase a simmetria spontaneamente rotta ro < 0, si ha µL > µT . Nel limite uo → 0 possiamo utilizzare i risultati del modello gaussiano: la teoria e’ la somma di un campo libero longitudinale che ha un correlatore, nello spazio degli impulsi, della forma 1 GL (p) = 2 p + µ2L ⇒ µ2L = 3 e N − 1 campi di correlatore GT (p) = 1 1 = 2 p2 + µ T p2 + h/φo Nel limite h → 0 questi N − 1 campi descrivono eccitazioni di massa 0 dette appunto bosoni di Goldstone. Si dice teorema di Goldstone l’affermazione che la fase a simmetria spontaneamente rotta di un gruppo continuo contiene eccitazioni di massa nulla. Il metodo che abbiamo usato è un metodo molto generale che si puo’ applicare ogniqualvolta si sappiano trattare perturbativamente le fluttuazioni attorno a un vuoto della teoria. 69 5.3 Dimensione critica inferiore È noto (v. la parte del corso sui sistemi critici) che l’approssimazione di campo medio e’ tanto migliore quanto piu’ la dimensionalita’ dello spazio e’ alta , e si definisce dimensione critica superiore la dimensione spaziale in cui la descrizione del comportamento critico data dal campo medio è esatta. Al contrario, le fluttuazioni di un sistema attorno una configurazione di equilibrio sono tanto piu’ importanti quanto piu‘ la dimensione dello spazio è bassa. Queste fluttuazioni tendono ovviamente a disordinare il sistema e quindi ad abbassare la temperatura di transizione verso la fase ordinata; se la dimensione è minore o uguale a un valore critico dc detto dimensione critica inferiore la temperatura di transizione si riduce a zero, per cui il sistema non possiede una fase a simmetria spontaneamente rotta. Per il modello di Ising e per tutti modelli con una simmetria discreta e con interazioni a corto raggio si ha dc = 1, mentre per i modelli con simmetria continua risulta dc = 2. Benchè le afferamzioni precedenti si possano dimostrare rigorosamente, qui ci si contenta di darne una giustificazione plausibile con dei semplici argomenti intutivi basati sul costo necessario, in termini di energia libera F = E − T S, per disordinare una fase ordinata. Consideriamo come primo esempio un modello di Ising unidimensionale su P reticolo, definito dall’ hamiltoniana H = −J i σi σi+1 e supponiamo che il sistema sia in una fase ordinata con σ = +1. Qual’e’ il costo in energia libera per creare un domino di dimensione ℓ di magnetizzazione opposta attorno a un dato sito j in cui si è posto σj = −1 ? Ognuno dei due estremi del dominio contribuisce con un energia E = 2J, ma il domino puo’ occupare ℓ posizioni diverse attorno a j, percio’ ∆S = κ log ℓ e quindi ∆F ∼ 4J − κT log ℓ. In conclusione, la formazione di in tale dominio per ℓ sufficientemente grande e T arbitrario produce sempre un abbassamento di F per ogni valore di T e la fase ordinata non puo’ essere stabile. Viceversa in due dimensioni l’energia di un dominio di perimetro ℓ è E ∼ 2Jℓ. Per calcolarne l’entropia consideriamo il bordo del dominio come un cammino casuale chiuso che ad ogni passo, nel reticolo quadrato, ha al massimo tre possibilità (perchè non può tornare su se stesso), perciò il numero possibile di configurazioni è circa cℓ , con c < 3. Quindi ∆F = 2Jℓ − κT ℓ log c e a temperature sufficientemente basse la fase ordinata è stabile rispetto alla formazione di domini di spin opposto. Se la simmetria è continua il discorso è un po’ diverso. Possiamo, per fare un esempio concreto, considerare un modello con simmetria O(3), sostituendo nell’ hamiltoniana di Ising al posto del segno σi un vettore σ~i . Se si forma un 70 dominio di dimensione ℓ che possiede al centro uno spin di verso opposto rispetto a quelli della frontiera, gli spin intermedi hanno a disposizione una distanza O(ℓ) per interpolare, col minor costo energetico possibile, lo spin al centro con quelli alla frontiera. L’angolo relativo tra due spin contigui (che è la grandezza che interviene nell’ hamiltoniana) è dell’ordine di π/ℓ e la densità di energia (che è ∝ (∇θ)2 , vedi l’eq.(5.4)) è O(1/ℓ2). Questa dà un’energia totale, in d dimensioni, E = O(ℓd−2 ) per un dominio il cui volume è O(ℓd ), da compararsi con O(ℓd−1 ) nel caso di simmetria discreta. Questo significa che gli effetti entropici sono sempre dominanti per d ≤ 2. L’argomento intuitivo precedente è corroborato dal teorema di Mermin- WagnerHohenberg (noto in teoria dei campi come teorema di Coleman) che stabilisce in modo rigoroso che a temperatura 6= 0 non ci puo’ essere rottura spontanea di una simmetria continua (cioè con un valore di aspettazione non nullo del parametro d’ordine) in dimensioni d ≤ 2 nei modelli con accoppiamenti a corto raggio. Una motivazione semplice per giustificare questo teorema da un altro punto di vista è che non possono esistere modi di Goldstone in d ≤ 2 dimensioni. Infatti il correlatore di un campo di massa nulla in d = 2 soddisfa l’eq. (3.3) che nel limite limite continuo diventa −∆G(x, y) = δ(x)δ(y) 1 la cui unica soluzione a simmetria radiale18 è G(x, y) = c − 2π log r, (c è una costante arbitraria) che è divergente a grandi distanze (divergenza infrarossa) ed è sorgente di inconsistenze, perchè come si è già visto al § 3.1.2 ,il correlatore dovrebbe essere sempre positivo. Analogamente in una dimensione il correlatore soddisfa l’equazione d2 G(x) = −δ(x) , dx2 è anch’essa divergente infrarossa. In conclusione la cui soluzione G(x) = c − |x| 2 i modi di Goldstone in d ≤ 2 dimensioni non possono esistere e quindi neanche il vuoto in cui si propagano, cioè una fase a simmetria spontaneamente rotta, la cui esistenza richiede necessariamente anche quella dei modi di Goldstone. 2 ∂ ∂ ∂ Infatti il laplaciano in coordinate polari (r, φ) è ∆f = 1r ∂r (r ∂r f )+ r12 ∂φ 2 f , da cui, ponendo 1 d 1 ∂ ∂φ G = 0, si ha G(r) ∝ log r. Poichè ∆ log r = r dr θ(r) = r δ(r), si ha δ(x)δ(y)dxdy = 18 δ(r)dr dφ 2π , come si puo’ verificare integrando su una funzione di prova entrambi i membri. Si ottiene la normalizzazione riportata nel testo 71 5.4 Il modello XY bidimensoniale Il modello XY è un modello con simmetria U(1)=O(2) ottenuto assegnando ad ogni nodo j di un reticolo in d dimensioni un vettore unimodulare bidimensionale Sj = eiθj ≡ (xj = cos θj , yj = sin θj ) ; il suo nome deriva banalmente dal fatto che le componenti cartesiane che definiscono in ogni nodo il vettore sono x e y. È una generalizzazione diretta del modello di Ising, che si otterrebbe limitando θ ai due valori 0 e π, mentre i questo modello 0 ≤ θ ≤ 2π. L’Hamiltoniana è X KX Si Sj⋆ + Si⋆ Sj = −K cos(θi − θj ) . (5.5) H=− 2 hiji hiji in d=3 il modello ha una transizione ordine-disordine che è nella stessa classe di universalità del punto lambda dell’elio superfluido. Qui studiamo il caso in due dimensioni, che è di grande interesse teorico per vari motivi. Innanzi tutto questo modello bidimensionale, in base al teorema di MerminWagner - Hohenberg, non può avere una rottura spontanea di simmetria, il che non esclude che abbia una transizone di fase. La funzione di partizione è Z 2π Y Z= dθj e−H (5.6) 0 j dove la temperatura è inglobata in K ∝ 1/T . A bassissima temperatura, cioè K molto grande, il sistema tende ad ordinarsi e gli angoli θi − θj sono molto piccoli, per cui, a parte una costante moltiplicativa, la funzione di partizione è dominata dal termine gaussiano nello sviluppo del coseno. che nella notazione del continuo diventa Z 1 K X ∂α θ(x)∂ α θ(x) − (∂α θ(x)∂ α θ(x))2 + . . . (5.7) H = d2 x 2 α=1,2 4! D’accordo con la (4.7), K è un accoppiamento marginale, ma non può essere riassorbito in una ridefinizione del campo θ che è un angolo e quindi varia da 0 a 2π; dunque l’equazione del gruppo di rinormalizzazione par essere a d K ≡ K̇ = 0 . da (5.8) È anche facile verificare, utilizzando il metodo usato per ricavare la (4.9), che i termini di ordine superiore nello sviluppo (5.7) corrispondono a costanti di accoppiamento irrilevanti, dunque per ogni valore di K (purchè abbastanza grande, 72 come vedremo) le traiettorie del gruppo di rinormalizzazione fanno fluire il sistema verso un punto fisso gaussiano. L’Hamiltoniana di punto fisso è Z K ⋆ (5.9) H = d2 x ∂α θ∂ α θ . 2 Cominciamo col calcolarci il correlatore hSx Sy⋆ i = heiθx −iθy i = eG(x−y)−G(0) , dove si è usata la (4.2) con Bx = −By = i. Ricordando poi che il correlatore gaussiano bidimensionale è dato da 19 hθx θy i ≡ G(x − y) = c − si ha hSx Sy⋆ i = 1 log |x − y| , 2πK C . |x − y|1/2πK (5.10) Questa legge di potenza mostra che il sistema è critico e l’esponente magnetico η= 1 2πK (5.11) varia con continuità con K, il che corrisponde ad un comportamento molto diverso rispetto ai sistemi fisici finora studiati. Ci sono però delle configurazioni in θ di cui lo sviluppo (5.7) non tiene conto: i vortici. Come avevamo già visto nell’elio superfluido, nel limite continuo un vortice centrato nel punto (xo , yo ) di un sistema di riferimento cartesiano è dato da θ(x, y) = n α = n arctan[(y − yo)/(x − xo )] , dove l’intero relativo n è la vorticità e α è l’angolo delle coordinate polari con origine nel centro del vortice. A grande distanza dal suo centro un vortice è lentamente variabile e quindi contribuisce a (5.7) e per una semplice ragione topologica più volte discussa, questa configurazione è stabile e non si può trascurare il suo contributo alla funzione di partizione anche quando K è grande, nonostante in prossimità del suo centro vari rapidamente. 19 La costante K davanti al logaritmo è dovuta al fatto che l’Hamiltoniana gaussiana non ha la normalizzazione canonica 12 ma K 2 . 73 Con un conto analogo a quello fatto per l’elio superfluido si può facilmente calcolare l’energia di un vortice tenendo conto che dall’equazione precedente si ha ∂α θ(~x)∂ α θ(~x) = 1/r 2 dove r è la distanza di x dal centro del vortice si ha E = n2 πK log L/b , (5.12) dove L è la dimensione lineare del vortice e b è un parametro che fissa la scala microscopica al di sotto della quale le considerazioni topologiche sulle condizioni di continuità del vortice non valgono più. Perchè l’energia totale sia finita occorre che la vorticità totale sia zero. Vediamo ora quando le configurazioni di vortice sono termodinamicamente stabili. Supponiamo che il sistema possa essere descritto da un gas rarefatto di vortici e che ogni vortice abbia a disposizione un dominio di area L2 . Il numero di configurazioni a sua disposizione è L2 /a2 dove a è il passo reticolare;la sua energia è data dalla (5.12), dunque la variazione di energia libera dovuta alla creazione di un vortice è ∆F = n2 Kπ log L/b − 2 log L/a , κT (5.13) dunque per K ≤ KKT ≡ π2 i vortici di vorticità 1 sono stabili. Questo valore critico di K, detto punto di Kosterlitz-Thouless (KT), è il punto teminale della linea di punti fissi gaussiani e il sistema per K > KKT si comporta in maniera diversa come ora vedremo. Per tener conto anche della presenza dei vortici, conviene passare al formalismo gran canonico, con una grand partition function Q che dipende oltre che da K anche dalla fugacità yo che controlla il numero di vortici Q = Zgauss + Z2 yo2 + Z4 yo4 + . . . dove il termine del prim’ordine in yo non c’è per la condizione sulla vorticità totale nulla. Possiamo riscrivere l’equazione precedente in forma più dettagliata: Z 2 Q = Zgauss + yo d2 x d2 ye−E(x,y) + . . . (5.14) dove E(x, y) è l’energia (libera) di due vortici con vortcità opposta con centro in x e y. La dimensione di questi vortici è dell’ordine della loro mutua distanza e la loro energia totale è, per grandi distanze, approssimativamente la somma delle loro energie E(x, y) = 2π K log |x − y|/c , 74 dove c è una costante opportuna. Si può osservare una forte somiglianza della (5.14) con la (4.20) e la (4.22) che consente di leggere le dimensioni di scala xyo di yo . Possiamo riassorbire tutte le varie costanti moltiplicative in gioco nella nuova fugacità y, per cui, utilizzando la (4.21), possiamo scrivere a d y ≡ ẏ = (2 − xy ) y = (2 − πK) y = x y , da dove x è la costante di accoppiamento che conviene usare al posto di K, dato che si annulla proprio a KKT . L’equazione precedente ci dice che y diventa rilevante per K > KKT e quindi i vortici vengono prodotti in coppia e il sistema si comporta nell’infrarosso come un gas di vortici. È da notare che i vortici di vorticità n > 1 corrispondono a costanti di accoppiamento irrilevanti a KKT , come si verifica immediatamente dalle formule precedenti. Continuando con l’analogia alle (4.20) e (4.22) e la corrispondente OPE, si vede che la fusione di due operatori locali che descrivono la creazione di vortici genera come operatore φk l’identità, che può essere riassorbito con una modifica (infinitesima) della normalizzazione, e quindi in una mdifica di K e dunque di x. La (4.21) suggerisce quindi ẋ = A y 2 dove A è una costante positiva. In conclusione le equazioni del gruppo di rinormalizzazione nell’intorno del punto KT si possono scrivere nella forma ẏ = x y ẋ = A y 2 (5.15) (5.16) Queste sono le equazioni di Kosterlitz. E’ importante la simmetria rispetto a y → −y che assicura che i vortici siano prodotti in coppia ed esclude la presenza di altri termini del secondo ordine in queste equazioni. Dividendo membro a membro le due equazioni possiamo ricavare la forma generale delle traiettorie del RG ẏ/ẋ ≡ dy x = ⇒ A y 2 − x2 = c , dx Ay che chiaramente formano un fascio di iperboli. Per c < 0 esse tagliano l’asse delle x. Nel semipiano x < 0 il verso di percorrenza è verso il basso, come vuole la (5.15), e terminano lungo la semiretta y = 0, x ≤ 0 formata dai punti fissi gaussiani. La traiettoria √ A y + x = 0, y ≤ 0 (5.17) è la linea di separazione tra la regione critica (ξ = ∞) controllata dalla linea di punti fissi e il resto, controllato da un punto fisso ad alta temperatura che non si 75 ξ<∞ y ξ=∞ KT x Figure 3: Le traiettorie del gruppo di rinormalizzazione di Kosterlitz 76 può rappresentare nello stesso diagramma dei flussi, che è valido solo per x e y piccoli. Il punto fisso di KT, rappresentato dall’origine nel piano xy, è caratterizzato da valori razionali degli esponenti critici η e δ, infatti ponendo K = KKT nella (5.11) e ricordando che δ = (d+2−η)/(d−2+η) si ottiene η = 41 e δ = 15. Viceversa ν non è definito (o vale ∞) perchè la legge con cui diverge ξ non è una legge di potenza. Per studiare con che legge ξ diverge, scegliamo un dato modello XY di partenza, ad es. quello definito dalla (5.5). Pochè questo modello dipende da un sol parametro, esso sarà rappresentato da una curva nel piano xy (si veda la linea tratteggiata in figura). Poniamoci subito al di sopra della linea critica di KT (5.17); in questa regione le traiettorie si possono descrivere con le iperboli Ay 2 − x2 = αt, dove t ha il ruolo di temperatura ridotta, in quanto il sistema diventa critico a t = 0. Queste traiettorie possono far evolvere il sistema da un valore iniziale x = x(0) negativo a un valore finale x(ℓ = log s) > 0 che conviene scegliere dell’ordine O(1). L’equazione (5.16) lungo la suddetta traiettoria dà dx ẋ = α t + x2 , ⇒ dℓ = 2 , x + αt da cui Z ∞ Z ℓ Z x(ℓ) dz 1 π dx ≃√ = √ , (t → 0) . dℓ = 2 2 α t −∞ z + 1 αt 0 x(0) x + α t Combinando questo risultato con la nota equazione funzionale per ξ ξ(x(ℓ), y(ℓ)) ≡ ξo = ξ(x(0), y(0))/ exp[ℓ] ≡ ξ/s si ha √ ξ = ξo eπ/ αt , (5.18) dunque ξ diverge secondo una precisa legge esponenziale. 5.4.1 Trasformazione di dualità Il fattore di Boltzmann associato ai link nel modello XY è una funzione periodica di periodo 2π, e quindi si può sviluppare in serie trigonometrica. In particolare per il modello (5.5) si ha X eK cos(θi −θj )) = Imij (K) ei mij (θi −θj ) (5.19) mij ∈Z 77 j2 mij2 h1 h2 j3 mij3 i h3 j1 mij1 h4 mij4 j4 Figure 4: I quattro link incidenti sul nodo i e i quatto siti del reticolo duale le cui variabili consentono di risolvere il vincolo (5.22) dove le In (z) = I−n (z) sono le funzioni di Bessel modificate. Per i nostri scopi ci basta sapere che per K grande In (K)/I0 (K) ∼ e−n 2 /2K , (K ≫ 1) . (5.20) Inserendo questo sviluppo nella funzione di partizione (5.6) si possono integrare esplicitamente tutte le θ; infatti la variabile θi compare solo nei quattro link che incidono sul nodo i (si veda la figura) ( P Z 2π 0 mijn 6= 0 dθi eiθi (mij1 +mij2 +mij2 +mij3 +mij4 ) = (5.21) Pn 1 0 n mijn = 0 Integrando su tutti i nodi si può riscrivere la Z nella forma Z= ′ Y X hiji mij ∈Z Imij (K) ∼ I0links ′ Y X hiji mij ∈Z 2 emij /2K (K ≫ 1) dove ora le configurazioni su cui si somma sono i numeri interi relativi mij associati ai link e l’apice nella somma sta ad indicare che queste somme non sono libere, ma devono soddisfare in accordo con la (5.21) il vincolo 4 X n=1 mijn = 0 , ∀ i . 78 (5.22) Un modo semplice per risolvere automaticamente questo vincolo su tutti i nodi nel reticolo quadrato infinito consiste nel prendere in considerazione il reticolo duale (che è costuito asegnando un nodo al centro di ogni quadrato elementare del reticolo diretto) e di assegnare ad uno dei suoi nodi un intero arbitrario e quindi assegnare ad ogni altro nodo un intero hj scelto in modo che la differenza hj − hl coincida con l’intero mjl associato al link corrispondente del reticolo diretto. Per esempio nel caso rappresentato in figura si ha mijn = hn − hn−1 . È immediato verificare che 1. In un reticolo infinito si ha per ogni configurazione {mij } di tutti i link del reticolo diretto una configurazione {hl } associata ai nodi del reticolo duale, definita a meno di una costante additiva che è il valore arbitrario del primo nodo duale scelto 2. Il vincolo (5.22) è automaticamente soddisfatto per ogni nodo del reticolo diretto 3. La funzione di partizione si può scrivere nella forma Z= ∞ Y Y X i hi =−∞ hiji Ihi −hj (K) 4. In questa nuova forma la simmetria manifesta del modello non è più U(1), ma Z. 5. Interpretando hi come la distanza del quadrato elementare di posizione i = (x, y) dal piano z = 0, ogni configurazione {hj } rappresenta una superficie h = f (x, y). 6. A bassa temperatura (K grande) il fattore di Boltzmann è dominato in base alla (5.20) dal termine gaussiano e− P 2 hiji (hi −hj ) /2K , quindi per K grande anche la differenza hi − hj può essere grande, perciò le configurazioni dominanti sono rappresentate da superfici molto rugose o rough. Tutta la regione critica del modello XY, caratterizzata da una variabile θ lentamente variabile corrisponde alla fase rough delle superfici. Viceversa la regione non critica, dove vengono liberati i vortici corrisponde a superfici lisce o smooth. La transizione di KT viene detta in questo linguaggio roughening transition. 79 Questa transizione è ubiquitaria i natura. Si può osservare ad esempio nella superficie di crescita dei cristalli o nelle interfacce di separazione tra fasi differenti. Un esempio concreto e molto studiato si ha nel modello di Ising tridimensionale a bassa temperatura. Supponiamo di fissare le condizioni al bordo in modo che nel piano z = ∞ tutti gli spin siano S = +1 e nel piano z = −∞ siano invece S = −1; si formerà necessariamente un’interfaccia che separa le due fasi con magnetizzazione opposta. A T → 0 l’interfaccia che minimizza l’energia libera sarà un piano ortogonale all’asse z; l’energia non dipende dalla posizione dell’interfaccia. Man mano che la temperatura aumenta cominceranno a contribuire anche le interfacce formate da superfici lentamente variabili: la loro energia interna aumenta ma aumenta anche la loro entropia. Ad un valore critico TR della temperatura, che è notevolmente più basso della temperatura di smagnetizzazione di Curie Tc , avviene la transizione di roughening, caratterizzata da interfacce rapidamente variabili e fluttuanti. Alcune osservazioni finali: • La trasformazione di dualità è una tipica trasformazione dei modelli con simmetria abeliana che generalizza la trasformazione di Kramers-Wannier già vista nel modello di Ising bidimensionale. • Essa consiste essenzialmente nel rimpiazzare le variabili di gruppo con variabili associate alle rappresentazioni irriducibili. • Solo nei gruppi abeliani il duale G⋆ di un gruppo G, cioè l’insieme delle sue rappresentazioni irriducibili, forma a sua volta un gruppo (necesariamente abeliano). • (G⋆ )⋆ = G • U(1)⋆ = Z, Z⋆N = ZN , R∗ = R 5.5 Il modello O(n > 2) in 2 dimensioni La transizione di KT non è una transizione ordine-disordine, ma è prodotta dalla presenza di vortici, cioè di configurazioni non banali e topologicamente stabili. Un vortice è caratterizzato dal fatto che un cammino chiuso γ nel piano π in cui è definito il modello nel limite continuo è mappato nel cerchio trigonometrico S1 dei possibili valori della variabile di spin in un cammino chiuso Γn che avvolge n volte S1 , con n 6= 0: γ ⊂ π → Γn ⊂ S1 n 6= 0 . 80 Poichè Γn non è omotopo a zero (cioè non può essere ridotto con continuità a un punto) i vortici son stabili. La situazione è molto diversa quando il gruppo di simmtria del modello bidimensionale è O(n) con n > 2. Consideriamo un modello bidimensionale definito dall’Hamiltoniana Z n X 1 2 H= dx ∂α φa ∂ α φa (5.23) 2T a=1 dove φa sono le n componenti di un vettore unitario: n X φa (x)2 = 1 . (5.24) a=1 Ogni vettore individua un punto della sfera unitaria Sn−1 che è una varietà semplicemente connessa per ogni n > 2, cioè ogni cammino chiuso Γ ⊂ Sn−1 è omotopo a zero, dunque il sistema non possiede configurazioni topologiche stabili e non ci si aspettano transizioni di fase a T > 0. Per via del vincolo (5.24) non tutti le componenti di φ possono essere piccole. Conviene risolvere il vincolo ponendo p p φi = ti , (i = 1, . . . n − 2) , φn−1 = 1 − ti ti cos θ , φn = 1 − ti ti sin θ . Quindi la funzione di partizione diventa Z Y Z Z= Dti Dθe−H i con 1 H= 2T Z 2 dx n−2 X i=1 ∂α ti ∂ α ti + (1 − ti ti )∂α θ ∂ α θ + . . . Dove i puntini indicano i termini in cui la derivata ∂α agisce sulla radice e che si puo’ dimostrare essere trascurabili. Con questa approssimazione, integrando prima sui campi gaussiani trasversi ti , si ottiene Z Z 1 −Hef f d2 x(1 − hti ti i) ∂α θ ∂ α θ , (5.25) Z = Dθ e , Hef f = 2T dove i valori medi sono calcolati rispetto alla misura gaussiana. Quindi questa teoria è equivalente al modello XY con due importanti differenze: 81 • La costante di accoppiamento effettiva è Kef f = (1 − hti ti i)/T (5.26) • Non ci sono vortici, per cui l’equazione del gruppo di rinormalizzazione è semplicemente d a Kef f ≡ K̇ef f = 0 . (5.27) da Per scriverla in forma esplicita bsisogna calcolarsi il correlatore gaussiano j hti (0) t (0)i = δij T (2π)2 Z 1 a 1 L d2 k T = δij log L/a , 2 k 2π dove si è usata la solita rappresentazione integrale del correlatore gaussiano (4.4). Essendo la teoria in due dimensioni, oltre al cut-off ultravioletto 1/a si deve introdurre anche un cut-off infrarosso 1/L per i noti problemi del correlatore gaussiano bidimensionale nel limite termodinamico. Inserendo questa espressione nella (5.27) si ha subito n−2 2 Ṫ = T . (5.28) 2π Quest’equazione è simile, ma di segno opposto all’eq.(4.29) per l’accopppiamento u della teoria φ4 , quindi T è marginalmente rilevante, cioè T cresce al crescere del passo reticolare, dunque T si annulla nel limite continuo. Quests proprietá, che riveste grande importanza nella teoria quantistica dei campi, è detta libertà asintotica o asymptotic freedom. Un’altra proprietà importante di questo modello bidimensionale è che la sua Hamiltoniana (5.23) è invariante di scala e non contiene nessun parametro dimensionale. Eppure T che è adimensionale, dipende esplicitamnete dal passo reticolare (altrimenti l’equazione (5.28) sarebbe invece banalmente Ṫ = 0). L’unico modo in cui la quantità dimensionale a può apparire in T è attraverso la combinazione adimensinale T = T (aΛ), dove Λ è una costante che ha le dimensioni dell’inverso di una lunghezza (ossia di una massa), ma non dipende dal dal cut-off a d Λ=0. (5.29) a da Dunque Λ è una grandezza dimensionale e fisica perchè indipendente dal cut-off che non c’era nella teoria classica di partenza, che è invariante di scala. La comparsa di questa scala fisica è dunque un fenomeno prodotto dalla formulazione 82 dela teoria mediante l’integrazione funzionale (somma sulle configurazioni) e quindi è un fenomeno quantistico. detto trasmutazione dimensionale. La dipendenza della scala fisica Λ da T si ottiene osservando che per ragioni ) dimensionali, essendo a l’unica scala della teoria regolarizzata, Λ = f (T , dove a f (T ) è una funzione adimensionale da determinare. La (5.29) dà −f (T ) + df df Ṫ = 0 , ⇒ = dT f dT n−2 2 T 2π da cui, indicando con C la costante di integrazione, 2π f (T ) = C e− (n−2) T . (5.30) Naturalmente questa forma funzionale vale per ogni grandezza fisica della teoria. In particolare l’inverso della lunghezza di correlazione ξ −1 ∝ f (T ), a conferma che in questo modello la transizone di fase avviene solo a T = 0 e la lunghezza di correlazione cresce con una legge esponenziale. 5.5.1 Il modello O(n) in 2+ǫ dimensioni Il calcolo precedente si può facilmente adattare in d = 2 + ǫ dimensioni nel limite ǫ → 0. È importante tener conto che i gradi di libertà “lenti” che rimangono dopo l’integrazione sui gradi di libertà trasversi ( si veda la (5.25)) continuano ad essere gli angoli θ(x), dunque sono adimensionali anche in 2 + ǫ dimensioni, quindi l’Hamiltoniana è ora 20 1 H= 2T Z n dd x X ∂α φa ∂ α φa aǫ a=1 (5.31) per cui l’equazione del gruppo di rinormalizzazione (5.27) diventa K̇ef f = ǫ Kef f . (5.32) D’altra parte il correlatore gaussiano dei campi trasversi è ora j hti (0) t (0)i = δij T (2π)d Z 1 a 0 dd k 2π d/2 Ωd jT = δ , Ω = d i k2 ǫ (2π)d aǫ Γ(d/2) 20 Si noti che la dipendenza dal passo reticolare è diversa rispetto al caso gaussiano, per cui il coefficiente del termine cinetico non è marginale. 83 T =0 T⋆ T Figure 5: Il flusso del gruppo di rinormalizzazione in una teoria con simmetria O(n) in 2 + ǫ dimension. da cui T hti t i = ǫ i n−2 + O(ǫ) 2π che inserita nella (5.32) dà Ṫ = −ǫ T + n−2 2 T 2π (5.33) che ha due punti fissi (v. Figura), T = 0 (punto fisso stabile, cioè T irrilevante) e 2π T ⋆ = ǫ n−2 che è un punto fisso instabile, infatti linearizzando l’equazione precedente ponendo T = T ⋆ + δT si trova, con lo stesso calcolo fatto per la teoria φ4 in 4 − ǫ dimensioni (si veda il § (4.6)), che δT ha autovalore x = ǫ > 0 ed è quindi rilevante. In conclusione il sistema con simmetria O(n), in base al flusso delle traiettorie del RG determinata dai punti fissi, ha una fase ordinata nell’intervallo T ≤ T ⋆ ; questa fase si riduce a 0 nel limite ǫ → 0, come previsto dal valore delle dimensioni critiche inferiori di un sistema con simmetria continua. 84 6 Simmetrie locali 6.1 Il fenomeno di Higgs Il teorema di Goldstone non vale per la rottura spontanea di una simmetria locale ( cioe’ una simmetria i cui parametri sono funzioni arbitrarie dello spazio-tempo) come la simmetria di gauge. Vedremo che si manifesta un nuovo fenomeno. Consideriamo il modello di Landau-Ginsburg per un campo scalare carico, cioe’ sostituiamo al campo scalare reale φ(x) che abbiamo considerato nei sistemi magnetici un campo scalare complesso ψ(x). Per maggiore generalita’ consideriamo una teoria dipendente anche dal tempo. Essendo ψ un campo carico, si accoppia al campo elettromagnetico. Questo accoppiamento si ottiene semplicemente sostituendo alla derivata ∂µ le derivate covarianti Dµ : ie Aµ (x), ~c dove Aµ (x) e’ il potenziale o campo di gauge. Con questa sostituzione la densita’ Lagrangiana 1 Lψ = (D µ ψ)∗ (Dµ ψ) − V (|ψ|) , 2 dove V è il potenziale di Landau-Ginzburg: V (|ψ|) = r2o |ψ|2 + u4!o |ψ|4 , è invariante per trasformazioni locali di gauge ∂µ → Dµ = ∂µ + e ψ(x) → e−i ~c ω ψ(x) = ψ ′ (x) Aµ (x) → Aµ (x) + ∂µ ω(x) = A′µ , (6.1) (6.2) dove ω(x) è una funzione (derivabile) arbitraria di xµ . L’invarianza di L è una immediata conseguenza del fatto che V (|ψ ′ |) = V (|ψ|) e che la derivata covariante si trasforma nel modo seguente: e ie ′ ie ′ Dµ ψ(x) → ∂µ + Aµ (x) ψ (x) = ∂µ + (Aµ (x) + ∂µ ω) e−i ~c ω ψ(x) ~c ~c e = e−i ~c ω Dµ ψ(x) , per cui |Dµ ψ|2 e’ invariante. Poiche’ ψ si accoppia al campo elettromagnetico, la densità Lagrangiana completa contiene anche il contributo del campo elettromagnetico Z Z Z 1 µ 1 µ 1 µν 4 ν 4 Fµν F dx = A Aµ − A ∂µ ∂ν A dx4 Lem dx = − 4 2 2 85 d2 −△ dt2 = ∂µ Aν − ∂ν Aµ = Fµν 1 E k = F ko , B k = − ǫijk Fij 2 L = Lem + Lψ Le equazioni del moto per i campi ψ e Aµ si ottengono imponendo la stazionarieta’ dell’azione δL δL δL =0, = =0. δAµ δψ δψ ∗ Nella fase a simmetria spontaneamente rotta (detta anche fase ordinata) possiamo utilizzare l’invarianza di gauge per fare in modo che ψ(x) sia reale per ogni x. Infatti, poiche’ in generale il campo ψ si puo’ parametrizzare nella forma ψ(x) = e ω(x) = θ(x) per avere φ(x)eiθ(x) , dove φ(x) e’ un campo reale, basta scegliere ~c ′ ψ (x) = φ(x). Questa scelta di gauge e’ nota come gauge unitario.21 In questo gauge e’ facile verificare che le eq. del moto assumono la forma ∂µ F µν (x) = − e2 2 δLφ =− φ (x)Aν (x) δAν (~c)2 δ uo uo V (φ) = −ro φ − φ3 = φ(x)[φ2o − φ2 (x)] , δφ 6 6 dove φo e’ il minimo del potenziale nella fase in cui la simmetria e’ spontaneao . Lo stato fondamentale corrisponde alla configurazione mente rotta: φ2o = − 6r uo φ(x) = φo , Aµ (x) = 0. Per studiare lo spettro delle eccitazioni attorno allo stato fondamentale possiamo utilizzare un metodo molto generale, che consiste nel considerare piccole perturbazioni della configurazione di campo corrispondente allo stato fondamentale. Le equazioni del moto linearizzate di queste perturbazioni forniscono direttamente lo spettro della teoria. Nel caso in questione poniamo φ(x) = φo + φ̄(x) e consideriamo φ̄(x) e Aµ (x) delle piccole fluttuazioni, in modo da poter linearizzare le eq. del moto: e2 2 ν ∂µ F µν (x) = − φA (~c)2 o D µ Dµ φ(x) = − 21 E’ importante osservare che il gauge unitario è ben definito solo nella fase ordinata, dove φ(x) 6= 0 e quindi θ(x) è sempre ben definita. Viceversa nei punti in cui ψ si annulla, θ non è necessariamente definita e quindi la trasformazione di gauge cercata è singolare o non esiste. 86 uo 2 φ φ̄ + O(φ̄2 ) 3 o Poiche’ F µν = −F νµ , ⇒ ∂µ ∂ν F µν = 0, e dalla prima eq. ⇒ ∂ ν Aν = 0, quindi ∂µ F µν = Aν , e le eq. del moto delle fluttuazioni attorno alla config dello stato fondamentale si possono scrivere nella forma: e2 2 + φ Aµ (x) = 0 (6.3) (~c)2 o uo (6.4) + φ2o φ̄(x) = 0 3 Quindi non ci sono piu’eccitazioni di massa nulla, ma il fotone (descritto dal e campo Aµ ) acquista una massa mg = ~c φo e descrive quindi la propagazione di una eccitazione massiva dipspin 1 e il campo φ̄(x) descrive un’eccitazione scalare (spin 0) di massa mH = u3o φo , detta particella di Higgs. E’ importante notare che se applichiamo lo stesso procedimento per studiare le perturbazioni attorno al vuoto simmetrico (φo = 0), si trova che il campo Aµ descrive la propagazione di una particella di massa nulla con solo due stati di polarizzazione, quindi bastano le due componenti A1 (x) e A2 (x) per descriverla. Dunque nella fase simmetrica i campi che descrivono le eccitazioni del sistema sono A1 , A2 , ψ e ψ ∗ ,22 mentre nella fase ordinata φo 6= 0 sono sostituiti da A1 , A2 , A3 e φ̄. Si puo’ quindi dire che la natura locale della simmetria U(1) trasforma il potenziale bosone di Goldstone nella 3a componente (quella a polarizzazione longitudinale) del campo di gauge massivo. Il meccanismo attraverso il quale un campo di gauge acquista una massa non nulla e’ detto meccanismo o fenomeno di Higgs. Puo’avvenire anche per simmetrie di gauge non abeliane ed e’ alla base della teoria delle interazioni elettrodeboli. Il fenomeno di Higgs per il campo scalare che abbiamo descritto fornisce una teoria fenomenologica accurata della superconduttivita’ come ora vedremo. ∂ µ ∂µ φ̄(x) ≡ φ̄(x) = − 22 Nella fase simmetrica non si puo’ usare il gauge unitario per la ragione esposta nella nota precedente 87 7 Superconduttività Moltissimi conduttori non ferromagnetici, al di sotto di una temperatura critica (che di solito è molto bassa: qualche decina di o K) subiscono una transizione a uno stato superconduttore, in cui il sistema ha una resistenza sperimentalmente nulla: la corrente elettrica fluisce attraverso il superconduttore senza sviluppare calore Joule. La prima osservazione sperimentale della superconduttività risale al 1911, quando Kamerlingh Onnes osservò che la resistenza elettrica del mercurio, al di sotto di 4.2 o K, cade bruscamente a zero. In condizioni stazionarie non ci puo’ essere un campo elettrico non nullo nel superconduttore, in quanto ogni differenza di potenziale implica una resistenza non nulla. Ci sono molti effetti associati a questo comportamento, principalmente legati al campo magnetico. Siccome un campo magnetico variabile genera un campo elettrico, un conduttore senza resistenza non puo’ contenere un campo magnetico variabile. Questo spiega i due fenomeni seguenti: • Se un superconduttore di forma sferica viene posto in un campo magnetico, le sue linee di flusso sono spinte fuori dal superconduttore. • Se un anello superconduttore è posto in un campo magnetico, il flusso magnetico concatenato con l’anello rimane invariato anche dopo lo spengimento del campo magnetico esterno: poichè la resistenza elettrica dell’ anello è nulla c’è una corrente che continua a circolare indefinitamente per mantenere il flusso magnetico concatenato a un valore costante. Infine si osserva che, se un conduttore è posto in un campo magnetico B è raffreddato fino allo stato superconduttivo, il campo magnetico è espulso dal superconduttore. Quest’ultimo fenomeno, detto effetto Meissner, mostra che il superconduttore è un perfetto diamagnete, e non è semplicemente riconducibile al fatto che il superconduttore ha resistenza nulla. Se l’intensità dell campo magnetico esterno B supera una soglia critica Bcrit l’effetto Meissner non puo’ avvenire e il sistema non diventa superconduttivo (cio’ spiega perchè il ferro e gli altri conduttori ferromagnetici non diventano superconduttori). 88 7.1 Teoria di London dell’effetto Meissner Si consideri il conduttore come un gas di elettroni liberi. Detta n il numero di elettroni per unità di volume , −e la loro carica, m la loro massa, classicamente si ha ~ = m d~v , ~j = −n e ~v (t) , −eE dt dove ~j è la densità di corrente elettrica. ~ si ha In un campo elettromagnetico generato dal potenziale vettore A ~ =− ∂ A ~, B ~ =∇∧A ~ ≡ rotA ~ E c∂t percio’ m d~ d ~ ne2 ~ e∂ ~ A=− A(~x, t) = 0 , j⇒ j(~x, t) + c ∂t n e dt dt mc 2 ~ x, t) + A ~ o (~x)], dove A ~ o (~x), funzione solo di ~x, [A(~ da cui si ottiene ~j(~x, t) = − ne mc ~ o ≡ 0 all’interno dei superconè la costante di integrazione. Secondo London A duttori: 2 ~ x, t) (equazione di London) ~j(~x, t) = − ne A(~ (7.1) mc Il fatto che la componente di ~j normale alla superficie del superconduttore deve essere nulla (gli elettroni non fuoriescono) si puo’ imporre scegliendo il gauge ~ = 0. Di conseguenza div~j = 0 (⇒ le linee di flusso sono ”trasverso” div A chiuse) L’equazione di Maxwell ~ ≡∇∧B ~ = rotB ~j c diventa ~ ≡ ∇(divA) ~ − △A ~= ∇ ∧ (∇ ∧ A) ~j c Combinando queste eq. con l’equazione di London si ha ~= △A ne2 ~ A mc2 ~ tende esponenzialmente a zero, come Quindi all’interno del superconduttore A ora verifichiamo considerando una geometria particolarmente semplice: 89 Supponiamo che il superconduttore si trovi nel semispazio x ≥ 0. Dalla sim~ è solo funzione di x metria del problema si ha che A 2 d ne2 ~ ⇒ A=0 − dx2 mc2 ~ ~ −x/λ ⇒ A(x) = Ce p c . In conclusione, il campo magnetico penetra nel superconduttore dove λ = m n e per uno spessore ∼ λ. Questa è una buona descrizione del comportamento reale dei superconduttori, ma l’equazione di London che è all’origine non è giustificata e non è invariante di gauge. 7.2 La teoria BCS Dopo piu’ di 50 anni dalla scoperta della superconduttività Bardeen, Cooper e Schrieffer posero le basi per una teoria microscopica della superconduttività, fondata sul fatto che elettroni di un superconduttore, interagendo con i fononi del reticolo cristallino in cui sono immersi, formano (nonostante la repulsione coulombiana) delle coppie con spin antiparallelo dette coppie di Cooper 23 che si comportano come eccitazioni (o quasi particelle) bosoniche; queste coppie che trasportano una carica e = 2q, dove q è la carica dell’elettrone, possono essere descritte da una funzione d’onda o campo scalare carico ψ, in interazione col campo elettromagnetico, quindi la teoria è invariante per la simmetria U(1) di gauge. In analogia a quanto avevamo fatto per l’elio liquido, supponiamo che ψ sia normalizzata in modo che |ψ(x)|2 rappresenti la densità di coppie di Cooper nel punto x. Dal punto di vista della meccanica statistica, il campo ψ è un parametro d’ordine che ha un ruolo analogo alla magnetizzazione spontanea nei sistemi magnetici; il suo valore di attesa hψ(x)i è zero nella fase simmetrica ad alta temperatura; viceversa la fase ordinata è caratterizzata da un valore di attesa diverso da zero che denota la rottura spontanea della simmetria di gauge. Si puo’ dimostrare che nella fase ordinata una frazione finita delle coppie di Cooper occupano lo stato fondamentale; in altri termini, la rottura spontanea della simmetria di gauge 24 hψi = 6 0 23 Queste coppie sono elettroni che sono vicini non nello spazio delle coordinate, ma nello spazio degli impulsi, quindi sono coppie di elettroni che pur non essendo fiscamente molto vicini (e quindi la repulsione coulombiana è schermata) viaggiano alla stessa velocità. 24 La rottura spontanea della simmetria ha un significato non ambiguo solo nel gauge unitario 90 corrisponde alla condensazione delle coppie di Cooper. Quindi la superconduttività, come la superfluidità nell’elio liquido è un fenomeno quantico macroscopico, in cui una frazione finita dei costituenti del sistema è nello stesso stato fondamentale. Gli ingredienti fondamentali di una teoria fenomenologica della superconduttività sono i due seguenti: • Le coppie di Cooper sono descritte da un campo scalare complesso ψ(x) (quindi la teoria ha una simmetria U(1) locale e si accoppia col campo elettromagnetico). • Condensazione delle coppie di Cooper, cioè hψi = 6 0 al di sotto di una temperatura critica Tc , quindi il potenziale V (|ψ|) del campo ψ puo’ essere descritto da una teoria di Landau-Ginzburg. Queste condizioni mostrano che questa teoria fenomenologica non e’ altro che il modello di Higgs precedentemente descritto, cioe’ un modello di Landau-Ginzburg per il campo complesso ψ accoppiato minimalmente (cioè mediante la derivata covariante) al campo elettromagnetico. Questa formulazione e’ nota come modello di Landau-Ginzburg della superconduttivita’. 7.3 Modello di L-G della superconduttività In condizioni di equilibrio l’Hamiltoniana di L-G puo’ essere scritta nella forma H = He.m. + Hψ Z 1 He.m. = d3 x E 2 + B 2 2 Z 1 ~ 2 3 Hψ = d x |Dψ| + V (|ψ|) 2 ~ V (|ψ|) = 1 ro |ψ|2 + uo |ψ|4 ~ = ∇ + ie A, D ~c 2 4! E’ facile verificare direttamente (v. §6.1) che questo modello è invariante per trasformazioni di gauge: e ψ(x) → e−i ~c ω ψ(x) = ψ ′ (x) e ′ ψ ∗ (x) → ei ~c ω ψ ∗ (x) = ψ ∗ (x) 91 ~ ~ ~′ , A(x) → A(x) + ∇ω(x) = A dove ω(x) è una funzione (derivabile) arbitraria di xµ . Per comodità scegliamo un gauge in cui il potenziale scalare Ao è zero (questo è sempre possibile in condizioni statiche). Nella fase a simmetria spontaneamente rotta (detta anche fase ordinata) possiamo utilizzare questa invarianza di gauge per fare in modo che ψ(x) sia reale per ogni x. Infatti, poichè il campo ψ si puo’ sempre parametrizzare nella forma e ψ(x) = φ(x)eiθ(x) , dove φ(x) è un campo reale, basta scegliere ~c ω(x) = θ(x) per avere ψ ′ (x) = φ(x) e ~ ~′ = A ~ + ~c ∇θ ≡  A . e Questa scelta di gauge è nota come gauge unitario.25 ~ B, ~ φ(x) Con questa scelta di gauge la teoria è espressa in termini di campi E, ~ e Â(x) Z 1 e2 ~ˆ 2 2 1 2 3 Aφ + V (φ) (∇φ) + ⇒ H = He.m. + d x 2 2 (~c)2 Lo stato di equilibrio termico del sistema corrisponde al minimo dell’energia libera di Helmoltz. Nell’approssimazione di Landau (che è stata già utilizzata nella descrizione dei sistemi magnetici) l’energia libera coincide con l’Hamiltoniana, quindi lo stato di equilibrio termico corrisponde alle configurazioni di minima energia. 26 In questa approssimazione il valore di minimo del campo φ coincide con il suo valore di attesa, cioè hφi = φ Le condizioni di minimo o, meglio, di stazionarietà dell’Hamiltoniana sono δH =0, δφ 25 E’ importante osservare che il gauge unitario è ben definito solo nella fase ordinata, dove φ(x) 6= 0 e quindi θ(x) è sempre ben definita. Viceversa nei punti in cui ψ si annulla, θ non è necessariamente definita e quindi la trasformazione di gauge cercata è singolare o non esiste. 26 In condizioni statiche la densità hamiltoniana è uguale alla densità lagrangiana cambiata di ~ e φ indipendenti dal tempo ci possono fornire direttasegno, per cui le equazioni del moto di A mente le condizioni di minimo dell’energia. 92 δH =0. ~ δ  ~ = − 1 ∂ Â~ = 0 Avendo posto Âo = 0 e osservando che in condizioni stazionarie E c ∂t si ha27 2 ~ ~ + e φ2 (x) rot B =0 (7.2) 2 (~c) e2 dV Â2 φ + =0 (7.3) 2 (~c) dφ Per un conduttore molto grande, lontano dai bordi, il sistema è invariante per ~ = 0, percio’ il sistema di condizioni di equilibrio traslazioni, ⇒ ∆φ = rot B diventa un sistema algebrico: ~ φ2  = 0 −△φ + e2 dV e2 uo 2  φ + = Â2 φ + ro φ + φ3 = 0 2 2 (~c) dφ (~c) 6 ~ da cui discende che la soluzione φ = 0 esiste sempre, e in questo caso  è indeter~ è arbitrario ⇒ non c’è effetto Meissner. minato, 28 quindi il campo magnetico B Viceversa, ( ~ =0 B (effetto Meissner) ~ se φ = φo 6= 0 ⇒  = 0 ⇒ φo : dV =0 dφ quindi la fase a simmetria spontaneamente rotta del modello di LG corrisponde proprio allo stato superconduttore. c Notare che φo 6= 0 solo per ro < 0, dove al solito si avrà ro = T −T . Tc ~ ~ = − e2 2 φ2 (x) Confrontando l’eq. di minima energia per il campo magnetico rot B (~c) con l’equazione di Maxwell ~ ~ =j rot B c si ha 2 ~ ~j = − ce φ2  (~c)2 R R ~ˆ · ∇ ∧ B). ~ utilizzando ad esempio l’identità 12 d3 x B 2 = 21 d3 x (A 28 In questo caso va però osservato che il gauge unitario non è ben definito e occorrerebbe scrivere le condizioni di minimo in forma invariante di gauge, come faremo in seguito per altri scopi. 27 93 che nella configurazione di stato fondamentale φ = φo coincide in forma con l’equazione di London. • Effetti di bordo In prossimità dei bordi non possiamo piu’ supporre che il sistema sia invariante per traslazioni e quindi i campi diventano funzioni della distanza dal bordo. Quindi il bordo introduce una perturbazione dello stato fondamentale (che è invariante per traslazioni). Questa perturbazione è in genere piccola, per cui possiamo porre nelle condizioni di equilibrio (7.2) e (7.3) φ(x) = φo + φ̄(x) ~ e considerare solo i termini lineari in φ̄ e Â. In questa approssimazione dalla ~ ~ ∝ Â. prima equazione si ha rot B Poichè la divergenza di un rotore è identi~ camente nulla, si ha div  = 0 e quindi, come già visto nella teoria di London, ~ ~ = −△Â. rot B Di conseguenza le condizioni di equilibrio diventano (~c)2 ~ (−△ + λ−2 )Â(x) = 0, λ2 = 2 2 e φo (−△ + ξ −2)φ̄(x) = 0, ξ 2 = 3 uo φ2o dove mG = 1/λ e mH = 1/ξ non sono altro che le masse del fotone massivo e del campo di Higgs introdotte nel § 6.1. Consideriamo un conduttore che idealmente riempia omogeneamente tutto il semispazio x > 0 superconduttore φo = 0 φo 6= 0 In queste condizioni il sistema è solo funzione della variabile x ⇒ △ = e le soluzioni delle eq. precedenti si possono scrivere nella forma: ~ ~ o e− λx , Â(x) = A x φ(x) = φo 1 − e− ξ . 94 d2 dx2 λ è la lunghezza di penetrazione già discussa nel modello di London. ξ è nota come lunghezza di coerenza. λ e ξ sono le due scale che intervengono nella descrizione della superconduttività. Queste due scale descrivono anche la lunghezza di correlazione delle eccitazioni che si possono propagare in un superconduttore omogeneo. Infatti è noto che per studiare lo spettro delle eccitazioni di un dato sistema occorre valutare i correlatori dei campi in gioco; dalla legge di decadimento esponenziale si puo’ leggere la lunghezza di correlazione delle possibili eccitazioni. Nel sistema in esame si possono definire due tipi di correlatori: quello ~ A(~ ~ r)i. Si tra i campi di materia hφ(0)φ(~r)i e quello tra i campi di gauge hA(0) puo’ dimostrare che il comportamento asintotico di questi correlatori è lo stesso di quello prodotto dall’effetto dei bordi, cioè r hφ(0)φ(~r)i → ce− ξ , r ~ ~ hÂ(0)Â(~r)i → c′ e− λ . Percio’ lo spettro contiene un singoletto, legato al campo di materia φ, associato ~ di alla lunghezza di correlazione ξ e un tripletto, associato al campo di gauge A, lunghezza di correlazione λ. Vedremo che molte proprietà del sistema dipendono dal rapporto di queste due scale. Si trovano in natura due tipi di superconduttori: • 1) ξ > λ Superconduttore di tipo I: c’è uno schermaggio totale del campo magnetico a B = 0 e un valore critico Bc al di sopra del quale si ha una fase normale con penetrazione completa di B. • 2) ξ < λ Superconduttore di tipo II: schermaggio completo a B = 0, una prima transizione a una fase mista a Bc1 e una seconda transizione a una fase normale a Bc2 , con Bc1 < Bc < Bc2 . La fase mista è caratterizzata dal fatto che il superconduttore ha resistenza nulla ma non è piu’ un perfetto diamagnete: il campo magnetico riesce a penetrare. Per studiare questo comportamento dobbiamo calcolarci la funzione di energia libera di Gibbs. 7.4 Funzione di energia libera di Gibbs L’energia libera di Helmoltz coincide, nell’approssimazione di Landau che stiamo di fatto usando, con l’Hamiltoniana per lo stato fondamentale. Percio’ trascurando 95 gli effetti di bordo si ha, utilizzando il fatto che il valore del potenziale nel minimo è dato da V (φo ) = r4o φ2o , Fnormal = B2 V, 2 Fsuper = ro 2 B2 φo V + V 4 2 ~ è il campo magnetico indotto dal dove V è il volume del superconduttore e B ~ = ~jφ /c dove campo di materia φ, e abbiamo già visto che δF~ = 0 ⇒ ∇ ∧ B δ ~ e2 2 abbiamo posto ~jφ = − c~ 2 φ (x)Â. Introduciamo ora un campo magnetico esterno, che per comodità indichiamo ~ H ~ è associato a una densità di corrente esterna ~jext da con H. ~ = ~jext /c ∇∧H ~ soddisferà l’equazione ⇒ Il campo magnetico totale B ~ = ~jtot /c = (~jφ + ~jext )/c ∇∧B (7.4) Si è già visto (nei sistemi magnetici) che le condizioni di equilibrio in presenza di un campo esterno si ottengono non dalla variazione di F ma dalla variazione dell’energia libera di Gibbs Γ. La definizione di Γ nei sistemi diamagnetici (come i superconduttori) è diversa da quella utilizzata per i sistemi magnetici. E’ immediato verificare che ponendo ~ · HV, ~ Γ=F −B si ha, imponendo δΓ ~ δ F = Hφ + B2 V 2 = 0, δH[φ] δ  ~ −∇∧H ~ =0 +∇∧B che coincide con la (7.4). Quindi Γ puo’ essere considerata l’energia libera di Gibbs Γ ed in condizioni di equilibrio termico è una funzione di T e B.29 ~ =H ~ Nella fase normale (φo = 0) non c’è campo magnetico indotto ⇒ B 29 Nei gas l’energia libera di Gibbs è funzione di T e di P ; nel nostro caso la pressione può essere identificata con l’energia per unità di volume necessaria per espellere il campo magnetico, quindi P = 12 B 2 . 96 Γnormal = H[φ = 0] − B2 V 2 2 = − B2 V Nella fase superconduttrice (φ = φo ) il campo B è completamente schermato ~ = 0, percio’ ⇒B Γsuper = H[φo] = ro 2 φV 4 o 2 = − 32 uroo V Poichè Γ è un potenziale termodinamico che per trasformazioni a T e B costanti è minimo per le configurazioni in equilibrio termico, per valori di T e B sufficientemente piccoli il sistema si troverà nella fase superconduttrice e quindi Γsuper < Γnormal ; la linea di transizione alla fase normale sarà allora data da Γsuper (T, Bcrt ) = Γnormal (T, Bcrt ) , 6 ...................................... ..... ....... ..... ..... . . . .... ... .... ...... T ... . ... .... ... . . ... . ... ... . ... Γ .... ... super > Γnormal . . .... Γsuper < Γnormal ....... . ... ... .. ... normal .. ... .... ... ... supercond. ... . .. B Dall’equazione precedente si ha Γsuper = − 2 Bcrt =− 2 Bcrt V 2 ro 2 3ro2 φ = ∝ (Tc − T )2 2 o uo Sperimentalmente si osserva " Bcrt = Bo 1 − 97 T Tc 2 # (7.5) La predizione teorica di Landau -Ginzburg è in accordo con la legge sperimentale solo per T ∼ Tc . 7.5 La fase mista La trattazione precedente non tiene in considerazione gli effetti di bordo e delle fluttuazioni del campo φ. Questa approssimazione è giustificata nei superconduttori di tipo I, in cui quando φ ha raggiunto il suo valore asintotico φo , il campo B è già completamente schermato: 6 B φ 6 ... ... ... ................... ... .................. .................. ... . . . . . . . . . . . . . . . . .... ............. ............ ................ . . . . . ........... . . . . . ................ .. ............................. ..... .............. ... B φ - .... .... ..... ..... ...... ............... ......................................................................... ..... ........ . . . . . . ....... .... ....... ..... ........ .... . ......... . . ............... .... ........................... .. ..... ... r r Tipo I Tipo II Nei superconduttori di tipo II bisogna tener conto degli effetti di bordo, perchè le regioni del conduttore in cui per effetto di fluttuazioni statistiche si sviluppa una fase normale (φ ∼ 0) possono essere circondate da un alone in cui il campo magnetico puo’ penetrare; questo alone è nella fase mista. In particolare consideriamo un superconduttore a forma di parallelepipedo, immerso in un campo magnetico perpendicolare a due facce opposte . In queste condizioni acquistano particolare importanza quelle fluttuazioni statistiche del campo φ che formano dei filamenti che attraversano il superconduttore lungo cui φ ∼ 0. Attorno a tali filamenti si forma un alone di campo magnetico non nullo. Per un valore sufficientemente grande Bc1 di B questi filamenti accompagnati dai rispettivi aloni possono diventare le configurazioni di equilibrio stabile. Queste configurazioni sono note come vortici di Abrikosov; la loro struttura microscopica sarà descritta nel § successivo. In queste condizioni il superconduttore si può riempire di questi filamenti e tutto il sistema transisce nella fase mista. Per valutare approssimativamente il valore Bc1 di transizione dalla fase superconduttrice alla fase mista, consideriamo un cilindro superconduttore di base S = πR2 e altezza L con un piccolo canale lungo l’asse di simmetria lungo cui puo’ penetrare un campo magnetico questo canale rappresenta il filamento lungo cui φ = 0: 98 - ← λ→ ....................................... ....... ............ ...... ...... . . . . .... ... .... .. ... ... ... ... . . . . . . . .......... ............... . . . . ... .... .. ......................... ..... . . . .... .. . .. ... ... ... .... .... .... ... .. ξ . .. . . . t ...... ...... -..... ... ... .... .. ... HH . .. ... ... ... j ... .. R..... ... ..... ... .... ......... ............. ...... ...... ..... ..... ... ........................... λ .. ... ... . .... . .. ..... .... ...... ...... ........ . . . . . . .. ............... .............................. 6 L ? ξ posto Γ = γV = γSL dove γ denota la densità di energia libera, si ha, per la fase mista Γmix = Lγsuper (S − πξ 2) + Lγnormal πλ2 B2 2 dove γnormal = − B2 e γsuper = − 2crt Il valore critico Bc1 di transizione dalla fase superc. alla fase mista è dato dall’eq. Γmix (T, Bc1 ) = Γsuper (T, Bc1 ) (7.6) ξ Bcrt < Bcrt λ Il rapporto χ = λξ è detto parametro di L − G. L’equazione (7.6) esprime la condizione per cui una fluttuazione del mezzo verso una fase mista è in equilibrio termico con la fase superconduttrice. Poichè Bc1 deve essere minore di Bcrt (altrimenti il sistema è già passato nella fase normale) si ha transizione alla fase mista se χ > 1. Per valutare approssimativamente il valore Bc2 del campo necessario per la transizione dallo stato misto a quello normale conviene fare qualche approssimazione delle eq. di equilibrio (7.2, 7.3): ( ~ ~ + e2 2 φ2  =0 rotB (~c) 2 ⇒ ξ 2 Bcrt − λ2 Bc21 = 0, Bc1 = −∆φ + e2 Â2 φ (~c)2 + dV dφ =0 Se il sistema è nella fase mista e prossimo a transire nella fase normale, φ è vicino a zero e quindi possiamo trascurare il termine φ4 del potenziale. D’altra parte in queste condizioni il campo magnetico può penetrare in tutto il conduttore e quindi ~ costante. Consideriamo quindi un corpo superconduttore possiamo considerare B ~ costante a simmetria cilindrica nella fase mista immerso in un campo magnetico B ~ orientato lungo l’asse z del cilindro. Allora A si puo’ scegliere come un campo tangenziale nel piano x, y: 99 y 6 ~ '$ I A @ @ i -Ai = x &% −y 0 B ~ ~ x ⇒ ∇ ∧ A = B = 0 2 0 B L’equazione per il campo φ diventa −∆φ + e2 B 2 2 (x + y 2)φ = −ro φ (~c)2 4 Questa equazione puo’ essere letta come l’equazione di Schrödinger stazionaria Hφ = Eφ per un oscillatore armonico bidimensionale di Hamiltoniana H= mω 2 r 2 −~2 ∆ mω 2 r 2 P2 + = + 2m 2 2m 2 con eB −~2 ro , E= . 2mc 2m Questo sistema ha due tipi di soluzione: o φ = 0 (fase normale), o φ 6= 0 (fase mista) e E = ~ω(n1 + 12 + n2 + 12 )) = ~ωn con n = 1, 2, . . . . Scrivendo l’espressione esplicita di ω si ottiene un vincolo sui valori permessi del campo B: ~c Bn = −ro ne . Quindi il valore massimo permesso per il campo B è B1 = −ro ~c che posq e siamo identificare con Bc2 . Dall’eq. (7.5) si ha Bcrt = −ro u3o , e poichè p , possiamo scrivere Bc2 = χBcrt . χ ≡ λξ = u3o ~c e In conclusione, nei superconduttori di tipo II (χ > 1) esiste una fase (detta fase mista) in cui il sistema, pur essendo superconduttore (φ 6= 0), non è un perfetto diamagnete. Questa fase è caratterizzata dalla comparsa di ”difetti” in cui il campo magnetico puo’ penetrare. La fase mista compare in presenza di campi magnetici compresi tra Bc1 e Bc2 , con q Bc1 = χ1 Bcrt , Bc2 = χBcrt , χ = λξ , Bcrt = −ro u3o ω= dove Bcrt è il campo critico di transizione dalla fase superconduttrice alla fase normale. 100 7.6 Vortici di Abrikosov I vortici di Abrikosov possono essere considerati delle configurazioni di equilibrio di energia finita (rispetto all’energia dello stato fondamentale). Una soluzione a energia finita (detta anche solitoneRdel modello di L − G deve 2 soddisfare le condizioni Hψ − Hφo < ∞ e He.m. = d3 x B2 < ∞, quindi per 3 ogni coordinata x → ∞ si ha B 2 = o(x−3 ), ossia B = o(x− 2 ) 1 1 ~ = puro gauge + o(x− 2 ) = ∇ω + o(x− 2 ) ⇒A Analogamente per il campo di materia si ha 3 V (ψ) − V (φo ) = o(x−3 ) ⇒ ψ = φo eiθ(x) + o(x− 2 ) Consideriamo ora una sezione piana del nostro sistema. Prendendo in questo piano un cerchio C(R) di raggio R molto grande, non essendoci nessuna direzione privilegiata, la fase θ(x) dipenderà solo dall’angolo α di un sistema di coordinate polari ρ, α, perciò poniamo θ = θ(α) e quindi 3 ψ = ψ(θ) + o(x− 2 ) . Il comportamento all’∞ del campo ψ stabilisce una mappa α → θ tra il cerchio all’infinito e la fase θ. Poichè ψ è a un sol valore, ⇒ ψ(α) = ψ(α + 2π) ⇒ θ(α + 2π) = 2nπ + θ(α) possiamo in generale porre θ(α) = nα + β(α), con n = 0, ±1, ±2, . . . e β(α + 2π) = β(α) è una funzione periodica regolare. Se n 6= 0 e ψ non è singolare (come deve essere se l’energia è finita) esiste almeno un punto, nel piano in cui giace il cerchio C(R), per cui ψ si annulla; infatti al variare del raggio R, n non puo’ cambiare se ψ è una f. continua e quindi, riducendo il raggio di questo cerchio c’è almeno un punto in cui la fase di ψ non puo’ essere definita e percio’ in quel punto ψ si annulla (esempio: ψ = (x + iy)2 = rei2α ⇒ n = 2 e ψ(0) = 0). Il punto (o i punti) in cui ψ = 0 rappresenta(no) l’intersezione dei filamenti di cui si è parlato nel § precedente con la sezione piana in esame. Il numero intero n è un invariante topologico: nessuna deformazione continua puo’ modificare n, percio’ le fluttuazioni del parametro d’ordine ψ non possono alterare n. Se n 6= 0 c’è qualche problema col gauge unitario, perchè partendo da ~ regolare, il potenziale trasformato un potenziale A ~′ = A ~ − n ~c ∇α A e 101 è singolare nell’origine, dove α è indeterminato. Solo la parte regolare β(α) della fase θ puo’ essere assorbita da una trasformazione di gauge. Poichè il caso n 6= 0 non puo’ essere trattato nel gauge unitario, dobbiamo utilizzare le equazioni di equilibrio (7.2) e (7.3) nella loro forma piu’ generale, cioè gauge invariante: 2 dV ie ~ =0 (7.7) − ∇+ A ψ+ ~c dψ ∗ ~ = − e ℑm(ψ ∗ Dψ) ~ ∇∧B (7.8) ~c Quest’ultima equazione fornisce un legame, nella soluz. a energia finita, tra la ~ che compare nella forma fase θ del campo ψ e il parametro ω del potenziale A asintotica ~ = ∇ω + o(r − 21 ) A ~ = o(x− 52 ), inoltre poichè sappiamo che per x → ∞ ∇ ∧ B 1 ie ~ e ∗~ −iθ(x) ∇ + A φo eiθ(x) = i |ψ|2∇ θ(x) + ω(x) + o(x− 2 ) . ψ Dψ → φo e ~c ~c 5 Poichè il I membro dell’eq.(7.8) è o(x− 2 ), ci deve essere una cancellazione tra il primo e il secondo termine, cioè 1 e ∇ θ(x) + ω(x) = o(x− 2 ) ~c 1 ∇θ(x) + o(x− 2 ) ossia ∇ω(x) = − ~c e ~ A(x) → − ~c ∇θ(x) e ⇒ ψ(x) → φo eiθ(x) Quindi I C(R) ~ A(x) · d~l ≡ Z Z ~ · dΣ = − ~c (θ(2π) − θ(0)) = − hc n B e e Σ ⇒ Il flusso del campo magnetico è quantizzato. E’ importante notare che all’infinito non c’è campo magnetico, ma il numero quantico n 6= 0 contiene l’informazione 102 che da qualche parte al finito c’è un campo magnetico non nullo. Queste configurazioni sono appunto i vortici di Abrikosov. Sperimentalmente si osservano questi vortici con un valore minimo del flusso magnetico corrispondente a ~c , 2q dove q è la carica elettrica di un elettrone. Questo conferma che il campo ψ che stiamo studiando descrive eccitazioni di carica e = 2q corrispondenti alle coppie di Cooper. Il fatto che il flusso magnetico nei superconduttori sia quantizzato ha una importante conseguenza di carattere generale. Supponiamo che da qualche parte nell’universo ci sia un monopolo magnetico di carica g, cioe’ il flusso magnetico R ~ · uscente da qualunque superficie chiusa Σ contenente questo monopolo è B ~ = g. L’esistenza in natura dei superconduttori implica che g non puo’ essere dΣ arbitrario. Infatti, se supponiamo di immergere il monopolo in un superconduttore, il flusso magnetico uscente da dal monopolo è necessariamente suddiviso in uno o più vortici di Abrikosov ed è quindi quantizzato: ⇒ g= u hc n e g flusso magnetico Vedremo nel prossimo § una derivazione più generale e una discussione di questa celebre relazione, nota come condizione di quantizzazione di Dirac. Vediamo ora di studiare in dettaglio la soluzione delle equazioni del moto corrispondente a un vortice di Abrikosov a simmetria cilindrica, posto lungo l’asse z di un sistema di assi cartesiani. A causa della simmetria cilindrica il modulo del campo p di materia |ψ| e il ~ campo magnetico B sono solo funzioni della distanza r = x2 + y 2 dall’asse di simmetria. Possiamo percio’ scrivere ψ(~x) = φ(r)eiθ(~x) , dove lim θ(~x) = nα . r→∞ Poichè per ipotesi θ è definita ovunque nel piano x, y, tranne che nell’origine, dove c’è il centro del vortice, e quindi φ(0) = 0 , 103 possiamo scrivere θ(~x) = nα + β(~x) dove β è una funzione regolare ovunque. Possiamo allora sceglere un gauge che riassorba la funzione β e quindi in definitiva possiamo parametrizzare ovunque il campo ψ nella forma ψ(~x) = φ(r) einα . ~ = ~k B(r) si può scegliere Analogamente, per riprodurre un campo magnetico B ~ = ~tA(r) , A dove ~t è il versore tangenziale che abbiamo già introdotto in diverse occasioni: y −r ~t = x = r ∇α . r 0 ~ di questa forma soddisfa automaticaE‘ immediato verificare che un campo A mente il gauge di Coulomb: ~ =0. ∇·A Poniamo n~c (F (r) − 1), er ~ → − ~c n∇α. dove la f. incognita F (r) si deve annullare all’infinito affinche’ A e Inoltre, poichè il versore ~t non è definito nell’origine, li deve annularsi A(r). Quindi F (r) soddisfa le due condizioni ai bordi: A(r) = F (0) = 1 , Si ha ~i ~ ≡∇∧A ~ = ∂x B − yr A(r) lim F (r) = 0 . r→∞ ~k ~j 1 d (rA(r)) ∂y ∂z = ~k r dr x A(r) 0 r ~ = ~kB(r), B(r) = n~c F ′ (r) ⇒B er e ∗ ~ = − ℑm ψ (∇+ ie A)ψ ~ si semplifica notevolLa condizione di equilibrio ∇∧ B ~c ~c mente utilizzando le identità seguenti ′ F ~c d d ~ ∇ ∧ B = −~t B(r) = −n ~t dr e dr r 104 D’altra parte ~t inF ie ~ ~ ~ φeinα + einα ∇φ(r) Dψ = ∇ + A ψ = in∇α − in + t ~c r r nF 2~ ∗~ ∗ inF ~ ⇒ ℑm ψ Dψ = ℑm ψ φt tψ = r r Percio’ la condizione di equilibrio per F diventa F ′′ − F′ r − e2 φ2 (r)F (~c)2 (7.9) =0 Poiche’ per r → ∞ φ → φo risolviamo l’equazione in forma asintotica F ′′ − √ ponendo F (r) = G(r) r si ha G′′ − F′ e2 − 2 φ2o F = 0 r ~c e2 2 3 φo G − 2 G = 0 . 2 (~c) 4r Sarebbe facile verificare che la soluzione generale di questa equazione è esprimibile in termini di funzioni di Bessel di argomento immaginario. Nel limite r → ∞ l’equazione si semplifica ulteriormente: G′′ − percio’ G = ce−r eφo ~c e2 φ2o G≃0, (~c)2 √ r ⇒ F (r) → c re− λ , dove al solito λ denota la lunghezza di penetrazione. Studiamo ora la condizione di stabilità del campo ψ: 2 dV ie ~ = 0. ∇+ A ψ− ~c dψ Utilizzando la (7.9) si ha, sfruttando il fatto che ∇f (r) · ∇α = 0, ie ∇ + A(r)~t · einα ∇φ(r) + i~tnF (r)ψ ~c 105 n2 F n2 △φ − F φ + (1 − F ) φ =e r r r 2 d tenendo inoltre conto che in coordinate polari ∆f (r) = dr 2 + ottiene: inα φ′′ + 1r φ′ − n2 F 2 φ r2 − dV dφ 1 d r dr f (r) , si =0 dove al solito dV = ro φ + u6o φ3 . dφ Nell’intorno dell’origine, essendo φ regolare (config. a energia finita) ⇒ 2 2 2 φ(r) = φ(0) + φ′ (0)r + φ′′ (0) r2 , . . . se φ(0) 6= 0 il termine n rF2 φ diverge per r → 0 ⇒ φ(0) = 0 ⇒ φ(r) = cr µ + . . . . Poiche’ F (0) = 1 ⇒ (µ(µ − 1) + µ − n2 )cr µ−2 + O(r µ−1 ) = 0 ⇒ µ = |n| : il campo di Higgs φ(r) ha uno zero di ordine |n| sull’asse del vortice. Inserendo nell’eq. per F il ′ suo sviluppo di Taylor nell’intorno dell’origine si vede che affinche’ Fr (e quindi ~ non diverga F ′ |r=0 = 0, ⇒ F (r) = 1 + O(r 2) Quindi B) B= n~c ′′ F (0) + O(r) e (r → 0). 6 B ............................. ............. ................................... ..... . . φ ............. . .......... ....... ........ ... ... ..... ........ ..... ..... . . . . ....... ..... ......... . . . . . ............ ..... . ................ . . . . . . . . . ............................ . . . . . .......... - r 7.7 Confinamento dei monopoli magnetici Il centro dei vortici di Abrikosov si comporta come un conduttore normale :φ(0) = 0 e B(0) 6= 0. Poiche’ la configurazione di un vortice differisce dal vuoto in una regione a forma cilindrica di raggio ∼ λ, l’energia del vortice e’ proporzionale alla sua lunghezza. Se esistono in natura monopoli magnetici, c’è un’importante conseguenza di questa proprietà. Il campo magnetico generato nel vuoto da una coppia monopolo anti-monopolo ha esattamente la stessa forma del campo elettrico 106 generato da una coppia di cariche, quindi l’energia potenziale V (R) tra questa 2 coppia di monopoli è di tipo Coulombiano: V (R) = − gR . Supponiamo ora di immergere questa coppia monopolo-antimonopolo in un superconduttore. La distribuzione del campo cambia drasticamente e tutto il flusso magnetico è concentrato in un vortice di Abrikosov che congiunge i due monopoli: vuoto.................................ordinario ...... . g ..... . .... .... .... ... .... ... ... ... . . . . . . . . . . . . . . . . . . ... . . . . . . .. .. .......... ..... ... ...... ... .......... . ..... .. . ..... . ..... ..... .... ... .... ..... .... .. .. ..... .... ... ... ... .... ... .... .. .. .. ....... .. .. .. .. . ............................................................. ....... ............................. ................ .......... ............. .... ................ ......... ......... ...................... . . . ..... ............. . . . . . . . . . . . .... .................. .... ..... ..................................................................... .... ....... . .. ... . . ... .. ... .. ... .... .... .. .... .. ... .... .... .. ... ..... .... .... . . ... ..... . ... ...... ...... ..... ..... ....... . ... ........................................ ... ... ... ... .... ... ... . .... . . .... ... ..... .... ........ ...... ..................... u superconduttore e u -g e Quindi l’energia potenziale della coppia di monopoli in un superconduttore è proporzionale alla loro distanza : V (R) = σR, dove σ è l’energia per unità di lunghezza del vortice di Abrikosov. In queste condizioni la coppia di monopoli rimane permamente legata : ci vorrebbe un’energia infinita per allontanarli all’infinito. questa è la proprietà di confinamento dei monopoli magnetici in un superconduttore. Oggi si hanno buone ragioni per ritenere che un meccanismo analogo valga per i quark (cioè i costituenti elementari dei nucleoni e dei mesoni) nel vuoto ordinario, in quanto l’energia di una coppia di quark è proporzionale alla distanza. Nei superconduttori ordinari il confinamento dei monopoli è prodotto dalla condensazione delle coppie di Cooper. Si ritiene che nella Cromodinamica quantistica (che è la teoria che descrive le interazioni dei quark) il confinamento dei quark sia dovuto alla condensazione dei monopoli magnetici. 107 8 Effetti topologici in elettrodinamica In elettrodinamica classica la conoscenza di Fµν determina completamente le proprieta’ del campo elettromagnetico. Il potenziale Aµ ha il ruolo di uno strumento comodo per semplificare il formalismo, ma non e’ una quantita’ misurabile, perche’ non e’ invariante rispetto alle trasformazioni di gauge. Abbiamo visto che questa affermazione non e’ piu’ del tutto vera nei sistemi quantistici: i vortici di Abrikosov mostrano che e’ possibile estrarre delle informazioni fisiche sul campo elettromagnetico anche da regioni in cui Fµν = 0. Infatti a grande distanza dal vortice di Abrikosov si ha Fµν = 0, quindi il sistema e’ nel vuoto elettromagnetico, ma per ogni cammino chiuso γ concatenato con il vortice si ha I ~ · d~l = hc n A e γ e quindi si ha un’informazione fisica (cioe’ invariante di gauge); questo e’ dovuto al fatto che esistono configurazioni di gauge corrispondenti al puro vuoto Fµν = 0 ~ = ∇θ del § precedente) che per ragioni topologiche non possono essere ( come A ricondotte con trasformazioni di gauge non singolari nella configurazione banale Aµ ≡ 0. In conclusione, la conoscenza di Fµν non e’ sufficiente, nelle teorie quantistiche, a caratterizzare il comportamento del sistema. Una conseguenza sperimentalmente ossevabile di queste considerazioni e’ l’effetto Aharonov-Bohm. Vedremo infatti che non e’ necessario ricorrere alla superconduttivita’ per sco~ prire effetti osservabili legati a A. 8.1 Effetto Aharonov-Bohm Premessa: se ψo (x) e’ la f. d’onda che descrive un elettrone in assenza di campo elettromagnetico, quella che descrive l’elettrone in interazione col campo e’ data da Rx e ~ ~ ψ(x) = e−i ~c γ A·dl ψo (x) (8.1) dove γ e’ un cammino qualsiasi che congiunge il punto x a un punto all’infinito. È infatti facile da verificare che una trasformazione di gauge sul potenziale ~→A ~′ = A ~ + ∇ω A induce la corretta trasfomazione di fase su ψ: e ψ → ψ ′ = e−i ~c ω ψ ; 108 inoltre la derivata ordinaria di ψo si trasforma nella derivata covariante: e e−i ~c Rx γ ~ ~l A·d ∇ ψo (x) = {∇ + i e ~ A}ψ(x) ~c Una deformazione di γ (γ → γ + δγ) genera una variazione della fase di ψ pari a I e ~ · d~l . δθ = A ~c δγ Nel vuoto banale, cioè in una regione semplicemente connessa in cui B ≡ 0 si ha ovviamente δθ = 0. Consideriamo la propagazione di un fascio di elettroni intorno a un sottile ~ parsolenoide rettilineo di sezione di area Σ in cui ci sia un campo magnetico B allelo al solenoide che genera un flusso Φ = BΣ. Fuori dal solenoide il campo e’ nullo. Poiche’ la regione in cui si propagano gli elettroni non e’ semplicemente connessa, i cammini γ si dividono in due classi di omotopia distinte, a seconda se passano a sinistra o a destra del solenoide: γ ...................................................................................................... ...................................... ........................................ ............................... .................. ............................ ............. ........................... ........ . . . . .............. .... ................. .. .................. .... ................... ..... .................... ...... ..................... ...... ′ ........................ . . . . . . . . . .. ........................... .................................... ............... ................................................................................................. Σm γ Cammini appartenenti a classi distinte generano una differenza di fase I e ~ · d~l = e BΣ . δθ = A ~c δγ ~c Se δθ 6= 2nπ si formano delle frange di interferenza previste da Aharonov e Bohm nel 1959 e osservate sperimentalmente nel 1962. Questo effetto dimostra che il potenziale elettromagnetico produce degli effetti osservabili anche quando il campo elettromagnetico e’ nullo. 8.2 Dualita’ elettromagnetica Le equazioni di Maxwell nel vuoto ~ =0 , ∇·B ~ =0 , ∇·E 109 ~ ~ ~ − ∂E = 0 , ∇ ∧ E ~ + ∂B = 0 , ∇∧B c∂t c∂t non sono solo invarianti, come è noto, per trasformazioni di Lorentz. Sono anche invarianti per trasformazioni di dualità: ~ → cos α E ~ + sin α B ~ , E ~ → cos α B ~ − sin α E ~. B In particolare, se poniamo α = π2 , otteniamo la trasformazione discreta di dualità ~ →B ~ , B ~ → −E ~. E ~ + iB ~ la trasformazione di dualità si puo’ Introducendo il vettore complesso E scrivere in forma più compatta −α ~ ~ ~ ~ E + iB . E + iB → e Notare che la densità di energia E e di impulso ℘ del campo elettromagnetico, che si possono scrivere nella forma ∗ 1 ~ ~ + iB ~ ∧ E ~ 2 = 1 E2 + B2 , ℘ = 1 E ~ + iB ~ =E ~ ∧B ~, + iB| E = |E 2 2 2i sono invarianti per trasformazioni di dualità. La simmetria per dualità delle equazioni di Maxwell viene distrutta quando si accende l’interazione aggiungendo alle equazioni la densità di carica elettrica ρe e la relativa densità di corrente ~je . Se si volesse preservare questa simmetria occorrerebbe introdurre parallelamente una densità di carica e di corrente magnetica ρm e ~jm . Le equazioni di Maxwell diventerebbero allora ~ ~ ∇ · E + iB = ρe + iρm , ~ + iB ~ = 1 ~je + i~jm , ~ + iB ~ − ∂ E −i∇ ∧ E c∂t c e sono ancora invarianti per dualità, purchè le densità si trasformino nel modo seguente ρe + iρm → e−iα (ρe + iρm ) , ~je + i~jm → e−iα ~je + i~jm . 110 Nella trattazione usuale dell’elettromagnetismo questa formulazione più simmetrica non la si fa per la buona ragione che i monopoli magnetici non sono (ancora) stati osservati in natura.. Non c’ è però nessuna ostruzione concettuale che permetta di concludere che i monopoli magnetici non possono esistere. Anzi, come vedremo, la loro esistenza consentirebbe di spiegare (Dirac, 1931) in maniera semplice il fatto sperimentale che la carica elettrica di ogni particella è un multiplo intero di quella dell’elettrone. Vedremo che una teoria con cariche elettriche e magnetiche è quantisticamente consistente solo se vale la condizione di quantizzazione di Dirac eg = 2πn. Questa relazione non è invariante rispetto alla più ~c ~ → B, ~ generale trasformazione di dualità, ma solo rispetto alla dualità discreta E ~ → −E, ~ che implica B e → g , g → −e . 8.3 Derivazione semiclassica della condizione di quantizzazione di Dirac Consideriamo una particella classica puntiforme di massa m e carica e immersa nel campo magnetico generato da un monopolo puntiforme di carica g (perciò ~ = g ~r3 ). L’equazione del moto è B 4π r ge ˙ ~r˙ ~ d2 = ~r ∧ ~r . m 2 ~r = e ∧ B dt c 4πcr 3 La variazione di momento angolare è d2~r eg d ˙ ∧ ~r , ~r ∧ m~r˙ = m~r ∧ 2 = ~ r ∧ ~ r dt dt 4πcr 3 quindi, nonostante il sistema sia soggetto a una forza centrale il momento angolare orbitale non è conservato. Tuttavia, poichè ~r˙ ṙ d ~r 1 ˙ , ~r ∧ ~r ∧ ~r = − ~r 2 = r3 r r dt r si ha che il momento angolare totale conservato è eg ~r ~r ∧ m~r˙ − 4cπ r 111 C’è quindi un contributo del momento angolare totale lungo la congiungente delle due particelle. Essendo il momento angolare quantizzato in multipli interi o semiinteri di ~ si ha n eg = ~ 4cπ 2 che è nuovamente la condizione di quantizzazione di Dirac. 30 8.4 Derivazione di Dirac Supponiamo di deformare il cammino γ dell’eq.(8.1) del § 8.1 , tenendo fissi i punti x e ∞, facendo descrivere a γ una superficie chiusa Σ. Quando γ torna nella posizione di partenza, la variazione δθ della fase di ψ(x) deve essere un multiplo intero di 2π perche’ ψ(x) e’ a un sol valore. Z Z e ~ · dΣ ~ = ΦΣ (B) e = 2nπ B ⇒ δθ = ~c ~c Σ ~ = 0, il flusso di B ~ attraverso In base alle equazioni di Maxwell, poiche’ div B ogni superficie chiusa e’ nullo. Se pero’ ci fosse all’interno di Σ un monopolo magnetico di carica g si avrebbe g = ΦΣ (B) = eg = 2πn, che e’ la condizione ~c di quantizzazione della carica magnetica di Dirac (1931). E’ sufficiente che in un punto qualunque dell’universo ci sia un monopolo magnetico di carica g per assicurare, in base al ragionamento precedente, che la carica elettrica di ogni par. Se in natura esistono particelle di ticella deve essere un multiplo intero di hc g carica elettrica ei (i = 1, 2 . . . ) e monopoli di carica magnetica gj (j = 1, 2, . . . ), ogni coppia carica - monopolo soddisfa la condizione ei gj = nij , hc dove nij è un opportuno intero. Quindi ogni carica elettrica è un multiplo intero di hc . Per un dato gj sia noj il massimo comun divisore di n1j , n2j , . . . Allora ogni gj Questa e’ una carica elettrica è un multiplo della carica elementare eo = noj hc gj spiegazione semplice e generale della quantizzazione della carica elettrica. In questa formulazione elementare le cariche elettriche e magnetiche sono trattati come particelle puntiformi che sono introdotte a mano nella teoria. E’ da notare pero’ che esistono delle teorie di campo che sono semplici generalizzazioni 30 E’ curioso che per riprodurre questa condizione sia necessario ricorrere anche ai multipli semi-interi di ~, come se il sistema monopolo-carica elettrica fosse un fermione. 112 non- abeliane del modello di Landau-Ginzburg della superconduttività, utilizzate per descrivere le interazioni fondamentali delle particelle elementari, in cui necessariamente esistono delle soluzioni a energia finita che sono identificabili come monopoli magnetici dotati di una struttura interna e di una massa finita (monopolo di ’t Hooft- Polyakov, 1974), quindi l’ipotesi di esistenza di monopoli magnetici in natura non solo non è contraddittoria, ma esistono modelli delle interazioni fondamentali che la richiedono. 8.5 Stringa di Dirac Mostriamo ora che la presenza di un monopolo magnetico genera necessariamente ~ e che la forma minimale di questa una singolarita’ non fisica nel potenziale A singolarità è una linea continua di forma arbitraria che congiunge il monopolo magnetico all’infinito. ~ regolare in ogni regione semplicemente connessa31 È noto che esiste un campo A ~ non è singolare e ∇ · B ~ = 0 . Supponiamo che ci sia un dello spazio in cui B monopolo magnetico puntiforme di carica g nell’origine di un sistema di riferimento cartesiano. Il campo magnetico da esso generato avrà la forma a simmetria radiale seguente ~ mono = g ~r . B 4π r 3 Si ha ∇ · Bmono = gδ (3) (~r) e quindi la regione senza cariche magnetiche non è semplicemente connessa; se però escludiamo dalla regione una linea continua qualunque Γ che congiunga il monopolo all’infinito, la regione rimanente è sem~ è ivi regolare. Facciamo ora vedere che A ~ è necesplicemente connessa e quindi A sariamente singolare su Γ. Consideriamo una sfera S2 di raggio arbitrario centrata sul monopolo e supponiamo che Γ intersechi la sfera nel polo Sud; consideriamo ora una calotta Nord di questa sfera di area Σ il cui bordo sia un parallelo γ. Il flusso magnetico uscente dalla calotta ΦΣ è ovviamente proporzionale all’angolo solido Ω del cono con vertice sul monopolo e base sulla calotta I g ~ · d~l ΦΣ = Ω= A 4π γ Ampliamo ora la calotta facendo scorrere γ sulla famiglia di paralleli da Nord a Sud. Quando γ si riduce a un cerchiolino infinitesimo ε attorno al polo Sud, la 31 Cioè una regione in cui ogni superficie chiusa si puo’ deformare con continuità in un punto senza uscirne fuori. 113 H ~ · d~l = g. Un superficie Σ coincide con la sfera bucata, quindi Ω = 4π e ε A integrale finito lungo un cammino infinitesimo implica che la funzione integranda ~ è singolare su Γ. Questa è una singolarità non fisica, perchè sia singolare, quindi A ~ mono su Γ è regolare. Non è quindi possibile costruire un A ~ mono ben definito e B ~ mono = ∇ ∧ A ~ mono anche su Γ. tale che valga la relazione B Vediamo ora un modo concreto per trattare questa singolarita’. Si puo’ pensare di realizzare un monopolo magnetico supponendo che esso sia il polo di un sottilissimo solenoide filiforme, detto stringa di Dirac, che dalla posizione del monopolo raggiunga un punto all’infinito sovrapponendosi alla curva Γ. Il flusso magnetico che scorre nel solenoide è I ~ · d~l = g Φ= A γ dove γ è un circuito microscopico concatenato ad esso. Questa linea corrisponde ~ ed è quindi una singolarità fisica, ma se il solenoide è a una singolarita’ di B infinitamente sottile non c’è, per lo meno dal punto di vista della fisica classica, nessun modo operativo per osservarla sperimentalmente. Supponendo che la stringa di Dirac sia diretta lungo il semiasse z negativo, la ~ generata dalla stringa si può scrivere nella forma singolarità in B ~ string = Bstring~k = gθ(−z)δ(x)δ(y)~k B da cui si ha subito32 ~ string = ∂ Bstring = −g δ (3) (~x) , ∇·B ∂z ~ =B ~ mono + B ~ string è solenoidale (cioè ∇· B ~ = perciò il campo magnetico totale B ~ regolare corrispondente 0 ovunque) ed è quindi possibile costruire un potenziale A ~ = ∇∧A ~ ovunque.33 Viceversa non al sistema monopolo-solenoide tale che B ~ string . può esistere nessun potenziale il cui rotore riproduca unicamente il campo B 34 ( ) Quindi d θ(t) = δ(t). Utilizzando la nota proprietà dt 33 ~ ~ lo è. Naturalmente A è singolare dove anche B 34 Se invece il solenoide filiforme occupasse tutto l’asse z o, più in generale un qualsiasi cam~ In particolare, se mino Γ senza estremi, il campo del solenoide è dato dal rotore di un opportuno A. Γ coincide con tutto l’asse z, utilizzando le considerazioni già sviluppate nella trattazione dei vor~ string = ∇ ∧ A ~ sing , con A ~ sing = g ∇α, tici dell’elio superfluido o di Abrikosov, si ha che che B 2π dove α è l’angolo di un sistema di coordinate cilindriche il cui asse coincide con l’asse z. 32 114 ~ mono = ∇ ∧ A − gθ(−z)δ(y)δ(x)~k B 6 @ I @ @s @ @ R @ ? = 6 @ I @ @s @ @ R @ - È importante notare che la stringa di Dirac ha come unico ruolo di cancellare la singolarità del potenziale e non deve produrre effetti fisicamente osservabili. Quindi il sistema monopolo-stringa di Dirac deve essere fisicamente indistinguibile da quello con il solo monopolo. Di conseguenza lo sfasamento δθ prodotto dall’effetto di Aharonov-Bohm (v. § 8.1) attorno alla stringa di Dirac deve essere un multiplo intero di 2π: I e ~ · d~l = e g = 2nπ , A δθ = ~c γ ~c si ritrova cosı́ la condizione di quantizzazione di Dirac. La forma Γ della stringa di Dirac può essere chiaramente scelta ad arbitrio. Facciamo vedere che due configurazioni che differiscono per la scelta della stringa ~ ~ mono + B ~ str (Γ) di Dirac sono legate da una trasformazione di gauge: se B(Γ) =B ′ ′ ~ )=B ~ mono + B ~ str (Γ ) sono i campi magnetici prodotti da due diverse cone B(Γ ~ ~ ′) = B ~ str (Γ) − figurazioni della stringa di Dirac, la loro differenza è B(Γ) − B(Γ ~ str (Γ′ ) = ∇∧ A ~ sing , dove A ~ sing è il gradiente di una variabile angolare ( 34 ) che è B singolare solo sul cammino senza estremi ΓΓ′−1 , quindi queste due configurazioni differiscono per una trasformazione di gauge (singolare). 115