Interazioni col campo elettromagnetico 1 La sostituzione minimale Classicamente, l’equazione del moto di una particella con carica q in un campo elettromagnetico (e.m.) è data da1 : (1) mẍ = q E + q ẋ ∧ B, c che rappresenta l’equazione fondamentale dell’elettrodinamica classica. Come è noto, questa si può ricavare come equazione di Lagrange, partendo dalla lagrangiana (2) 1 q L = mẋ2 + ẋ·A − q φ, 2 c dove A e φ sono i potenziali e.m. Dalla (2) si ricava il momento coniugato rispetto a x, che risulta: q p = mẋ + A. c (3) È importante osservare che il momento p, che chiameremo momento canonico, differisce dal momento cinematico mẋ. Dalle (2) e (3) si ottiene poi la hamiltoniana (4) H= q 2 1 p − A + qφ. 2m c Dobbiamo fare due osservazioni importanti. La prima è che, mentre nell’equazione classica (1) compaiono i campi E e B, nella hamiltoniana H —e quindi poi nell’equazione di Schrödinger— compaiono i potenziali A e φ. Questo fatto, in particolare, rende non banale l’invarianza di gauge. La seconda osservazione è che la hamiltoniana (4) si può ottenere da quella in assenza di campo H = p2 /2m con le sostituzioni2 (5) p → p − (q/c)A, H → H − qφ. Nel formalismo quadridimensionale relativistico le (5) si scrivono più sinteticamente nella forma pµ → pµ − (q/c)Aµ , dove p0 = E/c = H/c. Questa sostituzione prende il nome di sostituzione minimale e l’interazione col campo e.m. che nasce in generale facendo questa sostituzione nella hamiltoniana viene chiamata interazione minimale. 1 Useremo il sistema gaussiano di unità di misura, identificando in particolare (nel vuoto) il campo magnetico H col campo d’induzione B. 2 Osserviamo che le sostituzioni (5) lasciano le due espressioni invariate in valore, pari rispettivamente a mẋ e 1 mẋ2 . 2 1 2 La hamiltoniana Passando alla meccanica quantistica, consideriamo la hamiltoniana più generale (6) H = = q 2 1 p − A + qφ + V − µs ·B 2m c q q2 p2 +V − (p·A + A·p) + A2 + qφ − µs ·B, 2m 2mc 2mc2 dove si sono aggiunti alla (4) un generico potenziale V e l’interazione magnetica di spin. In particolare l’ultimo termine rappresenta l’interazione del momento magnetico intrinseco3 µs = gµB s col campo magnetico B. Nella rappresentazione delle coordinate si ha p = −i~∇ e quindi (7) p ·A = A·p − i~ (∇·A). Scegliendo il gauge di Coulomb, nel quale ∇·A = 0, la (6) diventa quindi (8) H= q q2 p2 +V − A·p + A2 + qφ − µs ·B. 2m mc 2mc2 Consideriamo la grandezza relativa dei termini col potenziale vettore. Classicamente, il rapporto fra il terzo e il primo termine della (8) è dell’ordine di qA/cp e anche il rapporto fra il quarto e il terzo termine è dello stesso ordine. Supponiamo che la particella, legata dal potenziale V , descriva un’orbita chiusa di dimensione a e che il campo magnetico B sia costante in questa regione. Vale allora la relazione (si veda la (20)) A ' Ba. Se invece la particella fosse soggetta al solo campo magnetico (V = 0), essa descriverebbe una circonferenza di raggio Rc = cp/qB, detto raggio di ciclotrone. Per il rapporto cercato si ottiene allora qA/cp ' a/Rc . Si possono considerare due casi estremi: quello di un elettrone soggetto solo al campo magnetico e quello di un elettrone atomico. Nel primo caso (che sarà trattato nel § 7) si ha a = Rc e quindi i tre termini considerati sono dello stesso ordine di grandezza. Nel secondo caso si ha a ' a0 = 5.3 × 10−9 cm, mentre ad esempio per un elettrone con energia di 10 eV in un campo B = 1 tesla si ha Rc = 1.06 × 10−3 cm. Si ottiene quindi a/Rc ' 5 × 10−6 , per cui il termine lineare in A della (8) rappresenta solo una piccola perturbazione, mentre il termine quadratico è una perturbazione del secondo ordine e può essere in generale trascurato. 3 L’invarianza di gauge È noto dall’elettromagnetismo classico che i campi E e B, dati da (9) E = −∇φ − 1 ∂A , c ∂t B = ∇ ∧ A, sono invarianti per una trasformazione dei potenziali, detta trasformazione di gauge, data da (10) A → A + ∇ Λ, φ→φ− 3 1 ∂Λ , c ∂t Con le usuali notazioni g è il fattore giromagnetico, µB = e~/2mc è il magnetone di Bohr (ovvero il magnetone nucleare nel caso di un nucleone) e s è l’operatore di spin in unità ~. 2 dove Λ = Λ(x, t) è una funzione arbitraria. Questo principio di invarianza si estende alla meccanica quantistica, richiedendo che le quantità misurabili siano invarianti per trasformazioni di gauge. Consideriamo l’equazione di Schrödinger temporale (11) i~ ∂ ψ(x, t) = H ψ(x, t), ∂t dove H è data dalla (6), che riscriviamo nella forma q 2 1 −i~∇ − A + V + qφ − µs ·B. (12) H= 2m c Eseguendo la trasformazione di gauge (10) nella hamiltoniana, questa diventa 2 e = 1 −i~∇ − q A − q ∇Λ + V + qφ − q ∂Λ − µs ·B. (13) H 2m c c c ∂t Osserviamo ora che si ha ∂ ∂ q ∂Λ e−i(q/~c)Λ = i~ + ei(q/~c)Λ i~ ∂t ∂t c ∂t (14) q q ei(q/~c)Λ −i~∇ − A e−i(q/~c)Λ = −i~∇ − A + ∇Λ c c da cui si ottiene (15) ∂ ∂ e ei(q/~c)Λ i~ − H e−i(q/~c)Λ = i~ − H. ∂t ∂t Se allora indichiamo con ψe la soluzione dell’equazione ∂ e ψe = 0, (16) i~ − H ∂t si vede che ψe è legata a ψ dalla relazione (17) ψe = ei(q/~c)Λ ψ. Osserviamo che le trasformazioni (15) e (17) corrispondono a una trasformazione unitaria. L’equazione (16) ci mostra che una trasformazione di gauge lascia l’equazione di Schrödinger invariante in forma, mentre la funzione d’onda non è invariante4 , ma è soggetta alla trasformazione (17). Per quanto riguarda le osservabili, una grandezza M , rappresentata in assenza di campo dalla funzione M (x, p), con il campo, introdotto mediante la sostituzione minimale, diventa M (x, p − qA/c). Facendo poi una trasformazione di gauge si ottiene M [ x, p − (q/c)(A + ∇Λ) ]; ma dalla seconda equazione delle (14) segue che si può scrivere: (18) M x, p − (q/c)(A + ∇Λ) = ei(q/~c)Λ M x, p − qA/c e−i(q/~c)Λ , cioè una trasformazione di gauge su M equivale a una trasformazione unitaria. Poiché tutte le quantità misurabili sono esprimibili come valori di aspettazione del tipo (ψ, M ψ) e questi sono invarianti per trasformazioni unitarie, ne segue che esse sono anche invarianti per trasformazioni di gauge. 4 Questo non deve sorprendere poiché la funzione d’onda non è una grandezza misurabile. È invece misurabile il modulo quadro |ψ|2 , che risulta infatti invariante. 3 4 Interazione di dipolo magnetico Consideriamo un elettrone soggetto a un generico potenziale V e ad un campo magnetico B uniforme e costante. La hamiltoniana si ottiene dalla (8) ponendo q = −e, φ = 0 e trascurando il termine in A2 e risulta quindi (19) H= p2 e +V + A·p − µs ·B. 2m mc Poiché B è indipendente da x, il potenziale vettore A si può scegliere della forma (20) A= 1 B ∧ x. 2 Infatti si verifica facilmente che esso soddisfa alle condizioni (21) B = ∇ ∧ A, ∇·A = 0. Allora il terzo termine della (19) diventa: (22) e e e B∧x·p= B·x∧p= B ·L = µB B ·l = −µo ·B, 2mc 2mc 2mc dove L = x ∧ p è il momento angolare orbitale e si è posto l = L/~. L’ultima espressione della (22) corrisponde all’interazione di un dipolo magnetico di momento5 µo = −µB l, dovuto al moto orbitale, col campo magnetico B. Questa espressione è simile all’ultimo termine della (19) e in totale si può scrivere (23) H = H0 − µ·B, dove si è posto H0 = p2 /2m + V e (24) µ = µo + µs = −µB (l + 2s) rappresenta il momento magnetico totale dell’elettrone. Nella (24) si è preso g = −2 per il fattore giromagnetico, mentre il valore sperimentale è circa g = −2.00232. Esaminiamo ora l’effetto dell’interazione sull’energia dei livelli in un caso semplice. Consideriamo l’elettrone di un atomo d’idrogeno, ovvero l’elettrone di valenza di un metallo alcalino. Il potenziale ha la forma (25) V = V0 (r) + V1 (r) l·s, dove V0 (r) è un potenziale centrale e il secondo termine corrisponde all’interazione spin-orbita. Il problema dei livelli si può affrontare con la teoria delle perturbazioni e risulta abbastanza semplice se una delle due interazioni è piccola rispetto all’altra. Poiché l’interazione di dipolo è proporzionale al campo magnetico applicato, si hanno due casi possibili. Uno è quello di ‘campo debole’, in cui gli spostamenti dovuti al campo magnetico sono piccoli rispetto alla separazione dei livelli della struttura fine. Questo corrisponde all’effetto Zeeman, che verrà trattato nel prossimo paragrafo. L’altro caso è quello di ‘campo forte’, in cui l’interazione di dipolo magnetico è prevalente rispetto all’altra, che potrà essere trattata come una piccola 5 Il segno meno proviene dalla carica negativa dell’elettrone. 4 correzione. Questo caso corrisponde all’effetto Paschen-Back ed è quello che vogliamo discutere adesso. Trascurando l’interazione spin-orbita e prendendo B lungo l’asse z, la hamiltoniana (23) diventa (26) H= p2 + V0 (r) + µB B (lz + 2sz ) 2m e l’equazione di Schrödinger stazionaria risulta ~2 2 (27) − ∇ + V0 (r) + µB B (lz + 2sz ) ψ = Eψ, 2m I primi due termini nella parentesi quadra corrispondono a una hamiltoniana con potenziale centrale, che ha autovalori Enl e autofunzioni del tipo Rnl (r)Ylm (θ, ϕ). Anche il terzo termine è diagonale in questa base e in definitiva si ha E = Enl + µB B (ml + 2ms ) (28) ψ = R (r) Y ml (θ, ϕ) χ ms nl l dove ms = ± 21 è l’autovalore di sz e χms è uno spinore costante. Per B = 0 l’autovalore Enl è degenere rispetto a ml e a ms , in totale 2(2l + 1) volte. Per effetto del campo magnetico questo livello si separa in un multipletto di 2l + 3 livelli equidistanti, distanziati di µB B. Si vede che i due livelli più alti e i due più bassi sono non degeneri, mentre i livelli intermedi sono due volte degeneri. A questo punto l’interazione spin-orbita si potrebbe aggiungere come una perturbazione, ma trattandosi di un’interazione non dovuta al campo e.m. applicato non siamo interessati a discuterla. 5 Effetto Zeeman L’effetto Zeeman, scoperto nel 1896, consiste nella separazione dei livelli atomici dovuta all’azione di un campo magnetico esterno. I livelli di partenza sono quelli della struttura fine e il campo applicato deve essere ‘debole’, in modo che gli spostamenti prodotti siano piccoli rispetto alla separazione dei livelli. La trattazione che segue si applica bene ad atomi leggeri o medio-pesanti (Z < 80). In questi casi le interazioni spin-orbita degli elettroni risultano piccole e si possono trattare come perturbazioni. Se trascuriamo le interazioni spin-orbita, si conservano separatamente il momento angolare P P orbitale totale6 L = i li e lo spin totale S = i si . L’interazione spin-orbita viene poi introdotta come perturbazione e dà un contributo che risulta proporzionale a L·S. In conclusione gli stati atomici vengono rappresentati dai vettori | αLSJM i, dove α indica una data configurazione elettronica, J è il numero quantico del momento angolate totale J = L + S e M è l’autovalore di Jz . I livelli energetici dipendono dai numeri quantici (αLSJ) e sono degeneri (2J + 1 volte) rispetto a M . Questo schema si chiama metodo dell’accoppiamento LS, ovvero di Russel-Saunders e rappresenta una semplice generalizzazione del caso dell’atomo d’idrogeno. 6 In questo paragrafo useremo i simboli L, S, J per indicare i momenti angolari totali degli elettroni in unità ~. 5 Consideriamo allora l’interazione con un campo magnetico B diretto lungo l’asse z. Il termine d’interazione H1 della hamiltoniana si ottiene dalle (4.5) e (4.6) sommando i contributi di tutti gli elettroni e risulta (29) H1 = µB B (Lz + 2Sz ). Se B è abbastanza piccolo, H1 si può trattare come una perturbazione. Osserviamo che H1 è diagonale nell’autospazio del livello EαLSJ , poiché Lz + 2Sz commuta con Jz . Allora gli spostamenti del livello al primo ordine sono dati direttamente dai valori di aspettazione secondo la formula (30) ∆E ≡ ∆(1) EαLSJ = µB B h αLSJM | Lz + 2Sz | αLSJM i. Ponendo Lz + 2Sz = Jz + Sz si ha (31) ∆E = µB B M + h Sz i . Per calcolare h Sz i si può usare il seguente Teorema della proiezione. Se A è un qualsiasi operatore vettoriale e J è il momento angolare totale, fra stati con lo stesso J vale la relazione 7 (32) h αJM | A | αJM 0 i = h αJM | J ·A | αJM i h JM | J | JM 0 i, J(J + 1) dove α rappresenta un set di altri numeri quantici. Nel nostro caso prendiamo A = S e consideriamo la componente z dell’equazione, per cui si ottiene (33) h Sz i = h J ·S i M. J(J + 1) Dalla relazione L = J − S, facendo il modulo quadro si ricava (34) 1 J ·S = (J 2 + S 2 − L2 ) 2 7 La (32) equivale a dire che in un dato autospazio di J 2 A è uguale alla sua proiezione lungo J , cioè A = (A·J ) J /J 2 , da cui la denominazione del teorema. Dimostriamo ora la (32). Un operatore vettore A è tale che le sue componenti obbediscono alle relazioni di commutazione [ Ji , Aj ] = iijk Ak . Applicando ancora quest’equazione si ottiene [ J 2 , [J 2 , A] ] = 2(J 2 A + AJ 2 ) − 4(J ·A) J . Prendendo questa fra stati con lo stesso J, il primo membro si annulla e si ricava J(J + 1) h αJM | A | αJM 0 i = h αJM | (J ·A) J | αJM 0 i. Osserviamo ora che J ·A è un operatore scalare e quindi commuta con tutti i Ji . Ne segue che esso è diagonale e che gli elementi di matrice h αJM | J ·A | αJM i sono indipendenti da M . Inserendo allora al secondo membro della precedente equazione un set completo di autostati del momento angolare, si ottiene la (32). 6 e da questa segue (35) h J ·S i ≡ h αLSJM | J ·S | αLSJM i = i 1h J(J + 1) + S(S + 1) − L(L + 1) . 2 Infine, sostituendo questa nella (33) e quest’ultima nella (31), si ottiene per gli spostamenti dei livelli la formula (36) ∆E = gL µB BM , dove il coefficiente (37) gL = 1 + J(J + 1) + S(S + 1) − L(L + 1) 2J(J + 1) viene chiamato fattore di Landé. Concludiamo con alcune osservazioni di carattere fenomenologico. La (36) dice che il livello EαLSJ si separa in un multipletto di 2J + 1 livelli equidistanti. Se il numero atomico Z è pari, allora S e J sono interi e quindi il multipletto contiene un numero dispari di livelli. Se invece Z è dispari, il numero dei livelli è pari. La separazione fra due livelli vicini è data da gL µB B ed è quindi proporzionale al campo magnetico tramite un coefficiente che in generale dipende dai tre numeri quantici L, S, J secondo la (37). Tuttavia se S = 0 si ha J = L e quindi gL = 1. In questo caso la separazione dei livelli è data semplicemente da µB B e non dipende da nessun numero quantico. Questo caso corrisponde a quello che viene chiamato l’ effetto Zeeman normale, mentre nel caso S 6= 0 si ha il cosiddetto effetto Zeeman anomalo. 6 Precessione di Larmor Un dipolo magnetico di momento µ e momento angolare J , tali che µ = αJ , quando viene sottoposto a un campo magnetico B descrive un moto di precessione, noto come precessione di Larmor. Tale precessione si svolge attorno alla direzione di B con velocità angolare (38) ω L = −α B, il cui modulo viene chiamato frequenza di Larmor. Questo fenomeno si spiega classicamente in modo molto semplice. Vale infatti l’equazione del moto (39) µ̇ = αJ̇ = α µ ∧ B = ω L ∧ µ, dove µ ∧ B è la coppia meccanica che agisce sul dipolo. Il fatto che dµ/dt sia ortogonale a µ e a B mostra che si tratta appunto di un moto di precessione attorno a B con velocità angolare ωL. Questa proprietà si estende facilmente alla meccanica quantistica, sostituendo a µ, che diventa un operatore, il suo valore di aspettazione. Per dimostrarlo supporremo che: (i) la hamiltoniana sia della forma (40) H = H0 − µ·B; 7 (ii) i due termini di H commutino fra loro, e più in generale si abbia [ µi , H0 ] = 0; (iii) il momento magnetico sia dato da (41) µ = gµB j, dove j è un operatore di momento angolare in unità ~. Indichiamo con h µ i = h ψ(t) | µ | ψ(t) i il valore di aspettazione di µ in un generico stato | ψ(t) i. Derivando la componente i-esima rispetto al tempo si ottiene (42) 1 1 1 h [µi , H] i = − Bj h [µi , µj ] i = − (gµB )2 Bj h [ji , jj ] i i~ i~ i~ gµB gµB = − ijk Bj h µk i = − ( B ∧ h µ i )i . ~ ~ d h µi i = dt Si ottiene quindi la relazione (43) d gµB hµi = − B ∧ h µ i = ωL ∧ h µ i , dt ~ che è la corrispondente dell’equazione classica (39). Si è cosı̀ dimostrato che h µ i descrive un moto di precessione con velocità angolare (44) ωL = − ge gµB B=− B. ~ 2mc Osserviamo che la frequenza di Larmor ωL è proporzionale al fattore giromagnetico g. Consideriamo allora il caso dell’elettrone visto nel § 4, in cui sono presenti due distinti momenti magnetici: µo del moto orbitale con g = −1 e µs dello spin con g = −2. La hamiltoniana (23-24) ha la forma (45) H = H0 + µB (l + 2s)·B e poiché l e s commutano fra loro e con H0 , ne segue che l’equazione (42) si applica separatamente a µo e a µs . Si hanno quindi due distinti moti di precessione, con frequenze ωLorb = eB/2mc e ωLspin = eB/mc. Questo però non vale se è presente l’interazione spin-orbita, perché in questo caso i due momenti magnetici non commutano con H0 . Consideriamo il caso di un elettrone che si muove liberamente nel campo magnetico. È interessante osservare che la frequenza di Larmor ωLspin sarebbe uguale alla frequenza di ciclotrone ωc = eB/mc, se |g| fosse esattamente uguale a 2. Ma poiché |g| è di circa l’1 per mille più grande di 2, ne segue che se a un dato istante lo spin e la velocità dell’elettrone sono paralleli, lo spin ruota un poco più velocemente e dopo un certo tempo le due direzioni formano un certo angolo. Su questa circostanza si basa un famoso esperimento del 1961, che ha permesso di misurare con grande precisione la piccola differenza g − 2. 7 Moto in un campo magnetico uniforme: livelli di Landau Vogliamo studiare il moto (non relativistico) di una particella con carica e e senza spin in un campo magnetico B uniforme, diretto lungo l’asse z, costante e infinitamente esteso. Classicamente la particella descrive un moto elicoidale, che è la combinazione di un moto rettilineo 8 uniforme lungo l’asse z e di un moto circolare uniforme nel piano xy, con frequenza angolare ωc = eB/mc e raggio Rc = mcv⊥ /eB. La hamiltoniana è data dalla (6) con il solo termine dell’energia cinetica, cioè 1 e 2 (46) H= p− A . 2m c Per risolvere l’equazione di Schrödinger conviene prendere il potenziale vettore nella forma (47) A ≡ B(−y, 0, 0), piuttosto che quello della (20). I due potenziali differiscono ovviamente per una trasformazione di gauge, ovvero per un gradiente. Con questa scelta la hamiltoniana diventa 1 eB 2 2 2 y + py + pz (48) H= px + 2m c e si può scrivere come somma di due termini commutanti: (49) H = H1 + H2 dove (50) H1 = p2z , 2m (51) H2 = 2 p2y 1 c + mωc2 y + px . 2m 2 eB Il termine H1 corrisponde a un moto libero lungo l’asse z. Infatti, poiché Az = 0, per la (3) si ha pz = mż e quindi pz = costante corrisponde al moto classico con velocità costante lungo l’asse z. Il termine H2 descrive il moto nel piano xy. Osserviamo che px è una costante del moto, dato che H non dipende da x e quindi commuta con px . Tuttavia questo non significa che il moto lungo x sia un moto libero. Infatti dalla (3) e dalla (47) segue mẋ = px + (eB/c)y e quindi il moto (classico) lungo x è legato a quello lungo y. Inoltre si ha [ (y + cpx /eB) , py ] = i~, per cui H2 è formalmente identica alla hamiltoniana di un oscillatore armonico di frequenza ωc lungo l’asse y, con l’origine nel punto y0 = −cpx /eB. Il moto nel piano xy è quindi quantizzato, con uno spettro di livelli di oscillatore armonico, che sono detti livelli di Landau. Consideriamo ora l’equazione di Schrödinger (52) H ψ(x) = E ψ(x). In virtù della (49) questa si può separare in due equazioni distinte per H1 e per H2 della forma (53) H1 u1 (z) = E1 u1 (z), (54) H2 u2 (x, y) = E2 u2 (x, y), tali che (55) ψ(x) = u1 (z)u2 (x, y); E = E1 + E2 . 9 La (53) ha come soluzioni (56) u1 (z) = A eikz z + B e−ikz z , kz = 1p 2mE1 ~ ⇒ E1 = ~2 kz2 ∈ R+ . 2m Riguardo alla (54), poiché px commuta con H2 , si può scegliere u2 (x, y) come autofunzione simultanea di px e di H2 della forma u2 (x, y) = eikx x v(y), (57) dove ~kx è l’autovalore di px e v(y) è soluzione dell’equazione h (58) − i ~2 d 2 1 2 2 (y − y ) + mω v(y) = E2 v(y). 0 c 2m dy 2 2 Nella (58) si è posto (59) y0 = − c~ c px = − kx , eB eB che rappresenta il centro8 della forza elastica. Dalla teoria dell’oscillatore unidimensionale sappiamo che gli autovalori E2 sono dati da (60) E2n = ~ωc (n + 21 ), n∈N e le autofunzioni v(y) sono date da (61) 1 vn (y) = un (y − y0 ) = Nn e− 2 α 2 (y−y 0) 2 Hn α(y − y0 ) , dove con un abbiamo indicato le autofunzioni standard dell’oscillatore, in cui Hn sono i polinomi p di Hermite, α = mωc /~ e Nn è la costante di normalizzazione. La (60) ci dice quindi che i livelli di energia del moto nel piano xy coincidono coi livelli di un oscillatore armonico unidimensionale di frequenza classica uguale alla frequenza di ciclotrone ωc . Una particolarità notevole di questi livelli è quella di essere infinitamente degeneri. Infatti 8 Si può mostrare che y0 è la coordinata y del centro della traiettoria classica nel piano xy. Infatti integrando l’equazione del moto classico e mẍ = ẋ ∧ B c si ottengono le equazioni della traiettoria nel piano xy nella forma x(t) = x0 − Rc cos(ωc t + α) y(t) = y0 + Rc sin(ωc t + α) dove x0 , y0 e α sono costanti arbitrarie d’integrazione. La traiettoria è quindi una circonferenza di raggio Rc col centro nel punto (x0 , y0 ). Da queste equazioni si ottiene ẋ(t) = ωc Rc sin(ωc t + α) = ωc [ y(t) − y0 ] e utilizzando la relazione mẋ = px + (eB/c)y si ottiene per y0 l’espressione (59). In maniera analoga si ricava x0 = x(t) + c py . eB Osserviamo che gli operatori quantistici corrispondenti a x0 e y0 non commutano e quindi le due coordinate non si possono determinare contemporaneamente. Nel nostro caso si è fissato px e quindi y0 , per cui x e x0 rimangono del tutto indeterminati. 10 le autofunzioni complete della (54) sono date dalle (57) e (61) e queste dipendono, oltre che dal numero quantico n legato all’energia, anche dal parametro kx , che può prendere qualsiasi valore reale. Pertanto il livello En è degenere infinite volte, con una molteplicità continua. Questa continuità discende dalla schematizzazione che abbiamo fatto di considerare la regione del piano xy dove è presente il campo magnetico e dove si svolge il moto come infinitamente estesa. Se invece tale regione si considera finita, per esempio di lunghezza L lungo l’asse x, con L Rc ma finito, allora px ha uno spettro discreto di autovalori e quindi la molteplicità della degenerazione diventa discreta. Questa proprietà dell’energia di una particella carica in un campo magnetico, di presentare uno spettro discreto di livelli infinitamente degeneri, fu scoperta da Landau nel 1930 e per questo motivo si parla di livelli di Landau. Per concludere osserviamo che lo spettro dei livelli (60) e la degenerazione infinita sono indipendenti dalla scelta del gauge per il potenziale vettore, mentre la forma delle autofunzioni ne dipende. Se ad esempio avessimo preso A = 21 B ∧ x ≡ 21 B(−y, x, 0), avremmo trovato delle autofunzioni molto diverse dalle (57) e (61). 8 L’effetto Aharonov-Bohm Voglimo discutere un effetto fisico puramente quantistico, che è di grande interesse per i fondamenti della meccanica quantistica, perché è legato al carattere non locale della funzione d’onda e al fatto che nell’equazione di Schrödinger intervengono i potenziali e.m. invece dei campi. Consideriamo un fascio di elettroni emesso da una sorgente A, il quale viene diviso in due fasci 1 e 2 che seguendo due cammini diversi arrivano a un rivelatore B, come è mostrato schematicamente nella figura. 1 A S B 2 Fra i due fasci si trova una regione S, che rappresenta la sezione di un elettromagnete ortogonale al piano della figura, dove è concentrato un campo magnetico B, del quale indicheremo con Φ il flusso attraverso la sezione S. Si suppone che il campo magnetico nella regione esterna a S sia nullo e che la regione S sia completamente schermata da un forte campo elettrico, in modo che gli elettroni non la possano attraversare. Si osserva che il rivelatore registra delle frange d’interferenza, con i massimi e i minimi dell’intensità che si spostano al variare del flusso Φ. Secondo la fisica classica, ciascun elettrone segue una ben determinata traiettoria, e poiché questa non può attraversare la regione S, ne segue che il moto dell’elettrone non dovrebbe 11 subire l’azione del campo magnetico. L’esistenza delle frange d’interferenza dimostra invece che un singolo elettrone non segue una sola traiettoria, ma le segue entrambe (o più precisamente segue tutte le traiettorie possibili), ciascuna con una data ampiezza di probabilità, cosı̀ come accade nell’esperienza di Young delle due fenditure. Inoltre il moto quantistico è influenzato dal potenziale vettore A, che è diverso da zero anche nella regione esterna a S. Si può allora pensare che la presenza di A possa produrre uno sfasamento fra due traiettorie distinte, in grado di spiegare l’interferenza osservata. Per capire il fenomeno in modo quantitativo, dobbiamo calcolare come la probabilità di un elettrone di arrivare sul rivelatore B dipende dal potenziale vettore A. Il modo più semplice per fare questo calcolo è quello basato sul principio di Feynman della somma sui cammini. Indichiamo con K l’ampiezza di probabilità per un elettrone di andare dalla sorgente A al rivelatore B, indicando per semplicità con A e B i punti di partenza e di arrivo degli elettroni. Secondo la teoria di Feynman9 K è dato da (62) K= X γ i A exp ~ Z L(x, ẋ) dt γ dove L(x, ẋ) è la lagrangiana classica e γ è un dato cammino, cioè una traiettoria classica percorribile dall’elettrone, con equazioni parametriche x = x(t) e in cui gli estremi sono fissati nei punti A e B. L’integrale a esponente va eseguito lungo la linea γ e la somma sui cammini γ è definita in modo opportuno. Conviene separare K in due parti, ponendo K = K1 + K2 , dove K1 è la somma su tutti i cammini γ1 che passano sopra la regione S della figura e K2 è la somma sui cammini γ2 che passano sotto. La lagrangiana L è della forma e 1 L = mẋ2 − ẋ·A − V (x, ẋ), 2 c che estende la (2) e dove V rappresenta un potenziale generico, che contiene l’interazione dell’elettrone con altri campi e.m. necessari per guidare la traiettoria. Nella (68) si può facilmente isolare il contributo di A scrivendo L = L0 − (e/c)A· ẋ, dove L0 è la lagrangiana che si ottiene ponendo A = 0. Si ha allora Z Z Z e A · dx . L dt = L0 dt − (64) c γ γ γ (63) Si osserva che l’ultimo integrale è indipendente da γ per tutti i cammini del tipo γ1 ovvero del tipo γ2 . Infatti se γ1 e γ10 sono due cammini del primo tipo, la differenza fra i due integrali per il teorema di Stokes è uguale alla circuitazione di A lungo la linea chiusa γ1 − γ10 , e questa è nulla poiché nella regione interna si ha rot A = 0. Allora nell’espressione per K1 analoga alla (62), tutti i termini della somma dipendono da A tramite uno stesso fattore di fase e si può scrivere: (65) K1 = eiα1 K10 , dove con K10 si è indicata l’ampiezza K1 per A = 0 e si è posto Z e (66) α1 = − A · dx, ~c γ1∗ 9 Si vedano gli appunti del corso: Cenni sulla meccanica quantistica di Feynman. 12 dove γ1∗ è un arbitrario cammino di tipo γ1 . In maniera analoga si può fare per K2 , sostituendo l’indice 1 con 2. In conclusione la probabilità dell’elettrone di arrivare in B è data da (67) P = | K1 + K2 |2 = |K1 |2 + |K2 |2 + 2 Re(K1∗ K2 ) = |K10 |2 + |K20 |2 + 2 |K10 | |K20 | cos(α2 − α1 + φ2 − φ1 ) dove con φ1 e φ2 si sono indicate le fasi di K10 e K20 . Dalla (66) e dal teorema di Stokes si ottiene Z I e e e A · dx = − A · dx = − Φ. (68) α2 − α1 = − ~c γ2∗ −γ1∗ ~c S ~c L’equazione (67) dice allora che la probabilità P è una funzione periodica del flusso Φ del campo magnetico, con un periodo pari a 2π~c/e. Questo fenomeno fisico fu predetto da Y. Aharonov e D. Bohm nel 1959 ed è stato poi osservato sperimentalmente per la prima volta nel 1982. 9 Risonanza magnetica di spin Vogliamo descrivere brevemente la risonanza magnetica di spin, un fenomeno di fisica quantistica che ha trovato importanti applicazioni in fisica, in chimica organica, in biologia e particolarmente nella diagnostica medica. A seconda dell’oggetto d’indagine, possono essere messi in risonanza gli elettroni, e si parla in questo caso di risonanza di spin elettronico (ESR); oppure i nuclei atomici, e si ha allora la risonanza magnetica nucleare (NMR). Il principio di funzionamento è il seguente. Una particella dotata di spin e momento magnetico viene immersa in un forte campo magnetico uniforme e costante, al quale si sovrappone un campo magnetico più debole, ortogonale al primo e oscillante nel tempo con una frequenza ω. Per effetto del campo costante la particella presenta uno spettro discreto di livelli di spin e va ad occupare di preferenza lo stato di energia più bassa. Inoltre il suo spin descrive un moto di precessione con frequenza di Larmor ωL . Quando ω = ωL si ha una risonanza nella probabilità di eccitazione, per cui la particella va ad occupare anche i livelli superiori. Quando il campo variabile viene spento, la particella – che non è mai isolata ma fa parte di un campione – rilassa nello stato fondamentale emettendo una radiazione caratteristica, la cui analisi fornisce importanti informazioni sulla struttura del campione. L’argomento è di grande interesse anche teorico, perché rappresenta uno dei rari casi in cui l’equazione di Schrödinger temporale si può risolvere esattamente. Per illustrare il fenomeno della NMR nel caso più semplice, consideriamo il caso di un protone, che è un sistema con due livelli di spin. Sia B 0 un campo magnetico uniforme, costante e diretto lungo l’asse z e B 1 un campo variabile, che ruota10 nel piano xy con frequenza angolare ω, nello stesso verso (orario) della precessione di Larmor: (69) B 1 = B1 ( ex cos ωt − ey sin ωt ). 10 Nella pratica il campo B 1 oscilla in una direzione fissata, per esempio lungo l’asse x. Questo si può ottenere come somma di due campi con la stessa ampiezza B1 /2 che ruotano in verso contrario, per esempio quello della (74) e quello che si ottiene cambiando ω in −ω. Ma di questi due campi, solo il primo dà luogo alla risonanza per ω = ω0 , mentre il secondo è sempre lontano dalla risonanza e dà un effetto trascurabile. 13 Trascurando l’energia cinetica e le interazioni che non riguardano lo spin, la hamiltoniana del protone è data da h i (70) H = −µ·B = −µ σ·B = −µ B0 σz + B1 ( σx cos ωt − σy sin ωt ) = −µ B0 B1 e−iωt B1 eiωt −B0 dove µ = µσ è il momento magnetico, µ = ge~/4mc, con g = 5.586, è il fattore giromagnetico del protone e m è la sua massa. Per B1 = 0 il sistema ha due livelli di spin, con energie E1 = −µB0 ed E2 = +µB0 , e si vede che lo stato fondamentale è quello con σz = +1, rappresentato dallo spinore χ+ = 10 . Al salto di energia fra i due livelli corrisponde la frequenza di Bohr (71) ω21 = E2 − E1 geB0 = . ~ 2mc Inoltre, in uno stato di spin generico, lo spin precede attorno all’asse z con la frequenza di Larmor ωL data dal modulo della (44): ωL = (72) geB0 . 2mc Si osserva che le due frequenze sono uguali e poniamo allora ω0 = ω21 = ωL . In presenza del campo B 1 , indichiamo con a(t) (73) χ(t) = b(t) lo spinore del protone. Esso obbedisce all’equazione di Schrödinger temporale (74) i~ d χ(t) = Hχ(t), dt dove H è dato dalla (70). In forma matriciale questa si scrive ! ω0 ω1 eiωt ȧ(t) 1 (75) i~ =− ~ 2 ḃ(t) ω1 e−iωt −ω0 a(t) b(t) ! dove si è posto (76) 1 µB0 = ~ω0 ; 2 1 µB1 = ~ω1 . 2 Per le componenti dello spinore si ha quindi il sistema di equazioni i ȧ = (ω0 a + ω1 eiωt b) 2 (77) i ḃ = (ω e−iωt a − ω b) 1 0 2 La soluzione di questo sistema è complicata dal fatto che i coefficienti dipendono dal tempo. Per eliminare questa dipendenza conviene passare a un sistema di riferimento che ruota attorno 14 all’asse z con la stessa velocità angolare ω del campo B 1 , in modo tale che nel nuovo sistema il campo B 1 risulti costante. Questa trasformazione corrisponde a una rotazione attiva di un angolo ωt, che viene eseguita dall’operatore e−iωtjz . Poniamo allora χ e(t) = e−iωtσz /2 χ(t) (78) per cui l’equazione di Schrödinger diventa (79) i~χ(t) ė = i~ d −iωtσz /2 e + 1 ~ωσz χ e(t), e χ(t) = H 2 dt dove, utilizzando la (70), si è posto e = e−iωtσz /2 Heiωtσz /2 = −µB0 σz − µB1 (e H σx cos ωt − σ ey sin ωt). (80) Nell’ultimo membro si sono introdotti gli opertori ruotati σ ex e σ ey , che risultano11 σ ex = e−iωtσz /2 σx eiωtσz /2 = σx cos ωt + σy sin ωt (81) σ ey = e−iωtσz /2 σy eiωtσz /2 = σy cos ωt − σx sin ωt La hamiltoniana nel sitema rotante risulta allora e = −µB0 σz − µB1 σx H (82) ed è quindi indipendente dal tempo. Dalle (79), (82) e (76) si ricava per lo spinore χ e la seguente equazione del moto i (83) χ ė = (ω0 − ω)σz + ω1 σx χ e. 2 Questa si può riscrivere nella forma (84) dove si è posto (85) Ω= 1 2 q (ω0 − ω)2 + ω12 ; χ(t) ė = iΩ (σ ·n) χ e(t) , n≡ 1 ω1 , 0 , (ω0 − ω) , 2Ω tale che n2 = 1. La (84) si può integrare formalmente e si ottiene (86) χ e(t) = eiΩt(σ·n) χ e(0) = [ cos Ωt + i(σ·n) sin Ωt ] χ e(0). Supponiamo che al tempo t = 0 il protone si trovi nello stato fondamentale, per cui si ha χ e(0) = χ(0) = χ+ . Infine, facendo la trasformazione inversa della (78), si ottiene per lo spinore χ(t) la seguente espressione h i ω0 − ω eiωt/2 cos Ωt + i sin Ωt 2Ω . (87) χ(t) = iω 1 e−iωt/2 sin Ωt 2Ω 11 Le relazioni (81) risultano evidenti per la rotazione attiva di un vettore nel piano xy. Si possono anche ottenere formalmente utilizzando la formula generale 1 [A, [A, B]] + . . . 2! e risommando poi le serie dei termini pari e dei termini dispari, che danno rispettivamente i termini in cos ωt e sin ωt. eA Be−A = B + [A, B] + 15 Si osserva che lo spinore è normalizzato, come deve essere. La probabilità di trovare il protone nello stato eccitato è data da P (t) = |b(t)|2 = (88) ω12 sin2 Ωt 4Ω2 da cui si vede che P (t) oscilla periodicamente fra zero e un valore massimo con frequenza 2Ω. Questo valore massimo è dato da (89) Pmax = ω12 ω12 = . 4Ω2 (ω0 − ω)2 + ω12 Nella pratica il campo B1 è di diversi ordini di grandezza più piccolo di B0 e si ha quindi ω1 /ω0 = B1 /B0 1. Si hanno allora due situazioni molto diverse a seconda del valore di ω. Quando ω è sensibilmente diverso da ω0 si ha Pmax ' (ω1 /ω0 )2 , per cui la probabilità di eccitazione è molto piccola. Quando invece ω = ω0 si ha Pmax = 1, cioè lo spin si ribalta completamente. In altre parole il protone passa periodicamente dallo stato di spin su a quello di spin giù in un tempo π/ω1 , come si vede anche direttamente dalla (87). Questo si capisce facilmente se ci mettiamo nel sistema di riferimento rotante considerato prima. Infatti in questo sistema la precessione di Larmor attorno a B 0 viene annullata, mentre si ha una precessione attorno al campo B 1 , che è costante e diretto lungo l’asse x. Questa oscillazione è accompagnata da un trasferimento di energia, che passa alternativamente dal campo B1 al protone e viceversa. Si ha quindi a che fare con un fenomeno di risonanza, che si verifica quando la frequenza di rotazione ω del campo B 1 è uguale alla frequenza di Larmor ω0 . Questa risonanza può essere visualizzata riportando in un grafico Pmax in funzione di ω. Si osserva il caratteristico picco di risonanza per ω = ω0 , che ha una larghezza a metà altezza pari a 2ω1 . A titolo di esempio riportiamo nel grafico qui sotto y = Pmax in funzione di x = ω/ω0 , dove si è posto ω1 /ω0 = 10−2 . 1 0.8 0.6 y 0.4 0.2 0 0.8 0.9 1 x 16 1.1 1.2