DIAMAGNETISMO E PARAMAGNETISMO Usiamo per la definizione delle grandezze fisiche magnetiche il sistema C.G.S. Si noti che in questo capitolo ci atterremmo alla notazione del cap. 31 del libro di N. W. Ashcroft e N.D. Mermin “Solid State Physics” indicando con H il campo di induzione magnetica che in genere viene denominato con B . Si sottintende che questa uguaglianza sia riferita alla regione esterna alla sostanza magnetica che è tutti gli effetti considerata come vuoto. Nel sistema C.G.S. si ha infatti che nello spazio libero (al di fuori del mezzo magnetico) B = μ0 H , ma poiché la permeabilità magnetica del vuoto μ0 vale 1, si ha che B = H , cioè il campo di intensità H coincide con il campo di induzione magnetica di intensità B. L’unità di misura usata in questo capitolo per l’intensità H del campo magnetico è quindi in Gauss (G) che rappresenta l’unità di misura usata per l’intensità B del campo di induzione magnetica. L’unità di misura dell’intensità H del campo magnetico nel sistema C.G.S. è infatti espressa in Oersted (Oe) e vale in generale la relazione 1 G = 1 Oe. Questa identificazione fra H e B non vale solo per il campo magnetico esterno maggiormente trattato in questo capitolo, ma anche per il campo di scambio ed il campo dipolare che sono campi intrinseci dei materiali magnetici. Si noti infine che in questo capitolo viene indicato con la lettera J sia il numero quantico associato al momento angolare totale che l’integrale di scambio. 1.1 Introduzione Diamo in primo luogo la definizione della magnetizzazione M di un corpo. Essa è una grandezza vettoriale ed è definita nella sua forma generale come la derivata del vettore momento magnetico μ rispetto al volume V del corpo, cioè M (r ) = d μ (r ) dV (1.1) In base a tale definizione la magnetizzazione viene determinata in un punto a distanza r rispetto ad un’origine O ed è quindi diversa in ogni punto del corpo. Non è quindi necessario che il solido sia magnetizzato uniformemente per definire la magnetizzazione. Il momento magnetico viene anche definito momento di dipolo magnetico. In figura è rappresentato un solido magnetizzato in modo 1 non uniforme. Si deve considerare un elemento infinitesimo di volume dV a distanza r rispetto ad un’origine O di un sistema di riferimento ed un momento magnetico infinitesimo d μ . Se il corpo è magnetizzato uniformemente, cioè il momento magnetico è uguale in ogni punto ( μ ( r ) = μ ) si ha che anche M ( r ) = M . In questo modo la definizione di magnetizzazione viene semplificata nella forma M = μ V (1.2) Quindi, se la magnetizzazione è uniforme, la relazione fra magnetizzazione e momento magnetico può essere espressa in forma scalare. Daremo nei prossimi paragrafi anche la definizione termodinamica di magnetizzazione di un solido in relazione alla energia libera del sistema. Tale ulteriore definizione si può giustificare pienamente prendendo in esame un sistema quantistico e non più un sistema classico. Analogamente si definisce suscettività magnetica e la si indica con la lettera χ la seguente grandezza χ= ∂M ∂H (1.3) dove H è l’intensità del campo magnetico applicato. Questa definizione risulta valida quando il vettore magnetizzazione M è parallelo al vettore campo magnetico H . La suscettività rappresenta la capacità di magnetizzazione di un solido con proprietà magnetiche ed esprime il grado con cui un solido risponde all’azione di un campo magnetico esterno. In base alla definizione data la suscettività è una grandezza scalare. Poiché per campi applicati facilmente raggiungibili negli 2 esperimenti spesso M dipende linearmente da H (cioè M = k H dove k è una costante) la definizione di suscettività si riduce ad una forma ancora più semplice, cioè χ= M H (1.4) In accordo con questa definizione la suscettività è ancora una grandezza scalare e non dipende dal campo magnetico esterno H. In base al comportamento nei confronti di un campo magnetico esterno le sostanze si suddividono in due categorie, cioè in sostanze DIAMAGNETICHE e sostanze PARAMAGNETICHE. Si definisce DIAMAGNETICA una sostanza che tende a schermare l’azione di un campo magnetico applicato. In questo modo il momento magnetico indotto di ciascun atomo ha direzione opposta a quella individuata dal campo applicato. Una sostanza è invece PARAMAGNETICA quando i corrispettivi momenti magnetici di ciascuno dei suoi atomi tendono ad allinearsi sotto l’azione di un campo magnetico esterno lungo la direzione individuata dal campo magnetico stesso. In base a tale comportamento le sostanze DIAMAGNETICHE sono caratterizzate da suscettività magnetica χ negativa (χ < 0), mentre le sostanze PARAMAGNETICHE hanno suscettività magnetica χ positiva (χ > 0). 1.2 Teoria classica del diamagnetismo: teoria di Langevin Il fenomeno del diamagnetismo causato dalla tendenza delle cariche elettriche (elettroni) a schermare in parte un corpo dall’azione di un campo magnetico applicato ha il suo analogo elettrodinamico nella legge di Lenz. Tale legge descrive l’insorgenza di una corrente indotta come risposta alla variazione di flusso del campo magnetico attraverso un circuito di corrente. Tale corrente indotta si oppone alla variazione di flusso ed alla corrente ad esso associata. Tutte le sostanze hanno comportamento diamagnetico, poiché tutti gli atomi hanno elettroni appartenenti alle shell più esterne che schermano l’azione di un campo magnetico esterno. Il comportamento diamagnetico è tipico di quelle sostanze in cui questo effetto è preponderante rispetto agli altri effetti possibili. Sono esempi di sostanze diamagnetiche i gas nobili allo stato solido, materiali con shell elettroniche complete come l’elio (He), il neon (Ne), l’argon (Ar), il kripton (Kr) e lo xenon (Xe); sono diamagnetici anche i composti ionici come il fluoruro di litio (LiF), il fluoruro di potassio (KF) ed il fluoruro di sodio (NaF). Sia l’alogeno (atomo di fluoro F) acquistando un 3 elettrone che i metalli alcalini (Li, K, Na) perdendo un elettrone sono sostanze diamagnetiche, poichè ionizzandosi realizzano la condizione di shell esterna completa. Per ricavare il risultato classico di Langevin esprimente la suscettività magnetica di una sostanza diamagnetica occorre richiamare in primo luogo il TEOREMA di LARMOR. Esso afferma che il moto degli elettroni attorno al nucleo in presenza di un campo magnetico di intensità H è, al primo ordine in H, lo stesso moto che si avrebbe in assenza di tale campo a cui si deve sovrapporre un ulteriore moto di precessione attorno ad H la cui frequenza angolare di precessione è data per ogni elettrone da ωL = eH 2mc (1.5a) dove e è la carica dell’elettrone presa in modulo, m è la massa dell’elettrone e c è la velocità della luce. La frequenza angolare viene definita FREQUENZA di LARMOR. La direzione della velocità angolare ωL è lungo l’asse individuato dal campo magnetico H . La corrispondente frequenza f L = ω L 2π (L indica Larmor) può essere espressa nella forma fL = dove γ L = γL H 2π (1.5b) e è il rapporto giromagnetico orbitale (scritto a meno del segno – della carica) di un 2mc corpo rigido rotante (elettrone) secondo le leggi della meccanica classica. Si vedrà nel paragrafo 1.4 che esso è dato dal rapporto fra il momento magnetico ed il momento angolare orbitale. Si fa l’ipotesi che la corrente media (la media è d’insieme) generata dagli elettroni contenuti all’interno di un atomo sia nulla prima dell’applicazione del campo magnetico esterno. In seguito all’applicazione di un campo magnetico esterno ciascun elettrone ruota descrivendo orbite circolari attorno all’asse individuato da H ad una frequenza angolare pari alla frequenza di Larmor e l’insieme degli elettroni produce una corrente media finita attorno al nucleo. Si assume anche che la frequenza di Larmor sia molto inferiore alla frequenza del moto originale dell’elettrone attorno al nucleo soggetto a forze di tipo centrale e questa ipotesi è ragionevole per un campo magnetico esterno debole. E’ noto dalle leggi dell’elettrodinamica classica che una carica in movimento genera una corrente i = dq / dt dove q è la generica carica e t è il tempo. Vista l’analogia geometrica con il modello della spira circolare percorsa da corrente può essere utilizzato per il calcolo di i tale modello. La corrente è data, per ciascun elettrone, da i = e / cT (c si aggiunge nell’espressione di i per ragioni dimensionali nel sistema C.G.S.); T = 2π / ωL è il periodo di rivoluzione, cioè il tempo impiegato dall’elettrone per percorrere un’intera circonferenza ed ωL è la frequenza angolare di 4 Larmor. Il periodo di rivoluzione è in questo caso un periodo associato alla precessione attorno alla direzione del campo magnetico esterno. Quindi, sostituendo l’espressione di T nell’intensità di corrente i, si trova iL = e ωL / 2π c . Se si considera un atomo contenente Z elettroni si scrive la corrente totale equivalente I = − Z iL dove il segno – è dovuto al fatto che la direzione della corrente equivalente generata convenzionalmente da una carica positiva è opposta rispetto alla direzione del moto della corrente generata dall’elettrone avente carica negativa. Sostituendo l’espressione della frequenza di Larmor di Eq.(1.5) dentro iL = e ωL / 2π c si trova che la corrente totale I generata da Z elettroni vale I =− Ze 2 H 4π m c 2 (1.6) Poiché il percorso della corrente è molto piccolo il momento magnetico orbitale può essere scritto come il prodotto fra l’intensità i della corrente e l’area A dell’orbita (assunta circolare). Il campo magnetico prodotto dall’elettrone è, a grandi distanze, equivalente a quello di un dipolo magnetico caratterizzato da un vettore momento di dipolo posto nel centro dell’orbita e perpendicolare al piano dell’orbita stessa. L’elettrone è, a tutti gli effetti, equivalente ad un dipolo magnetico. In base alla = iL A definizione fornita, l’intensità del momento magnetico orbitale del singolo elettrone è μeorbitale L dove A = π ρ 2 è l’area dell’orbita dell’elettrone e ρ è il raggio dell’orbita. Il momento magnetico orbitale esprime la forza del dipolo magnetico associato all’elettrone. Per avere il momento magnetico totale μ dell’atomo associato agli Z elettroni basta moltiplicare per il numero Z di elettroni, cioè μ=− Z e2 H 2 〈ρ 〉 4mc 2 (1.7) In Eq.(1.7) la quantità 〈 ρ 2 〉 è la media del quadrato della distanza del generico elettrone dall’asse lungo cui è posto il campo magnetico. Essa è definita come una media d’insieme delle posizioni degli Z elettroni dell’atomo. Poiché tale distanza è definita su un piano individuato dalla rotazione dell’elettrone avente generiche coordinate x ed y attorno all’asse si scrive 〈 ρ 2 〉 = 〈 x 2 〉 + 〈 y 2 〉 con le quantità 〈 x 2 〉 e 〈 y 2 〉 indicanti le corrispondenti medie delle singole componenti x ed y elevate al quadrato. La distanza quadratica media del generico elettrone dal nucleo è invece 〈 r 2 〉 = 〈 x 2 〉 + 〈 y 2 〉 + 〈 z 2 〉 dove si è aggiunta anche la media del quadrato della componente z, poiché la distanza è in questo caso calcolata rispetto ad un punto, rappresentato dal nucleo, posto sull’asse. In figura è schematizzato il moto di precessione del generico elettrone attorno all’asse definito dal campo magnetico applicato. 5 z H Piano xy ωL ρ e- r Nucleo Per una distribuzione di carica a simmetria sferica deve valere 〈 x 2 〉 = 〈 y 2 〉 = 〈 z 2 〉 a causa dell’isotropia spaziale così che si può scrivere ad esempio 〈 ρ 2 〉 = 2〈 x 2 〉 ed 〈 r 2 〉 = 3〈 x 2 〉 . Si trova che 〈 x 2 〉 = 〈 r 2 〉 / 3 che, sostituito in 〈 ρ 2 〉 , fornisce 〈 ρ 2 〉 = 2 / 3 〈 r 2 〉 . Sostituendo in Eq.(1.7) l’espressione di 〈 ρ 2 〉 si trova Z e2 H 2 μ=− 〈r 〉 6mc 2 (1.8) Per ottenere il momento magnetico totale basta sommare i momenti magnetici di ciascun atomo e ciò equivale a moltiplicare per il numero N di atomi del mezzo supponendo che tali momenti magnetici siano tutti uguali. Quindi si può scrivere μtot = N μ . Dividendo μtot per il volume V del mezzo si trova la corrispondente magnetizzazione, cioè M = − N Z e2 H 2 〈 r 〉 nell’ipotesi che il V 6mc 2 mezzo sia uniformemente magnetizzato in accordo con Eq. (1.2). Si nota che la magnetizzazione è 6 antiparallela al campo esterno. Dividendo ancora per il campo magnetico H si trova la SUSCETTIVITÀ DIAMAGNETICA del mezzo χ= M N Z e2 2 =− 〈r 〉 H V 6mc 2 (1.9) Eq.(1.9) rappresenta la LEGGE di LANGEVIN e costituisce un risultato derivato per via classica. Il problema del calcolo della suscettività diamagnetica si riduce al calcolo di 〈 r 2 〉 per la distribuzione elettronica nell’atomo che può essere ottenuto in modo preciso usando la meccanica quantistica. Per come è stata definita, la suscettività diamagnetica è una grandezza scalare ed adimensionale. A causa del segno meno nel membro di destra posto davanti ad una quantità positiva essa risulta minore di zero. Come si nota la suscettività diamagnetica è indipendente dalla temperatura. Si sarebbe potuta trovare la suscettività diamagnetica di Eq.(1.9) anche applicando la definizione più generale di suscettività data in Eq.(1.3). Tipicamente la suscettività diamagnetica è dell’ordine di -10-4÷-10-5. Tuttavia, sperimentalmente viene misurata la suscettività magnetica molare misurata in cm3/mole (si veda il paragrafo 1.5.1 per la sua definizione). molare χ Il limite della trattazione classica del diamagnetismo sta nel fatto che si assume che la direzione del campo magnetico esterno sia un asse di simmetria del sistema e questo non è in genere vero per sistemi molecolari complessi. Per questa ragione deve essere applicata la teoria generale del diamagnetismo e del paramagnetismo formulata da Van Vleck. Tale teoria si basa su leggi quantistiche e riproduce sotto particolari condizioni il risultato classico di Langevin. Discuteremo tale teoria nel paragrafo 1.4. 1.3 Teoria classica del paramagnetismo: equazione di Langevin e legge di Curie In generale, il paramagnetismo di una sostanza origina dal moto degli elettroni attorno ai nuclei di ciascun atomo ed è quindi denominato paramagnetismo elettronico. Occorre tenere presente che si ha anche un paramagnetismo nucleare associato al moto dei protoni e dei neutroni attorno al nucleo la cui entità è molto minore rispetto a quello elettronico a causa della massa dei protoni e dei neutroni che risulta molto maggiore rispetto a quella degli elettroni. Si ha paramagnetismo elettronico nelle seguenti classi: 7 a) Atomi, molecole e difetti reticolari con un numero dispari di elettroni. Infatti lo spin totale non può essere nullo. b) Atomi liberi e ioni con un orbitale più interno parzialmente occupato. Appartengono a questa classe gli elementi di transizione (es. ferro (Fe), cobalto (Co), nichel (Ni), rame (Cu), manganese (Mn)), elementi delle terre rare (es. lantanio (La), cerio (Ce), samario (Sm), gadolinio (Gd)) e degli attinoidi (es. torio (Th), uranio (U), plutonio (Pu)). c) Alcuni composti aventi un numero pari di elettroni incluso l’ossigeno molecolare (non atomi singoli). d) I metalli (es. sodio (Na), potassio (K), calcio (Ca)) esclusi i metalli di transizione appartenenti al gruppo b). Le sostanze paramagnetiche sono caratterizzate da atomi ciascuno dei quali ha un definito momento magnetico, ma i momenti magnetici non interagiscono fra di loro. Risultano quindi nulle sia l’interazione di scambio che l’interazione dipolare che verranno discusse nei paragrafi 2.1 e 2.2 per le sostanze ferromagnetiche. Deriviamo ora l’equazione di Langevin per il paramagnetismo classico. Supponiamo di avere un mezzo (paramagnete) contenente N atomi ciascuno dei quali con momento magnetico μ . In un mezzo paramagnetico la magnetizzazione totale si media a zero a causa del disordine termico. Se viene applicato un campo magnetico esterno, oltre al piccolissimo effetto diamagnetico, i momenti magnetici degli atomi tendono ad allinearsi lungo la direzione del campo. L’energia d’interazione di ciascun atomo con il campo H è data da E = − μ ⋅ H = − μ H cos θ (1.10) dove θ è l’angolo compreso fra il momento magnetico ed il campo magnetico esterno. Ciò equivale ad affermare che un dipolo magnetico di momento μ , se immerso in un campo magnetico H , acquisisce un’energia pari ad E = − μ ⋅ H . In figura è rappresentata la direzione arbitraria del momento magnetico del generico atomo rispetto al campo magnetico esterno. 8 H μ z θ y φ x Per il calcolo della magnetizzazione Langevin seguì lo stesso tipo di calcolo effettuato da Debye per calcolare la polarizzabilità per orientazione in un dielettrico. In particolare si può definire la magnetizzazione del paramagnete nella forma M = N μ 〈 cos θ 〉 V (1.11) dove N è il numero di atomi supposti non interagenti e V è il volume del mezzo paramagnetico. 〈...〉 indica la media delle possibili orientazioni del generico atomo rispetto al campo magnetico nell’elemento di angolo solido d Ω = sin θ dθ dφ calcolata rispetto alla distribuzione classica di probabilità di Boltzmann all’equilibrio, cioè 2π 〈 cos θ 〉 = ∫ 0 π dφ ∫ dθ sin θ cos θ e − β E 2π 0 π ∫ dφ ∫ dθ sin θ e 0 −β E 0 dove φ è l’angolo azimutale e θ è l’angolo polare; β = 1/ k BT con k B costante di Boltzmann. Sostituendo ad E l’espressione data in Eq.(1.10) ed integrando in φ a numeratore ed a denominatore si ottiene π cos θ = ∫ dθ sin θ cos θ e 0 π ∫ dθ sin θ e βμ H cosθ βμ H cosθ 0 9 L’integrale si risolve per sostituzione di variabile, cioè si pone t = cosθ per cui dt = − sin θ dθ ; quindi per θ = 0 si ha t = 1 e per θ = π si ha t = −1 . Conviene anche effettuare la sostituzione x = βμ H . Si ottiene −1 〈 cos θ 〉 = ∫ −dt t e 1 tx 1 −1 ∫ −dt e = ∫ dt t e −1 1 ∫ dt e tx tx tx = f ′( x) f ( x) = d ⎡ ln f ( x ) ⎤⎦ = dx ⎣ −1 1 1 1 ⎞ ⎤ d ⎡ ⎛ et x ⎞ ⎤ d ⎡ ⎛ e x − e − x ⎞ ⎤ d ⎡ ⎛ tx ⎢ ln ⎜ ⎟⎥ = = ⎢ ln ⎜ dt e ⎟ ⎥ = ⎢ ln ⎜ ⎟⎥ = ⎜ ⎟ dx ⎢⎣ ⎝ −∫1 dx x dx x ⎢ ⎥ ⎠⎦ ⎠ ⎥⎦ ⎣ ⎝ −1 ⎠ ⎦ ⎣ ⎝ d ⎡ −x x ⎤ = d ⎡ ln e x − e − x ⎤ − d [ ln x ] = = − − ln ln e e x ⎦ dx ⎣ ⎦ dx dx ⎣ 1 e x + e− x 1 = x − x − = coth x − e −e x x ( ) ( ) Nel primo passaggio si è cambiato segno sia a numeratore che a denominatore scambiando così gli 1 1 1 d d estremi di integrazione e si è posto ∫ dt e = f ( x ) così che f ′ ( x ) = f ( x ) = ∫ dt et x = ∫ dt tet x dx dx −1 −1 −1 tx dove si è scambiato l’integrale con l’operazione di derivazione a causa della continuità della funzione integranda. Si è, quindi, applicata la regola di derivazione della funzione logaritmo naturale f ′( x) d a ⎡⎣ ln f ( x ) ⎤⎦ = . Si è poi sfruttata una proprietà del logaritmo, cioè ln = ln a − ln b b dx f ( x) e si è infine tenuto conto dell’identità trigonometrica e x + e− x = coth x dove coth è la cotangente e x − e− x iperbolica. La funzione L( x) = coth x − 1 x (1.12) è la FUNZIONE di LANGEVIN disegnata in figura. L ( x ) è una funzione compresa fra 0 ed 1. In particolare, L ( x ) è una funzione monotona crescente di x e tende ad 1 al crescere di x, cioè al crescere del rapporto H/T . 10 1.0 L(x) 0.8 0.6 0.4 0.2 0 2 4 x 6 8 10 Quindi, sostituendo nell’espressione della magnetizzazione di Eq.(1.11), si ricava M= N μ L ( x) V (1.13) Eq.(1.13) rappresenta l’EQUAZIONE di LANGEVIN. Essa esprime l’andamento della magnetizzazione di una sostanza PARAMAGNETICA ricavato per via classica. La magnetizzazione è parallela al campo magnetico ed ad esempio cresce al crescere del campo magnetico esterno a fissata temperatura. Per x<<1 con x = βμ H si può sviluppare in serie la funzione cotangente iperbolica, cioè coth x 1 x + + O ( 3) e si ottiene per la funzione di Langevin L ( x ) x 3 x . Occorre tenere presente 3 che la condizione x<<1 si realizza ad una temperatura di poco maggiore di 1 K (a maggior ragione quindi alla temperatura ambiente a cui avvengono gli esperimenti) per un campo magnetico di intensità H dell’ordine di 104 G facilmente ottenibile in laboratorio. Quindi la magnetizzazione risulta M N x μ . Sapendo che β = 1/ k BT si ricava V 3 M N μ2H V 3k BT (1.14) La suscettività magnetica in questo limite risulta 11 M χ= H N μ2 C = V 3k BT T Eq.(1.15) prende il nome di LEGGE di CURIE. La costante C = (1.15) N μ2 è la costante di Curie ed ha V 3k B le dimensioni di una temperatura. La suscettività di un paramagnete espressa in Eq.(1.15) è una grandezza scalare, adimensionale, positiva ed inversamente proporzionale alla temperatura. Inoltre, in virtù dell’approssimazione effettuata, non dipende dal campo magnetico esterno. E’ da notare che la suscettività di Eq.(1.15) si sarebbe potuta ottenere anche applicando la definizione più generale di Eq.(1.3). La suscettività paramagnetica è mediamente dell’ordine di 10-4÷10-5 anche se raggiunge valori più alti a bassa temperatura. Come per la suscettività diamagnetica, sperimentalmente viene molare espressa in cm3/mole (si veda il paragrafo 1.5.1 misurata la suscettività magnetica molare χ per la sua definizione). 1.4 Teoria quantistica del paramagnetismo Discutiamo in questo paragrafo la teoria quantistica del paramagnetismo. Si è visto nel paragrafo 1.2 che ad un elettrone, che descrive un’orbita circolare facendo una precessione attorno al campo magnetico H con frequenza angolare ω L detta frequenza di Larmor, è associata un’intensità di corrente iL = e ω L / 2π c in analogia con il caso della spira percorsa da corrente e ad essa, a sua volta, un momento magnetico. Analogamente, definito con ρ il raggio dell’orbita circolare, l’intensità del momento magnetico orbitale di un elettrone associato alla rotazione dell’elettrone con frequenza angolare ω attorno al nucleo, dato ancora dal prodotto dell’intensità di corrente i = e ω / 2π c per l’area dell’orbita, è espressa da μeorbitale = ( eω / 2π c ) π ρ 2 da cui si ricava immediatamente che μeorbitale = e / 2c ω ρ 2 . In questo caso ω non è la frequenza angolare di Larmor, ma la frequenza angolare di rotazione dell’elettrone attorno al nucleo presente in assenza di un campo magnetico applicato. Sapendo che l’intensità del momento angolare orbitale dell’elettrone 2 di velocità v per un moto circolare vale l = mvρ = mω ρ , poiché v = ωρ si trova che ω ρ 2 = l / m e quindi che μeorbitale = e l . Poiché la corrente equivalente è opposta al moto 2m c 12 dell’elettrone, l’orientazione del momento magnetico orbitale è opposta a quella del momento angolare orbitale. In forma vettoriale si scrive quindi μeorbitale = − e l 2mc La direzione di μeorbitale è la stessa di l , ma il verso è opposto come schematizzato in figura. La costante γ orbitale =− e è il rapporto giromagnetico orbitale coincidente con quello già definito 2mc nel paragrafo 1.2 (a meno del segno -) per un corpo rigido (elettrone) che ruota attorno al campo magnetico esterno alla frequenza angolare ωL di Larmor. In questo ambito si può attribuire a tale grandezza un significato fisico ben preciso definendo γ orbitale come il rapporto fra il momento magnetico orbitale di un elettrone ed il corrispondente momento angolare orbitale, cioè γ orbitale = μeorbitale l . Come si nota, la relazione fra momento magnetico orbitale e momento angolare orbitale è stata ricavata basandosi su leggi di meccanica classica. Essa continua a rimanere valida anche in meccanica quantistica per un moto arbitrario di un elettrone con momento angolare l elevato a rango di operatore vettoriale. Teniamo per semplicità come notazione per un operatore vettoriale la stessa usata per un vettore sottintendendo d’ora in avanti che sia sottinteso anche il simbolo operatoriale “∧”. Per ragioni dimensionali si deve sostituire il vettore l con l dove = h / 2π (h è la costante di Planck) ha le dimensioni di un momento angolare. Occorre poi aggiungere il 13 momento magnetico di spin che invece può essere spiegato solo nell’ambito della meccanica spin quantistica e che vale μe = − g 0 e s dove g 0 è il fattore di Landè dell’elettrone (si veda dopo 2mc per una discussione). E’ quindi possibile definire il rapporto giromagnetico associato allo spin dell’elettrone come il rapporto fra l’operatore momento magnetico di spin μespin e l’operatore momento angolare di spin s , cioè γ spin = μespin s spin =− da cui si ricava γ g0e . 2mc Combinando insieme il momento magnetico orbitale e quello di spin del singolo elettrone si trova il ( ) orbitale + μespin = −e / 2mc l + g 0 s . momento magnetico totale del singolo elettrone, cioè μe = μe Sommando i momenti magnetici di tutti gli elettroni appartenenti ad uno ione (atomo) si ricava il ( ) momento magnetico totale di uno ione (atomo), cioè μ = μ orbitale + μ spin = −e / 2mc L + g 0 S con μ orbitale = ∑ μeorbitale e μ spin = ∑ μespin . L’operatore i i L è la somma dei momenti angolari orbitali ∑ l , mentre l’operatore S è la somma dei momenti angolari di spin i i degli elettroni, cioè L= i i degli elettroni, cioè S= ∑s . i Le definizioni del rapporto giromagnetico orbitale e di spin i rimangono valide anche considerando il momento magnetico orbitale e di spin del singolo atomo ed i corrispondenti momenti angolari orbitali e di spin del singolo atomo, purchè si sostituisca ad s la quantità S e ad l la quantità L. Il momento magnetico totale si può riscrivere come μ = − ge / 2mc J (si veda il paragrafo 1.5.1 per una dimostrazione qualitativa usando il teorema di Wigner-Eckart). La grandezza g prende il nome di fattore di separazione spettroscopico o fattore di Landè ed è dato da g =1+ J ( J + 1) + S ( S + 1) − L ( L + 1) 2 J ( J + 1) . Per lo spin elettronico si ottiene, in presenza di correzione α ⎛ ⎞ + … ⎟ , con α relativistica, g 0 = 2 ⎜ 1 + ⎝ 2π ⎠ 1 costante di struttura fine, 137 che fornisce g 0 = 2.0023 (valore calcolato da Dirac) e che viene approssimato al valore g 0 = 2 . Si nota quindi che il rapporto giromagnetico di spin γ spin è il doppio di quello orbitale γ orbitale . Tale risultato non deve sorprendere, perché γ spin viene calcolato mediante leggi quantistiche e non ha un analogo classico. Quindi, solo figurativamente lo spin di un elettrone può essere pensato come originato dalla rotazione dell’elettrone attorno a se stesso. L’operatore J = L + S è l’operatore momento 14 angolare totale dato dalla somma vettoriale dell’operatore momento angolare orbitale e dell’operatore momento angolare di spin. Definendo la quantità μ B = e / 2 mc magnetone di Bohr il momento magnetico di un atomo assume la forma μ = − g μB J (1.16a) In particolare μ B = 0.927 ×10−20 erg/G . Si può riscrivere Eq.(1.16a) nella forma μ =γ J con γ = − (1.16b) ge , rapporto giromagnetico definito come il rapporto fra il momento magnetico totale 2m c μ del singolo atomo ed il momento angolare totale, cioè γ = J . Si dimostra facilmente che le dimensioni del rapporto giromagnetico, sia esso orbitale, di spin o totale sono nel sistema C.G.S.[s-1 G-1] oppure [s-1 Oe-1]. Basta scrivere il rapporto fra le dimensioni del momento magnetico e quelle del momento angolare tenendo presente che il momento angolare ha le dimensioni di un’azione cioè ⎡ erg ⎤ ⎡ μ ⎤ ⎢ G ⎥ = ⎡s -1 G -1 ⎤ . Poiché 1 G = 1 Oe si può anche di un’energia per un tempo, cioè ⎢ ⎥ = ⎦ ⎢ erg s⎥ ⎣ J ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ scrivere ⎡⎣s -1 Oe-1 ⎤⎦ . E’ possibile ricavare questo risultato anche tenendo presente l’espressione del rapporto giromagnetico che può essere riscritto in forma compatta come γ = − ge con g = 1 se il 2m c rapporto giromagnetico è orbitale, g = g0 = 2 se è di spin e 1 ≤ g ≤ 2 se è totale. Infatti, nel sistema C.G.S. si ha ⎡ g 12 cm 3 2 s-1 ⎤ 3 1 ⎡ ⎤ e -1 ⎡ ⎤ ⎡g− 12 cm 12 ⎤ = ⎡G−1s−1 ⎤ . ⎥ = [e] = ⎢⎣g 2 cm 2 s ⎥⎦ per cui ⎢ ⎥ = ⎢ -1 ⎦ ⎥⎦ ⎣ ⎣ mc ⎦ ⎢⎣ g cm s ⎥⎦ ⎢⎣ L’ultima uguaglianza viene dal fatto che G = erg1/2/ cm3/2. Esplicitando le dimensioni di 1 erg si −1 ottiene G = g1/2 cm-1/2s-1 che può essere riscritta come g 2 1 cm 2 = G−1s−1 . Le dimensioni della carica e si ottengono a partire ad esempio dalla forza di Coulomb espressa nel sistema C. G. S., cioè F = e2/r2 da cui e = F1/2 r. Esplicitando le dimensioni della forza, cioè [F ] = [g cm s-2 ] si ottengono facilmente le dimensioni di e. È interessante ricavare l’equazione di Brillouin per la teoria quantistica del paramagnetismo. Essa rappresenta l’equivalente quantistico dell’equazione classica di Langevin (cf. Eq.(1.13)). Supponiamo di avere un atomo che possiede il momento magnetico espresso in Eq.(1.16) appartenente ad una sostanza paramagnetica e di porlo in un campo magnetico. In base a ciò si assume che l’atomo del paramagnete abbia già un momento magnetico permanente diverso da zero 15 anche in assenza di campo. Indicato con J il numero quantico del momento angolare totale lo stato fondamentale avrà un determinato valore di J. Esso si trova mediante le regole di Hund trascurando il contributo degli altri termini del multipletto associati a stati eccitati e vale J = L − S ,..., L + S . Ciò è realistico se la differenza fra l’energia del primo stato eccitato J ′ e quella dello stato fondamentale soddisfa la condizione EJ ′ − EJ >> k BT . Se è rispettata questa condizione si trascura l’influenza che gli stati eccitati ad energia più elevata hanno sullo stato fondamentale. Lo stato fondamentale è 2J+1 volte degenere ed è l’unico stato termicamente eccitato. Per effetto di un campo magnetico viene rimossa tale degenerazione (effetto Zeeman) ed il livello fondamentale si splitta in 2J +1 livelli pari al numero di valori assunti dal numero quantico mj = -J, -J + 1,…, J - 1, J. Il numero quantico mj è il numero quantico magnetico del momento angolare totale ed è quindi associato alla proiezione del momento angolare totale lungo la direzione z ( J z ) individuata dal campo magnetico. Si può poi considerare un insieme di atomi (ioni) identici sottoposti all’azione di un campo magnetico. Lo scopo è quello di ricavare l’espressione della magnetizzazione corrispondente. Essa si potrebbe determinare direttamente a partire dal momento magnetico definito in Eq.(1.16). Infatti per magnetizzazione si intende la densità di momento magnetico o momento magnetico per unità di μ volume, cioè M = V nell’ipotesi di un mezzo magnetizzato uniformemente. Tuttavia, tale approccio non porterebbe ad un risultato rilevante da un punto di vista fisico. Quindi, per derivarla si utilizza un metodo di meccanica statistica che tiene conto dell’energia quantizzata. In primo luogo si esprime l’energia libera del sistema. L’energia libera di Helmholtz vale F = − k BT ln Z dove J Z è la funzione di partizione del sistema espressa in questo caso nella forma Z = ∑eβ − Ej con m j =− J E j = − μ ⋅ H = g μ B H m j energia quantizzata dello stato j-esimo del sistema dovuta alla presenza del campo magnetico assunto applicato lungo z in cui compare il numero quantico m j associato a J z . J Sostituendo le espressioni di Z e di Ej in F si ha F = −k BT ln ∑eβ − g μB H m j da cui m j =− J J −β F = ln ∑eβμ m j =− J − g BH mj ; quest’ultima uguaglianza si ottiene dividendo per k BT , ponendo 1/ k BT = β e cambiando segno ad entrambi i membri. Applicando la funzione esponenziale a primo 16 ed a secondo membro dell’ultima uguaglianza si ottiene e −β F J = ∑eβμ − g BH mj . Questa è ancora m j =− J una definizione dell’energia libera, ma espressa in forma esponenziale. La forma scritta risulta utile per i calcoli seguenti, poiché, come si può notare, l’energia libera è espressa mediante una serie geometrica convergente avente un numero finito di termini. La serie scritta si può quindi agevolmente sommare. Infatti, la ragione di tale serie vale q = e− β γ H < 1 dove γ = g μ B . A partire dalla regola generale di somma delle serie geometriche con un numero finito di termini la serie data J ∑ si può riscrivere come q mj = m j =− J q − J − q J +1 . Per dimostrare l’uguaglianza scritta occorre in primo 1− q luogo riscrivere la sommatoria di una serie geometrica di ragione q costituita da un numero finito di termini che richiama la serie data spezzando la sommatoria in due sommatorie, cioè scrivendo n ∑ qk = k =− n −1 ∑ qk + k =− n n ∑q k dove la ragione nella prima sommatoria ha esponenti negativi, mentre nella k =0 seconda sommatoria ha esponenti positivi incluso lo zero. Se si considera la prima serie a secondo membro conviene moltiplicarla per (1-q) ed esplicitare la sommatoria, cioè scrivere: −1 (1 − q ) ∑ q k k =− n ( = q −n +q − n +1 + .... + q −1 −q − n +1 − ... − q −1 ) ( −1 = q −n ) −1 −1 da cui ∑ qk = k =− n q −n − 1 . 1− q Analogamente, considerando la seconda serie, moltiplicandola per (1 - q) ed esplicitando la n sommatoria si ottiene: (1 − q ) ∑ q k k =0 n ∑q k =0 n ∑ k =− n k = 1 − q n +1 . 1− q qk = ( ) ( = 1 + q + q 2 + .... + q n − q − q 2 ... − q n − q n +1 = 1 − q n +1 ) da cui Sostituendo i risultati ricavati per entrambe le sommatorie si ricava q − n − 1 1 − q n +1 q − n − q n +1 + = . Nel caso specifico si deve sostituire all’indice n intero, 1− q 1− q 1− q l’indice J che può essere anche frazionario per multipli di ½ e scrivere, senza perdita di generalità, l’uguaglianza iniziale. −β F = Quindi si ha anche che e ed a denominatore per q −1/ 2 q − J − q J +1 . Conviene moltiplicare a secondo membro a numeratore 1− q −β F = e si ottiene e − J +1/ 2 ) J +1/ 2 ) q ( − q( q −1/ 2 − q1/ 2 . Sostituendo il valore di q = e− β γ H si trova che 17 e −β F = e β γ H ( J +1/ 2) −e − β γ H ( J +1/ 2) e β γ H / 2 − e− β γ H / 2 (1.17) A partire da questa espressione si ricava l’energia libera F applicando la funzione logaritmo naturale sia a primo che a secondo membro, dividendo per β e cambiando di segno entrambi i membri, cioè F =− =− 1 β ln ( f ( H ) + g ( H ) ) − e− ( f ( H ) + g ( H ) ) e g H −g H e ( ) −e ( ) = ( ) 1 ⎡ ⎛ ( f ( H ) + g ( H )) −( f ( H ) + g ( H )) ⎞ g H −g H ⎤ −e − ln e ( ) − e ( ) ⎥ ⎢ln ⎜ e ⎟ β⎣ ⎝ ⎠ ⎦ (1.18) dove si è posto f ( H ) = β γ H J e g ( H ) = β γ H / 2 . A partire dall’energia libera F scritta per un sistema magnetico, è possibile dare la definizione di magnetizzazione M in ambito di meccanica statistica e determinarla. Il primo principio della termodinamica espresso in forma differenziale vale dQ = dU + dW dove dQ è la variazione infinitesima di calore, dU la variazione infinitesima di energia interna e dW il lavoro infinitesimo. Tenendo presente la relazione fra dQ e la variazione infinitesima di entropia dS si può scrivere dQ = T dS da cui dU = TdS − dW . Per un sistema magnetico il lavoro infinitesimo si può scrivere nella forma dW = μ dH da cui dU = TdS − μ dH . D’altra parte l’energia libera di Helmholtz F = U − T S espressa in forma differenziale è data da dF = dU − TdS − S dT . Sostituendo l’espressione di dU dentro dF si ricava dF = − μ dH − S dT per cui si ha che ⎛ ∂F ⎞ 1 ⎛ ∂F ⎞ da cui M = − ⎜ . Se si considerano N ioni (atomi) indipendenti si ottiene ⎟ V ⎝ ∂H ⎟⎠T ⎝ ∂H ⎠T μ = −⎜ M =− N V ⎛ ∂F ⎞ ⎜ ∂H ⎟ ⎝ ⎠T (1.19) Eq.(1.19) rappresenta la definizione termodinamica della magnetizzazione per un sistema di N ioni (atomi) dove la derivata rispetto ad H è fatta a temperatura T costante. Non è permesso in questo caso eguagliare l’energia libera alla variazione di energia ΔE0, dovuta al campo magnetico H, dello stato fondamentale che è 2 J +1 volte degenere. Non si può cioè porre F = U – T S = ΔE0, uguaglianza che può essere assunta valida solo per T→0. Infatti, la separazione in energia fra due livelli adiacenti appartenenti ai 2 J+1 livelli per effetto dell’applicazione di un campo magnetico esterno (corrispondenti allo stato fondamentale) risulta piccola rispetto all’energia termica kBT non 18 Δ Multipletto di 2 J+1 livelli Δ: separazione in energia fra due livelli adiacenti Ej : energia dello stato fondamentale Δ << kB T appena il campo magnetico esterno va a zero. In Figura è rappresentato schematicamente l’ordine di grandezza delle energie in gioco. Ciò implica che la temperatura T non può essere considerata tendente a zero. Sostituendo in Eq.(1.19) l’energia libera di Helmholtz data in Eq.(1.18) si ricava ( ) ⎞ ∂ ⎡ ⎛ ( f ( H ) + g ( H ) ) −( f ( H ) + g ( H ) ) ⎞ g H −g H ⎤ −e − ln e ( ) − e ( ) ⎥ = ⎟ ⎢ln ⎜ e ⎟ ⎠ ⎠ ∂H ⎣ ⎝ ⎦ N ∂ ⎡ ⎛ ( f ( H ) + g ( H ) ) −( f ( H ) + g ( H ) ) ⎞ ⎤ N ∂ ⎡ g H −g H = −e ln e ( ) − e ( ) ⎤⎥ = ⎢ln ⎜ e ⎥− ⎟ ⎢ β V ∂H ⎣ ⎝ ⎦ ⎠ ⎦ β V ∂H ⎣ M =− = N βV N = βV N⎛ 1 ⎜− V ⎝ β ( ( f ′ ( H ) + g′ ( H ) ) ⎛⎜⎝ e( f ( H )+ g ( H )) + e−( f ( H )+ g ( H )) ⎞⎟⎠ e ( f ( H ) + g ( H ) ) − e −( f ( H ) + g ( H ) ) ( β γ J + β γ / 2) ⎜⎛ e( f ( H )+ g ( H ) ⎝ e − ) N βV ( g H −g H g′( H ) e ( ) + e ( ) g H −g H e ( ) −e ( ) ( ) + e −( f ( H ) + g ( H ) ) ⎞ )= ) g H −g H β γ /2 e ( ) +e ( ) ⎟ ⎠− N = g H −g H βV e ( ) −e ( ) ( f ( H ) + g ( H ) ) − e −( f ( H ) + g ( H ) ) N N ( β γ J + β γ / 2 ) coth f ( H ) + g ( H ) − ( β γ / 2 ) coth g ( H ) = βV βV N = ⎡( γ J +γ / 2 ) coth f ( H ) + g ( H ) − γ / 2coth g ( H ) ⎤ = ⎦ V⎣ N = γ J ⎡( 1 +1/ 2 J ) coth f ( H ) + g ( H ) − 1/ 2 J coth g ( H ) ⎤ = ⎣ ⎦ V ( = ( ) ( ⎡⎛ N γ J ⎢⎜ V ⎣⎝ ⎡⎛ N = γ J ⎢⎜ V ⎣⎝ = = ) ( ( ) ) ) ( ) ⎤ 2J + 1 ⎞ 1 coth ( β γ JH + β γ H / 2 ) − coth ( β γ H / 2 ) ⎥ = ⎟ 2J ⎠ 2J ⎦ ⎤ 2J + 1 ⎞ 1 coth ( β γ JH / 2 J ) ⎥ = ⎟ coth β γ JH (1 + 1/ 2 J ) − 2J ⎠ 2J ⎦ ( ) ⎡⎛ 2 J + 1 ⎞ N ⎛ 2J + 1 ⎞ 1 ⎛ 1 γ J ⎢⎜ x⎟ − coth ⎜ ⎟ coth ⎜ V ⎝ 2J ⎠ 2J ⎝ 2J ⎣⎝ 2 J ⎠ ⎞⎤ x ⎟⎥ ⎠⎦ 19 dove l’apice ' indica la derivata fatta rispetto ad H. Si è cioè applicata la regola di derivazione del F ′ (G ( x )) G′ ( x ) logaritmo naturale di una funzione composta, cioè si è scritto D ⎣⎡ln ⎣⎡ F ( G ( x ) ) ⎦⎤ ⎦⎤ = F (G ( x )) con H al posto di x. Nei passaggi intermedi si è utilizzata l’identità trigonometrica f x −f x e ( ) +e ( ) f x −f x e ( ) −e ( ) = coth ⎡⎣ f ( x ) ⎤⎦ dove il simbolo coth indica cotangente iperbolica. Nell’ultimo passaggio si è invece posto β γ J H = x con β = 1/ kBT La magnetizzazione della sostanza PARAMAGNETICA risulta quindi: M = N γ JBJ ( x ) V (1.20) dove BJ ( x ) è la FUNZIONE di BRILLOUIN definita come: BJ ( x ) = 2J + 1 ⎛ 2J + 1 ⎞ 1 ⎛ 1 ⎞ coth ⎜ coth ⎜ x⎟ − x⎟ 2J 2 2 2 J J J ⎝ ⎠ ⎝ ⎠ (1.21) Eq.(1.20) con la funzione BJ ( x ) data da Eq.(1.21) è l’EQUAZIONE di BRILLOUIN. Essa rappresenta l’andamento della magnetizzazione di una sostanza PARAMAGNETICA ricavata per via quantistica. E’ quindi l’equivalente quantistico dell’equazione classica di Langevin del paramagnetismo (cf. Eq.(1.13)). L’andamento grafico della funzione di Brillouin è qualitativamente simile a quello della funzione classica di Langevin (cf. Eq.(1.12)), cioè essa ha un andamento monotono crescente al crescere del rapporto H/T. Anche la funzione di Brillouin è compresa fra 0 ed 1. Tuttavia, poiché BJ ( x ) è stata derivata quantisticamente, a fissato x si avranno diverse curve corrispondenti ai diversi valori di J assunti dal momento angolare totale al variare dello stato fondamentale del materiale paramagnetico studiato. Questo comportamento la differenzia dalla funzione classica di Langevin la quale è rappresentata da curve che risultano diverse al variare del materiale paramagnetico preso in esame senza che sia esplicita la dipendenza da J. La funzione di Brillouin è disegnata in figura per tre valori di J, cioè per J = 1/2, J = 3/2 e J = 5/2. Essa descrive il comportamento paramagnetico di ioni di metalli contenuti in solidi. 20 0 Bj(x) 1 2 3 1 J = 1/2 J = 3 /2 J = 5/2 0.5 0 0 1 2 3 x Risulta interessante studiare l’andamento della magnetizzazione nel limite di x<<1 che significa γH kBT e corrisponde molto spesso al caso reale. Infatti, la quantità γ H / k B ≈ 1 K per un campo di 104 G usato comunemente negli esperimenti. Tenendo conto che gli esperimenti sono effettuati a temperatura ambiente la condizione x<<1 è facilmente realizzabile. Sviluppando fino al secondo coth y ordine entrambe le cotangenti iperboliche di Eq.(1.20), cioè scrivendo 1 y 1 2J + 1 + + O(3) con y = x per il secondo termine x per il primo termine e y = y 3 2J 2J si ricava BJ ( x ) 2J +1 ⎛ 2J 1 2J +1 x ⎞ 1 + − 2 J ⎜⎝ 2 J + 1 x 2 J 3 ⎟⎠ 2 J 1 1 x⎞ ⎛ ⎜ 2J x + 2J 3 ⎟ = ⎝ ⎠ 2 1 ⎛ 2J + 1 ⎞ x 1 1 x ⎛ 4 J 2 + 4 J + 1 − 1 ⎞ x J ( J + 1) x = +⎜ − − =⎜ ⎟ = ⎟3 x ⎝ 2 J ⎟⎠ 3 x 4 J 2 3 ⎜⎝ 3 4J 2 J2 ⎠ Sostituendo questa espressione approssimata di BJ ( x ) nell’espressione di M di Eq.(1.20) si ottiene ricordando che γ = g μB e che β γ J H = x con β = 1/ k BT . 21 J ( J + 1) x N J ( J + 1) g J μ B H N g μB J g J μ = = B V 3 V 3k BT J2 J2 N H = g 2 μ B 2 J ( J + 1) V 3k BT M A partire dalla definizione termodinamica della magnetizzazione M = − N ⎛ ∂F ⎞ si ricava la V ⎜⎝ ∂H ⎟⎠T N ⎛ ∂2F ⎞ suscettività del sistema, cioè χ = − ⎜ ⎟ essendo χ = ∂M / ∂H . Nel caso specifico basta V ⎝ ∂H 2 ⎠T ricavarla come χ = M / H , poichè la magnetizzazione è lineare in H ottenendo N 2 2 1 g μ B J ( J + 1) V 3k BT χ Se si definisce la quantità adimensionale peff = g J ( J + 1) come numero efficace di magnetoni di Bohr si ha χ 2 μ B2 N peff V 3k BT (1.22) Eq.(1.22) rappresenta la LEGGE di CURIE per un sistema di ioni (atomi) non interagenti. Essa esprime, anche per il caso quantistico, una suscettività inversamente proporzionale alla temperatura 2 2 T con C = N / V peff μ B / 3k B costante di Curie avente le dimensioni di una temperatura. Eq.(1.22) rimane valida (con qualche piccola eccezione) per descrivere la suscettività di tali ioni quando fanno parte di una struttura più complessa come un solido. Anche l’espressione della suscettività di Eq.(1.22) ottenuta nell’approssimazione x <<1 è molto simile a quella ottenuta classicamente seguendo la stessa approssimazione (cf. Eq.(1.15)). La differenza fondamentale sta nel fatto che in questo caso il momento magnetico può essere definito come μeff = peff μ B , cioè come il prodotto fra il magnetone di Bohr μ B ed un numero decimale peff . Il momento magnetico varia in relazione alla sostanza paramagnetica considerata rappresentata ad esempio da uno ione trivalente del gruppo delle terre rare (lantanidi) all’interno di un cristallo isolante oppure da uno ione del gruppo del ferro (fra gli elementi di transizione) all’interno di un composto salino come l’allume ferrico di ammonio. Ciò è in questo caso una diretta conseguenza della sua derivazione quantistica che porta a definire un numero efficace peff di magnetoni di Bohr. 22 Si possono anche ricavare gli andamenti della magnetizzazione e della suscettività magnetica quando gli elettroni di ogni atomo e quindi gli atomi stessi non sono tutti nello stato fondamentale. Ad esempio M e χ si possono ricavare nel caso in cui la differenza fra l’energia del livello fondamentale J e quella del primo livello eccitato J ′ soddisfa alla condizione EJ ′ − EJ ≈ k BT , cioè è dello stesso ordine di grandezza di k BT ; M e χ si possono ricavare anche nel caso opposto a quello discusso precedentemente, cioè quando EJ ′ − EJ << k BT . Gli andamenti della magnetizzazione e della suscettività che si ricavano sono molto simili a quelli riferiti al caso studiato. Quando EJ ′ − EJ << kBT si deve anche tenere conto della distribuzione degli atomi sui diversi livelli energetici (livello fondamentale e livelli eccitati) corrispondenti ai diversi termini di multipletto (ad es. i termini di multipletto J = L − S ,..., L + S per lo stato fondamentale, i termini di multipletto J ′ = L′ − S ′ ,..., L′ + S ′ per il primo stato eccitato e così via) degli atomi del paramagnete. 1.5 Teoria quantistica del paramagnetismo: teoria perturbativa di Van Vleck Il modello di Van Vleck è un modello molto raffinato basato sulla teoria perturbativa indipendente dal tempo che rappresenta un potente strumento matematico per studiare i sistemi quantistici. Lo scopo è quello di ricavare mediante la teoria perturbativa la variazione di energia di un paramagnete e da essa la suscettività magnetica. In presenza di un campo magnetico esterno supposto uniforme, cioè H ( r ) = H occorre modificare l’operatore Hamiltoniano del sistema trattato secondo la meccanica quantistica. In primo luogo nell’espressione dell’operatore energia cinetica totale associata al moto degli elettroni si deve tenere conto della presenza di H . L’operatore vettoriale momento pi dell’i-esimo elettrone di carica –e che entra a far parte dell’operatore energia cinetica deve essere sostituito da e ⎛ e ⎞ pi′ → pi − ⎜ − A ( ri ) ⎟ → pi + A ( ri ) c ⎝ c ⎠ dove A ( ri ) è il potenziale vettore dipendente dalla posizione ri dell’i-esimo elettrone. Consideriamo l’equazione ∇ ⋅ H = 0 dove ∇ è l’operatore divergenza che esprime la solenoidalità del campo H . Tale equazione è una delle equazioni di Maxwell ed è sempre valida. In virtù dell’ 23 equazione ∇ ⋅ H = 0 si può introdurre un vettore A , detto potenziale vettore, tale che H = ∇ × A dove ∇× è l’operatore rotazionale. Infatti, in base ad una semplice regola di calcolo vettoriale, la divergenza del rotazionale di un generico vettore è sempre nulla. In presenza di un campo magnetico uniforme si trova, a partire dalla relazione H = ∇ × A , che il potenziale vettore A ( ri ) per l’i-esimo elettrone può essere espresso nella forma 1 A ( ri ) = − ri × H 2 e A ( ri ) ha le dimensioni di un momento esplicitando le c Si dimostra facilmente che la quantità dimensioni di A ( ri ) , cioè −1 ⎡ 1 ⎤ ⎡⎣ A⎤⎦ = ⎢g 2cm 2 s-1cm⎥ ⎣ ⎦ 1 ⎤ ⎡ erg 2 ⎥ ⎡ 1 2 − 1 2 -1 ⎤ = g cm s cm⎥ ⎡⎣H ⎤⎦ = ⎡⎣Oe⎤⎦ = ⎢ 3 ⎥ ⎢ ⎢ ⎣ ⎦ 2 cm ⎣⎢ ⎦⎥ ⎡e ⎢ ⎣c . Infatti, essendo le dimensioni del campo esterno facendo l’analisi dimensionale si ottiene 3 1 −1 ⎡ 1 ⎤ ⎤ ⎢ g 2cm 2 s-1g 2cm 2 s-1cm ⎥ ⎡ = g cm s-1⎤ . A⎥ = ⎦ ⎥ ⎣ cm s-1 ⎦ ⎢ ⎣⎢ ⎦⎥ Per dimostrare che 1 A ( ri ) = − ri × H conviene semplificare la descrizione prendendo il campo 2 magnetico diretto ad esempio lungo z, cioè scrivere H = H kˆ con H intensità uniforme del campo e k̂ versore associato alla direzione z. Ricaviamo A esplicitamente, cioè iˆ 1 1 A = − ri × H = − xi 2 2 0 ( ˆj yi ) 0 kˆ 1 zi = − yi H iˆ − xi H ˆj 2 H ( ) dove ri = ( xi , yi , zi ) . Sostituiamo l’espressione di A in H = ∇ × A ricavando esplicitamente H , cioè iˆ 1 ∂ ⎡ 1 ⎤ H = H kˆ = ∇ × A = ∇ × ⎢ − yi H iˆ − xi H ˆj ⎥ = − 2 ∂xi ⎣ 2 ⎦ yi H ( ) ˆj ∂ ∂yi − xi H kˆ ∂ = ∂ zi 0 ⎞ 1⎛ ∂ ∂ = − ⎜⎜ ( xi H )iˆ + ( yi H ) ˆj + ( − H − H ) kˆ ⎟⎟ = H kˆ 2 ⎝ ∂zi ∂ zi ⎠ poiché le derivate sono nulle a causa dell’uniformità del campo magnetico secondo cui H ( r ) = H cioè il campo magnetico non dipende dalle coordinate. Si ottiene un’identità e quindi si è dimostrato 24 1 2 che A ( ri ) = − ri × H . Il potenziale vettore espresso in questa forma soddisfa anche la condizione ∇ ⋅ A = 0 , cioè è a divergenza nulla. Infatti, basta sostituire l’espressione di A e scrivere in forma esplicita tale condizione, cioè 1 1⎛ ∂ ˆ ∂ ˆ ∂ i+ j+ ∇ ⋅ A = − ∇ ⋅ yi H iˆ − xi H ˆj = − ⎜⎜ 2 2 ⎝ ∂xi ∂yi ∂zi ( ) ⎞ kˆ ⎟⎟ ⋅ yi H iˆ − xi H ˆj = ⎠ ( ) ⎞ 1⎛ ∂ ∂ = − ⎜⎜ ( yi H ) − ( xi H ) ⎟⎟ = 0 2 ⎝ ∂xi ∂yi ⎠ tenendo conto delle relazioni fra i versori, cioè iˆ ⋅ iˆ = 1 , ˆj ⋅ ˆj = 1 , iˆ ⋅ ˆj = 0 , ˆj ⋅ iˆ = 0 , kˆ ⋅ iˆ = 0 e kˆ ⋅ ˆj = 0 e dell’annullamento delle derivate a causa dell’uniformità del campo magnetico. L’equazione a divergenza nulla del potenziale vettore prende il nome di gauge di Coulomb. In meccanica quantistica A è un operatore vettoriale, H può essere considerato un vettore essendo uniforme spazialmente. I due contributi energetici, espressi in forma operatoriale, da calcolare sono i seguenti 1) Energia di interazione fra il campo magnetico esterno e lo spin elettronico Essa viene scritta come la somma delle energie d’interazione di ciascuno spin con il campo magnetico esterno, cioè si ha ΔH 0 = - μ spin ⋅ H = g0 μ B S ⋅ H = g0 μ B H ⋅ S = g0 μ B H S z spin = − g 0 μ B S è il momento magnetico di spin degli elettroni, S = dove μ (1.23) ∑s i è l’operatore i vettoriale di spin totale espresso come somma degli operatori di spin di ciascun elettrone ed Sz = ∑s i z è la componente z dell’operatore S data dalla somma delle componenti degli spin i orientati lungo la direzione z individuata da H. Gli siz possono assumere i valori +1/2 e -1/2, mentre g0 = 2 è il fattore di Landè per l’elettrone. A causa della commutatività fra l’operatore S e l’operatore H si ha che S ⋅ H = H ⋅ S . I due operatori commutano, perché l’operatore H può essere visto come vettore a causa della sua uniformità spaziale. 2) Energia cinetica totale elettronica Essa assume la forma 25 Si sostituisce l'espressione di A( ri ) ∑ 1 T= 2m 1 2m i ∑ pi 2 i 1 = 2m ∑ i 2 1 2m ∑ e 1 ⎡ ⎤ ⎢ pi + c A ( ri ) ⎥ = 2m ⎣ ⎦ 1 e − 4m c ∑ 1 e pi ⋅ ri × H − 4m c p′i2= ∑ 2 e ⎡ ⎤ ⎢ pi − 2c ri × H ⎥ = ⎣ ⎦ i i Si scrivono separatamente i due contributi e non si fa il doppio prodotto, poichè non è ancora dimostrata la commutatività di pi ⋅ A( ri ) ed A( ri )⋅ pi i 1 e pi − 4m c 2 ∑( i ∑ ∑( 1 e2 + 8m c2 ri × H ⋅ pi i ) 1 e2 pi ⋅ ri × H + ri × H ⋅ pi + 8m c2 ri × H ) 2 = i ∑ ( ri × H ) 2 = i = T0 + ΔH 1 1 In questa espressione T0 = 2m ∑p i 2 è l’operatore energia cinetica totale elettronica in assenza di un i campo magnetico esterno, mentre ΔH 1 = − 1 e 4m c 1 e ∑ ( pi ⋅ ri × H + ri × H ⋅ pi ) + 8m c2 ∑ ( ri × H ) 2 i 2 i è l’operatore associato alla variazione di energia dovuta alla presenza del campo magnetico esterno. I due termini di ΔH 1 possono essere ulteriormente manipolati e posti in una forma più semplice ed interpretabile da un punto di vista fisico. 1 e Partiamo dalla derivazione del primo termine di ΔH 1 , cioè di − 4m c ∑( p ⋅ r × H + r × H ⋅ p ) . A i i i i i partire dalla condizione ∇ ⋅ A = 0 si può dimostrare che A ( ri ) ⋅ pi = pi ⋅ A ( ri ) , cioè che i due operatori vettoriali potenziale vettore e momento coniugato commutano (la dimostrazione viene lasciata al lettore). Ciò implica, sostituendo ri × H ⋅ pi = pi ⋅ ri × H − 1 e 4m c e l’espressione quindi, A di più nell’uguaglianza in scritta, generale, che che ∑ ( p ⋅ r × H + r × H ⋅ p ) = − 4m c ∑ ( p ⋅ r × H + p ⋅ r × H ) = − 2 m c ∑ ( p ⋅ r × H ) . i i i i i 1 e i i i i i 1 e i i i Si può riscrivere il termine in una forma più semplice. Infatti, basta tenere presente che il momento angolare classico dell’i-esimo elettrone vale li = ri × pi per cui si può scrivere per ogni elettrone, sfruttando la regola del prodotto misto a ⋅ b × c = c ⋅ a × b e la proprietà del prodotto vettoriale a × b = −b × a , − pi ⋅ ri × H = − H ⋅ pi × ri = H ⋅ ri × pi = H ⋅ li ; anche in questo caso si è inserito 26 = h / 2π per ragioni dimensionali, poiché ha le dimensioni di un momento angolare, mentre li in meccanica quantistica è un numero. Da notare che la proprietà del prodotto vettoriale si può applicare a maggior ragione, perchè H può essere considerato a tutti gli effetti un vettore e non un operatore vettoriale essendo uniforme nello spazio. Di − conseguenza, 1 e 2m c considerando la somma ∑ ( p ⋅ r × H ) = 2m c H ⋅ ∑ l = 2 m c H ⋅ L , i 1 e i i i 1 e su tutti gli elettroni, si ha dopo avere definito il momento angolare i elettronico totale come ∑l = L . Tenendo conto della definizione del magnetone di Bohr, cioè i i μB = e e, sfruttando la commutatività di H ed L ( H può essere visto come un vettore) per 2mc cui H ⋅ L = L ⋅ H , il primo termine di ΔH 1 si può riscrivere in una forma più semplice, cioè − 1 e 2m c ∑( p ⋅ r × H ) = μ i i BL ⋅ H dove compare il prodotto scalare fra l’operatore momento angolare i orbitale elettronico ed il campo magnetico esterno. 1 e2 Scriviamo ora in una forma più semplice il secondo termine di ΔH 1 , cioè 2 8m c iˆ = ri × H ⋅ ri × H = xi 0 ( ri × H ) ( 2 )( ˆj yi 0 ) kˆ iˆ zi ⋅ xi H 0 ˆj yi 0 ∑( r × H ) 2 i . Si ha i kˆ zi = H ( yi H iˆ − xi H ˆj ) ⋅ ( yi H iˆ − xi H ˆj ) = ( xi 2 H 2 + yi 2 H 2 ) = H 2 ( xi 2 + yi 2 ) dove xi , yi , zi sono le componenti dell’i-esimo elettrone in un riferimento cartesiano ed il campo magnetico è assunto lungo z, cioè H = H kˆ . Si è tenuto conto delle relazioni fra i versori, cioè iˆ ⋅ iˆ = 1 , ˆj ⋅ ˆj = 1 , iˆ ⋅ ˆj = 0 e ˆj ⋅ iˆ = 0 . Quindi, in virtù di quest’ultimo risultato, il secondo termine di 1 e2 8m c 2 ΔH 1 si può riscrivere in una forma più semplice, cioè ∑( ri × H ) i 2 = e2 H 2 8mc 2 ∑( x i 2 ) + yi 2 . i Combinando insieme il primo ed il secondo termine di ΔH 1 così semplificati si ricava ΔH 1 = μ B L ⋅ H + e2 H 2 8mc 2 ∑( x i i 2 + yi 2 ) (1.24) 27 Scriviamo, quindi, l’operatore associato alla variazione dell’energia totale ΔH come somma del contributo ΔH 0 dovuto allo spin elettronico (cf. Eq.(1.23)) e del contributo ΔH 1 dovuto all’effetto del campo magnetico sull’energia cinetica degli elettroni (cf. Eq.(1.24)), cioè ΔH = ΔH 0 + ΔH 1 = g0 μ B S ⋅ H + μ B L ⋅ H + ( ) = μ B L + g0 S ⋅ H + 2 e H 2 8mc 2 ∑( x 2 i i + yi2 ) e2 H 2 8mc 2 ∑( x 2 i ) + yi2 = i (1.25) Si nota che l’operatore ΔH è proporzionale ad un termine al primo ordine in H ed ad un termine al secondo ordine in H . Se si applica un campo magnetico di intensità media pari ad esempio a 104 G si può dimostrare, con un semplice calcolo effettuato facendo una stima approssimativa dell’ordine di grandezza del primo termine a secondo membro di Eq.(1.25), che si ottiene una variazione di energia di 10-4 eV. Il secondo termine a secondo membro dà infatti un contributo molto più piccolo e quindi trascurabile per il conto. Quindi risulta che, applicando un campo magnetico di intensità media, l’energia del sistema cambia di poco tenendo presente che le energie atomiche sono dell’ordine di alcuni eV. Questa piccola variazione è però responsabile delle proprietà magnetiche della materia. Per calcolare piccole variazioni di energia in meccanica quantistica ci si avvale della TEORIA PERTURBATIVA ORDINARIA. Poiché la suscettività è proporzionale alla derivata seconda dell’energia libera (e quindi anche alla derivata seconda dell’energia) si dovranno tenere nello sviluppo perturbativo dell’energia termini fino al secondo ordine in H per avere una suscettività magnetica che risulti indipendente dal campo esterno come effettivamente si osserva sperimentalmente. Per questa ragione si usa il risultato della teoria perturbativa indipendente dal tempo al secondo ordine nell’energia. Quindi, nel calcolo si trascurano i contributi dell’energia perturbata di ordine superiore al secondo nel campo magnetico esterno che risultano molto piccoli. Se En è l’energia dello stato imperturbato n-esimo (con n = 0 stato fondamentale ed n = 1,2,..,k i k stati eccitati imperturbati) e ΔEn la sua variazione corrispondente all’operatore ΔH si ha En -> En + ΔEn con la variazione di energia ΔEn espressa mediante la teoria perturbativa indipendente dal tempo al secondo ordine nella forma 28 Perturbazione al IIo ordine Perturbazione al Io ordine ΔEn = 〈 n | ΔH | n〉 + ∑ 〈 n | ΔH | n′〉 2 En − En′ n′ ≠ n Si fa uso della teoria perturbativa indipendente dal tempo, perché non si è interessati alla evoluzione nel tempo dell’Hamiltoniana. Infatti, è ragionevole studiare l’interazione con il campo magnetico esterno ad un dato istante temporale. La notazione usata è quella introdotta da Dirac con vettori bra (a sinistra) e ket (a destra) rispetto all’operatore di perturbazione ΔH . Il primo termine a secondo membro rappresenta la correzione perturbativa al primo ordine data dall’elemento di matrice della perturbazione ΔH sullo stato imperturbato n (elemento diagonale) che ha il significato di un valore medio della perturbazione. Invece il secondo termine a secondo membro è la correzione al secondo ordine. La sommatoria è fatta su tutti i k stati imperturbati n′ diversi dallo stato n fissato (elementi off-diagonali). È da notare che in meccanica quantistica gli elementi di matrice sono degli integrali sullo spazio di Fock le cui funzioni integrande sono rappresentate da operatori e da autovettori, uno a destra dell’operatore (corrispondente alll’autovettore ket) e l’altro a sinistra dell’operatore (corrispondente all’autovettore bra). Quest’ultimo deve essere scritto come complesso coniugato. Il secondo termine a secondo membro è quindi espresso da una sommatoria di elementi di matrice. Se si sostituisce l’espressione dell’operatore ΔH di Eq.(1.25) dentro ΔEn si ottiene ( ) ΔEn = 〈 n | μ B L + g 0 S ⋅ H + + ∑ n′ ≠ n ( ) 〈 n | μ B L + g0 S ⋅ H + e2 H 2 8mc 2 2 e H 2 8mc 2 ∑( x 2 i ) + yi2 | n〉 + i ∑( x 2 i ) 2 + yi2 | n′〉 i En − En′ Poichè la variazione di energia è piccola si trascurano i contributi al terzo ed al quarto ordine in H provenienti dall’ultimo termine a secondo membro (quello contenente la sommatoria ∑ n′ ≠ n ); in 29 seguito a questa semplificazione ( ) ΔEn = 〈 n | μ B H ⋅ L + g 0 S | n〉 + + e2 H 2 8mc 2 〈n | ∑( x 2 i si ∑ può riscrivere ( ) 〈 n | μ B H ⋅ L + g 0 S | n′〉 En − En′ n′ ≠ n ΔEn la nella forma 2 + ) + yi2 | n〉 i In questo ultimo passaggio si è sfruttata la proprietà di commutatività degli operatori L ed S con l’operatore H ( ) ( ) grazie alla quale L + g0 S ⋅ H = H ⋅ L + g0 S . Inoltre si è decomposto il primo termine in due termini portando fuori dall’elemento di matrice 〈 n | ∑( x 2 i ) + yi2 | n〉 (che dà la correzione al i primo ordine perturbativo) il termine e2 H 2 8mc 2 non dipendente dall’elemento di matrice stesso e sono stati scambiati il risultante secondo termine con l’ultimo termine contenente gli elementi di matrice off-diagonali. Infine, in quest’ultimo termine si è tenuto solo il contributo al secondo ordine in H. Si può infine portare fuori dal primo elemento di matrice μ B H , quantità che non dipende da esso essendo H un vettore ottenendo ( ) ΔEn = μ B H ⋅ 〈 n | L + g0 S | n〉 + + e2 H 2 8mc 2 〈n | ∑(x 2 i i ∑ ( ) 〈 n | μ B H ⋅ L + g0 S | n′〉 n′ ≠ n En − En ′ 2 + ) (1.26) + yi2 | n〉 Eq.(1.26) costituisce l’EQUAZIONE DI BASE per le teorie quantistiche della SUSCETTIVITÀ MAGNETICA di atomi, ioni o molecole. Il primo termine nel membro di destra è al primo ordine nel campo magnetico esterno, cioè varia linearmente con il campo esterno. Il secondo ed il terzo termine costituiscono insieme il contributo al secondo ordine nel campo esterno. Si può scrivere il generico elemento ( di matrice del secondo termine in notazione compatta, cioè ) 〈 n | μ B H ⋅ L + g0 S | n′〉 = Vn n′ in modo tale che, ancora in notazione compatta, possa essere scritto 2 il modulo quadro di tale elemento di matrice, cioè Vn n ′ = Vn n ′Vn∗n ′ . A causa del fatto che ∗ ( l’operatore L + g 0 S è hermitiano (è infatti reale) si ha che Vn n ′ = Vn∗′ n . Quindi, Vn n ′ = Vn∗′ n ) ∗ da 30 ( ) cui Vn n ′ = Vn ′ n con Vn′ n = 〈 n′ | μ B H ⋅ L + g0 S | n〉 per cui gli elementi di matrice del secondo ∗ termine ∑ nel ( membro ) di destra ( si possono riscrivere come ) 〈 n | μ B H ⋅ L + g 0 S | n′〉〈 n′ | μ B H ⋅ L + g0 S | n〉 En − En ′ n′≠ n . Da notare che il contributo al secondo ordine diagonale in n è circa 105 volte più piccolo del contributo al primo ordine anche per campi grandi dell’ordine di 104 G. Anche il termine al secondo ordine costituito dagli elementi di matrice off-diagonali è dello stesso ordine di grandezza nella maggior parte dei casi a causa del fatto che il denominatore En − En′ dà la tipica energia di eccitazione atomica che risulta piuttosto grande rendendo il termine corrispondente molto piccolo. Tuttavia alcuni atomi, come per esempio i gas nobili, esibiscono proprietà diamagnetiche per le quali l’operatore L + g 0 S ha autovalore nullo a causa del fatto che L 0 = S 0 = 0 (si veda il paragrafo successivo per una discussione). Ciò porta all’annullamento del primo e del secondo termine del membro di destra di Eq.(1.26). Per questi atomi si dovrà tenere conto, nel calcolo della suscettività, del terzo termine del membro di destra di Eq.(1.26) (secondo termine al secondo ordine nel campo magnetico) che, pur essendo piccolo, risulta diverso da zero. Escluso questo caso l’energia di un sistema di atomi con o senza campo magnetico è praticamente la stessa. 1.5.1 Suscettività di ioni (atomi) isolanti con tutte le shell occupate: diamagnetismo di Larmor Analizziamo in primo luogo il caso dei GAS NOBILI che rappresentano il prototipo di sostanze diamagnetiche e sono ISOLANTI. Calcoliamo per essi, a partire dal risultato della teoria perturbativa, la suscettività diamagnetica. Consideriamo il sistema ad una temperatura tale che tutti gli elettroni si trovino nello stato fondamentale n = 0 non degenere che indichiamo con 0 usando la notazione della meccanica quantistica. Poiché i gas nobili presentano shell complete si ha che i numeri quantici associati al momento angolare totale, a quello orbitale ed a quello di spin sono nulli, cioè J = L = S = 0 . Ciò implica che J 0 =L 0 =S 0 =0 essendo uguali a zero gli autovalori J ( J + 1) , L ( L + 1) e S (S + 1) corrispondenti rispettivamente al momento angolare totale, al momento angolare orbitale ed a quello di spin. Di conseguenza, i primi due termini della correzione 31 perturbativa all’energia di Eq.(1.26) sono uguali a zero, poiché per entrambi i termini vale la condizione ( L + g 0 S ) 0 = 0 essendo L 0 = S 0 = 0 . In particolare, per J = 0 si trova che 2 J + 1=1, cioè che lo stato fondamentale effettivamente non è degenere essendo rappresentato da un solo livello. Quindi, la correzione perturbativa dell’energia nello stato fondamentale n = 0 vale ΔE0 = e2 H 2 8mc 2 〈0 | ∑( x 2 i ) + yi2 | 0〉 i In questo caso si può porre ΔE0 = F , dove F è l’energia libera, poiché lo stato fondamentale è non degenere. Si deve perciò confrontare l’energia dello stato fondamentale E0 con l’energia termica kBT con il risultato che E0 >> kBT . Quindi, in virtù di questa disuguaglianza, è come se si assumesse una temperatura T = 0, temperatura alla quale si può porre ΔE0 = F . Quindi, la suscettività per ione si può esprimere come la derivata seconda dell’energia ΔE0 risultando 1 ∂2 F 1 ∂ 2 ΔE0 1 ∂2 χ =− = − = − V ∂H 2 V ∂H 2 V ∂H 2 1 e2 =− 〈0 | V 4mc 2 ∑( x 2 i ⎛ 2 2 ⎜ e H 〈0 | ⎜ 8mc 2 ⎝ ∑( i ⎞ xi2 + yi2 | 0〉 ⎟ = ⎟ ⎠ ) ) + yi2 | 0〉 i Supponendo di avere N ioni indipendenti si può esprimere la suscettività totale nella forma N e2 χ =− 〈0 | V 4mc 2 ∑( x ) + yi2 | 0〉 2 i i (1.27) L’espressione trovata prende il nome di SUSCETTIVITÀ DIAMAGNETICA di LARMOR. Essa è una grandezza adimensionale e negativa, poiché l’elemento di matrice è positivo. Inoltre è indipendente dalla temperatura. Si dimostra facilmente che il risultato quantistico ottenuto applicando la teoria perturbativa al secondo ordine è equivalente al risultato classico della teoria del diamagnetismo di Langevin. Infatti, nell’ipotesi che la distribuzione elettronica abbia simmetria sferica, si può scrivere 〈0 | ∑( x 2 i ) + yi2 | 0〉 = 〈0 | i = 2 3 ∑ 〈0 | r 2 i ∑x 2 i i | 0〉 + 〈0 | ∑y 2 i | 0〉 = i | 0〉 i 32 essendo 〈0 | per ∑x | 0〉 = 〈 0 | ∑x | 0〉 + 〈 0 | 2 i i 〈0 | 2 i ri2 = xi2 + yi2 + zi2 definizione ∑y | 0〉 = 〈 0 | ∑y | 0〉 = 2 i i i 2 i ∑z 2 i | 0〉 = i 2 〈0 | 3 i 2 ionico nella forma 〈 r 〉 = 1 Z ∑r 2 i i ∑ 〈0 | r 2 i 1 〈0 | 3 | 0〉 = 2 3 e, ∑r 2 i | 0〉 a causa della simmetria sferica, per cui si ottiene immediatamente i ∑ 〈0 | r 2 i | 0〉 . Definendo un raggio quadratico medio i | 0〉 (è la definizione di media aritmetica) dove Z è il numero di i elettroni in ciascuno ione e, sostituendo tale espressione in Eq.(1.27), si ricava N Z e2 2 χ =− 〈r 〉 V 6mc 2 (1.28) Il risultato di Eq.(1.28) è equivalente al risultato classico di Langevin di Eq.(1.9). Tuttavia, usando il metodo perturbativo si trova che il diamagnetismo è associato agli elettroni delle shell elettroniche esterne che risultano completamente occupate. Questo risultato non poteva essere ottenuto per via classica. In genere risulta comodo esprimere la suscettività diamagnetica come suscettività molare avente unità di misura in cm3/mole. Basta moltiplicare la suscettività per il volume di una mole, cioè χ molare = χ NA V dove ( N A / N ) V è il volume di una mole con N A numero di Avogadro. Ad N esempio fra i gas nobili la suscettività molare dell’elio (He) (la più bassa in valore assoluto) vale −1.9 × 10−6 cm3 /mole , mentre quella dello xenon (Xe) (la più alta in valore assoluto) è −43 × 10−6 cm3 /mole . Invece ad esempio fra gli alcalini la suscettività molare dello ione potassio (K+) è −14.6 × 10−6 cm3 /mole e fra gli alogeni quella dello ione Cl- è −24.2 × 10−6 cm3 /mole . 1.5.2 Suscettività di ioni (atomi) isolanti con shell parzialmente occupate: paramagnetismo di Van Vleck Prendiamo ora in esame atomi appartenenti alla classe degli ISOLANTI che non soddisfano la condizione di completezza della shell più esterna e calcoliamo per essi la correzione dell’energia al secondo ordine perturbativo. Questi atomi manifestano sia comportamento diamagnetico che paramagnetico. 33 Esaminiamo prima il CASO IN CUI il NUMERO QUANTICO è nullo, cioè J = 0 che equivale ad avere L’AUTOVALORE DEL MOMENTO ANGOLARE TOTALE J ( J + 1) NULLO. Tale caso si verifica, oltre che per shell piene (cf. paragrafo 1.5.1), anche per shell in cui manca un elettrone perché risultino semipiene. E’ da notare che non era possibile considerare tale caso nella discussione del paramagnetismo quantistico fatta nel paragrafo 1.4 dove si assumeva che J fosse diverso da zero e si aveva suscettività magnetica non nulla solo per sostanze paramagnetiche con momento magnetico permanente. Il valore di J = 0 si ricava utilizzando le 3 regole di Hund per il riempimento delle shell secondo le quali: a) Gli elettroni vengono distribuiti in maniera tale da avere lo spin totale S dello stato fondamentale massimo in accordo con il principio di esclusione di Pauli. Questa regola stabilisce quindi il valore di S con S = n ∑ i =1 szi numero quantico dello spin totale corrispondente allo stato fondamentale considerato; szi è la componente lungo z dello spin dell’i-esimo elettrone e può assumere i valori +1/2 (spin up) o -1/2 (spin down), mentre n è il numero di elettroni da porre nella shell considerata il cui numero massimo è stabilito dal principio di esclusione di Pauli. b) Occorre massimizzare il momento angolare orbitale totale L dello stato fondamentale. c) Occorre stabilire il valore del momento angolare totale J corrispondente allo stato fondamentale una volta noti i valori di L ed S. In base al segno del termine ( ) dell’Hamiltoniana λ L ⋅ S che esprime l’interazione spin-orbita i valori di J corrispondenti allo stato fondamentale sono i seguenti J = L−S , n ≤ 2l + 1 Shell meno che semipiene J = L + S, n ≥ 2l + 1 Shell più che semipiene dove l è il numero quantico azimutale (per shell d- si ha l = 2, per shell f si ha l =3). Per shell meno che semipiene, cioè per n ≤ 2l + 1 , l’accoppiamento spin-orbita avente λ > 0 favorisce il minimo valore di J, dato da momento angolare e di spin totali antiparalleli, cioè L − S . Per shell più che semipiene, cioè per n ≥ 2l + 1 , l’accoppiamento spin-orbita avente λ < 0 favorisce il massimo valore di J dato dalla condizione di momento angolare orbitale e di spin totali paralleli, cioè L + S . Il numero totale di elettroni è pari a n = 2 ( 2l + 1) . La regola a) tuttavia presenta ambiguità perché non stabilisce quale orbitale debba essere riempito per primo (per esempio non stabilisce quale dei 5 orbitali della shell d- o quale dei 7 orbitali della shell f- deve essere riempito per primo). 34 Se si considerano gli stati fondamentali (indicati con | 0〉 in notazione di Dirac) di ioni con shell dparzialmente occupate (numero quantico azimutale l = 2) si ha che la condizione per cui il momento angolare totale sia nullo, cioè J = L − S = 0 , si realizza quando si pongono nella shell d- 4 elettroni scelti ad esempio tutti con spin down (shell meno che semipiena) ognuno dei quali con componente lungo la direzione z data da sz = -1/2. Questa condizione corrisponde ad una shell a cui manca un elettrone per risultare semipiene. I due elementi (isolanti) aventi 4 elettroni nella shell più esterna e che realizzano questa condizione sono gli ioni Cr2+ ed Mn3+ (si noti che i corrispondenti atomi di Cr e di Mn sono invece metalli di transizione che non realizzano la condizione J = 0 ). I 4 elettroni posti nella shell d- danno come momento angolare totale di spin S= 4 ∑s i =1 zi = −1/ 2 + (−1/ 2) + (−1/ 2) + (−1/ 2) = −2 = 2 . Invece il numero quantico associato al momento angolare orbitale totale è L = 4 ∑l i =1 zi = +2 + 1 + 0 + ( −1) = 2 , poichè il numero quantico lz i , che dà la componente lungo z del momento angolare orbitale li dell’i-esimo elettrone, varia da li a +li, cioè lzi ∈ [ −li , +li ] a passi di un’unità. E’ da notare che nel riempimento degli orbitali si è partiti per convenzione da quello corrispondente ad lz = +2 , ma ovviamente si perviene allo stesso risultato anche partendo dall’orbitale corrispondente ad lz = −2 . Si verifica facilmente che J = L − S = 2 − 2 = 0 . Lo stesso risultato si otterrebbe se gli elettroni fossero scelti tutti con spin- up. Il riempimento completo della shell d- costituita da 5 orbitali si ottiene con 10 elettroni, due per ogni orbitale per il principio di esclusione di Pauli come si può facilmente verificare. Tuttavia l’ultimo caso di interesse, se si vuole avere una shell d- parzialmente occupata, è quello con 9 elettroni anche se il corrispondente valore di J risulterebbe diverso da zero. Un ragionamento simile applicato alla shell f- caratterizzata da numero quantico azimutale l = 3 e da 7 orbitali porterebbe ad avere il numero quantico J nullo se si utilizzassero 6 elettroni, poiché si avrebbe S = 3 ed L = 3 che porterebbe ad avere J = L − S = 3 − 3 = 0 . Il riempimento totale della shell f- si ottiene invece con 14 elettroni. Se J = 0 si può dimostrare, a partire da opportune regole di commutazione fra gli operatori di momento angolare, che 〈 0 | L + g 0 S | 0〉 = 0 pur essendo non nullo lo stato ( L + g0 S ) | 0〉 . Ciò corrisponde fisicamente ad un sistema che nello stato fondamentale non presenta momento magnetico permanente. Questo non significa, come avveniva nel caso discusso nel paragrafo 1.5.1, 35 che l’autovalore L e l’autovalore S riferiti allo stato fondamentale siano entrambi separatamente nulli. Alla luce di questi risultati la correzione al secondo ordine perturbativo nell’energia risulta ΔE0 = 2 e H 2 8mc 2 〈0 | ∑( x 2 i ) + yi2 | 0〉 − ∑ ( En − E0 n≠0 i ) 〈0 | μ B H ⋅ L + g0 S | n〉 2 =F (1.29) dove l’uguaglianza ΔE0 = F vale nel caso non degenere (si veda il paragrafo 1.5.1 per una giustificazione di questa uguaglianza). In questo caso si assume infatti che sia soddisfatta la condizione En − E0 k BT con n=1,2,3 indice dell’energia degli stati eccitati. In base a tale condizione la maggior parte degli elettroni in ciascun atomo e quindi anche la maggior parte degli atomi o delle molecole sono nello stato fondamentale all’equilibrio termico. La somma presente nel secondo termine è effettuata su tutti i k stati eccitati imperturbati off-diagonali caratterizzati dal numero quantico n ≠ 0 con n = 1,2,.. Come si nota, in Eq.(1.29) manca il primo termine a secondo membro che era presente in Eq.(1.26), poiché 〈 0 | L + g 0 S | 0〉 = 0 . In Eq.(1.29) si è rinominato n′ con n ed il segno meno nel secondo termine a secondo membro rispetto ad Eq.(1.26) è dovuto al cambio di segno effettuato a denominatore. Questo cambio di segno è puramente arbitrario, ma risulta comodo per il calcolo della suscettività. Come si può notare l’ultimo termine a secondo membro contenente gli elementi off-diagonali non si annulla a differenza del caso precedente degli isolanti con shell piena dove era invece diverso da zero solo il primo termine del membro di destra di Eq.(1.29). Supponendo di applicare il campo ( ) magnetico lungo z si ha: H ⋅ L + g0 S = H ( Lz + g0 S z ) . A partire da Eq.(1.29) e, tenendo conto di quest’ultima semplificazione nel secondo termine a secondo membro, si ricava la suscettività degli isolanti contenenti N/V atomi (ioni) per unità di volume, cioè ⎡ N ∂2 F N ∂2ΔE0 N ⎢ e2 =− =− 〈0 | χ =− V ∂H 2 V ∂H 2 V ⎢ 4mc2 ⎢⎣ N e2 =− 〈0 | V 4mc2 ∑( i ) N xi2 + yi2 | 0〉 + 2μB2 V ∑( x ∑ n≠0 2 2 i + yi i ) | 0〉 − 2μ ∑ 2 B n≠0 〈0 | ( Lz + g0Sz ) | n〉 2 2 〈0 | ( Lz + g0Sz ) | n〉 ⎥⎤ = ⎥ En − E0 ⎥⎦ (1.30) En − E0 portando fuori μ B2 dagli elementi di matrice off-diagonali. È da notare che l’operatore derivata seconda rispetto ad H agente sul secondo termine di Eq.(1.29) è applicato al modulo quadro di ciascuno dei k elementi di matrice corrispondenti agli stati imperturbati off-diagonali proporzionali ad H 2 . Eq.(1.30) rappresenta un risultato importante. Il primo termine nell’ultimo membro è la SUSCETTIVITÀ DIAMAGNETICA di LARMOR ed è associata agli elementi di matrice 36 (diagonali) dell’operatore ∑( x 2 i + yi2 ) . La suscettività diamagnetica di Larmor è già stata discussa i nel paragrafo 1.5.1. Il secondo termine è un contributo nuovo e rappresenta la correzione paramagnetica alla suscettività diamagnetica di Larmor. Esso è associato agli elementi off-diagonali fra lo stato fondamentale imperturbato | 0〉 e gli stati eccitati imperturbati | n〉 dell’operatore Lz + g0 S z che risulta proporzionale al momento magnetico, componente z. Come si può notare, la suscettività che si ricava è un contributo positivo ed è quindi certamente di natura paramagnetica, ma, a causa del suo piccolo valore, rappresenta SOLO una correzione al diamagnetismo degli ISOLANTI. Questa correzione paramagnetica alla suscettività diamagnetica prende il nome di PARAMAGNETISMO di VAN VLECK. Essa non ha a nulla a che vedere con la suscettività paramagnetica studiata nei paragrafi 1.3 ed 1.4. Si può quindi affermare che il comportamento magnetico degli isolanti contenenti ioni (atomi) con shell meno che semipiena (la sola che può realizzare la condizione J = 0 ) dipende dal bilanciamento fra il diamagnetismo di Larmor (primo termine nell’ultimo membro di Eq.(1.30)) ed il paramagnetismo di Van Vleck (secondo termine nell’ultimo membro di Eq.(1.30)). Si nota che la suscettività paramagnetica di Van Vleck che si ricava dal secondo termine nell’ultimo membro di Eq. (1.30) risulta indipendente dalla temperatura. Se vale la condizione per cui En − E0 k BT (con E0 caratterizzato dal numero quantico J = 0 del momento angolare totale associato allo stato fondamentale ed En associato al numero quantico J’ del primo stato eccitato) non si può più usare Eq.(1.30) per ricavare la suscettività diamagnetica e paramagnetica, ma si può dimostrare che la suscettività paramagnetica risulta inversamente proporzionale alla temperatura assumendo la forma della legge di Curie (cf. Eq.(1.22)). Tale condizione è però meno probabile. Anche nelle molecole più complesse è presente il paramagnetismo di Van Vleck con suscettività magnetica indipendente dalla temperatura come termine correttivo alla suscettività diamagnetica. Esso origina dalle fluttuazioni del momento angolare attorno all’asse molecolare che a loro volta generano un momento magnetico. Tuttavia, dalle misure su diverse molecole risulta che il comportamento complessivo è ancora diamagnetico, poiché la suscettività totale misurata è negativa. Consideriamo ora il caso in cui il NUMERO QUANTICO J È DIVERSO DA ZERO, cioè J ≠ 0 che equivale ad avere l’AUTOVALORE DEL MOMENTO ANGOLARE TOTALE DIVERSO DA ZERO. Questo caso si verifica sempre, tranne che per shell piene (cf. paragrafo 1.5.1) e per shell a cui manca un elettrone per risultare semipiene (caso precedente di shell meno che semipiene). Quando J ≠ 0 risulta diverso da zero in Eq.(1.26) anche il primo termine dell’energia perturbata. Tale termine è associato agli elementi diagonali dell’operatore L + g 0 S a sua volta proporzionale al momento magnetico del singolo atomo (ione) che risulta così diverso da zero anche in assenza di 37 campo esterno. Si può dimostrare che il primo termine dell’energia perturbata in Eq.(1.26) è quasi sempre maggiore degli altri due, i quali possono essere quindi trascurati. Infatti, nella maggior parte dei casi i due termini al secondo ordine in H sono almeno 5 ordini di grandezza più piccoli del primo termine al primo ordine come già discusso nel paragrafo 1.5. Lo stato fondamentale è in questo caso 2J+1 volte degenere in assenza di campo essendo J ≠ 0 . Poiché lo stato fondamentale è caratterizzato dagli autostati degli operatori J 2 e Jˆ z ( ∧ è il simbolo di operatore per la componente z del momento angolare totale), cioè J , L , S e Jz l’elemento di matrice del ( ) primo termine di Eq.(1.26) dato da 〈 n | L + g0 S | n〉 si può riscrivere nella forma proporzionale a ( ) 〈 J LS J z | L + g 0 S | J LS J z′ 〉 con J z , J z′ = − J ,..., J ed | n〉 =| J LS J z 〉 . J z J z′ è il numero quantico magnetico del momento angolare totale indicato nei paragrafi precedenti con mJ. Per il calcolo di questo elemento di matrice viene in aiuto il teorema di WIGNER-ECKART. Applicato al caso in esame esso afferma che gli elementi di matrice di qualsiasi operatore vettoriale nello spazio (2J+1)dimensionale agente sugli autostati di J 2 e J z con un dato valore di J sono proporzionali agli elementi di matrice dell’operatore J stesso, cioè 〈 J LS J z | L + g 0 S | J LS J z′ 〉 = g ( J LS ) 〈 J LS J z | J | J LS J z′ 〉 dove g è la costante di proporzionalità espressa dal fattore di Landè e rappresenta il coefficiente di Clebsch-Gordan della trasformazione. Nel caso specifico l’operatore vettoriale nello spazio (2J+1)dimensionale degli autostati di J 2 e J z è L + g 0 S . E’ da notare inoltre che gli elementi di matrice dell’operatore Lˆ z + g 0 Sˆ z (con ∧ simbolo di operatore) sono già diagonali negli stati di definito J z , poiché in generale si ha 〈 J LS J z | Lˆ z + g 0 Sˆ z | J LS J z′ 〉 = g ( J LS ) 〈 J LS J z | Jˆ z | J LS J z′ 〉 = g ( J LS ) J zδ J z J z′ . che La prima uguaglianza è vera grazie al teorema di WIGNER-ECKART, mentre la seconda viene dalla definizione degli elementi di matrice dell’operatore J z . Riprendendo gli elementi di matrice dell’operatore L + g 0 S e l’uguaglianza scritta in virtù del teorema di WIGNER-ECKART si può riscrivere il secondo membro di tale uguaglianza portando dentro gli elementi di matrice la quantità g ( J LS ) così da ottenere 〈 J LS J z | L + g 0 S | J LS J z′ 〉 = 〈 J LS J z | g ( J LS ) J | J LS J z′ 〉 . Scritta l’uguaglianza senza gli autostati (togliendo cioè sia i bra che i ket a primo ed a secondo membro) si ricava che 38 L + g0 S = g J (1.31) Questa relazione è rigorosamente valida per elementi di matrice diagonali in J, L ed S, cioè nell’ambito dell’insieme (2J+1)-dimensionale dei livelli (non separati in energia) che costituiscono lo stato fondamentale atomico degenere in assenza di campo esterno. Un atomo (ione) paramagnetico può infatti avere un momento magnetico diverso da zero proporzionale al numero quantico J ≠ 0 . Lo stato fondamentale è l’unico stato termicamente eccitato. Se, a causa dell’applicazione di un campo magnetico, come spesso si verifica, la separazione in energia fra il multipletto 2J+1 dello stato fondamentale ed il multipletto 2 J ′ +1 associato al primo stato eccitato J ′ è molto maggiore di k BT , cioè EJ ′ − EJ k BT , viene trascurata l’influenza che gli stati eccitati ad energia più elevata hanno sullo stato fondamentale. In questo modo lo stato fondamentale 2J+1 volte degenere può ancora considerarsi l’unico stato termicamente eccitato. Solo in questo caso Eq.(1.31) permette di interpretare il primo termine al primo ordine nel campo magnetico dell’energia perturbata di Eq.(1.26) come energia d’interazione − μ ⋅ H del campo con un momento magnetico μ proporzionale al momento angolare totale dello ione (atomo) e dato da μ = − g μB J (1.32) Eq.(1.32) è esattamente uguale ad Eq.(1.16) ricavato nell’ambito della teoria quantistica del paramagnetismo ed esprime il momento magnetico totale di uno ione (atomo) paramagnetico. Poichè lo stato fondamentale è degenere non è più permesso calcolare la magnetizzazione come derivata prima dell’energia perturbata e la suscettività come derivata seconda dell’energia perturbata. Infatti, in questo caso non è più vero che l’energia libera F è uguale a ΔE0 (si veda il paragrafo 1.4 per una dimostrazione di questa affermazione). La magnetizzazione viene quindi calcolata in base alla sua definizione statistica, cioè M = − N ⎛ ∂F ⎞ V ⎜⎝ ∂H ⎟⎠T e la suscettività come N ⎛ ∂2 F ⎞ ⎟ 2 ⎟ . ⎝ ∂H ⎠T χ = ∂M / ∂H che implica χ = − ⎜⎜ V La serie di passaggi da effettuare per ricavare la magnetizzazione e da essa la suscettività è esattamente quella già descritta fra Eq.(1.17) ed Eq.(1.22) del paragrafo 1.4 e la discussione relativa risulta ancora valida. Quindi, anche mediante il metodo perturbativo, si ritrova la magnetizzazione di Eq.(1.20) espressa mediante la funzione di Brillouin e la LEGGE di CURIE per la suscettività di una sostanza paramagnetica già ricavata in Eq.(1.22). Tuttavia la teoria quantistica del paramagnetismo basata sul metodo perturbativo trattata in questo paragrafo dà maggiori informazioni sul paramagnetismo di atomi e ioni rispetto alla teoria 39 quantistica del paramagnetismo discussa nel paragrafo 1.4, poichè permette di descrivere una nuova forma di paramagnetismo, detto paramagnetismo di Van Vleck, presente negli isolanti con shell meno che semipiene dove però si realizza la condizione per cui l’autovalore del momento angolare totale è nullo corrispondente al caso J = 0. Questo caso non poteva essere trattato nell’ambito della teoria quantistica del paramagnetismo del paragrafo 1.4 dove veniva assunto che J fosse diverso da zero. Infine, è da notare che la suscettività magnetica può talvolta assumere carattere tensoriale quando il vettore magnetizzazione M non è parallelo al vettore campo magnetico H . In questo caso la magnetizzazione viene definita come ⎛ ∂ ∂ ∂ , , ∇H = ⎜ ⎜ ∂H x ∂H y ∂H z ⎝ ( M = −N /V ∇H F ) T con H = (Hx, H y, Hz ) dove ⎞ ⎟⎟ è il gradiente dell’energia libera F fatto rispetto ad H a temperatura T ⎠ ( costante e la suscettività risulta χˆ = χαβ = − N / V ∇ H ∇ H F ) T ; il simbolo ^ in χ̂ indica una grandezza tensoriale con α , β = H x , H y , H z . Quindi, ad esempio, la componente xx del tensore vale ⎛ ∂ ∂ ⎞ F ⎟ e così via per le altre componenti. In notazione compatta si può porre ⎝ ∂H x ∂H x ⎠ χH H = −N /V ⎜ x x α , β = x, y, z con x, y, z rispettivamente al posto di H x , H y , H z . In forma esplicita il tensore di suscettività assume quindi la forma di una matrice 3 × 3 χ xx χ xy χ xz χαβ = χ yx χ yy χ yz χ zx χ zy χ zz . 1.6.1 Suscettività dei metalli: paramagnetismo di Pauli Occorre tenere presente che nei metalli anche gli elettroni di conduzione contribuiscono al momento magnetico. E’ da notare che il paramagnetismo discusso nei paragrafi precedenti era associato agli elettroni di valenza appartenenti alle shell più esterne di isolanti. Ci si potrebbe aspettare che anche gli elettroni di conduzione possano fornire un contributo alla magnetizzazione 40 ed alla suscettività paramagnetica di un metallo del tipo della legge di Curie, cioè un contributo inversamente proporzionale alla temperatura. Invece, si è osservato sperimentalmente che la magnetizzazione di molti metalli (fra di essi anche metalli di transizione) è indipendente dalla temperatura. Occorre quindi correggere la teoria relativa al paramagnetismo quantistico degli elettroni di valenza appartenenti alle shell più esterne per spiegare questo comportamento associato agli elettroni di conduzione. Pauli dimostrò che l’applicazione della distribuzione di Fermi-Dirac avrebbe corretto la teoria come richiesto. Si assume in prima approssimazione che gli elettroni siano liberi, cioè che non siano soggetti all’azione di un potenziale esterno (es. potenziale periodico di un reticolo cristallino). Si fa anche l’ipotesi che valga l’approssimazione ad elettroni indipendenti in base alla quale gli elettroni non interagiscono fra di loro mediante un’interazione coulombiana. Se si trascura il contributo associato al momento angolare orbitale che dà origine come vedremo ad una forma di diamagnetismo, detta diamagnetismo di Landau, ogni elettrone è dotato solamente di momento magnetico di spin μespin = − g 0 μ B s . Scegliendo la direzione z (quella lungo cui viene applicato il campo magnetico esterno) si ottiene μespin = − g0 μ B sz . Sapendo che sz = ±1/ 2 dove il segno + (-) indica che lo spin è parallelo (antiparallelo) ad H e che g0 = 2 , ciascun elettrone fornisce alla magnetizzazione un contributo pari a ± μ B / V dove V è il volume del sistema. In particolare, se lo spin dell’elettrone è parallelo al campo H (momento magnetico di spin antiparallelo) il contributo vale − μ B / V , mentre se lo spin dell’ elettrone è antiparallelo ad H (momento magnetico di spin parallelo) il contributo vale + μ B / V . Quindi, definito n± = N ± / V dove n+ ( n− ) è il numero di elettroni per unità di volume con spin parallelo (antiparallelo) ad H, la magnetizzazione totale netta risulta M = μ B n− + (− μ B n+ ) = μ B n− − μ B n+ = μ B ( n− − n+ ) > 0 , poiché n− > n+ (si veda dopo per una dimostrazione). Se ogni elettrone interagisce con il campo magnetico solo attraverso il suo momento magnetico di spin allora l’energia d’interazione vale E = − μ espin ⋅ H = g 0 s z μ B H , poiché μespin = − g 0 μ B sz con sz = ±1/ 2 . L’effetto del campo magnetico è quello di rimuovere la degenerazione shiftando l’energia di ogni livello elettronico di una quantità pari ad E = ± μ B H dove il segno + si riferisce all’elettrone con spin parallelo al campo magnetico (spin up) e momento magnetico di spin antiparallelo, mentre il segno – fa riferimento all’elettrone con spin antiparallelo (spin down) e momento magnetico parallelo. Se si indica con g + ( ε ) ( g − ( ε ) ) il numero di elettroni per unità di volume con spin up (down) con energia compresa fra ε ed ε + d ε si deve avere, in assenza di un campo magnetico esterno, che 41 g ± (ε ) = 1 g (ε ) 2 poiché la probabilità di avere elettroni con spin up è uguale a quella di avere elettroni con spin down. In base alla definizione appena data si può indicare g + ( ε ) ( g − ( ε ) ) anche con ( dn / dε )+ ( ( dn / dε )− ) . La quantità g (ε ) = g + (ε ) + g − (ε ) , numero totale di elettroni per unità di volume con energia compresa fra ε ed ε + d ε , indica quindi genericamente una densità di stati di energia. È possibile esprimere mediante tale quantità il numero totale di elettroni per unità di volume per ogni specie di spin (spin up e spin down) scrivendo: n± = d ε g ± ( ε ) f ( ε ) dove ∫ f (ε ) = 1 e β (ε − μ ) +1 è la funzione di distribuzione di Fermi-Dirac ad una qualsiasi temperatura T con μ potenziale chimico. Essa rappresenta la probabilità di occupazione o numero medio di occupazione da parte degli elettroni di conduzione di un livello energetico presente nella banda di conduzione di un metallo compatibilmente con il principio di esclusione di Pauli. L’energia ε = 0 corrisponde al fondo della banda di conduzione, poiché nei metalli non è presente una vera e propria banda di valenza, ma solo una sorta di banda associata agli elettroni più vicini ai nuclei o elettroni di core. Come si nota, per ricavare n± si deve moltiplicare la densità di stati di energia corrispondente per la probabilità di occupazione a quella data energia. Allo zero assoluto (T = 0) vale l’uguaglianza μ = ε F dove ε F è l’energia di Fermi. La quantità ε è l’energia del singolo elettrone che risulta uguale alla sua energia cinetica imperturbata. Per il principio di conservazione dell’energia, l’energia cinetica ε′ posseduta dall’ elettrone in presenza di un campo esterno H è quindi la differenza fra la sua energia totale l’energia potenziale E acquisita in presenza di un campo esterno, ε e cioè ε ′ = ε − E = ε − ( ± μ B H ) = ε ∓ μ B H . In particolare, per spin up, cioè per spin parallelo ad H si ha ε − μ B H , mentre per spin down, cioè per spin antiparallelo ad H si ha ε + μ B H . In presenza di un campo magnetico esterno l’energia cinetica cambia a causa dell’interazione con H. Si ha quindi 1 g ( ε − μ B H ) Densità di stati di energia con spin up 2 1 g − ( ε ) = g ( ε + μ B H ) Densità di stati di energia con spin down 2 g+ (ε ) = 42 Si nota immediatamente dalla figura, dove è rappresentata la densità di stati di energia indicata con dn / dE , che il numero di elettroni di energia compresa fra ε ed ε + d ε con spin down è maggiore del numero di elettroni di energia compresa fra ε ed ε + d ε con spin up, cioè g − ( ε ) > g + ( ε ) a causa del segno + dentro la parentesi a secondo membro in g − ( ε ) . Si noti che in figura l’intensità H del campo magnetico è indicata con B. Ciò significa che gli elettroni con momento magnetico di spin parallelo al campo sono in numero maggiore degli elettroni con momento magnetico antiparallelo ad H come ci si doveva aspettare. E’ proprio questo eccesso di elettroni che dà il contributo al paramagnetismo degli elettroni di conduzione. Lo stato con energia massima corrisponde all’energia di Fermi εF sia per gli elettroni con spin down che per quelli con spin up. Quindi entrambe le bande elettroniche sono occupate fino all’energia corrispondente al livello di Fermi. Poiché gli elettroni con spin up contribuiscono con un momento magnetico pari a − μ B e quelli con spin down con un momento magnetico pari a + μ B , la magnetizzazione netta (momento magnetico 43 per unità di volume) del metallo riscritta mediante g ± ( ε ) che entrano a loro volta nella definizione di n± vale εF M = ∫ ⎡⎣ μ B g − ( ε ) f ( ε ) − μ B g + ( ε ) f ( ε ) ⎤⎦ d ε 0 dove a T = 0 f ( ε ) = 1 per 0 ≤ ε < ε F ed f ( ε F ) = (1.33) 1 . Si noti che Eq.(1.33) ha le dimensioni di una 2 magnetizzazione, poiché l’integrale dipende dal prodotto del momento magnetico μ B per il numero di elettroni (che è un numero puro) per unità di volume. Il numero di elettroni per unità di volume è dato a sua volta da g ± ( ε ) d ε con g ± ( ε ) d ε = ( dn / d ε )± d ε . Poichè l’energia d’interazione ± μ B H con il campo magnetico causa uno shift piccolo dell’energia degli elettroni (dell’ordine di 10-4 volte ε F anche per H pari a 104 G) se paragonato a ε che è invece dell’ordine di ε F (alcuni eV), si può sviluppare in serie di Taylor al primo ordine l’argomento di g ± ( ε ) , cioè g ± (ε ) = Basta infatti g ( x± ) = g ( ε ) + porre dg dx± 1 1⎛ dg ⎞ g (ε ∓ μ B H ) = ⎜ g (ε ) ∓ μ B H ⎟ 2 2⎝ dε ⎠ x± = ε ∓ μ B H , ( x± − ε ) sviluppare al primo ordine attorno a x± , cioè . Sostituendo nell’espressione della magnetizzazione di Eq.(1.33) si x± =ε ottiene 1 εF ⎡ ⎛ dg ⎞ dg ⎞ ⎤ ⎛ − μ B ⎜ g (ε ) − μB H μB ⎜ g (ε ) + μB H ⎟ ⎟ dε = ⎢ ∫ 2 0 ⎣ ⎝ dε ⎠ d ε ⎠ ⎥⎦ ⎝ ε F dg 1 εF ⎡ dg dg ⎤ = ∫ ⎢ μ B g ( ε ) + μ B2 H − μ B g ( ε ) + μ B2 H d ε == μ B2 H ∫ d ε = μB2 H ( g ( ε F ) − g ( 0 ) )= ⎥ 0 0 2 dε dε ⎦ dε ⎣ 2 = μB H g ( ε F ) M= poiché g ( 0 ) = 0 . Si trova che la magnetizzazione è espressa in funzione della densità di stati g valutata per ε = ε F . Si trova facilmente a partire dalla densità di stati di energia calcolata per ε = εF , cioè g (εF ) = ( 8π 2m3 h3 ) 1 2 2 ε 1 2 F e dall’energia di Fermi ⎛ 3n ⎞ 3 ε F = h 8m ⎜ 0 ⎟ ⎝ π ⎠ 2 che g ( ε F ) = 3n0 / 2ε F . Basta ricavare h3 dall’energia di Fermi e sostituirlo in g ( ε F ) . Infatti si ha che 44 2/3 ⎛ π ⎞ 2 h 2 = 8m ⎜ ⎟ εF ⇒ h ⎝ 3n0 ⎠ ( ) 3/ 2 2/3 ⎛ ⎞ 3 3/ 2 3/ 2 ⎛ π ⎞ = h = 8 m ⎜⎜ ⎟ ⎟ ⎜ ⎝ 3n0 ⎠ ⎟ ⎝ ⎠ sostituisce in g ( ε F ) si ottiene g (εF ) = 8π ( 2 ) 1/ 2 16 ( 2 ) 1/ 2 π 3n0 3/ 2 ε F3/ 2 ⇒ h3 = 24 ( 2 ) 1/ 2 m3 / 2 m3 / 2ε F3 / 2 1 εF 2 = π 3n0 m3/ 2ε F3/ 2 . Se si 3n0 In particolare, n0 è il 2ε F numero totale di elettroni per unità di volume che occupano i livelli fino al livello massimo a T = 0 corrispondente all’energia di Fermi ε F . Sostituendo g ( ε F ) nell’espressione della magnetizzazione si ottiene M = 3n0 μB2 H 2ε F (1.34) Questa espressione rappresenta la magnetizzazione dovuta alla riorientazione di spin degli elettroni di conduzione per effetto di un campo magnetico. Tale effetto è quindi presente nei metalli. E’ un effetto paramagnetico, poiché la magnetizzazione è nella stessa direzione e verso del campo 3n0 μB2 magnetico H a causa del fatto che la costante 2ε F è positiva e viene denominato PARAMAGNETISMO di PAULI. La suscettività paramagnetica di spin di un metallo tenendo conto della definizione, χPauli χPauli vale, χ = M / H valida quando M dipende linearmente da H 3n0 μB2 = 2ε F (1.35) Anche in questo caso la suscettività è una grandezza scalare positiva ed adimensionale. E’ da notare che la suscettività associata al paramagnetismo di Pauli è indipendente dalla temperatura. L’indipendenza dalla temperatura di χPauli è dovuta al fatto che la sua derivazione è stata effettuata assumendo T = 0. Tenendo presente che l’energia di Fermi per un metallo è mediamente ε F ≈ 2 eV (può anche avere un valore molto più alto) si ottiene che χPauli ≈ 5 × 10−6 valore in accordo con il risultato sperimentale. Tale valore è di circa un ordine di grandezza più piccolo rispetto a quella della suscettività paramagnetica di Langevin-Larmor associato agli elettroni di valenza e discussa nei paragrafi 1.3, 1.4 ed 1.5.2. Ciò è dovuto al fatto che l’effetto associato al principio di esclusione di Pauli è molto più efficace del disordine termico nel contrastare l’allineamento dei momenti magnetici con il campo magnetico esterno. Anche se nella derivazione di Eq.(1.35) si è fatta l’ipotesi che la temperatura fosse allo zero assoluto considerando l’occupazione dei livelli fino 45 all’energia di Fermi ε F e non oltre, tale risultato vale per un intervallo di temperature diverse dallo zero assoluto piuttosto ampio a partire da T = 0. Poichè nelle shell d- (es. W (Tungsteno)) il valore di n0 è maggiore rispetto a quello nelle shell s- (es. Li, Ag, Cu, Au) o p- (es. Al) e quello di ε F è invece in genere minore, il paramagnetismo elettronico dovuto agli elettroni di conduzione degli atomi che hanno shell d- incomplete è maggiore, poiché la corrispondente χPauli è maggiore. 1.6.2 Suscettività dei metalli: diamagnetismo di Landau Nella derivazione della suscettività paramagnetica degli elettroni di conduzione si è supposto che il moto degli elettroni non venga influenzato dal campo magnetico considerando solo gli effetti paramagnetici che si generano dall’accoppiamento dello spin dell’elettrone (momento angolare di spin) con il campo magnetico applicato. Si è quindi implicitamente assunto che le funzioni d’onda orbitali degli elettroni non vengano modificate dal campo H. Tuttavia ci sono anche effetti diamagnetici che originano dall’accoppiamento del campo con il moto orbitale degli elettroni considerati come particelle cariche che inducono una modifica delle funzioni d’onda orbitali degli elettroni di conduzione. Landau ha dimostrato che negli elettroni liberi ciò comporta la presenza di una magnetizzazione antiparallela ad H nota come DIAMAGNETISMO di LANDAU. In particolare, ha ricavato una suscettività diamagnetica pari ad 1/3 della suscettività di Pauli cambiata di segno, cioè χLandau = −1/ 3 χPauli . Se gli elettroni si muovono in un potenziale periodico (non sono quindi più elettroni liberi) l’analisi diventa più complicata anche se l’ordine di grandezza della suscettività diamagnetica è ancora pari a quello della suscettività paramagnetica. La suscettività totale che risulta da una misura del momento magnetico di un metallo indotto da un campo esterno risulta una combinazione della suscettività paramagnetica di Pauli dovuta agli elettroni di conduzione, della suscettività diamagnetica di Landau associata agli elettroni di conduzione e della suscettività diamagnetica di Larmor-Langevin associata agli elettroni più vicini ai nuclei o elettroni di core (per i metalli hanno il ruolo di elettroni di valenza anche se non sono caratterizzati da una banda di valenza). Quest’ultima forma di suscettività è presente in tutti i materiali, siano essi metalli all’interno di composti (in forma di ioni con shell esterna completa e quindi aventi comportamento isolante) od isolanti puri come i gas nobili. Non è semplice isolare facendo una misura i singoli contributi alla suscettività. La suscettività paramagnetica di Pauli può essere estratta dalla suscettività totale di un metallo facendo una misura basata sulla tecnica della risonanza magnetica nucleare. Tale tecnica infatti sfrutta il 46 forte accoppiamento con i momenti magnetici di spin da parte dei momenti magnetici dei nuclei ionici usati in questa tecnica. In figura sono rappresentate le suscettività magnetiche caratteristiche di sostanze diamagnetiche e paramagnetiche in funzione della temperatura T. Si noti che l’ordine di grandezza della suscettività paramagnetica di Pauli è lo stesso di quello della suscettività paramagnetica di Van Vleck anche se in media il corrispondente valore di χ è minore per la suscettività di Pauli come si vede in figura. Per alcuni metalli di transizione tuttavia la suscettività di Pauli è maggiore di quella di Van Vleck per gli isolanti. FERROMAGNETISMO Il ferromagnetismo è caratteristico dei materiali che presentano forte magnetizzazione in presenza di un campo magnetico che rimane quando viene tolto il campo. Perché ciò avvenga ci deve essere interazione fra i dipoli magnetici che li tiene orientati in una stessa direzione e verso (il verso risulta opposto per spin adiacenti in un antiferromagnete) anche quando viene meno il campo. Altrimenti non appena viene tolto il campo i dipoli si dovrebbero orientare in maniera casuale e ciò è invece una caratteristica dei materiali paramagnetici. La maggiore responsabile di tale interazione è 47 l’energia di scambio la cui origine microscopica è di natura quantistica essendo essa associata all’ordinaria interazione coulombiana repulsiva elettrone-elettrone ed al principio di esclusione di Pauli. La maggior parte delle teorie di magnetismo si basano solo su questo tipo di interazione e trascurano l’energia dipolare e l’energia di anisotropia che può a sua volta manifestarsi in diverse forme. Infatti, sia l’energia dipolare che quella di anisotropia sono in genere poco intense rispetto all’energia di scambio. 2.1 Interazione dipolare L’energia d’interazione fra due dipoli aventi momenti magnetici μ1 e μ2 rispettivamente e posti ad una generica distanza r vale Edipolare = 1 ⎡ μ1 ⋅ μ 2 − 3 ( μ1 ⋅ rˆ )( μ 2 ⋅ rˆ ) ⎤⎦ r3 ⎣ (2.1) dove rˆ = r / | r | è il versore che individua la direzione di r con | r |= r . Come si nota l’interazione dipolare è proporzionale all’inverso del cubo della distanza r. La forma scritta è anche simmetrica per i due dipoli, cioè risulta invariante se si scambia μ1 con μ2 . In generale l’energia dipolare agisce a distanze dell’ordine di 1 micron. E’ utile dare una stima dell’ordine di grandezza dell’interazione dipolare od interazione dipolo-dipolo che per definizione è un’interazione a lungo raggio a causa della dipendenza dall’inverso del cubo della distanza. Una buona stima dell’interazione dipolare si ottiene assumendo che i momenti magnetici siano μ1 ≈ μ2 ≈ g μ B così che l’energia, trascurando i contributi angolari contenuti nei prodotti scalari, vale approssimativamente Edipolare ( g μB ) ≈ 2 r3 Tenendo presente che la distanza dei dipoli magnetici in un ferromagnete è tipicamente dell’ordine di 2 A si trova che Edipolare ≈ 10−4 eV , cioè un valore molto piccolo rispetto all’interazione elettrostatica che porta a delle differenze di energie fra gli stati atomici dell’ordine di 1 eV . L’interazione dipolare è quindi troppo debole per giustificare il ferromagnetismo. Si può rappresentare il sistema nella forma schematizzata in figura. A sinistra è disegnato genericamente l’insieme dei momenti magnetici in un ferromagnete, mentre a destra è illustrata la 48 configurazione di due momenti magnetici μ1 e μ2 in corrispondenza della quale l’interazione dipolare in un sistema magnetico reale risulta minima. Si noti che l’energia dipolare di Eq.(2.1) risulta minima in un sistema ideale quando una coppia di dipoli μ1 e μ2 è allineata in modo tale che la freccia di un dipolo sia rivolta verso il punto di applicazione dell’altro (i due dipoli sono cioè lungo la direzione del vettore congiungente r ). Tuttavia nei sistemi fisici reali, per minimizzare l’energia dipolare i dipoli μ1 e μ2 tendono a disporsi ortogonalmente ad r e con verso opposto a causa ad esempio della presenza di anisotropie. Quindi l’interazione dipolare non favorisce l’allineamento dei dipoli, ma il loro antiallineamento. Da notare che entra in gioco nella minimizzazione energetica la posizione relativa rispetto al vettore r congiungente i due dipoli. Come vedremo, anche questo fatto differenzia l’interazione dipolare rispetto all’interazione di scambio dove invece compare solamente la posizione relativa fra le coppie di momenti magnetici individuata dall’angolo compreso fra di essi. 2.2 Interazione di scambio Come anticipato, il ferromagnetismo si spiega grazie all’interazione di scambio che è a corto raggio e più intensa di quella dipolare. Per spiegare l’origine microscopica di questo tipo di interazione che sta alla base del ferromagnetismo consideriamo un sistema a due elettroni appartenenti ciascuno ad un nucleo e quindi spaiati. Esso può essere rappresentato ad esempio da una molecola d’idrogeno in cui si considera in un primo momento solo l’interazione coulombiana repulsiva fra i due elettroni e 49 si trascurano le interazioni di ciascuno dei due elettroni con i due nuclei. E’ noto che il principio di esclusione di Pauli, che può essere riformulato nei termini di antisimmetria della funzione d’onda complessiva (parte spaziale e di spin), può portare ad effetti magnetici anche quando non ci sono termini dipendenti dallo spin nell’Hamiltoniana H. Poiché l’Hamiltoniana (intesa come operatore) di un sistema a due elettroni, data dalla somma di un termine di energia cinetica T =− 2 (∇ 2m 2 1 + ∇ 22 ) ed uno d’energia potenziale V ( r1 , r2 ) , non dipende dallo spin, lo stato stazionario di un sistema a due elettroni può essere scritto come il prodotto di uno stato stazionario puramente orbitale la cui funzione d’onda elettronica vale ψ ( r1 , r2 ) e soddisfa l’equazione di Schrödinger elettronica orbitale indipendente dal tempo H ψ ( r1 , r2 ) = − 2 (∇ 2m 2 1 ) + ∇ 22 ψ ( r1 , r2 ) + V ( r1 , r2 ) = Eψ ( r1 , r2 ) (2.2) e di uno stato di spin dato dalle possibili combinazioni lineari dei 4 stati di spin (funzione d’onda di spin) indicati con ↑↑ , ↑↓ , ↓↑ , ↓↓ dove ↑ indica sz = + 1/2 (spin up) e ↓ indica sz = -1/2 (spin down). Nell’Eq.(2.2) l’operatore energia potenziale è un’energia di interazione coulombiana fra i due elettroni, cioè V ( r1 , r2 ) = e2 . r1 − r2 Si possono scegliere le combinazioni lineari in modo tale da ottenere valori definiti dello spin totale S dei due elettroni e della sua componente Sz, somma delle componenti sz dei singoli spin lungo l’asse z. Come noto queste 4 combinazioni, ognuna delle quali esprimente la funzione d’onda di spin, sono rappresentate da 1 stato di singoletto (da cui il nome singoletto) caratterizzato da spin totale S = 0 e componente totale Sz = 0 e da 3 stati di tripletto (da cui il nome tripletto) caratterizzati da spin totale S = 1 e componente Sz = 1,0,-1 rispettivamente, cioè 50 χS ( s1, s2 ) = ( 1 ↑↓ − ↓↑ 2 ) ⎧ ↑↑ ⎪ ⎪⎪ 1 χT ( s1, s2 ) = ⎨ ↑↓ + ↓↑ 2 ⎪ ⎪ ↓↓ ⎪⎩ ( S = 0, S z =0 Singoletto S = 1, S z = 1 ) S = 1, S z =0 Tripletto S = 1, S z =-1 Lo stato di singoletto è descritto da una combinazione antisimmetrica degli spin, cioè cambia segno per scambio degli spin (scambio “spin up” con “spin down”) per cui χS ( s1, s2 ) = − χS ( s2 , s1 ) . E’ ragionevole scegliere tale stato di spin come antisimmetrico, poiché si deve differenziare il caso con spin 1 up e spin 2 down dal caso in cui vengono scambiati gli spin, cioè quello con spin 1 down e spin 2 up. I 3 stati di tripletto sono espressi invece da combinazioni simmetriche, cioè non cambiano segno per scambio degli spin per cui χ T ( s1 , s2 ) = χ T ( s2 , s1 ) . Anche in questo caso è ragionevole scegliere tali stati come simmetrici, perché lo scambio dello spin 1 con lo spin 2 non ha un effetto sul sistema degli spin. Corrispondentemente, a causa dell’antisimmetria della funzione d’onda totale imposta dal principio di esclusione di Pauli, la funzione d’onda orbitale dello stato di singoletto è simmetrica rispetto allo scambio delle posizioni delle due particelle, cioè di r1 con r2 , per cui viene scritta mediante la seguente combinazione lineare ψ S ( r1 , r2 ) = 1 (φ1 ( r1 ) φ2 ( r2 ) + φ2 ( r1 )φ1 ( r2 ) ) dove 2 φ1 si riferisce al nucleo 1 posto in R1 e φ2 al nucleo 2 posto in R2 . Quindi si ha che ψ S ( r1 , r2 ) = ψ S ( r2 , r1 ) . Da notare che, in base a questo tipo di rappresentazione, l’elettrone avente posizione r1 può appartenere al nucleo 2 avente posizione R2 e viceversa per l’elettrone avente posizione r2 a causa del principio di indistinguibilità. In questo scambio di posizioni sta la chiave del problema che porterà alla determinazione dell’integrale di scambio. Invece, la funzione d’onda orbitale di tripletto è antisimmetrica rispetto allo scambio di r1 con r2 per cui viene espressa mediante la combinazione lineare ψ T ( r1 , r2 ) = 1 (φ1 ( r1 ) φ2 ( r2 ) − φ2 ( r1 )φ1 ( r2 ) ) per ragioni simili a 2 quelle di ψ S ( r1 , r2 ) . Quindi si ha che ψ T ( r1 , r2 ) = −ψ T ( r2 , r1 ) . 51 Indichiamo con Es ed Et i due autovalori più piccoli (corrispondenti cioè allo stato fondamentale di energia minima), soluzioni dell’equazione di Schrödinger orbitale (cf. Eq.(2.2)), associati rispettivamente allo stato di singoletto ed allo stato di tripletto. Oltre a questi va considerato l’autovalore associato all’interazione coulombiana fra i due elettroni V ( r1 , r2 ) . Ancora una volta si nota che lo spin non influenza l’energia del sistema, perché gli autovalori, soluzione dell’Eq.(2.2), sono autovalori (energie) della parte orbitale dell’equazione di Schrödinger che è per definizione spin indipendente. Se si rappresenta lo stato generale di una molecola come una combinazione lineare dei 4 stati di spin, 3 di tripletto ed 1 di singoletto, discussi precedentemente è conveniente avere un operatore chiamato Hamiltoniana di spin H spin i cui autovalori Es ed Et danno gli spin degli stati corrispondenti, rispettivamente di singoletto e di tripletto. Vale per l’operatore vettoriale di spin totale S 2 la condizione S 2 = ( s1 + s2 ) = s12 + s22 + 2 s1 ⋅ s2 2 dove il doppio prodotto deriva dalla commutatività dei due operatori di spin su siti diversi (gli spin appartengono infatti ad atomi diversi), cioè s1 ⋅ s2 = s2 ⋅ s1 . Si ha che l’operatore S 2 soddisfa l’equazione agli autovalori S 2 χ ( s1 , s2 ) = S ( S + 1) χ ( s1 , s2 ) e l’autovalore corrispondente vale S ( S + 1) . Analogamente, devono valere le equazioni agli autovalori per gli operatori di singolo spin s12 ed s2 2 , cioè s12 χ ( s1 ) = s1 ( s1 + 1) χ ( s1 ) ed s22 χ ( s2 ) = s2 ( s2 + 1) χ ( s2 ) dove gli autovalori corrispondenti valgono s1 ( s1 + 1) ed s2 ( s2 + 1) , rispettivamente, ognuno dei quali è uguale ad 1/ 2 (1/ 2 + 1) = 3/ 4 . Si trova, in base alla relazione scritta fra gli operatori ed in base alle equazioni S2, agli autovalori per ( s12 ed s22 che l’autovalore E( s1 ⋅s2 ) associato all’operatore ) s1 ⋅ s2 = S 2 − ( s12 + s22 ) / 2 può essere scritto in funzione degli altri autovalori, cioè come ⎛ 3⎞ ⎛ 3 3 ⎞⎞ ⎛ E( s1 ⋅s2 ) = ( S ( S + 1) − ( s1 ( s1 + 1) + s2 ( s2 + 1) ) ) / 2 = ⎜ S ( S + 1) − ⎜ + ⎟ ⎟ / 2 = ⎜ S ( S + 1) − ⎟ / 2 2⎠ ⎝ 4 4 ⎠⎠ ⎝ ⎝ Si possono distinguere due casi: a) Stato di SINGOLETTO S = 0. L’autovalore di S 2 vale S(S+1), cioè 0. L’autovalore corrispondente di s1 ⋅ s2 vale ( 0 − 3/ 2 ) / 2 = −3/ 4 b) Stato di TRIPLETTO S = 1. L’autovalore di S 2 vale S(S+1), cioè 2. 52 L’autovalore corrispondente di s1 ⋅ s2 vale ( 2 − 3/ 2 ) / 2 = +1/ 4 Di conseguenza si può costruire il seguente operatore, Hamiltoniana di spin, nella forma H spin = 1 ( Es + 3Et ) − ( Es − Et ) s1 ⋅ s2 4 La corrispondente equazione di Schrödinger è data da H spin χ ( s1 , s2 ) = E spin χ ( s1 , s2 ) . Tale operatore è scritto in modo tale che nello stato di singoletto esso abbia autovalore E spin pari all’autovalore Es dell’Hamiltoniana di partenza e nello stato di tripletto abbia autovalore E spin pari all’autovalore Et dell’Hamiltoniana di partenza (cf. Eq. 2.2). Infatti si ha Stato di SINGOLETTO: l’autovalore di s1 ⋅ s2 vale -3/4 per cui E spin = 1 3 1 3 3 3 ( Es + 3Et ) − ( Es − Et ) ⎛⎜ − ⎞⎟ = Es + Et + Es − Et = Es 4 4 4 4 ⎝ 4⎠ 4 Stato di TRIPLETTO: l’autovalore di s1 ⋅ s2 vale +1/4 per cui E spin = 1 1 1 3 1 1 ( Es + 3Et ) − ( Es − Et ) ⎛⎜ + ⎞⎟ = Es + Et − Es + Et = Et 4 4 4 4 ⎝ 4⎠ 4 Ridefinendo lo zero dell’energia si può omettere la costante ( Es + 3Et ) / 4 comune a tutti e quattro gli stati e scrivere l’Hamiltoniana di spin H spin nella forma H spin = − 2 J s1 ⋅ s 2 (2.3) con 2 J = Es − Et e J integrale di scambio. L’Hamiltoniana di Eq.(2.3) prende il nome di Hamiltoniana di Heisenberg. Si può infatti dimostrare, utilizzando il metodo di Heitler-London applicato alla molecola di idrogeno, che due particelle (elettroni) 1 e 2 aventi posizioni r1 ed r2 ed orbitanti attorno a due nuclei aventi posizioni R1 ed R2 interagiscono attraverso un’energia coulombiana diretta ed una energia di scambio. L’Hamiltoniana corrispondente, detta di HeitlerLondon, è quella espressa dall’operatore di Eq.(2.2) a cui vanno aggiunte le interazioni coulombiane negative elettroni-nuclei, cioè − nucleo-nucleo + e2 R1 − R2 e2 r1 − R1 − e2 r2 − R2 − e2 r1 − R2 − e2 r2 − R1 , e quella positiva in modo tale che l’Hamiltoniana di Heitler-London risulta 53 H HL 2 ⎡ e2 e2 2 2 ⎢ = − ∇1 + ∇ 2 + − r1 − r2 r1 − R1 ⎢ 2m ⎣ ( ) ⎤ ⎡ e2 e2 e2 e2 ⎥ + ⎢− − − + ⎥ ⎢ r2 − R2 r1 − R2 r2 − R1 R1 − R2 ⎦ ⎣ ⎤ ⎥ . Assumendo ⎥ ⎦ che i nuclei si trovino a grande distanza grazie a cui la funzione d’onda del sistema a due elettroni può essere fattorizzata nelle funzioni d’onda associate a ciascun atomo si ottiene ⎛ e2 e2 e2 e2 ⎜ K = ∫ d r1 d r2 ⎡⎣φ ( r1 ) φ ( r2 ) ⎤⎦ + − − ⎜ r1 − r2 R1 − R2 r1 − R2 r2 − R1 ⎝ ⎞ ⎟ ⎡φ1 ( r1 ) φ2 ( r2 ) ⎤ ⎦ ⎟⎣ ⎠ 2 2 2 ⎛ e2 e e e + − − J = ∫ d r1 d r2 ⎡⎣φ ( r1 ) φ ( r2 ) ⎤⎦ ⎜ ⎜ r1 − r2 R1 − R2 r1 − R2 r2 − R1 ⎝ ⎞ ⎟ ⎡φ2 ( r1 ) φ1 ( r2 ) ⎤ ⎦ ⎟⎣ ⎠ ∗ 1 ∗ 2 ∗ 1 ∗ 2 dove K esprime l’energia coulombiana e J quella di scambio. Entrambi gli integrali hanno quindi le dimensioni di un’energia. In particolare, si può ricavare J determinando la differenza fra Es ed Et, a partire dall’Hamiltoniana di Heitler-London, cioè scrivendo Es − Et = dove (ψ i , H HLψ i ) con i = s, t indica l’elemento di matrice (ψ s , H HLψ s ) − (ψ t , H HLψ t ) (ψ s ,ψ s ) (ψ t ,ψ t ) e (ψ i ,ψ i ) è l’integrale di normalizzazione anch’esso espresso in forma di elemento di matrice. Si ricava l’integrale di scambio come J = ( Es − Et ) / 2 . Nel calcolo si possono usare per esempio le autofunzioni non normalizzate ψ S ( r1 , r2 ) = φ1 ( r1 ) φ2 ( r2 ) + φ2 ( r1 ) φ1 ( r2 ) e ψ S ( r1 , r2 ) = 2 (φ2 ( r1 ) φ1 ( r2 ) − φ1 ( r1 ) φ2 ( r2 ) ) , rispettivamente per lo stato di singoletto e di tripletto che si possono ottenere a partire dall’approssimazione ad elettroni indipendenti. A causa del fatto che i nuclei si assumono a grande distanza si può trascurare il quadrato dell’integrale di sovrapposizione I s2 che ha origine dall’integrale di normalizzazione I s = ∫ d r1 φ1∗ ( r1 ) φ2 ( r1 ) = ∫ d r2 φ1∗ ( r2 ) φ2 ( r2 ) . (ψ i ,ψ i ) . In particolare I termini in parentesi tonda indicano rispettivamente l’interazione coulombiana repulsiva fra i due elettroni, l’interazione coulombiana repulsiva fra i due nuclei, l’interazione coulombiana attrattiva fra l’elettrone 1 ed il nucleo 2 e l’interazione coulombiana attrattiva fra l’elettrone 2 ed il nucleo 1. Il secondo, il terzo ed il quarto termine di interazione vengono sommati al primo termine di interazione repulsiva fra i due elettroni che corrisponde all’operatore V ( r1 , r2 ) nell’equazione elettronica (cf. Eq.(2.2)) per tenere conto dell’energia potenziale totale del sistema includendo anche le energie di interazione elettroni-nuclei e nucleo-nucleo. In particolare, grazie all’approssimazione di Born-Oppenheimer, il potenziale d’interazione fra i due nuclei può essere assunto come costante se riferito al moto elettronico. I 54 termini di interazione coulombiana − e2 r1 − R1 e − e2 r2 − R2 degli elettroni 1 e 2 con i corrispettivi nuclei non entrano negli integrali K e J essendo termini associati agli atomi di idrogeno isolati. Entrambi i termini K e J sono scritti come elementi di matrice fra due stati espressi solo da funzioni d’onda orbitali. Esse risultano reali, poiché sono funzioni d’onda dello stato fondamentale di ciascun atomo di idrogeno che per definizione sono reali per cui si può omettere la complessa coniugazione. Poiché J si riferisce alla differenza fra l’energia dello stato di singoletto e quella dello stato di tripletto prende anche il nome di “splitting” di scambio. Le autofunzioni che compaiono in K ed in J sono autofunzioni orbitali e non di spin. Mentre l’integrale coulombiano K ha un analogo classico, perché l’elemento di matrice è fra stati uguali pari a φ1 ( r1 ) φ2 ( r2 ) , l’integrale di scambio J è calcolato fra due stati che differiscono fra loro per uno scambio delle posizioni r1 ed r2 dei due elettroni dati rispettivamente da φ1 ( r1 ) φ2 ( r2 ) e φ2 ( r1 ) φ1 ( r2 ) . Da notare che nell’integrale di scambio J si ha lo scambio delle posizioni spaziali dei 2 elettroni che a sua volta implica uno scambio fra gli spin assegnati a ciascun nucleo. A causa di questa peculiarità legata alle autofunzioni, l’origine dello scambio può quindi essere spiegato solamente mediante leggi quantistiche e non ha controparte classica. Se ci si limita a considerare un sistema a due elettroni come la molecola di idrogeno si può affermare, grazie ad un teorema valido per sistemi a due elettroni, che lo stato fondamentale è caratterizzato da una funzione d’onda orbitale simmetrica corrispondente ad uno stato di singoletto (S = 0) per cui si ha sempre che Es < Et da cui J < 0 , poiché l’energia di singoletto è l’energia minima. L’energia totale d’interazione si ottiene dall’integrazione dell’equazione di Schrödinger (cfr. Eq.(2.2)) in cui si considera per H l’Hamiltoniana completa di Heitler-London. Tralasciando il contributo costante imperturbato 2E0 associato ai due atomi considerati separatamente e contenente i due termini di energia cinetica dei due elettroni ed i termini di interazione di ciascun elettrone con il proprio nucleo, l’energia totale può essere scritta come Etot= K±J (K e J sono entrambi negativi) dove il segno + vale per spin antiparalleli (singoletto) ed il segno – per spin paralleli (tripletto). La differenza fra l’energia corrispondente allo stato di tripletto e quella corrispondente allo stato di singoletto vale Et - Es= (K-J) -(K+J) = -2 J. E’ da notare che, mediante il metodo di Heitler-London, si spiega il legame covalente che caratterizza il più importante contributo al legame nella molecola di idrogeno. Tuttavia, mediante il metodo di Heitler-London, si ottiene solo una stima grossolana dell’energia di legame , poiché occorre tenere presente che il legame ha in parte anche una natura ionica del tipo H+ H-. Per tenere conto di questo contributo occorre aggiungere alla funzione d’onda orbitale dello stato fondamentale di singoletto anche un 55 termine che tiene conto del fatto che entrambi gli elettroni possono appartenere ad un unico atomo, cioè una combinazione del tipo φ1 ( r1 ) φ2 ( r1 ) + φ1 ( r2 ) φ2 ( r2 ) Tuttavia, se si considera un solido costituito da N atomi o in generale da molecole complesse (caso più frequente), a causa di effetti a molti corpi, l’integrale di scambio J può essere positivo o negativo per cui nei solidi anche lo stato di tripletto può essere lo stato fondamentale. Risulta evidente che il ferromagnetismo si manifesta in elementi che hanno un numero piuttosto elevato di elettroni spaiati, cioè quelli i cui momenti angolari di spin non si cancellano. Inoltre la sovrapposizione delle funzioni d’onda orbitali, che entrano direttamente nella definizione dell’integrale di scambio, deve risultare piuttosto marcata in modo tale che J assuma valori sufficientemente grandi. Si vede facilmente che l’interazione di scambio decresce rapidamente al crescere della distanza fra gli elettroni appartenenti ad atomi diversi. Infatti, ciascuna funzione orbitale elettronica è maggiormente localizzata nell’intorno di r = Ri con i =1,2 (cioè vicino a ciascun nucleo) per poi decrescere molto rapidamente. Di conseguenza, l’energia di scambio diminuisce rapidamente per distanze superiori a R1 − R2 , cioè per distanze superiori alla distanza fra i due nuclei primi vicini. Quindi, praticamente solo gli atomi primi vicini di un determinato atomo in un cristallo contribuiscono all’interazione di scambio. Si può modellare fenomeno logicamente l’interazione di scambio mediante un esponenziale decrescente. Esso tende a zero più rapidamente di una potenza inversa del cubo della distanza che è invece caratteristico dell’interazione dipolare. In base a queste considerazioni risulta chiaro come in alcuni elementi di transizione (ad esempio il ferro, il nichel ed il cobalto) gli elettroni della shell d- (la più esterna), che risultano spaiati a causa della incompletezza della stessa, siano responsabili del loro comportamento ferromagnetico basato sull’interazione di scambio fra atomi vicini. Anche le loro corrispondenti leghe manifestano per ragioni simili un comportamento ferromagnetico. Infine, ancora per le stesse ragioni, alcune leghe del manganese (MnAs, MnBi ed MnSb), ma non il manganese preso come elemento singolo, sono ferromagnetiche. L’Hamiltoniana di Eq.(2.3) è molto semplice, perché dipende SOLO dal prodotto scalare dei due operatori di spin. Se J > 0 l’energia di scambio risulta minima quando gli spin sono paralleli dando luogo allo stato FERROMAGNETICO. Infatti, trattando i due operatori vettoriali s1 ed s2 come vettori ed indicando con θ l’angolo fra essi compreso si ha che H spin = −2 J s1 ⋅ s2 = −2 J | s1 || s2 | cos 0 = −2 J | s1 || s2 |( +1) = −2 J s1 s2 < 0 dove θ = 0 , mentre si otterrebbe 2 J s1 s2 > 0 per spin antiparalleli. La sostanza corrispondente è denominata 56 FERROMAGNETICA. E’ da notare che se J > 0 ciò implica, tenendo presente che 2 J = Es − Et , che Et < Es , cioè lo stato di tripletto a spin paralleli minimizza l’energia di scambio. Invece, se J < 0 l’energia di scambio risulta minima quando gli spin sono antiparalleli dando luogo allo stato ANTIFERROMAGNETICO. Infatti, in questo caso si ha H spin = −2 J s1 ⋅ s2 = −2 J | s1 || s2 | cos π = −2 J | s1 || s2 | ( −1) = 2 J s1 s2 < 0 dove θ = π , mentre si otterrebbe −2 J s1 s2 > 0 per spin paralleli. Le sostanze caratterizzate da questo accoppiamento sono ANTIFERROMAGNETICHE. Se J < 0 si ha che Es < Et , cioè lo stato di singoletto a spin antiparalleli minimizza l’energia di scambio. Esiste anche un terzo tipo di accoppiamento simile all’antiferromagnete rappresentato dal FERRIMAGNETE (ad esempio la magnetite (FeO x Fe2O3)) dove gli spin sono antiparalleli, ma non hanno la stessa grandezza. I tre tipi di sistemazioni ordinate di spin sono illustrati in figura. L’accoppiamento di scambio dipende solo dalla posizione relativa dei due spin, ma non dalle direzioni di ogni singolo spin rispetto al vettore congiungente i due spin r1 − r2 con r1 vettore posizione dello spin 1 ed r2 vettore posizione dello spin 2. L’interazione di scambio è un’interazione di origine quantistica a CORTO RAGGIO che, come già affermato, coinvolge soprattutto coppie di primi vicini. Tuttavia, nei solidi magnetici il ferromagnetismo è rappresentato dall’ Hamiltoniana generale H scambio = −∑ J ij si ⋅ s j ij dove si è estesa la somma a tutte le coppie di spin. Quindi, in teoria non solo gli atomi primi vicini, ma anche i vicini di ordine superiore contribuiscono all’interazione di scambio. Si è indicato genericamente con J ij la costante di scambio fra l’atomo i-esimo e l’atomo j-esimo (quella indicata in Eq.(2.3) con 2 J). Inoltre, a fissato ione i-esimo, la costante di scambio per ogni coppia di spin è diversa: in particolare, se si considerano n vicini (n=1 primi vicini, n=2 secondi vicini e così via) si 57 ( ha J i i +1 ≠ J i i + 2 ≠ J i i + 3 ≠ ...J i i + n J i i −1 ≠ J i i − 2 ≠ J i i − 3 ≠ ...J i i − n ) dove si è supposto per semplicità di essere nel caso unidimensionale. Spesso però nei modelli si considera realistica la somma estesa ai soli atomi primi vicini (2 nel caso unidimensionale), poichè essa rappresenta anche nei solidi il contributo più grande all’energia di scambio. Di conseguenza, l’integrale di scambio risulta uguale per ogni coppia ij con j = i ± 1 e può essere posto uguale a J. Sulla base di questa approssimazione si riscrive l’Hamiltoniana di scambio nella forma H scambio = − J ∑ si ⋅ s j 〈 ij 〉 (2.4) dove 〈 ij 〉 indica che la somma è fatta sui primi vicini. 2.3 Domini magnetici I domini magnetici sono regioni di un sistema ferromagnetico con magnetizzazione diversa. La formazione dei domini dipende dalla forma e dalle dimensioni del sistema e la magnetizzazione cambia orientazione passando da un dominio a quello adiacente. I domini magnetici sono chiamati anche domini di Weiss. Il confine che divide un dominio da quello adiacente prende il nome di parete di dominio. A causa dell’energia in gioco il confine fra due domini adiacenti può essere netto (la parete ha spessore tendente a zero) oppure graduale (la parete ha spessore finito). In quest’ultimo caso la parete di dominio è più estesa ed il costo energetico in energia di scambio per formarla è minore rispetto al caso in cui il confine è netto. Nella realtà la parete ha comunque sempre uno spessore diverso da zero ed il suo spessore dipende dalla competizione fra l’energia di scambio e quella di anisotropia. La parete di dominio è detta di Bloch se la magnetizzazione all’interno della parete ruota in un piano parallelo alla parete stessa (caso (a) di figura). La parete è invece detta di Néel se la magnetizzazione ruota in un piano perpendicolare alla parete di dominio (caso (b) di figura). 58 Nei sistemi magnetici le pareti che si formano più frequentemente sono quelle di Bloch. In figura è riportata una configurazione a singolo dominio e due esempi di configurazioni a doppio dominio separati da una parete di dominio che segna un confine netto fra i due domini. 59 Nella configurazione a singolo dominio schematizzata in alto è favorito energeticamente lo scambio ferromagnetico (J >0), poiché gli spin sono tutti paralleli a causa dell’azione del campo magnetico esterno e gli spin interagiscono mediante un’interazione di scambio ferromagnetica. Nella prima configurazione a doppio dominio (Es.1) si può affermare che dal punto di vista dell’interazione di scambio ferromagnetico si ha un danno energetico passando dalla configurazione con magnetizzazione up alla configurazione con magnetizzazione down, perché si accumula 60 un’energia in eccesso pari a 2 J. Infatti, assumendo gli spin di modulo unitario, quando essi sono paralleli l’energia di scambio di una coppia di spin vale H ↑↑ scambio = − J , mentre quando sono antiparalleli H ↑↓ scambio = J come si verifica per le coppie di spin adiacenti presenti in figura rispettivamente nel dominio di sinistra ed in quello di destra. La differenza fra le due energie è quindi H ↑↓ scambio − H ↑↑ scambio = J − ( − J ) = 2 J . Invece, dal punto di vista dell’interazione dipolare la configurazione è energeticamente conveniente. Infatti, l’interazione dipolare è per definizione un’interazione a lungo raggio ed una configurazione favorevole per l’energia dipolare si ha quando gli spin (atomi) sono disposti ortogonalmente rispetto al vettore congiungente ed antiparallelamente gli uni (dominio di sinistra) rispetto agli altri (dominio di destra) come in questo caso. Inoltre i primi (Ii) vicini (atomi) che interagiscono mediante l’interazione di scambio sono molti meno rispetto alla totalità degli atomi. Pur essendo più debole, in questa configurazione l’interazione dipolare è più importante dello scambio. Invece, la seconda configurazione a doppio dominio (Es.2) dove i primi vicini sono in numero maggiore rispetto ai vicini di ordine superiore (non rappresentati per semplicità in figura perchè presenti in numero basso) non è energeticamente favorevole nè per lo scambio ferromagnetico (per la stessa ragione del caso precedente) nè per l’interazione dipolare a causa della scarsità di atomi secondi, terzi, ect… vicini che interagirebbero mediante un’interazione a lungo raggio. L’interazione di scambio è comunque la più importante ed anche la più forte. E’ interessante studiare il comportamento di un sistema a doppio dominio come quello dell’Es.1 sotto l’azione di un campo magnetico esterno. Si verifica che il dominio avente magnetizzazione parallela ad H risulta più esteso rispetto al dominio con magnetizzazione antiparallela. Il sistema presenta magnetizzazione netta parallela alla direzione di H . Infine, lo spostamento della parete di dominio in seguito all’azione di un campo esterno è dovuta al campo esterno stesso che porta ad un’estensione del dominio con magnetizzazione parallela ad H . Tale spostamento si può bloccare a causa di difetti reticolari. In figura è rappresentato lo spostamento della parete dalla posizione P alla posizione P1 in un sistema a due domini. Al crescere dell’intensità di H nel tempo, se non si verificano blocchi dovuti a difetti reticolari, il dominio di sinistra con magnetizzazione parallela ad H aumenta di dimensioni a causa dello spostamento della parete verso destra, mentre quello di destra, con magnetizzazione antiparallela ad H , si riduce sempre più. Si arriva alla fine del processo di spostamento ad avere un singolo dominio con magnetizzazione parallela ad H in tutto il sistema. 61 2.4 Ferromagnete semplice In generale i sistemi magnetici sono interessanti, perché presentano transizioni di fase. Il tipo di interazioni associate alle transizioni di fase sono quella di scambio e quella Zeeman esprimente l’interazione del sistema con il campo magnetico esterno. Si devono considerare materiali a singolo dominio, cioè sistemi sufficientemente piccoli affinché non si verifichi il fenomeno dei domini magnetici. Un ferromagnete caratterizzato solo da interazione di scambio ed interazione con il campo magnetico esterno si chiama FERROMAGNETE SEMPLICE. In un ferromagnete semplice tutti i dipoli sono uguali, l’integrale di scambio è POSITIVO ( J > 0) ed a temperatura T = 0 i dipoli magnetici sono tutti allineati fra di loro. 62 L’Hamiltoniana di un ferromagnete semplice ha la forma H = − J ∑ μi ⋅ μ j − H ⋅ ∑ μi 〈 ij 〉 (2.5) i dove μi ( μ j ) è il momento di dipolo dell’atomo i-(j)-esimo ed H è il campo magnetico esterno. In questo caso J ha le dimensioni di un’energia e si assume che anche H abbia le dimensioni di un’energia, poiché il momento magnetico μi è assunto adimensionale. Il primo termine dell’Hamiltoniana è il termine di scambio con interazione a primi vicini, mentre il secondo termine esprime l’interazione con il campo (termine Zeeman). Se si pone J = 0 si ha un paramagnete semplice. Dal punto di vista classico il momento magnetico generico μ precede attorno ad H formando un cono di precessione come disegnato in figura. H ẑ μz μ Dal punto di vista quantistico lo schema è simile, ma solo per gli autovalori (corrispondenti alle frequenze dei modi normali calcolate classicamente) perché i vettori μ sono elevati al rango di operatori e la componente z ( μ z ) del momento magnetico è quantizzata. Inoltre, gli autovalori sono quantizzati secondo le regole della meccanica quantistica. Esiste anche un modello semiclassico dove vengono considerati vettori μ la cui componente nella direzione del campo è però ancora quantizzata. Essa è uguale a + μ0 se è parallela ad H , mentre vale − μ 0 se è antiparallela. Anche se si parla di vettori e non di operatori si ha lo stesso una quantizzazione della componente z del momento magnetico. 63 Per studiare la dinamica dei modi di spin nei sistemi continui (infiniti o confinati) si può seguire sia l’approccio semiclassico che quello quantistico. 2.4.1 Diagramma di fase di un ferromagnete semplice per H = 0 Il diagramma di fase del ferromagnete semplice disegnato in figura è individuato dalle variabili H, T, M ed n dove H è il campo magnetico, T è la temperatura assoluta del sistema, M è la magnetizzazione ed n il numero di moli che è considerato costante. Si ha che M = M(H,T), cioè la magnetizzazione M dipende sia dal campo applicato H che dalla temperatura T e le tre grandezze sono legate da una sorta di equazione di stato. Il sistema è scelto in modo tale che il campo applicato sia lungo la direzione z, cioè H zˆ . La temperatura critica Tc è la temperatura in corrispondenza della quale la magnetizzazione è nulla in assenza di un campo magnetico applicato e segna il passaggio dalla fase ferromagnetica alla fase paramagnetica o viceversa (transizione di fase ferromagnete↔paramagnete). Si può individuare, per T < Tc, una linea di transizioni di fase del primo ordine ad H = 0. Se T = 0 ed H è diretto lungo + ẑ si ottiene M = N / V μ (N è il numero di atomi e V il volume del sistema) che rappresenta il valore massimo. Se invece H ha verso opposto si ottiene M = − N / V μ , valore 64 minimo. La transizione è quindi del primo ordine. Il vettore magnetizzazione è indicato in figura con una freccia verso l’alto (per H positivo) e con una verso il basso (per H negativo). Quando la temperatura sale alcuni dipoli iniziano a ruotare a causa dell’agitazione termica. Quindi, non si avrà più il valore della magnetizzazione massima o minima. A T = Tc per H = 0 si ha una transizione continua o critica e per questa ragione Tc prende il nome di punto critico. Anche a temperatura T molto elevata non si può avere M = 0 quando H ≠ 0 , cioè in presenza di un campo esterno. Per T > Tc e per H = 0 si ha M = 0. In figura è disegnato l’andamento della magnetizzazione in funzione della temperatura per H = 0. Si vede che per T < Tc la magnetizzazione è diversa da zero. Per T ≥ Tc la magnetizzazione è nulla. Equivalentemente la curva della magnetizzazione per M <0 risulterebbe simmetrica rispetto all’asse delle T e per T ≥ Tc risulterebbe anch’essa uguale a zero. La classificazione delle transizioni di fase, di cui queste appena descritte fanno parte, verrà discussa nel Capitolo “Transizioni di fase”. M Tc T 65 2.5 Temperatura di Curie e legge di Curie-Weiss La temperatura di Curie è la temperatura al di sopra della quale scompare la magnetizzazione spontanea. E’ la temperatura critica che caratterizza la transizione di fase ferromagnete ↔ paramagnete in assenza di un campo esterno, cioè per H = 0. Separa quindi la fase paramagnetica disordinata a T > Tc dalla fase ferromagnetica ordinata a T < Tc. Supponiamo che il sistema sia nella fase paramagnetica caratterizzata da una magnetizzazione nulla. L’applicazione di un campo magnetico esterno H provoca una magnetizzazione finita M . Conviene tenere conto dell’ipotesi di Weiss del campo molecolare o campo di scambio H s , trattato equivalentemente ad un campo magnetico esterno, secondo cui H s è proporzionale ad M , cioè H s = λ M dove λ è una costante indipendente dalla temperatura. Questa ipotesi è a tutti gli effetti la prima ipotesi basata su una teoria di campo medio. Quindi, in base ad essa, la magnetizzazione finita del paramagnete, dovuta ad un campo esterno, genera a sua volta un campo di scambio. Se χ è la suscettività del sistema, tenendo conto del fatto che essa esprime la capacità di magnetizzazione di un sistema in risposta all’applicazione di un campo, si può scrivere la seguente relazione scalare, cioè M = χ (H + Hs ) dove si è incluso anche il campo di scambio. Sostituendo ad H s la sua espressione in forma scalare si ricava χ = M / ( H + λ M ) . Si è già ricavato che la suscettività di un paramagnete è data dalla legge di Curie secondo cui χ = C / T dove C è la costante di Curie e T è la temperatura assoluta (cf. Eq.(1.15) ed Eq.(1.22)). Eguagliando le due espressioni della suscettività, cioè scrivendo M /(H + λ M ) = C /T si ha che M T = C ( H + λ M ) . Portando il termine proporzionale alla magnetizzazione C λ M a primo membro si ha che (T − C λ ) M = C H . Si ottiene quindi che M = C H / (T − C λ ) . Tenendo ancora conto della definizione della suscettività nel caso in cui M dipende linearmente da H, cioè χ = M / H si trova che 66 χ= C T − Cλ La suscettività presenta una singolarità per T = Cλ ed è quindi infinita ( χ → ∞) . A questa temperatura e conseguentemente anche per temperature al di sotto di essa esiste una magnetizzazione spontanea tipica di un ferromagnete. Infatti, se per T = Cλ la suscettività è infinita, tenendo conto del fatto che la suscettività è anche espressa da χ = M / H si realizza la condizione χ → ∞ con un valore di M finito, cioè con una magnetizzazione spontanea, in assenza di un campo esterno H, cioè per H = 0 (infatti il limite di un numero finito (M) diviso per zero (H) è uguale all’infinito). Si può quindi esprimere χ nella forma χ= C ; T − Tc Tc = C λ (2.6) Eq.(2.6) esprime la LEGGE di CURIE-WEISS dove Tc è detta temperatura di Curie o punto di Curie e segna il passaggio dalla fase paramagnetica a quella ferromagnetica in assenza di campo esterno. Essa rappresenta una temperatura critica. L’espressione trovata descrive abbastanza bene l’andamento della suscettività poco al di sopra del punto di Curie. Tuttavia, calcoli più accurati confermati da dati sperimentali mostrano che l’andamento della suscettività è χ ∝ (T − Tc ) −4 / 3 in prossimità del punto di Curie. I principali elementi ferromagnetici hanno temperature di Curie diverse. In particolare ad esempio per il ferro Tc = 1043 K , per il cobalto Tc = 1400 K , mentre per il nichel Tc = 631 o K . In modo analogo ai ferromagneti si può ricavare la suscettività e l’equivalente di una temperatura di Curie per i ferrimagneti e per gli antiferromagneti. Per questi ultimi la temperatura al di sotto della quale a partire da un paramagnete si ha un antiferromagnete (spin ordinati antiparallelamente) con momento totale nullo è detta TEMPERATURA di NEEL. L’andamento della suscettività in funzione della temperatura di un antiferromagnete semplice ha un comportamento più complesso rispetto a quello del paramagnete semplice. 67