esperimenti spesso M dipende linearmente da H (cioè M = k H dove k è una costante) la definizione di suscettività si riduce ad una forma ancora più semplice, cioè χ= M H (1.4) In accordo con questa definizione la suscettività è ancora una grandezza scalare e non dipende dal campo magnetico esterno H. In base al comportamento nei confronti di un campo magnetico esterno le sostanze si suddividono in due categorie, cioè in sostanze DIAMAGNETICHE e sostanze PARAMAGNETICHE. Si definisce DIAMAGNETICA una sostanza che tende a schermare l’azione di un campo magnetico applicato. In questo modo il momento magnetico indotto di ciascun atomo ha direzione opposta a quella individuata dal campo applicato. Una sostanza è invece PARAMAGNETICA quando i corrispettivi momenti magnetici di ciascuno dei suoi atomi tendono ad allinearsi sotto l’azione di un campo magnetico esterno lungo la direzione individuata dal campo magnetico stesso. In base a tale comportamento le sostanze DIAMAGNETICHE sono caratterizzate da suscettività magnetica χ negativa (χ < 0), mentre le sostanze PARAMAGNETICHE hanno suscettività magnetica χ positiva (χ > 0). 1.2 Teoria classica del diamagnetismo: teoria di Langevin Il fenomeno del diamagnetismo causato dalla tendenza delle cariche elettriche (elettroni) a schermare in parte un corpo dall’azione di un campo magnetico applicato ha il suo analogo elettrodinamico nella legge di Lenz. Tale legge descrive l’insorgenza di una corrente indotta come risposta alla variazione di flusso del campo magnetico attraverso un circuito di corrente. Tale corrente indotta si oppone alla variazione di flusso ed alla corrente ad esso associata. Tutte le sostanze hanno comportamento diamagnetico, poiché tutti gli atomi hanno elettroni appartenenti alle shell più esterne che schermano l’azione di un campo magnetico esterno. Il comportamento diamagnetico è tipico di quelle sostanze in cui questo effetto è preponderante rispetto agli altri effetti possibili. Sono esempi di sostanze diamagnetiche i gas nobili allo stato solido, materiali con shell elettroniche complete come l’elio (He), il neon (Ne), l’argon (Ar), il kripton (Kr) e lo xenon (Xe); sono diamagnetici anche i composti ionici come il fluoruro di litio (LiF), il fluoruro di potassio (KF) ed il fluoruro di sodio (NaF). Sia l’alogeno (atomo di fluoro F) acquistando un 3 elettrone che i metalli alcalini (Li, K, Na) perdendo un elettrone sono sostanze diamagnetiche, poichè ionizzandosi realizzano la condizione di shell esterna completa. Per ricavare il risultato classico di Langevin esprimente la suscettività magnetica di una sostanza diamagnetica occorre richiamare in primo luogo il TEOREMA di LARMOR. Esso afferma che il moto degli elettroni attorno al nucleo in presenza di un campo magnetico di intensità H è, al primo ordine in H, lo stesso moto che si avrebbe in assenza di tale campo a cui si deve sovrapporre un ulteriore moto di precessione attorno ad H la cui frequenza angolare di precessione è data per ogni elettrone da ωL = eH 2mc (1.5a) dove e è la carica dell’elettrone presa in modulo, m è la massa dell’elettrone e c è la velocità della luce. La frequenza angolare viene definita FREQUENZA di LARMOR. La direzione della velocità angolare ωL è lungo l’asse individuato dal campo magnetico H . La corrispondente frequenza f L = ω L 2π (L indica Larmor) può essere espressa nella forma fL = dove γ L = γL H 2π (1.5b) e è il rapporto giromagnetico orbitale (scritto a meno del segno – della carica) di un 2mc corpo rigido rotante (elettrone) secondo le leggi della meccanica classica. Si vedrà nel paragrafo 1.4 che esso è dato dal rapporto fra il momento magnetico ed il momento angolare orbitale. Si fa l’ipotesi che la corrente media (la media è d’insieme) generata dagli elettroni contenuti all’interno di un atomo sia nulla prima dell’applicazione del campo magnetico esterno. In seguito all’applicazione di un campo magnetico esterno ciascun elettrone ruota descrivendo orbite circolari attorno all’asse individuato da H ad una frequenza angolare pari alla frequenza di Larmor e l’insieme degli elettroni produce una corrente media finita attorno al nucleo. Si assume anche che la frequenza di Larmor sia molto inferiore alla frequenza del moto originale dell’elettrone attorno al nucleo soggetto a forze di tipo centrale e questa ipotesi è ragionevole per un campo magnetico esterno debole. E’ noto dalle leggi dell’elettrodinamica classica che una carica in movimento genera una corrente i = dq / dt dove q è la generica carica e t è il tempo. Vista l’analogia geometrica con il modello della spira circolare percorsa da corrente può essere utilizzato per il calcolo di i tale modello. La corrente è data, per ciascun elettrone, da i = e / cT (c si aggiunge nell’espressione di i per ragioni dimensionali nel sistema C.G.S.); T = 2π / ωL è il periodo di rivoluzione, cioè il tempo impiegato dall’elettrone per percorrere un’intera circonferenza ed ωL è la frequenza angolare di 4 Larmor. Il periodo di rivoluzione è in questo caso un periodo associato alla precessione attorno alla direzione del campo magnetico esterno. Quindi, sostituendo l’espressione di T nell’intensità di corrente i, si trova iL = e ωL / 2π c . Se si considera un atomo contenente Z elettroni si scrive la corrente totale equivalente I = − Z iL dove il segno – è dovuto al fatto che la direzione della corrente equivalente generata convenzionalmente da una carica positiva è opposta rispetto alla direzione del moto della corrente generata dall’elettrone avente carica negativa. Sostituendo l’espressione della frequenza di Larmor di Eq.(1.5) dentro iL = e ωL / 2π c si trova che la corrente totale I generata da Z elettroni vale I =− Ze 2 H 4π m c 2 (1.6) Poiché il percorso della corrente è molto piccolo il momento magnetico orbitale può essere scritto come il prodotto fra l’intensità i della corrente e l’area A dell’orbita (assunta circolare). Il campo magnetico prodotto dall’elettrone è, a grandi distanze, equivalente a quello di un dipolo magnetico caratterizzato da un vettore momento di dipolo posto nel centro dell’orbita e perpendicolare al piano dell’orbita stessa. L’elettrone è, a tutti gli effetti, equivalente ad un dipolo magnetico. In base alla = iL A definizione fornita, l’intensità del momento magnetico orbitale del singolo elettrone è μeorbitale L dove A = π ρ 2 è l’area dell’orbita dell’elettrone e ρ è il raggio dell’orbita. Il momento magnetico orbitale esprime la forza del dipolo magnetico associato all’elettrone. Per avere il momento magnetico totale μ dell’atomo associato agli Z elettroni basta moltiplicare per il numero Z di elettroni, cioè μ=− Z e2 H 2 〈ρ 〉 4mc 2 (1.7) In Eq.(1.7) la quantità 〈 ρ 2 〉 è la media del quadrato della distanza del generico elettrone dall’asse lungo cui è posto il campo magnetico. Essa è definita come una media d’insieme delle posizioni degli Z elettroni dell’atomo. Poiché tale distanza è definita su un piano individuato dalla rotazione dell’elettrone avente generiche coordinate x ed y attorno all’asse si scrive 〈 ρ 2 〉 = 〈 x 2 〉 + 〈 y 2 〉 con le quantità 〈 x 2 〉 e 〈 y 2 〉 indicanti le corrispondenti medie delle singole componenti x ed y elevate al quadrato. La distanza quadratica media del generico elettrone dal nucleo è invece 〈 r 2 〉 = 〈 x 2 〉 + 〈 y 2 〉 + 〈 z 2 〉 dove si è aggiunta anche la media del quadrato della componente z, poiché la distanza è in questo caso calcolata rispetto ad un punto, rappresentato dal nucleo, posto sull’asse. In figura è schematizzato il moto di precessione del generico elettrone attorno all’asse definito dal campo magnetico applicato. 5 z H Piano xy ωL ρ e- r Nucleo Per una distribuzione di carica a simmetria sferica deve valere 〈 x 2 〉 = 〈 y 2 〉 = 〈 z 2 〉 a causa dell’isotropia spaziale così che si può scrivere ad esempio 〈 ρ 2 〉 = 2〈 x 2 〉 ed 〈 r 2 〉 = 3〈 x 2 〉 . Si trova che 〈 x 2 〉 = 〈 r 2 〉 / 3 che, sostituito in 〈 ρ 2 〉 , fornisce 〈 ρ 2 〉 = 2 / 3 〈 r 2 〉 . Sostituendo in Eq.(1.7) l’espressione di 〈 ρ 2 〉 si trova Z e2 H 2 μ=− 〈r 〉 6mc 2 (1.8) Per ottenere il momento magnetico totale basta sommare i momenti magnetici di ciascun atomo e ciò equivale a moltiplicare per il numero N di atomi del mezzo supponendo che tali momenti magnetici siano tutti uguali. Quindi si può scrivere μtot = N μ . Dividendo μtot per il volume V del mezzo si trova la corrispondente magnetizzazione, cioè M = − N Z e2 H 2 〈 r 〉 nell’ipotesi che il V 6mc 2 mezzo sia uniformemente magnetizzato in accordo con Eq. (1.2). Si nota che la magnetizzazione è 6 antiparallela al campo esterno. Dividendo ancora per il campo magnetico H si trova la SUSCETTIVITÀ DIAMAGNETICA del mezzo χ= M N Z e2 2 =− 〈r 〉 H V 6mc 2 (1.9) Eq.(1.9) rappresenta la LEGGE di LANGEVIN e costituisce un risultato derivato per via classica. Il problema del calcolo della suscettività diamagnetica si riduce al calcolo di 〈 r 2 〉 per la distribuzione elettronica nell’atomo che può essere ottenuto in modo preciso usando la meccanica quantistica. Per come è stata definita, la suscettività diamagnetica è una grandezza scalare ed adimensionale. A causa del segno meno nel membro di destra posto davanti ad una quantità positiva essa risulta minore di zero. Come si nota la suscettività diamagnetica è indipendente dalla temperatura. Si sarebbe potuta trovare la suscettività diamagnetica di Eq.(1.9) anche applicando la definizione più generale di suscettività data in Eq.(1.3). Tipicamente la suscettività diamagnetica è dell’ordine di -10-4÷-10-5. Tuttavia, sperimentalmente viene misurata la suscettività magnetica molare misurata in cm3/mole (si veda il paragrafo 1.5.1 per la sua definizione). molare χ Il limite della trattazione classica del diamagnetismo sta nel fatto che si assume che la direzione del campo magnetico esterno sia un asse di simmetria del sistema e questo non è in genere vero per sistemi molecolari complessi. Per questa ragione deve essere applicata la teoria generale del diamagnetismo e del paramagnetismo formulata da Van Vleck. Tale teoria si basa su leggi quantistiche e riproduce sotto particolari condizioni il risultato classico di Langevin. Discuteremo tale teoria nel paragrafo 1.4. 1.3 Teoria classica del paramagnetismo: equazione di Langevin e legge di Curie In generale, il paramagnetismo di una sostanza origina dal moto degli elettroni attorno ai nuclei di ciascun atomo ed è quindi denominato paramagnetismo elettronico. Occorre tenere presente che si ha anche un paramagnetismo nucleare associato al moto dei protoni e dei neutroni attorno al nucleo la cui entità è molto minore rispetto a quello elettronico a causa della massa dei protoni e dei neutroni che risulta molto maggiore rispetto a quella degli elettroni. Si ha paramagnetismo elettronico nelle seguenti classi: 7 a) Atomi, molecole e difetti reticolari con un numero dispari di elettroni. Infatti lo spin totale non può essere nullo. b) Atomi liberi e ioni con un orbitale più interno parzialmente occupato. Appartengono a questa classe gli elementi di transizione (es. ferro (Fe), cobalto (Co), nichel (Ni), rame (Cu), manganese (Mn)), elementi delle terre rare (es. lantanio (La), cerio (Ce), samario (Sm), gadolinio (Gd)) e degli attinoidi (es. torio (Th), uranio (U), plutonio (Pu)). c) Alcuni composti aventi un numero pari di elettroni incluso l’ossigeno molecolare (non atomi singoli). d) I metalli (es. sodio (Na), potassio (K), calcio (Ca)) esclusi i metalli di transizione appartenenti al gruppo b). Le sostanze paramagnetiche sono caratterizzate da atomi ciascuno dei quali ha un definito momento magnetico, ma i momenti magnetici non interagiscono fra di loro. Risultano quindi nulle sia l’interazione di scambio che l’interazione dipolare che verranno discusse nei paragrafi 2.1 e 2.2 per le sostanze ferromagnetiche. Deriviamo ora l’equazione di Langevin per il paramagnetismo classico. Supponiamo di avere un mezzo (paramagnete) contenente N atomi ciascuno dei quali con momento magnetico μ . In un mezzo paramagnetico la magnetizzazione totale si media a zero a causa del disordine termico. Se viene applicato un campo magnetico esterno, oltre al piccolissimo effetto diamagnetico, i momenti magnetici degli atomi tendono ad allinearsi lungo la direzione del campo. L’energia d’interazione di ciascun atomo con il campo H è data da E = − μ ⋅ H = − μ H cos θ (1.10) dove θ è l’angolo compreso fra il momento magnetico ed il campo magnetico esterno. Ciò equivale ad affermare che un dipolo magnetico di momento μ , se immerso in un campo magnetico H , acquisisce un’energia pari ad E = − μ ⋅ H . In figura è rappresentata la direzione arbitraria del momento magnetico del generico atomo rispetto al campo magnetico esterno. 8 H μ z θ y φ x Per il calcolo della magnetizzazione Langevin seguì lo stesso tipo di calcolo effettuato da Debye per calcolare la polarizzabilità per orientazione in un dielettrico. In particolare si può definire la magnetizzazione del paramagnete nella forma M = N μ 〈 cos θ 〉 V (1.11) dove N è il numero di atomi supposti non interagenti e V è il volume del mezzo paramagnetico. 〈...〉 indica la media delle possibili orientazioni del generico atomo rispetto al campo magnetico nell’elemento di angolo solido d Ω = sin θ dθ dφ calcolata rispetto alla distribuzione classica di probabilità di Boltzmann all’equilibrio, cioè 2π 〈 cos θ 〉 = ∫ 0 π dφ ∫ dθ sin θ cos θ e − β E 2π 0 π ∫ dφ ∫ dθ sin θ e 0 −β E 0 dove φ è l’angolo azimutale e θ è l’angolo polare; β = 1/ k BT con k B costante di Boltzmann. Sostituendo ad E l’espressione data in Eq.(1.10) ed integrando in φ a numeratore ed a denominatore si ottiene π cos θ = ∫ dθ sin θ cos θ e 0 π ∫ dθ sin θ e βμ H cosθ βμ H cosθ 0 9 L’integrale si risolve per sostituzione di variabile, cioè si pone t = cosθ per cui dt = − sin θ dθ ; quindi per θ = 0 si ha t = 1 e per θ = π si ha t = −1 . Conviene anche effettuare la sostituzione x = βμ H . Si ottiene −1 〈 cos θ 〉 = ∫ −dt t e 1 tx 1 −1 ∫ −dt e = ∫ dt t e −1 1 ∫ dt e tx tx tx = f ′( x) f ( x) = d ⎡ ln f ( x ) ⎤⎦ = dx ⎣ −1 1 1 1 ⎞ ⎤ d ⎡ ⎛ et x ⎞ ⎤ d ⎡ ⎛ e x − e − x ⎞ ⎤ d ⎡ ⎛ tx ⎢ ln ⎜ ⎟⎥ = = ⎢ ln ⎜ dt e ⎟ ⎥ = ⎢ ln ⎜ ⎟⎥ = ⎜ ⎟ dx ⎢⎣ ⎝ −∫1 dx x dx x ⎢ ⎥ ⎠⎦ ⎠ ⎥⎦ ⎣ ⎝ −1 ⎠ ⎦ ⎣ ⎝ d ⎡ −x x ⎤ = d ⎡ ln e x − e − x ⎤ − d [ ln x ] = = − − ln ln e e x ⎦ dx ⎣ ⎦ dx dx ⎣ 1 e x + e− x 1 = x − x − = coth x − e −e x x ( ) ( ) Nel primo passaggio si è cambiato segno sia a numeratore che a denominatore scambiando così gli 1 1 1 d d estremi di integrazione e si è posto ∫ dt e = f ( x ) così che f ′ ( x ) = f ( x ) = ∫ dt et x = ∫ dt tet x dx dx −1 −1 −1 tx dove si è scambiato l’integrale con l’operazione di derivazione a causa della continuità della funzione integranda. Si è, quindi, applicata la regola di derivazione della funzione logaritmo naturale f ′( x) d a ⎡⎣ ln f ( x ) ⎤⎦ = . Si è poi sfruttata una proprietà del logaritmo, cioè ln = ln a − ln b b dx f ( x) e si è infine tenuto conto dell’identità trigonometrica e x + e− x = coth x dove coth è la cotangente e x − e− x iperbolica. La funzione L( x) = coth x − 1 x (1.12) è la FUNZIONE di LANGEVIN disegnata in figura. L ( x ) è una funzione compresa fra 0 ed 1. In particolare, L ( x ) è una funzione monotona crescente di x e tende ad 1 al crescere di x, cioè al crescere del rapporto H/T . 10 1.0 L(x) 0.8 0.6 0.4 0.2 0 2 4 x 6 8 10 Quindi, sostituendo nell’espressione della magnetizzazione di Eq.(1.11), si ricava M= N μ L ( x) V (1.13) Eq.(1.13) rappresenta l’EQUAZIONE di LANGEVIN. Essa esprime l’andamento della magnetizzazione di una sostanza PARAMAGNETICA ricavato per via classica. La magnetizzazione è parallela al campo magnetico ed ad esempio cresce al crescere del campo magnetico esterno a fissata temperatura. Per x<<1 con x = βμ H si può sviluppare in serie la funzione cotangente iperbolica, cioè coth x 1 x + + O ( 3) e si ottiene per la funzione di Langevin L ( x ) x 3 x . Occorre tenere presente 3 che la condizione x<<1 si realizza ad una temperatura di poco maggiore di 1 K (a maggior ragione quindi alla temperatura ambiente a cui avvengono gli esperimenti) per un campo magnetico di intensità H dell’ordine di 104 G facilmente ottenibile in laboratorio. Quindi la magnetizzazione risulta M N x μ . Sapendo che β = 1/ k BT si ricava V 3 M N μ2H V 3k BT (1.14) La suscettività magnetica in questo limite risulta 11 M χ= H N μ2 C = V 3k BT T Eq.(1.15) prende il nome di LEGGE di CURIE. La costante C = (1.15) N μ2 è la costante di Curie ed ha V 3k B le dimensioni di una temperatura. La suscettività di un paramagnete espressa in Eq.(1.15) è una grandezza scalare, adimensionale, positiva ed inversamente proporzionale alla temperatura. Inoltre, in virtù dell’approssimazione effettuata, non dipende dal campo magnetico esterno. E’ da notare che la suscettività di Eq.(1.15) si sarebbe potuta ottenere anche applicando la definizione più generale di Eq.(1.3). La suscettività paramagnetica è mediamente dell’ordine di 10-4÷10-5 anche se raggiunge valori più alti a bassa temperatura. Come per la suscettività diamagnetica, sperimentalmente viene molare espressa in cm3/mole (si veda il paragrafo 1.5.1 misurata la suscettività magnetica molare χ per la sua definizione). 1.4 Teoria quantistica del paramagnetismo Discutiamo in questo paragrafo la teoria quantistica del paramagnetismo. Si è visto nel paragrafo 1.2 che ad un elettrone, che descrive un’orbita circolare facendo una precessione attorno al campo magnetico H con frequenza angolare ω L detta frequenza di Larmor, è associata un’intensità di corrente iL = e ω L / 2π c in analogia con il caso della spira percorsa da corrente e ad essa, a sua volta, un momento magnetico. Analogamente, definito con ρ il raggio dell’orbita circolare, l’intensità del momento magnetico orbitale di un elettrone associato alla rotazione dell’elettrone con frequenza angolare ω attorno al nucleo, dato ancora dal prodotto dell’intensità di corrente i = e ω / 2π c per l’area dell’orbita, è espressa da μeorbitale = ( eω / 2π c ) π ρ 2 da cui si ricava immediatamente che μeorbitale = e / 2c ω ρ 2 . In questo caso ω non è la frequenza angolare di Larmor, ma la frequenza angolare di rotazione dell’elettrone attorno al nucleo presente in assenza di un campo magnetico applicato. Sapendo che l’intensità del momento angolare orbitale dell’elettrone 2 di velocità v per un moto circolare vale l = mvρ = mω ρ , poiché v = ωρ si trova che ω ρ 2 = l / m e quindi che μeorbitale = e l . Poiché la corrente equivalente è opposta al moto 2m c 12