diamagnetismo e paramagnetismo

DIAMAGNETISMO E PARAMAGNETISMO
Usiamo per la definizione delle grandezze fisiche magnetiche il sistema C.G.S. Si noti che in
questo capitolo ci atterremmo alla notazione del cap. 31 del libro di N. W. Ashcroft e N.D. Mermin
“Solid State Physics” indicando con H il campo di induzione magnetica che in genere viene
denominato con B . Si sottintende che questa uguaglianza sia riferita alla regione esterna alla
sostanza magnetica che è tutti gli effetti considerata come vuoto. Nel sistema C.G.S. si ha infatti che
nello spazio libero (al di fuori del mezzo magnetico) B = μ0 H , ma poiché la permeabilità
magnetica del vuoto μ0 vale 1, si ha che B = H , cioè il campo di intensità H coincide con il campo
di induzione magnetica di intensità B. L’unità di misura usata in questo capitolo per l’intensità H
del campo magnetico è quindi in Gauss (G) che rappresenta l’unità di misura usata per l’intensità B
del campo di induzione magnetica. L’unità di misura dell’intensità H del campo magnetico nel
sistema C.G.S. è infatti espressa in Oersted (Oe) e vale in generale la relazione 1 G = 1 Oe. Questa
identificazione fra H e B non vale solo per il campo magnetico esterno maggiormente trattato in
questo capitolo, ma anche per il campo di scambio ed il campo dipolare che sono campi intrinseci
dei materiali magnetici.
Si noti infine che in questo capitolo viene indicato con la lettera J sia il numero quantico associato
al momento angolare totale che l’integrale di scambio.
1.1 Introduzione
Diamo in primo luogo la definizione della magnetizzazione M di un corpo. Essa è una grandezza
vettoriale ed è definita nella sua forma generale come la derivata del vettore momento magnetico μ
rispetto al volume V del corpo, cioè
M (r ) =
d μ (r )
dV
(1.1)
In base a tale definizione la magnetizzazione viene determinata in un punto a distanza r rispetto ad
un’origine O ed è quindi diversa in ogni punto del corpo. Non è quindi necessario che il solido sia
magnetizzato uniformemente per definire la magnetizzazione. Il momento magnetico viene anche
definito momento di dipolo magnetico. In figura è rappresentato un solido magnetizzato in modo
1
non uniforme. Si deve considerare un elemento infinitesimo di volume dV a distanza r rispetto ad
un’origine O di un sistema di riferimento ed un momento magnetico infinitesimo d μ .
Se il corpo è magnetizzato uniformemente, cioè il momento magnetico è uguale in ogni punto
( μ ( r ) = μ ) si ha che anche M ( r ) = M . In questo modo la definizione di magnetizzazione viene
semplificata nella forma
M =
μ
V
(1.2)
Quindi, se la magnetizzazione è uniforme, la relazione fra magnetizzazione e momento magnetico
può essere espressa in forma scalare. Daremo nei prossimi paragrafi anche la definizione
termodinamica di magnetizzazione di un solido in relazione alla energia libera del sistema. Tale
ulteriore definizione si può giustificare pienamente prendendo in esame un sistema quantistico e
non più un sistema classico.
Analogamente si definisce suscettività magnetica e la si indica con la lettera χ la seguente
grandezza
χ=
∂M
∂H
(1.3)
dove H è l’intensità del campo magnetico applicato. Questa definizione risulta valida quando il
vettore magnetizzazione M è parallelo al vettore campo magnetico H . La suscettività rappresenta
la capacità di magnetizzazione di un solido con proprietà magnetiche ed esprime il grado con cui un
solido risponde all’azione di un campo magnetico esterno. In base alla definizione data la
suscettività è una grandezza scalare. Poiché per campi applicati facilmente raggiungibili negli
2
esperimenti
spesso M dipende linearmente da H (cioè M = k H dove k è una costante) la
definizione di suscettività si riduce ad una forma ancora più semplice, cioè
χ=
M
H
(1.4)
In accordo con questa definizione la suscettività è ancora una grandezza scalare e non dipende dal
campo magnetico esterno H.
In base al comportamento nei confronti di un campo magnetico esterno le sostanze si suddividono
in due categorie, cioè in sostanze DIAMAGNETICHE e sostanze PARAMAGNETICHE.
Si definisce DIAMAGNETICA una sostanza che tende a schermare l’azione di un campo
magnetico applicato. In questo modo il momento magnetico indotto di ciascun atomo ha direzione
opposta a quella individuata dal campo applicato.
Una sostanza è invece PARAMAGNETICA quando i corrispettivi momenti magnetici di ciascuno
dei suoi atomi tendono ad allinearsi sotto l’azione di un campo magnetico esterno lungo la direzione
individuata dal campo magnetico stesso.
In base a tale comportamento le sostanze DIAMAGNETICHE sono caratterizzate da suscettività
magnetica χ negativa (χ < 0), mentre le sostanze PARAMAGNETICHE hanno suscettività
magnetica χ positiva (χ > 0).
1.2 Teoria classica del diamagnetismo: teoria di Langevin
Il fenomeno del diamagnetismo causato dalla tendenza delle cariche elettriche (elettroni) a
schermare in parte un corpo dall’azione di un campo magnetico applicato ha il suo analogo
elettrodinamico nella legge di Lenz. Tale legge descrive l’insorgenza di una corrente indotta come
risposta alla variazione di flusso del campo magnetico attraverso un circuito di corrente. Tale
corrente indotta si oppone alla variazione di flusso ed alla corrente ad esso associata. Tutte le
sostanze hanno comportamento diamagnetico, poiché tutti gli atomi hanno elettroni appartenenti
alle shell più esterne che schermano l’azione di un campo magnetico esterno. Il comportamento
diamagnetico è tipico di quelle sostanze in cui questo effetto è preponderante rispetto agli altri
effetti possibili. Sono esempi di sostanze diamagnetiche i gas nobili allo stato solido, materiali con
shell elettroniche complete come l’elio (He), il neon (Ne), l’argon (Ar), il kripton (Kr) e lo xenon
(Xe); sono diamagnetici anche i composti ionici come il fluoruro di litio (LiF), il fluoruro di
potassio (KF) ed il fluoruro di sodio (NaF). Sia l’alogeno (atomo di fluoro F) acquistando un
3
elettrone che i metalli alcalini (Li, K, Na) perdendo un elettrone sono sostanze diamagnetiche,
poichè ionizzandosi realizzano la condizione di shell esterna completa.
Per ricavare il risultato classico di Langevin esprimente la suscettività magnetica di una sostanza
diamagnetica occorre richiamare in primo luogo il TEOREMA di LARMOR. Esso afferma che il
moto degli elettroni attorno al nucleo in presenza di un campo magnetico di intensità H è, al primo
ordine in H, lo stesso moto che si avrebbe in assenza di tale campo a cui si deve sovrapporre un
ulteriore moto di precessione attorno ad H la cui frequenza angolare di precessione è data per ogni
elettrone da
ωL =
eH
2mc
(1.5a)
dove e è la carica dell’elettrone presa in modulo, m è la massa dell’elettrone e c è la velocità della
luce. La frequenza angolare viene definita FREQUENZA di LARMOR. La direzione della velocità
angolare ωL è lungo l’asse individuato dal campo magnetico H . La corrispondente frequenza
f L = ω L 2π (L indica Larmor) può essere espressa nella forma
fL =
dove γ L =
γL
H
2π
(1.5b)
e
è il rapporto giromagnetico orbitale (scritto a meno del segno – della carica) di un
2mc
corpo rigido rotante (elettrone) secondo le leggi della meccanica classica. Si vedrà nel paragrafo 1.4
che esso è dato dal rapporto fra il momento magnetico ed il momento angolare orbitale.
Si fa l’ipotesi che la corrente media (la media è d’insieme) generata dagli elettroni contenuti
all’interno di un atomo sia nulla prima dell’applicazione del campo magnetico esterno. In seguito
all’applicazione di un campo magnetico esterno ciascun elettrone ruota descrivendo orbite circolari
attorno all’asse individuato da H ad una frequenza angolare pari alla frequenza di Larmor e
l’insieme degli elettroni produce una corrente media finita attorno al nucleo. Si assume anche che la
frequenza di Larmor sia molto inferiore alla frequenza del moto originale dell’elettrone attorno al
nucleo soggetto a forze di tipo centrale e questa ipotesi è ragionevole per un campo magnetico
esterno debole. E’ noto dalle leggi dell’elettrodinamica classica che una carica in movimento genera
una corrente i = dq / dt dove q è la generica carica e t è il tempo. Vista l’analogia geometrica con il
modello della spira circolare percorsa da corrente può essere utilizzato per il calcolo di i tale
modello. La corrente è data, per ciascun elettrone, da i = e / cT (c si aggiunge nell’espressione di i
per ragioni dimensionali nel sistema C.G.S.); T = 2π / ωL è il periodo di rivoluzione, cioè il tempo
impiegato dall’elettrone per percorrere un’intera circonferenza ed ωL è la frequenza angolare di
4
Larmor. Il periodo di rivoluzione è in questo caso un periodo associato alla precessione attorno alla
direzione del campo magnetico esterno. Quindi, sostituendo l’espressione di T nell’intensità di
corrente i, si trova iL = e ωL / 2π c . Se si considera un atomo contenente Z elettroni si scrive la
corrente totale equivalente I = − Z iL dove il segno – è dovuto al fatto che la direzione della corrente
equivalente generata convenzionalmente da una carica positiva è opposta rispetto alla direzione del
moto della corrente generata dall’elettrone avente carica negativa.
Sostituendo l’espressione della frequenza di Larmor di Eq.(1.5) dentro iL = e ωL / 2π c si trova che
la corrente totale I generata da Z elettroni vale
I =−
Ze 2 H
4π m c 2
(1.6)
Poiché il percorso della corrente è molto piccolo il momento magnetico orbitale può essere scritto
come il prodotto fra l’intensità i della corrente e l’area A dell’orbita (assunta circolare). Il campo
magnetico prodotto dall’elettrone è, a grandi distanze, equivalente a quello di un dipolo magnetico
caratterizzato da un vettore momento di dipolo posto nel centro dell’orbita e perpendicolare al piano
dell’orbita stessa. L’elettrone è, a tutti gli effetti, equivalente ad un dipolo magnetico. In base alla
= iL A
definizione fornita, l’intensità del momento magnetico orbitale del singolo elettrone è μeorbitale
L
dove A = π ρ 2 è l’area dell’orbita dell’elettrone e ρ è il raggio dell’orbita. Il momento magnetico
orbitale esprime la forza del dipolo magnetico associato all’elettrone. Per avere il momento
magnetico totale μ dell’atomo associato agli Z elettroni basta moltiplicare per il numero Z di
elettroni, cioè
μ=−
Z e2 H 2
⟨ρ ⟩
4mc 2
(1.7)
In Eq.(1.7) la quantità ⟨ ρ 2 ⟩ è la media del quadrato della distanza del generico elettrone dall’asse
lungo cui è posto il campo magnetico. Essa è definita come una media d’insieme delle posizioni
degli Z elettroni dell’atomo. Poiché tale distanza è definita su un piano individuato dalla rotazione
dell’elettrone avente generiche coordinate x ed y attorno all’asse si scrive ⟨ ρ 2 ⟩ = ⟨ x 2 ⟩ + ⟨ y 2 ⟩ con le
quantità ⟨ x 2 ⟩ e ⟨ y 2 ⟩ indicanti le corrispondenti medie delle singole componenti x ed y elevate al
quadrato. La distanza quadratica media del generico elettrone dal nucleo è invece
⟨ r 2 ⟩ = ⟨ x 2 ⟩ + ⟨ y 2 ⟩ + ⟨ z 2 ⟩ dove si è aggiunta anche la media del quadrato della componente z, poiché
la distanza è in questo caso calcolata rispetto ad un punto, rappresentato dal nucleo, posto sull’asse.
In figura è schematizzato il moto di precessione del generico elettrone attorno all’asse definito dal
campo magnetico applicato.
5
z
H
Piano xy
ωL
ρ
e-
r
Nucleo
Per una distribuzione di carica a simmetria sferica deve valere ⟨ x 2 ⟩ = ⟨ y 2 ⟩ = ⟨ z 2 ⟩ a causa
dell’isotropia spaziale così che si può scrivere ad esempio ⟨ ρ 2 ⟩ = 2⟨ x 2 ⟩ ed ⟨ r 2 ⟩ = 3⟨ x 2 ⟩ . Si trova
che
⟨ x 2 ⟩ = ⟨ r 2 ⟩ / 3 che, sostituito in
⟨ ρ 2 ⟩ , fornisce ⟨ ρ 2 ⟩ = 2 / 3 ⟨ r 2 ⟩ . Sostituendo in Eq.(1.7)
l’espressione di ⟨ ρ 2 ⟩ si trova
Z e2 H 2
μ=−
⟨r ⟩
6mc 2
(1.8)
Per ottenere il momento magnetico totale basta sommare i momenti magnetici di ciascun atomo e
ciò equivale a moltiplicare per il numero N di atomi del mezzo supponendo che tali momenti
magnetici siano tutti uguali. Quindi si può scrivere μtot = N μ . Dividendo μtot per il volume V del
mezzo si trova la corrispondente magnetizzazione, cioè M = −
N Z e2 H 2
⟨ r ⟩ nell’ipotesi che il
V 6mc 2
mezzo sia uniformemente magnetizzato in accordo con Eq. (1.2). Si nota che la magnetizzazione è
6
antiparallela al campo esterno. Dividendo ancora per il campo magnetico H si trova la
SUSCETTIVITÀ DIAMAGNETICA del mezzo
χ=
M
N Z e2 2
=−
⟨r ⟩
H
V 6mc 2
(1.9)
Eq.(1.9) rappresenta la LEGGE di LANGEVIN e costituisce un risultato derivato per via classica.
Il problema del calcolo della suscettività diamagnetica si riduce al calcolo di ⟨ r 2 ⟩ per la
distribuzione elettronica nell’atomo che può essere ottenuto in modo preciso usando la meccanica
quantistica. Per come è stata definita, la suscettività diamagnetica è una grandezza scalare ed
adimensionale. A causa del segno meno nel membro di destra posto davanti ad una quantità positiva
essa risulta minore di zero.
Come si nota la suscettività diamagnetica è indipendente dalla
temperatura. Si sarebbe potuta trovare la suscettività diamagnetica di Eq.(1.9) anche applicando la
definizione più generale di suscettività data in Eq.(1.3). Tipicamente la suscettività diamagnetica è
dell’ordine di -10-4÷-10-5. Tuttavia, sperimentalmente viene misurata la suscettività magnetica
molare
misurata in cm3/mole (si veda il paragrafo 1.5.1 per la sua definizione).
molare χ
Il limite della trattazione classica del diamagnetismo sta nel fatto che si assume che la direzione del
campo magnetico esterno sia un asse di simmetria del sistema e questo non è in genere vero per
sistemi molecolari complessi. Per questa ragione deve essere applicata la teoria generale del
diamagnetismo e del paramagnetismo formulata da Van Vleck. Tale teoria si basa su leggi
quantistiche e riproduce sotto particolari condizioni il risultato classico di Langevin. Discuteremo
tale teoria nel paragrafo 1.4.
1.3 Teoria classica del paramagnetismo: equazione di Langevin e
legge di Curie
In generale, il paramagnetismo di una sostanza origina dal moto degli elettroni attorno ai nuclei di
ciascun atomo ed è quindi denominato paramagnetismo elettronico. Occorre tenere presente che si
ha anche un paramagnetismo nucleare associato al moto dei protoni e dei neutroni attorno al nucleo
la cui entità è molto minore rispetto a quello elettronico a causa della massa dei protoni e dei
neutroni che risulta molto maggiore rispetto a quella degli elettroni.
Si ha paramagnetismo elettronico nelle seguenti classi:
7
a) Atomi, molecole e difetti reticolari con un numero dispari di elettroni. Infatti lo spin totale
non può essere nullo.
b) Atomi liberi e ioni con un orbitale più interno parzialmente occupato. Appartengono a
questa classe gli elementi di transizione (es. ferro (Fe), cobalto (Co), nichel (Ni), rame (Cu),
manganese (Mn)), elementi delle terre rare (es. lantanio (La), cerio (Ce), samario (Sm),
gadolinio (Gd)) e degli attinoidi (es. torio (Th), uranio (U), plutonio (Pu)).
c) Alcuni composti aventi un numero pari di elettroni incluso l’ossigeno molecolare (non atomi
singoli).
d) I metalli (es. sodio (Na), potassio (K), calcio (Ca)) esclusi i metalli di transizione
appartenenti al gruppo b).
Le sostanze paramagnetiche sono caratterizzate da atomi ciascuno dei quali ha un definito momento
magnetico, ma i momenti magnetici non interagiscono fra di loro. Risultano quindi nulle sia
l’interazione di scambio che l’interazione dipolare che verranno discusse nei paragrafi 2.1 e 2.2 per
le sostanze ferromagnetiche.
Deriviamo ora l’equazione di Langevin per il paramagnetismo classico. Supponiamo di avere un
mezzo (paramagnete) contenente N atomi ciascuno dei quali con momento magnetico μ . In un
mezzo paramagnetico la magnetizzazione totale si media a zero a causa del disordine termico. Se
viene applicato un campo magnetico esterno, oltre al piccolissimo effetto diamagnetico, i momenti
magnetici degli atomi tendono ad allinearsi lungo la direzione del campo. L’energia d’interazione di
ciascun atomo con il campo H è data da
E = − μ ⋅ H = − μ H cos θ
(1.10)
dove θ è l’angolo compreso fra il momento magnetico ed il campo magnetico esterno. Ciò equivale
ad affermare che un dipolo magnetico di momento μ , se immerso in un campo magnetico H ,
acquisisce un’energia pari ad E = − μ ⋅ H . In figura è rappresentata la direzione arbitraria del
momento magnetico del generico atomo rispetto al campo magnetico esterno.
8
H
μ
z
θ
y
φ
x
Per il calcolo della magnetizzazione Langevin seguì lo stesso tipo di calcolo effettuato da Debye per
calcolare la polarizzabilità per orientazione in un dielettrico. In particolare si può definire la
magnetizzazione del paramagnete nella forma
M =
N
μ ⟨ cos θ ⟩
V
(1.11)
dove N è il numero di atomi supposti non interagenti e V è il volume del mezzo paramagnetico. ⟨...⟩
indica la media delle possibili orientazioni del generico atomo rispetto al campo magnetico
nell’elemento di angolo solido d Ω = sin θ dθ dφ calcolata rispetto alla distribuzione classica di
probabilità di Boltzmann all’equilibrio, cioè
2π
⟨ cos θ ⟩ =
∫
0
π
dφ ∫ dθ sin θ cos θ e − β E
2π
0
π
∫ dφ ∫ dθ sin θ e
0
−β E
0
dove φ è l’angolo azimutale e θ è l’angolo polare; β = 1/ k BT con k B costante di Boltzmann.
Sostituendo ad E l’espressione data in Eq.(1.10) ed integrando in φ a numeratore ed a denominatore
si ottiene
π
cos θ =
∫ dθ sin θ cos θ e
0
π
∫ dθ sin θ e
βμ H cosθ
βμ H cosθ
0
9
L’integrale si risolve per sostituzione di variabile, cioè si pone t = cosθ per cui dt = − sin θ dθ ;
quindi per θ = 0 si ha t = 1 e per θ = π si ha t = −1 . Conviene anche effettuare la sostituzione
x = βμ H . Si ottiene
−1
⟨ cos θ ⟩ =
∫ −dt t e
1
tx
1
−1
∫ −dt e
=
∫ dt t e
−1
1
∫ dt e
tx
tx
tx
=
f ′( x)
f ( x)
=
d
⎡ ln f ( x ) ⎤⎦ =
dx ⎣
−1
1
1
1
⎞ ⎤ d ⎡ ⎛ et x ⎞ ⎤ d ⎡ ⎛ e x − e − x ⎞ ⎤
d ⎡ ⎛
tx
⎢ ln ⎜
⎟⎥ =
=
⎢ ln ⎜ dt e ⎟ ⎥ =
⎢ ln ⎜
⎟⎥ =
⎜
⎟
dx ⎢⎣ ⎝ −∫1
dx
x
dx
x
⎢
⎥
⎠⎦
⎠ ⎥⎦
⎣ ⎝
−1 ⎠ ⎦
⎣ ⎝
d ⎡
−x
x
⎤ = d ⎡ ln e x − e − x ⎤ − d [ ln x ] =
=
−
−
ln
ln
e
e
x
⎦ dx ⎣
⎦ dx
dx ⎣
1
e x + e− x 1
= x − x − = coth x −
e −e
x
x
(
)
(
)
Nel primo passaggio si è cambiato segno sia a numeratore che a denominatore scambiando così gli
1
1
1
d
d
estremi di integrazione e si è posto ∫ dt e = f ( x ) così che f ′ ( x ) =
f ( x ) = ∫ dt et x = ∫ dt tet x
dx
dx
−1
−1
−1
tx
dove si è scambiato l’integrale con l’operazione di derivazione a causa della continuità della
funzione integranda. Si è, quindi, applicata la regola di derivazione della funzione logaritmo
naturale
f ′( x)
d
a
⎡⎣ ln f ( x ) ⎤⎦ =
. Si è poi sfruttata una proprietà del logaritmo, cioè ln = ln a − ln b
b
dx
f ( x)
e si è infine tenuto conto dell’identità trigonometrica
e x + e− x
= coth x dove coth è la cotangente
e x − e− x
iperbolica. La funzione
L( x) = coth x −
1
x
(1.12)
è la FUNZIONE di LANGEVIN disegnata in figura. L ( x ) è una funzione compresa fra 0 ed 1. In
particolare, L ( x ) è una funzione monotona crescente di x e tende ad 1 al crescere di x, cioè al
crescere del rapporto H/T .
10
1.0
L(x)
0.8
0.6
0.4
0.2
0
2
4
x
6
8
10
Quindi, sostituendo nell’espressione della magnetizzazione di Eq.(1.11), si ricava
M=
N
μ L ( x)
V
(1.13)
Eq.(1.13) rappresenta l’EQUAZIONE di LANGEVIN. Essa esprime l’andamento della
magnetizzazione
di
una
sostanza
PARAMAGNETICA
ricavato
per
via
classica.
La
magnetizzazione è parallela al campo magnetico ed ad esempio cresce al crescere del campo
magnetico esterno a fissata temperatura.
Per x<<1 con x = βμ H si può sviluppare in serie la funzione cotangente iperbolica, cioè
coth x
1 x
+ + O ( 3) e si ottiene per la funzione di Langevin L ( x )
x 3
x
. Occorre tenere presente
3
che la condizione x<<1 si realizza ad una temperatura di poco maggiore di 1 K (a maggior ragione
quindi alla temperatura ambiente a cui avvengono gli esperimenti) per un campo magnetico di
intensità H dell’ordine di 104 G facilmente ottenibile in laboratorio. Quindi la magnetizzazione
risulta M
N x
μ . Sapendo che β = 1/ k BT si ricava
V 3
M
N μ2H
V 3k BT
(1.14)
La suscettività magnetica in questo limite risulta
11
M
χ=
H
N μ2
C
=
V 3k BT T
Eq.(1.15) prende il nome di LEGGE di CURIE. La costante C =
(1.15)
N μ2
è la costante di Curie ed ha
V 3k B
le dimensioni di una temperatura. La suscettività di un paramagnete espressa in Eq.(1.15) è una
grandezza scalare, adimensionale, positiva ed inversamente proporzionale alla temperatura. Inoltre,
in virtù dell’approssimazione effettuata, non dipende dal campo magnetico esterno. E’ da notare che
la suscettività di Eq.(1.15) si sarebbe potuta ottenere anche applicando la definizione più generale di
Eq.(1.3). La suscettività paramagnetica è mediamente dell’ordine di 10-4÷10-5 anche se raggiunge
valori più alti a bassa temperatura. Come per la suscettività diamagnetica, sperimentalmente viene
molare
espressa in cm3/mole (si veda il paragrafo 1.5.1
misurata la suscettività magnetica molare χ
per la sua definizione).
1.4 Teoria quantistica del paramagnetismo
Discutiamo in questo paragrafo la teoria quantistica del paramagnetismo. Si è visto nel paragrafo
1.2 che ad un elettrone, che descrive un’orbita circolare facendo una precessione attorno al campo
magnetico H con frequenza angolare ω L detta frequenza di Larmor, è associata un’intensità di
corrente iL = e ω L / 2π c in analogia con il caso della spira percorsa da corrente e ad essa, a sua
volta, un momento magnetico. Analogamente, definito con ρ il raggio dell’orbita circolare,
l’intensità del momento magnetico orbitale di un elettrone associato alla rotazione dell’elettrone con
frequenza angolare ω attorno al nucleo, dato ancora dal prodotto dell’intensità di corrente
i = e ω / 2π c per l’area dell’orbita, è espressa da μeorbitale = ( eω / 2π c ) π ρ 2 da cui si ricava
immediatamente che μeorbitale = e / 2c ω ρ 2 . In questo caso ω non è la frequenza angolare di
Larmor, ma la frequenza angolare di rotazione dell’elettrone attorno al nucleo presente in assenza di
un campo magnetico applicato. Sapendo che l’intensità del momento angolare orbitale dell’elettrone
2
di velocità v per un moto circolare vale l = mvρ = mω ρ , poiché v = ωρ si trova che
ω ρ 2 = l / m e quindi che μeorbitale =
e
l . Poiché la corrente equivalente è opposta al moto
2m c
12
dell’elettrone, l’orientazione del momento magnetico orbitale è opposta a quella del momento
angolare orbitale. In forma vettoriale si scrive quindi
μeorbitale = −
e
l
2mc
La direzione di μeorbitale è la stessa di l , ma il verso è opposto come schematizzato in figura. La
costante γ
orbitale
=−
e
è il rapporto giromagnetico orbitale coincidente con quello già definito
2mc
nel paragrafo 1.2 (a meno del segno -) per un corpo rigido (elettrone) che ruota attorno al campo
magnetico esterno alla frequenza angolare ωL di Larmor. In questo ambito si può attribuire a tale
grandezza un significato fisico ben preciso definendo
γ orbitale come
il rapporto fra il momento
magnetico orbitale di un elettrone ed il corrispondente momento angolare orbitale, cioè
γ orbitale =
μeorbitale
l
.
Come si nota, la relazione fra momento magnetico orbitale e momento angolare orbitale è stata
ricavata basandosi su leggi di meccanica classica. Essa continua a rimanere valida anche in
meccanica quantistica per un moto arbitrario di un elettrone con momento angolare l elevato a
rango di operatore vettoriale. Teniamo per semplicità come notazione per un operatore vettoriale la
stessa usata per un vettore sottintendendo d’ora in avanti che sia sottinteso anche il simbolo
operatoriale “∧”. Per ragioni dimensionali si deve sostituire il vettore l con
l dove
= h / 2π (h
è la costante di Planck) ha le dimensioni di un momento angolare. Occorre poi aggiungere il
13
momento magnetico di spin che invece può essere spiegato solo nell’ambito della meccanica
spin
quantistica e che vale μe = − g 0
e
s dove g 0 è il fattore di Landè dell’elettrone (si veda dopo
2mc
per una discussione). E’ quindi possibile definire il rapporto giromagnetico associato allo spin
dell’elettrone come il rapporto fra l’operatore momento magnetico di spin μespin e l’operatore
momento angolare di spin
s , cioè γ
spin
=
μespin
s
spin
=−
da cui si ricava γ
g0e
.
2mc
Combinando insieme il momento magnetico orbitale e quello di spin del singolo elettrone si trova il
(
)
orbitale
+ μespin = −e / 2mc l + g 0 s .
momento magnetico totale del singolo elettrone, cioè μe = μe
Sommando i momenti magnetici di tutti gli elettroni appartenenti ad uno ione (atomo) si ricava il
(
)
momento magnetico totale di uno ione (atomo), cioè μ = μ orbitale + μ spin = −e / 2mc L + g 0 S con
μ orbitale = ∑ μeorbitale
e μ spin = ∑ μespin
. L’operatore
i
i
L è la somma dei momenti angolari orbitali
∑ l , mentre l’operatore
S è la somma dei momenti angolari di spin
i
i
degli elettroni, cioè
L=
i
i
degli elettroni, cioè
S=
∑s .
i
Le definizioni del rapporto giromagnetico orbitale e di spin
i
rimangono valide anche considerando il momento magnetico orbitale e di spin del singolo atomo ed
i corrispondenti momenti angolari orbitali e di spin del singolo atomo, purchè si sostituisca ad
s la quantità S e ad l la quantità
L.
Il momento magnetico totale si può riscrivere come μ = − ge / 2mc J (si veda il paragrafo 1.5.1
per una dimostrazione qualitativa usando il teorema di Wigner-Eckart). La grandezza g prende il
nome di fattore di separazione spettroscopico o fattore di Landè ed è dato da
g =1+
J ( J + 1) + S ( S + 1) − L ( L + 1)
2 J ( J + 1)
. Per lo spin elettronico si ottiene, in presenza di correzione
α
⎛
⎞
+ … ⎟ , con α
relativistica, g 0 = 2 ⎜ 1 +
⎝ 2π
⎠
1
costante di struttura fine,
137
che fornisce
g 0 = 2.0023 (valore calcolato da Dirac) e che viene approssimato al valore g 0 = 2 . Si nota quindi
che il rapporto giromagnetico di spin γ spin è il doppio di quello orbitale γ orbitale . Tale risultato non
deve sorprendere, perché γ spin viene calcolato mediante leggi quantistiche e non ha un analogo
classico. Quindi, solo figurativamente lo spin di un elettrone può essere pensato come originato
dalla rotazione dell’elettrone attorno a se stesso. L’operatore J = L + S è l’operatore momento
14
angolare totale dato dalla somma vettoriale dell’operatore momento angolare orbitale e
dell’operatore momento angolare di spin. Definendo la quantità μ B = e / 2 mc magnetone di Bohr
il momento magnetico di un atomo assume la forma
μ = − g μB J
(1.16a)
In particolare μ B = 0.927 ×10−20 erg/G . Si può riscrivere Eq.(1.16a) nella forma
μ =γ J
con γ = −
(1.16b)
ge
, rapporto giromagnetico definito come il rapporto fra il momento magnetico totale
2m c
μ
del singolo atomo ed il momento angolare totale, cioè γ =
J
. Si dimostra facilmente che le
dimensioni del rapporto giromagnetico, sia esso orbitale, di spin o totale sono nel sistema C.G.S.[s-1
G-1] oppure [s-1 Oe-1]. Basta scrivere il rapporto fra le dimensioni del momento magnetico e quelle
del momento angolare tenendo presente che il momento angolare ha le dimensioni di un’azione cioè
⎡ erg ⎤
⎡ μ ⎤ ⎢
G ⎥ = ⎡s -1 G -1 ⎤ . Poiché 1 G = 1 Oe si può anche
di un’energia per un tempo, cioè ⎢ ⎥ =
⎦
⎢
erg
s⎥ ⎣
J
⎣ ⎦ ⎢
⎥
⎣
⎦
scrivere ⎡⎣s -1 Oe-1 ⎤⎦ . E’ possibile ricavare questo risultato anche tenendo presente l’espressione del
rapporto giromagnetico che può essere riscritto in forma compatta come γ = −
ge
con g = 1 se il
2m c
rapporto giromagnetico è orbitale, g = g0 = 2 se è di spin e 1 ≤ g ≤ 2 se è totale. Infatti, nel sistema
C.G.S. si ha
⎡ g 12 cm 3 2 s-1 ⎤
3
1
⎡
⎤
e
-1
⎡
⎤
⎡g− 12 cm 12 ⎤ = ⎡G−1s−1 ⎤ .
⎥
=
[e] = ⎢⎣g 2 cm 2 s ⎥⎦ per cui ⎢ ⎥ = ⎢
-1
⎦
⎥⎦ ⎣
⎣ mc ⎦ ⎢⎣ g cm s ⎥⎦ ⎢⎣
L’ultima uguaglianza viene dal fatto che G = erg1/2/ cm3/2. Esplicitando le dimensioni di 1 erg si
−1
ottiene G = g1/2 cm-1/2s-1 che può essere riscritta come g
2
1
cm 2 = G−1s−1 . Le dimensioni della
carica e si ottengono a partire ad esempio dalla forza di Coulomb espressa nel sistema C. G. S., cioè
F = e2/r2 da cui e = F1/2 r. Esplicitando le dimensioni della forza, cioè [F ] = [g cm s-2 ] si ottengono
facilmente le dimensioni di e.
È interessante ricavare l’equazione di Brillouin per la teoria quantistica del paramagnetismo. Essa
rappresenta l’equivalente quantistico dell’equazione classica di Langevin (cf. Eq.(1.13)).
Supponiamo di avere un atomo che possiede il momento magnetico espresso in Eq.(1.16)
appartenente ad una sostanza paramagnetica e di porlo in un campo magnetico. In base a ciò si
assume che l’atomo del paramagnete abbia già un momento magnetico permanente diverso da zero
15
anche in assenza di campo. Indicato con J il numero quantico del momento angolare totale lo stato
fondamentale avrà un determinato valore di J. Esso si trova mediante le regole di Hund trascurando
il contributo degli altri termini del multipletto associati a stati eccitati e vale J = L − S ,..., L + S . Ciò
è realistico se la differenza fra l’energia del primo stato eccitato J ′ e quella dello stato
fondamentale soddisfa la condizione EJ ′ − EJ >> k BT . Se è rispettata questa condizione si trascura
l’influenza che gli stati eccitati ad energia più elevata hanno sullo stato fondamentale. Lo stato
fondamentale è 2J+1 volte degenere ed è l’unico stato termicamente eccitato. Per effetto di un
campo magnetico viene rimossa tale degenerazione (effetto Zeeman) ed il livello fondamentale si
splitta in 2J +1 livelli pari al numero di valori assunti dal numero quantico mj = -J, -J + 1,…, J - 1,
J. Il numero quantico mj è il numero quantico magnetico del momento angolare totale ed è quindi
associato alla proiezione del momento angolare totale lungo la direzione z ( J z ) individuata dal
campo magnetico.
Si può poi considerare un insieme di atomi (ioni) identici sottoposti all’azione di un campo
magnetico. Lo scopo è quello di ricavare l’espressione della magnetizzazione corrispondente. Essa
si potrebbe determinare direttamente a partire dal momento magnetico definito in Eq.(1.16). Infatti
per magnetizzazione si intende la densità di momento magnetico o momento magnetico per unità di
μ
volume, cioè M = V
nell’ipotesi di un mezzo magnetizzato uniformemente. Tuttavia, tale
approccio non porterebbe ad un risultato rilevante da un punto di vista fisico. Quindi, per derivarla
si utilizza un metodo di meccanica statistica che tiene conto dell’energia quantizzata. In primo
luogo si esprime l’energia libera del sistema. L’energia libera di Helmholtz vale F = − k BT ln Z dove
J
Z è la funzione di partizione del sistema espressa in questo caso nella forma Z =
∑eβ
− Ej
con
m j =− J
E j = − μ ⋅ H = g μ B H m j energia quantizzata dello stato j-esimo del sistema dovuta alla presenza del
campo magnetico assunto applicato lungo z in cui compare il numero quantico m j associato a J z .
J
Sostituendo le espressioni di Z e di
Ej
in F si ha
F = −k BT ln
∑eβ
− g μB H m j
da cui
m j =− J
J
−β F = ln
∑eβμ
m j =− J
− g
BH mj
; quest’ultima uguaglianza si ottiene dividendo per k BT , ponendo
1/ k BT = β e cambiando segno ad entrambi i membri. Applicando la funzione esponenziale a primo
16
ed a secondo membro dell’ultima uguaglianza si ottiene e
−β F
J
=
∑eβμ
− g
BH mj
. Questa è ancora
m j =− J
una definizione dell’energia libera, ma espressa in forma esponenziale. La forma scritta risulta utile
per i calcoli seguenti, poiché, come si può notare, l’energia libera è espressa mediante una serie
geometrica convergente avente un numero finito di termini. La serie scritta si può quindi
agevolmente sommare. Infatti, la ragione di tale serie vale q = e− β γ H < 1 dove γ = g μ B . A partire
dalla regola generale di somma delle serie geometriche con un numero finito di termini la serie data
J
∑
si può riscrivere come
q
mj
=
m j =− J
q − J − q J +1
. Per dimostrare l’uguaglianza scritta occorre in primo
1− q
luogo riscrivere la sommatoria di una serie geometrica di ragione q costituita da un numero finito di
termini che richiama la serie data spezzando la sommatoria in due sommatorie, cioè scrivendo
n
∑
qk =
k =− n
−1
∑
qk +
k =− n
n
∑q
k
dove la ragione nella prima sommatoria ha esponenti negativi, mentre nella
k =0
seconda sommatoria ha esponenti positivi incluso lo zero. Se si considera la prima serie a secondo
membro conviene moltiplicarla per (1-q) ed esplicitare la sommatoria, cioè scrivere:
−1
(1 − q ) ∑ q
k
k =− n
(
= q
−n
+q
− n +1
+ .... + q
−1
−q
− n +1
− ... − q
−1
) (
−1 = q
−n
)
−1
−1
da
cui
∑
qk =
k =− n
q −n − 1
.
1− q
Analogamente, considerando la seconda serie, moltiplicandola per (1 - q) ed esplicitando la
n
sommatoria
si
ottiene:
(1 − q ) ∑ q k
k =0
n
∑q
k =0
n
∑
k =− n
k
=
1 − q n +1
.
1− q
qk =
(
) (
= 1 + q + q 2 + .... + q n − q − q 2 ... − q n − q n +1 = 1 − q n +1
)
da
cui
Sostituendo i risultati ricavati per entrambe le sommatorie si ricava
q − n − 1 1 − q n +1 q − n − q n +1
+
=
. Nel caso specifico si deve sostituire all’indice n intero,
1− q
1− q
1− q
l’indice J che può essere anche frazionario per multipli di ½ e scrivere, senza perdita di generalità,
l’uguaglianza iniziale.
−β F
=
Quindi si ha anche che e
ed a denominatore per q
−1/ 2
q − J − q J +1
. Conviene moltiplicare a secondo membro a numeratore
1− q
−β F
=
e si ottiene e
− J +1/ 2 )
J +1/ 2 )
q (
− q(
q −1/ 2 − q1/ 2
. Sostituendo il valore di
q = e− β γ H si trova che
17
e
−β F
=
e
β γ H ( J +1/ 2)
−e
− β γ H ( J +1/ 2)
e β γ H / 2 − e− β γ H / 2
(1.17)
A partire da questa espressione si ricava l’energia libera F applicando la funzione logaritmo
naturale sia a primo che a secondo membro, dividendo per β e cambiando di segno entrambi i
membri, cioè
F =−
=−
1
β
ln
( f ( H ) + g ( H ) ) − e− ( f ( H ) + g ( H ) )
e
g H
−g H
e ( ) −e ( )
=
(
)
1 ⎡ ⎛ ( f ( H ) + g ( H )) −( f ( H ) + g ( H )) ⎞
g H
−g H ⎤
−e
− ln e ( ) − e ( ) ⎥
⎢ln ⎜ e
⎟
β⎣ ⎝
⎠
⎦
(1.18)
dove si è posto f ( H ) = β γ H J e g ( H ) = β γ H / 2 .
A partire dall’energia libera F scritta per un sistema magnetico, è possibile dare la definizione di
magnetizzazione M in ambito di meccanica statistica e determinarla. Il primo principio della
termodinamica espresso in forma differenziale vale dQ = dU + dW dove dQ è la variazione
infinitesima di calore, dU la variazione infinitesima di energia interna e dW
il lavoro
infinitesimo. Tenendo presente la relazione fra dQ e la variazione infinitesima di entropia dS si
può scrivere dQ = T dS da cui dU = TdS − dW . Per un sistema magnetico il lavoro infinitesimo si
può scrivere nella forma dW = μ dH da cui dU = TdS − μ dH . D’altra parte l’energia libera di
Helmholtz F = U − T S espressa in forma differenziale è data da
dF = dU − TdS − S dT .
Sostituendo l’espressione di dU dentro dF si ricava dF = − μ dH − S dT per cui si ha che
⎛ ∂F ⎞
1 ⎛ ∂F ⎞
da cui M = − ⎜
. Se si considerano N ioni (atomi) indipendenti si ottiene
⎟
V ⎝ ∂H ⎟⎠T
⎝ ∂H ⎠T
μ = −⎜
M =−
N
V
⎛ ∂F ⎞
⎜ ∂H ⎟
⎝
⎠T
(1.19)
Eq.(1.19) rappresenta la definizione termodinamica della magnetizzazione per un sistema di N ioni
(atomi) dove la derivata rispetto ad H è fatta a temperatura T costante. Non è permesso in questo
caso eguagliare l’energia libera alla variazione di energia ΔE0, dovuta al campo magnetico H, dello
stato fondamentale che è 2 J +1 volte degenere. Non si può cioè porre F = U – T S = ΔE0,
uguaglianza che può essere assunta valida solo per T→0. Infatti, la separazione in energia fra due
livelli adiacenti appartenenti ai 2 J+1 livelli per effetto dell’applicazione di un campo magnetico
esterno (corrispondenti allo stato fondamentale) risulta piccola rispetto all’energia termica kBT non
18
Δ
Multipletto di 2 J+1 livelli
Δ: separazione in energia
fra due livelli adiacenti
Ej : energia dello
stato fondamentale
Δ << kB T
appena il campo magnetico esterno va a zero. In Figura è rappresentato schematicamente l’ordine di
grandezza delle energie in gioco. Ciò implica che la temperatura T non può essere considerata
tendente a zero.
Sostituendo in Eq.(1.19) l’energia libera di Helmholtz data in Eq.(1.18) si ricava
(
)
⎞ ∂ ⎡ ⎛ ( f ( H ) + g ( H ) ) −( f ( H ) + g ( H ) ) ⎞
g H
−g H ⎤
−e
− ln e ( ) − e ( ) ⎥ =
⎟
⎢ln ⎜ e
⎟
⎠
⎠ ∂H ⎣ ⎝
⎦
N ∂ ⎡ ⎛ ( f ( H ) + g ( H ) ) −( f ( H ) + g ( H ) ) ⎞ ⎤ N ∂ ⎡
g H
−g H
=
−e
ln e ( ) − e ( ) ⎤⎥ =
⎢ln ⎜ e
⎥−
⎟
⎢
β V ∂H ⎣ ⎝
⎦
⎠ ⎦ β V ∂H ⎣
M =−
=
N
βV
N
=
βV
N⎛ 1
⎜−
V ⎝ β
(
( f ′ ( H ) + g′ ( H ) ) ⎛⎜⎝ e( f ( H )+ g ( H )) + e−( f ( H )+ g ( H )) ⎞⎟⎠
e
( f ( H ) + g ( H ) ) − e −( f ( H ) + g ( H ) )
( β γ J + β γ / 2) ⎜⎛ e(
f ( H )+ g ( H )
⎝
e
−
)
N
βV
(
g H
−g H
g′( H ) e ( ) + e ( )
g H
−g H
e ( ) −e ( )
(
) + e −( f ( H ) + g ( H ) ) ⎞
)=
)
g H
−g H
β γ /2 e ( ) +e ( )
⎟
⎠− N
=
g H
−g H
βV
e ( ) −e ( )
( f ( H ) + g ( H ) ) − e −( f ( H ) + g ( H ) )
N
N
( β γ J + β γ / 2 ) coth f ( H ) + g ( H ) − ( β γ / 2 ) coth g ( H ) =
βV
βV
N
= ⎡( γ J +γ / 2 ) coth f ( H ) + g ( H ) − γ / 2coth g ( H ) ⎤ =
⎦
V⎣
N
= γ J ⎡( 1 +1/ 2 J ) coth f ( H ) + g ( H ) − 1/ 2 J coth g ( H ) ⎤ =
⎣
⎦
V
(
=
(
)
(
⎡⎛
N
γ J ⎢⎜
V
⎣⎝
⎡⎛
N
= γ J ⎢⎜
V
⎣⎝
=
=
)
(
(
)
)
)
(
)
⎤
2J + 1 ⎞
1
coth ( β γ JH + β γ H / 2 ) −
coth ( β γ H / 2 ) ⎥ =
⎟
2J ⎠
2J
⎦
⎤
2J + 1 ⎞
1
coth ( β γ JH / 2 J ) ⎥ =
⎟ coth β γ JH (1 + 1/ 2 J ) −
2J ⎠
2J
⎦
(
)
⎡⎛ 2 J + 1 ⎞
N
⎛ 2J + 1 ⎞ 1
⎛ 1
γ J ⎢⎜
x⎟ −
coth ⎜
⎟ coth ⎜
V
⎝ 2J
⎠ 2J
⎝ 2J
⎣⎝ 2 J ⎠
⎞⎤
x ⎟⎥
⎠⎦
19
dove l’apice ' indica la derivata fatta rispetto ad H. Si è cioè applicata la regola di derivazione del
F ′ (G ( x ))
G′ ( x )
logaritmo naturale di una funzione composta, cioè si è scritto D ⎣⎡ln ⎣⎡ F ( G ( x ) ) ⎦⎤ ⎦⎤ =
F (G ( x ))
con H al posto di x. Nei passaggi intermedi si è utilizzata l’identità trigonometrica
f x
−f x
e ( ) +e ( )
f x
−f x
e ( ) −e ( )
= coth ⎡⎣ f ( x ) ⎤⎦ dove
il simbolo
coth indica cotangente iperbolica. Nell’ultimo
passaggio si è invece posto β γ J H = x con β = 1/ kBT
La magnetizzazione della sostanza PARAMAGNETICA risulta quindi:
M =
N
γ JBJ ( x )
V
(1.20)
dove BJ ( x ) è la FUNZIONE di BRILLOUIN definita come:
BJ ( x ) =
2J + 1
⎛ 2J + 1 ⎞ 1
⎛ 1 ⎞
coth ⎜
coth ⎜
x⎟ −
x⎟
2J
2
2
2
J
J
J
⎝
⎠
⎝
⎠
(1.21)
Eq.(1.20) con la funzione BJ ( x ) data da Eq.(1.21) è l’EQUAZIONE di BRILLOUIN. Essa
rappresenta l’andamento della magnetizzazione di una sostanza PARAMAGNETICA ricavata per
via quantistica. E’ quindi l’equivalente quantistico dell’equazione classica di Langevin del
paramagnetismo (cf. Eq.(1.13)).
L’andamento grafico della funzione di Brillouin è qualitativamente simile a quello della funzione
classica di Langevin (cf. Eq.(1.12)), cioè essa ha un andamento monotono crescente al crescere del
rapporto H/T. Anche la funzione di Brillouin è compresa fra 0 ed 1. Tuttavia, poiché BJ ( x ) è stata
derivata quantisticamente, a fissato x si avranno diverse curve corrispondenti ai diversi valori di J
assunti dal momento angolare totale al variare dello stato fondamentale del materiale paramagnetico
studiato. Questo comportamento la differenzia dalla funzione classica di Langevin la quale è
rappresentata da curve che risultano diverse al variare del materiale paramagnetico preso in esame
senza che sia esplicita la dipendenza da J. La funzione di Brillouin è disegnata in figura per tre
valori di J, cioè per J = 1/2, J = 3/2 e J = 5/2. Essa descrive il comportamento paramagnetico di ioni
di metalli contenuti in solidi.
20
0
Bj(x)
1
2
3
1
J = 1/2
J = 3 /2
J = 5/2
0.5
0
0
1
2
3
x
Risulta interessante studiare l’andamento della magnetizzazione nel limite di x<<1 che significa
γH
kBT e corrisponde molto spesso al caso reale. Infatti, la quantità γ H / k B ≈ 1 K per un
campo di 104 G usato comunemente negli esperimenti. Tenendo conto che gli esperimenti sono
effettuati a temperatura ambiente la condizione x<<1 è facilmente realizzabile. Sviluppando fino al
secondo
coth y
ordine
entrambe
le
cotangenti
iperboliche
di
Eq.(1.20),
cioè
scrivendo
1 y
1
2J + 1
+ + O(3) con y =
x per il secondo termine
x per il primo termine e y =
y 3
2J
2J
si ricava
BJ ( x )
2J +1 ⎛ 2J 1 2J +1 x ⎞ 1
+
−
2 J ⎜⎝ 2 J + 1 x
2 J 3 ⎟⎠ 2 J
1 1 x⎞
⎛
⎜ 2J x + 2J 3 ⎟ =
⎝
⎠
2
1 ⎛ 2J + 1 ⎞ x 1
1 x ⎛ 4 J 2 + 4 J + 1 − 1 ⎞ x J ( J + 1) x
= +⎜
−
−
=⎜
⎟ =
⎟3
x ⎝ 2 J ⎟⎠ 3 x 4 J 2 3 ⎜⎝
3
4J 2
J2
⎠
Sostituendo questa espressione approssimata di BJ ( x ) nell’espressione di M di Eq.(1.20) si ottiene
ricordando che γ = g μB e che β γ J H = x con β = 1/ k BT .
21
J ( J + 1) x N
J ( J + 1) g J μ B H
N
g μB J
g
J
μ
=
=
B
V
3 V
3k BT
J2
J2
N
H
= g 2 μ B 2 J ( J + 1)
V
3k BT
M
A partire dalla definizione termodinamica della magnetizzazione M = −
N ⎛ ∂F ⎞
si ricava la
V ⎜⎝ ∂H ⎟⎠T
N ⎛ ∂2F ⎞
suscettività del sistema, cioè χ = − ⎜
⎟ essendo χ = ∂M / ∂H . Nel caso specifico basta
V ⎝ ∂H 2 ⎠T
ricavarla come χ = M / H , poichè la magnetizzazione è lineare in H ottenendo
N 2 2
1
g μ B J ( J + 1)
V
3k BT
χ
Se si definisce la quantità adimensionale peff = g J ( J + 1) come numero efficace di magnetoni di
Bohr si ha
χ
2
μ B2
N peff
V 3k BT
(1.22)
Eq.(1.22) rappresenta la LEGGE di CURIE per un sistema di ioni (atomi) non interagenti. Essa
esprime, anche per il caso quantistico, una suscettività inversamente proporzionale alla temperatura
2
2
T con C = N / V peff μ B / 3k B costante di Curie avente le dimensioni di una temperatura. Eq.(1.22)
rimane valida (con qualche piccola eccezione) per descrivere la suscettività di tali ioni quando
fanno parte di una struttura più complessa come un solido.
Anche l’espressione della suscettività di Eq.(1.22) ottenuta nell’approssimazione x <<1 è molto
simile a quella ottenuta classicamente seguendo la stessa approssimazione (cf. Eq.(1.15)). La
differenza fondamentale sta nel fatto che in questo caso il momento magnetico può essere definito
come μeff = peff μ B , cioè come il prodotto fra il magnetone di Bohr μ B ed un numero decimale
peff . Il momento magnetico varia in relazione alla sostanza paramagnetica considerata
rappresentata ad esempio da uno ione trivalente del gruppo delle terre rare (lantanidi) all’interno di
un cristallo isolante oppure da uno ione del gruppo del ferro (fra gli elementi di transizione)
all’interno di un composto salino come l’allume ferrico di ammonio. Ciò è in questo caso una
diretta conseguenza della sua derivazione quantistica che porta a definire un numero efficace
peff di magnetoni di Bohr.
22
Si possono anche ricavare gli andamenti della magnetizzazione e della suscettività magnetica
quando gli elettroni di ogni atomo e quindi gli atomi stessi non sono tutti nello stato fondamentale.
Ad esempio M e χ si possono ricavare nel caso in cui la differenza fra l’energia del livello
fondamentale J e quella del primo livello eccitato J ′ soddisfa alla condizione EJ ′ − EJ ≈ k BT ,
cioè è dello stesso ordine di grandezza di k BT ; M e χ si possono ricavare anche nel caso opposto a
quello discusso precedentemente, cioè quando
EJ ′ − EJ << k BT . Gli andamenti della
magnetizzazione e della suscettività che si ricavano sono molto simili a quelli riferiti al caso
studiato. Quando EJ ′ − EJ << kBT si deve anche tenere conto della distribuzione degli atomi sui
diversi livelli energetici (livello fondamentale e livelli eccitati) corrispondenti ai diversi termini di
multipletto (ad es. i termini di multipletto J = L − S ,..., L + S per lo stato fondamentale, i termini di
multipletto J ′ = L′ − S ′ ,..., L′ + S ′ per il primo stato eccitato e così via) degli atomi del paramagnete.
1.5 Teoria quantistica del paramagnetismo: teoria perturbativa di
Van Vleck
Il modello di Van Vleck è un modello molto raffinato basato sulla teoria perturbativa indipendente
dal tempo che rappresenta un potente strumento matematico per studiare i sistemi quantistici. Lo
scopo è quello di ricavare mediante la teoria perturbativa la variazione di energia di un paramagnete
e da essa la suscettività magnetica.
In presenza di un campo magnetico esterno supposto uniforme, cioè H ( r ) = H occorre modificare
l’operatore Hamiltoniano del sistema trattato secondo la meccanica quantistica. In primo luogo
nell’espressione dell’operatore energia cinetica totale associata al moto degli elettroni si deve tenere
conto della presenza di H . L’operatore vettoriale momento pi dell’i-esimo elettrone di carica –e
che entra a far parte dell’operatore energia cinetica deve essere sostituito da
e
⎛ e
⎞
pi′ → pi − ⎜ − A ( ri ) ⎟ → pi + A ( ri )
c
⎝ c
⎠
dove A ( ri ) è il potenziale vettore dipendente dalla posizione ri dell’i-esimo elettrone.
Consideriamo l’equazione ∇ ⋅ H = 0 dove ∇ è l’operatore divergenza che esprime la solenoidalità
del campo H . Tale equazione è una delle equazioni di Maxwell ed è sempre valida. In virtù dell’
23
equazione ∇ ⋅ H = 0 si può introdurre un vettore A , detto potenziale vettore, tale che H = ∇ × A
dove ∇× è l’operatore rotazionale. Infatti, in base ad una semplice regola di calcolo vettoriale, la
divergenza del rotazionale di un generico vettore è sempre nulla. In presenza di un campo
magnetico uniforme si trova, a partire dalla relazione H = ∇ × A , che il potenziale vettore A ( ri ) per
l’i-esimo elettrone può essere espresso nella forma
1
A ( ri ) = − ri × H
2
e
A ( ri ) ha le dimensioni di un momento esplicitando le
c
Si dimostra facilmente che la quantità
dimensioni di A ( ri ) , cioè
−1
⎡ 1
⎤
⎡⎣ A⎤⎦ = ⎢g 2cm 2 s-1cm⎥
⎣
⎦
1 ⎤
⎡
erg 2 ⎥ ⎡ 1 2 − 1 2 -1 ⎤
= g cm s cm⎥
⎡⎣H ⎤⎦ = ⎡⎣Oe⎤⎦ = ⎢
3 ⎥ ⎢
⎢
⎣
⎦
2
cm
⎣⎢
⎦⎥
⎡e
⎢
⎣c
.
Infatti,
essendo le dimensioni del campo esterno
facendo
l’analisi
dimensionale
si
ottiene
3
1
−1
⎡ 1
⎤
⎤ ⎢ g 2cm 2 s-1g 2cm 2 s-1cm ⎥ ⎡
= g cm s-1⎤ .
A⎥ =
⎦
⎥ ⎣
cm s-1
⎦ ⎢
⎣⎢
⎦⎥
Per dimostrare che
1
A ( ri ) = − ri × H conviene semplificare la descrizione prendendo il campo
2
magnetico diretto ad esempio lungo z, cioè scrivere H = H kˆ con H intensità uniforme del campo e
k̂ versore associato alla direzione z. Ricaviamo A esplicitamente, cioè
iˆ
1
1
A = − ri × H = − xi
2
2
0
(
ˆj
yi
)
0
kˆ
1
zi = − yi H iˆ − xi H ˆj
2
H
(
)
dove ri = ( xi , yi , zi ) . Sostituiamo l’espressione di A in H = ∇ × A ricavando esplicitamente H , cioè
iˆ
1 ∂
⎡ 1
⎤
H = H kˆ = ∇ × A = ∇ × ⎢ − yi H iˆ − xi H ˆj ⎥ = −
2 ∂xi
⎣ 2
⎦
yi H
(
)
ˆj
∂
∂yi
− xi H
kˆ
∂
=
∂ zi
0
⎞
1⎛ ∂
∂
= − ⎜⎜
( xi H )iˆ + ( yi H ) ˆj + ( − H − H ) kˆ ⎟⎟ = H kˆ
2 ⎝ ∂zi
∂ zi
⎠
poiché le derivate sono nulle a causa dell’uniformità del campo magnetico secondo cui H ( r ) = H
cioè il campo magnetico non dipende dalle coordinate. Si ottiene un’identità e quindi si è dimostrato
24
1
2
che A ( ri ) = − ri × H . Il potenziale vettore espresso in questa forma soddisfa anche la condizione
∇ ⋅ A = 0 , cioè è a divergenza nulla. Infatti, basta sostituire l’espressione di A e scrivere in forma
esplicita tale condizione, cioè
1
1⎛ ∂ ˆ ∂ ˆ ∂
i+
j+
∇ ⋅ A = − ∇ ⋅ yi H iˆ − xi H ˆj = − ⎜⎜
2
2 ⎝ ∂xi
∂yi
∂zi
(
)
⎞
kˆ ⎟⎟ ⋅ yi H iˆ − xi H ˆj =
⎠
(
)
⎞
1⎛ ∂
∂
= − ⎜⎜
( yi H ) − ( xi H ) ⎟⎟ = 0
2 ⎝ ∂xi
∂yi
⎠
tenendo conto delle relazioni fra i versori, cioè iˆ ⋅ iˆ = 1 , ˆj ⋅ ˆj = 1 , iˆ ⋅ ˆj = 0 , ˆj ⋅ iˆ = 0 , kˆ ⋅ iˆ = 0 e
kˆ ⋅ ˆj = 0 e dell’annullamento delle derivate a causa dell’uniformità del campo magnetico.
L’equazione a divergenza nulla del potenziale vettore prende il nome di gauge di Coulomb. In
meccanica quantistica A è un operatore vettoriale, H può essere considerato un vettore essendo
uniforme spazialmente.
I due contributi energetici, espressi in forma operatoriale, da calcolare sono i seguenti
1) Energia di interazione fra il campo magnetico esterno e lo spin elettronico
Essa viene scritta come la somma delle energie d’interazione di ciascuno spin con il campo
magnetico esterno, cioè si ha
ΔH 0 = - μ spin ⋅ H = g0 μ B S ⋅ H = g0 μ B H ⋅ S = g0 μ B H S z
spin
= − g 0 μ B S è il momento magnetico di spin degli elettroni, S =
dove μ
(1.23)
∑s
i
è l’operatore
i
vettoriale di spin totale espresso come somma degli operatori di spin di ciascun elettrone ed
Sz =
∑s
i
z
è la componente z dell’operatore S data dalla somma delle componenti degli spin
i
orientati lungo la direzione z individuata da H. Gli siz possono assumere i valori +1/2 e -1/2,
mentre g0 = 2 è il fattore di Landè per l’elettrone. A causa della commutatività fra l’operatore S e
l’operatore
H si ha che S ⋅ H = H ⋅ S . I due operatori commutano, perché l’operatore
H può
essere visto come vettore a causa della sua uniformità spaziale.
2) Energia cinetica totale elettronica
Essa assume la forma
25
Si sostituisce l'espressione
di A( ri )
∑
1
T=
2m
1
2m
i
∑
pi
2
i
1
=
2m
∑
i
2
1
2m
∑
e
1
⎡
⎤
⎢ pi + c A ( ri ) ⎥ = 2m
⎣
⎦
1 e
−
4m c
∑
1 e
pi ⋅ ri × H −
4m c
p′i2=
∑
2
e
⎡
⎤
⎢ pi − 2c ri × H ⎥ =
⎣
⎦
i
i
Si scrivono separatamente i due contributi e
non si fa il doppio prodotto, poichè non è ancora
dimostrata la commutatività di pi ⋅ A( ri ) ed A( ri )⋅ pi
i
1 e
pi −
4m c
2
∑(
i
∑
∑(
1 e2
+
8m c2
ri × H ⋅ pi
i
)
1 e2
pi ⋅ ri × H + ri × H ⋅ pi +
8m c2
ri × H
)
2
=
i
∑ ( ri × H )
2
=
i
= T0 + ΔH 1
1
In questa espressione T0 = 2m
∑p
i
2
è l’operatore energia cinetica totale elettronica in assenza di un
i
campo magnetico esterno, mentre
ΔH 1 = −
1 e
4m c
1 e
∑ ( pi ⋅ ri × H + ri × H ⋅ pi ) + 8m c2 ∑ ( ri × H )
2
i
2
i
è l’operatore associato alla variazione di energia dovuta alla presenza del campo magnetico esterno.
I due termini di ΔH 1 possono essere ulteriormente manipolati e posti in una forma più semplice
ed interpretabile da un punto di vista fisico.
1 e
Partiamo dalla derivazione del primo termine di ΔH 1 , cioè di − 4m c
∑( p ⋅ r × H + r × H ⋅ p ) . A
i
i
i
i
i
partire dalla condizione ∇ ⋅ A = 0 si può dimostrare che A ( ri ) ⋅ pi = pi ⋅ A ( ri ) , cioè che i due operatori
vettoriali potenziale vettore e momento coniugato commutano (la dimostrazione viene lasciata al
lettore).
Ciò
implica,
sostituendo
ri × H ⋅ pi = pi ⋅ ri × H
−
1 e
4m c
e
l’espressione
quindi,
A
di
più
nell’uguaglianza
in
scritta,
generale,
che
che
∑ ( p ⋅ r × H + r × H ⋅ p ) = − 4m c ∑ ( p ⋅ r × H + p ⋅ r × H ) = − 2 m c ∑ ( p ⋅ r × H ) .
i
i
i
i
i
1 e
i
i
i
i
i
1 e
i
i
i
Si può riscrivere il termine in una forma più semplice. Infatti, basta tenere presente che il momento
angolare classico dell’i-esimo elettrone vale li = ri × pi per cui si può scrivere per ogni elettrone,
sfruttando la regola del prodotto misto a ⋅ b × c = c ⋅ a × b e la proprietà del prodotto vettoriale
a × b = −b × a , − pi ⋅ ri × H = − H ⋅ pi × ri = H ⋅ ri × pi = H ⋅ li ; anche in questo caso si è inserito
26
= h / 2π per ragioni dimensionali, poiché
ha le dimensioni di un momento angolare, mentre li
in meccanica quantistica è un numero. Da notare che la proprietà del prodotto vettoriale si può
applicare a maggior ragione, perchè H può essere considerato a tutti gli effetti un vettore e non un
operatore vettoriale essendo uniforme nello spazio.
Di
−
conseguenza,
1 e
2m c
considerando
la
somma
∑ ( p ⋅ r × H ) = 2m c H ⋅ ∑ l = 2 m c H ⋅ L ,
i
1 e
i
i
i
1 e
su
tutti
gli
elettroni,
si
ha
dopo avere definito il momento angolare
i
elettronico totale come
∑l = L . Tenendo conto della definizione del magnetone di Bohr, cioè
i
i
μB =
e
e, sfruttando la commutatività di H ed L ( H può essere visto come un vettore) per
2mc
cui H ⋅ L = L ⋅ H , il primo termine di ΔH 1 si può riscrivere in una forma più semplice, cioè
−
1 e
2m c
∑( p ⋅ r × H ) = μ
i
i
BL ⋅ H
dove compare il prodotto scalare fra l’operatore momento angolare
i
orbitale elettronico ed il campo magnetico esterno.
1 e2
Scriviamo ora in una forma più semplice il secondo termine di ΔH 1 , cioè
2
8m c
iˆ
= ri × H ⋅ ri × H = xi
0
( ri × H ) (
2
)(
ˆj
yi
0
)
kˆ
iˆ
zi ⋅ xi
H 0
ˆj
yi
0
∑( r × H )
2
i
. Si ha
i
kˆ
zi =
H
( yi H iˆ − xi H ˆj ) ⋅ ( yi H iˆ − xi H ˆj ) = ( xi 2 H 2 + yi 2 H 2 ) = H 2 ( xi 2 + yi 2 )
dove xi , yi , zi sono le componenti dell’i-esimo elettrone in un riferimento cartesiano ed il campo
magnetico è assunto lungo z, cioè H = H kˆ . Si è tenuto conto delle relazioni fra i versori, cioè
iˆ ⋅ iˆ = 1 , ˆj ⋅ ˆj = 1 , iˆ ⋅ ˆj = 0 e ˆj ⋅ iˆ = 0 . Quindi, in virtù di quest’ultimo risultato, il secondo termine di
1 e2
8m c 2
ΔH 1 si può riscrivere in una forma più semplice, cioè
∑( ri × H )
i
2
=
e2 H 2
8mc 2
∑( x
i
2
)
+ yi 2 .
i
Combinando insieme il primo ed il secondo termine di ΔH 1 così semplificati si ricava
ΔH 1 = μ B L ⋅ H +
e2 H 2
8mc
2
∑( x
i
i
2
+ yi 2
)
(1.24)
27
Scriviamo, quindi, l’operatore associato alla variazione dell’energia totale ΔH come somma del
contributo ΔH 0 dovuto allo spin elettronico (cf. Eq.(1.23)) e del contributo ΔH 1 dovuto
all’effetto del campo magnetico sull’energia cinetica degli elettroni (cf. Eq.(1.24)), cioè
ΔH = ΔH 0 + ΔH 1 = g0 μ B S ⋅ H + μ B L ⋅ H +
(
)
= μ B L + g0 S ⋅ H +
2
e H
2
8mc 2
∑( x
2
i
i
+ yi2
)
e2 H 2
8mc 2
∑( x
2
i
)
+ yi2 =
i
(1.25)
Si nota che l’operatore ΔH è proporzionale ad un termine al primo ordine in H ed ad un termine
al secondo ordine in H .
Se si applica un campo magnetico di intensità media pari ad esempio a 104 G si può dimostrare, con
un semplice calcolo effettuato facendo una stima approssimativa dell’ordine di grandezza del primo
termine a secondo membro di Eq.(1.25), che si ottiene una variazione di energia di 10-4 eV. Il
secondo termine a secondo membro dà infatti un contributo molto più piccolo e quindi trascurabile
per il conto. Quindi risulta che, applicando un campo magnetico di intensità media, l’energia del
sistema cambia di poco tenendo presente che le energie atomiche sono dell’ordine di alcuni eV.
Questa piccola variazione è però responsabile delle proprietà magnetiche della materia. Per
calcolare piccole variazioni di energia in meccanica quantistica ci si avvale della TEORIA
PERTURBATIVA ORDINARIA.
Poiché la suscettività è proporzionale alla derivata seconda dell’energia libera (e quindi anche alla
derivata seconda dell’energia) si dovranno tenere nello sviluppo perturbativo dell’energia termini
fino al secondo ordine in H per avere una suscettività magnetica che risulti indipendente dal campo
esterno come effettivamente si osserva sperimentalmente. Per questa ragione si usa il risultato della
teoria perturbativa indipendente dal tempo al secondo ordine nell’energia. Quindi, nel calcolo si
trascurano i contributi dell’energia perturbata di ordine superiore al secondo nel campo magnetico
esterno che risultano molto piccoli.
Se En è l’energia dello stato imperturbato n-esimo (con n = 0 stato fondamentale ed n = 1,2,..,k i k
stati eccitati imperturbati) e ΔEn la sua variazione corrispondente all’operatore ΔH si ha En -> En
+ ΔEn con la variazione di energia ΔEn espressa mediante la teoria perturbativa indipendente dal
tempo al secondo ordine nella forma
28
Perturbazione
al IIo ordine
Perturbazione
al Io ordine
ΔEn = ⟨ n | ΔH | n⟩ +
∑
⟨ n | ΔH | n′⟩
2
En − En′
n′ ≠ n
Si fa uso della teoria perturbativa indipendente dal tempo, perché non si è interessati alla evoluzione
nel tempo dell’Hamiltoniana. Infatti, è ragionevole studiare l’interazione con il campo magnetico
esterno ad un dato istante temporale.
La notazione usata è quella introdotta da Dirac con vettori bra (a sinistra) e ket (a destra) rispetto
all’operatore di perturbazione ΔH . Il primo termine a secondo membro rappresenta la correzione
perturbativa al primo ordine data dall’elemento di matrice della perturbazione ΔH sullo stato
imperturbato n (elemento diagonale) che ha il significato di un valore medio della perturbazione.
Invece il secondo termine a secondo membro è la correzione al secondo ordine. La sommatoria è
fatta su tutti i k stati imperturbati n′ diversi dallo stato n fissato (elementi off-diagonali). È da
notare che in meccanica quantistica gli elementi di matrice sono degli integrali sullo spazio di Fock
le cui funzioni integrande sono rappresentate da operatori e da autovettori, uno a destra
dell’operatore (corrispondente alll’autovettore ket) e l’altro a sinistra dell’operatore (corrispondente
all’autovettore bra). Quest’ultimo deve essere scritto come complesso coniugato. Il secondo termine
a secondo membro è quindi espresso da una sommatoria di elementi di matrice.
Se si sostituisce l’espressione dell’operatore ΔH di Eq.(1.25) dentro ΔEn si ottiene
(
)
ΔEn = ⟨ n | μ B L + g 0 S ⋅ H +
+
∑
n′ ≠ n
(
)
⟨ n | μ B L + g0 S ⋅ H +
e2 H 2
8mc
2
2
e H
2
8mc
2
∑( x
2
i
)
+ yi2 | n⟩ +
i
∑( x
2
i
)
2
+ yi2 | n′⟩
i
En − En′
Poichè la variazione di energia è piccola si trascurano i contributi al terzo ed al quarto ordine in H
provenienti dall’ultimo termine a secondo membro (quello contenente la sommatoria
∑
n′ ≠ n
); in
29
seguito
a
questa
semplificazione
(
)
ΔEn = ⟨ n | μ B H ⋅ L + g 0 S | n⟩ +
+
e2 H 2
8mc
2
⟨n |
∑( x
2
i
si
∑
può
riscrivere
(
)
⟨ n | μ B H ⋅ L + g 0 S | n′⟩
En − En′
n′ ≠ n
ΔEn
la
nella
forma
2
+
)
+ yi2 | n⟩
i
In questo ultimo passaggio si è sfruttata la proprietà di commutatività degli operatori L ed S con
l’operatore
H
(
)
(
)
grazie alla quale L + g0 S ⋅ H = H ⋅ L + g0 S . Inoltre si è decomposto il primo termine
in due termini portando fuori dall’elemento di matrice ⟨ n |
∑( x
2
i
)
+ yi2 | n⟩ (che dà la correzione al
i
primo ordine perturbativo) il termine
e2 H 2
8mc 2
non dipendente dall’elemento di matrice stesso e sono
stati scambiati il risultante secondo termine con l’ultimo termine contenente gli elementi di matrice
off-diagonali. Infine, in quest’ultimo termine si è tenuto solo il contributo al secondo ordine in H.
Si può infine portare fuori dal primo elemento di matrice μ B H , quantità che non dipende da esso
essendo H un vettore ottenendo
(
)
ΔEn = μ B H ⋅ ⟨ n | L + g0 S | n⟩ +
+
e2 H 2
8mc 2
⟨n |
∑(x
2
i
i
∑
(
)
⟨ n | μ B H ⋅ L + g0 S | n′⟩
n′ ≠ n
En − En ′
2
+
)
(1.26)
+ yi2 | n⟩
Eq.(1.26) costituisce l’EQUAZIONE DI BASE per le teorie quantistiche della SUSCETTIVITÀ
MAGNETICA di atomi, ioni o molecole. Il primo termine nel membro di destra è al primo ordine
nel campo magnetico esterno, cioè varia linearmente con il campo esterno. Il secondo ed il terzo
termine costituiscono insieme il contributo al secondo ordine nel campo esterno. Si può scrivere il
generico
elemento
(
di
matrice
del
secondo
termine
in
notazione
compatta,
cioè
)
⟨ n | μ B H ⋅ L + g0 S | n′⟩ = Vn n′ in modo tale che, ancora in notazione compatta, possa essere scritto
2
il modulo quadro di tale elemento di matrice, cioè Vn n ′ = Vn n ′Vn∗n ′ . A causa del fatto che
∗
(
l’operatore L + g 0 S è hermitiano (è infatti reale) si ha che Vn n ′ = Vn∗′ n . Quindi, Vn n ′ = Vn∗′ n
)
∗
da
30
(
)
cui Vn n ′ = Vn ′ n con Vn′ n = ⟨ n′ | μ B H ⋅ L + g0 S | n⟩ per cui gli elementi di matrice del secondo
∗
termine
∑
nel
(
membro
)
di
destra
(
si
possono
riscrivere
come
)
⟨ n | μ B H ⋅ L + g 0 S | n′⟩⟨ n′ | μ B H ⋅ L + g0 S | n⟩
En − En ′
n′≠ n
.
Da notare che il contributo al secondo
ordine diagonale in n è circa 105 volte più piccolo del contributo al primo ordine anche per campi
grandi dell’ordine di 104 G. Anche il termine al secondo ordine costituito dagli elementi di matrice
off-diagonali è dello stesso ordine di grandezza nella maggior parte dei casi a causa del fatto che il
denominatore En − En′ dà la tipica energia di eccitazione atomica che risulta piuttosto grande
rendendo il termine corrispondente molto piccolo. Tuttavia alcuni atomi, come per esempio i gas
nobili, esibiscono proprietà diamagnetiche per le quali l’operatore L + g 0 S ha autovalore nullo a
causa del fatto che L 0 = S 0 = 0 (si veda il paragrafo successivo per una discussione). Ciò porta
all’annullamento del primo e del secondo termine del membro di destra di Eq.(1.26). Per questi
atomi si dovrà tenere conto, nel calcolo della suscettività, del terzo termine del membro di destra di
Eq.(1.26) (secondo termine al secondo ordine nel campo magnetico) che, pur essendo piccolo,
risulta diverso da zero. Escluso questo caso l’energia di un sistema di atomi con o senza campo
magnetico è praticamente la stessa.
1.5.1 Suscettività di ioni (atomi) isolanti con tutte le shell occupate:
diamagnetismo di Larmor
Analizziamo in primo luogo il caso dei GAS NOBILI che rappresentano il prototipo di sostanze
diamagnetiche e sono ISOLANTI. Calcoliamo per essi, a partire dal risultato della teoria
perturbativa, la suscettività diamagnetica.
Consideriamo il sistema ad una temperatura tale che tutti gli elettroni si trovino nello stato
fondamentale n = 0 non degenere che indichiamo con 0 usando la notazione della meccanica
quantistica. Poiché i gas nobili presentano shell complete si ha che i numeri quantici associati al
momento angolare totale, a quello orbitale ed a quello di spin sono nulli, cioè J = L = S = 0 . Ciò
implica
che
J 0 =L 0 =S 0 =0
essendo
uguali
a
zero
gli
autovalori
J ( J + 1) , L ( L + 1) e S (S + 1) corrispondenti rispettivamente al momento angolare totale, al
momento angolare orbitale ed a quello di spin. Di conseguenza, i primi due termini della correzione
31
perturbativa all’energia di Eq.(1.26) sono uguali a zero, poiché per entrambi i termini vale la
condizione ( L + g 0 S ) 0 = 0 essendo L 0 = S 0 = 0 .
In particolare, per J = 0 si trova che 2 J + 1=1, cioè che lo stato fondamentale effettivamente non è
degenere essendo rappresentato da un solo livello. Quindi, la correzione perturbativa dell’energia
nello stato fondamentale n = 0 vale
ΔE0 =
e2 H 2
8mc
2
⟨0 |
∑( x
2
i
)
+ yi2 | 0⟩
i
In questo caso si può porre ΔE0 = F , dove F è l’energia libera, poiché lo stato fondamentale è non
degenere. Si deve perciò confrontare l’energia dello stato fondamentale E0 con l’energia termica kBT
con il risultato che E0 >> kBT . Quindi, in virtù di questa disuguaglianza, è come se si assumesse una
temperatura T = 0, temperatura alla quale si può porre ΔE0 = F .
Quindi, la suscettività per ione si può esprimere come la derivata seconda dell’energia ΔE0
risultando
1 ∂2 F
1 ∂ 2 ΔE0
1 ∂2
χ =−
=
−
=
−
V ∂H 2
V ∂H 2
V ∂H 2
1 e2
=−
⟨0 |
V 4mc 2
∑( x
2
i
⎛ 2 2
⎜ e H ⟨0 |
⎜ 8mc 2
⎝
∑(
i
⎞
xi2 + yi2 | 0⟩ ⎟ =
⎟
⎠
)
)
+ yi2 | 0⟩
i
Supponendo di avere N ioni indipendenti si può esprimere la suscettività totale nella forma
N e2
χ =−
⟨0 |
V 4mc 2
∑( x
)
+ yi2 | 0⟩
2
i
i
(1.27)
L’espressione trovata prende il nome di SUSCETTIVITÀ DIAMAGNETICA di LARMOR. Essa è
una grandezza adimensionale e negativa, poiché l’elemento di matrice è positivo. Inoltre è
indipendente dalla temperatura. Si dimostra facilmente che il risultato quantistico ottenuto
applicando la teoria perturbativa al secondo ordine è equivalente al risultato classico della teoria del
diamagnetismo di Langevin. Infatti, nell’ipotesi che la distribuzione elettronica abbia simmetria
sferica, si può scrivere
⟨0 |
∑( x
2
i
)
+ yi2 | 0⟩ = ⟨0 |
i
=
2
3
∑ ⟨0 | r
2
i
∑x
2
i
i
| 0⟩ + ⟨0 |
∑y
2
i
| 0⟩ =
i
| 0⟩
i
32
essendo
⟨0 |
per
∑x
| 0⟩ = ⟨ 0 |
∑x
| 0⟩ + ⟨ 0 |
2
i
i
⟨0 |
2
i
ri2 = xi2 + yi2 + zi2
definizione
∑y
| 0⟩ = ⟨ 0 |
∑y
| 0⟩ =
2
i
i
i
2
i
∑z
2
i
| 0⟩ =
i
2
⟨0 |
3
i
2
ionico nella forma ⟨ r ⟩ =
1
Z
∑r
2
i
i
∑ ⟨0 | r
2
i
1
⟨0 |
3
| 0⟩ =
2
3
e,
∑r
2
i
| 0⟩
a
causa
della
simmetria
sferica,
per cui si ottiene immediatamente
i
∑ ⟨0 | r
2
i
| 0⟩ . Definendo un raggio quadratico medio
i
| 0⟩ (è la definizione di media aritmetica) dove Z è il numero di
i
elettroni in ciascuno ione e, sostituendo tale espressione in Eq.(1.27), si ricava
N Z e2 2
χ =−
⟨r ⟩
V 6mc 2
(1.28)
Il risultato di Eq.(1.28) è equivalente al risultato classico di Langevin di Eq.(1.9). Tuttavia, usando
il metodo perturbativo si trova che il diamagnetismo è associato agli elettroni delle shell
elettroniche esterne che risultano completamente occupate. Questo risultato non poteva essere
ottenuto per via classica.
In genere risulta comodo esprimere la suscettività diamagnetica come suscettività molare avente
unità di misura in cm3/mole. Basta moltiplicare la suscettività per il volume di una mole, cioè
χ molare = χ
NA
V dove ( N A / N ) V è il volume di una mole con N A numero di Avogadro. Ad
N
esempio fra i gas nobili la suscettività molare dell’elio (He) (la più bassa in valore assoluto) vale
−1.9 × 10−6 cm3 /mole , mentre quella dello xenon (Xe) (la più alta in valore assoluto) è
−43 × 10−6 cm3 /mole . Invece ad esempio fra gli alcalini la suscettività molare dello ione potassio
(K+) è −14.6 × 10−6 cm3 /mole e fra gli alogeni quella dello ione Cl- è −24.2 × 10−6 cm3 /mole .
1.5.2 Suscettività di ioni (atomi) isolanti con shell parzialmente occupate:
paramagnetismo di Van Vleck
Prendiamo ora in esame atomi appartenenti alla classe degli ISOLANTI che non soddisfano la
condizione di completezza della shell più esterna e calcoliamo per essi la correzione dell’energia al
secondo ordine perturbativo. Questi atomi manifestano sia comportamento diamagnetico che
paramagnetico.
33
Esaminiamo prima il CASO IN CUI il NUMERO QUANTICO è nullo, cioè J = 0 che equivale ad
avere L’AUTOVALORE DEL MOMENTO ANGOLARE TOTALE
J ( J + 1) NULLO. Tale
caso si verifica, oltre che per shell piene (cf. paragrafo 1.5.1), anche per shell in cui manca un
elettrone perché risultino semipiene. E’ da notare che non era possibile considerare tale caso nella
discussione del paramagnetismo quantistico fatta nel paragrafo 1.4 dove si assumeva che J fosse
diverso da zero e si aveva suscettività magnetica non nulla solo per sostanze paramagnetiche con
momento magnetico permanente. Il valore di J = 0 si ricava utilizzando le 3 regole di Hund per il
riempimento delle shell secondo le quali:
a) Gli elettroni vengono distribuiti in maniera tale da avere lo spin totale S dello stato
fondamentale massimo in accordo con il principio di esclusione di Pauli. Questa regola
stabilisce quindi il valore di S con S =
n
∑
i =1
szi
numero quantico dello spin totale
corrispondente allo stato fondamentale considerato; szi è la componente lungo z dello spin
dell’i-esimo elettrone e può assumere i valori +1/2 (spin up) o -1/2 (spin down), mentre n è
il numero di elettroni da porre nella shell considerata il cui numero massimo è stabilito dal
principio di esclusione di Pauli.
b) Occorre massimizzare il momento angolare orbitale totale L dello stato fondamentale.
c) Occorre stabilire il valore del momento angolare totale J corrispondente allo stato
fondamentale una volta noti i valori di L ed S. In base al segno del termine
(
)
dell’Hamiltoniana λ L ⋅ S che esprime l’interazione spin-orbita i valori di J corrispondenti
allo stato fondamentale sono i seguenti
J = L−S ,
n ≤ 2l + 1
Shell meno che semipiene
J = L + S,
n ≥ 2l + 1
Shell più che semipiene
dove l è il numero quantico azimutale (per shell d- si ha l = 2, per shell f si ha l =3). Per shell meno
che semipiene, cioè per n ≤ 2l + 1 , l’accoppiamento spin-orbita avente λ > 0 favorisce il minimo
valore di J, dato da momento angolare e di spin totali antiparalleli, cioè L − S . Per shell più che
semipiene, cioè per n ≥ 2l + 1 , l’accoppiamento spin-orbita avente λ < 0 favorisce il massimo
valore di J dato dalla condizione di momento angolare orbitale e di spin totali paralleli, cioè L + S .
Il numero totale di elettroni è pari a n = 2 ( 2l + 1) . La regola a) tuttavia presenta ambiguità perché
non stabilisce quale orbitale debba essere riempito per primo (per esempio non stabilisce quale dei 5
orbitali della shell d- o quale dei 7 orbitali della shell f- deve essere riempito per primo).
34
Se si considerano gli stati fondamentali (indicati con | 0⟩ in notazione di Dirac) di ioni con shell dparzialmente occupate (numero quantico azimutale l = 2) si ha che la condizione per cui il momento
angolare totale sia nullo, cioè J = L − S = 0 , si realizza quando si pongono nella shell d- 4
elettroni scelti ad esempio tutti con spin down (shell meno che semipiena) ognuno dei quali con
componente lungo la direzione z data da sz = -1/2. Questa condizione corrisponde ad una shell a
cui manca un elettrone per risultare semipiene. I due elementi (isolanti) aventi 4 elettroni nella shell
più esterna e che realizzano questa condizione sono gli ioni Cr2+ ed Mn3+ (si noti che i
corrispondenti atomi di Cr e di Mn sono invece metalli di transizione che non realizzano la
condizione J = 0 ). I 4 elettroni posti nella shell d- danno come momento angolare totale di spin
S=
4
∑s
i =1
zi
= −1/ 2 + (−1/ 2) + (−1/ 2) + (−1/ 2) = −2 = 2 . Invece il numero quantico associato al
momento angolare orbitale totale è L =
4
∑l
i =1
zi
= +2 + 1 + 0 + ( −1) = 2 , poichè il numero quantico
lz i , che dà la componente lungo z del momento angolare orbitale li dell’i-esimo elettrone, varia da li a +li, cioè lzi ∈ [ −li , +li ] a passi di un’unità. E’ da notare che nel riempimento degli orbitali si è
partiti per convenzione da quello corrispondente ad lz = +2 , ma ovviamente si perviene allo stesso
risultato anche partendo dall’orbitale corrispondente ad lz = −2 . Si verifica facilmente che
J = L − S = 2 − 2 = 0 . Lo stesso risultato si otterrebbe se gli elettroni fossero scelti tutti con spin-
up. Il riempimento completo della shell d- costituita da 5 orbitali si ottiene con 10 elettroni, due per
ogni orbitale per il principio di esclusione di Pauli come si può facilmente verificare. Tuttavia
l’ultimo caso di interesse, se si vuole avere una shell d- parzialmente occupata, è quello con 9
elettroni anche se il corrispondente valore di J risulterebbe diverso da zero. Un ragionamento simile
applicato alla shell f- caratterizzata da numero quantico azimutale l = 3 e da 7 orbitali porterebbe ad
avere il numero quantico J nullo se si utilizzassero 6 elettroni, poiché si avrebbe S = 3 ed L = 3 che
porterebbe ad avere J = L − S = 3 − 3 = 0 . Il riempimento totale della shell f- si ottiene invece con
14 elettroni.
Se J = 0 si può dimostrare, a partire da opportune regole di commutazione fra gli operatori di
momento angolare, che
⟨ 0 | L + g 0 S | 0⟩ = 0 pur essendo non nullo lo stato
( L + g0 S ) | 0⟩ . Ciò
corrisponde fisicamente ad un sistema che nello stato fondamentale non presenta momento
magnetico permanente. Questo non significa, come avveniva nel caso discusso nel paragrafo 1.5.1,
35
che l’autovalore L e l’autovalore S riferiti allo stato fondamentale siano entrambi separatamente
nulli. Alla luce di questi risultati la correzione al secondo ordine perturbativo nell’energia risulta
ΔE0 =
2
e H
2
8mc
2
⟨0 |
∑( x
2
i
)
+ yi2 | 0⟩ −
∑
(
En − E0
n≠0
i
)
⟨0 | μ B H ⋅ L + g0 S | n⟩
2
=F
(1.29)
dove l’uguaglianza ΔE0 = F vale nel caso non degenere (si veda il paragrafo 1.5.1 per una
giustificazione di questa uguaglianza). In questo caso si assume infatti che sia soddisfatta la
condizione En − E0
k BT con n=1,2,3 indice dell’energia degli stati eccitati. In base a tale
condizione la maggior parte degli elettroni in ciascun atomo e quindi anche la maggior parte degli
atomi o delle molecole sono nello stato fondamentale all’equilibrio termico. La somma presente nel
secondo termine è effettuata su tutti i k stati eccitati imperturbati off-diagonali caratterizzati dal
numero quantico n ≠ 0 con n = 1,2,.. Come si nota, in Eq.(1.29) manca il primo termine a secondo
membro che era presente in Eq.(1.26), poiché ⟨ 0 | L + g 0 S | 0⟩ = 0 . In Eq.(1.29) si è rinominato n′
con n ed il segno meno nel secondo termine a secondo membro rispetto ad Eq.(1.26) è dovuto al
cambio di segno effettuato a denominatore. Questo cambio di segno è puramente arbitrario, ma
risulta comodo per il calcolo della suscettività.
Come si può notare l’ultimo termine a secondo membro contenente gli elementi off-diagonali non si
annulla a differenza del caso precedente degli isolanti con shell piena dove era invece diverso da
zero solo il primo termine del membro di destra di Eq.(1.29). Supponendo di applicare il campo
(
)
magnetico lungo z si ha: H ⋅ L + g0 S = H ( Lz + g0 S z ) . A partire da Eq.(1.29) e, tenendo conto di
quest’ultima semplificazione nel secondo termine a secondo membro, si ricava la suscettività degli
isolanti contenenti N/V atomi (ioni) per unità di volume, cioè
⎡
N ∂2 F
N ∂2ΔE0
N ⎢ e2
=−
=−
⟨0 |
χ =−
V ∂H 2
V ∂H 2
V ⎢ 4mc2
⎢⎣
N e2
=−
⟨0 |
V 4mc2
∑(
i
)
N
xi2 + yi2 | 0⟩ + 2μB2
V
∑( x
∑
n≠0
2
2
i + yi
i
) | 0⟩ − 2μ ∑
2
B
n≠0
⟨0 | ( Lz + g0Sz ) | n⟩
2
2
⟨0 | ( Lz + g0Sz ) | n⟩ ⎥⎤
=
⎥
En − E0
⎥⎦
(1.30)
En − E0
portando fuori μ B2 dagli elementi di matrice off-diagonali. È da notare che l’operatore derivata
seconda rispetto ad H agente sul secondo termine di Eq.(1.29) è applicato al modulo quadro di
ciascuno dei k elementi di matrice corrispondenti agli stati imperturbati off-diagonali proporzionali
ad H 2 . Eq.(1.30) rappresenta un risultato importante. Il primo termine nell’ultimo membro è la
SUSCETTIVITÀ DIAMAGNETICA di LARMOR ed è associata agli elementi di matrice
36
(diagonali) dell’operatore
∑( x
2
i
+ yi2
) . La suscettività diamagnetica di Larmor è già stata discussa
i
nel paragrafo 1.5.1. Il secondo termine è un contributo nuovo e rappresenta la correzione
paramagnetica alla suscettività diamagnetica di Larmor. Esso è associato agli elementi off-diagonali
fra lo stato fondamentale imperturbato | 0⟩ e gli stati eccitati imperturbati | n⟩ dell’operatore
Lz + g0 S z che risulta proporzionale al momento magnetico, componente z. Come si può notare, la
suscettività che si ricava è un contributo positivo ed è quindi certamente di natura paramagnetica,
ma, a causa del suo piccolo valore, rappresenta SOLO una correzione al diamagnetismo degli
ISOLANTI. Questa correzione paramagnetica alla suscettività diamagnetica prende il nome di
PARAMAGNETISMO di VAN VLECK. Essa non ha a nulla a che vedere con la suscettività
paramagnetica studiata nei paragrafi 1.3 ed 1.4. Si può quindi affermare che il comportamento
magnetico degli isolanti contenenti ioni (atomi) con shell meno che semipiena (la sola che può
realizzare la condizione J = 0 ) dipende dal bilanciamento fra il diamagnetismo di Larmor (primo
termine nell’ultimo membro di Eq.(1.30)) ed il paramagnetismo di Van Vleck (secondo termine
nell’ultimo membro di Eq.(1.30)). Si nota che la suscettività paramagnetica di Van Vleck che si
ricava dal secondo termine nell’ultimo membro di Eq. (1.30) risulta indipendente dalla temperatura.
Se vale la condizione per cui En − E0
k BT (con E0 caratterizzato dal numero quantico J = 0 del
momento angolare totale associato allo stato fondamentale ed En associato al numero quantico J’
del primo stato eccitato) non si può più usare Eq.(1.30) per ricavare la suscettività diamagnetica e
paramagnetica, ma si può dimostrare che la suscettività paramagnetica risulta inversamente
proporzionale alla temperatura assumendo la forma della legge di Curie (cf. Eq.(1.22)). Tale
condizione è però meno probabile. Anche nelle molecole più complesse è presente il
paramagnetismo di Van Vleck con suscettività magnetica indipendente dalla temperatura come
termine correttivo alla suscettività diamagnetica. Esso origina dalle fluttuazioni del momento
angolare attorno all’asse molecolare che a loro volta generano un momento magnetico. Tuttavia,
dalle misure su diverse molecole risulta che il comportamento complessivo è ancora diamagnetico,
poiché la suscettività totale misurata è negativa.
Consideriamo ora il caso in cui il NUMERO QUANTICO J È DIVERSO DA ZERO, cioè J ≠ 0
che equivale ad avere l’AUTOVALORE DEL MOMENTO ANGOLARE TOTALE DIVERSO DA
ZERO. Questo caso si verifica sempre, tranne che per shell piene (cf. paragrafo 1.5.1) e per shell a
cui manca un elettrone per risultare semipiene (caso precedente di shell meno che semipiene).
Quando J ≠ 0 risulta diverso da zero in Eq.(1.26) anche il primo termine dell’energia perturbata.
Tale termine è associato agli elementi diagonali dell’operatore L + g 0 S a sua volta proporzionale al
momento magnetico del singolo atomo (ione) che risulta così diverso da zero anche in assenza di
37
campo esterno. Si può dimostrare che il primo termine dell’energia perturbata in Eq.(1.26) è quasi
sempre maggiore degli altri due, i quali possono essere quindi trascurati. Infatti, nella maggior parte
dei casi i due termini al secondo ordine in H sono almeno 5 ordini di grandezza più piccoli del
primo termine al primo ordine come già discusso nel paragrafo 1.5. Lo stato fondamentale è in
questo caso 2J+1 volte degenere in assenza di campo essendo J ≠ 0 . Poiché lo stato fondamentale
è caratterizzato dagli autostati degli operatori J 2 e Jˆ z ( ∧ è il simbolo di operatore per la
componente z del momento angolare totale), cioè J , L , S e Jz l’elemento di matrice del
(
)
primo termine di Eq.(1.26) dato da ⟨ n | L + g0 S | n⟩ si può riscrivere nella forma proporzionale a
( )
⟨ J LS J z | L + g 0 S | J LS J z′ ⟩ con J z , J z′ = − J ,..., J ed | n⟩ =| J LS J z ⟩ . J z J z′ è il numero quantico
magnetico del momento angolare totale indicato nei paragrafi precedenti con mJ. Per il calcolo di
questo elemento di matrice viene in aiuto il teorema di WIGNER-ECKART. Applicato al caso in
esame esso afferma che gli elementi di matrice di qualsiasi operatore vettoriale nello spazio (2J+1)dimensionale agente sugli autostati di J 2 e J z con un dato valore di J sono proporzionali agli
elementi di matrice dell’operatore J stesso, cioè
⟨ J LS J z | L + g 0 S | J LS J z′ ⟩ = g ( J LS ) ⟨ J LS J z | J | J LS J z′ ⟩
dove g è la costante di proporzionalità espressa dal fattore di Landè e rappresenta il coefficiente di
Clebsch-Gordan della trasformazione. Nel caso specifico l’operatore vettoriale nello spazio (2J+1)dimensionale degli autostati di J 2 e J z è L + g 0 S . E’ da notare inoltre che gli elementi di matrice
dell’operatore Lˆ z + g 0 Sˆ z (con ∧ simbolo di operatore) sono già diagonali negli stati di definito J z ,
poiché
in
generale
si
ha
⟨ J LS J z | Lˆ z + g 0 Sˆ z | J LS J z′ ⟩ = g ( J LS ) ⟨ J LS J z | Jˆ z | J LS J z′ ⟩ = g ( J LS ) J zδ J z J z′ .
che
La
prima uguaglianza è vera grazie al teorema di WIGNER-ECKART, mentre la seconda viene dalla
definizione degli elementi di matrice dell’operatore J z . Riprendendo gli elementi di matrice
dell’operatore L + g 0 S e l’uguaglianza scritta in virtù del teorema di WIGNER-ECKART si può
riscrivere il secondo membro di tale uguaglianza portando dentro gli elementi di matrice la quantità
g ( J LS ) così da ottenere ⟨ J LS J z | L + g 0 S | J LS J z′ ⟩ = ⟨ J LS J z | g ( J LS ) J | J LS J z′ ⟩ .
Scritta l’uguaglianza senza gli autostati (togliendo cioè sia i bra che i ket a primo ed a secondo
membro) si ricava che
38
L + g0 S = g J
(1.31)
Questa relazione è rigorosamente valida per elementi di matrice diagonali in J, L ed S, cioè
nell’ambito dell’insieme (2J+1)-dimensionale dei livelli (non separati in energia) che costituiscono
lo stato fondamentale atomico degenere in assenza di campo esterno. Un atomo (ione)
paramagnetico può infatti avere un momento magnetico diverso da zero proporzionale al numero
quantico J ≠ 0 . Lo stato fondamentale è l’unico stato termicamente eccitato. Se, a causa
dell’applicazione di un campo magnetico, come spesso si verifica, la separazione in energia fra il
multipletto 2J+1 dello stato fondamentale ed il multipletto 2 J ′ +1 associato al primo stato eccitato
J ′ è molto maggiore di k BT , cioè EJ ′ − EJ
k BT , viene trascurata l’influenza che gli stati
eccitati ad energia più elevata hanno sullo stato fondamentale. In questo modo lo stato
fondamentale 2J+1 volte degenere può ancora considerarsi l’unico stato termicamente eccitato.
Solo in questo caso Eq.(1.31) permette di interpretare il primo termine al primo ordine nel campo
magnetico dell’energia perturbata di Eq.(1.26) come energia d’interazione − μ ⋅ H del campo con
un momento magnetico μ proporzionale al momento angolare totale dello ione (atomo) e dato da
μ = − g μB J
(1.32)
Eq.(1.32) è esattamente uguale ad Eq.(1.16) ricavato nell’ambito della teoria quantistica del
paramagnetismo ed esprime il momento magnetico totale di uno ione (atomo) paramagnetico.
Poichè lo stato fondamentale è degenere non è più permesso calcolare la magnetizzazione come
derivata prima dell’energia perturbata e la suscettività come derivata seconda dell’energia
perturbata. Infatti, in questo caso non è più vero che l’energia libera F è uguale a ΔE0 (si veda il
paragrafo 1.4 per una dimostrazione di questa affermazione). La magnetizzazione viene quindi
calcolata in base alla sua definizione statistica, cioè M = −
N ⎛ ∂F ⎞
V ⎜⎝ ∂H ⎟⎠T
e la suscettività come
N ⎛ ∂2 F ⎞
⎟
2 ⎟ .
⎝ ∂H ⎠T
χ = ∂M / ∂H che implica χ = − ⎜⎜
V
La serie di passaggi da effettuare per ricavare la magnetizzazione e da essa la suscettività è
esattamente quella già descritta fra Eq.(1.17) ed Eq.(1.22) del paragrafo 1.4 e la discussione relativa
risulta ancora valida. Quindi, anche mediante il metodo perturbativo, si ritrova la magnetizzazione
di Eq.(1.20) espressa mediante la funzione di Brillouin e la LEGGE di CURIE per la suscettività di
una sostanza paramagnetica già ricavata in Eq.(1.22).
Tuttavia la teoria quantistica del paramagnetismo basata sul metodo perturbativo trattata in questo
paragrafo dà maggiori informazioni sul paramagnetismo di atomi e ioni rispetto alla teoria
39
quantistica del paramagnetismo discussa nel paragrafo 1.4, poichè permette di descrivere una nuova
forma di paramagnetismo, detto paramagnetismo di Van Vleck, presente negli isolanti con shell
meno che semipiene dove però si realizza la condizione per cui l’autovalore del momento angolare
totale è nullo corrispondente al caso J = 0. Questo caso non poteva essere trattato nell’ambito della
teoria quantistica del paramagnetismo del paragrafo 1.4 dove veniva assunto che J fosse diverso da
zero.
Infine, è da notare che la suscettività magnetica può talvolta assumere carattere tensoriale quando il
vettore magnetizzazione M non è parallelo al vettore campo magnetico H . In questo caso la
magnetizzazione viene definita come
⎛ ∂
∂
∂
,
,
∇H = ⎜
⎜ ∂H x ∂H y ∂H z
⎝
(
M = −N /V ∇H F
)
T
con
H = (Hx, H y, Hz )
dove
⎞
⎟⎟ è il gradiente dell’energia libera F fatto rispetto ad H a temperatura T
⎠
(
costante e la suscettività risulta χˆ = χαβ = − N / V ∇ H ∇ H F
)
T
; il simbolo ^ in χ̂ indica una
grandezza tensoriale con α , β = H x , H y , H z . Quindi, ad esempio, la componente xx del tensore vale
⎛ ∂ ∂
⎞
F ⎟ e così via per le altre componenti. In notazione compatta si può porre
⎝ ∂H x ∂H x ⎠
χH H = −N /V ⎜
x
x
α , β = x, y, z con x, y, z rispettivamente al posto di H x , H y , H z . In forma esplicita il tensore di
suscettività assume quindi la forma di una matrice 3 × 3
χ xx
χ xy
χ xz
χαβ = χ yx
χ yy
χ yz
χ zx
χ zy
χ zz
.
1.6.1 Suscettività dei metalli: paramagnetismo di Pauli
Occorre tenere presente che nei metalli anche gli elettroni di conduzione contribuiscono al
momento magnetico. E’ da notare che il paramagnetismo discusso nei paragrafi precedenti era
associato agli elettroni di valenza appartenenti alle shell più esterne di isolanti. Ci si potrebbe
aspettare che anche gli elettroni di conduzione possano fornire un contributo alla magnetizzazione
40
ed alla suscettività paramagnetica di un metallo del tipo della legge di Curie, cioè un contributo
inversamente proporzionale alla temperatura. Invece, si è osservato sperimentalmente che la
magnetizzazione di molti metalli (fra di essi anche metalli di transizione) è indipendente dalla
temperatura. Occorre quindi correggere la teoria relativa al paramagnetismo quantistico degli
elettroni di valenza appartenenti alle shell più esterne per spiegare questo comportamento associato
agli elettroni di conduzione.
Pauli dimostrò che l’applicazione della distribuzione di Fermi-Dirac avrebbe corretto la teoria come
richiesto. Si assume in prima approssimazione che gli elettroni siano liberi, cioè che non siano
soggetti all’azione di un potenziale esterno (es. potenziale periodico di un reticolo cristallino). Si fa
anche l’ipotesi che valga l’approssimazione ad elettroni indipendenti in base alla quale gli elettroni
non interagiscono fra di loro mediante un’interazione coulombiana. Se si trascura il contributo
associato al momento angolare orbitale che dà origine come vedremo ad una forma di
diamagnetismo, detta diamagnetismo di Landau, ogni elettrone è dotato solamente di momento
magnetico di spin μespin = − g 0 μ B s . Scegliendo la direzione z (quella lungo cui viene applicato il
campo magnetico esterno) si ottiene μespin = − g0 μ B sz . Sapendo che sz = ±1/ 2 dove il segno + (-)
indica che lo spin è parallelo (antiparallelo) ad H e che g0 = 2 , ciascun elettrone fornisce alla
magnetizzazione un contributo pari a ± μ B / V dove V è il volume del sistema. In particolare, se lo
spin dell’elettrone è parallelo al campo H (momento magnetico di spin antiparallelo) il contributo
vale − μ B / V , mentre se lo spin dell’ elettrone è antiparallelo ad H (momento magnetico di spin
parallelo) il contributo vale + μ B / V . Quindi, definito n± = N ± / V dove n+ ( n− ) è il numero di
elettroni per unità di volume con spin parallelo (antiparallelo) ad H, la magnetizzazione totale netta
risulta M = μ B n− + (− μ B n+ ) = μ B n− − μ B n+ = μ B ( n− − n+ ) > 0 , poiché n− > n+ (si veda dopo per una
dimostrazione).
Se ogni elettrone interagisce con il campo magnetico solo attraverso il suo momento magnetico di
spin allora l’energia d’interazione vale E = − μ espin ⋅ H = g 0 s z μ B H , poiché μespin = − g 0 μ B sz con
sz = ±1/ 2 . L’effetto del campo magnetico è quello di rimuovere la degenerazione shiftando
l’energia di ogni livello elettronico di una quantità pari ad E = ± μ B H dove il segno + si riferisce
all’elettrone con spin parallelo al campo magnetico (spin up) e momento magnetico di spin
antiparallelo, mentre il segno – fa riferimento all’elettrone con spin antiparallelo (spin down) e
momento magnetico parallelo. Se si indica con g + ( ε ) ( g − ( ε ) ) il numero di elettroni per unità di
volume con spin up (down) con energia compresa fra ε ed ε + d ε si deve avere, in assenza di un
campo magnetico esterno, che
41
g ± (ε ) =
1
g (ε )
2
poiché la probabilità di avere elettroni con spin up è uguale a quella di avere elettroni con spin
down. In base alla definizione appena data si può indicare g + ( ε ) ( g − ( ε ) ) anche con
( dn / dε )+ ( ( dn / dε )− ) . La quantità g (ε ) = g + (ε ) + g − (ε ) , numero totale di elettroni per unità di
volume con energia compresa fra ε ed ε + d ε , indica quindi genericamente una densità di stati di
energia. È possibile esprimere mediante tale quantità il numero totale di elettroni per unità di
volume per ogni specie di spin (spin up e spin down) scrivendo: n± = d ε g ± ( ε ) f ( ε ) dove
∫
f (ε ) =
1
e
β (ε − μ )
+1
è la funzione di distribuzione di Fermi-Dirac ad una qualsiasi temperatura T
con μ potenziale chimico. Essa rappresenta la probabilità di occupazione o numero medio di
occupazione da parte degli elettroni di conduzione di un livello energetico presente nella banda di
conduzione di un metallo compatibilmente con il principio di esclusione di Pauli. L’energia ε = 0
corrisponde al fondo della banda di conduzione, poiché nei metalli non è presente una vera e
propria banda di valenza, ma solo una sorta di banda associata agli elettroni più vicini ai nuclei o
elettroni di core. Come si nota, per ricavare n± si deve moltiplicare la densità di stati di energia
corrispondente per la probabilità di occupazione a quella data energia. Allo zero assoluto (T = 0)
vale l’uguaglianza μ = ε F dove ε F è l’energia di Fermi.
La quantità ε è l’energia del singolo elettrone che risulta uguale alla sua energia cinetica
imperturbata. Per il principio di conservazione dell’energia, l’energia cinetica ε′ posseduta dall’
elettrone in presenza di un campo esterno H è quindi la differenza fra la sua energia totale
l’energia
potenziale
E
acquisita
in
presenza
di
un
campo
esterno,
ε
e
cioè
ε ′ = ε − E = ε − ( ± μ B H ) = ε ∓ μ B H . In particolare, per spin up, cioè per spin parallelo ad H si ha
ε − μ B H , mentre per spin down, cioè per spin antiparallelo ad H si ha ε + μ B H . In presenza di un
campo magnetico esterno l’energia cinetica cambia a causa dell’interazione con H. Si ha quindi
1
g ( ε − μ B H ) Densità di stati di energia con spin up
2
1
g − ( ε ) = g ( ε + μ B H ) Densità di stati di energia con spin down
2
g+ (ε ) =
42
Si nota immediatamente dalla figura, dove è rappresentata la densità di stati di energia indicata con
dn / dE , che il numero di elettroni di energia compresa fra ε ed ε + d ε con spin down è maggiore
del numero di elettroni di energia compresa fra ε ed ε + d ε con spin up, cioè g − ( ε ) > g + ( ε ) a
causa del segno + dentro la parentesi a secondo membro in g − ( ε ) . Si noti che in figura l’intensità
H del campo magnetico è indicata con B.
Ciò significa che gli elettroni con momento magnetico di spin parallelo al campo sono in numero
maggiore degli elettroni con momento magnetico antiparallelo ad H come ci si doveva aspettare. E’
proprio questo eccesso di elettroni che dà il contributo al paramagnetismo degli elettroni di
conduzione.
Lo stato con energia massima corrisponde all’energia di Fermi
εF
sia per gli elettroni con spin
down che per quelli con spin up. Quindi entrambe le bande elettroniche sono occupate fino
all’energia corrispondente al livello di Fermi.
Poiché gli elettroni con spin up contribuiscono con un momento magnetico pari a − μ B e quelli con
spin down con un momento magnetico pari a + μ B , la magnetizzazione netta (momento magnetico
43
per unità di volume) del metallo riscritta mediante g ± ( ε ) che entrano a loro volta nella definizione
di n± vale
εF
M = ∫ ⎡⎣ μ B g − ( ε ) f ( ε ) − μ B g + ( ε ) f ( ε ) ⎤⎦ d ε
0
dove a T = 0 f ( ε ) = 1 per 0 ≤ ε < ε F ed f ( ε F ) =
(1.33)
1
. Si noti che Eq.(1.33) ha le dimensioni di una
2
magnetizzazione, poiché l’integrale dipende dal prodotto del momento magnetico μ B per il numero
di elettroni (che è un numero puro) per unità di volume. Il numero di elettroni per unità di volume è
dato a sua volta da g ± ( ε ) d ε con g ± ( ε ) d ε = ( dn / d ε )± d ε . Poichè l’energia d’interazione ± μ B H
con il campo magnetico causa uno shift piccolo dell’energia degli elettroni (dell’ordine di 10-4 volte
ε F anche per H pari a 104 G) se paragonato a ε che è invece dell’ordine di ε F (alcuni eV), si può
sviluppare in serie di Taylor al primo ordine l’argomento di g ± ( ε ) , cioè
g ± (ε ) =
Basta
infatti
g ( x± ) = g ( ε ) +
porre
dg
dx±
1
1⎛
dg ⎞
g (ε ∓ μ B H ) = ⎜ g (ε ) ∓ μ B H
⎟
2
2⎝
dε ⎠
x± = ε ∓ μ B H ,
( x± − ε )
sviluppare
al
primo
ordine
attorno
a
x± ,
cioè
. Sostituendo nell’espressione della magnetizzazione di Eq.(1.33) si
x± =ε
ottiene
1 εF ⎡ ⎛
dg ⎞
dg ⎞ ⎤
⎛
− μ B ⎜ g (ε ) − μB H
μB ⎜ g (ε ) + μB H
⎟
⎟ dε =
⎢
∫
2 0 ⎣ ⎝
dε ⎠
d ε ⎠ ⎥⎦
⎝
ε F dg
1 εF ⎡
dg
dg ⎤
= ∫ ⎢ μ B g ( ε ) + μ B2 H
− μ B g ( ε ) + μ B2 H
d ε == μ B2 H ∫
d ε = μB2 H ( g ( ε F ) − g ( 0 ) )=
⎥
0
0
2
dε
dε ⎦
dε
⎣
2
= μB H g ( ε F )
M=
poiché g ( 0 ) = 0 . Si trova che la magnetizzazione è espressa in funzione della densità di stati g
valutata per ε = ε F . Si trova facilmente a partire dalla densità di stati di energia calcolata per
ε = εF ,
cioè
g (εF ) =
(
8π 2m3
h3
)
1
2
2
ε
1
2
F
e
dall’energia
di
Fermi
⎛ 3n ⎞ 3
ε F = h 8m ⎜ 0 ⎟
⎝ π ⎠
2
che
g ( ε F ) = 3n0 / 2ε F . Basta ricavare h3 dall’energia di Fermi e sostituirlo in g ( ε F ) . Infatti si ha che
44
2/3
⎛ π ⎞
2
h 2 = 8m ⎜
⎟ εF ⇒ h
⎝ 3n0 ⎠
( )
3/ 2
2/3
⎛
⎞
3
3/ 2 3/ 2 ⎛ π ⎞
= h = 8 m ⎜⎜
⎟ ⎟
⎜ ⎝ 3n0 ⎠ ⎟
⎝
⎠
sostituisce in g ( ε F ) si ottiene
g (εF ) =
8π ( 2 )
1/ 2
16 ( 2 )
1/ 2
π
3n0
3/ 2
ε F3/ 2 ⇒ h3 = 24 ( 2 )
1/ 2
m3 / 2
m3 / 2ε F3 / 2
1
εF 2 =
π
3n0
m3/ 2ε F3/ 2 . Se si
3n0
In particolare, n0 è il
2ε F
numero totale di elettroni per unità di volume che occupano i livelli fino al livello massimo a T = 0
corrispondente all’energia di Fermi ε F . Sostituendo g ( ε F ) nell’espressione della magnetizzazione
si ottiene
M =
3n0 μB2
H
2ε F
(1.34)
Questa espressione rappresenta la magnetizzazione dovuta alla riorientazione di spin degli elettroni
di conduzione per effetto di un campo magnetico. Tale effetto è quindi presente nei metalli. E’ un
effetto paramagnetico, poiché la magnetizzazione è nella stessa direzione e verso del campo
3n0 μB2
magnetico H a causa del fatto che la costante
2ε F
è positiva e viene denominato
PARAMAGNETISMO di PAULI. La suscettività paramagnetica di spin di un metallo
tenendo conto della definizione,
χPauli
χPauli
vale,
χ = M / H valida quando M dipende linearmente da H
3n0 μB2
=
2ε F
(1.35)
Anche in questo caso la suscettività è una grandezza scalare positiva ed adimensionale. E’ da notare
che la suscettività associata al paramagnetismo di Pauli è indipendente dalla temperatura.
L’indipendenza dalla temperatura di χPauli è dovuta al fatto che la sua derivazione è stata effettuata
assumendo T = 0.
Tenendo presente che l’energia di Fermi per un metallo è mediamente ε F ≈ 2 eV (può anche avere
un valore molto più alto) si ottiene che χPauli ≈ 5 × 10−6 valore in accordo con il risultato
sperimentale. Tale valore è di circa un ordine di grandezza più piccolo rispetto a quella della
suscettività paramagnetica di Langevin-Larmor associato agli elettroni di valenza e discussa nei
paragrafi 1.3, 1.4 ed 1.5.2. Ciò è dovuto al fatto che l’effetto associato al principio di esclusione di
Pauli è molto più efficace del disordine termico nel contrastare l’allineamento dei momenti
magnetici con il campo magnetico esterno. Anche se nella derivazione di Eq.(1.35) si è fatta
l’ipotesi che la temperatura fosse allo zero assoluto considerando l’occupazione dei livelli fino
45
all’energia di Fermi ε F e non oltre, tale risultato vale per un intervallo di temperature diverse dallo
zero assoluto piuttosto ampio a partire da T = 0. Poichè nelle shell d- (es. W (Tungsteno)) il valore
di n0 è maggiore rispetto a quello nelle shell s- (es. Li, Ag, Cu, Au) o p- (es. Al) e quello di ε F è
invece in genere minore, il paramagnetismo elettronico dovuto agli elettroni di conduzione degli
atomi che hanno shell d- incomplete è maggiore, poiché la corrispondente χPauli è maggiore.
1.6.2 Suscettività dei metalli: diamagnetismo di Landau
Nella derivazione della suscettività paramagnetica degli elettroni di conduzione si è supposto che il
moto degli elettroni non venga influenzato dal campo magnetico considerando solo gli effetti
paramagnetici che si generano dall’accoppiamento dello spin dell’elettrone (momento angolare di
spin) con il campo magnetico applicato. Si è quindi implicitamente assunto che le funzioni d’onda
orbitali degli elettroni non vengano modificate dal campo H. Tuttavia ci sono anche effetti
diamagnetici che originano dall’accoppiamento del campo con il moto orbitale degli elettroni
considerati come particelle cariche che inducono una modifica delle funzioni d’onda orbitali degli
elettroni di conduzione. Landau ha dimostrato che negli elettroni liberi ciò comporta la presenza di
una magnetizzazione antiparallela ad H nota come DIAMAGNETISMO di LANDAU. In
particolare, ha ricavato una suscettività diamagnetica pari ad 1/3 della suscettività di Pauli cambiata
di segno, cioè χLandau = −1/ 3 χPauli .
Se gli elettroni si muovono in un potenziale periodico (non sono quindi più elettroni liberi) l’analisi
diventa più complicata anche se l’ordine di grandezza della suscettività diamagnetica è ancora pari a
quello della suscettività paramagnetica. La suscettività totale che risulta da una misura del momento
magnetico di un metallo indotto da un campo esterno risulta una combinazione della suscettività
paramagnetica di Pauli dovuta agli elettroni di conduzione, della suscettività diamagnetica di
Landau associata agli elettroni di conduzione e della suscettività diamagnetica di Larmor-Langevin
associata agli elettroni più vicini ai nuclei o elettroni di core (per i metalli hanno il ruolo di elettroni
di valenza anche se non sono caratterizzati da una banda di valenza). Quest’ultima forma di
suscettività è presente in tutti i materiali, siano essi metalli all’interno di composti (in forma di ioni
con shell esterna completa e quindi aventi comportamento isolante) od isolanti puri come i gas
nobili. Non è semplice isolare facendo una misura i singoli contributi alla suscettività. La
suscettività paramagnetica di Pauli può essere estratta dalla suscettività totale di un metallo facendo
una misura basata sulla tecnica della risonanza magnetica nucleare. Tale tecnica infatti sfrutta il
46
forte accoppiamento con i momenti magnetici di spin da parte dei momenti magnetici dei nuclei
ionici usati in questa tecnica. In figura sono rappresentate le suscettività magnetiche caratteristiche
di sostanze diamagnetiche e paramagnetiche in funzione della temperatura T.
Si noti che l’ordine di grandezza della suscettività paramagnetica di Pauli è lo stesso di quello della
suscettività paramagnetica di Van Vleck anche se in media il corrispondente valore di χ è minore
per la suscettività di Pauli come si vede in figura. Per alcuni metalli di transizione tuttavia la
suscettività di Pauli è maggiore di quella di Van Vleck per gli isolanti.
FERROMAGNETISMO
Il ferromagnetismo è caratteristico dei materiali che presentano forte magnetizzazione in presenza
di un campo magnetico che rimane quando viene tolto il campo. Perché ciò avvenga ci deve essere
interazione fra i dipoli magnetici che li tiene orientati in una stessa direzione e verso (il verso risulta
opposto per spin adiacenti in un antiferromagnete) anche quando viene meno il campo. Altrimenti
non appena viene tolto il campo i dipoli si dovrebbero orientare in maniera casuale e ciò è invece
una caratteristica dei materiali paramagnetici. La maggiore responsabile di tale interazione è
47
l’energia di scambio la cui origine microscopica è di natura quantistica essendo essa associata
all’ordinaria interazione coulombiana repulsiva elettrone-elettrone ed al principio di esclusione di
Pauli. La maggior parte delle teorie di magnetismo si basano solo su questo tipo di interazione e
trascurano l’energia dipolare e l’energia di anisotropia che può a sua volta manifestarsi in diverse
forme. Infatti, sia l’energia dipolare che quella di anisotropia sono in genere poco intense rispetto
all’energia di scambio.
2.1 Interazione dipolare
L’energia d’interazione fra due dipoli aventi momenti magnetici μ1 e μ2 rispettivamente e posti ad
una generica distanza r vale
Edipolare =
1
⎡ μ1 ⋅ μ 2 − 3 ( μ1 ⋅ rˆ )( μ 2 ⋅ rˆ ) ⎤⎦
r3 ⎣
(2.1)
dove rˆ = r / | r | è il versore che individua la direzione di
r
con | r |= r . Come si nota
l’interazione dipolare è proporzionale all’inverso del cubo della distanza r. La forma scritta è anche
simmetrica per i due dipoli, cioè risulta invariante se si scambia
μ1 con μ2 . In generale l’energia
dipolare agisce a distanze dell’ordine di 1 micron. E’ utile dare una stima dell’ordine di grandezza
dell’interazione dipolare od interazione dipolo-dipolo che per definizione è un’interazione a lungo
raggio a causa della dipendenza dall’inverso del cubo della distanza. Una buona stima
dell’interazione dipolare si ottiene assumendo che i momenti magnetici siano μ1 ≈ μ2 ≈ g μ B così
che l’energia, trascurando i contributi angolari
contenuti nei prodotti scalari, vale
approssimativamente
Edipolare
( g μB )
≈
2
r3
Tenendo presente che la distanza dei dipoli magnetici in un ferromagnete è tipicamente dell’ordine
di 2 A si trova che Edipolare ≈ 10−4 eV , cioè un valore molto piccolo rispetto all’interazione
elettrostatica che porta a delle differenze di energie fra gli stati atomici dell’ordine di 1 eV .
L’interazione dipolare è quindi troppo debole per giustificare il ferromagnetismo.
Si può rappresentare il sistema nella forma schematizzata in figura. A sinistra è disegnato
genericamente l’insieme dei momenti magnetici in un ferromagnete, mentre a destra è illustrata la
48
configurazione di due momenti magnetici
μ1 e μ2 in corrispondenza della quale l’interazione
dipolare in un sistema magnetico reale risulta minima.
Si noti che l’energia dipolare di Eq.(2.1) risulta minima in un sistema ideale quando una coppia di
dipoli μ1 e μ2 è allineata in modo tale che la freccia di un dipolo sia rivolta verso il punto di
applicazione dell’altro (i due dipoli sono cioè lungo la direzione del vettore congiungente r ).
Tuttavia nei sistemi fisici reali, per minimizzare l’energia dipolare i dipoli μ1 e μ2 tendono a
disporsi ortogonalmente ad r e con verso opposto a causa ad esempio della presenza di
anisotropie. Quindi l’interazione dipolare non favorisce l’allineamento dei dipoli, ma il loro
antiallineamento. Da notare che entra in gioco nella minimizzazione energetica la posizione relativa
rispetto al vettore
r congiungente
i due dipoli. Come vedremo, anche questo fatto differenzia
l’interazione dipolare rispetto all’interazione di scambio dove invece compare solamente la
posizione relativa fra le coppie di momenti magnetici individuata dall’angolo compreso fra di essi.
2.2 Interazione di scambio
Come anticipato, il ferromagnetismo si spiega grazie all’interazione di scambio che è a corto raggio
e più intensa di quella dipolare. Per spiegare l’origine microscopica di questo tipo di interazione che
sta alla base del ferromagnetismo consideriamo un sistema a due elettroni appartenenti ciascuno ad
un nucleo e quindi spaiati. Esso può essere rappresentato ad esempio da una molecola d’idrogeno in
cui si considera in un primo momento solo l’interazione coulombiana repulsiva fra i due elettroni e
49
si trascurano le interazioni di ciascuno dei due elettroni con i due nuclei. E’ noto che il principio di
esclusione di Pauli, che può essere riformulato nei termini di antisimmetria della funzione d’onda
complessiva (parte spaziale e di spin), può portare ad effetti magnetici anche quando non ci sono
termini dipendenti dallo spin nell’Hamiltoniana H. Poiché l’Hamiltoniana (intesa come operatore)
di un sistema a due elettroni, data dalla somma di un termine di energia cinetica
T =−
2
(∇
2m
2
1
+ ∇ 22 ) ed uno d’energia potenziale V ( r1 , r2 ) , non dipende dallo spin, lo stato
stazionario di un sistema a due elettroni può essere scritto come il prodotto di uno stato stazionario
puramente orbitale la cui funzione d’onda elettronica vale ψ ( r1 , r2 ) e soddisfa l’equazione di
Schrödinger elettronica orbitale indipendente dal tempo
H ψ ( r1 , r2 ) = −
2
(∇
2m
2
1
)
+ ∇ 22 ψ ( r1 , r2 ) + V ( r1 , r2 ) = Eψ ( r1 , r2 )
(2.2)
e di uno stato di spin dato dalle possibili combinazioni lineari dei 4 stati di spin (funzione d’onda di
spin) indicati con
↑↑ , ↑↓ , ↓↑ , ↓↓
dove ↑ indica sz = + 1/2 (spin up) e ↓ indica sz = -1/2 (spin down). Nell’Eq.(2.2) l’operatore
energia potenziale è un’energia di interazione coulombiana fra i due elettroni, cioè
V ( r1 , r2 ) =
e2
.
r1 − r2
Si possono scegliere le combinazioni lineari in modo tale da ottenere valori definiti dello spin totale
S dei due elettroni e della sua componente Sz, somma delle componenti sz dei singoli spin lungo
l’asse z. Come noto queste 4 combinazioni, ognuna delle quali esprimente la funzione d’onda di
spin, sono rappresentate da 1 stato di singoletto (da cui il nome singoletto) caratterizzato da spin
totale S = 0 e componente totale Sz = 0 e da 3 stati di tripletto (da cui il nome tripletto) caratterizzati
da spin totale S = 1 e componente Sz = 1,0,-1 rispettivamente, cioè
50
χS ( s1, s2 ) =
(
1
↑↓ − ↓↑
2
)
⎧ ↑↑
⎪
⎪⎪ 1
χT ( s1, s2 ) = ⎨
↑↓ + ↓↑
2
⎪
⎪ ↓↓
⎪⎩
(
S = 0, S z =0
Singoletto
S = 1, S z = 1
)
S = 1, S z =0
Tripletto
S = 1, S z =-1
Lo stato di singoletto è descritto da una combinazione antisimmetrica degli spin, cioè cambia segno
per scambio degli spin (scambio “spin up” con “spin down”) per cui χS ( s1, s2 ) = − χS ( s2 , s1 ) . E’
ragionevole scegliere tale stato di spin come antisimmetrico, poiché si deve differenziare il caso con
spin 1 up e spin 2 down dal caso in cui vengono scambiati gli spin, cioè quello con spin 1 down e
spin 2 up. I 3 stati di tripletto sono espressi invece da combinazioni simmetriche, cioè non cambiano
segno per scambio degli spin per cui χ T ( s1 , s2 ) = χ T ( s2 , s1 ) . Anche in questo caso è ragionevole
scegliere tali stati come simmetrici, perché lo scambio dello spin 1 con lo spin 2 non ha un effetto
sul sistema degli spin. Corrispondentemente, a causa dell’antisimmetria della funzione d’onda totale
imposta dal principio di esclusione di Pauli, la funzione d’onda orbitale dello stato di singoletto è
simmetrica rispetto allo scambio delle posizioni delle due particelle, cioè di r1 con r2 , per cui viene
scritta mediante la seguente combinazione lineare ψ S ( r1 , r2 ) =
1
(φ1 ( r1 ) φ2 ( r2 ) + φ2 ( r1 )φ1 ( r2 ) ) dove
2
φ1 si riferisce al nucleo 1 posto in R1 e φ2 al nucleo 2 posto in R2 . Quindi si ha che
ψ S ( r1 , r2 ) = ψ S ( r2 , r1 ) . Da notare che, in base a questo tipo di rappresentazione, l’elettrone avente
posizione r1 può appartenere al nucleo 2 avente posizione R2 e viceversa per l’elettrone avente
posizione r2 a causa del principio di indistinguibilità. In questo scambio di posizioni sta la chiave
del problema che porterà alla determinazione dell’integrale di scambio. Invece, la funzione d’onda
orbitale di tripletto è antisimmetrica rispetto allo scambio di r1 con r2 per cui viene espressa
mediante la combinazione lineare ψ T ( r1 , r2 ) =
1
(φ1 ( r1 ) φ2 ( r2 ) − φ2 ( r1 )φ1 ( r2 ) ) per ragioni simili a
2
quelle di ψ S ( r1 , r2 ) . Quindi si ha che ψ T ( r1 , r2 ) = −ψ T ( r2 , r1 ) .
51
Indichiamo con Es ed Et i due autovalori più piccoli (corrispondenti cioè allo stato fondamentale di
energia minima), soluzioni dell’equazione di Schrödinger orbitale (cf. Eq.(2.2)), associati
rispettivamente allo stato di singoletto ed allo stato di tripletto. Oltre a questi va considerato
l’autovalore associato all’interazione coulombiana fra i due elettroni V ( r1 , r2 ) . Ancora una volta si
nota che lo spin non influenza l’energia del sistema, perché gli autovalori, soluzione dell’Eq.(2.2),
sono autovalori (energie) della parte orbitale dell’equazione di Schrödinger che è per definizione
spin indipendente.
Se si rappresenta lo stato generale di una molecola come una combinazione lineare dei 4 stati di
spin, 3 di tripletto ed 1 di singoletto, discussi precedentemente è conveniente avere un operatore
chiamato Hamiltoniana di spin H
spin
i cui autovalori Es ed Et danno gli spin degli stati
corrispondenti, rispettivamente di singoletto e di tripletto. Vale per l’operatore vettoriale di spin
totale S 2 la condizione
S 2 = ( s1 + s2 ) = s12 + s22 + 2 s1 ⋅ s2
2
dove il doppio prodotto deriva dalla commutatività dei due operatori di spin su siti diversi (gli spin
appartengono infatti ad atomi diversi), cioè
s1 ⋅ s2 = s2 ⋅ s1 .
Si ha che l’operatore S 2 soddisfa
l’equazione agli autovalori S 2 χ ( s1 , s2 ) = S ( S + 1) χ ( s1 , s2 ) e l’autovalore corrispondente vale
S ( S + 1) . Analogamente, devono valere le equazioni agli autovalori per gli operatori di singolo
spin s12 ed s2 2 , cioè s12 χ ( s1 ) = s1 ( s1 + 1) χ ( s1 ) ed s22 χ ( s2 ) = s2 ( s2 + 1) χ ( s2 ) dove gli autovalori
corrispondenti valgono s1 ( s1 + 1) ed s2 ( s2 + 1) , rispettivamente, ognuno dei quali è uguale ad
1/ 2 (1/ 2 + 1) = 3/ 4 . Si trova, in base alla relazione scritta fra gli operatori ed in base alle equazioni
S2,
agli autovalori per
(
s12
ed
s22
che l’autovalore
E( s1 ⋅s2 )
associato all’operatore
)
s1 ⋅ s2 = S 2 − ( s12 + s22 ) / 2 può essere scritto in funzione degli altri autovalori, cioè come
⎛
3⎞
⎛ 3 3 ⎞⎞
⎛
E( s1 ⋅s2 ) = ( S ( S + 1) − ( s1 ( s1 + 1) + s2 ( s2 + 1) ) ) / 2 = ⎜ S ( S + 1) − ⎜ + ⎟ ⎟ / 2 = ⎜ S ( S + 1) − ⎟ / 2
2⎠
⎝ 4 4 ⎠⎠
⎝
⎝
Si possono distinguere due casi:
a) Stato di SINGOLETTO S = 0. L’autovalore di S 2 vale S(S+1), cioè 0.
L’autovalore corrispondente di s1 ⋅ s2 vale ( 0 − 3/ 2 ) / 2 = −3/ 4
b) Stato di TRIPLETTO S = 1. L’autovalore di S 2 vale S(S+1), cioè 2.
52
L’autovalore corrispondente di s1 ⋅ s2 vale ( 2 − 3/ 2 ) / 2 = +1/ 4
Di conseguenza si può costruire il seguente operatore, Hamiltoniana di spin, nella forma
H spin =
1
( Es + 3Et ) − ( Es − Et ) s1 ⋅ s2
4
La corrispondente equazione di Schrödinger è data da H
spin
χ ( s1 , s2 ) = E spin χ ( s1 , s2 ) . Tale
operatore è scritto in modo tale che nello stato di singoletto esso abbia autovalore E spin pari
all’autovalore Es dell’Hamiltoniana di partenza e nello stato di tripletto abbia autovalore E spin pari
all’autovalore Et dell’Hamiltoniana di partenza (cf. Eq. 2.2). Infatti si ha
Stato di SINGOLETTO: l’autovalore di s1 ⋅ s2 vale -3/4 per cui
E spin =
1
3
1
3
3
3
( Es + 3Et ) − ( Es − Et ) ⎛⎜ − ⎞⎟ = Es + Et + Es − Et = Es
4
4
4
4
⎝ 4⎠ 4
Stato di TRIPLETTO: l’autovalore di s1 ⋅ s2 vale +1/4 per cui
E spin =
1
1
1
3
1
1
( Es + 3Et ) − ( Es − Et ) ⎛⎜ + ⎞⎟ = Es + Et − Es + Et = Et
4
4
4
4
⎝ 4⎠ 4
Ridefinendo lo zero dell’energia si può omettere la costante ( Es + 3Et ) / 4 comune a tutti e quattro
gli stati e scrivere l’Hamiltoniana di spin H spin nella forma
H
spin
= − 2 J s1 ⋅ s 2
(2.3)
con 2 J = Es − Et e J integrale di scambio. L’Hamiltoniana di Eq.(2.3) prende il nome di
Hamiltoniana di Heisenberg. Si può infatti dimostrare, utilizzando il metodo di Heitler-London
applicato alla molecola di idrogeno, che due particelle (elettroni) 1 e 2 aventi posizioni r1 ed r2 ed
orbitanti attorno a due nuclei aventi posizioni R1 ed R2 interagiscono attraverso un’energia
coulombiana diretta ed una energia di scambio. L’Hamiltoniana corrispondente, detta di HeitlerLondon, è quella espressa dall’operatore di Eq.(2.2) a cui vanno aggiunte le interazioni
coulombiane negative elettroni-nuclei, cioè −
nucleo-nucleo
+
e2
R1 − R2
e2
r1 − R1
−
e2
r2 − R2
−
e2
r1 − R2
−
e2
r2 − R1
, e quella positiva
in modo tale che l’Hamiltoniana di Heitler-London risulta
53
H HL
2
⎡
e2
e2
2
2
⎢
= −
∇1 + ∇ 2 +
−
r1 − r2 r1 − R1
⎢ 2m
⎣
(
)
⎤ ⎡
e2
e2
e2
e2
⎥ + ⎢−
−
−
+
⎥ ⎢ r2 − R2 r1 − R2 r2 − R1 R1 − R2
⎦ ⎣
⎤
⎥ . Assumendo
⎥
⎦
che i nuclei si trovino a grande distanza grazie a cui la funzione d’onda del sistema a due elettroni
può essere fattorizzata nelle funzioni d’onda associate a ciascun atomo si ottiene
⎛ e2
e2
e2
e2
⎜
K = ∫ d r1 d r2 ⎡⎣φ ( r1 ) φ ( r2 ) ⎤⎦
+
−
−
⎜ r1 − r2
R1 − R2 r1 − R2 r2 − R1
⎝
⎞
⎟ ⎡φ1 ( r1 ) φ2 ( r2 ) ⎤
⎦
⎟⎣
⎠
2
2
2
⎛ e2
e
e
e
+
−
−
J = ∫ d r1 d r2 ⎡⎣φ ( r1 ) φ ( r2 ) ⎤⎦ ⎜
⎜ r1 − r2
R1 − R2 r1 − R2 r2 − R1
⎝
⎞
⎟ ⎡φ2 ( r1 ) φ1 ( r2 ) ⎤
⎦
⎟⎣
⎠
∗
1
∗
2
∗
1
∗
2
dove K esprime l’energia coulombiana e J quella di scambio. Entrambi gli integrali hanno quindi le
dimensioni di un’energia. In particolare, si può ricavare J determinando la differenza fra Es ed Et, a
partire dall’Hamiltoniana di Heitler-London, cioè scrivendo Es − Et =
dove
(ψ i , H HLψ i )
con i = s, t indica l’elemento di matrice
(ψ s , H HLψ s ) − (ψ t , H HLψ t )
(ψ s ,ψ s )
(ψ t ,ψ t )
e
(ψ i ,ψ i )
è l’integrale di
normalizzazione anch’esso espresso in forma di elemento di matrice. Si ricava l’integrale di
scambio come J = ( Es − Et ) / 2 . Nel calcolo si possono usare per esempio le autofunzioni non
normalizzate ψ S ( r1 , r2 ) = φ1 ( r1 ) φ2 ( r2 ) + φ2 ( r1 ) φ1 ( r2 ) e ψ S ( r1 , r2 ) = 2 (φ2 ( r1 ) φ1 ( r2 ) − φ1 ( r1 ) φ2 ( r2 ) ) ,
rispettivamente per lo stato di singoletto e di tripletto che si possono ottenere a partire
dall’approssimazione ad elettroni indipendenti. A causa del fatto che i nuclei si assumono a grande
distanza si può trascurare il quadrato dell’integrale di sovrapposizione I s2 che ha origine
dall’integrale
di
normalizzazione
I s = ∫ d r1 φ1∗ ( r1 ) φ2 ( r1 ) = ∫ d r2 φ1∗ ( r2 ) φ2 ( r2 ) .
(ψ i ,ψ i ) .
In
particolare
I termini in parentesi tonda indicano
rispettivamente l’interazione coulombiana repulsiva fra i due elettroni, l’interazione coulombiana
repulsiva fra i due nuclei, l’interazione coulombiana attrattiva fra l’elettrone 1 ed il nucleo 2 e
l’interazione coulombiana attrattiva fra l’elettrone 2 ed il nucleo 1. Il secondo, il terzo ed il quarto
termine di interazione vengono sommati al primo termine di interazione repulsiva fra i due elettroni
che corrisponde all’operatore V ( r1 , r2 ) nell’equazione elettronica (cf. Eq.(2.2)) per tenere conto
dell’energia potenziale totale del sistema includendo anche le energie di interazione elettroni-nuclei
e nucleo-nucleo. In particolare, grazie all’approssimazione di Born-Oppenheimer, il potenziale
d’interazione fra i due nuclei può essere assunto come costante se riferito al moto elettronico. I
54
termini di interazione coulombiana −
e2
r1 − R1
e −
e2
r2 − R2
degli elettroni 1 e 2 con i corrispettivi
nuclei non entrano negli integrali K e J essendo termini associati agli atomi di idrogeno isolati.
Entrambi i termini K e J sono scritti come elementi di matrice fra due stati espressi solo da funzioni
d’onda orbitali. Esse risultano reali, poiché sono funzioni d’onda dello stato fondamentale di
ciascun atomo di idrogeno che per definizione sono reali per cui si può omettere la complessa
coniugazione. Poiché J si riferisce alla differenza fra l’energia dello stato di singoletto e quella dello
stato di tripletto prende anche il nome di “splitting” di scambio. Le autofunzioni che compaiono in
K ed in J sono autofunzioni orbitali e non di spin. Mentre l’integrale coulombiano K ha un analogo
classico, perché l’elemento di matrice è fra stati uguali pari a φ1 ( r1 ) φ2 ( r2 ) , l’integrale di scambio J
è calcolato fra due stati che differiscono fra loro per uno scambio delle posizioni r1 ed r2 dei due
elettroni dati rispettivamente da φ1 ( r1 ) φ2 ( r2 ) e φ2 ( r1 ) φ1 ( r2 ) . Da notare che nell’integrale di
scambio J si ha lo scambio delle posizioni spaziali dei 2 elettroni che a sua volta implica uno
scambio fra gli spin assegnati a ciascun nucleo. A causa di questa peculiarità legata alle
autofunzioni, l’origine dello scambio può quindi essere spiegato solamente mediante leggi
quantistiche e non ha controparte classica.
Se ci si limita a considerare un sistema a due elettroni come la molecola di idrogeno si può
affermare, grazie ad un teorema valido per sistemi a due elettroni, che lo stato fondamentale è
caratterizzato da una funzione d’onda orbitale simmetrica corrispondente ad uno stato di singoletto
(S = 0) per cui si ha sempre che Es < Et da cui J < 0 , poiché l’energia di singoletto è l’energia
minima. L’energia totale d’interazione si ottiene dall’integrazione dell’equazione di Schrödinger
(cfr. Eq.(2.2)) in cui si considera per
H
l’Hamiltoniana completa di Heitler-London. Tralasciando
il contributo costante imperturbato 2E0 associato ai due atomi considerati separatamente e
contenente i due termini di energia cinetica dei due elettroni ed i termini di interazione di ciascun
elettrone con il proprio nucleo, l’energia totale può essere scritta come Etot= K±J (K e J sono
entrambi negativi) dove il segno + vale per spin antiparalleli (singoletto) ed il segno – per spin
paralleli (tripletto). La differenza fra l’energia corrispondente allo stato di tripletto e quella
corrispondente allo stato di singoletto vale Et - Es= (K-J) -(K+J) = -2 J. E’ da notare che, mediante il
metodo di Heitler-London, si spiega il legame covalente che caratterizza il più importante
contributo al legame nella molecola di idrogeno. Tuttavia, mediante il metodo di Heitler-London, si
ottiene solo una stima grossolana dell’energia di legame , poiché occorre tenere presente che il
legame ha in parte anche una natura ionica del tipo H+ H-. Per tenere conto di questo contributo
occorre aggiungere alla funzione d’onda orbitale dello stato fondamentale di singoletto anche un
55
termine che tiene conto del fatto che entrambi gli elettroni possono appartenere ad un unico atomo,
cioè una combinazione del tipo φ1 ( r1 ) φ2 ( r1 ) + φ1 ( r2 ) φ2 ( r2 )
Tuttavia, se si considera un solido costituito da N atomi o in generale da molecole complesse (caso
più frequente), a causa di effetti a molti corpi, l’integrale di scambio J può essere positivo o
negativo per cui nei solidi anche lo stato di tripletto può essere lo stato fondamentale. Risulta
evidente che il ferromagnetismo si manifesta in elementi che hanno un numero piuttosto elevato di
elettroni spaiati, cioè quelli i cui momenti angolari di spin non si cancellano. Inoltre la
sovrapposizione delle funzioni d’onda orbitali, che entrano direttamente nella definizione
dell’integrale di scambio, deve risultare piuttosto marcata in modo tale che J assuma valori
sufficientemente grandi. Si vede facilmente che l’interazione di scambio decresce rapidamente al
crescere della distanza fra gli elettroni appartenenti ad atomi diversi. Infatti, ciascuna funzione
orbitale elettronica è maggiormente localizzata nell’intorno di r = Ri con i =1,2 (cioè vicino a
ciascun nucleo) per poi decrescere molto rapidamente. Di conseguenza, l’energia di scambio
diminuisce rapidamente per distanze superiori a R1 − R2 , cioè per distanze superiori alla distanza
fra i due nuclei primi vicini. Quindi, praticamente solo gli atomi primi vicini di un determinato
atomo in un cristallo contribuiscono all’interazione di scambio. Si può modellare fenomeno
logicamente l’interazione di scambio mediante un esponenziale decrescente. Esso tende a zero più
rapidamente di una potenza inversa del cubo della distanza che è invece caratteristico
dell’interazione dipolare. In base a queste considerazioni risulta chiaro come in alcuni elementi di
transizione (ad esempio il ferro, il nichel ed il cobalto) gli elettroni della shell d- (la più esterna),
che risultano spaiati a causa della incompletezza della stessa, siano responsabili del loro
comportamento ferromagnetico basato sull’interazione di scambio fra atomi vicini. Anche le loro
corrispondenti leghe manifestano per ragioni simili un comportamento ferromagnetico. Infine,
ancora per le stesse ragioni, alcune leghe del manganese (MnAs, MnBi ed MnSb), ma non il
manganese preso come elemento singolo, sono ferromagnetiche.
L’Hamiltoniana di Eq.(2.3) è molto semplice, perché dipende SOLO dal prodotto scalare dei due
operatori di spin. Se J > 0 l’energia di scambio risulta minima quando gli spin sono paralleli dando
luogo allo stato FERROMAGNETICO. Infatti, trattando i due operatori vettoriali s1 ed s2 come
vettori
ed
indicando
con
θ
l’angolo
fra
essi
compreso
si
ha
che
H spin = −2 J s1 ⋅ s2 = −2 J | s1 || s2 | cos 0 = −2 J | s1 || s2 |( +1) = −2 J s1 s2 < 0 dove θ = 0 ,
mentre si otterrebbe 2 J s1 s2 > 0 per spin antiparalleli. La sostanza corrispondente è denominata
56
FERROMAGNETICA. E’ da notare che se J > 0 ciò implica, tenendo presente che 2 J = Es − Et ,
che Et < Es , cioè lo stato di tripletto a spin paralleli minimizza l’energia di scambio.
Invece, se J < 0 l’energia di scambio risulta minima quando gli spin sono antiparalleli dando luogo
allo
stato
ANTIFERROMAGNETICO.
Infatti,
in
questo
caso
si
ha
H spin = −2 J s1 ⋅ s2 = −2 J | s1 || s2 | cos π = −2 J | s1 || s2 | ( −1) = 2 J s1 s2 < 0 dove θ = π ,
mentre si otterrebbe −2 J s1 s2 > 0 per spin paralleli.
Le sostanze caratterizzate da questo
accoppiamento sono ANTIFERROMAGNETICHE. Se J < 0 si ha che Es < Et , cioè lo stato di
singoletto a spin antiparalleli minimizza l’energia di scambio.
Esiste anche un terzo tipo di accoppiamento simile all’antiferromagnete rappresentato dal
FERRIMAGNETE (ad esempio la magnetite (FeO x Fe2O3)) dove gli spin sono antiparalleli, ma
non hanno la stessa grandezza. I tre tipi di sistemazioni ordinate di spin sono illustrati in figura.
L’accoppiamento di scambio dipende solo dalla posizione relativa dei due spin, ma non dalle
direzioni di ogni singolo spin rispetto al vettore congiungente i due spin r1 − r2 con r1 vettore
posizione dello spin 1 ed r2 vettore posizione dello spin 2. L’interazione di scambio è
un’interazione di origine quantistica a CORTO RAGGIO che, come già affermato, coinvolge
soprattutto coppie di primi vicini. Tuttavia, nei solidi magnetici il ferromagnetismo è rappresentato
dall’ Hamiltoniana generale
H scambio = −∑ J ij si ⋅ s j
ij
dove si è estesa la somma a tutte le coppie di spin. Quindi, in teoria non solo gli atomi primi vicini,
ma anche i vicini di ordine superiore contribuiscono all’interazione di scambio. Si è indicato
genericamente con J ij la costante di scambio fra l’atomo i-esimo e l’atomo j-esimo (quella indicata
in Eq.(2.3) con 2 J). Inoltre, a fissato ione i-esimo, la costante di scambio per ogni coppia di spin è
diversa: in particolare, se si considerano n vicini (n=1 primi vicini, n=2 secondi vicini e così via) si
57
(
ha J i i +1 ≠ J i i + 2 ≠ J i i + 3 ≠ ...J i i + n J i i −1 ≠ J i i − 2 ≠ J i i − 3 ≠ ...J i i − n
)
dove si è supposto per semplicità di
essere nel caso unidimensionale. Spesso però nei modelli si considera realistica la somma estesa ai
soli atomi primi vicini (2 nel caso unidimensionale), poichè essa rappresenta anche nei solidi il
contributo più grande all’energia di scambio. Di conseguenza, l’integrale di scambio risulta uguale
per ogni coppia ij con j = i ± 1 e può essere posto uguale a J. Sulla base di questa approssimazione
si riscrive l’Hamiltoniana di scambio nella forma
H scambio = − J ∑ si ⋅ s j
⟨ ij ⟩
(2.4)
dove ⟨ ij ⟩ indica che la somma è fatta sui primi vicini.
2.3 Domini magnetici
I domini magnetici sono regioni di un sistema ferromagnetico con magnetizzazione diversa. La
formazione dei domini dipende dalla forma e dalle dimensioni del sistema e la magnetizzazione
cambia orientazione passando da un dominio a quello adiacente. I domini magnetici sono chiamati
anche domini di Weiss. Il confine che divide un dominio da quello adiacente prende il nome di
parete di dominio. A causa dell’energia in gioco il confine fra due domini adiacenti può essere netto
(la parete ha spessore tendente a zero) oppure graduale (la parete ha spessore finito). In quest’ultimo
caso la parete di dominio è più estesa ed il costo energetico in energia di scambio per formarla è
minore rispetto al caso in cui il confine è netto. Nella realtà la parete ha comunque sempre uno
spessore diverso da zero ed il suo spessore dipende dalla competizione fra l’energia di scambio e
quella di anisotropia. La parete di dominio è detta di Bloch se la magnetizzazione all’interno della
parete ruota in un piano parallelo alla parete stessa (caso (a) di figura). La parete è invece detta di
Néel se la magnetizzazione ruota in un piano perpendicolare alla parete di dominio (caso (b) di
figura).
58
Nei sistemi magnetici le pareti che si formano più frequentemente sono quelle di Bloch. In figura è
riportata una configurazione a singolo dominio e due esempi di configurazioni a doppio dominio
separati da una parete di dominio che segna un confine netto fra i due domini.
59
Nella configurazione a singolo dominio schematizzata in alto è favorito energeticamente lo scambio
ferromagnetico (J >0), poiché gli spin sono tutti paralleli a causa dell’azione del campo magnetico
esterno e gli spin interagiscono mediante un’interazione di scambio ferromagnetica.
Nella prima configurazione a doppio dominio (Es.1) si può affermare che dal punto di vista
dell’interazione di scambio ferromagnetico si ha un danno energetico passando dalla configurazione
con magnetizzazione up alla configurazione con magnetizzazione down, perché si accumula
60
un’energia in eccesso pari a 2 J. Infatti, assumendo gli spin di modulo unitario, quando essi sono
paralleli l’energia di scambio di una coppia di spin vale H ↑↑ scambio = − J , mentre quando sono
antiparalleli H ↑↓ scambio = J come si verifica per le coppie di spin adiacenti presenti in figura
rispettivamente nel dominio di sinistra ed in quello di destra. La differenza fra le due energie è
quindi H ↑↓ scambio − H ↑↑ scambio = J − ( − J ) = 2 J . Invece, dal punto di vista dell’interazione dipolare
la configurazione è energeticamente conveniente. Infatti, l’interazione dipolare è per definizione
un’interazione a lungo raggio ed una configurazione favorevole per l’energia dipolare si ha quando
gli spin (atomi) sono disposti ortogonalmente rispetto al vettore congiungente ed antiparallelamente
gli uni (dominio di sinistra) rispetto agli altri (dominio di destra) come in questo caso. Inoltre i
primi (Ii) vicini (atomi) che interagiscono mediante l’interazione di scambio sono molti meno
rispetto alla totalità degli atomi. Pur essendo più debole, in questa configurazione l’interazione
dipolare è più importante dello scambio.
Invece, la seconda configurazione a doppio dominio (Es.2) dove i primi vicini sono in numero
maggiore rispetto ai vicini di ordine superiore (non rappresentati per semplicità in figura perchè
presenti in numero basso) non è energeticamente favorevole nè per lo scambio ferromagnetico (per
la stessa ragione del caso precedente) nè per l’interazione dipolare a causa della scarsità di atomi
secondi, terzi, ect… vicini che interagirebbero mediante un’interazione a lungo raggio.
L’interazione di scambio è comunque la più importante ed anche la più forte.
E’ interessante studiare il comportamento di un sistema a doppio dominio come quello dell’Es.1
sotto l’azione di un campo magnetico esterno. Si verifica che il dominio avente magnetizzazione
parallela ad H risulta più esteso rispetto al dominio con magnetizzazione antiparallela. Il sistema
presenta magnetizzazione netta parallela alla direzione di H . Infine, lo spostamento della parete di
dominio in seguito all’azione di un campo esterno è dovuta al campo esterno stesso che porta ad
un’estensione del dominio con magnetizzazione parallela ad H . Tale spostamento si può bloccare a
causa di difetti reticolari. In figura è rappresentato lo spostamento della parete dalla posizione P alla
posizione P1 in un sistema a due domini. Al crescere dell’intensità di H nel tempo, se non si
verificano blocchi dovuti a difetti reticolari, il dominio di sinistra con magnetizzazione parallela ad
H aumenta di dimensioni a causa dello spostamento della parete verso destra, mentre quello di
destra, con magnetizzazione antiparallela ad H , si riduce sempre più. Si arriva alla fine del
processo di spostamento ad avere un singolo dominio con magnetizzazione parallela ad H in tutto il
sistema.
61
2.4 Ferromagnete semplice
In generale i sistemi magnetici sono interessanti, perché presentano transizioni di fase. Il tipo di
interazioni associate alle transizioni di fase sono quella di scambio e quella Zeeman esprimente
l’interazione del sistema con il campo magnetico esterno. Si devono considerare materiali a singolo
dominio, cioè sistemi sufficientemente piccoli affinché non si verifichi il fenomeno dei domini
magnetici. Un ferromagnete caratterizzato solo da interazione di scambio ed interazione con il
campo magnetico esterno si chiama FERROMAGNETE SEMPLICE. In un ferromagnete semplice
tutti i dipoli sono uguali, l’integrale di scambio è POSITIVO ( J > 0) ed a temperatura T = 0 i dipoli
magnetici sono tutti allineati fra di loro.
62
L’Hamiltoniana di un ferromagnete semplice ha la forma
H = − J ∑ μi ⋅ μ j − H ⋅ ∑ μi
⟨ ij ⟩
(2.5)
i
dove μi ( μ j ) è il momento di dipolo dell’atomo i-(j)-esimo ed H è il campo magnetico esterno. In
questo caso J ha le dimensioni di un’energia e si assume che anche H abbia le dimensioni di
un’energia, poiché il momento magnetico μi è assunto adimensionale. Il primo termine
dell’Hamiltoniana è il termine di scambio con interazione a primi vicini, mentre il secondo termine
esprime l’interazione con il campo (termine Zeeman). Se si pone J = 0 si ha un paramagnete
semplice.
Dal punto di vista classico il momento magnetico generico
μ
precede attorno ad H formando un
cono di precessione come disegnato in figura.
H ẑ
μz
μ
Dal punto di vista quantistico lo schema è simile, ma solo per gli autovalori (corrispondenti alle
frequenze dei modi normali calcolate classicamente) perché i vettori μ sono elevati al rango di
operatori e la componente z ( μ z ) del momento magnetico è quantizzata. Inoltre, gli autovalori sono
quantizzati secondo le regole della meccanica quantistica.
Esiste anche un modello semiclassico dove vengono considerati vettori μ la cui componente nella
direzione del campo è però ancora quantizzata. Essa è uguale a + μ0 se è parallela ad H , mentre
vale − μ 0 se è antiparallela. Anche se si parla di vettori e non di operatori si ha lo stesso una
quantizzazione della componente z del momento magnetico.
63
Per studiare la dinamica dei modi di spin nei sistemi continui (infiniti o confinati) si può seguire sia
l’approccio semiclassico che quello quantistico.
2.4.1 Diagramma di fase di un ferromagnete semplice
per H = 0
Il diagramma di fase del ferromagnete semplice disegnato in figura è individuato dalle variabili H,
T, M ed n dove H è il campo magnetico, T è la temperatura assoluta del sistema, M è la
magnetizzazione ed n il numero di moli che è considerato costante. Si ha che M = M(H,T), cioè la
magnetizzazione M dipende sia dal campo applicato H che dalla temperatura T e le tre grandezze
sono legate da una sorta di equazione di stato. Il sistema è scelto in modo tale che il campo
applicato sia lungo la direzione z, cioè H zˆ . La temperatura critica Tc è la temperatura in
corrispondenza della quale la magnetizzazione è nulla in assenza di un campo magnetico applicato e
segna il passaggio dalla fase ferromagnetica alla fase paramagnetica o viceversa (transizione di fase
ferromagnete↔paramagnete).
Si può individuare, per T < Tc, una linea di transizioni di fase del primo ordine ad H = 0. Se T = 0 ed
H è diretto lungo + ẑ si ottiene M = N / V μ (N è il numero di atomi e V il volume del sistema) che
rappresenta il valore massimo. Se invece H ha verso opposto si ottiene M = − N / V μ , valore
64
minimo. La transizione è quindi del primo ordine. Il vettore magnetizzazione è indicato in figura
con una freccia verso l’alto (per H positivo) e con una verso il basso (per H negativo). Quando la
temperatura sale alcuni dipoli iniziano a ruotare a causa dell’agitazione termica. Quindi, non si avrà
più il valore della magnetizzazione massima o minima. A T = Tc per H = 0 si ha una transizione
continua o critica e per questa ragione Tc prende il nome di punto critico. Anche a temperatura T
molto elevata non si può avere M = 0 quando H ≠ 0 , cioè in presenza di un campo esterno. Per T >
Tc e per H = 0 si ha M = 0.
In figura è disegnato l’andamento della magnetizzazione in funzione della temperatura per H = 0. Si
vede che per T < Tc la magnetizzazione è diversa da zero. Per T ≥ Tc la magnetizzazione è nulla.
Equivalentemente la curva della magnetizzazione per M <0 risulterebbe simmetrica rispetto all’asse
delle T e per T ≥ Tc risulterebbe anch’essa uguale a zero.
La classificazione delle transizioni di fase, di cui queste appena descritte fanno parte, verrà discussa
nel Capitolo “Transizioni di fase”.
M
Tc
T
65
2.5 Temperatura di Curie e legge di Curie-Weiss
La temperatura di Curie è la temperatura al di sopra della quale scompare la magnetizzazione
spontanea. E’ la temperatura critica che caratterizza la transizione di fase ferromagnete ↔
paramagnete in assenza di un campo esterno, cioè per H = 0. Separa quindi la fase paramagnetica
disordinata a T > Tc dalla fase ferromagnetica ordinata a T < Tc. Supponiamo che il sistema sia nella
fase paramagnetica caratterizzata da una magnetizzazione nulla. L’applicazione di un campo
magnetico esterno H provoca una magnetizzazione finita M . Conviene tenere conto dell’ipotesi
di Weiss del campo molecolare o campo di scambio H s , trattato equivalentemente ad un campo
magnetico esterno, secondo cui H s è proporzionale ad M , cioè H s = λ M dove λ è una costante
indipendente dalla temperatura. Questa ipotesi è a tutti gli effetti la prima ipotesi basata su una
teoria di campo medio. Quindi, in base ad essa, la magnetizzazione finita del paramagnete, dovuta
ad un campo esterno, genera a sua volta un campo di scambio. Se
χ è la suscettività del sistema,
tenendo conto del fatto che essa esprime la capacità di magnetizzazione di un sistema in risposta
all’applicazione di un campo, si può scrivere la seguente relazione scalare, cioè
M = χ (H + Hs )
dove si è incluso anche il campo di scambio.
Sostituendo ad H s la sua espressione in forma scalare si ricava χ = M / ( H + λ M ) . Si è già
ricavato che la suscettività di un paramagnete è data dalla legge di Curie secondo cui χ = C / T dove
C è la costante di Curie e T è la temperatura assoluta (cf. Eq.(1.15) ed Eq.(1.22)). Eguagliando le
due
espressioni
della
suscettività,
cioè
scrivendo
M /(H + λ M ) = C /T
si
ha
che
M T = C ( H + λ M ) . Portando il termine proporzionale alla magnetizzazione C λ M a primo
membro si ha che (T − C λ ) M = C H . Si ottiene quindi che M = C H / (T − C λ ) . Tenendo ancora
conto della definizione della suscettività nel caso in cui M dipende linearmente da H, cioè
χ = M / H si trova che
66
χ=
C
T − Cλ
La suscettività presenta una singolarità per T = Cλ ed è quindi infinita
( χ → ∞) .
A questa
temperatura e conseguentemente anche per temperature al di sotto di essa esiste una
magnetizzazione spontanea tipica di un ferromagnete. Infatti, se per T = Cλ la suscettività è infinita,
tenendo conto del fatto che la suscettività è anche espressa da χ = M / H si realizza la condizione
χ → ∞ con un valore di M finito, cioè con una magnetizzazione spontanea, in assenza di un campo
esterno H, cioè per H = 0 (infatti il limite di un numero finito (M) diviso per zero (H) è uguale
all’infinito). Si può quindi esprimere χ nella forma
χ=
C
;
T − Tc
Tc = C λ
(2.6)
Eq.(2.6) esprime la LEGGE di CURIE-WEISS dove Tc è detta temperatura di Curie o punto di
Curie e segna il passaggio dalla fase paramagnetica a quella ferromagnetica in assenza di campo
esterno. Essa rappresenta una temperatura critica. L’espressione trovata descrive abbastanza bene
l’andamento della suscettività poco al di sopra del punto di Curie. Tuttavia, calcoli più accurati
confermati da dati sperimentali mostrano che l’andamento della suscettività è χ ∝ (T − Tc )
−4 / 3
in
prossimità del punto di Curie. I principali elementi ferromagnetici hanno temperature di Curie
diverse. In particolare ad esempio per il ferro Tc = 1043 K , per il cobalto Tc = 1400 K , mentre per il
nichel Tc = 631 o K .
In modo analogo ai ferromagneti si può ricavare la suscettività e l’equivalente di una temperatura di
Curie per i ferrimagneti e per gli antiferromagneti. Per questi ultimi la temperatura al di sotto della
quale a partire da un paramagnete si ha un antiferromagnete (spin ordinati antiparallelamente) con
momento totale nullo è detta TEMPERATURA di NEEL. L’andamento della suscettività in
funzione della temperatura di un antiferromagnete semplice ha un comportamento più complesso
rispetto a quello del paramagnete semplice.
67