ElevaMente al Cubo

Carlo Dariol
STRUTTURA DELLA MATERIA
Modulo di Fisica della Materia Condensata
che si basa sugli appunti dei professori
Roberto Raimondi, del Dipartimento di Matematica e Fisica dell’Università RomaTre
e Luciana Di Gaspare, del Dipartimento di Scienze dell’Università RomaTre
Descrizione generale
Le applicazioni dell’elettricità e dell’elettronica sono presenti in moltissimi aspetti della
nostra vita quotidiana. Tali applicazioni sono possibili grazie a una comprensione
profonda e dettagliata delle proprietà elettriche dei solidi, in particolare dei metalli e dei
semiconduttori. In queste lezioni esamineremo gli aspetti generali sui quali si fonda la
nostra comprensione delle proprietà di conduzione elettrica nei solidi. Successivamente
ci soffermeremo su alcuni fenomeni importanti per le applicazioni tecnologiche come la
magnetoresistenza gigante in spintronica, la superconduttività e l’effetto Hall quantistico.
Il modulo è diviso in due parti.
La prima (tenuta dal professor Raimondi) si sviluppa su sei lezioni (sei capitoli)
che trattano delle proprietà di conduzione elettrica dei dispositivi, attraverso una
introduzione alla meccanica statistica classica e quantistica, al ruolo da essa giocato nello
sviluppo della meccanica quantistica, l’illustrazione della teoria della conduzione elettrica
basata sul modello classico di Drude, la descrizione degli stati elettronici nei solidi, il
fenomeno della superconduttività, l’effetto di magneto-resistenza gigante e l’effetto Hall
quantistico.
Nella seconda parte (tre lezioni tenute dalla professoressa Di Gaspare), che tratta
della Fisica dei Semiconduttori e alle Nanoscienze, si introducono le proprietà
fondamentali degli stati elettronici dei semiconduttori e i principi del loro impiego
nell’elettronica; quindi si introducono le nanoscienze, discutendo come le proprietà
fisiche dipendono dalla dimensionalità dei sistemi. Attraverso alcuni esempi rilevanti si
mostrerà come i progressi scientifici e tecnologici siano in questi ambiti altamente
interconnessi e versatili, producendo risultati innovativi in diversi campii quali ad
esempio l’ICT, la biomedica, i materiali.
1
PARTE I
MAPPA CONCETTUALE DELLE LEZIONI
Cap. 1 – La meccanica statistica
pag.
5
1.1. La teoria cinetica dei gas.
1.2. La distribuzione di Maxwell delle velocità in un gas di particelle classiche. Il metodo
combinatorio di Boltzmann.
1.3. Il metodo combinatorio applicato da Planck al problema della radiazione di corpo
nero. La formula di Planck.
1.4. L’emergere del concetto di fotone nella termodinamica della radiazione di corpo
nero. Il gas di fotoni.
1.5. Test ed esercizi
Cap. 2 – La teoria dei metalli
pag. 25
2.1. Il modello di Drude della conduzione elettrica nei metalli.
2.2. L’effetto Hall classico e sua descrizione nel modello di Drude.
2.3. La statistica quantistica di Fermi-Dirac e il gas di Fermi.
2.4. Approfondimento: il modello di (Drude–)Sommerfeld
2.5. Test ed esercizi
Cap. 3 – I livelli elettronici nei solidi
pag. 44
3.1. Il “solido” biatomico
3.2. Il solido unidimensionale
3.3. Il teorema di Bloch (il “cuore” della teoria dei livelli elettronici nei solidi)
2
3.4. La teoria delle bande
3.5. Appendice: Reticolo di Bravais. Reticolo reciproco. La zona di Brillouin (BZ).
Il teorema di Bloch e la serie di Fourier.
3.6. Test ed esercizi
Cap. 4 – La spintronica
pag. 64
4.1 Cos’è la spintronica? Alcune idee sui sistemi paramagnetici e ferromagnetici.
4.2. La fenomenologia dell’effetto di magneto-resistenza gigante (GMR).
4.3. Il modello di conduzione a due canali
4.4. Interpretazione e teoria dell’effetto GMR
4.5. Applicazioni. Cenni sull’applicazione dell’effetto GMR alle memorie magnetiche.
4.6. Test ed esercizi
Cap. 5 – L’effetto Hall quantistico
pag. 82
5.1. Fenomenologia dell’effetto Hall quantistico. Densità degli stati.
5.2. Livelli di energia di Landau per una particella in presenza di un campo magnetico.
5.3. Trattazione matematica
5.4. Stati di bordo e quantizzazione della resistenza di Hall.
5.5. Appendice: argomento di Laughlin
5.6. Test ed esercizi
Cap. 6 – La superconduttività
pag. 107
6.1. Significato della superconduttività. L’effetto Meissner di espulsione del flusso
magnetico da un superconduttore. 6.2. La teoria fenomenologia di London e (6.3.) la
natura dello stato superconduttivo. 6.4. La teoria della superconduttività. Cenni alla
teoria microscopica BCS della superconduttività.
PARTE II
C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana
Sommario parte II
pag. 130
Cap. 7 – Introduzione alla fisica dei semiconduttori
7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e
gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e
a temperatura finita in semiconduttori intrinseci.
3
7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore.
7.3. Concetto di lacuna
7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e
alla banda di conduzione.
7.5. Drogaggio e densità dei portatori dei semiconduttori.
7.6. Test ed esercizi.
Cap. 8 – I semiconduttori nell’elettronica
pag. 164
8.1. Drogaggio di tipo n e drogaggio di tipo p. Modello idrogenoide per le energie degli
stati elettronici di impurezze droganti. Densità dei portatori intrinseci e estrinseci in
funzione della temperatura. L’effetto Hall classico. Giunzione p-n all’equilibrio:
diffusione, regione di deplezione. Polarizzazione diretta e inversa della giunzione p n.
8.2. Il diodo.
8.3. I diodi LED, la scelta del materiale semiconduttore. Barriere Schottky .
8.4. Principi di funzionamento del transistor.
8.5. Test ed esercizi.
Cap. 9 – Nanoscienze e nanotecnologie
pag. 182
9.1. I principi delle nanoscienze.
Proprietà fisiche e dimensionalità: introduzione allo studio e alla manipolazione dei
materiali, dei dispositivi e dei fenomeni fisico/chimici su scala nanometrica
9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori.
Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune
Introduzione alle tecniche di imaging alla nanoscala.
9.3. Nanotecnologie.
Introduzione alle tecniche di fabbricazione per le nanotecnologie
9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici.
Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a
forza atomica (AFM)
9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e
delle nanoscienze. Cenni sul grafene.
9.6. Test.
4
PARTE I
Introduzione
In ultima analisi le proprietà elettriche dei solidi sono dovute alle cariche elettriche libere
di muoversi al loro interno.
Un solido è fatto di atomi, a loro volta composti di un nucleo e di elettroni. Come
vedremo più in dettaglio nel seguito, in un solido conduttore gli elettroni non sono
associati ad un particolare atomo. Piuttosto, gli elettroni sono liberi di muoversi da un
atomo all’altro e quindi di condurre una corrente elettrica.
Gli elettroni quindi si comportano come un gas di particelle che riempie tutto il
volume occupato dal solido. La descrizione del loro comportamento richiede quindi
l’utilizzo dei concetti della meccanica statistica e della teoria cinetica dei gas. Dobbiamo
quindi necessariamente partire da alcune idee fondamentali della meccanica statistica.
Nell’esaminare gli aspetti fondamentali della meccanica statistica ci renderemo
conto del ruolo fondamentale che hanno avuto nello sviluppo della meccanica
quantistica.
Capitolo 1
La Meccanica Statistica
1.1. La teoria cinetica dei gas
Il classico libro “Fisica atomica” di Max Born contiene un’eccellente esposizione del
ruolo della meccanica statistica nell’avvento della meccanica quantistica e la nascita della
fisica dei solidi. Si consultino in particolare i paragrafi 1-8, 55-58, 60-61
La teoria cinetica dei gas (T.C.G.) fu formulata per la prima volta da Daniel Bernoulli
(1700-1782) nel 1738 nel suo libro “Hydrodynamica”.
5
L’idea di base è quella mutuata dalla chimica, ovvero che la materia è fatta di costituenti
elementari semplici: li chiameremo atomi o molecole, che nel caso dei gas sono
costantemente in moto.
Bernoulli intende spiegare la pressione nei
termini dell’ipotesi atomica. Nella figura è
rappresentato in modo schematico un gas, fatto di
costituenti elementari, palline che si muovono
all’interno di un contenitore: le linee tratteggiate
rappresentano le traiettorie; le particelle rimbalzano
sulle pareti del recipiente come sulle pareti di un
biliardo.
L’idea di Bernoulli fu quella di ricondurre la pressione che il gas esercita sulle
pareti di un contenitore agli urti (elastici) che le molecole del gas compiono sulle
pareti del contenitore: questo è l’esempio di una riduzione meccanica di un
fenomeno termico: la temperatura è una misura dell’energia cinetica media.
Vediamo come si fa il calcolo della pressione
Consideriamo una parete (Wall) particolare del
contenitore, perpendicolare all’asse x.
Il gas è a sinistra della parete.
Consideriamo l’urto di una molecola che
impatta su tale parete. In un urto elastico la
componente della velocità parallela alla parete si
conserva, mentre cambia segno quella
perpendicolare.
In ogni urto la particella trasferisce alla
parete una quantità di impulso pari alla
differenza tra il suo impulso finale e quello
iniziale: p x  2mv x
In base alla seconda legge della dinamica di Newton, la forza esercitata sulla parete è pari
all’impulso trasferito per unità di tempo: f x 
p x
.
t
La forza esercitata è quindi dovuta all’effetto cumulativo degli urti che avvengono
nell’unità di tempo. Il numero degli urti è dato dal numero di molecole che nell’unità di
tempo vanno a collidere con la parete.
Le molecole interessate sono quelle che si
trovano in un cilindro (“cilindro collisionale”)
con asse perpendicolare alla parete di altezza
pari alla distanza percorsa nell’unità di tempo e
di base A
Calcoliamo il numero delle molecole contenute nel cilindro collisionale.
6
Numero molecole = densità x volume cilindro
N
  Av x t 
V 
Il numero delle molecole che vanno a sbattere è il numero degli urti.
Infine ricordiamo che la pressione è definita come la forza esercitata per unità di
superficie. Quindi dividendo per la base del cilindro otteniamo la pressione
N
N
P  2mv x v x  2mv x2
V
V
Per rendere il precedente argomento indipendente dal valore particolare della velocità,
possiamo considerare il valor medio della velocità. Per simmetria, valori positivi della
velocità sono ugualmente probabili. Inoltre, se assumiamo l’isotropia dello spazio, i
valori medi delle velocità sono uguali per le tre direzioni.
I valori positivi contribuiscono per metà: v x 
2
1 2
vx
2
Possiamo quindi generalizzare a tutte e tre le dimensioni dello spazio, che devono essere
1 2
v
3
1N
2E
m v2 
La pressione è proporzionale all’energia cinetica media: P 
3V
3V
2
2
2
equivalenti per l’isotropia dello spazio: v x  v y  v z 
La legge dei gas perfetti
Il comportamento sperimentale dei gas è descritto dalla legge di Boyle dei gas perfetti
secondo la quale la pressione e il volume sono inversamente proporzionali. Per una mole
di gas, il numero di molecole è pari al numero di Avogadro NA=6,022x1023.
N
PV  nmoli RT 
RT
NA
R = 8,314 J/(K mol) è detta costante dei gas.
Il significato della temperatura
2
3
Se confrontiamo l’espressione di Bernoulli ( PV  E ) con la legge di Boyle richiamata
sopra ( PV  nmoli RT ), otteniamo l’espressione della temperatura come una misura
dell’energia cinetica media:
2
2
N
2 E
R
E  nRT  E 
RT 

T
3
3
NA
3 N NA
Il rapporto tra la costante R dei gas e il numero di Avogadro definisce la costante di
Boltzmann kB:
7
2 E 2 mv 2
k BT 

3N 3 2
kB 
R
 1,3807  10  23 J  K 1
NA
Il teorema di equipartizione
La relazione tra energia cinetica media e temperatura rappresenta un caso particolare di
un teorema generale della meccanica statistica: il teorema di equipartizione:
E
3
N A k BT
2
Ogni grado di libertà ha, in media, un’energia pari a
1
k BT
2
Domande
1) Perché la pressione esercitata dalle molecole del gas dipende dal quadrato della velocità?
2) Qual è la definizione della costante di Boltzmann?
3) Cosa afferma il teorema di equipartizione?
1.2. La distribuzione di Maxwell
L’argomento di Bernoulli non spiega come si effettua la media. Per calcolare le medie in
meccanica statistica occorre qualcosa di più. Per questo Maxwell introduce il concetto di
funzione di distribuzione nello spazio delle fasi.
Qui sotto abbiamo una rappresentazione “pittorica” di un caso abbastanza semplice,
quello in cui le particelle si possono muovere in una sola direzione. La generalizzazione
al caso tridimensionale è tuttavia abbastanza facile.
Ogni puntino rosso indica una particella con date posizione e velocità. Questa
distribuzione di punti è quella che si chiama una “distribuzione nello spazio delle fasi”.
Per particelle che si muovono nelle tre dimensioni lo spazio delle fasi ha sei dimensioni.
8
Macrostati e microstati
La completa conoscenza del microstato del sistema corrisponde a sapere, a ogni istante,
la posizione e velocità di ogni particella (microstato). Una conoscenza statistica si
accontenta di sapere qual è il numero di particelle che hanno un determinato valore (o
intervallo di valori) della posizione e un determinato valore (o intervallo di valori) della
velocità, cioè di sapere come sono distribuite le particelle nello spazio delle fasi
(macrostato). Questo è lo stesso approccio delle società assicuratrici. La funzione di
distribuzione descrive quindi un macrostato.
Esempio: una particella A che ha velocità 5 e una particella B che ha velocità 10 sono un
microstato diverso da quello in cui A ha velocità 10 e B ha velocità 5… ma le due
particelle insieme, nel primo e nel secondo caso, individuano lo stesso macrostato: una
particella con velocità 5 e l’altra 10. I due microstati concorrono allo stesso macrostato.
Il numero di microstati che concorrono a formare lo stesso macrostato determinerà il
peso statistico di quel macrostato.
La distribuzione di Maxwell
La distribuzione delle velocità nello spazio delle fasi per quanto riguarda un gas fu
dedotta da James Clerk Maxwell (1831 – 1879) nel 1866, più di un secolo dopo il lavoro
pioneristico di Bernoulli.
Quella a destra è la distribuzione
delle velocità dell’ossigeno a diverse
temperature
Quella sotto è la formula che
Maxwell ricavò (e che tra poco
andremo a derivare) e dà il numero
di particelle che hanno velocità
compresa tra v e v+dv.
32
 m 
2  mv 2 2 k BT
 v e
f v   N 4 
 2k B T 
In tale formula compare il numero totale di particelle, N; compare la massa delle
particelle, m; e per quanto riguarda la velocità, compaiono due fattori con v2, una
potenza e un’esponenziale negativo. Il massimo della curva è in corrispondenza della
velocità più probabile.
9
Il parametro T (temperatura) fa cambiare forma alla curva.
Derivazione della distribuzione
La forma della distribuzione può essere ricavata, come fece Maxwell, con considerazioni
di simmetria basate sull’isotropia dello spazio. A tale scopo si fanno le seguenti
ipotesi:
1. la distribuzione della componente i-esima della velocità è identica per tutti gli i=x,y,z.
2. le distribuzioni per componenti diverse sono reciprocamente indipendenti;
3. la distribuzione della velocità totale dipende solo dal suo modulo.
La formulazione matematica di queste ipotesi è la seguente equazione funzionale,
evidentemente soddisfatta dalla distribuzione di Maxwell ricordando le proprietà della
funzione esponenziale:

g v x g v y g v z   G v x2  v y2  v z2

Dobbiamo determinare le funzioni g (distribuzioni delle singole componenti, tutte uguali
tra di loro per l’ipotesi 1.) e la funzione G (distribuzione delle velocità quadratiche in
modulo). A sinistra abbiamo il prodotto delle g quale conseguenza dell’ipotesi 2.
Prendiamo il logaritmo di entrambi i membri

lng vx g v y g vz   ln G vx2  v y2  vz2
e deriviamo rispetto a una delle variabili, ad esempio, rispetto a
 
 
g ' v x  G ' v 2

2v x
g v x  G v 2
ovvero

vx :
 
 
1 g ' v x  G ' v 2

2v x g v x  G v 2
Poiché i due membri dipendono da variabili diverse, devono essere uguali ad una stessa
costante. Integrando si ottiene la distribuzione di Maxwell.
Domanda - La funzione di distribuzione nello spazio delle fasi fornisce:
a. la posizione e la velocità di ogni singola particella a un dato istante.
b. la densità media di particelle che hanno una data velocità e una data posizione, a un dato istante.
c. la velocità media delle particelle ad un dato istante.
[La risposta corretta è la b.]
10
Arriva Boltzmann sulla scena
Nel 1872, ovvero sei anni dopo che Maxwell ebbe proposto la sua distribuzione delle
velocità, irruppe sulla scena Ludwig Boltzmann (1844-1906).
Per approfondire l’opera di Boltzmann è consigliata la lettura di The Man Who Trusted
Atoms, di Carlo Cercignani
Il programma di Boltzmann è quello di comprendere non solo la funzione di
distribuzione in equilibrio, ma come l’equilibrio viene raggiunto. I suoi ingredienti sono:
1. argomenti probabilistici;
2. grandi numeri;
3. condizioni iniziali.
All’epoca, l’uso delle probabilità in fisica non era così diffuso.
Riportiamo qui sotto un brano dello stesso Boltzmann in proposito.
“L’uso del calcolo delle probabilità in un caso particolare non può essere
giustificato in modo rigoroso… Nonostante ciò, ogni compagnia assicurativa fa
affidamento su di esso… L’assunzione che questi eventi rari non sono osservati in
natura non è strettamente dimostrabile (né lo è l’intera rappresentazione meccanica
stessa), ma alla luce di ciò che si è detto, è così naturale ed ovvio, e così in accordo con
tutta l’esperienza con le probabilità, . . . che nessun dubbio su questo punto può mettere
in discussione la validità della teoria quando risulta d’altronde così utile. È
completamente incomprensibile per me come si possa vedere una confutazione dell’uso
del calcolo delle probabilità nel fatto che qualche altro argomento mostra che delle
eccezioni devono presentarsi adesso e dopo un’eternità di tempo; infatti il calcolo delle
probabilità ci insegna esattamente questo.”
(Ludwig Boltzmann, Ann.der.Physik, 60,392 (1897))
Abbiamo accennato prima che diversi microstati concorrono a formare lo stesso
macrostato e quindi ne determinano il peso statistico. Come si calcola?
Peso statistico dei macrostati
1. Si divide lo spazio delle fasi in K celle. K è scelto arbitrariamente e opportunamente,
di caso in caso.
2. Ogni cella contiene un certo numero di particelle (immaginiamo di dividere il piano
cartesiano usato prima in celle).
3. L’insieme dei numeri di occupazione definisce un macrostato
4. Più microstati corrispondono a un macrostato
I riquadri verdi sono le celle, che abbiamo numerato in blu: 1, 2, 3, …, 14, …, 23, …, 30.
Osserviamo, ad esempio, che nel range di valori corrispondente alla cella 23 cadono 3
particelle.
11
N1, N2, …, Nk è un particolare macrostato… ovvero una maniera rapida per dare la
distribuzione delle particelle nello spazio delle fasi; nel caso sopra k=30 e il macrostato è
1, 1, 1, 1, 0, 0, 2, 0, 2, …, 3, 1, 2, 1, 1, 1, 2, 2.
I numeri appena scritti sono i numeri di occupazione. La loro somma è N=42
Il metodo combinatorio
1. Le proprietà fisiche dipendono dalla funzione di distribuzione dei numeri di
occupazione.
2. Il problema è di determinare quale scelta ha la maggiore probabilità di presentarsi
tenendo costante la somma dei numeri di occupazione.
3. Il problema è ridotto a un problema di calcolo combinatorio.
Vediamo qui sotto un esempio con numero di celle K=2 e numero totale di particelle
N=2. L’esempio è irrealistico ma serve a chiarire le idee; le due particelle le abbiamo
indicate con colori diversi per distinguerle: una blu e una verde.
Osservazione: il macrostato corrispondente a N=1 e N=1 può essere realizzato in due
microstati diversi e ha un peso statistico, W, doppio rispetto a quello degli altri
macrostati.
12
La distribuzione più probabile?
Il volume dello spazio delle fasi è ripartito in celle
K
   i
i 1
Le  i sono i volumetti delle singole celle.  rappresenta dunque la generalizzazione
dello spazio cartesiano visto prima (dove il “volume” delle celle era l’area delle celle).
Ad ogni cella i-esima corrisponde un’energia media associata al valore medio
dell’impulso nella cella
pi2
i 
2m
I vincoli da osservare
Il nostro scopo è determinare, tra tutte quelle possibili, la distribuzione più probabile,
compatibilmente con i vincoli dettati dalla legge di conservazione dell’energia e del
numero di particelle:
K
K
N   Ni
E   N i i
i 1
i 1
Spazio delle fasi a N molecole
Lo spazio delle fasi per N molecole è pari al volume dello spazio delle fasi di una
molecola elevato al numero totale delle molecole
N        ...    N
Dato un insieme di numeri di occupazione, cioè un macrostato, vogliamo
determinare quale volume occupa nello spazio delle fasi di N molecole.
Volume per una cella
Il volume nello spazio delle fasi di N particelle occupato dalle particelle in una data cella
si ottiene moltiplicando il volume della cella per se stesso tante volte quante sono le
particelle nella cella:
i  i  i  ...  i  i N
i
Tanto maggiore sarà questo volume (nello spazio delle fasi) tanto maggiore sarà il peso
statistico di tale macrostato.
13
Volume per tutte le celle
Il peso statistico nello spazio delle fasi a N particelle per una certa distribuzione è dato
prendendo il prodotto su tutte le celle
 iK1  iN i
Fattore combinatorio
Boltzmann osserva che il peso statistico di una certa distribuzione di numeri di
occupazione si ottiene infine moltiplicando il suo volume nello spazio per il numero di
modi possibili di ripartire le particelle tra le celle dopo aver fissato i numeri di
occupazione
N!
 iK1 N i !
[è l’analogo che calcolare gli anagrammi di una sequenza di lettere (macrostato):
scambiare di posto tra loro due lettere (microstati) uguali non fa variare la parola, cioè il
macrostato]
Scelti i numeri di un certo macrostato,
N i  
N!
Ni
K


i 1 i
 iK1 N i !
rappresenta il peso di quel macrostato.
Problema
Determinare per quale scelta dei numeri di occupazione il volume nello spazio delle fasi
N i  
N!
Ni
K


i 1 i
 iK1 N i !
è massimo con le condizioni
K
N   Ni
i 1
K
E   N i i
i 1
Boltzmann, usando la tecnica dei moltiplicatori di Lagrange per i massimi vincolati (α per
N e β per E), determina l’insieme dei numeri di occupazione che determina il massimo
del logaritmo del volume nello spazio delle fasi.
14
In meccanica statistica, poiché i numeri in gioco sono molto grandi (abbiamo a che fare
con un numero di Avogadro di particelle), è utile usare la formula di Stirling per
approssimare il fattoriale:
N!  2N N N e  N
per N>>1
Ci servirà anche l’approssimazione del Log (N!)
Log N!  NLog N   N
per N>>1
Dopo aver scritto la lagrangiana (funzione da massimizzare sommata ai vincoli, ciascuno
moltiplicato per un moltiplicatore di Lagrange) passiamo a calcolare le derivate parziali
rispetto a ciascuna delle variabili, ossia i numeri di occupazione Ni:

N i
K
K
K
 
iNi 






ln
N
!


N

N


E


N



  


i
i i  

N
!
i 1
i 1




  i 1 i 


N i


N i
 ln
 iNi

ln


N


N

i
i i

Ni
i 1 

K
K

 N
i
Ni
i 1

i ln

 N i  N i   i N i 
Ni

i
    i  0
L’ultima equazione ci dice che, per fissati valori dei vincoli, cioè per fissati valori di  i , è
determinato un particolare valore di N i .
Boltzmann dimostra, quindi, che la distribuzione con il maggior peso statistico
(cioè i numeri di occupazione N i che rendono massima il peso del macrostato) è:
 i
N i  Ce
con le costanti da determinare imponendo i vincoli.
N i dipende esponenzialmente dall’energia della cella i-esima corrispondente.
Esplicitando il moltiplicatore di Lagrange corrispondente (β) e ricordando che l’energia
della cella è l’energia cinetica media della cella, si ritrova che questa è proprio la
distribuzione di Maxwell, interpretandola però come la distribuzione che ha il
maggior peso statistico nello spazio delle fasi.
15
L’entropia secondo Boltzmann
Inoltre, Boltzmann definisce il logaritmo del volume nello spazio delle fasi come
l’entropia del macrostato:
S  ln Ni 
ovvero l’entropia termodinamica di un sistema è proporzionale al logaritmo del peso
statistico per una scelta di numeri di occupazione.
In questo modo si giustifica la seconda legge della termodinamica, secondo la quale un
sistema evolve verso stati di entropia maggiore che sono quelli a peso statistico
maggiore.
Questo collegamento tra entropia e peso statistico di un macrostato non è campata in
aria, ma è facilmente verificabile, almeno nel caso dei gas perfetti: se esplicitiamo il
peso statistico di un macrostato (riscrivendolo come una produttoria) e sviluppiamo il
logaritmo
Ni
i
i
i
i
S  ln N
  ln  
N!
N i   i
  i
ln
i   N i
i
 
  1
 
otteniamo l’espressione qui sopra. Se ora prendiamo le celle nello spazio delle fasi
arbitrariamente piccole (in modo da rendere continua la distribuzione (che è discreta)) la
sommatoria sulle celle diventa un integrale nello spazio delle fasi:
Ni
la
diventa la f v  di Maxwell, e la formula sopra diventa
i
V 
S    d vf v  ln f v   N ln 
 N  … e questa è esattamente la
3
dipendenza dell’entropia di un gas perfetto.
È utile concludere questo paragrafo citando le parole dello stesso Boltzmann sulla
numerosità degli STATI MAXWELLIANI:
“La distribuzione di Maxwell è caratterizzata dal fatto che la stragrande maggioranza
delle distribuzioni possibili ha le proprietà della distribuzione di Maxwell, e in rapporto a
questa maggioranza c’è un numero relativamente piccolo di possibili distribuzioni che
deviano in modo significativo da quella di Maxwell. Laddove Zermelo sostiene che il
numero di (micro)stati che infine evolvono verso un (micro)stato maxwelliano è piccolo
in rapporto all’insieme di tutti i possibili (micro)stati, io sostengo al contrario che la
16
stragrande maggioranza di (micro)stati sono maxwelliani e che il numero di quelli
che deviano dallo stato maxwelliano è incomparabilmente piccolo.”
(Ludwig Boltzmann, Ann. der Physik, 57, 773(1896) )
La distribuzione di Maxwell – Domande e test
1) Come si sposta il massimo della distribuzione delle velocità al variare della temperatura?
2) Qual è la differenza tra microstato e macrostato?
3) Qual è la definizione di entropia di Boltzmann?
4) Secondo la teoria proposta da Boltzmann, il peso statistico di un dato macrostato è dato:
a. dal numero di possibili microstati ad esso associati.
b. dal numero di particelle presenti.
c. dal numero di particelle che hanno una velocità prefissata.
[La risposta esatta è la a.]
1.3. La formula di Planck
In questo paragrafo vedremo il contributo dato dalla meccanica statistica alla meccanica
quantistica.
Il problema del corpo nero
L’esigenza di spiegare lo spettro di corpo nero segna la crisi della fisica classica, che
funziona solo alle basse frequenze. Il cuore del problema è la determinazione della
distribuzione spettrale della densità di energia della radiazione in equilibrio termico con
la materia. Planck considera il problema nella maniera più semplice possibile
schematizzando la materia come un insieme di oscillatori che, vibrando, emettono ed
assorbono radiazione. La novità del suo lavoro del dicembre del 1900 è di ricercare la
distribuzione di energia tra gli oscillatori utilizzando il metodo combinatorio di
Boltzmann, senza fare riferimento esplicito alle leggi dell’elettromagnetismo.
Le parole di Planck
“…a me oggi importa... di esporvi nel modo più chiaro possibile il vero punto centrale di
tutta la teoria, e ciò può avvenire nel modo migliore col descrivervi qui un nuovo
procedimento del tutto elementare, col quale, senza sapere alcunché di una formula
spettrale o anche di una qualsiasi teoria, è possibile calcolare numericamente la
ripartizione di una data quantità di energia nei singoli colori dello spettro normale con
l’aiuto di un’unica costante naturale, e poi con l’aiuto di una seconda costante anche la
temperatura di questa energia raggiante.”
Planck, Verhandlungen der Deutschen Physikalischen Gesellschaft, 2, 237(1900)
La seconda costante è quella di Boltzmann: è Planck a darle il nome con cui oggi è
conosciuta.
17
Formulazione del problema
A ogni frequenza dello spettro corrisponde un oscillatore che vibra alla stessa frequenza.
In equilibrio termico l’energia totale è ripartita tra la radiazione e la materia (oscillatori)
Etot  Erad  E1  ...  Ei  ...
E i = Energia degli oscillatori con particolare frequenza  i
N i = Numero di oscillatori con frequenza particolare  i
L’ipotesi di Planck
Determinare la distribuzione d’equilibrio significa conoscere la distribuzione dell’energia
tra gli oscillatori di diversa frequenza. Planck ipotizza che esista un’energia minima,
per ciascuna frequenza, posseduta da ciascun oscillatore
i
In tal modo ad ogni frequenza corrisponde un numero di pacchetti (celle nel
linguaggio di Boltzmann) di energia che devono essere distribuiti tra gli oscillatori di
quella frequenza
i 
Ei
i
Il calcolo combinatorio
Quanti sono i modi di distribuire gli  i pacchetti (le palline) tra gli N i oscillatori (le
scatole) con frequenza  i ?
o oo
ooo o
oo
In base al calcolo combinatorio tale numero corrisponde ai modi di ordinare le linee
rosse (che separano gli oscillatori) e le palline (i pacchetti). Nell’esempio in figura (dove i
pacchetti sono 9 e gli oscillatori sono 6), si deve intendere che al primo oscillatore spetta
un pacchetto, due toccano al secondo, zero al terzo, etc.
i 
N i  i  1!
i ! N i  1!
Confronto con Boltzmann
Nel caso classico (il conteggio di Boltzmann) si calcola come le particelle si
distribuiscono tra le celle dello spazio delle fasi. Il conteggio classico corrisponde, come
si ricorderà, a moltiplicare, nel caso di due particelle, il numero di stati a disposizione
della prima particella per il numero di stati a disposizione della seconda particella. In tal
modo si considerano come stati differenti quelli in cui sono particelle diverse ad
occupare lo stesso stato. Nel conteggio di Planck, che diventerà quello quantistico, si
calcola come le celle (pacchetti) dello spazio delle fasi si distribuiscono tra le particelle
(oscillatori). Nel far questo le particelle diventano “indistinguibili”, poiché perde senso
18
seguire il moto di ogni particella nello spazio delle fasi, ma è possibile solo dichiarare il
numero di particelle in una data cella nello spazio delle fasi.
Il limite classico
Si riottiene il caso classico quando il numero di stati a disposizione è molto maggiore del
numero degli oscillatori. Chiaramente, se l’energia di ogni pacchetto  i è presa
infinitamente piccola, il numero di stati  i diventa infinitamente grande.

N i  i  1! iN
i 

i ! N i  1!
Ni!
i
se N i  i
La distribuzione più probabile
Una volta stabilito il numero di pacchetti e quale sia il numero di modi in cui quel
numero di pacchetti si può dividere tra gli oscillatori, la tecnica di Planck è la stessa di
Boltzmann: stabilire il massimo di questa quantità.
Una volta stabilito qual è il peso relativo a una particolare scelta di pacchetti, Planck
segue Boltzmann nell’identificare l’entropia degli oscillatori col logaritmo del numero dei
modi di distribuire i pacchetti:
 
Si  N i k B 1  i
Ni

  i
 ln1 
Ni
 
 i i 
 
ln 
N
Ni 
i

Questa Si è l’entropia degli oscillatori con energia con frequenza i. L’entropia totale sarà
la somma su i.
In equilibrio l’entropia deve essere massima (facendo variare gli  i ); ancora una volta si
tratta di un problema di massimo vincolato e Planck ottiene, usando il metodo di
Boltzmann, il numero medio di pacchetti per oscillatore che rende massima
l’entropia:
i
Ni

1
e i  1
(qui β è un moltiplicatore di Lagrange e, come nel caso classico, acquista il significato
dell’inverso di una temperatura).
La formula di corpo nero
L’ultimo passo di Planck consiste nel mettere in relazione la densità spettrale di energia
della radiazione e l’energia media dell’oscillatore usando la teoria elettromagnetica
classica e prendendo l’energia dei pacchetti proporzionale alla frequenza dell’oscillatore iesimo.
8 i2 i 8 i2  i
u  i   3  i
 3
c
Ni
c e i  1
 i  h i
19
  k B T 1
8 i2
Il primo termine,
, viene dedotto con le leggi dell’elettromagnetismo classico ed è
c3
legato alla geometria del problema.
È dunque un ragionamento statistico che guida Planck verso la deduzione della legge
spettrale del corpo nero, che apre la strada alla teoria quantistica.
La formula di Planck – Domande e test
1) In che senso Planck segue il metodo combinatorio di Boltzmann?
2) Qual è la differenza tra il modo di conteggio degli stati di Boltzmann e quello di Planck?
3) Dove interviene, nel ragionamento di Planck, la teoria dell’elettromagnetismo classico?
4) Secondo la teoria di Planck del corpo nero, ad ogni frequenza dello spettro della radiazione è
a. associato un numero minimo di oscillatori che vibrano a quella frequenza, con costante di
proporzionalità pari al numero di Avogadro.
b. associato un numero minimo di oscillatori che vibrano a quella frequenza, con costante di
proporzionalità pari alla costante di Boltzmann.
c. associata un’energia minima proporzionale alla frequenza stessa, con costante di proporzionalità pari
alla costante di Planck.
[La risposta esatta è la c.]
1.4. Il gas di fotoni
Il concetto di “fotone” fu introdotto da Einstein cinque anni dopo il lavoro di Planck.
Anche lui intuisce, utilizzando un ragionamento termodinamico, una conseguenza
interessante del lavoro di Planck.
Planck aveva basato la sua distribuzione di pacchetti di energia esclusivamente sugli
oscillatori, ovvero sulla materia, e non aveva fatto alcuna ipotesi sulla radiazione. È
Einstein che fa un passo avanti fondamentale dando un significato fisico alla costante di
Planck.
Vediamo il ragionamento di Einstein.
La formula di corpo nero inversa
Consideriamo la legge di Planck nel limite di Wien, cioè alle alte frequenze o basse
densità di radiazione dove la teoria classica (legge di Raleygh-Jeans) non funziona:
8h 3 h
u  , T  
e
c3
k BT
Fissata la frequenza, questa formula può essere esplicitata rispetto alla temperatura
1
k B  c 3u 


ln
3 
T
h  8h 
20
Il ragionamento termodinamico di Einstein parte da una relazione generale
della termodinamica, che lega la derivata dell’entropia rispetto all’energia all’inverso della
temperatura. In base alla termodinamica, introducendo la densità spettrale di entropia s
in analogia alla densità spettrale di energia u, si ha la seguente generale relazione:
ds 1

du T
Si tratta ora di legare T a u. Usando la formula di Wien inversa e la relazione
termodinamica precedente,
k B  c 3u 
ds


ln
du
h  8h 3 
(quella sopra è un’equazione differenziale che si integra facilmente)
Einstein ottiene una relazione tra la densità spettrale di entropia e la densità
spettrale di energia (a meno di una costante di integrazione):
entropia della radiazione
s
kB
u ln u  u 
h
(mentre Planck aveva trovato l’entropia associata agli oscillatori nella materia).
Se adesso riesprimiamo la densità di energia in funzione dell’energia totale U divisa per il
volume V ( u  U V ), la relazione di Einstein implica la dipendenza dell’entropia della
radiazione dal volume
S 
kB  U
U

U  ln  1  k B
lnV
h  V
h

dove, nel passaggio finale, si è tenuto conto dell’unico termine che dipende dal volume:
l’entropia S è proporzionale a lnV. Quindi Einstein si ricorda che, per un gas perfetto,
descritto dalla distribuzione di Maxwell-Boltzmann, la dipendenza dell’entropia dal
volume è
S  k B N ln V
(dove N è il numero di molecole di un gas) indipendentemente dalle leggi che regolano il
moto delle molecole del gas.
Il concetto di fotone
Einstein propone allora di interpretare euristicamente la formula dell’entropia della
radiazione come quella di un gas di corpuscoli di energia o quanti di energia pari a
hν: il numero di tali quanti è N 
U
h
21
in modo che la formula diventi S  k B N ln V , la stessa dei gas perfetti.
Così come nel caso di Planck, è il ragionamento statistico che guida Einstein verso
l’introduzione dei quanti di radiazione, che diverranno i fotoni.
Gas di fotoni – Domande e test
1) Qual è la relazione termodinamica usata da Einstein per introdurre il concetto di fotone?
2) Qual è la dipendenza dell’entropia dal volume per un gas classico descritto dalla distribuzione di
Maxwell-Boltzmann?
3) Qual è la relazione tra energia e frequenza del fotone?
4) Einstein interpreta i risultati di Planck sul corpo nero:
a. assumendo che gli oscillatori armonici che rappresentano la materia abbiano energia hν
b. assumendo che la radiazione sia composta da particelle di energia hν.
c. assumendo che l'energia totale della radiazione divisa per hν dia il numero di oscillatori che oscillano
alla frequenza ν.
[La risposta corretta è la b.]
1.5. Test ed esercizi
La meccanica statistica – Domande conclusive
1) Che cosa s’intende per funzione di distribuzione?
2) Perché l’entropia di un gas non dipende dai dettagli delle leggi del moto?
3) Qual è stato il ruolo della meccanica statistica nella nascita della meccanica quantistica?
In base al calcolo combinatorio, qual è il numero di modi di 6 oggetti in 3 contenitori,
inserendo 3 oggetti nel primo contenitore, 2 nel secondo e 1 nel terzo?
a. 60
b. 720
c. 180
d. 120
e. 240
6 3 1
[La risposta corretta è     = 60.]
 3  2 1
In base al ragionamento combinatorio di Planck, quanti sono i modi di distribuire ω i=4
pacchetti di energia ϵi tra Ni=3 oscillatori?
a.
b.
c.
d.
e.
30
15
20
35
8
4  3  1
[La risposta corretta è 
 = 15.]

4

Quale delle seguenti affermazioni meglio descrive l'intento di Planck nel suo lavoro
fondamentale sullo spettro del corpo nero?
a. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia senza
utilizzare il metodo combinatorio di Boltzmann.
22
b. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando
solamente le leggi dell’elettromagnetismo.
c. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando
il metodo combinatorio di Boltzmann, senza fare riferimento esplicito alle leggi dell’elettromagnetismo.
d. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando
i metodi della meccanica quantistica.
e. L’intento di Planck è di ricercare la distribuzione di energia tra gli oscillatori della materia utilizzando
il metodo combinatorio di Boltzmann basato sulle leggi dell’elettromagnetismo.
[La risposta esatta è la c.]
In base al teorema di equipartizione, qual è l’energia media di un gas con N particelle?
a.
b.
c.
d.
e.
(3kBT/2)
(NkBT/2)
(3NkBT/2)
(6NkBT)
(3NkBT)
[La risposta esatta è la c. Si fa evidentemente riferimento a un gas monoatomico.]
Perché la pressione che un gas esercita sulle pareti del recipiente che lo contiene dipende dal
quadrato della velocità media delle particelle?
a. La dipendenza dal quadrato della velocità segue dall’uguaglianza tra energia cinetica ed energia
potenziale durante gli urti.
b. La dipendenza dal quadrato della velocità ha origine dal fatto che gli urti avvengono in modo
anelastico.
c. La dipendenza da vx2 ha origine dal prodotto di due fattori: (i) vx è la velocità prima di ogni urto; (ii)
(N/V)AvxΔt il numero di urti nel tempo Δt. In media si ha vx2 →⟨v2⟩/3
d. La dipendenza dal quadrato della velocità segue dalla conservazione del momento angolare durante
gli urti.
.e. La dipendenza da vx2 ha origine dal prodotto di due fattori: (i) 2mvx è l’impulso trasferito in ogni
urto; (ii) (N/V)Avx Δt il numero di urti nel tempo Δt. In media si ha vx2 →⟨v2⟩/3
[La risposta esatta è la e.]
In base al metodo delle celle nello spazio delle fasi introdotto da Boltzmann, a cosa
corrisponde la distribuzione di Maxwell?
a. La distribuzione di Maxwell corrisponde all’insieme più probabile di numeri d’occupazione che
soddisfano i vincoli ∑Ki=1Ni=N e ∑Ki=1ϵiNi=E
b. La distribuzione di Maxwell corrisponde all’insieme di numeri d’occupazione che soddisfano i vincoli
∑Ki=1Ni=N e ∑Ki=1ϵiNi=E
c. La distribuzione di Maxwell corrisponde all’insieme meno probabile di numeri d’occupazione.
d. La distribuzione di Maxwell corrisponde all'insieme meno probabile di numeri d'occupazione che
soddisfano i vincoli ∑Ki=1Ni=N e ∑Ki=1ϵiNi=E
e. La distribuzione di Maxwell corrisponde all'insieme più probabile di numeri d'occupazione.
[La risposta esatta è la a.]
Qual è il contributo di Einstein alla comprensione della densità spettrale della radiazione del
corpo nero?
a. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di
particelle con velocità data dalla distribuzione di Maxwell.
23
b. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di
corpuscoli di energia pari a mc2, dove c è la velocità della luce e m è la massa a riposo dei corpuscoli.
c. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di
corpuscoli di energia pari a 1/2 mc2, dove c è la velocità della luce e m è la massa relativistica dei
corpuscoli.
d. Einstein propose di interpretare la formula dell’entropia della radiazione come quella di un gas di
corpuscoli di energia pari ad hν, dove h è la costante di Planck e ν è il numero di occupazione medio
della cella con energia pari all'energia totale del gas.
e. Einstein propose di interpretare la formula dell'entropia della radiazione come quella di un gas di
corpuscoli di energia pari ad hν, dove h è la costante di Planck e ν è la frequenza della radiazione.
[La risposta corretta è la e.]
24
Cap. 2
Teoria elementare dei metalli
I primi tre capitoli del classico libro Solid State Physics di N. W. Ashcroft e N. D. Mermin
sono una delle migliori introduzioni alla teoria elementare dei metalli.
Argomenti di questo capitolo:
2.1. Il modello di Drude della conduzione elettrica nei metalli
2.2. L’effetto Hall e sua descrizione nel modello di Drude
2.3. La statistica quantistica di Fermi-Dirac e il gas di Fermi
2.1. Il modello di Drude
La scoperta dell’elettrone
Nel 1897 Joseph John Thomson a Cambridge mostra che i
raggi catodici emessi in un tubo a vuoto quando una differenza di
potenziale è applicata tra due placche metalliche, consistono in
particelle. Tali particelle, che trasportano l’elettricità, sono gli
elettroni. Thomson conclude inoltre che gli elettroni sono parte
degli atomi.
Il modello di Drude
Tre anni dopo (cioè nel 1900), Paul Drude propone un
modello per spiegare le proprietà di trasporto degli elettroni
nei materiali, in particolare la conduzione nei metalli.
Drude applica la teoria cinetica dei gas agli elettroni in
un solido, con l’aggiunta di alcune ipotesi.
In quel momento non sono ancora disponibili le teorie
quantistiche ma molti anni dopo si concluderà che
effettivamente gli elettroni all’interno di un metallo
costituiscono un gas.
Annalen der Physik 1, 566 e 3, 369 (1900)
25
Rappresentazione del modello
Qui sotto è rappresentato il modello di Drude: ci sono gli atomi (i punti neri) e gli
elettroni possono muoversi rapidamente tra di essi come le particelle di un gas all’interno
di un solido, ogni tanto urtando gli atomi.
Le ipotesi di Drude
1. Gli elettroni all’interno di un solido metallico costituiscono un gas di particelle di
massa m e carica unitaria negativa –e.
2. Gli elettroni si muovono liberamente tra una collisione e la successiva con gli ioni del
solido. La probabilità di collisione per unità di tempo è l’inverso del tempo medio τ tra
un urto e il successivo.
3. In analogia con la teoria cinetica dei gas, gli elettroni, attraverso gli urti, sono in
equilibrio termico con gli ioni del solido.
4. Come in un gas, gli elettroni raggiungono l’equilibrio termico attraverso le collisioni.
Formulazione matematica
In base alla legge fondamentale della dinamica, l’equazione del moto di un elettrone si
ottiene considerando la forza esercitata dal campo elettrico sulla carica. L’equazione per
la componente della velocità lungo la direzione del campo risulta quindi


dv
m
 eE
dt
Tra un urto e il successivo la velocità aumenta linearmente con il tempo essendo un
moto uniformemente accelerato, e la velocità che raggiunge l’elettrone tra un urto e
l’altro (tra i quali scorre un tempo τ) è
v
eE
m
26
Formula di Drude
La densità di corrente totale, cioè la corrente per unità di superficie, si ottiene
moltiplicando la velocità per la densità degli elettroni e per la loro carica. In tal modo si
ottiene una relazione lineare tra densità di corrente e campo elettrico
 eE
j  env  en 
 m
2
 e n
E  E

m

e 2 n

m
Significato della formula
Il modello di Drude è la prima spiegazione microscopica della legge
sperimentale scoperta da Georg Ohm nel 1827. La legge di Ohm connette il valore
della corrente elettrica al campo elettrico applicato tramite un coefficiente detto
conducibilità elettrica σ.
La formula per la conducibilità di Drude dipende dalla densità delle cariche (più densità
= più corrente) e inversamente dalla massa degli elettroni (dato che occorre accelerarli), e
dipende dal tempo tra due urti (meno urti = tempo medio tra due urti più lungo = più
corrente). Dalla misura sperimentale della conducibilità σ e conoscendo la massa
dell’elettrone si può stimare il valore del tempo tra due urti.
Stima del tempo tra due urti
  106  1 m 1
n  10 28 m 3 densità tipica di un solido
m  10 30 kg
e  10 19 Coulomb massa dell’elettrone
(sono considerati solo gli ordini di grandezza)
14
Usando la formula di Drude si ricava l’ordine di grandezza di   10 s . Il tempo tra
due urti è stato introdotto in modo fenomenologico.
La domanda è: possiamo stimare anche teoricamente l’ordine di grandezza di τ? Questo
può essere fatto, sempre nell’ambito della meccanica statistica, introducendo il concetto
di
Cammino libero medio
Ancora in analogia con la teoria cinetica, Drude utilizza il concetto di cammino libero
medio per caratterizzare gli urti con gli ioni. Per comprendere il concetto di cammino
libero medio, possiamo usare un argomento simile a quello usato per il calcolo della
pressione di un gas.
Numero di urti
Assumiamo che lo ione contro cui collidono gli elettroni abbia una certa sezione d’urto
S. Il numero di collisioni in un dato intervallo di tempo è dato dal numero di ioni in un
cilindro (il cilindro “collisionale”) di base pari alla sezione d’urto S e altezza pari alla
distanza percorsa nell’intervallo di tempo.
27
Se moltiplichiamo il volume di questo cilindro per il numero di ioni per unità di volume
presenti nel solido avremo una stima degli ioni che l’elettrone incontrerà nel suo
cammino, ovvero del numero di urti che lo interesseranno:
# urti  nioni vtS
Eliminando l’intervallo di tempo otteniamo gli urti in un secondo
# urti / sec ondo  nioni vS
Formula per il tempo tra due urti
Il cammino libero medio è dato dal prodotto della velocità per la probabilità di un
urto, che è l’inverso del numero di urti al secondo
l
v
v
1


# urti / sec ondo nioni vS nioni S
Il tempo tra due urti si ottiene dividendo l per la velocità media:

l
v
In base al teorema di equipartizione della meccanica statistica, possiamo esprimere la
velocità media in termini della temperatura (questo era quello che si poteva immaginare
al tempo di Drude).

l
1

v
nioni S
m
3kT
Stima del tempo tra due urti con la formula microscopica
Usando la formula appena trovata per fare una stima della grandezza trovata in
precedenza e considerando
S  1020 m 2 (sezione d’urto pari alla dimensione atomica)
nioni  1028 m 3 (densità tipica della materia)
8
Drude ricava un cammino libero medio pari a l  10 m
5
1
Stimando la velocità con la temperatura e la massa elettronica: v  10 ms trova infine
una stima di del tempo medio tra due urti pari a   10
quella stimata precedentemente.
Il modello di Drude funziona abbastanza bene.
28
13
s non molto diversa da
Domande e test
1) In quale aspetto il modello di Drude rappresenta un miglioramento della legge già scoperta da Ohm?
a. Permette di calcolare il valore della carica elettrica degli elettroni.
b. Stabilisce un legame di proporzionalità inversa tra campo elettrico applicato e corrente.
c. Fornisce una giustificazione microscopica della legge di Ohm.
2) Cosa s’intende per derivazione microscopica della legge di Ohm?
3) Come può essere spiegata la formula del cammino libero medio usando argomenti dimensionali?
4) Qual è il ruolo della meccanica statistica nel modello di Drude?
APPROFONDIMENTO Nel modello di Drude la velocità di deriva degli elettroni è
ricavata da un bilancio della quantità di moto; la particella risente del gradiente di un
potenziale elettrico ∇V (cioè di un campo elettrico e di un attrito viscoso (che dipende
dalla velocità media degli elettroni) caratterizzata da un coefficiente γ: la formula più
generale è dunque


dv
m
 qV   v dove
dt

v indica la velocità di deriva, m la massa efficace e q la carica
elettrica.

dv
 0 ) per questa equazione differenziale è
La soluzione stazionaria (per la quale vale
dt
 q
v 
V  V dove τ = m/γ è il tempo di rilassamento, e μ è la mobilità. La densità
m


di corrente è data da j  nq v dove n è la densità di elettroni per unità di volume.
Si può ricavare allora la legge di Ohm con conducibilità elettrica σ
 nq 2
j
V  V
m
Lo stesso modello può essere usato per ricavare la conduttività nel caso di un potenziale
elettrico alternato con frequenza angolare ω:    
0
1  i
Questo semplice modello fornisce una buona spiegazione per la conduttività in corrente
continua e alternata, l’effetto Hall e la conducibilità termica nei metalli. Inoltre spiega la
legge di Wiedemann-Franz del 1853. Tuttavia, sovrastima le capacità termiche dei
metalli. Benché il modello possa essere applicato anche a portatori positivi (lacune),
come dimostrato con l’effetto Hall, non predice la loro esistenza.
29
2.2. L’effetto Hall
Un miglioramento della comprensione della conduzione
elettrica nei metalli venne dalla scoperta dell’effetto Hall.
Nel 1879 Edwin Herbert Hall (durante il suo lavoro di tesi
in dottorato) scopre che tra i lati di un conduttore, (in
verde, sotto) percorso da corrente e immerso in un
campo magnetico costante, si genera una differenza
di potenziale perpendicolare alla corrente e al campo.
Am. J. Math.2, 287(1879)
Hendrik Antoon Lorentz fu tra i primi a comprendere che l’effetto
Hall può essere spiegato nell’ambito del modello di Drude
aggiungendo l’azione della forza (che porta il suo nome) di
Lorentz, esercitata da un campo magnetico su una particella carica
in moto.

 
F  qv  B
La forza di Lorentz spinge le cariche in direzione y creando il
potenziale trasverso.
La teoria dell’effetto Hall
Le equazioni del moto contengono l’effetto combinato dei campi elettrico e magnetico.
dv
m
m x  eEx  ev y Bz  v x
dt

m
dv y
dt
 eE y  evx B z 
m

vy
Nelle equazioni del moto abbiamo aggiunto un terzo termine proporzionale alla velocità
che è un termine di dissipazione che considera l’effetto degli urti analizzati prima (una
sorta di attrito viscoso che dipende dalla velocità).
Ricordiamo che la velocità può essere collegata alla corrente tramite la formula
i  nevA
30
La costante di Hall
Risolvendo le equazioni del moto in condizioni stazionarie (cioè indipendenti dal
tempo: a tale scopo è sufficiente uguagliare a zero i membri di sinistra delle equazioni,
cioè le derivate rispetto al tempo, ottenendo così un sistema lineare delle correnti in
funzione dei campi) si ottiene la relazione tra le correnti e i campi.
Posto quindi che la corrente trasversa sia zero, si ottiene l’espressione del campo
elettrico trasverso indotto

E x  cE y 
2
1   c 

cE x  E y 
jy 
2
1   c 
jx 
In queste due equazioni si è utilizzato il coefficiente di conducibilità
Drude, e si è introdotta
c 

introdotto da
eB
detta PULSAZIONE DI CICLOTRONE.
m
Quando il campo B è nullo (e la pulsazione di ciclotrone è nulla a sua volta) le densità di
corrente sono indipendenti l’una dall’altra e ciascuna dipende solo dalla componente
omologa del campo elettrico applicato: j x  E x e j y  E y .
Quando invece è presente un campo magnetico (diretto secondo z) le due equazioni
sono accoppiate e la soluzione del sistema porge (per Ey, ad esempio)

1
E y  j y  c jx


La teoria dell’effetto Hall consiste in questo: la corrente in direzione x produce un
campo elettrico in direzione y per effetto della forza di Lorenz che agisce sulle cariche, e
tale campo è quello che dà luogo alla differenza di potenziale trasversa osservata da Hall
Dl punto di vista sperimentale tale dipendenza è espressa dalla
COSTANTE DI HALL:
Ey  
 c
B

j x  RH j x

en
RH  
B
en
La misura della costante RH di Hall consente di misurare la densità elettronica.
Domande e test
1) Come è definita la pulsazione di ciclotrone?
2) Qual è la dipendenza della resistenza di Hall dal campo magnetico?
3) Come è collegata la resistenza di Hall al segno della carica elettrica?
4) Quali informazioni ci permette di ricavare la misura della costante di Hall?
a. Il campo magnetico microscopico prodotto dagli elettroni.
b. Il tempo medio tra un urto e il successivo.
c. La densità dei portatori di carica.
31
2.3. Il gas di Fermi
Funziona il modello di Drude?
Se combiniamo l’espressione della conducibilità elettrica derivata nel modello di Drude
1
e 2 n

e inseriamo l’espressione del tempo tra due urti  
m
nioni S
m
, otteniamo
3kT
un’espressione per la dipendenza in temperatura della stessa conducibilità
  T 1 2    T 1 2
Tale andamento non è però osservato. In modo simile al caso dei fotoni tale discrepanza
è da attribuirsi alla natura quantistica degli elettroni.
Le statistiche quantistiche
Abbiamo visto che Planck riesce a dedurre la legge del calore radiante modificando il
calcolo combinatorio di Boltzmann. Nel 1924 Bose ed Einstein estendono il calcolo
combinatorio di Planck anche a particelle con massa, diverse dai fotoni. Nasce dunque la
cosiddetta meccanica statistica quantistica. Nel 1925 al fine di spiegare le regolarità
degli spettri atomici, Pauli formula il suo principio di esclusione per gli elettroni: ogni
stato può essere occupato al più da un solo elettrone. Nel 1926 Fermi e Dirac derivano
la statistica per gli elettroni a partire dal principio di esclusione.
Analisi combinatoria
o
o
o
o
A causa del principio di esclusione, il calcolo combinatorio si riduce a calcolare il numero
di modi in cui scegliere un certo numero di stati occupati tra quelli disponibili in una data
cella. Nell’esempio il numero di stati occupati, corrispondenti alle particelle, è 4, mentre
6 è il numero degli stati nella cella. Quattro fermioni vanno a occupare quattro dei sei
posti a disposizione. Dal punto di vista dell’analisi combinatoria il problema si riduce a
calcolare in quanti modi si possono scegliere 4 oggetti da 6 disponibili.
i 
i !
N i ! i  N i !
è il numero generale di combinazioni possibili
32
LA STATISTICA DI FERMI-DIRAC
L’idea è ancora una volta quella di calcolare l’entropia come il logaritmo del numero
delle combinazioni possibili (attraverso la costante di Boltzmann quale fattore di
proporzionalità). Usando la formula di Stirling si ottiene:

N
S i  i k B ln1  i
 i
 
N
 ln1  i
  i
 Ni Ni 
 
ln 

i 
i

In equilibrio, come nel caso dei fotoni, l’entropia deve essere massima (anche qui
servono due moltiplicatori di Lagrange, perché, oltre all’energia, si conserva anche il
numero di particelle).
Il valore che rende massima l’entropia è:
Ni
i

1

e   i     1 dove i è l’energia del livello i-esimo
Il modo in cui uno stato è occupato dipende, in media, oltre che dall’energia, dalla
temperatura; ma vi dipende in maniera del tutto diversa da quella che era la statistica
classica di Maxwell e Boltzmann. Questa funzione (detta funzione di Fermi-Dirac) ha
questa caratteristica, che può variare tra 0 e 1; in altre parole: il valore medio statistico di
occupazione di uno stato in una cella non può mai essere superiore a 1.
Se ogni stato può essere occupato al più da una particella statistica, in media ogni stato
sarà occupato da un numero frazionario di particelle che vari atra 0 e 1.
Vediamo come varia questa funzione (di Fermi) alle varie temperature.
La funzione di Fermi
A temperatura
nulla, tutti gli stati
con energia
inferiore a una data
energia, detta
energia di Fermi,
sono occupati.
L’energia, in
ascissa, è appunto
espressa in unità di
Energia di Fermi.
L’energia del livello occupato più alto è l’ENERGIA DI FERMI.
33
Se T=0 la funzione di distribuzione assume una forma molto semplice: il valor medio di
occupazione è identicamente 1 per gli stati occupati ed è identicamente 0 per gli stati
vuoti (funzione a gradino nel grafico sopra; in ascissa l’energia in unità di Fermi).
Tramite la costante di Boltzmann introduciamo la TEMPERATURA DI FERMI
TF  EF k B
Anche la temperatura può essere definita in unità della temperatura di Fermi.
Definiremo d’ora in poi le temperature “basse” se sono basse rispetto alla temperatura di
Fermi, “alte” se sono alte rispetto alla temperatura di Fermi.
Si dice anche che il gas di Fermi si trova in uno stato degenere quando si trova a
temperature “basse”, ovvero in regime completamente quantistico.
Si vede allora che man mano che la temperatura sale la distribuzione si avvicina sempre
di più a quella classica.
Stati di impulso
Finora non abbiamo fatto nessuna ipotesi sulla natura degli stati. Adesso diciamo che
sono gli stati di una particella libera confinata in una scatola. Immaginiamo cioè di avere
un gas di fermioni confinato in una scatola di lunghezza L. Qual è la regola di
quantizzazione per particelle confinate in un segmento di lunghezza L? La lunghezza
d’onda è un sottomultiplo di L : n  L
(questo in tutte le dimensioni, anche se noi ci concentriamo su una dimensione).
Questa regola di quantizzazione si riflette anche sull’impulso attraverso la relazione di
De Broglie.
Utilizzando la regola di quantizzazione vista sopra otteniamo per l’impulso la seguente
relazione
p  k 
2


2
n
L
Somme integrali
In base al principio di Pauli, ogni elettrone occupa un diverso stato d’impulso. Bisogna
quindi sommare sugli stati d’impulso. Per lunghezze grandi rispetto a quelle
microscopiche si possono sostituire le somme con gli integrali. Esiste una tecnica ben
consolidata per trasformare delle somme in integrali: notando che tra un livello e l’altro
di una certa grandezza (in questo caso dei valori dell’impulso) c’è una certa differenza,
p 
2
L distanza tra un valore di impulso e il successivo
il trucco consiste nel fare in modo che in ogni regione di integrazione ci sia la stessa
densità di punti discreti in media che si avevano nella sommatoria
L’inverso del valore tra un impulso e l’altro è esattamente questa densità:
dp
dp
...   p ...  L  2 ...
n
34
Vediamo un esempio del suo utilizzo.
Se vogliamo scoprire, a temperatura T=0, quante particelle abbiamo, un numero
proporzionale al numero di stati occupati (per il principio di esclusione), dobbiamo
appunto calcolare il numero degli stati occupati. Ma calcolare il numero di stati occupati
vuol dire fare una somma sugli interi nx, ny ed nz… fino all’energia di Fermi.
Questa somma può essere trasformata in un integrale… ma siccome è una somma su tre
interi la possiamo far diventare un integrale triplo, cioè di volume:
In tre dimensioni bisogna fare un integrale di volume nello spazio tridimensionale degli
impulsi
d3p
...  V 
...

3
2 
nx ,n y ,nz
Tutti i valori dell’impulso corrispondenti a un’energia inferiore all’energia di Fermi si
trovano nella cosiddetta
SFERA DI FERMI,
individuata dalla condizione
px2  p y2  pz2
2m
 EF
(l’energia non dipende dalla direzione ma solo dal modulo quadro dell’impulso)
Tale sfera ha evidentemente RAGGIO rF  p x  p y  p z  2mE F
L’integrale all’interno della sfera di Fermi ci dà il numero di stati all’interno della sfera di
Fermi, ovvero il numero di stati che possono essere occupati, ovvero il numero di
fermioni.
DISTRIBUZIONI DI FERMI
2

f  p 
2
2
1
e
 p2

 

 2m 
 
1
è la distribuzione di fermioni in una scatola, ovvero il numero medio di elettroni con
impulso dato alla temperatura T; tale distribuzione di fermioni in una scatola
generalizza la distribuzione di Maxwell vista in precedenza. Si nota che alle alte
temperature, dove vale la meccanica statistica classica e dove il potenziale chimico μ
tende a un valore grande e negativo, l’esponenziale a denominatore diventando molto
più grande dell’addendo +1 (che quindi può essere trascurato) può essere portato a
numeratore, facendoci ritrovare così la distribuzione di Maxwell-Boltzmann. La statistica
di Fermi ad alte temperature riproduce la statistica di Maxwell.
35
A questo punto, scrivere l’espressione della densità di corrente (che dipende

dalla velocità) è molto semplice: non dobbiamo far altro che associare a uno staro di p
una corrente, ricordando che la velocità è legata a un certo impulso tramite

p m.
Sommiamo sugli impulsi e sulle due possibili orientazioni dello spin (dato che ogni stato
può essere occupato da due fermioni con spin opposto).
Ricapitolando:






f  p
distribuzione di Fermi, ossia numero di fermioni aventi un certo un
impulso alla temperatura T

p
m
è la velocità posseduta da tali fermioni (elettroni)
d3p
 2 3 numero totale di tutti gli stati
 e carica di un elettrone

p possibili
2 gli elettroni che possono occupare un certo stato, ciascuno con il suo spin;
La


j  ev N
diviene allora


d3p p 
j  2 e 
f  p
3
2  m
In equilibrio la corrente è nulla: infatti impulsi opposti sono equiprobabili e l’integrale

p
sulla grandezza vettoriale
diventa nullo. Una corrente è possibile se un campo
m
elettrico rompe l’isotropia dello spazio e rende più probabili gli stati di impulso di una
certa direzione piuttosto che della direzione opposta
La statistica quantistica di Fermi-Dirac completa quindi il modello di Drude dando vita a
quello che è conosciuto come
Modello di Sommerfeld (o di Drude-Sommerfeld)
Sommerfeld riprende il modello di Drude (che considera gli elettroni come un gas ideale
che obbedisce alla statistica classica) modificandolo con la statistica di Fermi-Dirac per
tener conto della natura quantistica degli elettroni.
Queste le ipotesi di Sommerfeld:
1. Gli elettroni all’interno di un solido metallico costituiscono un gas quantistico di
particelle di massa m e carica unitaria negativa –e.
36
2. In assenza di urti, gli elettroni occupano stati di impulso ben definito. Le regole della
meccanica quantistica consentono di calcolare la probabilità per unità di tempo che un
elettrone possa fare una transizione da uno stato di impulso a un altro.
3. L’inverso di questa probabilità è il tempo di collisione da usare nella formula di Drude.
Ora ci sono vari modi per calcolare questo tempo di collisione, ad esempio la regola di
Fermi, sulla quale però non ci soffermiamo. Ci interessa invece dare una
stima del tempo tra due urti per il gas di Fermi
20
S  10 m sezione d’urto (la stessa che nel caso classico)
nioni  1028 m 3 (T  300K )  1026 m 3 (T  4K ) (stessi numeri che nel caso classico)
2
l  108 m(T  300K )  106 m(T  4 K )
quello che cambia è che anziché usare la velocità classica (ricavata dal teorema di
equipartizione e che dava la sua dipendenza dalla radice quadrata di T) si usa la velocità
di Fermi, ovvero quella che possiede l’elettrone quando si trovi alla superficie della sfera
di Fermi, cioè al livello più alto occupato. Usando tale valore, che in un metallo è
v F  106 ms 1 , e facendo il rapporto tra l e vF , si ottiene
  1014 sT  300K   1012 sT  4 K 
dell’ordine di
Domande sul gas di Fermi
1) Come si tiene conto del principio di esclusione nella statistica quantistica di Fermi-Dirac?
2) Che cos’è l’energia di Fermi?
3) Qual è il ruolo della temperatura nella forma della funzione di distribuzione di Fermi-Dirac?
4) Come si passa dalla somma sugli impulsi all’integrale?
5) Ad alte temperature la meccanica statistica classica è in grado di descrivere in modo soddisfacente il
comportamento dei metalli. In quelle condizioni la distribuzione di Fermi-Dirac riproduce quella di
Maxwell, a causa del fatto che il potenziale chimico diventa...
a. grande in modulo e negativo.
b. grande in modulo e positivo.
c. pari a zero.
[La risposta corretta è la a.]
Domande sulla teoria dei metalli
1) Quali sono le ipotesi del modello di Drude per la conduzione elettrica nei metalli?
2) Qual è la relazione tra il modello di Drude e quello di Sommerfeld?
3) Cos’è la sfera di Fermi?
37
2.4. APPROFONDIMENTO: IL MODELLO DI SOMMERFELD
Il modello di (Drude–)Sommerfeld, pur essendo molto semplice, riesce a dare una
soddisfacente spiegazione della:
 conduttività elettrica;
 legge di Wiedemann-Franz che mette in relazione la conducibilità termica alla
conduttività elettrica;
 dipendenza dalla temperatura del calore specifico elettronico;
 dipendenza approssimativa dall’energia della densità degli stati;
 dell'energia di coesione dei metalli;
 cammino libero medio
Ipotesi del modello di Sommerfeld
Gli elettroni di valenza sono considerati completamente liberi e costituiscono a tutti gli
effetti un gas ideale di elettroni. Come nel caso di un gas ideale la interazione elettroneelettrone è completamente trascurata.
La struttura cristallina non è tenuta in considerazione. L’unico limite del modello è dato
dalla scatola cubica di lato L in cui sono contenuti gli elettroni.
La statistica a cui obbedisce tale gas quantistico è la statistica di Fermi-Dirac.
Modello stazionario
Consideriamo una scatola cubica di lato L dentro cui sono contenute N elettroni non
interagenti. Si può dimostrare che la forma della scatola modifica i risultati finali in
maniera irrilevante. Immaginiamo che il potenziale sia infinito all’esterno della scatola, di
conseguenza la funzione d’onda deve essere nulla all’esterno della scatola stessa. Se
scegliamo l’origine delle coordinate coincidente con un vertice del cubo e gli assi
cartesiani orientati come i suoi spigoli, la funzione d'onda soddisferà per ragioni di
continuità le equazioni:
ψ(0,y,z)=ψ(L,y,z)=0
ψ(x,0,z)=ψ(x,L,z)=0
ψ(x,y,0)=ψ(x,y,L)=0
La soluzione del problema è la combinazione lineare di onde piane viaggianti in direzioni


ik r

ik r

opposte:  x, y, z   A e  e
Tale equazione può essere riscritta come:
 x, y, z   2iAsinkx xsink y y sinkz z 
La necessità che vengano soddisfatte le condizioni al contorno richiede che le

componenti di k debbano assumere solo dei valori discreti:
kx = nx π/L
ky = ny π/L
kz = nz π/L
38
dove nx, ny ed nz devono essere numeri positivi ed interi. Non sono soluzioni possibili
quelle per cui anche uno solo degli ni è nullo: verrebbe infatti violato il principio di
indeterminazione in quella direzione.

Se noi disegniamo, nello spazio k , l’insieme dei punti-soluzioni del problema di N
particelle nella scatola cubica di lato L, otteniamo un reticolo cubico semplice di punti in
un solo ottante di tale spazio.
Allo zero assoluto ci si aspetta che siano occupati solo gli stati con minore energia
rispettando il principio di esclusione di Pauli. Il numero di elettroni nei solidi
macroscopici è molto elevato per cui se andiamo a disporre gli N elettroni negli stati

k
possibili riempiendo prima gli stati con
basso (bassa energia) e poi via via quelli con

k più elevato (grande energia), dato che il numero N è molto elevato si può trascurare

la discretizzazione degli stati. Nello spazio k gli stati possibili occupano i punti di un
reticolo cubico semplice. La distanza tra punti adiacenti di tale reticolo vale ovviamente:
a = π/L. Nei reticoli cubici semplici di parametro reticolare a, la densità dei punti

reticolari vale ovviamente n = a−3. Abbiamo che la densità dei punti nello spazio k vale:
  L 3 V
n k     3 dove V è il volume del cubo. Abbiamo calcolato tale densità di punti,

 
ma ogni stato può essere occupato da due soli elettroni a causa del principio di esclusioni
di Pauli, avendo gli elettroni un ulteriore grado di libertà interno dovuto allo spin
semintero. Quindi per ogni stato permesso alla funzione d’onda di un elettrone, ci sono
due stati elettronici, che corrispondono alle due possibili direzioni verso cui può puntare
il momento angolare di un elettrone.



V
Quindi la densità g k di stati elettronici nello spazio k vale: g k  2n k  2 3 .


Il significato fisico di g k (estendendo la sua definizione dallo spazio discreto a quello
 3
continuo) è che vi sono nel volume d 3 k un numero dn  g k d k di elettroni.
Possiamo determinare il raggio kF dell’ottavo di sfera contenente gli N elettroni del
metallo:
 1 4 3 Vk F3
Ngk
k F  2
83
3
Si noti come si faccia un errore, tuttavia trascurabile, includendo i punti sui tre piani
cartesiani. Dalla equazione si ricava che:









1
3
k F  3 N
Il raggio kF del settore sferico viene detto vettore d’onda di Fermi. Al contrario del caso
classico quindi gli elettroni in un metallo anche a temperatura bassissima hanno un vasto
range di valori di vettori d’onda e di conseguenza di energie cinetiche fino ad un certo
valore massimo dipendente soltanto dalla densità degli elettroni.
2
39
La scelta della condizione al contorno
a) Condizione al contorno nulla
La condizione data sulla funzione d’onda, che imponeva il suo annullarsi sulla superficie
del cubo, è nella pratica poco soddisfacente, infatti porta come conseguenza che le
soluzioni del problema siano onde stazionarie. Nei solidi macroscopici l’interazione degli
elettroni con gli estremi del solido è spesso trascurabile nei fenomeni di trasporto di
energia e carica: soluzioni quindi propagantesi descrivono meglio i fenomeni fisici di

interesse (tranne che per i k al limite della I zona di Brillouin… vedi appendice del
capitolo successivo, ma nel modello la periodicità del reticolo è trascurata). Le proprietà
generali di un solido macroscopico (è possibile dimostrarlo in maniera rigorosa) non
dipendono dalle condizioni al contorno.
b) Condizione al contorno periodica
Una scelta più soddisfacente delle condizioni al contorno è quella di una condizione al
contorno periodica, detta anche condizione al contorno di Born-Von Karman: si
immagina che ogni faccia del cubo sia unita alla superficie opposta, in maniera tale che
ogni elettrone che arrivi su una superficie non sia riflesso dalla superficie stessa, ma lasci
il metallo entrando di nuovo dalla faccia opposta. Una condizione di tale tipo impone
che la densità degli elettroni non vari lungo il solido. In tali termini la condizione sulla
funzione d'onda è del tipo:
ψ(x,y,z,t)=ψ(x+L,y,z,t)
ψ(x,y,z,t)=ψ(x,y+L,z,t)
ψ(x,y,z,t)=ψ(x,y,z+L,t)
Le soluzioni del problema sono in tale caso semplicemente delle onde piane:
 x, y, z, t   Ae 
 
i k  r t

La necessità che vengano soddisfatte le condizioni al contorno richiede che le
componenti di k possono assumere solo dei valori discreti:
kx = nx 2π/L
ky = ny 2π/L
kz = nz 2π/L
dove nx, ny ed nz devono essere numeri interi positivi o negativi, ma non tutti nulli. Nello

k
spazio
tali punti costituiscono un reticolo cubico. La distanza tra i punti del reticolo
cubico semplice degli stati permessi, è due volte più grande rispetto alla precedente

condizione al contorno. Quindi nello spazio k l’insieme dei punti-soluzione del
problema di N particelle nella scatola periodica di lato L è un reticolo cubico semplice di
punti di tale spazio, ma disposti simmetricamente intorno agli assi delle coordinate. Ma la

distanza tra i punti del reticolo nello spazio k normalmente non provoca nessun effetto
misurabile nei solidi macroscopici.
Tale condizioni portano alla stessa soluzione per quanto riguarda il vettore d’onda di
Fermi kF, raggio della sfera occupata. Infatti ripetendo i ragionamenti nel caso T = 0:
40




V
g k  2n k  2
2 3
Gli N elettroni andranno quindi a riempire una sfera di raggio kF (non più un ottavo di
 4 3 Vk F3
sfera): N  g k k F  2
3
3
che è la stessa equazione di quella derivata precedentemente. Quindi il vettore d’onda di
Fermi è identico con tale condizione al contorno. La regione nello spazio k permessa agli
stati di un elettrone è una sfera.

2.4. Test ed esercizi
Quale forza fornisce una spiegazione dell’effetto Hall?
a. La forza di Lorentz F=q B dove q è la carica di una particella in un campo magnetico B.
b. La forza di Lorentz F =q v⋅B dove q è la carica di una particella in moto con velocità v in un campo
magnetico B.
c. La forza di Lorentz F =q v×E dove q è la carica di una particella in moto con velocità v in un campo
elettrico E
d. La forza di Lorentz F =q v×B dove q è la carica di una particella in moto con velocità v in un
campo magnetico B
e. La forza di Coulomb esercitata dagli atomi del solido sugli elettroni che trasportano la corrente.
[La risposta esatta è la d.]
Qual è il numero di stati in cui possiamo accomodare 4 fermioni in 6 stati, in accordo con il
principio di esclusione di Pauli?
a.
b.
c.
d.
e.
(6+4−1)!/4!(6−1)!=126
64/4!=54
6!/4!(6−4)!=15
6!/4!=30
4⋅6=24
6
[La risposta esatta è   , cioè la c.]
 4
Perché in un gas di Fermi in equilibrio la corrente è nulla?


d3p p 
f  p  , dove f(p⃗) è
a. L’espressione della corrente è data dalla seguente formula: j  2 e 
2 3 m
diversa da zero solo per p⃗≠0.
b. In equilibrio gli urti confinano gli elettroni in una regione finita intorno ad un particolare atomo.


d3p p 
f  p  , dove f(p⃗) è
c. L’espressione della corrente è data dalla seguente formula: j  2 e 
2 3 m
la distribuzione di Fermi. Quest’ultima è isotropa e quindi l’integrale sulle direzioni di p⃗ produce un
risultato nullo.
41
d. A causa del principio di esclusione di Pauli, gli elettroni non possono muoversi tutti insieme nella
stessa direzione.
e. In equilibrio gli elettroni, che sono i portatori della corrente, sono fermi e quindi non possono
portare la corrente.
[La risposta esatta è la c.]
Che cos’è l’energia di Fermi?
a. In un metallo, l’energia di Fermi corrisponde all’energia media degli elettroni.
b. In un gas di Fermi, l’energia minima necessaria per eccitare un elettrone tramite l’assorbimento di
radiazione.
c. In un gas di Fermi allo zero assoluto, l’energia di Fermi corrisponde al massimo livello energetico
occupato.
d. In un gas di Fermi allo zero assoluto, l’energia di Fermi corrisponde al minimo livello energetico
occupato.
e. In un metallo, l’energia di Fermi corrisponde all’energia acquistata dagli elettroni tra un urto ed il
successivo.
[La risposta esatta è la c.]
Da quali caratteristiche di un solido metallico dipende il cammino libero medio degli elettroni
nel modello di Drude?
a. Il rapporto tra la sezione d’urto elettrone-ione, S, e la densità degli elettroni n, definisce il cammino
libero medio: l =S/n
b. Il prodotto della densità degli ioni, nioni per la sezione d’urto della collisione elettrone-ione, S, ha le
dimensioni di una lunghezza. Tale lunghezza definisce il cammino libero medio: l =(nioniS)
c. La sezione d’urto elettrone-ione, S, definisce il quadrato del cammino libero medio: l = √ S
d. L’inverso della radice cubica della densità degli ioni, nioni , definisce il cammino libero medio: l
=(nioni)−1/3
e. Il prodotto della densità degli ioni, nioni , per la sezione d’urto della collisione elettrone-ione, S, ha le
dimensioni dell’inverso di una lunghezza. Tale lunghezza definisce il cammino libero medio: l =(nioniS)−1
[la risposta corretta è la e.]
Qual è l’espressione della costante di Hall RH nel modello di Drude?
(B è l’intensità dell’induzione magnetica, n è la densità elettronica, e è la carica unitaria, m è la massa
elettronica, ωc, è la pulsazione di ciclotrone, τ il tempo di volo tra un urto e il successivo, σ la
conducibilità elettrica)
a. RH = (ne)/B,.
b. RH = −B/(ne)
c. RH = eB/m
d. RH = ne2B/m
e. RH = (ωcτ)/σ
[La risposta corretta è la b.]
Qual è la differenza tra i modelli di Drude e di Sommerfeld per la descrizione dei metalli?
a. Il modello di Sommerfeld modifica quello di Drude per tener conto della natura quantistica degli
elettroni. Entrambi si basano sul concetto di gas elettronico.
b. I modelli differiscono per il segno della carica elettronica.
c. Mentre il modello di Drude si basa sulla teoria cinetica dei gas, quello di Sommerfeld considera la
teoria degli spettri atomici.
d. A differenza di quello di Drude, il modello di Sommerfeld descrive gli elettroni come dipoli oscillanti
intorno alle posizioni d’equilibrio individuate dagli atomi del solido.
42
e. Nel modello di Drude la conducibilità dipende dagli urti tra gli elettroni e gli ioni; nel modello di
Sommerfeld invece vengono considerati gli urti degli elettroni tra di loro.
[La risposta corretta è la a.]
Che cos’è la sfera di Fermi?
a. Un dispositivo sperimentale metallico di forma sferica ideato da Enrico Fermi per misurare
l’elettricità statica.
b. In presenza di un potenziale a simmetria sferica, è il volume di spazio nel quale si trovato confinati
gli elettroni intorno a un atomo.
c. Il luogo geometrico degli stati elettronici con energia nulla.
d. Nello spazio tridimensionale degli impulsi, è il volume delimitato dalla condizione
(px2+py2+pz2)/(2m)≤EF, dove EF è l’energia di Fermi.
e. Nello spazio tridimensionale degli impulsi, è il volume delimitato dalla condizione
(px2+py2+pz2)/(2m)>EF, dove EF è l’energia di Fermi.
[La risposta corretta è la d.]
43
Cap. 3
I livelli elettronici nei solidi
Il capitolo 8 del libro Solid State Physics di N. W. Ashcroft e N. D. Mermin contiene un’approfondita
discussione del teorema di Bloch e della teoria dei livelli elettronici nei solidi.
3.1. Il “solido” biatomico
3.2. Il solido unidimensionale
3.3. Il teorema di Bloch (il cuore della teoria dei livelli elettronici nei solidi)
3.4. La teoria delle bande
3.5. Appendice. Reticolo di Bravais. Reticolo reciproco. Zona di Brillouin (BZ). Il
teorema di Bloch e la serie di Fourier.
3.6. Test ed esercizi
3.1. Il “solido” biatomico
Definizione di solido
Un solido è fatto di atomi, che si dispongono in modo ordinato. Ogni atomo occupa un
sito di un reticolo la cui forma è determinata dalla natura delle forze che tengono insieme
gli atomi. Un reticolo ideale si estende indefinitamente in tutte le direzioni. Un esempio è
un reticolo cubico (una serie di cubi l’uno accanto all’altro, di cui gli atomi occupano i
vertici; vogliamo sfruttare la simmetria del problema per ricavare delle informazioni).
Il problema della fisica dei solidi
Il problema della fisica dei solidi è di determinare i livelli elettronici a partire dal tipo di
reticolo cristallino considerato. In quest’analisi occupano un ruolo essenziale gli
argomenti basati sulle proprietà di simmetria del reticolo. Un solido esibisce un tipo di
simmetria traslazionale discreta, cioè sono equivalenti punti che differiscono di multipli
di vettori di traslazione caratteristici per un dato tipo di reticolo. Tali vettori sono detti
primitivi.
44
Perché il solido biatomico?
Il solido costituito da due soli atomi uguali è un modello irrealistico ma semplice e
istruttivo.
Atomi lontani: prima che il solido si formi possiamo pensare che ciascuno dei due abbia
un elettrone (informazione che vale a qualificarli come atomi di idrogeno); le funzioni
d’onda sono localizzate sui nuclei.
I due atomi sono identici: i due elettroni occupano stati diversi ma completamente
identici dal punto di vista energetico.
Secondo la meccanica quantistica, quando gli atomi sono lontani gli stati elettronici sono
quelli dei due atomi isolati. Ogni stato elettronico è quindi doppiamente degenere (i due
stati sono identici). Che succede ai due livelli atomici avvicinando i due atomi?
Ipotesi semplificatrici
Supponiamo che il problema atomico sia unidimensionale e che il potenziale atomico
sia simmetrico per inversione rispetto alla posizione dell’atomo. Assumiamo anche che la
funzione d’onda sia simmetrica rispetto alla posizione dell’atomo. Se l’atomo è posto
nell’origine assumiamo quindi che
Vatomico x   Vatomico  x 
il potenziale ha un andamento simmetrico rispetto
all’atomo
 atomica x    atomica  x 
Formazione del solido
Se i due atomi sono vicini le funzioni d’onda sono sovrapposte
Quando gli atomi sono a una distanza comparabile con quella dell’estensione spaziale
della funzione d’onda atomica, comincia a perdere senso attribuire un elettrone a un dato
atomo, dato che i due atomi condividono i due elettroni. La funzione d’onda stessa deve
45
essere ricalcolata tenendo conto dei due centri di attrazione. Le due funzioni d’onda
cominciano a sovrapporsi (ed è quello che tiene legati i due atomi). Entrambi gli atomi
possiedono entrambi gli elettroni, su due livelli separati.
Combinazione di orbitali atomici
Quando gli atomi sono vicini e le funzioni d’onda si sovrappongono, i nuovi stati
elettronici possono essere ottenuti come una combinazione lineare degli stati
corrispondenti alla situazione in cui gli atomi sono lontani. È l’idea alla base della
meccanica quantistica.
Concettualmente, la situazione è analoga al caso dell’esperimento della doppia fenditura
quando entrambe le fenditure permettono il passaggio delle particelle: la particella può
passare dall’una o dall’altra ma esiste anche lo stato in cui la particella passa per entrambe
le fenditure.
In questo caso, quando i due atomi sono vicini, ogni elettrone si troverà in uno stato che
è una combinazione degli stati che ci sono quando gli atomi sono isolati.
Come si applica il principio della combinazione lineare?
La generica combinazione avrà forma
  a 1  b 2
con a  b  1 (la funzione d’onda dev’essere normalizzata)
e con a e b appartenenti ai complessi. Inoltre a e b in modulo devono essere uguali
perché abbiamo preso due atomi identici e non c’è motivo di differenziare un atomo
dall’altro. Se a e b avessero modulo diverso questo indicherebbe una diversità dei due
atomi.
Poiché gli atomi sono identici i moduli dei coefficienti devono essere uguali, quindi
a b
2
2
1
e resta da esplicitare una fase per a e b.
2
1 ia

e  1  e ib 2
2


Poiché la funzione d’onda è determinata a meno di un fattore di fase (quello che
c’interessa è infatti il modulo quadro della funzione d’onda) possiamo considerare solo
la FASE RELATIVA, ovvero raccogliere (ed eliminare) e


1
 1  ei 2
2

i a
:
Vogliamo determinare la fase relativa. A questo proposito osserviamo che dobbiamo
aspettarci due possibili valori della fase, uno per ciascuno stato: infatti il numero delle
possibili combinazioni lineari deve essere pari al numero degli stati corrispondenti agli
atomi isolati. Per semplicità immaginiamo un problema unidimensionale. Le funzioni
d’onda atomiche sono identiche per i due atomi, ma localizzate in posizioni diverse
46



1
 atomica x  x0   ei atomica x  x0 
2
La funzione d’onda è la combinazione della funzione d’onda dell’atomo che si trova
centrato in  x0 e di quella dell’atomo che si trova in x 0 .
Uso della simmetria
Secondo la meccanica quantistica, operatori che commutano con l’operatore
hamiltoniano sono diagonalizzabili simultaneamente, ossia condividono con lui gli
autostati. Se l’operatore hamiltoniano è simmetrico per inversione, l’operatore di
inversione spaziale, detto operatore di parità, deve avere gli stessi autovettori
dell’operatore hamiltoniano. Poiché il quadrato dell’operatore di parità è l’identità, i suoi
autovalori possono essere +1 oppure –1, corrispondenti a funzioni d’onda simmetriche
o antisimmetriche.
Poiché il sistema dei due atomi è simmetrico per inversione rispetto all’origine, le
funzioni d’onda possibili devono essere simmetriche (S) o antisimmetriche (AS) rispetto
a un cambiamento di segno della variabile spaziale. Questa richiesta è sufficiente a
determinare i possibili valori della fase relativa:
S  x   S x   S  0
AS  x   AS x    AS  
Dimostrazione:
usando il fatto che la funzione d’onda atomica è simmetrica o antisimmetrica nel suo
argomento
1
 atom  x  x0   ei atom  x  x0  
2
1
 atom x  x0   ei atom x  x0  

2
ei

 atom x  x0   e i atom x  x0  
2
 x  x    0
 x  x    
  x  

Se
Se

Ora vogliamo capire come le due combinazioni (simmetrica o antisimmetrica) sono
legate all’energia dei due stati.
47
Nel primo caso (  x   x     0 ) la funzione d’onda (simmetrica) è detta
“legante” e non ha zeri.
Nel secondo caso (  x  x     ) la funzione d’onda (antisimmetrica) è
detta “antilegante” e ha uno zero a metà della distanza tra i due atomi
Energie dei livelli “legante” e “antilegante”
Dalla meccanica quantistica sappiamo che più la funzione d’onda presenta oscillazioni e
maggiore è l’energia associata.
L’energia del livello antilegante, la cui funzione d’onda ha un nodo (uno zero) è
superiore a quella del livello legante in accordo con le regole generali della meccanica
quantistica.
L’idea di legare i livelli di energia agli zeri della funzione d’onda è una delle idee
importanti nel determinare i livelli elettronici degli elettroni nei solidi.
Il “solido” biatomico – Domande e test
1) Qual è il ruolo della simmetria nel determinare la funzione d’onda del “solido” biatomico?
2) Perché una funzione d’onda con un nodo ha un’energia maggiore di una funzione d’onda senza
nodi?
48
3) Quali sono i due soli valori possibili per la fase relativa tra le funzioni d’onda di singolo atomo nel
modello del solido biatomico? A cosa corrispondono?
a. +1 e -1, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei
due atomi.
b. +1 e 0, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei
due atomi.
c. 0 e π, e corrispondono a funzioni d’onda simmetriche o antisimmetriche per il sistema dei
due atomi.
3.2. Il solido unidimensionale
La simmetria del solido
Un solido è costituito da una disposizione regolare di atomi. Consideriamo ad esempio il
caso unidimensionale dove N atomi sono disposti a una distanza a, detta passo
reticolare, l’uno dall’altro. Nel caso illustrato il solido è lungo L=Na.
Come termina il solido? Di solito, se si vuole analizzare come si comporta un solido non
interessa sapere quali sono i particolari effetti di superficie o di bordo. Supponiamo
allora che il sito N-esimo sia collegato, idealmente, al sito 1 in modo da realizzare
condizioni al contorno periodiche (è come se gli atomi fossero equispaziati lungo una
circonferenza).
Qual è la simmetria che vogliamo sfruttare in questo caso? Non la simmetria per
inversione, ma la simmetria dell’invarianza traslazionale.
La particolare simmetria del solido, rispetto a quella della molecola biatomica considerata
in precedenza, consiste nel fatto che ogni sito è equivalente a tutti gli altri. In particolare
la relazione tra il valore della funzione d’onda al sito i e quello della funzione
d’onda al sito i+1 è sempre la stessa per tutti i siti.
  xi1   ei  xi 
Non ha importanza quale sia il fattore di fase relativo, quello che preme è osservare che
tale fattore di fase relativo per un sito e per il successivo è sempre lo stesso: se così non
fosse una particolare coppia di siti consecutivi si distinguerebbe dalle altre.
L’identificazione del sito 1 con il sito N+1 determina l’equazione per i possibili valori
della fase relativa
 xN 1    xi   eiN xi 
49
relazione ottenuta applicando N volte la relazione in alto. Questo ci dice che
eiN  1
i valori permessi della fase relativa sono le radici N-esime dell’unità
n 
2
n con n = 0, 1, …, N – 1
N
Se N = 2 ritroviamo i due valori di fase del “solido” biatomico, caso particolare del
solido unidimensionale.
Il valore di n compreso tra 0 e N – 1 determina la funzione d’onda del solido.
Quando n = 0 (e quando n = N) la funzione d’onda è in fase in tutti i siti atomici
n0 x    atom x    atom x  a    atom x  2a   ...
Quando n = 1 la differenza di fase tra un sito e il successivo è pari all’angolo giro diviso
per il numero di siti:
2
N
n1 x    atom x   e  atom x  a   e
i
i
2
2
N
 atom x  2a   ...
Data una scelta della fase relativa tra due siti, ad essa possiamo associare una lunghezza
d’onda.
Nel caso n = 1 possiamo dire che la lunghezza d’onda della variazione di fase tra un
sito e il successivo è pari al passo reticolare moltiplicato per il numero dei siti
1  Na
Il VETTORE D’ONDA è definito dal reciproco della lunghezza d’onda moltiplicata
per l’angolo giro
k1 
2
Na
Classificazione delle combinazioni
il base al numero n che determina la fase relativa, e quindi λ e quindi k, (ogni k determina
quindi una fase relativa) possiamo classificare le diverse funzioni d’onda
Possiamo quindi classificare le diverse combinazioni delle funzioni d’onda atomiche in
base al loro vettore d’onda:
2
n , e indicato il sito i-esimo con xi  i  1a i = 1, …, N
detto k n 
Na
ikn xi
ogni fattore di fase diventa e
.
Una particolare funzione d’onda riferita a una particolare scelta di fase relativa che
identifica un particolare vettore d’onda può allora essere scritta
50
N
kn  x    e ikn xi atom  x  xi 
i 1
Nei grafici sotto abbiamo preso una funzione d’onda gaussiana (simmetrica rispetto al
sito) combinata con diverse fasi relative (per un solido lungo L=10 a.)
N = 10.
n = 0, 1, 2, …, 9
La parte reale per
n = 0 (blu)
non ha zeri
n =1 (gialla)
ha 2 zeri
n =2 (verde)
ha 4 zeri
La parte reale per
n = 3 (blu)
ha 6 zeri
n =4 (gialla)
ha 8 zeri
n =5 (verde)
ha 10 zeri
Si noti che in funzione dell’n scelto (e quindi del relativo vettore d’onda k) varia il
numero degli zeri della funzione d’onda. All’aumentare di n dapprima il numero degli
51
zeri aumenta… ma all’aumentare ancora il numero n il numero degli zeri comincia a
diminuire.
n = 6 (blu)
ha 8 zeri
n =7 (gialla)
ha 6 zeri
n =8 (verde)
ha 4 zeri
n =9 (ocra)
ha 2 zeri
In questo esempio n = 10; per n = 10 si ottiene la stessa funzione che per n = 0.
Relazione di dispersione
Il valore del vettore d’onda determina il numero di nodi della funzione d’onda e quindi la
sua energia. In questo modo a ogni valore del vettore d’onda corrisponde un valore
di energia, determinando la cosiddetta
RELAZIONE DI DISPERSIONE dello spettro elettronico del solido
E k n 
Esempio: per una particella libera
 2k 2
E k  
2m
l’energia è crescente in funzione di k, e cresce sempre all’aumentare di k (cioè di n).
Nel caso di un solido invece
52
Il numero di zeri (asse y) è periodico con n che varia da 0 a 9. Quindi l’energia (che
dipende dagli zeri) è una funzione periodica del vettore d’onda (asse x). Questa
periodicità è immagine della simmetria del solido.
Il solido unidimensionale – Domande
1) Qual è la condizione di periodicità imposta alla funzione d’onda di un solido unidimensionale?
2) Qual è il numero quantico che classifica gli stati elettronici di un solido unidimensionale?
[risposta: il vettore d’onda kn]
3) Cosa viene fornito dalla relazione di dispersione?
a. La dipendenza funzionale dell’energia dal valore del vettore d’onda.
b. Il tipo di simmetria del reticolo cristallino.
c. Il numero di zeri della funzione d’onda.
[La risposta corretta è la a.]
3.3. Il teorema di Bloch
Osservazione
Risulta utile introdurre la seguente funzione uk(x) in termini di combinazioni di funzioni
d’onda atomiche (k è numero d’onda che dipende dalla scelta della fase relativa.) Tale
funzione è periodica nella variabile x con periodo pari al passo reticolare a.
N
u kn  x    e ikn  x xi  atom  x  xi  ,
i 1
xi  i  1a ,
kn 
2
n
Na
funziona d’onda atomica moltiplicata per un fattore di fase il cui argomento nella x è lo
stesso della funzione d’onda.
xi  i  1a è la posizione del sito i-esimo.
La periodicità di u k  x  di periodo a [ovvero tale che u k  x  a   u k  x  ] può essere
Ricordiamo che
n
n
n
dimostrata sfruttando le condizioni periodiche al contorno del nostro reticolo
unidimensionale. Tale dimostrazione viene lasciata come esercizio.
53
Il teorema di Bloch
In termini della funzione uk(x) è possibile riscrivere la funzione per uno stato elettronico
del solido unidimensionale nella forma di un’onda piana modulata da una funzione
periodica con la periodicità del reticolo. Tale forma costituisce un caso particolare del
cosiddetto teorema di Bloch, che può essere espresso quindi nella forma seguente:
kn x   eikn x ukn x 



con ukn x  a  ukn x
Il teorema può essere dimostrato in generale mediante la teoria delle serie di Fourier.
(per la dimostrazione vedi l’appendice al capitolo 3.)
Il significato del teorema di Bloch
Il teorema di Bloch ha un significato profondamente connesso con la simmetria del
cristallo. Mentre nello spazio vuoto la simmetria traslazionale porta alla conservazione
dell’impulso i cui autostati sono le onde piane, nel cristallo la simmetria traslazionale è
discreta e porta alla conservazione del momento cristallino k (che quindi è definito
come numero quantico) che classifica i livelli elettronici in presenza di un potenziale
periodico. Questi livelli hanno la forma di un’onda piana ulteriormente modulata
da una funzione periodica uk(x). Tale funzione ha il compito di “pesare” l’ampiezza di
probabilità in relazione ai punti di minimo e massimo del potenziale periodico (in altre
parole: quando l’elettrone transiterà vicino ai nuclei sentirà un’attrazione più forte che
non quando transiterà lontano da essi).
Bloch sviluppò il suo teorema durante il suo lavoro di
dottorato. Questo è quello che concluse:
Felix Bloch (1905 – 1983)
Stanford University
‘When I started to think about it, I felt that the main
problem was to explain how the electrons could
sneak by all the ions in a metal…. By straight
Fourier analysis I found to my delight that the wave
differed from the plane wave of free electrons only
by a periodic modulation’
F. BLOCH
Conseguenze per il modello di Drude (-Sommerfeld)
A questo punto possiamo tornare un momento al modello di Drude per sottolineare che
la principale sorgente che causa le collisioni degli elettroni non sono gli ioni disposti
ordinatamente. Un reticolo ordinato di ioni non cambia il vettore d’onda, provoca una
modulazione di ampiezza. L’effetto globale degli ioni è inglobato in questa modulazione
periodica. Nell’urto ci aspettiamo che un’onda piana con un certo vettore d’onda venga
modificato in un’altra onda piana con diverso vettore d’onda (un impulso viene cambiato
54
in un altro impulso), in base al teorema di Bloch questo non può accadere. Il vettore
reticolare di Bloch non è cambiato dalla presenza degli ioni. Eppure il modello di Drude
dà delle predizioni confrontabili con l’esperienza: le collisioni col reticolo non sono
un’astrazione… Come si spiegano? Le dobbiamo imputare alle imperfezioni del
reticolo.
Se nel reticolo sono presenti imperfezioni (se ad esempio manca un atomo nel reticolo, o
è presente un atomo di una specie diversa, oppure…), che rompono la simmetria del
reticolo, allora il vettore d’onda cristallino non è più un buon numero quantico.
Concludiamo dunque che il tempo medio τ tra due urti successivi e, conseguentemente,
il cammino libero medio l in un metallo sono determinati dalle imperfezioni del reticolo:
per calcolare τ o l non dobbiamo più prendere la densità degli ioni del reticolo ma la
densità delle imperfezioni.
Questo è stato anche un suggerimento per migliorare le proprietà di conduzione di un
metallo: per costruire il metallo più conduttore possibile dobbiamo costruire un metallo
col minor numero di imperfezioni possibile (cosa che può essere realizzata con una serie
di tecniche che non interessa qui raccontare).
Il teorema di Block – Test e domande
1) Secondo il Teorema di Bloch, la funzione d’onda elettronica per un solido (unidimensionale) può
essere scritta nella forma
kn x   e ikn x u kn x  , con u tale che uk x  a  uk x, mentre a è il
n
n
passo reticolare. Qual è il ruolo della funzione u ?
a. Quello di tener conto della relazione di dispersione tra il vettore d’onda cristallino e l’energia dei
livelli.
b. Quello di modulare l’onda piana con una funzione che ha la stessa periodicità del reticolo.
c. Quello di inserire un numero opportuno di zeri nelle funzioni d’onda elettroniche per
individuare i vari livelli energetici.
[La risposta corretta è la b.]
1) Che cosa afferma il teorema di Bloch?
2) Mostrare la proprietà uk(x+a)=uk(x).
3.4. La teoria delle bande
Estensione a tre dimensioni
Il ragionamento fatto per il solido unidimensionale può essere esteso a qualunque solido
con le seguenti modifiche:
1. vi è un vettore d’onda per ogni direzione spaziale: nello spazio tridimensionale
avremo kx ky kz .
2. vi sono infiniti orbitali atomici per ogni sito e quindi l’orbitale localizzato su ogni
sito è, in generale, una combinazione lineare degli orbitali atomici dell’atomo: dovremo
calcolare la combinazione lineare di funzioni d’onda centrate su atomi diversi e funzioni
d’onda che coinvolgono più orbitali dello stesso atomo. Il problema diventa
estremamente complesso (e lo è: la teoria delle bande è una specializzazione in fisica
55
dello stato solido, per farlo bisogna essere dei professionisti del settore… anche se tali
idee più raffinate oggi possono essere sviluppate tramite calcolatore); ma le idee di base
restano le stesse.
Infine:
3. un solido può essere formato da più di un tipo di atomo.
Le funzioni d’onda e i livelli elettronici nei solidi sono quindi classificati da tre vettori
d’onda kx ky kz e un indice di “banda” n che si riferisce al tipo di orbitale localizzato
En k x , k y , k z  (avremo quindi 4 numeri quantici per definire una banda n)
I livelli con lo stesso valore di n formano appunto una banda di energia permessa
(i livelli sono in realtà discreti ma così fitti da formare una BANDA), mentre i valori di
energia non appartenenti a nessun valore di n individuano le gap di energia
Vediamo qui sotto le bande di energia per il silicio.
Sull’asse x è rappresentato il vettore d’onda: le varie lettere sono un modo per indicare
come ci si muove nello spazio k nelle varie direzioni; le linee continue sono i livelli
energetici in funzione del vettore d’onda; quella che vediamo è cioè l’estensione al caso
n-dimensionale del caso unidimensionale del solido biatomico, dove vi erano unicamente
due linee; qui le linee sono tante e molto fitte da dar vita a delle bande.
Si noti la BAND GAP, un intervallo di energia in cui non ci sono livelli (gap =
mancanza)
56
Stato fondamentale di un solido
Per gli elettroni vale il principio di esclusione di Pauli, in base al quale i livelli disponibili
sono riempiti al più da un solo elettrone. Lo stato fondamentale della configurazione
elettronica di un solido si ottiene quindi occupando (a temperatura T=0K) tutti i
livelli elettronici a partire da quello di più bassa energia fino a quando ci sono
elettroni disponibili. Tale principio permette di classificare i solidi in base al grado di
riempimento dei livelli in ciascuna banda di energia. Il livello pieno di più alta energia
individua l’ENERGIA DI FERMI del solido.
Ricordiamo che per i solidi ordinari l’energia di Fermi è di qualche elettronvolt, energia
che corrisponde a una temperatura TF=10.000 Kelvin; a temperatura ambiente
(T=300K) possiamo considerare i livelli energetici dei solidi come se fossero a
temperatura T=0K, e quindi il riempimento dei livelli è molto simile a quando abbiamo
temperatura nulla.
Ai tempi di Drude, il modello di Drude spiegava bene come un metallo conduceva ma
era totalmente incapace di spiegare perché un materiale fosse conduttore e un altro fosse
isolante.
La teoria delle bande, in base al teorema di Bloch, permette invece di capire questa
differenza… Aver compreso la differenza tra conduttori e isolanti rappresenta un
successo della meccanica quantistica applicata alla fisica dei solidi. Questo modo di
riempire le bande di energia dei solidi ci permette di classificare i vari tipi di solidi.
Il disegno a sinistra mostra i livelli di energia
(segnata sull’asse verticale) che possono essere
occupati o meno. Tanto più il semicerchio è
bombato verso destra tanto più è densa la
numerosità degli stati per quel livello di energia.
In un ISOLANTE la banda indicata dal livello di
Fermi è completamente piena. In un isolante, cioè,
le bande sono tutte piene o tutte vuote.
Un conduttore invece ha l’ultima banda occupata
parzialmente piena. In un CONDUTTORE vi
sono stati vuoti vicini in energia al livello di Fermi
e gli elettroni possono fare transizioni di bassa
energia.
Quando applichiamo un campo elettrico per avere una conduzione in un sistema,
attraverso il campo elettrico compiamo un lavoro sulla particella carica, ma
quantisticamente l’elettrone può assorbire solo grani discreti di energia passando da un
livello elettronico a uno più energetico; nel caso di un isolante, dove la banda è
completamente piena, gli elettroni per poter assorbire energia da un campo elettrico
devono passare alla banda successiva; ma se la banda successiva è ben lontana (in
energia) l’energia che fornisce il campo (il campo che ordinariamente si usa per effettuare
misurazioni) non è sufficiente a far compiere agli elettroni tali transizioni energetiche, gli
elettroni restano dove sono e il sistema si comporta come un isolante.
57
Nel conduttore invece il livello di Fermi capita a metà di una banda e ci sono stati liberi
vicini nei quali l’elettrone, anche debolmente energizzato/eccitato, può finire… e questo
è alla base della conduzione.
La teoria delle bande – Domande e test
1) Cos’è una banda di livelli d’energia?
2) In cosa consistono le “bande” utilizzate nella descrizione dei metalli?
a. In regioni di energia densamente popolate di livelli disponibili per gli elettroni.
b. In regioni spaziali del solido determinate dalla simmetria del reticolo dove è maggiore la
probabilità di trovare gli elettroni.
c. In funzioni d’onda elettroniche che presentano periodicamente dei picchi in corrispondenza
degli ioni del reticolo.
3) Quali sono i numeri quantici in un solido tridimensionale?
I livelli elettronici nei solidi – Domande
1) Cos’è un gap d’energia?
2) In che modo la teoria delle bande permette la classificazione dei solidi in conduttori e isolanti?
3.5. Appendice. Reticolo di Bravais. Reticolo reciproco. Zona
di Brillouin. Il teorema di Bloch e la serie di Fourier
In geometria e in cristallografia, un RETICOLO CRISTALLINO (o “RETICOLO
DI BRAVAIS”, dal francese Auguste Bravais che per primo lo descrisse, nel 1848) è un
insieme infinito di punti con una disposizione geometrica sempre uguale in tutto lo
spazio. I punti del reticolo sono costituiti da una “base” (racchiusa all’interno di una cella
unitaria), cioè da un insieme di uno o più entità molecolari (atomi, molecole o ioni), per
cui la struttura atomica dei cristalli è definita dal reticolo e dalla base del reticolo.]
La teoria dei gruppi permette di definire il numero di reticoli di Bravais possibili
per ogni dimensione dello spazio.
In un reticolo cristallino, la CELLA DI WIGNER-SEITZ è una cella primitiva
che gode di tutte le proprietà di simmetria della struttura cristallina. Essa è definita come
la regione di spazio, costruita intorno a un nodo reticolare del reticolo di Bravais,
formata da quei punti che sono più vicini a quel nodo rispetto a qualunque altro; tale
zona è descritta geometricamente dal più piccolo poliedro individuato dai piani che
bisecano ortogonalmente i segmenti che congiungono il nodo a ciascuno dei “primi
vicini” (anche se in pratica, per costruire tale poliedro, è sufficiente considerare solo
pochi nodi tra quelli più vicini a quello di partenza). Generalizzando, questa regione può
essere introdotta per un qualsiasi insieme discreto di punti indipendentemente dalla
periodicità dell’insieme di punti considerato, e in generale, prende il nome di poliedro di
Voronoi. Il poliedro di Voronoi, nel caso particolare del reticolo di Bravais, si riduce alla
cella di Wigner-Seitz.
58
Consideriamo un set di punti R che costituiscono un reticolo di Bravais e un’onda piana

ik r

definita da e . Tale onda piana per alcuni
valori di k ha la periodicità del reticolo di

Bravais. L’insieme dei vettori d’onda k che descrive onde piane con la periodicità
di un dato reticolo di Bravais si chiama RETICOLO RECIPROCO. Tale

condizione da un punto di vista algebrico corrisponde a scrivere e
  
ik  r  R
  eik r

, e

dovendo tale relazione valere per qualsiasi r segue che l’insieme dei vettori del reticolo
reciproco soddisfa la relazione: e
 
ik R
 1 per tutti i punti R del reticolo di Bravais.
Infine, in fisica dello stato solido, si chiama prima ZONA DI BRILLOUIN la cella di
Wigner-Seitz del reticolo reciproco. Il contorno della zona di Brillouin si ottiene
tracciando la bisettrice delle linee congiungenti i primi vicini nel reticolo reciproco. In tre
dimensioni alle rette bisettrici si sostituiscono i piani bisettori.1
Si definiscono inoltre la seconda, la terza e le successive zone di Brillouin, corrispondenti
a una sequenza di zone nello spazio reciproco non sovrapposte e a maggior distanza
dall’origine; tali zone hanno un interesse minore, per questa ragione con “zona di
Brillouin” si identifica la prima.
Perché abbiamo dato questa serie di definizioni?
L’importanza della (prima) zona di Brillouin dipende dalla descrizione mediante
funzioni di Bloch delle onde in un mezzo periodico: in tale rappresentazione si trova che
le soluzioni possono essere completamente caratterizzate dal loro comportamento in una
sola zona di Brillouin.
E veniamo infine alla dimostrazione del Teorema di Bloch
Il teorema di Bloch, che abbiamo derivato in modo intuitivo partendo da combinazioni
di funzioni d’onda atomiche, può essere dimostrato matematicamente usando la
trasformata/serie di Fourier. A tale scopo ricordiamo alcune proprietà per una funzione
definita nell’intervallo (0,L), dove L=Na.
f x    f k eikx ,
k
k
2
2
n
n
L
Na ,
n  0,1,2,...
Introduciamo i vettori d’onda G, chiamati vettori di reticolo reciproco e definiti da
G
2
l,
a
l intero
Si dimostra, ad esempio, che, essendo il reticolo reciproco di un reticolo cubico semplice ancora un reticolo
cubico, la zona di Brillouin di un reticolo cubico è un cubo. Al contrario essendo il reticolo reciproco del cubico
a corpo centrato un reticolo cubico a facce centrate la prima zona di Brilluoin è un dodecaedro rombico. Mentre
per un reticolo cubico a facce centrate il reticolo reciproco è cubico a corpo centrato quindi la prima zona di
Brilluoin è un ottaedro tronco.
1
59
Tali vettori godono della proprietà che, per ogni vettore del reticolo R=ma, si ha
GR  2q , q intero
(sono i vettori per cui la funzione d’onda ha la stesa periodicità del reticolo)
Lo sviluppo di f(x) può, in generale, essere scritto come una doppia somma
f x  
  f k Geik G x
k
BZ G
2
n
Na ,
n  0,1,2,..., N  1
Gli N valori di k definiscono la ZONA DI BRILLOUIN (BZ).
Il problema di un elettrone in un solido può essere schematizzato come quello di una
particella in un potenziale V(x) periodico, cioè tale che V(x)=V(x+a), con a il passo
reticolare. In virtù della periodicità, lo sviluppo di Fourier di V(x) ammette solo vettori di
reticolo reciproco, cioè
V x   VG eiGx
G
Questo è evidente notando che Ga è pari a un multiplo di 2π.
In una dimensione l’equazione di Schrödinger si scrive
2 2

 x   V x  x   E x 
2m x 2
Facendo la trasformata di Fourier dell’equazione si ottiene
 2k 2
 k  VG k G  E k
2m
G
In assenza di V(x), ogni componente di Fourier è indipendente dalle altre. In presenza di
V(x), le componenti di Fourier che differiscono di un vettore G, sono accoppiate.
In generale, in presenza di un potenziale V(x) arbitrario, tutte le componenti di Fourier
sono accoppiate. Nel caso di un potenziale periodico, il problema si scompone in N
problemi distinti, ciascuno corrispondente a un valore di k nella BZ. La funzione d’onda
ha quindi lo sviluppo seguente:
 k x    k G ei k G x  eikx  k G eiGx  eikxuk x 
G
G
Tale sviluppo riproduce il contenuto del teorema di Bloch.
60
3.6. Test ed esercizi
In che modo si utilizza il principio di esclusione di Pauli per determinare lo stato fondamentale
di un solido?
a. L’energia di Fermi assume valori discreti.
b. Elettroni che occupano stati con vettore d’onda opposto devono avere spin opposto.
c. I livelli energetici elettronici del solido, a temperatura nulla, sono riempiti a partire dal più basso in
energia fino ad accomodare tutti gli elettroni, uno per livello, fino all’energia di Fermi.
d. In un solido a temperatura nulla, si può avere un solo elettrone per sito reticolare.
e. I livelli energetici elettronici del solido, a temperatura nulla, sono riempiti a partire dal più basso in
energia fino ad accomodare tutti gli elettroni, facendo in modo che ogni livello sia o occupato da un
solo elettrone o vuoto.
[La risposta esatta è la c.]
Che cos’è la relazione di dispersione per gli elettroni in un solido?
a. La relazione nello spazio tra due stati elettronici localizzati su siti reticolari primi vicini.
b. Il modo in cui la funzione d’onda si distribuisce nello spazio determina la relazione di dispersione.
c. La dipendenza dell’energia di un livello elettronico in un solido dal vettore d’onda che caratterizza
tale livello determina la relazione di dispersione.
d. La dipendenza dell’energia di un livello elettronico dal raggio di Bohr efficace della funzione d’onda.
e. La dipendenza dell'energia dal quadrato dell'impulso dello stato elettronico.
[La risposta corretta è la c.]
In cosa consistono le condizioni al contorno periodiche per un solido monoatomico
unidimensionale?
a.
b.
c.
d.
e.
In un reticolo di N atomi, atomi che differiscono di due passi reticolari sono equivalenti.
N atomi ugualmente spaziati, dove l’atomo nel sito N-esimo è collegato all’atomo nel primo sito.
La funzione d’onda può assumere solo valori interi.
In un reticolo di N atomi ugualmente spaziati, i siti 1 e N sono equivalenti.
La funzione d’onda ai siti estremi 1 e N si annulla.
[La risposta esatta è la b.]
Quale tra le seguenti affermazioni è in accordo con il teorema di Bloch?
a. Il teorema di Bloch giustifica il modello di Drude precisando come il cammino libero medio sia
dovuto alle collisioni con gli ioni del reticolo.
b. In un reticolo ordinato, le autofunzioni d’onda sono onde piane come nello spazio vuoto.
c. In un reticolo ordinato, le collisioni degli elettroni con gli ioni sono modulate da una funzione
periodica uk(x)
d. In un reticolo ordinato il vettore d’onda cristallino è un numero quantico conservato. Imperfezioni
del reticolo sono causa della non conservazione del vettore d’onda cristallino e deviano gli elettroni.
e. In un reticolo ordinato il vettore d’onda cristallino è un numero quantico non conservato. Le
collisioni degli elettroni avvengono con gli atomi posti ai siti reticolari.
[La risposta esatta è la d.]
Che cosa afferma il teorema di Bloch relativamente agli autostati di un reticolo
unidimensionale di passo reticolare a?
a. ψk(x) = eikx uk(x),
b. ψk(x) = A eikx +Be−ikx,
uk(x+a)=−uk(x)
con A, B complessi.
61
c. ψk(x) = eikx
d. ψk(x) = eikx uk(x),
e. ψk(x) = eikx uk(x),
uk(x+a)=uk(x)
uk(x)=uk(−x)
[La risposta corretta è la d.]
Che cos’è la zona di Brillouin in un solido unidimensionale? (vedi appendice 3.5)
a. In un reticolo, la zona di Brillouin è la regione intorno a ogni sito reticolare. L’intero reticolo può
essere pensato come la somma di N zone di Brillouin.
b. La zona di Brillouin definisce l’insieme dei vettori d’onda G detti di reticolo reciproco, che
soddisfano RG=2πq con q intero.
c. Nello spazio dei vettori d’onda, la zona di Brillouin definisce i valori permessi del vettore d’onda.
d. La zona di Brillouin definisce i vettori d’onda che appaiono nello sviluppo di Fourier di una
funzione con la periodicità del reticolo, f(x+a)=f(x)
e. In un reticolo con N siti e con sito reticolare generico R=ma (a passo reticolare), ogni vettore d’onda
può essere scritto nella forma q=k+G dove i vettori di reticolo reciproco G soddisfano RG=2πj, con j
intero, e k=n(2π)/(Na) con n=0,1,2,…,N−1. I valori di k definiscono la zona di Brillouin.
[la risposta corretta è la e…?]
Quali sono, in generale, i numeri quantici che identificano i livelli elettronici nei solidi?
a. Come nel caso della particella libera, i numeri quantici sono i valori dell’impulso.
b. Sono quelli corrispondenti agli atomi di cui è costituito il solido.
c. Non esistono regole generali, i numeri quantici dipendono dal tipo di solido.
d. In generale, la simmetria traslazionale discreta di un solido richiede tre vettori d'onda discreti (uno
per ogni direzione spaziale) e uno o più indici di banda, connessi al tipo di atomi costituenti il reticolo.
e. In generale, la simmetria traslazionale discreta di un solido richiede due vettori d'onda discreti (scelti
fra i tre possibili) ed un indice di spin.
[La risposta corretta è la d.]
In un solido unidimensionale monoatomico con N siti, il valore della funzione d’onda tra due
siti successivi varia per un fattore di fase costante ϕ. Quale tra le seguenti equazioni determina
il valore di tale fase?
a. eiNϕ = 1
b. eiNϕ = π
c. eiNϕ = −1
d. eiNϕ = i
e. e−Nϕ = 1
[La risposta corretta è la a.]
In base alla teoria delle bande, qual è la differenza tra un conduttore metallico e un isolante?
a. Dal punto di vista della teoria delle bande non vi è alcuna differenza.
b. Un isolante ha un numero pari di bande piene, mentre un conduttore ne ha un numero dispari.
c. Un conduttore ha le sue bande d'energia o esattamente piene o esattamente vuote, mentre un isolante
ha bande d'energia parzialmente riempite.
d. Nel caso degli isolanti, il principio di esclusione di Pauli è irrilevante.
e. Un isolante ha le sue bande d'energia o esattamente piene o esattamente vuote, mentre un conduttore
ha bande d'energia parzialmente riempite.
[La risposta corretta è la e.]
62
In cosa consiste la simmetria traslazionale di un reticolo cristallino?
a. Punti dello spazio che differiscono di multipli di vettori di traslazione caratteristici per un dato
reticolo sono equivalenti.
b. La funzione d’onda soddisfa condizioni periodiche.
c. I punti del reticolo tornano in se stessi dopo una rotazione di 180 gradi intorno ad un asse passante
per due punti del reticolo.
d. Le coordinate dei punti del reticolo assumono solo valori interi.
e. Ogni punto dello spazio è equivalente ad ogni altro punto.
[La risposta corretta è la a.]
Cosa comporta la presenza di un reticolo cristallino perfetto (privo di impurezze) per il
modello di Drude?
a. In un reticolo perfetto gli urti tra elettroni e ioni non sono in grado di cambiare il vettore d’onda
cristallino; in queste condizioni, il metallo sarebbe sempre all’equilibrio e non potrebbe condurre una
corrente elettrica.
b. La presenza di un reticolo perfetto è una delle ipotesi del modello di Drude: in presenza di
impurezze non si potrebbe avere conduzione elettrica.
c. In un reticolo perfetto gli urti tra elettroni e ioni fanno cambiare il vettore d’onda cristallino; in
queste condizioni, il metallo non raggiungerebbe mai l’equilibrio e non potrebbe condurre una corrente
elettrica.
d. In un reticolo perfetto gli urti tra elettroni e ioni non sono in grado di cambiare il vettore d’onda
cristallino; in queste condizioni, il metallo non raggiungerebbe mai l’equilibrio tramite le collisioni e si
otterrebbe una stima della conducibilità non soddisfacente.
e. In un reticolo perfetto gli urti tra elettroni e ioni fanno cambiare il vettore d’onda cristallino; in
queste condizioni, il metallo non raggiungerebbe mai l’equilibrio tramite le collisioni e si otterrebbe una
stima della conducibilità non soddisfacente.
[La risposta corretta è la d.]
63
Cap. 4
La spintronica
In questo capitolo affronteremo il concetto della spintronica. Approfondiremo alcune
idee sui sistemi paramagnetici e ferromagnetici. Studieremo la fenomenologia dell’effetto
di magneto-resistenza gigante (GMR), quindi il modello di conduzione a due canali.
Daremo una interpretazione dell’effetto GMR e alcuni cenni sull’applicazione dell’effetto
GMR alle memorie magnetiche.
4.1 Cos’è la spintronica
4.2. L’effetto GMR
4.3. Il modello a due canali
4.4. Teoria dell’effetto GMR
4.5 Applicazioni
4.6. Test ed esercizi
4.1. Cos’è la spintronica
Che cosa significa spintronica?
“Spin transport electronics” (elettronica basata sul trasporto di spin) oppure “Spin based
electronics” secondo la definizione di S. A. Wolf e altri. Science 294, 1488 (2001)
Nell’elettronica tradizionale si usa solo la carica tradizionale, mentre lo spin è un grado di
libertà “inerte”. Esso diventa invece fondamentale nella spintronica
Grande impatto sulla scienza di base: il Premio Nobel 2007 ad Albert Fert (francese) e
Peter Grünberg (tedesco) per la scoperta dell’effetto di magnetoresistenza gigante
(GMR) (avvenuta nel 1988) ha catalizzato moltissima ricerca sull’argomento; ma fin da
subito la scoperta ebbe impatto sulla tecnologia: già qualche anno dopo la scoperta
dell’effetto GMR si trovò modo di utilizzarla per rivoluzionare le tecniche di
fabbricazione dei dischi rigidi dei computer consentendo un notevole aumento della
densità di immagazzinamento dei dati; l’EPS’s Hewlett-Packard Europhysics Prize
1997 fu consegnato a Stuart Parkin (allora e tuttora ricercatore dell’IBM) appunto per il
suo lavoro pionieristico nella tecnologia GMR per i dischi rigidi.
La spintronica è un terreno d’incontro ideale tra scienza di base e
applicata
“Gli scopi centrali della spintronica sono quelli di comprendere i meccanismi attraverso i
quali è possibile ottenere un efficiente controllo elettronico delle correnti di spin e delle
configurazioni di spin, e di scoprire i materiali nei quali questi meccanismi sono presenti
in modo preminente. A causa della ovvia relazione con le tecniche magnetiche di
archiviazione dell’informazione, la possibilità di nuove applicazioni è sempre presente
nel contesto degli argomenti di ricerca in spintronica e talvolta balza in primo piano con
64
effetti spettacolari. Ciò nondimeno, i problemi che sorgono in questo campo sono
spesso affascinanti da un punto di vista fondamentale e parecchi argomenti sono studiati
per il loro interesse intrinseco.”
Pesin e Mac Donald (due fisici teorici) in Nature Materials 11,409 (2012)
L’attore principale: l’elettrone
Una breve biografia dell’elettrone:
 Data di nascita: 1897 (per opera di J J Thomson con i raggi catodici)
 Massa: m = 9.10938291 X 10 – 31 Kg (e/m più grande del valore atteso)
 Carica: e = 1.602176665 X 10 – 19 C (per opera di R A Millikan con l’esperimento
delle goccioline d’olio 1909)
 Spin: s = ħ/2, ħ =1.054571726 X 10 – 34 Js (Stern-Gerlach 1922, Uhlenbeck and
Goudsmit 1925, Pauli 1927)
Lo spin è momento angolare intrinseco. I fermioni hanno spin semintero e gli elettroni
hanno lo spin minimo possibile, ½ in unità di ħ.
Corrente di carica (l’elettrone, muovendosi, si porta dietro la sua carica)
ji   e vi
è un vettore che si porta dietro le caratteristiche della velocità e pertanto dipende da un
indice i che individua la direzione in cui fluisce la corrente e che può essere x, y o z.
Introduciamo ora un concetto nuovo rispetto all’elettronica tradizionale, che è la
corrente di spin: poiché l’elettrone si muove ed è dotato di spin può trasferire
momento angolare da una regione a un’altra; quindi, esattamente come per la carica,
possiamo introdurre la corrente di spin: la velocità moltiplicata per lo spin… ma lo spin
non è una grandezza scalare, e perciò essa deve dipendere da due indici, il primo legato
alla direzione della velocità e il secondo che indica la direzione verso cui punta lo spin
che l’elettrone si porta appresso.
jij  s j vi
Possiamo pertanto dire, in termini matematici, che la corrente di spin è una quantità
tensoriale.
Rappresentiamo varie possibili situazioni: indicheremo con le frecce nere più spesse il
flusso di elettroni e con le frecce colorate più sottili lo stato di spin o di polarizzazione.
Come è noto dalle regole generali della meccanica quantistica lo stato di spin può essere
o positivo o negativo: +ħ/2 oppure –ħ/2. Nell’elettronica tradizionale gli spin SU (rossi)
e GIÙ (blu) sono presenti in egual numero.
65
Nel I caso lo spin totale è nullo, non c’è trasporto di momento angolare e la corrente di
spin è a sua volta nulla.
Nel II caso abbiamo soltanto gli elettroni con un certo spin, ad esempio SU: oltre al
trasporto di carica associato agli elettroni ci sarà anche trasporto di momento angolare:
entrambe le correnti sono diverse da zero.
Nel III caso abbiamo di nuovo elettroni con spin SU ed elettroni con spin GIÙ, ma per
un qualche motivo siamo riusciti a farli andare in direzioni opposte (questo non si riesce
a fare con un campo elettrico standard): la carica totale trasportata verso destra o verso
sinistra è dunque nulla, ma il fatto che lo spin SU venga portato da sinistra verso destra e
che lo spin GIÙ venga portato da destra verso sinistra comporta che ci sia un accumulo
di spin SU verso destra e un accumulo di spin GIÙ verso sinistra: c’è un trasporto netto
di spin da sinistra verso destra, e la corrente di spin è diversa da zero.
TEST. La corrente di spin
a. quantifica la velocità degli elettroni per la carica trasportata; a differenza della corrente di carica è una
grandezza scalare.
b. quantifica la velocità degli elettroni per lo spin trasportato; come la corrente di carica, è una
grandezza tensoriale.
c. quantifica la velocità degli elettroni per lo spin trasportato; a differenza della corrente di carica è una
grandezza tensoriale.
[La risposta corretta è la c.]
4.2. L’effetto GMR (gyant magneto-resistance)
Come si manipola lo spin elettronico?
Vediamo intanto come si può intervenire sulle caratteristiche di un elettrone: massa,
carica, spin.
Intervenire sulla massa? La forza gravitazionale nell’elettronica tradizionale è sempre
trascurata in quanto è troppo debole: il confronto tra attrazione gravitazione e repulsione
coulombiana è praticamente zero:
Gm 2 6.67 1011 9.1 1062
43


10
2
ke2
9 109 1.6 1038
2
66
La carica è invece la proprietà che maggiormente si sfrutta nell’elettronica standard per
controllare il moto degli elettroni; in un metallo lo si fa attraverso l’uso del campo
elettrico. In un metallo gli elettroni come fermioni obbediscono al principio di esclusione
di Pauli; gli elettroni che rispondono al campo elettrico sono quelli vicini al livello di
19
Fermi; l’energia dello stato occupato più alto EF  1eV  10 J
Il campo elettrico permette la transizione tra stati appena sotto il livello di Fermi e stati
vuoti sopra tale livello.
Come si può manipolare lo spin? Una carica in moto circolare è equivalente a un dipolo
magnetico. Si può associare un dipolo magnetico anche allo spin dell’elettrone, che
possiamo immaginare come una trottola, anche se è chiaramente una descrizione di
fantasia.
Il campo magnetico agisce sul dipolo magnetico μ associato allo spin elettronico.
In particolare si definisce “magnetone di Bohr” il momento magnetico dell’elettrone:
e 1.6 1019 34 1
  B 

10 JT  1023 JT 1
31
2m 9.110
In un campo di 1 Tesla abbiamo un’energia di 10–23 J, e osserviamo che
1023 J  104 eV : in un campo di 1 Tesla abbiamo delle energie in gioco che sono
molto piccole rispetto all’energia di Fermi. Tuttavia non sono trascurabili.
Un ferromagnete è un materiale che ha al suo interno un campo magnetico intrinseco
che può essere stimato calcolando l’intensità prodotta da un numero di magnetoni di
Bohr per unità di volume pari alla densità della materia standard.
In un ferromagnete il campo interno vale dunque
Bint  0 B n  4 107 1023 1029 T  1T
e può produrre un effetto sul momento magnetico di dipolo associato allo spin
dell’elettrone.
Paramagneti e ferromagneti
Come insegna l’elettromagnetismo classico, l’induzione magnetica B e il campo
magnetico H sono legati tra loro dalla magnetizzazione M. Quest’ultima è funzione del
campo magnetico H e tale funzione determina la cosiddetta
RELAZIONE COSTITUTIVA DEL MEZZO
B  H  M H 
Nel vuoto B ed H coincidono. In un mezzo dobbiamo introdurre la magnetizzazione M
che esprime come il mezzo materiale risponde alla presenza di un campo magnetico
esterno. Non ci addentreremo a capire come questo avviene, lo prenderemo come un
dato di fatto: ci sono alcuni materiali che immersi in un campo producono una M
trascurabile e ce ne son altri che producono una M apprezzabile.
Nel limite di campo esterno H nullo, una magnetizzazione nulla o finita determina se un
materiale è paramagnetico o ferromagnetico, e rispettivamente è
67
PARAMAGNETE se
lim M H   0
FERROMAGNETE se
lim M H   0
H 0
H 0
In questo caso il valore ottenuto rappresenta la magnetizzazione residua.
La parte della fisica che andiamo a discutere si basa sulla combinazione di materiali
ferromagnetici e materiali paramagnetici.
Cos’è l’effetto GMR?
L’effetto GMR, ricordiamo, fu scoperto da Albert Fert e Peter Grünberg nel 1988.
I due studiarono i materiali a molti strati (in inglese: magnetic multileaves). Qui sopra
vediamo un’immagine tratta dalla conferenza tenuta da Fern in occasione del
conferimento del premio Nobel. Le parti chiare della figura a destra rappresentano un
metallo normale di materiale paramagnetico, le parti più scure rappresentano metalli
ferromagnetici; sia in alto che in basso si vede un sandwich costituito di materiali
ferromagnetici che racchiudono un materiale paramagnetico all’interno.
Fert e Grünberg studiarono la conduzione elettrica di questi sistemi compositi.
Mandando una corrente ad esempio dall’alto verso il basso, gli elettroni si trovano ad
attraversare prima una regione ferromagnetica, poi una regione paramagnetica, poi di
nuovo una regione ferromagnetica.
Ricordiamo che un ferromagnete si comporta come un enorme dipolo ferromagnetico,
dovuto al fatto che tutti i momenti magnetici elementari si orientano tutti allo stesso
modo.
La resistenza di un sistema multistrato, in cui strati magnetici e paramagnetici
sono alternati, dipende dall’orientazione parallela o antiparallela degli strati
magnetici.
68
Com’è che si varia la magnetizzazione nei due casi? Quello che si è scoperto, soprattutto
grazie ai lavori di Grünberg, è che se abbiamo due strati magnetici e una regione
non magnetica (paramagnetica) in mezzo, i dipoli magnetici dei due materiali
ferromagnetici tendono a disporsi naturalmente in una configurazione
antiparallela (che è il caso mostrato in alto). Se in questa situazione a questo sandwich
applichiamo un campo magnetico esterno orientato ad esempio secondo uno dei due
versi di magnetizzazione, se tale campo magnetico è sufficientemente intenso tenderà a
orientare non solo la magnetizzazione che è già concorde con lui ma anche la
magnetizzazione del secondo ferromagnete; quindi con un campo magnetico esterno
sufficientemente intenso possiamo avere una magnetizzazione parallela dei due
ferromagnetici, ossia passare da una configurazione antiparallela a una parallela.
Quello che i due fisici osservarono misurando la corrente che passa in questo
sistema è che c’è una differenza di proprietà di conduzione a seconda che la
configurazione sia antiparallela o parallela; in particolare (ed è quello che dice il
grafico di sinistra) a campo nullo la configurazione è antiparallela, aumentando il campo
la resistenza comincia a diminuire e dopo una caduta relativamente brusca tende a
saturare a un valore costante che corrisponde al completo allineamento parallelo dei
due ferromagneti. La differenza percentuale di variazione della resistenza per
l’applicazione del campo può arrivare anche a valori dell’ordine dell’80%. A questo
effetto si dà il nome di GMR.
TEST. L’effetto GMR trae il suo nome dal fatto che
a. applicando un campo magnetico esterno è possibile far scendere il valore della resistenza di un
sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a
circa l’80%, raggiungendo un valore di saturazione della resistenza.
b. applicando un campo magnetico esterno è possibile far aumentare il valore della resistenza di un
sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a
circa l’80%, raggiungendo un valore di saturazione della resistenza.
c. applicando un campo magnetico esterno è possibile far scendere il valore della resistenza di un
sandwich ferromagnete-paramagnete-ferromagnete attraversato ortogonalmente da una corrente fino a
circa l’80% e, anche aumentando la differenza di potenziale, la corrente raggiunge un valore di
saturazione.
[La risposta corretta è la a.]
4.3. Il modello a due canali
In questo paragrafo affronteremo il modello a due canali che è un modello
interpretativo dell’effetto GMR. Tale modello a due canali corrisponde a un modello
con due gas di Fermi; in altre parole quello che facciamo è associare a ogni orientazione
possibile dello spin elettronico un diverso gas di Fermi.
La situazione è illustrata nella figura sotto.
Quando non c’è un campo magnetico (esterno) possiamo rappresentare la
dispersione elettronica in funzione dell’impulso p o di k.
69
Consideriamo ad esempio la dispersione della particella libera. Considerare un solido
reale non porta a considerazioni molto diverse. Per semplicità immaginiamo di avere un
elettrone in una scatola: la relazione energia-impulso è E = p2/2m.
Normalmente gli elettroni con spin SU e quelli con spin GIÙ hanno la stessa
dipendenza dell’energia dall’impulso (abbiamo cioè degenerazione dei due stati di
spin).
Gli elettroni in un ferromagnete possono essere divisi
in due gruppi in base alla proiezione dello spin. Poiché
l’elettrone in virtù dello spin possiede un momento di
dipolo magnetico, applicando un campo magnetico
abbiamo quello che si chiama effetto Zeeman: c’è
interazione tra il dipolo magnetico dell’elettrone e il
campo magnetico; per una data proiezione di spin
l’energia dipende dall’impulso: elettroni con dipolo
magnetico concorde con il campo magnetico tendono
ad avere energia più bassa di quelli con impulso
discorde.
Questo può essere rappresentato spostando le due curve di dispersione una verso il
basso (quella con spin concorde) e una verso l’alto (quella con spin discorde).
Quando andremo a costruire lo stato fondamentale del nostro sistema cominceremo a
riempire lo stato più basso che corrisponde a elettroni con spin SU. Come si vede dalla
figura, possiamo andare a riempire diversi livello con spin SU senza andare a toccare
quelli con spin GIÙ. Arriverà un momento in cui stati di elettrone con spin SU sono
degeneri con stati di elettrone con spin GIÙ, che però hanno impulso diverso: da quel
momento in poi andremo a riempire entrambe le curve di dispersione fino all’energia
massima possibile, cioè fino a quando abbiamo elettroni a disposizione.
I due stati con spin SU e spin GIÙ è come se costituissero due gas di Fermi con sfere di
Fermi separate, corrispondenti al fatto che c’è una diversa popolazione di elettroni con
spin SU e con spin GIÙ. Dunque, a differenza che in un metallo paramagnetico, in un
metallo ferromagnetico abbiamo uno sbilanciamento di popolazione e potremo
chiamare “elettroni maggioritari” gli elettroni con lo spin SU e “minoritari” quelli con lo
spin GIÙ.
L’idea del modello a due canali che andremo a utilizzare è quella di pensare alle
proprietà di trasporto di un metallo ferromagnetico (anche in un dispositivo composto)
come alla conduzione in parallelo di due gas di Fermi ciascuno corrispondente ai due
stati di spin.
Dobbiamo però prima analizzare alcune proprietà dello spin.
70
Il rilassamento dello spin
Lo spin, a differenza della carica, non è una quantità conservata. Questo significa che, se
in una certa regione di spazio siamo riusciti a creare una certa quantità di spin, tale flusso
di spin tende a degradarsi durante la sua propagazione. Lo spin di un elettrone può
interagire con lo spin di qualche imperfezione atomica o dei nuclei stessi. Ci possono
essere effetti relativistici che producono quella che viene chiamata l’interazione spin
orbita di cui avremo occasione di parlare a proposito degli spettri atomici. Non è
importante entrare nei dettagli di questi meccanismi che possono essere anche molto
molto complessi. Quello che conta notare è che lo spin non si conserva e tende a
degradarsi.
Nel gaso dei due gas di Fermi tale degradarsi corrisponde a uno scambio reciproco di
elettroni tra i due gruppi di spin.
Nei metalli il degradarsi del flusso di spin ha una decrescita esponenziale su una scala
detta lunghezza di rilassamento di spin Ls. Essa dipende da tanti parametri e dipende
dalla tipologia del materiale in esame. Tale lunghezza varia nell’intervallo tra pochi
nanometri fino a parecchie decine di nanometri. La strada per la realizzazione di
dispositivi che sfruttano il flusso di spin richiede lo sfruttamento di fenomeni su scale
spaziali dell’ordine di Ls.
La giunzione ferromagnete-paramagnete
L’elemento base per comprendere la fisica dell’effetto GMR è la giunzione tra un metallo
ferromagnetico e uno paramagnetico: questo è il mattoncino teorico più semplice da
esaminare. Supponiamo che l’interfaccia tra i due si trovi nell’origine di un sistema di
riferimento.
LF e LN sono le lunghezze di rilassamento di spin nell’uno e nell’altro metallo.
Nel ferromagnete c’è uno sbilanciamento di popolazione: gli elettroni maggioritari con
spin SU sono molti di più di quelli con spin GIÙ: se facciamo passare della corrente
elettrica, nel ferromagnete la maggior parte della corrente è trasportata dagli elettroni
“maggioritari” con spin SU (la freccia relativa è molto più spessa), mentre nel metallo
paramagnetico la corrente è trasportata in modo paritario dalle due componenti di spin
71
(le frecce relative alla corrente trasportata dagli elettroni con spin SU e alla corrente
trasportata dagli elettroni con spin GIÙ sono identiche).
Questo è quello che succede in un ferromagnete isolato o in un paramagnete isolato. Ma
cosa succede se giuntiamo i due sistemi? Dobbiamo passare dalla situazione a sinistra (in
cui c’è sbilanciamento tra le due correnti) alla situazione di destra (in cui le due correnti
sono bilanciate). Come avviene la transizione tra la situazione “sbilanciata” e quella
“bilanciata”?
Dobbiamo aggiungere una quantità nuova indicata alla giunzione da quel
riferisce all’accumulo di spin, che adesso andiamo a spiegare.
0
che si
L’accumulazione di spin
(La figura sotto è sempre tratta dalla conferenza tenuta in occasione dell’assegnazione del Nobel)
Per comprendere il funzionamento
della giunzione, bisogna considerare
che parte della popolazione dei
maggioritari si deve convertire nei
minoritari. Nella regione della
giunzione i primi devono rallentare,
mentre i secondi accelerare. I primi
vedono quindi un ostacolo, una
barriera di potenziale che tende a
rallentarli (una cresta), mentre i secondi
devono vedere una buca di potenziale
(una valle).
Qui a sinistra sono rappresentati i
potenziali elettrici “visti” dalle due
popolazioni: gli elettroni con spin SU
vedono la curva blu, quelli con spin
GIÙ vedono la curva rossa.
La differenza è detta “potenziale di spin” o ACCUMULO DI SPIN (che non esiste
nell’elettronica tradizionale), che resta finito sulla scala del rilassamento di spin ed è il
motore che fa funzionare queste due correnti. Tale effetto esiste solo in presenza di
una corrente, ossia di un campo elettrico applicato: se non ci fosse una corrente non
ci sarebbe nessun bisogno di bilanciare le due correnti.
Per dare una qualche nozione quantitativa sul fenomeno si introduce…
il modello con le resistenze efficaci
Il funzionamento della giunzione può essere spiegato usando il modello delle resistenze
efficaci. In questo modello la conduzione nel metallo ferromagnetico è descritta come
una conduzione in parallelo delle correnti trasportate dagli elettroni con spin su e con
72
spin giù, rispettivamente. A questi due canali di conduzione vengono associate due
resistenze diverse.
Sappiamo che R  L A (II legge di Ohm)
Quello che si può dimostrare (anche se la dimostrazione esula dallo scopo di
queste lezioni) è che se noi introduciamo delle resistenze “efficaci” in cui la lunghezza
del conduttore non è la vera lunghezza ma è la distanza del rilassamento di spin che
abbiamo introdotto prima, allora possiamo modellizzare il nostro sistema complicato in
termini di resistenze. Il vantaggio è che poi possiamo usare le regole dei circuiti standard.
La resistenza maggiore è quella associata agli elettroni minoritari, che essendo meno
numerosi, possono trasportare una quantità inferiore di corrente.
R   LsF A resistenza degli spin su maggioritari
R   LsF A resistenza degli spin giù minoritari
Conseguenze del modello
In modello a due canali è quindi un parallelo di due canali: in quello superiore corrono
gli elettroni con spin SU, in quello inferiore quelli con spin GIÙ.
Nel metallo normale le due resistenze RN sono identiche, mentre, per quanto detto
sopra, R  R (la conducibilità è legata al numero di portatori e nei due casi vi è un
diverso numero di portatori)
Il problema è adesso calcolare come si ripartisce la corrente nei due canali.
Il risultato è facile da calcolare.
I 
RF   RN
I
RF   RN  RF   RN
I 
Tra le due correnti vi è una differenza pari a
73
RF   RN
I
RF   RN  RF   RN
RF   RF 
I  I 
I
RF   RN  RF   RN
Nel metallo normale, dove in generale non vi è sbilanciamento delle due correnti, per
effetto della contiguità del ferromagnete si produce una differenza tra le due correnti.
Tale effetto è chiamato “spin injection”. A parità di differenza di potenziale applicata
tale spin injection è regolato dalla differenza delle resistenze efficaci.
Per avere una buona efficienza della giunzione, la resistenza del metallo normale deve
essere confrontabile con quella del ferromagnete.
Caduta di potenziale di spin
La caduta di potenziale per i due canali efficaci
di conduzione è diversa; nel ferromagnete è
più accentuata per gli spin GIÙ (linea rossa)
che incontrano maggior resistenza.
Gli spin SU (blu) maggioritari vedono un
potenziale più alto alla giunzione degli spin
GIÙ (rosso).
VG  VG 
RN RF   RN RF 
I
RF   RN  RF   RN
Questa differenza è l’accumulazione di spin, una nuova grandezza che controlla il
funzionamento di questi dispositivi ibridi.
TEST. In un ferromagnete:
a. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due
specie di spin; da ciò risulta che la corrente di spin non può essere conservata su distanze più grandi
della lunghezza di rilassamento.
b. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due
specie di spin; ciò ostacola la formazione di correnti di spin.
c. la presenza del campo magnetico genera una differenza tra il potenziale a cui sono sottoposte le due
specie di spin; da ciò, risulta uno sbilanciamento nelle due popolazioni di spin.
[La risposta corretta è la c.]
74
4.4. Teoria dell’effetto GMR
La giunzione F-N-F
Il meccanismo GMR può essere compreso studiando il comportamento di due giunzioni
F–N accoppiate. Il requisito fisico è che la lunghezza dello strato di metallo
normale sia comparabile (o inferiore) con la lunghezza di rilassamento di spin.
Quando tale lunghezza è maggiore della lunghezza di rilassamento di spin c’è il
disaccoppiamento delle due giunzioni e il dispositivo non può funzionare in modalità
GMR.
Il modello delle resistenze efficaci
Anche per la doppia giunzione possiamo introdurre delle resistenze efficaci relative ai
canali di conduzione dei due ferromagneti e dello strato normale.
Resistenza totale
Per mezzo delle regole standard dei circuiti si ottiene la resistenza totale
Rtot 
R
F1

 RF2   RN RF1  RF2   RN
RF1  RF2   RN  RF1  RF2   RN
75

Configurazione antiparallela
è quella che esiste tra i due ferromagneti in assenza di campo magnetico applicato;
conveniamo di chiamare le seguenti resistenze uguali tra loro
I maggioritari nel primo ferromagnete diventano i minoritari nel secondo ferromagnete
RF1  RF2  
(conveniamo di chiamare tali resistenze efficaci)  R
e viceversa: i minoritari nel primo ferromagnete diventano i maggioritari nel secondo;
RF1  RF2   R
con queste due posizioni otteniamo

Rtot

R  R  RN
2
Configurazione parallela
RF1  RF2   R
RF1  RF2   R

Rtot

2R
 RN 2 R  RN 
2R  RN  R 

Teoria dell’effetto GMR
La variazione percentuale della resistenza tra le due configurazioni dipende dalla
differenza di resistenza tra i canali di spin su e spin giù.


R  R 
Rtot
 Rtot


R  RN  R 2
Rtot
2
Tale variazione percentuale può arrivare all’80%. Nel caso limite in cui gli spin minoritari
siano molto resistivi, la variazione percentuale può arrivare quasi al cento per cento.
Negli esperimenti si possono avere anche molti più strati ferromagnetici intervallati da
strati normali. Si può anche studiare l’influenza del numero di strati. Ma il principio base
è quello qui descritto.
Questo modello efficace è giustificato da una teoria microscopica molto più raffinata ma
il principio di funzionamento è ben descritto da questo semplice modello.
Prima di chiudere il paragrafo facciamo un confronto dei profili di potenziale nei due
casi.
76
Confronto dei profili di potenziale
Anche questo si può calcolare col modello delle resistenze efficaci. La curva blu è la
curva degli spin maggioritari, quella rossa degli spin minoritari. Tali curve sono delle
spezzate perché nel modello a resistenze efficaci il comportamento è completamente
ohmico: la caduta di potenziale varia linearmente con la distanza e la pendenza è un
indice della resistenza in quel tratto di metallo. Le differenze di valori tra la curva blu e la
curva rossa alle giunzioni sono quelle che abbiamo definito “accumulo di spin”.
Nella configurazione antiparallela (a sinistra) il segno dell’accumulazione di spin alle
due giunzioni è concorde: gli spin che sono maggioritari nella prima giunzione diventano
minoritari nella seconda; quello che fanno le due giunzioni in modo concorde è ritardare
i portatori con spin SU e accelerare quelli con spin GIÙ, che sono alternativamente
maggioritari e minoritari. Le pendenze ci dicono che gli spin SU incontrano minore
resistenza degli spin GIÙ nel primo ferromagnete e viceversa nel secondo ferromagnete
Nell configurazione parallela c’è sempre un canale (il canale SU nella figura sopra) che
è meno resistivo dell’altro. Alle giunzioni vi sono accumuli di spin opposti in segno.
La resistenza globale è comunque inferiore che nella configurazione antiparallela.
TEST. Il modello a due canali permette di spiegare l’effetto GMR; in esso
a. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che
il ferromagnete sia polarizzato concordemente o meno col metallo normale.
b. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che
il ferromagnete sia polarizzato parallelamente o antiparallelamente alla specie considerata.
c. per ogni specie di spin è possibile stabilire un canale elettrico con resistenze differenti a seconda che
il metallo normale sia più lungo o più corto della lunghezza di rilassamento di spin.
[La risposta corretta è la b.]
77
4.5 Applicazioni del principio del GMR
Si invita a cliccare sul sito dei premi Nobel del 2007 che rinvia al sito dell’IBM,
la prima azienda che applicò su scala industriale i principi del GMR:
http://www.research.ibm.com/research/gmr.html
Come si legge un bit?
L’effetto GMR può essere utilizzato per realizzare un modo nuovo di leggere un bit
d’informazione. In tale schema, la testina di lettura è costituita da un sensore GMR (il
parallelepipedo multicolore disegnato qui sotto). Questo è fatto di diversi strati diversi.
Lo strato bloccante fornisce un campo magnetico parallelamente al quale si allinea la
magnetizzazione dello strato bloccato. Lo strato bloccato è il primo ferromagnete del
sensore GMR. Successivamente vi è uno strato spaziatore, che svolge il ruolo del metallo
normale. Infine vi è lo strato libero, che svolge il ruolo del secondo ferromagnete del
sensore GMR. La magnetizzazione dello strato libero si orienta parallelamente a quella
del bit da “leggere”.
La testina di lettura costituita dal sensore GMR passa vicino ai bit da leggere (le regioni
arancioni). Lo strato verde e lo strato azzurro (i due ferromagneti) possono mettersi in
configurazione parallela o antiparallela a seconda di quello che lo strato libero (verde)
legge nel BIT che gli scorre sotto. Attraverso la testina GMR scorre corrente. Le
variazioni di resistenza corrispondono a variazioni della magnetizzazione dei bit.
Aumento della capacità di archiviazione
La nuova tecnologia introdotta dall’effetto GMR ha rivoluzionato l’industria
dell’archiviazione dell’informazione aumentando la capacità dei dispositivi di memoria.
La variazione “gigante” di resistività ha infatti aumentato la sensibilità di un sensore
GMR, permettendo così di rendere più piccole le regioni che definiscono i bit da leggere.
Questo si traduce in un aumento della densità areale di registrazione, che si misura in bit
per centimetro quadro. Si stima che l’avvento dei dischi rigidi con tecnologia GMR nel
1997 abbia condotto a un aumento di circa due ordini di grandezza della densità areale di
registrazione da circa 0,16 Gbit/cm2 a 16 Gbit/cm2.
(Albert Fert, Review of Modern Physics, 80, 1517 (2008)).
78
Osservazioni conclusive
L’effetto GMR è uno di quei casi in cui la comprensione di un affascinante nuovo
fenomeno ha comportato un impatto sulla tecnologia che coinvolge la vita quotidiana
delle persone. Inoltre la scoperta dell’effetto GMR ha aperto un intero nuovo campo di
ricerca, usualmente indicato come spintronica dove sono importanti gli aspetti
interdisciplinari tra diversi settori della fisica come il magnetismo, l’elettronica e la fisica
dello stato solido. I principi di funzionamento dei nuovi dispositivi spintronici sono
profondamente basati sulla natura quantistica degli elettroni e la loro dettagliata
comprensione rappresenta una delle sfide più eccitanti non solo della fisica applicata ma
anche di quella teorica.
TEST. L’effetto GMR ha permesso di aumentare la capacità dei dischi rigidi; lo schema di
funzionamento è il seguente:
a. i bit sono implementati da regioni che possono contenere due diversi valori di quantità di carica;
l'unità di lettura è costituita da un elemento che si polarizza concordemente alla regione che
implementa il bit, un metallo normale e un ferromagnete con magnetizzazione opportunamente
bloccata; facendo scorrere una corrente è possibile misurare la quantità di carica presente nella
regione che implementa il bit.
b. i bit sono implementati da regioni magnetizzate in due possibili direzioni; l’unità di lettura è
costituita da un elemento che si polarizza concordemente alla regione magnetizzata, un metallo
normale e un ferromagnete con magnetizzazione opportunamente bloccata; facendo scorrere una
corrente è possibile misurare la quantità di carica presente nella regione che implementa il bit.
c. i bit sono implementati da regioni magnetizzate in due possibili direzioni; l’unità di lettura è
costituita da un elemento che si polarizza concordemente alla regione magnetizzata, un metallo
normale e un ferromagnete con magnetizzazione opportunamente bloccata; facendo scorrere una
corrente è possibile misurare la resistenza del sandwich stabilendo la direzione di magnetizzazione
della regione che implementa il bit.
[La risposta esatta è la c.]
La spintronica – Domande
1) Qual è la differenza tra un paramagnete e un ferromagnete?
2) In cosa consiste il modello a due canali per la conduzione elettrica nei metalli ferromagnetici?
3) Che cos’è l’accumulazione di spin?
4) Qual è l’applicazione più famosa dell’effetto GMR?
79
4.6. Test e quesiti
Come si definisce la lunghezza di rilassamento di spin?
a.
b.
c.
d.
e.
La media geometrica delle lunghezze degli strati magnetici di un dispositivo F-N-F.
La lunghezza ottimale per lo strato non magnetico di un dispositivo F-N-F.
La lunghezza ottimale del primo strato magnetico di un dispositivo F-N-F.
In un decadimento esponenziale, è la lunghezza sulla quale l’accumulazione di spin si riduce di e−1.
La lunghezza ottimale del secondo strato magnetico di un dispositivo F-N-F.
[La risposta corretta è la d.]
Che cos’è l’accumulazione di spin in una giunzione F−N?
a. A causa del campo magnetico interno in un ferromagnete, gli spin del metallo normale tendono ad
avvicinarsi alla regione di giunzione, determinando l'accumulazione di spin.
b. Poiché in un ferromagnete la corrente elettrica è trasportata in misura uguale dagli elettroni con spin
opposto, nella regione di giunzione F−N, deve avvenire un trasferimento di elettroni dalla popolazione
di spin minoritaria verso quella maggioritaria. Le due popolazioni di spin sperimentano quindi un
potenziale di segno opposto. La differenza tra i due potenziali è detta accumulazione di spin.
c. L’accumulazione di spin corrisponde alla quantità di spin acquistata dagli elettroni di conduzione in
un ferromagnete.
d. In una giunzione F−N l’accumulazione di spin corrisponde alla quantità d’informazione che può
essere accumulata.
e. Poiché in un ferromagnete la corrente elettrica è trasportata in misura diversa dagli elettroni con spin
opposto, nella regione di giunzione F−N deve avvenire un trasferimento di elettroni dalla popolazione
di spin maggioritaria verso quella minoritaria. Le due popolazioni di spin sperimentano quindi un
potenziale di segno opposto. La differenza tra i due potenziali è detta accumulazione di spin.
[La risposta corretta è la e.]
Qual è la resistenza, nel modello a due canali, per la configurazione antiparallela della
giunzione F−N−F ? Si assuma che i due ferromagneti siano uguali con resistenze R↑ e R↓ per
gli spin maggioritari e minoritari e che RN sia la resistenza del metallo normale.
a.
b.
c.
d.
e.
(R↓+R↑+R N)/2
2/(R↓+R↑+RN)
(R↑+R↓+R N)/2(2R↓+R N) (2R↑+R N)
(2R↓+R N) (2R↑+R N)/2(R↑+R↓+R N)
2(R↓+R↑+R N)
[La risposta corretta è la a.]
Quale tra le seguenti affermazioni definisce il modello a due canali usato in spintronica?
a. A causa del campo magnetico interno, gli elettroni di conduzione di un ferromagnete possono essere
divisi in due gruppi individuati dalla proiezione dello spin lungo il campo magnetico interno. I due
gruppi costituiscono due conduttori in parallelo.
b. In una giunzione ferromagnete-metallo (F−N), i due canali corrispondono alla conduzione degli
elettroni nel ferromagnete e nel metallo normale, rispettivamente.
c. In un ferromagnete gli elettroni portatori di corrente possono essere divisi in due gruppi a seconda
del segno della proiezione dell’impulso sull’asse che individua la direzione della corrente elettrica.
d. A causa del campo magnetico interno, gli elettroni di conduzione di un ferromagnete possono essere
divisi in due gruppi individuati dalla proiezione dello spin lungo il campo magnetico interno. I due
gruppi costituiscono due conduttori in serie.
80
e. I due canali individuano le regioni dove la corrente scorre in senso opposto.
[La risposta corretta è la a.]
Che cos’è la relazione costitutiva di un mezzo materiale con proprietà magnetiche?
a. La relazione che definisce il grado di resistenza del mezzo in presenza di un campo magnetico.
b. Il valore del campo magnetico esterno necessario per invertire la magnetizzazione del mezzo.
c. La relazione che definisce il valore del campo magnetico esterno necessario per magnetizzare il
mezzo.
d. La relazione che definisce la dipendenza della magnetizzazione dal campo magnetico, M(H).
e. La relazione B=H+M(H) che lega l’induzione B con la magnetizzazione M e il campo magnetico H.
[La risposta corretta è la e.]
Se indichiamo con Ri,↑ e Ri,↓ le resistenze dei portatori maggioritari e minoritari del
ferromagnete i-esimo con i =1,2, qual è la configurazione parallela?
a.
b.
c.
d.
e.
R1,↑=R2,↑ e R1,↓=R2,↓
R1,↑=R2,↓ e R1,↓=R2,↑
R1,↑=R2,↑=R1,↓=R2,↓
R1,↑=R2,↓ e R1,↓=R2,↓
R1,↑=R2,↑ e R1,↓=R2,↑
[La risposta corretta è la a.]
81
Cap. 5
L’effetto Hall quantistico
5.1. Fenomenologia dell’effetto Hall quantistico. Densità degli stati.
5.2. Livelli di energia di Landau per una particella in presenza di un campo magnetico.
5.3. Trattazione matematica
5.4. Stati di bordo e quantizzazione della resistenza di Hall.
5.5. Appendice: argomento di Laughlin
5.6. Test ed esercizi
5.1. Fenomenologia dell’effetto Hall quantistico
Effetto Hall Quantistico (QHE)
Nel 1985 viene assegnato il premio Nobel per la fisica a
Klaus von Klitzing per la sua scoperta, avvenuta nel 1980,
dell’effetto Hall quantistico in un gas elettronico
bidimensionale. È uno dei premi Nobel più veloci della
storia della fisica: questo a testimoniare l’importanza della
scoperta, subito compresa da tutta la comunità scientifica.
Klitzing tra l’altro era relativamente giovane, non aveva
ancora quarant’anni.
Vedi anche il sito della Nobel Foundation.
Abstract. L’effetto Hall quantistico è l’equivalente quantistico dell’effetto Hall classico. L'effetto Hall
quantistico è osservato in sistemi elettronici bidimensionali ad alta mobilità e basso disordine. Un tale
sistema elettronico raffreddato a temperature inferiori a 1 K e sottoposto a un forte campo magnetico
mostra delle sconcertanti deviazioni rispetto al comportamento previsto dalla teoria classica. In primo
luogo, la resistenza di Hall in tali condizioni non è più una funzione lineare del campo magnetico ma
rimane costante in corrispondenza di alcuni intervalli del valore del campo. In secondo luogo, la
resistenza longitudinale (definita come il rapporto tra differenza di potenziale alle estremità di uno
stesso lato del sistema elettronico e la corrente iniettata nello stesso) si annulla in corrispondenza degli
stessi intervalli del valore del campo, pertanto il sistema elettronico si comporta come se fosse un
superconduttore in quanto supporta un flusso di corrente non dissipativo. Gli intervalli del valore del
campo magnetico B per i quali si osservano questi effetti sono centrati intorno a valori di B tali che:
nh
B  0 , dove e indica la carica elementare dell’elettrone, h è la costante di Planck e il numero
e
quantico ν (detto fattore di riempimento) prende valori interi (1, 2, 3, ...).
La larghezza di tali intervalli cresce all’aumentare del livello di disordine presente nel sistema
elettronico. In corrispondenza di tali intervalli il sistema è quantizzato, in quanto il suo comportamento
a livello macroscopico dipende in modo critico da effetti quantistici (come avviene per esempio nei
82
superconduttori o nei superfluidi). La quantizzazione del sistema ha l'effetto di annullare la probabilità
di urti dissipativi tra portatori di carica e reticolo cristallino e di conseguenza di azzerare la resistenza
longitudinale; allo stesso tempo la conduttanza di Hall σ del sistema (definita come il reciproco della
resistenza di Hall) può assumere solo valori multipli interi di un quanto fondamentale di conduttanza:
e2
 
h
Nell’effetto Hall quantistico ordinario, o intero, il numero quantico ν (detto fattore di riempimento)
prende valori interi (1, 2, 3, ...). Mentre in un altro tipo di effetto Hall quantistico, conosciuto come
frazionario, la ν assume valori di frazioni con numeratore intero e denominatore intero dispari.
Il gas bidimensionale in un mosfet
La scoperta dell’effetto Hall quantistico avviene in un sistema conduttivo che viene
chiamato gas elettronico bidimensionale, dove sostanzialmente gli elettroni sono
confinati in due dimensioni.
Come avviene tutto ciò?
Si utilizza un dispositivo composto di più parti, un MOSFET.
Un MOSFET (metal-oxide field-effect transistor) è costituito da un campione di silicio
semiconduttore (tridimensionale, indicato in verde) cui è sovrapposto uno strato di
ossido isolante (ossido di silicio SiO2) seguito da uno strato metallico carico
positivamente.
Se si applica una tensione positiva allo strato metallico si viene a creare un campo
elettrico diretto verso il basso, concorde con l’asse z segnato in figura. Gli elettroni del
silicio semiconduttore sono attratti verso l’alto, verso il metallo, ma non possono entrare
nell’isolante a causa del gap d’energia, e sono quindi schiacciati e confinati in un sottile
strato, dove le cariche hanno la possibilità di muoversi soltanto nelle due direzioni x e y.
Questo strato è il gas bidimensionale.
In prima approssimazione è come se prendessimo gli elettroni in una scatola ed
eliminassimo una delle coordinate (la coordinata z in questo caso). L’energia cinetica, ad
esempio, diventa
E cinetica 
p x2  p y2
2m
83
In che cosa consiste la scoperta di Von Klitzing? Nella quantizzazione della resistenza di
Hall, che abbiamo incontrato nel cap. 2, dedicato al modello di Drude. Abbiamo visto
che l’effetto Hall, scoperto da Edwin Hall nel 1879, cento anni prima della scoperta del
suo omologo quantistico, consiste nel fatto che, se facciamo scorrere corrente in un
conduttore immerso in un campo magnetico con direzione perpendicolare alla direzione
di scorrimento della corrente, si osserva una differenza di potenziale ai lati del
conduttore; questa differenza di potenziale è legata alla corrente da una resistenza,
chiamata appunto resistenza di Hall.
Quello che scopre Von Klitzing nel 1980 lavorando su dispositivi MOSFET è la
quantizzazione della resistenza di Hall
Nell’effetto Hall standard, utilizzando il
modello di Drude, abbiamo determinato
che la resistenza di Hall è lineare nel
campo magnetico.
A campi magnetici intensi dell’ordine di
decine di Tesla, la resistenza di Hall
assume valori che sono gli inversi di
multipli del quadrato della carica elettrica
diviso per la costante di Planck
Si noti che h/e2 ha proprio le dimensioni fisiche di una resistenza.
Quello che l’effetto Hall quantistico fa vedere è che la resistenza di Hall è quantizzata
con inversi di interi di una resistenza fondamentale che dipende solo da costanti
universali.
La cosa estremamente sorprendente è che questa quantizzazione è la stessa per tutti i
materiali ed è indipendente dalla bontà del materiale. Mentre la teoria della
conduzione elettrica nei solidi e nei metalli ci aveva abituato al fatto che la resistenza
varia da materiale a materiale e può essere migliorata o peggiorata a seconda di come il
materiale viene preparato, l’effetto Hall fa vedere che si ottengono dei valori per la
resistenza di Hall indipendenti da qualsiasi dettaglio particolare, per cui la spiegazione di
questo effetto deve essere ricercata in qualcosa di estremamente generale e di
estremamente fondamentale.
Giustamente questo esperimento richiamò l’attenzione di tutta la comunità scientifica
della fisica dello stato solido. Tra l’altro ebbe un’importanza notevolissima anche dal
punto di vista tecnologico perché fornisce uno standard di resistenza. Non è un caso che
84
Von Klitzing all’epoca collaborasse attivamente con l’Istituto Metrologico Tedesco a
Braunschweig.
Fenomenologia del QHE - Domande
1) Quali sono le dimensioni fisiche della combinazione e2/h?
2) Qual è la differenza tra effetto Hall classico e quantistico?
5.2. I livelli di Landau
Ripartiamo dalla descrizione dell’effetto Hall classico.
Elettroni in campo magnetico
Abbiamo scritto le equazioni del moto per gli elettroni
dv
m x  eBv y
dt
d 2 v x, y
eB
m
  c2 v x , y dove  c 
è la pulsazione di ciclotrone
dv y
2
m
dt
m
 eBv x
dt
Le equazioni del moto sono quelle di un oscillatore armonico con pulsazione di
ciclotrone (cfr. lez. 2). Gli elettroni confinati in un piano compiono, classicamente,
orbite circolari e le componenti x e y della velocità tendono a fare dei moti armonici.
Nella descrizione quantistica sarà dunque necessario quantizzare il moto di oscillatore
armonico.
Livelli di Landau
I livelli energetici di una particella quantistica carica in presenza di un campo
magnetico sono detti livelli di Landau perché Landau fu il primo a trattare il problema
85
negli anni Trenta del XX secolo. Essi sono espressi dalla formula standard dei livelli
dell’oscillatore armonico, ma con la pulsazione di ciclotrone al posto di quella classica:
1

E n   c  n   con n=0, 1, 2, …
2

Questa formula dipende da un unico numero quantico, n, dell’oscillatore. Questo fatto
deve indurre a qualche riflessione perché in realtà noi stiamo trattando un problema in
due dimensioni.
In assenza di campo B i livelli energetici devono essere quelli della particella libera:
dobbiamo pertanto confrontare/mettere-in-relazione la formula appena scritta con
quella dei livelli energetici per gli stati elettronici in due dimensioni a campo nullo
E nx n y
4 2  2 2
2


n

n
x
y
2
2mL
In questa seconda formula l’energia dipende da due numeri quantici, uno per la
direzione x (nx) e uno per la direzione y (ny)
Se in assenza di campo magnetico abbiamo due numeri quantici mentre in presenza di
un campo magnetico abbiamo un unico numero quantico questo significa che in
presenza di un campo magnetico esiste un numero quantico che non appare
esplicitamente nell’espressione dell’energia: quando un numero quantico non appare
esplicitamente nell’espressione dell’energia significa che i livelli energetici (i livelli di
Landau) devono essere degeneri rispetto a quel numero quantico. E quindi
possiamo dire che i livelli di Landau sono caratterizzati da un certo grado di
degenerazione.
Cerchiamo di capire l’origine di questa degenerazione. Per far questo dobbiamo
sviluppare alcuni argomenti relativi allo spazio delle fasi introdotto nel Capitolo 1.
Spazio delle fasi
Classicamente gli stati di una particella sono individuati dal valore delle componenti
cartesiane della posizione e dell’impulso. Il numero totale di queste componenti
determina la dimensione del cosiddetto spazio delle fasi. Nel caso di un moto libero in
due dimensioni vincolato in un quadrato di lato L, il volume dello spazio delle fasi a
disposizione delle particelle sarà il prodotto del volume del sottospazio delle coordinate
spaziali per il volume del sottospazio delle coordinate impulso. Il volume di quest’ultimo
dipende dall’energia delle particelle.
Un modo per passare dalla meccanica classica a quella quantistica è quello di
discretizzare lo spazio delle fasi classico, introducendo delle celle di dimensione unitaria
pari alla costante di Planck per ogni grado di libertà. Questo argomento è già apparso alla
fine del Cap. 3 quando siamo passati dalle sommatorie agli integrali.
86
Numero di stati quantistici
In meccanica quantistica, il numero di stati si ottiene dividendo il volume dello spazio
delle fasi per quello della cella elementare. Il prodotto di un impulso per una coordinata
ha le dimensioni fisiche di un’energia per un tempo. Queste dimensioni fisiche sono
quelle della costante di Planck. La cella elementare è dunque determinata dalla
costante di Planck elevata a una potenza pari al numero di coppie coordinataimpulso necessarie per descrivere il moto. Nel caso di un moto in due dimensioni,
la cella elementare è data quindi dalla costante di Planck al quadrato.
h 2  2 
2
Densità degli stati
Se consideriamo un cerchio di raggio p nel sottospazio degli impulsi, la sua area
moltiplicata per l’area del quadrato di lato L (superficie della scatola, che corrisponde al
“volume” della parte spaziale dello spazio delle fasi) e divisa per la costante di Planck al
quadrato determina il numero di stati con valore dell’impulso uguale o minore di p.
Se vogliamo, ad esempio, calcolare il numero di stati quantistici che si trovano in una
corona circolare compresa tra i cerchi di raggio p e p+dp dobbiamo calcolare l’area della
corona, moltiplicarla per L2 (“volume” della parte spaziale dello spazio delle fasi) e
dividerla per h2.
il numero di stati (disponibili) con valore dell’impulso tra p e p+dp è dunque pari a:
2


p

dp
 p2
2
L
2 2
87
 L2
2 pdp
2 2
Densità degli stati N(E)
Poiché l’energia non dipende dalla direzione dell’impulso ma solo dal suo modulo, tutti
gli stati che si trovano sulla stessa circonferenza (che hanno cioè lo stesso modulo)
hanno la stessa energia; e poiché, viceversa, il modulo dell’impulso è funzione
dell’energia, possiamo chiederci quanti sono gli stati con energia compresa tra E e E+dE.
Usando il fatto che l’energia è una funzione quadratica dell’impulso, ricaviamo che il
numero di stati con energia compresa tra E (corrispondente a impulso p) e E+dE
(corrispondente a impulso p + dp) e lo stesso del numero di stati per l’impulso
compreso tra p e p + dp:
2 pdp
mL2
N E dE  L 

dE
2
2
2  2
2
dove si è tenuto conto del fatto che
p2
p
E
 dE  dp
2m
m
Nel caso in esame bidimensionale, si noti che N(E) non dipende da E.
Come possiamo utilizzare tale risultato?
Degenerazione dei livelli di Landau
A sinistra è mostrato lo spettro dei livelli energetici quando il campo B è assente. Questi
sono dei livelli discreti ma nei limiti delle dimensioni macroscopiche della regione di
spazio in cui gli elettroni sono confinati tali livelli tendono a diventare così fitti da
diventare un continuo; qui sono stati tracciati in maniera discreta per comodità di lettura.
88
Cosa accade quando “accendiamo” un campo magnetico? L’energia assume i
valori dei livelli di oscillatore armonico, i quali sono spaziati dalla quantità  c
eB
dove  c 
.
m
Se il campo B è abbastanza intenso la spaziatura tra i livelli sarà piuttosto marcata (come
segnato nella figura sopra, nella parte destra).
Poiché il numero di stati non può dipendere dal valore del campo magnetico, in ogni
livello di Landau (di oscillatore armonico) si “addensano” più livelli. Il grado di
addensamento determina la “degenerazione dei livelli di Landau” (si deve
intendere “degenerazione” come occupazione dello stesso livello energetico da parte di
più stati, per cui il livello risulta dotato di una “molteplicità”). Se siamo in grado di
calcolare esattamente quanti sono gli stati che vanno a condensarsi in un unico livello di
oscillatore armonico siamo in grado di calcolare la “degenerazione dei livelli di Landau”.
Applicando l’idea del “principio di conservazione degli stati” (gli stati non possono
sparire!) e assumendo come ragionevole che questo raggruppamento sia uniforma lungo
l’asse delle energie (N.d.C.: che la “molteplicità” sia la stessa per ogni livello di Landau),
possiamo calcolare che in un intervallo  c (distanza tra un livello di Landau e il
successivo) ci sarà un numero di stati pari a questa distanza di energia per la numerosità
degli stati in assenza di campo magnetico.
(qui la numerosità è da intendersi come dn/dE
che corrisponde all’N(E) visto sopra)
Il valore g della degenerazione dei livelli di Landau si ottiene moltiplicando N(E)
per l’intervallo energetico tra un livello di Landau e il successivo quando il campo è
diverso da zero:
mL2
2 eB
g  N E c 



L
c
2 2
h
cioè: maggiore è il campo B maggiore è la degenerazione dei livelli di Landau.
Siamo ora in grado di definire quello che viene chiamato
fattore di riempimento
Il fattore di riempimento è definito come il rapporto tra il numero di elettroni nel
sistema e il numero di stati in un livello di Landau, cioè la degenerazione g che
abbiamo calcolato (esso ci dice in sostanza quanti elettroni possono andare a occupare lo
stesso livello di Landau). Il numero di elettroni in un sistema bidimensionale è dato dal
prodotto della densità superficiale n di elettroni per l’area del sistema, che corrisponde
all’area del quadrato di lato L che stiamo considerando.
nL2
hn
v


Fattore di riempimento
eB h L2 eB
Esso indica quanti livelli di Landau sono stati riempiti.
89
Siamo ora in grado di capire una parte dell’origine della
quantizzazione della resistenza di Hall
Supponiamo ora di avere un numero di elettroni tale da riempire un numero intero di
livelli di Landau, cioè tale da avere livelli di Landau o completamente pieni o
completamente vuoti, ovvero il numero di elettroni deve essere un multiplo della
degenerazione dei livelli di Landau, il che è lo stesso che dire che il fattore di
riempimento (che indica quanti livelli di Landau sono stati riempiti) è pari a un numero
intero.
Questo valore del fattore di riempimento (un numero intero) determina una relazione tra
il campo magnetico e la densità: v 
hn
. Se prendiamo l’espressione classica della
eB
B
R

resistenza di Hall, quella ricavata dal modello di Drude, H
en , e, nell’ipotesi che
abbiamo un numero intero di livelli di Landau riempito, esprimiamo il campo B
utilizzando il fattore di riempimento visto sopra ( B 
hn
)
ev
otteniamo
RH 
B
1 hn h 1


en en ev e 2 v
formula in cui la densità n, che è una caratteristica del materiale, si semplifica e sparisce.
La RESISTENZA DI HALL QUANTIZZATA assume esattamente il valore
osservato negli esperimenti: è quantizzata nel senso che il suo inverso è pari a un
numero intero per una costante. Tale costante è pari al quadrato della carica
divisa per la costante di Planck.
Introduciamo ora
la costante di Von Klitzing
Nel SI (sistema internazionale) delle unità di misura una resistenza è misurata in Ohm,
corrispondente dimensionalmente a


V 1 J 1 1 m 2 Kg m 2 Kg
m 2 Kgs 1  h 
 

 2 3 
  2
2
2
A A C A As s
As
 As 
e 
La combinazione di costanti fondamentali come la costante di Planck e la carica
dell’elettrone determina un quanto naturale di resistenza o del suo inverso, cioè la
conduttanza. L’effetto Hall quantistico introduce la costante di von Klitzing
h
 RK  25812.807
2
e
90
Robustezza della Quantizzazione
Finora abbiamo visto che la quantizzazione della resistenza di Hall è la conseguenza di
due fatti:
1. quantizzazione delle orbite di ciclotrone;
2. il fattore di riempimento è un numero intero.
Il fattore di riempimento dipende dal campo magnetico
specifico; ci si può aspettare che solo per determinati
valori del campo magnetico si verifichi la quantizzazione
della resistenza di Hall. In altre parole, in un grafico BRH dovremmo vedere questa quantizzazione soltanto a
punti isolati di B. Invece, quello che gli esperimenti
fanno vedere è che la quantizzazione “è robusta”: si
estende su tratti estesi di valori del campo magnetico.
Quello che ancora non riusciamo a spiegare è la “robustezza della quantizzazione”, il
fatto cioè che la quantizzazione rimanga anche facendo variare il campo B.
Cosa succede esattamente quando facciamo variare il campo B? Cosa accade cioè se il
fattore di riempimento non è intero (che è quel che accade se, a numero di elettroni
fissato, vi è una minima variazione del campo magnetico)? In base a quanto detto, non ci
sarebbe la quantizzazione. Eppure l’esperimento mostra una quantizzazione robusta su
intervalli finiti di campo magnetico!
Il motivo cercheremo di spiegarlo nel prossimo paragrafo.
Livelli di Landau – Test e domande
1) I livelli di Landau sono dati dalla quantizzazione delle orbite di ciclotrone di particelle cariche in un
campo magnetico. Tali livelli sono degeneri e il numero di elettroni diviso per la degenerazione dei
livelli di Landau
a. è inversamente proporzionale alla intensità del campo magnetico.
b. non dipende dalla intensità campo magnetico.
c. è direttamente proporzionale alla intensità del campo magnetico.
2 eB
[La domanda chiede in sostanza l’espressione n g  n L
. La risposta corretta è la a.]
h
2) Che cos’è la densità degli stati?
3) Che cos’è il fattore di riempimento?
5.3. Trattazione matematica
Per la trattazione matematica dei livelli di Landau dobbiamo ricorrere al formalismo
generale della meccanica quantistica
Formulazione matematica
Equazione di Schrodinger H  E
per determinare i livelli energetici stazionari
91
Dato che la particella si muove sotto l’azione del campo magnetico, l’operatore
Hamiltoniano di una particella carica è scritto in termini del potenziale vettore A, il
cui rotore è il campo magnetico. Sappiamo che esistono diverse possibili scelte del
potenziale vettore A. Consideriamo la situazione di una particella confinata a muoversi
in un piano, che scegliamo essere il piano xy. Il campo magnetico è diretto lungo l’asse z.
L’invarianza di gauge ci dice inoltre che esistono diverse scelte del potenziale vettore A il
cui rotore dà sempre il medesimo campo B.
Nel formalismo hamiltoniano dobbiamo far entrare il potenziale vettore A, la cui
funzione risulta quella di “spostare” l’impulso.
Hamiltoniana in presenza di un campo magnetico
H

1
 i x  eAx 2   i y  eAy 2
2m



B  rotA
Formalmente essa ha l’aspetto dell’hamiltoniana di una particella in due dimensioni:
riconosciamo, ad esempio, che  i x è la componente dell’operatore impulso lungo la
direzione x e che  i y è la componente dell’impulso lungo la direzione y; entrambe
sono spostate di quantità proporzionali alle componenti x e y rispettivamente del
potenziale vettore moltiplicato per la carica.
Questa formulazione hamiltoniana della meccanica classica è equivalente alla forza di
Lorentz. Non ci interessa sapere come ci siamo arrivati; noi sappiamo che B è il rotore di
A e che A entra nell’hamiltoniana in questo modo. Partiamo da qua: ci interessa risolvere
l’equazione. L’invarianza di gauge ci permette, per un certo B, diverse scelte di A… e
dobbiamo operare una scelta opportuna di A.
Bx   y Az   z Ay


By   z Ax   x Az
B  rotA equivale a
Bz   x Ay   y Ax
Gauge di Landau
L’invarianza di gauge consente di avere diverse scelte del potenziale vettore che
corrispondono allo stesso campo magnetico. Poiché il campo magnetico nel nostro
esempio è uniforme ed è diretto lungo l’asse z, una scelta possibile per A è la cosiddetta
gauge di Landau (così chiamata perché introdotta da lui stesso)
Ax  0
Ay  Bx
Az  0
Si verifica facilmente che il rotore di questo A è proprio un campo B uniforme diretto
secondo l’asse z.
92
Funzione d’onda
Se usiamo la gauge di Landau, l’operatore Hamiltoniano dipende dai due impulsi px e py
e dalla sola coordinata x.
H

1
 i x 2   i y  eBx2
2m

Dato che Ax  0 la parte di operatore hamiltoniano che dipende dall’impulso in
direzione x assume la forma standard delle particelle in una scatola mentre la parte che
dipende dall’operatore impulso in direzione y risulta spostata di una quantità eBx.
L’osservazione importante è che per questa scelta di gauge l’operatore hamiltoniano
dipende da px e py e dalla sola coordinata x: il fatto che non ci sia dipendenza dalla
coordinata y ci dice che il nostro sistema è invariante per traslazioni lungo la direzione y.
Gli autostati di un sistema invariante per traslazioni sono le onde piane; ovvero, per quel
che riguarda la coordinata y la nostra funzione d’onda soluzione dell’equazione sopra
deve essere un’onda piana.
Questo permette di cercare la soluzione per la funzione d’onda nella forma di un
prodotto di un’onda piana lungo la direzione y per una funzione della variabile x.
Chiameremo p il vettore d’onda lungo la direzione y (è il parametro che indicizza
l’onda piana)
 x, y   eipy  x 
Oscillatore armonico
Facendo agire l’operatore Hamiltoniano sulla funzione d’onda così ottenuta, si ricava
 x  che dobbiamo determinare.
H x x   E x 
un’equazione di Schrödinger efficace per la
Quest’equazione corrisponde a quella di un oscillatore armonico con pulsazione di
ciclotrone.


1
 2 2 mc2
2
2
 i x    p  eBx    x 
x  xc 2
Hx 
2m
2m
2
p
x


L’origine dell’oscillatore non è nell’origine ma è in c
eB , determinata cioè dal
valore del numero quantico p che descrive l’onda piana nella direzione y.
Otteniamo dunque che il problema dell’hamiltoniano di una particella carica in presenza
di un campo magnetico si è ridotto al moto di onda piana lungo la direzione y e al moto
di un oscillatore armonico lungo la direzione x.
I numeri quantici che descrivono questo problema sono due, esattamente come
dovevamo aspettarci da ragionamenti fatti in precedenza… e sappiamo associarli a una
funzione d’onda particolare: il primo di tali numeri è quello che caratterizza
93
l’hamiltoniana, l’impulso p dell’onda piana; l’altro è il numero quantico associato
all’oscillatore armonico (con pulsazione di ciclotrone) (n=0, 1, 2, …) che indica il livello
energetico della particella carica in campo magnetico.
Ogni livello energetico è degenere e la degenerazione è descritta dall’impulso
dell’onda piana p, che determina l’origine del potenziale di oscillatore per ogni stato.
La degenerazione, che prima abbiamo calcolato con argomenti euristici e intuitivi,
può essere riottenuta calcolando quanti sono i possibili valori di p che caratterizzano
l’onda piana, e questo si può fare facilmente perché se consideriamo che il moto lungo la
direzione x è confinato entro una distanza L, i valori del centro possibile sono spaziati di
xc 
p
eB
Il valore della degenerazione g si riottiene considerando quanti centri di oscillatore
possono essere inseriti lungo la direzione x di estensione L:
L
LeB LeB eBL2
g



xc
p
h L
h
TEST. L’equazione di Schrodinger per un elettrone in un piano (x,y) sottoposto a un campo
magnetico uniforme ortogonale al piano stesso può essere ridotta
a. all’equazione dell’elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo x
che oscilla intorno a un punto di coordinata proporzionale all’intensità del campo magnetico.
b. all’equazione dell’elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo x
che oscilla intorno a un punto di coordinata proporzionale all’impulso totale dell’elettrone.
c. all’equazione dell'elettrone libero lungo la componente y e a quella di un oscillatore armonico lungo
x che oscilla intorno a un punto di coordinata proporzionale all’impulso dell’elettrone lungo y.
[La risposta esatta è la c.]
5.4. Gli stati di bordo
Effetto del confinamento
Abbiamo visto che l’energia dei livelli di Landau non dipende dal numero quantico p,
cioè dalla posizione del centro xc dell’oscillatore. Questo è vero però solo in un sistema
infinito dove ogni punto dello spazio è equivalente ad ogni altro: in tal caso possiamo
mettere l’oscillatore dove vogliamo e non varierà l’energia dei livelli. Se il sistema
(l’oscillatore armonico, che ha un potenziale quadratico) è confinato la situazione
cambia: la posizione dell’oggetto può influire sull’energia dei livelli. Questo può essere
compreso nel caso semplice di un oscillatore armonico confinato sulla semiretta positiva.
Ripensiamo per un attimo all’oscillatore armonico classico centrato nell’origine per il
quale i livelli di energia dono dati da
En   n  1 2 . Tali livelli di energia sono
94
classificati in “pari” e “dispari”: sono “pari” quelli per cui la relativa funzione d’onda è
una funzione pari, “dispari” quelli per cui la relativa funzione d’onda è dispari.
Se perturbiamo il nostro oscillatore confinandolo sulla semiretta positiva (ovvero se
innalziamo sull’origine una barriera di potenziale infinita per cui l’oscillatore può stare
soltanto, per esempio, nelle x positive), si possono calcolare i nuovi livelli energetici
dell’oscillatore confinato semplicemente selezionando dai livelli energetici originari quelli
che corrispondono a funzioni d’onda dispari rispetto al centro dell’oscillatore, livelli che
sono dati dalla seguente formula.
En  c 2n  3 2
L’energia di ogni livello risulta innalzata, in particolare quello stato fondamentale
corrispondente a n=0.
Vediamo qui sotto la funzione d’onda per i primi due livelli (n=0 e n=1) dell’oscillatore
armonico:
per n=0 la funzione d’onda del livello fondamentale non deve avere zeri e non deve
avere nodi;
per n=1 la funzione d’onda ha un nodo e, per simmetria, questo nodo è nell’origine.
Se l’oscillatore è confinato ai valori positivi della x (una barriera di potenziale infinita
nell’origine), la funzione d’onda deve aggiustarsi con le nuove condizioni nell’origine;
solo il livello n=1 è permesso, in quanto la sua funzione d’onda si annulla nell’origine.
Questo è vero per tutti i valori dispari di n, che continuano ad essere dunque “buone”
funzioni d’onda per il nuovo problema “confinato”.
(Nota: l’n=0 della nuova formula coincide con l’n=1 della primitiva, l’n=1 corrisponde
all’n=3 della primitiva, l’n=2 corrisponde all’n=5 della primitiva)
Il fatto che i livelli energetici dell’oscillatore risultino aumentati per effetti di bordo si
traduce nella seguente figura:
95
La figura mostra a titolo di esempio l’andamento dei primi quattro livelli di Landau nel
caso in cui le particelle sono confinate lungo la direzione x. Per valori di xc (centro di
oscillazione dell’oscillatore armonico) lontani dal bordo sono possibili tutti i valori di
energia dell’oscillatore armonico e i livelli di energia sono quelli soliti, equispaziati tra
loro. Si noti come l’energia del livello vari invece in modo pronunciato in prossimità dei
bordi. La pendenza potrà essere più o meno brusca a seconda delle situazioni.
Relazione tra energia e velocità
Per effetto del confinamento, l’energia dei livelli di Landau (perde la degenerazione
dovuta al numero p e) acquista una dipendenza dalla posizione del centro dell’oscillatore
xc, e quindi anche dal numero quantico p.
En, p 
(n indica il livello di Landau)
La derivata dell’energia rispetto al numero quantico p (che parametrizza l’onda piana
lungo la direzione y) determina la velocità lungo la direzione y dello stato individuato
dalla coppia n e p.
v y n, p  
E n, p 
p
Come utilizziamo questo risultato?
96
Corrente di un livello di Landau
La corrente di un livello di Landau (indicato da n) è data dalla velocità lungo la direzione
y integrata sui valori del numero quantico p. La corrente risulta quindi pari alla frazione
(e/h) per l’intervallo di energie coinvolte.
J n, y  e
dp
dp E n, p  e
e
v y n, p   e 
  dE  E
h
h
p
h
h
Questo è il primo passo verso la comprensione dell’effetto Hall quantistico.
TEST. Se consideriamo un oscillatore armonico e imponiamo che sia confinato in una
opportuna regione di spazio:
a. i livelli energetici dell’oscillatore si alzano; l’effetto è più marcato se il centro di oscillazione è vicino
ai bordi della regione di spazio.
b. i livelli energetici dell’oscillatore si abbassano; l’effetto è più marcato se il centro di oscillazione è
vicino ai bordi della regione di spazio.
c. i livelli energetici dell’oscillatore si alzano; l’effetto è più marcato se il centro di oscillazione è lontano
dai bordi della regione di spazio.
Cerchiamo di dare una rappresentazione intuitiva di quanto visto finora.
Stati di bordo
Poiché la corrente è diversa da zero per gli stati per cui la derivata dell’energia rispetto a
p è diversa da zero, la corrente nel regime di effetto Hall quantistico è dovuta
principalmente agli stati di bordo.
Dal punto di vista classico possiamo interpretare questo fatto come illustrato nella figura.
L’elettrone vicine al bordo non potrà completare la sua orbita e subirà una riflessione. Le
orbite che si propagano lungo i bordi riescono a mantenere sempre lo stesso verso
medio di propagazione, a differenza per quanto accade per le orbite lontane dai bordi al
centro del sistema, classicamente circolari.
97
Queste orbite che scivolano (verso il basso o verso l’alto a seconda della parete
considerata) sono dette in inglese skipping orbits. Nella figura sotto a sinistra sono
rappresentate tratteggiate.
La velocità (derivata dell’energia rispetto alla quantità di moto) ha segno opposto agli
opposti confini della regione di confinamento, le diverse velocità sono i diversi sensi di
scorrimento degli stati di bordo.
Stati di bordo ed effetto Hall
Quando si effettua una misura Hall essenzialmente si “contattano” i due bordi del
conduttore e si misura la corrente che scorre nel sistema.
In assenza di potenziale di Hall entrambi i bordi si trovano alla stessa energia che è
l’energia di Fermi che è quella di equilibrio. Quando applichiamo (leggi: si misura) una
differenza di potenziale significa che un bordo avrà stati popolati a un’energia
leggermente superiore pari al potenziale di Hall moltiplicato per la carica unitaria.
Gli stati di bordo a destra portano una corrente positiva fino all’energia E F. Gli stati sul
bordo opposto, una corrente negativa fino all’energia EF+eVH.
Nella figura di destra sono riportati in rosso i due livelli di Landau più bassi. Delle due
linee tratteggiate, quella nera più in basso rappresenta l’energia di Fermi quando non è
applicata nessuna differenza di potenziale: il numero di stati di bordo che vanno in una
direzione è lo stesso del numero di stati di bordo che vanno nell’altra direzione. In
situazione di equilibrio non si ha corrente. Quando si applica (leggi: si misura) una
differenza di potenziale VH tra i due bordi si popolano in maniera diversa gli stati di
bordo.
Gli stati di energia tra EF ed EF+eVH sono popolati solo da un lato: questi non possono
essere compensati e danno origine a una corrente netta.
Quanto vale tale corrente?
e
e
e2
J  E  eVH  VH
h
h
h
98
la costante di proporzionalità tra corrente e potenziale di Hall è proprio l’inverso della
resistenza di Hall.
Non abbiamo però ancora spiegato la
Robustezza della quantizzazione
della resistenza di Hall
Supponiamo che il potenziale chimico, cioè l’energia di Fermi, si trovi al livello più basso
(retta tratteggiata più in basso nella figura sotto). In questa situazione soltanto il livello di
Landau più basso interseca l’energia di Fermi. Quindi, se facciamo una misura di Hall,
alla corrente parteciperanno soltanto gli stati di bordo relativi al livello di Landau più
basso. E se facciamo il ragionamento della diapositiva precedente ritroviamo la
quantizzazione.
Che cosa accade se variamo l’energia di Fermi?
Variare l’energia di Fermi significa variare il numero di elettroni a disposizione, e questo
significa popolare un livello di Landau rispetto a un altro; matematicamente questo è
equivalente a variare il campo magnetico perché il campo magnetico controlla la
degenerazione dei livelli, quindi se, fissato il numero di elettroni, variamo il campo
magnetico variamo come i livelli vengono popolati; se invece manteniamo fisso il campo
magnetico allora variare il numero di livelli riempiti significa variare il numero di
elettroni.
Per comodità è più semplice pensare di aggiungere elettroni.
Se dunque, aggiungendo elettroni, cominciamo a riempire altri stati di bordo sempre più
in alto a un certo punto si incontra il secondo livello di Landau. Appena incontrato il
secondo livello di Landau dovrebbe cambiare il valore della quantizzazione.
In realtà la situazione è più complessa
perché in un sistema reale – diverso da
quello ideale considerato fin qui – possono
esistere imperfezioni, atomi che mancano
che in un sito reticolare, possono quindi
esistere
una
serie
di
termini
nell’hamiltoniana che rompono l’invarianza
traslazionale considerata fino ad adesso;
questo significa che invece di avere un
livello di Landau completamente degenere
anche al centro del nostro sistema, questo
livello di Landau può spezzettarsi, scindersi
in livelli non degeneri.
Questo spezzettarsi del livello originario è rappresentato nella figura qui sopra a sinistra
dalle regioni tratteggiate che rappresentano appunto un insieme di livelli che si trovano
in quella regione di energia.
99
In generale, dunque, la presenza di imperfezioni nei materiali determina una parziale
rimozione della degenerazione dei livelli di Landau all’interno del sistema in modo da
creare una banda di livelli.
L’assunzione che allora si fa (giustificata da considerazioni teoriche più avanzate) è che
questi livelli non degeneri siano localizzati al centro del sistema e non siano in grado di
portare corrente.
Quindi, quel che accade quando aumentiamo il numero di elettroni, il potenziale chimico
ovvero l’energia di Fermi comincia a spostarsi verso l’alto; quando incontra il secondo
livello di Landau per prima cosa incontra degli stati localizzati (al centro) che non
conducono corrente: comincia a popolarli ma non cambia il numero di stati bordo che
partecipa alla corrente; e quindi non cambia la quantizzazione. In prossimità dei bordi
resta dominante il potenziale di confinamento e permangono gli stati di bordo. Una
variazione della popolazione dei livelli, fintanto che è limitata ai livelli interni al sistema
non disturba la quantizzazione che rimane dunque “robusta”.
Naturalmente, quando l’energia di Fermi sale ancora e la linea tratteggiata più in alto
arriverà a toccare gli stati di bordo del secondo livello di Landau, allora questi stati di
bordo cominceranno anch’essi a condurre e allora la quantizzazione passerà a un livello
di quantizzazione diversa, cioè al gradino successivo.
Questa cosa si ripete, continuando ad aumentare il numero di elettroni, per tutti i livelli
di Landau; di qui l’aumento a gradini della resistenza di Hall e quindi la robustezza al
variare del campo magnetico.
Perché RH varia a tratti?
Siamo ora in grado di capire perché la resistenza di Hall ha un andamento a tratti. A un
dato valore del campo magnetico, e quindi a un determinato valore della degenerazione
dei livelli di Landau, solo un numero finito di livelli di bordo si trova all’energia di Fermi.
Tale numero determina la quantizzazione della resistenza di Hall. Al variare del campo
magnetico, il livello di Fermi si sposta e altri stati possono essere o popolati o svuotati.
Fintanto che gli stati coinvolti sono quelli lontani dai bordi, il valore della resistenza di
Hall non cambia, determinando un andamento piatto. La resistenza di Hall può solo
cambiare per l’occupazione o lo svuotamento di uno stato di bordo.
Osservazioni conclusive
L’effetto Hall quantistico è una spettacolare manifestazione di un comportamento
quantistico su scala macroscopica. Ciò può avvenire in quanto la degenerazione dei livelli
di Landau indotta dal campo magnetico permette che un numero macroscopico di
elettroni si trovi alla stessa energia e che non sia possibile la dissipazione a causa di un
gap d’energia tra lo stato fondamentale egli stati eccitati. Lo stato fondamentale rimane
dunque assai stabile. Dal punto di vista della resistenza longitudinale, un sistema Hall
quantistico può definirsi un isolante: cioè, quando la resistenza Hall (trasversa) è
quantizzata quella longitudinale è pari a zero.
100
Gli stati di bordo – Test e domande
1) Quando per descrivere l’effetto Hall quantistico si considera una situazione più realistica in cui
possono essere presenti delle imperfezioni nei materiali:
a. parte della degenerazione degli stati di oscillatore che oscillano lontani dal bordo è rimossa; gli
elettroni in tali stati conducono corrente e quando l’energia di Fermi raggiunge uno di essi
cambia il valore della resistenza.
b. parte della degenerazione degli stati di oscillatore che oscillano lontani dal bordo è rimossa; gli
elettroni in tali stati non conducono corrente; al contrario, per gli stati di bordo continua a
dominare il potenziale di confinamento.
c. parte della degenerazione degli stati di oscillatore che oscillano in prossimità del bordo è
rimossa; gli elettroni in tali stati non conducono corrente, al contrario degli elettroni negli stati
di oscillatori lontani bordo.
[La risposta corretta è la b.]
2) Perché il confinamento aumenta l’energia dei livelli elettronici?
3) Che cosa determina la direzionalità degli stati di bordo?
4) Che cosa determina il comportamento a tratti della resistenza di Hall?
5.5. Appendice: argomento di Laughlin
Un potente argomento dovuto a Robert Laughlin mostra che la quantizzazione della
resistenza di Hall è il risultato di alcuni principi molto generali. Questi sono:
1. La legge di Faraday in base alla quale una variazione di flusso concatenato con un
circuito induce in quest’ultimo una forza elettromotrice.
2. Il comportamento della funzione d’onda per una trasformazione di gauge.
3. L’ipotesi che il sistema si trovi in un cosiddetto gap di mobilità, cioè l’energia di Fermi
si trovi in una regione d’energia senza stati o con stati localizzati.
Consideriamo un elettrone in campo magnetico. L’equazione d’onda è


2

1
 i  eA   E
2m
 2
1
i
 i  0  E 0
Cerchiamo la soluzione nella forma   e  0 con
2m


La fase può essere scelta come l’integrale di linea del potenziale vettore, a patto che
questi sia longitudinale, cioè sia pura gauge

r

r

  
  
2
2
 r   
dr ' Ar '  
dr ' Ar '
h e r0
 0 r0
101
Immaginiamo una struttura anulare. Nella corona
circolare è presente un campo magnetico B
perpendicolare. Tra i bordi esterno ed interno è
presente una differenza di potenziale VH e una
corrente I scorre in direzione azimutale. Inoltre
supponiamo di concatenare, mediante un solenoide,
un flusso all’interno dell’anello, come mostrato. Il
campo magnetico del solenoide quindi non è
presente nella corona circolare dove si trovano gli
elettroni.
Benché gli elettroni nella corona non sentano il campo magnetico del solenoide, le loro
funzioni d’onda sentono il flusso da esso creato. Ora bisogna distinguere due casi. Se la
funzione d’onda è localizzata in una regione piccola, allora il flusso può essere eliminato
mediante una trasformazione di gauge. Se la funzione è delocalizzata su tutto la corona
circolare, la trasformazione di gauge è possibile solo se si garantisce che la funzione
d’onda sia ad un sol valore. Per questo si richiede che la variazione di flusso debba essere
un multiplo del quanto Φ0=h/e.
Il potenziale vettore responsabile del flusso è puramente azimutale


A
eˆ
2r
La derivata dell’operatore Hamiltoniano è quindi espressa in termini dell’operatore
corrente lungo la direzione azimutale
H


ˆ 
J r   eˆ
2r
Ricordiamo il teorema di Feynman-Hellman
da cui
E
H


 
 
H   H





H

 
 E
  


H
 


ˆ 
r   eˆ
J
E
H
 
  
  1


2r
102
La variazione di flusso induce nel circuito una forza elettromotrice che compie lavoro
sulla corrente che scorre in direzione azimutale. Tale lavoro, in assenza di dissipazione a
causa del gap di mobilità, deve risultare in energia assorbita dal sistema. Poiché la
variazione di un quanto di flusso risulta in una trasformazione di gauge, lo spettro del
sistema resta invariato. L’energia assorbita deve quindi corrispondere ad una diversa
distribuzione degli elettroni nei livelli energetici, cioè in un trasferimento di un numero
intero di elettroni da un bordo all’altro con variazione di energia
E  neVH
Applicando la relazione del teorema di Feynman-Hellman e valutando la derivata come il
rapporto tra la variazione di energia e la variazione di flusso, si ottiene la quantizzazione
della resistenza di Hall
E

neVH
e2
I
 n VH
he
h
I 
5.6. Test ed esercizi
Qual è il principio mediante il quale si realizza un gas elettronico bidimensionale in un
dispositivo MOSFET?
a. In un dispositivo MOSFET si ha un sistema composto metallo-isolante-semiconduttore. Gli
elettroni non possono passare dal metallo all’isolante e formano nel metallo uno gas bidimensionale.
b. In un dispositivo MOSFET, un semiconduttore è immerso in un gas, la cui pressione esercita una
forza sugli elettroni obbligandoli a restare vincolati alla superficie del semiconduttore.
c. In un dispositivo MOSFET, un semiconduttore è in contatto con un isolante, cui è sovrapposto un
metallo carico negativamente. Gli elettroni sono quindi respinti verso l’interfaccia isolantesemiconduttore, ma non possono oltrepassarla a causa della gap d’energia nell’isolante.
d. In un dispositivo MOSFET, un semiconduttore è in contatto con un isolante, cui è sovrapposto un
metallo carico positivamente. Gli elettroni sono quindi attratti verso l’interfaccia isolantesemiconduttore, ma non possono oltrepassarla a causa della gap d’energia nell’isolante.
e. In un dispositivo MOSFET si ha un metallo molto sottile compreso tra un isolante ed un
semiconduttore. Nel metallo si crea un gas elettronico bidimensionale.
[La risposta corretta è la d.]
Quali sono le costanti fisiche fondamentali che appaiono nell’espressione della resistenza di
Hall quantizzata?
a.
b.
c.
d.
e.
La costante di Planck h e la carica unitaria e.
La costante di Planck h e la velocità della luce c.
La costante di Planck h e la costante di Boltzmann kB.
La costante di Planck h e la massa dell’elettrone m.
La carica unitaria e, la costante dielettrica del vuoto ϵ0 e la velocità della luce c.
[La risposta corretta è la a.]
103
Quali sono le equazioni del moto classiche di una particella di carica q vincolata a muoversi su
un piano (piano xy) in presenza di un campo magnetico perpendicolare al piano stesso?
a.
b.
c.
d.
e.
m dvx/dt=q vx Bz,
m dvx/dt=q vy/ Bz
m dvx/dt = q Bz
(1/m) dvx/dt =q vy Bz
m dvx/dt =q vy Bz
m dvy /dt=−q vy Bz
m dvy /dt=−q vx/Bz
m dvy /dt=−q Bz
(1/m) dvy/dt=−q vx Bz
m dvy /dt=−q vx Bz
dvx
 eBv y
dt
[la risposta corretta è
con q al posto di – e. ]
dv y
m
 eBv x
dt
Quale delle seguenti espressioni descrive la funzione hamiltoniana in un campo magnetico di
una particella di carica q e vincolata a muoversi in un piano?
m
a.
b.
c.
d.
e.
H=1/2m [(−iℏ∂x−qAx)2+(−iℏ∂y−qAy)2], con A=rotB.
H=1/2m [(−iℏ∂x−qAx)2+(−iℏ∂y−qAy)2], con B=rotA.
H=1/2m [(−iℏ∂x−qAy)2+(−iℏ∂y+qAz)2], con B=rotA.
H=1/2m [(−iℏ∂x−qBx)2+(−iℏ∂y−qBy)2].
H=1/2m [(−iℏ∂x)2+(−iℏ∂y)2]+ B ⋅ rotA .
[La risposta corretta è la b.]
Cosa sono i “livelli di Landau”?
a. I valori massimi dei raggi delle orbite di una particella quantistica in un campo magnetico applicato.
b. Le massime ampiezze della funzione d’onda di una particella quantistica carica in un campo
magnetico.
c. I livelli energetici per gli elettroni in un gas bidimensionale.
d. I livelli energetici di una particella quantistica carica in moto in presenza di un campo magnetico
applicato.
e. I valori energetici per i quali la resistenza di Hall è quantizzata.
[La risposta corretta è la d.]
Qual è il valore della distanza in energia tra due livelli di Landau in funzione del campo
magnetico?
a.
b.
c.
d.
e.
eB/ℏm
ℏmeB
(e/ℏ)mB
ℏeB/m
me/ℏB
[La distanza vale  c dove
c 
eB
]
m
Quale tra i seguenti potenziali vettori corrisponde alla gauge di Landau?
a.
b.
c.
d.
e.
Ax=−y/2,
Ax=By/2,
Ax=0,
Ax=0,
Ax=Bx,
Ay=Bx/2,
Ay=Bx,
Ay=0,
Ay=Bx,
Ay=By,
Az=0.
Az=0.
Az=0.
Az=0.
Az=Bz.
[La risposta corretta è la d.]
104
Come si calcola la degenerazione di un livello di Landau?
a. Il valore della degenerazione g si ottiene considerando il rapporto tra la distanza tra due centri
consecutivi di oscillatore e la distanza L tra i bordi: g=Δxc/L=heBL2
b. La degenerazione è pari al numero dei diversi stati di spin in cui può trovarsi un elettrone.
c. Il valore della degenerazione g si ottiene considerando quanti centri di oscillatore possono essere
inseriti lungo la direzione x di estensione L: g=L/Δxc=LeB/Δp=LeB/(h/L)=eBL2/h
d. La degenerazione si ottiene dividendo l’energia di Fermi per la distanza in energia tra due livelli di
Landau successivi.
e. Il valore della degenerazione g si ottiene considerando quanti centri di oscillatore possono essere
inseriti lungo la direzione x di estensione L: g=L/Δxc=Δp/LeB=(h/L)/LeB=h/eBL2
L
LeB LeB eBL2
]



xc
p
h L
h
Supponendo che tutti gli elettroni di un gas bidimensionale abbiano la stessa componente di
spin parallela al campo magnetico esterno, quanti posso accomodarne in un livello di Landau
completamente pieno?
[Si ricordi che g 
a. Posso accomodarne un numero pari all’inverso della degenerazione (h/eBA), dove A è l’area della
regione di piano che contiene il gas elettronico.
b. Posso accomodarne un numero pari alla degenerazione (eB/h)A, dove A è l’area della regione di
piano che contiene il gas elettronico.
c. Posso accomodarne un numero pari al prodotto della densità per l’area A della regione di piano che
contiene il gas elettronico.
d. Posso accomodarne un numero pari alla degenerazione (eh/B)A, dove A è l’area della regione di
piano che contiene il gas elettronico.
e. (errata) Posso accomodarne un numero pari alla metà della degenerazione (eB/h)A, dove A è l’area
della regione di piano che contiene il gas elettronico.
[La risposta corretta è la ...]
Perché l’energia dei livelli dei Landau in prossimità dei bordi è maggiore di quella dei livelli di
Landau al centro del volume del sistema?
a. Perché i centri degli oscillatori degli stati in prossimità dei bordi risentono dell’interazione
coulombiana tra gli elettroni.
b. Perché per gli stati di bordo non sono permessi i numeri quantici più bassi.
c. I livelli di Landau, che hanno il loro centro in prossimità dei bordi, risentono maggiormente del
confinamento, che tende ad aumentare l’energia degli stati.
d. I livelli di Landau, che hanno il loro centro in prossimità dei bordi, risentono in modo minore del
confinamento, che tende a diminuire l’energia degli stati.
e. Perché corrispondono a numeri quantici maggiori.
[La risposta corretta è la c… anche se, a rigor di termini,
non i livelli di Landau ma gli oscillatori hanno centro in una zona geometrica.]
L’energia di un livello di Landau E(n,p) dipende dai numeri quantici n (stato di oscillatore) e p
(connesso alla distanza del centro dell’oscillatore dai bordi). Perché stati su bordi opposti
hanno la componente della velocità parallela ai bordi di segno contrario?
a. La velocità di un livello di Landau è data da v=∂E(n,p)/∂p e la derivata ha segno contrario in virtù
dell’opposto andamento del potenziale di confinamento.
b. Perché vale la relazione E(n,p)=−E(n,−p).
c. Perché E(n,p) ha un massimo e un minimo, come funzione di p, ai due bordi.
105
d. La velocità di un livello di Landau è data da v=(∂E(n,p)/∂p)−1 e la derivata ha segno contrario in
virtù dell’opposto andamento del potenziale di confinamento.
e. La velocità di un livello di Landau è data da v=−∂E(n,p)/∂p e la derivata ha segno contrario in virtù
dell’opposto andamento del potenziale di confinamento.
[La risposta corretta è la a.]
In che modo gli stati di bordo determinano la quantizzazione della resistenza di Hall?
a. Poiché gli stati su bordi opposti trasportano correnti di segno contrario, una differenza di potenziale
VH tra i bordi implica una corrente pari a J=(e/h) eVH dove (e/h) è la corrente di uno stato di bordo per
unità di intervallo di energia.
b. Poiché gli stati su bordi opposti trasportano correnti che differiscono di e/h, una differenza di
potenziale VH tra i bordi implica una corrente pari a J=(e/h) eVH.
c. Poiché gli stati su bordi opposti trasportano correnti di segno contrario, una differenza di potenziale
VH tra i bordi implica una corrente pari a J=(h/e 2 )VH dove (h/e) è la corrente di uno stato di bordo per
unità di intervallo di energia.
d. Poiché le energie sono quantizzate, la differenza di potenziale tra stati su bordi opposti può solo
assumere valori determinati.
e. Poiché gli stati su bordi opposti trasportano correnti di segno concorde, una differenza di potenziale
VH tra i bordi implica una corrente pari a J=−(e/h)eVH dove (e/h) è la corrente di uno stato di bordo
per unità di intervallo di energia.
[La risposta corretta è la a.]
106
Cap. 6
La superconduttività
Significato della superconduttività. L’effetto Meissner di espulsione del flusso magnetico
da un superconduttore. La teoria fenomenologica di London e la natura dello stato
superconduttivo. Cenni alla teoria microscopica BCS della superconduttività.
6.1. Cos’è la superconduttività
6.2. Fenomenologia
6.3. Lo stato superconduttivo
6.4. La teoria della superconduttività
Un’introduzione non troppo matematica la si trova nel libro Introduzione alla fisica dello
stato solido di Charles Kittel. Una trattazione più avanzata è nel libro Solid State Physics di
Giuseppe Grosso e Giuseppe Pastori Parravicini.
6.1. Cos’è la superconduttività
Il fenomeno della superconduttività
Un po’ di storia.
In diversi materiali metallici la resistenza elettrica si annulla bruscamente al di sotto di
una temperatura critica. Questo fenomeno fu osservato per la prima volta nel 1911 da
Kamerling-Onnes (nella figura a destra, ritratto nel suo laboratorio), che misurò una
Tc=4.2K nel mercurio
107
Più della metà degli elementi sono superconduttori (alcuni a temperature molto basse o a
pressioni molto alte)
In giallo oro gli elementi superconduttori, in marrone quelli che lo possono diventare in
appropriate condizioni di pressione.
Oltre agli elementi puri ci sono materiali superconduttori che sono leghe o composti.
Insomma, quello della superconduttività è un fenomeno piuttosto diffuso.
Negli ultimi venti-trent’anni si è aperto anche un importante filone per quel che riguarda
le applicazioni tecnologiche che va sotto il nome di “superconduttività ad alta
temperatura critica”: sono stati infatti scoperti materiali che diventano superconduttori a
temperature ben più alte della temperatura critica del mercurio. Però per questi materiali
superconduttori ad alta temperatura critica la situazione teorica non è stata ancora ben
chiarita e perciò non ne parleremo in questa lezione.
Ma prima di entrare nel vivo della fisica della superconduttività vogliamo
menzionare il fatto che la superconduttività, oltre ad essere un argomento estremamente
importante dal punto di vista della scienza di base, è anche importante per diverse
applicazioni.
108
Può essere utile la superconduttività?
Segnaliamo solo un’applicazione, per
attirare la curiosità: i superconduttori
vengono utilizzati per la costruzione di
grandi strutture diagno-magnetiche aperte
grazie al fatto che, non essendoci
dissipazione energia, è possibile ottenere
campi magnetici intensi, omogenei e
stabili in strutture aperte che hanno il loro
utilizzo nella diagnostica medica: è il caso
della risonanza magnetica nucleare
(NMR), che permette di avere la
risoluzione e la precisione necessarie per
la determinazione della struttura chimica
dei tessuti.
Che cos’è la superconduttività? – Domande
1) In cosa consiste la superconduttività?
2) Qual è la differenza tra un metallo normale e uno superconduttore?
6.2. Fenomenologia della superconduttività
Ovvero: quali sono gli aspetti sperimentali più importanti sui quali si focalizza
l’attenzione del teorico per tentare di ricavare una spiegazione.
Fatti sperimentali rilevanti:
1. Resistenza nulla per T<Tc.
2. Lo stato superconduttivo è sensibile alla presenza di un campo esterno. Per ogni T,
esiste un campo critico Hc(T) al di sopra del quale lo stato superconduttivo è soppresso.
3. Un materiale superconduttore, quando viene immerso in un campo magnetico di
intensità inferiore a un certo valore critico, si comporta come un diamagnete perfetto,
cioè all’interno del superconduttore vi è “espulsione di B”, ossia una completa
soppressione del flusso magnetico: B=0; e poiché H non è zero (H è il campo esterno)
questo significa che nel superconduttore la magnetizzazione acquista un valore tale da
compensare l’effetto di H. Questo è l’effetto Meissner-Ochsenfeld (noto anche più
semplicemente come effetto Meissner) scoperto da Walther Meissner e Robert
Ochsenfeld nel 1933. Ciò avviene tramite la generazione di correnti superficiali che
inducono, all’interno del superconduttore, un campo magnetico opposto a quello
applicato.
109
Nel loro esperimento Meissner e Ochsenfeld raffreddarono campioni di stagno e
piombo fin sotto la temperatura di transizione allo stato superconduttivo, in presenza di
un campo magnetico. Essi trovarono che il campo esterno aumentava dopo la
transizione; e poiché il flusso magnetico è conservato da un superconduttore, questo
aumento del campo esterno doveva essere dovuto alla riduzione di quello interno al
campione.
4. A basse temperature il calore specifico si annulla in modo esponenziale:
c  e   kBT
il calore specifico in un solido indica la sua capacità di assorbire calore quando si fa una
variazione di temperatura. Lo studio del calore specifico è ragionevolmente è un indizio
su come il sistema può assorbire o meno energia. Poiché l’assorbimento di energia a
livello quantistico è legato alla struttura dello spettro dei livelli, lo studio del calore
specifico è un modo per capire com’è fatto lo spettro dei livelli. Gli esperimenti
mostrano che il calore specifico di un superconduttore a basse temperature ha un
andamento con la temperatura di decadimento esponenziale secondo un fattore di
Boltzmann. Questo decadimento esponenziale è indice del fatto che esiste una gap nello
spettro delle eccitazioni, vale a dire che lo stato fondamentale è separato dal primo stato
eccitato da una gap di energia: per poter eccitare un superconduttore dobbiamo fornirgli
un’energia che dev’essere almeno pari a quella della gap; e questa è l’origine della capacità
di un superconduttore di condurre corrente senza dissipazione.
La teoria della superconduttività deve essere una teoria in grado di mettere assieme in
maniera coerente i quattro elementi elencati sopra.
La teoria della superconduttività è stata sviluppata lungo un arco piuttosto esteso di
tempo: è cominciata negli anni Trenta e la teoria definitiva che vedremo nell’ultima parte
della lezione è arrivata verso la fine degli anni Cinquanta (teoria BCS).
Il diagramma di fase di una sostanza magnetica
Quando si studia una fase nuova della materia (e la superconduttività è una nuova fase
della materia) (le fasi, ad esempio, sono gli stati di aggregazione: la fase liquida, la fase
solida, la fase gassosa) diventa utile utilizzare un opportuno diagramma che mostri sotto
quali condizioni lo stato metallico “transisce” verso la nuova fase, appunto la fase
superconduttore.
Tale diagramma T-H, detto diagramma di fase.
riporta in ascissa la temperatura T (la
superconduttività dipende dalla temperatura), e
in ordinata il campo magnetico H che influenza
il comportamento superconduttivo. Quando si
applica un campo magnetico esterno H via via
più intenso la temperatura di transizione allo
stato superconduttivo si sposta verso il basso.
110
Se calcoliamo, per ogni valore di H, la temperatura a cui avviene la transizione verso lo
stato superconduttivo si ottiene una linea (la linea blu del diagramma precedente), che
separa le due fasi di conduttore Normale e Superconduttore. Tale linea è tracciata a
mano perché è indicativa di quello che avviene nella realtà.
Nel diagramma delle fasi più noto le linee separano, ad esempio, la fase liquida dalla fase
gassosa. L’analogia con tale diagramma più famoso ci permette di trarre alcune
importanti conclusioni.
L’equazione di Clausius-Clapeyron permette di determinare la forma analitica di
questa curva di separazione in termini di quantità fisiche misurabili. La pendenza di
questa curva (matematicamente: la derivata di H rispetto a T) può essere scritta come il
rapporto di due quantità caratteristiche delle due fasi:
S  SS
dH
 N
dT M S  M N
formula in cui al numeratore abbiamo la differenza delle entropie dei due materiali e al
denominatore la differenza delle due magnetizzazioni.
Dal punto di vista sperimentale sappiamo che la magnetizzazione nel sistema normale è
qualcosa di molto piccolo, quindi in prima approssimazione possiamo trascurarlo.
Inoltre, a causa dell’effetto Meissner, il superconduttore è un diamagnete perfetto:
questo significa che MS è l’opposto del campo magnetico esterno. Quindi, in prima
approssimazione:
dH
S  SS
S  SS
 N
 N
dT M S  M N
H
L’informazione sperimentale ci dice che la curva ha la forma indicata in figura, ovvero
che la pendenza è negativa. E poiché H è positivo questo significa che SN – SS è positiva;
cioè l’entropia dello stato Normale è maggiore è maggiore dell’entropia dello
stato Superconduttore: il sistema, nel passare dallo stato normale a quello
superconduttivo si ordina, diventa più ordinato. Ciò non è sorprendente in altri casi:
anche passando dalla fase gassosa alla fase liquida abbiamo una minore entropia e un
certo ordinamento; e lo stesso accade quando passiamo dalla fase liquida alla fase solida:
il solido, come abbiamo visto nel capitolo 3, è una struttura ordinata. Non è quindi
sorprendente che nel passare da una fase all’altra ci sia un salto di entropia perché c’è un
ordinamento.
Nel passaggio dalla fase normale alla fase superconduttore… in cosa consiste il maggior
ordinamento?
Dal punto di vista dell’ordinamento spaziale, se andiamo a guardare come sono disposti
gli atomi di un superconduttore rispetto agli atomi del conduttore dello stato normale
non vediamo alcuna differenza. Pertanto l’ordinamento dev’essere più “nascosto”.
Vedremo che questo ordinamento è legato a come il superconduttore si organizza a
livello quantistico, in particolare come si organizzano i suoi elettroni di conduzione.
111
La teoria dei London
Negli anni Trenta del Novecento i fratelli London compirono un primo importante
passo verso lo sviluppo della teoria della superconduttività, che troverà il suo
compimento solo nel 1957. L’analisi teorica dei fratelli London prende le mosse dalle
seguenti caratteristiche sperimentali di un superconduttore:
1. ha un comportamento conduttivo perfetto (assenza di resistenza);
2. ha un comportamento diamagnetico perfetto (effetto Meissner).
Queste due caratteristiche insieme alle equazioni di Maxwell e a un’ulteriore ipotesi,
introdotta dai London, permettono di caratterizzare la fenomenologia dei
superconduttori e indicano la strada verso la teoria microscopica.
Il conduttore perfetto
Abbiamo visto (modello di Drude) che un conduttore può essere visto come un gas di
conduttori aventi una certa carica e una certa massa.
Un conduttore perfetto può condurre elettricità senza dissipare energia.
Non immaginando cosa avviene in un superconduttore ma ipotizzando che vi sia
comunque un trasporto di carica e di massa, indichiamo con e* e m* la carica
elettrica e la massa dei portatori responsabili del comportamento
superconduttivo. Esse non coincidono con quelle dei portatori. In seguito discuteremo
come questi portatori sono collegati agli elettroni che conducono la corrente nei metalli
ordinari. Come nell’analisi svolta da Drude per il trasporto elettrico ordinario (il modello
che si aveva a disposizione negli anni Trenta) possiamo partire dall’equazione del moto
in un campo elettrico.


2

dv
dj ne * 
m*
 e * E 

E
dt
dt
m*


con j  e * nv
Un commento
Può essere utile confrontare la relazione ottenuta tra la corrente e il campo elettrico con
quella corrispondente nel caso di un metallo ordinario, come sviluppata nel modello di
Drude.

2
dj ne * 

E
dt
m*
 ne2 
j
E
m
Conduttore perfetto
Conduttore ordinario
Nel conduttore ordinario è la densità di corrente ad essere proporzionale al campo
elettrico; nel conduttore perfetto, secondo il modello dei London, è la derivata della
densità di corrente ad essere proporzionale al campo elettrico. Questo ci dice che in un
conduttore perfetto, in condizioni stazionarie, a differenza di quanto accade in un
112
metallo ordinario, una corrente può essere sostenuta in assenza di campo elettrico; in
altre parole, se generiamo una corrente e poi non applichiamo più un campo elettrico la
corrente può scorrere indefinitamente; fu fatto una volta un esperimento in cui si provò
a vedere quanto durasse la corrente in un superconduttore… La corrente andò avanti
due anni, poi gli sperimentatori si sono stancati di osservarla girare.

2
dj ne * 

E con le
Combiniamo l’equazione del conduttore perfetto
dt
m*
equazioni di Maxwell-Faraday
L’equazione dell’induzione magnetica di Maxwell-Faraday, che connette i campi elettrico
e magnetico, ci permette di trovare una relazione tra la corrente e il campo magnetico.

 
B
   E
t

2
dj ne * 

E
dt
m*
Equazione di Maxwell-Faraday
Conduttore perfetto
Entrambe le equazioni contengono il campo elettrico: possiamo unificarle eliminando il
campo elettrico:


B   m * dj 

m*  

  0 ossia  B 
  j   0
2
2
da cui t    
dt

t




n
e
*
n
e
*




L’equazione ottenuta (il primo passo della teoria dei London) contiene la corrente e il
campo magnetico. Non è ancora sufficiente per risolvere il problema. Per risolverla
dobbiamo usarla insieme all’equazione di Ampére-Maxwell che connette le medesime
due quantità.

m*  
 B 
  j   0
2
t 
ne *

 
1 
 B 
j
 0c 2
Conduttore perfetto
Equazione di Ampére-Maxwell
Eliminiamo la densità di corrente, calcolando nell’eq. di Ampére-Maxwell il rotore a
  
 
destra e a sinistra:     B   1 2   j per cui l’equazione di conduttore perfetto
 0c


2
   m * 0c 2    
ne * B   B
B
    B   0 
 
0
diventa
2
2
t 
m
*

c

t

t
ne *
0

  


Integrando rispetto al tempo e usando l’identità vettoriale     a   2 a    a 
e osservando che l’ultimo termine è nullo, otteniamo


2
 
ne *  
2
B  B0   B  B0 ,
m *  0c 2




113

con B0 il campo a t = 0
Ma noi sappiamo che un superconduttore gode dell’effetto Meissner.
Condizione di espulsione di B


L’equazione per il campo magnetico appena scritta ammette la soluzione B  B0
Tale soluzione però non è compatibile con l’evidenza sperimentale dell’effetto Meissner
che richiede un campo magnetico nullo nel superconduttore. I fratelli London quindi
conclusero che l’unico modo per soddisfare l’effetto Meissner fosse quello di
ipotizzare un’ulteriore condizione tra campo magnetico e corrente:

m*  
B
 j  0
2
ne *
(ossia non solo la derivata rispetto al tempo di tale quantità doveva essere zero, come
imponeva la condizione di conduttore perfetto, ma la combinazione stessa doveva essere
zero).
Tale condizione equivale infatti a imporre che sia B=0.
Tale condizione contiene in sé le condizioni del diamagnete perfetto (la nullità della
combinazione implica B=0) e del conduttore perfetto (la sua derivata è nulla)
Fenomenologia della superconduttività – Domande
1) Perché si parla di transizione superconduttiva?
2) Qual è la relazione tra campo magnetico e superconduttività?
3) In cosa consiste la relazione dei London tra corrente e campo magnetico?
6.3. Lo stato superconduttivo
Conseguenze dell’equazione dei London
In presenza di un potenziale vettore, l’impulso viene spostato dal potenziale vettore: si



ha p  m * v  e * A (è ciò che abbiamo usato nella lezione dedicata all’effetto Hall
quantistico ed è un modo in cui a livello hamiltoniano si ottiene la forza di Lorentz)


p
Distinguiamo quindi tra impulso canonico
e impulso cinematico m * v , legati tra
loro dal potenziale vettore.
Se analizziamo la relazione di London ottenuta nel paragrafo precedente

m*  
B

  j  0 ), che lega l’induzione magnetica B al rotore della corrente, e se
(
2
ne *
  
ricordiamo che B    A allora la relazione dei London si può scrivere come:
 
 
m*  
m* 

 A


j

0



A

j   0
2
2



ne *
n
e
*


114
2

ne * 
A.
Da cui j  
m*


j


e
*
n
v
E se ricordiamo che è
otteniamo
 e* 
v
A
m*



Tale relazione, sostituita nella p  m * v  e * A , implica un valore nullo della
quantità di moto per tutti i portatori di corrente.
I portatori responsabili della superconduttività si trovano in uno stato di impulso zero.
Questo fatto, per chi conosce la meccanica quantistica, è un campanello d’allarme molto
chiaro di qualcosa legato alla BEC (Bose-Einstein Condensation).
In meccanica quantistica l’occupazione dello stesso stato quantico da parte di tutte le
particelle si presenta infatti nel fenomeno della condensazione di Bose-Einstein (BEC).
La BEC non spiega la superconduttività ma fornisce alcuni indizi utili per la sua
comprensione.
Superconduttività a BEC
In meccanica quantistica distinguiamo le particelle in bosoni e fermioni. Per i secondi
vale il principio di esclusione di Pauli, che impedisce a due o più fermioni di occupare lo
stesso stato. Due o più bosoni invece possono occupare lo stesso stato. In particolare a
temperatura nulla, lo stato di minima energia di un sistema di bosoni si ottiene
disponendo tutte le particelle nel livello di energia più basso. Tipicamente tale stato
corrisponde a quello di impulso nullo. Le particelle quindi risultano “ordinate” nel senso
di occupare tutte lo stesso stato nello spazio degli impulsi. Tale condensazione non
avviene nello spazio fisico ma nello spazio astratto degli stati di impulso.
Quest’ordinamento deve portare a livello termodinamico a una diminuzione
dell’entropia.
Si può mostrare che, anche a temperature diverse dallo zero assoluto ma non
troppo alte, un numero macroscopico di bosoni continua a occupare il livello di
energia più basso. La BEC è la rappresentazione macroscopica di un effetto
quantistico… L’equazione di London dice che nei superconduttori si verifica qualcosa di

p
 0 ; la superconduttività può
simile, dato che i portatori si trovano tutti nello stato
essere dunque considerato la manifestazione macroscopica di un fenomeno quantistico.
L’accettazione di tale punto di vista presenta però alcune difficoltà, che andiamo a
discutere. Tuttavia è vero che la transizione allo stato superconduttivo è caratterizzata da
un ordinamento che porta al salto di entropia osservato sperimentalmente.
Perché la superconduttività non è BEC?
Le ragioni sono principalmente due:
1. i portatori della superconduttività sono gli elettroni, che in quanto fermioni non
possono esibire il fenomeno della BEC;
115
2. anche un sistema di bosoni, che esibisca il fenomeno della BEC, non è
superconduttivo, cioè non conduce senza dissipare.
Per ovviare a questi due tipi di problemi è nata la teoria standard, detta poi BCS dalle
iniziali del cognome di Bardeen, Cooper e Schrieffer che la formularono nel 1957, la
quale spiega come sia possibile sviluppare una teoria per un sistema di fermioni, che
senza violare il principio di esclusione di Pauli, conservi alcuni aspetti del fenomeno
BEC in accordo con l’analisi dei fratelli London.
Prima però spieghiamo perché un sistema di bosoni che esibisca il fenomeno della
BEC non è necessariamente superconduttivo.
Il criterio di Landau
Il motivo perché un sistema di bosoni che esibisca la BEC non sia necessariamente
superconduttivo fu compreso da Landau che formulò un criterio in proposito. Lo
determinò usando il principio di relatività galileiano, cioè il fatto che si può descrivere un
sistema fisico secondo un qualunque sistema di riferimento inerziale (i sistemi inerziali
sono legati l’uno all’altro da una trasformazione di Galileo).
Se si ha un sistema di bosoni, superfluido e che scorra a una velocità costante, possiamo
anche pensare di osservare questo sistema da un sistema che sia solidale col fluido che
scorre, un sistema cioè nel quale il fluido appaia fermo: in questo sistema l’energia
cinetica dovuta allo scorrimento è assente. Ora, se il sistema comincia a dissipare, cioè a
perdere parte delle proprietà superconduttive, significa che il sistema si sta eccitando:
matematicamente questo può essere descritto dicendo che il sistema sta acquistando una
energia ε e un certo impulso p. In termini quantistici possiamo indicare una qualunque
eccitazione come individuata da una relazione di ENERGIA

  p
in funzione


p


k
dell’IMPULSO (
) nominata RELAZIONE DI DISPERSIONE.
Superconduttività significa assenza di dissipazione. Questa si manifesta perché
durante il moto dei portatori il sistema si riscalda, cioè parte dell’energia cinetica si
converte in energia termica. Matematicamente questo si può descrivere dicendo che il
sistema è passato da uno stato di minima energia a uno stato di energia più elevata
caratterizzata da un impulso corrispondente al vettore d’onda che descrive la variazione
spaziale rispetto al sistema in assenza di dissipazione. Tale stato di energia più elevata è
detto costituire un’eccitazione elementare del sistema.
L’idea di Landau fu quella di collegare la presenza di un’eccitazione osservata nel sistema
solidale al fluido col sistema di laboratorio. Nel far questo si possono usare le
trasformazioni di Galileo.
Velocità critica
Consideriamo il sistema di portatori in moto con velocità v e consideriamo la comparsa
di un’eccitazione. In un sistema di riferimento in quiete con il sistema di portatori,
116
l’energia e la quantità di moto sono quelle dell’eccitazione elementare. Usando le
trasformazioni di Galileo otteniamo l’energia e la quantità di moto nel sistema del
laboratorio. In questo sistema, se c’è dissipazione, l’energia deve diminuire. Quindi
la comparsa dell’eccitazione richiede che la velocità di conduzione sia superiore a una
velocità critica.
 

1
2


E

Mv

p

v


p
La formula nel riferimento del laboratorio diventa
2
dove M è la massa totale del fluido, v è la velocità che collega i due sistemi di riferimento
inerziali, p è l’impulso dell’eccitazione ed ε la sua energia.
Analogamente esiste una legge di trasformazione dell’impulso, che è la seguente:

 
P  Mv  p
dove P è l’impulso osservato nel sistema di laboratorio, p è l’impulso osservato nel
sistema solidale con il fluido e Mv è l’impulso del fluido che scorre complessivamente.
Affinché ci sia dissipazione il contributo aggiuntivo all’energia cinetica del fluido visto
 
 
nel sistema del laboratorio, cioè la quantità p  v   p deve essere negativa
(affinché ci sia un decremento rispetto all’energia cinetica).
Questa condizione implica l’esistenza di una velocità critica, definita come il minimo, tra

tutti i possibili valori dell’impulso, del rapporto
  p
p :

   p 
 


p  v    p   0  v  vc  min
p


Immediatamente si vede da questa relazione che se la dispersione

  p
è quella di un
p2
sistema libero, cioè quello di una particella libera in una scatola, cioè   p  
2m ,
  p p

allora
p
2m e il minimo per p di un sistema lineare in p è zero, un sistema di
bosoni liberi ha una velocità critica nulla, questo vuol dire che a qualunque velocità il
sistema presenta eccitazione e non è più superfluido.
Il criterio di Landau ci dice cioè che un gas di bosoni liberi non può essere
superconduttivo.
Deve perciò esistere una modifica importante nella relazione di dispersione: per esempio
la presenza di una gap nello spettro di oscillazione può portare a una velocità critica
diversa da zero.
Questa è una cosa che dobbiamo tenere a mente perché abbiamo visto dalle misure di
calore specifico quando abbiamo parlato degli aspetti generali che nel caso dei
superconduttori lo spettro delle eccitazioni è caratterizzato da una gap.
117
Coppie di Cooper
Gli elettroni non possono condensare nello stesso stato, perché sono fermioni ed
obbediscono al principio di esclusione di Pauli. Come dunque possono gli elettroni dar
luogo a un’occupazione macroscopica di uno stato quantistico? L’idea di base è
relativamente semplice (anche se poi l’implementazione formale richiese molto lavoro):
gli elettroni formano delle coppie il cui spin totale è la somma di quello dei due elettroni
componenti (1/2+1/2=1). In tal modo la coppia si comporta come un bosone e può dar
luogo a un fenomeno tipo BEC. Quindi non dobbiamo pensare a una condensazione di
elettroni ma a una condensazione di coppie. La domanda quindi diventa: come fanno gli
elettroni a formare una coppia stabile in presenza della repulsione coulombiana? Da
dove arriva l’attrazione che porta a uno stato legato?
È una domanda a cui è difficile rispondere e la teoria corrente lo fa ma usando un
apparato formale estremamente complesso; si può tuttavia avere una intuizione fisica di
quello che succede con alcuni semplici ragionamenti. Non dobbiamo dimenticare il fatto
che gli elettroni non vivono nel vuoto ma si trovano immersi in un solido dove sono
presenti gli ioni da cui provengono.
Interazione elettrone-reticolo
Gli elettroni di un solido si muovono in un reticolo di ioni carichi positivamente.
Semplificando un po’, possiamo pensare che un elettrone che passi vicino ad un ione del
reticolo eserciti un’attrazione sullo ione. Quest’ultimo quindi si sposta rispetto alla sua
posizione di equilibrio. Nella figura sotto, esagerando il fenomeno, è mostrato come gli
ioni sono attratti al passaggio dell’elettrone (il pallino verde)
Ora immaginiamo un altro elettrone che si muova nelle vicinanze dello ione che si è
mosso per il passaggio del primo elettrone. Questo elettrone sarà dunque attratto verso
la mutata posizione dello ione, nella regione dove c’è una mancanza di carica positiva.
Interazione elettrone-elettrone
118
In definitiva il secondo elettrone sarà attratto verso la regione di spazio dove è passato il
primo elettrone: è esattamente questa attrazione “efficace” di elettroni che porta alla
formazione delle coppie di Cooper.
Condensazione delle coppie
Senza preoccuparci per il momento di come si formino le coppie di elettroni, possiamo
chiederci quali conseguenze possono esserci a causa della loro condensazione.
Ipotizziamo che le coppie di elettroni (che si comportano come bosoni) vadano a
occupare lo stesso stato quantistico descritto da una funzione d’onda, normalizzata in
modo tale che il modulo quadro dia la densità delle coppie (il modulo quadro della
funzione d’onda dovrebbe dare la densità di probabilità… ma siccome abbiamo un
numero macroscopico di coppie di elettroni che si trovano nello stesso stato quantico
della funzione d’onda, il modulo quadro della funzione d’onda finisce per darci la densità
delle coppie di elettroni; possiamo cioè costruire una teoria dal punto di vista euristico
identificando il modulo quadro della funzione d’onda con la densità degli elettroni):


 r , t   ns r , t 
2
questa funzione d’onda deve però obbedire all’equazione di Schroedinger associata.
Equazione di Schrödinger
In presenza di un potenziale vettore, possiamo scrivere l’equazione di Schrödinger
attraverso la sostituzione minimale.
 2

1  
i

   e * A 
t
2m *  i

m* ed e* sono la massa e la carica dei portatori:
m*  2m
e*  2e
la carica e la massa di una coppia sono quelle corrispondenti a due elettroni.
Come usiamo quest’idea della funzione d’onda che obbedisce all’equazione di
Schrödinger per arrivare alla teoria della superconduttività?
Corrente delle coppie
In base alle regole della meccanica quantistica possiamo scrivere l’espressione della
corrente delle coppie




 * e*  * 
 i
*
J   e * 
     
A  
m*
 2m *

In assenza del campo magnetico (A=0), la funzione d’onda ha un’espressione semplice:
  nS
Se, in presenza di campo magnetico, potessimo trascurare il primo termine della
corrente,
119

 e*  * 
J


e
*
A   ovvero

l’equazione diventerebbe
 m*


e *2 
J 
nS A
m*
avremmo cioè riottenuto la relazione dei London.
Ragionare sulle coppie conduce quindi alla relazione dei London che era stata ricavata su
basi puramente fenomenologiche. Questo è un indizio che siamo sulla strada giusta.
Ma perché possiamo trascurare il primo termine della relazione sopra?
Rigidità della funzione d’onda
La regione per cui possiamo trascurare il primo termine è indicata solitamente come
“rigidità” della funzione d’onda delle coppie.
In assenza di potenziale vettore la funzione d’onda è una costante che ha a che fare con
la densità:   nS
Com’è che quando viene introdotto il campo magnetico (cioè il potenziale vettore), la
funzione d’onda non varia, resta cioè “rigida”? Ciò può essere compreso assumendo che
esista un gap di energia tra lo stato fondamentale e gli stati eccitati e usando la teoria
delle perturbazioni, la quale dice che, se voglio studiare un problema complicato, posso
andare per gradi, posso prima risolvere un problema più semplice, poi aggiungere una
perturbazione e procedere nell’analisi per fasi successive… Senza entrare nei dettagli, la
formula importante di questa teoria delle perturbazioni è la seguente:
 01   0  
n
Vn 0
E0  E n
La funzione d’onda in presenza di una prima perturbazione (che indichiamo
genericamente con V) è dunque uguale a  0 (la funzione d’onda in assenza della
perturbazione) + una correzione. Quello che ci dice la teoria quantistica è che questa
correzione è lineare nella perturbazione (e questo non sorprende) e poi dipende da un
denominatore che è la differenza di energia tra lo stato imperturbato che stiamo
considerando e gli altri stati imperturbati del sistema.
Ora la funzione d’onda sarà rigida, cioè cambierà poco in presenza di una perturbazione,
quando il denominatore
E0  En è molto grande.
 01   0  
n
Vn 0
0
E0  E n
se
Vn 0
 1
E0  En
Ma questo cosa vuol dire?
Siccome E0 è lo stato fondamentale ed En sono gli stati eccitati, se esiste una gap
nello spettro energetico del nostro superconduttore quel denominatore tenderà ad essere
120
grande e la frazione ad essere piccola; quindi, se esiste una gap possiamo trascurare
questa correzione. Quindi la rigidità della funzione d’onda che ci serve per derivare la
relazione di London dalla meccanica quantistica funziona se abbiamo una gap nello
spettro di energia… Ma effettivamente, come ci mostra l’andamento del calore specifico,
è proprio il caso del superconduttore.
Lo stato superconduttivo – Domande e test
1) In che senso la superconduttività implica una condensazione tipo Bose-Einstein?
2) Che cosa afferma il criterio di Landau?
3) Cosa sono le coppie di Cooper?
a. Coppie di bosoni che si comportano, complessivamente, come fermioni, per i quali può avere
luogo il fenomeno della superconduttività.
b. Coppie di elettroni che si comportano, complessivamente, come bosoni, per i quali può avere
luogo la condensazione di Bose-Einstein.
c. Coppie di elettroni che si spostano assieme, nello stesso livello di energia ma con spin
opposto, in accordo col principio di esclusione di Pauli per i fermioni.
[La risposta esatta è la b.]
4) Cos’è la rigidità della funzione d’onda?
Possiamo finalmente mettere insieme tutti i pezzi del puzzle fin qui accumulato per
illustrare la
6.4. La teoria della superconduttività
Per far questo ci manca un ultimo passaggio formale,
un teorema di meccanica quantistica
Consideriamo M stati quasi degeneri in presenza di una perturbazione.
Problema
imperturbato
H 0i  E0i
L’indice i va da 1 a N
Problema
con perturbazione
H 0  U   E ,
U è la perturbazione e H 0  U è il nuovo hamiltoniano.
La soluzione la possiamo trovare come combinazione
lineare delle soluzioni del problema imperturbato:
M
   aii
i 1
, che deve soddisfare alla condizione di
M
normalizzazione  ai  1
i 1
121
2
La perturbazione può “mescolare” gli stati ed eliminare la degenerazione.
In base alle regole della meccanica quantistica, l’energia di un nuovo autostato è il valore
di aspettazione dell’operatore Hamiltoniano
E   H0 U  
M
M
a a
i , j 1
*
i
j
i H 0  U  j 
M
 E0  ai   ai*a j i U  j
2
i 1
i , j 1
Il termine a destra è quello risultante dalla perturbazione.
Assumiamo che la perturbazione sia negativa e che abbia elementi di matrice tutti uguali
i U  j  V
i, j  1,..., M
Ricordiamo la nota disuguaglianza di Cauchy-Schwarz per cui
M
M

2 
ai    ai  1  M

i 1
 j 1
 i1 
M
Otteniamo quindi per l’energia dell’autostato
M
2
E  E0  V  ai  E0  VM
i 1
Il valore minimo dell’energia si ottiene quando tutti i coefficienti sono uguali
ai 
1
M
Uno stato si “stacca” dagli altri e forma una gap anche per una piccola V.
Questo meccanismo (per cui uno stato si stacca dagli altri) è quello che controlla la teoria
BCS.
122
La teoria BCS
The Nobel Prize in Physics 1972 was awarded jointly to
John Bardeen, Leon Neil Cooper and John Robert Schrieffer
“for their jointly developed theory of superconductivity, usually called the BCS theory”.
(ottennero il Nobel 15 anni dopo la pubblicazione del loro articolo nel 1957)
A quali stati va applicato il teorema di meccanica quantistica visto sopra?
Ricordiamo la struttura dello stato fondamentale di un gas di Fermi. Gli stati di singola
particella sono onde piane, come le particelle “confinate in una scatola”. I numeri
quantici sono il vettore d’onda e la proiezione dello spin.
Nello stato fondamentale del gas di Fermi, se uno stato con dati impulso e proiezione di
spin è occupato, sarà occupato anche lo stato con impulso e proiezione di spin opposti.
Questi due stati infatti sono connessi dalla simmetria per inversione del tempo e
in virtù del Teorema di Kramers hanno la stessa energia e sono quindi degeneri.


T k ,    k ,   Ek ,  Ek ,
T è l’operazione di inversione temporale: invertire la direzione del tempo significa
invertire la direzione della velocità, e quindi dell’impulso. E se pensiamo allo spin SU
come a un moto rotatorio in una certa direzione, invertendo la direzione del tempo si
inverte la direzione di rotazione.
123
Lo stato fondamentale del gas di Fermi può essere descritto dicendo che tutte le coppie
di stati che sono connessi dall’operazione di inversione temporale sono o occupati o
vuoti.
L’idea di base della teoria BCS è che, quando si consideri l’interazione attrattiva tra gli
elettroni dovuta alla presenza del reticolo, si può ottenere uno stato di più bassa energia
considerando una situazione intermedia.
 BCS  




u vuoto  v k , ; k , 

k

k

k
ovvero, per ogni k, anziché dire che lo stato è doppiamente occupato o completamente
vuoto, possiamo pensare che il sistema si trovi in una situazione intermedia, ovvero una
combinazione lineare di queste possibilità.
Lo stato del gas di Fermi corrisponde alla situazione in cui fino all’impulso di Fermi gli
stati sono occupati (v=1, u=0) e per gli impulsi successivi gli stati sono vuoti (v=0, u=1).
Facendo variare i coefficienti u e v per tutti i valori dell’impulso si ottiene l’insieme degli
stati da cui scegliere lo stato fondamentale (ossia l’energia la minima possibile).
Una volta trovati gli u e v che determinano l’energia minima possibile abbiamo ricavato
lo stato BCS. (Nel teorema di prima questo equivaleva a scegliere i coefficienti a dello
stato che si stacca dagli altri). Gli stati di quest’insieme saranno “mescolati”
dall’interazione tra gli elettroni e, in virtù del teorema di meccanica quantistica, uno di
questi stati può separarsi dagli altri e creare un gap d’energia.
Quello che dobbiamo fare a livello quantitativo è stimare l’energia di questo stato
fondamentale. Quello che dobbiamo ricordare, dal teorema visto prima, è che il
guadagno di energia (la gap) dev’essere dell’ordine della perturbazione moltiplicata per il
numero degli stati.
Dall’evidenza sperimentale sappiamo che l’energia di Fermi di un metallo standard è
dell’ordine dell’elettrovolt (tradotto in temperature sono 10.000 Kelvin), mentre la
temperatura di transizione critica è dell’ordine di qualche Kelvin (nell’intervallo 1-10 K).
La teoria BCS ipotizza che la perturbazione introdotta dal reticolo debba coinvolgere
solo stati che differiscano in energia di una quantità dell’ordine della temperatura critica
moltiplicata per la costante di Boltzmann. Quindi si assume che l’energia del gap
d’energia deve essere dell’ordine della temperatura critica (moltiplicata per la costante di
Boltzmann) e quindi molto più piccola dell’energia di Fermi tipica di un metallo.
  k BTc  EF
Nell’esaminare tutti i possibili stati della forma BCS, possiamo quindi limitarci a quelli
dove i coefficienti u e v della componente piena e della componente vuota differiscano
dal caso dello stato fondamentale del gas di Fermi (quello per il quale la u e v nei grafici
sotto hanno la forma della funzione tratteggiata, a gradino) soltanto in una regione
d’energia di larghezza dell’ordine del gap di energia e centrata all’energia di Fermi.
124
La teoria BCS consiste cioè nello scegliere valori di u e v che danno origine a
distribuzioni “più dolci” delle funzioni tratteggiate a gradino, distribuzioni che assumano
valori diversi da 1 e 0 in una regione di energia intorno alla superficie di Fermi
dell’ordine della gap ossia della temperatura critica (moltiplicata per costante di
Boltzmann).
Il numero di stati di coppia per intervallo di energia è mediamente dato dalla densità
degli stati (data dal rapporto tra numero di elettroni (N) ed energia media degli stati
occupati (EF)), moltiplicata per l’intervallo di energia dove gli stati di coppia si
mescolano (Δ). L’energia media degli stati occupati è dell’ordine dell’energia di Fermi.
Quindi il guadagno di energia dello stato fondamentale, in virtù del teorema di
meccanica quantistica discusso precedentemente, sarà il prodotto degli stati di coppia
coinvolti per l’energia tipica della perturbazione, che è anch’essa dell’ordine del gap
d’energia.
 N 
N 2
EBCS  EFG  
   EFG 

E
E
F
 F 
Benché ci siamo lasciati guidare dall’idea delle coppie di elettroni nel costruire la teoria
BCS, tali coppie hanno un carattere particolare che può essere messo in risalto da alcune
stime di ordini di grandezza. Risulta infatti che la dimensione tipica di una coppia è
molto più grande delle dimensioni dei singoli elettroni che formano la coppia. Tale
dimensione tipica è detta distanza di coerenza
  vF
:
 EF  EF 1
E



 F F 
 1
 pF 
 kF

F
Le coppie di Cooper sono dunque molto lontane tra loro: le coppie tra loro possono
intersecarsi…
125
Osservazioni conclusive
Possiamo brevemente riassumere i capisaldi della nostra comprensione del
fenomeno della superconduttività:
1. L’interazione degli elettroni con il reticolo induce un’attrazione tra gli elettroni.
2. L’interazione attrattiva tra gli elettroni porta alla formazione di coppie tra gli elettroni.
3. Le coppie hanno un “carattere” bosonico e al di sotto di una temperatura critica
occupano macroscopicamente lo stesso stato quantico.
4. Lo stato fondamentale BCS presenta un gap d’energia che rende “rigida” la funzione
d’onda e porta alla relazione di London e all’espulsione del flusso.
La teoria della superconduttività – Domande
1) Quali sono le assunzioni della teoria BCS?
2) Qual è la differenza dell’occupazione nello spazio degli impulsi tra lo stato fondamentale del gas di
Fermi e quello dello stato superconduttivo?
3) Quale idea hanno usato Bardeen, Cooper e Schrieffer (BCS) per spiegare il fenomeno della
superconduttività?
a. L’interazione attrattiva risultante dall’interazione degli elettroni con gli ioni del reticolo
modifica lo stato fondamentale del metallo rispetto alla trattazione del gas di Fermi, rendendo
possibile la creazione di uno stato di energia minore.
b. L’interazione repulsiva dovuta alle forze coulombiane tra gli elettroni modifica lo stato
fondamentale del metallo rispetto alla trattazione del gas di Fermi, rendendo possibile la
creazione di uno stato di energia minore.
c. L’interazione attrattiva risultante dall’interazione degli elettroni con gli ioni del reticolo
modifica lo stato fondamentale del metallo rispetto al caso della condensazione di BoseEinstein, rendendo possibile la creazione di uno stato di energia minore.
[La risposta corretta è la a.]
6.5. Test
In cosa consiste l’effetto Meissner nei superconduttori?
a. Un materiale superconduttore si comporta come un paramagnete perfetto, cioè all’interno del
superconduttore si ha un aumento del flusso magnetico.
b. Un materiale superconduttore si comporta come un diamagnete perfetto, cioè all’interno del
superconduttore si ha un aumento esponenziale del flusso magnetico.
c.
Un materiale superconduttore si comporta come un ferromagnete, cioè all’interno del
superconduttore si ha flusso magnetico anche senza campo magnetico esterno.
d. Un materiale superconduttore si comporta come un diamagnete, cioè all’interno del superconduttore
si ha una parziale soppressione del flusso magnetico.
e. Un materiale superconduttore si comporta come un diamagnete perfetto, cioè all’interno del
superconduttore si ha una completa soppressione del flusso magnetico.
[La risposta corretta è la e.]
126
Quale aspetto della superconduttività viene messo in luce dall’analisi del diagramma di fase?
a. Nel diagramma di fase T−H per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato
normale è soppresso.
b. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato
superconduttivo è massimo.
c. Nel diagramma di fase T−H, per ogni H esiste un campo critico Hc(T) al di sopra del quale lo stato
superconduttivo è soppresso.
d. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sotto del quale lo stato
superconduttivo è soppresso.
e. Nel diagramma di fase T−H, per ogni T esiste un campo critico Hc(T) al di sopra del quale lo stato
superconduttivo è soppresso.
[La risposta corretta è la e.]
La transizione superconduttiva può essere vista come la manifestazione macroscopica di un
comportamento quantistico mediante l’occupazione coerente dello stesso stato quantico da
parte di un numero macroscopicamente grande di costituenti elementari. Da questo punto di
vista, si può parlare di condensazione di Bose-Einstein del gas elettronico?
a. No, a causa della repulsione coulombiana tra gli elettroni.
b. No, perché gli elettroni hanno natura fermionica. Coppie di elettroni hanno però carattere bosonico
e possono condensare nello stesso stato quantico.
c. Sì, perché la relazione di dispersione degli elettroni soddisfa il criterio di Landau per la superfluidità.
d. No, perché la relazione di dispersione degli elettroni non soddisfa il criterio di Landau per la
superfluidità.
e. Sì, perché gli elettroni obbediscono al principio di esclusione di Pauli.
[La risposta corretta è la b.]

 
B
   E insieme alla condizione di conduttore perfetto
L’equazione di Maxwell
t

2
dj ne * 

E conduce ad una relazione tra flusso magnetico B e densità di corrente J. Quale
dt
m*
tra le seguenti è tale relazione?
a.
b.
c.
d.
e.

m*  
 B 
  j   0
2
t 
ne *

 
m*  
j
  B   0
2
t 
ne *





m*
B
 j  0
2
t
ne *

m*   
B
 j  0
2
t
ne *

m* 
B 
j  0
2
t 
ne * 
[La risposta corretta è la a.]
127
Qual è la relazione dei London tra flusso magnetico B e densità di corrente?

m*  
1 


j

j
2
0
ne *
 
m* 
 B 
j 0
2
ne *
 
m*  
B
 j  0
2
t
ne *

m*  
B
 j  0
2
ne *

m*   1 
B
 j 
j
2
0
ne *
a. B 
b.
c.
d.
e.
[La risposta corretta è la d.]
A proposito del significato dell’equazione dei London, quale tra le seguenti affermazioni è
corretta?
2

ne * 
A (dove A è il potenziale vettore), implica un valore
a. La relazione dei London, j  
m*
negativo della quantità di moto p⃗ per tutti i portatori di corrente.
2

ne * 
A (dove A è il potenziale vettore), tutti i portatori di
b. In base alla relazione dei London j  
m*
corrente hanno velocità nulla.
2

ne * 
A (dove A è il potenziale vettore), implica un valore nullo
c. La relazione dei London, j  
m*
della quantità di moto p⃗ per tutti i portatori di corrente.
2

ne * 
B (dove B è il flusso magnetico), tutti i portatori di
d. In base alla relazione dei London j  
m*
corrente hanno velocità nulla.
2

ne * 
A (dove A è il potenziale vettore), implica un valore positivo
e. La relazione dei London, j  
m*
della quantità di moto p⃗ per tutti i portatori di corrente.
[La risposta corretta è la c.]
La corrente delle coppie di elettroni può essere espressa in termini della funzione d'onda delle



e*  * 
 i
 *  * 
A   .
coppie in accordo con la meccanica quantistica J  e * 
m*
 2m *

In che modo l’assunzione della rigidità della funzione d’onda permette di ottenere la relazione
dei London?


a. In presenza di un gap d’energia nello spettro delle eccitazioni elementari, la funzione d’onda dello
stato superconduttivo,   nS , non è perturbata dalla presenza di un campo magnetico esterno e
soltanto il primo termine contribuisce alla corrente.
b. Il primo termine della corrente può essere trascurato, perché la funzione d’onda può essere scelta
reale.
128
c. In presenza di un gap d’energia nello spettro delle eccitazioni elementari, la funzione d’onda dello
stato superconduttivo,   nS , non è perturbata dalla presenza di un campo magnetico esterno e
soltanto il secondo termine contribuisce alla corrente.
d. Il primo termine della corrente si può trascurare perché la funzione d'onda è uniforme.
e. In assenza di un gap d'energia nello spettro delle eccitazioni elementari, la funzione d’onda dello
stato superconduttivo,   nS , è perturbata dalla presenza di un campo magnetico esterno e soltanto
il primo termine contribuisce alla corrente.
[La risposta corretta è la c.]
Secondo la teoria BCS della superconduttività si può ottenere uno stato di più bassa energia



uk vuoto  vk k , ; k , 
mediante il seguente stato fondamentale  BCS  


e
k
scegliendo opportunamente le funzioni
la scelta BCS di queste funzioni?
a.
u 0

k
e
v  1 per

k
b. Le funzioni u k e
del gap d’energia Δ.
c. Le funzioni
Fermi.
u k
v k
e

k  kF
u k
mentre
e
v k . Quale tra le seguenti affermazioni descrive
u 1 e v  0

k

k
per

k  kF
differiscono da quelle del gas di Fermi solo in una regione d’energia d’ordine
v k
nello stato BCS acquistano un valore complementare a quello del gas di
d.
u k  0
e

v k  1 per k  k F
e.
u k  0
e
v k  1
mentre
u k  1 e v k  0
per

k  kF
[La risposta corretta è la b.]
129
PARTE II
Sommario parte II
Cap. 7
Introduzione alla fisica dei semiconduttori
7.1. Bande di energia e classificazione dei solidi. Bande di valenza, bande di conduzione e
gap diretta e indiretta nei semiconduttori. Occupazione delle bande a temperatura nulla e
a temperatura finita in semiconduttori intrinseci.
7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore.
7.3. Concetto di lacuna.
7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e
alla banda di conduzione.
7.5. Drogaggio e densità dei portatori dei semiconduttori.
7.6. Test ed esercizi.
Cap. 8
I semiconduttori nell’elettronica
8.1. Drogaggio di tipo n e drogaggio di tipo p. Modello idrogenoide per le energie degli
stati elettronici di impurezze droganti. Densità dei portatori intrinseci e estrinseci in
funzione della temperatura. L’effetto Hall classico. Giunzione p-n all’equilibrio:
diffusione, regione di deplezione. Polarizzazione diretta e inversa della giunzione p-n.
8.2. Il diodo.
8.3. I diodi LED, la scelta del materiale semiconduttore.
8.4. Principi di funzionamento del transistor.
8.5. Test ed esercizi.
Cap. 9
Nanoscienze e nanotecnologie
9.1. I principi delle nanoscienze.
Proprietà fisiche e dimensionalità: introduzione allo studio e alla manipolazione dei
materiali, dei dispositivi e dei fenomeni fisico/chimici su scala nanometrica
9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori.
Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune
Introduzione alle tecniche di imaging alla nanoscala.
9.3. Nanotecnologie.
Introduzione alle tecniche di fabbricazione per le nanotecnologie
9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici.
Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a
forza atomica (AFM)
9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e
delle nanoscienze. Cenni sul grafene.
130
Cap. 7
Introduzione alla fisica dei semiconduttori
Argomenti del capitolo:
7.1. Bande di energia e classificazione dei solidi.
Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori.
Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori
intrinseci.
7.2. Bande di energia nei semiconduttori. Conduzione elettrica in un semiconduttore.
7.3. Concetto di lacuna.
7.4. Conduzione elettrica. Massa efficace nei solidi: applicazione alla banda di valenza e
alla banda di conduzione.
7.5. Drogaggio e densità dei portatori dei semiconduttori.
7.1. Bande di energia e classificazione dei solidi.
Bande di valenza, bande di conduzione e gap diretta e indiretta nei semiconduttori.
Occupazione delle bande a temperatura nulla e a temperatura finita in semiconduttori
intrinseci.
In un solido cristallino le energie degli elettroni e le corrispondenti funzioni d’onda sono
individuati
• dall’indice di banda n
• dal momento cristallino k
L’indice di banda n è una variabile discreta, il momento cristallino k è invece una
variabile continua.
131
La banda di energia En(k) è costituita dall’insieme dei valori di energia permessi che
hanno lo stesso valore di n (n-esima banda di energia). Nella figura sono riportate le
bande di energia del silicio. Lungo l’asse x è riportato il valore del momento cristallino
nelle direzioni significative dello spazio k, mentre le rispettive energie sono riportate
sull’asse verticale. Ricordiamo che il momento cristallino di un conduttore solido è una
variabile tridimensionale, anche se, per semplicità, a volte la si considera
unidimensionale.
Bande di energia En(k)
Una banda di energia è costituita dall’insieme dei valori di energia permessi che hanno lo
stesso valore di n. Bande distinte hanno valori distinti di n e all’interno di ciascuna banda
ciascuna energia è individuata dal valore del momento cristallino k.
Le bande di energia di un solido si originano dai livelli atomici degli atomi che
compongono il solido. In forma semplificata possiamo immaginare che da ciascun livello
di energia degli atomi che costituiscono il solido si genera una banda di energia En(k)
individuata dal numero quantico n, come riportato nella figura sotto a destra.
La proprietà dei livelli atomici per cui al crescere del numero quantico principale n
aumenta l’energia degli elettroni si riflette sugli stati elettronici del solido, per cui
all’aumentare dell’indice di banda n aumenta l’energia.
132
Ciascuna banda è rappresentata da un intervallo di energie permesse che si distinguono
per il valore del momento k.
La funzione E(k) rappresenta la dispersione della banda di energia: fissata la banda
considerata, la dispersione che ne segue di k , E(k), è una funzione continua e periodica
in k.
La periodicità in k è una proprietà che è legata alla simmetria con cui gli atomi in un
solido sono disposti nello spazio: grazie alla periodicità è possibile rappresentare le bande
in un intervallo ristretto di momenti k che sono quelli che rappresentano stati
fisicamente distinti.
Gli intervalli di energia permessi (bande permesse) sono separati da intervalli di energie
proibite, che vengono dette gap proibite. La presenza di gap proibite si vede anche nella
rappresentazione dello spazio dei momenti (figura a destra) e rappresentano le energie
comprese tra due estremi di due bande successive. Questi estremi sono i massimi e i
minimi e possono verificarsi allo stesso valore di k oppure per valori di k diversi.
Banda di valenza e banda di conduzione
Gli stati elettronici. e quindi le bande, sono occupati in base al principio di esclusione di
Pauli. Lo stato fondamentale (a temperatura nulla) della configurazione elettronica di un
solido si ottiene quindi occupando tutti i livelli a partire da quello di minor energia fino a
quando ci sono elettroni disponibili.
Ricordiamo che, nel caso dei solidi, essendo k il numero quantico che individua lo stato
elettronico potremo allocare al massimo due elettroni (con spin opposto) in ogni stato k.
Molte delle proprietà che manifestano i solidi sono legate all’occupazione delle bande a
maggior energia. Definiamo quindi, riferendoci sempre allo stato fondamentale, la
banda di valenza e la banda di conduzione come in figura sotto.
133
Banda di conduzione
banda E(k) vuota o parzialmente
occupate di minor energia
Banda di valenza
banda E(k) completamente occupata a
più alta energia
L’occupazione delle bande è riferita allo stato fondamentale (T=0K).
I solidi si suddividono in conduttori, semiconduttori e isolanti in base all’occupazione
nello stato fondamentale (T=0K) della banda di valenza e di conduzione e al valore
dell’energia di gap.
I conduttori sono i metalli in cui la banda di conduzione è semipiena. Al contrario, nei
semiconduttori e negli isolanti la banda di conduzione è completamente vuota e quella di
valenza è completamente piena; ciò che li distingue è la distanza tra la sommità della
banda di valenza e il fondo della banda di conduzione, che si chiama gap proibita.
Energia di gap proibita EG
L’energia di gap EG è la distanza in energia fra il massimo della banda di valenza e il
minimo di quella di conduzione. Indicativamente
134
Trasporto elettrico
Metalli, isolanti e semiconduttori rispondono diversamente ad un campo elettrico
esterno e la loro resistività varia con la temperatura.
In un isolante la resistività è molto elevata e non varia con la temperatura. Al contrario,
in un metallo la resistività è molto più piccola (i metalli sono conduttori) e la resistività
decresce al decrescere della temperatura; per i semiconduttori il comportamento è più
complesso: a bassa temperatura si comportano come isolanti; aumentando la
temperatura la resistività diminuisce e i semiconduttori sono in grado di condurre
corrente; la loro resistività diminuisce all’aumentare della temperatura anche se non
arriva mai ai valori che si osservano nei metalli.
Dal punto di vista qualitativo questi diversi comportamenti sono legati all’occupazione
delle bande.
Si ha conduzione solo in presenza di stati vuoti nella banda di energia: gli stati vuoti
possono essere occupati dagli elettroni che acquisiscono extra energia dal campo
elettrico applicato.
Le bande piene non contribuiscono alla conducibilità elettrica (isolanti e semiconduttori
a T=0K)
Struttura a bande dei semiconduttori
Tra i vari semiconduttori disponibili possiamo riconoscere delle caratteristiche comuni
nella loro struttura a bande, in particolare nella banda di valenza e nella banda di
conduzione.
Banda di conduzione con
curvatura positiva
intorno al minimo
Banda di valenza con
curvatura negativa e
massimo a k=0
(momento cristallino
nullo)
135
Riguardo al minimo della banda di conduzione sono possibili due casi:
semiconduttori a gap diretta
Il minimo della banda di conduzione e il
massimo di quella di valenza sono allo
stesso valore del momento cristallino k, in
k=0
semiconduttori a gap indiretta
Il minimo della banda di conduzione e il
massimo di quella di valenza sono ad un
diverso valore del momento cristallino k
Queste due tipologie di semiconduttori hanno comportamento diverso quando si va a
parlare di emissione di luce.
Come esempio di bande reali, nella figura seguente è riportata la dispersione in varie
direzione dello spazio k della bande di valenza e conduzione in germanio, silicio e
arseniuro di gallio.
• Ge e Si sono semiconduttori a gap indiretta
• Il GaAs è un semiconduttore a gap diretta
136
Energie di gap in diversi semiconduttori
Pallini pieni e vuoti indicano rispettivamente gap diretta e indiretta.
Sovrapposta all’energia di gap dei vari materiali è riportata una banda colorata: il colore
di questa banda rappresenta il colore della luce qualora si considerino fotoni con energia
pari all’energia di gap; ovviamente soltanto per quei semiconduttori che hanno energie di
gap che corrisponderebbero a un fotone nella banda del visibile. Sopra la banda colorata
ci sono materiali che vengono considerati semiconduttori ma che hanno energie di gap
che corrispondono all’ultravioletto; al di sotto troviamo il silicio e il germanio che sono
conduttori la cui energia di gap corrisponde a un fotone nell’infrarosso.
TEST. Cosa differenzia un semiconduttore da un conduttore (metallo)?
a. Nello stato fondamentale sia i metalli sia i semiconduttori hanno la banda di conduzione
parzialmente piena, ma in un metallo la densità di elettroni è molto più alta rispetto ad un
semiconduttore.
b. Nello stato fondamentale la banda di conduzione di un metallo è parzialmente piena mentre in un
semiconduttore è completamente vuota.
c. Nello stato fondamentale sia in un metallo sia in un semiconduttore la banda di conduzione è vuota
ma la l’energia di gap di un metallo è inferiore a 2 eV.
[La risposta corretta è la b.]
7.2. Occupazione delle bande e densità di corrente nei
semiconduttori.
Occupazione delle bande nello spazio k a T=0K
A T=0K in un semiconduttore la banda di valenza (e tutte le bande a minore energia) è
completamente occupata: ogni stato k per il principio di Pauli è occupato da 2 elettroni
con spin opposto.
La banda di conduzione è completamente vuota
137
I semiconduttori a temperatura finita T>0
A temperatura finita, grazie al relativamente
piccolo valore della energia di gap, gli elettroni
sono termicamente eccitati dalla banda di valenza
alla banda di conduzione (elettroni intrinseci)
lasciando stati vuoti in banda di valenza.
Rappresentiamo quanto abbiamo appena detto nello spazio k.
Gli elettroni che saltano in banda di valenza vanno a occupare gli stati più vicini al
minimo di energia.
138
La conduzione elettrica
A T=0K i semiconduttori sono isolanti:
applicando un campo elettrico esterno non
c’è conduzione elettrica.
Infatti, nella banda di valenza non ci sono
stati vuoti che possano essere occupati
dagli elettroni che driftano per effetto del
campo elettrico (cambiano il valore del
loro momento k)
A T non nulla il semiconduttore è in grado di condurre.
In presenza di un campo elettrico gli elettroni driftano, cioè cambiano la loro velocità,
ovvero il loro momento cristallino, grazie all’effetto del campo elettrico e quindi da uno
stato k vanno a occupare lo stato k’, e lo stesso fanno gli elettroni in banda di valenza,
dove però potremmo pensare che si è spostato lo stato vuoto.
Alla conduzione contribuiscono sia gli stati in banda di valenza che quelli in banda di
conduzione, entrambe solo parzialmente piene.
139
A questo punto siamo pronti per il
calcolo della densità di corrente
Per il calcolo della corrente possiamo utilizzare la formula che è stata introdotta nel
corso di fisica dei solidi: le vk sono le velocità dei portatori presenti nella banda, ciascuno
moltiplicata per la carica elementare e il tutto diviso per il volume del sistema.
Questa sommatoria va calcolata sia per gli elettroni in banda di conduzione sia
(separatamente) per gli elettroni in banda di valenza.
Contributo degli elettroni
in banda di conduzione
j   e 
1
V

Contributo degli elettroni
in banda di valenza
j   e 
k
k _ occupati
banda _ conduzione
1
V

k
k _ occupati
banda _ di _ valenza
Semplifichiamo la procedura matematica mediante alcune osservazioni di simmetria.
Alcune proprietà degli stati elettronici dei solidi
Gli stati con momento cristallino k e –k (uguali in
modulo e verso opposto) hanno la stessa energia, cioè
sono degeneri in energia
Gli elettroni negli stati con momento k e –k hanno stessa
energia ma velocità opposte 𝒗𝒌= – 𝒗−𝒌
Si ritrova quindi che una banda completamente occupata
non contribuisce alla densità di corrente
j   e 
1
V
v
k
k _ banda
0
Se suddividiamo tutti i k possibili in una banda di energia in due insiemi che chiamiamo
koccupati e kvuoti
k_banda = koccupati + kvuoti
dalla espressione della densità di corrente in una banda piena (che vale zero) si ricava che
e
1
V
v
k
k _ banda
 0   e 
1
V
1
 v   e V  v
k
k _ occupati
k
k _ vuoti
Quindi per la densità di corrente dovuta agli elettroni nella banda di valenza parzialmente
occupata
140
j   e 
1
V
 vk   e
k _ occupati
1
V
v
k
k _ vuoti
Da cui segue immediatamente che per il calcolo di j possiamo utilizzare in alternativa alla
sommatoria sugli stati occupati la sommatoria sugli stati vuoti a patto di cambiare il
segno dell’espressione.
I semiconduttori nello stato fondamentale sono isolanti. Perché?
a. Perché la banda di valenza è completamente occupata e la banda di conduzione è vuota.
b. Perché la a banda di conduzione contiene un numero di elettroni estremamente basso, tale da non
generare conduzione elettrica.
c. Perché la conduzione dovuta agli elettroni in banda di valenza compensa esattamente quella dovuta
agli elettroni in banda di conduzione.
[La risposta corretta è la a.]
7.3. Le lacune e le loro proprietà
Concetto di LACUNA
Abbiamo appena visto che
j   e 
1
V
1
 v   eV  v
k
k _ occupati
k
k _ vuoti
La corrente prodotta da elettroni che occupano un
insieme di stati in una banda è analoga a quella che
si ottiene se si considerano quell’insieme di stati
come vuoti e tutti i restanti stati realmente vuoti
della banda come occupati da particelle con carica
positiva pari a +e: le lacune
Le proprietà di trasporto dovuta agli stati occupati in banda di valenza si descrivono
efficacemente in termini di lacune, particelle positive di carica +e che occupano gli
stati vuoti della banda. In una banda di valenza il numero degli stati vuoti è piccolo
rispetto a quello degli stati occupati e quindi diventa più comodo descrivere le proprietà
di trasporto dovute agli stati occupati in termini di lacune. Le lacune rispondono ai
campi elettrici e magnetici come particelle di carica positiva +e.
Vediamo ora le proprietà delle lacune, a cominciare dalla loro energia.
Nei diagrammi delle bande si riporta sempre la dispersione E(k) degli elettroni. Le
energie degli elettroni crescono verso l’alto.
141
Assumiamo che lo zero sia in corrispondenza del massimo della banda di valenza.
Osservando che le lacune hanno carica positiva, l’energia delle lacune è uguale ed
opposta a quella degli elettroni e cresce nella direzione verticale verso il basso (vedi
figura sotto)
Se Ee è l’energia elettronica dello stato vuoto di vettore d’onda k, e con El l’energia della
lacuna corrispondente si ha che
El k    Ee k 
Per capire questa proprietà basta osservare la seguente immagine, dove è mostrata la
banda di valenza. Sia nel caso a sia nel caso b, per generare una lacuna è stato rimosso
un elettrone
Più l’elettrone mancante era legato (stato vuoto lontano dal massimo della banda di
valenza) maggiore lavoro è stato necessario per rimuoverlo: pertanto l’energia delle
lacune aumenta nella direzione opposta di quella deli elettroni.
Sia gli elettroni che le lacune tendono ad occupare gli stati con minor energia.
142
Nel diagramma a bande
- gli elettroni tendono a scendere
- le lacune tendono a galleggiare
Struttura delle energie di banda del GaAs (Arseniuro di gallio) e del Si (Silicio)
TEST. Cosa sono le lacune in un semiconduttore?
a. Le lacune sono particelle di carica positiva +e con le quali descrivere le proprietà della banda di
conduzione.
b. Le lacune sono particelle di carica negativa – e con le quali descrivere le proprietà della banda di
conduzione.
c. Le lacune sono particelle di carica positiva +e con le quali descrivere le proprietà della banda di
valenza.
[La risposta corretta è la c.]
7.4. Conduzione elettrica. Massa efficace nei solidi:
applicazione alla banda di valenza e alla banda di conduzione.
Gli elettroni in un cristallo rispondono ai campi esterni applicati come se avessero una
massa m* diversa da quella dell’elettrone libero m=9 x 10 – 31 Kg
Tale valore prende il nome di
m* = massa efficace
Il valore m* è determinato dalla forma della dispersione delle bande nello specifico stato
occupato dall’elettrone, individuato dai numeri quantici n e k.
Per comprendere da dove arriva questa proprietà dei solidi possiamo fare delle semplici
osservazioni considerando la forma della dispersione della banda di conduzione e poi
della banda di valenza. Non è una teoria rigorosissima da un punto di vista matematico
ma ci permette di comprendere l’origine fisica di questa proprietà.
143
Cominciamo a osservare la banda di conduzione in un semiconduttore a gap diretta
(questo vale anche per un semiconduttore a gap indiretta): gli elettroni occuperanno stati
vicini al fondo della banda di conduzione; in prossimità del minimo della banda di
conduzione la relazione di dispersione è ben approssimabile con un andamento
parabolico.
Sviluppando quindi l’espressione di Ec(K) in serie di Taylor fino al termine quadratico e
ponendo lo zero dell’energia sulla sommità della banda di valenza si ottiene:
Ee k   EG  Ak 2
1 d 2E
A
dove A è una costante positiva pari a :
2 dk 2 k k
min
Confrontiamo questa espressione con l’energia di un elettrone libero
Eelettronelibero
p 2 2k 2


2m
2m
Possiamo pertanto riscrivere la dispersione della banda di conduzione intorno al minimo
come:
 2k 2
Ee k   EG  Ak  EG 
2me*
2
2
Si vede che A ha le dimensioni di  divisa due volte una massa; tale massa efficace ha
le dimensioni fisiche di una massa ma numericamente non coincide con la massa
144
dell’elettrone libero; sarà invece determinata dalla curvatura della dispersione dell’energia
elettronica; ovviamente me  0 in quanto la curvatura della dispersione è positiva.
Si ottiene una espressione analoga a quella che si ha per gli elettroni liberi, pur di
sostituire la massa dell’elettrone me con me*, che è la massa efficace dell’elettrone in
banda di conduzione nel semiconduttore.
*
Anche per le lacune che occupano gli stati alla sommità della banda di valenza la
dispersione dell’energia E(k) si può sviluppare intorno al massimo
 2k 2
El k    Ee k   A' k 
2ml*
2
1 d 2E
dove A' è una costante positiva pari a : A'  2 dk 2
k 0
con ml  0 massa efficace delle lacune in banda di valenza.
Notiamo come nei semiconduttori la descrizione degli stati in prossimità del massimo
della banda di valenza in termini di elettroni e non di lacune porterebbe ad una relazione
di dispersione fra energia e momento tale che la massa efficace sarebbe negativa.
*
Massa efficace e bande di energia
Riassumendo: le masse efficaci degli elettroni e delle lacune in un semiconduttore sono
legate alla forma della dispersione, in particolare alla derivata seconda della dispersione;
ovviamente il loro valore numerico dipende non solo dalla forma ma anche dal valore
specifico in cui appare il minimo o il massimo delle bande.
Pertanto rappresenteremo
la banda di conduzione come occupata da elettroni di carica
(–e) e massa pari alla massa efficace me*
la banda di valenza come occupata da lacune di carica (+e) e
massa pari alla massa efficace ml*
2
m  2
d Ee
dk 2
k min
2
m  2
d El
dk 2
k  max
*
e
*
l
145
Significato della massa efficace
La relazione di dispersione dell’energia è formalmente simile a quella dell’elettrone
libero: in realtà gli elettroni non sono liberi in quanto interagiscono con gli atomi del
reticolo cristallino.
L’effetto dell’interazione con le cariche del solido è dentro il valore della massa efficace.
Gli elettroni nel cristallo rispondono ai campi elettrici e magnetici come se fossero
particelle libere con massa pari alla massa efficace, determinata dalla curvatura della
banda di energia.
L’uso della massa efficace ci permette di non far comparire esplicitamente le interazioni
fra gli elettroni di conduzione e di valenza e le restanti cariche del cristallo.
Nella figura sono riportate schematicamente la tipica struttura della sommità della
banda di valenza e del fondo della banda di conduzione di un semiconduttore.
Sono presenti 3 bande di valenza, tutte
con curvature negative. Le due bande
degeneri a k=0 rappresentano le energie di:
• lacune pesanti (heavy hole band, banda
con curvatura minore)
• lacune leggere (light hole band, banda
con curvatura maggiore).
A maggiore energie per le lacune si ha la
terza banda di valenza (split-off band),
separata dalle precedenti dall’energia di
interazione spin-orbita.
Massa efficace degli elettroni: tipici valori
Silicio:
mt*=0.2m (m massa elettrone libero), mL*=0.98 m
Germanio: mt*=0.08 m, mL*1.6m
GaAs:
m*=0.067 m
m*t, m*L sono la massa efficace degli elettroni per due diverse direzioni del momento
cristallino (trasverso e longitudinale). La massa efficace dell’elettrone può essere più
grande o più piccola della massa dell’elettrone libero e può dipendere dalla direzione
dello spazio k che si sta considerando (questo in particolare è vero per i semiconduttori
a gap indiretta mentre nell’arseniuro di gallio, a gap diretta, la massa mostra una
146
maggiore isotropia e ha un unico valore indipendentemente dalla direzione di k che
stiamo considerando).
Massa efficace delle lacune: tipici valori
Silicio:
mlp*=0.49m , mll*=0.16 m
Germanio: mlp*=0.28 m, mll*=0.044m
GaAs:
mlp*=0.45 m, mll*=0.082m
mlp* e mll* sono le masse efficaci delle lacune pesanti e leggere in banda di valenza.
Dinamica del trasporto elettrico
Ciò che ci interessa è trovare l’equazione del moto in presenza di un
campo elettrico e/o magnetico esterno
Campo elettrico F
Campo magnetico B
Equazione del moto


  
dv
dk
m

 e F  v  B
dt
dt


Scriviamo l’equazione del moto per le lacune e gli elettroni in banda di valenza e
conduzione rispettivamente:
ELETTRONI
LACUNE
 2k 2
Ee k   EG 
2me*
 2k 2
El k    Ee k   A' k 
2ml*
2
in presenza di campo elettrico (caso 1D per
semplicità) la velocità e l’accelerazione sono:
v
1
1 dE

k

me*
 dk
v
dv d  1 dE  1 d 2 E dk  e
am
 

F

dt dt   dk   dk 2 dt me*
1
1 dE

k

ml*
 dk
dv d  1 dE  1 d 2 E dk
e
am
 

F

dt dt   dk   dk 2 dt ml*
Come ci aspettiamo per una particella di carica Come ci aspettiamo per una particella di
(–e) e massa positiva l’accelerazione è diretta carica (+e) e massa positiva l’accelerazione è
concorde con il verso del campo elettrico
in verso opposto al campo elettrico
147
A questo punto abbiamo tutti gli ingredienti necessari per poter definire la conducibilità
elettrica in un semiconduttore.
Calcolo della conducibilità elettrica in un semiconduttore
Un semiconduttore a temperatura non nulla mostra una conducibilità elettrica dovuta sia
agli elettroni in banda di conduzione sia alle lacune in banda di valenza.
Grazie al modello di Drude mettiamo in relazione la densità di corrente e il campo
elettrico utilizzando per la velocità e l’accelerazione le espressioni determinate con le
equazioni del moto di elettroni e lacune
v  a
j  qne ,l v  qne ,l a
τ tempo medio di collisione
a accelerazione dovuta al campo elettrico
Indicando con n la densità di elettroni e con p la densità di buche
e
ne2
Contributo degli elettroni: je  enve   ne m* F e  m*  e F   e F
e
e
ne2
con  e  m*  e
e
pe2
Contributo delle lacune je  epvl  m*  l F   l F
l
pe2
con  l  m*  l
l
Dobbiamo ora capire come sommare i due contributi.
Supponiamo di avere un campo elettrico F diretto
come in figura.
Moto degli elettroni in banda di conduzione in
presenza di un campo elettrico F
Moto delle lacune in banda di valenza in presenza di
un campo elettrico F
Le velocità di deriva degli elettroni e delle buche hanno verso opposto, ma le densità di
corrente hanno lo stesso verso, concorde con il campo elettrico.
Pertanto le densità di corrente vanno sommate:
j  je  jl
148
Legge di Ohm nei semiconduttori
 ne2
pe2 
j  je  jl   *  e  *  l  F  F
ml 
 me
ne2
pe2
1







e
l è la conducibilità del sistema.
dove
me*
ml*

Questa espressione mostra attraverso quali fattori la conducibilità (o la resistività) di un
semiconduttore dipende dalla temperatura:
- τ aumenta al diminuire di T
- n e p diminuiscono al diminuire di T (è un processo di eccitazione termica che li
genera; al contrario in un metallo la densità di portatori è costante al variare di T)
Anziché dare come parametro la conducibilità, spesso si preferisce dare la
mobilità elettronica
Il rapporto fra la velocità di deriva e il campo elettrico applicato che l’ha generata è
una grandezza che dipende dalle caratteristiche del materiale ed è chiamato mobilità
elettronica μ. Avremo un valore di mobilità per gli elettroni e uno per le lacune
e 
ve e e
 *   e T 
F
me
l 
vl e l

  l T 
F ml*
La mobilità così come la conducibilità dipende dalla temperatura
ne2
pe2
  *  e  *  l  nee  pel
me
ml
Mobilità degli elettroni in banda di conduzione: valori tipici a temperatura ambiente
Silicio:
μe =1400 cm2 V – 1 s – 1
Germanio: μe =3900 cm2 V – 1 s – 1
GaAs:
μe =3500 cm2 V – 1 s – 1
Mobilità delle lacune in banda di valenza: valori tipici a temperatura ambiente
Silicio:
μe =450 cm2 V – 1 s – 1
Germanio: μe =190 cm2 V – 1 s – 1
GaAs:
μe =400 cm2 V – 1 s – 1
Si osserva che gli elettroni sono molto più “mobili” delle lacune. Tali valori della
mobilità sono dati in una unità di misura “intermedia” ai due sistemi SI e c.g.s., ma che è
comunque quella in cui vengono dati.
149
TEST. Nella legge di Ohm per un semiconduttore la conducibilità è determinata:
a. dalla somma del contributo degli elettroni in banda di conduzione e da quello delle lacune in banda
di valenza e i due contributi hanno segno discorde.
b. solamente dagli elettroni in banda di conduzione.
c. dalla somma del contributo degli elettroni in banda di conduzione e da quello delle lacune in banda
di valenza e i due contributi hanno segno concorde.
[La risposta esatta è la c.]
Densità dei portatori in funzione della temperatura
Calcolo della densità dei portatori intrinseci
SEMICONDUTTORE INTRINSECO: assenza di impurezze che contribuiscono
alla densità di portatori. In altre parole, gli elettroni in banda di conduzione sono
solamente quelli eccitati termicamente a partire dalla banda di valenza. è evidente che nei
semiconduttori intrinseci la densità di elettroni in banda di conduzione è uguale alla
densità di lacune in banda di valenza: le due sono legate intrinsecamente dal meccanismo
che li produce.
Le concentrazioni di elettroni n in banda di
conduzione e di lacune p in banda di valenza
dipendono dalla temperatura.
In un semiconduttore intrinseco n(T) = p(T)
Come si determina la densità di portatori in una banda di energia
(ad esempio in banda di conduzione)
Ci aiuta la meccanica statistica:
Cominciamo con l’analizzare f(E)
150
La funzione di distribuzione di Fermi-Dirac, f(E), determina come gli elettroni
occupano gli stati nella banda.
Tale funzione è riportata qui sotto. In un solido a temperatura T e potenziale chimico μ
(energia di Fermi) la probabilità di occupazione dello stato di energia E è data da
f E  
1
e
E 
k BT
1
A temperatura nulla la funzione di Fermi-Dirac è una funzione a gradino che vale 1 per
tutti gli stati elettronici che hanno energie inferiore al potenziale chimico e vale 0 per
tutti gli stati che hanno energia maggiore al potenziale chimico.
A temperatura non nulla avremo una certa probabilità diversa da zero anche per gli stati
con energia maggiore del potenziale chimico.
Cerchiamo ora di calcolare il valore della
funzione di distribuzione di Fermi–Dirac per gli elettroni e le lacune
In banda di conduzione: la probabilità che un elettrone occupi lo stato a energia E è f(E)
In banda di valenza: la probabilità che una lacuna occupi lo stato a energia E corrisponde
alla probabilità che quello stato sia vuoto, perciò è pari a 1 – f (E).
Per valutare effettivamente f(E) e 1 – f(E) dobbiamo conoscere il
potenziale chimico in un semiconduttore intrinseco
n = p per ogni temperatura
Supponiamo che il numero di stati (in un dato intervallo di energia) nell’intorno del
minimo della banda di conduzione Ec sia uguale a quello nell’intorno massimo della
banda di valenza Ev .
Probabilità che elettroni occupino stati a Ec = Probabilità di lacune occupino stati a Ev
f(Ec) = 1 – f(Ev)
Da cui segue, essendo Ec – Ev il
valore dell’energia di gap EG , che
il potenziale chimico di un
semiconduttore vale

EG
2
151
In un semiconduttore intrinseco
il potenziale chimico è all’incirca
a metà gap
In rosso le energie in banda di
conduzione.
In blu quelle relative alla banda di
valenza
A fianco la funzione di
distribuzione, in rosso per gli
elettroni, in blu per le lacune con
il flesso al potenziale chimico che
si trova a metà gap
Guardando questi grafici troviamo che sia per gli elettroni (E>Ec) che per le lacune
(E<Ev) vale la relazione E  
semiconduttori non degeneri)
 kBT (quando vale questa relazione si parla di
La funzione di distribuzione di Fermi-Dirac in un semiconduttore non degenere è
approssimabile con
f E  
1
e
E 
kBT
e

E 
kBT
1
Densità degli elettroni e delle lacune
n  ni  N c e

EG
2 k BT
p  pi  N v e

EG
2 k BT
Se facciano il prodotto np otteniamo la densità di portatori intrinseci al quadrato,
un’espressione che dipende soltanto dalla temperatura, fissato il semiconduttore, ovvero
la sua energia di gap. Questa relazione si chiama
152
Legge dell’azione di massa
np  ni2  N v N p e

EG
kBT
In un semiconduttore intrinseco, a temperatura ambiente:
ni  1010 cm3
Questo numero così piccolo è sufficiente per avere una conducibilità adeguata per
utilizzare i semiconduttori nell’elettronica o comunque come conduttori?
Germanio
Silicio
Arsenio di Gallio
13
9
300 K
2.02 x 10
8.72 x 10
2.03 x 10 6
400 K
1.38 x 10 15
4.52 x 10 12
5.98 x 10 9
500 K
1.91 x 10 16
2.16 x 10 14
7.98 x 10 11
600 K
1.18 x 10 17
3.07 x 10 15
2.22 x 10 13
In realtà questi numeri non sono sufficienti; e infatti, perché sia possibile usare i
semiconduttori dobbiamo fare qualcosa… quel qualcosa è “drogarli”.
7.5. Drogaggio e densità dei portatori dei semiconduttori.
DROGAGGIO DI UN SEMICONDUTTORE: introduzione di impurezze
opportune nel cristallo semiconduttore per variare intenzionalmente e in modo
controllato la densità di elettroni o lacune.
La variazione della densità dei portatori si riflette in una variazione di conducibilità
del semiconduttore.
Tale processo di modulazione della densità dei portatori è molto efficiente: anche
introducendo 1 impurezza ogni 105 atomi si può ottenere un aumento della conducibilità
di un fattore 103.
Dobbiamo innanzitutto richiamare alcune nozioni relativi alla struttura cristallina e ai
legami nei semiconduttori. Ci riferiremo al silicio che è alla base dell’elettronica e della
microelettronica attuale.
153
Struttura cristallina e legame nei semiconduttori
Semiconduttori tipici: Si, Ge.
Il Si e il Ge, atomi tetravalenti, cristallizzano nella
struttura del diamante; in ciascun atomo i 4 elettroni
di valenza (in stati ibridizzati sp3) formano 4 legami
covalenti con i primi vicini.
Rappresentazione bidimensionale del reticolo del
silicio: ciascun atomo forma 4 legami con gli altri
atomi del cristallo (immagine bidimensionale
Drogaggio di tipo n e drogaggio di tipo p
Sono possibili due tipi di drogaggi.
Drogaggio di tipo n tramite
introduzione di impurezze
donori: aumento della densità
di elettroni in banda di
conduzione
Drogaggio di tipo p tramite
introduzione di impurezze
accettori: aumento della
densità di lacune in banda di
valenza
154
DROGAGGIO DI TIPO
n
ATOMI DONORI
I donori sono impurezze pentavalenti (un donore, ad esempio, è il fosforo P) che
sostituiscono un atomo di Silicio nel reticolo
Dei 5 elettroni di valenza del donore, 4 elettroni formano i legami covalenti con i
rispettivi atomi di Si primi vicini nel cristallo; il 5° elettrone di valenza è un elettrone
extra per il semiconduttore e rimane spaiato.
Effetto dell’introduzione nel cristallo di impurezze donori:
• Il semiconduttore rimane neutro nel suo insieme
• ma è come se localmente nel reticolo avessimo messo una carica fissa addizionale
pari a +e
• intorno alla quale c’è una carica negativa in più, un elettrone extra nel
semiconduttore
L’elettrone extra risente del potenziale coulombiano generato dallo ione impurezza
di carica +e immerso nel semiconduttore di costante dielettrica εr
V r   
e2
40 r r
Questo elettrone extra rimane confinato nella regione attorno allo ione donore o
partecipa alla conduzione?
L’energia di ionizzazione del donore può essere stimata utilizzando il modello di Bohr
per la rappresentazione del legame fra lo ione impurezza e l’elettrone extra.
Il modello di Bohr è analogo al modello dello ione con l’elettrone spaiato.
Modello di Bohr per l’atomo di idrogeno
1 2
e2
E  T  V  mv 
2
4 0 r
mvr  n
Quantizzazione del momento angolare
Energia dell’elettrone nell’atomo di Bohr
e4m
Elegame n  1 
 13.6eV
2
24 0 
Raggio di Bohr:
4 2 0
a0  2
 0.53Angstrom
em
155
Energia dei donori
Utilizzando il modello di Bohr per la rappresentazione del legame fra lo ione impurezza
e l’elettrone extra, è necessario considerare la costante dielettrica εr del semiconduttore e
la massa efficace m* dell’elettrone;
1 * 2
e2
E  T  V  me v 
2
40 r r
Energia di ionizzazione del donore:
Raggio di Bohr del donore:
e 4 me*
1 me*
ED 
 13.6 2
eV
2
r m
24 0 r 
4 2 0 r
m
aD 

0
.
53

Angstrom
r
e 2 me*
me*
Per il silicio
 r  16 , m*  0.2m
0.2
eV  poche decine di meV
2
16
16
aD  0.53 r
 4nm
0 .2
ED  13.6
Le tipiche energie dei donori sono tali che a temperatura ambiente il donore è ionizzato,
cioè l’elettrone extra non è in uno stato legato confinato intorno all’impurezza, ma si può
considerare «libero» di partecipare alla conduzione del cristallo.
È proprio questo il meccanismo che consente l’aumento di densità di elettroni in banda
di conduzione in cado di drogaggio n.
Ionizzazione dei donori e aumento della densità di elettroni
Gli elettroni extra debolmente legati alle impurezze
sono ionizzati e promossi in banda di conduzione
grazie all’energia termica.
La densità di elettroni è pertanto maggiore di quella che
si avrebbe in un semiconduttore intrinseco.
156
DROGAGGIO DI TIPO
p
ATOMI ACCETTORI
Gli accettori sono impurezze trivalenti (atomo accettore, ad esempio, è il boro, B) che
sostituiscono un atomo di Silicio nel reticolo.
I 3 elettroni di valenza dell’accettore formano tre legami covalenti con i rispettivi degli
atomi di Si primi vicini nel cristallo. Localmente dove è presente l’impurezza manca un
elettrone per saturare il legame: l’elettrone mancante proviene dalla banda di valenza del
Si generando quindi una lacuna.
Effetto dell’introduzione nel cristallo di impurezze accettori
• Il semiconduttore rimane neutro nel suo insieme.
• carica fissa addizionale pari a –e
• una lacuna extra nel semiconduttore
La lacuna extra risente del potenziale coulombiano generato dallo ione impurezza di
carica –e immerso nel semiconduttore di costante dielettrica εr
V r   
e2
40 r r
La costante dielettrica relativa è quella del silicio, che ospita l’atomo accettore.
L’energia di ionizzazione degli accettori può essere stimata utilizzando il modello di Bohr
per l’atomo di idrogeno per il legame fra lo ione impurezza e la lacuna, così come visto
per il caso dei donori.
e 4 ml*
1 ml*
 13.6 2
eV
2
Energia di ionizzazione dell’accettore: E A 

m
24 0 r 
r
4 2 0 r
m
a


0
.
53

Angstrom
A
r
2 *
*
Raggio di Bohr dell’accettore:
e ml
ml
La stima numerica per gli accettori fornisce valori analoghi a quelli dei donori:
E A  qualche decina di meV
aA  qualche nanometro
Abbiamo dunque individuato il meccanismo che consente ai semiconduttori drogati p un
aumento delle lacune in banda di valenza.
157
Affinché si generi una lacuna nella banda di valenza
l’impurezza deve essere «ionizzata» (analogamente al
caso dei donori). Ciò significa che per effetto
dell’energia termica un elettrone lascerà la banda di
valenza occupando il livello dell’accettore (a più alta
energia per l’elettrone) liberando così la lacuna in
banda di valenza.
In presenza di impurezze accettori ionizzate: la
densità di lacune è maggiore di quella che si avrebbe
in un semiconduttore intrinseco
Energia delle impurezze
Energia di ionizzazione ED per impurezze
pentavalenti in Si e Ge, in meV:
Energia di ionizzazione EA per impurezze
trivalenti in Si e Ge, in meV:
P
As Sb
Si 45 49 39
Ge 12.0 12.7 9.6
P
As Sb
Si 45 57 65
Ge 10.4 10.2 10.8
LEGGE DI AZIONE DELLA MASSA
In ogni semiconduttore, indipendentemente dal drogaggio, il prodotto np è una costante
che dipende solo dalla temperatura
np  n  N N p e
2
i

EG
kT
 const(T )
Semiconduttori drogati n: in presenza di donori ionizzati aumenta la concentrazione di
elettroni (portatori maggioritari) e diminuisce quella delle lacune (portatori minoritari)
rispetto al caso dei semiconduttori intrinseci.
Semiconduttori drogati p: in presenza di accettori ionizzati aumenta la concentrazione
di lacune (portatori maggioritari) e diminuisce quella degli elettroni (portatori minoritari).
Oltre che il meccanismo qualitativo è importante capire quanti sono effettivamente gli
elettroni che possono essere promossi in banda di conduzione e quante sono le lacune in
banda di valenza grazie alla ionizzazione delle impurezze donori o accettori. È un
processo di attivazione termica.
158
Dipendenza dalla temperatura
Il numero di impurezze ionizzate e quindi il numero di portatori promossi in banda di
conduzione o di valenza è fornito dalle leggi della meccanica statistica, cosi come nel
caso intrinseco.
Contributo delle impurezze a temperatura ambiente
A temperatura ambiente gli atomi donori (gli atomi accettori) sono ionizzati:
Drogaggio di tipo N:
nestrinseci = ND
Drogaggio di tipo P:
pestrinseci = NA
Contributo delle impurezze a bassa temperatura
A bassa temperatura la densità di elettroni (lacune) estrinseci dipende esponenzialmente
dalla temperatura
ne   N D  e
12
 ED
2 k BT
pe   N A  e
12
 EA
2 k BT
All’esponente non è presente l’energia di gap ma l’energia di ionizzazione termica del
donore o dell’accettore.
Portatori in funzione della temperatura
Mettiamo assieme tutte le informazioni via via introdotte fin qui per vedere come varia la
densità dei portatori in funzione della temperatura.
Cominciamo con un semiconduttore drogato n. Quello che diremo vale anche per un
semiconduttore drogato p.
159
Densità di elettroni in un semiconduttore vs temperatura
BASSA T: kBT<< ED
(ED = energia di ionizzazione
dei donori)
Regione di congelamento
L’energia termica è insufficiente a
ionizzare le impurezze e a
maggior ragione a promuovere gli
elettroni intrinseci dalla banda di
valenza a quella di conduzione. Il
semiconduttore tende ad un
isolante
Temperatura ambiente:
kBT ~ ED
Regione estrinseca
La densità di portatori è
determinata dai portatori estrinseci
promossi in banda di conduzione
dovuta alla ionizzazione dei donori.
Per una ionizzazione completa
n=ND e la densità non dipende
dalla temperatura. I portatori
intrinseci sono congelati.
Temperatura ALTA:
kBT>> EG
Regione intrinseca
La densità dei portatori è dovuta ai
portatori intrinseci eccitati
termicamente dalla banda di
valenza alla banda di conduzione.
160
Valori tipici a temperatura ambiente
All’aumentare della densità di portatori in un semiconduttore non degenere
- in funzione del drogaggio: da 10 13 a 10 18 cm – 3
ND, NA: 1013-1018 impurezze cm – 3
- in un metallo: 1022 cm – 3
diminuisce la ρ (resistività elettrica)
- in Silicio: da 10 3 a 10 – 2 Ohm m
- in un metallo: 10 – 8 -10 – 7 Ohm m
7.6. Test ed esercizi
In un metallo all’aumentare della temperatura:
a. Il numero di elettroni in banda di conduzione non varia.
b. Aumenta il numero di lacune in banda di valenza.
c. Aumentano in eguale misura sia il numero di elettroni in banda di conduzione sia il numero di lacune
in banda di valenza.
d. Diminuisce il numero di elettroni in banda di conduzione.
e. Aumenta il numero di elettroni in banda di conduzione.
[La risposta corretta è la a.]
Calcolare la velocita di deriva delle lacune in un semiconduttore indotta da un campo elettrico
di intensità F=1V/cm, se la massa efficace delle lacune è m∗=1.2m e il tempo medio di
collisione τ=2 10−12.
a.
b.
c.
d.
e.
1 m/s.
100 m/s.
3 10 6 m/s.
29 m/s
5 10 5 m/s
[La risposta corretta è la d: v=aτ=(e/m*)Fτ.
Si ricordi che e/m=1,759 10 11 C/Kg]
In un semiconduttore intrinseco il potenziale chimico μ:
a. Si trova all’interno della banda di valenza.
b. Si trova all’interno della banda di conduzione.
c. Si trova all’interno della gap.
d. Si sposta dalla banda di valenza a quella di conduzione a seconda della sua energia di gap e delle
masse efficaci.
e. Si sposta dalla banda di valenza a quella di conduzione in funzione della temperatura.
[La risposta corretta è la c.]
In un semiconduttore intrinseco all’aumentare della temperatura:
a. Aumenta sia il numero di elettroni che il numero di lacune in modo che n=p.
161
b. Aumenta il numero di elettroni in banda di conduzione in modo che gli elettroni siano in numero
maggiore rispetto alle lacune.
c. Aumenta il numero di elettroni in banda di conduzione a spese delle lacune in banda di valenza, il cui
numero diminuisce.
d. Aumenta il numero di lacune in banda di valenza in modo che le lacune siano in numero maggiore
rispetto agli elettroni.
e. La temperatura non influisce il numero di elettroni in un semiconduttore intrinseco ma solo su quello
in un semiconduttore drogato.
[La risposta corretta è la a.]
Le bande di conduzione e di valenza di due semiconduttori sono ben esprimibili intorno ai
loro rispettivi estremi con le seguenti espressioni (Nota: le energie sono in eV):
1) EV(k)=−C1k2 e EC(k)=2+C2k2, con C1=6.2 10−20eVm2 e C2=3 10−20eVm2,
2) EV(k)=−C+Dcos(ka) e EC(k)=A−Bcos(ka), con A=4.6eV, B=4.0eV, C=3.0eV, D=2.9eV e
a=2angstrom. Quanto valgono le energie di gap nei due semiconduttori?
a. (1) 1.6 10−19J e (2) 1.6eV.
b. (1) 3.2 10−19J e (2) 0.7eV.
c. (1) 1.8 10−11J e (2) 0.5eV.
d. (1) 3.8 10−11J e (2) 0.9eV.
e. (1) 1.1J e (2) 1.1eV.
[La differenza fra il minimo di EC(k) e il massimo di EV(k) si ottiene per k=0 in entrambi i casi
e vale nel caso (1) EG=2eV mentre vale (A – B) – (– C+D) nel caso (2). La risposta esatta è la b.]
La densità di elettroni in un semiconduttore intrinseco è 3 10 15cm−3. Sapendo che la mobilità
elettronica è pari a 2500cm2 V −1s−1 ed è doppia di quella delle lacune, calcolare il valore della
conducibilità del semiconduttore.
a. 180 Ω−1m−1.
b. 30 Ω−1m−1.
c. 120 Ω−1m−1.
d. 240 Ω−1m−1.
e1. 60 Ω−1m−1.
[La formula è   nee  pel . Ricordare che n=p.
1 

2 

In un semiconduttore intrinseco la conducibilità elettrica (σ) dovuta agli elettroni è pari a 45
Ω−1m−1. Sapendo che le lacune hanno mobilità pari a 1/3 di quella elettronica, quale è il valore
della conducibilità del semiconduttore?
  ne  e   e  . La risposta corretta è la a.]
a.
b.
c.
d.
e.
30 Ω−1m−1.
60 Ω−1m−1.
45 Ω−1m−1.
90 Ω−1m−1.
120 Ω−1m−1.
[(1+1/3)σ = (4/3)σ. La risposta corretta è la b.]
Nel drogaggio di tipo p di un semiconduttore:
a. si introducono impurezze donori nel reticolo con lo scopo di aumentare la densità di elettroni
rispetto al caso intrinseco.
b. si introducono impurezze accettori nel reticolo con lo scopo di aumentare la densità di lacune
rispetto al caso intrinseco.
162
c. si introducono impurezze accettori nel reticolo con lo scopo di aumentare la qualità cristallina del
semiconduttore.
[La risposta corretta è la b.]
Un semiconduttore con energia di gap pari a 1.4eV, drogato p con accettori aventi energia di
ionizzazione di 35meV e densità NA=3 10 17 cm−3 è posto a temperatura T=370K. In queste
condizioni, quale delle seguenti affermazioni sui valori della densità di elettroni in banda di
conduzione e di lacune in banda di valenza è corretta?
a. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e un ugual numero di elettroni sono in
banda di conduzione.
b. (sbagliata) la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e non ci sono elettroni in
banda di conduzione
c. la densità di lacune p è uguale alla densità n di elettroni e entrambe sono uguali al valore intrinseco,
perché le impurezze accettori non sono ionizzate alla temperatura data.
d. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e quella di elettroni in banda di
conduzione è molto inferiore a quella delle lacune.
e. la densità di lacune in banda di valenza è pari a p=3 10 17cm−3 e quella di elettroni è pari alla densità di
elettroni che si avrebbe in un semiconduttore intrinseco posto alla stessa temperatura.
[La risposta esatta ha l’aria di essere la e.]
163
Cap. 8
I semiconduttori nell’elettronica
C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana
8.1. La giunzione p-n
Giunzione fra due semiconduttori drogati p e n
Nella regione di tipo P i portatori maggioritari sono le lacune pp. Gli accettori ionizzati
NA costituiscono le cariche negative «fisse».
Nella regione di tipo N i portatori maggioritari sono gli elettroni nn. I donori ionizzati
ND costituiscono le cariche positive «fisse»
Alla formazione della giunzione P-N l’equilibrio è raggiunto mediante la diffusione
attraverso l’interfaccia di elettroni verso la regione P e lacune verso la regione N.
La DIFFUSIONE è dovuta alla diversa concentrazione delle due tipologie di cariche
nelle due regioni della giunzione.
Il trasferimento di carica lascia all’interfaccia della giunzione una regione di carica
spaziale fissa costituita dalle impurezze cariche non più neutralizzate da elettroni e
lacune.
La regione all’interfaccia in cui è presente la carica fissa è detta REGIONE DI
SVUOTAMENTO O DI DEPLEZIONE. Questa densità di carica all’interfaccia
164
genera un campo elettrico che si oppone alla diffusione di elettroni verso la zona P e di
lacune verso la regione N, permettendo alla giunzione di raggiungere l’equilibrio.
Il campo elettrico nella regione di svuotamento genera una differenza di potenziale fra la
regione P e la regione N che è detta potenziale di built-in ΔVbi
Densità dei portatori, carica spaziale, campo elettrico e potenziale
elettrostatico
Le regioni n e p del
semiconduttore lontane
dall’interfaccia sono neutre
Profilo della densità di
carica spaziale fissa: densità
ND nella regione n, NA nella
regione p. Estensione: da
qualche nm al mm.
Profilo del campo elettrico
Profilo del potenziale
elettrico: il potenziale di
built-in ΔVbi è la caduta di
tensione ai capi della
regione di svuotamento.
165
Distribuzione dei portatori maggioritari e minoritari nella giunzione
pp cariche maggioritarie
nn cariche maggioritarie
np elettroni minoritari
generati termicamente
pn lacune minoritarie
generate termicamente
Le concentrazioni di elettroni e lacune sono legate dalla relazione
np  ni2  ni2 T 
All’equilibrio, quindi in assenza di tensione applicata ai capi della giunzione, la corrente
totale sia di elettroni che di lacune attraverso la giunzione è nulla
je  0
jl  0
je  0 : densità di corrente di elettroni nulla significa che la corrente netta degli
elettroni che attraversano la giunzione da n a p e viceversa è nulla.
jl  0 : lo stesso vale per la corrente delle lacune.
166
Due contributi: corrente di ricombinazione e corrente di generazione
CORRENTE DI RICOMBINAZIONE: corrente di
elettroni maggioritari che dalla regione n vanno
verso la p. La differenza di potenziale ΔVbi ai capi della
regione di svuotamento (=della giunzione) si oppone al
flusso della corrente di ricombinazione.
CORRENTE DI GENERAZIONE: corrente di
elettroni minoritari che sono generati termicamente
nella regione p e che sono «spinti» da ΔVbi nella
regione n.
je  je,r  je,g  0
CORRENTE DI RICOMBINAZIONE: corrente di
lacune maggioritarie che dalla regione p vanno
verso la n. La differenza di potenziale ΔVbi ai capi della
regione di svuotamento (=della giunzione) si oppone al
flusso della corrente di ricombinazione.
CORRENTE DI GENERAZIONE: corrente di
lacune minoritarie che sono generate termicamente
nella regione n e che sono «spinti» da ΔVbi nella
regione p.
jl  jl ,r  jl ,g  0
Le correnti di ricombinazione dovute ad elettroni e lacune si sommano.
Le correnti di generazione dovute ad elettroni e lacune si sommano.
167
Polarizzazione della giunzione p-n
Si supponga di applicare una d.d.p. ΔV alla giunzione con potenziale positivo sulla
regione p: si è in condizioni di POLARIZZAZIONE DIRETTA.
La tensione applicata ΔV cade ai capi della regione di svuotamento (responsabile
della resistenza del sistema) e ha segno discorde al potenziale di built-in.
La tensione positiva applicata riduce l’estensione della regione di svuotamento
favorendo il movimento delle cariche maggioritarie.
Attraverso la giunzione fluisce una corrente di ricombinazione dovuta alle cariche
maggioritarie, favorita appunto dalla tensione applicata, mentre la corrente di
generazione dovuta ai portatori minoritari di fatto non è significativamente influenzata
dalla tensione stessa.
168
Si supponga di applicare una ddp alla giunzione con potenziale negativo sulla regione p:
si è in condizioni di POLARIZZAZIONE INVERSA.
La tensione applicata ΔV cade anche in questo caso ai capi della regione di svuotamento
ma ora è concorde con il potenziale di built-in
La tensione negativa applicata aumenta l’estensione della regione di svuotamento
sfavorendo il movimento delle cariche maggioritarie.
Attraverso la giunzione è inibito il fluire della corrente di ricombinazione dovuta alle
cariche maggioritarie.
La corrente di generazione dovuta ai portatori minoritari non è influenzata dalla tensione
applicata.
169
8.2. Il diodo.
Il diodo è un componente elettronico non lineare a due terminali costituito da una
giunzione p-n.
Il DIODO è un elemento non lineare: fra tensione applicata e corrente che fluisce nel
componente non vi è una relazione di tipo lineare
Ogni componente elettronico è identificato dalla sua caratteristica, cioè dalla relazione
fra la tensione ai capi del componente e la corrente che vi fluisce.
La resistenza, ad esempio, è l’oggetto lineare per eccellenza.
Qual è la legge che lega la differenza di potenziale applicata al diodo e la corrente che vi
fluisce attraverso?
170
Applicando una tensione positiva sull’anodo la giunzione p-n è POLARIZZATA IN
DIRETTA.
Correnti nel diodo
Jr: corrente di ricombinazione dovuta alle cariche maggioritarie favorita dalla
polarizzazione diretta. Il suo valore aumenta rispetto al caso non polarizzato di un
fattore che dipende esponenzialmente dal ΔV applicato.
e
eV
k BT
J0: la corrente di generazione dovuta alle cariche minoritarie non è influenzata dalla
tensione applicata.
Il verso della corrente è dall’anodo (p) verso il catodo (n).
Applicando una tensione negativa sull’anodo la giunzione p-n è POLARIZZATA IN
INVERSA.
Corrente nel diodo
Jr: La corrente di ricombinazione dovuta alle cariche maggioritarie è ora sfavorita dalla
polarizzazione inversa. Il suo valore diminuisce rispetto al caso non polarizzato di un
fattore che dipende esponenzialmente dal ΔV applicato, dove ora ΔV<0.
e
eV
k BT
J0: la corrente di generazione dovuta alle cariche minoritarie non è influenzata dalla
tensione applicata.
La corrente totale è dovuta alla somma dei due termini, che hanno segno opposto
 ekTV

B

j  j0 e
 1




Termine a sinistra: di ricombinazione
Termine a destra: di generazione
polarizzazione diretta ΔV>0: la corrente nel diodo è dominata dal termine di
ricombinazione, che scorre dall’anodo verso il catodo.
polarizzazione inversa ΔV<0: la corrente nel diodo è dominata dal termine di
generazione, che scorre dal catodo verso l’anodo. La corrente in inversa è molto più
piccola di quella in diretta.
171
Caratteristica I-V del diodo
 ekTV

B

j  j0 e
 1




Caratteristica del diodo
Schematizzazione ideale
Uso del diodo nei circuiti elettronici
Il diodo è un rettificatore: applicando una tensione positiva sull’anodo nel dispositivo
scorre corrente. Per tensione con polarità opposta può fluire solo una piccola corrente.
172
In caso di segnale di tensione alternato la corrente scorre (in una sola direzione) solo
quando il segno della tensione corrisponde alla polarizzazione diretta della giunzione: il
diodo ha agito da rettificatore.
TEST. In una giunzione p-n polarizzata in diretta la regione di svuotamento all’interfaccia:
a. è ridotta rispetto al caso della giunzione non polarizzata.
b. è aumentata rispetto al caso della giunzione polarizzata in inversa.
c. è aumentata rispetto al caso della giunzione non polarizzata.
[La risposta corretta è la c.]
8.3. I diodi LED (Light Emitting Diode).
Il diodo LED è costituito da una giunzione p-n che
emette luce quando attraversata da corrente.
La giunzione p-n del diodo è polarizzata in diretta,
quindi gli elettroni sono iniettati dalla regione n alla p
e le lacune dalla regione p alla n.
Elettroluminescenza
L’elettroluminescenza è l’emissione di
luce a seguito del processo di
ricombinazione di elettroni e lacune
all’interfaccia della giunzione
173
Meccanismo di ricombinazione e generazione della luce
Gli elettroni occupano gli stati in banda di conduzione, mentre le lacune sono in banda
di valenza. La banda di conduzione e quella di valenza sono separati dalla energia di gap
E G.
Il processo di ricombinazione elettrone-lacuna pertanto comporta la cessione di energia
pari all’energia di gap.
Nel caso tale energia sia liberata tramite emissione di fotoni si ha la ricombinazione
radiativa alla base del funzionamento dei LED.
I processi di ricombinazione radiativa sono fortemente probabili nei semiconduttori
a gap diretta e molto improbabili in quelli a gap indiretta (non utilizzabili nei LED)
Al processo di ricombinazione radiativa si applicano le leggi di conservazione
dell’energia e del momento includendo l’elettrone, la lacuna e il fotone.
p fotone  k fotone
Momento e energia del fotone
2
hc

energia  h 
 fotone
 fotone
Momento e energia dell’elettrone e della lacuna
2
pelettrone / lacuna  k  
dove k è il momento cristallino, legato al parametro
a
Eelettrone  EC
reticolare a del cristallo.
Elacuna  EV
Essendo il parametro reticolare a (ossia la distanza fra gli atomi del semiconduttore
quindi dell’ordine di qualche Angstrom) molto minore della lunghezza d’onda
 p fotone  pelettrone/ lacuna
si trascura il momento del fotone rispetto a quello di elettroni e lacune.
a  
174
Ricombinazione radiativa nei semiconduttori a gap diretta
L’elettrone e la lacuna che entrano nel
processo di ricombinazione radiativa hanno lo
stesso momento.
Nello spazio dei momenti quindi il processo di
ricombinazione radiativa è una transizione
diretta fra elettrone e lacuna (fortemente
probabile nei semiconduttori a gap diretta)
Per la conservazione dell’energia il fotone
emesso ha energia pari alla gap del
semiconduttore
h  EGap
Ricombinazione radiativa nei semiconduttori a gap indiretta
Nei semiconduttori a gap indiretta (Si,
Ge) le leggi di conservazione del
momento richiedono l’intervento di una
terza particella oltre all’elettrone e lacuna.
Il momento mancante è fornito dagli
atomi del reticolo cristallino.
Il processo di ricombinazione radiativa
elettrone-lacuna è ora una transizione
indiretta ed è improbabile.
Per questo motivo la ricombinazione
radiativa è un processo poco efficiente
nei semiconduttori a gap indiretta, che
pertanto non possono essere utilizzati
per costruire LED.
LED: Semiconduttori a gap diretta
Il colore della luce LED è determinato dalla energia di gap del semiconduttore utilizzato.
Ogni semiconduttore emette luce di un solo colore.
I LED sono dispositivi caratterizzati da alta efficienza e pertanto hanno un grande
impatto sulla società per le possibilità di risparmio energetico
175
Efficienza luminosa in lumen/Watt (flusso luminoso generato/potenza in ingresso)
lampadina a incandescenza: 70
LED: 300
L’utilizzo di LED come sorgente luminosa è ora possibile grazie alla disponibilità di
semiconduttori con energia di gap in grado di coprire tutte le regioni dello spettro
elettromagnetico di interesse. In particolare per il visibile ora è possibile generare luce
bianca mescolando i tre colori fondamentali: rosso, verde e blu.
La possibilità di avere luce blu (cioè LED che nel processo di ricombinazione radiativa
emettono nel blu) si è avuta solo recentemente grazie ai progressi nella crescita di
materiali semiconduttori.
La luce blu si è ottenuta in diodo LED in semiconduttori basati su GaN (nitruro di
gallio) e loro leghe (InGaN) quando il progresso scientifico-tecnologico ha permesso la
deposizione di questi semiconduttori con elevata qualità.
Ai ricercatori che hanno messo a punto il processo di crescita del nitruro di gallio è stato
assegnato il Nobel del 2014.
“Per l’invenzione di diodi efficienti che emettono luce blu, che ha permesso lo sviluppo
di sorgenti di luce bianca luminose ed energeticamente economiche”.
(Tabelle della produzione dei led)
TEST. In un semiconduttore a gap diretta nel processo di ricombinazione radiativa:
a. è emesso un fotone con energia pari alla metà dell’energia di gap.
b. è emesso un fotone con energia pari all’energia di gap.
c. i processi di ricombinazione radiativa sono fortemente probabili solamente in semiconduttori a gap
indiretta.
[La risposta corretta è la b.]
176
8.4. Principi di funzionamento del transistor
Nel 1947 tre ricercatori dei Bell Labs
(USA) inventano il transistor: sono
William Shockley, Walter Brattain e John
Bardeen.
Nel 1956 i tre ricercatori vengono insigniti
del premio Nobel per la Fisica con la
motivazione «per le ricerche sui
semiconduttori e per la scoperta
dell’effetto transistor».
Il primo transistor in germanio
Il transistor cambia il mondo: inizia l’era della moderna elettronica a cui seguirà quella
della miniaturizzazione.
Da alcuni è giudicata come l’invenzione più importante del ventesimo secolo.
I suoi principali impieghi nell’elettronica sono come componente amplificante e come
switch (cioè come interruttore).
177
Il TRANSISTOR (BJT: transistor a giunzione bipolare) è costituito da due
giunzioni p-n con un elemento in comune (detto base).
La sequenza può essere p-n-p oppure n-p-n.
Il transistor è un componente elettronico non-lineare a tre terminali: oltre alla base
abbiamo l’emettitore e il collettore che sono costituiti dalle altre due regioni distinte delle
giunzioni
Simboli circuitali del transistor
Polarizzazione del transistor
Nel normale funzionamento di un transistor la giunzione Emettitore–Base è polarizzata
in diretta e la giunzione Base–Collettore in inversa.
Per polarizzare un transistor bisogna quindi usare tensioni i cui segni dipendono dalla
sequenza (npn o pnp) che costituisce il componente, cioè dalla sequenza di drogaggio
utilizzato.
178
La corrente di emettitore IE costituita da lacune maggioritarie fluisce nella base favorita
dalla polarizzazione diretta della giunzione E-B. Queste lacune partecipano alla corrente
di cariche minoritarie che fluiscono verso il collettore IC, attraverso la giunzione B-C
polarizzata in inversa.
Parte delle lacune provenienti dall’emettitore sono perse a causa della ricombinazione
con gli elettroni della base, drogata n.
Gli elettroni per la ricombinazione sono forniti dalla corrente di base IB; parte degli
elettroni dovuti alla corrente IB sono iniettati nell’emettitore dalla polarizzazione diretta
della giunzione E-B
Le lacune generate termicamente nella base raggiungono il collettore e contribuiscono
alla corrente di collettore.
Gli elettroni generati termicamente nel collettore raggiungono la base.
179
Utilizzo del transistor nell’elettronica
A livello macroscopico noi abbiamo tre terminali: Base, Emettitore, Collettore e tre
correnti che scorrono verso il dispositivo stesso.
Esistono diverse configurazioni.
L’ingresso del dispositivo è fra il
terminale di base e emettitore
(configurazione ad emettitore comune)
Il segnale di uscita VCE si raccoglie fra il
terminale del collettore e quello
dell’emettitore.
Macroscopicamente, le correnti che fluiscono attraverso i tre terminali del transistor
(Emettitore, Base e Collettore) sono legate da
I E  I B  IC
Lo stato di conduzione si controlla agendo sulla corrente IB.
Il transistor come interruttore
Perché operi come interruttore (switching) il transistor deve presentare due stati di
conduzione elettrica in uscita:
OFF: circuito aperto
fra collettore ed
emettitore
ON: «corto circuito»
fra collettore ed
emettitore
Stato di OFF: il BJT è posto in interdizione (cut-off) ponendo IB a zero o negativa, cioè
ponendo la giunzione base-emettitore in polarizzazione inversa. La corrente IC, così
come IE è perciò nulla (perché non c’è più iniezione dall’emettitore al collettore): l’uscita
fra collettore e emettitore equivale a un interruttore aperto.
Stato di ON: il BJT è portato in saturazione polarizzando in diretta entrambe le
giunzioni (sia quella tra emettitore e base, sia quella tra base e collettore); per far questo
bisogna aumentare la corrente di base IB fino a che la giunzione base-collettore va in
polarizzazione diretta e scorre una elevata corrente tra emettitore e collettore, ottenendo
una significativa caduta di tensione ai capi dei due terminali (VCE quasi nulla e una
corrente IB grande). La corrente IC scorre da C verso E in una regione di bassa
resistenza: l’uscita fra collettore e emettitore equivale a un interruttore chiuso.
180
8.5. Test ed esercizi
Quanto vale la densità delle cariche fisse nella regione all’interno della regione di svuotamento
di una giunzione p-n?
a.
b.
c.
d.
e.
ND−NA (sbagliata).
ND .
Dipende dal rapporto fra ND e NA.
È nulla.
Dipende dalla estensione della regione di svuotamento.
[La risposta esatta è la c.]
Si considerino due diodi in serie in cui i due catodi sono connessi insieme. Applicando una
tensione alla serie si osserva passaggio di corrente quando:
a. solamente per tensione negative, quando il primo diodo è polarizzato in inversa.
b. sempre, perché in questa configurazioni i due diodi sono sempre polarizzati entrambi in diretta.
c. mai, perché qualsiasi sia il segno della tensione applicata uno dei due diodi è sempre polarizzato in
inversa.
d. sempre, perché qualsiasi sia il segno della tensione applicata uno dei due diodi è sempre polarizzato
in diretta.
e. solamente per tensione positive, quando il primo diodo è polarizzato in diretta.
[La risposta corretta è la c.]
In un transistor BJT pnp polarizzato in modo standard (EB in diretta e BC in inversa) le
lacune iniettate dall’emettitore:
a. tutte ricombinano nella base.
b. tutte raggiungono il collettore dopo aver attraversato la base.
c. raggiungono il collettore, ma parte ricombinano nella base.
d. il comportamento cambia a seconda se la base ha o meno la stessa tipologia di drogaggio
dell’emettitore (entrambi n o entrambi p).
e. dipende dal tipo di drogaggio della base rispetto al collettore.
[La risposta corretta è la c.]
181
Cap. 9
Nanoscienze e nanotecnologie
9.1. I principi delle nanoscienze. Proprietà fisiche e dimensionalità: introduzione allo
studio e alla manipolazione dei materiali, dei dispositivi e dei fenomeni fisico/chimici su
scala nanometrica
9.2. Nanoscienze ed elettronica. Ingegneria di banda nei semiconduttori.
Sistemi 2D: eterostrutture fra semiconduttori; buche per elettroni e buche per lacune
Introduzione alle tecniche di imaging alla nanoscala.
9.3. Nanotecnologie. Introduzione alle tecniche di fabbricazione per le nanotecnologie
9.4. Imaging dei nanosistemi: come vedere le nanostrutture. Microscopi elettronici.
Microscopie a scansione di sonda: microscopio a effetto tunnel (STM); microscopio a
forza atomica (AFM)
9.5. Alcuni esempi di applicazione effetti quantistici in nanostrutture di semiconduttori e
delle nanoscienze. Cenni sul grafene.
C. Kittel, Introduzione alla Fisica dello Stato solido Casa Editrice Ambrosiana
9.1. I principi delle nanoscienze. Introduzione agli effetti alla
nanoscala. Effetti di superficie ed effetti di confinamento.
Cosa significa “nanoscienze” e cosa si intende per nanoscienze e
nanotecnologie?
Le nanoscienze e le nanotecnologie sono lo studio, la manipolazione e la progettazione
dei materiali, dei fenomeni chimico/fisico e dei dispositivi su scala nanometrica.
È evidente dalla definizione che le nanoscienze e le nanotecnologie sono intrinsecamente
multidisciplinari e coinvolgono ambiti quali la fisica, la chimica, la biologia molecolare, la
scienza dei materiali, l’ingegneria meccanica, chimica ed elettronica, la bioingegneria e la
medicina.
La scala nanometrica: quanto è piccola?
Il prefisso nano significa “un
miliardesimo” ed è usato per indicare la
quantità pari alla miliardesima parte
dell’unità:
1 nm: 10 – 9 metri = 0.000000001 m
1 ngr: 10 – 9 grammi = 0.000000001 gr
1 ns: 10 – 9 secondi = 0.000000001 s
Con la parola nanoparticella si intende qualcosa dell’ordine di 100 nm o meno: le
molecole della vita, il DNA
182
Osserviamo in dettaglio nella scala delle dimensioni la transizione da micro a nano sia
per gli oggetti «naturali» (a sinistra) che per quelli creati dall’uomo (a destra).
Scala dei micron
Globuli bianchi (10 – 5 metri = 10 μm)
Globuli rossi
Dispositivi MicroElettroMeccanici (10-100
μm )
Scala dei nanometri
DNA: 2.5 nm
Atomi di silicio: 0.078 nm
Dispositivi elettronici
Nanotubi di carbonio
Le nanoscienze studiano e manipolano sistemi che contengono da
qualche decina a migliaia di atomi;
raggio di Bohr = 0.5292Å ≈ 0.05 nm
atomo di C ≈ 0.17 nm
In una linea di 1nm : 3 atomi di C
In una superficie di 1nm2: 9 atomi di C
In un volume di 1nm3: 27 atomi di C
In un volume di 10 nm3: 270 atomi di C
Quando di parla di nano sistemi ci si riferisce ordinariamente a qualche migliaio di atomi.
Macro: In un volume di 1m3 : 2.7·1028 atomi di C
L’interesse per le nanoscienze e nanotecnologie
Alla nanoscala emergono NUOVE PROPRIETÀ dei materiali rispetto al caso
macroscopico. Emergono e diventano predominanti gli EFFETTI QUANTISTICI E
DI SUPERFICIE che permettono quindi di implementare sistemi e dispositivi con
nuove proprietà.
Sono inoltre tecnologicamente vantaggiose perché
leggere
veloci
occupano meno spazio
consumano meno energia
Il comportamento degli oggetti alle nanoscale sono determinati dagli
Effetti di superficie
Gli effetti di superficie sono dovuti alle particelle che sono presenti sulla superficie e
possono dominare il comportamento dei nanosistemi e delle nanoparticelle perché nel
«piccolo» il numero di atomi presenti sulla superficie cresce percentualmente rispetto a
quelli interni di volume
183
Area  L2
Volume  L3
Area
1

Volume L
Nella figura sotto vediamo delle nanoparticelle composte da un diverso numero di
atomi. Più è piccola la particella e maggiore è la percentuale di atomi che sta sulla
superficie.
Nel caso della particella più piccola, su 12 atomi, 9 sono sulla superficie, pari al 75%.
Effetti di superficie in natura
Insetti e gechi (che riescono a camminare su pareti verticali) hanno sviluppato sotto le
loro zampe delle «nanostrutture» (spatole di centinaia di nm) che aumentando la
superficie di adesione permettono loro di camminare su pareti verticali. La presenza di
queste nanostrutture sulle zampette degli animali è stata visualizzata nel microscopio a
elettroni
La nanostrutturazione della superficie delle zampe
diventa via via più piccola man mano che l’insetto
diventa più grande (la densità di nanofibre aumenta
con la massa dell’utilizzatore): vi è una sorta di
ottimizzazione dell’ingegnerizzazione da parte della
natura.
Ovviamente abbiamo provato a copiare questi effetti dando vita a quella che si chiama
nanotecnoligia bio-inspired, e un esempio abbastanza divertente è rappresentato dallo
sviluppo di adesivi con grande capacità di adesione:
si tratta di adesivi progettati (la cui superficie è
nanostrutturata) come le setole del geco; in questo modo
si riesce a ottenere che con una superficie di pochi
centimetri quadrati si è in grado di sostenere un uomo di
corporatura media.
184
Effetti quantistici
La meccanica quantistica domina le proprietà dei nanosistemi: le proprietà ottiche,
elettriche e meccaniche dipendono infatti dalla dimensione (delle nanostrutture) in cui
sono confinati i portatori. In particolare, alle nanoscale (sistemi le cui dimensioni sono
confrontabili con le loro dimensioni) gli elettroni manifestano la loro natura ondulatoria
Un esempio piuttosto eclatante di questi effetti è dato da un esperimento –
effettuato all’IBM americana negli anni ’90 – in cui, grazia alla capacità di manipolare gli
atomi, è stato costruito quello che viene definito un recinto quantistico per gli elettroni
formato da 48 atomi di Fe (ferro) su una superficie di Cu (rame).
Confinement of electrons by
quantum corrals on metal surface M.
F. Crommie, C. P. Lutz, D.M.
Eigler, Science, 262, 218 (1993)
I 48 atomi di ferro sono quella sorta di palizzata rappresentata nell’immagine sopra. Cosa
succede sulla superficie? La presenza degli atomi di ferro in forma chiusa di fatto genera
un potenziale di confinamento per gli elettroni della superficie all’interno del recinto
stesso: gli elettroni sulla superficie subiscono quindi il potenziale di confinamento del
recinto quantistico e vengono pertanto localizzati all’interno del recinto con una
distribuzione di carica che sappiamo essere proporzionale al modulo quadro della
funzione d’onda (onda stazionaria, visualizzata nell’immagine) che è esattamente quella
prevista dalla soluzione dell’equazione di Schrödinger.
Cambiando la forma del recinto cambia la distribuzione spaziale della carica e
dunque cambia la forma della funzione d’onda. Sono state fatte delle prove con recinti di
forma diversa, ad esempio lo stadio, l’esagono, il triangolo equilatero, il quadrato… e di
volta in volta si ottengono delle distribuzioni di cariche confinate diverse a seconda
appunto della forma del potenziale confinante.
Nanoscienze e nanotecnologie puntano dunque a costruire il recinto quantistico e a
rivelare le onde elettroniche
185
Proprietà ottiche e confinamento quantistico
Anche le proprietà ottiche sono dominate dagli effetti quantistici nei nanosistemi.
Nanoparticelle di semiconduttore assorbono la luce e la riemettono luce con diverso
colore (diversa energia del fotone) a seconda della loro dimensione.
Nelle provette sono presenti soluzioni contente nanocristalli di semiconduttore (CdSe) di
diversa grandezza (dai 2 agli 8 nm), eccitate con una luce ultravioletta
Illuminate con luce ultravioletta, la luce trasmessa dalle soluzioni cambia colore a
seconda delle dimensioni delle nanoparticelle presenti in soluzione; in particolare si
osserva che la luce tende verso il blu, ovvero verso le lunghezze d’onda minori, man
mano che decresce la dimensione delle particelle presenti in soluzione.
È un effetto quantistico.
La meccanica quantistica infatti ci insegna
- che al decrescere delle dimensioni gli effetti di confinamento quantistico diventano
più rilevanti (si allontanano i livelli energetici degli elettroni presenti nella
nanostruttura): gli elettroni confinati quantisticamente in una buca di potenziale a
parete infinita hanno valori di energie discrete che dipendono dalla «grandezza» della
regione in cui sono confinati:
En 
 2 2
2mL2
n2
m è la massa, L la larghezza della buca di altezza infinita
Man mano che le dimensioni della buca diminuiscono le energie possibili via via si
allontanano tra loro. Ed è esattamente quello che succede nelle soluzioni di cui sopra: al
diminuire delle dimensioni dei nanocristalli semiconduttori presenti nella soluzione si
allontanano tra loro i livelli di energia.
In un semiconduttore macroscopico gli elettroni in banda di conduzione hanno
energia EC, mentre le lacune sono in banda di valenza e hanno energia EV. In un
processo di ricombinazione che prevede emissione di luce avremo che il fotone emesso
avrà energia proprio pari alla differenza EC – EV, energia di gap del semiconduttore.
186
Nel caso di nanocristalli di semiconduttore gli elettroni al loro interno sono confinati e
gli elettroni in banda di conduzione non avranno più energia EC ma, esattamente come
nel caso di una buca, avranno una energia più grande perché lo stato permesso non è più
coincidente col fondo della banda di conduzione; analogamente le lacune in banda di
valenza non avranno più energia EV ma energia più grande perché anche loro subiscono
il confinamento dovuto alle ridotte dimensioni del nanocristallo; di fatto questo significa
che quando si va a considerare l’emissione di un fotone dovuto al processo di
ricombinazione, la distanza di energia tra gli elettroni in banda di conduzione e le lacune
in banda di valenza (la gap del semiconduttore) è aumentata; ed è tanto più grande
quanto più piccole sono le particelle.
Ecco perché l’emissione di luce si sposta verso il blu (maggior energia del fotone) al
diminuire delle dimensioni delle nanoparticelle.
La coppa di Licurgo e le nanotecnologie romane
La coppa di Licurgo (del IV secolo,
conservata al British Museum), costruita da
artigiani romani, appare verde se la luce è
riflessa, rossa se trasmessa.
Si è cercato di capire donde derivasse questa
proprietà e si è scoperto che fu ottenuta dagli
artigiani romani inserendo nel vetro nanoparticelle di Au e Ag aventi dimensioni
inferiori ai 100nm: primo esempio di uso
(inconsapevole) di nanotecnologie per
ottenere proprietà innovative.
187
9.2. – 9.5. NANOSCIENZE ED ELETTRONICA
Modeling di materiali e dispositivi (9.2), fabbricazione (9.3) e caratterizzazione (9.4) sono
fortemente interconnessi e inseparabili nelle nanoscienze e nanotecnologie.
9.2. Materiali e dispositivi. Ingegneria di banda nei
semiconduttori
I progressi delle nanoscienze e delle nanotecnologie hanno
permesso la realizzazione di sistemi a ridotta dimensionalità
2D, 1D o addirittura 0D («atomi artificiali») in cui i portatori
di carica sono confinati quantisticamente in 2 o 1 direzioni
spaziali.
Come si ottengono questi sistemi?
Con l’ingegneria di banda.
Ingegneria di banda
I sistemi a ridotta dimensionalità sono realizzabili efficacemente con i semiconduttori
(quindi utilizzabili in elettronica): si deposita una sequenza artificiale (non disponibile in
natura) di semiconduttori diversi, con spessori controllati, anche dell’ordine di qualche
nanometro. Che cosa succede quando si va a depositare questa sequenza?
188
Eterogiunzione fra semiconduttori A e B
All’interfaccia fra i due semiconduttori si creano delle discontinuità di energia in banda di
valenza e in banda di conduzione per accomodare il diverso valore dell’energia di gap.
In particolare sono possibili diverse
tipologie di allineamento
La differenza fra le energie di gap produce tre tipologie possibili di allineamento fra le
bande di valenza e di conduzione all’interfaccia fra i due materiali, chiamate
convenzionalmente “di tipo I”, “di tipo II”, “di tipo III”.
Allineamento di tipo I
L’energia di gap minore è completamente
contenuta all’interno della gap più grande.
Nel materiale con gap minore (B nel
disegno) sia gli elettroni sul fondo della
banda di conduzione che le lacune in cima
alla banda di valenza hanno energia
minore rispetto a quelli nel materiale A
Allineamento di tipo II
Nel materiale B gli elettroni sul fondo della
banda di conduzione hanno energia
minore rispetto a quelli nel materiale A.
Viceversa, sono le lacune nel materiale A
ad avere la minor energia.
189
Allineamento di tipo III
L’allineamento è tale che non ci sono
intervalli energetici in cui si
sovrappongono le energie dei portatori del
materiale A e B.
Nel caso riportato nel disegno gli elettroni
del materiale B hanno energia minore delle
lacune in A.
Ogni coppia di semiconduttori A e B possiede il suo specifico allineamento di banda
all’interfaccia A-B: il profilo di banda risultante lungo la direzione di crescita genera
buche e/o barriere per elettroni e lacune.
Immaginiamo una sequenza di tre semiconduttori: A-B-A.
Supponiamo che la gap del semiconduttore B sia
completamente contenuta all’interno della gap del
semiconduttore A.
Il profilo di banda che ne risulta – sia per gli elettroni in
banda di conduzione sia per le lacune in banda di
valenza – è quella riportata nel disegno a sinistra.
Elettroni e lacune sono confinati nel materiale B in una
buca avente
- larghezza: spessore del materiale B.
- altezza: discontinuità di banda (per gli elettroni)
ΔEC e (per le lacune) ΔEV.
Se lo spessore del materiale B è di pochi nanometri i
portatori sono confinati quantisticamente nella buca; in
altre parole è possibile creare quello che in precedenza
abbiamo definito
sistema bidimensionale 2D
Il profilo dell’ingegneria di banda genera una buca di
potenziale per i portatori lungo z, le cariche sono libere
Sopra l’asse z un esempio:
elettroni confinati in una buca solo nel piano xy, cioè possono muoversi nel materiale
B ma non possono raggiungere le zone A né a sinistra
di altezza ΔEC e larghezza L
né a destra perché inibite dalla presenza di una barriera
data dalla discontinuità in banda di conduzione per gli
elettroni e dalla discontinuità in banda di valenza per le
lacune.
190
Utilizzare l’ingegneria di banda significa scegliere
opportunamente la sequenza di semiconduttori per
generare il profilo desiderato della banda di conduzione
(o della banda di valenza, o entrambe) lungo la direzione
di crescita (direzione z)
La combinazione opportuna nella sequenza di crescita
permette di realizzare i profili di banda desiderati lungo
la direzione di crescita.
Buche quantiche, barriere, superreticoli
Cos’è che ci permette o ci impedisce di ottenere un profilo arbitrario? Va tenuto conto
che non tutti i semiconduttori possono essere depositati uno sull’altro: è necessario che
ci sia una sorta di compatibilità tra i due materiali. La prima compatibilità è di tipo
chimico: in qualche modo dev’essere compatibile la loro coesistenza; vi è poi un fattore
molto importante legato al valore del parametro reticolare dei due materiali che sto
crescendo l’uno sull’altro; in altre parole le due strutture cristalline non devono essere
troppo diverse. In altre parole, per ottenere la deposizione di eterostrutture di elevata
qualità, i costituenti devono avere struttura cristallina simile e parametro reticolare “non
troppo differente” affinché sia possibile un adattamento delle celle cristalline.
Parametro reticolare vs energia di gap per i diversi semiconduttori in natura
191
Eterostrutture con disaccordo reticolare
Supponiamo che il parametro reticolare del materiale A sia diverso da quello del
materiale B. Quando li vado a mettere l’uno sull’altro possono accadere due cose:
Crescite rilassate
Nella crescita l’epistrato si deposita con il suo parametro reticolare, il disaccordo
reticolare presente genera dei difetti all’interfaccia fra i due materiali che vanno a
danneggiare le prestazioni del materiale stesso.
È però anche possibile che durante la crescita di un materiale B su A succeda qualcosa di
diverso:
Crescite coerenti (stressate)
Nella deposizione l’epistrato si adatta al passo reticolare del substrato deformandosi
(tensilmente o compressivamente)
La tipologia di crescita modifica la simmetria del reticolo cristallino (da cubica a
tetragonale) quindi modifica anche le proprietà elettroniche. Le proprietà elettroniche
sono infatti correlate e direttamente determinate dalla simmetria del sistema, per cui, se
192
variamo la simmetria del sistema, di fatto variamo le proprietà e gli stati energetici del
sistema stesso.
Lo sviluppo di LED nel blu (utili per creare la luce bianca) è stato possibile grazie al
controllo dei processi di crescita epitassiali e di drogaggio di semiconduttori quali il GaN
(nitruro di gallio) su opportuni substrati.
TEST. Cosa è necessario per confinare elettroni in un strato di materiale A utilizzando
l’ingegneria di banda?
a. Che il minimo della banda di conduzione in A sia alla stessa energia che nei materiali adiacenti.
b. Che il minimo della banda di conduzione in A sia a energia maggiore che nei materiali adiacenti.
c. Che il minimo della banda di conduzione in A sia a energia minore che nei materiali adiacenti.
[La risposta corretta è la c.]
9.3. I metodi di fabbricazione imaging dei nanosistemi: le
microspie a scansione di sonda
Sono possibili due approcci per la fabbricazione di nanostrutture
Approccio Top-Down
Le nanostrutture sono ottenute mediante riduzione delle dimensioni e della
dimensionalità di oggetti macroscopici utilizzando processi di nanofabbricazione.
Questo è il tipico approccio che viene usato per definire i dispositivi elettronici, di fatto
utilizzato nella microelettronica, dove oggetti piccoli vengono ottenuti a partire da
oggetti grandi, ottenendo una ideale riduzione delle dimensioni da macro a nano.
Approccio Bottom-Up
Le nanostrutture sono ottenute mediante connessioni macroscopiche a nanostrutture
pre-esistenti in natura (nanotubi di carbonio, nanofili, aggregati di molecole …).
In entrambi i casi è necessario un processo di fabbricazione che prende il nome di
litografia.
La litografia per la fabbricazione di nanosistemi
Litografia: creazione di strutture con profili tridimensionali mediante il trasferimento di
un disegno (pattern) bidimensionale sulla superficie da strutturare utilizzando un resist
Resist: polimero che a seguito di esposizione a radiazione UV o elettroni subisce una
reazione fotochimica che ne modifica la solubilità in un solvente.
A seconda della dimensione delle strutture che si intendono fabbricare la litografia può
essere ottica oppure elettronica:
193
Litografia ottica: uso di fotoni UV per esporre il resist. Il limite inferiore della
dimensione delle strutture realizzabili è fornito dal limite di diffrazione della luce.
Se si vogliono ottenere oggetti più piccoli si utilizza la
Litografia elettronica EBL: uso di elettroni per esporre il resist. È possibile fabbricare
strutture di dimensioni fino al nm.
In entrambi i casi il processo di litografia, e quindi di fabbricazione, si può schematizzare
come nella seguente immagine: si ha un campione (il rettangolo verde) sul quale viene
deposto il resist, cioè il polimero; sul campione si pone una maschera (una sequenza di
zone opache e zone trasparenti) e la sonda (la radiazione o gli elettroni) incide sul resist
attraverso la maschera. A questo punto, a seconda che il resist sia positivo o negativo,
dopo lo sviluppo chimico rimarrà sul campione o il solo resist che è stato esposto (resist
negativo) oppure il resist che non è stato esposto (resist positivo)
Si è quindi trasferito il disegno che volevamo sulla superficie del campione.
Per poter poi andare a definire il nostro dispositivo sono necessari ulteriori processi. In
realtà la sequenza di fabbricazione è molto complessa. Qui stiamo definendo solo i
principi di base che però ci permettono di comprendere le difficoltà e le tipologie.
Le tipologie di processo
Dopo l’esposizione si procede alla sagomatura tridimensionale del campione mediante
due classi di procedure:
- processi di tipo sottrattivo (etching o attacco);
- processi di tipo additivo (lift-off).
194
Processo sottrattivo: Etching
Viene tolto del materiale fino a che ciò che rimane ha la forma che vogliamo: per
sagomare il film sovrapponiamo il resist, lo esponiamo e sviluppiamo… Quindi
portiamo una serie di attacchi (di tipo chimico, secchi o a bagnate) che vanno a
rimuovere il film soltanto dove non è coperto dal resist. Infine si rimuove il resist,
avendo sagomato il film con un disegno direttamente legato a quello del resist.
Processo additivo: Lift-off
Viene aggiunto del materiale (il film) della forma che vogliamo,
Si parte dal substrato, gli si pone sopra il resist, si passa alla litografia e allo sviluppo; di
nuovo abbiamo il resist della forma voluta (il negativo di ciò che vogliamo rimanga); si
deposita sopra il film; quindi si fa evaporare il resist su tutta la superficie del substrato:
dove è presente il resist il film verrà via insieme al resist e dove il resist non è presente il
film rimane sul substrato.
Combinando opportunamente queste due procedure in modo più o meno complesso
con una certa professionalità, di fatto è possibile realizzare qualsiasi forma e qualsiasi
struttura.
A sinistra vediamo
qualche esempio: una
macchina di formula1
delle dimensioni di
qualche centinaio di
micron e un London
Bridge di qualche micron.
195
Infine un esempio di contattatura su un dispositivo elettronico nanometrico:
a sinistra vediamo dei contatti
metallici su un foglio di
grafene;
a destra dei contatti metallici
di qualche nanometro nella
regione terminale su un canale
conduttivo largo a sua volta
qualche decina di nanometri.
9.4. Imaging dei nanosistemi: come vedere le nanostrutture
“Vedere” le cose piccole è uno degli aspetti più interessanti delle nanotecnologie.
Un po’ di storia del microscopio
La scienza ha sviluppato nel corso dei secoli gli strumenti per «vedere» cose piccole che
funzionano su diversi principi
1700: Microscopio ottico
1931: Microscopio a trasmissione di elettroni (TEM)
1942: Microscopio a scansione di elettroni (SEM)
1981: Microscopio a effetto tunnel (STM)
1986: Microscopio a forza atomica (AFM)
Microscopio ottico
Il potere risolutivo dovuto al limite di diffrazione della luce di lunghezza d’onda λ è
quantificato dal criterio di Rayleigh
R
1.22
2n sin 
n è l’indice di rifrazione del mezzo in cui è posto l’oggetto,
θ è l’angolo con cui è visto l’oggetto
Con la luce nel visibile si può arrivare a 300 nm.
Microscopi elettronici
Per vedere cose più piccole è necessario cambiare sonda, non più fotoni ma elettroni.
Gli elettroni sono alla base del funzionamento di microscopi essenzialmente di due tipi:
- microscopi a trasmissione di elettroni TEM
- microscopi a scansione di elettroni SEM
196
La sonda è costituita da elettroni (che sostituiscono le onde elettromagnetiche dei
microscopi ottici), con energie tipicamente dai keV a centinaia di keV, a seconda del tipo
di applicazione
Sono strumenti complessi che funzionano in vuoto.
TEM: Microscopio a trasmissione di elettroni
Energia ~100 keV
L’immagine è formata dal fascio di elettroni trasmesso dal campione. È possibile
costruire immagini 3D del campione. La risoluzione che si può ottenere è legata
all’energia degli elettroni che si utilizzano. Infatti la lunghezza d’onda degli elettroni
dipende dalla loro energia attraverso la relazione di De Broglie:

h

mv
h
2mE
per E=100 keV
λ~ picom
È possibile ottenere risoluzioni inferiori ai nm, cioè risoluzione atomica.
Alcune immagini TEM
Piani atomici in una eterostruttura di
semiconduttori costituita da ALGaAs e AlAs
in sequenza: l’uso del TEM ha permesso di
distinguere i vari piani atomici e gli atomi ivi
presenti.
Apparato del Golgi e mitocondri
Virus dell’Ebola
SEM: Microscopio a elettroni secondari
L’imaging della superficie è ottenuta dagli elettroni secondari emessi dal campione
investito dal fascio elettronico. La microscopia SEM è eseguibile su conduttori e
semiconduttori, non su isolanti.
197
Utilizzando elettroni con energia dell’ordine dei keV è possibile ottenere risoluzioni fino
ai nm.
Alcune immagini SEM
Pistilli del fiore Nanofili di semiconduttori
Microscopie a scansione di sonda
Negli anni ’80 le microscopie a scansione di sonda hanno rivoluzionato la capacità di
vedere «cose piccole»
(Nobel Prize 1986 a Ernst Ruska (50%), Gerd Binning (25%) e Heinrich Rohrer (25%)
“per la loro progettazione del microscopio a scansione per effetto tunnel”)
La loro rapida evoluzione ha permesso e permette oggi non solo di vedere gli atomi ma
anche la loro manipolazione.
La sonda è una “punta” che scansiona la superficie del campione. L’immagine della
superficie si ottiene dalla misura dell’interazione tra sonda e campione durante la
scansione della superficie stessa del campione.
La punta ha dimensioni nanometriche nella regione terminale: è così possibile ottenere
una sensibilità alla topografia della superficie sub nanometrica lungo la direzione z
Risoluzione Z ~0.1 nm
198
La posizione della sonda è controllata con estrema precisione da scanner piezoelettrici,
sia in x-y (da nanometri a decine di micron) che lungo z (con sensibilità fino ai subnanometri).
Schema di un microscopio a scansione di sonda
Vediamo due esempi di microscopi a scansione di sonda
Microscopio a effetto tunnel (STM)
- Il microscopio a effetto tunnel è il primo microscopio a scansione di sonda. Il suo
principio di funzionamento si basa sull’effetto tunnel.
- Può essere utilizzare per l’imaging di superfici sia di campioni conduttori che
semiconduttori, non isolanti.
- Permette di ottenere risoluzioni atomiche.
- Opera sia in modalità topografica che spettroscopica.
Nel microscopio ad effetto tunnel la sonda è una punta metallica (tungsteno) la cui
regione finale ha dimensioni corrispondenti a pochi atomi.
199
L’interazione fra punta e campione è rappresentata dalla corrente di tunnel degli elettroni
che passano dalla punta al campione quando la punta è posta in prossimità della
superficie a distanza dell’ordine degli Angstrom.
L’effetto tunnel è il fenomeno quantistico per cui gli elettroni hanno una probabilità non
nulla di superare una barriera di altezza superiore alla loro energia.
Elettroni nella punta: Gas di Fermi con energia EF1
Elettroni sulla superficie del campione: Gas di Fermi con energia EF2
La barriera è costituita dal potenziale che tiene confinati gli elettroni all’interno di un
solido e la larghezza della barriera è la distanza tra punta e campione.
200
Applicando una tensione fra punta e campione (che deve essere metallico o
semiconduttore) l’effetto tunnel produce una corrente di tunnel, che costituisce il segnale
misurato risultante dalla interazione punta-campione.
La corrente di tunnel dipende esponenzialmente dalla larghezza della barriera, cioè nel
caso dell’STM dalla distanza punta-campione. L’effetto tunnel si verifica per distanze
punta-campione dell’ordine o inferiore ai nm.
I tunnel  exp 2kd 
dove
k
B
2mB
h2
d = distanza punta campione
altezza barriera
La legge esponenziale permette di avere una variazione di corrente di un ordine di
grandezza per variazioni della distanza di 0.1 nm
La misura della corrente di tunnel durante la scansione della superficie permette di
determinare la variazione di altezza delle strutture presenti sulla superficie stessa: si
ottiene la topografia del campione.
Con questa tipologia si sono visualizzati per la prima volta gli atomi presenti sulla
superficie del campione.
Immagini STM
Atomi sulla superficie di silicio
(20 Angstrom)
Alcune delle prime immagini del DNA, in scala via via
più piccola fino a visualizzare gli atomi del DNA
201
L’altro fondamentale e importante microscopio a scansione di sonda è il
Microscopio a forza atomica (AFM)
- Il microscopio a forza atomica si basa sulla forza di interazione fra gli atomi della
punta e quelli sulla superficie del campione.
- (Al contrario dell’STM) si può utilizzare l’AFM sia con metalli che con isolanti.
- La sonda AFM è montata su un cantilever che subisce delle deflessioni al variare
della forza di interazione fra la punta e la superficie durante la scansione del
campione.
- Dalla misura della deflessione del cantilever attraverso la gestione dell’elettronica di
controllo si risale alla morfologia della superficie scansionata. Il microscopio AFM
opera in aria.
La deflessione del cantilever a seguito della interazione punta-superficie è rivelata dallo
spostamento del riflesso di un fascio laser incidente sul dorso del cantilever stesso. Il
fotodiodo è in grado di rilevare gli spostamenti del fascio riflesso e quindi del cantilever.
Vediamo ora quali sono le forze in gioco tra campione e punta in questo tipo di
microscopio.
202
Potenziale di interazione fra punta e campione
A grandi distanze le forze sono
di tipo attrattivo (essenzialmente
forze di Van der Waals).
Quando gli atomi si avvicinano
oltre la posizione di equilibrio le
forze diventano fortemente
repulsive dovuto al fatto che gli
atomi non possono penetrarsi
l’uno con l’altro.
Questo ci dice che il microscopio AFM può funzionare in due modi.
Il primo modo è “in contatto”; il secondo è “in non-contatto”.
Microscopia AFM «in contatto»
Nella modalità in contatto la punta
è tenuta forzatamente in contatto
sulla superficie del campione e
l’AFM lavora nell’intervallo delle
forze repulsive.
Si ottiene la risoluzione migliore,
ma la superficie del campione deve
essere sufficientemente «dura» da
non essere modificata dalla forza
esercitata dalla punta.
203
Microscopia AFM «in non contatto»
Nella modalità in non-contatto la
distanza punta –campione,
dell’ordine di 1-10 nm, è mantenuta
nella regione in cui l’interazione
punta-campione è di tipo attrattivo.
Questa modalità, non prevedendo il
contatto, non modifica le
nanostrutture che si vogliono
visualizzare. Risulta particolarmente
utile ad esempio nell’analisi di
campioni biologici.
La risoluzione finale ottenibile con il microscopio AFM dipende anche dalla forma della
punta e dalla sua integrità (usura e/o danni). È possibile con gli strumenti più moderni
ottenere risoluzioni «atomiche».
La forma specifica e il tipo di materiale con cui sono costruite le punte variano con le
modalità operative.
9.5. Il grafene
Uno dei materiali più interessanti che trovano utilizzo nelle nanotecnologie è il grafene.
Il grafene fu scoperto nel 2004 da Andre Geim e Konstantin Novoselov (Università di
Manchester) sfogliando la grafite con lo scotch. Nel 2010 i due ricevettero il Nobel per la
fisica “for groundbreaking experiments regarding the two-dimensional material
graphene”.
Il grafene è un singolo strato di atomi di carbonio: è un sistema bidimensionale
(Sistema 2D) perfetto.
204
Configurazione dell’atomo di carbonio (6 elettroni): C: 1s2, 2s2, 2p2
Il carbonio ibridizza in diversi stati: sp, sp2, sp3
Dopo l’ibridizzazione è in grado di formare legami con altri elementi o con se stesso con
proprietà diverse; quando si presenta come diamante è ibridizzato sp3, quando si
presenta come grafite è ibridizzato sp2.
L’ibridizzazione determina di fatto orbitali di legame completamente diversi che si
manifestano poi in proprietà diverse. Concentriamo sull’ibridizzazione sp2, che è quella
che interessa il grafene.
Ibridizzazione sp2:
3 orbitali disposti nel piano a 120°
1 orbitale pz perpendicolare.
È quella che caratterizza la grafite: gli
orbitali sul piano danno origine a legami
covalenti i cui atomi sono disposti ai
vertici di un esagono e i vari piani della
grafite sono in interazione fra di loro
attraverso l’orbitale pz perpendicolare ai
primi tre.
Come si arriva dalla grafite al grafene?
Dal carbonio ibridizzato sp2 al grafene
Il carbonio in sp2 non si presenta solo come grafite o come grafene: sono stati scoperti
nel corso degli anni anche altre forme molto interessanti: ad esempio i fullereni: un
singolo foglio di atomi di carbonio è racchiuso a forma di sfera, oppure i nanotubi di
carbonio in cui vi è un foglio arrotolato a formare una sorta di tubo.
205
Grafite
Come è stato ottenuto il grafene? Con la tecnica dello scotch (tecniche meccaniche:
scotch-tape): si sono via via sfogliati degli strati di grafite finché sullo scotch è rimasto un
solo foglio della grafite stessa.  Si ottengono in questo modo materiali di elevata
qualità per ricerche di base… ma ovviamente questo non è un sistema utilizzabile a
livello applicativo o di sviluppo industriale.
Successivamente alla scoperta del grafene si sono avviati tutta una serie di studi per
riuscire a ottenerlo con dei sistemi più convenzionali e più adeguati a un processo
applicativo, essenzialmente per deposizione chimica nella fase vapore.
206
Grafene: monolayer, bilayer  Per ottenere materiale in quantità adeguate per processi
applicativi: tecniche di tipo chimico.
Il grafene è:
- il materiale più sottile al mondo (uno solo strato atomico)
- il più leggero (1 mq ha una massa di 0.0077 gr e è capace di sostenere un peso di 4
kg)
- 200 volte più resistente dell’acciaio ma più flessibile della gomma
- trasparente
- un conduttore elettrico e termico di qualità superiore
- una barriera perfetta: neanche l’elio lo può attraversare
Tutte queste proprietà (e altre che ancora non sono note) sono legate alle proprietà del
legame del carbonio.
Gli orbitali sp2 del piano formano dei legami covalenti con gli atomi di carbonio sul
piano stesso e ciascuno degli orbitali può ospitare due elettroni con spin opposto. La
banda di conduzione e la banda di valenza del grafene sono invece formati dai due
orbitali pz
Le bande del grafene
Bande π (di valenza,
completamente
piena) e π*(di
conduzione,
completamente
vuota) che si
originano dagli
orbitali pz del C
ibridizzato
Le bande σ che si
generano dai legami
sigma nel piano sono
completamente
occupate
207
Banda π e π* in un particolare punto dello spazio k (attorno al punto K) sono degeneri,
cioè hanno la stessa energia; in corrispondenza del punto di degenerazione hanno una
relazione di dispersione lineare!



E k    F k

La costante di proporzionalità è la velocità di Fermi degli elettroni, ovvero la velocità
degli elettroni che hanno l’energia di Fermi. Questa proprietà è una proprietà
rivoluzionaria rispetto a quella che normalmente presentano gli elettroni nei solidi,
quando l’energia e il momento cristallino sono legati tra loro da una relazione di tipo
quadratico.
Quali altre particelle presentano una relazione lineare tra l’energia e il momento? Sono
essenzialmente le particelle a massa nulla. Ma questi non sono fotoni: questi sono
elettroni!
Quindi, nel grafene, gli elettroni si comportano come fermioni a massa nulla. Questa
tipologia di particelle prende il nome di FERMIONI DI DIRAC: fermioni a massa
nulla.
Questa proprietà ha delle conseguenze notevoli, sia sulle proprietà che manifesta il
grafene sia per quel che riguarda le ricerche scientifiche di base (ed è il motivo per cui
fisici e scienziati sono così interessati a questo materiale).
208
A: Portatori di carica:
Equazione di Schrödinger
con massa efficace m*
diversa dalla massa
elettronica
B: Particelle relativistiche
nel limite di zero massa a
riposo. Equazione di Dirac
(c=velocità della luce,
σ =Matrici di Pauli)
C: Portatori di carica nel
grafene: “Massless Dirac
Fermions” (vF ha il ruolo di
c, σ = 2D-Pseudospin
Matrix )
Normalmente, in un solido, abbiamo che la relazione tra energia e momento è di tipo
quadratico; nel caso dei fotoni la relazione tra energia e momento è di tipo lineare… ma i
fotoni sono particelle relativistiche (la loro velocità è quella della luce). Nel caso del
grafene abbiamo una relazione mista: gli elettroni hanno una relazione tra energia e
momento di tipo lineare – esattamente come le particelle relativistiche – ma non vanno
alla velocità della luce, bensì alla velocità di Fermi: da questa proprietà derivano tutta una
serie di caratteristiche sia dal punto di vista applicativo sia da un punto di vista
scientifico.
Ad esempio comporta eccezionali proprietà di trasporto elettrico, alta mobilità
elettronica anche a temperatura ambiente (non osservabile in altri materiali) e questo
apre tutta una serie di
>Applicazioni in elettronica
Dal punto di vista della scienza fondamentale gli elettroni del grafene permettono di
studiare
>Effetti quantistici relativistici …in laboratorio
Cosa possiamo fare con il grafene
Materiali resistenti
Vernici
Celle solari
Elettronica
Conduttori termici
… in realtà la ricerca procede e scopre le sue peculiari e uniche proprietà
209
Nanoscienze e nanotecnologie
9.6. Test
Consideriamo i processi di ricombinazione radiativa in nanoparticelle di semiconduttore a gap
diretta. Questi processi origineranno fotoni con:
a. con energia diversa dall'energia di gap del semiconduttore non soggetto a confinamento quantico,
con segno (variazione positiva o negativa) dipendente dalle dimensioni delle nanoparticelle.
b. energia minore della energia di gap del semiconduttore non soggetto a confinamento quantico
perché il confinamento quantistico diminuisce l’energia sia degli elettroni sia delle lacune.
c. con energia corrispondente all’energia di gap del semiconduttore non soggetto a confinamento
quantico perché l’energia di gap è una proprietà del materiale non modificabile nella nanostrutturazione.
d. con energia diversa dall'energia di gap del semiconduttore non soggetto a confinamento quantico,
con segno (variazione positiva o negativa) dipendente dal valore delle masse efficaci degli elettroni e
delle lacune del semiconduttore.
e. energia maggiore della energia di gap del semiconduttore non soggetto a confinamento quantico
perché il confinamento quantistico aumenta l’energia sia degli elettroni sia delle lacune.
[La risposta corretta è la e.]
Utilizzando l’ingegneria di banda per creare una sequenza di materiali BAB in cui sia gli
elettroni sia le lacune siano liberi di muoversi solamente nel piano del materiale A e siano
210
quindi confinati nella direzione perpendicolare è necessario che (Nota: si chiede di
determinare una condizione necessaria non sufficiente):
a. la costante reticolare del materiale A deve essere maggiore di quella del materiale B.
b. il materiale A abbia energia di gap maggiore di quella del materiale B.
c. la massa efficace degli elettroni e delle lacune nel materiale A deve essere maggiore dei corrispettivi
valori nel materiale B.
d. il materiale A abbia energia di gap minore di quella del materiale B.
e. i due materiali devono avere la stessa energia di gap.
[La risposta corretta è la d.]
Nella microscopia a forza atomica le forze di interazione fra gli atomi della punta e gli atomi
sulla superficie del campione generano un segnale che viene utilizzato per determinare la
topografia. Quale tipo di segnale?
a. Le forze repulsive di interazione producono una deformazione della punta che viene ricondotta alla
topografia attraverso il segno della variazione della corrente che scorre fra la punta e la superficie.
b. Le forze di interazione producono una deflessione del cantilever che sostiene la punta, rivelata dallo
spostamento di un fascio di luce riflesso.
c. Le forze attrattive di interazione producono una deformazione della punta che viene ricondotta alla
topografia attraverso il segno della variazione della corrente che scorre fra la punta e la superficie.
d. Le forze attrattive di interazione fra la punta e il campione generano una corrente proporzionale alla
distanza fra la punta e la superficie del campione.
e. Le forze repulsive di interazione allontanano la punta dalla superficie annullando la corrente che
scorre fra la punta e la superficie.
[La risposta corretta è la b.]
Si consideri una eterostruttura fra due semiconduttori di diversa natura A e B (diversa energia
di gap, diverso parametro reticolare, ma stessa simmetria cristallina). Quali delle seguenti
affermazioni è corretta?
a. È sempre possibile depositare il materiale B sul materiale A senza difetti indipendentemente dallo
spessore del materiale B.
b. È possibile solamente la deposizione del materiale B deformato tensilmente affinché si adegui al
parametro reticolare del substrato.
c. La deposizione del materiale B sul materiale A provoca una deformazione del substrato A che
adegua il suo parametro reticolare a quello dell’epistrato B.
d. Il materiale B può depositarsi sul materiale A privo di difetti per spessori inferiori ad uno spessore
critico di rilassamento se si deforma tensilmente o compressivamente (a seconda della grandezza
relativa dei parametri reticolari) per adattarsi al substrato.
e. È possibile solamente la deposizione del materiale B deformato compressivamente affinché si adegui
al parametro reticolare del substrato.
[La risposta corretta è la d.]
Nella microscopia a forza atomica è possibile osservare la topografia fino alla risoluzione
atomica di una superficie grazie a:
a. esclusivamente la regione repulsiva delle forze di interazione del tipo di Van der Waals fra la punta e
la superficie isolante del campione.
b. le forze elettriche presenti fra la punta metallica e la superficie metallica o semiconduttrice del
campione.
c. esclusivamente la regione attrattiva delle forze di interazione del tipo di Van der Waals fra la punta e
la superficie del campione.
d. le forze di attrito fra la punta e la superficie metallica del campione.
211
e. le forze di interazione del tipo di Van der Waals fra la punta e la superficie del campione sia essa
metallica o isolante.
[La risposta corretta è la e.]
Gli elettroni nel grafene sono fermioni di Dirac, cioè fermioni senza massa. Da quale proprietà
delle bande di energia del grafene discende questa proprietà:
a.
b.
c.
d.
e.
dispersione lineare delle bande di energia intorno al punto K.
velocità degli elettroni pari alla velocità di Fermi come in un metallo.
dispersione quadratica delle bande di energia intorno al punto K.
velocita degli elettroni nel grafene pari alla velocità della luce c.
mancanza di dispersione nella struttura a bande del grafene.
[La risposta corretta è la a.]
212