Chimica Fisica dei Materiali Molecolari

Chimica Fisica dei Materiali Molecolari
Alberto Girlando
November 2, 2006
2
Sono presenti alcuni argomenti svolti nella prima parte del corso, e che sono o di difficile reperibilità o comuni
ad altri corsi (seppure con linguaggio un po’ diverso). In quest’ultimo caso gli argomenti saranno trattati in
maniera poco approfondita durante le lezioni.
Chapter 1
Sintesi e preparazione di materiali
In questo corso ci occupiamo di chimica fisica dei materiali molecolari. E’ allora il caso di chiedersi prima di
tutto che cosa si intenda per materiali. Per materiale si intende una sostanza in un certo stato fisico, per lo
più solido, che in quanto tale si adatta ad un certo uso di tipo pratico o applicato. Quindi non si deve soltanto
disporre di una certa sostanza o prodotto chimico, ma questa sostanza deve anche avere delle caratteristiche
proprie del particolare stato fisico tali da poter essere utilizzata per un certo scopo. I materiali molecolari
sono abbastanza ovviamente una particolare classe di materiali, cioè materiali costituiti da molecole, ed in
cui le unità molecolari mantengono la propria identità. Visto che un materiale deve poter svolgere una qualche
funzione, acquista grande importanza non solo la sintesi del particolare prodotto chimico (la molecola) ma anche
la preparazione del materiale stesso. La sintesi e la preparazione significano due cose abbastanza diverse: per
sintesi del materiale si intende la formazione di un nuovo prodotto chimico a partire da materiali diversi in fase
gassosa, in fase liquida o in fase solida; la preparazione del materiale d’altra parte si riferisce alla produzione
di materiale in uno stato fisico come detto prima adatto ad uno scopo, a partire dallo stesso tipo di materiale.
Facciamo allora un breve riassunto dei metodi di preparazione dei materiali a partire dai metodi comuni a
diverse classi di materiali, per finire a quelli specifici dei materiali molecolari. Ci sono di verse maniere di
preparare i materiali, e possiamo distinguere la preparazione a partire da gas, a partire da soluzioni o a partire
dal solido. Di quest’ultima maniera non parleremo, perché la sintesi o la preparazione a partire da solido non
sono molto usate, e riguardano casi molto specifici. Le reazioni in stato solido sono difatti piuttosto infrequenti,
e per ciò che riguarda la preparazione si tratta per lo piú di fare avvenire delle transizioni di fase nel solido,
come nel caso della sintesi ad alta pressione del diamante.
1.1
Sintesi da gas a solido
E’ forse la tecnica di produzione più diretta: implica la condensazione di un vapore su un substrato relativamente
freddo, la fase vapore essendo ottenuta riscaldando un solido per sublimazione o un liquido per evaporazione.
Lo schema del è mostrato in fig. 1.1.
Abbiamo una camera cui viene fatto il vuoto con una pressione dell’ordine di 10−4 Pa. Il materiale di solito
sotto forma di polvere solida viene messo in una navicella fatta di materiale refrattario. Per sostanze che hanno
punto di fusione dell’ordine di 1000 C o meno la navicella viene riscaldata mediante una resistenza. Il vapore
che risulta per lo più dal solido fuso colpisce il substrato posto sopra la navicella, e condensa in un film sottile
o in un cristallino. Per sostanze organiche ovviamente le temperature necessarie sono basse,ed il più delle volte
3
4
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
Figure 1.1: Schema di una camera per la deposizione da vapore
non si passa attraverso il fuso, ma si ha la diretta sublimazione del solido. Questa tecnica, cosı́ come descritta, è
una preparazione del tipo fisico. In questa maniera possono essere preparate anche delle fasi solide metastabili
specialmente se il substrato è molto freddo rispetto alla temperatura di evaporazione. Il riscaldamento del
materiale di partenza può avvenire anche per via diversa dalla resistenza riscaldante. Per esempio possono
essere usati elettroni, focalizzando un fascio di elettroni sul materiale da vaporizzare. Questo metodo può essere
usato per produrre film sottili di Si o Ge amorfi. Un’altra possibilità è di usare un laser ad alta potenza, a
patto che la luce laser sia assorbita in maniera efficiente dal materiale da vaporizzare. Questa tecnica è nota
come “laser ablation”. La laser ablation per esempio viene usata per preparare films sottili di superconduttori
ad alta temperatura oppure per produrre i cosiddetti nanotubi di carbonio.
Abbiamo poi il processo di sputtering. In tale processo il materiale sotto forma di solido (target) viene
bombardato da ioni fortemente energetici creati da una corrente elettrica in gas, con la formazione di un
plasma. Il materiale estratto dal solido sotto forma di ioni o raggruppamenti di atomi passa sul substrato dove
si deposita un film. Questa è una tecnica preparativa cui il materiale di partenza è semplicemente trasportato
sul substrato, e il film risultante ha la stessa composizione chimica del materiale di partenza. Uno schema della
camera di sputtering è mostrato in fig. 1.2.
Si mantiene in una pressione di base minore di 10−4 Pa mediante una pompa diffusiva e il gas di sputtering
è introdotto nella camera a una pressione tipicamente di 0.1–1 Pa. Il gas è di solito argon. La maniera più
semplice per indurre lo sputtering è di applicare una alto voltaggio tra il target ed il substrato cosı́ da attrarre
gli ioni dal plasma. Questo metodo è ovviamente applicabile solo a materiali che siano metallici. Per potere
usare la tecnica con materiali scarsamente conduttori si genera un campo a corrente alternata a radiofrequenza
(RF sputtering). Le velocità di deposizione per la tecnica di sputtering RF sono tipicamente basse (1-10 A/s),
1.1. SINTESI DA GAS A SOLIDO
5
Figure 1.2: Schema di una camera di sputtering
e leggermente maggore per lo sputtering in DC. La velocità di deposizione può essere aumentata in maniera
significativa usando un campo magnetico costante attorno al materiale da evaporare cosı̀ da concentrare le
densità del plasma in vicinanza della materiale stesso.
Un problema che si presenta con la semplice tecnica di deposizione da fase vapore è il controllo della composizione quando il materiale di partenza ha una complessa composizione chimica. Si può avere una distillazione
frazionata del vapore cosicché la composizione del vapore e del solido iniziale non sono la stessa. L’altro caso di
variazione composizionale avviene quando il vapore consiste di specie molecolari che non presentano la stessa
composizione del fuso. Come esempio possiamo citare il caso di As2 S3 , per il quale il vapore in equilibrio termico
con il fuso consiste delle specie molecolari As4 S4 e S2 .
Una tecnica di sintesi che permette un preciso controllo composizionale a partire dal vapore è la cosiddetta
“molecolar beam epitaxy” (MBE) schematizzata in fig. 1.3 In questa tecnica raggi molecolari di ciascuno dei
costituenti richiesti sono diretti sul substrato. Il raggio molecolare è ottenuto da una cella di Knudsen o cella di
diffusione, riscaldata elettricamente e contenente il componente. La cella di Knudsen è aperta e chiusa mediante
diaframmi a scatto (shutters). Il processo di evaporazione avviene in una camera ad ultra alto vuoto (UHV) con
una pressione di meno di 10−9 Pa. Queste condizioni di ultra alto vuoto assicurano una minima contaminazione
e permettono il trasporto balistico del raggio molecolare sul substrato. Le velocità di crescita del film sottile
sono dell’ordine di 0.3 nm/s, cioè circa un monostrato per secondo. Se le sorgenti vengono aperte e chiuse a
velocità apprezzabilmente minori di un secondo, allora il profilo composizionale del film può essere controllato
in maniera precisa. La composizione di un particolare strato è determinata dal flusso di atomi in ciascun raggio
molecolare, a sua volta controllato dalla temperatura delle celle di Knudsen. In questa maniera possono essere
realizzate delle strutture artificiali consistenti da multistrati di materiali diversi. Sebbene la tecnica MBE offra
un preciso controllo composizionale nella crescita del film, la sua lenta velocità di crescita e lenta produzione di
campione, accoppiata all’alto costo della camera ad ultra alto vuoto ne impedisce l’uso uso di tipo industriale.
La tecnica di deposizione chimica del vapore (Chemical Vapor Deposition, CVD) è il processo in cui le specie
molecolari precursori reagiscono in maniera omogenea in fase gas o in maniera eterogenea alla interfaccia solido
gas, con la produzione di un film di composizione diversa da quella dei materiali di partenza. Le molecole
precursori possono essere fatte decomporre per mezzo di calore, di assorbimento di radiazione ultravioletta o
6
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
Figure 1.3: Schema di una camera MBE
in un plasma elettrico. La tecnica termica è quella più comunemente usata. Semiconduttori compositi che
sono tecnologicamente importanti, come i materiali -V (GaAs, InP, GaP) possono essere cresciuti come film
epitassiali usando la CVD termica, ma partendo da precursori che sono molecole organiche in fase gas. Questa
variante viene chiamata “metal organic chemical vapor deposition” (MOCVD). Una illustrazione schematica di
un apparato per la crescita MOCVD è mostrato in fig. 1.4.
La tecnica, se confrontata con la MBE, ha il vantaggio di non richiedere un apparato ad ultra altro vuoto,
ed inoltre le varie sorgenti di diversi atomi o molecole possono essere controllati da valvole di flusso di gas. Ha
lo svantaggio però che l’intero volume di gas del reattore deve essere cambiato quando si passa da una sorgente
di gas all’altra per crescere film di composizione diversa. Altre varianti di questa tecnica non vengono discusse
qui.
1.2
Sintesi da liquido a solido
Possiamo distinguere due casi: crescita del cristallo a partire dal fuso e crescita del cristallo a partire da
una soluzione. Ci sono tre metodi generali nella produzione di materiali cristallini dal fuso. Il cristallo può
essere estratto dal fuso, oppure la cristallizzazione avviene all’interno di un apposito contenitore. Infine, la
cristallizzazione può avvenire all’interno del materiale stesso che funge anche da contenitore. Queste tecniche
permettono in genere una elevata purezza del materiale e sono state sviluppate soprattutto per ottenere cristalli
di Si e di Ge estremamente puri, meglio di una parte su 1012 . Forse la tecnica più importante per crescere
1.2. SINTESI DA LIQUIDO A SOLIDO
7
Figure 1.4: Schema di una camera MOCVD
cristalli singoli perfetti dal fuso è il metodo di Czochralski, mostrato in fig. 1.5.
In questo metodo del materiale fuso è contenuto in un recipiente refrattario e mantenuto a una temperatura
appena superiore al punto di fusione. Un seme (seed) di cristallo singolo attaccato a una bacchetta è posto sulla
superficie del fuso e tirato su lentamente, ad una velocità di pochi millimetri per minuto. Il fuso cristallizza in
maniera epitassiale sul cristallo seme, mantenendo la sua orientazione cristallografica nel cristallo tirato su. La
bacchetta con il cristallo, e il recipiente sono generalmente ruotati in senso opposto a una frequenza di poche
decine di giri al minuto per mantenere l’omogeneità del fuso e una temperatura costante nella regione della
crescita del cristallo. Come risultato di questa rotazione attorno all’asse longitudinale il cristallo tirato su ha
una geometria cilindrica. Cristalli di Si cresciuti in questa maniera hanno un diametro anche più grande di 20
cm.
Una maniera leggermente diversa che produrre cristalli da fuso è la tecnica di Bridgman dove il recipiente
che contiene il fuso in contatto con il cristallo seme è sottoposta a un gradiente di temperatura. Due varianti
del metodo sono illustrate in fig. 1.6.
In un caso si mantiene un gradiente di temperatura lungo il recipiente, riducendo la temperatura complessiva della fornace lentamente con il tempo. In questa maniera la posizione in cui la temperatura è uguale
alla temperatura di fusione del materiale si muove progressivamente lungo la lunghezza delle recipiente e con
essa si muove il fronte di cristallizzazione. Nell’altra variante (metodo di Stockbarger) invece il recipiente è
mosso relativamente alla fornace in cui il gradiente di temperatura e la temperatura media sono mantenute
costanti. Infine nella tecnica fusione a zona il profilo di temperatura è piccato ad una temperatura superiore
alla temperatura di fusione del materiale in una regione molto piccola del recipiente contenente il materiale.
Questo viene trasportato relativamente al punto riscaldante e quindi la zona in cui il materiale fonde si muove
lungo il recipiente lasciando dietro un solido cristallizzato da un opportuno cristallo seme.
Nelle tecniche precedenti lo scopo era di ottenere una cristallo perfetto a partire dal fuso. Talvolta si desidera
preparare materiale sotto forma solida ma che non abbia nessuna traccia di cristallinità. Il liquido non ha alcun
ordine a lungo raggio e quindi c’è la possibilità che se si raffredda un liquido in maniera sufficientemente rapida
si evita la cristallizzazione e si congela la struttura caratteristica del liquido. In questo caso si parla di vetro.
8
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
Figure 1.5: Metodo Czochralski per la crescita da fuso
Questo processo di vetrificazione o formazione del vetro è appunto ottenuto sottoraffreddando un liquido al
di sotto di il suo normale punto di congelamento. Il processo avviene fuori dell’equilibrio termodinamico ed è
controllato dalla cinetica.
La crescita del cristallo a partire dalla soluzione è naturalmente il normale processo di ricristallizzazione. La
preparazione di cristalli da soluzione implica lo sciogliere il materiale da cristallizzare in un solvente adatto, cioè
che non reagisca, e poi causando la cristallizzazione, o riducendo la solubilità del soluto, per esempio abbassando
la temperatura, o aumentando la concentrazione del soluto nella soluzione togliendo un po’ del solvente, per
esempio per evaporazione. Il problema con questa tecnica è naturalmente la possibilità di includere il solvente
nel cristallo. Solventi usati per la crescita di cristalli da soluzione a bassa temperatura, ad esempio sotto i 100
C, sono l’acqua, per la cristallizzazione di molti composti inorganici, e vari solventi organici come ad esempio
acetone, etanolo, tetracloruro di carbonio ecc. per cristalli di molecole organiche. La crescita da soluzione ad
alta temperatura implica temperature molto piú alte del punto di ebollizione dell’acqua, tipicamente dell’ordine
di 1000 C. Il solvente in questo caso può essere un metallo liquido, oppure un composto inorganico tipo un
ossido o un fluoruro. Questi solventi inorganici sono chiamati flussi poiché essi riducono il punto di fusione del
soluto puro formando una soluzione di punto di fusione più basso. Questa forma della crescita da soluzione ad
alta temperatura è pertanto anche nota come crescita da flusso.
Un altro metodo di crescita da soluzione è quello che usa come solvente l’acqua supercritica, cioè a temperature e pressioni al di là del punto critico (647.3 K e 22.12 MPa). Questo metodo per esempio è usato per
crescere la modificazione cristallina dell’ α-quarzo, ovvero per la crescita delle zeoliti.
1.3. METODO SOL-GEL
9
Figure 1.6: Tecniche di crescita di cristalli con gradienti di temperatura. a) Metodo di Bridgman; b) Metodo
di Stockbarger; c) e d) Tecniche zone-refining
1.3
Metodo sol-gel
Questo metodo parte ancora da una soluzione, ma il materiale è decisamente diverso, per cui lo trattiamo a
parte. Il metodo sol-gel è particolarmente adatto per la sintesi di materiale refrattario costituito da ossidi a
temperature relativamente bassa, per esempio il vetro denso SiO2 può essere fatto in questa maniera, con una
temperatura di 1200 C, invece della temperatura di fusione di 2000 C. Il punto di partenza in questo metodo è un
sol cioè una dispersione colloidale di piccole particelle sospese nel liquido. Un sol può essere stabilizzato tramite
peptizzazione, cioè l’aggiunta di un agente che formi un monostrato elettricamente carico attorno ciascuna
particella. La repulsione elettrostatica impedisce quindi l’aggregazione delle particelle. Sotto adatte condizioni
chimiche e termiche, le particelle possono essere fatte reagire o interagire elettrostaticamente, cosicchè esse
formano una struttura tridimensionale di particelle connesse, nota come un gel, invece di aggregarsi per formare
delle particelle più grandi ma discrete, come succede nella precipitazione (vedi fig. 1.7).
Il gel leggermente umido o bagnato formato durante il processo sol-gel è costituito allora da una struttura
di particelle connesse e contenente il sol liquido nei suoi interstizi. Un gel si comporta come un materiale
facilmente deformabile oppure duro ma estremamente fragile. Via via che un gel invecchia, più particelle del
sol condensano, pertanto indurendo il gel. La rimozione del liquido interstiziale da un gel bagnato produce un
10
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
Figure 1.7: Illustrazione della formazione del gel e della precipitazione (“flocculazione”) da un sol
gel secco noto come xerogel. Però il processo di essiccamento non è un processo banale se si vuole mantenere
la integrità strutturale della struttura del gel. Questo metodo può essere anche usato per ottenere materiale
funzionalizzato, introducendo delle molecole apposite all’interno della struttura dello xerogel. Il materiale
risultante non ha ovviamente struttura cristallina, ma nemmeno vetrosa ed è piuttosto classificabile come un
frattale.
1.4
1.4.1
Metodi specifici per i materiali molecolari
Spin-coating
I materiali molecolari sono molto adatti alla preparazione con questa tecnica, che è allo stesso tempo semplice
ed economica. Lo spin coating è usato per molte applicazioni in cui un substrato relativamente piatto deve
essere ricoperto con uno strato sottile (dell’ordine dei micron) di materiale. Il materiale che deve costituire il
coating viene sciolto o disperso in un solvente adatto, e la soluzione viene depositata sul substrato che viene
fatto ruotare velocemente. La rotazione causa la formazione di un film uniforme di soluzione, allo stesso tempo
facilitando l’evaporazione del solvente e quindi la formazione di un film di spessore abbastanza uniforme. Tra
le tecnologie che adottano lo spin coating possiamo ricordare: i) le deposizione di “photoresist” per definire i
pattern di fabbricazione dei microcircuiti; ii) formazione di layers dielettrici o isolanti, sempre per i microcircuiti;
iii) ricopertura di un layer magnetico (sospensione i particelle magnetiche) in un hard disk, o ricopertura di
uno strato lubrificante per le testine di lettura; iv) layer attivo nei compact disks; v) flat display coatings; vi)
deposizione di polimeri con particolari proprietà elettriche, etc.
Il processo di spin-coating può essere suddiviso in quattro fasi (fig. 1.8).
1. Nel primo stadio il fluido con disciolto il materiale viene depositato sul substrato. Ciò può essere fatto
1.4. METODI SPECIFICI PER I MATERIALI MOLECOLARI
11
Figure 1.8: Deposizione di films con il metodo spin-coating
con una pipetta che versa la soluzione, o con una tecnica spray. Di solito la soluzione del materiale viene
versata in eccesso rispetto alla quantità richiesta per un dato spessore di film. Per molte soluzioni è spesso
conveniente effettuare la deposizione usando un filtro di pori sub-micrometrici, per eliminare le particelle
che potrebbero portare a dei difetti. Un’ altra questione importante è se la soluzione “bagna” la superficie
completamente. Se non lo fa, si può avere una non completa ricopertura.
2. Nel secondo stadio il substrato viene posto in rotazione accelerando la velocità di rotazione fino a raggiungere il valore finale desiderato. Questo stadio è di solito caratterizzato da una espulsione violenta
del fluido dal substrato, a causa della forza centrifuga. Data lo spessore iniziale del fluido depositato, si
possono avere dei vortici a spirale. Questi vortici si possono formare a causa della diversa velocità angolare
di rotazione tra il layer di fluido a contatto con il substrato rotante ed i layer superiori, che seguono l’
accelerazione con ritardo. Alla fine, il fluido è sufficientemente sottile da permettere una rotazione uniforme col substrato, e la forza centrifuga che tende a espellere il fluido è controbilanciata dalla viscosità
del fluido e dalla sua adesione al substrato.
3. Nel terzo stadio il substrato sta ruotando a velocità costante, e le forze di viscosità dominano il processo di
assottigliamento del film. Questo processo è la prosecuzione del secondo stadio, ma il fluido viene espulso
in maniera meno violenta, con un assottigliamento del film che di solito è piuttosto uniforme. Talvolta
si possono avere degli effetti di spigolo, perché il fluido fluisce uniformemente verso l’esterno, ma forma
12
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
delle gocce al bordo del substrato prima che queste possano essere allontanate. Allora, a seconda della
tensione superficiale, la viscosità, la velocità di rotazione etc., ci possono essere delle piccole differenze
di spessore in corrispondenza dei bordi del substrato. Un trattamento matematico del comportamento
del fluido mostra che se il liquido ha una viscosità Newtoniana (cioè lineare) e se lo spessore del film è
inizialmente uniforme, allora lo spessore del film rimarrà uniforme.
4. Il quarto stadio si ha quando il substrato gira a velocità costante e l’ evaporazione del solvente domina l’
assottigliamento del film. Via via che il terzo stadio procede, lo spessore del fluido raggiunge un punto in
cui la viscosità impedisce ulteriori flussi del fluido. A questo punto, l’ evaporazione del solvente diviene l’
effetto dominante. In effetti, il coating a questo punto “gelifica”, perché con l’ evaporazione del solvente
la viscosità della soluzione aumenta, e fissa il coating al substrato.
1.4.2
Ink-jet printing
La tecnica dello spin-coating non può essere usata qualora il film debba avere un ben preciso pattern. Nel caso
dei photo-resits, per esempio, si fa una deposizione spin-coating, poi si crea il pattern sul photo-resists, e poi si
deposita il materiale attivo. Una strategia emergente per creare direttamente delle deposizioni di materiale in
strutture ben definite, è quello della stampa con tecnica ink-jet, già usata a livello industriale nella produzione
di displays basati su materiali organici, per es. polimeri. Il polimero viene disciolto in un solvente adatto, e
poi la soluzione viene “stampata” sul substrato mediante una testina con fori di scala micrometrica, del tipo di
quella usata nelle comuni stampanti a getto di inchiostro (ink-jet). Raffinando la tecnica, è possibile depositare
goccioline corrispondenti a diversi colori del display sullo stesso pixel. Il processo può essere molto veloce,
generando per es. lo schermo di un telefonino in pochi secondi.
La stampa ink-jet richiede un controllo preciso della chimica del materiale, per soddisfare non solo le proprietà
elettriche ed ottiche richieste per es. per un display, ma anche per ottimizzare le proprietà meccaniche (viscosità,
densità, etc.) del materiale e dell’inchiostro che deve essere ottenuto con una opportuna scelta del solvente.
1.4.3
Films ultrasottili o monomolecolari
Infine vediamo la preparazione di films ultrasottili di composti organici. Per films ultrasottili si intendono
dei films al limite monomolecolari o di spessore corrispondente a poche molecole. La preparazione di questi
films può essere fisica o chimica. La preparazione fisica è basata su quella che prende il nome di tecnica di
Langmuir-Blodgett (LB). In questa tecnica una soluzione di molecole cosiddette anfifiliche, e cioè con una una
testa idrofila e una coda idrofobica, viene sparsa sulla superficie dell’acqua (vedi fig. 1.9).
La testa idrofila penetra nell’acqua mentre quella idrofobica rimane fuori. Quindi le molecole si spargono
sulla superficie dell’acqua come un olio. Mediante una opportuna barriera le molecole possono essere compresse
cosı̀ da riempire in maniera uniforme tutta la superficie. Abbiamo allora un film monomolecolare sulla superficie
dell’acqua. Per una pressione superficiale sufficientemente elevata il film ha una struttura ordinata. Questo film
può allora essere trasferito a un adatto substrato, che viene tirato su dalla superficie dell’acqua mantenendo
costante la pressione superficiale. Si possono depositare anche più strati alzando ed abbassando il substrato
nella soluzione. Il caso ideale sarebbe quello di trasferire un film perfettamente ordinato, ma in realtà si hanno
dei domini ordinati in maniera diversa sul substrato. Le forze che tengono unite le molecole al substrato e tra
di loro sono quindi forze di tipo fisico: si parla ciodi adsorbimento. Da questo punto di vista il film preparato
con il metodo LB non è un film particolarmente stabile o resistente, e quindi questa tecnica è usata a livello di
laboratorio, e difficilmente potrà trovare impiego su larga scala.
1.4. METODI SPECIFICI PER I MATERIALI MOLECOLARI
13
Figure 1.9: Tecnica di Langmuir-Blodgett per l’ottenimento di films monomolecolari
Un metodo alternativo alla tecnica LB è quello di legare le molecole al substrato tramite un legame chimico.
In questo caso si parla di films autoassemblantisi (self-assembled), di cui riporto un esempio in fig. 1.10.
In un caso abbiamo un solo strato molecolare mentre nell’altro caso abbiamo la possibilità di costruire più
strati molecolari, che si autoorganizzano tramite la formazione di specifici legami chimici. Questa tecnica è
molto promettente, ma ovviamente non sempre applicabile.
14
CHAPTER 1. SINTESI E PREPARAZIONE DI MATERIALI
Figure 1.10: Esempi di films self-assembled
Chapter 2
Classificazione dei materiali
Il primo problema che ci dobbiamo porre è come classificare la grande varietà di materiali con cui abbiamo
a che fare. Infatti delle collezioni di particelle (dove con particelle s’ intende sia atomi che molecole) possono
aggregarsi in una varietà pressoché infinita strutture di equilibrio e di non equilibrio. Queste strutture possono
essere caratterizzate dalle posizioni medie delle particelle e dalle interazioni spaziali tra le particelle stesse. Per
esempio i cristalli, con la loro disposizione regolare di particelle, sono più ordinati ed hanno simmetria più bassa
dei fluidi. Nei fluidi si ha difatti una disposizione disordinata delle particelle, e queste sono anche in continuo
moto termico. Allora se consideriamo per esempio un gas di tipo ideale abbiamo una disposizione uniforme
delle particelle con interazioni nulle o per meglio dire trascurabili. Abbassando la temperatura o aumentando la
densità (cioé la pressione), si ha un aumento delle forze di interazione: si parla allora di liquido, dove c’è una forte
correlazione tra le posizioni delle particelle. Tuttavia un liquido ha la stessa simmetria del gas. Raffreddando
ulteriormente si possono formare varie fasi di simmetria ancora più bassa. Alle temperature più basse la fase di
equilibrio di gran parte dei materiali o dei sistemi di particelle è un cristallo altamente ordinato. Strutture di
non equilibrio come gli aggregati possono avere delle simmetria insolite non trovate nelle strutture di equilibrio.
Si pone dunque il problema di classificare questi tipi di materiali in una maniera un poco più razionale e
quantitativa. Possiamo a tale scopo definire le seguenti quantità. Definiamo anzitutto la funzione densità, che
specifica il numero di particelle per unità di volume in una certa posizione r [r = (x,y,z) in tre dimensioni, e la
sommatoria è estesa a tutte le particelle α]:
n(r) =
X
δ(r − rα )
(2.1)
α
Dove δ è il delta di Dirac, che mi dice se nel punto r = rα c’è o no una particella. Nei sistemi quanto
meccanici, r è l’operatore posizione per una particella, nei sistemi classici esso è la variabile dinamica che
specifica la posizione della particella. La media statistica dell’operatore densità è la densità media hn(r)i nel
punto r. In un fluido omogeneo e isotropo, la densità media è indipendente da r ed è semplicemente la densità
nel fluido.
Possiamo poi definire delle funzioni di correlazione, che sono medie statistiche di prodotti della funzione
densità in punti diversi dello spazio. La più importante di queste funzioni è la funzione di correlazione densità
tra una coppia di punti:
X
X
(2.2)
δ(r1 − rα )][
δ(r2 − rα0 )]i
Cnn (r1 , r2 ) = hn(r1 )n(r2 )i = h[
α
15
α0
16
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
Abbiamo poi la funzione di distribuzione per una coppia, g(r1 , r2 ), definita nella maniera seguente:
hn(r1 )ig(r1 , r2 )hn(r2 )i = h
X
δ(r1 , rα )δ(r2 , rα0 )i
(2.3)
α6=α0
ovvero:
g(r1 , r2 ) =
P
h α6=α0 δ(r1 − rα )δ(r2 , rα0 )i
hn(r1 )ihn(r2 i
(2.4)
Sostanzialmente, data una particella α in un punto r1 , la funzione di distribuzione per la coppia è la
probabilità di trovare una particella diversa, α’ nel punto r2 . Una maniera diretta ed intuitiva di visualizzare
g(r1 = 0, r2 = r) ≡ g(r) è quella riportata in figura 2.1. Si scelga una configurazione di posizioni di particelle
nell’insieme delle configurazioni permesse, e si scelga unPsistema di coordinate cosı̀ che una particella che
etichettiamo con lo zero è all’origine. Allora g(r) = hni−1 h α6=0 δ(r−rα +r0 )i può essere determinata contando
il numero di particelle in un volume infinitesimo a distanza r dalla particella all’origine. In un gas ideale non si
sono correlazioni, e g(r) = 1 . Questo valore, o in ogni caso il valore costante raggiunto per r → ∞, viene preso
come valore di riferimento, g0 . Se il sistema è isotropico g(r) → g(r), con r = |r|. In questo caso g(r) è nota
come funzione di distribuzione radiale.
Date queste definizioni possiamo cercare di classificare i materiali in base alle loro proprietà di simmetria
nella distribuzione delle particelle. La simmetria è, come sappiamo e come vedremo anche meglio in questo corso,
un metodo potentissimo per classificare un certo sistema e per ottenere informazioni su di esso. Naturalmente
i sistemi reali saranno solo approssimazioni del modello ideale mediante il quale facciamola la classificazione.
2.1
Liquidi e gas
Sia i liquidi che i gas sono dei fluidi. I fluidi sono spazialmente omogenei e isotropici dal punto di vista
rotazionale. Questo significa che l’intorno medio di ogni punto nel fluido è identico a quello di ogni altro punto
ed è indipendente dalla direzione. Allora le proprietà medie del fluido sono invarianti rispetto alle traslazioni
lungo un vettore qualunque R, di lunghezza e direzione arbitraria, e rispetto a rotazioni arbitrarie attorno ad
un asse qualunque. Questo implica che le densità sono spazialmente uniformi e che la funzione di correlazione di
una coppia dipende solo dalla differenza tra le due coordinate spaziali. Difatti l’invarianza traslazionale implica
che hn(r)i = hn(r + R)i, dove appunto il vettore spostamento R è arbitrario. In particolare possiamo sceglierlo
uguale a −r, cosicché hn(r)i è uguale alla densità hn(0)i nell’origine prescelta. Allora la densità non dipende
da r. In maniera analoga l’invarianza delle rotazioni fa sı̀ che la funzione di correlazione dipenda soltanto dalla
distanza tra le due particelle.
Come sappiamo l’insieme delle operazioni che lasciano un sistema inalterato forma un gruppo chiamato il
gruppo di simmetria. Il gruppo delle traslazioni arbitrarie, anche infinitesime, e delle rotazioni arbitrarie, è
detto il gruppo Euclideo. Nello spazio tridimensionale avremo tre direzioni di traslazione indipendenti, e tre
assi di rotazione indipendenti, cosicché il gruppo Euclideo è caratterizzato dalle operazioni T 3 e R3. I fluidi
allora hanno la simmetria più alta possibile cioè hanno il più gran numero di operazioni di simmetria. Tutte le
altre fasi di equilibrio della materia sono invarianti solo sotto alcuni sottogruppi del gruppo Euclideo, ed hanno
una simmetria più bassa della fase fluida. Come vedete un gas e un liquido hanno la stessa simmetria. In effetti
il passaggio gas-liquido può anche avvenire in maniera continua, andando oltre il punto critico. Tranne che
2.1. LIQUIDI E GAS
17
Figure 2.1: Configurazione atomica tipica di un fluido a sfere rigide. In basso: la corrispondente distribuzione
radiale per tre diverse frazioni di volume (cioè il rapporto tra il volume occupato dalle sfere rigide e il volume
totale).
18
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
per i gas ideali, ci sono sempre delle interazioni e delle correlazioni tra le particelle e quindi una funzione di
distribuzione per le coppie che differisce dall’unità, e che riflette queste correlazioni. La differenza tra un gas
ideale (nessuna correlazione) e un liquido, che ha appunto delle correlazioni abbastanza forti, è dunque riflessa
nella diversa funzione di correlazione. Se per esempio approssimiamo le particelle di un liquido a delle sfere
rigide, facendo ovviamente la grossa semplificazione di considerare solo le forze repulsive, abbiamo la situazione
raffigurata nella figura precedente. E’ chiaro da questa figura che ci sono delle forti interazioni a corto raggio
nella posizione delle particelle. C’è un guscio dei primi vicini che consiste di circa 6 particelle (in due dimensioni),
poi una caduta di densità causata dall’esclusione da questo guscio, poi un altro guscio e cosı̀ via. La correlazione
muore rapidamente nella scala alcuni diametri di particella. La funzione di distribuzione radiale ha allora la
forma mostrata in basso nella figura precedente (il guscio dei primi vicini è evidenziato in grigio). Abbiamo
quello che si chiama un ordine a corto raggio (SRO) che quindi può essere definito come quell’ordine in cui
la funzione di distribuzione radiale cade al valore di riferimento g0 , preso come zero, oltre una certa distanza
tipica, ξ, che viene detta lunghezza di correlazione. L’annullarsi della funzione di correlazione può in questo
caso essere schematizzato da un esponenziale:
[g(r) − g∞ (r)] ≡ g(r) = exp(−r/ξ)
SRO
(2.5)
Come abbiamo detto nella lezione precedenti, se raffreddiamo velocemente un liquido possiamo impedire
la cristallizzazione cioè l’abbassamento della simmetria, e ottenere un vetro. Il vetro è una struttura di non
equilibrio che ha le stesse proprietà di simmetria di un fluido, ma magari una diversa funzione di correlazione
radiale, che in ogni caso è statica cioè non cambia nel tempo (mentre nel caso di un liquido la funzione di
distribuzione radiale deve essere intesa come una media temporale o una media statistica).
2.2
Solidi cristallini
Penso sappiate benissimo cosa si intende per un cristallo perfetto. Questo consiste in un riempimento dello
spazio mediante copie identiche di unità strutturali singole. La struttura è allora una struttura periodica, che
si ripete a intervalli regolari e stabiliti. Un esempio è mostrato in fig. 2.2
Abbiamo ancora la simmetria traslazionale, ma né la direzione né il modulo del vettore sono arbitrari.
Abbiamo quindi perso tutte e tre le operazioni di traslazione Euclidee. La stessa cosa vale per le rotazioni.
Quindi il passaggio da fluido a cristallo significa passare da un gruppo continuo delle rotazioni e delle traslazioni
a un gruppo discreto, che come vedremo si chiama gruppo spaziale. In questo in questo corso ci occuperemo
soprattutto, per non dire quasi esclusivamente, dei solidi cristallini. Rimandiamo quindi alle lezioni successive
una descrizione più dettagliata della simmetria cristallina. Per adesso possiamo concludere questa sezione
dicendo che in un cristallo c’è un ordine a lungo raggio (LRO), dato che in questo caso l’ordine si ripete maniera
pressoché infinita, e la funzione di correlazione è diversa da zero anche per distanze infinite:
lim g(r) 6= 0
r→∞
LRO
(2.6)
C’è poi anche la situazione intermedia, cioè con ordine “quasi a lungo raggio” (QLRO). Menzioniamo infine
che anche che i film ultrasottili come i films LB, ovvero le superfici di un cristallo hanno una simmetria discreta,
seppure in due dimensioni, piuttosto che in tre dimensioni.
2.3. CRISTALLI LIQUIDI
19
Figure 2.2: Esempio di struttura cristallina bidimensionale.
2.3
Cristalli liquidi
Nelle sezioni precedenti abbiamo visto due forme estreme di materia condensata: liquidi omogenei e isotropici
con una struttura media invariante per traslazioni e rotazioni arbitrarie, e solidi cristallini con strutture medie
che sono invarianti soltanto rispetto a certe traslazioni e rotazioni discrete. Il liquido ha ordine a corto raggio,
e la simmetria più alta possibile. Il solido cristallino ha un ordine a lungo raggio e simmetria più bassa. Tra
questi due estremi ci sono dei sistemi che esibiscono delle correlazioni a corto raggio in alcune direzioni e delle
correlazioni a lungo raggio in altre: essi hanno dunque simmetria intermedia tra quella del liquido e quella del
cristallo. Tra questi sistemi “intermedi” abbiamo i cosiddetti cristalli liquidi. Supponiamo di avere un sistema
costituito da molecole di forma allungata. Esse quindi perdono più facilmente la possibilità di riorientarsi
rispetto quella di traslare nella direzione dell’elongazione. Allora al diminuire della temperatura, a partire
dalla fase liquida si perde in primo luogo l’invarianza rotazionale (ricordiamo che parliamo sempre di rotazioni
infinitesime) lungo due assi di rotazione. Abbiamo allora il cristallo liquido nematico illustrato in fig. 2.3 alla
lettera (b).
Nella fase nematica le molecole si dispongono parallelamente ad n, vettore unitario che esprime la direzione
media dell’allineamento molecolare. E’ chiaro che le rotazioni infinitesime attorno ad un asse parallelo a n sono
operazioni di simmetria Euclidea, mentre non lo sono rotazioni perpendicolari a n, in quanto ci si ritrova nella
stessa situazione solo per rotazioni di 180 gradi.
Altri cristalli liquidi oltre perdere due gradi di invarianza rotazionale, possono anche perdere l’invarianza
rispetto a gradi di libertà traslazionali infinitesimi, dando luogo a un cristallo liquido di tipo smectico A, oppure
cristallo smectico di tipo C, sempre illustrati in fig 2.3. Se la forma delle molecole invece che essere allungata
come un sigaro, somiglia a quella di un disco, abbiamo i cristalli liquidi colonnari. In questo caso è mantenuta
l’invarianza traslazionale soltanto lungo la direzione delle colonne, e viene persa tutta l’invarianza rotazionale.
20
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
Figure 2.3: Rappresentazione schematica della disposizione delle molecole in: (a)un liquido; (b) un cristallo
liquido nematico; (c) un cristallo liquido smectico A; (d) un cristallo liquido smectico C; (e) un cristallo liquido
colonnare.
2.4. CRISTALLI GLOBULARI
FASE
Liquido
Crist. liquido
nematico
Crist. liquido
smectico A
Crist. liquido
smectico C
Crist. liquido
colonnare
Crist. plastico
Cristallo
21
simm.trasl.
continua
T3
simm.rotaz.
continua
R3
ordine
traslazionale
SRO(3)
ordine
rotazionale
SRO(3)
T3
R1
SRO(3)
LRO(2),SRO(1)
T2
R1
SRO(2),LRO(1)
LRO(2),SRO(1)
T2
R0
SRO(2),LRO(1)
LRO(3)
T1
T0
T0
R1
R3
R0
SRO(1),LRO(2)
LRO(3)
LRO(3)
LRO(2),SRO(1)
SRO(3)
LRO(3)
Table 2.1: Classificazione delle fasi in base alla simmetria
2.4
Cristalli globulari
I cristalli globulari o cristalli plastici sono cristalli molecolari in cui le molecole hanno forma pressoché sferica.
L’esempio tipico di un cristallo glubulare è il fullerene o C60 . Prima della cristallizzazione completa, i cristalli
globulari formano una fase detta cristallo plastico, in cui è persa l’invarianza traslazionale, e quindi si è stabilito
un ordine a lungo raggio traslazionale, ma non quella rotazionale, per cui le molecole sono libere di orientarsi
reciprocamente all’interno del cristallo. Nella tabella 2.4 riassumiamo la simmetria dei vari sistemi considerati
finora e le loro funzioni di correlazione.
2.5
Strutture incommensurate
Ci sono in natura delle strutture che non sono né con ordine a corto raggio come il liquidi né periodiche
come i cristalli. Queste esibiscono delle modulazioni spaziali discrete, ma i rispettivi periodi stanno tra di loro
come numeri irrazionali. Si parla allora di strutture incommensurate, che di solito risultano dalla competizione
tra due diverse scale di lunghezza. Come primo semplice esempio di strutture incommensurate consideriamo
l’adsorbimento di gas nobili su un reticolo di grafite come illustrato in fig. 2.4
Le dimensioni del Kripton adsorbito su grafite (in alto) sono tali che esso può sovrapporsi a un esagono di
grafite ogni due. La struttura è allora una struttura ordinata e periodica. Lo Xenon è più grande del Kr e
allora la struttura commensurata descritta sopra non è più possibile. Le molecole di Xe prendono allora una
posizione incommensurata rispetto al reticolo sottostante: il periodo secondo cui si ripete la struttura dello Xe
è diverso da quello della grafite, ed i due periodi sono incommensurati, cosicchè la struttura complessiva della
superficie non è periodica.
Un altro caso interessante di reticolo incommensurate è quello dei cosiddetti quasi-cristalli. Questi materiali
esibiscono un ordine icosaedrico, come è evidente dalla morfologia dell’abito cristallino (vedi fig. 2.5). Nella figura
è evidente un dodecaedro di AlCuFe. Ora il fatto è che la simmetria icosaedrica, cioè contenente assi di ordine
5, non può riempire in maniera periodica tutto lo spazio. Questo era uno dei fondamenti della cristallografia
classica. Una razionalizzazione del fatto che ciononostante questi cristalli esistono, può essere fornita notando
22
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
Figure 2.4: Kripton (in alto) e Xenon (in basso) adsorbiti su grafite.
Figure 2.5: Foto di un quasi-cristallo di AlCuFe, mostrante la caratteristica struttura dodecaedrica con facce
pentagonali.
2.6. FRATTALI
23
Figure 2.6: Porzione di un “pavimento” di Penrose, con illustrazione delle “mattonelle” (a destra).
che una struttura quasi cristallina aperiodica in tre dimensioni è la proiezione nello spazio tridimensionale di una
struttura periodica in uno spazio a sei dimensioni. Un punto di vista diverso può essere quello che fa riferimento
al cosiddetto pavimento di Penrose, fig.2.6, che fornisce una visualizzazione del riempimento dello spazio in
due dimensioni, cioè un pavimento, mediante l’uso di due diversi tipi di mattonelle di tipo forma rombica. La
struttura ha simmetria pentagonale, ma è aperiodica nel senso che la periodicità in direzioni diverse non è
commensurata. Da questo punto di vista i quasi-cristalli sono dunque delle strutture incommensurate.
2.6
Frattali
Un’altra classe strutturale distinta di materiali comprende i frattali. Queste strutture sono caratterizzate
dall’essere auto-simili, ovvero la struttura appare identica in tutte le scale di lunghezza. Un esempio matematico
in due dimensioni di una struttura frattale è riportata in fig. 2.7
Materiali reali che esibiscono strutture frattali sono gli aerogel di silicio, oppure delle strutture aggregate di
particelle quali quelle che si hanno nei sol: si veda nella fig. 2.8 un aggregato frattale di particelle d’oro.
24
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
Figure 2.7: Un esempio di struttura frattale, il gasket di Sierpinski, mostrando anche la costruzione del frattale
a partire dal triangolo iniziale.
Figure 2.8: Un aggregato frattale di particelle d’oro.
2.6. FRATTALI
25
Nonostante il fascino che possono esibire strutture come i frattali o i quasi-cristalli, nel nostro corso ci
dedicheremo soprattutto alle strutture critalline, o comunque ordinate, perchè come vedremo la simmetria è in
questo caso di grande aiuto per ottenere una descrizione in certi casi molto accurata della chimica e della fisica
di questi sistemi. E’ pertanto logico partire da qui.
26
CHAPTER 2. CLASSIFICAZIONE DEI MATERIALI
Chapter 3
I cristalli e la loro simmetria
Quando gli atomi sono legati uno all’altro, si trova che essi stanno ad una ben definita distanza di equilibrio,
che è determinata dalla condizione che l’energia totale sia ad un minimo. Pertanto, in un solido composto da un
gran numero di atomi uguali, l’energia minima può essere ottenuta solo se ogni atomo ha un intorno identico.
Ciò dà luogo ad una disposizione periodica tridimensionale che ha il nome di “stato cristallino”. La stessa cosa
è vera per i solidi che siano composti da più di un elemento: in questo caso, certi gruppi di atomi possono essere
considerati come le unità ripetitive della struttura cristallina.
L’esistenza della periodicità dà luogo ad un numero di proprietà tipiche dei cristalli, e lo sfruttamento della
simmetria risultante consente di semplificare il trattamento in maniera considerevole. Anche se un cristallo
reale non possiede mai una periodicità tridimensionale esatta, si assume una perfetta periodicità nel modello e
si trattano le deviazioni (difetti, dislocazioni, ecc.) come una perturbazione.
3.1
Reticolo, simmetria traslazionale e gruppi spaziali
La disposizione periodica tridimensionale degli atomi (o dei gruppi di atomi) può essere ottenuta in vari modi;
il numero di tali modi è però finito. Il concetto che ci permette di definire questi modi è quello di reticolo,
definito come una struttura infinita di punti in cui ogni punto ha un intorno identico a quello di tutti gli altri
punti. Un reticolo è una costruzione geometrica, ed è generato da un vettore di traslazione primitivo:
tn = n1 a1 + n2 a2 + n3 a3
(3.1)
dove n1 , n2 , n3 sono numeri interi e a1 , a2 , a3 sono tre vettori arbitrari indipendenti. Il numero infinito di
punti generati da questo vettore sono i punti reticolari. La figura 3.1 mostra un reticolo in due dimensioni e un
insieme di punti che non costituiscono un reticolo perché l’intorno angolare di ogni punto non è lo stesso. Da
notare anche che la simmetria di un punto reticolare è comunque Ci , cioè il centro di inversione.
Completando il parallelepipedo formato da a1 , a2 , a3 viene racchiuso un volume V = a1 · (a2 × a3 ) che,
traslato parallelamente a se stesso da tn , riempie tutto lo spazio. Questo volume viene chiamato cella unitaria
primitiva qualora contenga solo un punto reticolare. Notare che per esempio nel reticolo bidimensionale della
fig. 3.1, ogni punto reticolare è condiviso tra quattro celle, e quindi conta per 1/4, cosicché la cella contiene
in totale un punto reticolare. Una cella si dice non primitiva o semplicemente cella unitaria, se contiene più di
un punto reticolare. Ogni reticolo descritto da una cella non primitiva può essere descritto anche da una cella
primitiva. In questo caso però si perde qualche vantaggio, come per esempio vettori reticolari non ortogonali.
27
28
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
Figure 3.1: a) Un esempio di reticolo bidimensionale; b) Un esempio di una disposizone periodica di punti che
non formano un reticolo.
Questo è esemplificato nella fig.3.2 a sinistra, dove una cella unitaria primitiva, P, detta anche cella elementare,
è confrontata con celle unitarie non primitive, DP (due punti reticolari) e TP (tre punti reticolari).
In tre dimensioni ogni punto ai vertici della cella conta per 1/8. Una cella elementare disegnata in maniera
tale da non avere punti reticolari ai vertici, ma un punto reticolare al suo centro, è detta cella di Wigner-Seitz.
Le regole per generare una cella di Wigner-Seitz sono molto semplici ed illustrate nella parte destra di fig. 3.2 per
un reticolo bidimensionale: partendo da un punto reticolare si tracciano delle rette verso tutti i punti reticolari
primi vicini. Si tracciano poi delle normali a questi segmenti, passanti per il punto di mezzo dei segmenti
stessi. La più piccola aerea (volume in 3 dimensioni) delimitata in questa maniera è la cella di Wigner-Seitz.
Notiamo infine che in cristallografia si usa una simbologia e delle convenzioni diverse da quelle usate in fisica (o
chimica-fisica) dello stato solido. Cosı̀ gli assi della cella unitaria vengono indicati con le lettere a, b, c invece
che con a1 , a2 , a3 .
Se consideriamo tutte le possibilità per le lunghezze e gli angoli tra i vettori che individuano una cella
elementare, otteniamo i 7 sistemi cristallini riportati in Tabella 3.1. Se consideriamo adesso i vari tipi di celle
unitarie associabili a ciascun sistema cristallino, vediamo che i tipi di cella unitaria sono anch’essi finiti, ed in
numero di 14, i 14 reticoli di Bravais riportati in fig. 3.3.
Il reticolo descrive la simmetria traslazionale del cristallo, e tra poco la descriveremo in maniera formale.
La simmmetria di una cella unitaria può essere descritta in termini delle operazioni di simmetria puntuale già
Figure 3.2: Lato sinistro: Esempi di cella primitiva (P) e di celle non primitive (DP,TP) per un reticolo
bidimensionale. Lato destro: costruzione della cella di Wigner-Seitz
3.1. RETICOLO, SIMMETRIA TRASLAZIONALE E GRUPPI SPAZIALI
Sistema
Triclino
Monoclino I
Monoclino II
Ortorombico
Tetragonale
Romboedrico
o Trigonale
Esagonale
Cubico
Relazione tra assi ed angoli
a 6= b 6= c
α 6= β 6= γ
a 6= b 6= c
α = β = 90◦ 6= γ
a 6= b 6= c
α = γ = 90◦ 6= β
a 6= b 6= c
α = β = γ = 90◦
a = b 6= c
α = β = γ = 90◦
a=b=c
α = β = γ < 120◦
a = b 6= c
α = β = 90◦ , γ = 120◦
a = b 6= c
α = β = 90◦ , γ = 120◦
a=b=c
α=β=γ
29
Simmetria essenziale
Nessun asse o piano
Un asse binario
o un piano
3 assi binari perpendicolari
o due piani perpendicolari
Un asse di
ordine 4
Un asse di ordine 3
Un asse di ordine 6
4 assi di ordine 3
Table 3.1: I sette sistemi cristallini
utilizzate per descrivere la simmetria molecolare (E, Cn , Sn , i, σ, che descrivono i gruppi puntuali). Tuttavia,
dato che le traslazioni della cella unitaria lungo gli assi reticolari devono riempire tutto lo spazio, abbiamo
certe restrizioni sulle operazioni di simmetria permesse: gli assi di rotazione possono avere solo i valori 1, 2,
3, 4, e 6 (i quasi-cristalli visti nel Capitolo 2 hanno assi di ordine 5, ma difatti non sono descritti in termini
dei reticoli). Con questa limitazione, si vede che solo 32 gruppi possono essere formati dalle operazioni che
descrivono la simmetria della cella unitaria. Queste 32 gruppi costituiscono le classi cristalline. Se consideriamo
tutta una simmetria del cristallo, in termini della teoria dei gruppi spaziali, abbiamo un totale di 230 diversi
gruppi spaziali. Ma passiamo ora ad un trattamento più dettagliato.
Sappiamo dalla teoria dei gruppi puntuali che ogni operazione di simmetria puntuale R può essere rappresentata da una matrice quadrata R. Se il vettore r individua un punto nel sistema molecolare, l’effetto di R
può essere descritto da:
r0 = Rr,
(3.2)
dove


cos φ − sin φ 0
0 
R =  sin φ cos φ
0
0
±1
(3.3)
(Si ricorda che σ ≡ S1 , i ≡ S2 , ed i segno + e − si applicano alle rotazioni proprie e improprie, rispettivamente). L’equazione 3.2 può essere generalizzata ad un cristallo se includiamo la possibilità di traslazione t,
non necessariamente reticolare, ma finita:
r0 = Rr + t
(3.4)
30
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
Figure 3.3: I 14 reticoli di Bravais
Nella notazione dovuta a Seitz, quest’ultima equazione prende la forma:
r0 = {R|t} r
(3.5)
dove {R|t} indica l’operazione di simmetria composta dalla parte puntuale e dalla parte traslazionale. Possiamo
definire il prodotto di due operatizioni:
r00 = {R0 |t0 } r0 = {R0 |t0 }{R|t} r = {R0 R|R0 t + t0 }
(3.6)
dove si fa presente che R0 t è comunque una traslazione. Parimenti si può definire l’inverso delle operazioni {R|t},
che quindi formano un gruppo, il gruppo spaziale S. L’ insieme di tutte le traslazioni pure {E|t} formano un
sottogruppo invariante di S, nel senso che ogni operazione di similitudine su membri del sottogruppo li trasforma
in altri membri del sottogruppo:
{R|t}−1 {E|t0 }{R|t} = {R−1 | − R−1 t}{E|t0 }{R|t} = {E|R−1 t0 }
(3.7)
Se le operazioni di traslazione pura sono ristrette ad essere le traslazioni reticolari, {E|tn }, l’insieme di
operazioni {E|tn } forma il gruppo di traslazione T , un altro sottogruppo invariante ed abeliano (ogni operazione
è una classe per se stessa) del gruppo S. Se limitiamo l’attenzione alla simmetria della cella unitaria, possiamo
formare il cosiddetto gruppo fattore U , che è isomorfo con il gruppo di operazioni puntuali {R|0} che definiscono
3.2. GRUPPO FATTORE
31
le classi cristalline (vedremo tra un attimo il significato di isomorfo). Formalmente il gruppo spaziale è descritto
come prodotto semi-diretto tra il gruppo fattore U e e il gruppo di traslazione:
S =U ⊗T
3.2
(3.8)
Gruppo fattore
Quindi S sono i 230 gruppi spaziali, U le 32 classi cristalline, e T i 14 reticoli di Bravais. Il sottogruppo delle
traslazioni primitive {E|tn } caratterizza solo in parte la simmetria traslazionale del cristallo. Difatti i gruppi
spaziali corrispondenti ad un dato gruppo di punti ed ad un dato reticolo di Bravais sono ulteriormente distinti
in base alla forma della parte traslazionale delle operazioni {R|t} del gruppo. Quando R = E, le operazioni
{E|t} sono necessariamente traslazioni primitive {E|tn }. Però quando R 6= E, la parte traslazionale non è
necessariamente primitiva. Tutti gli operatori di simmetria del gruppo spaziale possono essere scritti nella
forma:
{R|t} = {R|τ (R) + tn } = {R|τ (R)}{E|tn }
(3.9)
Dove tn è una traslazione primitiva, e τ (R) è o zero, o una traslazione non primitiva contenuta nella cella unitaria.
Per 73 dei 230 gruppi spaziali, τ (R) = 0, e per ogni operazione R del gruppo puntuale c’è un’operazione del
gruppo spaziale {R|0}. In questi gruppi spaziali l’intero gruppo puntuale è un sottogruppo di S. Quando
τ (R) 6= 0, le operazioni {R|τ (R)} sono traslazioni non primitive seguite da rotazioni proprie o improprie.
Queste operazioni sono gli “slittopiani” e gli “assi elicogiri”, schematizzati in fig. 3.4
Figure 3.4: Esempi di assi elicogiri (a sinistra) e di slittopiani (a destra).
La cosa importante è che alle operazioni {R|τ (R)} possono essere assegnate le stesse rappresentazioni irriducibili delle operazioni {R|0}, cioè {R|τ (R)} e {R|0} sono isomorfe. Le operazioni {R|τ (R)}, con τ (R) = 0
oppure τ (R) 6= 0 costituiscono il gruppo fattore del gruppo spaziale. Le tabelle dei caratteri del gruppo fattore
sono comunque le tabelle di uno dei 32 gruppi puntuali corrispondenti alle classi cristalline. Le informazioni
sul gruppo spaziale cui appartiene un cristallo sono in genere fornite dalle indagini strutturali ai raggi X. Anche qui, la cristallografia e la chimica fisica dello stato solido usano una diversa notazione per etichettare i
gruppi spaziali: in cristallografia si usa la notazione di Hermann-Mauguin (Internazionale), ed in chimica fisica
dello stato solido quella di Schönflies. Quest’ultima ha il vantaggio di dare immediatamente il gruppo puntuale associato al gruppo fattore. I vari gruppi fattore isomorfi con un dato gruppo puntuale sono distinti da
un diverso esponente apposto al simbolo convenzionale che etichetta il gruppo puntuale. Alcuni esempi della
corrispondenza tra la notazione di Hermann-Mauguin e quella di Schönflies sono riportati in Tabella 3.2.
32
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
Sistema
Triclino
Monoclino
HM
P1
P1
P2
P 21
B2
Pm
Pb
P 2/b
S
C11
Ci1
C21
C22
C23
Cs1
Cs2
4
C2h
Sistema
Ortorombico
P 21 /c
C2/c
5
C2h
6
C2h
Cubico
Tetragonale
Trigonale
Esagonale
HM
P 222
C2221
Cmm2
P mma
P 43
I4
P 31m
P6
S
D21
D25
11
C2v
5
D2h
4
C4
C45
2
C3v
1
C3h
P m3
F 43c
Th1
Td5
Table 3.2: Esempi di gruppi spaziali in notazione Hermann-Mauguin e Schönflies
3.3
Rappresentazioni irriducibili del gruppo di traslazione
Ottenere le rappresentazioni irriducibili dei gruppi spaziali ed i corrispondenti caratteri non è un compito facile.
D’altra parte nella maggior parte dei casi è sufficiente conoscere le rappresentazioni e i caratteri del gruppo
fattore, che come abbiamo detto sono le stesse dei corrispondenti gruppi puntuali isomorfi, e le rappresentazioni
del gruppo di traslazione. Il gruppo di traslazione, come il gruppo spaziale, sarebbe un gruppo di dimensione
infinita. Possiamo però assumere delle condizioni cicliche per dire che le simmetria traslazionale è mantenuta
anche per un sistema finito, sia pure di grandi dimensioni rispetto alle dimensioni atomiche. Le condizioni al
contorno sono scritte come:
(ni + Ni )ai = ni ai ,
i = 1, 2, 3
(3.10)
dove N1 , N2 ed N3 sono il numero celle elementari in ogni direzione cristallografica, e N = N1 N2 N3 il numero
totale di celle unitarie nell’unità ciclica, quindi uguale all’ordine del gruppo di traslazione T .
In termini delle delle operazioni di simmetria del gruppo di traslazioni primitive, le condizioni cicliche si
scrivono come:
{E|a1 }N1 = {E|a2 }N2 = {E|a3 }N3 = {E|0}
(3.11)
Il gruppo di traslazione T è allora il prodotto diretto T1 ⊗ T2 ⊗ T3 , con T1 , T2 , T3 i sottogruppi formati dalle
operazioni {E|ai } e le corrispondenti potenze. Tutte le operazioni di T sono commutative, ed il gruppo è
abeliano. Quindi il numero delle classi ed il numero delle rappresentazioni irriducibili è uguale all’ordine del
gruppo: ogni rappresentazione è di ordine 1, e coincide con il carattere. Il carattere di {E|0} è ovviamente
1, e allora l’intero problema è risolto se assegnamo a ciascun elemento l’appropriata potenza di una delle
N1 N2 N3 = N radici dell’unità:
µ
¶
µ
¶
µ
¶
√
2πs
2πs
2πs
N
1 = cos
+ i sin
= exp i
(3.12)
N
N
N
con s = 1 ÷ N − 1. Quindi la tabella dei caratteri del gruppo T ha N righe e N colonne con:
(k)
χtn = exp i (k · tn )
(3.13)
3.4. RETICOLO RECIPROCO
33
dove k viene detto “vettore d’onda”, ed è un vettore dello spazio reciproco, dato da:
s1
s2
s3
k=
b1 +
b2 +
b3
N1
N2
N3
(3.14)
dove b1 , b2 e b3 sono i vettori che individuano quello che viene denominato “reticolo reciproco”. I vettori b1 ,
b2 e b3 sono definiti in maniera univoca dai vettori delle reticolo diretto, sulla base delle relazioni:
b1 =
2π (a2 × a3 )
;
|a1 · (a2 × a3 )|
b2 =
2π (a3 × a1 )
;
|a2 · (a3 × a1 )|
b3 =
2π (a1 × a2 )
,
|a3 · (a1 × a1 )|
(3.15)
in maniera tale che risulti:
bi · aj = 2π δij
(3.16)
Facciamo notare espicitamente che il vettore d’onda definito nella 3.14 è un vettore dello spazio reciproco,
e non un vettore del reticolo reciproco, quest’ultimo essendo dato da:
gh = h1 b1 + h2 b2 + h3 b3
(3.17)
con h1 , h2 , h3 tre interi, mentre si /Ni dell’eq. 3.14 sono in generale delle frazioni.
Prima di discutere in maniera approfondita il reticolo reciproco e la sua relazione con il reticolo diretto,
menzioniamo che in cristallografia si segue una diversa simbologia: come i vettori del reticolo diretto sono
indicati da a, b e c, quelli del reticolo reciproco sono indicati da a∗ , b∗ e c∗ .
3.4
Reticolo reciproco
Il reticolo reciproco che abbiamo introdotto in maniera abbastanza indiretta parlando delle rappresentazioni del
gruppo di traslazione primitiva, viene probabilmente capito meglio tramite la serie di Fourier (cf. Appendice
A.2). L’asserzione che in un cristallo esiste una simmetria traslazionale significa infatti che ogni funzione relativa
al moto di particelle entro il cristallo deve essere una funzione periodica, cioè:
ψ(r) = ψ(r + tn )
(3.18)
Se consideriamo inizialmente per semplicità una sola dimensione, l’equazione precedente diviene:
ψ(x) = ψ(x + tn ),
tn = na
(3.19)
Una funzione periodica può essere convenientemente espressa in serie di Fourier (consideriamo il caso esponenziale):
X
ψ(x) =
Am exp i(2πmx/a)
(3.20)
m
con m un intero. Possiamo scrivere anche:
ψ(x) =
X
Ag exp i(gx),
(3.21)
g
avendo definito con g un vettore del reticolo reciproco in una dimensione, g = m(2π/a), ovvero ga = 2πm.
Quindi i vettori del reticolo diretto e quelli del reticolo reciproco sono connessi tra loro tramite una serie di
Fourier, il cui coefficienti sono dati da:
Z
0
1 a
ψ(x0 )eigx dx0 ,
(3.22)
Ag =
a 0
34
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
ottenuti moltiplicando la serie per [exp(igx)]∗ e integrando sulla cella. Tutti termini della serie si annullano
tranne il g-esimo, dato che le funzioni esponenziali sono ortonormali tra di loro.
Il tutto è facilmente generalizzabile tre dimensioni:
X
Agh eigh ·r
(3.23)
ψ(r) =
gh
con gh · tn = 2πm, cosicché exp(igh · tn ) = 1 qualunque sia tn . In tale maniera l’equazione 3.18 risulta
soddisfatta:
ψ(r + tn ) =
X
gh
Agh eigh ·(r+tn ) =
X
Agh eigh ·r eigh ·tn =
gh
X
Agh eigh ·r = ψ(r).
(3.24)
gh
Se vogliamo che gh · tn = 2πm, possiamo definire gh come delle traslazioni primitive nello spazio reciproco
(le dimensione di gh devono essere quelle di uno spazio−1 se vogliamo che l’esponenziale sia adimensionale), e
cioè:
gh = h1 b1 + h2 b2 + h3 b3
(3.25)
con b1 , b2 , b3 i vettori del reticolo reciproco già definiti nella 3.15, cosicché risulta bi · aj . I coefficienti della
serie di Fourier in tre dimensioni sono:
Z
0
1
Agh =
ψ(r0 )eigh ·r dr0
(3.26)
Vcella cella
e sono ovviamente uguali per tutte le celle.
Quindi tramite la serie di Fourier ad ogni reticolo diretto è associato un reticolo reciproco, e viceversa. Il
reticolo reciproco è, come vedremo, fondamentale nella teoria dei solidi, ed alcune delle sue proprietà geometriche
possono essere dedotte facilmente.
1. Il volume di una cella unitaria del reticolo reciproco è inversamente proporzionale al volume di una cella
unitaria del reticolo diretto:
(2π)3
,
(3.27)
Vr =
Vd
dove il fattore 8π 3 deriva da come abbiamo definito i vettori del reticolo diretto e del reticolo reciproco.
2. Ciascun vettore del reticolo reciproco è normale ad un insieme di piani reticolari del reticolo diretto.
3. Se le componenti di gh , h1 , h2 ed h3 , non hanno fattori in comune, allora gh è inversamente proporzionale
alla distanza di piani reticolari normali a gh .
La proprietà 2 si deduce facilmente dalla relazione:
gh · tn = 2πm = |gh |(|tn | cos θ),
(3.28)
cioè la proiezione di tn nella direzione di gh ha la lunghezza d:
d=
2πm
|gh |
(3.29)
3.5. TEOREMA DI BLOCH
35
Figure 3.5: Illustrazione delle proprietà del reticolo reciproco (in 2 dimesioni)
Ma c’è un numero infinito di punti del reticolo diretto con questa proprietà. Supponiamo difatti che tl sia un
altro punto reticolare rappresentato dagli interi:
l1 = n1 − rh3 ;
l2 = n2 − rh3 ;
l3 = n1 + r(h1 + h2 ),
con r un intero. Allora:
gh · tl = h1 l1 + h2 l2 + h3 l3 = h1 (n1 − rh3 ) + h2 (n2 − rh3 ) + h3 [n1 + r(h1 + h2 )] = gh · tn = 2πm
e quindi tl e tn hanno la stessa proiezione su gh , e quindi saranno sullo stesso piano normale a gh a distanza d
dall’origine. Ma se c’è un punto reticolare su questo piano c’è un numero infinito di punti reticolari: abbiamo
dunque costruito un piano reticolare normale a gh (fig. 3.5, a sinistra).
La proprietà 3 segue direttamente dalla proprietà 2, come può essere visto nella parte a sinistra della fig.
3.5, tenendo presente che se h1 , h2 , h3 non hanno fattori in comune, possiamo sempre trovare un vettore tj con
componenti gh · tj = 2π(m + 1). Allora il piano reticolare contenente tj è a una distanza d0 = 2π(m + 1)/|gh |,
cioè è ad una distanza 2π/|gh | dal piano contenente tn .
Da questi due risultanti vediamo che una maniera semplice per caratterizzare i piani del reticolo diretto è
attraverso le loro normali, espresse come vettori delle reticolo reciproco. I piani più importanti del reticolo diretto
sono quelli che hanno il maggior numero di punti reticolari. Poiché la densità di punti reticolari è costante nello
spazio, i piani più importanti sono quelli più largamente separati cioè quelli con i vettori del reticolo reciproco
più piccoli (fig. 3.5, a destra). Etichettare piani reticolari con interi h1 , h2 , h3 , che specificano gh , corrisponde
ad usare i cosiddetti indici di Miller (h1 h2 h3 ) della cristallografia classica.
3.5
Teorema di Bloch
Torniamo adesso alla simmetria cristallina e in particolare alla simmetria traslazionale per dimostrare quello
che i fisici chiamano il teorema di Bloch. Il fatto che esiste una simmetria traslazionale significa che in un
cristallo tutte le celle sono equivalenti, cioé indistinguibili. Questo significa che l’operatore hamiltoniano che
36
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
descrive qualunque proprietà del cristallo deve essere invariante rispetto a qualunque operazione del gruppo di
traslazioni primitive. Allora se |ψj i è un’autofunzione dell’hamiltoniano, risulterà:
{E|tn } (H|ψj i) = {E|tn }Ej |ψj i,
(3.30)
e quindi vista la commutazione [H, {E|tn }] = 0, abbiamo:
H{E|tn }|ψj i = Ej {E|tn }|ψj i
(3.31)
Quindi le funzioni ottenute operando con l’operatore {E|tn } sono ancora autofunzioni dell’ hamiltoniano con
lo stesso autovalore. In altre parole, esiste un set di funzioni che sono autofunzioni sia dell’ hamiltoniano che
dell’operatore del gruppo di traslazione. Notiamo che essendo il gruppo di traslazione Abeliano, cioè con tutte le
operazioni che commutano tra di loro, le sue rappresentazioni irriducibili sono tutte monodimensionali, e quindi
le autofunzioni di {E|tn } sono tutte nondegeneri. Gli autovalori dell’operatore {E|tn } sono facilmente ottenibili,
anzi li conosciamo già. Difatti per una funzione appartenente alla rappresentazione irriducibile k-appesima:
{E|tn }|ψk (r)i = |ψk (r + tn )i
(3.32)
Se applichiamo {E|tn } N volte (condizioni cicliche), deve essere:
{E|tn }N |ψk (r)i = |ψk (r)i
(3.33)
e quindi se si estrae la radice N -esima dell’unità:
{E|tn }|ψk (r)i = eik·tn |ψk (r)i
(3.34)
Gli autovalori degli operatori di traslazione sono dunque i caratteri delle rappresentazioni irriducibili. Per
ciò che riguarda l’ hamiltoniano dobbiamo distinguere il caso in cui le autofunzioni non sono degeneri o sono
degeneri. Se non sono degeneri queste sono evidentemente, per quanto mostrato sopra, le stesse autofunzioni
dell’operazione del gruppo di traslazione. Se sono degeneri, possiamo sempre fare delle combinazioni lineari tali
che ciascuna di queste sia autofunzione di {E|tn } con un diverso valore di k. Allora possiamo enunciare il
Teorema di Bloch - Le soluzioni non degeneri dell’equazione di Schrödinger relative ad un cristallo (potenziale
periodico), ovvero delle opportune combinazioni lineari delle soluzioni degeneri, sono anche autofunzioni |ψk (r)i
dell’operatore del gruppo di traslazioni primitive {E|tn }, con autovalori exp(ik · tn ).
Quindi dal nostro punto di vista il teorema di Bloch non è niente di nuovo ma solo un’altra applicazione della
teoria dei gruppi. Possiamo usare il vettore d’onda k per etichettare le autofunzioni e le energie dell’hamiltoniano,
per esempio scrivendo E(k), e, se le energie corrispondenti ad uno stesso k sono degeneri, Ej (k) = Ei (k).
Dal teorema di Bloch espresso dall’eq. 3.34 segue anche che, essendo {E|tn }|ψk (r)i = |ψk (r + tn )i:
|ψk (r + tn )i = eik·tn |ψk (r)i
(3.35)
E questa è una seconda forma del teorema di Bloch: l’autofunzione in due punti separati da una distanza
reticolare differisce solo per il fattore di fase exp(ik · tn ).
Supponiamo ora di non conoscere le soluzioni dell’equazione di Schrödinger. E’ facile dimostrare quanto
segue. Scriviamo la funzione d’onda come:
|ψk (r)i = eik·r uk (r)
(3.36)
3.5. TEOREMA DI BLOCH
37
dove per esempio uk (r) può essere una funzione che vogliamo poi ottimizzare tramite il metodo variazionale.
Sostituendo nell’equazione 3.35 abbiamo:
eik·(r+tn ) uk (r + tn ) = eik·(tn +r) uk (r),
e quindi:
uk (r + tn ) = uk (r)
(3.37)
Quindi la nostra funzione di prova deve essere periodica con la periodicità del reticolo. Quindi se vogliamo
trovare le autofunzioni relative ad una particella, per es. un elettrone, all’interno del cristallo, basterà scegliere
come funzione di prova una funzione periodica con periodicità del reticolo, per es. un orbitale centrato attorno
a ciascun punto reticolare, e poi moltiplicarla per exp(ik · r). Questo non è altro che la costruzione delle funzioni
adattate per simmetria (SALC), secondo il metodo già incontrato nella soluzione dell’ eq. di Schrödinger relativa
ad una molecola.
Quanto sopra riguarda le soluzioni dell’equazione di Schrödinger indipendente dal tempo. Sappiamo peraltro
che le soluzioni complete, includenti anche la parte temporale, per un sistema stazionario si scrivono come:
i
Ma E = ~ω, e quindi:
|Φk (r, t)i = |ψk (r)ie− ~ Et
(3.38)
|Φk (r, t)i = uk (r)eik·r e−iωt = uk (r)ei(k·r−ωt)
(3.39)
e questa è l’equazione di un’onda come descritto nell’Appendice A.1. Il vettore k che contraddistingue la
rappresentazione irriducibile del gruppo di traslazione s’identifica dunque con il vettore d’onda, e la natura
ondulatoria delle soluzioni dell’hamiltoniano del cristallo è una conseguenza diretta della simmetria traslazionale.
38
CHAPTER 3. I CRISTALLI E LA LORO SIMMETRIA
Chapter 4
Simmetria e transizione di fase
In questo capitolo vediamo come la simmetria puo aiutarci anche nella comprensione di fenomeni complessi
quali le transizioni di fase. Una previsione che si può fare facilmente sulla base della simmetria è che essendo
l’hamiltoniano del sistema in esame invariante rispetto alle operazioni di simmetria del gruppo cui appartiene,
anche tutti i risultati di misure compiute su questo sistema debbono godere della stessa proprietà. Ne segue che
per il sistema in oggetto si possono avere valori d’attesa non nulli soltanto per le osservabili che trasformano
secondo la rappresentazione totalsimmetrica del gruppo di simmetria del sistema stesso. E’ allora facile prevedere
per esempio l’assenza di momento di dipolo permanente in sistemi centrosimmetrici.
In realtà esistono dei sistemi in cui mentre l’hamiltoniano è invariante rispetto tutte le operazione del
gruppo, esiste almeno un’osservabile che, pur trasformando secondo una rappresentazione irriducibile non totalsimmetrica, ha un valore di attesa non nullo. Questi sistemi (detti a simmetria rotta, o broken symmetry)
sono caratterizzati da un hamiltoniano il cui stato più basso in energia ha una simmetria inferiore a quella
dell’hamiltoniano stesso. Più precisamente, in questi sistemi esiste una grandezza Q, non totalsimmetrica, che
in assenza di rottura di simmetria ha valore medio nullo, mentre in caso di rottura di simmetria assume un
valore medio diverso da zero. La simmetria dell’hamiltoniano è in realtà riflessa dal fatto che in generale esistono
diversi stati fondamentali degeneri con diversi valori di hQi i quali nel loro insieme conservano la simmetria del
sistema. L’energia potenziale di questi sistemi a simmetria rotta è descritta da una curva con due o più minimi
come mostrato in fig. 4.1 Esempio classico di un sistema a simmetria rotta è quello in cui Q è una coordinata
vibrazionale e lo stato elettronico è uno stato degenere. In questo caso come è noto si può avere la distorsione
di Jahn-Teller. Ciò premesso, vediamo come questi concetti e la simmetria in generale ci aiutino a inquadrare
in termini generali le transizioni di fase che possono avvenire in un solido cristallino.
Le transizioni di fase sono fenomeni repentini (catastrofi in senso fisico) durante i quali, al variare delle
condizioni esterne, una fase si trasforma in una nuova fase che differisce qualitativamente e/o quantitativamente
dalla precedente. Se si osserva una transizione di fase dev’esserci almeno un’osservabile, che indichiamo con η,
che si modifichi nel passaggio fra le due fasi. Tale grandezza è detta parametro d’ordine. Nel caso in cui la
differenza tra le fasi sia puramente quantitativa, nel senso che non implichi un cambio di simmetria, per poter
osservare una transizione di fase occorre che η cambi con discontinuità da un valore ad un altro. Esempio molto
familiare di questo tipo di transizione è la transizione gas-liquido, dove il parametro d’ordine è rappresentato
dalla densità. A conferma della richiesta di una variazione discontinua del parametro d’ordine per poter avere
una transizione di fase nel caso non ci sia rottura di simmetria, ricordo come la curva della transizione di fase
gas-liquido termini alle alte temperature e pressioni in un punto critico (Tc , pc ), al di là del quale non è più
39
40
CHAPTER 4. SIMMETRIA E TRANSIZIONE DI FASE
Figure 4.1: Potentiali a più minimi caratterizzanti i sistemi a broken symmetry.
possibile distinguere due fasi, dal momento che non si osserva più alcuna discontinuità nella densità.
Venendo al caso di fasi qualitativamente diverse, esse devono necessariamente differenziarsi per simmetria. Il
parametro d’ordine deve allora essere in grado di abbassare, cioè rompere, la simmetria della fase più simmetrica,
ovverosia deve trasformare come una rappresentazione irriducibile non totalsimmetrica del gruppo di simmetria
di quella fase. Ne segue che η deve annullarsi nella fase simmetrica, mentre assume valori diversi da zero nella
fase a bassa simmetria. In questo caso una transizione di fase può ancora avvenire in maniera discontinua con
una variazione finita di η, ma può anche essere continua perché le due fasi sono comunque distinguibili. La
differenza qualitativa tra le due fasi, la loro distinguibilità, chiaramente esclude la possibilità di avere un punto
critico per le transizioni con rottura di simmetria.
Come è noto, le transizioni di fase discontinue vengono dette transizioni di primo ordine, e ad esse è associata
una discontinuità nelle derivate prime dell’energia libera di Gibbs rispetto alle variabili termodinamiche temperatura e pressione, cioè entropia e volume. Le transizioni di fase continue, alle quali è associata una discontinuità
nelle derivate seconde dell’energia di Gibbs (calore specifico e compressibilità), sono dette del secondo ordine.
Risulta allora che solo le transizioni con rottura di simmetria possono essere del secondo ordine. La fig. 4.2
illustra la diversa variazione del parametro d’ordine per transizioni di primo e secondo ordine.
Un trattamento teorico dettagliato delle transizioni di fase di primo ordine è in genere assai difficile, proprio
a causa della loro discontinuità. Invece la teoria della transizioni di fase del secondo ordine è stata sviluppata
negli anni 30 da Landau ed nota appunto come teoria di Landau. Per motivi di concretezza consideriamo una
transizione di fase che avvenga in un cristallo mantenendo costante la pressione e facendo variare la temperatura.
Allora la condizione di equilibrio termodinamico è data dalla funzione energia libera di Gibbs G. Supponiamo
inoltre che la transizione di fase del secondo ordine implichi il cambio di gruppo di simmetria cristallino da
1
(P 2/m) a C2 (P 2) all’ abbassarsi della temperatura. Questo cambiamento di simmetria può essere dovuto
C2h
41
Figure 4.2: Variazione del parametro d’ordine in funzione della temperatura. (a) Transizione del primo ordine;
(b) Transizione del secondo ordine; (c) Transizione del primo ordine vicina al secondo ordine.
ad una distorsione (variazione nella posizione di equilibrio) di alcuni atomi nel cristallo. Il parametro d’ordine
può allora essere preso come lo spostamento di atomi dalla posizione di equilibrio nella fase ad alta temperatura
alla posizione di equilibrio nella fase a bassa temperatura. Questo tipo di transizioni si chiamano transizioni
displacitive, distinte dalle transizioni disordine-ordine in cui la fase ad alta simmetria è data dalla sovrapposizione
disordinata di due strutture ugualmente distorte in senso opposto.
La funzione energia libera di Gibbs è considerata funzione della temperatura e del parametro d’ordine. Il
verificarsi della transizione di fase può essere descritto come segue: la funzione G(η) ha un minimo a η = 0
nella fase simmetrica ad alta temperatura, e ad η 6= 0 nella fase non simmetrica. In quest’ultimo caso, per
quanto detto all’inizio, la G(η) deve esibire due o più minimi. Deve essere sottolineato che la funzione G(η)
è determinata non solo per la fase non simmetrica ma anche per quella simmetrica. Questo impone delle
limitazioni importanti sulla forma della dipendenza di G da η. L’energia libera di Gibbs difatti è una quantità
scalare che caratterizza le proprietà fisiche del cristallo, e quindi dev’essere invariante rispetto ad ogni operazione
di simmetria della fase simmetrica:
G(η) = G(η ‡ )
(4.1)
dove η ‡ è il parametro d’ordine trasformato dall’operazione di simmetria.
In vicinanza della transizione di fase di secondo ordine ci possiamo limitare ad analizzare piccole distorsioni
del reticolo, ovverosia piccole variazioni del parametro d’ordine. E’ pertanto naturale considerare l’espansione
del potenziale termodinamico in serie di Taylor sul parametro d’ordine:
µ
G(p, T, η) =
=
G0 +
G0 +
∂G
∂η
¶
µ
η+
η=0
∂2G
∂η 2
¶
µ
η2 +
η=0
A(p, T ) η
2
∂3G
∂η 3
¶
µ
η3 +
η=0
+ C(p, T ) η
3
∂4G
∂η 4
¶
η 4 + ..
η=0
4
+ B(p, T ) η + ...
(4.2)
42
CHAPTER 4. SIMMETRIA E TRANSIZIONE DI FASE
Questa equazione deve evidentemente soddisfare la condizione 4.1. G(η) dipende dalla pressione e dalla
temperatura come parametri. Quindi anche i vari termini della serie dipenderanno dalla p e T . Nell’esempio che
abbiamo fatto sopra, all’abbassarsi della simmetria vengono persi il centro d’inversione e il piano di simmetria.
Ciò è associato al fatto che a causa della distorsione del reticolo questi elementi fanno cambiare il segno di η
nella fase a bassa temperatura, e quindi non entrano nel gruppo di simmetria della fase stessa. Quindi le leggi
di trasformazione del parametro d’ordine sono:
C2h
Au
E
η
C2
η
i
-η
σ
-η
Questo vuol dire che il termine del primo ordine nell’espansione deve essere uguale a zero, altrimenti il valore
dell’energia di Gibbs cambierebbe segno sotto le operazioni i e σ, il che contraddice la condizione 4.1. Quindi il
primo termine diverso da zero e dipendente da η nel potenziale termodinamico è il termine quadratico in η, del
tipo A(T )η 2 dove A(T ) è una certa funzione della temperatura (a pressione costante: d’ora in poi ometteremo
il parametro p). La condizione di minimo per G nel punto η = 0 impone in tale fase A > 0, mentre nella fase a
bassa simmetria il punto η = 0 deve essere un punto di massimo, cosicché A < 0. Allora alla transizione A = 0.
Se vogliamo che la funzione G(η) abbia un minimo finito a η = 0, occorre considerare anche gli altri termini
nell’espansione in serie. Sempre per ragioni di simmetria il termine al terzo ordine non può esistere (C = 0)
perché cambia di segno con il centro di inversione e con il piano di simmetria. Il termine successivo è quindi
il quartico, con B > 0 se vogliamo che la fase ad alta T sia stabile. Possiamo allora affermare che condizione
necessaria ma non sufficiente, perché una transizione di fase, descritta da un parametro d’ordine che trasformi
secondo la rappresentazione irriducibile Γ del gruppo che descrive la fase simmetrica, sia del secondo ordine, è
che Γ3 non contenga la rappresentazione totalsimmetrica del gruppo. Questa condizione è nota sotto il nome di
condizione di Landau. In definitiva il potenziale termodinamico assume la forma seguente:
G(T ) = G0 (T ) + A(T )η 2 + B(T )η 4 + ....
(4.3)
Dal momento che A(T ) varia con continuità e cambia segno attorno alla temperatura critica Tc della transizione di fase, è possibile espanderla in serie attorno a tale punto. La stessa cosa possiamo fare per B:
A(T ) =
B(T ) =
A(Tc ) + A0 (T − Tc ) + (1/2)A00 (T − Tc )2 + ...
B(Tc ) + B 0 (T − Tc ) + (1/2)B 00 (T − Tc )2 + ...
(4.4)
Tenendo conto che A(Tc ) = 0 e B(Tc ) > 0, e mantenendo i primi due termini nell’espansione abbiamo (trascurando i termini di ordine superiore):
G(T, η) = G0 (T ) + (1/2)α(T − Tc )η 2 + (1/4)βη 4 + ...
(4.5)
dove α = 2A0 e β = 4B(Tc ). Adesso possiamo imporre le condizioni di equilibrio su G, cioè (∂G/∂η) = 0 e
(∂ 2 G/∂η 2 ) > 0. Evidentemente, ηeq = 0 per T > Tc , mentre
s
ηeq = −
α(T − Tc )
β
per T < Tc . Allora la funzione termodinamica di equilibrio vale:
43
Figure 4.3: Evoluzione dell’energia libera di Gibbs per una transizone del secondo ordine, con C = 0.
(
G(T ) =
G0 (T )
G0 (T ) −
perT > Tc
[α(T −Tc )]2
4β
perT < Tc
(4.6)
L’andamento di η in funzione della temperatura è riportato in fig. 4.2 (b), mentre la corrispondente evoluzione
di G(T ) è mostrata in fig. 4.3 Da tale figura si ricava immediatamente come per una transizione del secondo
ordine non può presentarsi il fenomeno dell’isteresi. Dato l’andamento di G in funzione di T si possono poi
ricavare l’entropia e la capacità termica, S = −(∂G/∂T ), cp = T (∂S/∂T ), e si ricava immediatamente che S è
continua intorno a Tc , mentre la capacità termica presenta una discontinuità.
Se nell’espansione dell’energia libera compare anche il termine cubico in η, allora le curve nell’intorno di Tc
assumono la forma riportata in fig. 4.4 E’ chiaro che in questo caso η varia con discontinuità nell’intorno di Tc
(la transizione è di primo ordine) ed inoltre si può avere il fenomeno dell’isteresi.
Come detto sopra, la condizione C = 0 è una condizione necessaria, ma non sufficiente affinchè la transizione
sia di secondo ordine. Difatti, se C = 0, certamente la transizione non è di secondo ordine, come appena visto,
mentre se C = 0 possiamo pur sempre avere la situazione rappresentata in figura, in cui B = 0, ed è allora
necessario fare l’espansione fino alla sesta potenza in η. L’evoluzione di G è riportata in fig. 4.5 La transizione è
di primo ordine, seppure viene detta “vicino ad una secondo ordine”, vista la variazione del parametro d’ordine
riportata in fig 4.2(c). A pressioni diverse, la transizione di primo ordine prossima alla secondo ordine può
diventare propriamente di secondo ordine.
44
CHAPTER 4. SIMMETRIA E TRANSIZIONE DI FASE
Figure 4.4: Evoluzione dell’energia libera per una transizione del primo ordine, in cui C 6= 0.
Figure 4.5: Evoluzione dell’energia libera per una transizione del primo ordine “vicino ad un secondo ordine”,
in cui C = 0, B = 0.
Chapter 5
Vibrazioni nei cristalli. Fononi
Nella Appendice A.1 sono riassunti gli elementi basilari della descrizione matematica di un’onda. Sappiamo
anche che, da un punto di vista fisico, un’onda rappresenta la propagazione di un “disturbo” (variazione di
pressione, intensità, i campi elettrici ecc.) rispetto ad una situazione di equilibrio. Nella propagazione del
disturbo dunque non si propaga la materia, ma l’energia e il momento.
Un’onda che si propaga in un mezzo materiale si dice elastica se si propaga ad una velocità c che dipende
solo dalle proprietà del materiale stesso. Se invece la velocità dipende dalla lunghezza d’onda λ, ovverosia
dalla frequenza, si dice che c’è dispersione nella propagazione. Per esempio, se un’onda costituita da diversi
modi armonici di diversa λ viene a trovarsi in un mezzo dispersivo, l’onda viene distorta, perché ciascuna delle
componenti si propaga con velocità diversa. Esempio tipico di onda elastica sono le onde sonore: per questo
spesso si usa (abbastanza impropriamente) il termine onda acustica come sinonimo di onda elastica. Un’onda
sonora non è che il propagarsi di una compressione (variazione della distanza tra gli atomi) attraverso il mezzo.
In un fluido possono esistere solo onde sonore longitudinali, mentre in un solido possono propagarsi anche onde
trasversali.
Se trattiamo il propagarsi di un’onda sonora in un solido isotropo da un punto di vista macroscopico,
troviamo che le velocità è data da:
p
c = Y /%,
(5.1)
dove % è la densità del solido, e Y una costante propria del solido, detta modulo di Young o costante di
elasticità. Il modulo di Young può essere misurato indipendentemente da c, sottoponendo il solido stesso ad
una certa pressione F/A e misurandone la deformazione. Misure indipendenti di Y e c dimostrano che la
relazione 5.1 è soddisfatta con c costante, fintantoché λ è grande rispetto alle distanze interatomiche. Se λ è
confrontabile alla distanza, la velocità non è più costante ma tende diminuire: il modello macroscopico, che
considera solo spostamenti macroscopici, viene ovviamente a cadere quando lo spostamento comprende solo
pochi atomi alla volta. Dovremo allora tener conto della natura corpuscolare della materia, e dato che un’onda
sonora implica la variazione della distanza interatomica (il disturbo) rispetto alla posizione di equilibrio. Il
problema che dobbiamo affrontare è allora quello delle vibrazioni nei cristalli. Nel limite di grandi lunghezza
d’onda dovremmo ovviamente ritrovare il risultato macroscopico.
Come nel caso delle vibrazioni nelle molecole, affrontiamo prima il problema da un punto di vista classico,
passando poi alla soluzione quanto-meccanica. Adottando l’approssimazione armonica, si tratta anzitutto di
trovare le coordinate normali, secondo cui il moto vibrazionale è separato in tanti moti oscillatori indipendenti.
Come nel caso delle molecole il sistema di coordinate di partenza è un sistema di coordinate con l’origine nel
45
46
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
baricentro del cristallo stesso, e che ruota e trasla con il cristallo. Quindi per un cristallo costituito da N nuclei
i gradi di libertà vibrazionali sarebbero 3N − 6. Abbiamo però visto nel Cap. 3 che per sfruttare le proprietà di
simmetria traslazionale, è conveniente usare le condizioni cicliche di periodicità. Ciò corrisponde a trattare non
intero cristallo finito, ma un frammento all’interno del cristallo stesso (con N comunque molto grande, circa
1023 atomi), cosı̀ da ignorare le superfici del cristallo. Allora le traslazioni e rotazioni del frammento cristallino
avvengono all’interno del cristallo stesso, e quindi sono anch’esse gradi di libertà vibrazionali. Pertanto se
consideriamo un cristallo costituito da N atomi, i gradi di libertà vibrazionali sono 3N .
5.1
Catena monoatomica
Per cominciare, consideriamo un sistema estremamente semplificato, e cioè una catena lineare di atomi uguali,
separati dalla distanza a nella posizione di equilibrio:
Abbiamo dunque un reticolo monodimensionale, con un atomo per cella elementare. Sia un lo spostamento
dell’ennesimo atomo dalla posizione di equilibrio, spostamento che considereremo possibile solo lungo la catena
(onda longitudinale). Abbiamo dunque N gradi di libertà vibrazionali. Supponiamo inoltre che ci siano forze
elastiche solo fra atomi adiacenti. Dato che gli atomi sono tutti uguali, le costanti di forza F sono tutte uguali
tra loro. Allora la forza esercitata sull’atomo n-esimo dall’atomo (n-1)-esimo è: φn = F (un − un−1 ), e quella
esercitata dall’atomo (n+1)-esimo: φn+1 = F (un+1 − un ). La forza risultante φn+1 − φn è uguale al prodotto
della massa per l’accelerazione ün dell’atomo n-esimo:
mün = F (un+1 − 2un + un−1 ),
(5.2)
e abbiamo tante espressioni di questo tipo, quanti sono gli atomi nella catena. Per risolvere queste N equazioni
del moto, usiamo una soluzione nella forma data dal teorema di Bloch, cioè:
un = A exp i(q · tn − ωt),
(5.3)
dove abbiamo usato la lettera q per etichettare il vettore d’onda, e dove tn = na è il vettore che individua la
posizione di equilibrio dell’n-simo atomo. Difatti, possiamo avere ampiezza di oscillazione solo nella posizione
occupata da un atomo, quindi invece di r usiamo tn . Sostituendo nell’equazione del moto otteniamo:
−ω 2 m exp i(qna − ωt) = F {exp i[q(n + 1)a − ωt] − 2 exp i(qna − ωt) + exp i[q(n − 1)a − ωt]}
(5.4)
cioè
−ω 2 m = F {exp(iq · a) − 2 + exp(−iq · a)} = 2F (cos q · a − 1).
La soluzione è dunque:
ω2 = 4
³q · a´
F
sin2
m
2
(5.5)
(5.6)
5.1. CATENA MONOATOMICA
47
ovvero
r
ω=2
F ¯¯ ³ q · a ´¯¯
¯sin
¯
m
2
(5.7)
p
C’ è dunque una frequenza massima, ω = 2 F/m, per le onde vibrazionali che si propagano lungo la
catena. Per frequenze superiori a questo valore q deve essere immaginario: abbiamo allora un moto che decade
esponenzialmente, e non si propaga. Quindi solo onde inferiori ad una certa frequenza (superiori ad una certa
lunghezza d’onda) possono propagarsi. Notiamo che n non compare nella soluzione, cioè le equazioni del moto
portano alla stessa relazione tra ω e q, il che prova che la nostra soluzione è effettivamente la soluzione delle
equazioni del moto.
Anche se abbiamo detto che la catena ha N atomi, non abbiamo finora visto come questo influenzi le
soluzioni che abbiamo trovato, che però godono della simmetria traslazionale, avendo imposto la forma di
Bloch. Ci sono due modi di stabilire le condizioni al contorno. Il primo è di considerare la catena lunga
quanto il cristallo unidimensionale. In questo modo però perdiamo la simmetria traslazionale. Allora le onde
vengono riflesse indietro dagli atomi terminali, che sono logicamente assunti come non liberi di muoversi. Le
onde assumono dunque il carattere di onde stazionarie. L’altra condizione è quella di Born-von Karman, che ci
riporta a considerare il cristallo come infinito. Si immagina infatti che la catena di N a atomi faccia parte di
un reticolo infinito: gli atomi terminali non sono più immobili, e le onde sono onde viaggianti che si propagano
indefinatamente nel mezzo. Noi imponiamo che ci sia una periodicità a lungo raggio nelle oscillazioni, cioè un =
u(n+N ) . Quindi imponiamo che il movimento ondulatorio si riproduca periodicamente, con periodo N a, cioè
dopo N celle elementari. Questa condizione ciclica può essere facilmente visualizzata nel caso unidimensionale,
immaginando la nostra catena di N atomi come disposta a formare un cerchio, cosicché l’N -esimo atomo coincide
con il primo. Tale visualizzazione viene a cadere se abbiamo più di una dimensione, ma matematicamente la
condizione può essere sempre imposta.
Utilizzando la condizione ciclica di Born-von Karman alle nostre soluzioni dobbiamo avere
exp i(nq · a) = exp i[(n + N )q · a],
(5.8)
da cui exp i(N q · a) = 1, cioè N q · a = 2πs, con s un intero. Quindi:
|q| =
2πs
,
Na
ovvero
q=
s
b
N
(5.9)
dove b è un vettore tale che b · a = 2 π, cioè è il vettore unitario di reticolo reciproco del nostro reticolo lineare.
D’altra parte se adesso consideriamo la nostra soluzione 5.7, vediamo che essa è una funzione periodica del
vettore d’onda, ovvero otteniamo la stessa soluzione se a |q| sostituiamo |q| + 2πl/|a|, con l un intero. Pertanto
otteniamo tutte le possibili soluzioni per ω se, con l = 1, limitiamo i valori di q a:
−
ovvero:
π
π
<q≤ ,
a
a
(5.10)
b
b
<q≤ ,
(5.11)
2
2
cioè se limitiamo il vettore d’onda a essere interno alla cella primitiva (scelta del tipo Wigner-Seitz) del reticolo
reciproco: si dice che il vettore q deve essere contenuto nella “prima zona di Brillouin”. Risulta allora che
−N/2 < s ≤ N/2, cioè abbiamo in tutto N diversi possibili valori di s, ovverosia N diversi valori di q. Il vettore
−
48
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
d’onda non può dunque avere valore qualsiasi, ma deve essere un vettore compreso nella prima zona di Brillouin,
e avere i valori dati da q = (s/N )b. In tutto abbiamo dunque N possibili soluzioni delle nostre equazioni del
moto, ciascuna delle quali ha una precisa frequenza di vibrazione ω. Le soluzioni sono i modi normali, e sono
N , quanti sono i gradi di libertà vibrazionale del nostro cristallo monodimensionale.
Figure 5.1: Curva di dispersione per una catena monoatonica. A destra sono raffigurati gli autovettori per
q = 0, q = π/a, e ad un valore intermedio. Per chiarezza di rappresentazione gli spostamenti sono mostrati
come spostamenti trasversali invece che longitudinali.
La soluzione 5.7 delle equazioni del moto, detta curva di dispersione, è riportata in fig. 5.1. Analizziamo più
in dettaglio le soluzioni trovate nel limite q · a ¿ 1, cioè per λ À a. In questo limite sin(q · a/2) ' q · a/2, e la
relazione di dispersione si riduce a:
r
F
ω=
q · a,
(5.12)
m
p
e la velocità ω/q risulta costante, c = a F/m. Pertanto per grandi lunghezza d’onda rispetto alla distanza
interatomica non c’è dispersione, cioè la velocità di propagazione non dipende da λ. I corrispondenti spostamenti
degli atomi sono rappresentati nella parte destra di fig. 5.1 (per chiarezza di rappresentazione gli spostamenti
sono mostrati come spostamenti trasversali). Come si vede tutti gli atomi si spostano con la stessa fase: il moto
corrisponde ad una oscillazione di tipo traslatorio. Quindi a grandi lunghezza d’onda ritroviamo il risultato
macroscopico.
Per lunghezza d’onda più corte, cioè per q maggiori, l’equazione 5.7 ci fornisce la dispersione:
dω
=a
c=
dq
r
³q · a´
F
cos
m
2
(5.13)
5.1. CATENA MONOATOMICA
49
Quando q = π/a, cioè al limite della prima zona di Brillouin, c = 0, e abbiamo un’onda stazionaria. I
corrispondenti spostamenti degli atomi sono riportati in fig. 5.1: gli atomi alternanti oscillano in antifase, ed i
nodi sono in posizione fissa.
Figure 5.2: In alto: curva di dispersione di una catena monotaomica nello schema a zona ripetuta; in basso:
spostamenti atomici per q = 8π/7a (linea continua, seconda zona di Brillouin) e q = 6π/7a (linea tratteggiata,
prima zona di Brilluoin).
Torniamo un momento sul significato che ha il limitare i valori di q al campo compreso nella prima zona di
Brillouin. In figura 5.2 è riportata la funzione ω(q) per q oltre alla prima zona di Brillouin. Consideriamo
uno spostamento istantaneo degli atomi per un q un po’ più grande di q = π/a, il limite della prima zona di
Brillouin. Per esempio, consideriamo q = 8π/7a, corrispondente al punto A in figura 5.2. La corrispondente
oscillazione degli atomi è mostrata nella parte in basso della figura. D’altra parte questo stesso insieme di
spostamenti degli atomi può essere rappresentato ugualmente bene da una curva con una lunghezza d’onda più
grande (curva tratteggiata), per la quale q = 6π/7a, che corrisponde ai punti B oppure C in figura 5.2. Allora
i punti A, B, e C rappresentano gli stessi spostamenti atomici istantanei, e la stessa frequenza di vibrazione.
Nel punto B, dω/dq = c > 0, cosicché l’ onda viaggia verso destra. A e C invece rappresentano entrambi
un’onda che viaggia verso sinistra, e sono allora completamente equivalenti. Pertanto concludiamo dicendo che
aggiungere un qualunque multiplo di 2π/a a q non altera gli spostamenti atomici che stiamo descrivendo, né la
velocità dell’ onda, e quindi non è una soluzione addizionale. Pertanto è sufficiente considerare il solo campo
−π/a < q ≤ π/a, che contiene N modi di vibrazione.
50
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
5.2
Catena biatomica
Consideriamo adesso una catena lineare costituita da due tipi diversi di atomi di massa m ed M , e diverse
distanze di legame. La cella primitiva, di dimensione a, contiene quindi due atomi, e chiamiamo F e f le
costante di forza del legame m − M e del legame M − m, rispettivamente. Se abbiamo a che fare con un
cristallo di tipo ionico, come NaCl in una dimensione, le distanze (e quindi le costanti di forza) saranno uguali;
se abbiamo un polimero come il poliacetilene, le masse saranno uguali e le costanti di forza diverse; infine in un
cristallo di tipo molecolare, tipo IBr, sia le masse che le costanti di forza saranno diverse. Seguendo lo stesso
procedimento che abbiamo usato per la catena monoatomica possiamo scrivere le equazioni del moto, che questa
volta saranno le due tipi diversi (gli atomi di massa m occupino le posizioni pari, quelli di massa M le posizione
dispari):
mü2n = −f (u2n − u2n−1 ) + F (u2n+1 − u2n )
M ü2n+1 = −F (u2n+1 − u2n ) + f (u2n+2 − u2n+1 )
(5.14)
(5.15)
Cerchiamo soluzioni della forma:
u2n = A2n exp i(2nq · a − ωt)
u2n+1 = A2n+1 exp i[(2n + 1)q · a − ωt]
(5.16)
(5.17)
La sostituzione di queste equazioni in quelle originarie porta alla seguente coppia di equazioni lineari ed omogenee
nelle ampiezze incognite A2n ed A2n+1 :
³
h
³ q · a´
£ 2
¤
q · a ´i
+ f exp −i
A2n+1 = 0
(5.18)
ω m − (F + f ) A2n + F exp i
2
2
³
´i
h
³ q · a´
£
¤
q·a
+ F exp −i
A2n + ω 2 M − (f + F ) A2n+1 = 0
(5.19)
f exp i
2
2
Queste due equazioni ammettono soluzione diverse da quella banale solo se il determinante dei coefficienti si
annulla:
¯
¯
¯
F + f − ω2 m
−[F exp i(q · a/2) + f exp −i(q · a/2)] ¯¯
¯
(5.20)
¯ −[F exp i(q · a/2) + f exp −i(q · a/2)]
¯=0
f + F − ω2 M
Le radici di queste equazione di secondo grado in ω 2 sono:
µ
¶ sµ
¶2 µ
¶2
F
+
f
F +f
1
1
1
1
Ff
q·a
2
ω± =
+
±
+
−4
sin2
2
m M
2
m M
mM
2
(5.21)
Ci sono dunque due valori delle frequenze angolari (le soluzioni sono due, e non 4, perché ω deve essere positivo),
ω+ ed ω− , in corrispondenza ad un sol valore di q. Dalla soluzione generale precedente possiamo facilmente
ricavare i due casi particolari, e cioè:
5.2. CATENA BIATOMICA
51
F =f


¶ sµ
¶2
µ 1
1
1
1
4
q · a
2
ω±
=F
+
±
+
−
sin2
 m M
m M
mM
2 
(5.22)
e m=M
2
ω±
=
1
m
r
½
(F + f ) ±
(F − f )2 + 4F f cos2
q·a
2
¾
(5.23)
Le corrispondenti curve di dispersione sono riportate in fig. 5.3.
Figure 5.3: Curve di dispersione per una catena biatomica, sia per il caso F = f (a sinistra) che per M = m (a
destra). Per il caso F = f si riportano anche gli autovettori al centro ed al limite della prima zona di Brillouin.
Esaminiamo ora alcune delle soluzioni più significative dell’equazione 5.22, quella per F = f . Per q che
tende a zero, qa ¿ 1 e sin(qa/2) ≈ (qa/2). Dopo una serie di riarrangiamenti otteniamo:
2
ω+
'
2F (M + m)
mM
(5.24)
2
ω−
'
F q 2 a2
2(m + M )
(5.25)
(5.26)
52
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
sostituendo questi valori di ω 2 nelle equazioni 5.19, possiamo trovare il rapporto tra le ampiezze:
2
ω+
−→
2
ω−
−→
M
A2n
=−
A2n+1
m
(5.27)
A2n
=1
A2n+1
(5.28)
(5.29)
Allora per ω+ i due atomi M ed m oscillano in opposizione di fase, mentre il loro baricentro resta fermo, e la
frequenza è uguale alla frequenza
di un oscillatore armonico di massa ridotta µ = (m + M )/(mM ) e costante
p
di forza 2F , cioè ω+ = 2F/µ. La velocità dω/dq = 0, cioè si ha un’onda stazionaria. La soluzione per
ω− somiglia invece
p alla soluzione già trovata per il reticolo monoatomico, cioè troviamo una velocità costante,
c = ω/q = (a/2) (2F )/(m + M ), e gli atomi hanno tutti circa la stessa ampiezza e fase. Abbiamo dunque
un’onda elastica che si propaga a velocità costante, e ciò che conta è solo la massa media (m + M )/2: il suono
è un fenomeno macroscopico, e il risultato è essenzialmente lo stesso che per una catena monoatomica. Gli
autovettori sono riportati nella parte sinistra della fig. 5.3, in basso.
Sempre per F = f , ed al limite della prima zona di Brillouin, q = π/a = b/2, abbiamo sin(q · a/2) = 1 e
dunque:
2
ω+
'
2F
m
(5.30)
2
ω−
'
2F
M
(5.31)
(5.32)
che sostituite nell’equazione delle ampiezze danno A2n /A2n+1 = ∞ e A2n /A2n+1 = 0, rispettivamente. Nella
prima soluzione m oscilla ed M è fermo, e quindi la frequenza dipende solo da m; nella seconda soluzione m è
fermo, e M oscilla. In entrambi i casi la velocità è nulla. Gli autovettori sono riportati nella parte sinistra della
fig. 5.3, in alto.
Abbiamo dunque visto le soluzioni al centro e bordo zona, corrispondenti alle curve di dispersione riportate
nella fig. 5.3. La curva che corrisponde a ω− è chiamata ramo acustico. In effetti vicino a q = 0, ω− → 0, e
la curva rappresenta delle onde elastiche, con velocità indipendente dalla frequenza, che arriva nel range delle
frequenze udibili. Le onde elastiche longitudinali corrispondono alle onde sonore. La curva corrispondente a ω+
ha sempre frequenze diverse da zero, anche per grandi lunghezze d’onda, e viene detta ramo ottico. Il nome
deriva dal fatto che a q = 0 si hanno vibrazioni dei due atomi in opposizione di fase. Nei cristalli ionici ciò si
traduce nella presenza di forti momenti dipolo oscillante, che interagiscono fortemente con il campo elettrico
della radiazione elettromagnetica. Le frequenze di vibrazione del ramo ottico corrispondono a frequenze della
radiazione elettromagnetica che cadono nella zona dell’infrarosso.
E’ istruttivo a questo punto studiare il passaggio dalla catena monoatomica a quella diatomica. Partiamo
dalla catena monoatomica, e supponiamo di usare una cella unitaria contenente due atomi, ignorando il fatto
che le due masse sono uguali. Chiamiamo a0 le dimensioni della nuova cella, mantenendo il simbolo a per
la vecchia cella con un solo atomo (a0 = 2a). Avendo due atomi per cella, abbiamo due rami, ma se le due
masse sono uguali, i rami ottico ed acustico convergono ad uno stesso punto al bordo zona (vedi fig. 5.4 (a)).
Se confrontiamo questo con il risultato ottenuto con la cella contenente un solo atomo (fig. 5.1), sembra che
5.3. ESTENSIONE AD UN CRISTALLO REALE TRIDIMESIONALE.
53
Figure 5.4: Curve di dispersione per una catena monoaomica: (a) Falsa zona di Brilluouin, con cella doppia;
(b) Zona di Brilluoin normale. (c) Catena biatomica, rappresentazione a zona estesa.
abbiamo raddoppiato il numero dei modi. In realtà non è cosı̀, perché raddoppiando la lunghezza della cella,
abbiamo dimezzato la zona di Brillouin. Ogni ramo comprende quindi N/2 modi. Con una traslazione di π/a,
cioè di un vettore di reticolo reciproco della cella doppia, possiamo trasformare la fig. 5.4 (a) nella fig. 5.4
(b). Si vede allora che il ramo ottico viene ad essere una continuazione di quello acustico. In questo caso la
rappresentazione della fig. 5.4 (a) è sbagliata, perché abbiamo preso una cella doppia di quello che dovrebbe
essere. Se però adesso facciamo sı̀ che le masse siano diverse, possiamo vedere che la fig. 5.4 (b) si modifica
come illustrato nella fig. 5.4 (c). Allora l’effetto di cambiare le masse degli atomi alternativamente è quello di
introdurre dei nuovi confini nella zona di Brillouin del reticolo “monoatomico”, nei punti π/a0 = π/2a: i nuovi
contorni di zona sono a metà della vecchia zona di Brillouin, e delimitano appunto una nuova prima zona di
Brillouin. La frequenza non è più continua attraverso questi confini: compare un intervallo o “gap” di frequenza.
La fig. 5.4 (c) è un secondo modo di rappresentare le soluzioni per il problema delle vibrazioni in una catena
lineare biatomica, in aggiunta a quello già riportato in fig. 5.3. Mentre nella fig. 5.3 il valore di q è limitato
alla prima zona di Brillouin, corrispondente alla cella tipo Wigner-Seitz del reticolo reciproco, e si hanno due
valori di frequenza per ogni valore di q, nella fig. 5.4 (c) abbiamo scelto di far variare q fino al doppio della
zona di Brillouin, cioè fino alla seconda zona di Brillouin, e ad ogni q corrisponde un’unica frequenza. I due
modi di rappresentazione sono evidentemente equivalenti: il primo viene detto “schema a zona ridotta”, e il
secondo “ schema a zona estesa”. Dato che le funzioni soluzioni dell’equazione del moto vengono contraddistinte
con il valore di q cui corrispondono, c’è ambiguità nella assegnazione dei valori di q per il reticolo biatomico,
a seconda che si scelga uno o l’altro schema. Lo schema a zona ridotta ha il vantaggio che il valore di q è, in
valore assoluto, sempre minore di, o uguale a, π/(dimesione della cella unitaria), cioè è limitato sempre alla
prima zona di Brillouin. Lo schema a zona estesa ha il vantaggio che ad un valore di q corrisponde un sol valore
di ω. In effetti si usa uno con l’altro schema a seconda di quale vantaggio è più utile sfruttare per il particolare
problema. Nel caso delle vibrazioni, si adotta pressoché esclusivamente lo schema a zona ridotta, mentre, come
vedremo, per il problema elettronico si usano entrambi gli schemi.
5.3
Estensione ad un cristallo reale tridimesionale.
Finora abbiamo trattato delle vibrazioni nei cristalli per mezzo di modelli semplificati, e cioè: reticolo ad
una sola dimensione; forze solo fra atomi adiacenti. La rimozione di queste due semplificazioni non comporta
54
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
particolari problemi, se non che le equazioni divengono più complicate e non risolubili analiticamente, ma solo
per via numerica. Chiamiamo unαi lo spostamento dell’atomo α-esimo nella cella n nella direzione cartesiana i
(i = i, y, z). Le equazioni del moto sono allora:
X mβj
(5.33)
Mα ünαi +
Φnαi umβj = 0
mβj
dove Φmβj
nαi è la costante di forza relativa agli spostamenti unαi e umβj . Per N celle unitarie con p atomi, si
ottengono 3pN equazioni differenziali di questo tipo. Scrivendo la soluzione come:
unαi = √
1
Aαi (q) ei(q·tn −ωt)
Mα
(5.34)
definita solo nei punti reticolari tn , e sostituendo nell’equazione del moto, otteniamo le seguenti equazioni lineari
ed omogenee nelle incognite Aαi :
−ω 2 Aαi (q) + Dβj
(5.35)
αi (q) Aβj (q) = 0
Nell’equazione i termini Dβj
αi (q) sono gli elementi della “matrice dinamica” che corrispondono a:
Dβj
αi (q) =
XX
βj
m
1
p
Φmβj eiq·(tm −tn )
Mα Mβ nαi
(5.36)
Le equazioni lineari ed omogenee ammettono soluzione non banali solo se il seguente determinante dei coefficienti
si annulla:
2
|Dβj
(5.37)
αi (q) − ω 1| = 0
dove 1 è la matrice unità.
La soluzione del problema comporta dunque la risoluzione numerica delle equazioni secolari per diversi valori
del vettore d’onda q. Le curve di dispersione non sono dunque più delle curve analitiche ma l’inviluppo di una
serie di punti discreti. Senza addentrarci nel dettaglio delle soluzioni, che ovviamente dipendono dal particolare
cristallo sotto esame, possiamo facilmente estendere in maniera qualitativa i risultati ottenuti tramite i modelli
semplificati.
Consideriamo un reticolo tridimensionale monoatomico, cioè con un atomo per cella elementare. Ogni
dimensione in più introduce una componente cartesiana in più del vettore spostamento, e quindi dovremmo
risolvere una equazione cubica in ω 2 . Abbiamo dunque tre radici dell’equazione, che nel caso limite di lunghezza
d’onda infinita (q = 0) corrispondono ad onde acustiche propagantesi con velocità diverse lungo una certa
componente del vettore q. I tre modi acustici differiscono essenzialmente perché sono polarizzati in maniera
diversa: se il cristallo è isotropo, uno è polarizzato longitudinalmente, e gli altri due, che hanno velocità uguale,
sono polarizzati trasversalmente, cioè gli atomi si muovono in piani perpendicolari alla direzione di propagazione
dell’onda. Se il cristallo non è isotropo i modi trasversali non saranno più degeneri, tranne che in direzioni di
simmetria particolari. Anche la classificazione in modi longitudinali e trasversali risulta arbitraria, perché il
vettore spostamento non deve essere necessariamente perpendicolare al vettore d’onda o avere la stessa direzione.
Comunque sia il risultato importante è che per un cristallo tridimensionale abbiamo tre modi di tipo acustico,
cioè con velocità costante per lunghezza d’onda sufficientemente grande (a centro zona) e con la frequenza che
tende a zero per q → 0. Allora per ogni vettore q compreso nella prima zona di Brillouin ci saranno tre
valori di ω. Naturalmente la prima zona di Brillouin sarà tridimensionale, non essendo altro che la cella di
Wigner-Seitz del reticolo reciproco. Pertanto la dipendenza funzionale di ciascuna delle tre radici ω(qx , qy , qz )
sarà rappresentata non da una curva ma da una superficie tridimensionale. Nel piano possiamo rappresentare
5.4. CRISTALLI MOLECOLARI
55
delle sezioni di questa superficie mediante curve di livello. In alternativa, si può scegliere di rappresentare la
dispersione di ω lungo una data direzione del vettore q. Questa in effetti è la rappresentazione più comune, le
direzioni prescelte essendo quelle di particolare simmetria del cristallo. Ogni ramo della curva rappresenterà N
modi.
Se adesso passiamo ad un cristallo tridimensionale con due atomi per cella unitaria, avremo una estensione
del caso monodimensionale analoga alla precedente. Cioè, oltre ai tre rami acustici, avremo la comparsa di tre
rami ottici. D’altra parte se abbiamo più di due atomi per cella, diciamo p atomi, è facile intuire che avremo
in tutto 3p rami distinti per la dipendenza di ω da q. Di questi, solo tre potranno avere la frequenza che tende
a zero a centro zona, cioè solo tre saranno di tipo acustico. Difatti per q → 0 i modi acustici corrispondono
a spostamenti di ampiezza confrontabile, e uguale fase per tutti gli atomi, una situazione che si può realizzare
in un unico modo per una data direzione dello spazio. Quindi nello spazio tridimensionale ci saranno solo tre
maniere di realizzare una vibrazione di questo tipo per q → 0, e avremo solo tre rami acustici. Gli altri rami
saranno il tipo ottico, cioè con ω 6= 0 per q = 0. Quindi in generale in un cristallo con p atomi per cella
elementare avremo in ciascuna direzione 3p rami, ciascuno costituito da N punti. Di questi, tre rami saranno
di tipo acustico, e 3p − 3 di tipo ottico. Due esempi di curve di dispersione per cristalli reali sono riportate in
fig. 5.5: a sinistra il cristallo di Potassio, con un atomo per cella, e a destra quello di NaCl.
Figure 5.5: Curve di dispersione per il cristallo di K (a sinistra) e per il cristallo di NaCl (a destra).
5.4
Cristalli molecolari
Adesso consideriamo più in dettaglio cosa succede in un cristallo molecolare. Per analizzare la situazione,
riprendiamo il caso della catena diatomica, con diversi valori delle costanti di forza. Nella soluzione 5.21
che avevamo ricavato, consideriamo il caso F À f . In altre parole, F corrisponde alla costante di forza
intramolecolare, e f rappresenta le deboli forze intermolecolari. In questa situazione le radici dell’equazione
5.21 sono date approssimativamente da:
s µ
¶ s
1
1
F
ω+ = ωint ≈ F
+
=
(5.38)
m M
µ
r
¯
f
q · a ¯¯
¯
(5.39)
¯sin
¯.
m+M
2
La prima soluzione, corrispondente al ramo ottico, non dipende da q, ed è la frequenza vibrazionale di una
molecola isolata, cioè di una molecola in fase gas. Il centro di gravità di ogni molecola rimane fisso all’interno
ω− = ωext = ωret ≈ 2
56
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
Figure 5.6: Schema generale per le curve di dispersione in un cristallo molecolare.
della cella unitaria. Il moto corrisponde dunque a una vibrazione intramolecolare, o “interna” alla molecola
(ωint ). La seconda soluzione, corrispondente al ramo acustico, rappresenta il moto di entrambi gli atomi nella
stessa direzione e con la stessa ampiezza, cioè corrisponde al moto traslazionale della molecola come un tutto
rigido. La frequenza è uguale a quella ottenuta per la catena monoatomica con la massa della molecola, m + M ,
al posto della massa dell’atomo. Si parla allora, in contrapposizione alla vibrazione interna, di vibrazione
“esterna” (ωext ) o reticolare (ωret ). Le soluzioni che abbiamo illustrato sono valide nel caso limite F À f :
la separazione tra moti interni ed esterni (o di reticolo) è una separazione approssimata, i due tipi di moto si
influenzeranno a vicenda. Cosı̀, ωint presenterà una qualche dipendenza, seppure piccola, da q, e ωret conterrà
anche oscillazioni delle distanze intramolecolari. L’approssimazione della molecola rigida, con la separazione tra
modi interni ed esterni, è tuttavia un utile punto di partenza per l’analisi dei modi vibrazionali di un cristallo
molecolare.
Passando al caso tridimensionale, supponiamo di avere un cristallo contenente σ molecole per cella elementare, ciascuna con t atomi. Quindi per ogni valore di q avremo 3σt modi normali, cioè 3σt rami. Di questi,
6σ corrisponderanno a modi esterni, cioè a moti delle molecole rigide come un tutto: per ogni molecola dovremo
allora considerare tre possibili traslazioni e tre rotazioni attorno agli assi principali di inerzia. Abbiamo visto
prima che i modi acustici sono modi reticolari. Dato che i modi acustici sono comunque 3 per un cristallo
tridimensionale, dei 6σ modi reticolari, 3 saranno acustici, corrispondenti a moti traslatori delle molecole, e
6σ − 3 saranno di tipo ottico. I rimanenti 3σt − 6σ = 3σ(t − 2) modi saranno modi interni (o intramolecolari),
tutti il tipo ottico. Uno schema delle curve di disperisone risultanti è riportato in fig. 5.6.
5.5. PASSAGGIO ALLA QUANTO-MECCANICA. FONONI.
5.5
57
Passaggio alla quanto-meccanica. Fononi.
Finora abbiamo trattato problema dal punto di vista classico. E’ da notare che anche con il modello classico
abbiamo una sorta di “quantizzazione”, cioè a dire dei valori proibiti di frequenza. Un primo tipo di quantizzazione potrebbe essere pensato come dovuto al fatto che q assume solo valori discreti. In tre dimensioni, le
condizioni cicliche di Born-von Karman difatti sono:
exp i(q · tn ) = exp i[(1 + N )q · tn ],
(5.40)
con tn un vettore del reticolo reciproco, e N = N1 N2 N3 il numero di celle. Allora i possibili 3N valori di q
sono dati da:
s2 ∗
s3 ∗
s1 ∗
a +
b +
c
(5.41)
q=
N1
N2
N3
con un a∗ , b∗ , e c∗ vettori della cella unitaria del reticolo reciproco, e −Ni /2 < si ≤ Ni /2 (i = 1, 2, 3).
D’altra parte, N1 , N2 ed N3 , sono numeri molto grandi, dell’ordine di 1020 , e quindi la quantizzazione su q
praticamente non esiste. Un secondo tipo di “quantizzazione” è quello dovuto ai gap tra i rami delle curve
di dispersione. Onde di frequenza corrispondente al gap non possono propagarsi all’interno del cristallo, sono
cioè frequenze proibite per le vibrazioni. Si parla comunque di gap: il termine quantizzazione è abbastanza
improprio e potrebbe generare confusione.
Abbiamo dunque trovato i modi normali di vibrazione di un cristallo. Il passaggio alla quanto meccanica
è a questo punto immediato. Difatti abbiamo usato l’approssimazione armonica e separato il moto in tanti
oscillatori armonici indipendenti. Dunque i livelli vibrazionali corrispondenti ad un certo vettore d’onda q
avranno la forma:
µ
¶
1
²n,q = n +
~ωq
(5.42)
2
con ωq la frequenza classica risultante dalla risoluzione delle equazioni del moto che abbiamo appena visto.
L’energia totale sarà la somma su tutti i q delle energie ²n,q e la funzione d’onda sarà il prodotto di 3pN polinomi
di Hermite (per un cristallo tridimensionale con p atomi per cella e N celle). Poiché l’equazione rappresenta un
set di livelli uniformemente spaziati, per ciascun modo normale di frequenza ωq possiamo considerare lo stato
²n,q come costruito aggiungendo allo stato fondamentale n “quanti di eccitazione” o “eccitazioni elementari”,
ciascuna di energia ~ωq . Da questo punto di vista conviene ridefinire lo zero di energia, prendendolo uguale alla
energia dello stato fondamentale:
1X
Egs =
~ωq = 0
(5.43)
2 q
Allora gli operatori creazione e distruzione bosonici corripondenti ad un dato modo normale Qq , cioè a+
q e aq ,
con
[aq , a+
(5.44)
q 0 ] = δq,q 0 ,
aggiungeranno o toglieranno quanti di eccitazione. Lo stato fondamentale è detto allora “ stato vuoto”, ed i
quanti di eccitazione vengono denominati “fononi”.
Questo modo di considerare le cose è analogo a quello che si usa nel caso della radiazione elettromagnetica di
frequenza ν: noi diciamo che lo stato di energia εm della radiazione elettromagnetica corrisponde alla presenza
di m fotoni ciascuno di energia hν. Nel caso delle vibrazioni parliamo invece di fononi energia ~ωq come quanti
di eccitazione vibrazionale. La dinamica del fonone, visto come una particella, può essere espressa in termini di
massa, momento, e energia. A differenza del fotone, tuttavia, il fonone non può esistere al di fuori del cristallo, e
le sue proprietà dipendono dalle forze che tengono uniti gli atomi a formare il solido. Cosı̀ le proprietà del fonone
58
CHAPTER 5. VIBRAZIONI NEI CRISTALLI. FONONI
sono proprietà collettive: per esempio il momento del fonone non è un momento fisico, dato che le coordinate
del fonone sono coordinate di spostamento relativo degli atomi, e il cristallo come un tutto non ha momento
lineare. Per questi motivi il fonone, come altre particelle che incontreremo più avanti, viene detto essere una
“quasi-particella”, per distinguerlo dalle particelle ordinarie.
Da che cosa è dato il momento del fonone ? Consideriamo un singolo fonone di frequenza ωq , la cui velocità
è data da c = ωq /q, cioè ωq = q · c. In meccanica classica il momento p è derivabile dalla funzione Lagrangiana
classica L(r, ṙ) = L(r, c), differenza tra l’energia cinetica T e l’energia potenziale V , L = T − V , tramite la
derivata:
∂L
p=
(5.45)
∂c
Nel nostro caso la funzione Lagrangiana relativa ad un fonone può essere scritta come L = T − V = H − 2V .
L’energia totale corrispondente ad H è data da ²q = ~ωq , e dato che il potenziale V non dipende dalle velocità
in un sistema conservativo, ∂V /∂c = 0, il momento del fonone è dato da:
p=
∂H
~ ∂q · c
=
= ~q
∂c
∂c
(5.46)
che non è poi che un altro modo di esprimere la relazione di De Broglie |p|λ = h. Il momento del fonone è
dunque direttamente proporzionale al vettore d’onda, e q assume dunque il significato di momento.
L’utilità del concetto di fonone è collegata al fatto che possiamo considerare l’interazione delle vibrazioni del
cristallo con agenti esterni, come per esempio la radiazione elettromagnetica, come una collisione tra particelle,
per esempio un urto fonone-fotone. Questo è appunto l’argomento del prossimo capitolo.
Chapter 6
Scattering fononico
Vediamo ora come il concetto di fonone si dimostri utile per descrivere l’interazione delle vibrazioni con agenti
esterni, quali fotoni o altre particelle. Come vedremo tra un attimo, è possibile descrivere questa interazione in
termini di urti (scattering), ed in tal modo possiamo ottenere una descrizione semplice ed unificante di vari tipi
di spettroscopia utilizzati per ottenere informazioni sulla curva ω(q), cioè sulle curve di dispersione fononiche.
Se abbiamo due sistemi di particelle interagenti, la probabilità di transizione da uno stato all’altro è data
da:
Ps←i ∝ | < ψs |HI0 |ψi > |2
HI0
(6.1)
HI0
essendo l’ampiezza dell’hamiltoniano di interazione dipendente dal tempo, HI =
cos ωt. Questa espressione richiama la ben nota regola d’oro di Fermi, che dà la probabilità di transizione per un sistema molecolare
interagente con radiazione elettromagnetica. La regola d’oro di Fermi è ricavata da un trattamento semiclassico,
in cui cioè il sistema molecolare è trattato in maniera quanto-meccanica, e la radiazione in maniera classica.
Un trattamento quanto-meccanico completo porta alla stessa espressione, ma naturalmente in questo caso la ψ
descrive entrambi i sistemi interagenti, per esempio appunto il fonone e il fotone. In assenza di interazione lo
stato del sistema è dato dal prodotto degli stati:
|ψi >= |χq > |φk >
(6.2)
Dove abbiamo riservato la q per indicare il vettore d’onda del fonone descritto da χ, e k il vettore d’onda
del fotone descritto da φ. Difatti sia |χq > che |φk > devono soddisfare il teorema di Bloch, il fotone dovendo
comunque propagarsi all’interno del cristallo. Avremo dunque:
|χq >
∝ exp(iq · r)
(6.3)
|φk >
∝ exp(ik · r)
(6.4)
L’hamiltoniano di interazione sarà anch’esso una funzione periodica con periodicità del reticolo, cioè:
HI0 (r + tn ) = HI0 (r)
E naturalmente possiamo espandere tale funzione in serie di Fourier:
59
(6.5)
60
CHAPTER 6. SCATTERING FONONICO
HI0 (r) =
X
AG exp(iG · r)
(6.6)
G
G essendo un vettore del reticolo reciproco, G · tn = 2π× un intero (nota: in altri capitoli abbiamo usato il
simbolo gh invece di G). Allora la probabilità di transizione scritta sopra sarà proporzionale al quadrato di:
"
Z
exp(−iqs · r) exp(−iks · r)
X
#
AG exp(iG · r) exp(iqi · r) exp(iki · r) dr
G
=
X
AG
(6.7)
Z
exp i [(−qs − ks + G + qi + ki )r] dr
G
E dal momento che le funzioni esponenziali sono ortogonali tra di loro, l’integrale precedente si annulla a meno
che qs + ks − G − qi − ki = 0, e quindi il solo termine G-esimo sopravvive nella sommatoria. Abbiamo allora
che la probabilità di transizione è:
(
AG se qs + ks − G − qi − ki = 0
(6.8)
0
altrimenti
Ora sappiamo che a temperatura ambiente le vibrazioni in un cristallo sono per lo più tutte nello stato fondamentale. Nel linguaggio dei fononi, ciò corrisponde allo stato vuoto, senza fononi. Pertanto senza perdere in
generalità, possiamo assumere qi = 0, e la regola di selezione è
qs = ki − ks + G
(6.9)
Supponiamo dapprima che G = 0. Moltiplicando per ~ abbiamo ~qs = ~(ki − ks ), cioé ps = Pi − Ps ,
che non è altro che la legge di conservazione del momento della quantità di moto. Quindi nel trovare le regole
di selezione per la transizione, siamo stati ricondotti all’enunciazione della legge di conservazione del momento
della quantità di moto nell’urto tra particelle. A questo risultato si poteva arrivare direttamente considerando
l’interazione come un urto tra particelle. Cominciamo dunque a vedere l’utilità del concetto di fonone, anche
se nella derivazione siamo partiti della regola d’oro di Fermi e abbiamo sostanzialmente sfruttato le proprietà
di simmetria traslazionale del cristallo.
I tipi di processi in cui G = 0 vengono detti processi “normali” o N. Nel caso più generale, G sarà diverso
da zero, e la legge di conservazione del momento della quantità di moto non è apparentemente più rispettata
perchè abbiamo: ps = Pi − Ps + ~G. Questo tipo di processo viene detto processo “Umklapp” (folding) o
U. La legge di conservazione della quantità di moto è solo apparentemente violata nel processo U: la particella
incidente può acquistare o perdere l’impulso ~G in aggiunta all’impulso del fonone. L’impulso ~G è ceduto
o acquistato dal cristallo come un tutto. Nel costruire gli stati vibrazionali del cristallo, non abbiamo tenuto
conto del moto il baricentro del cristallo stesso, in relazione al quale vengono espresse le vibrazioni stesse. Si
può dimostrare che la legge fondamentale della conservazione della quantità di moto è rispettata se si include il
moto associato alla traslazione del cristallo come in tutto.
Possiamo allora considerare l’interazione del moto vibrazionale con agenti esterni come un urto del fonone
con altre particelle. Ora nella meccanica degli urti si distinguono due tipi di possibilità: l’urto elastico e l’urto
anelastico. Nel primo caso, il momento della particelle incidente è uguale in valore assoluto a quello della
particella scatterata: |Pi | = |Ps |. Quindi nessun fonone è creato o distrutto in questo processo, l’energia della
particella incidente è uguale a quella della particella scatterata:
61
Pi2
P2
= s
(6.10)
2m
2m
E l’unico risultato dell’urto è il cambiamento in direzione della particella incidente. Nei processi U ci sarà
trasferimento di momento al/dal cristallo.
L’urto anelastico è invece quello in cui un fonone è creato o distrutto, in cui cioè oltre al momento anche
l’energia della particella incidente varia:
Pi2
P2
= s + ~ωq
2m
2m
(6.11)
Consideriamo allora l’interazione tra il fotone ed il fonone. Per il fotone all’interno del cristallo la relazione
tra lunghezza d’onda e frequenza è ovviamente λν = c dove c è la velocità della luce nel cristallo ed è una
costante. L’energia del fotone è data da ²k = ~ωk La frequenza del fonone, ωq , legata al vettore d’onda
dall’appropriata relazione di dispersione, è dell’ordine di grandezza di 1012 - 1013 s−1 , cioè da 100 a 4000
cm− 1. Se inviamo nel cristallo un fotone alla stessa frequenza, in seguito all’urto il fotone è assorbito e un
fonone è creato. I processi il tipo U possono in questo caso essere trascurati. Abbiamo dunque ki = qs , ed in
termini della conservazione dell’energia abbiamo ~ωk = ~ωq . L’urto è dunque completamente anelastico, con
la massima variazione dell’energia della particella incidente. Se conosciamo ωk possiamo dunque determinare
ωq . ωk corrisponde a radiazione elettromagnetica di lunghezza d’onda da 10 a 300 × 10−4 cm, cioè nella zona
dell’infrarosso. Il vettore d’onda della radiazione incidente è dunque della dimensione 2×102 - 5×103 cm−1 . Il
massimo valore che può assumere il vettore d’onda fononico, cioè π/a, dove a ha la dimensione tipica di una
cella cristallina, è di 3×108 cm−1 . Pertanto il valore del vettore d’onda del fonone creato, uguale a quello del
fotone incidente, è praticamente zero rispetto ai normali valori di q.
Abbiamo dunque trovato la regola di selezione per l’assorbimento della radiazione, ovvero qs ∼ 0. Pertanto
in questo caso è facile determinare l’energia con accuratezza, mentre i vettori d’onda sono troppo piccoli perché
possano essere determinati. Quindi possiamo avere solo un pezzo d’informazione dei due potenziali: in sostanza
non possiamo allontanarci dalla zona intorno a q = 0. Dal che si vede che il ramo acustico non dà luogo ad
assorbimento dell’infrarosso, dato che ωq = 0. Pertanto il numero massimo di vibrazioni che possono essere
attive in infrarosso è uguale al numero dei rami ottici, cioè per un cristallo costituito da m atomi per cella
elementare, da m - 3 modi.
La regola di selezione q ∼ 0 vuol dire che il fonone creato appartiene alla rappresentazione totalsimmetrica
del gruppo di traslazione, cioè, la forma geometrica della vibrazione non cambia nell’operazione di traslazione
stessa. Ciò significa che lo spostamento di un certo atomo è lo stesso in ogni cella unitaria. Per questo
motivo, per classificare le vibrazioni infrarosso attive e trovare le ulteriori regole di selezione possiamo servirci
del gruppo fattore cioè del gruppo di simmetria della cella unitaria stessa. Ad ogni modo, la spettroscopia
infrarossa ci fornisce informazioni molto limitate circa le frequenze di vibrazione nei cristalli, permettendo al
più di determinare la frequenza dei modi ottici a q = 0. La forma della curva di dispersione deve essere
determinata con altri metodi sperimentali.
Aumentiamo adesso la frequenza della radiazione incidente, in modo da portarci fuori della zona di assorbimento fononico, ma restando al di sotto della zona di assorbimento da parte degli elettroni nel cristallo.
Portiamoci cioè nella zona della radiazione del vicino infrarosso o del visibile, cioè da 1000 a 500 nm circa.
In queste condizioni non si ha quindi assorbimento, ma piuttosto i fenomeni di secondo ordine come l’effetto
Raman. Anche in questo caso è irrilevante la presenza di processi di tipo U, per cui ki = ks + qs . Abbiamo, al
62
CHAPTER 6. SCATTERING FONONICO
solito, la possibilità di scattering sia elastico che anelastico. Radiazione incidente visibile, di lunghezza d’onda
di 500 nm, ha un vettore d’onda all’interno del cristallo di circa 2×105 cm−1 . Se, come spesso succede nella
disposizione sperimentale, ki e ks fanno un angolo di 90 gradi, la conservazione del vettore d’onda richiede che
il fonone creato o distrutto sia di circa 3×105 cm−1 , ancora molto piccolo rispetto al valore di q al limite della
zona di Brillouin. Pertanto i fononi implicati sia nell’urto elastico che in quello anelastico hanno lunghezza
d’onda molto grandi rispetto alle dimensioni del reticolo, ed hanno praticamente la stessa frequenza dei fononi
a lunghezza d’onda infinita. Si ha in altre parole anche in questo caso la regola di selezione q ∼ 0. Di nuovo non
sarà possibile misurare q, perché è ancora molto piccolo anche se più grande che nel caso infrarosso. Pertanto
la presenza dei processi U è irrelevante, come anticipato sopra, e potremo avere informazioni solo sulle energie.
Nell’urto elastico - che viene detto effetto Rayleigh - il fotone conserva la propria energia, e quindi questo dato
non è informativo dal nostro punto di vista. Nell’urto anelastico - che corrisponde all’effetto Raman - abbiamo:
~[ω(ki ) − ω(ks )] = ~ω(q)
(6.12)
E quindi misurando la differenza di frequenza tra radiazione incidente e radiazione scatterata si determina
la frequenza del fonone. L’effetto Rayleigh e l’effetto Raman avvengono naturalmente contemporaneamente
quando inviamo luce visibile sul cristallo, con l’effetto Rayleigh largamente predominante. I due effetti danno
però luogo a radiazione di frequenza diversa, e possono essere discriminati mediante un monocromatore, magari
doppio.
E’ da tenere presente, tuttavia, che la zona di q attorno a zero esplorabile con il Raman è un poco più
ampia di quella relativa all’infrarosso: si passa da un valore 100000 volte più piccolo rispetto a q al confine
di zona, a un valore di solo 1000 volte più piccolo. Questo non ha praticamente effetto per le transizioni del
ramo ottico, data la scarsa dipendenza della frequenza da q attorno a q = 0 per questi modi. Per il ramo
acustico invece la dipendenza di ω da q attorno a q = 0 è molto grande, ed il valore di q per l’effetto Raman
è sufficientemente grande perché la frequenza abbia valori diversi da zero, e cioè da 0 a circa 5 cm−1 . Inoltre
il valore della frequenza osservata dipenderà dall’angolo tra ki e ks . Data la piccolissima differenza tra la
frequenza delle radiazione incidente e la frequenza delle radiazione scatterata, occorrerà fare uso di tecniche ad
alta risoluzione, per poter discriminare la radiazione scatterata con creazione o distruzione di un fonone acustico
dalla radiazione dovuta all’effetto Rayleigh. Per questi motivi l’effetto Raman relativo ai rami acustici viene più
spesso denominato effetto Brillouin. Da notare che questi stati fononici hanno bassa energia, e gli stati eccitati
sono apprezzabilmente popolati tranne che a temperature al disotto di circa 20 K.
Per ciò che riguarda i rami ottici dunque sia infrarosso che Raman forniscono lo stesso tipo di informazione,
e cioè la frequenza di tali modi a q = 0. Naturalmente la regola di selezione q ∼ 0 è ricavata sulla base
della simmetria translazionale del reticolo. Per ottenere le regole di selezione valide caso per caso, bisognerà
considerare l’intera simmetria del cristallo. Dato però che vale la q ∼ 0, potremo trovare le ulteriori regole di
selezione limitandoci a considerare il gruppo fattore, come abbiamo già detto in precedenza, e come vedremo
più in dettaglio quando parleremo delle proprietà ottiche dei cristalli.
Sempre restando nel campo dell’interazione fotone-fonone, possiamo pensare di aumentare ancora la frequenza delle radiazione incidente. Se passiamo dalla zona visibile alla zona dell’ultravioletto o comunque se
il fotone è assorbito da transizioni tipo elettronico, naturalmente non possiamo avere informazioni sulla parte
fononica dello stato fondamentale. Vediamo invece cosa succede se aumentiamo ulteriormente la frequenza fino
a portarci nella zona dei raggi X cioè circa 1018 s−1 . Possiamo avere, rispetto ai fononi, sia lo scattering elastico
che quello anelastico, con creazione o distruzione di fononi. Tuttavia l’energia di un fotone X è di circa 104 eV,
mentre l’energia di un fonone è di circa 10−1 - 10−3 eV. Nell’urto anelastico si tratterebbe quindi di determinare
differenze piccolissime energia, in genere inferiore alla risoluzione ottenibile con gli ordinari strumenti a raggi
X. Pertanto una misura diretta della differenza di energia nel caso dello scattering anelastico non può essere
63
ottenuta. Un’informazione indiretta e parziale è ottenibile, ma la tecnica è piuttosto imprecisa e non trova per
il momento largo uso.
Il vettore d’onda dei raggi X è invece di circa 2×108 cm−1 , quindi confrontabile con il vettore d’onda fononico.
Siamo quindi in una situazione complementare rispetto all’infrarosso e al Raman: è possibile determinare il
vettore d’onda, ma non l’energia. Allora sostanzialmente non possiamo apprezzare la differenza tra un urto
elastico e un urto anelastico. Consideriamo quindi l’urto elastico. La relazione di conservazione del momento
in questo caso è:
ks = ki + G
(6.13)
È importante considerare il processo U, dato che possiamo determinare i vettori d’onda. Per lo scattering
elastico |ki | = |ks | = |k|, e allora, detto 2θ l’angolo tra ki e ks , abbiamo:
|G| = 2|k| sin θ
(6.14)
D’altra parte sappiamo che ogni vettore del reticolo reciproco è perpendicolare ad un insieme di piani
reticolari del reticolo diretto, la cui distanza è data da d = 2πn/|G|, con n un intero. Sostinuendo nella (6.14),
tenendo conto che |k| = 2π/λ, otteniamo:
nλ = 2d sin θ
(6.15)
che è nota come la legge di riflessione Bragg, originariamente ricavata sulla base della relazione tra le fasi di
fasci di raggi X “riflessi” da piani reticolari successivi.
Quindi sostanzialmente se si fa variare l’angolo θ (cioè facendo ruotare il cristallo rispetto alla sorgente ed
al rivelatore), l’immagine che si ottiene tramite la diffrazione dei raggi X è un’immagine del reticolo reciproco.
Uno può quindi pensare che da questo sia possibile determinare il reticolo diretto facendo la trasformata inversa.
In realtà non è cosı̀, perché quello che si misura non è l’ampiezza delle radiazione ma l’intensità, cioè il modulo
quadro:
¯
¯2
Z
¯X
¯
¯
2¯
I ∝ |A0 | ¯
ρG exp[i(G − ks + ki )]dr¯
(6.16)
¯
¯
G
dove ρG è la densità dei punti reticolari. Quindi non possiamo fare la trasformata inversa, perché manca
informazione sulla fase. Una procedura è allora di calcolare il pattern di diffrazione per una data struttura, e
poi fare un fitting non lineare sulla struttura sperimentale (con il cosiddetto processo di raffinamento).
Riassumendo, l’interazione dei fotoni con il cristallo fornisce informazioni diverse a seconda della zona
spettrale cui questi appartengono. Fotoni molto energetici hanno lunghezza d’onda confrontabile con quella
fononica ma a causa della loro energia non possono fornire informazioni circa l’energia fononica: essi sono utili
solo per dare la posizione di equilibrio degli atomi. Viceversa, fotoni meno energetici (visibile, vicino infrarosso
e infrarosso) forniscono informazioni sull’energia dei fononi, ma solo di quelli a grande lunghezza d’onda cioè
a q ∼ 0, mentre non danno informazioni strutturali, né permettono di ricavare sperimentalmente le curve di
dispersione.
Per poter ottenere apprezzabili cambiamenti relativi di frequenza nello scattering anelastico, e nello stesso
tempo poter esaminare valori di q nell’intera zona di Brillouin, bisogna avere particelle di frequenza confrontabile
a quella delle vibrazioni del reticolo, (∼ 1013 s−1 ) e di lunghezza d’onda confrontabile alla distanza interatomica
(qualche Å). L’accoppiamento tra queste due caratteristiche può essere ottenuto mediante particelle “ordinarie”
cioè, a differenza del fotone, con massa diversa da zero. Per queste particelle l’energia corrisponde all’energia
cinetica, T = p2 /2m = hν. Il momento può essere variato accelerando o rallentando la particella. Il modulo del
momento p sarà poi legato alla lunghezza d’onda dalla relazione di De Broglie pλ = h. Da queste due relazioni
si ricava:
h
(6.17)
νλ2 =
2m
64
CHAPTER 6. SCATTERING FONONICO
Questa equazione esprime la relazione tra ν e λ (ovvero tra ω e k) al posto della nota νλ = c valida per
il fotone. Per avere un valore di ν e λ adatti, cioè confrontabili con quelli dei fononi, la particella deve avere
una massa di circa 2× 10−27 kg, cioè la massa di un protone o di un neutrone. I protoni sono facilmente
ottenibili, ma il loro uso assai limitato: in vista del gran numero di elettroni presenti nel solido il protone viene
immediatamente trasformato in atomo e “catturato” all’interno del cristallo. Si usano pertanto i neutroni con
energia nel campo 1-100 eV, cioè neutroni lenti o “termici”, che hanno frequenza dell’ordine di 1013 − 1016 s−1 ,
e lunghezza d’onda nel campo di 1-10 Å. Naturalmente anche nel caso della diffrazione (o scattering) neutronica
possiamo avere sia lo scattering elastico che quello anelastico, entrambi regolati dai principi che abbiamo già
visto.
Lo scattering elastico dà lo stesso tipo di informazioni della scattering elastico dei raggi X, cioè a dire la
posizione degli atomi all’interno della cella. La relazione che si ottiene è analoga alla legge di Bragg. Da questo
punto di vista, lo scattering neutronico elastico è complementare ai raggi X: difatti nell’urto elastico questi
ultimi sono scatterati principalmente dagli elettroni, e quindi vengono scatterati con tanta maggiore efficienza
quanti più elettroni ci sono, cioè quanto più grande è il numero atomico. Viceversa i neutroni sono scatterati
principalmente dai nuclei e l’efficienza della scattering in questo caso non presenta una variazione sistematica
col numero atomico. Si verifica tuttavia che i neutroni sono particolarmente adatti per rivelare la posizione degli
elementi leggeri ed in particolare dell’idrogeno. Una limitazione dello scattering neutronico è quella imposta
dalla bassa intensità del fascio, cioè dalla difficoltà di ottenere segnali facilmente rivelabili del fascio scatterato.
Per ovviare a questa difficoltà si è costretti a diminuire il grado di monocromaticità fascio stesso, cioé a dire
si deve essere meno severi nel selezionare i neutroni in un certo intervallo di velocità, il che crea problemi di
collimazione e di risoluzione. Pertanto si richiedono dei cristalli piuttosto grandi. In definitiva a parte gli atomi
leggeri come l’idrogeno i raggi X sono superiori ai neutroni per ciò che riguarda la precisione nella determinazione
della struttura.
Per ciò che riguarda lo scattering anelastico otteniamo lo stesso tipo di informazione della spettroscopia
infrarossa e Raman, solo che il campo di valori di q esplorabile non è limitato alla zona intorno q ∼ 0, ma
si estende sopra l’intera zona di Brillouin. Un’altra caratteristica che distingue lo scattering a neutroni dalla
spettroscopia infrarossa e Raman è che non ci sono in questo caso regole selezione addizionali in aggiunta alle:
~ki
=
~ks + ~q − ~G
(6.18)
~2 ki2
2Mn
=
~2 ks2
+ ~ω
2Mn
(6.19)
mentre nel caso infrarosso e Raman avevamo in aggiunta le regole di selezione del gruppo fattore (simmetria della
cella unitaria), essenzialmente legate alle proprietà di simmetria degli operatori relativi all’interazione fononefotone, il momento di dipolo elettrico e la polarizzabilità. Il fatto che nella diffrazione neutronica non ci siano
regole di selezione di questo tipo è da una parte un vantaggio, perché tutti i modi normali sono potenzialmente
rivelabili, dall’altra è uno svantaggio perché se la cella contiene molti atomi, gli spettri di diffrazione neutronica
diventano molto difficili da interpretare. Difatti se abbiamo molte curve di dispersione addossate l’una all’altra
può risultare difficile distinguere a quale ramo appartiene una data frequenza, data la vicinaza dei valori di q,
ovvero, per un dato valore di q, può essere difficile risolvere frequenze prossime tra loro.
La fig. 6.1 dà un quadro riassuntivo della discussione testé fatta sullo scattering fononico e sulle informazioni
che si possono ottenere.
65
Figure 6.1: Confronto tra i vari metodi di indagine per i fononi e la struttura cristallina.
66
CHAPTER 6. SCATTERING FONONICO
Appendix A
Onde. Serie e Trasformate di Fourier
In questa appendice considereremo brevemente la descrizione fisica di moti ondulatori e l’analisi di Fourier di
moti ondulatori o di moti comunque periodici. Questo ci serve per rivedere brevemente alcuni concetti che
trovano larga applicazione nella descrizione della fisica dei solidi cristallini.
A.1
Onde
Consideriamo dapprima il moto ondulatorio in un piano, per esempio una corda che viene fatta vibrare. Possiamo
visualizzare il moto rappresentando lo spostamento dalla posizione di equilibrio o in funzione della coordinata
x, o in funzione del tempo t.
L’equazione del moto della corda è della forma seguente, con z = z(x, t) che rappresenta lo spostamento
dalla posizione di riposo:
∂2z
1 ∂2z
=
2
∂x
c ∂t2
(A.1)
Se scriviamo c2 = (∂x2 /∂ 2 z)(∂ 2 z/∂t2 ) = (∂x/∂t)2 , cioè c = ∂x/∂t, è facile rendersi conto che c è una quantità
che ha le dimensioni di una velocità lungo l’asse x. La velocità c può essere costante, oppure dipendere dal
tempo t o da x o da entrambi.
Le soluzioni dell’equazione precedente hanno la forma seguente, a patto che la velocità c non dipenda dal
tempo:
z(x, t) = f (x + ct)
(A.2)
z(x, t) = g(x − ct)
(A.3)
oppure
dove f e g sono due funzioni qualunque di x e t. Il significato fisico di queste soluzioni è facilmente visualizzabile.
Al tempo t = 0, l’onda avrà una certa “forma” o profilo, dato da z(0) = f (x), e sia per esempio quello riportato in
fig A.1. In ogni istante successivo l’onda presenterà lo stesso profilo, solo che questo sarà spostato in direzione
negativa (se c è positiva) di una quantità ct. Quindi la z = f (x + ct) corrisponde ad un’onda di profilo
costante moventesi con velocità c nella direzione x negativa. Parimenti, la z = g(x − ct) rappresenta un’onda
67
68
APPENDIX A. ONDE. SERIE E TRASFORMATE DI FOURIER
z(x,t)
λ or T
x or t
Figure A.1: Diagramma della funzione z(x,t)
di forma costante che si muove con la velocità c nella direzione x positiva. Anche la combinazione lineare:
z(x, t) = f (x + c1 t) + g(x − c2 t) è naturalmente una soluzione dell’equazione d’onda. Se c1 = c2 e f = g,
abbiamo quella che si chiama un’onda stazionaria, un’onda cioè il cui profilo non si muove nel tempo. In tal
caso ci sono dei punti in cui z = 0, che rimangono fissi nel tempo. Come sapete questi punti sono chiamati nodi.
La condizione di onda stazionaria o di onda mobile è determinata dalle condizioni al contorno del problema.
Nel caso che z(x) sia normale al piano, come abbiamo mostrato in figura, l’onda si dice trasversale; nel caso che
coincida con x, l’onda si dice longitudinale. Questo non porta comunque differenze nel trattamento matematico.
Finora abbiamo visto il tipo di soluzione più generale dell’equazione d’onda. Noi siamo particolarmente
interessati alle soluzioni cosiddette armoniche, cioè il cui profilo è una curva sinusoidale, seno o coseno:
z = A cos m(x − ct)
(A.4)
z = A sin m(x − ct)
(A.5)
oppure
Il valore massimo dell’elongazione, A, è detta ampiezza dell’onda. Il profilo dell’onda si ripete a distanze
regolari, 2π/m. Questa distanza, cioè la distanza tra i due punti più vicini con la stessa ampiezza, è la lunghezza
d’onda, λ = 2π/m. Inoltre il tempo impiegato perché un’onda completa passi per un certo punto è detto il
periodo T dell’onda. Pertanto (2π/λ)(x − ct) deve passare attraverso un ciclo completo di valori quando t è
aumentato di T . Quindi (2πcT )/λ = 2π, e T = λ/c. Definendo ν, la frequenza, come inverso del periodo,
abbiamo la ben nota:
νλ = c
(A.6)
Se introduciamo poi la frequenza angolare ω = 2πν, e il vettore d’onda k, cioè un vettore che ha la direzione
e il verso di propagazione dell’onda stessa e modulo |k| = 2π/λ, l’equazione d’onda diviene:
z = A cos(|k|x − ωt)
(A.7)
A.2. SERIE DI FOURIER
69
e la velocità c = ω/|k|. Usando le consuete formule di Eulero e±iy = cos y ± i sin y, possiamo fare una combinazione lineare moltiplicando la seconda equazione per l’unità immaginaria, ottenendo un altro modo di scrivere
un’onda armonica:
z = A exp i(|k|x − ωt)
(A.8)
Quest’onda viaggia in direzione delle x positive. Per un’onda che viaggia in direzione negativa possiamo
fare una combinazione lineare moltiplicando la funzione seno per −i, ottenendo: z = exp i(−|k|x − ωt). Le due
equazioni differiscono nel segno posto davanti al modulo del vettore d’onda. Se ricordiamo che k è un vettore
che ha il verso nella direzione propagazione dell’onda possiamo fare uso della notazione vettoriale e scrivere
un’unica formula generale:
z = A exp i(kx − ωt)
(A.9)
Cosicché se k è concorde con x, l’onda viaggia nella direzione delle x positive, e se è discorde l’onda viaggia in
direzione opposta.
Quanto detto può essere generalizzato in tre dimensioni cioè per il caso di un’onda che si propaga nello
spazio ordinario. In questo caso si definisce come fronte d’onda il piano che un certo istante è individuato da
tutti punti che hanno la stessa ampiezza. Se il fronte d’onda è perpendicolare alla direzione di propagazione,
che è individuata dal vettore k, l’onda si dice piana. Nel caso tridimensionale la funzione d’onda può essere
scritta come:
φ(r, t) = A exp i(kr − ωt)
(A.10)
dove r è un vettore perpendicolare al fronte d’onda.
A.2
Serie di Fourier
Se abbiamo una funzione periodica può essere conveniente espanderla in serie di seni e di coseni secondo
l’espansione detta di Fourier:
∞
f (x) =
a0 X
+
(an cos nx + bn sin nx)
2
n=1
(A.11)
Le condizioni affinchè quest’equazione sia valida è che f (x) abbia al più un numero finito di discontinuità,
di massimi e di minimi. In genere queste condizioni sono soddisfatte per le funzioni che descrivono fenomeni
fisici. Se esprimiamo il coseno e il seno in forma esponenziale tramite le formule di Eulero, possiamo riscrivere
la serie in termini degli esponenziali:
f (x) =
+∞
X
cn einx
(A.12)
n=−∞
con: cn = (1/2)(an − ibn ), c−n = (1/2)(an + ibn ) e c0 = (1/2)a0 . Possiamo dunque usare indifferentemente le
serie di Fourier in seno e coseno o la serie di Fourier in termini esponenziali. Una proprietà importante delle
funzioni termini delle serie è che esse costituiscono un set completo (sono difatti autofunzioni di un’equazione
differenziale). In quanto tali possono essere usate per rappresentare qualunque funzione, ed inoltre sono ortogonali. Ad esempio nel caso delle funzioni esponenziali (essendo le funzioni esponenziali delle funzioni periodiche,
l’integrale va da 0 a 2π o da −π a +π, invece che da −∞ a +∞):
70
APPENDIX A. ONDE. SERIE E TRASFORMATE DI FOURIER
Z
2π
(eimx )∗ einx dx = 2πδmn
(A.13)
0
Quindi possiamo usare le funzioni delle serie come abbiamo fatto con le autofunzioni di un hamiltoniano.
Per esempio per ottenere i coefficienti cn basta moltiplicare la serie per exp(imx)∗ e integrare. Tutti termini
con m 6= n si annullano per cui abbiamo:
1
cn =
π
Z
2π
f (x0 ) exp(−inx0 ) dx0
(A.14)
0
Ovvero per la serie seno e coseno:
an
bn
1
π
=
1
π
=
Z
2π
f (x0 ) cos(nx0 ) dx0
0
Z
2π
f (x0 ) sin(nx0 ) dx0
(A.15)
0
dove abbiamo messo in segno ’ per poter distinguere la x su cui si fa l’integrale dalla x della funzione espansa
in serie:
+∞
X
1
f (x) =
an =
π
n=−∞
·Z
¸
2π
0
0
0
f (x ) exp(−inx ) dx exp(inx)
(A.16)
0
o, ancora più chiaramente se usiamo il seno e il coseno:
f (x)
=
=
¾
Z 2π
Z 2π
∞ ½
1X
0
0
0
0
0
0
f (x )dx +
cos nx
f (x ) cos nx dx + sin nx
f (x ) sin nx dx
π n=1
0
0
0
Z 2π
∞ Z
1 X 2π
1
0
0
f (x )dx +
f (x0 ) cos n(x0 − x)dx0
(A.17)
2π 0
π n=1 0
1
2π
Z
2π
0
0
Quali sono i vantaggi della serie di Fourier rispetto ad altre serie, per esempio quella di Taylor? Anzitutto
esse possono essere usate per rappresentare anche funzioni discontinue. Inoltre sono particolarmente vantaggiose
per rappresentare funzioni periodiche. Se f (x) ha periodo 2π, è solo naturale che noi la espandiamo in una serie
di funzioni con periodo 2π, 2π/2, 2π/3 etc. Naturalmente la periodicità non è necessariamente 2π. Se f (x) è
periodica con periodo 2L, possiamo scrivere:
a0 X n
nπx o
nπx
+
an cos(
) + bn sin(
)
2
L
L
n=1
∞
f (x) =
(A.18)
con
an
bn
=
=
1
L
1
L
Z
Z
+L
−L
+L
−L
f (x0 ) cos(
nπx0
)
L
f (x0 ) sin(
nπx0
)
L
(A.19)
A.2. SERIE DI FOURIER
71
Figure A.2: Onda quadra e sua rappresentazione nello spazio delle frequenze
Consideriamo per esempio un’onda quadra, funzione periodica del tempo t, mostrata in fig. A.2. Sia 2L = T
il periodo dell’onda. Allora 1/T = ν, e ω = 2π/T , quindi:
2
an =
T
Z
T
f (t) cos(nωt)dt
(A.20)
0
e un’equazione analoga per bn . La serie è allora data da:
4V
1
1
1
(cos ωt − cos 3ωt + cos 5ωt − cos 7ωt + .....)
(A.21)
π
3
5
7
Il fatto che compaiono solo i coseni deriva dalla simmetria di f (t). Lo spettro in frequenza sarà allora quello
riportato nella parte destra della figura precedente.
Quindi vediamo che abbiamo potuto esprimere una funzione discontinua, e che se nella coordinata tempo
avevamo un’onda quadra, nella coordinata frequenza, inverso del tempo, abbiamo una frequenza fondamentale
e una serie di armoniche (con peso via via decrescente). Se avessimo considerato l’onda sinusoidale avremmo
avuto solo la frequenza fondamentale.
In aggiunta ai vantaggi di rappresentare funzioni discontinue periodiche, un altro vantaggio della serie di
Fourier è nella risoluzione dei problemi fisici. Supponiamo di voler risolvere l’equazione del moto di una particella
che oscilla guidata dalla forza periodica nel tempo. Se facciamo un’espansione di Fourier della forza, abbiamo
una fondamentale e una serie di armoniche. Le equazioni del moto possono essere risolte per ciascuna delle
armoniche separatamente. Questo è più che un trucco matematico: corrisponde trovare la risposta del sistema
alle frequenza fondamentale e alle armoniche della forza. Quindi in diversi casi nel risolvere un problema fisico
può essere conveniente passare dal dominio dei tempi a quello delle frequenze, o viceversa. Oltre alla coppia
f (t) =
72
APPENDIX A. ONDE. SERIE E TRASFORMATE DI FOURIER
tempo frequenza la serie di Fourier può mettere in relazione anche altre grandezze (l’una il reciproco dell’altra),
come per esempio nel considerare l’equazione di un’onda: φ(r, t) = A exp i(kr − ωt), oltre che ω e t possiamo
considerare la coppia r e k, cioè lo spazio ordinario e lo spazio reciproco. Questo lo vedremo tra poco.
A.3
Trasformata di Fourier
Adesso vediamo come sia possibile rappresentare una funzione non periodica estendendo il campo all’infinito.
In termini fisici questo significa risolvere un singolo impulso un pacchetto d’onda in onde sinusoidali. Per
l’intervallo −L, L una funzione periodica può essere scritta in termine della serie in seno e coseno:
f (x) =
1
2L
Z
L
f (x0 ) dx0 +
−L
∞ Z
1 X L
nπ 0
(x − x) dx0
f (x0 ) cos
L n=1 −L
L
(A.22)
Supponiamo che l’intervallo −L, L sia nello spazio dei tempi, e come in precedenza 2L = T . Allora:
f (t) =
1
T
Z
T
0
f (t0 )dt0 +
∞ Z
2 X T
2nπ 0
(t − t)dt0
f (t0 ) cos
T n=1 0
T
(A.23)
Supponiamo adesso che il periodo T tenda all’infinito ( cioè, la funzione non è più periodica). Poniamo 2nπ/T =
ω, e 2π/T = ∆ω (per T → ∞ difatti il primo termine è finito perché anche n → ∞, mentre il secondo diventa
R +∞
un infinitesimo). Se l’integrale −∞ f (t0 )dt0 esiste ed è finito, quando T → ∞ il primo termine dell’quazione
precedente si annulla, per cui abbiamo:
f (t) =
Z +∞
∞
1X
∆ω
f (t0 ) cos ω(t0 − t)dt0
π n=1
−∞
Ovvero sostituendo la sommatoria con un integrale:
Z
Z +∞
1 ∞
dω
f (t0 ) cos ω(t0 − t) dt0
f (t) =
π 0
−∞
(A.24)
(A.25)
Quest’equazione viene detta integrale di Fourier. Per passare alla forma esponenziale basta tener presente
che l’equazione precedente può essere scritta anche in termini del seno:
Z
Z +∞
1 ∞
f (t) =
dω
f (t0 ) sin ω(t0 − t)dt0
(A.26)
π 0
−∞
Sommando le due equazioni, la seconda moltiplicata per i, e facendo entrambi gli integrali da −∞ a +∞,
abbiamo:
Z +∞
Z +∞
0
1
−iωt
f (t0 )eiωt dt0
(A.27)
e
dω
f (t) =
2π −∞
−∞
Adesso definiamo come trasformata di Fourier della funzione f (t) la
Z ∞
1
g(ω) = √
f (t)eiωt dt
2π −∞
E allora la trasformata inversa è:
(A.28)
A.3. TRASFORMATA DI FOURIER
73
1
f (t) = √
2π
Z
∞
g(ω)e−iωt dω
(A.29)
−∞
La trasformata di Fourier appartiene alla classe matematica delle trasformate, di cui è un caso particolare.
Ciò che la rende particolarmente utile è il fatto che, come abbiamo appena visto, esiste sempre l’operazione di
trasformazione inversa, mentre questo non è necessariamente vero per altri tipi di trasformata. Le equazioni
precedenti definiscono le trasformate di Fourier sotto forma esponenziale. Possiamo naturalmente definire la
trasformata in coseno:
r
Z
2 ∞
f (t) cos ωt dt
g(ω) =
π 0
r Z ∞
2
f (t) =
g(ω) cos ωt dω
π 0
(A.30)
e una analoga per il seno.
Vediamo ora un’applicazione della trasformate. Sia dato un treno finito di onda sinusoidale di frequenza ω0 :
(
sin ω0 t se|t| ≤ N π/ω0
f (t) =
(A.31)
0
se|t| > N π/ω0
con N = un intero. La funzione è rappresentata a destra nella fig. A.3 (N = 2).
Figure A.3: Treno di onda sinusoidale e sua trasformata di Fourier.
Possiamo usare una trasformata nel seno:
r
g(ω) =
Integrando abbiamo:
2
π
Z
N π/ω0
sin ωtdt
0
(A.32)
74
APPENDIX A. ONDE. SERIE E TRASFORMATE DI FOURIER
r
g(ω) =
2
π
½
sin[(ω0 − ω)(N π/ω0 )] sin[(ω0 + ω)(N π/ω0 )]
−
2(ω0 − ω)
2(ω0 + ω)
¾
(A.33)
Per ω0 grande e ω ≈ ω0 , solo il primo termine è importante e corrisponde alla curva disegnata a destra nella
fig. A.3.
Da questo esempio risulta come la trasformata di Fourier possa essere usata per ottenere gli spettri (funzioni
di ω) a partire da un segnale modulato in qualche modo nel tempo, per esempio attraverso un interferometro
in cui uno specchio sia mobile. Questo è il principio di tutte le spettroscopie a trasformata di Fourier. La curva
mostrata sopra ha degli zeri per ∆ω/ω0 = (ω0 − ω)/ω0 = ±(1/N ); ±(2/N ); ... etc. Dal momento che i contributi
fuori dal picco centrale sono piccoli possiamo prendere ∆ω = ω0 /N come una buona misura della dispersione in
frequenza del nostro impulso. Se N è grande (impulso lungo), le dispersione sarà piccola, e viceversa. Se stiamo
trattando onde elettromagnetiche ~∆ω = ∆E. C’è anche incertezza nel tempo, perché la nostra onda di N
cicli richiede 2N π/ω0 secondi per passare. Se prendiamo ∆t = 2N π/ω0 come l’incertezza nel tempo, abbiamo
∆E∆t ≈ h, un analogo classico del principio di indeterminazione.
Che cosa succede se facciamo una trasformata di Fourier di una derivata? Sia:
Z ∞
1
g(ω) = √
f (t)eiωt dt
2π −∞
(A.34)
Facendo la derivata su ambo i membri:
1
g (ω) = √
2π
0
Z
∞
−∞
df (t) iωt
e dt
dt
(A.35)
e integrando per parti:
·
eiωt
g (ω) = √
2π
0
¸+∞
iω
−√
2π
−∞
Z
+∞
f (t)eiωt dt
(A.36)
−∞
Se f (t) si annulla per t → ±∞, abbiamo il semplice risultato:
g 0 (ω) = −iωg(ω)
(A.37)
Cioè la trasformata della derivata di f (t) è −iω volte la trasformata della funzione originale. Questo risultato
è generalizzabile ad una derivata di ordine n:
g (n) (ω) = (−iω)n g(ω)
(A.38)
Come esempio finale facciamo vedere come tramite delle trasformate di Fourier si possa arrivare alla soluzione
dell’equazione d’onda in una dimensione, che come abbiamo visto è la seguente equazione differenziale alle
derivate parziali:
∂2z
1 ∂2z
=
∂x2
c2 ∂t2
(A.39)
Applichiamo la trasformata di Fourier alla coppia spazio/spazio reciproco, cioè moltiplichiamo per eikx e integriamo su x. Abbiamo:
A.3. TRASFORMATA DI FOURIER
75
Z
∞
−∞
∂ 2 z ikx
1 ∂ 2 z ikx
e
dx
=
e dx
∂x2
c2 ∂t2
(A.40)
Adesso definiamo la trasformata di z(x, t):
1
Z(k, t) = √
2π
Z
∞
z(x, t)eikx dx
(A.41)
−∞
e, applicando la regola della trasformata delle derivate, dalla (40) otteniamo:
1 ∂ 2 Z(k, t)
(A.42)
c2
∂t2
Dal momento che non compaiono derivate rispetto a k, l’equazione precedente è una equazione differenziale
ordinaria piuttosto che una equazione differenziale alle derivate parziali. La soluzione è allora molto più facile.
Se all’istante t = 0 z(x, 0) = f (x), abbiamo:
Z ∞
1
Z(k, 0) = √
f (x)eikx dx = F (k)
(A.43)
2π −∞
(−ik)2 Z(k, t) =
La soluzione della equazione differenziale è allora:
Z(k, t) = F (k) exp(±ickt)
(A.44)
Tornando nello spazio x:
z(x, t)
=
=
Z ∞
1
√
Z(k, t)e−ikx dk
2π −∞
Z ∞
1
√
F (k)e−ik(x±ct) dk
2π −∞
(A.45)
Dato che f (x) è la trasformata inversa di F (k), abbiamo alla fine:
z(x, t) = f (x ± ct)
(A.46)
Come avevamo già visto in precedenza. Questo esempio mostra l’utilità della trasformate di Fourier nella
soluzione di problemi fisici.
Riassumendo: le serie e le trasformate di Fourier servono per passare dalla descrizione problema fisico in
termini di una variabile alla descrizione in termini di un’altra, di solito inversa della prima: frequenza contro
tempo, spazio contro spazio reciproco. La serie di Fourier è usata per descrivere una funzione periodica;
l’integrale (o trasformata) di Fourier una funzione non periodica. La relazione tra la serie e l’integrale sono
graficamente illustrate nella fig. A.4.
76
APPENDIX A. ONDE. SERIE E TRASFORMATE DI FOURIER
Figure A.4: Relazione tra serie e integrale di Fourier.