Metodi spettroscopici della materia condensata
Appunti di Lorenzo Tenuzzo
Prof. Stefano Lupi
a.a. 2015/2016
1
Prefazione
Gli appunti che state per leggere sono stati presi durante il corso di Metodi spettroscopici per la materia condensata tenuto dal professor Stefano Lupi presso
l’Università "La Sapienza" di Roma durante l’anno accademico 2015-2016.
Sono per lo più sbobinature delle lezione riorganizzate per rendere la divisione
dei vari argomenti più chiara. Non sono state sottoposte alla valutazione del
professore quindi mi scuso per errori o sviste sicuramente presenti all’interno.
Alcune figure sono state ottenute con paint (e si vede) mentre altre sono state
prese direttamente dai lucidi mostrati durante le lezioni. E’ consigliato, per
capire al meglio queste dispense, di aver seguito e studiato i corsi di Materia
Condensata e di Fisica dei Solidi I.
La figura in copertina è il dipinto "Rooms by the sea" dell’artista americano
Edward Hopper realizzato nel 1951.
Buona lettura
Lorenzo Tenuzzo
INDICE
2
Indice
1 Introduzione
3
2 La spettroscopia
2.1 Operatore di Scattering . . . . . . . . . . . . . . . . . . . . . . .
2.2 La sezione d’urto . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Teorema della risposta lineare per la spettroscopia . . . .
5
10
18
19
3 Scattering da neutroni termici
26
3.1 Funzione di Van Hove, funzione di scattering, fattore di struttura
statico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Studio di un gas perfetto . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Studio di un gas reale . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Studio di un solido ordinato . . . . . . . . . . . . . . . . . . . . . 37
3.4.1 I fononi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.4.2 Risposta Coerente e Risposta Incoerente . . . . . . . . . . 44
3.5 Studio di un solido amorfo e di un liquido . . . . . . . . . . . . . 61
4 Spettroscopia da campo elettromagnetico
67
4.1 Dalle equazioni di Maxwell alla quantizzazione del campo elettromagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2 Interazione radiazione-materia . . . . . . . . . . . . . . . . . . . . 71
4.2.1 Processi ad 1 fotone: assorbimento ed emissione . . . . . 72
4.2.2 Proprietà ottiche e Modello di Drude . . . . . . . . . . . . 77
4.2.3 Transizioni interbanda e intrabanda e processo sperimentale 88
4.2.4 Interazione con un gas di elettroni liberi . . . . . . . . . . 91
4.2.5 Interazione con un reticolo di ioni e Modello di Lorentz . 96
4.2.6 La polarizzabilità . . . . . . . . . . . . . . . . . . . . . . . 101
4.3 Scattering da campo elettromagnetico . . . . . . . . . . . . . . . 106
4.3.1 Studio di un cristallo di atomi . . . . . . . . . . . . . . . 113
4.3.2 Studio di un gas perfetto . . . . . . . . . . . . . . . . . . 116
4.3.3 Studio di un gas reale . . . . . . . . . . . . . . . . . . . . 117
4.3.4 Studio di un gas biatomico di molecole scorrelate: Raman
vibrazionale e Raman Rotazionale . . . . . . . . . . . . . 119
5 Applicazioni Biologiche della spettroscopia IR
6 Spettroscopia risolta nel tempo
6.1 Tecniche di laser pulsing . . . . . . . . . . . . . . . .
6.2 L’esperimento di spettroscopia pump-probe . . . . .
6.2.1 Esempio di un metallo . . . . . . . . . . . . .
6.2.2 Esempio di un semiconduttore . . . . . . . .
6.2.3 Esempio di un superconduttore . . . . . . . .
6.3 Spettroscopia tramite fluorescenza . . . . . . . . . .
6.4 Fotoemissione risolta in angolo e in tempo: Tr-Arpes
6.5 Diffrazione a raggi-x ultraveloce . . . . . . . . . . . .
Riferimenti bibliografici
121
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
131
135
139
139
144
145
147
150
151
154
1
1
INTRODUZIONE
3
Introduzione
Il programma di massima del corso prevede una prima parte sulle generalità relative alla spettroscopia intesa come interazione tra il sistema fisico che si vuole
studiare (target) con una sonda spettroscopica (probe). L’interazione probetarget in regime lineare implica, in generale, che l’interazione sia così debole che
si stia scattando, tramite il probe, una "fotografia" (con una certa risoluzione
spaziale e temporale) del sistema target come se fosse non perturbato. Questo
non significa necessariamente che la perturbazione sia debole, bensì che in certe situazioni si possa considerare che essa non determini grosse variazione sul
sistema. Quindi un sistema che subisce questo tipo di eccitazioni, mantiene le
eccitazioni con la stessa curva di dispersione energia-impulso, le stesse frequenze
caratteristiche ecc ecc, in presenza o in assenza della perturbazione esterna.
Tutto ciò può essere trattato in forma del tutto generale dal punto di vista matematico introducendo l’operatore di scattering (o matrice di scattering) che è
una trattazione mutuata dalla fisica delle particelle elementari: alla matrice di
scattering verrà associato il teorema della risposta lineare.
Tutto ciò serve ad inquadrare in modo generale, al di là delle approssimazioni
che siamo abituati a fare, l’interazione tra un probe e un target. Quando però
verrà scritto equilibrio e fuori equilibrio, si comincerà a descrivere cosa succede
quando si utilizzano sonde spettroscopiche particolarmente intense oppure che
hanno delle caratteristiche temporali particolari. Nella maggior parte dei casi
fino a circa 15 anni fa, le spettroscopie usate per studiare sistemi fisici erano
nel campo delle frequenze e dei vettori d’onda, per cui si studiavano proprietà
all’equilibrio con l’idea di non perturbare particolarmente il sistema. In realtà da 15/20 anni a questa parte con lo sviluppo dei laser ultraveloci e con le
tecniche ultraveloci in generale, si riescono a fare misure in cui, piuttosto che
studiare le eccitazioni nel dominio delle frequenze le si studiano nel dominio dei
tempi, riuscendo ad eccitarle e studiare la loro evoluzione e decadimento temporale. Questa spettroscopia è ben diversa da quella a cui si era abituati perché,
innanzi tutto, fornisce informazioni "fuori equilibrio" (cioè si perturba in modo
consistente un sistema e ne si studia il decadimento temporale) e in secondo luogo permette di studiare i tempi caratteristici di evoluzione di un sistema fisico.
Le prime misure su scale temporali ridotte (ordine del picosecondo) sono state
realizzate (ed hanno fruttato il nobel per la chimica nel 2013 ad Arieh Warshel)
per studiare l’evoluzione temporale delle reazioni chimiche indotte dall’esterno.
Successivamente vedremo altre tecniche come lo scattering di neutroni, tecnica
potentissima in fisica, chimica e biotecnologie, concentrandoci su cosa si può
studiare con una determinata tecnica.
L’idea di base è che quando si fa interagire una sonda spettroscopica con il sistema, la sonda che è descritta da una propria hamiltoniana interagisce con il
sistema (la radiazione elettromagnetica interagisce con i dipoli, i neutroni interagiscono con i nuclei del target, lo scattering Raman e Brillouin interagisce con
le fluttuazioni di densità del sistema ecc ecc). Per ogni sonda spettroscopica
è molto importante definire quali sono le eccitazioni e le fluttuazioni del sistema che interagiscono direttamente con quella particolare
sonda e capire quindi che tipo di informazione si può ricavare.
Obiettivo del corso è rendere lo studente, di fronte ad un problema fisico, capace
di scegliere la tecnica spettroscopica adeguata.
Infine verrà studiata la spettroscopia odierna: cosa si intende per spettroscopia
1
INTRODUZIONE
4
pump-probe risolta nel tempo, cosa significa risolvere in tempo una eccitazione
di un sistema. Quando si parla di risoluzione temporale, buona parte delle di eccitazione che vivono nei sistemi condensati hanno tempi caratteristici che vanno
dai picosecondi agli attosecondi (10−12 − 10−18 s). Un buon sistema elettronico
ha sensibilità delle centinaia di picosecondi (ps), per andare a tempi minori bisogna usare laser ultraveloci, al femtosecondo (fs) o all’attosecondo (as), e questo
dà luogo a quella che viene chiamata spettroscopia ultraveloce pump-probe e ne
vedremo qualche applicazione.
Normalmente l’ambizione di un sistema spettroscopico è, in linea di principio,
quello di fotografare al meglio le eccitazioni, di risolvere la loro dinamica temporale, e di sapere in che range spaziale queste vivono. In altri termini l’interesse
è quello di studiare con risoluzione spaziale adeguate applicazioni nanotecnologiche.
Sappiamo che se si ha una radiazione elettromagnetica di lunghezza d’onda λ,
non è possibile focalizzare il fascio su distanze minori o dell’ordine di λ stessa
(legge della diffrazione). Quindi se si vuole misurare con radiazione nell’infrarosso (circa 10 µm = 1000 cm−1 ) non è possibile ad esempio focalizzare (qualunque
sia lo strumento) un oggetto più piccolo di 10 µm, anche se esso ha spettro di
assorbimento in quella regione di frequenza. Di fatto si va a misurare una zona
più grande che contiene l’oggetto target ma anche altre cose. Tuttavia esiste
la tecnica di spettroscopia ottica in campo vicino che permette di fare spettroscopia trascurando i limiti della diffrazione. E’ legata a sonde ottiche (quindi
radiazione elettromagnetica) ed è molto di moda ultimamente.
La modalità d’esame è la seguente: si porta un argomento a piacere di quelli
compresi nel programma, si porta inoltre una tesina fra quelle indicate sul sito
del professore (presentazione con slide di uno o più articoli che si riferiscono ad
un certo sistema fisico o tecniche specifiche) e infine a discrezione del prof. ci
sono domande sul resto del programma. Ci sono appelli definiti ma si prende
l’accordo con il prof. a prescindere dalla data ufficiale.
2
2
LA SPETTROSCOPIA
5
La spettroscopia
Quando si parla di target in materia condensata si intende un mondo molto
ampio che va dai sistemi di macromolecole in ambito biologico alla fisica dello
stato solido ai beni culturali. Nella maggior parte dei casi un sistema condensato vive all’equilibrio termodinamico ed è caratterizzato da eccitazioni sia di
singola particella (elettroni in un metallo, in cui ogni elettrone sottoposto ad
urti elastici si muove in un certo modo, o le vibrazioni dei gruppi chimici o
molecole) che di modi collettivi. Il concetto di modo collettivo è stato esteso
recentemente anche a sistemi poco attinenti con la fisica. In un sistema condensato si trovano, coesistenti, eccitazioni di singola particella e modi collettivi
e spesso sono l’uno lo specchio dell’altro: ad esempio, in un metallo in cui ci
sono elettroni liberi, i modi di singola particella si riferiscono ai modi dei singoli elettroni che si muovo scatterati nel metallo, sottoposti all’interazione con
gli ioni ed elettrone-elettrone; tuttavia i singoli elettroni danno luogo a modi
collettivi, cioè è l’intero "gas di elettroni liberi" che si muove e la sua densità
fluttua. Un altro esempio sono i fononi, che sono le eccitazioni quantistiche
relative al modo collettivo che è la variazione di densità di un cristallo. Buona
parte di queste cose sono traducibili in meccanica quantistica: se si ha un modo
collettivo che contiene molte particelle, esso può di solito essere quantizzato, e
i modi quantistici si chiamano fononi nel caso di un reticolo, magnoni per le
eccitazioni collettive di un sistema di spin ecc ecc.
Non necessariamente una spettroscopia capace di misurare i modi collettivi di
un sistema è in grado di misurare anche le eccitazioni di singola particella.
L’idea generale dell’interazione tra un probe spettroscopico il target sta in questo: si ha un certo tipo di probe, che si cerca di preparare nel modo più preciso
possibile. Questo significa che si conoscono le energie iniziali (ad esempio degli
elettroni) e quindi il fascio è il più monocromatico possibile, con vettore d’onda e
polarizzazione ben definiti. In pratica lo stato iniziale del probe deve essere ben
definito. Questo perché si manda il probe ben conosciuto sul sistema e ciò che
si misura è il probe stesso dopo che ha interagito, cioè si misurano quali effetti
il target ha avuto sul probe. La misura di come il probe è stato perturbato dall’interazione con il sistema spettroscopico (energia finale, vettore d’onda finale e
polarizzazione finale) permette di dedurre da leggi di conservazioni generali con
che cosa il probe ha interagito e che tipo di proprietà hanno i modi collettivi o
di singola particella che hanno interagito col probe.
In altri termini misurando le tre quantità citate (o altre a seconda del probe),
−
cioè per trovare il vettore d’onda scambiato →
q dal probe col sistema si misura
la differenza
→
−
→
−
→
−
→
−
→
−
q = k pf − k pi = k ti − k tf
→
−
→
−
dove k ti,f e k pi,f rappresentano rispettivamente i vettori d’onda iniziale e finale
di target (t) e probe (p). Se ad esempio il sistema parte da uno stato a vettore
→
−
−
d’onda nullo k ti = 0, →
q rappresenta il vettore d’onda che il target ha acquisi−
to grazie all’interazione. All’interno di →
q ci possono essere vari fenomeni, ad
→
−t
→
−t
esempio può capitare che k f < k i che è chiamato processo anti-stokes: processo in cui il probe guadagna vettore d’onda ed energia a sfavore del sistema.
Il processo complementare è quello stokes in cui è la sonda a fornire energia ed
impulso al sistema.
Se si considera il sistema come isolato vale, per l’energia, una relazione analoga
2
LA SPETTROSCOPIA
6
Figura 1: Curve di dispersione del silicio nella prima zona di Brillouin nello
spazio reciproco.
a quella vista prima per il vettore d’onda, e quindi, con evidente significato dei
simboli si ha che
~ω = Eip − Efp = Eft − Eit
da cui si possono dedurre moltissime informazioni.
In figura 1 si vede il grafico di dispersione del silicio in cui si ha la frequenza in THz (1012 Hz) vs il vettore d’onda in diversi punti della prima zona di
Brillouin nello spazio reciproco. Le curve sono le curve di dispersione fononiche
(frequenza-impulso) e dicono che a vettori d’onda diversi l’energia che serve per
eccitare il reticolo è in generale diversa. Dispersione vuol dire che le frequenze
caratteristiche di oscillazione dell’intero reticolo dipendono dal vettore d’onda
che si considera. Se si usano i neutroni e si misura il vettore d’onda scambiato, le
−
quantità →
q e E = ~ω, stanno campionando rispettivamente l’asse delle ascisse
e quello delle ordinate. L’idea è che si mandi la sonda sul sistema misurando,
ad esempio in un processo stokes, il momento che è stato ceduto al target ad
una certa energia specifica (misurata in quanto il neutrone ha perso energia)
ed è possibile così campionare punto dopo punto la curva di dispersione dell’eccitazione collettiva (fononica in questo caso). Questo tipo di processo fornisce
−
nello spazio di Fourier →
q , ω la fotografia dell’eccitazione che ha interagito con
il neutrone.
Sostituendo al neutrone un altro tipo di sonda e si possono così campionare curve di dispersione in generale. Per essere più precisi, le curve di dispersione sono
l’espressione fisica dei modi collettivi, che in generale in un sistema condensato è descritto dalla curva di dispersione vettore d’onda-energia, ma che non è
necessariamente vero per eccitazioni di singola particella (ma le equazioni viste
sono valide in generale, magari estendendole alla polarizzazione e al momento
angolare).
In ogni caso, riassumendo, l’idea di funzionamento è la seguente:
• conoscere al meglio lo stato cinematico iniziale del probe
2
LA SPETTROSCOPIA
7
• misurare lo stato cinematico finale del probe (che può essere costituito da
molti stati finali)
• dedurre informazioni sul sistema.
Quando si parla di spettroscopia da neutroni (NS: neutron scattering), normalmente si usano neutroni termici. Un neutrone termico è un neutrone che ha
un’energia media dell’ordine di 300 K, che corrisponde a circa 25 meV. Per fare spettroscopia da neutroni c’è bisogno di un reattore nucleare che produca
neutroni per fissione (che hanno energie dell’ordine del MeV),che vengono poi
"raffreddati", cioè vengono fatti passare in un moderatore più volte (di solito
acqua e grafite, perché gli atomi di carbonio sono leggeri e la collisione con un
atomo che ha massa 12 volte quella del neutrone è efficace per ridurre l’energia
"per urto") fino a che non hanno energia termica di 25 meV. Ciò è interessante
perché se si prende la curva energia-impulso dei neutroni e si cerca di ricavare
→
−
−1
k , si ottiene un valore di 108 cm−1 , cioè 1 Å . Questo significa che il vettore d’onda di un neutrone termico è paragonabile al vettore d’onda del bordo
zona di una cella di Brillouin. Se si prende la luce, e si impone di avere un
vettore d’onda pari a 108 cm−1 , si trova che si deve un’energia di 1 keV (che è
all’incirca al confine fra UV e raggi x). Il punto è che se si vuole eccitare una
eccitazione di bassa energia (nello stato condensato nella maggior parte dei casi,
qualunque sia l’eccitazione, hanno energia caratteristiche dell’ordine di qualche
decina/centinaia di meV) se si entra con un neutrone termico di 25 meV e si
crea un fonone di 10 meV, la variazione è di 15 meV che è quindi una quantità
apprezzabile dell’energia iniziale. Se si vuole fare la stessa cosa con un fotone
di 1 keV e avere quindi un fonone con energia di 10 meV, il fotone dopo aver
interagito avrà un’energia di 999.990 eV con una variazione relativa di 10−6 per
cui si deve avere una strumentazione con potere risolutivo molto elevato per
poter apprezzare questa differenza.
Se il probe ha un’energia bassa ma contemporaneamente un grande vettore d’onda in grado di seguire tutta la curva di dispersione, ciò è molto conveniente in
quanto le variazioni che si hanno durante il processo di interazione sono facilmente misurabili e il grande vettore d’onda permette di scambiare da zero fino
al vettore d’onda massimo e "scansionare" così tutta la curva di dispersione.
Da questo punto di vista quindi i neutroni sono più convenienti della radiazione
elettromagnetica. Se si usano invece gli elettroni bisogna avere energie di 100
eV che sono, tutto sommato, facili da ottenere.
Si cerca quindi di scegliere una sonda spettroscopica con energia paragonale o leggermente maggiore delle energie caratteristiche si vogliono eccitare.
→
−
La lunghezza d’onda dei neutroni termici che abbiamo descritto è λ = 2π/| k | =
1 Å, per cui con questi neutroni in linea di principio si possono risolvere spazialmente oggetti della dimensione media dell’ordine di λ. Questo tipo di spettroscopia permette quindi di studiare oggetti nanoscopici.
Se si volesse usare la radiazione elettromagnetica nel visibile (λ ≈ 500 nm) al
meglio si possono risolvere 500 nm, e quindi per rimpicciolire questa quantità
e risolvere oggetti più piccoli bisogna aumentare l’energia, cioè andare verso i
raggi x, ma in questo caso si potrebbe non essere risonanti con le eccitazioni che
si vogliono studiare.
Le condizioni che si vogliono soddisfare quindi sono:
2
LA SPETTROSCOPIA
8
• poter risolvere spazialmente l’oggetto della misura (microscopia=vedere
un oggetto);
• essere in risonanza in energia con l’eccitazione da studiare (spettroscopia="vedere" l’eccitazione).
A parte i sistemi naturali (atomi e molecole che hanno dimensioni nell’intorno
dell’angstrom o del nanometro) oggi c’è un enorme sviluppo nella costruzione di
oggetti nanometrici nonostante un sistema di dimensioni macroscopiche abbia
delle proprietà fisiche che non necessariamente si mappano sulle proprietà del
sistema dopo aver ridotto la sua dimensione (non c’è invarianza di scala) e molti
sistemi presentano delle disomogeneità caratteristiche che ne determinano molte
proprietà su scala mesoscopica (dimensioni < 1 µm). Tuttavia c’è un interesse
pratico e tecnologico nel diminuire le dimensioni degli oggetti (transistor sempre
più piccoli e più veloci, celle fotovoltaiche nanostrutturate che hanno efficienze
più alte rispetto a celle della dimensione del micron). Normalmente le tecniche
sperimentali per costruire oggetti piccoli si chiamano tecniche litografiche che,
ad oggi, riescono a costruire oggetti dell’ordine di qualche nm. Quindi dato l’interesse intorno a sistemi nanometrici e mesoscopici sia naturali che artificiali, si
vogliono studiare le eccitazioni di questi oggetti risolvendoli singolarmente. Ad
esempio in biofisica c’è un interesse fondamentale nel studiare il comportamento
della singola cellula anche a livello sub-cellulare; una cosa fondamentale fatta
negli anni 80’ è stato lo studio dell’assorbimento infrarosso di singole cellule
durante il processo di mitosi (separazione cellulare). Focalizzando la radiazione
infrarossa sulla cellula si può misurare lo spettro caratteristico del DNA, della
membrana lipidica e di altre strutture sub-cellulari e illuminando la cellula che
sta avendo un processo fisiologico non la si disturba molto (si aumenta la temperatura di qualche grado ma non la si uccide come accadrebbe ad esempio usando
la luce UV). Si devono ovviamente scegliere cellule della dimensione di qualche
decina di µm (un globulo bianco misura circa 5 µm), mentre i fili di Juss che
sono oggetti a cavallo fra viventi e non viventi possono avere dimensioni anche
delle centinaia di nm. La morte programmata di alcune cellule si può dedurre
dallo spettro infrarosso perché si modificano in maniera molto evidente righe
spettrali legate a gruppi chimici specifici, quindi studiando la singola cellula si
può avere informazioni sia sulla cellula che sulla morte programmata stessa.
Vogliamo ora parlare della risoluzione temporale. Nei sistemi condensati si ha
a che fare sostanzialmente con le fluttuazioni : il sistema in equilibrio termodinamico ha una certa temperatura, pressione e altre quantità termodinamiche
medie che sono relative sostanzialmente a una media su dimensioni fisiche e su
una scala dei tempi macroscopica. Tuttavia un sistema in equilibrio termodinamico, istante per istante e punto per punto fluttua in maniera abbastanza
consistente. In certi casi sono proprio le fluttuazioni che tendono a divergere
che lo portano da una fase specifica ad un’altra (transizioni di fase): ad esempio se si prende un solido e ne si alza di molto la temperatura, si manifesta la
liquefazione, cioè quando la distanza quadratica media della fluttuazione raggiunge circa un terzo della distanza di equilibrio fra gli atomi (nel NaCl passa da
0.01 Å a circa 0.3 Å). Quindi la fluttuazione dalla posizione di equilibrio determina un certo tipo di effetto. Nell’accezione generale, parlare di fluttuazioni è
equivalente a parlare di eccitazioni di un sistema. Le eccitazioni che un sistema
manifesta sono perciò quelle che determinano le sue fluttuazioni dalla posizione
di equilibrio. Un sistema fluttua con delle eccitazioni proprie, che possono esse-
2
LA SPETTROSCOPIA
(a) Stormo di storni.
9
(b) Banco di sardine.
Figura 2: Modi collettivi nel mondo animale.
re di tipo collettivo. Le fluttuazioni dalla posizione di equilibrio in un cristallo
danno luogo a delle eccitazioni che modulano la densità (localmente) rispetto a
quella media, e i quanti di oscillazione, cioè i quanti di fluttuazione di densità
si chiamano fononi. Invece le onde di densità di carica in un cristallo che ha
elettroni liberi, cioè le eccitazioni sono modi di densità di carica collettivi in cui
tutti gli elettroni oscillano in fase, e i quanti di oscillazione si chiamano plasmoni. C’è una certa faunistica in materia di tipologie di fluttuazioni che hanno
in meccanica quantistica una propria definizione. Un aspetto interessante è il
seguente: se si prendono degli elettroni in un metallo questi sono fermioni che
quindi obbediscono alla statistica di Fermi-Dirac, ma studiando il modo collettivo, i quanti corrispondenti sono dei bosoni che obbediscono a una statistica
diversa, quella di Bose-Einstein.
Lo studio dei modi collettivi, sia fenomenologico che formale è nato nello studio
del mondo condensato, ma molte delle scoperte riferite a questi modi sono state
successivamente applicate a mondi molto diversi. Un esempio sono i modi collettivi degli stormi di storni (a Roma si vedono) o dei banchi di sardine (fig. 2).
Questi sono modi collettivi in cui viene modulata la densità "di storno" o "di
sardina". Modi collettivi di questo tipo esistono in natura in molti campi. Se in
cristallo le fluttuazioni di densità vengono determinate dalla temperatura, nei
gruppi di animali ciò avviene per l’intervento di un fattore esterno, ad esempio
un predatore.
Questo tipo di modi collettivi dal punto di vista della meccanica quantistica
viene descritto esattamente come i modi collettivi fononici in un cristallo.
Un modo collettivo è determinato dalla presenza di un interazione fra i singoli
componenti. Quando si crea una disomogeneità, essa si propaga attraverso i
singoli componenti del modo, che quindi, affinché vi sia propagazione, devono
"parlarsi".
Quello che è interessante è anche studiare il moto di singola particella, di solito
del tutto disordinato. La spettroscopia di neutroni è l’unica tecnica la cui misura
fornisce informazioni contemporaneamente sul collettivo e sul singolo. L’interesse nello studiare entrambi gli aspetti è che si ottengono informazioni diverse
sullo stesso sistema: i modi danno informazioni sui potenziali di interazione, i
moti di singola particella sulla cinematica dell’oggetto preso come singolo.
Quali sono i tempi caratteristici della materia condensata e quali tempi devono
avere gli strumenti per seguirne la dinamica?
Quando si parla di tempo caratteristico di un’eccitazione, pensando all’oscillatore armonico, per dire che l’oscillare abbia effettivamente oscillato si direbbe
2
LA SPETTROSCOPIA
10
che bisogna attendere almeno mezzo periodo. Il mezzo periodo è il tempo per
cui possiamo dire che la vita di un’oscillazione la rende effettivamente definibile come tale. Ciò significa che, poiché il periodo di vita di un’oscillazione è
2π
dove f è la frequenza caratteristica, possiamo dire che per un fonone
T =
f
che ha frequenze caratteristiche dell’ordine del THz il tempo medio del periodo
di oscillazione è 1 ps. Questo è generalizzabile a tutte le eccitazioni per calcolare
il tempo necessario per misurare effettivamente un’oscillazione.
Prendiamo ad esempio l’atomo di idrogeno, con un elettrone 1s ed energia caratteristica che è la costante di Rydberg cioè 1 Ry = 109737 cm−1 = 3.28984 · 1015
Hz. Si trova che il tempo caratteristico semi-classico di rivoluzione dell’elettrone
nell’orbita 1s è di circa 800 · 10−18 s = 800 as. Tanto più l’energia è alta tanto
più il tempo caratteristico risulta piccolo. Quindi se si vuole fare una fotografia
temporale di questo fenomeno, la sonda spettroscopica deve avere una durata
temporale almeno uguale o più piccola della vita media di quest’eccitazione. In
questo caso si ha bisogno di un "otturatore" che si apra e chiuda con tempi dell’ordine di centinaia di attosecondi. Le vibrazioni di una macromolecola hanno
tempi caratteristici dell’ordine di un centinaio di fs, quindi bisogna avere sonde
con tempi delle decine di fs.
Questo non è affatto banale: le sonde spettroscopiche standard sono di tipo
steady-state (emettono in maniera continua e non permettono di fare fotografie
temporali), mentre la spettroscopia risolta nel tempo è nata con l’invenzione dei
laser titanio-zaffiro (il mezzo attivo è un cristallo di zaffiro Al2 O3 drogato con
ioni di titanio T i3+ ), che ormai sono oggetti commerciali. Un laser che emette
luce pulsata con range temporali nelle decine di fs costa circa 100 mila euro.
Esistono laser più sofisticati in laboratori non commerciali per avere prestazioni
più elevate: il record italiano è stato raggiunto al politecnico di Milano con 100
as, mentre il record mondiale (USA) si aggira intorno ai 20 as.
Se si volesse coniugare la possibilità di fare una fotografia temporale in scala
temporale piccola e simultaneamente una fotografia spaziale che risolva qualche decina di nm, si dovrebbe usare un laser ad elettroni liberi (Free-Electron
Laser). I FEL si trovano uno a Triste (si chiama Fermi), un altro prototipo si
trova a Frascati. Il FEL più potente che emette impulsi a di luce ad λ = 1 Å
con una durata di 10 fs (cioè si hanno raggi x a 10 fs) si chiama SLAC e si
trova in California, a Stanford. E’ attualmente in costruzione il FEL europeo,
ad Amburgo e si chiama XFEL. Queste macchine sono installazioni di ricerca,
non da laboratorio, soggette ad un comitato che valuta ogni singolo progetto ed
assegna di conseguenza il tempo macchina.
2.1
Operatore di Scattering
La situazione di partenza è schematizzata dalla figura 3. Un sistema condensato
qualsiasi che possiamo chiamare target, è caratterizzato a tempi t < t∗1 da una
b t e da stati |ti i. Si ha anche un certo probe spettroscopropria hamiltoniana H
b p . Si accende
pico caratterizzato da stati |pi i e da una propria hamiltoniana H
l’interazione a tempi t ≥ t∗1 e la sorgente spettroscopica comincia ad interagire
col sistema condensato dal quale vogliamo ottenere informazioni. L’interazione
si manifesta nell’intervallo t∗1 ≤ t ≤ t∗2 , intervallo normalmente macroscopico
2
LA SPETTROSCOPIA
11
Figura 3: Schematizzazione di un processo spettroscopico. I pedici p e t indicano
rispettivamente il probe e il target.
(ma non necessariamente), e l’hamiltoniana totale si scrive come:
b =H
bt + H
b p +Vb (t)
H
| {z }
(2.1)
H0
il termine Vb (t) è quello che determina l’interazione tra la sorgente spettroscopica
del sistema in esame e quella che ci permette di studiare il sistema stesso.
b =H
bt + H
b p = H0 perché non c’è
Per tempi t ≤ t∗1 l’hamiltoniana è data solo da H
interazione, mentre per tempi t ≥ t∗2 la sonda spettroscopica si divide in vari stati
finali |pf i. Ad esempio se stiamo usando fotoni in un esperimento di diffusione,
dopo l’interazione col sistema molti fotoni (la maggior parte) proseguirà nella
stessa direzione di partenza mentre altri saranno scatterati in altre direzioni e
con diverse energie. In generale gli stati del probe iniziale e finale contengono
diversi parametri, come enegia, momento angolare, vettore d’onda ecc. :
|pi i = |Epi , J i , k i i
|pf i = |Epf , J f , k f i
Lo stato iniziale lo si cerca di preparare al meglio, in modo "puro" nel senso quantistico del termine cioè con la miglior definizione possibile dei parametri
generali dello stato cinematico (cioè con la migliore conoscenza possibile di energia, momento angolare, vettore d’onda ecc.). Lo stato finale invece tiene conto
dei fenomeni scatteranti: se le energie del probe iniziale e finale sono identiche
normalmente si parla di scattering elastico, ed è ciò che si vuole misurare.
Per descrivere un sistema di questo tipo nell’intervallo t∗1 ≤ t ≤ t∗2 , lo stato
dipendente dal tempo, che è autostato dell’intera hamiltoniana, viene chiamato
|φ(t)i. Quest’oggetto ha le seguenti caratteristiche:
|φ(t < t∗1 )i = |pi i |ti i
|φ(t > t∗2 )i = |pf i |tf i
Per tempi inferiori all’accensione dell’interazione l’hamiltoniana si riconduce ai
due oggetti |pi i , |ti i che non sono interagenti e quindi al loro prodotto. Poi
il sistema evolve in uno stato che non sarà più il prodotto dei due ket iniziali
(potrebbe anche non essere la loro combinazione lineare), e infine per tempi superiori a t∗2 si ritorna al prodotto degli stati finali (con l’idea che possono esserci
2
LA SPETTROSCOPIA
12
tanti stati finali per effetto dell’interazione). La perturbazione può essere forte
quanto si vuole e ciò che si impara con l’approssimazione della perturbazione al
primo ordine è solo un caso particolare.
Come si può calcolare |φ(t)i in modo generale?
In presenza di perturbazioni che, in linea di principio, possono dipendere dal
tempo (oscillazioni di un campo elettromagnetico, accensione e spegnimento di
un interruttore), per studiare l’evoluzione degli stati quantistici si hanno a disposizione determinati strumenti matematici. Si potrebbe scrivere un’equazione
di evoluzione temporale di Schrödinger:
i d
|φ(t)iS = (Ht + Hp + V ) |φ(t)S i
~ dt
dove il pedice S indica che siamo in rappresentazione di Schrödinger. La rappresentazione di Schrödinger è quella in cui gli stati quantistici dipendono dal
tempo ed evolvono nel tempo in base all’equazione appena mostrata. L’operatore che determina l’evoluzione è l’operatore totale Ht + Hp + V dato dalla
somma di operatori che si ritengono indipendenti dal tempo. Quindi in questa
rappresentazione tutta la dipendenza temporale si trova negli stati. Invece nella
rappresentazione di Heisenberg sono gli stati che sono costanti e gli operatori
invece che dipendono dal tempo, per cui in questo caso si scrive un’equazione
evolutiva degli operatori tramite i commutatori.
Esiste una rappresentazione intermedia, che noi useremo da ora in poi, che si
chiama rappresentazione di Interazione (o di Dirac), in cui l’evoluzione temporale degli stati per effetto dell’interazione dipende solo dall’operatore di interazione, mentre l’evoluzione temporale degli operatori dipende dall’hamiltoniana
imperturbata:
i d
|φ(t)iI = VI (t) |φ(t)iI
(2.2)
~ dt
d
∂VI (t)
i~ VI (t) = i~
+ [VI (t), Ht + Hp ]
(2.3)
dt
∂t
il pedice I indica l’uso della rappresentazione di interazione. Il primo termine
a destra dell’equazione (2.3) è presente solo se l’operatore è esplicitamente dipendente dal tempo, altrimenti l’unico termine a dare l’evoluzione temporale
dell’operatore è il commutatore tra l’operatore di interazione e l’hamiltoniana
parziale. Nella rappresentazione di Heisenberg l’unica equazione di evoluzione
è la (2.3) in cui si trovano tutti gli operatori all’interno del commutatore.
Siamo interessati a studiare come evolve il target, cioè le sue eccitazioni, e per
farlo si misura macroscopicamente cosa succede al probe, da cui si deducono le
informazioni microscopiche. Queste informazioni microscopiche sono contenute
nello stato generale che dipende dal tempo per effetto dell’interazione probetarget. Nella rappresentazione di interazione l’equazione di evoluzione dello
stato generale è la (2.2), che dipende da VI (t). Se V fosse zero lo stato non
evolverebbe, cioè sarebbe:
|φ(t)iI = |φ(t)iS = |pi i |ti i
∀t
(2.4)
Risolvendo l’equazione differenziale al primo ordine (2.2) con le date condizioni
iniziali (2.4) si ottiene:
Z ∗
i t2 c
|φ(t∗2 )i = |ii −
VI (t) |φ(t)i dt
(2.5)
~ t∗1
2
LA SPETTROSCOPIA
13
cioè la soluzione integrale dell’equazione temporale in forma derivata, dove |ii
è lo stato iniziale |pi i |ti i. Questa equazione è risolvibile come quella derivata,
cioè è irrisolvibile. La soluzione infatti dipende dallo stato |φ(t)i ai tempi t∗1 e
t∗2 , che è sconosciuto ed è proprio la soluzione che si sta cercando. Questo tipo
di equazione è un’equazione integrale implicita detta di Fredholm.
In forma integrale però si può trovare una soluzione iterativa: se V fosse nulla
lo stato a tempi qualsiasi, come già detto, sarebbe |ii. Allora si può dire che
la soluzione all’ordine zero è esattamente |ii. Sostituendo la soluzione di grado
zero nella (2.5) si può ottenere quella di grado 1, di grado 2 e così via. Si ottiene:
|ii
grado 0 :
(2.6)
1
|φ(t∗2 )iI = |ii −
grado 1 :
2
|φ(t∗2 )iI
grado 2 :
i
~
i
= |ii −
~
Z
t∗
2
t∗
1
Z
t∗
2
t∗
1
cI (t) |ii dt
V
"
cI (t2 ) |ii − i
V
~
(2.7)
Z
t0
t∗
1
#
cI (t1 ) |ii dt1 dt2
V
(2.8)
svolgendo la parentesi nella (2.8), si può scrivere esplicitamente la soluzione
iterativa di grado 2, cioè:
2 Z t∗2 Z t0
Z t∗2
i
2
cI (t1 )+ i
cI (t1 )V
cI (t2 ) (2.9)
|ii
dt1 V
dt1 dt2 V
|φ(t∗2 )iI = |ii− |ii
~
~
t∗
t∗
t∗
1
1
1
E’ importante notare che vale per gli intervalli t1 > t2 per costruzione, cioè
l’ordine temporale del prodotto fra gli operatori nell’integrale doppio è importantissimo. Agisce prima l’operatore a tempo t1 e poi quello a tempo t2 che
essendo più piccolo si riferisce ad un istante successivo. Gli operatori V non
necessariamente sono commutativi a tempi diversi. Se si lascia fluttuare un sistema autonomamente, ci si trova di fronte a quelli che sono chiamati
sistemi ergodici, cioè sistemi che passano per tutti gli stati possibili, quindi a
qualunque istante si fotografi il sistema, l’evoluzione non dipende dall’istante
scelto. Nel momento in cui si accende una perturbazione esterna, se questa è
abbastanza grande può spingere il sistema verso uno stato di equilibrio preferenziale e quindi perturbare l’ergodicità. Nel momento in cui viene spenta la
perturbazione il sistema potrebbe raggiungere un nuovo stato di equilibrio diverso da quello iniziale.
Si può scrivere formalmente lo stato che si sta cercando come il prodotto di un
operatore per lo stato iniziale, cioè:
b ∗1 , t∗2 ) |ii
|φ(t∗2 )iI = S(t
(2.10)
e quest’operatore Sb si chiama operatore di scattering (o matrice di scattering) o operatore di evoluzione. Siamo interessati quindi a determinarlo, perché
esso entra in tutte le quantità misurabili. Dai conti fatti, si vede che questa
matrice si scrive, allo step n-esimo, come:
i
Sb = 1−
~
Z
t∗
2
t∗
1
n Z t∗2
Z tn−1
i
c
c
cI (tn ) (2.11)
dt1 VI (t1 )+· · ·+ −
dt1 VI (t1 ) ...
dtn V
∗
~
t∗
t
1
1
Il difetto di questa scrittura sta nel fatto che qualunque ordine maggiore del
secondo ha integrali che coprono intervalli temporali sempre più piccoli. Infatti
2
LA SPETTROSCOPIA
14
per costruzione si ha che t1 > t2 > ... > tn−1 > tn , ma tali variabili temporali
sono mute, per cui è possibile, mantenendo l’ordine temporale dei prodotti,
permutare la variabile di integrazione. Ci sono n variabili di integrazione e
quindi ci sono n! possibili permutazioni di variabili mute. Si possono scrivere
termini equivalenti ai precedenti permutando la variabile di integrazione, e poi si
può sommare su tutti gli n e dividere per n! (pur di mantenere l’ordine temporale
dei prodotti fra gli operatori), così alla fine si ha per il termine n-esimo:
b ∗ , t∗ )n =
S(t
1 2
i
−
~
n
1
n!
Z
t∗
2
Z
t∗
2
dt1 ...
t∗
1
t∗
1
dtn Tb[VI (t1 )...VI (tn )]
(2.12)
Dal termine non simmetrico di grado 2, si è potuto, integrando su tutto l’intervallo grazie alle variabili mute, integrare n volte su tutto l’intervallo rilassando
la condizione di integrali sempre più piccoli, con la condizione di non perdere
l’ordine temporale dei prodotti fra gli operatori V. L’operatore Tb è chiamato operatore temporale o ordinatore temporale di Dyson, che ristabilisce, dopo
le permutazioni fatte, il giusto ordine temporale. Il suo funzionamento è il
seguente:
Tb[VI (t1 )VI (t2 )] → VI (t2 ) · VI (t1 )
con t2 > t1
con un segno proprio, sul quale torneremo. Si può dire che questo è uno dei
pochi casi in cui la fisica delle particelle ha insegnato qualcosa dal punto di vista
dell’apparato matematico di meccanica quantistica alla fisica dello stato condensato. Normalmente è avvenuto il contrario: tutta la teoria dei fenomeni critici,
il gruppo di rinormalizzazione, ad esempio hanno insegnato a come correggere
le divergenze infrarosse ed ultraviolette nelle più evolute teorie di campo.
La soluzione generale, che dipende dall’intervallo temporale in cui agisce la
perturbazione, è:
b ∗1 , t∗2 ) =
S(t
X 1 i n Z t∗2
−
dt1 ...dtn Tb[VI (t1 )...VI (tn )]
n!
~
t∗
1
n
(2.13)
in cui si riconosce lo sviluppo in serie dell’esponenziale. Per cui è possibile
riscrivere:
R t∗
i
2
b ∗ , t∗ ) = Tb e− ~ t∗1 VI (t)dt
(2.14)
S(t
1 2
Ricapitolando: data la condizione iniziale per cui a tempi t < t∗1 si ha che
b ≡H
bt + H
b p e Vb = 0 e quindi vale che |φ(t)i = |ii = |pi i |ti i, il significato di Sb
H
sta nel fatto che lo stato finale a tempi t ≥ t∗2 è |φ(t)i = Sb |ii. Quindi calcolando
Sb (a prescindere dall’intensità della perturbazione) si è in grado di prevedere
tutta l’evoluzione temporale del sistema condensato o meno.
Tuttavia avendo a disposizione la scrittura in serie dell’operatore di scattering
è possibile scrivere soluzioni approssimate. Da questo punto di vista uno studio
su quanto è intensa la perturbazione permette di capire a quale termine dello
sviluppo in serie ci si può fermare. Vedremo che specificando opportunamente
l’operatore di interazione, cioè la spettroscopia che si vuole fare, con i campi
elettromagnetici ad esempio il primo ordine di Sb da l’assorbimento o l’emissione
di un fotone, mentre il secondo ordine da lo scattering della luce (effetto Raman,
Brillouin) e l’assorbimento e l’emissione a due fotoni ecc ecc.
2
LA SPETTROSCOPIA
15
Tabella 1: Schema dell’interazione
tempo
hamiltoniana
stato
t < t∗1
t > t∗2
b0 = H
bt + H
bp
H
|φ(t)i = |ii = |pi i |ti i
|φ(t∗2 )i = Sb |ii
Vediamo ora le proprietà di Sb e di Tb. Se il sistema prima dell’interazione è in
uno stato |pi i |ti i, e dopo l’interazione passa ad uno stato (o vari stati) |pf i |tf i,
la probabilità di transizione generica è:
Pi→f = | hpf | htf | Sb |ti i |pi i |2
| {z }
(2.15)
|φ(t∗
2 )i
che come si vede, è una probabilità di transizione fra uno stato iniziale definito
ed uno stato finale definito. Come evidenziato essa è la proiezione verso di tutti
i possibili stati finali su uno stato dato |φ(t∗2 )i. Non facendo il modulo quadro
b
si ottiene l’ampiezza di transizione come elemento di matrice
di S.
P
Inoltre la matrice di scattering è unitaria cioè vale che f |Sif |2 = 1. Ciò significa che partendo da uno stato iniziale e calcolando la probabilità di transizione
verso tutti i possibili stati finali la probabilità totale è 1.
Per quanto riguarda l’operatore di Dyson si supponga di trovare un prodotto
del tipo Tb[V (t2 )V (t1 )] |ii con t1 > t2 . L’operatore Tb ripristina il giusto ordine
temporale, cioè il primo operatore a destra è quello che agisce per primo. Tuttavia il modo in cui Tb agisce dipende dalla natura degli operatori V: se essi sono
bosonici (hamiltoniana dell’oscillatore armonico) allora quando Tb li scambia, il
segno non cambia. Se invece essi sono fermionici (operatori di creazione e distruzione fermionici) e Tb ristabilisce il giusto ordine, allora bisogna mettere un
segno meno davanti agli operatori.
Chiamiamo l’intervallo temporale in cui si manifesta la perturbazione come
T = t∗2 − t∗1 che può essere macroscopico, nel senso che se si ha una sorgente
spettroscopica che viene accesa e poi spenta si possono avere misure che durano
anche mezza giornata, se invece si ha una sorgente pulsata i tempi caratteristici
sono dettati dalla durata dell’impulso che può essere microscopico. In ogni caso
nell’intervallo T si ha che Vb 6= 0. Si chiama probabilità di transizione nell’unità
di tempo la quantità:
1
(2.16)
Ṗi→f = | hf | Sb |ii |2
T
che è la probabilità di transizione tra uno stato iniziale e uno finale totale nell’unità di tempo, diviso il tempo totale in cui si manifesta la perturbazione.
La situazione è schematizzata nella tabella 1: lo stato finale |φ(t∗2 )i contiene
potenzialmente molti stati finali sia del probe che del target. L’elemento di
matrice nella (2.15) proietta lo stato finale (ottenuto dalla matrice di scattering
applicata allo stato iniziale) su uno stato specifico. Tuttavia questo è un caso
particolare, in quanto non è ciò che avviene normalmente. Il sistema target evolve verso tanti possibili stati finali e l’interazione con il probe fa si che anch’esso
evolva versi stati finali diversi. Facciamo un esempio: prendiamo una molecola
nello schema dell’oscillatore armonico. Siano n=0, 1, 2 gli stati vibrazionali
distanziati del valore ~ω. A temperatura nulla l’unico stato popolato è n=0. Si
2
LA SPETTROSCOPIA
16
Figura 4: Schematizzazione di un processo spettroscopico. Stati iniziale e finale.
manda sul sistema un fotone di energia ~ω e si ottiene la transizione 0 → 1. Lo
stato iniziale è l’oscillatore armonico nello stato n=0 e un fotone di energia ~ω,
lo stato finale è zero fotoni (il fotone è stato assorbito) e l’oscillatore armonico
nello stato n=1. Si supponga ora di scaldare il sistema in modo da avere anche
il livello n=1 parzialmente popolato. Mandando lo stesso fotone, si potrà avere
la transizione 0 → 1 o anche quella 1 → 2. A parità di perturbazione gli stati
finali, sempre con il probe a zero fotoni, potranno essere due in questo caso
(n=1 o n=2). La soluzione del target può essere qualsivoglia in base allo stato
termodinamico prima che avvenga l’interazione. Questo per far capire come lo
stato finale che rappresenta il target in realtà possa contenere molti stati finali.
Per descrivere matematicamente questo fenomeno cominciamo col descrivere
meglio i possibili stati finali del probe. Si considera un solo stato iniziale del
probe, che si può preparare al meglio, e molti stati finali del probe si possono
provare ad esprimere usando l’espressione:
ρ(Efp )dEfp dΩ
(2.17)
che sarebbe il numero di stati del probe con energia finale compresa tra Efp
e Efp + dEfp e vettore d’onda compreso nel medesimo intervallo cioè fra kfp e
kfp + dkfp . La situazione è schematizzata in figura 4. Gli stati finali sono in
principio un insieme continuo o quasi continuo. Per descriverli quindi si definisce una densità di stati finali ρ(Efp ) e la si moltiplica per l’intervallo di energia
in cui sono distribuiti dEfp per l’intervallo di angolo solido dΩ. Normalmente
tutte le spettroscopie lavorano in questo modo, cioè nella configurazione assiale,
in cui si fissa l’asse di propagazione del fascio incidente e si controllano tutti
gli angoli possibili attorno a tale asse. L’espressione (2.17) misura il numero di
stati finali del probe nell’unità di energia e di vettore d’onda (le variazioni di
vettore d’onda sono mappate sull’angolo solido).
In quasi tutti i casi, nei processi di interazione, il sistema probe+target costituisce un sistema chiuso, quindi c’è conservazione dell’energia e del vettore d’onda
ecc. Questo è espresso dalle seguenti relazioni:
~ω = Eft − Eit = Eip − Efp
q̄ = kit − kft =
kfp
−
kip
(2.18)
(2.19)
che in struttura della materia sono espresse dalle regole di selezione sui numeri
quantici. Dal punto di vista matematico la quantità espressa dall’espressione
(2.17) è uguale ad ~ω, perché lo stato iniziale è ben definito e quindi la variazione
infinitesima da considerare nella differenza Efp − Eip è quella sugli stati finali, ed
2
LA SPETTROSCOPIA
17
è espressa dalla (2.17).
Si è scritto nella (2.15) la probabilità di transizione tra uno stato iniziale e uno
finale ben definiti, ma poiché in qualunque processo spettroscopico gli stati finali
del probe sono tanti, l’espressione (2.16) può essere generalizzata definendo:
d2 Ṗi→f =
1
ρ(Efp )dEfp dΩ| hf | Sb |ii |2
T
(2.20)
Semplicemente si è presa l’espressione (2.16) e la si è moltiplicata per gli stati
finali compresi nell’intervallo infinitesimo di energia e di angolo solido, cioè la
(2.17), e si è ottenuta la probabilità doppio differenziale di transizione nell’unità
di tempo infinitesima da uno stato iniziale ben definito in una densità di stati
finali compresi nell’intervallo dEfp dΩ.
Si può allora scrivere semplicemente differenziando rispetto a Ω e Efp :
1
∂ 2 Pi→f
ρ(Efp )| hf | Sb |ii |2
p =
∂Ω∂Ef
T
(2.21)
e questa tiene conto del fatto che durante il processo spettroscopico la sonda
può andare in molti stati possibili finali, cioè verso un continuo o quasi-continuo
finali.
Il sistema condensato si trova in un certo stato di equilibrio termodinamico
macroscopico prima dell’interazione, a cui corrisponde un numero elevato di
stati microscopici possibili. Non si parte mai da un singolo stato iniziale del
target, ed ovviamente durante la transizione si può andare in molti stati finali
del target stesso. In realtà ciò che si misura è una quantità più complicata, la
probabilità totale di transizione per unità di tempo:
X 1
∂ 2 Ṗ
p
λt (TK )| hf | Sb |ii |2
p = ρ(Ef )
∂Ω∂Ef
T i
(2.22)
|ti i,|tf i
che è il prodotto della densità di stati finali del probe, la somma sugli stati
iniziali e finali del target, il modulo quadro dell’elemento di matrice scattering
per una nuova quantità λti che è la probabilità di occupazione termica dello stato
iniziale del target (dipende dalla temperatura TK ). Questa dice, dato un certo
sistema specifico ad una data temperatura, quali sono gli stati occupati. Questo
termine è:
1
(2.23)
λti (TK ) = e−βEti
z
che è una funzione decrescente dell’energia, dove z è la funzione di partizione
P
del sistema e vale z = ti hti | e−β Ĥt |ti i, e β = kB1TK , con TK temperatura e
kB costante di Boltzmann.
La (2.22) è ciò che si misura nei sistemi condensati in cui l’equilibrio termodinamico per il target implica molti stati iniziali possibili ciascuno con una propria
probabilità termica, e di conseguenza facendolo interagire col sistema si può
andare in tanti possibili stati finali.
Visto che vale la relazione ~dω = dEfp , si può riscrivere la densità di stati finale
del probe come ρ(ω) = ~1 ρ(Efp ), e la probabilità di transizione (2.21), in forma
adimensionale è:
∂ 2 Pi→f
1
= ρ(ω)| hf | Sb |ii |2
(2.24)
∂Ω∂ω
T
2
LA SPETTROSCOPIA
18
e la sua generalizzazione che porta a riscrivere la (2.22),
X
∂ 2 Ṗ
1X
λti (TK )
| hpf , tf | Sb |pi , ti i |2
= ρ(ω)
∂Ω∂ω
T
|ti i
(2.25)
|tf i
Ricapitolando: a partire dalla definizione della matrice di scattering che è l’oggetto che collega gli stati finali con quelli iniziali per effetto dell’interazione
(cioè che fa evolvere il sistema all’equilibrio termodinamico che ha interagito
con una sonda spettroscopica esterna), la probabilità di transizione che tiene
conto di tutti i possibili stati iniziali del target e di tutti i possibili stati finali in
cui questo può transire per effetto dell’interazione è la (2.25). Si ha la somma
su tutti gli stati iniziali pesati dalla probabilità di popolazione (a temperatura
nulla tale quantità si riduce ad 1, cioè si ha un solo stato popolato: il ground
state), la somma su tutti gli stati in cui il sistema può transire che tiene conto
anche della densità di stati finali possibili. Quest’espressione è la più generale
possibile e contiene un aspetto di meccanica quantistica (l’elemento di matrice
di scattering) e un aspetto di meccanica statistica (la probabilità di popolazione
termica), cioè è un’espressione quanto-termodinamica.
2.2
La sezione d’urto
Un’altra quantità molto importante (spesso è quella ad essere realmente misurata) si chiama sezione d’urto.
Si considera un sistema che contiene N particelle (atomi, molecole, macromolecole ecc ecc) ed un probe che ha un flusso di dimensioni [φ] = l−2 t−1 , cioè il
numero di particelle che arrivano sul sistema per unità di tempo e per unità di
superficie.
Si definisce la sezione d’urto doppio differenziale come:
1 ∂2P
∂2σ
=
∂Ω∂ω
N φ ∂Ω∂ω
(2.26)
dato che la (2.24) è adimensionale (la probabilità di transizione è t−1 che si elide
con la frequenza), la dimensione della (2.26) è il reciproco del flusso [φ] cioè una
distanza al quadrato per un tempo. Essa dice il numero di eventi che avvengono
per unità di tempo e unità di superficie. Qualche volta quello che si misura in
certi esperimenti è:
Z
∂2σ
dωdΩ
=σ
(2.27)
∂Ω∂ω
che si chiama sezione d’urto totale (con dimensioni [σ] = l2 , cioè una superficie).
L’interpretazione geometrica della sezione d’urto è la dimensione del bersaglio
che interagisce con il probe, in meccanica quantistica invece essa misura il raggio
medio delle forze di interazione. Nella maggior parte dei casi l’unità di misura
della sezione d’urto totale è il barn, dove 1 barn = 10−24 cm2 (approssimativamente pari alla sezione di un nucleo si Uranio). Integrando su tutte le energie
scambiate e su tutto l’angolo solido la sezione d’urto totale tiene conto di tutti
i possibili eventi che avvengono durante l’interazione. Per fare un esempio, un
atomo ha una propria sezione d’urto elettromagnetica, dovuta alla densità di
carica elettronica, e se la sonda è un campo elettromagnetico, l’interazione fra
2
LA SPETTROSCOPIA
19
atomo e campo avviene su una certa dimensione atomica, ed è misurata in barn
(varie centinaia di barn). Se invece la sonda sono dei neutroni, il neutrone interagisce con il nucleo dell’atomo e la sezione d’urto, cioè la capacità del neutrone
di interagire con l’atomo è qualche barn. In pratica a parità di atomo il neutrone
interagisce molto meno di un campo elettromagnetico specifico.
L’interpretazione meccanicistica di questa quantità è la grandezza del bersaglio,
mentre l’interpretazione vera e propria è la dimensione media che definisce qual
è il raggio di interazione della forza che accoppia l’atomo bersaglio con la sonda
spettroscopica.
In generale in un qualsivoglia processo, la sezione d’urto doppio differenziale si
scrive come la somma di 3 termini, diffusione, assorbimento e riflessione:
∂ 2 σ ∂ 2 σ ∂ 2 σ ∂2σ
+
+
=
∂Ω∂ω
∂Ω∂ω dif f ∂Ω∂ω assorb ∂Ω∂ω rif les
(2.28)
ogni processo di interazione con la materia che si può avere è scindibile in termini
che tengono conto dei singoli fenomeni: ad esempio per la diffusione della luce
su un sistema, quando si manda un fascio di radiazione sulla materia, parte
dei fotoni vengono diffusi (effetto Raman e Rayleigh), parte dei fotoni vengono
assorbiti e in parte riflessi (la differenza macroscopica fra riflessione e diffusione è
che la riflessione avviene geometricamente allo stesso angolo di incidenza, mentre
nella diffusione l’angolo di diffusione è in generale diverso rispetto all’angolo di
incidenza). Data una sonda spettroscopica possono comparire diversi fenomeni
legati ad elementi diversi della matrice di scattering ed ognuno con propria
sezione d’urto.
2.2.1
Teorema della risposta lineare per la spettroscopia
Prima di enunciare questo teorema facciamo un’osservazione: consideriamo la
matrice di scattering (2.14): in molti casi l’hamiltoniana di interazione tra il proR
be e la materia può essere scritta come integrale spaziale VbI (t) = dr̄VbI (r̄, t),
dove VbI (r̄, t) è la densità di hamiltoniana di interazione, che significa che l’interazione fra la sorgente esterna e la materia può avvenire anche localmente nello
spazio oltre che nel tempo (esempio è la densità di energia del campo elettromagnetico).
Facciamo qualche esempio di hamiltoniana di interazione:
Z
1
¯ t) · Ā(r̄, t)
VIem−mat (t) = −
dr̄ J(r̄,
(2.29)
c
Z
VIN M R (t) = − dr̄ h̄(r̄, t) · M̄ (r̄, t)
(2.30)
Z
¯ (r̄, t)
VIscatt (t) = c dr̄ Ā2 (r̄, t) ⊗ ᾱ
(2.31)
Nella (2.29) esprime l’interazione tra campo elettromagnetico e materia J¯ è la
densità di corrente nel sistema bersaglio e Ā è il potenziale vettore del campo
sonda. Quindi l’operatore locale di interazione è espresso da un prodotto scalare
di due operatori che dipendono rispettivamente dai due sistemi che interagiscono.
La (2.30) invece esprime la spettroscopia NMR (Nuclear Magnetic Resonance),
2
LA SPETTROSCOPIA
20
il cui operatore di interazione locale è espresso dal prodotto scalare fra gli operatori campo magnetico locale h̄ e magnetizzazione M̄ del sistema (la densità
di spin). Anche in questo caso si ha il prodotto scalare fra un operatore che
rappresenta la sonda (il campo magnetico) e uno che rappresenta il sistema in
esame (la magnetizzazione).
La (2.31) infine rappresenta l’operatore di interazione dello scattering della luce
(Raman, Rayleigh) ed è dato dal prodotto tensoriale fra il quadrato del poten¯ (che esprime come un oggetto
ziale vettore Ā2 e il tensore di polarizzabilità ᾱ
costituito da elementi elettricamente carichi si distorce per effetto del campo
esterno).
Vediamo ora il
Teorema 2.1 (della risposta lineare). La matrice di scattering Sb si può
P
scrivere come sviluppo in serie Sb = k Sk , i cui termini sono:
k Z
i
dt1 ...dtk Tb[VI (t1 )...VI (tk )]
Sk = −
~
Allora se si possono individuare uno o più termini k, la cui somma si può
scrivere come:
Z
c
W = dr̄dt φ̂p (r̄, t) · φ̂t (r̄, t)
cioè un integrale sullo spazio e sul tempo del prodotto operatoriale tra φ̂p e φ̂t ,
che sono operatori che rappresentano rispettivamente il probe e il target (sempre
vero al primo ordine come negli esempi visti), allora la probabilità di transizione
doppio differenziale si scrive come:
Z
∂ 2 Ṗ
= ρ(ω) dr¯1 dr¯2 eiq̄(r¯1 −r¯2 ) eiω(t1 −t2 ) |Aφp (ω, q̄)|2 Cφt (r¯1 , r¯2 , t1 , t2 ) (2.32)
∂Ω∂ω
dove |Aφp (ω, q̄)|2 è il modulo quadro dell’operatore di probe, che dà l’intensità
della sonda spettroscopica, e Cφt (r¯1 , r¯2 , t1 , t2 ) è la funzione di correlazione dell’operatore di target coinvolto nella linearizzazione della matrice di scattering.
La loro espressione esplicita è:
|Aφp (ω, q̄)|2 = hpi | φ†p (ω, q̄) |pf i hpf | φp (ω, q̄) |pi i
X
Cφt (r¯1 , r¯2 , t1 , t2 ) =
λti (t) hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i
ti
Dimostrazione. Si consideri la relazione (2.25). La somma sugli stati finali tf si
può scrivere come:
X
X
| hf | Sb |ii |2 =
hpi | hti | Sb† |tf i |pf i hpf | htf | Sb |ti i |pi i ⇒
tf
tf
e dato che gli stati finali del target costituiscono
un sistema completo per
P
definizione, vale la relazione di chiusura tf |tf i htf | = 1 e si può scrivere:
⇒ hpi | hti | Sb† |pf i hpf | Sb |pi i |ti i
Inoltre per ipotesi vale che:
Z
c=
Sk = W
dr̄dt φ̂p (r̄, t) · φ̂t (r̄, t)
2
LA SPETTROSCOPIA
21
e sostituendo si può scrivere:
Z
⇒ dr¯1 dr¯2 dt1 dt2 hpi | φ†p (r¯1 , t1 ) |pf i hpf | φp (r¯2 , t2 ) |pi i hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i
La parte di target è contenuta nell’elemento di matrice diagonale che corrisponde
proprio alla funzione di correlazione Cφt .
Si risolve prima la parte relativa all’integrale temporale. Si scrive l’evoluzione
temporale degli operatori in rappresentazione di interazione
i
i
φp (r̄, t) = e ~ (Ht +Hp )t φp (r̄, 0)e− ~ (Ht +Hp )t
L’operatore relativo al target (probe) agisce sulle variabili fisiche relative al
target (probe), e matematicamente questo vuol dire che l’hamiltoniana di target
e l’operatore di probe commutano fra loro. E’ quindi possibile scrivere che, per
il probe:
i
i
φp (r̄, t) = e ~ (Hp )t φp (r̄, 0)e− ~ (Hp )t
come si vede non si considera più l’hamiltoniana di target nell’evoluzione dell’operatore di probe. Si sostituisce quindi nell’integrale. Si consideri solo il primo
termine, si ha:
p
i
p
i
i
p
p
hpi | φ†p (r¯1 , t1 ) |pf i = e ~ Ei t1 hpi | φ†p (r¯1 , 0) |pf i e− ~ Ef t1 = e− ~ (Ef −Ei )t1 = eiωt1
perché si applica l’evoluzione dell’operatore sugli autostati iniziale e finale dell’hamiltoniana di probe. Facendo lo stesso conto per il secondo termine si
ha:
i
p
i
p
i
p
p
hpf | φ†p (r¯2 , t2 ) |pi i = e− ~ Ei t2 hpf | φ†p (r¯2 , 0) |pi i e− ~ Ef t2 = e ~ (Ef −Ei )t2 = e−iωt2
Questi due termini insieme danno eiω(t1 −t2 ) che è esattamente il termine temporale presente nella trasformata di Fourier del teorema.
Si osserva che ci sono due integrali temporali con t1 > t2 . Se si sostituisce
t1 − t2 = T e t2 = τ e si fa il cambiamento di variabile, supponendo che la
funzione di correlazione non dipenda in maniera separata da t1 e t2 ma solo
dalla loro differenza (che significa che il sistema è stazionario, cioè qualunque
sia il tempo iniziale di osservazione la sua evoluzione temporale è sempre la stesR
RT
sa) si ottiene per la parte temporale che dteiωt 0 dτ . L’integrale in dτ dà T
(tempo totale di applicazione del probe) come risultato che si semplifica con T1
nella probabilità di transizione. Con quest’ipotesi la probabilità di transizione
la si può scrivere come:
Z
∂2P
= ρ(ω) dr¯1 dr¯2 dt eiωt e−iq̄(r¯1 −r¯2 ) |Aφp (ω, q̄)|2 Cφt (r¯1 , r¯2 , t)
(2.33)
∂Ω∂ω
Ora vediamo la parte relativa all’integrale spaziale. In generale si possono scrivere gli stati iniziale e finale del probe come onda piana (e non c’è particolare
limitazione nel farlo), cioè:
p
|pi i = eik̄i r̄
p
|pf i = eik̄f r̄
il primo elemento di matrice si risolve in questo modo:
p
p
hpi | φ†p (r̄1 , 0) |pf i = A∗ e−ik̄i r̄1 +ik̄f r̄1
2
LA SPETTROSCOPIA
22
dove A∗ rappresenta qual è l’ampiezza del probe (ad esempio se si avesse un
campo elettrico sarebbe il numero di volt per centimetro). Per il secondo termine
si ha:
p
p
hpf | φp (r̄2 , 0) |pi i = A e−ik̄f r̄2 +ik̄i r̄2
che moltiplicati danno il fattore:
p
p
|Aφp |2 ei(k̄f −k̄i )(r̄1 −r̄2 ) = |Aφp |2 e−iq̄(r̄1 −r̄2 )
che è esattamente il fattore spaziale presente nella trasformata di Fourier del
teorema.
E con questo la dimostrazione del teorema è conclusa.
In sostanza il significato del teorema è questo: se valgono le condizioni citate,
quello che si va a misurare, cioè la probabilità di transizione, è di fatto legata
alla trasformata di Fourier spazio-temporale della funzione di correlazione dell’operatore del sistema che interagisce con il probe esterno.
Facciamo un esempio: la radiazione elettromagnetica interagisce con le fluttuazioni di densità degli elettroni (la densità di la corrente). Prendendo la
(2.29), che è scritta la primo ordine, si ha che φp è il potenziale vettore Ā,
¯ quindi la funzione di correlazione in
mentre φt è la densità di corrente J,
questoPcaso sarebbe una funzione di correlazione corrente-corrente del tipo
CJ¯ = ti λti (t) hti | J¯† J¯ |ti i.
Cosa si intende per correlazione (o autocorrelazione) in fisica statistica? Usiamo
l’esempio della densità di corrente. Preparo il vettore densità di corrente, all’istante iniziale in un certo stato, lo lascio evolvere nel tempo (e l’evoluzione può
essere causata da una naturale evoluzione del sistema o da un fattore esterno)
e dopo un certo tempo misuro nuovamente il vettore densità di corrente. La
funzione di correlazione indica come lo stato iniziale ha influenzato
l’evoluzione del vettore di stato del sistema. Se la grandezza è scorrelata,
il suo valore ad istanti successivi non dipende dallo stato iniziale. La variabile
importante in questo caso è il tempo. Infatti il tempo di correlazione indica
in quale intervallo di tempo lo stato che ho preparato inizialmente influenza
l’evoluzione della grandezza stessa a tempi successivi. Evidentemente per tempi
molto maggiori del tempo di correlazione il valore che la grandezza fisica assume
è indipendente dal valore preparato all’istante iniziale. In termini probabilistici
si può dire che la funzione di correlazione è una probabilità condizionata.
L’aspetto potente di questo teorema è che ciò che si misura con la spettroscopia, se valgono le condizioni descritte, è l’immagine di Fourier spazio-temporale
della funzione di correlazione: la dinamica che avviene nello spazio-tempo viene
trasdotta nello spazio di Fourier cioè nello spazio vettore d’onda-frequenza, e
quello che si misura di fatto è la funzione di correlazione nello spazio di Fourier.
I neutroni ad esempio rilevano le fluttuazioni di densità e danno la funzione di
correlazione di Fourier densità-densità, cioè in che vettori d’onda e in che frequenze la funzione di correlazione è diversa da zero, cioè in quale scala spaziale
e dei tempi le fluttuazioni di densità sono correlate.
Ricapitolando: se andando a vedere come è fatta l’interazione fra probe e target e scrivendo la matrice di scattering che determina l’evoluzione del sistema
per effetto dell’interazione con il probe, ci si accorge che alcuni termini possono
essere scritti come un integrale sullo spazio-tempo di un operatore che dipende
2
LA SPETTROSCOPIA
23
solo dal probe per uno che dipende solo dal target, allora la probabilità di transizione è la trasformata di Fourier della funzione di correlazione spazio-temporale
dell’operatore che entra nella linearizzazione della matrice di scattering.
Perché è importante misurare la correlazione spazio-temporale?
I neutroni misurano le fluttuazioni di densità di un sistema: se si prende un
liquido, le fluttuazioni di densità sono determinate da molti fenomeni, dalla variazione di temperatura locale, dalla variazione del numero di particelle locali,
dalla variazione di pressione locale ecc ecc. ma queste fluttuazioni possono manifestarsi sia su scale spaziali ampie (sentiamo la voce del prof perché le sue
corde vocali modulano la densità dell’aria su scale dell’ordine della lunghezza
d’onda sonora con cui parla) che su scale molto piccole (angstrom, nm). Così
come si può studiare cambiando la densità locale ad un certo istante e vedere
come quella variazione di densità sopravvive ad un tempo successivo. Tuttavia quello che si è in grado di misurare non è la correlazione nello spazio fisico
dello spazio-tempo, bensì tramite lo scambio energia-impulso che la sonda ha
col sistema, la sua immagine di Fourier nelle frequenze e nei vettori d’onda.
Nel momento in cui si considera lo scambio di impulso ed energia fra sonda e
sistema, (le relazioni 2.18 e 2.19) si sta considerando lo scambio fra la sonda
spettroscopica e l’eccitazione misurata da quella stessa sonda. Dal punto di vista matematico la trasformata di Fourier si fa su tutte le frequenze ω e su tutti
i vettori d’onda scambiati q̄. Tuttavia dal punto di vista fisico ciò non è vero:
quanto vettore d’onda si è grado di scambiare dipende dalla sonda spettroscopi~2 k̄ 2
ca. Se questa sonda sono neutroni, la relazione di energia-impulso è E =
2MN
e se i netroni hanno energia media di 25 meV, allora k ∼ 108 cm−1 ' πa che è
abbastanza grande, ma ovviamente non vale lo stesso se la sonda è la radiazione
elettromagnetica.
Considerando il vettore d’onda scambiato per i neutroni, che fenomeni possono
manifestarsi nell’interazione? Quando i neutroni non interagiscono vale k¯i = k¯f ,
mentre se il neutrone è retrodiffuso si ha k¯i = −k¯f e quindi q̄ = 2k¯i cioè dell’ordine di 108 cm−1 . A seconda del processo considerato (scattering ad angolo
piccolissimo in cui la variazione di vettore d’onda in modulo e verso è circa
nulla oppure la retrodiffusione) si copre una zona di spazio di vettore d’onda
piuttosto ampia (perché k¯i è grande). Se si fosse in grado di misurare solo i
neutroni diffusi in un angolo solido dΩ abbastanza piccolo intorno alla direzione
di propagazione, allora lo spazio di vettore d’onda che si è in grado di apprezzare
è piccolo (perché k̄i ' k̄f ). Quindi matematicamente si ha una trasformata di
Fourier i cui limiti fisici dipendono dalla possibilità o meno di apprezzare certe
variazioni, cioè da come è fatto l’esperimento. Se si fosse in grado di misurare
tutti i neutroni (anche quelli retrodiffusi) si andrebbe da un vettore d’onda 0
ad uno 2π
a cioè tutta la prima zona di Brillouin, e quindi tutto lo spazio dei
vettori d’onda disponibili. Si potrebbe osservare il sistema con una risoluzione
spaziale δ ' λN = 10−8 cm = 1 Å, infatti il reciproco del vettore d’onda (cioè la
lunghezza d’onda della sonda) definisce la capacità di risolvere oggetti spazialmente, quindi coprendo tutto lo spazio dei vettori d’onda si sarebbe in grado di
apprezzare fluttuazioni che avvengono su scale spaziali molto piccole. Se invece è possibile captare solo i vettori d’onda nell’intorno di quello incidente, si è
sensibili a scale spaziali macroscopiche, ovvero fluttuazioni su scale grandi, cioè
il suono.
Se invece di usare neutroni si usa la radiazione elettromagnetica, dato che
2
LA SPETTROSCOPIA
24
E = ck, i vettori d’onda nel visibile (il rosso ha energia di 2 eV) sono di 105 cm−1 ,
quindi rispetto ai neutroni si apprezzano distanze 1000 volte più grandi, in generale molto più grandi della distanza media fra le particelle in un liquido o in
un solido, per cui non si è in grado di apprezzare fluttuazioni su scale microscopiche. Con la luce visibile infatti si misurano fluttuazioni di densità prodotte
dal suono, cioè effetti macroscopici.
Lo stesso discorso si può fare per quanto riguarda la parte temporale della trasformata di Fourier in cui si parla di scambio di energia (tramite la frequenza ω)
e non di vettore d’onda: se si possono scambiare energie tali da coprire intervalli
temporali microscopici allora si possono osservare fluttuazioni microscopiche, se
invece non si può scambiare energia come si vuole si potranno osservare solo
fluttuazioni macroscopiche.
Si è visto nella dimostrazione del teorema di risposta lineare che si può considerare la funzione di correlazione come dipendente non da t1 e t2 , bensì dalla loro
differenza, vero in generale per sistemi liquidi solidi, amorfi ecc. In linea di principio sarebbe possibile fare lo stesso discorso per la variabile spaziale e scrivere
R̄ = r̄1 − r̄2 . Ci si chiede in quali casi la funzione di correlazione non dipenda
separatamente da r̄1 ed r̄2 ma solo dalla loro differenza. Ebbene ciò avviene
per sistemi traslazionalmente omogenei come ad esempio i liquidi. Qui viene
mantenuta la distinzione fra r̄1 ed r̄2 per sottolineare il fatto che in generale
non c’è invarianza spaziale completa. Se il sistema è completamente omogeneo
dal punto di vista spaziale e temporale la funzione di correlazione dipenderà da
|R̄| e da t, altrimenti si avranno dipendenze specifiche dalle singole variabili.
Un’ultima cosa prima di trattare i vari tipi di spettroscopia nello specifico. Data
l’espressione della funzione di correlazione:
X
Cφt (r¯1 , r¯2 , t1 , t2 ) =
λti (t) hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i
(2.34)
ti
con
λti (TK ) =
1 −βEtt
i
e
z
λtf (TK ) =
1 −βEttf
e
z
(2.35)
se si considera la transizione ti → tf e quella tf → ti , ci si può chiedere che
relazione intercorre fra la probabilità di transizione Pti →tf e Ptf →ti . Se il sistema
di target costituisce un sistema completo, calcolare l’elemento di matrice fra |ti i
o |tf i non fa differenza, mentre ciò che cambia è la probabilità di occupazione
termica, come messo in evidenza nelle espressioni (2.35). Il loro rapporto è:
λtf
t
t
= e−β(Ef −Ei ) = e−β~ω
λ ti
(2.36)
quindi per le probabilità di transizione si ha:
Pi→f = eβ~ω Pf →i
(2.37)
che ci dice che la probabilità di transizione considerata fin’ora, da uno stato a
più bassa energia verso uno stato a più alta energia, è più grande della sua inversa, con un rapporto dato dal fattore esponenziale puramente quantistico (in
un sistema classico le probabilità sono identiche) nella precedente espressione.
Questo è il principio di bilancio dettagliato. Tutti i processi che ammettono
transizioni tra uno stato iniziale e uno finale, ammettono in generale, essendo
identico l’elemento di matrice, il processo inverso, ma con una probabilità diversa.
2
LA SPETTROSCOPIA
25
Quelle che viene chiamato processo Stokes, in cui una particella che incide sul
sistema rilascia allo stesso energia e impulso e riparte con energia e impulso più
bassi, è il processo in cui il sistema guadagna energia e quindi passa da uno stato
a più bassa energia ad uno a più alta energia, mentre il processo anti-Stokes è
quello inverso in cui il sistema cede energia alla particella incidente e transisce
da uno stato a più alta energia verso uno a più bassa. La cessione di energia
e impulso da parte del sistema implica che nel processo anti-Stokes il sistema
abbia stati popolati che non siano quello fondamentale, ed è quindi legato alla
probabilità di occupazione termica, quindi si può dire che nel limite di temperatura nulla sopravvive solo la transizione Stokes (perché è popolato solo lo stato
fondamentale).
Vogliamo ora vedere dei casi specifici in cui applicare il teorema della risposta
lineare.
3
3
SCATTERING DA NEUTRONI TERMICI
26
Scattering da neutroni termici
E’ una spettroscopia con qualche difficoltà tecnica di applicazione ma molto
importante in molti campi della fisica, dallo stato solido alla biofisica, dalla
soft-matter fino all’archeometria. Essa permette di studiare la struttura di un
cristallo, le fluttuazioni all’interno di un cristallo o di un liquido (ad esempio
legate alla presenza di fononi), permette di misurare la correlazione testa-coda
di una macro molecola biologica, in alcuni casi permette di misurare la struttura
dei cristalli delle proteine, la struttura magnetica di alcuni materiali ecc ecc.
Le difficoltà tecniche stanno nel fatto che per avere una sorgente di neutroni bisogna avere a disposizione un reattore nucleare (che usa processi di fissione) ed
esiste un network di reattori a fissione per uso spettroscopico in Europa e negli
Stati Uniti, oppure usare una sorgente di spallazione, cioè dei protoni accelerati
(prodotti bombardando una targhetta con degli elettroni) su un bersaglio di
grafite, che espelle neutroni, ed una tecnologia di questo tipo la si può trovare
al Rutherford Laboratory di Oxford in Inghilterra.
I neutroni ottenuti tramite fissione sono estremamente energetici (quando si fonde Uranio 235 si ottengono neutroni con diversi MeV di energia) che possono
risolvere vettori d’onda dell’ordine dei millesimi di Å e che non hanno nessun
utilizzo dal punto di vista dello studio della struttura della materia (dove le
distanze medie sono di qualche Å), inoltre neutroni di questo tipo hanno anche una pericolosità legata alla radioattività. Quindi questi neutroni vengono
raffreddati (rallentati) facendoli urtare verso bersagli dell’ordine del nucleo atomico (tipicamente la grafite). Alla fine si hanno i cosiddetti neutroni termici,
descritti da una distribuzione maxwelliana centrata a 25 meV (cioè 300 K) che
corrispondono a una lunghezza d’onda di 1 Å e a un vettore d’onda di 108 cm−1 .
Quindi si hanno grandi vettori d’onda e lunghezza d’onda paragonabile alla distanza fra le particelle in fase condensata.
I neutroni termici interagiscono con la materia attraverso lo pseudopotenziale di
Fermi che si scrive in questo modo:
Vbf ermi (r̄, t) =
X
l
bl
2π~2
δ(r̄ − R̄l (t))
MN
(3.1)
esso si chiama pseudopotenziale perché il neutrone è una particella che interagisce con i nuclei della materia con una forza forte, ma quando si ha una lunghezza
d’onda come quella descritta (1 Å è circa 103 volte maggiore della dimensione
media di un nucleo) non si è in grado di vedere i diversi nucleoni bensì il sistema
come se fosse un oggetto omogeneo, e quindi interagisce con un potenziale medio
che si chiama "pseudo" proprio per questo motivo.
Si immagini di avere un sistema di oggetti microscopici che sono investiti dai
neutroni. L’oggetto l al tempo t è individuato dal vettore R̄l (t). L’interazione
quindi è puntuale, cioè se il neutrone di massa MN , individuato dalla coordinata r̄ coincide con quella dell’oggetto scatteratore cioè r̄ = R̄l (t) allora avviene
l’interazione. La somma su l è quindi su tutti gli oggetti che scatterano mentre bl è un parametro detto parametro d’urto che in generale è una quantità
complessa cioè b̃l = Re(bl ) + iIm(bl ). Com’è noto la parte immaginaria di una
grandezza fisica è legata alle proprietà di assorbimento, e in questo caso essa è
semplicemente diversa da zero in alcuni casi e significa che il nucleo scatteratore
è in grado di assorbire il neutrone termico. Nell’uso spettroscopico dei neutroni
3
SCATTERING DA NEUTRONI TERMICI
27
termici si è interessati che questa parte immaginaria sia nulla e che quindi il
parametro d’urto abbia solo la parte reale (perché si vuole che il neutrone viva
e non che venga assorbito). bl è specifico per ogni sistema fisico e dipende dal
numero di massa (neutroni+protoni) cioè dallo stato isotopico e dallo spin nucleare.
Nello schema del teorema della risposta lineare si può vedere lo pseudopotenziale di Fermi come il prodotto di un fattore che dipende solo dal sistema (target)
P
2
cioè l bl δ(r̄ − R̄l (t)) e uno che dipende solo dai neutroni (probe) cioè 2π~
MN , e
poichè la matrice di scattering è un integrale sul tempo del potenziale, se il potenziale è fattorizzato allora lo è anche la matrice di scattering. Quindi dato un
potenziale formato dal prodotto di due fattori, uno del probe e uno del target,
viene soddisfatto il criterio base del teorema della risposta lineare. Il teorema
quindi è applicabile in questo caso.
Si consideri la relazione (2.33), e facendo le dovute sostituzioni si ha:
1 ∂2P
∂2σ
=
⇒
∂Ω∂ω
N φN ∂Ω∂ω
Z
X
|k̄fN | 1
−iq̄(r̄1 −r̄2 ) iωt
d
r
¯
d
r
¯
dt
e
e
h
[b∗l δ(r̄1 − R̄l (t))][bl0 δ(r̄2 − R̄l0 (0))]i
1
2
|k̄iN | 2π
0
ll
(3.2)
I fenomeni di scattering li si preferisce trattare tramite la sezione d’urto doppio
differenziale invece che con la probabilità di transizione doppio differenziale.
La funzione di correlazione è
X
Cφt (r̄1 , r̄2 , t) = h [b∗l δ(r̄1 − R̄l (t))bl0 δ(r̄2 − R̄l0 (0))]i
ll0
di cui si vuole illustrare il significato.
Si prenda come esempio la grafite: essa è composta per la maggior parte da
carbonio-12, in percentuale minore da C-13, e in misura ancora minore da C14. A parità di protoni quindi gli isotopi C-13 e C-14 hanno rispettivamente
1 e 2 neutroni in più rispetto al C-12. In base al numero di neutroni si avrà
anche un diverso spin nucleare in cui figura il numero di nucleoni all’interno
del nucleo. La media h i è sulla configurazione dello spin nucleare e del numero
isotopico, e anche una media sulle posizioni R̄l . Nella maggior parte dei casi
non ci sono motivi particolari per cui i primi vicini del C-12 siano C-13 o C-14,
c’è una distribuzione statistica che esprime quanti C-12,13 o 14 si hanno nella
miscela ma non le loro posizioni reciproche. Di solito dal punto di vista della
massa isotopica e dello spin nucleare c’è completo disordine, in particolare non
c’è nessuna correlazione tra la posizione del nucleo e il valore del suo parametro
d’urto. Questo significa che la media che definisce la funzione di correlazione
può essere decomposta nel modo seguente:
X
hb∗l bl0 ihδ1 δ2 i
(3.3)
ll0
Si può sempre pensare di scrivere una variabile termodinamica come il suo valore
medio più la fluttuazione da quel valore, cioè si può scrivere che bl = b̂ + δbl .
Ovviamente calcolando il valore medio di questa quantità si ottiene bˆl = b̂ in
quanto il valore medio della fluttuazione è nullo. Il pedice l scompare nel fare
3
SCATTERING DA NEUTRONI TERMICI
28
la media in quanto essendo il valore medio fra tutti i possibili che assume il
parametro d’urto nel sistema considerato esso non dipende dal sito, che invece
rimane nello scarto. Sostituendo nella (3.3) si ha:
X
h(bˆ∗ + δb∗l )(b̂ + δbl0 )ihδ1 δ2 i ⇒
ll0
X
[hbˆ∗ b̂i + hbˆ∗ δbl0 i + hb̂δb∗l i + hδb∗l δbl0 i]hδ1 δ2 i
ll0
(attenzione a non confondere le fluttuazioni dal valore medio δb con le delta di
Dirac δ1 e δ2 ). Il secondo e terzo termine in parentesi quadra si azzerano in
quanto i valori medi delle fluttuazioni sono nulli per definizione, e rimangono
così solo il primo e il quarto termine, cioè:
X
[|b̂|2 + hδb∗l δbl0 i]hδ1 δ2 i
ll0
Si fa notare che la funzione di correlazione scarto-scarto hδb∗l δbl0 i è funzione
velocemente decrescente della distanza fra i siti l − l0 , a meno di situazioni particolari si può assumere che essa sia la delta di Kronecher hδb∗l δbl0 i = δb∗l δbl0 δll0 .
C’è un caso interessante: si consideri idrogeno molecolare. Esso è formato per
2/3 da orto-idrogeno molecolare (spin nucleare totale 1, nuclei con spin parallelo) e per 1/3 da para-idrogeno molecolare (spin nucleare totale 0, nuclei con
spin antiparallelo). L’idrogeno molecolare sotto 21 K si liquefa e sotto 13 K
solidifica. Ci si aspetta che, prendendo una molecola di orto-idrogeno, i suoi
prima vicini siano per 2/3 di tipo orto e per 1/3 di tipo para, ma non è così. In
questo caso si trova un addensamento di para con i para e orto con gli orto, e
questo perché c’è una diffusione di spin nella fase condensata che fa convertire
gli spin paro-orto e orto-para per cui i para e gli orto si avvicinano fra loro.
In pratica c’è una separazione di fase di spin nucleare. In questo caso specifico
quindi non è soddisfatta la condizione per cui la correlazione fra gli scarti può
essere considerata come una delta di Kronecker.
Se però si considera che hδb∗l δbl0 i = δb∗l δbl0 δll0 , vero nella maggior parte dei casi,
si ottiene che, sostituendo nella funzione di correlazione:
X
[ |b̂|2 + δb∗l δbl0 δll0 ]hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l0 (0))i
|{z} | {z }
0
ll
(2)
(1)
Si consideri sola la prima parte, si può scrivere che:
X
X
(1): |b̂|2 h
δ(r̄1 − R̄l (t))
δ(r̄2 − R̄l0 (0))i
l0
l
Si definisce l’operatore densità come:
X
ρ(r̄, t) =
δ(r̄ − R̄l (t))
(3.4)
l
che è una buona definizione di densità in quanto è la somma su tutte le particelle
dell’operatore delta di Dirac che ha le dimensioni del reciproco della variabile
che contiene. Per la parte (1) si può scrivere che:
(1): |b̂|2 hρ(r¯1 , t)ρ(r¯2 , 0)i
3
SCATTERING DA NEUTRONI TERMICI
29
e si vede che questo termine è legato al valore medio del parametro d’urto, cioè
il valore medio dell’interazione fra i neutroni e il sistema considerato.
Il termine (1) misura la trasformata di Fourier spazio-temporale della funzione
di correlazione densità-densità e si chiama risposta coerente dei neutroni.
Per la parte (2) si ha:
X
(2): δb∗l δbl0 δll0
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i
ll0
che invece dà luogo a quella che viene chiamata la risposta incoerente dei
neutroni. Quindi per la sezione d’urto si possono scrivere due termini distinti:
|k N | 1
∂ 2 σ 2 f
=
|
b̂|
∂Ω∂ω coer
|kiN | 2π
Z
dt eiωt
Z
dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) hρ(r¯1 , t)ρ(r¯2 , 0)i (3.5)
Z
Z
|kfN | 1
∂ 2 σ iωt
ˆ
2
= |δbl | N
dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) ·
dt e
∂Ω∂ω incoer
|ki | 2π
X
·
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i
(3.6)
l
La risposta coerente è legata alla risposta collettiva del sistema, in quanto la
densità è la manifestazione delle eccitazioni delle particelle a livello locale, coerente perché misura la risposta di tutto il sistema di particelle, e come si vede
dipende dal valore medio del parametro di interazione che di solito è una quantità ben definita. Per quanto riguarda il termine (2) legato alle fluttuazioni,
esso dà luogo al termine incoerente della sezione d’urto. A causa della delta di
Kronecker δll0 non è più possibile definire la densità, e la doppia sommatoria
diventa una sommatoria singola, e ciò che si sta misurando è:
2
|δ bˆl |
X
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i
l
che è la correlazione tra la posizione della particella l-esima con sè stessa al
tempo zero e ad un tempo successivo t. Si chiama incoerente perché è una
risposta legata alla singola particella e non alla collettività del sistema.
3.1
Funzione di Van Hove, funzione di scattering, fattore
di struttura statico
La funzione di correlazione densità-densità può essere scritta in termini di una
grandezza generale detta funzione di Van Hove:
G(r̄, t) = hρ(r̄, t)ρ(0̄, 0)i
(3.7)
che può essere trovata anche normalizzata rispetto alla densità media. La sezione d’urto coerente, con la definizione appena data è proprio la trasformata di
Fourier (TdF) della funzione di Van Hove. Questa a sua volta può essere scritta
come la somma di due termini, una parte self e una parte distinct:
G(r̄, t) = Gs (r̄, t) + Gd (r̄, t)
(3.8)
3
SCATTERING DA NEUTRONI TERMICI
30
La definizione generale della funzione di Van Hove, esplicitando la funzione di
correlazione densità-densità è:
X
G(r¯1 , r¯2 , t) =
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i
(3.9)
ll0
e i termini self e distinct sono rispettivamente:
X
G self:
Gs (r¯1 , r¯2 , t) =
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i
(3.10)
l
G distinct:
Gd (r¯1 , r¯2 , t) =
X
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i
(3.11)
l6=l0
quindi nella G self è contenuta la dinamica di singola particella mentre nella G
distinct è contenuta la dinamica di una particella con un’altra da essa distinta.
Qui non si discute di particelle indistinguibili, per cui queste sono tutte definizioni classiche. La funzione di Van Hove è ben definita nelle variabili r̄ e t, e
vale il seguente limite:
lim G(r̄, t) = Gs (r̄, 0) + Gd (r̄, 0)
(3.12)
Gs (r̄, 0) −−−→ δ(r̄)
(3.13)
t→0
e ovviamente vale che:
t→0
in quanto la correlazione della particella con sè stessa è 1 a tempi nulli (la
particella o si trova in quel punto oppure non c’è).
Vediamo ancora qualche definizione.
Viene chiamata funzione di scattering la seguente espressione:
Z
S(q̄, ω) = dr¯1 dr¯2 dt e−iq̄(r¯1 −r¯2 ) eiωt G(r¯1 , r¯2 , t)
(3.14)
che come si vede è la TdF della funzione di Van Hove. Quindi per la parte
coerente della sezione d’urto si può riscrivere:
|kfN | 1
∂ 2 σ = |b̂|2 N
Sd (q̄, ω)
∂Ω∂ω coer
|ki | 2π
(3.15)
la funzione di scattering essendo la TdF della funzione di correlazione densitàdensità è relativa al sistema. Facendo la decomposizione vista fra i termini self e
distinct nella definizione di S(q̄, ω) si ottiene una Sself e una Sdistinct . La Sself
è quella che entra nella parte incoerente della sezione d’urto cioè:
|kfN | 1
∂ 2 σ = |δbˆ2l | N
Ss (q̄, ω)
∂Ω∂ω incoer
|ki | 2π
(3.16)
A partire dalla definizione della funzione di scattering si definisce il fattore di
struttura statico:
Z
S(q̄) = dωS(q̄, ω)
(3.17)
cioè l’integrale su tutte le energie scambiate della funzione di scattering (o fattore
di struttura dinamico) dà il fattore di struttura statico che può essere spiegato
3
SCATTERING DA NEUTRONI TERMICI
31
guardando la figura 4: i neutroni dopo aver interagito col target vengono diffusi
in tutte le direzioni, alcuni hanno lo stesso ki mentre altri avranno un kf 6=
ki mentre altri ancora verranno retrodiffusi (cioè kf = −ki ). E’ importante,
fissata una certa direzione di diffusione capire se l’energia dei neutroni diffusi
sia uguale o meno a quella dei neutroni incidenti per capire se l’interazione è
di tipo elastico o anelastico. Calcolare il fattore di struttura statico vuol dire
scegliere una precisa direzione finale kf e integrare su tutte le ω, ricordando che
~ω = EfN − EiN , significa contare tutti i neutroni che arrivano in quella data
direzione senza curarsi del fatto che abbiano subito uno scattering elastico o
anelastico. Per capire meglio si pensi che della quantità di neutroni che incidono
sul bersaglio circa il 99 % passano indisturbati; il 99 % dell’1 % rimanente subisce
uno scattering elastico e solo la parte restante (cioè l’1 % dell’1 %) subisce uno
scattering anelastico. Per contare tutti i neutroni diffusi si dovrebbe avere un
detector emisferico attorno al bersaglio e integrare non solo su tutte le frequenze
ma anche su tutti i vettori d’onda.
Il fattore di struttura statico è interessante perché misura i picchi di Bragg di
una struttura ordinata: essi sono i picchi di intensità dovuti a processi elastici
in cui non viene scambiata energia (~ω = 0) ma viene cambiato solo il vettore
d’onda. Il contributo elastico è enormemente maggiore di quello anelastico e
il Bragg misura proprio questo. Dalla misura del Bragg si possono ottenere
informazioni sulla struttura ordinata che costituisce il target.
E’ facile mostrare che, data la (3.14) e la (3.17), integrando in dω, il fattore di
struttura statico è la TdF spaziale della G(r̄, 0):
Z
S(q̄) = dr̄e−iq̄ · r̄ G(r̄, 0)
R
R
questo perché si può scambiare dω con dt (perché le funzioniRcoinvolte sono
iωt
uniformemente continue,
R e le funzioni fisiche come ω e t lo sono) e dωe = δ(t)
che annulla l’integrale dt. Il significato fisico è che il fattore di struttura statico
contiene le correlazioni a tempi nulli.
Infine si consideri il fattore di struttura dinamico:
Z
S(q̄, ω) = dr̄dt e−iq̄ · r̄ eiωt hρ(r̄, t)ρ(0̄, 0)i
(3.18)
dove si è usata la definizione di G, cioè la correlazione densità-densità: dato un
valore di densità nella posizione 0̄ al tempo 0, la funzione di correlazione misura
come questo valore di densità influenza la densità stessa a valori spaziali r̄ e
temporali t successivi.
Qualunque grandezza fisica di solito può essere scritta come si è fatto per il
parametro d’urto, cioè come data dal valore medio più le fluttuazioni da quel
valore:
ρ(r̄, t) = ρ̂ + δρ(r̄, t)
(3.19)
il valore medio ρ̂ è quello che si ottiene da una misura macroscopica termodinamica mentre le fluttuazioni δρ(r̄, t) sono quelle che si ottengono con un
probe locale. Prendendo questa definizione e sostituendola nella funzione di
correlazione densità-densità si ha:
h(ρ̂ + δρ(r̄, t))(ρ̂ + δρ(0̄, 0))i = ⇒
⇒ =|ρ̂|2 + hδρ(r̄, t)ρ̂i + hρ̂δρ(0̄, 0)i + hδρ(r̄, t)δρ(0̄, 0)i
2
⇒ =|ρ̂| + hδρ(r̄, t)δρ(0̄, 0)i
(3.20)
3
SCATTERING DA NEUTRONI TERMICI
32
cioè si è divisa la funzione di correlazione in una parte che dipende dal valore
medio di ρ e di una parte che dipende dalla correlazione delle fluttuazioni.
Sostituendo nella (3.18) si ha, per la prima parte che dipende solo da ρ̂:
Z
Z
2
iωt
S(q̄, ω) = ρ̂
dt e
dr̄ e−iq̄ · r̄ = ρ̂2 δ(q̄)δ(ω)
(3.21)
come si vede la parte dipendente dalla densità media macroscopica è 6= 0 solo
se q̄ = 0 e ω = 0 e questo significa che essa riguarda i neutroni che attraversano
il campione indisturbati, cioè quelli che non interagiscono. Si potrebbe dire che
questi neutroni "interagiscano col valore medio della densità".
Se non ci fossero fluttuazioni di densità quindi i neutroni passerebbero indenni,
e il sistema da questo punto di vista sarebbe neutro. Questo in generale è vero
per qualunque funzione di correlazione quando si scrive la variabile dinamica
come la somma del suo valore medio più la correlazione fra le fluttuazioni: la
parte dipendente dal valore medio di solito è quella che non restituisce risposta,
mentre il contributo alla S(q̄, ω) viene dalla parte fluttuativa. Il Prof. Lupi
usa intenzionalmente le parole eccitazione e fluttuazione come sinonimi proprio
per questo motivo: la fluttuazione equivale a una eccitazione del sistema che
si riflette dal punto di vista macroscopico in una modifica del probe, che viene
misurato e quindi fornisce una misura dello "spettro spaziale e temporale delle
fluttuazioni". Questo discorso vale per sistemi omogenei (liquido o fluido) mentre per un cristallo si usa una scrittura differente che vedremo più avanti.
Distinguiamo ora dei casi semplici per capire meglio cosa si studia con lo scattering da neutroni.
3.2
Studio di un gas perfetto
Un gas perfetto, per particelle massive, ha una hamiltoniana del tipo:
b =
H
X p¯i 2
+ 6 Vb
2m
i
(3.22)
come si evince dal potenziale barrato 6 Vb in un gas perfetto non c’è interazione fra le particelle, e viene considerata solo l’energia cinetica. Che tipo di
risposta si misura incidendo con i neutroni su gas molto rarefatto?
L’assenza del potenziale di interazione particella-particella implica che l’unica
risposta misurabile è quella incoerente. Una risposta collettiva sarebbe legata
alla densità, ma se non c’è interazione fra le particelle, anche cambiando localmente la posizione di una o più particella non v’è alcun effetto su tutte le altre.
Come visto la risposta incoerente è legata alla Gs (r̄, t) il cui limite è:
lim Gs (r̄, t) = δ(r̄)
t→0
Per calcolare lo spettro si dovrebbe calcolare la:
Z
Ss (q̄, ω) = dr̄dt eiωt e−iq̄ · r̄ Gs (r̄, t)
(3.23)
(3.24)
perché la sezione d’urto incoerente è:
|kfN | 1
∂ 2 σ = |δbˆ2l | N
Ss (q̄, ω)
∂Ω∂ω incoer
|ki | 2π
(3.25)
3
SCATTERING DA NEUTRONI TERMICI
33
Ciò significa che, se si arriva con N neutroni sul sistema, il numero di neutroni
scatterati con una certa energia Ef e vettore d’onda kf è dato da:
NEf ,kf = N ·
∂2σ
∂Ω∂ω
(3.26)
Non conoscendo l’espressione della Gs si ipotizza una forma gaussiana, cioè:
"
# 23
r2
1
Gs (r̄, t) =
(3.27)
e− 4α(t)
2πα(t)
in questo modo la non conoscenza della Gs si è spostata sulla non conoscenza del
parametro α(t). La G come la Gs e la Gd , opportunamente normalizzate, sono
delle probabilità condizionate (come un valore iniziale condiziona i valori successivi). Dal punto di vista probabilistico quindi è possibile definire il momento
secondo della distribuzione cioè:
Z
2
hr i = dr r2 Gs (r̄, t)
(3.28)
che è il valore medio della posizione quadratica. Esso è comunque definito, per
un gas perfetto, come la media della velocità quadratica per il tempo al quadrato
cioè hr2 i = hv 2 it2 (si hanno particelle libere). Il valore di hv 2 i è noto grazie al
principio di equipartizione dell’energia:
1
3
3kB T
mhv 2 i = kB T ⇒ hv 2 i =
2
2
m
(3.29)
dove T è la temperatura assoluta. Per cui si ha per il momento secondo:
hr2 i =
3kB T 2
t
m
(3.30)
Data la definizione probabilistica della Gs e conoscendo hr2 i, è possibile integrare la Gs a causa della forma funzionale gaussiana data e calcolare α(t), trovando
che:
kB T 2
hr2 i = 6α(t) ⇒ α(t) =
t
(3.31)
2m
Ora, visto che è stato ben definito il parametro α(t) (che deve avere le dimensioni di una distanza al quadrato dato che l’esponente della (3.27) deve essere
adimensionale) questo può essere inserito nella (3.27) per ridefinire la Gs e quindi calcolare la Ss e quindi la sezione d’urto, e ottenere così la risposta data dai
neutroni termici che incidono contro un gas perfetto. Sapendo che la funzione gaussiana è autofunzione dell’operatore trasformata di Fourier (cioè sono
invarianti sotto TdF) scrivendo in maniera esplicita la Ss si ha:
# 12
"
2
m
− mω
Ss (q̄, ω) =
e 2kB T q2
(3.32)
kB T 2πq
che come si vede è una funzione a sua volta gaussiana nelle variabili ω (TdF del
tempo) e q̄ (TdF della posizione). In particolare la larghezza a mezza altezza di
questa funzione (Full Width Half Maximum - FWHM) è:
r
2 ln 2 kB T
Γ(q) = 2
q
(3.33)
m
3
SCATTERING DA NEUTRONI TERMICI
34
Figura 5: Grafico della Ss in due direzioni differenti q1 e q2 .
che in pratica è la sua varianza. In figura 5 è graficata la Ss . Si hanno in ascisse
l’energia scambiata e in ordinata il momento scambiato. Il grafico in sostanza
rappresenta le particelle scatterate in due direzioni differenti (q1 e q2 ). Alcuni
neutroni sono scatterati in maniera elastica (la maggior parte visto che il picco
si ha per ω = 0) e altri in maniera anelastica. Le linee verdi mostrano il valore
del FWHM delle due gaussiane disegnate a differenti valori di q. Rispetto al
segnale massimo (scattering elastico, ω = 0) vi sono processi anelastici Stokes e
anti-Stokes per valori di ω rispettivamente negativi e positivi. Spostandosi da q1
verso q2 , cioè aumentando il vettore d’onda scambiato, Γ aumenta linearmente
con q e di conseguenza la gaussiana si schiaccia.
Ci si può chiedere se l’area sotto la prima gaussiana sia uguale a quella della
seconda, o in altri termini se c’è una distribuzione isotropa di scattering a tutti
i vettori d’onda scambiati, cioè da 0 a 2kiN oppure, in alternativa, se c’è un
qualche tipo di cut-off nel vettore d’onda scambiato.
Un gas perfetto a temperatura ambiente ha una funzione di distribuzione delp̄2m
l’energia delle particelle maxwelliana, centrata sul valore 32 kB T = 2m
dove p̄m
è l’impulso più probabile; ci si aspetta che se si va ad una decina di volte il
valore massimo dell’energia ci siano pochissime particelle che hanno un’energia
media molto più grande di 32 kB T . In sostanza la maggioranza delle particelle ha
un’energia molto vicina al valore centrale e solo pochissime particelle avranno
un impulso molto più grande di p̄m .
Per avere un processo in cui il vettore d’onda scambiato q̄ è molto grande, i
neutroni devono interagire con particelle ad alto vettore d’onda, quindi in principio si può anche ottenere retrodiffusione, tuttavia il numero di particelle che
subiscono processi di questo tipo è estremamente basso.
Il calcolo è semplice: si consideri un gas di azoto N2 con massa m a 300 K. Si
può calcolare l’impulso quadratico medio p̄ = ~k̄ da cui si ricava k e quindi il
3
SCATTERING DA NEUTRONI TERMICI
35
vettore d’onda più probabile nel processo.
La statistica delle particelle, cioè come sono distribuite a livello energetico, e di
conseguenza (data la relazione tra energia e impulso delle particelle) qual è il
vettore d’onda più probabile, determina come è fatto lo spettro di scattering.
In conclusione si può dire che per un gas perfetto la probabilità che avvengano
processi con vettore d’onda scambiato grande è una quantità piccola, in quanto
è piccolo il numero di particelle con vettore d’onda diverso da quello più probabile.
Quindi cosa si vede fisicamente in questo sistema? Fissata una direzione di
scattering si contano il numero di particelle che arrivano, e si fa una selezione in
energia, si costruisce la funzione di distribuzione dei neutroni scatterati e per un
dato vettore d’onda (quindi per una data direzione di scattering) si ottiene una
gaussiana centrata in ω = 0, che mi dice che il processo più probabile è quello
elastico.
A parità di vettore d’onda la larghezza della gaussiana dipende da
√
T , che riflette semplicemente la statistica delle velocità delle particelle. Quindi tanto più è alta la temperatura, tanto maggiore è la larghezza della gaussiana
e quindi si ha un alto numero di particelle con velocità (energia cinetica) sufficiente per avere scattering elastico, quindi Γ è una misura della distribuzione
di energia delle particelle che stanno diffondendo i neutroni. In teoria, andando
a temperatura quasi nulla e supponendo che il gas perfetto in esame rimanga
un gas, le gaussiane tendono a stringersi fino a diventare delle delta di Dirac;
ad esempio per l’elio gassoso, che rimane gassoso fino a 4.2 K dopodichè liquefa
(con un salto di densità di circa un fattore 1000), e non solidifica mai, si vede
l’effetto di restringimento delle gaussiane in cui i processi anelastici diventano
sempre meno probabili a vantaggio di quelli elastici, perché lo spettro di energia
delle particelle che stanno diffondendo i neutroni è sempre meno largo.
Vogliamo ora andare a vedere il caso di una gas reale, in cui c’è un poco di
interazione fra le particelle.
3.3
Studio di un gas reale
Come già detto, un gas reale, l’operatore di interazione Vb fra le particelle è
piccolo rispetto all’energia cinetica ma non nullo. Quando il potenziale totale
(media fra potenziale a corto range repulsivo e potenziale a lungo range attrattivo) assume un valore comparabile a quello dell’energia cinetica si ha la
transizione verso lo stato liquido. Per un gas a densità sufficientemente elevata
il potenziale particella-particella gioca un ruolo fondamentale e ha un effetto
nello spettro osservabile tramite scattering di neutroni termici. Un gas reale
ha un tempo caratteristico fra due urti τ : per tempi piccoli cioè t τ si è in
approssimazione di particella libera, mentre per tempi sufficientemente grandi
cioè t τ gli urti hanno un peso rilevante (consideriamo per semplicità urti
elastici). Si può dire quindi che la dinamica dipende dal range temporale che si
considera.
L’effetto medio di tale dinamica permette di calcolare la funzione α(t). Come nel
caso precedente infatti ci si vuole concentrare sulla forma della Gs , spostando
la non conoscenza della Gs sulla non conoscenza di α(t):
α(t) = D∗ t
(3.34)
dove D∗ è il parametro di diffusione di Einstein. La media per tempi tali per cui
si abbiano sia le dinamiche di particella libera che quelle degli urti fa si che il
3
SCATTERING DA NEUTRONI TERMICI
36
Figura 6: Andamento di Γ(q)
parametro α non sia più quadratico nel tempo, come nel caso di un gas perfetto,
bensì sia lineare. Prendendo la (3.34) e inserendola nella (3.27), e calcolando la
trasformata di Fourier, si ottiene per un gas reale:
Ss (q̄, ω) =
1
D∗ q2
π (D∗ q 2 )2 + ω 2
(3.35)
e la FWHM di questa funzione è:
Γ(q) = 2D∗ q 2
(3.36)
La nuova funzione è una lorenziana, mentre prima nel caso di particella libera
si aveva una gaussiana. Anche questa funzione è centrata in ω = 0, cioè la probabilità massima si ha per processi elastici, e a differenza del caso precedente
la Γ cresce con q 2 mentre prima cresceva linearmente con q. In figura 6 viene
graficato il valore di Γ(q). Quando si hanno delle particellepche scatterano con
altre particelle, si può definire il libero cammino medio l = hv 2 iτ . Per un gas
τ è dell’ordine del ps, mentre hv 2 i è dell’ordine dei 105 m/s.
Osservando spazialmente il sistema, quando la variabile spaziale è molto più
grande del cammino libero medio r l si sta osservando una dinamica contraddistinta da molti urti. Ciò significa che Γ(q) è quello dato dalla (3.36), e lo
spettro del processo è lorenziano. Questo significa che l’andamento quadratico
di Γ è esclusivo di valori di q piccoli, perché l’inverso del vettore d’onda fornisce
la risoluzione spaziale λ = 2π/q (per vettore d’onda scambiato piccolo si stanno
considerando neutroni diffusi attorno alla direzione ki ) che quindi sarà grande
e corrisponde alla dinamica appena descritta.
Se invece si considerano vettori d’onda scambiati grandi, significa che dal punto
di vista della risoluzione spaziale si è in grado di risolvere dinamiche molto piccole, tra due urti, per cui si è in grado di vedere una FWHM della distribuzione
che varia linearmente con q.
Si può dire che Γ(q) non ha solo il significato probabilistico di essere la FWHM
della distribuzione di particelle (gaussiana, lorenziana o una via di mezzo), ma
rende l’idea della dinamica che si è in grado di osservare.
In termini rigorosi: dato un fluido reale, con un certo potenziale di interazione e
distribuzione di energia, i processi di scattering in cui il vettore d’onda finale del
neutrone è abbastanza vicino a quello incidente (quindi neutroni scarsamente
3
SCATTERING DA NEUTRONI TERMICI
37
Figura 7: Studio di un solido ordinato: cella elementare cubica
deviati) stanno fotografando dinamiche collettive medie su distanze grandi (gli
urti), i neutroni che vengono scatterati con vettore d’onda scambiato grande
tengono conto delle dinamiche di singola particella (cammino libero). Ovviamente c’è una regione di transizione in cui si passa dalla dinamica mediata sugli
urti a quella di singola particella (è un problema ancora aperto capire cosa succede nella regione di crossover sui sistemi reali per lo scattering di neutroni).
In conclusione se si è in grado di registrare l’andamento di Γ si è in grado di
studiare i regimi estremali: quello di particella libera e quello degli urti.
3.4
Studio di un solido ordinato
Nel caso dei solidi ordinati, l’interazione che serve ad avere dinamiche collettive
è tale per cui queste dinamiche possono propagarsi (ad esempio il suono). Per
un sistema ordinato lo scattering di neutroni fornisce numerose informazioni
utili sul sistema.
Nei casi precedenti la variabile q è continua, e i neutroni possono essere scatterati in tutte le direzioni, mentre per i solidi ordinati l’invarianza traslazionale
finita determina scattering solo lungo direzioni specifiche, e quest’effetto è chiamato scattering di Bragg.
Un cristallo è un oggetto contraddistinto da una struttura periodica il cui elemento unitario è la cella elementare.
Si consideri una cella elementare cubica e un sistema di riferimento esterno:
il vettore x̄l indica lo spigolo della cella, e dato questo spigolo, il vettore che
individua gli atomi all’interno della cella è x̄χ . Il sistema è schematizzato in
figura 7. Si può dire che x̄l è un vettore macroscopico mentre x̄χ è un vettore
di qualche Å. Quindi i pedici l e χ indicano rispettivamente la cella e l’atomo
in essa.
Data la periodicità del reticolo, se si trasla di un vettore R̄lχ = x̄l + x̄χ si
ottiene una struttura equivalente (grazie all’invarianza per traslazione di un
vettore principale del reticolo diretto). In generale gli atomi possono oscillare, a
temperatura finita, attorno alla posizione di equilibrio, e questo determina una
dipendenza dal tempo del vettore R̄lχ a causa del vettore ūlχ (t) che definisce la
posizione istantanea e indica lo spostamento dalla posizione di equilibrio. Quindi si può scrivere che R̄lχ (t) = x̄l + x̄χ + ūlχ (t). Se si prendono due atomi nella
3
SCATTERING DA NEUTRONI TERMICI
cella, si può vedere che:
|x̄χ − x̄χ0 | √
38
ū2
(3.37)
che significa che lo scarto quadratico medio degli atomi che oscillano attorno
ad una certa posizione di equilibrio è molto più piccolo della distanza media
fra gli √atomi stessi. Per dare un’idea delle grandezze, se |x̄χ − x̄χ0 | ' 1 Å,
allora ū2 ' 0.01 Å. Quando si aumenta tanto la temperatura, il valore di ū
aumenta (oscillazioni sempre più ampie) e quando la distanza quadratica media
dell’oscillazione passa da 1/100 a circa 1/3 della distanza media fra due atomi,
allora il cristallo fonde e si ha la transizione di fase verso lo stato liquido.
Si faccia quindi l’ipotesi di avere un cristallo stabile e cioè che il valore di ū sia
piccolo rispetto alla distanza fra due atomi. In un sistema tridimensionale, in
cui si hanno r atomi per cella e N celle, il numero totale di gradi di libertà (dof)
è 3rN , un numero enorme. Per un tale sistema, l’energia cinetica è:
T =
1X
2
Mχ (u̇α
lχ )
2
con α = x, y, z
(3.38)
lχα
e per il discorso fatto prima si può dire che si hanno 3rN termini cinetici di
questo tipo. Il potenziale d’azione cristallino non è a corto range in quanto se
si muove un atomo in una cella tutti quelli vicini ne risentiranno. L’energia di
interazione dipende quindi dall’insieme delle coordinate (parentesi graffe) e dato
che non ne si conosce la forma si può pensare di svilupparlo in serie:
φ(R̄lχ (t)) = φ0 +
X
φα (l, χ)uα
lχ (t) +
1 X
β
φαβ (l, l0 , χ, χ0 )uα
lχ (t)ul0 χ0 (t) + . . .
2
lχα
l 0 χ0 β
lχα
(3.39)
tale potenziale dipende dalla configurazione reticolare: φ0 è il potenziale calcolato nella configurazione di equilibrio cioè:
φ0 = φ({x̄l + x̄χ })
(3.40)
mentre per il termine lineare si ha:
φα (l, χ) =
∂φ ∂uα
lχ u=0
(3.41)
questo termine all’equilibrio va a zero in quanto il sistema è stabile e il potenziale
totale ha un minimo. Per il termine quadratico si ha:
φαβ (l, l0 , χ, χ0 ) =
∂2φ
β u=0
∂uα
lχ ∂ul0 χ0
(3.42)
Se si tiene conto anche dei termini cubici, quarti ecc, si sta tenendo conto di
fenomeni che ci sono nei sistemi reali, ad esempio per tenere conto della dilatazione termica si deve includere nel potenziale anche il termine di ordine 3
(quindi in sistemi armonici non si ha espansione termica).
Normalmente per il potenziale di interazione in una cella e fra le varie celle, ci
si ferma al secondo ordine, cioè si scrive il potenziale totale all’equilibrio più la
derivata seconda, e questa scrittura si chiama approssimazione armonica. La
φαβ (l, l0 , χ, χ0 ) è la costante della forza di richiamo, cioè la forza generalizzata
3
SCATTERING DA NEUTRONI TERMICI
39
di interazione fra l’atomo χ0 presente nella cella l0 con l’atomo χ nella cella l.
L’atomo χ si muove in maniera istantanea con lo spostamento ulχ (t) mentre
l’atomo χ0 si muove istantaneamente con lo spostamento ul0 χ0 (t).
Si possono quindi scrivere le 3rN equazioni del moto:
X
φαβ (l, l0 , χ, χ0 )uβl0 χ0 (t)
(3.43)
Mχ ülχ (t) = −
l0 χ0 α0
L’approssimazione armonica favorisce la soluzione delle equazioni del moto altrimenti irrisolvibili. Una possibile soluzione della (3.43) si può scrivere come:
X
1
ēα (k̄j , χ)eik̄j · x̄l Qk̄j (t)
uα
lχ (t) = p
N Mχ
(3.44)
k̄j
Questa formula dice che la posizione dell’atomo χ nella cella l, nella sua componente cartesiana α al tempo t è una combinazione lineare (a parte il fattore di
normalizzazione) di moti armonici di ampiezza Qk̄j (t), dove k̄j è il vettore d’onda con j che è l’indice di branca della dispersione fononica. L’oggetto ēα (k̄j , χ)
si chiama versore di polarizzazione dei modi normali di vibrazione e indica il
verso di oscillazione dei piani cristallini sollecitati da un’onda k̄: se l’oscillazione è parallela alla propagazione dell’onda si ha il modo longitudinale, se invece
è perpendicolare ad essa si hanno i due modi trasversali ; questa situazione è
diversa da quella dell’onda elettromagnetica in cui il versore di polarizzazione
ha solo due componenti sempre trasverse rispetto alla direzione di propagazione
dell’onda.
Il fattore di fase eik̄j · x̄l altro non è che il teorema di Bloch, cioè è un fattore
che tiene conto della periodicità del cristallo, e data la conoscenza di quello che
avviene nella cella elementare, si conosce la dinamica su tutto il cristallo.
Data la soluzione generale (3.44), inserendola nell’equazione del moto (3.43), si
trova un’equazione del moto puramente armonica. L’approssimazione armonica
fa si che ogni atomo si muova all’interno del cristallo come una combinazione
lineare di moti armonici e questo è ciò che si chiama modo armonico di vettore
d’onda k̄ e branca j.
Ricapitolando si può scrivere che un modo armonico del cristallo Qk̄j (t) è definito
da:
• k̄ vettore d’onda del modo;
• ē(k̄j , χ) versore di polarizzazione del modo armonico;
• j indice di branca (longitudinale e trasversale);
L’espressione (3.44) è uno sviluppo in serie e dice come oscilla un atomo rispetto ai modi normali di oscillazione. Quest’espressione può essere invertita
per scrivere l’espressione del modo normale di oscillazione in funzione dello
spostamento dei singoli atomi:
1 Xp
Qk̄j (t) = √
Mχ e∗α (k̄j , χ)e−ik̄j · x̄l uα
lχ (t)
N lχα
(3.45)
Nel momento in cui, per effetto dell’interazione atomo-atomo all’interno del cristallo, viene spostato dalla posizione di equilibrio (o ciò avviene a causa della
3
SCATTERING DA NEUTRONI TERMICI
40
Figura 8: Grafico della relazione di dispersione per la branca acustica e quella
ottica. La distanza 0-π/a rappresenta la metà della prima zona di Brillouin.
temperatura) un singolo atomo, questa perturbazione locale si propaga all’interno del cristallo. La perturbazione locale si riflette in un’onda di perturbazione
globale che si propaga nel cristallo. Per questo motivo il moto di singolo atomo
è scrivibile come composizione di onde oscillatorie all’interno del cristallo. Se si
guarda il cristallo nel complesso, il moto del cristallo è riconducibile alla somma
di moti armonici di ampiezza uα
lχ (t).
Questo è il modo normale di vibrazione: una combinazione lineare dei moti di
singolo atomo la cui quantizzazione dà luogo al concetto di fonone.
In principio si può dire che il modo normale è un modo cooperativo di tutti
gli atomi che si muovono all’interno del cristallo. Ma perché si chiama modo
normale? perché esso soddisfa un’equazione del moto del tipo:
Q̈k̄j (t) + ωk̄2j Qk̄j (t) = 0
(3.46)
che è un’equazione di oscillatore armonico. La soluzione della (3.46) è evidentemente:
−iω t
(3.47)
Qk̄j (t) = Qk̄j (0)e k̄j
con ωk̄j che è la pulsazione del modo normale di vibrazione.
Infatti il modo normale, a seconda di j è caratterizzato da una legge di dispersione data dalla pulsazione in funzione del vettore d’onda ωj (k̄); quella dei
fotoni ad esempio è ω(k̄) = ck̄. Per i modi normali di vibrazione invece la legge
è più complessa. Se si ha un cristallo tridimensionale con r atomi per cella,
facendo riferimento alla figura 8, la linea blu rappresenta la branca acustica
che di solito si splitta in tre linee, una più alta per il modo longitudinale e due
più basse sovrapposte per i modi trasversali; la linea rossa invece rappresenta la
branca ottica, che si presenta quando si hanno almeno due atomi per cella (con
un solo atomo per cella si hanno solo le branche acustiche), ed essa non va a
zero col vettore d’onda. Anche la branca ottica si splitta in una linea a più alta
energia per il modo longitudinale e due linee più basse per i modi trasversali.
Tutto questo, in generale, è un discorso classico. Per fare un passo avanti e
studiare i modi normali nel caso quantistico bisogno introdurre il concetto di
fonone.
3
SCATTERING DA NEUTRONI TERMICI
3.4.1
41
I fononi
Data la posizione istantanea di un atomo, dal punto di vista della meccanica si può definire l’impulso dell’atomo come p̄lχ (t) = Mχ ū˙ lχ . La meccanica
quantistica entra in queste considerazioni scrivendo il commutatore:
β
[ûα
lχ (t), p̂l0 χ0 (t)] = i~δll0 δχχ0 δαβ
(3.48)
ed ora û e p̂ sono operatori. La relazione (3.48) rappresenta semplicemente un’altra relazione già nota e cioè il commutatore dell’oscillatore armonico
[X̂, P̂ ] = i~.
Il commutatore (3.48) significa che non è possibile misurare con infinita precisione e contemporaneamente la posizione e l’impulso istantanei dell’atomo in
esame (per due atomi distinti invece è possibile).
L’applicazione, in meccanica quantistica, di un commutatore posizione-impulso
fa si che anche Q̂k̄j (t) diventi un operatore.
˙
Similmente, definendo il nuovo impulso per il modo normale come P̂k̄j = Mχ Q̂k̄j (t)
si può mostrare che vale la relazione di commutazione a tempi uguali:
[Q̂k̄j (t), P̂k¯0 j0 (t)] = i~δjj 0 ∆(k̄ − k̄ 0 )
(3.49)
Quindi si può dire che il passaggio alla meccanica quantistica avviene imponendo
la relazione di commutazione posizione-impulso nello spazio reale che è semplicemente l’estensione della proprietà di commutazione dell’oscillatore armonico
unidimensionale, e anche la variabile modo normale e il suo impulso coniugato
diventano operatori che soddisfano la relazione (3.49).
Quest’espressione significa che la variabile modo normale e impulso coniugato
sono contemporaneamente misurabili se si considerano branche diverse o se hanno vettori d’onda diversi. La quantità ∆(k̄ − k̄ 0 ) si chiama delta generalizzata
o delta cristallografica ed essa è diversa da zero se k̄ = k̄ 0 + Ḡ con Ḡ vettore
principale del reticolo reciproco.
Come per la quantizzazione dell’oscillatore armonico unidimensionale, partendo
dalla (3.45), si possono definire gli operatori a†k̄ e ak̄j :
j
"r
a†k̄
j
=
"r
ak̄j =
ωj (k̄) †
1
Q̂k̄ +
j
2~
i
s
ωj (k̄)
1
Q̂k̄j −
2~
i
s
1
P̂ †
2~ωj (k̄) k̄j
#
1
P̂
2~ωj (k̄) k̄j
#
(3.50)
(3.51)
che sono gli operatori di creazione e distruzione, e soddisfano la relazione di
commutazione [â†k̄ , âk̄j ] = δjj 0 ∆(k̄ − k̄ 0 ). E’ possibile definire l’hamiltoniana,
j
che diventa un operatore, tramite gli operatori appena scritti come una somma
di hamiltoniane di singolo oscillatore armonico:
X †
1
b
b
b
~ωj (k̄)
(3.52)
H =T +φ⇒
ak̄ ak̄j +
j
2
k̄,j
La quantità n̂k̄j = a†k̄ ak̄j è detta operatore numerico k̄j .
j
Lo stato fondamentale di un oscillatore armonico unidimensionale quantizzato
3
SCATTERING DA NEUTRONI TERMICI
42
Figura 9:
Livelli energetici dell’oscillatore armonico unidimensionale
quantizzato sovrapposti al potenziale V dell’oscillatore armonico classico.
ha energia ~ω
2 detta energia di punto zero. I livelli energetici rispetto all’oscillatore classico sono discretizzati, tutti distanziati di ~ω, e in figura 9 li si
vede sovrapposti al potenziale dell’oscillatore classico. In meccanica quantistica
l’oscillatore ha un’energia di punto zero che è non nulla, questo a causa della
relazione di commutazione a tempi uguali (3.49). A causa del principio di indeterminazione di Heisenberg, se l’oscillatore è fermo ha una indeterminazione
infinita sull’impulso (e quindi sull’energia cinetica), viceversa se l’oscillare ha
un impulso ben definito allora ha indeterminazione infinita sulla posizione. In
questo quadro l’energia di punto zero ha il significato della minima indeterminazione posizione-impulso che minimizza l’indeterminazione sull’energia. Poichè
posizione e impulso non sono simultaneamente misurabili cioè ∆p∆x ≥ ~, la
minima indeterminazione soddisfacente la relazione appena scritta implica la
minima indeterminazione sull’energia ∆E ≥ ~ω
2 . Quando si parla di operatori di creazione o distruzione, ciò che viene distrutto e creato è la popolazione
corrispondente ai livelli. L’ampiezza di oscillazione classica significa a livello
quantistico quanti livelli popolati si hanno.
E’ possibile definire la coordinata generalizzata Q nonchè operatore di modo
normale tramite gli operatori (3.50) e (3.51) e scrivere:
s
i
~ h †
Qk̄j (t) =
ak̄ (t) + ak̄j (t)
(3.53)
j
2ωk̄j
e questa può essere sostituita nella (3.44) e ottenere:
s
i
X
~ h †
1
ik̄j · x̄l
α
ulχ (t) = p
ēα (k̄j , χ)e
ak̄ (t) + ak̄j (t)
j
2ωk̄j
N Mχ
(3.54)
k̄j
la coordinata istantanea ū dell’atomo χ nella cella l viene così espressa mediante
gli operatori di creazione e distruzione, di cui vogliamo esplicitare il funzionamento.
3
SCATTERING DA NEUTRONI TERMICI
43
Se |nk̄j i è lo stato che indica l’n-esimo stato eccitato dell’oscillatore armonico
allora l’operatore di creazione fononico (3.50) applicato a questo stato da:
q
a†k̄ |nk̄j i = nk̄j + 1 |nk̄j + 1i
(3.55)
j
mentre per l’operatore di distruzione fononico (3.51) si ha:
q
ak̄j |nk̄j i = nk̄j − 1 |nk̄j i
(3.56)
cioè a†k̄ alza di uno il livello di eccitazione del sistema mentre ak̄j fa il lavoro
j
opposto: partendo da uno stato eccitato lo abbassa di livello energetico.
Lo stato di eccitazione del cristallo si riconduce a considerare un insieme finito
di 3rN oscillatori armonici indipendenti (cioè il numero di modi normali), caratterizzati dal proprio vettore d’onda e dallo loro legge di dispersione. Lo stato
generale del cristallo si individua considerando la popolazione di ogni singolo
oscillatore, cioè quali e quanto sono popolati i livelli energetici, nella forma del
suo valore medio di eccitazione.
Il fonone è una quantità distinta rispetto al modo normale di vibrazione: esso è la popolazione dell’oscillatore ed è dipendente dallo stato
termodinamico in cui l’oscillatore si trova (dalla temperatura).
Il livello di popolazione di ogni oscillatore dipende solitamente dalla comparazione fra energia termica ed energia caratteristica dell’oscillatore.Si vuole quindi
individuare come siano popolati i singoli oscillatori.
Si considerino quindi i 3rN oscillatori nella scrittura:
|{nk̄j }i → |nk¯1j , nk¯2j , ...i
1
(3.57)
2
quindi la parentesi { } indica la configurazione di ciascun oscillatore. La (3.57)
si calcola in meccanica quantistica nel modo seguente:
|{nk̄j }i = qQ
1
k̄j (nk̄j )!
(a†k¯
1
j1
)nk¯1 j1 (a†k¯
2
j2
)nk¯2 j2 ... |0i
(3.58)
che in sostanza è l’espressione dello stato più generale del cristallo. Si può
notare che prendendo l’espressione (3.54) e calcolando il valore di aspettazione
rispetto a uno stato generico in cui la popolazione è ben definita (cioè si conosce
la popolazione per ogni oscillatore) si ha:
hnk¯1j , ..., nk¯n jn | uα
lχ |nk¯1j , ..., nk¯njn i = 0
1
(3.59)
1
Questo fatto non deve sorprendere in quanto in approssimazione armonica il valore medio dello spostamento dalla posizione di equilibrio dell’oscillatore è zero,
e questo è stato semplicemente "tradotto" in meccanica quantistica. L’hamiltoniana (3.52), essendo una sommatoria di hamiltoniane di oscillatori armonici
quantistici indipendenti si può scrivere come:
X
b =
H
ĥk̄j
(3.60)
k̄j
e l’energia del sistema si calcola come valore di aspettazione della somma delle
hamiltoniane cioè:
X
X
1
E(T ) = h
ĥk̄j i =
nk̄j (T ) +
~ωk̄j
(3.61)
2
k̄j
k̄j
3
SCATTERING DA NEUTRONI TERMICI
44
dove nk̄j (T ) è la distribuzione di Bose-Einstein:
nk̄j (T ) =
1
n
β~ωk̄j
−1
(3.62)
e contiene l’informazione su quanto è popolato l’oscillatore k̄j alla temperatura
T . La popolazione termica del dato oscillatore si chiama fonone. I fononi sono
il valore di aspettazione termico di popolazione dei 3rN oscillatori indipendenti
e unidimensionali che si descrivono nello spazio reciproco con le equazioni (3.46).
Volendo riassumere si può dire che inizialmente ci si trova in una situazione molto complicata: nello spazio reale si ha numero enorme (ma finito!) di atomi che
oscillano secondo le equazioni (3.44) in approssimazione armonica. Da queste
equazioni si può passare nello spazio reciproco usando le coordinate generalizzate (3.45) che rispondono all’equazione di oscillatore armonico (3.46) e di fatto
rappresentano 3rN oscillatori armonici indipendenti e sono i modi normali di
vibrazione.
Passando alla meccanica quantistica viene definita la relazione di commutazione
(3.48) fra la posizione dell’atomo e il suo impulso che sono ora degli operatori, e
da questa si passa alle coordinate dei modi normali e relativo impulso (3.49) da
cui vengono definiti gli operatori di creazione e distruzione (3.50-51). Con queste definizioni, facendo i conti si dimostra che l’hamiltoniana totale del cristallo
(3.52) si scrive come somma di hamiltoniane di oscillatori armonici unidimensionali le quali sono definite tramite l’operatore numero, prodotto degli operatori
a† e a. La popolazione termica di ogni oscillatore, cioè quanto sono popolati
mediamente i livelli energetici di ogni oscillatore, è chiamata fonone, che è una
quasi-particella indipendente che soddisfa la statistica di Bose-Einstein a potenziale chimico nullo.
Si supponga che kB T ~ωk̄j , cioè l’energia termica sia sufficientemente grande
rispetto all’energia caratteristica degli oscillatori; allora si ha che:
nk̄j (T ) '
kB T
~ωk̄j
(3.63)
cioè la popolazione fononica aumenta linearmente con la temperatura. Da un
sistema di atomi fortemente interagenti nello spazio reale si è passati ad un gas di
bosoni non interagenti detti fononi, e si vuole misurare con lo scattering coerente
dei neutroni la curva di dispersione e la popolazione fononica, che contengono
l’informazione sulla struttura del solido in esame. Se si ha una macromolecola
(proteina, DNA ecc.) data una certa struttura si può calcolare come si muove il
sistema a livello collettivo e definire i modi normali di vibrazione. Non essendoci
però ordine a lungo raggio ne’ invarianza traslazionale i conti sono molto più
complicati. Normalmente la trasformazione di una macromolecola da uno stato
fisico ad un altro avviene aumentando la temperatura e popolando sempre di
più i modi normali fino a quando il sistema va fuori armonicità ed è costretto a
cambiare stato di equilibrio.
3.4.2
Risposta Coerente e Risposta Incoerente
Si vuole tornare ora, dopo questa digressione sulla modellizzazione di un solido
ordinato e sui fononi, allo scattering di neutroni e su cosa viene effettivamente
3
SCATTERING DA NEUTRONI TERMICI
45
misurato. Lo scattering di neutroni, come visto, considerando la sezione d’urto,
presenta due risposte, quella coerente e quella incoerente:
∂ 2 σ ∝ T dF [hρ(r̄, t)ρ(0̄, 0)i]
∂Ω∂ω coer
∂ 2 σ ∝ T dF hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i
∂Ω∂ω incoer
(3.64)
(3.65)
dove T dF [ ] rappresenta l’operazione trasformata di Fourier spazio-temporale.
La (3.64) è la TdF spazio-temporale della funzione di correlazione densitàdensità a tempi e spazi diversi mentre la (3.65) è la TdF spazio-temporale della
funzione di correlazione del singolo atomo con sè stesso a tempi e spazi diversi,
e misurano rispettivamente la risposta collettiva e quella di singola particella.
Nel caso del gas perfetto si è visto che, dato che le particelle sono scorrelate, si
ha solo la risposta incoerente.
Nel caso di un cristallo invece, in cui le particelle sono fortemente interagenti,
si hanno entrambe le risposte.
Quella coerente si può dividere nella somma di due pezzi: la risposta coerente
a 0 fononi, che da lo scattering Bragg da cui si ricava la struttura statica del
cristallo, e la risposta coerente ad 1 fonone che permette di misurare la curva di
dispersione ωk̄j .
Dalla sezione d’urto incoerente si ha: la risposta incoerente a 0 fononi che non
da particolari informazioni fisiche (è un segnale di background piatto), e la risposta incoerente ad 1 fonone che permette di misurare la densità degli stati
fononica con cui si può calcolare il calore specifico.
Ci si concentra ora sulla risposta coerente, che scritta in maniera esplicita
è:
Z
Z
|kfN | |b̂|2
∂ 2 σ iωt
=
dt e
dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) ·
∂Ω∂ω coer |kiN | 2π
(3.66)
X
·
hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i
ll0
dove si possono fare le seguenti modifiche sulla notazione e i simboli: l → l, χ e
R̄l (t) = x̄l + x̄χ + ūlχ (t), e in un cristallo generico composto da χ atomi ognuno
avrà il proprio parametro d’urto che può essere scritto come il suo valore medio
più le deviazioni cioè bχ = bχ + δbχ . Quindi l’espressione (3.66) si può riscrivere
in maniera specifica per i cristalli come:
|kfN | X |bχ bχ0 |2
∂ 2 σ = N
∂Ω∂ω coer |ki | 0
2π
Z
dt eiωt
Z
dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) ·
ll
χχ0
(3.67)
· hδ[r¯1 − (x̄l + x̄χ + ūlχ (t))]δ[r¯2 − (x̄l0 + x̄χ0 + ūl0 χ0 (0))]i
La TdF spaziale può essere scambiata con l’operazione funzione di correlazione
cioè:
Z
Z
dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) h...i = h dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) ...i
(3.68)
e facendo questa operazione, quando si porta l’integrale dentro la funzione di
correlazione allora e−iq̄ · r¯1 va ad agire sulla prima δ di Dirac, mentre eiq̄ · r¯2 va
3
SCATTERING DA NEUTRONI TERMICI
46
ad agire sulla seconda δ di Dirac. Allora si ottiene che:
e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i
(3.69)
questo tenendo conto del lavoro che fa la delta sull’esponenziale nella (3.67)
e tenendo conto che x̄l e x̄χ sono quantità che non dipendono dal tempo e
quindi possono essere portate fuori dalla definizione di funzione di correlazione,
che significa classicamente calcolare la correlazione sul tempo delle funzioni di
spostamento u(t) (mentre in meccanica quantistica significa calcolare i valori di
aspettazione).
Si può dire quindi che la funzione di correlazione densità-densità in un cristallo
si "mappa" in quella appena scritta cioè:
hδ[r¯1 − (x̄l + x̄χ + ūlχ (t))]δ[r¯2 − (x̄l0 + x̄χ0 + ūl0 χ0 (0))]i → he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i
(3.70)
l’operazione è formalmente corretta, cioè esatta nei limiti in cui si possono esprimere le posizione degli atomi come la somma delle loro posizioni di equilibrio
più le variazioni istantanee u(t), la cui correlazione attraverso gli esponenziali
(che sono anch’essi degli operatori come u) sostituisce ora le funzioni densità
nel mappare le variazioni di densità del cristallo.
Per semplificare i conti l’obiettivo a cui si mira è trasformare la funzione di
correlazione degli esponenziali nell’esponenziale della funzione di correlazione
cioè:
he( ) i → eh i
(3.71)
e vogliamo spiegare il motivo fisico di questo fatto.
Facciamo ora alcune stime. Si sa che il vettore d’onda scambiato è dell’ordine
di grandezza:
|q̄| = |k̄fN − k̄iN | ≤ 2k̄iN ∼ 108 cm−1
inoltre vale che:
p
hui = 0
hu2 i '
1
1
Å=
10−8 cm
100
100
quindi il prodotto (al massimo) chepsi trova nell’argomento degli esponenziali
della funzione di correlazione è |q̄| · hu2 i ' 1/100. Se l’operazione (3.71) fosse
possibile, si potrebbe scrivere:
eh i ' 1 + h i
(3.72)
cioè fare uno sviluppo in serie. Dato che la quantità h i è un numero che si
è stimato piccolo, si suppone che questa operazione si lecita. Purtroppo il
problema da risolvere è il passaggio (3.71); per cui è necessario uno strumento
matematico che lo renda possibile.
Si suppone ora che il passaggio (3.71) si possa svolgere (verrà dimostrato in
seguito). Si trascura il termine h i nello sviluppo in serie (3.72) e si scrive:
he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i = 1
quindi per la risposta coerente della sezione d’urto si può scrivere:
Z
|kfN | X |bχ bχ0 |2 −iq̄ · (x̄ −x̄ 0 ) −iq̄ · (x̄χ −x̄ 0 )
∂ 2 σ l
l
χ
dt eiωt
= N
e
e
∂Ω∂ω coer
2π
|ki | 0
| {z }
ll
0
χχ
δ(ω)
(3.73)
(3.74)
3
SCATTERING DA NEUTRONI TERMICI
47
dove come evidenziato, avendo trascurato la correlazione h i a tempi distinti,
l’integrale sul tempo si riduce ad una δ(ω). Si ricorda che ~ω = EiN − EfN =
Eft −Eit , e δ(ω) significa che ~ω = 0 cioè che le energie iniziali e finali dei neutroni
sono uguali così come l’energia finale e iniziale del target: non c’è scambio di
energia tra i neutroni e il sistema target cioè si ha un processo elastico.
Vediamo il caso semplice del reticolo di Bravais cioè si ha un atomo per
cella (in natura esiste solo un sistema cubico
P con un atomo per cella ed è il
Polonio). Per questo motivo la sommatoria χχ0 sparisce e vale |bχ bχ0 |2 = |b|2 .
Quindi l’espressione (3.74), assumendo invarianza per traslazione diventa:
X
X
∂ 2 σ =
e−iq̄ · (x̄l −x̄l0 ) = N
e−iq̄ · x̄l
(3.75)
∂Ω∂ω coer
0
ll
l
dove N è il numero totale di celle e si è preso il riferimento x̄l0 = 0̄. Il reticolo
ha invarianza traslazionale quindi vale che le proprietà fisiche rilevate in x̄l sono
equivalenti a quelle in x̄l + x̄l00 dove x̄l00 è un vettore principale del reticolo diretto
(il vettore che stabilisce la simmetria di traslazione). Quindi si può scrivere che:
X
X
e−iq̄ · x̄l =
e−iq̄ · (x̄l +x̄l00 ) ⇒ e−iq̄ · x̄l00 = 1 ⇒ q̄ = Ḡ, 0
(3.76)
l
l
dove Ḡ è un vettore principale del reticolo reciproco. Fra vettori del reticolo
diretto e quelli di reticolo reciproco infatti vale la relazione x̄l00 · Ḡ = 2πn con n
intero. Pertanto riprendendo la (3.75) si può scrivere che:
X
e−iq̄ · (x̄l −x̄l0 ) = N 2 ∆(q̄ − Ḡ)
(3.77)
ll0
Dove la delta cristallografica ∆(q̄ − Ḡ) 6= 0 se q̄ = 0 o se q̄ = Ḡ.
Se q̄ = 0 si ha un processo elastico senza scambio di vettore d’onda (il neutrone
passa indisturbato).
Se invece q̄ = Ḡ si ha un processo elastico con scambio di vettore d’onda uguale
ad un vettore di reticolo reciproco. Questo significa che lo scattering dei neutroni
non avviene uniformemente su tutto l’angolo solido ma solo per direzioni discrete
e specifiche corrispondenti a vettori principali di reticolo reciproco, che vanno
a formare i picchi di Bragg. E’ questo il fenomeno dello scattering di Bragg
in cui si rilevano i neutroni solo in direzioni specifiche del reticolo reciproco, da
cui tramite TdF è possibile ricavare il reticolo diretto. E’ questa una differenza
importante rispetto al caso di gas perfetto in cui si aveva un processo continuo
e i neutroni potevano essere scatterati in qualunque direzione.
Torniamo ora alle espressioni (3.64-65) per studiarle nel dettaglio. Scriviamo
esplicitamente la funzione di correlazione densità-densità già vista nella (3.71):
he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = e− 2 Wχ (q) e− 2 Wχ0 (q) eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i
1
1
(3.78)
questo passaggio è dato dal teorema operatoriale di Baker-Hausdorff. Se
gli operatori che si trovano negli esponenti sono operatori bosonici, cioè che soddisfano le regole di commutazione bosoniche dell’oscillatore armonico allora è
possibile trasformare la funzione di correlazione dell’esponenziale nell’esponenziale della funzione di correlazione. Questo come già scritto permette di svilup1
pare in serie l’ultimo oggetto della (3.78), dato che il prodotto |q̄ · ū| ≈ 100
.
Gli esponenziali:
1
1
e− 2 Wχ (q) e− 2 Wχ0 (q)
(3.79)
3
SCATTERING DA NEUTRONI TERMICI
48
si chiamano fattori di Debye-Waller. Il fattore di Debye-Waller si può calcolare in maniera analitica in due regimi diversi, quello classico per T ΘD e
quello quantistico per T ΘD . A parte fattori di proporzionalità si ha che:
X
β
Wχ (q) = h|q̄ · ūlχ (t)|2 i =
q α q β hūα
lχ (t)ūl0 χ0 (t)i =
αβ
(
∝
T
ΘD
se T ΘD
se T ΘD
cost 6= 0
(3.80)
dove ΘD è la temperatura di Debye del sistema. In un oscillatore armonico il
valore quadratico medio dello scarto, per il teorema di equipartizione dell’energia va come la temperatura, quindi a parte la dipendenza dal vettore d’onda
scambiato q̄ questi oggetti in regime classico dipendono esplicitamente dalla
temperatura T e dicono che la temperatura influenza le intensità delle righe
Bragg che si possono osservare. I fattori di D-W quindi, a parità di vettore
d’onda e in regime classico tendono a decrescere al crescere della temperatura.
In regime quantistico il valore di aspettazione di ū2 tende ad un valore costante
diverso da zero, e questo perché gli atomi oscillano ugualmente anche a temperatura nulla (energia di punto zero).
Ricapitolando si può scrivere l’espressione della sezione d’urto coerente considerando il passaggio dovuto al teorema di Baker-Hausdorff e i fattori di DebyeWaller:
Z
|kfN | X |bχ bχ0 |2
∂ 2 σ =
dt eiωt e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) ·
∂Ω∂ω coer |kiN | 0
2π
ll
(3.81)
0
χχ
·e
− 12 Wχ (q) − 12 Wχ0 (q) h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i
e
e
dove si è visto che l’esponenziale della funzione di correlazione sviluppato in
serie al primo ordine (cioè posto =1) permette di ottenere l’intensità delle righe
Bragg. Quindi il primo termine è:
Risposta coerente all’ordine zero:
X
1
1
∂ 2 σ =
|bχ bχ0 |2 δ(ω)N 2 ∆(q̄ − Ḡ)e−iq̄ · (x̄χ −x̄χ0 ) · e− 2 Wχ (q) e− 2 Wχ0 (q) · 1
∂Ω∂ω coer
0
χχ
(3.82)
che esprime lo scattering elastico dei neutroni che possono attraversare il campione indisturbati (circa il 99% con q̄ = 0) oppure essere scatterati in direzioni
precise, cioè quando il vettore d’onda scambiato corrisponde a vettori principali
del reticolo reciproco (q̄ = Ḡ). Il valore di N 2 , cioè il quadrato del numero
di celle è in perfetta analogia con la diffrazione in cui l’intensità della riga di
diffrazione ottica è proporzionale al numero di fenditure al quadrato.
Nel caso di un atomo per cella si può scrivere:
X
∂ 2 σ = δ(ω)N 2 ∆(q̄ − Ḡ)|
bχ e−iq̄ · x̄χ · e−Wχ (q) |2
(3.83)
∂Ω∂ω coer
χ
dove la quantità presente nel modulo quadro è detta fattore di struttura.
Si prova a fare un calcolo: si pone per semplicità il fattore di D-W uguale a 1.
3
SCATTERING DA NEUTRONI TERMICI
49
Si considera un cristallo cubico a corpo centrato (bcc) di lato a che ha 2 atomi
per cella nelle posizioni x̄1 = a(0, 0, 0) e x̄2 = a( 21 , 12 , 12 ), e si considerano questi
atomi uguali (quindi il valore di bχ non dipende più da χ). Si ha che:
X
1 1 1
b e−iq̄ · x̄χ = b(1 + e−iḠ · a( 2 , 2 , 2 ) )
(3.84)
0,0,0
1 1 1
2,2,2
la condizione di conservazione dell’impulso ∆(q̄ − Ḡ) impone che q̄ = Ḡ vettore
principale di reticolo reciproco. Il reticolo reciproco di un bcc è un cubico a
facce centrate (fcc) ed ha un vettore minimo di reticolo reciproco (lato della
cella elementare cubica a facce centrate) di modulo pari a |b̄| = 2π
a e quindi i
vettori principali di reticolo reciproco si scrivono come:
Ḡ = b̄1 v1 + b̄2 v2 + b̄3 v3
con v1 , v2 , v3 ∈ N
(3.85)
Tenendo conto della relazione fra vettori elementari del reticolo reciproco e
diretto è b̄i · āj = 2πδij , finendo il conto della (3.84) si ha:
(
0
con v1 + v2 + v3 dispari
−iπ(v1 +v2 +v3 )
⇒1+e
=
6= 0
con v1 + v2 + v3 pari
questo significa che alcune righe di diffrazione sono cancellate per effetto del
fattore di struttura. Quando il fattore di struttura, che in sostanza è la somma
di fattori di fase, è zero, significa che il neutrone è diffratto dagli atomi della
cella con una combinazione di fasi tale per cui quella specifica riga di diffrazione
viene annullata. La fase totale all’interno della cella dà luogo a un contributo
nullo.
Per sistemi con una base atomica (più di un atomo per cella) il fattore di struttura gioca il ruolo di annullare alcune righe di diffrazione. Nel caso visto non
sono visibili i Ḡ con una combinazione di indici dispari.
Considerando nel fattore di struttura anche il fattore di D-W si ha non un azzeramento totale delle righe ma una forte diminuzione di intensità dei picchi. Lo
schema è quello mostrato in figura 10: la maggior parte dei neutroni non viene
scatterato e prosegue con la stessa direzione di incidenza, altri invece vengono
scatterati in direzioni specifiche dando luogo ai picchi di Bragg. Il detector copre
l’angolo solido mostrato e conoscendo la direzione di propagazione e l’angolo di
scattering si risale al vettore d’onda.
Per sapere se la riga osservata è una riga di diffrazione, oltre alla sua direzione
specifica, bisogna conoscerne l’energia (i neutroni Bragg sono scatterati in maniera elastica).
Misurando i neutroni scatterati in maniera elastica e graficando l’intensità in
funzione del vettore d’onda scambiato si ha una cosa del tipo figura 11: la
FWHM della riga di scattering è legata in principio al fattore di D-W Wχ (q),
che quindi non influenza solo l’intensità (l’altezza) del picco ma anche la sua
larghezza, che sarà quindi proporzionale alla temperatura, grande in regime classico e decrescente man mano che la temperatura viene fatta diminuire e si va
verso il regime quantistico (ma rimane comunque finita perché legata all’indeterminazione di punto zero). In principio quindi se si fosse in grado di misurare
la FWHM della riga Bragg al decrescere della temperatura si avrebbe una misura degli effetti di punto zero sull’energia del cristallo, tuttavia questa misura
3
SCATTERING DA NEUTRONI TERMICI
Figura 10: Diffrazione di neutroni secondo i picchi di Bragg
Figura 11: Intensità dei picchi di Bragg
50
3
SCATTERING DA NEUTRONI TERMICI
51
è irrealistica in quanto le righe Bragg sono allargate soprattutto dal disordine
cristallino (i cristalli non sono perfetti). Un certo insieme di righe che permette
di determinare i vettori d’onda nel reticolo reciproco, permette, in TdF di determinare i vettori di reticolo diretto, cioè di ricostruire la struttura del reticolo
nello spazio reale.
Tutto ciò che è stato studiato fin’ora però è dovuto al fatto che non è stata
considerata la correlazione e ci si è fermati all’ordine zero nello sviluppo della
funzione di correlazione.
Vogliamo ora studiare ora il primo ordine, in cui si ha:
Risposta coerente al primo ordine:
Z
|kfN | X |bχ bχ0 |2 −iq̄ · (x̄ −x̄ 0 ) −iq̄ · (x̄χ −x̄ 0 )
∂ 2 σ l
l
χ
= N
e
dt eiωt ·
e
∂Ω∂ω coer
2π
|ki | 0
(3.86)
ll
χχ0
1
1
· e− 2 Wχ (q) e− 2 Wχ0 (q) · h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i
inoltre considerando solo il termine di correlazione si sa che:
X
β
h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i =
q α q β hūα
lχ (t)ūl0 χ0 (0)i
(3.87)
αβ
Ora tenendo presente l’espressione (3.54) dello sviluppo in modi normali tramite
gli operatori di creazione e distruzione, la si può inserire nella (3.86) per avere
questa cosa mostruosa:
N 2 ∆(q̄−k̄)
z
}|
{Z
X
|kfN | 1 X ∗
∂ σ −i(q̄−k̄)(x̄l −x̄l0 )
B (q)Bχ0 (q)
= N
e
dt eiωt ·
∂Ω∂ω coer
|ki | 2π χχ0 χ
0
ll
X
X
1
p
·
qα qβ
ēα (k̄j , χ)ēβ (k̄j , χ0 )
2ωj (k̄)N Mχ Mχ0
αβ
k̄j
i
ih
h
· h a†k̄ (t) + ak̄j (t) a†k̄ (0) + ak̄j (0) i
2
j
(3.88)
j
1
dove si è posto che Bχ (q) = e−iq̄ · x̄χ e− 2 Wχ (q) bχ e k̄ è il vettore d’onda che
definisce i modi normali di vibrazione.
Vale che:
X
∆(q̄ − k̄) =
δ(q̄ − (k̄ + Ḡ))
Ḡ
cioè si sta considerando un processo in cui un neutrone con un certo vettore
d’onda k¯iN scattera con modo normale di vibrazione scambiando una quantità di
vettore d’onda q̄ con la corrispondente quasi-particella fonone di vettore d’onda
k̄, quindi c’è conservazione dell’impulso e il processo è possibile quando il vettore
d’onda scambiato è uguale al vettore d’onda del fonone emesso o assorbito.
In altri termini prima si aveva un processo a zero fononi, lo scattering Bragg, cioè
quando k̄ = 0, invece ora per avere conservazione dell’impulso si deve considerare
che il neutrone venga deviato per effetto dell’interazione con i fononi (cioè con
la popolazione dei modi normali).
Si prenda ora solo l’ultima riga della (3.88): si vuole conoscere il significato dei
3
SCATTERING DA NEUTRONI TERMICI
52
singoli prodotti fra gli operatori. Svolgendo esplicitamente si hanno 4 funzioni
di correlazione:
ha†k̄ (t)a†k̄ (0)i + ha†k̄ (t)ak̄j (0)i + hak̄j (t)a†k̄ (0)i + hak̄j (t)ak̄j (0)i
j
j
j
j
(3.89)
Si ricorda che per un operatore Ô la funzione di correlazione è data da:
X
λti hti | Ô† Ô |ti i
ti
quindi nella (3.89) si devono fare le somme sugli stati iniziali del target (degli
oscillatori armonici corrispondenti al cristallo) pesati ognuno con la probabilità
di eccitazione termica. Dei quattro termini scritti ne sopravvivono solo due,
quelli con i prodotti misti, in quanto i prodotti fra operatori uguali danno prodotti fra stati ortogonali che sono nulli.
A titolo d’esempio si studia il secondo termine ha†k̄ (t)ak̄j (0)i. Tutti gli operatori
j
considerati, nella rappresentazione di interazione, evolvono nel tempo nel modo
seguente:
a†k̄ (t) = eiωj (k̄)t a†k̄ (0)
(3.90)
ak̄j (t) = e−iωj (k̄)t ak̄j (0)
(3.91)
j
j
quindi per il termine di considerato si può scrivere, applicando la definizione di
funzione di correlazione:
ha†k̄ (t)ak̄j (0)i = eiωj (k̄)t ha†k̄ (0)ak̄j (0)i =
j
j
|
{z
}
n̂k̄j
=
X
eiωj (k̄)t
e
−βEn
z
n
= eiωj (k̄)t
X1
nk̄j
z
e
hn| n̂k̄j |ni =
−β~ωk̄j nk̄j + 21
(3.92)
nk̄j
dove si è applicata la definizione di probabilità di eccitazione termica (2.23), con
n̂k̄j operatore numerico e la definizione di autovalore di un’oscillatore armonico
quantizzato En = ~ωk̄j nk̄j + 21 .
L’ultimo termine della (3.92), a parte il primo esponenziale fuori dalla sommatoria rappresenta nk̄j ed proprio la somma che da la distribuzione di
Bose-Einstein, cioè si ha:
eiωj (k̄)t nk̄j = eiωj (k̄)t
1
e
β~ωk̄j
−1
(3.93)
L’altro termine di correlazione, il terzo della (3.89) cioè hak̄j (t)a†k̄ (0)i da come
j
risultato, seguendo un procedimento analogo al precedente:
1
−iωj (k̄)t
−iωj (k̄)t
e
nk̄j + 1 = e
1 + β~ω
(3.94)
e k̄j − 1
3
SCATTERING DA NEUTRONI TERMICI
53
Inserendo questo risultato nella (3.88) si ha:
N 2 ∆(q̄−k̄)
Z
zX
}|
{
|kfN | X ∗
∂ σ −i(q̄−k̄)(x̄l −x̄l0 ) 1
= N
B (q)Bχ0 (q)
dt eiωt ·
e
∂Ω∂ω coer
2π
|ki | χχ0 χ
0
ll
2
·
X
αβ
·
qα qβ
X ēα (k̄j , χ)ēβ (k̄j , χ0 )
k̄j
2ωj (k̄)
eiωj (k̄)t nk̄j + e−iωj (k̄)t nk̄j + 1
| {z } |
{z
}
distruzione di
1 f onone
1
p
·
N Mχ Mχ0
(3.95)
creazione di
1 f onone
si può ora risolvere l’integrale sul tempo che si spezza nella somma di 2 integrali
che danno luogo a due funzioni δ di Dirac cioè:
Z
1
dt ei(ω±ωj (k̄))t = δ(ω ± ωj (k̄))
(3.96)
2π
le due funzioni δ esprimono la conservazione dell’energia e la loro presenza è
legata all’aver supposto che i modi normali oscillino in maniera armonica, cioè
che valga l’approssimazione armonica. Se questo non vale le due delta hanno
forme di riga diverse e si trasformano in lorenziane o gaussiane con una certa
FWHM che corrisponde all’inverso del tempo di vita dello stato eccitato dal
neutrone.
Si può riscrivere la (3.95) in cui la sommatoria in k̄j scompare in quanto deve
valere che k̄j = q̄; e si possono evidenziare esplicitamente i processi Stokes e
Anti-Stokes:
X
X
|kfN |
∂ 2 σ = N N ∆(q̄ − k̄)
Bχ∗ (q)Bχ0 (q) ·
q α q β ēα (k̄j , χ)ēβ (k̄j , χ0 ) ·
∂Ω∂ω coer
|ki |
0
χχ
αβ
i
h
1
1
1
p
·
+ δ(ω − ωj (k̄)) 1 + β~ω
δ(ω + ωj (k̄)) β~ω
2ωj (k̄) Mχ Mχ0
e k̄j − 1
e k̄j − 1
|
{z
} |
{z
}
processo Anti−Stokes
processo Stokes
(3.97)
nel processo di interazione dei neutroni con il cristallo, oltre al fenomeno Bragg
(detto anche 0 phonon) in si cui osserva la struttura di equilibrio, il primo
termine rilevante (detto anche 1 phonon) consiste in una somma di delta con q̄
uguale ad un particolare valore di k̄j .
Quindi per un certo modo normale e per una certa branca si hanno due fenomeni:
• il processo Stokes che corrisponde alla creazione di 1 fonone, cioè il neutrone cede energia e vettore d’onda al cristallo che eccitano quel dato modo
di vibrazione aumentando di 1 il numero di fononi corrispondenti;
• il processo Anti-Stokes che corrisponde alla distruzione di un fonone consiste in un modo normale già popolato che diminuisce di 1 la sua popolazione
fononica per cedere al neutrone energia e impulso.
Il rapporto fra i processi Stokes/Anti-Stokes è:
nk¯ (T ) + 1
IS
β~ω
= j
= e k̄j
IAS
nk¯j (T )
(3.98)
3
SCATTERING DA NEUTRONI TERMICI
54
che è l’espressione del già citato principio di bilancio dettagliato.
Semplificando ancora, e riconoscendo l’espressione del prodotto scalare si può
scrivere:
X
q α q β ēα (k̄j , χ)ēβ (k̄j , χ0 ) = |q̄ · ē|2
(3.99)
αβ
che è il prodotto scalare fra il vettore d’onda scambiato dal neutrone e la polarizzazione del modo normale (la direzione in cui oscillano i piani di atomi) che
può essere parallela o perpendicolare a q̄. Questo prodotto definisce la regola
di selezione neutronica: se q̄ ⊥ ē si ha un modo trasverso (ottico o acustico),
il prodotto vale zero, quindi in principio i neutroni non eccitano modi trasversali
ottici o acustici che quindi non possono essere studiati. Questo in realtà non è
vero, perché i neutroni permettono di osservare tutti i modi, anche le curve di
dispersione relative ai modi trasversi.
Vogliamo dimostrare questo fatto, e scriviamo:
|kfN | X X
q̄ · ē(q̄j , χ) 2
∂ 2 σ 1−phon
=N N
Bχ (q) p
·
∂Ω∂ω coer
|ki | j
Mχ
χ
i
1 h
nq̄j (T )δ(ω + ωq̄j ) + nq̄j (T ) + 1δ(ω − ωq̄j )
·
2ωj (q̄)
(3.100)
la regola di selezione citata si trova nel modulo quadro della sommatoria su χ. Se
q̄ k ē si osservano i modi ottici e acustici longitudinali, mentre quelli trasversali
in teoria non dovrebbero poter essere osservati. Tuttavia con la spettroscopia
da neutroni termici è possibile aumentare il vettore d’onda scambiato a piacere
(basta aumentare l’angolo di osservazione).
Si può dire quindi che se q̄ · ē = 0 nella prima zona di Brillouin (1 BZ), si
può andare in seconda zona di Brillouin (2 BZ) considerando un nuovo vettore
d’onda scambiato q̄ → ā = q̄ + Ḡ con Ḡ solito vettore principale del reticolo
reciproco. La polarizzazione ē è una funzione periodica nello spazio reciproco
cioè ē(q̄j , χ) = ē(āj , χ) così come lo è la pulsazione ωj (q̄) = ωj (q̄ + Ḡ). Purchè si
vada a osservare le direzioni di scattering corrispondenti a multipli del vettore
di reticolo reciproco dove l’intensità delle righe è più alta, per compensare la
diminuzione di intensità dovuta al fattore di D-W quando si aumenta il vettore
d’onda scambiato, allora polarizzazione e pulsazione sono invarianti per traslazione.
In questo modo in 2 BZ il prodotto scalare fra vettore d’onda scambiato e polarizzazione che in 1 BZ era nullo, diventa Ḡ · ē 6= 0. Quindi si può dire che
basta andare oltre la 1 BZ per osservare i modi trasversi ottici e acustici, cioè
aumentare molto il vettore d’onda scambiato, che significa, nello spazio reale,
considerare angoli di osservazione grandi.
Fisicamente vale questo perché rispetto ad un modo longitudinale, in cui le
oscillazioni quadratiche medie come visto sono 1/100 Å, nei modi trasversali gli
spostamenti di un atomo rispetto ad un altro (le variazioni di densità) sono
molto più piccole. Per cui per essere risolti, i modi trasversali necessitano di
un vettore d’onda molto più grande che come è noto corrisponde ad una risoluzione maggiore. La spiegazione di questo fatto può essere visualizzata in figura
12. Lo spostamento dei piani cristallini nella stessa direzione della propagazione
dell’onda genera una variazione di densità apprezzabile cioè d = xχ + u con una
variazione rispetto alla posizione di equilibrio di circa 2/100 Å. Lo spostamento
3
SCATTERING DA NEUTRONI TERMICI
55
Figura 12: differenza fra modi longitudinali e trasversali.
dei piani cristallini trasversalmente rispetto alla direzione
di propagazione delq
2
2
l’onda di 1/100 Å invece fa si che si abbia d = xχ + u con una variazione
molto più piccola rispetto al caso longitudinale e una densità al primo ordine
che in pratica non varia. Per questo motivo per apprezzare i modi longitudinali
è necessaria una maggiore risoluzione e il vettore d’onda scambiato deve essere
abbastanza grande da poter andare in 2 BZ.
Per ora sono stati discussi solo due termini dello sviluppo della funzione di correlazione: il termine all’ordine zero detto anche termine di Bragg o termine
0 phonon tramite il quale è possibile studiare la struttura statica del cristallo ovvero l’ordine a lungo range, e il termine coerente al primo ordine detto
termine 1 phonon che da il contributo più importante sulle modulazioni di densità del cristallo. Si potrebbe, nello sviluppo dell’esponenziale della funzione di
correlazione andare a ordini superiori:
1
eh i = 1 + h i + h i2 + · · ·
2
dove l’oggetto al secondo ordine conterrebbe il prodotto di 4 operatori che rappresentano i processi a 2 fononi, che sono però di intensità estremamente bassa.
Ci si concentra ora sulla risposta incoerente, la cui espressione viene qui
riscritta:
Z
|kfN | X
∂ 2 σ 2 1
= N
|δbχ |
dt eiωt e−iq̄ · (r̄1 −r̄2 ) dr̄1 dr̄2 ·
∂Ω∂ω incoer
2π
|ki | lχ
(3.101)
· hδ(r̄1 − R̄lχ (t))δ(r̄2 − R̄l0 χ0 (0))i
sostituendo le espressioni esplicite:
R̄lχ (t) = x̄l + x̄χ + ūlχ (t)
r¯1 = x̄l + x̄χ
r¯2 = x̄l0 + x̄χ0
sapendo che in questo caso si ha l = l0 e χ = χ0 in quanto la correlazione è riferita
alla particella con sè stessa al tempo 0 e al tempo t si ha per gli esponenziali:
e−iq̄ · (r̄1 −r̄2 ) = e−iq̄ · (x̄l +x̄χ −x̄l0 −x̄χ0 ) = e−iq̄ · (x̄l −x̄l ) e−iq̄ · (x̄χ −x̄χ ) = 1
P
e infine sapendo che l 1 = N numero di celle nel cristallo, si può scrivere:
Z
|kfN | X
∂ 2 σ 2 1
=N N
|δbχ |
dt eiωt he−iq̄ · ūlχ (t) e−iq̄ · ūlχ (0) i (3.102)
∂Ω∂ω incoer
2π
|ki | χ
3
SCATTERING DA NEUTRONI TERMICI
56
e come visto grazie al teorema di Baker-Hausdorff e considerando anche i fattori
di D-W la parte di correlazione si può scrivere come:
he−iq̄ · ūlχ (t) e−iq̄ · ūlχ (0) i = e− 2 Wχ (q) e− 2 Wχ (q) ehq̄ · ūlχ (t)q̄ · ūlχ (0)i
1
1
dove l’esponenziale della funzione di correlazione al secondo membro si può
sviluppare in serie proprio come nella (3.72).
E’ possibile quindi scrivere il primo termine della sezione d’urto incoerente a
zero fononi:
Risposta incoerente all’ordine zero:
δ(ω)
z Z }|
{
|kfN | X
1
∂ σ 0−phon
=N N
|δbχ |2
dt eiωt e−Wχ (q) · 1 =
∂Ω∂ω incoer
2π
|ki | χ
X
=N
|δbχ |2 δ(ω)e−Wχ (q) · 1
2
(3.103)
χ
la δ(ω) che da la conservazione dell’energia implica che kfN = kiN . Il termine
(3.103) non da informazione fisica: si traduce solo in un segnale di background
che "sbrodola" le righe specifiche del segnale coerente che in quanto dipendenti
da N 2 e non semplicemente da N come in questo caso saranno notevolmente
più intense.
Si vuole ora studiare la risposta incoerente al primo ordine della sezione d’urto
che sarebbe il termine a 1 fonone:
Riposta incoerente al primo ordine:
Z
XX
|kfN | X
∂ 2 σ 1−phon
2 1
= N
|δbχ |
dt eiωt
q α q β e−Wχ (q) hūlχ (t)ūlχ (0)i
∂Ω∂ω incoer
2π
|ki | χ
l αβ
(3.104)
e inserendo la (3.54) per le espressioni degli spostamenti ū e seguendo in generale
lo stesso procedimento usato per il termine ad 1 fonone della risposta coerente
si può scrivere:
X ~2 |q̄ · ē|2
|kfN | X
∂ 2 σ 1−phon
·
|δbχ |2 e−Wχ (q)
=
N
N
∂Ω∂ω incoer
|ki | χ
2N Mχ ωj (k̄)
k̄j
h
i
· nq̄j (T )δ(ω + ωq̄j ) + nq̄j (T ) + 1δ(ω − ωq̄j )
(3.105)
P −i(q̄−k̄)(x̄l −x¯0 )
l
Nel caso della risposta coerente si aveva
= N 2 ∆(q̄ − k̄)
ll0 e
P −i(q̄−k̄)(x̄
P
−
x
¯
)
l
l
= l 1 = N , per cui non
mentre in questo caso si ha che l e
è necessario che il vettore d’onda scambiato coincida con vettori del reticolo
reciproco e la sommatoria su k̄j si mantiene.
Per indagare il significato di questo risultato si studia un caso semplificato: si
consideri solo il processo Stokes e un reticolo cubico con un atomo per cella,
cioè un reticolo di Bravais. Per un reticolo di questo tipo vale che il prodotto
scalare |q̄ · ē|2 = 31 q 2 che può essere portato fuori dalla sommatoria (dal punto
di vista fisico significa che si sta mediando su tutto lo spazio a qualunque angolo
3
SCATTERING DA NEUTRONI TERMICI
57
considerando tutti i processi di scattering). Si può scrivere:
⇒ =
|kfN |
i
2 X −W (q) h
e
21 2 ~
|δb|
n
(T
)
+
1
·
δ(ω
−
ω
)
q
k̄
k̄
j
j
3 2M
|kiN |
ωj (k̄)
(3.106)
k̄j
Nella situazione in cui la temperatura T è sufficientemente bassa vale che
nk̄j (T ) + 1 ' 1
cioè la popolazione fononica si trova tutta nello stato fondamentale. L’espressione (3.106) viene mediata su superfici ad energia costante (si considerano tutti
gli angoli e neutroni con la stessa energia), che significa considerare costante il
termine 1/ωj (k̄) e portarlo fuori dalla sommatoria. Ciò che nella sommatoria
rimane è:
X
δ(ω − ωk̄j ) = N (ω)
(3.107)
k̄j
che è la densità degli stati dei modi normali di vibrazione. L’esperimento
consiste nell’osservare molti angoli di scattering intorno alla direzione di incidenza: a differenza del caso precedente (sia il Bragg che lo scattering coerente
ad 1 fonone) qui non c’è conservazione dell’impulso, quindi ci si può aspettare
segnale in ogni direzione. Dopo aver selezionato solo neutroni di una energia
precisa (questo vuol dire fare una media sulle superfici ad energia costante del
cristallo) rimane la densità degli stati dei modi normali di vibrazione. Questo
è abbastanza logico perché si è partiti considerando la correlazione dell’atomo
con sè stesso: come abbiamo visto il modo normale è un modo cooperativo di
tutti gli atomi, quindi se ci si pone sul singolo atomo in generale (a meno che
non si sia in grado di eccitare 1 solo modo di vibrazione) questo oscilla con
una combinazione di modi normali di vibrazione; questo significa che se si è in
grado di misurare la correlazione dell’atomo con sè stesso, essa è intuitivamente
legata alla densità degli stati vibrazionali, proprio perché l’atomo vibra con una
combinazione di tutti i modi eccitati. Il peso relativo di un modo rispetto ad
un altro è proprio la densità degli stati, cioè quanti stati di vibrazione esistono
per un certo vettore d’onda e per una certa frequenza. La densità degli stati
fononica (TdF della densità dei modi normali di vibrazione) è una grandezza
fondamentale in quanto con essa si può calcolare ad esempio il calore specifico,
la resistività ecc ecc.
In figura 13 si vede ciò che misura la sezione d’urto coerente ad 1 fonone: un
fonone viene creato o distrutto a favore dell’aumento o della diminuzione dell’energia e del vettore d’onda del neutrone incidente. Come già puntualizzato i
processi vengono divisi in Stokes e Anti-Stokes: lo S. è l’emissione di un fonone grazie al neutrone scatterato e l’AS. è l’assorbimento di un fonone da parte
del neutrone. Il grafico è un diagramma bidimensionale in cui è rappresentata
l’energia scambiata ~ω vs il vettore d’onda scambiato q. Sull’asse q ci sono dei
picchi di intensità molto elevata per q̄ = 0, Ḡ1 , Ḡ2 ... che sono i picchi di Bragg,
che sono processi elastici (energia scambiata nulla) e vettore d’onda scambiato
uguale a vettori principali del reticolo reciproco. Se si fa una scansione in vettore d’onda e impulso intorno ad un picco di Bragg quello che si misura sono
dei picchi di intensità molto più bassa e in generale molto più larghi (per effetto
della vita media dell’eccitazione) dei picchi di Bragg che corrispondo ai processi
S e AS fononici. Ad un dato vettore d’onda si vede un primo picco a energia
3
SCATTERING DA NEUTRONI TERMICI
58
Figura 13: Figura riassuntiva che mostra i picchi di Bragg per k̄ = Ḡ e i processi
S e AS.
negativa (Stokes) e poi un secondo picco a energia positiva (anti-Stokes), simmetrico rispetto al primo rispetto all’asse ~ω = 0. Ad un vettore d’onda più
alto i picchi si spostano, non si trovano alla stessa energia ma saranno sempre
due picchi simmetrici. Spostandosi lungo q si campiona la curva di dispersione
fononica.
Dato un certo vettore d’onda, i picchi che vengono visualizzati forniscono informazioni sul cristallo: se ad esempio se ne vede uno solo vuol dire che c’è
solo una branca di dispersione e quindi il cristallo ha un atomo per cella. In
generale come mostrato in figura 14 spostandosi verso energia più alte per un
cristallo complesso (più atomi per cella) si misurano un picco di bassa intensità
corrispondente ai due modi acustici trasversi (degeneri), poi un picco relativo
al modo acustico longitudinale, i picchi di intensità più alta corrispondenti ai
modi ottici trasversali e infine il modo ottico longitudinale. Il CsCl è un sale con
una struttura semplice: si vede che il range di frequenza campionato va da 0 a
circa 5 T Hz che significa 150 cm−1 cioè siamo nella zona del lontano infrarosso.
Il range di frequenze fononiche, nella maggior parte dei casi, è contenuto in un
range di qualche centinaio di cm−1 cioè qualche T Hz (1 T Hz = 33 cm−1 ). Sulle
ascisse è mostrato il vettore d’onda normalizzato per tre direzioni specifiche. Le
curve continue sono curve teoriche mentre i puntini sono dati sperimentali: il
CsCl ha due atomi per cella e pertanto mostra sia curve acustiche che ottiche.
A parità di vettore d’onda (scansione verticale cioè vettore d’onda fisso), il modo LA ha energie molto maggiori del TA (costa molta più energia muovere i
piani in maniera longitudinale che in maniera trasversa). Cambiando direzione
di misura (sono tre direzioni di alta simmetria del cristallo) si vede come LA
e TA tendono ad avvicinarsi e addirittura nel caso di LO e TO a sovrapporsi
e degenerare nella direzione [111]. Si vede anche che i modi ottici disperdono
poco: sono praticamente piatti, e in questo senso l’approssimazione di Einstein
nel considerare i modi costanti si adatta bene ai modi ottici. A seconda della
direzione che si sta considerando quindi, cambia il numero dei primi vicini e
cambia il modo degli atomi di interagire fra loro e quindi le funzioni di dispersione cambiano anche di molto. I modi trasversi sono due di solito e in questo
3
SCATTERING DA NEUTRONI TERMICI
59
Figura 14: Dispersione dei modi acustici e ottici (trasversi e longitudinali) del
CsCl per le direzioni [100], [110] e [111]
caso degeneri fra loro, e per rimuovere tale degenerazione bisogna andare a simmetrie più basse di quella cubica.
In figura 15 si vede la densità degli stati fononica che qui abbiamo chiamato
n(ω), cioè il numero dei modi normali di vibrazione con frequenza compresa
fra ω e ω + dω. Il modello di Debye mostra un andamento come ω 3 ed ha poi
un cut-off: come si vede l’andamento reale è un pò diverso. In figura si hanno
tre tipi di metalli alcalini, le curve tratteggiate mostrano il dato sperimentale
mentre le linee continue sono le previsioni teoriche. Il primo picco che si vede
mostra il modo acustico trasversale (a frequenza minore) e il picco a più alta
frequenza è il modo ottico longitudinale; tutto ciò che vi è nel mezzo è difficile
da definire. Di solito tuttavia i picchi ottici sono molto più definiti di quelli
acustici, questo perché gli ottici disperdono poco, che significa che modi con
alta dispersione hanno rappresentazioni in densità degli stati più allargate.
Vogliamo riassumere i risultati trovati fino a questo punto nel calcolo della
sezione d’urto, le formule e il loro significato. Si è divisa la sezione d’urto in
una parte di risposta coerente, che fornisce informazioni sulla statica del cristallo nel suo complesso e sulle variazioni di densità, ed una risposta incoerente,
che riguarda la correlazione della particella (nel caso solido la particella è una
quasi-particella detta fonone) con sè stessa a tempi diversi. Per ognuna della
due risposte, la parte della funzione di correlazione è stata sviluppata fermandosi al primo ordine dello sviluppo, avendo così due termini per i due tipi di
risposta. Il primo termine è quello che rappresenta l’ordine zero dello sviluppo
ed è detto a 0 fononi, mentre il secondo termine che rappresenta il primo ordine
dello sviluppo è detto a 1 fonone. Nella tabella 2 sono riassunti i significati fisici
dei termini di risposta della sezione d’urto studiati. E le relative formule per la
3
SCATTERING DA NEUTRONI TERMICI
60
Figura 15: Densità degli stati fononica in funzione della frequenza per metalli
alcalini.
Tabella 2: Schema delle risposte dello scattering da neutroni termici
0 phonon
1 phonon
risp. coerente
risp. incoerente
picchi di Bragg
processi S e AS
segnale di fondo
densità degli stati
3
SCATTERING DA NEUTRONI TERMICI
61
risposta coerente della sezione d’urto:
X
1
1
∂ 2 σ 0−phon
= N 2 ∆(q̄ − Ḡ)δ(ω)
|bχ bχ0 |2 e−iq̄ · (x̄χ −x̄χ0 ) · e− 2 Wχ (q) e− 2 Wχ0 · 1
∂Ω∂ω coer
0
χχ
(3.108)
Z
N
X
|kf | X
∂ σ 1−phon
1
= N
|bχ bχ0 |2 e−iq̄ · (x̄χ −x̄χ0 )
dt eiωt ·
e−iq̄ · (x̄l −x̄l0 )
∂Ω∂ω coer
2π
|ki | χχ0
0
ll
2
1
1
· e− 2 Wχ (q) e− 2 Wχ0 h−iq̄ · ūlχ (t)iq̄ · ūl0 χ0 (0)i
(3.109)
E per la risposta incoerente della sezione d’urto:
X
∂ 2 σ 0−phon
= N δ(ω)
|δbχ |2 e−Wχ (q) · 1
(3.110)
∂Ω∂ω incoer
χ
Z
XX
|kfN | X
∂ 2 σ 1−phon
1
= N
|δbχ |2
dt eiωt
q α q β e−Wχ (q) hūlχ (t)ūlχ (0)i
∂Ω∂ω incoer
2π
|ki | χ
l
αβ
(3.111)
3.5
Studio di un solido amorfo e di un liquido
Questa parte si colloca idealmente a metà fra ciò che abbiamo visto per un
gas perfetto e nello studio dei solidi. Il gas perfetto e il solido cristallino rappresentano in sostanza dei modelli in cui si ha nel primo caso solo la risposta
incoerente, mentre nel secondo caso si ha sia la risposta coerente che incoerente
sia elastica che anelastica.
Ricordiamo cos’è il fattore di struttura statico:
Z
Z
dσ
S(q̄) ∝
= dωS(q̄, ω) ⇒ dr̄ e−iq̄ · r̄ G(r̄, 0) per t = 0
dΩ
dove la G(r̄, t) è la già discussa funzione di Van-Hove che si può dividere nella
somma di un fattore self e di un fattore distinct. L’ultimo integrale dice che
il fattore di struttura statico è dato dalla trasformata di Fourier della funzione
di Van-Hove al tempo t=0. Questo integrale fisicamente significa che data una
certa direzione di scattering q̄ si misurano neutroni indipendentemente dal fatto
che siano elastici o anelastici (perché si integra su ω), cioè si misurano tutti i
neutroni uscenti sotto una certa direzione q̄. Poichè in generale il segnale predominante è quello del Bragg (come abbiamo già detto le componenti anelastiche
rappresentano una percentuale molto piccola del segnale totale) esso è legato
alla funzione di correlazione densità-densità a tempi uguali.
Vogliamo vedere come è fatta la S(q̄) e conseguentemente la G(r̄, 0) per un cristallo per estendere la discussione al caso di un liquido e di un solido amorfo.
Il caso di un cristallo si può vedere in figura 16: si hanno i picchi di Bragg
per dei punti specifici nel reticolo diretto e per multipli di vettori del reticolo
reciproco quando si fa la TdF. I due grafici quindi sono equivalenti per l’invarianza traslazionale e rappresentano rispettivamente l’informazione nello spazio
reale e nello spazio reciproco. In generale sappiamo che la G(r̄, t) rappresenta
3
SCATTERING DA NEUTRONI TERMICI
62
Figura 16: Caso di un cristallo: la G(r̄, 0) e la S(q̄) mostrano picchi definiti
sulla posizione dei punti reticolari del reticolo diretto e reciproco.
la funzione di correlazione densità-densità e si può scrivere come:
G(r̄, t) = Gs (r̄, t) + Gd (r̄, t)
dove la densità è una somma di delta di Dirac che individuano le particelle:
X
ρ(r̄, t) =
δ(r̄ − R̄l (t))
l
e possiamo scrivere la Gs e la Gd esplicitamente come:
X
1
Gs (r̄1 , r̄2 , t) =
hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l (0))i
ρ0
l
X
1
Gd (r̄1 , r̄2 , t) =
hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l0 (0))i
ρ
0
0
l6=l
che sono state normalizzate rispetto alla densità media ρ0 termodinamica, cioè
quella non correlata. La somma G = Gs + Gd vale a qualsiasi tempo, anche
a tempo 0, e in generale limt→0 Gs (r̄, t) = δ(r̄) opportunamente normalizzata.
Questo limite significa semplicemente che la particella o si trova in r̄ oppure non
c’è. Vediamo che grafico della G(r̄, 0) ci si può aspettare nel caso liquido alla
luce di quanto visto per un cristallo.
Un liquido ha una densità media ρ0 dell’ordine di quella di un cristallo (comprimendo un gas per transire alla fase liquida la densità aumenta circa di un
fattore 1000). Quindi anche per un liquido la distanza media fra le particelle è
dell’ordine di qualche Å. Localmente un solido e un liquido sono analoghi, per
questo la comparazione fra la G(r̄, 0) e la S(q̄) in un cristallo e in un liquido è
ragionevole.
Con riferimento alla figura 17, per quanto riguarda la Gs (r̄, 0) in zero vi è una
δ(r̄) che rappresenta la presenza di una particella in zero, ed essa poi oscilla
attorno al valore della densità media ρ0 con oscillazioni di ampiezza sempre
minore. Il primo massimo lo si individua alla distanza media fra le particelle
r̄, il secondo massimo a 2r̄ e così via. La distanza media fra le particelle è
√
banalmente r̄ = 1/ 3 ρ0 . La forma di questa funzione è legata a quella del potenziale repulsivo fra le particelle, per cui per determinate distanze posso avere
un probabilità più alta o più bassa (quindi oscillante) di trovare la particella
rispetto al valore di densità media. A distanze "grandi" dalla particella di riferimento in zero la probabilità, data l’isotropia del liquido (vale per la maggior
3
SCATTERING DA NEUTRONI TERMICI
63
Figura 17: Caso di un liquido: la Gs (r̄, 0) e la S(q̄) oscillano attorno ad un
valore medio ed esprimono il fatto che in un liquido si ha ordine a corto range
che tende ad una densità costante a lungo range.
parte dei liquidi), di trovare un’altra particella diventa costante, corrispondente alla densità media. Nel caso di un cristallo invece, a causa della simmetria
traslazionale, per distanze comunque grandi da una particella di riferimento si
ha la certezza di trovare la particella per alcuni valori di r̄ e la certezza di non
trovarla per tutti gli altri valori. Passando per TdF alla S(q̄) (opportunamente
normalizzata) si ha una forma analogamente oscillante. I picchi del caso liquido
si manifestano solo nel corto range a mostrare che la correlazione avviene solo
fra particelle vicine fra loro. Lavorando a vettori d’onda sufficientemente grandi
si è in grado di osservare la correlazione delle particelle a corto range, mentre
per vettori d’onda piccoli la lunghezza d’onda del neutrone è molto grande e
non si è un grado di vedere la correlazione a corto range.
In altri termini si è visto che per un cristallo, qualunque sia il vettore d’onda
scambiato si osservano dei picchi, cioè si può apprezzare l’ordine cristallino a
prescindere dal vettore d’onda scambiato. Nel caso di un liquido invece, visto
che l’ordine esiste solo per distanze piccole, lo si può vedere in TdF solo se il
vettore d’onda scambiato è grande.
Questo è ciò che accade per correlazione a tempi nulli. Si vuole estendere questo
discorso ad un tempo qualsiasi, e lo vediamo come fatto precedentemente prima
per un cristallo e poi per un liquido.
In figura 18 vediamo raggruppati i tre casi principali: solido liquido e amorfo
(vetro). Consideriamo il caso della sezione d’urto coerente ad 1 fonone (perché
ora siamo interessati al modo in cui la densità si modifica rispetto al suo valore
medio). Supponiamo, nel caso del cristallo, di poter eccitare un solo modo di
vibrazione mentre tutti gli altri rimangono nello stato fondamentale. Il cristallo
si muove di moto armonico e la densità sarà:
ρ(r̄, t) = ρ0 eiωt e−iq̄ · r̄
quindi la G(r̄, t) normalizzata rispetto a ρ0 applicando la definizione (3.7) è:
G(r̄, t) =
1 2 iωt −iq̄ · r̄
ρ e e
= ρ0 eiωt e−iq̄ · r̄
ρ0 0
e quindi se si fissa r̄ = R̄l si ottiene un’oscillazione armonica alla frequenza ω nel
tempo da −∞ a +∞, e ciò significa che la TdF è semplicemente una δ(ω). Nel
caso reale tuttavia, anche nell’approssimazione fatta, cioè la posizione fissata
e tutti i modi nello stato fondamentale eccetto uno, il modo attivo non oscilla
3
SCATTERING DA NEUTRONI TERMICI
Figura 18: Casi solido liquido e vetro: G(r̄, t) e S(q̄, ω)
64
3
SCATTERING DA NEUTRONI TERMICI
65
Figura 19: La Gs e la Gd nel caso liquido per diversi intervalli temporali.
t
all’infinito bensì si smorza nel tempo attraverso un fattore e− τ dove τ è il tempo
di vita dell’oscillazione, normalmente dell’ordine del ps. La figura di riferimento
quindi è la 18 nel caso solido, e l’espressione corretta della G diventa:
G(r̄, t) = ρ0 eiωt e−iq̄ · R̄l e− τ
t
Se ω = 2π/T perché l’oscillazione sia visibile deve valere che τ ' T /2, per cui i
periodi medi di vibrazione dei reticoli sono dell’ordine di qualche ps.
Per quanto riguarda la S(q̄, ω), nel caso di un cristallo si ha che e−iq̄ · R̄l 6= 0
solo se R̄l è un vettore di reticolo diretto, quindi per un cristallo la S(q̄, ω) è
centrata in zero, dove si ha la riga Bragg. Facendo una scansione in ω nel caso
solido, se l’oscillazione fosse non smorzata si avrebbero delle δ per i casi S a AS,
ma dato che il modo è smorzato le delta diventano dei picchi la cui larghezza a
mezza altezza (FWHM) è 1/τ .
In un liquido invece la G(r̄, t) oscilla brevemente ed è sovrapposta ad un esponenziale decrescente: i moti vibratori all’interno di un liquido esistono e sono
simil-fononi, e si chiamano modi idrodinamici. Questi modi collettivi si manifestano solo su distanze sufficientemente grandi rispetto alla distanza media
fra le particelle. Se le distanze sono piccole si osserva solo il moto di singola
particella. L’oscillazione in t è generata da un moto oscillatorio che rappresenta
il modo collettivo del sistema, sovrapposta ad una decrescita molto veloce in
termini di r̄. Per capire meglio questo fatto si guardi la figura 19: si vede la
G divisa nelle sue componenti Gs e Gd , plottate a tempo zero, per t ∼ τ e per
t τ dove τ è il tempo caratteristico di urto. Il primo grafico, a tempo zero
mostra una alta correlazione della particella con sè stessa, che scende e si allarga passando a tempi t ∼ τ a mostrare una probabilità minore ma finita che la
particella si "ricordi" della posizione che aveva a tempo zero. La Gd mostra lo
stesso comportamento: l’oscillazione si sta smorzando ma è ancora visibile, cioè
la correlazione della particella con le altre in funzione di r̄ è ancora misurabile.
Andando a tempi più lunghi cioè t τ la particella avrà fatto molti urti e la
correlazione con sè stessa a tempo zero è andata persa, e parimenti per la Gd le
particelle si sono "mischiate" raggiungendo subito il valore di equilibrio ρ0 .
Alla luce di questa discussione è forse più comprensibile il grafico della G(r̄, t)
in figura 18 nel caso liquido: il grafico è fatto in funzione del tempo a distanze
fisse mostra che l’esponenziale spaziale decrescente ha un peso che dipende dalla
distanza. Se ci si occupa di cercare la correlazione fra la molecola di riferimento
ed altre lontane non si vedrà nulla in quanto il liquido non ha simmetria traslazionale. Il grafico di S(q̄, ω) in figura 18 mostra, nel caso liquido, un picco
centrato in zero che è chiamato picco quasi-elastico, mentre i picchi laterali a
+ω e a −ω sono gli equivalenti dei fononi longitudinali per il cristallo. Il segnale
dinamico (cioè anelastico) per un liquido, equivale a due oscillazioni a frequenze
3
SCATTERING DA NEUTRONI TERMICI
66
simmetriche rispetto a zero come quel S e AS nel caso del cristallo. Ciò che
cambia è che per ω = 0 non si ha una δ bensì una riga allargata che da luogo
allo scattering Rayleigh per un liquido.
Si può dire quindi che prendendo il grafico di S(q̄, ω) nel caso solido in figura
18, liquefando tale solido si ottiene il grafico sottostante, e di fatto scompaiono
i modi trasversi, perché? Perché un liquido non ha piani di atomi che possano
oscillare trasversalmente gli uni rispetto agli altri; inoltre il termine cinetico dell’hamiltoniana è dello stesso ordine di grandezza del termine potenziale, quindi
se le oscillazioni sono determinate dalla parte repulsiva del potenziale le frequenze sono le stesse di quelle longitudinali nel caso solido, altrimenti se il potenziale
è determinato prevalentemente dalla parte attrattiva esse cambiano.
Infine vediamo il caso di un sistema amorfo, il vetro, facendo riferimento alla
figura 18. Un sistema amorfo è un sistema solido privo di simmetria traslazionale in cui le shell sono inchiodate, rispetto ad un liquido, su posizioni fisse.
C’è disordine locale come per un liquido ma i legami sono fissati come in un
cristallo. Quindi le shell oscillano l’una rispetto all’altra ma con una distanza
fissa che è la distanza media fra le shell. In questo senso il grafico di G del
vetro è molto simile a quello del solido, con la differenza di un minor tempo di
vita dell’oscillazione a causa del disordine strutturale. Dal punto di vista della
S c’è sempre una riga elastica che corrisponde al Bragg del cristallo (si hanno
comunque delle posizioni fisse anche se disordinate l’una rispetto all’altra) e i
picchi laterali sono equivalenti a quelli del caso liquido e che possono essere equiparati ai fononi longitudinali, in quanto l’amorfo è un sistema isotropo come un
liquido.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
4
4.1
67
Spettroscopia da campo elettromagnetico
Dalle equazioni di Maxwell alla quantizzazione del
campo elettromagnetico
Le proprietà elettriche della materia sono descritte da una funzione scalare dello
spazio e del tempo, la densità di carica ρ(r̄, t) mentre lo stato dinamico è descritto dalla funzione vettoriale v̄(r̄, t) il campo delle velocità. In questa accezione la
materia è descritta come un continuo, e la densità di corrente elettrica è:
¯ t) = ρ(r̄, t)v̄(r̄, t)
J(r̄,
(4.1)
La radiazione elettromagnetica viene rappresentata da due grandezze vettoriali:
Ē(r̄, t) e B̄(r̄, t) rispettivamente campo elettrico e magnetico. Questi campi
obbediscono alle equazioni di Maxwell, cioè un sistema di equazioni differenziali
alle derivate parziali a cui devono venire imposte delle condizioni al contorno:
¯ · B̄ = 0
∇
¯ · Ē = 4πρ(r̄, t)
∇
¯ ∧ Ē + 1 ∂ B̄ = 0
∇
c ∂t
1
¯ ∧ B̄ − ∂ Ē = 4π J(r̄,
¯ t)
∇
c ∂t
c
(4.2)
(4.3)
(4.4)
(4.5)
le quali per assenza di cariche (ρ(r̄, t) = 0) mostrano una particolare simmetria
tra i campi elettrico e magnetico.
Per la densità di carica vale l’equazione di continuità:
∂ρ
¯ J¯ = 0
+∇
∂r
(4.6)
la quale esprime la conservazione della carica elettrica ed è conseguenza delle
equazioni di Maxwell. Il sistema di equazioni può essere ridotto ad una forma
più compatta introducendo il potenziale vettore Ā(r̄, t) e il potenziale scalare
φ(r̄, t) (da ora in poi le barre vettoriali sui simboli di campo, sui nabla e sul
potenziale vettore verranno omessi per velocizzare la scrittura.)
L’equazione (4.2), che esprime l’assenza di monopoli magnetici si può scrivere
come:
B =∇∧A
Ora, tenendo conto che il campo elettrico è esprimibile come il gradiente di una
funzione scalare φ, e che ∇ ∧ (−∇φ) = 0, usando il potenziale vettore A si
possono riscrivere le ultime due equazioni di Maxwell:
1 ∂∇ ∧ A
1 ∂A
+ ∇ ∧ (−∇φ) ⇒ E = −∇φ +
c ∂t
c ∂t
1
∂E
4π
∇ ∧ B = ∇ ∧ ∇ ∧ A = ∇(∇ · A) − ∇2 A =
+
J
c ∂t
c
∇∧E =−
(4.7)
(4.8)
dove nella (4.8) si è usata la relazione ∇ ∧ ∇ ∧ A = ∇(∇ · A) − ∇2 A e si nota
che E + 1c ∂A
∂t è irrotazionale. La grandezza φ(r̄, t) è definita dalla (4.7) stessa.
Le scelte fatte per i potenziali A e φ non li definiscono in modo univoco: infatti
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
68
A è definito a meno di un vettore ∇χ(r̄, t) a rotazione nulla mentre φ è definito
a meno di una funzione scalare ψ a gradiente nullo.
Si può scrivere quindi che:
A0 = A − ∇χ
φ0 = φ + ψ
dove si ha ovviamente che ∇ ∧ A0 = ∇ ∧ A = B; ma A e φ devono essere tali
che:
1 ∂A
1 ∂A0
+ ∇φ0 =
+ ∇φ
E(r̄, t) =
c ∂t
c ∂t
e sostituendo nella precedente A0 = A − ∇χ e φ0 = φ + ψ si ottiene che:
1 ∂∇χ
= ∇ψ
c ∂t
e la scelta
ψ=
1 ∂χ
c ∂t
soddisfa l’uguaglianza rispetto ad E.
Si possono scrivere quindi le trasformazioni di gauge:
¯
Ā0 = Ā − ∇χ(r̄,
t)
(4.9)
1
∂χ
φ0 = φ +
(4.10)
c ∂t
e si sceglie una gauge particolare detta gauge di Coulomb per cui si ha:
∇·A = 0
(4.11)
In questa gauge è possibile riscrivere l’equazione (4.8) usando anche l’espressione
di E della (4.7):
1 ∂∇φ
1 ∂2A
4π
− ∇2 A + 2
+ 2 2 =
J
(4.12)
c ∂t
c ∂t
c
ma tale equazione è ancora complicata dal termine contenente φ. Tuttavia viene
in aiuto il Teorema di Helmotz: ogni campo vettoriale può essere scritto come
somma di due componenti: una detta trasversa (o soleonidale) a divergenza
nulla e una detta longitudinale (o irrotazionale) a rotore nullo. Ad esempio per
la densità di corrente J si può scrivere:
(
∇ · JT = 0
J = JT + JL con
(4.13)
∇ ∧ JL = 0
Definizioni e nomenclature simili possono essere applicati agli altri campi vettoriali, ad esempio dal fatto che B = ∇ ∧ A è evidente che B è definito tramite
AT (dato che ∇ ∧ AL = 0). Inoltre dal fatto che ∇ ∧ (∇φ) = 0 segue che ∇φ
è longitudinale per tutte le funzioni di gauge χ. Infine la gauge di Coulomb
identifica A come interamente trasversale.
Usando queste assunzioni si trova che l’equazione completa del campo (4.12)
può essere separata nella sua parte trasversa e longitudinale:
Trasversa:
Longitudinale:
−∇2 A +
1 ∂2A
4π
JT
=
2
2
c ∂t
c
1 ∂∇φ
4π
=
JL
2
c ∂t
c
(4.14)
(4.15)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
69
Si fa la scelta del potenziale scalare ∇φ = 0 e si considera il caso del campo libero
nel vuoto cioè JT = 0. Si ottiene così l’equazione delle onde per il potenziale
vettore nel vuoto:
1 ∂2A
=0
(4.16)
− ∇2 A +
c ∂t2
Come è possibile scrivere A? Applichiamo delle condizioni al contorno.
Se si considera un volume V = L · L · L con condizioni periodiche al contorno
del potenziale vettore:
A(x, y, z, t) = A(x + L, y, z, t) = A(x, y + L, z, t) = A(x, y, z + L, t)
(4.17)
si può scrivere il potenziale attraverso uno sviluppo in serie di Fourier di onde
viaggianti:
X
A(r̄, t) =
Ak (r̄, t)eik̄ · r̄ + A∗k (r̄, t)e−ik̄ · r̄
(4.18)
k
Nello spazio di Fourier vale sempre che k̄ e Ak sono ortogonali cioè k̄ · Ak =
k̄ · A∗k = 0. Quindi dato che k̄ è diretto come il vettore di Poynting, cioè nel
verso di propagazione dell’onda elettromagnetica, allora gli Ak giacciono su di
un piano ad esso ortogonale, e questo significa che il campo elettromagnetico
(CEM) ha due diversi stati di polarizzazione e si può scrivere Akj con j = 1, 2.
Sostituendo la (4.18) all’interno dell’equazione (4.16) si ottiene la dipendenza
temporale:
1 ∂ 2 Akj (t)
k 2 Akj (t) − 2
=0
(4.19)
c
∂t2
con soluzione
Akj (t) = Akj (0)e−iωkj t
(4.20)
con ωkj = ckj . Inserendola nell’espressione (4.18) si ha:
X
A(r̄, t) =
Akj e+i(k̄ · r̄−ωkj t) + A∗kj e−i(k̄ · r̄−ωkj t)
(4.21)
kj
La densità di radiazione di un CEM è:
ED =
1
(|E|2 + |B|2 )
8π
da cui si può calcolare l’hamiltoniana del CEM:
Z
1
dr̄(|E|2 + |B|2 )
H=
8π
(4.22)
(4.23)
Abbiamo visto che il campo elettromagnetico è dato da derivate del potenziale
vettore A. Ora si fa un passo avanti verso la quantizzazione del CEM ipotizzando
che il potenziale vettore si possa esprimere come la somma di due operatori
quantistici. Nello specifico come:
s
2πc2 Ak j =
ωkj Q̂kj + iP̂kj ¯kj
(4.24)
V ωkj
s
2πc2 ∗
Ak j =
ωkj Q̂kj − iP̂kj ¯∗kj
(4.25)
V ωkj
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
70
dove ¯kj rappresenta lo stato di polarizzazione. Da queste espressioni, ricavando
i campi elettrico e magnetico e inserendoli nell’espressione dell’hamiltoniana si
trova:
X1
X
(4.26)
Pk2j + ωk2j Q2kj
Hkj =
H=
2
kj
kj
l’hamiltoniana totale è la somma di tutte le hamiltoniane con un dato vettore
d’onda e polarizzazione, che sono tipiche hamiltoniane di oscillatore armonico.
A questo punto si introducono gli operatori di creazione e distruzione
bosonici, rispettivamente a†kj e akj attraverso cui esprimere gli P̂kj e Q̂kj , cioè:
r
P̂kj = i
s
Q̂kj =
m~ωkj †
akj − akj
2
~ †
akj + akj
2mωkj
(4.27)
(4.28)
e sostituendo le precedenti nell’espressione dell’hamiltoniana (4.26) si ottiene:
X
1
†
H=
~ωkj akj akj +
(4.29)
2
kj
Dato uno stato |ni dell’oscillatore armonico, gli operatori agiscono su tale stato
nel seguente modo:
√
a†kj |ni = n + 1 |n + 1i
(4.30)
√
(4.31)
akj |ni = n |n − 1i
e si chiama operatore numero n̂ = a†kj akj e conta il numero di oscillatori in
un dato stato cioè
hn| n̂ |ni = hn| a†kj akj |ni = n
Scriviamo per esteso il potenziale vettore espresso tramite gli operatori di creazione e distruzione:
s
X 2πc2 Akj (r̄, t) =
akj e+i(k̄ · r̄−ωkj t) + a†kj e−i(k̄ · r̄−ωkj t) ¯kj
(4.32)
V ω kj
kj
Il campo elettrico quindi, che si può scrivere come E = − 1c ∂A
∂t , ha un valore di
aspettazione nullo cioè hn| E |ni = 0. Questo è dovuto al fatto che anche i valori
di aspettazione degli operatori di creazione e distruzione sono nulli:
hn| a† |ni = 0
(4.33)
hn| a |ni = 0
(4.34)
Ciò significa che il valore aspettato del campo elettrico in regime quantistico è
nullo, e questo risultato è insolito; infatti se si scrive il campo elettrico:
E(r̄, t) = E0 e−iωt+iφ
(4.35)
considerando il principio di indeterminazione si può arrivare a scrivere:
∆E∆t ∼ ~ ⇒ ~∆ω∆t ∼ ~
(4.36)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
e dato che ∆ω = ω∆n e che ∆t =
∆φ
ω
71
si può scrivere:
∆n∆φ ∼ 1
(4.37)
quindi l’indeterminazione sulla fase per l’indeterminazione sul numero di fotoni,
cioè sull’ampiezza è una costante, e questo si traduce proprio nel fatto che non
posso avere contemporaneamente una informazione infinitamente precisa su fase
e ampiezza, che sono due grandezze fondamentali per conoscere il campo elettrico; ciò significa che, come scritto inizialmente, il valore aspettato del campo
elettrico, al contrario di quanto avveniva classicamente, è nullo.
4.2
Interazione radiazione-materia
Fin’ora abbiamo considerato la radiazione elettromagnetica nel vuoto. Vogliamo studiare cosa avviene quando la radiazione interagisce con la materia. E’
possibile derivare l’interazione radiazione-materia direttamente dalla sostituzione minimale: se si ha una particella con impulso p immersa in un CEM, allora
il suo impulso diventa p − ec A e questo nuovo impulso lo si inserisce all’interno dell’hamiltoniana della particella. L’hamiltoniana totale, data dalla somma
delle hamiltoniane del sistema e della radiazione è:
1 e 2
(4.38)
H=
p − A + V ({R}) + Hrad
2m
c
il primo termine descrive l’interazione radiazione-materia, il secondo termine è il
potenziale di interazione fra le particelle del sistema (ad esempio se studiamo un
cristallo esso sarà il potenziale cristallino), mentre il termine Hrad rappresenta
l’hamiltoniana di radiazione vista nell’espressione (4.23).
Ora passiamo dall’interazione fra il campo e una particella ad un sistema di
N particelle ognuna con carica Qi e si può scrivere svolgendo il quadrato nella
(4.38):
X p2
Q2
Qi
i
H=
+ 2 i A2 (r̄, t) −
[pi A(r̄, t) + A(r̄, t)pi ]+ +V ({Ri })+Hrad
2mi
2c mi
2cmi
i
(4.39)
dove V ({Ri }) dipende dalla mutua posizione delle particelle {Ri } e ovviamente impulso, posizione e potenziale vettore sono qui operatori quantistici. Non
avendo informazione sulla distribuzione spaziale delle particelle della materia in
esame si ipotizza una funzione densità del tipo (nel discreto e nel continuo):
Z
X
ρ(r̄, t) =
δ(r̄ − R̄i ) −−−−−−−→ dr̄ δ(r̄ − R̄i )
(4.40)
i
al continuo
si introduce la precedente funzione densità per inserirla nel termine di interazione dell’hamiltoniana (4.39), la quale viene riarrangiata in modo da evidenziare
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
72
la dipendenza dalle potenze di A:
X p2
i
H=
+ V ({Ri }) + Hrad +
2mi
i
{z
}
|
H0
Z
−
dr̄
X
δ(r̄ − R̄i )
i
|
Qi
[pi A(r̄, t) + A(r̄, t)pi ] +
2cmi
{z
}
(4.41)
H1 (A)
X Q2
i
A2 (r̄, t)
+
2m
2c
i
i
{z
}
|
H1 (A2 )
Quindi l’hamiltonina totale si può scrivere come H = H0 + Hint dove Hint =
H1 (A) + H1 (A2 ). Il termine H1 (A) è il prodotto tra la quantità di moto delle
particelle e il potenziale vettore del CEM su cui agisce la funzione densità e
può essere considerata come fattorizzata in una parte dipendente dal target per
una parte dipendente dal probe, mentre il termine H1 (A2 ), quadratico in A, è il
prodotto della somma del quadrato delle cariche del target per il quadrato del
potenziale vettore ed anche questa come la precedente può essere considerata
fattorizzata in una parte di probe per una parte di target.
4.2.1
Processi ad 1 fotone: assorbimento ed emissione
Ricordando la sezione 2, in particolare la (2.14) abbiamo visto che l’operatore
di scattering è ottenibile dal potenziale di interazione VI (che ha un termine
lineare in A e uno in A2 ) attraverso l’espressione:
i
Ŝ = T̂ {e− ~
R +∞
−∞
dtVI (t)
}
Si è visto che la matrice di scattering sviluppata in serie fornisce, ad ogni ordine,
i vari tipi di interazione. Qui possiamo anticipare che al primo ordine si trovano
i processi ad un fotone, in particolare di assorbimento ed emissione di un fotone
mentre al secondo ordine si trovano i processi a due fotoni come lo scattering
Raman e Brillouin e l’assorbimento e l’emissione di due fotoni.
Se il CEM è abbastanza piccolo il termine dominante è quello lineare in A.
Vogliamo arrivare a scriverlo come fattorizzato in un termine di probe per uno
di target, esattamente come nelle ipotesi viste del teorema della risposta lineare.
E’ possibile definire l’operatore densità di corrente come:
J(r̄, t) =
X Qi
X Qi
[pi ρ(r̄, t) + ρ(r̄, t)pi ] =
pi δ(r̄ − R̄i (t))
2mi
mi
i
i
che è relativo al target. Quindi si può scrivere il termine H1 come:
Z
1
H1 = −
dr̄J(r̄, t) · A(r̄, t)
c
(4.42)
(4.43)
che è il potenziale di interazione al primo ordine in A fattorizzato in un termine
di probe A(r̄, t) per un termine relativo al target J(r̄, t) (si noti come sia lo stesso
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
73
risultato anticipato nella (2.29)). E’ possibile quindi applicare il teorema della
risposta lineare e ricavare così la probabilità di transizione doppio differenziale
cioè:
Z
Z
∂ 2 Ṗ
ρ(ωF )
dteiωt dr̄1 dr̄2 e−iq̄(r¯1 −r¯2 ) ·
=
∂Ω∂ω
~
(4.44)
X
·
hpi | A†α (r̄1 , t) |pf i hpf | Aβ (r̄2 , 0) |pi i · hOα† (r¯1 , t)Oβ (r¯2 , 0)i
αβ
2
ω
La probabilidove ρ(ωF ) = (2πc)
2 è la densità degli stati e α, β = x, y, z.
tà di transizione precedente è scritta in termini della funzione di correlazione
corrente-corrente, infatti l’operatore O(r̄, t) è l’operatore momento di dipolo
cioè:
Jα (r̄, t) X Qi α
Oα (r̄, t) =
=
p δ(r̄ − R̄i (t))
(4.45)
c
cmi i
i
Conviene usare per A(r̄, t) il seguente modo di scrittura:
X
A(r̄, t) =
Bkj (r̄, t) + Bk∗j (r̄, t)
(4.46)
kj
dove si ha che:
s
2πc2
¯k ei(k̄ · r̄−ωkj t) akj
V ωkj j
(4.47)
2πc2 ∗ −i(k̄ · r̄−ωkj t) †
¯ e
akj
V ω kj kj
(4.48)
Bkj (r̄, t) =
s
Bk∗j (r̄, t)
=
Si considera lo stato iniziale del probe |pi i come un’onda piana polarizzata di
energia E = ~ω, momento q̄ e vettore di polarizzazione ¯. Il numero di fotoni
iniziali è n e si vuole calcolare la parte della probabilità di transizione relativa
al probe:
X
hn|
Bkαj (r̄1 )e−iωkj t + Bk∗α
(r̄1 )e+iωkj t |pf i ·
j
kj
· hpf |
X
kj0 0
= hn|
X
Bkβ0 (r̄2 )
j0
+
Bk∗β0 (r̄2 )
j0
Bkαj (r̄1 )e−iωkj t |pf i hpf |
X
X
kj0 0
kj
+ hn|
|ni =
Bk∗α
(r̄1 )eiωkj t |pf i hpf |
j
kj
X
kj0 0
Bk∗β0 (r̄2 ) |ni +
(4.49)
j0
Bkβ0 (r̄2 ) |ni
j0
il motivo per cui nell’ultimo passaggio della precedente espressione vi sono solo
due addendi invece di quattro è dovuto al fatto che B contiene un operatore
di distruzione e B ∗ uno di creazione e sopravvivono solo i termini misti cioè
hn| akj |pf i hpf | a†k0 |ni e hn| a†kj |pf i hpf | akj0 0 |ni.
j0
Distinguiamo ora i processi:
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
74
• quando |pf i = |n + 1i si ha l’emissione, cioè viene creato un fotone nel
processo e il primo addendo dell’ultima espressione della (4.49) restituisce
n(ω) + 1 mentre il secondo addendo si annulla;
• quando |pf i = |n − 1i si ha l’assorbimmento, cioè viene distrutto un
fotone nel processo e il primo addendo della (4.49) si annulla mentre il
secondo addendo restituisce n(ω).
Quindi si ha che, scrivendo tutte le costanti ed esplicitando i valori di B e B ∗ ,
il termine di probe che entra nell’espressione (4.44) si può scrivere come:
2π~c2 α ∗β
[n(ω) + 1]e−iωt e−iq̄ · (r¯1 −r¯2 ) + ∗α β n(ω)e+iωt eiq̄ · (r¯1 −r¯2 ) (4.50)
Vω
Inserendo quest’ultima espressione nella (4.44) e semplificando le costanti si può
riscrivere la probabilità di transizione con i termini di emissione e assorbimento:
∂ 2 Ṗ
ω
=
2
∂Ω∂ω (2π) ~c3 V
+∗α β n(ω)
Z
dr¯1 dr¯2 e−iq̄ · (r¯1 −r¯2 )
Z
Xh
α ∗β [n(ω) + 1] dt e−iωt +
αβ
Z
i
dt e+iωt hOα† (r¯1 , t)Oβ (r¯2 , 0)i
(4.51)
Ora bisogna risolvere la funzione di correlazione dell’operatore di target.
Si considera un sistema di N atomi o ioni, ognuno formato da un nucleo di carica
eZj , massa Mj e con Pj e Rj rispettivamente momento e coordinate nucleari.
Si indicano poi con py e ry momento e coordinate degli elettroni, di massa m e
carica −e e siano zj gli elettroni per atomo/ione. Si scrive per l’operatore:
Z
Oα (q̄, t) = dr̄e−iq̄ · r̄ Oα (r̄, t) =


Z
zj
N X
N
X
X
e
eZ
j
= dr̄e−iq̄ · r̄ −
pα δ(r̄ − r̄y (t)) +
Pjα (t)δ(r̄ − R̄j (t)) =
mc j y y
cM
j
j
N
=−
zj
N
e X X α −iq̄ · r̄y (t) X eZj α
p e
+
Pj (t)e−iq̄ · R̄j (t)
mc j y y
cM
j
j
(4.52)
dove si è applicata la definizione (4.45) e si è usata l’espressione
Z
e−iq̄ · r̄i (t) =
dr̄e−iq̄ · r̄ δ(r̄ − r̄i (t))
La (4.52) si può riesprimere usando le coordinate e il momento relativi di
elettrone e nucleo cioè rispettivamente:
%̄y = r̄y − R̄j
m
Π̄y = p̄y −
P̄j
Mj
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
75
Allora l’ultima espressione della (4.52) si può riscrivere come:
Oα (q̄, t) =
N zj N
−e X X
m α −iq̄ · (%̄y +R¯j (t)) e X Zj α −iq̄ · R¯j (t)
Πα
+
P
e
+
P e
=
y
mc j y
Mj j
c j Mj j
N
zj
e XX α
Π (t)e−iq̄ · (%̄y +R̄j (t)) +
mc j y y
#
"
zj
N
1 X −iq̄ · %̄y
e X −iq̄ · R̄j (t) α
Zj
e
+
Pj (t)
−
e
c j
Mj
Mj y
=−
(4.53)
di questo operatore va calcolato Oα† (q̄, t) e Oβ (q̄, 0) per poi fare la media quantistico termodinamica.
Si considera, in prima approssimazione che gli stati elettronici siano poco perturbati dalle interazioni atomo-atomo (o ione-ione) e che si possa usare l’approssimazione di Born-Oppenheimer fattorizzando le funzioni d’onda nucleari
ed elettroniche.
Se Ĥ è l’hamiltoniana del target allora
X
Ĥj + V̂ ({R̄j (t)})
Ĥ =
j
dove
Ĥj = Ĥje + ĤjN
e si ha che
|ψj i = |ψje i |ψjN i
e quindi si può scrivere la funzione di correlazione fattorizzata in una parte
elettronica per una parte nucleare:
h i = h ie h iN
(4.54)
Inoltre vale che
hPjα iN = hΠα
y ie = 0
∀ α, j, y
in quanto gli atomi sono qui considerati fissi.
Quindi gli unici termini che hanno medie non nulle sono:
e2 X X iq̄ · %̄y (t) †α
he
Πy (t)Πβy0 (0)e−iq̄ · %̄y0 (0) ie heiq̄ · R̄j (t) e−iq̄ · R̄j0 (0) iN +
m2 c2 0 0
jj
yy
2
e X
1
heiq̄ · R̄j (t) Pj†α (t)Pjβ0 (0)e−iq̄ · R̄j0 (0) iN ·
+ 2
0
c
M
M
j
j
0
jj
Zj 0
Zj
h
ih
i
X
X
iq̄ · %̄y (t)
· h Zj −
e
Zj 0 −
e−iq̄ · %̄y0 (0) ie
y
y0
(4.55)
Generalmente nel range della radiazione visibile e ultravioletta si ha q · %y 1
e quindi eiq̄ · %̄y (t) ∼ 1 (approssimazione di dipolo).
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
76
Introducendo le grandezze carica netta dello ione j e quantità di moto elettronico
dello ione j che sono rispettivamente
zj
X
Qj = e(Zj − zj )
α
Πα
y = Πj
y
dove la carica netta vale Qj = 0 per atomi neutri, si può scrivere la (4.55) come:
e2 X †α
hΠ (t)Πβj0 (0)ie heiq̄ · R̄j (t) e−iq̄ · R̄j0 (0) iN +
m2 c2 0 j
jj
(4.56)
1 X Qj Qj 0 iq̄ · R̄j (t) †α
β
−iq̄ · R̄j 0 (0)
+ 2
he
Pj (t)Pj 0 (0)e
iN
c
Mj Mj 0
0
jj
Il primo di questi termini da l’assorbimento o l’emissione dai livelli elettronici convoluto con la dinamica dei nuclei.
Nel caso di atomi neutri della stessa specie si ha che Qj = 0 e l’unico termine di assorbimento è quello elettronico. Indicando con FS (q̄, t) la funzione di
autocorrelazione dei nuclei si può scrivere:
X
e2 X †
hΠj (t) · ¯∗ Πj (0) · ¯ie (4.57)
∗α β hO†α (q̄, t)Oβ (q̄, 0)i = FS (q̄, t) 2 2
m c j
αβ
e usando la definizione di h ie e le relazioni
Πj (t) = e+i
Ĥe
~
t
Πj (0)e−i
Ĥe
~
X
t
|λi hλ| = 1
λ
si ottiene:
hΠ†j (t) · ¯∗ Πj (0) · ¯i = ρj (En )
X
e+iωλn t | hλ| Πj · ¯ |ni |2
(4.58)
λ
con
e
ρj (En ) = P
~ωλn = En − Eλ
− kEnT
m
B
e
− kEmT
B
dove ρj (En ) è la probabilità che l’atomo j sia sullo stato elettronico |ni.
Inoltre poichè vale:
e hλ| Πj · ¯ |ni = −iωλn m hλ| d¯j · ¯ |ni
(4.59)
¯
dove dj = e%¯j è l’operatore momento di dipolo elettronico. Usando la
scrittura hλ| d¯j · ¯ |ni = (d¯j · ¯)λn si può scrivere:
X
X
1
2 +iωλn t ¯
F
(q̄,
t)
ρ
(E
)
ωλn
e
|(dj · ¯)λn |2
(4.60)
S
j
n
c2
n
λ
Quindi possiamo scrivere infine, nel caso di atomi neutri della stessa specie, la
seguente probabilità di transizione doppio differenziale:
XX
∂ 2 Ṗ (q̄, ω)
ω
2 +iωλn t ¯
=
ρj (En )ωλn
e
|(dj · ¯)λn |2 ·
2
3
∂Ω∂ω
(2π) ~c V
λn j
(4.61)
Z
Z
−i(ω−ωλn )t
i(ω+ωλn )t
· [n(ω) + 1] dt e
FS (q̄, t) + n(ω) dt e
FS (q̄, t)
proviamo a commentare i termini presenti in quest’ultima espressione:
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
77
• dato che ω è sempre positiva il termine con [n(ω) + 1] implica che ωλn >
0 cioè En > Eλ in quanto questo termine rappresenta l’emissione di
radiazione che avviene se è En è occupato e si diseccita su Eλ .
Moltiplicando la parentesi [n(ω) + 1] per l’integrale questo termine può
essere a sua volta diviso in due parti:
emissione spontanea è data dal termine con 1, essa quindi non dipende dal flusso di radiazione incidente. Rappresenta, come suggerisce il nome, i processi
di diseccitazione spontanea dal primo livello elettronico occupato a
quello fondamentale. Il fenomeno di emissione può avvenire casualmente in tutte le direzioni ed è spiegato in seconda quantizzazione
considerando le fluttuazioni dello stato di vuoto del campo elettromagnetico incidente che pertanto transisce al primo stato eccitato
fotonico quando l’atomo si diseccita e viene emesso il fotone;
emissione stimolata è data dal termine con n(ω), essa quindi dipende dal flusso di radiazione incidente. Rappresenta tutti i processi di diseccitazione indotti dai fotoni incidenti che causano l’emissione di fotoni con frequenza e vettore d’onda uguale ai fotoni incidenti, causando l’amplificazione della radiazione. Questo fenomeno è usato per ottenere
l’amplificazione laser;
• dato che ω è sempre positiva il termine con n(ω) implica che ωλn < 0 e si
chiama termine di assorbimento e descrive i processi in cui i fotoni del
campo incidente vengono assorbiti dagli elettroni che transiscono da uno
stato a più bassa energia Eλ verso uno stato a più alta energia En (ecco
perchè questa volta ωλn = Eλ −En < 0). Con la trattazione fatta possiamo
distinguere l’assorbimento dai livelli elettronici con l’assorbimento causato
dai nuclei (cioè dai modi normali del reticolo, che tratteremo più avanti.)
Abbiamo visto che l’operatore di interazione è piuttosto complicato: contiene
almeno due termini di diversa intensità. In termini del potenziale vettore c’è un
termine lineare ed uno quadratico in A. Al primo ordine dello sviluppo della
matrice di scattering si avranno quindi due termini provenienti dall’hamiltoniana di interazione che sono rispettivamente il termine lineare e quadratico in A.
Le considerazione fatte riguardano la matrice di scattering al primo ordine lineare nel potenziale vettore, che rappresenta i processi più intensi nell’ambito
dell’interazione radiazione-materia e cioè i processi ad 1 fotone.
Ĥint = c1 Ā · p̄ + c2 Ā2 ⇒
Ŝ1 (Ā) + Ŝ1 (Ā2 ) + Ŝ2 (Ā)
|
{z
}
| {z }
processi a 1
f otone
(4.62)
processi a 2
f otoni/scattering
Il termine lineare nella matrice di scattering ma quadratico nel potenziale che
viene dal termine quadratico nel potenziale dell’hamiltoniana ha un’intensità
paragonabile al termine lineare in A ma al secondo ordine della matrice di
scattering e questi ultimi due termini contengono i processi di assorbimento ed
emissione a 2 fotoni e i processi di scattering elastico e anelastico.
4.2.2
Proprietà ottiche e Modello di Drude
Supposto che valga l’approssimazione di Born-Oppenheimer, ci si può preoccupare di cosa assorbano separatamente gli elettroni dalle altre unità fondamentali
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
78
Figura 20: Radiazione incidente, riflessa e trasmessa du un certo campione di
spessore d.
del target in esame. Nel caso di elettroni liberi, ad esempio per un metallo, si
può scrivere il termine di interazione radiazione-materia, cioè l’hamiltoniana
per elettroni liberi nel modo seguente:
Z
1
¯ t)
dr̄Ā(r̄, t) · J(r̄,
(4.63)
Ĥint = −
c
dove la densità di corrente microscopica J si scrive come:
X
¯ t) = − e
J(r̄,
P̄i δ(r̄ − R̄i (t))
c i
(4.64)
quantità comoda quando si trattano delle cariche in moto.
Arriveremo a trattare lo scattering da CEM come fatto per i neutroni, scrivendo
cioè la matrice di scattering e la sezione d’urto.
Vogliamo ricordare ora alcuni aspetti di ottica generale che saranno utili per
la descrizione delle proprietà dei metalli e presentare il modello semiclassico di
Drude che funziona molto bene per la descrizione delle proprietà ottiche dei
metalli.
Le proprietà ottiche di un materiale possono essere descritte in una forma macroscopica ed una microscopica. Quando si fa una misura ottica di un oggetto
si misura una quantità macroscopica (ad es. la trasmittanza, la riflettività ecc).
In figura 20 vediamo un campione di spessore d e una radiazione I0 (ω) che
incide su di esso; ciò che può avvenire a livello macroscopico è di avere una
radiazione riflessa in modo speculare IR (ω) mentre una parte della radiazione
incidente viene assorbita dal campione e un’altra parte ancora viene trasmessa.
In generale si chiama riflettività il rapporto fra l’intensità riflessa all’angolo θ e
l’intensità incidente all’angolo θ:
R(ω, θ) =
IR (ω, θ)
I0 (ω, θ)
(4.65)
ed è una quantità macroscopica. Si ottiene facendo il rapporto fra lo spettro
incidente e quello riflesso ed è compresa fra 0 e 1. La riflettività è vicina ad 1 nei
metalli, ed è funzione in generale della frequenza perché si possono avere effetti
di risonanza con meccanismi del sistema che possono far aumentare o diminuire
la sua riflettività.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
79
Figura 21: Schema della diffusione microscopica da una superficie rugosa.
Se il campione ha una superficie rugosa parte della radiazione viene anche diffusa, cioè deviata ad un angolo diverso da quello di incidenza, e si ottiene la
riflettività diffusa. In generale, guardando la superficie di un oggetto a livello
microscopico, la rugosità, nonostante tecniche di levigatura molto raffinate è
qualcosa di non completamente eliminabile. In figura 21 è mostrato come la
rugosità microscopica determini fasci riflessi con angolo che cambia da punto a
punto. Quindi mediamente una certa frazione del fascio incidente può venire
diffusa ad un angolo diverso da quello di incidenza perché le normali alla superficie possono cambiare punto per punto.
Se la rugosità media è δ, la luce per non accorgersi di tale rugosità, cioè per
evitare effetti di diffusione, deve avere una lunghezza d’onda λ δ.
A partire dall’intensità di radiazione trasmessa si può definire la trasmittanza, quantità macroscopica definita come il rapporto tra l’intensità trasmessa e
quella entrata nel campione cioè:
T (ω, θ) =
IT (ω, θ)
(1 − R)I0 (ω, θ)
(4.66)
In generale si ha che:
T +R+A=1
(4.67)
dove A è una quantità chiamata assorbanza, cioè la quantità di luce assorbita
dal campione e che in generale viene trasformata in calore. Quest’espressione
rappresenta sostanzialmente la conservazione dell’energia.
Quindi dal punto di vista ottico ciò che si misura sono le proprietà macroscopiche
cioè R, T e A. Tutto ciò che si calcola dalla probabilità di transizione sono
invece quantità microscopiche come la sezione d’urto. Il passaggio fra queste
quantità sono una serie di grandezze già viste durante i corsi di ottica e che ora
ricorderemo.
Se l’angolo di incidenza è θ < 10◦ sia la riflettività che la trasmittanza non
dipendono più dall’angolo e questo si chiama incidenza quasi-normale. In questo
caso la riflettivià si scrive come:
ñ − 1 2
R(ω) = (4.68)
ñ + 1
dove ñ è l’indice di rifrazione microscopico e ed è una quantità complessa
e adimensionale che si scrive come:
ñ = n + iκ
(4.69)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
80
con n indice di rifrazione reale mentre la parte immaginaria κ è chiamata indice di estinzione e tiene conto dei processi di assorbimento nel materiale. La
riflettività (4.68) si può quindi riscrivere come:
R(ω) =
(n − 1)2 + κ2 no ass. (n − 1)2
−−−−→
(n + 1)2 + κ2 κ=0 (n + 1)2
(4.70)
l’ultima espressione a destra è la formula classica della riflettività in assenza
di assorbimento. Questa formula conoscendo la riflettività permette di ricavare
l’indice di rifrazione di un dato materiale.
Generalizzando il discorso si può dire che la riflettività si manifesta se c’è una
discontinuità ottica: ad un certo punto l’indice di rifrazione (idr) cambia improvvisamente. Questo significa che fin’ora abbiamo considerato il materiale di
indice di rifrazione microscopica ñ come immerso nel vuoto (cioè il numero 1
nelle formule precedenti è l’idr del vuoto), ma se esso è immerso in un dielettrico
con idr microscopico ñd allora la riflettività generica è:
ñ − ñ 2
d
(4.71)
R(ω) = ñ + ñd
Si assume di solito che ñ ≥ 1, cosa che però non è del tutto vera in quanto è
stato dimostrato che l’idr può essere anche un numero negativo, e sono stati
prodotti alcuni metamateriali con interessanti applicazioni.
L’indice di rifrazione è un esempio di proprietà ottica microscopica. Tuttavia
ciò che si è in grado di misurare è R. Per sistemi assorbenti cioè in cui κ 6= 0 il
problema sembra mal posto in quanto dalla misura di R si dovrebbero ricavare
due quantità facenti parte della stessa equazione. Volendo si potrebbe anche misurare T che supponendo A = 0 è facile collegare direttamente ad n e κ dato che
sarebbe T = 1 − R. Se si potesse misurare contemporaneamente la luce riflessa
e quella trasmessa, in principio, invertendo numericamente le due equazioni, si
potrebbero ricavare i valori di n e κ. Questo però non sempre è possibile in
quanto alcuni materiali non possono essere resi sottili a piacere che quindi non
danno alcuna intensità trasmessa. Quindi spesso si è in grado di misurare una
singola proprietà ottica macroscopica.
Un altro esempio di grandezza ottica microscopica già visto è la funzione
dielettrica microscopica o permettività definita come:
˜(ω) = ñ2 (ω)
(4.72)
anch’essa è una quantità complessa che può essere scritta nel modo seguente:
˜(ω) = 1 + i2
con 1 = n2 (ω) − κ2 (ω) e 2 = 2nκ
(4.73)
che spiega come un campo elettrico viene modulato dalla presenza del materiale.
Un’altra grandezza ottica usata spesso è la conducibilità ottica σ̃(ω) definita
a partire dalla permettività nel seguente modo:
˜(ω) = 1 +
iσ̃(ω)
ω
(4.74)
ed è anch’essa una grandezza complessa cioè:
σ̃(ω) = σ1 + iσ2
(4.75)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
81
dove la parte reale σ1 è detta parte assorbitiva o dissipativa mentre la parte
immaginaria σ2 è chiamata parte reattiva.
Affichè ˜(ω) e quindi l’idr sia adimensionale la conducibilità deve avere le dimensioni di una frequenza.
Le relazioni che legano ñ,˜
e σ̃ non sono lineari e l’obiettivo di molti misuratori ottici è caratterizzare un sistema ottico, cioè determinare le parti reale e
immaginaria di una delle tre grandezze microscopiche citate e di conseguenza
determinarne anche le altre.
Storicamente, se il materiale è un isolante, le sue proprietà ottiche vengono descritte tramite la parte reale e immaginaria della funzione dielettrica, se invece
il materiale è metallico si usano le parti reale e immaginaria della conducibilità
ottica.
Tramite il modello di Drude si possono descrivere le proprietà ottiche di un
metallo in maniera semiclassica. Le proprietà elettrodinamiche dei metalli che
vedremo esposte tramite questo modello possono essere studiate con spettroscopia ottica nel visibile, nell’UV e nel IR.
Si consideri un gas di elettroni dove ogni elettrone sia individuato da una posizione r̄i . Si applica un campo esterno Ē = Ē0 eiωt e l’equazione che regola il
movimento degli elettroni è puramente classica e si scrive come:
m
dr̄i (t)
d2 r̄i (t)
+ mΓ
= −eĒ(t)
2
dt
| {zdt }
(4.76)
termine
dissipativo
e se τ è il tempo medio tra due urti allora Γ = 1/τ è il rate di scattering. Si
ricorda che Drude pensava che gli elettroni urtassero esclusivamente contro gli
ioni. Per tempi sufficientemente grandi ci si può aspettare che una soluzione
della precedente si possa scrivere come:
r̄i (t) = r̄0 eiωt
(4.77)
prendendo questa soluzione stazionaria e sostituendola nella (4.76) si ricava r̄˜0 ,
grandezza complessa:
e
Ē0
r̄˜0 =
(4.78)
m ω 2 − iωΓ
che in pratica è l’ampiezza dello spostamento dell’elettrone i-esimo per effetto
dell’applicazione del campo.
Se si hanno n elettroni nel materiale, che in un metallo è un numero dell’ordine
di 1022 -1023 elettroni per cm3 , il momento di dipolo che si crea per effetto della
posizione del campo è:
2
Ē0
¯ = −er̄˜0 = − e
d˜
m ω 2 − iωΓ
(4.79)
˜¯ Conoscendo il momento di
˜ = nd.
e il momento di dipolo totale sarà quindi D̄
dipolo si sa che questa grandezza e il campo elettrico sono legati dalla grandezza
nota come polarizzabilità, cioè:
˜ = ᾱ
˜¯ (ω)Ē0
D̄
(4.80)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
82
dove la doppia barra indica che la polarizzabilità è in generale un tensore. La
polarizzabilità per un gas di elettroni di massa m carica e e densità n è definita
come:
e2
n
˜
¯ (ω) = α1 + iα2 = −
ᾱ
(4.81)
m (ω 2 − iωΓ)
A partire dalla polarizzabilità è possibile ricavare la funzione dielettrica dalla
relazione:
˜¯ (ω)
(4.82)
˜(ω) = 1 + 4π ᾱ
Indichiamo ora le grandezze strettamente ottenute col modello di Drude con
l’uso dell’apice "D".
La parte reale della funzione dielettrica di drude si scrive come:
D
1 (ω) = 1 −
ωp2
ω 2 + Γ2
(4.83)
ωp2 ωΓ
+ Γ2
(4.84)
e la parte immaginaria come:
D
2 (ω) =
2
ω2
dove ωp2 = 4πne
è la frequenza di plasma al quadrato. Quindi si può concludere
m
che la funzione dielettrica di questo modello semplice per un gas di elettroni, in
cui si è partiti da un’equazione classica con un fattore dissipativo proporzionale
alla velocità degli elettroni, si può esprimere in funzione di soli due parametri:
uno è Γ che sarebbe la frequenza degli urti, e l’altro è ωp il cui quadrato è sostanzialmente il rapporto densità-massa n/m.
In generale n ed m si possono misurare in maniera indipendente mentre Γ è
un parametro fenomenologico. Drude per impostare il suo modello per i metalli partì dall’osservazione fondamentale riassumibile con la legge di Ohm: la
corrente che scorre in un metallo è proporzionale alla differenza di potenziale
tramite una costante dissipativa che è la resistenza. Fissata la ddp quindi la
corrente è costante, tuttavia dato che la velocità delle particelle è proporzionale
al campo elettrico, una ddp costante significa applicare una forza costante, il
che significa che gli elettroni dovrebbero accelerare all’infinito, ma questo come
sappiamo non avviene. Quindi Drude ipotizzò un qualche fenomeno di scattering (gli urti con gli ioni) che costringa la corrente a rimane costante. Questo
però non è vero, vediamo perché.
Gli elettroni si muovono con libero cammino medio definito da l = vF τ dove
vF è la velocità di Fermi. In un metallo il valore di l, se il metallo è purissimo
(elettroni balistici), è circa 1 mm con τ ∼ 1 µs, mentre in un metallo non puro
l ∼ 102 Å che è almeno di un fattore cento più alto delle distanze medie fra gli
ioni in un metallo che sono dell’ordine di qualche Å, e quest’osservazione spiega
come mai l’ipotesi iniziale fatta da Drude per cui gli elettroni scatterano con gli
ioni è falsa. I fenomeni di scattering principali riguardano le interazioni con i
fononi e con le impurezze.
Si possono scrivere anche le parti reale e immaginaria per la conducibilità di
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
83
Figura 22: Dipendenza spettrale della riflettività di un metallo di elettroni liberi
Drude:
σ1D (ω)
=
σ2D (ω) = ωp2
1
1
ωp2
Γ
2
+ ωΓ
ω
Γ
2
+ ωΓ
(4.85)
(4.86)
e la riflettività di Drude è:
˜D − 1 2
RD (ω) = D
˜ + 1 (4.87)
Ora spigheremo il significato fisico, molto importante, della frequenza di plasma,
che sostanzialmente definisce il colore del metallo.
Si considera una radiazione elettromagnetica che incide su di un metallo nel
vuoto. In figura 22 si vede il grafico tipico della riflettività rispetto all’energia
espressa in eV: fino ad un certo valore di frequenza che è esattamente ωp il
metallo riflette più del 99% della radiazione incidente e dopo questo valore la
riflettività crolla improvvisamente e il metallo assorbe. Fino alla frequenza di
plasma possiamo dire che il metallo si comporta come un filtro ottico passa-alto,
che riflette tutte le frequenze fino a ωp e assorbe le altre. Il prof fa vedere il
grafico di riflettività dell’oro (che non ho trovato) e spiega come l’oro ha una
frequenza di plasma nel rosso a circa 15000 cm−1 , e se illuminato con luce solare
che contiene tutte le frequenze nel visibile, riflette fino alla sua frequenza di
plasma e questo si traduce nel fatto che noi vediamo l’oro con un colore dovuto
alla somma di tutte le frequenze fino a circa 15000 cm−1 , una specie di miscela
di giallo e rosso. Ho inserito in figura 23 il grafico di riflettività dell’alluminio
per mostrare un caso reale.
Il caso dell’alluminio (di colore bianco) si può
discutere dicendo che questo metallo ha una frequenza di plasma intorno ai
15 eV (1 eV = 8000 cm−1 ) cioè nel UV spinto, ed essendo meno nobile dell’oro
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
84
Figura 23: Riflettività dell’alluminio. La diminuzione di riflettività a 1.4 eV
è dovuta ad una transizione interbanda mentre il crollo a 15 eV identifica la
frequenza di plasma
tende naturalmente ad ossidarsi, formando in superficie uno strato di ossido
di alluminio di diversi nanometri di spessore che ha come risultato quello di
abbassare la frequenza di plasma.
La curva di riflettività diventa più "smooth" e tende a calare rispetto ad 1 man
mano che cresce il valore di Γ, cioè man mano che aumenta lo scattering, ma il
taglio del filtro ottico rimane sempre a ωp . La temperatura entra nel valore di Γ
in quanto questo valore rappresenta una media di tutti i processi di scattering
che avvengono nel metallo, uno dei quali è dato dall’interazione con i fononi la
cui popolazione dipende dalla temperatura.
Nel caso dell’oro, mostrato dal prof, Γ = 90 e il grafico è spiegato molto bene con
il modello di Drude (la figura 22 ricorda molto il caso Au). Dopo la frequenza di
plasma la riflettività dell’oro scende al 30 % del suo valore iniziale. Gli elettroni
riescono a rispondere alla radiazione elettromagnetica fino ad una frequenza del
CEM paragonabile a Γ; dopo non riescono più a seguire l’oscillazione del campo
il quale riesce ad attraversare il materiale.
E’ interessante, partendo dalla riflettività modellistica di Drude, vedere come si
comportano le grandezze ˜ o σ̃ al variare di Γ. Ad esempio vediamo σdc = ωp2 /Γ
cioè il valore che si può misurare a frequenza nulla con un tester. Si vede dalla
figura 24 che in principio, prendendo la legge σ1D (ω) = σdcω 2 in sostanza essa è
1+( Γ )
una lorenziana centrata in zero, cioè a frequenza nulla; se Γ = 0 essa si trasforma
in una delta di Dirac, quindi un metallo perfetto (senza scattering) corrisponde
ad una conducibilità a forma di delta centrata in zero. Quando Γ è diverso da
zero il valore di σdc si abbassa e si alza il valore in "alternata" quindi vale che:
lim σ1D (ω) = σdc
ω→0
(4.88)
dove σdc è detta conducibilità in continua ed è semplicemente il reciproco della
resistività in continua cioè 1/ρdc . L’area sottesa dalla parte reale della conducibilità di Drude è costante ed è ωp2 ; questa si chiama regola di somma ed è legata
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
85
Figura 24: Conducibilità reale di un metallo nel modello di Drude a diversi
valori dello scattering (in rosso) Γ.
alla conservazione della probabilità di transizione. Peggiorando il metallo (aumento Γ), è vero che la conducibilità in continua σdc peggiora, però il rapporto
n/m rimane costante e finito, cioè l’area sottesa. Per ricapitolare si può dire
che il reale processo fisico consiste in misurare la riflettività da cui ricavare σ1 .
Invece il limite per la parte immaginaria della conducibilità vale:
lim σ2D (ω) = 0
ω→0
(4.89)
e questa funzione verrà vista fra poco.
Il rapporto fra parte immaginaria e reale della conducibilità è:
1
σ2D (ω)
= ωτ > 1 con ω >
τ
σ1D (ω)
(4.90)
Per dare dei numeri, considerando ad esempio l’oro ed esprimendo la frequenza
in cm−1 si ha che ωpAu ' 15000 cm−1 (rosso) con ΓAu ∼ 100 cm−1 (lontano IR)
e quindi la regione ωτ > 1 significa considerare frequenze maggiori di 100 cm−1 ;
quindi da una certa regione del lontano IR in poi la parte immaginaria della
conducibilità ottica vince sulla parte reale. Vediamo questo concetto anticipando che la σ1 è chiamata parte dissipativa (o resistiva) e la σ2 è chiamata parte
induttiva.
Per capire cosa comporta ciò, dato che i nomi ricordano note componenti circuitistiche, facciamo un conto di fisica di base: si consideri il metallo come un filo
in cui scorre corrente ad una certa frequenza. Si può scrivere la legge di Ohm
microscopica cioè:
˜
J˜¯ = σ̃ Ē
cioè la densità di corrente che è data dalla conducibilità per il campo elettrico.
Il campo elettrico sia reale monocromatico e con fase φE :
˜ = Ē eiωt+iφE
Ē
0
e si sceglie per semplicità φE = 0, questo perché l’obiettivo del conto è mostrare
come sono legate la fase della corrente che si induce nel metallo per effetto di un
campo esterno con la fase del campo stesso che viene per questo posta uguale a
zero.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
86
Si può scrivere la corrente in condizioni di regime (cioè si applica un campo in
alternata e si aspetta un tempo sufficientemente lungo tale per cui la corrente
nel filo si mette ad oscillare alla stessa frequenza), che ha fase φJ , come:
˜ = |σ̃|eiφσ Ē eiωt
¯ = J¯0 eiωt eiφJ = (σ1 + iσ2 )Ē
J˜
0
posso quindi eliminare le parti temporali e scrivere che:
J¯0 eiφJ = |σ̃|eiφσ Ē0 ⇒ φJ = φσ
cioè quando si applica una corrente ad un circuito, la corrente ha una fase
relativa rispetto a quella del campo (che può essere in anticipo o in ritardo)
e questa fase relativa è determinata dalla fase della conducibilità intesa come
grandezza complessa.
Inoltre si sa che:
q
σ̃ = σ1 + iσ2 −→ |σ̃| = (σ1D )2 + (σ2D )2 = ωp2 τ
si vede quindi che il modulo della conducibilità ottica di Drude è una costante.
Inoltre si vede che:
σ2
σD
tan φσ =
−→ 2D = ωτ
σ1
σ1
facendo i limiti della tangente si trovano i limiti della fase cioè:
1
= Γ limite dissipativo
τ
1
lim tan φσ = ∞ ⇒ ω = Γ limite induttivo
ω→∞
τ
lim tan φσ = 0 ⇒ ω <
ω→0
(4.91)
il primo limite significa che in continua la corrente è in fase col campo: per
frequenze basse cioè per ω < τ1 il metallo si comporta come un resistore (la
parte dissipativa è preponderante).
Per il secondo limite si ha che φσ = π/2 cioè a frequenze molto alte ω τ1 = Γ
la corrente che oscilla nel circuito è ortogonale al campo elettrico. Quando un
circuito ha una corrente sfasata di π/2 in anticipo rispetto al campo si ha un
circuito induttore, e questo implica nessuna dissipazione.
Ecco spiegato come mai σ1 e σ2 si chiamano parte induttiva e parte resistiva:
perché i nomi sono legati a quest’analisi di tipo circuitale.
L’origine microscopica di ciò è la seguente: τ è il tempo fra due urti e si sa che
la pulsazione è ω = 2πν = 2π
T e questo significa che:
1
• nel limite induttivo 2π
T τ ⇒ τ T cioè il tempo tra due urti è molto
più grande del periodo di oscillazione del CEM, quindi il CEM oscilla
molte volte prima che l’elettrone scatteri, e questo significa considerare
l’elettrone come libero, quindi non c’è dissipazione;
• nel limite dissipativo il campo non riesce ad oscillare nemmeno una volta
mentre l’elettrone ha già subito molti urti e quindi l’effetto del CEM è
ridotto dal punto di vista dell’accelerazione che può generare sulle cariche.
In figura 25 si vedono le parti reale e immaginaria degli indici di rifrazione di un
sistema a elettroni liberi. Ricordando la formula (4.70): prima della frequenza
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
87
Figura 25: Dipendenza spettrale di n e κ per un sistema a elettroni liberi. Le
regioni III e IV sono caratterizzate rispettivamente da alta riflettività (R) e
trasmittività (T).
di plasma dove la riflettività è alta e il sistema si comporta come un metallo, n
diminuisce vicino alla frequenza di plasma ed esplode per basse frequenze, che
significa altissima riflettività. La parte immaginaria è legata a σ1 cioè alla parte
dissipativa del materiale dove una alta riflettività è dovuta alla combinazione di
n e κ entrambi alti. Al di sopra della frequenza di plasma l’unica quantità che
sopravvive è n e il materiale si comporta come se non ci fosse dissipazione, cioè
come se si avesse un materiale isolante.
Possiamo vedere in figura 26 la funzione dielettrica (relazioni 4.73) cioè 1 e
2 . La prima è una quantità grande e negativa e tende a divergere per ω →
0 mentre la seconda è definita positiva. Il campo all’interno di un metallo,
come si sa, è nullo a causa delle cariche libere che schermano il materiale dal
campo esterno disponendosi sulla superficie del conduttore. La 1 negativa
rappresenta proprio questo: lo screening indotto delle cariche libere all’interno
di un materiale metallico. Pensate a quando entrate in ascensore e non avete
campo sul cellulare: le pareti metalliche dell’ascensore schermano il campo nei
GHz delle frequenze telefoniche. Il campo interno che si crea in un metallo
è uguale e opposto al campo esterno che l’ha indotto portando ad un campo
totale nullo. Quindi 1 negativa grande significa proprio schermatura quasi
perfetta dal campo elettrico esterno ed è una caratteristica tipica dei sistemi
con elettroni liberi. Questa caratteristica si annulla alla frequenza di plasma,
in cui il sistema perde la caratteristica metallica (gli elettroni non riescono più
a seguire il campo forzante) e in pratica il metallo diventa un dielettrico. Le
relazione della funzione dielettrica in funzione della conducibilità sono:
σ2D (ω)
ω
D
σ
(ω)
1
D
2 (ω) =
ω
D
1 (ω) = 1 −
(4.92)
(4.93)
Un dielettrico rimane sempre un dielettrico a prescindere dalla frequenza mentre
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
88
Figura 26: Dipendenza spettrale di 1 e 2 per un sistema metallico a elettroni
liberi. Si noti la differenza di scala fra la parte positiva e negativa dell’asse delle
ordinate: 1 è sempre più grande di 2 tranne che per ω → 0.
un metallo diventa un dielettrico una volta superata la frequenza di plasma. Dal
punto di vista del comportamento forzante del campo esterno la frequenza di
plasma è legata all’inerzia, cioè alla massa delle particelle che devono oscillare
per seguire il campo: a parità di numero di elettroni è la massa a fare la differenza
sul valore della frequenza di plasma. Se gli elettroni fossero leggeri la ωp si
sposterebbe a frequenze sempre più alte in quanto questi riuscirebbero così a
seguire il campo forzante.
In un metallo standard il numero di elettroni è sempre 1022 -1023 , quello che
cambia un po’ è la massa. Esistono dei materiali chiamati heavy fermions che
sono materiali metallici basati su uranici o terre rare (atomi con elettroni in
orbitali di tipo f), e in questo caso gli elettroni di conduzione sono così pesanti
che la loro massa relativa rispetto a quella dell’elettrone libero è 200-300 volte
maggiore con un numero di portatori standard, ma a causa della massa degli
elettroni hanno frequenza di plasma bassissima (queste cose sono fisica della
materia condensata trattata negli anni 80’).
4.2.3
Transizioni interbanda e intrabanda e processo sperimentale
Prima di riprendere la teoria della sezione d’urto e della matrice di scattering
per luce visibile, così come è stato fatto per i neutroni termici si vuole discutere
il collegamento fra le proprietà ottiche e la teoria a bande.
Com’è noto, in fisica dello stato solido i materiali sono descritti in termini di
bande elettroniche, che sono generate dalla sovrapposizione coerente degli orbitali semipieni in cui gli elettroni si trovano a partire dagli atomi componenti
il metallo. Ad esempio le bande elettroniche più esterne dell’oro sono ottenibili dalla ibridizzazione degli orbitali 4s. Se si pensa (ed è vero) che tutte le
proprietà di un sistema siano relative alle bande più esterne (vuote, piene o
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
89
Figura 27: Bande di un metallo: banda di conduzione (semipiena) fino all’energia di Fermi EF da cui si possono avere transizioni alla banda vuota superiore
(transizioni interbanda) o transizioni al di sopra dell’energia di Fermi ma nella
banda semipiena stessa (transizioni intrabanda).
semipiene), un metallo è caratterizzato da una banda semipiena, e di sopra ci
sarà almeno una banda vuota. La banda semipiena significa che si hanno tutti
gli elettroni a temperatura nulla che riempiono questa banda fino all’energia di
fermi EF (figura 27). Quando si parla di transizioni nel modello di Drude, ovvero di elettroni che si muovono liberi sollecitati dal CEM, considerando le bande
elettroniche si sta parlando, di transizioni intrabanda, cioè transizioni diagonali
all’interno della stessa banda in cui gli elettroni passano da valori di energia
appena sotto EF ad appena sopra. Se invece si fornisce un’energia sufficiente
si può portare un elettrone dalla banda semipiena alla banda vuota superiore
tramite una transizione verticale chiamata transizione interbanda.
Si può dire che le transizioni intrabanda rappresentano ciò che avviene nell’ambito del modello di Drude e quindi prima della frequenza di plasma, mentre le
transizioni interbanda rappresentano ciò che avviene dopo la frequenza di Plasma, fuori dalla validità del modello di Drude.
In figura 28 si vede, guardando l’argento, al di sotto della lunghezza d’onda
corrispondente alla frequenza di plasma, che la riflettività risale per effetto proprio delle transizioni interbanda, cioè gli elettroni sono in grado di salire alla
banda vuota superiore e riflettere frequenze più alte (la riflettività può arrivare
anche al 20-30 %.)
Se si potesse trasformare il metallo in un isolante eliminando tutti gli elettroni
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
90
Figura 28: Riflettività di oro argento e alluminio in funzione della lunghezza
d’onda.
liberi, ci si troverebbe solo con le transizioni interbanda tra la banda semipiena e
quella vuota e non si avrebbe la parte di riflettività massima prima della frequenza di plasma che è legata alle transizioni all’interno della stessa banda. In realtà
esistono molti materiali, specialmente gli ossidi dei metalli di transizione (esempio Ossido di Vanadio V O2 , V2 O3 ), che sono interessanti perché cambiando una
variabile termodinamica come temperatura o pressione esterna subiscono una
transizione di fase isolante-metallo o viceversa. Il V O2 , scoperto negli anni 50’,
ha già delle applicazioni industriali: esso a temperatura ambiente è un isolante,
aumentando la temperatura al di sopra di 340 K diventa un metallo. In gergo
tecnico questo tipo di materiali vengono definiti termocromici e sono usati per
sensori e telecamere infrarosse, anche a scopo militare, perché ingegnerizzando
opportunamente la temperatura di transizione permette di visualizzare fonti di
calore. Un’altra interessante applicazione permette di ottenere vetri in cui viene
fatta scorrere corrente e che quindi si scaldano per effetto Joule e che tendono
a oscurarsi quando la corrente supera un certo valore.
Come detto, sperimentalmente si è in grado di misurare solo la riflettività, ma
si vogliono ottenere informazioni microscopiche ottiche ed elettrodinamiche sul
materiale che si sta studiando. Vogliamo vedere la procedura sperimentale per
determinare alcune caratteristiche in un problema che sembra mal posto. Se si
ha un metallo si può supporre che esso segua il modello di Drude: i valori di n e
κ sono determinati solo dai parametri ωp e Γ che possono essere estratti fittando il valore della riflettività R misurata e ricostruire quindi qualunque funzione
microscopica. Per fare un fit però è essenziale che il modello usato funzioni: l’estrazione di ωp e Γ è fortemente dipendente dal modello usato. Se si vuole usare
un procedimento che sia model-indipendent si usa il seguente procedimento. La
riflettività R si può scrivere come:
R(ω) = r(ω) · r∗ (ω) = |ρ2 (ω)||eiθ(ω) |
(4.94)
dove r(ω) è detto coefficiente di Fresnel di riflessione che abbiamo scritto in
forma complessa. Dato che R(ω) è dato dal rapporto fra l’intensità del campo
riflesso e l’intensità del campo incidente, per definizione r(ω) è dato dal rapporto
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
91
fra il campo elettrico riflesso e quello incidente:
r(ω) =
˜ (ω)
Ē
|ĒR | iφR
R
=
e
Ē0
|Ē0 |
(4.95)
Nella maggior parte dei casi, nelle misure ottiche, si misura l’intensità, non il
campo. Misurando l’intensità, cioè i moduli quadri del campo elettrico si perde
l’informazione sulla fase, quindi se si fosse in grado di misurare r(ω) in termini
del suo modulo e della sua fase si potrebbero ricavare immediatamente n e κ
dalla relazione:
n − 1 + iκ
(4.96)
r(ω) = ρ(ω)eiθ(ω) =
n + 1 + iκ
però misurare i campi in fase e ampiezza è qualcosa di molto difficile, come detto
in generale si misurano le intensità.
Tuttavia ρ(ω) e θ(ω) ovvero il modulo e l’angolo di fase sono legate da relazioni
di causa-effetto note come relazioni di dispersione di Kramers-Kronig:
Z
2Γω ∞ ln ρ(ω 0 )dω 0
(4.97)
θ(ω) = −
π 0 (ω 0 )2 − ω 2
Matematicamente è tutto ben posto ma in realtà fisicamente si presenta un problema: la misura di riflettività si è in grado di farla non fino a valori infiniti
di frequenza, bensì in una regione finita ed anche piuttosto limitata, cioè dal
lontano IR al vicino UV (ben che vada). E’ quindi importante anche in questo
caso il modello per l’estrapolazione dei valori sperimentali di riflettività per capire come essa si comporta quando ω → 0 e ω → ∞. La finitezza della misura
influenza il grado di approssimazione con cui si è in grado di calcolare il precedente integrale e quindi l’errore che si commette nel trovare θ. Questo metodo
quindi non è completamente model-indipendent, bensì è un compromesso fra un
modello per la riflettività di un materiale e la capacità di fare misure in una
regione più o meno estesa di frequenze.
4.2.4
Interazione con un gas di elettroni liberi
Fin’ora abbiamo considerato un approccio fenomenologico, ma abbiamo perso
il contatto con l’apparato matematico, cioè la funzione di scattering e la sezione
d’urto, che è stato usato per lo scattering da neutroni termici e che vogliamo
ora riprendere.
Possiamo modellizzare un solido, in particolare un metallo come un gas di elettroni liberi all’interno di un reticolo di ioni. Il modello di Drude ci ha permesso
di ricavare la permittività di un gas di elettroni liberi così come il modello di
Lorentz ci consentirà di ricavare la permittività di un reticolo ionico. Unendo
le due trattazioni potremo analizzare la risposta alla radiazione da parte di un
metallo.
Vogliamo ora mostrare che considerando l’interazione fra la radiazione elettromagnetica e un gas di elettroni liberi si può ottenere l’espressione della conducibilità ottenuta tramite il modello di Drude. Nel prossimo paragrafo verrà
aggiunta l’interazione con un reticolo di ioni.
Riscriviamo il termine dell’hamiltoniana per l’interazione radiazione-materia:
Z
1
¯ t) · Ā(r̄, t)
Ĥint = −
dr̄J(r̄,
c
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
92
dove Ā è il potenziale vettore che descrive il CEM e J¯ è la densità di corrente
microscopica che si genera per effetto del campo e che si scrive, in gauge di
Coulomb:
X
¯ t) = − e
J(r̄,
p̄i δ(r̄ − r̄i (t))
(4.98)
m i
L’hamiltoniana di interazione è fattorizzata al primo ordine in un elemento che
dipende dal campo (il probe) per uno che dipende dalla corrente (il target) e
quindi si può applicare il teorema della risposta lineare. Normalmente un esperimento ottico viene fatto, come mostrato in figura 20, prelevando la radiazione
riflessa ad un angolo θ uguale a quello di incidenza in condizioni di incidenza
quasi-normale θ < 10◦ .
In una trattazione quantistica si mandano un certo numero di fotoni n ad energia
~ω e se ne prelevano con un detector un certo numero n0 alla stessa frequenza.
Nel caso dei neutroni termici quando è stata calcolata la probabilità di transizione e quindi la sezione d’urto, si è calcolata la ∂ Ṗ /∂Ω∂ω, cioè una doppia
derivata dovuta all’ipotesi che il probe, dopo l’interazione col target andasse in
vari possibili stati finali caratterizzati da vettori finali compresi in Ω e Ω + dΩ
ed energie possibili comprese fra ω e ω + dω. Si è partiti da una probabilità di
transizione Ṗ (q̄, ω) e si sono considerati tutti i processi in cui il probe era distribuito nello spazio con una certa densità finale di stati e con frequenze diverse,
in pratica si aveva la configurazione mostrata in figura 10.
Ora, se la configurazione dell’esperimento è quella della figura 20, l’angolo di
ricezione rimane fisso, e quindi in questo caso non serve la probabilità di transizione doppio differenziale bensì la probabilità di transizione per un angolo e
una frequenza fissati. L’espressione è la seguente:
Z
Z
X
Ṗ (q̄, ω) = |Ā|2 dteiωt dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 )
α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i
αβ
(4.99)
dove la funzione di correlazione è quella corrente-corrente.
Il potenziale vettore si scrive come in (4.32) quindi il prodotto scalare Ā · J¯ si
riconduce al prodotto scalare del vettore di polarizzazione della luce per la cor¯
rente microscopica ¯ · J.
L’obiettivo di questo conto è di far vedere, usando il campo elettrico al posto
del potenziale vettore, qual è il limite di quest’espressione microscopica quando
si usa il modello di Drude, cioè sotto quali condizioni la funzione di correlazione
corrente-corrente si riconduce al modello di Drude ovvero, detto in altra maniera, far vedere a quale funzione di correlazione equivale il modello di Drude.
Sapendo che il campo si scrive come Ē(r̄, t) = − 1c ∂∂tĀ si può scrivere:
Ṗ (q̄, ω) = −
c2
|Ē|2
ω2
Z
dteiωt
Z
dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 )
X
α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i
αβ
(4.100)
Questo significa che l’elemento di matrice del potenziale vettore è semplicemente
proporzionale all’elemento di matrice del campo elettrico. Questa probabilità
di transizione descrive il sistema in cui il fotone arriva, viene assorbito, e il
target transisce in uno stato proprio. In termini di bande il fotone arriva,
viene assorbito, e un elettrone della banda semipiena passa in uno stato vuoto
a più alta energia all’interno della stessa banda (transizione intrabanda). Si
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
93
ricorda che la Ṗ ha dimensione [t−1 ], allora la potenza dissipata dal campo
elettromagnetico è definita come:
Z
Z
X
~c2
W = ~ω Ṗ = −
|Ē|2 dteiωt dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 )
α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i
ω
αβ
(4.101)
che è l’energia nell’unità di tempo che il CEM perde a favore degli elettroni
di target che transiscono intrabanda. La 1◦ legge microscopica di Ohm dice
che la potenza dissipata dal campo in un conduttore è pari alla parte reale
della conducibilità per il modulo quadro del campo elettrico cioè W = σ1 · |Ē|2 .
Uguagliandola alla precedente si ottiene, semplificando il campo:
Z
Z
X
~c2
iωt
dte
dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 )
α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i (4.102)
σ1 = −
ω
αβ
cioè la parte reale della conducibilità ottica è legata alla trasformata di Fourier
spazio-temporale della funzione di correlazione corrente-corrente.
Per capire il senso di questa espressione si considera un gas di elettroni all’equilibrio termodinamico, in assenza di perturbazione e di corrente elettrica. Si
manda un campo in continua (ma lo stesso vale per un campo in alternata), cioè
un certo numero di fotoni alla frequenza ω che vengono assorbiti. Si generano
nel materiale delle transizioni elettromagnetiche all’interno della stessa banda
e quindi nasce una corrente elettrica per effetto di questo campo. La corrente
¯ 0̄, 0), e questa si propaga
nel momento iniziale, in cui essa si "accende", è J(
nel materiale. Per effetto degli urti tuttavia essa avrà una vita media finita,
cioè se non la si continua a sollecitare con un campo esterno essa si "spegne".
Il significato della funzione di correlazione sta proprio qui: essa descrive come
sono correlati i valori della corrente in (0̄, 0) con quello in (r̄, t). Se la corrente
continuasse a propagarsi a qualunque r̄ e per ogni tempo t, dividendo la fun¯ 0̄, 0) si avrebbe una corrente che non si annulla mai.
zione di correlazione per J(
Purtroppo i fenomeni di urto la fanno decadere e la funzione di correlazione assume il significato precedentemente descritto. La conducibilità ottica in questo
senso è una misura nello spazio reciproco di come la corrente si correla a tempi
e spazi diversi rispetto a quella generata a tempo e spazio iniziali.
Usando l’espressione della TdF per la corrente, passando così dallo spazio reale
a quello reciproco si ha:
Z
α
¯
(4.103)
J (q̄, t) = dr̄1 e−iq̄ · r̄1 J¯α (r̄1 , t)
Z
J¯β (q̄, 0) = dr̄2 e−iq̄ · r̄2 J¯β (r̄2 , 0)
(4.104)
allora si può scrivere la funzione di correlazione nello spazio reciproco come:
X
hJ¯α (q̄, t)J¯β (q̄, 0)i =
α ∗β hJ¯α J¯β i = hJ T (q̄, t)J T (q̄, 0)i
(4.105)
αβ
la sommatoria è sul prodotto scalare della polarizzazione della luce per la corrente microscopica e poichè la luce è polarizzata trasversalmente, cioè i campi
oscillano in un piano ortogonale alla direzione di propagazione, allora il prodotto scalare seleziona la componente trasversa della corrente, ed ecco spiegata la
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
94
scrittura della corrente con gli apici J T .
Si suppone che gli stati degli elettroni liberi che si stanno considerando siano
definiti da onde di Bloch caratterizzate dal vettore d’onda, quindi |ki i rappresenta lo stato iniziale e |kf i lo stato finale. La funzione di correlazione, per
definizione, si scrive come:
X
hJ T (q̄, t)J T (q̄, 0)i =
ρk̄i (T ) hki | J T (q̄, t)J T (q̄, 0) |ki i
(4.106)
k̄i
cioè la somma sugli stati iniziali del valore di aspettazione del prodotto delle
correnti microscopiche a tempi diversi con la popolazione degli stati iniziali
ad una certa temperatura; dove ρk̄i (T ) è la popolazione termica degli stati
caratterizzati da vettore d’onda k¯i , e questa quantità, avendo a che fare con
degli elettroni è la distribuzione di Fermi-Dirac 1/(eβ(Eki −EF ) + 1). Questa
distribuzione come si sa afferma in sostanza che lo stato di energia Ek̄i è occupato
al massimo da due elettroni di spin opposto.
Quindi si può scrivere la conducibilità reale nello spazio reciproco come:
Z
X
~c2
(4.107)
dteiωt
ρk̄i (T ) hki | J T (q̄, t)J T (q̄, 0) |ki i
σ1 (q̄, ω) =
ω
k̄i
Si suppone ora, per semplicità, di stare a temperatura T=0 e quindi ρk̄i (0) = 1,
e per ottenere l’approssimazione di Drude si inserisce la relazione
di chiusura
P
dello stato finale caratterizzato dal vettore d’onda |kf i cioè kf |kf i hkf | = 1.
Si può scrivere quindi la relazione, equivalente alla precedente:
Z
X
~c2
σ1 (q̄, ω) =
dteiωt
hki | J T (q̄, t) |kf i hkf | J T (q̄, 0) |ki i
(4.108)
ω
k̄i ,k̄f
Considerando l’espressione della corrente (4.98) e la sua TdF, e usando le proprietà della funzione delta si può scrivere che:
X
¯ t) = − e
J(q̄,
p̄i e−iq̄ · r̄i (t)
(4.109)
m i
X
¯ 0) = − e
J(q̄,
p̄i e−iq̄ · r̄i (0)
(4.110)
m i
Fin’ora non sono state fatte approssimazioni di alcun tipo eccetto il fatto di
considerare la temperatura nulla. Si fa ora l’approssimazione di dipolo
elettrico cioè si considera che la lunghezza d’onda del CEM sia estremamente
più grande delle dimensioni dell’oggetto che sta assorbendo. Se si considera
assorbimento di radiazione nell IR, o nel visibile, o anche nel UV, le lunghezze
d’onda di radiazione sono estremamente più grandi rispetto alle dimensioni degli
atomi che assorbono (qualche Å) che sono normalmente dell’ordine del raggio
di Bohr ρ0 . Quindi se q̄ = 2π
λ , e se r̄i è la coordinata dell’elettrone che sta
assorbendo rispetto al suo nucleo atomico che posso stimare con il raggio di
Bohr ρ0 , allora
e−iq̄ · r̄i (t) ' e−iq̄ · ρ0 ∼ 1
e posso trascurare il termine in vettore d’onda.
Questo significa che non vi è variazione spaziale del CEM (comandata dalla sua
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
95
lunghezza d’onda) rispetto alla dimensione dell’oggetto che assorbe, cioè il campo si può considerare uniforme sulle dimensioni spaziali degli atomi assorbenti.
In realtà in maniera formale si può dimostrare che l’elemento di matrice dell’impulso è equivalente all’elemento di matrice del dipolo (da cui il nome dell’approssimazione).
Nel nostro caso si parla della capacità di un elettrone libero di assorbire radiazione: la lunghezza caratteristica, che nel nostro caso va confrontata con la
lunghezza d’onda, è il cammino libero medio l = vF τ dove vF è la velocità
di Fermi mentre τ è il noto tempo medio fra due urti. Questa quantità in un
metallo ultra puro, per quelli che vengono chiamati elettroni balistici può anche arrivare ad 1 mm, ma normalmente in un metallo qualsiasi a temperatura
ambiente è dell’ordine dei 10 − 100 Å. Per questo la conducibilità ottica diventa
indipendente dal vettore d’onda e rimane la dipendenza dalla frequenza mentre
sparisce la componente spaziale del campo.
Si usano le definizioni di corrente (4.109-110) e si può scrivere:
Z
X
e2 ~c2
dt eiωt
hki | p̄i (t) |kf i hkf | p̄i (0) |ki i
(4.111)
σ1 (ω) = 2
m ω
i,ki ,kf
e a questo punto si fa una nuova approssimazione, cioè che l’impulso del i-esimo
elettrone al tempo t lo si possa scrivere come
t
p̄i (t) = p̄i (0)e− τ
Si è fatta qui un’ipotesi su come l’impulso dell’elettrone eccitato dal campo
dipenda dal tempo, cioè che decada in maniera esponenziale. Quest’ipotesi
come vedremo corrisponde all’approssimazione di Drude, cioè l’andamento
in frequenza ricavato nel modello di Drude in tutt’altro modo viene qui fuori da
un’ipotesi sull’andamento esponenziale della funzione di correlazione attraverso
gli impulsi degli elettroni che generano la corrente. Quindi si può scrivere:
Z
X
t
e2 ~c2
σ1 (ω) = 2
dt eiωt
hki | p̄i (0) |kf i hkf | p̄i (0) |ki i e− τ
(4.112)
m ω
i,ki ,kf
inoltre si può dimostrare che vale la relazione:
N=
X
i,ki ,kf
~c2
| hkf | p̄i |ki i |2
mω
(4.113)
che è il numero totale N di elettroni, che inserita nella (4.112) porta a scrivere:
Z
t
N e2
σ1 (ω) =
dt eiωt e− τ
(4.114)
m
|
{z
}
1
1−iωτ
L’integrale evidenziato è noto ed è pari alla funzione scritta sotto di esso. Il
risultato finale è quindi:
2
Ne
1
σ1 (ω) = Re
(4.115)
m 1 − iωτ
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
96
si considera la parte reale visto che si stavano trattando grandezze complesse,
cioè si è risolto un integrale di grandezze oscillanti complesse. Questa parte
reale è pari a:
N e2
1
(4.116)
σ1 (ω) =
m 1 + (ωτ )2
σdc
che nel modello di Drude abbiamo scritto come σ1D (ω) = 1+(ωτ
)2 .
La dipendenza in frequenza della conducibilità ottica ricavata a partire dalla ma1
trice di scattering è esattamente quella di Drude, ovvero 1+(ωτ
)2 è esattamente
l’immagine di Fourier di una funzione di correlazione che decade esponenzialmente nel tempo. Il modello di Drude (che è completamente classico), equivale
dal punto di vista della funzione di correlazione corrente-corrente (che è quella
che entra nella definizione di conducibilità) a supporre che la corrente generata
da un impulso elettromagnetico, sia una funzione che decade esponenzialmente
− τt
¯ = J(0)e
¯
. Questo significa, ed è vero anche applicando un
nel tempo: J(t)
campo in continua, che se abbiamo un gas di elettroni questi accelerano per
effetto del campo con quella che viene chiamata velocità di drift diretta parallelamente al campo. Questa velocità implica la corrente che, una volta spento
il campo, decade secondo Drude nel modo che abbiamo visto.
Questo modello è semplice ma importante in quanto rappresenta un ulteriore
esempio di come funzionino le funzioni di correlazione nello spazio dei tempi:
dato che le misure avvengono nello spazio reciproco anche le funzioni di correlazione sono di conseguenza misurate nello spazio reciproco, e si vuole sapere
però come vanno nello spazio dei tempi come in questo caso in cui si conosce
il decadimento esponenziale. Le funzioni di correlazione comandate dagli urti presentano solitamente decadimenti esponenziali. La situazione è quella di
elettroni che si muovono disordinatamente e a cui viene imposto un ordine temporaneo: la corrente. Il tempo che il disordine impiega a "vincere" sull’ordine è
esattamente il decadimento temporale della corrente. Sapendo che τ ∼ 10−12 10−15 s basta considerare tempi più lunghi del ps per non vedere gli effetti della
corrente.
4.2.5
Interazione con un reticolo di ioni e Modello di Lorentz
Dato un metallo abbiamo visto lo scattering di elettroni. Tuttavia anche gli
ioni, fissi in prima approssimazione, hanno i loro gradi di libertà che sono quelli
dati dai modi normali di vibrazione.
Facendo interagire il CEM con un metallo, scegliendo opportunamente la frequenza è possibile misurare i modi vibrazionali degli ioni e non solo la risposta
elettronica. Se invece di un metallo poi si ha un isolante, non si hanno cariche
libere e di conseguenza è assente la risposta "tipo Drude" del metallo, e il CEM
può interagire con i gradi di libertà vibrazionali o con le transizioni interbanda
come accennato precedentemente.
Riferendoci ora solo ai modi normali di vibrazione, l’equivalente semiclassico
per gli ioni del modello di Drude è il modello di Lorentz.
Questo modello si basa sull’equazione semiclassica che descrive l’interazione dello ione contraddistinto dalla coordinata r̄i (t) in grado di interagire col campo
Ē(t):
e
d2 r̄i (t) 1 dr̄i (t)
+
+ ω02 r̄i (t) = − Ē(t)
(4.117)
2
dt
τ dt
m
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
97
che è semplicemente l’equazione di un oscillatore armonico forzato che è uguale
a quella del modello di Drude a parte il termine in più ω02 r̄i (t) che significa che lo
ione è attratto da un centro di forza rispetto al quale oscilla in maniera forzata
con frequenza ω0 .
Considerando che il campo elettrico è Ē(t) = Ē0 eiωt si può scrivere che in
condizioni stazionarie r̄i (t) = r̄0i eiωt che messa dentro nell’equazione (4.117)
permette di ricavare l’ampiezza di oscillazione r̄0i . Esattamente come fatto per
Drude è possibile quindi ricavare il momento di dipolo, la polarizzabilità e la
funzione dielettrica.
Per la funzione dielettrica questa è pari a:
˜L (ω) = 1 +
1
4πN e2
m (ω02 − ω 2 ) +
iω
τ
(4.118)
con N numero degli ioni di massa m e carica e e questa espressione si riconduce
a quella di Drude per ω0 = 0 (l’apice "L" indica che ora si stanno considerando
grandezze nell’ambito del modello di Lorentz). Da questa si possono ricavare
come si sa le parti reale e immaginaria, l’indice di rifrazione, la conducibilità
ottica ecc ecc. In generale si può immaginare che, dato un cristallo di ioni più
un gas di elettroni liberi (quindi un metallo), la funzione dielettrica più generale
la si possa immaginare come somma di quella di Drude e quella di Lorentz:
˜ = 1 + ˜D + ˜L
L’ipotesi sotto questo risultato è che i gradi di libertà di elettroni e nuclei siano
non interagenti. Se il cristallo è molecolare possono aggiungersi altri gradi di
libertà come quello interno vibrazionale della molecola. Stesso discorso vale per
gradi di libertà magnetici ecc, ovviamente supponendo che valga una generalizzazione del principio adiabatico e cioè che i gradi di libertà non interagiscano
fra di loro. Il conto teorico fatto partendo dalla matrice di scattering da cui si
ricava il modello di Drude semiclassico può essere replicato per i gradi di libertà
vibrazionali.
Nello studio dell’interazione radiazione-materia, abbiamo visto i termini di emissione e assorbimento, e consideriamo ora solo quello di assorbimento, cioè il
termine nell’espressione (4.51) proporzionale a n(ω). Inoltre nello studio della
funzione di correlazione dell’operatore momento di dipolo, abbiamo potuto dividere la correlazione dovuta agli elettroni da quella dovuta ai nuclei con carica
netta Qj 6= 0, che abbiamo precedentemente tralasciato. Consideriamo ora questo termine, che è il secondo addendo nell’espressione (4.56).
Si può scrivere quindi che la probabilità di transizione doppio differenziale per
l’assorbimento di fotoni dovuto ad un sistema di ioni è:
Z
X Qj Qj 0
∂ 2 Ṗ ω
=
n(ω) dt e+iωt ·
∂Ω∂ω ass (2π)2 ~c3 V 0 Mj Mj 0
(4.119)
jj
−iq̄ · R̄j (t) ∗
iq̄ · R̄j 0 (0)
· he
(p̄ (t) · ¯)(p̄ 0 (0) · ¯)e
i
j
j
con gli indici j e j’ che identificano gli ioni interagenti di carica netta e massa
rispettivamente Qj , Mj e Qj 0 , Mj 0 , ed n(ω) che indica il numero di fotoni alla
frequenza ω incidenti sul sistema. Nella funzione di correlazione si trovano i
prodotti scalari dell’impulso degli ioni per la polarizzazione della luce e i soliti
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
98
esponenziali. Questo vale per un sistema ionico, ma non necessariamente per
un cristallo.
Se ora si considera anche un reticolo cristallino si hanno delle semplificazioni
dovute alle proprietà di simmetria. In particolare si può scrivere l’indicizzazione
come fatto per i neutroni:
j → l, χ
dove l è l’indice di cella (macroscopico) e χ è l’indice di posizione dello ione
all’interno della cella e di solito vale pochi Å. La coordinata ionica la si può
scrivere allora come già fatto nel caso dei neutroni come:
R̄j (t) = x̄l + x̄χ + ūlχ (t)
con ūlχ (t) spostamento istantaneo dalla posizione di equilibrio dello ione l, χ.
Posso sostituire questa definizione nella (4.119) e trovare così:
Z
X Qχ Qχ0
ω
∂ 2 Ṗ =
n(ω) dt e+iωt e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) ·
∂Ω∂ω ass (2π)2 ~c3 V 0 Mχ Mχ0
ll
χχ0
· he−iq̄ · ūlχ (t) (p̄∗lχ (t) · ¯)(p̄l0 χ0 (0) · ¯)eiq̄ · ūl0 χ0 (0) i
(4.120)
le semplificazioni che possono essere fatte a questo punto, dovute all’approssimazione di dipolo sono:
• le x̄χ rappresentano le coordinate microscopiche all’interno di una cella e
quindi sono di un ordine di grandezza di qualche Å, mentre per la luce
visibile si hanno lunghezze d’onda λ definite dalla relazione del vettore
d’onda scambiato q̄ = 2π
λ dell’ordine della centinaia di µm e quindi il
prodotto scalare q̄ · (x̄χ − x̄χ0 ) è piccolo perciò si può approssimare
e−iq̄ · (x̄χ −x̄χ0 ) ∼ 1
• si pongono gli esponenziali
e−iq̄ · ūlχ (t) ∼ 1
e−iq̄ · ūl0 χ0 (0) ∼ 1
per lo stesso motivo precedente.
Fatte queste semplificazioni si può quindi scrivere:
Z
∂ 2 Ṗ ωn(ω) X Qχ Qχ0
=
dt e+iωt e−iq̄ · (x̄l −x̄l0 ) h(p̄∗lχ (t) · ¯)(p̄l0 χ0 (0) · ¯)i
∂Ω∂ω ass
(2π)2 ~c3 V 0 Mχ Mχ0
ll
χχ0
(4.121)
per concludere il conto si vuole vedere che tipo di risultati da la funzione di
correlazione così modificata.
L’impulso di uno ione al tempo t è dato da:
p̄lχ (t) = Mχ ū˙ lχ (t)
(4.122)
e si sa che la posizione ūlχ (t) a meno delle costanti è proporzionale agli operatori
di creazione e distruzione fononici cioè
ūlχ (t) ∝ [ak̄j (t) + a†k̄ (t)]
j
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
99
dove
ak̄j (t) = ak̄j e
a†k̄ (t) = a†k̄ e
j
−iωk̄j t
+iωk̄j t
j
quindi dato che in funzione di correlazione si hanno i prodotti degli impulsi i
quali a loro volta sono combinazioni lineari degli operatori a e a† si ottengono i
soliti 4 termini
haa + a† a + aa† + a† a† i
dove l’unica cosa che cambia rispetto al caso già trattato è che qui si considera
la derivata temporale ū˙ (quindi ci saranno i fattori dovuti alla derivata degli
esponenziali nelle definizioni degli operatori).
Dei 4 addendi come già detto sopravvivono solo quelli con operatori misti (il
secondo e il terzo) relativi ad emissione ed assorbimento di un fonone.
Se consideriamo l’assorbimento di fotoni si ha solo il termine di l’emissione fononica e quindi la funzione di correlazione che si considera è quella dovuta al
termine ha† ai. Questo perchè la conservazione dell’energia suggerisce che l’unico
processo con un senso fisico è quello in cui l’energia del fotone assorbito viene
convertita in un quanto di popolazione fononica.
Per cui la probabilità di assorbimento doppio differenziale descrive l’assorbimento di un fotone da parte di un reticolo di ioni e la conseguente creazione di un
fonone all’interno del cristallo:
X X ¯ · ē(q̄j , χ)Qχ 2 ~ωq̄j
ω
∂ 2 Ṗ p
=
n(ω)
(nq̄j + 1)δ(ω − ωq̄j )
2
3
∂Ω∂ω ass
(2π) ~c V
2
Mχ
χ
j
(4.123)
Riassumendo si può scrivere che la probabilità di assorbimento è proporzionale al numero di fotoni inviati contro il sistema, la somma su tutte le branche
fononiche, la delta che da la conservazione dell’energia (processo possibile se la
pulsazione del fotone coincide con l’energia del modo normale di vibrazione in
cui si crea un fonone), la distribuzione di Bose-Einstein nq̄j + 1 che mi dice appunto che è aumentata di una unità la popolazione fononica relativa alla branca
j. Quello che cambia rispetto ai neutroni è la parte relativa al modulo quadro
dell’elemento di matrice di transizione: in questo caso si ha il prodotto scalare
della polarizzazione dell’onda elettromagnetica ¯ per la polarizzazione del modo
normale di vibrazione ē.
I passaggi fisici che avvengono sono i seguenti: il fotone arriva sul campione,
viene assorbito, viene creata un’onda normale di vibrazione nel cristallo (cioè
aumenta di 1 la popolazione fononica della branca j), essa si propaga lungo q̄
con polarizzazione longitudinale o trasversa a seconda di ē.
Il prodotto scalare quindi seleziona solo i modi normali trasversi ottici.
Nel caso dei neutroni invece si aveva q̄ · ē. In questo caso la luce è trasversa, cioè
il CEM oscilla trasversalmente rispetto alla direzione di propagazione, e questo
impedisce al modo di vibrazione che si propaga nella stessa direzione del fotone
di oscillare longitudinalmente: questa rappresenta la regola di selezione dello scattering da campo elettromagnetico.
Se il cristallo non è ionico ma neutro gli atomi non possono assorbire radiazione, cioè per avere assorbimento ci deve essere una carica netta diversa da zero.
Puntualizziamo qui che quando si è parlato dei modi normali di vibrazione, in
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
100
Tabella 3: Schema dei modi osservabili a piccolo vettore d’onda con radiazione
elettromagnetica
Modi acustici
Modi ottici
trasversi
longitudinali
NO
SI
NO
NO
particolare dei modi ottici, non si deve confondere il nome "ottico" col fatto che
ci sia assorbimento di CEM. Un cristallo con almeno due atomi per cella presenta modi ottici ma questo significa solo che avrà dei modi con una peculiare
legge di dispersione e non che c’è effettivamente assorbimento ottico. Il silicio ad
esempio ha modi ottici ma non assorbe radiazione elettromagnetica nel lontano
IR perché la carica netta degli atomi è zero.
Ma perché solo i modi ottici? Il diamante è quello che ha i fononi più energetici a circa 100 mV di energia: per questo tipo di energie dato che deve valere
per la luce ~ω = ~ωphon ∼ 100 meV ' 1000 cm−1 il vettore d’onda scambiato corrispondente è |q̄| ∼ 105 cm−1 , mentre il vettore d’onda di Brillouin è
π
8
−1
e questo significa che si sta guardando una piccola parte della
a ∼ 10 cm
prima zona di Brillouin attorno a q̄ = 0. Quindi vengono assorbiti fotoni di piccolo vettore d’onda. Si può dimostrare che i modi acustici con vettore d’onda
piccolo sono costanti, cioè non dipendono dall’atomo.
Ma come si muovono gli atomi all’interno della cella quando sono sottoposti a
un modo normale di vibrazione ottico oppure acustico di piccolo vettore d’onda?
Nel caso degli acustici gli atomi all’interno della cella sono sostanzialmente fermi
e la cella si muove in fase con le celle vicine. Nel caso del modo ottico le celle
non si muovono, e gli atomi all’interno della cella si muovono in controfase fra
loro. Questa è la distinzione fra modi ottici e acustici a piccolo vettore d’onda,
e nel caso in cui si si abbia un acustico il prodotto scalare nel modulo quadro
è indipendente da χ e può essere
fuori
dalla sommatoria, quindi per 2
Q portato
Q2 2
1
√
√
atomi la sommatoria diventa M + M
che per la neutralità elettrica vale
1
2
zero, cioè la carica totale all’interno della cella deve essere conservata e dato
che i due atomi all’interno della cella sono fermi, non c’è un momento di dipolo
netto e quella quantità si annulla.
Per questo i modi acustici trasversi non sono eccitabili dalla radiazione elettromagnetica: non c’è un momento di dipolo netto diverso da zero.
I modi che hanno momento di dipolo netto diverso da zero sono gli ottici dato
che gli atomi all’interno della cella si muovono in controfase fra loro.
E’ possibile riassumere la discussione appena fatta per lo scattering da CEM
nella tabella 3. Si ricorda che invece con i neutroni si può misurare tutto ad ogni
vettore d’onda. Tuttavia l’esperienza di scattering da CEM la si può effettuare
in qualunque laboratorio mentre per lo scattering da neutroni si ha bisogno di
una sorgente di neutroni (un reattore nucleare).
In figura 29 vediamo la riflettività del N d2 CuO4 , un cristallo che drogato opportunamente può diventare un superconduttore ad alta temperatura di transizione, e questo materiale è un isolante. Si può riconoscere il contributo fononico
alla riflettività: se non ci fossero modi normali di vibrazione atti ad assorbire
radiazione, cioè se si avesse un cristallo covalente, la riflettività sarebbe nulla,
ma dato che questo cristallo è ionico si hanno contributi a frequenze abbastanza
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
101
Figura 29: Riflettività del cristallo di N d2 CuO4
ben definite, e quindi il cristallo si comporta come un filtro riflettore a frequenze
specifiche. Ce ne sono 4 a causa della struttura del cristallo. Se dalla riflettività
si usano le relazioni di Kramers-Kronig si trova ciò che è graficato in figura 30:
la parte reale e immaginaria della funzione dielettrica. Si trovano 4 bei picchi di
forma lorentiana che se fittati con il modello di Lorentz darebbero un perfetto
accordo. Questo vuol dire che il modello di Lorentz è abbastanza buono per
descrivere le vibrazioni atomiche all’interno del cristallo così come il modello
di Drude è in grado di descrivere le eccitazioni elettroniche all’interno di un
metallo.
4.2.6
La polarizzabilità
Rifacendosi al solito schema probe-target, dove il probe in questo caso è costituito dal CEM che presenta vettore d’onda, frequenza e polarizzazione iniziali
k̄i , ωi , ¯i prima dell’interazione, e vettore d’onda, frequenza e polarizzazione finali k̄f , ωf , ¯f ; lo scattering da radiazione elettromagnetica può essere diviso in
scattering elastico e anelastico.
Lo scattering elastico è il caso in cui |k̄i | = |k̄f | e ~ωi = ~ωf ed è analogo allo
scattering Bragg nel caso dei neutroni.
Lo scattering anelastico da radiazione elettromagnetica è caratterizzato da |k̄i | =
6
|k̄f | ed è ricco di fenomeni:
- si ha lo scattering Brillouin quando ~ωi ' ~ωf , ovvero quando i fotoni vengono scatterati dalle variazioni di polarizzabilità indotte dai modi
normali di vibrazione nel cristallo, cioè dalle fluttuazioni di densità del
reticolo;
- si ha lo scattering Raman quando ~ωi 6= ~ωf , ovvero quando i fotoni
vengono scatterati dalle variazioni di polarizzabilità indotte dai moti rotovibrazionali delle molecole che compongono il reticolo. Si riconoscono
anche in questo caso i processi Stokes (ωi > ωf ) e i processi anti-Stokes
(ωi < ωf ).
Si chiama scattering Compton quello in cui la radiazione è costituita da raggi x
mentre per avere scattering nucleare (dell’interno dei nuclei) si usano fotoni al
altissima energia detti fotoni γ.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
102
Figura 30: Parte reale e immaginaria della funzione dielttrica ˜(ω) del cristallo
di N d2 CuO4
In ogni caso i fenomeni di assorbimento ed emissione, se esistono, sono di gran
lunga preponderanti rispetto ai fenomeni di scattering. Detto in un altro modo,
il termine al primo ordine dell’hamiltoniana di interazione lineare nel potenziale
vettore H1 (Ā) è molto più grande sia di H1 (Ā2 ) che di H2 (Ā).
Normalmente, fuori dai casi di risonanza, l’effetto del CEM sulla materia è
quello di indurre un dipolo: un campo elettrico dal continuo a frequenze via via
crescenti può distorcere la distribuzione di carica all’interno del target: cariche
di segno opposto subiscono forze di verso opposto dovute al campo e questo
squilibrio di carica genera un dipolo indotto che si può sovrapporre, se esiste,
al dipolo permanente del sistema (che di solito è molto più intenso per i campi
elettrici medi a disposizione di quello indotto).
Normalmente, per fonti elettromagnetiche comuni da laboratorio si hanno 1010 1012 fotoni per unità di frequenza e campi dell’ordine di 1 V /cm, mentre i campi
magnetici sono molto più bassi di quello del pianeta che è di circa mezzo gauss.
L’atomo di idrogeno nel suo stato fondamentale genera un campo magnetico di
circa mezzo tesla cioè circa 105 gauss e un campo elettrico generato dall’elettrone alla distanza del raggio di Bohr di 1 V /Å, quindi campi elettrici e magnetici
della materia sono solitamente molto più grandi di quelli generati dal probe.
Tuttavia esistono sorgenti laser così intense da non far avere spettroscopia lineare bensì non-lineare, con risposte del sistema che vanno studiate ad ordini
superiori della teoria delle perturbazioni.
Dal punto di vista semiclassico, se si ha un campo elettrico associato ad un
segnale luminoso o in continua, e lo si applica ad un sistema condensato chiedendosi quale dipolo si genera per effetto di questo campo, si usa la seguente
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
103
Figura 31: Molecola biatomica orientata lungo x e con origine centrata sul
baricentro della molecola
relazione:
¯ Ē
d¯ = ᾱ
(4.124)
¯ è il tensore polarizzabilità. Questo tensore è una caratteristica del
dove ᾱ
sistema su cui si sta applicando il campo: ad esempio per una molecola biatomica
orientata come in figura 31 esso ha la forma diagonale


αx

¯=
αz
ᾱ
αz
e con αx > αy , αz e αy = αz in quanto la carica è prevalentemente distribuita
lungo x. In sostanza il tensore polarizzabilità descrive quanto il sistema si distorce per effetto del campo ed è al primo ordine indipendente da esso. Quindi si
può dire che la simmetria del sistema influenza fortemente il tensore polarizzabilità: per un sistema triclino (bassa simmetria) si avranno tutte le componenti
del tensore diverse mentre per un cubico (alta simmetria) si avrà un tensore
diagonale a componenti uguali.
Consideriamo ora un oggetto che vibra e ruota: ci si può aspettare che i moti
interni influenzino il tensore polarizzabilità, cioè che esso sia funzione del modo
rotazionale e vibrazionale della molecola. Nel caso della nostra molecola biatomica il moto vibratorio avviene lungo l’asse x ed è quindi unidimensionale, e in
effetti esso modifica la distribuzione di carica. Anche quando la molecola ruota
avvengono modificazioni della distribuzione di carica a causa di effetti centrifughi che portano la distribuzione di carica a gonfiarsi.
In generale il tensore polarizzabilità è funzione sia della frequenza di rotazione che di quella vibrazionale della molecola. Si può scrivere infatti come, nel
caso della molecola biatomica che vibra in maniera armonica e ruota come un
rotatore libero:
¯ ¯ ∂ ᾱ
∂ ᾱ
¯ (ωV , ωR ) = ᾱ
¯0 +
ᾱ
sin ωV t +
sin 2ωR t
(4.125)
∂ R̄ R̄=R̄eq
∂ R̄ R̄=R̄eq
¯ 0 è il tensore polarizzabilità in condizioni di equilibrio (senza vibrazioni e
dove ᾱ
rotazioni) mentre le derivate parziali rispetto alle coordinate delle cariche all’equilibrio indicano rispettivamente l’intensità dei moti rotovibrazionali e infine
il 2 nel seno della frequenza rotazionale è dovuto al fatto che si considera solo
mezzo ciclo di rotazione in quanto la molecola ruotata di 180◦ subisce la stessa
deformazione di quella nella posizione iniziale poichè le lunghezze d’onda del
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
104
campo nel visibile (che sia in continua o in alternata) sono molto molto più
grandi della distanza fra gli atomi (500 nm contro 1 Å) e quindi non vedono la
rotazione.
Supponiamo ora di voler calcolare il momento di dipolo e supponiamo un campo
elettrico monocromatico del tipo Ē = Ē0 sin ωt.
Il momento di dipolo allora è:
¯ Ē = Ē0 sin ωt[ᾱ
¯ 0 + ᾱ
¯ V sin ωV t + ᾱ
¯ R sin 2ωR t]
d¯ = ᾱ
(4.126)
da cui usando le formule di prostaferesi si ottiene:
1
¯ ωV , ωR ) = ᾱ
¯ V [cos(ω − ωV )t + cos(ω + ωV )t] +
¯ Ē sin ωt + Ē0 ᾱ
d(ω,
} 2
| 0 0{z
{z
}
|
1
2
1
¯ R [cos(ω − 2ωR )t + cos(ω + 2ωR )t]
+ Ē0 ᾱ
{z
}
|2
(4.127)
3
quindi il momento di dipolo che si genera come risposta all’applicazione del
campo oscilla secondo 3 termini:
1 termine dovuto alla frequenza del campo esterno ω o della forzante con
¯0;
un’ampiezza determinata da ᾱ
2 termine legato distorsione della carica dovuta alla vibrazione, che si divide
in processi stokes e anti-stokes sono sfasati di 90◦ rispetto al campo (perché
il coseno è sfasato di 90◦ rispetto al seno) ed oscillano a frequenze ω − ωV
e ω + ωV ;
3 termine diviso anch’esso in stokes e anti-stokes, relativo alla distorsione
della carica per rotazione. Le componenti sono sfasate anch’esse in fase di
90◦ , ed oscillano a frequenze ω − 2ωR e ω + 2ωR .
Sempre classicamente, quando si ha un dipolo oscillante nel tempo che esso emette della radiazione con intensità proporzionale al modulo quadro della derivata
seconda del dipolo cioè:
¨¯ 2
I ∝ |d|
(4.128)
e questa si chiama legge di Hertz.
Nel momento in cui il dipolo si crea per effetto del campo esterno, e sono presenti moti propri dell’oggetto che si sta distorcendo, si generano come visto almeno
tre componenti di dipolo che emettono a frequenze distinte. Ovviamente deve
valere che ω > ωV , 2ωR perché siano eccitati dei livelli rotovibrazionali.
Sapendo che le frequenze vibrazionali delle molecole si trovano nel medio IR
(1000 cm−1 ) si devono usare sorgenti laser di frequenza maggiore perché valgano le precedenti relazioni.
Classicamente i pesi dei processi Stokes e anti-Stokes sono uguali, cioè probabilità di emissione e assorbimento sono uguali. A livello quantistico ci si aspetta
che i due processi siano uguali solo se KB T > ~ωV cioè se i livelli vibrazionali
eccitati della molecola sono molto popolati. Ad esempio per la molecola di idrogeno H2 vale che ~ωH2 ' 4000 cm−1 alla temperatura di 300 K (∼ 200 cm−1 )
il primo livello eccitato praticamente è vuoto (si applica la statistica di Boltzmann), cioè tutte le molecole di idrogeno di un gas a temperatura ambiente si
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
105
Figura 32: Livelli energetici rotazionali sovrapposti a quelli vibrazionali per la
molecola di H2 .
trovano nello stato fondamentale. A temperature molto alte il processo antiStokes inizia ad essere rilevante. Quindi tanto è più alta la frequenza che si
vuole rilevare, tanto più vive solo il processo Stokes. Valutando la differenza di
area fra i picchi Stokes e anti-Stokes si possono fare quindi misure di temperatura. Lo stesso discorso vale per i processi rotazionali. Il primo passo verso
la meccanica quantistica si fa considerando le ben note relazioni per l’energia
vibrazionale e rotazionale:
1
EV = ~ωV (v + )
2
ER = BJ(J + 1)
(4.129)
(4.130)
dove v indica il numero quantico vibrazionale, B è la costante rotazionale e J
è numero quantico del livello energetico rotazionale e si può vedere in figura 32
la disposizione di questi livelli.
Facciamo un esempio: si consideri un gas di H2 su cui viene inviata una radiazione di frequenza ω che viene raccolta ad un angolo definito. Facendo uno
scanning in frequenza si trovano un picco in zero che consiste nei fotoni elastici che escono quindi con la stessa energia del campo forzante, e secondo le
scale energetiche i primi fotoni anelastici che si trovano sono quelli dovuti ai
moti rotazionali delle molecole (BH2 ' 40 cm−1 ) e successivamente, molto più
distanti si trovano le righe vibrazionali. L’esperimento con il relativo spettro è
schematizzato in figura 33. Ovviamente le righe anelastiche saranno molteplici:
ad esempio per quelle rotazionali si trova una prima riga a distanza B, una seconda a distanza 2B, una terza a distanza 6B per J = 0, 1, 2 ecc. con pesi che
dipendono quantisticamente dalla popolazione dei diversi livelli. L’idrogeno che
è una molecola biatomica omonucleare non ha spettro di assorbimento, perché?
Perché non ha un dipolo.
Se si prende una molecola biatomica eteronucleare come ad esempio HCl, essa ha un momento di dipolo permanente in quanto la distribuzione di carica è
asimmetrica rispetto al centro di forza e vogliamo far vedere che a seconda che si
considerino i processi di scattering o di assorbimento le frequenze rotazionali si
dispongono in maniera diversa. Per eccitare il primo livello vibrazionale di que-
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
106
Figura 33: Spettro schematico di un gas di H2 .
sta molecola bisogna scegliere una radiazione opportuna tale che la frequenza di
eccitazione sia in risonanza (quindi quasi uguale) alla frequenza caratteristica
del primo livello vibrazionale della molecola cioè ~ωV =1 ' 1000 cm−1 , che è
una frequenza nell’infrarosso. Se però si sceglie un laser nel visibile, ad esempio
nel rosso a 16000 cm−1 , allora non esiste un processo in meccanica quantistica
che possa permettere l’assorbimento del fotone a tale frequenza e quindi questo
fotone sarà scatterato. Esso fornisce comunque la frequenza vibrazionale ma la
differenza con l’assorbimento è che il fotone sopravvive, questo cosa significa in
termini di livelli energetici rotazionali?
Basta vedere le regole di selezione rotazionali: nel caso dell’assorbimento
infatti, visto che il momento angolare totale deve conservarsi e che l’unico momento angolare del fotone è legato solo allo spin che può essere ±1, e dato che
dopo l’assorbimento non si ha nessun fotone deve valere che:
∆Jass = ±1
(4.131)
nel caso dello scattering invece il fotone sopravvive al processo e le regole di
selezione rotazionali cambiano, esse saranno infatti:
∆Jscatt = 0, ±2
(4.132)
infatti in questo caso il fotone può arrivare con spin 1(-1) e uscire con spin 1(-1)
per cui la differenza sarà 0, oppure può arrivare con spin 1(-1) e uscire cone spin
-1(1) e la differenza sarà 2(-2). In questo senso le frequenze rotazionali intorno
alla riga elastica si dispongono diversamente rispetto ai processi di assorbimento.
4.3
Scattering da campo elettromagnetico
Nella sezione interazione radiazione-materia abbiamo visto che trattando il CEM
tramite il potenziale vettore Ā abbiamo considerato due termini della matrice
di scattering entrambi al primo ordine e con dipendenza rispettivamente lineare
e quadratica dal potenziale vettore. Aggiungiamo ora, per la prima volta un
termine al secondo ordine della matrice di scattering con dipendenza lineare da
Ā. Scriviamo qui il termine al primo ordine con dipendenza quadratica e quello
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
al secondo ordine con dipendenza lineare dal potenziale vettore:
Z
1
1 X qi2
2
S1 (Ā2 ) = −
dr̄dt
Ā
(r̄,
t)δ(r̄
−
R̄
(t))
i
~ 2c2 i mi
2
Z
1
1 X qi qj
S2 (Ā) = −
dr̄1 dr̄2 dt1 dt2 ·
~
2c2 i,j mi mj
n
o
· Tb p̄i · Ā(r̄1 , t1 )δ(r̄1 − R̄i (t1 )) p̄j · Ā(r̄2 , t2 )δ(r̄2 − R̄j (t2 ))
107
(4.133)
(4.134)
in particolare il termine (4.134) essendo al secondo ordine contiene un doppio
integrale ma sopratutto l’operatore di ordinamento temporale di Dyson che
ordina i prodotti della particella i-esima con il potenziale vettore secondo tempi
crescenti, il tutto per rispettare il principio di causalità. Ricordiamo che il
potenziale vettore si scrive nel modo seguente:
r
i
2~c2 X ¯k̄j h
i(k̄ · r̄−ωk̄j t)
−i(k̄j · r̄−ωk̄j t)
ak̄j e j
+ a†k̄ e
Ā(r̄, t) =
√
j
V
ωk̄j
k̄j
dove gli elementi importanti sono la polarizzazione della luce ¯ e gli operatori
di creazione e distruzione a† e a.
Quando si tratta il problema della matrice di scattering ciò che si deve calcolare
è l’elemento di matrice Ŝ fra lo stato finale e iniziale hf | Ŝ |ii (si ricorda che Ŝ
applicato allo stato iniziale lo fa evolvere in un set di possibili stati finali che
vengono proiettati su un singolo stato operatoriale).
Consideriamo ora il termine S1 (Ā2 ). Dato che si inserisce il quadrato del potenziale vettore allora la somma degli operatori a† e a diventerà la somma dei
quattro prodotti operatoriali aa, a† a, aa† , a† a† che verranno mediati rispetto a
stati ad un numero definito di fotoni (la sorgente luminosa ha un numero di
fotoni definito). Il primo e l’ultimo di questi prodotti daranno l’assorbimento e
l’emissione a due fotoni, mentre i termini misti daranno lo scattering di fotoni.
Calcoliamo l’elemento di matrice usando la (4.133), considerando al posto della
carica e massa generica qi ed mi la carica e la massa dell’elettrone e ed m:
2
Z
r
1
e 4π~c2
n ∗
1
2
hf | Ŝ (Ā ) |ii = −
¯
¯
dt eiωt ·
f
~ 2mc2 V
ωi ωf i
(4.135)
Z
−iq̄ · r̄
· dr̄ e
htf | δ(r̄ − R̄(t)) |ti i
dove n sono i fotoni che irradiano il campione e gli stati iniziale e finale sono
|ii = |pi i |ti i e |f i = |pf i |tf i cioè i prodotti degli stati iniziale e finale di probe
e target. Ricordando che la probabilità di transizione Ṗi→f si ottiene dal modulo quadro dell’elemento di matrice, facendo il modulo quadro della (4.135)
si avranno 4 termini di polarizzazione e la funzione di correlazione delta-delta
sommata su tutte le particelle (elettroni) che poi sarebbe la funzione di correlazione densità-densità. Quindi questo termine dal punto di vista della risposta,
serve per sondare le fluttuazioni di densità del mezzo che è sottoposto ad irraggiamento luminoso.
Questo ce lo potevamo aspettare in quanto si è partiti da una hamiltoniana
fattorizzata in un prodotto di Ā2 per una delta (che rappresenta la risposta del
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
108
sistema alla sollecitazione da parte del CEM) che non può dare altro che una
risposta sulle fluttuazioni di densità, proprio come si era trovato per i neutroni.
La ragione fisica per cui mandando radiazione elettromagnetica non in risonanza col sistema si hanno fenomeni di scattering più deboli dell’assorbimento e
dell’emissione (mentre se si è in condizione di risonanza i fenomeni di scattering
saranno completamente cancellati dalla matrice al primo ordine lineare in Ā) è
che la funzione di correlazione è la stessa usata per i neutroni cioè la correlazione
densità-densità e lo scattering da luce visibile ha un vettore d’onda iniziale ed
energia caratteristica (confrontato con i neutroni):
~ωiluce ∼ 2 eV
|k̄i |luce ∼ 105 cm−1
~ωineut ∼ 25 meV
|k̄i |neut ∼ 108 cm−1
quindi facendo un esperimento di scattering con la luce nel visibile si vedono
fluttuazioni su scale più grandi rispetto ai neutroni (circa 1000 Å contro distanza dell’ordine di 1 Å per i neutroni), e quindi tutte le fluttuazioni più piccole
vengono mediate. Poi è vero che si possono vedere differenze di energie più
grosse ma questo è dovuto alla relazione fra energia e frequenza della particella
specifica (E = ~2 k 2 /2m per i neutroni e E = ~ω per i fotoni) e questo non fa
una grande differenza rispetto alle fluttuazioni di densità.
Quindi se avvengono fluttuazioni di densità macroscopiche nel mezzo che si sta
studiando siamo in grado di vederle con la luce, altrimenti non si vede nulla. Gli
integrali nelle formule sono ben definiti, ma a livello fisico funzionano a seconda
della regione in q̄ e ω che si è in grado di vedere con la sonda che si sta usando.
E’ possibile mostrare che il termine (4.134) da luogo anch’esso ai fenomeni: assorbimento ed emissione a due fotoni e scattering. Si può mostrare (ma non
viene qui effettuato il conto) che lo si può riscrivere esattamente come viene
scritta la (4.133). I due termini sono equivalenti dal punto di vista dell’intensità.
Si riscrive qui la sezione d’urto doppio differenziale che si ottiene dalla somma
dei termini (4.133) e (4.134) e contiene i fenomeni:
• scattering elastico
• scattering Brillouin (o quasi-elastico)
• scattering Raman:
- rotazionale
- vibrazionale
- fononico
L’espressione della sezione d’urto ottenuta dal termine lineare e quadratico della matrice di scattering a dipendenza rispettivamente quadratica e lineare nel
potenziale vettore è:
ωi ωf3 X α β ∗γ ∗δ
∂σ 2
(q̄, ¯i , ¯f , ω) =
f i f i ·
∂Ω∂ω
2πc4 N
αβ
γδ
·
XZ
dt eiωt
Z
j
j
dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) hααβ
(r̄1 , t)αγδ
(r̄2 , 0)i
0
jj 0
|
{z
Jαβγδ
}
(4.136)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
109
tutta la quantità evidenziata Jαβγδ è chiamata funzione di scattering. Come sappiamo la sezione d’urto doppio differenziale è legata alla probabilità di
transizione doppio differenziale tramite il flusso di particelle del probe.
La precedente scrittura tiene conto di un sistema di N particelle indicizzate da
j e j 0 , c’è il solito integrale temporale, le polarizzazioni del fotone i e f prima
e dopo lo scattering e infine α, β, γ, δ sono le componenti cartesiane.
Inoltre se lo scattering è anelastico la pulsazioni iniziale e finale del fotone ωi
ed ωf sono diverse fra loro. Se il processo è elastico la sezione d’urto allora va
come ω 4 .
L’ultima parte della formula è costituita dalla funzione di correlazione fra polarizzabilità, dove la polarizzabilità si scrive come:
j
j
ααβ
(r̄, t) = Pαβ
δ(r̄ − R̄j (t))
(4.137)
In generale il tensore polarizzabilità si scrive sempre come una parte intrinseca
(la polarizzabilità intrinseca) per una parte baricentrale (la funzione delta), che
poi sarebbe l’espressione del teorema di Born-Oppenheimer. Essa dipende dal
tempo in quanto esistono i moti interni del sistema, che fanno si ad esempio
che una molecola si gonfi e si sgonfi, cioè che cambi la distribuzione di carica
e quindi la capacità di formare un dipolo indotto da un campo esterno. Tanto
più il campo è vicino alla frequenza di risonanza del sistema, tanto più esso è
in grado di forzare la molecola a distorcersi e creare un momento di dipolo.
La polarizzabilità intrinseca si scrive nel modo seguente:
#
"
X hej | dα |ej i hej | dβ |ej i hej | dβ |ej i hej | dα |ej i
j
0
0
0
0
λ
λ
λ
λ
+
(4.138)
Pαβ (t) =
E0 − Eλ − ~ωf
E0 − Eλ − ~ωi
λ
quindi il tensore di polarizzabilità intrinseco è un oggetto che contiene i valori
di aspettazione dell’operatore dipolo tra lo stato fondamentale |e0 i e un possibile stato eccitato elettronico |eλ i del sistema che si sta distorcendo per effetto
del campo esterno. Il tensore dipende perciò da un doppio elemento di matrice
dipolo-dipolo. L’espressione appena scritta, che ora ricaveremo in continua, cioè
quando il campo esterno non dipende dalla frequenza, deriva dalla teoria delle
perturbazioni al primo ordine.
Anche la polarizzabilità intrinseca ha una dipendenza dal tempo, che è contentuta nelle funzioni d’onda elettroniche, dipendenti dal tempo per la presenza di
moti interni che modulano la distanza nucleare: infatti le funzioni d’onda elettroniche dipendono in maniera parametrica dalla distanza nucleare delle cariche
in approssimazione di Born-Oppenheimer (ovviamente tali moti interni non esistono nel caso di un atomo isolato).
Supponiamo ora di essere in continua (ma vale lo stesso discorso in alternata),
cioè di avere un campo elettrico costante; abbiamo visto che un dipolo indotto
si scrive come:
β
d¯α
(4.139)
i = Pαβ (t)E
ciò che vogliamo fare è arrivare a scrivere la (4.138) cioè dare una descrizione
quanto-meccanica dell’effetto di distorsione di una molecola per la creazione di
un dipolo.
In generale quando si ha una perturbazione esterna un sistema fisico quantomeccanico subisce due effetti: uno è la modifica dell’energia del sistema (i livelli
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
110
energetici possono alzarsi o abbassarsi) e questo, se la perturbazione è abbastanza intensa, viene trattato al primo ordine della teoria delle perturbazioni; il
secondo effetto della perturbazione è che anche le funzioni d’onda si modificano.
Supponiamo che la perturbazione si possa scrivere come:
V̂ = −d¯· Ē
(4.140)
se |e0 i è la funzione d’onda dello stato fondamentale del sistema con energia E0
e le |eλ i sono le funzioni d’onda eccitate con energie Eλ , esse si modificano tutte
attraverso la perturbazione V̂ al primo ordine nel modo seguente:
V̂
E0 −→ E00 = E0 + he0 | V̂ |e0 i
X heλ | V̂ |e0 i
V̂
|eλ i
|e0 i −→ |e00 i = |e0 i +
E0 − Eλ
(4.141)
(4.142)
λ>0
Quindi il livello energetico perturbato si scrive come il livello imperturbato più
l’elemento di matrice diagonale della perturbazione. La funzione d’onda che ha
subito la perturbazione è la funzione d’onda imperturbata più la combinazione
lineare di tutte le funzioni d’onda degli stati eccitati pesate con un termine di
mixing che è dato dall’elemento di matrice non diagonale della perturbazione
rispetto alle funzioni d’onda del sistema diviso la differenza di energia. A parità
di elemento di matrice (diverso da zero), ciò che è fondamentale per "mischiare"
le funzioni d’onda è che la differenza di energia al denominatore sia piccola.
Se si vogliono mischiare livelli con energia troppo distante quella differenza sarà
molto grande e quindi anche se l’elemento di matrice sarà diverso da zero, la
perturbazione diventa poco efficace.
Se il sistema in esame fosse un atomo, ad esempio l’atomo di idrogeno, la funzione d’onda fondamentale |e0 i sarebbe l’orbitale 1s mentre le funzioni d’onda dei
livelli eccitati |eλ i sarebbero gli orbitali cioè 2s, 2p, 3s, 3p ecc. Quindi se volessimo calcolare la pertubazione per la funzione d’onda di un atomo di idrogeno
dovremmo calcolare il valore:
heλ | − d¯· Ē |1si
E1s − Eλ
vogliamo sapere che tipo di funzioni d’onda si mischiano insieme per dare un
elemento di matrice diverso da zero. La risposta è basata su ragioni di simmetria (in fisica atomica è chiamato effetto Stark ).
Infatti il campo elettrico esterno che nel caso di un atomo si accoppia con l’elettrone orbitante non permette di associare ad esempio i livelli 1s e 2s in quanto
entrambi a simmetria sferica. Un atomo possiede la simmetria di parità (l’inversione) usata nelle regole di selezione atomiche, e quindi l’elemento di matrice
è diverso se si accoppiano livelli con parità opposta, in pratica i p e gli f con gli
orbitali s.
Ora possiamo vedere che il momento di dipolo indotto dal campo esterno si calcola come elemento di matrice dell’operatore dipolo rispetto alle nuove funzioni
d’onda pertubate. Ad esempio rispetto alle funzioni d’onda perturbate dello
stato fondamentale il dipolo indotto sarà:
d¯i = he00 | dˆ|e00 i
(4.143)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
111
e mettendoci dentro l’espressione (4.142) si trova:
!
!
X heλ | V̂ |e0 i
X heλ | V̂ |e0 i
¯
ˆ
ˆ
di = he0 | d |e0 i + he0 | d |
|eλ i i + h
|eλ i | dˆ|e0 i +
E0 − Eλ
E0 − Eλ
λ>0
λ>0
!
!
X heλ | V̂ |e0 i
heλ0 | V̂ |e0 i
|eλ0 i i
|eλ i | dˆ|
+
h
E
−
E
E0 − Eλ0
0
λ
0
λλ
(4.144)
Ciò che abbiamo appena calcolato è il valore di aspettazione del momento di dipolo indotto rispetto alle nuove funzioni d’onda perturbate per effetto del campo
elettrico esterno. Ci sono 4 termini: il primo rappresenta il dipolo intrinseco,
cioè quello permanente dato che è calcolato rispetto agli stati imperturbati, poi
ci sono i termini misti e infine il quarto termine, il quale sarà trascurabile in
quanto già i termini misti che accoppiano lo stato fondamentale a quelli eccitati
sono abbastanza piccoli. Possiamo scrivere infine per un generico dipolo indotto:
d¯i = d¯perm +
X he0 | dˆ|eλ i heλ | V̂ |e0 i
+ c.c.
E0 − Eλ
(4.145)
λ
Per un atomo qualunque il dipolo permanente vale zero (l’elemento di matrice
è calcolato tra le stesse funzioni) per le stesse ragioni esposte precedentemente. Esso sarà diverso da zero quando le funzioni d’onda rispetto alle quali sto
calcolando il momento di dipolo non hanno una parità definita: ad esempio la
molecola di HCl presenta funzioni d’onda che sono 1s dell’idrogeno col 2p del
cloro dalle quali si ottiene tramite LCAO (Linear Combination Atomic Orbitals)
una funzione d’onda a parità indefinita; in questo caso fisicamente si vede che
c’è una distribuzione di carica non omogenea che genera un momento di dipolo
permanente.
Per quanto riguarda i termini misti, ricordando che V̂ = −d¯· Ē, portando fuori
il campo elettrico si ottiene quella che abbiamo visto essere la polarizzabilità
intrinseca del sistema (4.138).
Riassumendo possiamo dire che un oggetto può essere naturalmente già distorto
dal punto di vista della distribuzione di carica elettrica (non negli atomi singoli) e in più si può aggiungere una ulteriore distorsione, il momento di dipolo
indotto, dovuto dall’applicazione di un campo elettrico esterno che viene calcolata con la teoria delle perturbazioni al primo ordine. Facendo lo stesso conto
per campi esterni in alternata compaiono nei denominatori ±~ω. Ciò che si
può ulteriormente osservare è la simmetria sotto parità della polarizzabilità: la
simmetria del dipolo sotto parità è negativa, cioè il dipolo cambia segno sotto
parità, quindi accoppia funzioni d’onda con parità opposta, ma la polarizzabilità
dipende dal quadrato del dipolo e se la parità è una grandezza definita allora
la polarizzabilità non cambia segno sotto parità, accoppia funzioni d’onda con
parità uguale. Quando vedremo lo scattering della luce fononico, cioè lo scattering da un cristallo, se questo possiede simmetria per inversione, allora i modi
vibrazionali che l’assorbimento infrarosso può vedere nel cristallo sono diversi
rispetto a quelli che si possono vedere con lo scattering Raman: perché le regole
di selezione del dipolo (assorbimento ed emissione) o di scattering (polarizzabilità) sono opposte. Finchè il sistema presenta la simmetria per inversione ciò
che vede il Raman è complementare a ciò che vede l’infrarosso. Se il sistema
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
112
Figura 34: Schema della geometria di un esperimento di scattering
ha una bassa simmetria in cui non è presente l’inversione ciò che è IR attivo è
anche Raman attivo e viceversa.
Geometria di un esperimento di scattering Prima di vedere qualche
esempio di molecole di cui studieremo la polarizzabilità vediamo come funziona
la geometria di un esperimento di scattering.
Si suppone che la molecola scatterante sia al centro del sistema di riferimento
come in figura 34. Per definire la geometria di scattering bisogna conoscere
come si propaga la luce incidente, cioè com’è fatto il vettore d’onda incidente
della radiazione k̄i con energia ~ωi , sapendo che i fotoni andranno a modificare
il vettore d’onda che diventerà quello finale k̄f . Supponiamo inoltre di conoscere
perfettamente la polarizzazione iniziale ¯i . Vediamo un caso semplice:
k̄i = (ki , 0, 0)
x̂
¯i = (0, 0, i )
ẑ
k̄f = (0, kf , 0)
ŷ
¯f = (0, 0, f )
ẑ
quindi il fotone viene scatterato a 90◦ e la polarizzazione mantiene la stessa
direzione iniziale. Un processo di questo tipo è detto processo completamente
polarizzato in quanto la polarizzazione iniziale e quella finale sono uguali cioè
¯i = ¯f , diversamente il processo si dice depolarizzato e ovviamente il processo
può essere elastico o anelastico.
Per un oggetto scatterante rotondo (ad esempio un atomo) si ha un processo
completamente polarizzato, mentre per una molecola biatomica la polarizzazione
finale della radiazione dipende da come è disposto l’asse della molecola. Nel
nostro esempio il vettore d’onda scambiato q̄ è:
1
1
q̄ = k̄i − k̄f = √ , − √ , 0
2
2
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
113
che si trova sulla diagonale del piano xy. Quindi la configurazione di scattering
può essere di tipo elastico o anelastico, polarizzato o depolarizzato e i vettori
d’onda possono dare scambio massimo quando sono l’uno l’opposto dell’altro
cioè k̄i = −k̄f ottenendo così la configurazione di backscattering o scambio
minimo quando sono uguali e si ha lo scattering in avanti, e poi tutti i casi
di angoli intermedi compresi fra 0◦ e 180◦ . Sostanzialmente si ha la stessa
configurazione geometrica che si aveva nel caso di scattering di neutroni, con
la differenza che in questo caso c’è da tenere in conto anche la polarizzazione.
Nel caso di una particella massiva non si parla di polarizzazione bensì di spin:
per "polarizzare" particelle massive come i neutroni si usa un campo magnetico
variabile che permetta lo spin-flip. Vediamo ora alcuni esempi.
4.3.1
Studio di un cristallo di atomi
Si considera un cristallo di atomi, per cui la (4.137) che compare nella funzione di
correlazione contenuta nella sezione d’urto (4.136) può essere riscritta seguendo
lo schema di figura 7 della sezione 3.4: l’indice j che identifica le particelle
che si distorcono può essere sostituito con due indici l, χ che fanno riferimento
il primo ad un vettore macroscopico x̄l che indica la cella e il secondo ad un
vettore microscopico x̄χ che identifica la posizione del singolo atomo all’interno
della cella. Se poi si considerano anche gli spostamenti ūlχ (t) degli atomi dalla
loro posizione di equilibrio, allora il vettore che identifica la posizione istantanea
dell’atomo all’interno del solido R̄j (t) si può riscrivere come:
R̄j (t) = x̄l + x̄χ + ūlχ (t) = R̄lχ (t)
(4.146)
e la polarizzabilità (4.137) diventa per un cristallo:
X
ααβ (r̄, t) =
αχ δαβ δ(r̄ − R̄lχ (t))
(4.147)
lχ
dove la delta di Kronecher δαβ indica una matrice di polarizzabilità diagonale
con componenti αχ che indicano la polarizzabilità del singolo atomo, ad esempio
in un cristallo di NaCl si avrà la polarizzabilità del sodio αN a diversa da quella
del cloro αCl . Quindi le matrici di polarizzabilità nel caso del solido di NaCl
saranno del tipo:
 Na

 Cl

α
α


αN a
αCl
Na = 
Cl = 
Na
Cl
α
α
Le componenti diagonali sono uguali fra loro in quanto abbiamo considerato un
cristallo di atomi. Prendiamo ora un cristallo di molecole, ad esempio l’idrogeno
solido che cristallizza sotto i 20 K in una fase esagonale. Per semplicità però
immaginiamo che cristallizzi in una struttura cubica a facce centrate: su ogni
spigolo e faccia del cubo vi sono quindi due atomi di idrogeno ovvero una molecola di H2 . Cosa otteniamo in questo caso per la matrice di polarizzabilità?
Bisogna distinguere fra le molecole su spigoli e facce. Se ẑ è l’asse della molecola
per entrambi i casi si ha:
 x

 x

αH2
αH2
y=x
y=x


αH
αH
H2spigolo = 
H2centro = 
2
2
z
z
αH2
αH2
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
114
Come si trasforma la funzione di correlazione polarizzabilità-polarizzabilità nel
caso di un cristallo di atomi? La molecola ha gradi di libertà interni (rotazionale e vibrazionale) ma per gli atomi la distorsione non dipende dal tempo.
Sostituendo la (4.146) nella funzione di scattering si ha per un cristallo di atomi
potenzialmente diversi:
'1
Jαβγδ =
X
}|
{Z
z
0
−iq̄ · (x̄l −x̄l0 ) −iq̄ · (x̄χ −x̄χ0 )
dt eiωt (αχ δαβ )(αχ δγδ ) ·
e
e
(4.148)
ll0
χχ0
· he−iq̄ · ūlχ (t) e−iq̄ · ūl0 χ0 (0) i
La sommatoria su jj’ ovviamente diventa una sommatoria su ll0 , χχ0 . Come
già visto per i neutroni la trasformata di Fourier spaziale può essere scambiata
con l’operazione di funzione di correlazione, cioè invece di calcolare l’integrale
spaziale della funzione di correlazione è possibile calcolare la funzione di correlazione e portare fuori dall’integrale temporale i termini costanti e lasciando solo
gli esponenziali dipendenti dal tempo in cui compare lo spostamento istantaneo.
Questa è per ora un’espressione esatta. Bisogna ora definire quali sono le caratteristiche della luce che si vuole usare per il proprio esperimento di scattering. Nella maggior parte dei casi, in un normale laboratorio gli esperimenti
di scattering si conducono con luce nel visibile. Il vettore d’onda nel visibile
|k̄ilucevis | ' 105 cm−1 πa cioè molto più piccolo del passo reticolare che è al
più dell’ordine di qualche Å, cosa non vera per i neutroni. Ciò significa che è
possibile semplificare la precedente espressione esatta nel limite della luce visibile in quanto il vettore d’onda scambiato sarà al massimo q̄ = 2|k̄ilucevis | e il
prodotto q̄ · (x̄χ − x̄χ0 ) vale 10−3 e l’esponenziale evidenziato nella (4.148) è approssimabile con 1 (cosa non fattibile con l’altro esponenziale in quanto i vettori
x̄l , x̄l0 sono macroscopici).
Ora si procede come con i neutroni, applicando cioè la relazione (3.78) data dal
teorema operatoriale di Baker-Hausdorff:
he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = e|− 2 Wχ (q){z
e− 2 Wχ0 (q)} eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i
1
1
(4.149)
1
dove si hanno i fattori di Debye-Waller in cui Wχ ' h(q̄ · ū)2 i misura lo spostamento quadratico medio dell’atomo rispetto alla posizione di equilibrio pesato
dal vettore d’onda scambiato, e li posso porre entrambi uguali a 1 per gli stessi
ragionamenti precedenti sull’ordine di grandezza del vettore d’onda scambiato.
Si può fare ora la stessa approssimazione già vista con i neutroni per la funzione
di correlazione:
1
eh i = 1 + h i + h i 2 + · · ·
(4.150)
2
dove ci si ferma al primo ordine.
Fin’ora è stato seguito lo stesso procedimento usato per i neutroni con la sola
semplificazione di avere piccoli vettori d’onda perché si sta usando luce nel
visibile. Ora come fatto per i neutroni discuteremo separatamente il termine
costante per cui si aveva lo scattering di Bragg nel caso dei neutroni, e il termine
di ordine uno per cui si avevano i processi stokes e anti-stokes.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
115
Termine di ordine 0 - scattering elastico
Con il termine costante si ha lo scattering elastico. Sostituendo nella funzione
di scattering si ottiene:
X
0
Jαβγδ =
e−iq̄ · (x̄l −x̄l0 ) (αχ αχ )δαβ δγδ δ(ω)
(4.151)
ll0
χχ0
le funzioni delta sono non nulle solo se gli indici sono α = β e γ = δ le quali
dicono che entrambe le polarizzabilità microscopiche sono diagonali e anche la
funzione delta dovuta all’integrale temporale deve essere ω = 0 dice che lo
scattering è elastico (da questo punto di vista somiglia al Bragg). Nella formula
generale della sezione d’urto la funzione di scattering appena scritta deve essere
moltiplicata per la parte contenente le polarizzazioni. Visto che la polarizzabilità
è diagonale le 4 componenti dei versori di polarizzazione saranno uguali a coppie
per cui si ha che:
X
α ∗γ ∗γ
α
f · ¯i |2
(4.152)
f i f i = |¯
αγ
che significa che lo scattering è polarizzato, discorso già fatto precedentemente
senza considerare formule matematiche ma solo la geometria del sistema. Infatti quel prodotto scalare è diverso da zero solo se polarizzazione finale e iniziale
sono orientate nello stesso modo. In altri termini scegliendo una polarizzazione
lineare, con un versore di polarizzazione a singola componente, necessariamente
la polarizzazione finale deve essere la stessa di quella iniziale. Se il versore è
a due componenti il prodotto scalare può essere diverso da zero con una modifica della polarizzazione finale. Normalmente però si sceglie la polarizzazione
iniziale in base al target che si ha: se ad esempio il target è un gas di atomi
che quindi non ha una direzione privilegiata della polarizzazione allora si può
scegliere la direzione di polarizzazione iniziale a piacere; se invece il target è un
cristallo si può scegliere una direzione particolare della polarizzazione incidente
per avere informazioni sul sistema scatterante usando ad esempio in uscita un
polarizzatore che selezioni solo una componente desiderata del vettore di polarizzazione. Si può così scoprire se il processo di scattering ha determinato o
meno un cambiamento di polarizzazione della luce incidente.
Il numero di fotoni scatterati per unità di frequenza e unità di angolo solido,
se ρ è la densità del sistema e Ji è il numero di fotoni incidenti è la quantità
che viene effetivamente misurata in un esperimento di scattering da radiazione
luminosa, e vale:
∂2σ
∂ 2 J(q̄, ω)
= Ji ρ
(4.153)
∂Ω∂ω
∂Ω∂ω
cioè la quantità di fotoni che vengono scatterati in una certa direzione definita
dall’angolo solido Ω legato al vettore d’onda scambiato q̄ per unità di frequenza (e questo dice se sono elastici o anelastici). L’intensità delle righe che si
osservano dipende propriamente da diverse quantità, ma in particolare dalla
polarizzabilità del sistema. La polarizzazione quindi può far variare di poco
l’intensità di alcune righe o può farne scomparire altre, ma l’entità delle righe
dipende sopratutto dalla polarizzabilità del sistema.
Analizziamo ora le risposte del sistema come fatto per i neutroni, considerando
diversi sistemi target.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
4.3.2
116
Studio di un gas perfetto
Nel caso di un gas di atomi rarefatto si considera solo l’energia cinetica del
sistema. Nel dettaglio consideriamo oggetti rotondi senza gradi di libertà interni,
dotati esclusivamente di energia cinetica. E’ possibile riscrivere la sezione d’urto
tramite la funzione di scattering già usata per i neutroni, che si può dividere
in parte self e parte distinct. Consideriamo la parte self per cui analizziamo la
risposta di particelle non correlate, in quanto come detto si sta trattando
un gas rarefatto di atomi in cui il potenziale tra le particelle viene trascurato.
Si scrive allora:
ωi ωf3 X α β ∗γ ∗δ 2
∂2σ
N f i f i |α| δαβ δγδ Ss (q̄, ω)
=
∂Ω∂ω
2πc4 N
(4.154)
αβ
γδ
dove appunto Ss (q̄, ω) rappresenta la parte self della funzione di scattering.
Come fatto nella sezione 3.2 per i neutroni si ipotizza la forma gaussiana della
S-self:
s
M β − ω22q̄M2 β
(4.155)
Ss (q̄, ω) =
e
2π q̄ 2
La S-self quindi determina sostanzialmente la grandezza (4.153) cioè la quantità
di fotoni scatterati. Graficando questa quantità in funzione della frequenza e
fissato il vettore d’onda scambiato (quindi fissata la direzione del detector) si
trova il valore della sezione d’urto, proporzionale a sua volta alla S-self, cioè
in ultima analisi la TdF spazio-temporale della funzione di correlazione della
particella scatterata con sè stessa a tempi diversi. Essa è una curva gaussiana
centrata in zero dove ω = 0 è il massimo di scattering che corrisponde al processo elastico e delle code a frequenza maggiore e minore che indicano i processi
anelastici con guadagno o perdita di energia del fotone incidente a favore del
sistema (figura 35 a).
La differenza con i neutroni
sta nella proprietà di polarizzazione della luce dovuP
α
te al prodotto scalare α α
¯f · ¯i e che il parametro d’urto b̂ che misurava
f i = quanto i neutroni interagissero con la materia viene sostituito dalla polarizzabilità |α|2 .
La grossa differenza fra neutroni termici e fotoni nel visibile, a parità di formule matematiche sta nella risoluzione, cioè nel vettore d’onda scambiato, come
abbiamo già discusso in precedenza ciò è legato ai vettori d’onda peculiari di
neutroni termici e fotoni nel visibile. Cambiando le due sonde spettroscopiche
sono sensibile a distanze più piccole (neutroni) o più grosse (fotoni luminosi).
Dal punto di vista dell’energia scambiata, i neutroni termici, se non fosse per
l’apparato sperimentale grosso e costoso che necessitano per essere prodotti,
danno luogo a esperimenti più "semplici". Consideriamo che in un gas di atomi
a temperatura di 300 K gli atomi hanno energia termica media di 25 meV . I
neutroni termici hanno energia tipica di 25 meV e in un processo completamente
anelastico cedono quest’energia al sistema passando da 25 meV a 0. Nel caso
di un fotone nel visibile l’energia tipica di un fotone nel verde è dell’ordine di
2.5 eV (1000 volte l’energia del neutrone), quindi in un processo completamente
anelastico in cui l’atomo del gas si ferma e cede tutta la sua energia termica
media al fotone, quest’ultimo sarà scatterato con una variazione di energia dello
0.001% ! Una quantità più difficile da rilevare rispetto al neutrone che cede
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
117
il 100% della sua energia. Perciò lo spettrometro che usa i fotoni dovrà avere
una risoluzione decisamente maggiore rispetto a quello che usa neutroni termici.
4.3.3
Studio di un gas reale
Se il sistema è correlato (gas reale o liquido) e quindi nell’hamiltoniana di tale
sistema è compresa anche l’energia potenziale, dobbiamo scrivere la sezione
d’urto nella sua forma estesa:
Z
XZ
ωi ωf3 X α β ∗γ ∗δ 2
∂2σ
iωt
=
N
|α|
δ
δ
dt
e
dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) ·
αβ γδ
f i f i
∂Ω∂ω 2πc4 N
0
jj
αβ
γδ
· hδ(r̄1 − R̄j (t))δ(r̄2 − R̄j 0 (0))i
(4.156)
ricordandosi che
scattering è:
P
j
δ(r̄ − R̄j (t)) = ρ(r̄, t) è la densità, e che la funzione di
Z
S(q̄, ω) =
dt eiωt
Z
dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) hρ(r̄1 , t)ρ(r̄2 , 0)i
si trova che:
ωi ωf3 X α β ∗γ ∗δ 2
∂2σ
=
N f i f i |α| δαβ δγδ S(q̄, ω)
∂Ω∂ω
2πc4 N
(4.157)
αβ
γδ
E’ la stessa trattazione svolta per i neutroni, in questo caso infatti non è possibile trascurare la correlazione fra le particelle. Tuttavia mentre con i neutroni era
sempre possibile misurare la risposta coerente e quella incoerente distinguendo
tra la risposta di densità del sistema e quella di singola particella, con i fotoni
non è possibile fare ciò, quello che si misura infatti è la S(q̄, ω) totale. Calcolare
la funzione di correlazione densità-densità è un problema numerico non banale:
ci sono molte tecniche sviluppate recentemente per calcolare la funzione di correlazione densità-densità da principi più o meno fondamentali (c’è la LDA, la
DFT ecc).
Se l è il libero cammino medio degli atomi del sistema, supponendo che q̄ 1l
e se τ è il tempo fra due urti, supponendo che il tempo di misura delle fluttuazioni sia t τ cioè vado a mediare su molti urti mi trovo in quello che viene
chiamato regime idrodinamico; in queste condizioni si possono scrivere delle
equazioni microscopiche per calcolare precisamente la funzione di correlazione
densità-densità. Non lo dimostriamo (si trova il conto sulle dispense di Mazzacurati e un discorso più ampio sul testo Liquid State di Hansel-MacDonald ) e
scriviamo direttamente l’espressione finale:
1
1
·
S(q̄, ω) = V ρ2 kB T χT 1 −
π
γ
1
Γq 2
DT q 2
Γq 2
·
+
+
2γ (ω − vs q)2 + (Γq 2 )2
(ω + vs q)2 + (Γq 2 )2
ω 2 + (DT q 2 )2
(4.158)
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
(a) Intensità di fotoni scatterati da un
gas ideale.
118
(b) Intensità di fotoni scatterati da un gas reale.
Figura 35: Scattering di fotoni per un gas perfetto e un gas reale.
a parte il fattore moltiplicativo iniziale si hanno tre termini lorenziani, centrati
rispettivamente in ω = ±vs q e in ω = 0. I vari elementi dell’equazione sono:
• ρ è la densità media del liquido;
c
• γ = cvp rapporto fra il calore specifico a pressione costante e a volume
costante;
• χT è la suscettività termica;
• DT diffusività termica (il coefficiente di Einstein di diffusione);
• vs velocità del suono nel liquido
In questo caso il segnale che si misura restituisce tre contributi distinti che si
possono vedere in figura 35 b: I picchi laterali sono sostanzialmente lo Stokes
e l’Anti-stokes e si chiamano picchi di diffusione di Brillouin. Il picco centrale
si chiama picco di diffusione di Rayleigh. Nel regime idrodinamico che può
essere considerato "medio", le grandezze di scattering dipendono da parametri
termodinamici (suscettività termica, calore specifico ecc).
In generale cambiando il vettore d’onda scambiato cambia la larghezza a mezza
altezza del picco centrale mentre i picchi di Brilluoin disperdono in maniera
lineare con q̄: questi oggetti altro non sono che i fononi longitudinali del liquido
(gli acustici, a meno di casi specifici). Misurando quindi in un certo numero
di punti la frequenza di questi picchi al variare del vettore d’onda, è possibile
ricavare una misura della velocità del suono nel materiale. Questo come visto
è misurabile con i neutroni ma anche con i fotoni in quanto le fluttuazioni
di densità implicano delle fluttuazioni delle proprietà dielettriche del mezzo e
quindi della polarizzabilità, determinando proprietà di scattering diverse. La
diffusione della luce quindi misura anche fluttuazioni di polarizzabilità generate
da fluttuazioni di densità.
Le onde sonore sono oggetti che si propagano e questo genera fluttuazioni di
polarizzabilità che si propagano, che è indicato dal fatto che la frequenza del
modo varia col vettore d’onda (c’è una dispersione spaziale). Il fatto che il
picco centrale (che non si propaga) sia proporzionale al coefficiente di diffusione
termica è legato alle fluttuazioni di densità indotte dalla temperatura cioè le
fluttuazioni di calore.
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
119
Se γ = 1 cioè quando cp = cv tutta la funzione di scattering si annulla. I
calori specifici a volume costante e pressione costante per i solidi e i liquidi si
sono molto vicini, ma hanno la loro differenza, seppur piccola, è riferica alla
compressione o all’espansione che è possibile applicare sul sistema. Se i calori
specifici a pressione e volume costante sono uguali allora ci stiamo riferendo
ad un caso ideale di un liquido perfettamente incomprimibile che pertanto non
ammette fluttuazioni di densità, e la cui risposta ad un campo incidente non
può che essere nulla.
4.3.4
Studio di un gas biatomico di molecole scorrelate: Raman
vibrazionale e Raman Rotazionale
Consideriamo ora un gas biatomico scorrelato. Che tipo di spettro di diffusione
della luce ci si aspetta di vedere? Sappiamo che la polarizzabilità della molecola
j si scrive come:
j
j
ααβ
= Pαβ
δ(r̄ − R̄j (t))
ed è rappresentata da una matrice diagonale con elementi che dipendono dal
tempo, in quanto condizionati da gradi di libertà interni vibrazionali e rotazionali. La sua capacità di distorsione quindi dipende fortemente da quanto la
frequenza del campo eccitatore è vicina alle frequenze caratteristiche del sistema
stesso. Classicamente abbiamo visto che la polarizzabilità la si può scrivere come un valore all’equilibrio più due fattori dipendenti dai coseni delle frequenze
rotazionali e vibrazionali:
¯ (t) = ᾱ
¯ eq + ᾱ
¯ 0 cos(2ωR t) + ᾱ
¯ 00 cos(ωV t)
ᾱ
Quando si calcola la funzione di correlazione della polarizzabilità della molecola
j
j
¯ eq si ottiene lo
con sè stessa hααβ
αγδ
i e si considera solo il termine all’equilibrio ᾱ
stesso risultato che si avrebbe per un gas di atomi in quanto si sta considerando
la molecola immobile e non rotante.
Ci sono molecole (come quella di CO2 ) e in generale per oggetti particolarmente
simmetrici, per cui il tensore di polarizzabilità è diagonalizzabile, cosa non vera
per oggetti più complicati e in genere per sistemi a bassa simmetria, che quindi
si portano dietro elementi fuori diagonale che dannoluogo a diversi effetti.
¯
∂ ᾱ
¯ 0 = ∂R
(R−Req ), è un oggetto
La componente vibrazionale, ricordando che ᾱ
Req
che da contributi allo scattering legati alla possibilità di eccitare una vibrazione
o di annullarla: il fotone che arriva cede parzialmente energia alla molecola,
ad esempio facendole fare una transizione vibrazionale, e riparte con energia
inferiore pari esattamente a un "quanto vibrazionale", oppure nel processo antistokes il fotone assorbe un quanto di energia vibrazionale da una molecola già
eccitata ad un livello vibrazionale superiore al fondamentale e riparte con energia superiore di un quanto di vibrazione. Questi sono i processi di diffusione
vibrazionali.
L’oggetto rotazionale invece è legato a processi in cui il fotone fa fare una transizione rotazionale al sistema oppure assorbe un quanto di rotazione dalla molecola. Quindi possiamo riassumere i due termini chiamandoli Raman rotazionale
e Raman vibrazionale.
Quello che si osserva in un tipico spettro raman roto-vibrazionale è riportato in
figura 36.
Il picco di Rayleigh centrale è associato alla S-self ed esiste a prescindere che
4
SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO
120
Figura 36: Spettro Raman roto-vibrazionale con relative regole di selezione.
il gas sia molecolare o atomico. Le prime transizioni che si osservano poi sono
quelle associate al creare o distruggere quanti di rotazione (cosa inesistente negli
atomi). Il Raman rotazionale ha una regola di selezione, come abbiamo visto di
∆J = 0, ±2 e questo significa che se l’energia rotazionale è:
ER (J) = BJ(J + 1)
(4.159)
per una transizione del tipo Ji → Ji + 2 ad esempio si ha:
∆ER (J) = B(Ji + 2)(Ji + 3) − BJi (Ji + 1) = 2(2BJi + 3)
(4.160)
che rappresenta il salto rotazionale. La regola di selezione per l’assorbimento è
∆J = ±1 che rende impossibile la transizione vibrazionale pura: in uno spettro
rotovibrazionale d’assorbimento per una molecola eteroucleare, alla transizione
vibrazionale si associa sempre uno spettro rotazionale.
E’ possibile vedere la transizione vibrazionale pura per ∆J = 0 e ∆V = ±1
attorno alla quale è possibile vedere altre transizioni che vanno a comporre la
rototransizione Raman.
Se si ha un liquido, e quindi c’è un qualche tipo di correlazione, la rotazione è
presente? In un mezzo di molecole eteronucleuari il potenziale di orientazione
dipende dall’orientazione rispettiva dei dipoli, e le rotazioni non sono più libere,
in quanto devono rispettare precise posizioni dovute al principio di minima
energia. Si hanno al più delle librazioni ovvero delle oscillazioni attorno a un
asse preferenziale. Per molecole omonucleari prive di momento di dipolo invece,
entrano in gioco i quadrupoli, cioè l’accoppiamento di molecole con i secondi
vicini che però è molto più debole e meno selettivo rispetto all’approssimazione
di dipolo, e quindi le molecole possono ruotare abbastanza liberamente (azoto
e idrogeno liquidi presentano uno spettro rotazionale abbastanza definito).
5
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
121
Applicazioni Biologiche della spettroscopia IR
Vogliamo ora vedere alcune applicazioni della spettroscopia IR e THz nei campi
della biologia e della biofisica.
Da fenomeni di assorbimento di fotoni da parte della materia abbiamo visto che
si possono dedurre alcune informazioni importanti sul sistema target, in particolare per un cristallo le interazioni principali avvengono con gli stati vibrazionali.
Lo stesso principio è enormemente applicato per sistemi molecolari: le vibrazioni molecolari di cui si parla cadono nell’IR e riguaradano molecole biatomiche
eteronucleari a strutture molto più complesse (proteine, DNA ecc), ma questo
passaggio non implica una notevole complicazione del problema poichè, di fatto, ciò che si misura sono le vibrazioni di singoli gruppi chimici costituenti la
molecola.
I gruppi chimici costituiscono in sostanza "l’impronta digitale" di una molecola. Infatti lo spettro IR di una molecola (ad esempio l’etanolo in figura 37)
Figura 37: Spettro IR della molecola di etanolo.
è come la fotografia della stessa attraverso l’individuazione dei gruppi chimici
che la compongono e che danno luogo ognuno ad assorbimento ad una diversa
frequenza.
Questo è particolarmente importante nell’ambito della biologia in quanto ad
oggi si è in grado di registrare lo spettro IR di cellule e tessuti, anche in vivo
(comportamento di una cellula sottoposta ad un farmaco, cellula in fase riproduttiva, pelle, ecc.). Un farmaco ad esempio interviene di solito su specifici
legami chimici, e quindi registrando il cambiamento nella molecola o nella cellula di tali legami e gruppi è possibile risalire al meccanismo d’azione del farmaco.
Si possono riassumere i vantaggi di questa tecnica per la biologia:
• informazioni di livello molecolare;
• quasi ogni gruppo chimico ha una specifica banda IR;
• alta sensibilità (viene rilevato persino il debole legame a idrogeno);
• tecnica non distruttiva/non ionizzante.
I problemi invece possono essere riassunti dicendo che:
• solitamente i tessuti biologici sono in soluzione acquosa, e l’acqua è un
fortissimo assorbitore di radiazione IR;
• gli spettri sono molto complicati: per oggetti complessi spesso le bande di
assorbimento si sovrappongono e sono difficili da distinguere.
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
122
Figura 38: La parte di spettro elettromagnetico in cui lavora la spettroscopia
IR.
L’unità di misura principale della spettroscopia IR è il numero d’onda che si
misura in cm−1 le cui conversioni sono:
200 cm−1 = 300 K = 25 meV = 50 µm = 7 T Hz
Dato l’infrarosso, che normalmente si trova nella regione spettrale fra le microonde e il visibile, può essere suddiviso in sotto regioni specifiche:
THz la regione THz è quella davvero vicina alle microonde, e si parla di frequenze < 100 cm−1 (vale che 1 THz=33 cm−1 ). In questa regione cadono
i modi collettivi delle macromolecole;
MIR la regione mid-infrared è quella compresa fra qualche centinaio di cm−1 e
4000-5000 cm−1 . In questa regione cadono le vibrazioni intra molecolari;
NIR la regione near-infrared va da 5000 cm−1 fino al visibile (il colore rosso ha
una frequenza di 15800 cm−1 ). In questa regione cadono gli ipertoni, cioè
più vibrazioni che vengono eccitate contemporaneamente oppure le bande
di combinazione.
queste nozioni sono riassunte in figura 38.
Buona parte dei sistemi di riconoscimento (telecamere a infrarossi ecc) lavora
nella zona NIR a causa della maggiore lunghezza di penetrazione delle onde,
anche se gli spettri del vicino IR sono molto più complicati da spiegare essendo
generati da overtones e combinazione di bande vibrazionali.
Quello che viene normalmente misurato è lo spettro di trasmissione di un materiale, che definisce la trasmittanza (che abbiamo trattato nella sezione 4.2.2).
Questa quantità macroscopica è:
T (ω) =
IT (ω)
I0 (ω)
ed è legata al coefficiente di assorbimento, quantità microscopica:
1
α(ω) = − log T (ω)
δ
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
123
Figura 39: Spettri di trasmissione: lo spettro in alto mostra l’intensità della
luce trasmessa (rosso) e quella incidente (blu), mentre lo spettro verde in basso
rappresenta la trasmittanza.
dove δ è lo spessore del target nella direzione di propagazione della radiazione.
In figura 39 si vedono gli spettri relativi alla trasmittanza: le scale sono "da
chimici" (frequenze alte a sinistra) e mostrano rispettivamente quello in alto lo
spettro di riferimento incidente I0 assieme allo spettro trasmesso IT che mostra
le linee di trasmissione. Il rapporto fra i due spettri in alto da luogo alla trasmittanza (riga verde): in regione di alta frequenza si vede che il sistema trasmette
1 (cioè è trasparente) e poi cominciano ad esserci delle righe profonde che dicono che in quelle zone specifiche il sistema non è trasparente. Quindi i "buchi"
nella trasmittanza definiscono le righe di assorbimento specifiche del materiale;
facendo il logaritmo si ottengono dei picchi che rappresentano il coefficiente di
assorbimento.
Che tipo di vibrazioni ci si aspetta di misurare?
Se si ha una molecola con n atomi, i gradi di libertà vibrazionali a seconda che
la molecola sia lineare o non-lineare sono:
Gradi di libertà molecola lineare
3n − 5
Gradi di libertà molecola non-lineare
3n − 6
Quindi ad esempio l’acqua che è una molecola triatomica non-lineare mostra 3
gradi di libertà vibrazionali che sono mostrati in figura 40. In particolare si ha:
Stretching simmetrico: allungamento e contrazione dei legami fra gli atomi:
può essere simmetrico quando gli atomi si allontano e si avvicinano fra loro
insieme, in cui la molecola si gonfia e si sgonfia (breathing "il respiro" della
molecola). Questo moto non altera la configurazione di carica e quindi non introduce un dipolo nel sistema e quindi è difficile che possa assorbire radiazione
infrarossa;
Stretching asimmetrico: la forma della molecola cambia completamente;
Bending o scissoring: cambia l’angolo fra i legami.
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
124
Figura 40: Gradi di libertà vibrazionali di una molecola di H2 O.
Figura 41: Moti vibrazionali per la molecola di CO2 (riquadro in alto) e per il
gruppo chimico CH2 con relative frequenze caratteristiche (riquadro in basso).
Per molecole più complicate possono aggiungersi altri tipi di moti come il wagging in cui gli atomi, ad esempio il CH2 che per esistere deve essere attaccato a
qualcos’altro, possono muoversi fuori piano. I moti vibrazionali per la molecola
eteronucleare lineare CO2 e per il gruppo chimico CH2 sono riassunti in figura
41. Per un dato gruppo chimico, a seconda della posizione spaziale in cui il
gruppo è legato, ci si potrebbe chiedere se le frequenza caratteristiche dei moti
appena descritti possono cambiare oppure no. Ebbene a prescindere dall’oggetto a cui il dato gruppo è legato le frequenze cambiano poco: le frequenze
"modificate" continuano ad essere distribuite intorno ai valori che avrebbero se
il gruppo chimico fosse libero.
Per questo motivo le frequenze caratteristiche costituiscono l’impronta digitale
di determinate molecole. Poi sapere quanto queste frequenza cambiano può dare
un’idea di dove il gruppo è legato, o meglio di qual è l’ambiente chimico-fisico
in cui esso si trova.
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
125
Figura 42: Tipico spettro di assorbimento di una cellula.
Dal punto di vista fisico ciò significa che i potenziali rispetto ai quali il gruppo vibra sono molto più importanti dei potenziali dell’ambiente circostante che
definiscono il come e dove il gruppo è legato: di fatto sono una piccola perturbazione rispetto al potenziale armonico che causa le vibrazioni specifiche del
gruppo.
Se si prende una cellula (di dimensioni sufficienti da poter essere misurata singolarmente) si deve essere in grado di concentrare sulla cellula le frequenze
corrispondenti alla regione di frequenza in cui si vuole registrare lo spettro di
assorbimento. Per questo ci si scontra con il limite di diffrazione: non è possibile
concentrare la radiazione su regioni più piccole della sua lunghezza d’onda. Se la
cellula in questione ha una dimensione minore della frequenza della radiazione
che la dovrebbe misurare allora non è possibile usare per questa data cellula la
spettroscopia IR.
In figura 42 si vede il tipico spettro di assorbimento di una cellula: ad alte
frequenze (a sinistra come nelle scale dei chimici) si individua una banda ben
strutturata relativa ai grassi dovuta ai gruppi CH2 e CH3 , infatti una cellula è protetta da una membrana lipidica composta da lunghe catene costruite
principalmente da gruppi CH2 e CH3 . I picchi prevalenti a circa 1600 cm−1
sono le così dette bande amidiche relative ai gruppi amidici (amide I, amide II)
delle proteine che costituiscono la cellula. A frequenze ancora più basse l’assorbimento è dato sopratutto dalle vibrazioni dei gruppi C − O che costituiscono
lo scheletro zuccherino del DNA e del RNA. Tutto il riconoscimento chimico a
partire da vibrazioni molecolari è stato realizzato dagli anni 50’ in poi a partire da strutture modello: ad esempio il polietilene (la plastica) per le strutture
lipidiche.
Concentriamoci ora sulle componenti cellulari che abbiamo pocanzi citato.
I Lipidi La spettroscopia IR rappresenta una tecnica importante per caratterizzare il contenuto lipidico di alcune strutture biologiche, in particolare per
l’analisi chimica degli alimenti, ad esempio per la caratterizzazioni dei grassi saturi o insaturi, ma anche per la qualità di oli vegetali o animali, o banalmente
per misurare la quantità di grassi presenti in un dato alimento.
La misura degli assorbimenti caratteristici da informazioni sulla forma e sulle
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
126
Figura 43: Spettro di assorbimento dei lipidi e relatici moti vibrazionali associati
ad ogni picco.
Figura 44: Schema della struttura di una proteina.
caratteristiche meccaniche delle membrane cellulari, in particolare grazie agli
stretching dei gruppi chimici citati. In figura 43 si può vedere l’ingrandimento della zona di assorbimento dei lipidi descritta in figura 42 con i vari modi
vibrazionali.
Le proteine Le proteine sono strutture importantissime per l’esistenza
della vita. Esse sono costituite essenzialmente da amminoacidi che costituiscono
i mattoncini di base delle strutture proteiche.
La struttura globale di una proteine è riassunta in figura 44 e può essere così
riassunta:
• la struttura primaria è costituita da elementari catene di aminoacidi;
• la struttura secondaria è costituita dalle strutture che le catene della
struttura primaria formano nello spazio: ad esempio possono avvolgesi
(struttura α-elica) o formare strutture planari (struttura β-sheet);
• la struttura terziaria è costituita dalla disposizione spaziale della struttura secondaria;
• la struttura quaternaria è farmata da un insieme di strutture terziarie
e costituisce la forma finale della proteina.
Dal punto di vista della funzione specifica che una data proteina deve svolgere
(enzimi ecc) la struttura secondaria ha un ruolo molto importante. L’efficacia
chimica (e quindi la funzionalità biologica) della struttura è fondamentale, e le
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
127
Figura 45: Schema della struttura primaria di una proteina, formata dall’unione
di più gruppi peptidici.
spettro IR, a parità di struttura primaria, è diverso per strutture secondarie
differenti.
In figura 45 è possibile vedere un tipico caso di struttura primaria. Piccole
differenze nella struttura primaria implicano funzioni biologiche completamente
diverse.
La struttura primaria è un oggetto complicato composto da molti atomi, nel
quale è possibile riconoscere gruppi chimici specifici: sicuramente sono presenti
gruppi a base carbonio (la vita è basata sul carbonio), l’azoto, gli ossigeni e gli
idrogeni, fra gli elementi costituenti principali di una struttura primaria. Date le
valenze specifiche di questi atomi, ad esempio il carbonio può formare un doppio
legame con l’ossigeno, legarsi all’azoto che si lega a sua volta con un gruppo ad
idrogeno singolo, e tutta questa struttura forma quello che è chiamato peptide. I
peptidi sono i mattoni di base delle proteine e ognuno di questi oggetti può avere
dei modi collettivi di vibrazione, ma essendo costruito da tanti atomi alcuni dei
quali anche abbastanza pesanti può dar luogo a righe di assorbimento a basse
frequenze (nel far-infrared). La vibrazione dei gruppi peptidici specifiche inoltre non mettono in moto l’intera struttura, ma il loro assorbimento può venire
assimilato a quello dello stesso gruppo inerte, cioè non legato ad alcuna struttura più grande. Quanto cambiano le frequenze vibrazionali quando il gruppo
è legato ad una struttura più complicata può dare informazioni sulla struttura
stessa.
Le lunghezze di legame e i relativi angoli fra gli atomi di queste catene sono
ben caratterizzati, e le specifiche vibrazioni sono contenute in un intervallo di
frequenze che va normalmente da 1000 a 1700 cm−1 . Queste vibrazioni molto
ben definite e monocromatiche (la larghezza a mezza altezza di un dato picco
è molto più piccola della frequenza caratteristica a cui il picco si trova) sono
relative alla struttura mostrata in figura 46. Data la struttura primaria, una
catena polipeptidica in sostanza, la sua ordinazione nello spazio va a formare la struttura secondaria, che può essere caratterizzata da tre configurazioni
principali
• la struttura α-elica;
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
128
Figura 46: Immagine di una tipico gruppo peptidico con relatici angoli e
lunghezze di legame.
• la struttura β-sheet;
• la struttura β-turn.
Inoltre fuori da queste tre configurazioni i segmenti di catena polipeptidica possono formare strutture chiamate random coil, che sono strutture non ripetitive
nè regolari, spesso prive di legami idrogeno tra gli aminoacidi che le compongono.
Nonostante la diversità delle forme primarie e secondarie, si hanno quasi sempre, per le proteine, ovviamente con frequenze e rapporti di intensità diversi,
due picchi di assorbimento, distribuiti nella regione di frequenza caratteristica
indicata precedentemente.
Facciamo un esempio concreto: la struttura α-elica. Essa è solitamente avvitata
in senso orario e la sua lunghezza dipende fortemente da che tipo di proteina si
sta considerando. I gruppi chimici costituenti sono prevalentemente quelli peptidici. I legami che stabilizzano l’ordine tridimensionale sono "ponti a idrogeno",
cioè appunto dei legami a idrogeno mostrati in figura 47 come linee tratteggiate.
Questo fa si che le proteine siano fortemente dipendenti dalla temperatura:
aumentando la temperatura non vengono distrutti i gruppi costituenti, però facilmente si distruggono le strutture tridimensionali che tali gruppi formano. Le
energie di legame in termini di temperatura di queste strutture sono intorno
ai 50-60 C ◦ , nel senso che superando queste temperature si rompe la conformazione di questa struttura ed essa torna ad essere bidimensionale come in un
β-sheet.
La banda di assorbimento della struttura ad α-elica è centrata intorno ai 1650
cm−1 . A partire dalla stessa struttura chimica, le strutture planari come i βsheet hanno assorbimenti diversi e cadono a 1630 cm−1 o 1680 cm−1 . Per una
struttura disordinata gli assorbimenti sono di solito molto più larghi.
Se la proteina, come spesso accade, racchiude in sè tutte queste sottostrutture,
le bande di assorbimento saranno una somma di quelle delle singole strutture
con pesi specifici diversi.
La differenza fra le diverse righe di assorbimento e la loro larghezza è dovuta al
fatto che l’approssimazione armonica in questo caso non fornisce un modello così
accurato come può essere ad esempio per solidi cristallini da cui si ottengono
delle bande molto strette.
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
129
Figura 47: Tipica struttura secondaria ad α-elica.
Il fatto di avere tanti gruppi chimici con una precisa disposizione spaziale, può
dar luogo a legami fra gruppi anche distanti fra loro nella singola catena, e ci
può aspettare che la frequenza caratteristica del gruppo possa risentirne.
Quella che dovrebbe essere una delta di Dirac per bande vibrazionali perfettamente armoniche, si allarga per il fatto che le frequenze caratteristiche delle
vibrazioni cambiano punto per punto, e questo a causa di legami fra gruppi
diversi che si "disturbano" a vicenda.
Come detto le bande di assorbimento cambiano pesantemente al variare della
temperatura, e questo permette di avere un’idea di come sta cambiando la sovrastruttura a causa della variazione di un parametro fisico esterno. In figura
48 si vede lo spettro di assorbimento per diversi intervalli di temperatura di
una proteina a elica (spettro blu) che è completamente "srotolata" nello spettro
nero. Quando, ad esempio, si cuoce della carne, le proteine all’interno subiscono
Figura 48: Spettri di assorbimento per una struttura ad α-elica al variare della
temperatura.
un processo di perdita di acqua e cambiano fortemente la struttura.
5
APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR
130
Studio di una cellula Tutto ciò che si trova come applicazioni di spettroscopia IR su materiali biologici è stato ottenuto a partire da modelli semplici,
andando a costruire vere e proprie banche dati.
In figura 49 si può vedere un cellula rotonda, trasparente nella parte centrale,
della dimensione di circa 10 µm. Se si è in grado di misurare lo spettro IR di
questa cellula sul bordo, che assorbe radiazione, dovrebbe vedere principalmente
i picchi relativi ai lipidi trattati in precedenza. Se invece si registra lo spettro
nella parte centrale si dovrebbe ottenere l’assorbimento delle proteine.
Con un laser IR viene campionata la cellula lungo una retta, quindi per diversi
Figura 49: Studio di una cellula in fase di mitosi: in alto vi sono le immagini
ottiche e in basso le ricostruzioni infrarosse nelle fasi di separazione cellulare.
punti spaziali su cui si decide di focalizzare il laser si ottiene uno spettro IR. I
diversi spettri a seconda delle bande che compaiono forniscono informazioni sulla composizione della cellula nei diversi punti, quindi a partire da questi spettri
è possibile ricostruire delle immagini infrarosse della molecola stessa. Questa
tecnica è chiamata spettromicroscopia.
Prendendo una cellula viva, ci si potrebbe domandare quali ripercussioni può
avere quando un fascio laser infrarosso è focalizzato su di esse. In sostanza non
succede nulla: la cellula si riscalda di qualche grado, ma il processo fisiologico
che la cellula avrebbe in assenza di radiazione IR continua praticamente indisturbato. In questo senso la radiazione infrarossa è non ionizzante, ed è possibile
seguire ad esempio il processo di separazione cellulare, la mitosi, e di conseguenza come cambia lo spettro durante questo processo, come mostrato in figura 49.
Come si vede dalle immagini, da una distribuzione sferica si raggiunge una
configurazione bicentrica, e dalla membrana lipidica iniziale deve formarsi una
membrana intermedia che permetta la separazione.
La spettroscopia elettronica invece utilizza radiazioni che sono dannose per le
cellule vive, e in questo senso la spettroscopia IR costituisce una tecnica potente.
Vi sono moltissimi processi cellulari, dal rilascio di un farmaco anti tumorale
alla morte programmata delle cellule che possono essere seguiti e studiati con
gli spettri molecolari IR.
6
6
SPETTROSCOPIA RISOLTA NEL TEMPO
131
Spettroscopia risolta nel tempo
Lo studio della materia non può limitarsi alla definizione di strutture cristalline
stabili in condizioni di equilibrio. Come abbiamo visto nelle precedenti tecniche
spettroscopiche il probe costituisce per il sistema sotto esame una perturbazione
"debole", nel senso che non perturba lo stato del sistema in modo tale da indurre,
ad esempio, una transizione di fase. Tuttavia una eccitazione indotta da una
sonda spettroscopica porta il sistema a transire verso stati ad energia più elevata,
o anche a diseccitarsi se possiede stati eccitati abbastanza popolati.
Queste transizioni possono fornire notevoli informazioni sullo stato del sistema
e sulla sua composizione. Lo studio del regime transiente quindi è fondamentale
se si vuole davvero approfondire la conoscenza di un dato sistema fisico.
Ed è qui che entra in gioco la spettroscopia risolta nel tempo: vogliamo essere in
grado di registrare, con impulsi della durata adeguata, i processi che avvengono
durante le transizioni (in senso generico) del sistema.
Consideriamo il sistema costituito dal target e dalla sonda spettroscopica probe.
Se fra target e probe non vi è interazione, cioè V̂int = 0 l’hamiltoniana del
sistema può essere scritta come:
Ĥ0 =
X
X p̄2
i
~ωk̄λ (n̂k̄λ +
+ φ({r̄i }) +
2mi
i
k̄,λ
{z
} |
|
{z
target
probe
1
)
2
}
Se facciamo ora l’ipotesi che target e probe interagiscano per un certo periodo,
all’espressione precedente si deve aggiungere un termine che tiene conto appunto
di tale interazione.
Abbiamo visto che in regime di risposta lineare il potenziale di interazione può
essere scritto come una parte di target per una di probe, e ciò significa che l’elemento di matrice di scattering è stato scritto usando stati che sono il prodotto
di uno stato target per uno stato probe, infatti si è visto che:
|ii = |ti i |pi i
|f i = |tf i |pf i
Con questi presupposti è stato mostrato che la sezione d’urto dipende da una
funzione di correlazione calcolata fra stati di target, il cui significato può essere
riassunto dicendo che gli stati di target non dipendono dall’intensità della sonda.
Il tempo è una delle quantità fisiche con la più ampia variabilità (figura 50a),
e le proprietà dinamiche del sistema che si vuole indagare con la spettroscopia
risolta nel tempo mostrano intervalli che vanno dai millisec (ad esempio la fusione di un solido) a qualche decina di femtosec (ad esempio una transizione
elettronica).
Per studiare questo tipo di sistemi è necessario un probe di durata temporale
compatibile con l’evento che si vuole studiare.
Prima di tutto il sistema viene mandato fuori dal suo stato di equilibrio tramite
un pump, ovvero un segnale abbastanza forte, tale da perturbare il sistema e
portarlo fuori equilibrio. Il sistema quindi si riporta naturalmente verso lo stato
di equilibrio, ovvero si dice che il sistema rilassa e in questa fase interviene il
probe a "fotografare" la fase di rilassamento. Facciamo ora un esempio concre-
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) La scala dei tempi fisici.
(b) Tempi caratteristici dei processi transienti.
Figura 50
(a) Al tempo zero il pump
agisce sul sistema.
(b) Al tempo ∆t il probe
registra il rilassamento del
sistema eccitato.
(c) Schema di un processo spettroscopico di tipo pump-probe.
Figura 51
132
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Schema di un esperimento
FTIR.
133
(b) Un interferogramma: ovvero in funzione del tempo e dello
spostamento dello specchio.
Figura 52
to: si consideri un materiale semiconduttore, che per un qualche stimolo esterno
diventa metallico. Questo significa che il sistema aumenta la sua opacità e quindi l’intensità trasmessa del probe tenderà a diminuire.
Per studiare un fenomeno del genere si usa la spettroscopia FTIR (spettroscopia
infrarossa in trasformata di Fourier) che sfrutta uno schema interferometrico e
uno specchio mobile. Per ottenere l’intensità trasmessa dal sistema in funzione
della frequenza si può utilizzare un monocromatore, cioè una griglia (grating)
che distribuisce spazialmente la luce proveniente dal campione in funzione della
frequenza, oppure si utilizza un interferometro. In figura 52a si può vedere lo
schema che stiamo considerando: quando i due specchi sono alla stessa distanza
dal beam-splitter si ha il massimo di interferenza costruttiva, e l’interferenza
rende sensibile la dipendenza in frequenza della sorgente rispetto al detector. In
altre parole se si acquisisce l’intensità di radiazione in funzione della posizione
dello spettro si ottengono delle frange di interferenza periodiche. Nel momento
in cui si fa l’operazione di trasformata di Fourier, se si ha una funzione oscillante periodica, si ottiene una funzione piccata (nel limite di funzioni cosinusoidali
si ottiene una delta di Dirac) proprio alla frequenza della radiazione della sorgente. Quindi se la radiazione della sorgente è formata da molte frequenze, la
trasformata di Fourier della figura di interferenza che si ottiene dà una serie
di picchi che sono proprio lo spettro del campione. Per ogni impulso di probe
quindi si ricavano queste immagini del sistema dette interferogrammi, ovvero la
scansione del segnale in funzione dell’andamento dello specchio (figura 52b).
Man mano che il sistema rilassa, cioè da metallico ritorna semiconduttore, aumenta la sua trasmissione e il segnale del probe tende a crescere. Tuttavia se
il ∆t di rilassamento è minore del tempo che impiega lo specchio a muoversi
lungo il braccio dell’interferometro allora non si riesce ad ottenere una fotografia "a fuoco" del sistema. Per risolvere questo problema, ed è quello che si fa
in esperimenti di questo tipo, si tiene fisso lo specchio e si campiona nel tempo
ogni singolo punto. In pratica per ogni istante di tempo si campiona il segnale
(usando un clock elettronico) e si cambia di volta in volta la posizione dello
specchio senza la necessità che questo si muova con una velocità compatibile col
rilassamento (metodo step-scan).
La limitazione di questo metodo è ovviamente l’elettronica: il tempo di clock
arriva fino a 10 ns. La molecola di H2 , ad esempio, ruota in circa 7 fs, quindi
ben più veloce dei tempi accessibili con la tecnica appena descritta.
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Esempio di una molecola di
cristallli liquidi.
(b) Schema di funzionamento
schermi a cristalli liquidi.
134
degli
Figura 53
Invece se si vuole fotografare la propagazione del suono in un certo materiale,
ciò è possibile dato che dato che un fonone acustico si muove ad una velocità di
circa 1 Å ogni 100 fs.
Negli anni 80’ c’è stato un forte sviluppo degli schermi cristalli liquidi (LCD):
un cristallo liquido è una molecola fortemente anisotropa, come ad esempio la
catena mostrata in figura 53a. Queste catene hanno un momento di dipolo molto grande, e se sottoposte ad un campo elettrico queste si allineano. Tuttavia
questi cristalli liquidi sono fortemente ionici e questo significa che gli schermi lcd
non possono essere alimentati in continua: infatti una differenza di potenziale
statica porterebbe l’insieme dei cristalli a migrare verso i capi della ddp, formando una grande corrente ionica che può portare il cristalli liquido a bruciarsi.
Quindi gli schermi sono alimentati in corrente alternata, ma con quale velocità?
La velocità con cui è possibile cambiare il segno del campo elettrico dipende
dalla velocità di orientazione dei cristalli: quindi dipende dal momento di dipolo della molecola e la tecnica pump-probe in trasformata di Fourier permette di
valutare proprio questo rilassamento.
In figura 54b vediamo, ammesso di misurare la vibrazione CN in funzione del
tempo, che l’assorbimento del gruppo CN tende ad aumentare all’aumentare
della frequenza del campo esterno che orienta le molecole. Successivamente,
allo spegnimento del campo, il sistema tende a rilassarsi. Ciò significa che misurando questo tipo di oggetti, e facendo poi la TdF, ottengo uno spettro che
mi dice che l’assorbimento del gruppo specifico aumenta in funzione dell’orientazione: quindi il sistema si orienta e successivamente si rilassa.
Il pump in questo sistema è il campo elettrico applicato alla cella che contiene
le molecole lcd.
Se si vogliono studiare fenomeni più veloci di quelli disponibili con la tecnica descritta si è costretti a cambiare sorgente. Sorgenti spettroscopiche ultra-veloci si
possono ottenere con i laser a luce pulsata. La caratteristiche dei laser a impulsi
sono:
• durata temporale dell’impulso,
• repetition rate;
• energia per impulso;
• lunghezza d’onda di emissione;
• fattore M2.
6
SPETTROSCOPIA RISOLTA NEL TEMPO
135
(a) TdF della figura di assorbimento del gruppo specifico.
(b) Eccitazione e rilassamento di un gruppo specifico
della molecola in funzione del tempo.
Figura 54
6.1
Tecniche di laser pulsing
Ci sono tre tecniche principali per realizzare laser a impulsi, e vogliamo qui
brevemente riportarle.
Q-Switching (>ns) Uno dei due specchi della cavità che racchiude il mezzo
attivo viene sostituito con uno specchio rotante. Quindi la cavità si chiude e si
apre con la frequenza di rotazione dello specchio, e il mezzo attivo si carica con
la medesima frequenza generando un impulso laser di qualche ns. La limitazione
di quest’oggetto è proprio la meccanica che fa ruotare uno dei due specchi.
Mode-Locking (fs-as) Si supponga di avere un laser in continua (quindi il
segnale è una sinusoide) con potenza media di circa 4 mW. La potenza media è
data da:
Potenza media = repetition rate · Energia per impulso
Si immagini ora di prendere il segnale del laser e schiacciarlo in un pacchetto
temporale limitato di forma gaussiana in modo tale che la potenza media rimanga costante.
Quindi se si diminuisce il numero di impulsi al secondo (il repetition rate) è
possibile aumentare l’energia di ogni impulso, che è data dalla potenza di picco
per la durata temporale del pacchetto. La potenza di picco quindi può essere
aumentata riducendo la durata temporale.
Con una potenza media di 1 mW (che è 1/4 della potenza del nostro laser), a
800 nm l’energia di ogni impulso è qualche femto Joule. Ora con una repetition
rate di 10 impulsi al secondo quel che succede è che ogni pulso trasporterà un’energia di 10 µJ. Se questi 10 µJ di energia sono schiacciati in 100 fs di durata
6
SPETTROSCOPIA RISOLTA NEL TEMPO
136
temporale si può avere fino a 1 GigaW di potenza di picco, e si è partiti da 1
mW di potenza media!
Se vogliamo sciogliere un solido col nostro laser a impulsi, lo scioglimento avviene su scale temporali dei ms, ma il sistema sarà sensibile alla potenza media
(il nostro 1 mW), ma gli elettroni sono molto più veloci (rispondono nelle decine/centinaia di fs) e la loro risposta ha una durata temporale compatibile con
la durata del pacchetto laser ipotizzata. Tuttavia mentre lo scioglimento del
materiale sente 1 mW di energia, gli elettroni sono investiti da 1 GW di potenza. Quindi con bassissima potenza, con gradi di libertà ultraveloci, si possono
ottenere campi molto intensi in grado di guidare il sistema fuori dallo stato di
equilibrio.
Il concetto, per riassumere, è non aumentare la potenza media per aumentare
enormemente quella di picco relativa ad ogni impulso.
Per esperimenti di questo genere è altresì necessario realizzare delle statistiche.
Per questo scopo c’è bisogno di un gran numero di eventi al secondo. Nel nostro
caso abbiamo si 1 GW di potenza di picco ma solo 10 eventi/s per fare statistica.
E’ possibile aumentare la statistica a discapito o della potenza di picco oppure
aumentando la potenza media iniziale.
Avere impulsi ultra corti è importante anche per fare tomografia: se ho un campione disomogeneo, le cui disomogeneità sono maggiori della durata temporale
dell’impulso, allora non solo è possibile misurare l’assorbimento ma anche avere
informazione sulla morfologia del campione usando l’impulso come un vero e
proprio sonar.
Come si fa a generare un impulso ultra corto tramite mode-locking?
Si suppone di avere una cavità, che sarà popolata da n modi permessi (figura
55a), e per realizzare l’impulso il maggior numero possibile di modi devono essere in fase, cioè devono essere "lockati" (bloccati) in fase. In figura 55b i modi
hanno una relazione di fase random che danno luogo ad un rumore di fondo
all’interno della cavità, ma se si suppone di avere tutti gli n modi con la stessa
relazione di fase (figura 55c) allora i modi si sommano coerentemente andando
a costruire un modo che nel tempo è come se fosse una delta di Dirac. Aumentando il numero di modi in cavità diminuisce la durata temporale del pacchetto.
Per realizzare ciò si può usare, ad esempio la tecnica del mode-locking passivo
(figura 56): in cavità si trovano sia il mezzo attivo che produce il lasing sia un
assorbitore saturabile che è un oggetto che riesce a fornire la giusta relazione di
fase fra i modi. Esso trasmette il segnale al crescere dell’intensità: in pratica
più intensità riceve più il sistema la trasmette. Quindi se la cavità è popolata
da n modi, sono favoriti solo quelli più intensi mentre gli altri sono assorbiti.
Inoltre se i modi si sovrappongono in fase l’intensità totale aumenta e quindi
questi modi ancora più intensi saranno ancora più favoriti andando quindi, nel
tempo, a selezionare solo i modi sovrapposti con fasi coerenti. Nel gergo della
spettroscopia ultaveloce gli impulsi ultracorti sono chiamati seed. Il seed viene fatto passare attraverso un amplificatore rigenerativo (figura 57): un mezzo
attivo viene caricato con un pump mentre viene fatto entrare il seed il quale,
per emissione stimolata, causerà la diseccitazione del mezzo attivo alla sua stessa frequenza generando un impulso gemello ma con un’intensità molto maggiore.
Vogliamo dare qualche numero per rendere l’idea dei tempi con cui si sta
lavorando. Realizzare un impulso corto dipende dal numero di modi che vengono lockati e quindi dalla banda disponibile. Per il principio di indeterminazione,
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Modi permessi all’interno di
una cavità.
(b) Modi in cavità con fasi
random danno luogo ad un
rumore di fondo.
(c) Modi in cavità con fasi
uguali danno luogo a impulsi piccati e molto stretti nel
tempo.
Figura 55
Figura 56: Schema del Mode-Locking passivo
Figura 57: Schema di un amplificatore rigenerativo
137
6
SPETTROSCOPIA RISOLTA NEL TEMPO
138
per un impulso gaussiano si ha che:
∆ν∆t ' 0.44
e questo significa che se l’impulso è di circa ∆t ' 100 f s allora ∆ν ' 4 T Hz =.
In lunghezza d’onda questo significa che, se ho un laser alla frequenza di 800
nm con una banda di 20 nm, che in frequenza significa 4 THz, posso realizzare
un impulso della durata temporale di circa 100 fs.
Questo tipo di impulsi ha una difficoltà di propagazione: il chirping. Infatti se
l’impulso è esteso in frequenza da 790 a 810 nm, e deve attraversare un materiale
che risponde bene a 800 nm ma risponde diversamente per frequenze che sono
maggiori o minori di questo valore, cioè l’indice di rifrazione del materiale varia
con la frequenza che lo attraversa, allora succede che alcune frequenze del mio
impulso viaggeranno più lentamente di altre, sparpagliando l’impulso stesso,
cioè allargandolo. Questo fenomeno disturba quindi la compattezza dei miei
impulsi. Questo è un limite tecnologico: non tutte le frequenze possono essere
lockate, portando a impulsi non più piccoli di 100 fs a livello di lase commerciali.
Fin’ora abbiamo visto che gli impulsi ultracorti vengono normalmente ottenuti
in laboratorio con laser ottici, ma è possibile realizzarli anche, ad esempio, nei
raggi x?
E’ possibile fare ciò ma bisogna cambiare sorgente, cioè gli elettroni, e costruire
un Free Electron Laser.
Free Electron Lasers (fs-as) I FEL sono basati sull’accelerazione di elettroni. Sono grandi strutture inventate negli anni 80’, ma solo negli ultimi 15 anni
sono stati investiti molti soldi, sia in Europa che negli Stati Uniti per realizzare
FEL sempre più potenti e precisi.
Rispetto ai laser ottici che al massimo possono occupare una stanza, i FEL possono essere lunghi anche 1.5 km.
I FEL producono impulsi laser ad alta intensità e altissima risoluzione spaziale
in un range di freqeunza che va dal lontano infrarosso a raggi x duri.
Essi sono fatti principalmente da due parti: il fotoiniettore e l’ondulatore. Il
fotoiniettore produce pacchetti di elettroni con caratteristiche controllate, che
vengono mandati all’interno dell’ondulatore. Cosa succede al pacchetto di elettroni che entra nell’ondulatore? Descriviamo il fenomeno facendo riferimento
alla figura 58a: l’ondulatore è costituito da una serie di dipoli magnetici alternati N-S e S-N che riproducono un campo magnetico sinusoidale. Questo
campo magnetico agisce sul pacchetto di elettroni che risentiranno di una forza
di Lorentz trasversale al campo e alla direzione di propagazione. Il pacchetto,
formato quindi da cariche che oscillano e variano il loro vettore di velocità e
quindi subiscono un accelerazione, emette radiazione. Infatti come predetto da
Larmor alla fine dell’ 800’ una carica accelerata emette in tutto lo spazio radiazione elettromagnetica. In questo caso però gli elettroni sono accelerati fino a
velocità relativistiche, e l’effetto che ne consegue (per una trattazione completa
si rimanda a [3] cap. 2.7) è che la radiazione viene emessa in avanti entro un cono
di apertura di pochi milli radianti, quindi in un fascio ben collimato. Inoltre la
forza di Lorentz agisce sugli elettroni costringendoli a disporsi in micropacchetti (questo fenomeno è chiamato microbunching) distanziati esattamente di una
lunghezza d’onda di emissione l’uno dall’altro. Questo fa si che la radiazione
emessa da ogni micropacchetto sia in fase con quella del pacchetto successivo
6
SPETTROSCOPIA RISOLTA NEL TEMPO
139
(a) Schema di un ondulatore.
(b) Schema di emissione coerente dovuta
al micro bunching del pacchetto di elettroni
(a sinistra) e dipendenza della potenza dalla distanza percorsa nell’ondulatore in scala
logaritmica (a destra).
Figura 58
(figura 58b a sinistra), facendo si che la radiazione totale emessa da tutto il pacchetto di elettroni iniettato nell’ondulatore subisca un incremento esponenziale
proporzionale alla distanza che viene percorsa all’interno dell’ondulatore (figura
58b a destra).
Il vantaggio di fare esperimenti con i FEL è il seguente: come è noto il problema
dei raggi x è la dose, in quanto una dose eccessiva può essere molto dannosa ad
esempio per tessuti biologici. Il tempo di esposizione per ottenere un’immagine a raggi x ad alta risoluzione diminuisce sensibilmente per questa categoria
di macchine. Inoltre la bassissima divergenza angolare permette di mantenere
l’alta potenza fortemente localizzata.
6.2
L’esperimento di spettroscopia pump-probe
In figura 59 è riportato lo schema tipico di un esperimento pump-probe di assorbimento: dato un laser, in questo caso un laser pulsato al titanio-zaffiro, viene
diviso in due canali, uno per il pump e uno per il probe che vengono preparati al
meglio; dopo essere passo sul campione il segnale di probe passa su di un reticolo
dopo viene diviso nelle sue varie frequenze ed analizzato da un computer.
6.2.1
Esempio di un metallo
Vediamo ora un esempio tipico dell’esperimento appena descritto. Come abbiamo visto trattando il modello di drude, si possono trovare le proprietà ottiche dei
metalli impostando l’equazione del moto per una carica (eq. 4.76) considerando
il termine dissipativo dipendente dalla sua velocità, da cui ricavare il momento
di dipolo totale e quindi le proprietà ottiche fondamentali come permettività e
conducibilità. Inserendo le espressioni di 1 , 2 , σ1 , σ2 all’interno della riflettività si trova, come abbiamo già descritto nella sezione 4.2.3, che essa è prossima
6
SPETTROSCOPIA RISOLTA NEL TEMPO
140
Figura 59: Schema di un esperimento di assorbimento per spettroscopia pumpprobe
ad 1 per i metalli prima della frequenza di plasma ωp (che dipende dal numero di portatori nel metallo) per poi crollare bruscamente a frequenza maggiori.
Possiamo vedere i grafici relativi alla permettività, conducibilità e reflettività
rispettivamente in figura 60a-b-c. Inizialmente il sistema è in equilibrio con una
funzione di distribuzione degli stati di Fermi Dirac:
1
hni =
e
E−EF
KB T
+1
dove EF è l’energia di fermi e T rappresenta la temperatura del sistema all’equilibrio. Vi sono due gradi di libertà: uno reticolare, in quando il solido avrà
delle eccitazioni reticolari, cioè i fononi, e un grado di libertà di assorbimento
dovuto agli elettroni liberi. All’equilibrio la temperatura degli elettroni e quella
del reticolo è la stessa. Se mandiamo sul campione un pump di 100 fs il reticolo
risponde molto più lentamente rispetto agli elettroni, i quali quindi acquisiranno
in qualche decina di fs l’energia trasmessa dal pump.
Con un pump a 800 nm il fotone che viene assorbito dall’aelettrone acquisisce
un’energia di 1.55 eV che va a modificare la funzione di distribuzione di Fermi,
costringendo a definire una nuova energia di Fermi ed una nuova temperatura di
equilibrio. L’ordine delle nuove temperature che si riesce a realizzare con energie di qualche mJ è di 3000-4000 K che possiamo spiegare tramite una relazione
termodinamica nel modo seguente: l’energia assorbita è data da
Ea = M CT ∆T
dove M è la massa, CT è la capacità termica, ∆T è la variazione di temperatura
ed anche con poca energia si hanno delle variazioni di temperatura del bagno
elettronico molto elevata a causa della grande capacità termica degli elettroni.
Tuttavia non tutti gli elettroni liberi sono influenzati dal pump, bensì solo quelli
compresi in due volte l’energia del fotone assorbito.
Successivamente al riscaldamento di solo una frazione del bagno elettronico, la
funzione di Fermi tende a rilassare in qualche centinaia di fs (dipende dal tempo
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Permettività reale 1 e immaginaria 2
per un tipico esperimento di assorbimento
su un metallo.
141
(b) Conducibilità reale σ2 ed immaginaria σ2 per un tipico esperimento di
assorbimento su un metallo.
(c) Riflettività R per un tipico esperimento
di assorbimento su un metallo.
Figura 60
6
SPETTROSCOPIA RISOLTA NEL TEMPO
142
di scattering) e a tempi ancora successivi interviene il reticolo (qualche ps) che
assorbe l’energia residua degli elettroni tramite scattering elettrone-fonone.
Dichiariamo le variabili:
TE temperatura elettronica
TL temperatura reticolare
CE capacità termica elettronica
CL capacità termica reticolare
κ conduttività termica
G costante di interazione elettrone-fonone
H(t) energia depositata dall’impulso di pump
e considerando le assunzioni fondamentali:
i la termalizzazione e-e è molto più veloce del rilassamento e-ph
ii la diffusione dovuta alle impurezze è trascurabile (buona approssimazione
quando il cammino libero medio degli elettroni è piccolo)
iii l’accelarazione dovuta a campi interni o esterni è trascurabile
iv non vi sono altri importanti fenomeni di scattering
allora è possibile studiare un sistema di questo tipo tramite le equazioni:
∂TE
= ∇(κ∇TE ) − G(TE − TL ) + H(t)
∂t
∂TL
CL (TL )
= G(TE − TL )
∂t
CE (TE )
che descrivono rispettivamente elettroni e reticolo. Per i metalli solitamente si
ha che CL ≈ 100CE . In figura 61 sono riportate le quantità macroscopiche che
vengono misurate in questi esperimenti, come la riflettività e la trasmittanza
per un metallo all’equilibrio (blu) e dopo che questo ha assorbito un impulso di
pump (in rosso). Si nota che la trasmittanza aumenta dopo l’impulso, che significa che il metallo sta perdendo la sua caratteristica metallica tendendo verso
un dielettrico. Dall’altra parte ovviamente la riflettività peggiora, ma aumenta
nel tempo in quanto il sistema tende spontaneamente a rilassarsi. Il modello
rappresentato dalle due equazioni scritte permette di calcolare la variazione di
temperatura in funzione del tempo (figura 62): si vede come quasi istantaneamente il bagno elettronico (blu) raggiunga una temperatura di 1000 K mentre il
reticolo (rosso) abbia una risposta più lenta e raggiunga temperature inferiori.
Le proprietà di un metallo tendono a peggiorare con la temperatura in quanto
si riduce il tempo di scattering con conseguente diminuzione di riflettività e aumento della trasmittanza.
Il tempo di scattering elettrone-elettrone va come
τe−e ∼
1
EF
6
SPETTROSCOPIA RISOLTA NEL TEMPO
143
Figura 61: Trasmittanza e riflettività di un metallo all’equilibrio (in blu) e
tramittanza e riflettività di un metallo dopo un impulso di pump (in rosso).
Figura 62: Variazione di temperatura in funzione del tempo del bagno
elettronico (in blu) e del reticolo (in rosso).
6
SPETTROSCOPIA RISOLTA NEL TEMPO
144
In un sistema perturbato non si può definire una vera e propria energia di
fermi, tuttavia si può definire una EF efficacie in quanto il sistema aumenta
la sua energia perchè tende a riequilibrarsi. La conducibilità immaginaria σ2
in funzione della frequenza è una lorenziana descritta dai parametri frequenza
di plasma ωp e tempo di scattering τ , ma il tempo di scattering è dato dalla
somma in quadratura dei singoli tempi di scattering cioè:
1
1
1
=
+
τ
τe−e
τe−ph
ma se taue−e diminuisce il tempo di scattering totale diminuisce, e se ωp rimane
costante allora la σ2 si allarga e si abbassa, ma se la conducibilità ottica diminuisce diminuisce anche la riflettività, e la trasmittanza aumenta.
6.2.2
Esempio di un semiconduttore
Quando un fotone incide su un semiconduttore e viene assorbito, un elettrone
della banda di valenza viene promosso in banda di conduzione: si ha una transizione interbanda. Tuttavia non solo è possibile investigare questa transizione
ma anche controllare lo stato di target.
Se si ipotizza di promuovere molti elettroni dalla banda di conduzione a quella
di valenza allora il semiconduttore dovrebbe aumentare le proprie caratteristiche metalliche e quindi la conducibilità e la riflettività. E’ possibile fare questo
con un segnale ultracorto di elevata potenza.
In figura 63a vediamo l’impulso di probe trasmesso prima e dopo il pump. Prima dell’impulso il probe vede un certo valore di trasmittanza che si riduce
notevolmente dopo l’impulso in quanto il semiconduttore acquisisce caratteristiche metalliche. In figura 63b invece si vede la riflettività: prima dell’impulso
il sistema riflette pochissimo ma quando ho la coincidenza fra pump e probe si
registra un brusco aumento di riflettività. Se si hanno due segnali nell’ottico che
durano circa 100 fs l’uno (∼ 30µm di lunghezza spaziale), che si propagano per
il laboratorio su distanze tipiche di 5-10 m, si vuole ritrovare la coincidenza temporale di due impulsi lunghi 30 micron. Per fare ciò si usa un sistema campione,
in genere il GaAs: l’aumento di riflettività funziona da rivelatore del fatto che
i due impulsi sono sovrapposti (un cross-check). Questo tipo di esperimento su
campioni di GaAs si effettua solitamente prima dell’esperimento vero e proprio,
una sorta di calibrazione della sovrapposizione temporale dei due impulsi.
Per quanto riguarda i processi di rilassamento, sempre considerando il GaAs, si
possono avere diversi processi di diseccitazione: la diseccitazione diretta fra la
banda di conduzione e la banda di valenza con l’emissione di un fotone di energia
pari all’energia della gap; si può avere una ricombinazione di livelli eccitonici
donori-accettori, oppure fra donore-valenza o fra accettore-conduzione. Inoltre
si può avere il processo Auger: è un processo non radiativo in cui l’elettrone di
diseccita dalla banda di conduzione a quella di valenza, ma l’energia prodotta
nella transizione serve a far transire un elettrone vicino dalla banda di valenza
a quella di conduzione.
In generale si possono avere ricombinazioni interbanda ma anche combinazioni
intrabanda che sono processi diagonali all’interno di una stessa banda a vettore
d’onda scambiato grande e sono di solito i processi che coinvolgono i fononi.
In figura 64 si vede a sinistra la parte immaginaria ed a destra la parte reale
6
SPETTROSCOPIA RISOLTA NEL TEMPO
145
(a) Impulso di probe trasmesso prima (in blu) e dopo
(in rosso) l’impulso di pump.
(b) Riflettività del GaAs prima e dopo l’impulso di
pump..
Figura 63
dell’inverso delle funzioni dielettriche. Si vede che all’equilibrio si ha un fonone
tra i 9 e 10 THz e nel momento in cui si stimola il sistema con un pump si
vede la formazione di una quasi-particella e la transizione metallica descritta
dal grafico che coincide con quello che si avrebbe seguendo il modello di Drude che modellizza i metalli. Questo processo crea un plasma di eccitoni (una
nuvola di elettroni e lacune) che diseccitandosi emette un segnale a bassissima
frequenza (circa 5 mev, nel lontano infrarosso) e quindi questo meccanismo può
essere usato per realizzare sorgenti nel lontano infrarosso.
6.2.3
Esempio di un superconduttore
Il fenomeno della superconduttività coinvolge la creazione di coppie di Cooper :
una coppia di Cooper è uno stato legato fra due elettroni, la cui interazione è
mediata dall’interazione con il reticolo.
La differenza fra un fluido normale e un fluido superconduttivo è la seguente: un
superconduttore in genere è un buon metallo, che quindi presenta una risposta
metallica e può essere rappresentato come un fluido normale (di elettroni). Il
passaggio da fluido a superfluido, e quindi da buon conduttore a superconduttore avviene quando una parte degli elettroni del fluido condenserà creando coppie
di Cooper. Questa transizione avviene ad una temperatura specifica.
I fenomeni superconduttivi sono stati scoperti all’inizio del ’900 quando si facevano esperimenti sul mercurio a 4 K. Ciò che avveniva è una vera e propria
condensazione degli elettroni, dovuta all’interazione con il reticolo. In figura
65a si può vedere la transizione da conduttore a superconduttore: quella in rosso rappresenta la normale conducibilità reale del conduttore per temperature
T > TC dove TC è la temperatura critica alla quale avviene la transizione a
6
SPETTROSCOPIA RISOLTA NEL TEMPO
146
Figura 64: Parte reale (a destra) e immaginaria (a sinistra) dell’inverso della
funzione dielettrica del GaAs per tempi di sovrapposizione fra pump e probe
diversi. tD è il delay time.
superconduttore. Come sappiamo i semiconduttori conducono moltissimo: per
piccoli potenziali applicati le coppie di Cooper all’interno del superconduttore
acquistano una grande energia cinetica, e questo significa che si ha un grande
termine induttivo. Invertendo la differenza di potenziale il sistema mostra una
grandissima inerzia: le cariche impiegano molto tempo a rallentare e la conducibilità reale tende rapidamente a zero.
Quando le coppie di Cooper condensano, si legano con una energie per elettrone
pari a ∆ ovvero una coppia di Cooper "costa" 2∆ che rappresenta quindi l’energia di formazione della coppia. Se fornisco al superconduttore un fotone di
energia ~ω > 2∆ avviene che le coppie si slegano e la risposta torna a tendere a
quella di un normale metallo tipo Drude.
La risposta della conducibilità può essere ricavata dal modello a due fluidi, in
cui la risposta totale è una combinazione lineare delle due risposte.
E’ possibile dividere l’effetto dello slegamento delle coppie di Cooper a causa
dell’applicazione di un pump sulla densità degli stati in 3 step.
Step 1 un impulso di energia ~ωIR nel vicino infrarosso (1.5 eV) rompe le coppie
di Cooper (2∆ ∼ 10 meV) creando un eccitoni ad alta energia (fig 66a),
cioè quasi particelle formate da elettroni slegati;
Step 2 gli eccitoni acquistano energia dell’ordine del eV, dato che l’energia dell’impulso è molto maggiore di 2∆. Le coppie slegate quindi hanno alta energia
e causano la rottura di altre coppie di Cooper scatterando e rilassandosi
attraverso la gap;
Step 3 le quasi particelle in eccesso (gli eccitoni) ricombinano e la gap ritorna al
valore iniziale.
Quando si rompono le coppie di Cooper eccitando il sistema, si ha una rottura
delle coppie in cascata, portando la conducibilità σ2 verso una risposta tipo
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Parte reale della conduttività di un superconduttore sopra
(in rosso) e sotto (in blu) la
temperatura critica TC .
147
(b) Conducibilità ottica: la linea continua rappresenta la risposta superconduttiva e la linea
tratteggiata rappresenta la conducibilità tipica dei metalli tipo
Drude.
Figura 65
metallo, e da cui, successivamente ci si aspetta un rilassamento per tornare alla
risposta superconduttiva. Dopo 300 ps, che è un tempo molto grande per la
fisica della materia, la risposta iniziale non è stata ancora ripristinata, e questo
è dovuto all’effetto di rotture in cascata citato inizialmente. Questo è dovuto al
fatto che si è usato un impulso troppo energetico, che rompe troppe coppie di
Cooper, e qui si ha un limite tecnologico in quanto non si è ancora in grado di
avere sorgenti abbastanza deboli (da 1 eV si vuole passare a 10 meV) nel lontano
infrarosso.
Il limite tecnologico si basa sul fatto che per ora non si è in grado di rompere
poche coppie di Cooper e osservare quindi la dinamica intrinseca del superconduttore. Infatti questa dinamica ad oggi è mascherata da una dinamica esterna
dovuta al fatto che si rompono troppe coppie di Cooper a causa dell’effetto cascata e questo maschera il rilassamento del sistema rendendolo troppo lento.
Fin’ora abbiamo considerato metalli sondati con pump e probe entrambi
nell’ottico; poi nei superconduttori si è visto un pump ottico (che costa di meno
commercialmente) e un probe nel lontano infra rosso a bassa energia. Ora
vogliamo cambiare tecnica spettroscopia e passare alla fluorescenza.
6.3
Spettroscopia tramite fluorescenza
La spettroscopia tramite fluorescenza è molto usata nei sistemi biologici.
Per spiegare come funziona questa tecnica facciamo un esempio. Si considera
una molecola nello stato fondamentale. Si applica un pump nell’ottico e la molecola transisce verso un certo stato eccitato. Successivamente il sistema tende a
rilassarsi tramite processi non radiativi, ad esempio per transizioni vibrazionali.
Una volta arrivata allo stato elettroni più basso dopo varie transizioni vibrazionali verso il basso essa tenderà a diseccitarsi in maniera radiativa emettendo
radiazione elettromagnetica: l’emissione di radiazione si esplica proprio nella
fluorescenza del materiale.
La fluorescenza è un fenomeno speculare all’assorbimento: si ha una transizione
principale la quale però contiene transizioni vibrazionali minori (figura 67b),
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Step 1: l’impulso rompe molte coppie di Cooper creando un
eccitoni.
(b) Step 2: gli eccitoni ad alta
energia che si sono formati scatterano e distruggono altre coppie
di Cooper.
(c) Step 3: le quasi particelle in eccesso si ricombinano restaurando il
valore iniziale della gap.
Figura 66
148
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Transizione di fluorescenza.
149
(b) Assorbimento e fluorescenza convoluti con
transizioni vibrazionali.
(c) Fluorescenza associata ad un rilassamento del
sistema.
Figura 67
per cui nello spettro di assorbimento ciò che si vede sono proprio le transizioni
vibrazionali. Anche lo spettro di fluorescenza quindi avrà gli stessi picchi vibrazionali.
Supponiamo di eccitare il sistema, il quale inizierà ad emettere luce per fluorescenza. Durante quest’emissione però il sistema potrebbe evolvere da uno stato
al non equilibrio eccitato verso uno stato eccitato all’equilibrio (figura 67c), cioè
durante il processo di fluorescenza vi è anche una dinamica di rilassamento del
sistema. In figura 68 vediamo un caso concreto di questa tecnica. Si è considerata la molecola di Cumarina, molecola polare che viene immersa in un solvente
anch’esso polare. Nel momento in cui viene eccitata, il momento di dipolo della
molecola cambia. Il solvente quindi sente il cambio di momento di dipolo della
molecola e l’intorno chimico del sistema tende a riarrangiarsi. Questo riarrangiamento del sistema avviene con la diminuzione di energia del livello eccitato, e
questo si ripercuote sullo stato fondamentale della molecola che invece tenderà
ad aumentare.
Quindi lo spettro emesso subisce in frequenza un red-shift: la frequenza della
fluorescenza si sposta verso lunghezze d’onda maggiori. Il tempo di spostamento dipende ovviamente dal tempo in cui le molecole intorno alla cumarina si
riarrangiano. Si osserva (ma non lo dimostriamo) che questo processo è bifasico: la figura 68b è divisa in tempi corti (ps) e tempi lunghi (centinaia di ps) in
cui vi è un cambio di concavità per la forma della curva di diseccitazione. Su
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Molecola di cumarina.
150
(b) Spettro di fluorescenza della molecola di Cumarina: c’è uno spostamento verso lunghezza d’onda
maggiori a causa del riarrangiamento del solvente
intorno alla molecola.
Figura 68
Figura 69: Fotoemissione riolta in angolo e in tempo
scale temporali più grandi infatti il sistema, che si è riarrangiato velocemente
solo nell’intorno chimico della molecola, si riarrangia anche su scale maggiori, e
questo da luogo al cambio di forma che si vede in figura.
6.4
Fotoemissione risolta in angolo e in tempo: Tr-Arpes
La fotoemissione risolta in angolo permette di ottenere la dispersione a bande
elettronica del campione. Negli ultimi anni si è riusciti ad implementare questo
tipo di fotoemissione anche risolta nel tempo.
In figura 69 vediamo lo schema di questa tecnica: il pump (1.55 eV) porta il
sistema fuori dall’equilibrio, mentre il probe (6 eV) arriva con un certo ritardo con una energia molto maggiore del pump e fa si che il sistema fotoemetta
elettroni. Si riesce ad avere uno studio dell’occupazione delle bande in funzione
del tempo: in figura 69 si vede un sistema molto studiato in questi anni, un
isolante topologico, cioè un sistema che misto metallo-isolante, fatto da un bulk
di materiale isolante che all’interfaccia con un altro materiale forma degli stati
metallici di superficie.
Quello che può essere interessante studiare è proprio l’accoppiamento fra lo stato
di bulk e lo stato di superficie. Abbiamo visto che eccitando un isolante que-
6
SPETTROSCOPIA RISOLTA NEL TEMPO
151
sto diventa metallico mentre un metallo tende a peggiorare le proprie proprietà
metalliche e quindi tende a diventare isolante. Quello che succede, in linea di
principio, è che l’isolante topologico, che possiede entrambe le fasi, se sottoposto
ad un pump peggiora la parte metallica e migliora le proprietà di quella isolante.
Guardando i risultati di fotoemissione si vedono le bande di bulk in basso e le
bande di superficie che si incrociano e che sono metalliche. Al tempo zero si
promuovono elettroni dalla banda di valenza a quella di conduzione del bulk;
dopo pochi istanti, dal bulk, attraverso transizioni radiative e non, tendono a
ricadere sulla banda di valenza. La cosa interessante è che si vede un accoppiamento fra gli stati di bulk e quelli di superficie: il bulk eccitato inietta portatori
nelle bande di superficie che si riempiono nell’intervallo di circa 5 ps. Anche in
questo caso l’iniezione da bulk a superficie è mediata dall’interazione elettrone
fonone.
6.5
Diffrazione a raggi-x ultraveloce
Tramite i FEL possono essere effettuati esperimenti di spettroscopia ultraveloce
non convenzionali. La sorgente FEL di Stanford (LCLS) che attualmente è
la più grande al mondo, produce impulsi che possono essere tunati fino a una
lunghezza di 4 nm e una durata temporale di 10 fs (durata compatibile con un
transizione elettronica). La repetition rate è anch’essa molto elevata: si hanno
circa 30mila impulsi al secondo.
Con questo laser è possibile fare diffrazione da raggi-x: se si ha un campione
biologico in particolare tramite l’impulso non solo cambio lo stato del campione
ma per tempi abbastanza lunghi lo posso distruggere.
La velocità del suono, su scale atomiche è circa 0.1 Å in 100 fs, e ciò significa
che l’impulso dura circa 10 fs, in questo tempo qualsiasi atomo all’interno del
campione percorre meno di un centesimo di Å. Questo spazio è inferiore allo
spazio di slegamento degli atomi del sistema sottoposti all’impulso: in pratica
la sonda è così veloce da permettere di ottenere immagini del sistema prima
ancora che esso si disgreghi a causa dell’impulso stesso.
In figura 70 si vede che per ottenere ciò si usa un iniettore di particelle che
"spara" il campione sul laser per ottenerne un’immagine prima che il campione
stesso sia disintegrato. Uno dei primi esperimenti fatti con LCLS è stato lo
studio dei Mimivirus: questi sono virus macroscopici rispetto ai virus normali,
tanto da tendere verso la dimensione dei batteri. Questi oggetti sono virus o
batteri?
E’ stato dimostrato che i batteri sono in grado di prendere decisioni, e sono
considerati esseri viventi, mentre i virus sono inanimati. Qual è la transizione
tra vivente e non vivente? Si sono studiati i mimivirus proprio per tentare di
dare una risposta a questa domanda.
Per fare la diffrazione a raggi-x di una proteina la si mette in un array di proteine,
cioè si tende a formare un cristallo; questo perchè la diffrazione su un cristallo
produce una amplificazione coerente, e quindi si ha un’immagine di diffrazione
che ha un alto contrasto anche con una radiazione di bassa intensità. Se invece
prendo la singola proteina bisogna aumentare l’intensità della radiazione, che
però danneggia la proteina, e quindi bisogno notevolmente ridurre la durata
temporale dell’impulso. Queste condizione sono soddisfatte dai FEL.
Quindi i mimivirus sono stati iniettati sul fascio di impulsi: non è stato possibile
controllare l’orientazione di ogni particella, ma analizzando ogni immagine si può
6
SPETTROSCOPIA RISOLTA NEL TEMPO
152
Figura 70: Schema di un esperimento di diffrazione a raggi x ultraveloce tramite
FEL.
effettuare una ricostruzione della struttura del mimivirus. Quello che è stato
dimostrato è che queste particelle in realtà sono dei virus, e non dei batteri, ma
hanno un genoma completo e allo stato attuale sono i virus più complessi che si
conoscano.
6
SPETTROSCOPIA RISOLTA NEL TEMPO
(a) Il mimivirus a confronto.
(b) Varie immagini di diffrazione del mimivirus: ad ogni immagine corrisponde un
mimivirus diverso.
(c) Ricostruzione 3D del mimivirus.
Figura 71: Mimivirus studiato tramite FEL
153
RIFERIMENTI BIBLIOGRAFICI
154
Riferimenti bibliografici
[1] Dispense Mazzacurati;
[2] F. Bassani, U.M. Grassano; Fisica dello stato solido.
[3] S. Mobilio, F. Boscherini; Syncrothron Radiation; Edizioni Springer.
[4] Presentazione sulle applicazioni biologiche della spettroscopia IR, Prof.
Stefano Lupi;
[5] Presentazione sulla spettroscopia pump-probe, Dott. Flavio Giorgianni;