Metodi spettroscopici della materia condensata Appunti di Lorenzo Tenuzzo Prof. Stefano Lupi a.a. 2015/2016 1 Prefazione Gli appunti che state per leggere sono stati presi durante il corso di Metodi spettroscopici per la materia condensata tenuto dal professor Stefano Lupi presso l’Università "La Sapienza" di Roma durante l’anno accademico 2015-2016. Sono per lo più sbobinature delle lezione riorganizzate per rendere la divisione dei vari argomenti più chiara. Non sono state sottoposte alla valutazione del professore quindi mi scuso per errori o sviste sicuramente presenti all’interno. Alcune figure sono state ottenute con paint (e si vede) mentre altre sono state prese direttamente dai lucidi mostrati durante le lezioni. E’ consigliato, per capire al meglio queste dispense, di aver seguito e studiato i corsi di Materia Condensata e di Fisica dei Solidi I. La figura in copertina è il dipinto "Rooms by the sea" dell’artista americano Edward Hopper realizzato nel 1951. Buona lettura Lorenzo Tenuzzo INDICE 2 Indice 1 Introduzione 3 2 La spettroscopia 2.1 Operatore di Scattering . . . . . . . . . . . . . . . . . . . . . . . 2.2 La sezione d’urto . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Teorema della risposta lineare per la spettroscopia . . . . 5 10 18 19 3 Scattering da neutroni termici 26 3.1 Funzione di Van Hove, funzione di scattering, fattore di struttura statico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2 Studio di un gas perfetto . . . . . . . . . . . . . . . . . . . . . . . 32 3.3 Studio di un gas reale . . . . . . . . . . . . . . . . . . . . . . . . 35 3.4 Studio di un solido ordinato . . . . . . . . . . . . . . . . . . . . . 37 3.4.1 I fononi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.4.2 Risposta Coerente e Risposta Incoerente . . . . . . . . . . 44 3.5 Studio di un solido amorfo e di un liquido . . . . . . . . . . . . . 61 4 Spettroscopia da campo elettromagnetico 67 4.1 Dalle equazioni di Maxwell alla quantizzazione del campo elettromagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 4.2 Interazione radiazione-materia . . . . . . . . . . . . . . . . . . . . 71 4.2.1 Processi ad 1 fotone: assorbimento ed emissione . . . . . 72 4.2.2 Proprietà ottiche e Modello di Drude . . . . . . . . . . . . 77 4.2.3 Transizioni interbanda e intrabanda e processo sperimentale 88 4.2.4 Interazione con un gas di elettroni liberi . . . . . . . . . . 91 4.2.5 Interazione con un reticolo di ioni e Modello di Lorentz . 96 4.2.6 La polarizzabilità . . . . . . . . . . . . . . . . . . . . . . . 101 4.3 Scattering da campo elettromagnetico . . . . . . . . . . . . . . . 106 4.3.1 Studio di un cristallo di atomi . . . . . . . . . . . . . . . 113 4.3.2 Studio di un gas perfetto . . . . . . . . . . . . . . . . . . 116 4.3.3 Studio di un gas reale . . . . . . . . . . . . . . . . . . . . 117 4.3.4 Studio di un gas biatomico di molecole scorrelate: Raman vibrazionale e Raman Rotazionale . . . . . . . . . . . . . 119 5 Applicazioni Biologiche della spettroscopia IR 6 Spettroscopia risolta nel tempo 6.1 Tecniche di laser pulsing . . . . . . . . . . . . . . . . 6.2 L’esperimento di spettroscopia pump-probe . . . . . 6.2.1 Esempio di un metallo . . . . . . . . . . . . . 6.2.2 Esempio di un semiconduttore . . . . . . . . 6.2.3 Esempio di un superconduttore . . . . . . . . 6.3 Spettroscopia tramite fluorescenza . . . . . . . . . . 6.4 Fotoemissione risolta in angolo e in tempo: Tr-Arpes 6.5 Diffrazione a raggi-x ultraveloce . . . . . . . . . . . . Riferimenti bibliografici 121 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 135 139 139 144 145 147 150 151 154 1 1 INTRODUZIONE 3 Introduzione Il programma di massima del corso prevede una prima parte sulle generalità relative alla spettroscopia intesa come interazione tra il sistema fisico che si vuole studiare (target) con una sonda spettroscopica (probe). L’interazione probetarget in regime lineare implica, in generale, che l’interazione sia così debole che si stia scattando, tramite il probe, una "fotografia" (con una certa risoluzione spaziale e temporale) del sistema target come se fosse non perturbato. Questo non significa necessariamente che la perturbazione sia debole, bensì che in certe situazioni si possa considerare che essa non determini grosse variazione sul sistema. Quindi un sistema che subisce questo tipo di eccitazioni, mantiene le eccitazioni con la stessa curva di dispersione energia-impulso, le stesse frequenze caratteristiche ecc ecc, in presenza o in assenza della perturbazione esterna. Tutto ciò può essere trattato in forma del tutto generale dal punto di vista matematico introducendo l’operatore di scattering (o matrice di scattering) che è una trattazione mutuata dalla fisica delle particelle elementari: alla matrice di scattering verrà associato il teorema della risposta lineare. Tutto ciò serve ad inquadrare in modo generale, al di là delle approssimazioni che siamo abituati a fare, l’interazione tra un probe e un target. Quando però verrà scritto equilibrio e fuori equilibrio, si comincerà a descrivere cosa succede quando si utilizzano sonde spettroscopiche particolarmente intense oppure che hanno delle caratteristiche temporali particolari. Nella maggior parte dei casi fino a circa 15 anni fa, le spettroscopie usate per studiare sistemi fisici erano nel campo delle frequenze e dei vettori d’onda, per cui si studiavano proprietà all’equilibrio con l’idea di non perturbare particolarmente il sistema. In realtà da 15/20 anni a questa parte con lo sviluppo dei laser ultraveloci e con le tecniche ultraveloci in generale, si riescono a fare misure in cui, piuttosto che studiare le eccitazioni nel dominio delle frequenze le si studiano nel dominio dei tempi, riuscendo ad eccitarle e studiare la loro evoluzione e decadimento temporale. Questa spettroscopia è ben diversa da quella a cui si era abituati perché, innanzi tutto, fornisce informazioni "fuori equilibrio" (cioè si perturba in modo consistente un sistema e ne si studia il decadimento temporale) e in secondo luogo permette di studiare i tempi caratteristici di evoluzione di un sistema fisico. Le prime misure su scale temporali ridotte (ordine del picosecondo) sono state realizzate (ed hanno fruttato il nobel per la chimica nel 2013 ad Arieh Warshel) per studiare l’evoluzione temporale delle reazioni chimiche indotte dall’esterno. Successivamente vedremo altre tecniche come lo scattering di neutroni, tecnica potentissima in fisica, chimica e biotecnologie, concentrandoci su cosa si può studiare con una determinata tecnica. L’idea di base è che quando si fa interagire una sonda spettroscopica con il sistema, la sonda che è descritta da una propria hamiltoniana interagisce con il sistema (la radiazione elettromagnetica interagisce con i dipoli, i neutroni interagiscono con i nuclei del target, lo scattering Raman e Brillouin interagisce con le fluttuazioni di densità del sistema ecc ecc). Per ogni sonda spettroscopica è molto importante definire quali sono le eccitazioni e le fluttuazioni del sistema che interagiscono direttamente con quella particolare sonda e capire quindi che tipo di informazione si può ricavare. Obiettivo del corso è rendere lo studente, di fronte ad un problema fisico, capace di scegliere la tecnica spettroscopica adeguata. Infine verrà studiata la spettroscopia odierna: cosa si intende per spettroscopia 1 INTRODUZIONE 4 pump-probe risolta nel tempo, cosa significa risolvere in tempo una eccitazione di un sistema. Quando si parla di risoluzione temporale, buona parte delle di eccitazione che vivono nei sistemi condensati hanno tempi caratteristici che vanno dai picosecondi agli attosecondi (10−12 − 10−18 s). Un buon sistema elettronico ha sensibilità delle centinaia di picosecondi (ps), per andare a tempi minori bisogna usare laser ultraveloci, al femtosecondo (fs) o all’attosecondo (as), e questo dà luogo a quella che viene chiamata spettroscopia ultraveloce pump-probe e ne vedremo qualche applicazione. Normalmente l’ambizione di un sistema spettroscopico è, in linea di principio, quello di fotografare al meglio le eccitazioni, di risolvere la loro dinamica temporale, e di sapere in che range spaziale queste vivono. In altri termini l’interesse è quello di studiare con risoluzione spaziale adeguate applicazioni nanotecnologiche. Sappiamo che se si ha una radiazione elettromagnetica di lunghezza d’onda λ, non è possibile focalizzare il fascio su distanze minori o dell’ordine di λ stessa (legge della diffrazione). Quindi se si vuole misurare con radiazione nell’infrarosso (circa 10 µm = 1000 cm−1 ) non è possibile ad esempio focalizzare (qualunque sia lo strumento) un oggetto più piccolo di 10 µm, anche se esso ha spettro di assorbimento in quella regione di frequenza. Di fatto si va a misurare una zona più grande che contiene l’oggetto target ma anche altre cose. Tuttavia esiste la tecnica di spettroscopia ottica in campo vicino che permette di fare spettroscopia trascurando i limiti della diffrazione. E’ legata a sonde ottiche (quindi radiazione elettromagnetica) ed è molto di moda ultimamente. La modalità d’esame è la seguente: si porta un argomento a piacere di quelli compresi nel programma, si porta inoltre una tesina fra quelle indicate sul sito del professore (presentazione con slide di uno o più articoli che si riferiscono ad un certo sistema fisico o tecniche specifiche) e infine a discrezione del prof. ci sono domande sul resto del programma. Ci sono appelli definiti ma si prende l’accordo con il prof. a prescindere dalla data ufficiale. 2 2 LA SPETTROSCOPIA 5 La spettroscopia Quando si parla di target in materia condensata si intende un mondo molto ampio che va dai sistemi di macromolecole in ambito biologico alla fisica dello stato solido ai beni culturali. Nella maggior parte dei casi un sistema condensato vive all’equilibrio termodinamico ed è caratterizzato da eccitazioni sia di singola particella (elettroni in un metallo, in cui ogni elettrone sottoposto ad urti elastici si muove in un certo modo, o le vibrazioni dei gruppi chimici o molecole) che di modi collettivi. Il concetto di modo collettivo è stato esteso recentemente anche a sistemi poco attinenti con la fisica. In un sistema condensato si trovano, coesistenti, eccitazioni di singola particella e modi collettivi e spesso sono l’uno lo specchio dell’altro: ad esempio, in un metallo in cui ci sono elettroni liberi, i modi di singola particella si riferiscono ai modi dei singoli elettroni che si muovo scatterati nel metallo, sottoposti all’interazione con gli ioni ed elettrone-elettrone; tuttavia i singoli elettroni danno luogo a modi collettivi, cioè è l’intero "gas di elettroni liberi" che si muove e la sua densità fluttua. Un altro esempio sono i fononi, che sono le eccitazioni quantistiche relative al modo collettivo che è la variazione di densità di un cristallo. Buona parte di queste cose sono traducibili in meccanica quantistica: se si ha un modo collettivo che contiene molte particelle, esso può di solito essere quantizzato, e i modi quantistici si chiamano fononi nel caso di un reticolo, magnoni per le eccitazioni collettive di un sistema di spin ecc ecc. Non necessariamente una spettroscopia capace di misurare i modi collettivi di un sistema è in grado di misurare anche le eccitazioni di singola particella. L’idea generale dell’interazione tra un probe spettroscopico il target sta in questo: si ha un certo tipo di probe, che si cerca di preparare nel modo più preciso possibile. Questo significa che si conoscono le energie iniziali (ad esempio degli elettroni) e quindi il fascio è il più monocromatico possibile, con vettore d’onda e polarizzazione ben definiti. In pratica lo stato iniziale del probe deve essere ben definito. Questo perché si manda il probe ben conosciuto sul sistema e ciò che si misura è il probe stesso dopo che ha interagito, cioè si misurano quali effetti il target ha avuto sul probe. La misura di come il probe è stato perturbato dall’interazione con il sistema spettroscopico (energia finale, vettore d’onda finale e polarizzazione finale) permette di dedurre da leggi di conservazioni generali con che cosa il probe ha interagito e che tipo di proprietà hanno i modi collettivi o di singola particella che hanno interagito col probe. In altri termini misurando le tre quantità citate (o altre a seconda del probe), − cioè per trovare il vettore d’onda scambiato → q dal probe col sistema si misura la differenza → − → − → − → − → − q = k pf − k pi = k ti − k tf → − → − dove k ti,f e k pi,f rappresentano rispettivamente i vettori d’onda iniziale e finale di target (t) e probe (p). Se ad esempio il sistema parte da uno stato a vettore → − − d’onda nullo k ti = 0, → q rappresenta il vettore d’onda che il target ha acquisi− to grazie all’interazione. All’interno di → q ci possono essere vari fenomeni, ad → −t → −t esempio può capitare che k f < k i che è chiamato processo anti-stokes: processo in cui il probe guadagna vettore d’onda ed energia a sfavore del sistema. Il processo complementare è quello stokes in cui è la sonda a fornire energia ed impulso al sistema. Se si considera il sistema come isolato vale, per l’energia, una relazione analoga 2 LA SPETTROSCOPIA 6 Figura 1: Curve di dispersione del silicio nella prima zona di Brillouin nello spazio reciproco. a quella vista prima per il vettore d’onda, e quindi, con evidente significato dei simboli si ha che ~ω = Eip − Efp = Eft − Eit da cui si possono dedurre moltissime informazioni. In figura 1 si vede il grafico di dispersione del silicio in cui si ha la frequenza in THz (1012 Hz) vs il vettore d’onda in diversi punti della prima zona di Brillouin nello spazio reciproco. Le curve sono le curve di dispersione fononiche (frequenza-impulso) e dicono che a vettori d’onda diversi l’energia che serve per eccitare il reticolo è in generale diversa. Dispersione vuol dire che le frequenze caratteristiche di oscillazione dell’intero reticolo dipendono dal vettore d’onda che si considera. Se si usano i neutroni e si misura il vettore d’onda scambiato, le − quantità → q e E = ~ω, stanno campionando rispettivamente l’asse delle ascisse e quello delle ordinate. L’idea è che si mandi la sonda sul sistema misurando, ad esempio in un processo stokes, il momento che è stato ceduto al target ad una certa energia specifica (misurata in quanto il neutrone ha perso energia) ed è possibile così campionare punto dopo punto la curva di dispersione dell’eccitazione collettiva (fononica in questo caso). Questo tipo di processo fornisce − nello spazio di Fourier → q , ω la fotografia dell’eccitazione che ha interagito con il neutrone. Sostituendo al neutrone un altro tipo di sonda e si possono così campionare curve di dispersione in generale. Per essere più precisi, le curve di dispersione sono l’espressione fisica dei modi collettivi, che in generale in un sistema condensato è descritto dalla curva di dispersione vettore d’onda-energia, ma che non è necessariamente vero per eccitazioni di singola particella (ma le equazioni viste sono valide in generale, magari estendendole alla polarizzazione e al momento angolare). In ogni caso, riassumendo, l’idea di funzionamento è la seguente: • conoscere al meglio lo stato cinematico iniziale del probe 2 LA SPETTROSCOPIA 7 • misurare lo stato cinematico finale del probe (che può essere costituito da molti stati finali) • dedurre informazioni sul sistema. Quando si parla di spettroscopia da neutroni (NS: neutron scattering), normalmente si usano neutroni termici. Un neutrone termico è un neutrone che ha un’energia media dell’ordine di 300 K, che corrisponde a circa 25 meV. Per fare spettroscopia da neutroni c’è bisogno di un reattore nucleare che produca neutroni per fissione (che hanno energie dell’ordine del MeV),che vengono poi "raffreddati", cioè vengono fatti passare in un moderatore più volte (di solito acqua e grafite, perché gli atomi di carbonio sono leggeri e la collisione con un atomo che ha massa 12 volte quella del neutrone è efficace per ridurre l’energia "per urto") fino a che non hanno energia termica di 25 meV. Ciò è interessante perché se si prende la curva energia-impulso dei neutroni e si cerca di ricavare → − −1 k , si ottiene un valore di 108 cm−1 , cioè 1 Å . Questo significa che il vettore d’onda di un neutrone termico è paragonabile al vettore d’onda del bordo zona di una cella di Brillouin. Se si prende la luce, e si impone di avere un vettore d’onda pari a 108 cm−1 , si trova che si deve un’energia di 1 keV (che è all’incirca al confine fra UV e raggi x). Il punto è che se si vuole eccitare una eccitazione di bassa energia (nello stato condensato nella maggior parte dei casi, qualunque sia l’eccitazione, hanno energia caratteristiche dell’ordine di qualche decina/centinaia di meV) se si entra con un neutrone termico di 25 meV e si crea un fonone di 10 meV, la variazione è di 15 meV che è quindi una quantità apprezzabile dell’energia iniziale. Se si vuole fare la stessa cosa con un fotone di 1 keV e avere quindi un fonone con energia di 10 meV, il fotone dopo aver interagito avrà un’energia di 999.990 eV con una variazione relativa di 10−6 per cui si deve avere una strumentazione con potere risolutivo molto elevato per poter apprezzare questa differenza. Se il probe ha un’energia bassa ma contemporaneamente un grande vettore d’onda in grado di seguire tutta la curva di dispersione, ciò è molto conveniente in quanto le variazioni che si hanno durante il processo di interazione sono facilmente misurabili e il grande vettore d’onda permette di scambiare da zero fino al vettore d’onda massimo e "scansionare" così tutta la curva di dispersione. Da questo punto di vista quindi i neutroni sono più convenienti della radiazione elettromagnetica. Se si usano invece gli elettroni bisogna avere energie di 100 eV che sono, tutto sommato, facili da ottenere. Si cerca quindi di scegliere una sonda spettroscopica con energia paragonale o leggermente maggiore delle energie caratteristiche si vogliono eccitare. → − La lunghezza d’onda dei neutroni termici che abbiamo descritto è λ = 2π/| k | = 1 Å, per cui con questi neutroni in linea di principio si possono risolvere spazialmente oggetti della dimensione media dell’ordine di λ. Questo tipo di spettroscopia permette quindi di studiare oggetti nanoscopici. Se si volesse usare la radiazione elettromagnetica nel visibile (λ ≈ 500 nm) al meglio si possono risolvere 500 nm, e quindi per rimpicciolire questa quantità e risolvere oggetti più piccoli bisogna aumentare l’energia, cioè andare verso i raggi x, ma in questo caso si potrebbe non essere risonanti con le eccitazioni che si vogliono studiare. Le condizioni che si vogliono soddisfare quindi sono: 2 LA SPETTROSCOPIA 8 • poter risolvere spazialmente l’oggetto della misura (microscopia=vedere un oggetto); • essere in risonanza in energia con l’eccitazione da studiare (spettroscopia="vedere" l’eccitazione). A parte i sistemi naturali (atomi e molecole che hanno dimensioni nell’intorno dell’angstrom o del nanometro) oggi c’è un enorme sviluppo nella costruzione di oggetti nanometrici nonostante un sistema di dimensioni macroscopiche abbia delle proprietà fisiche che non necessariamente si mappano sulle proprietà del sistema dopo aver ridotto la sua dimensione (non c’è invarianza di scala) e molti sistemi presentano delle disomogeneità caratteristiche che ne determinano molte proprietà su scala mesoscopica (dimensioni < 1 µm). Tuttavia c’è un interesse pratico e tecnologico nel diminuire le dimensioni degli oggetti (transistor sempre più piccoli e più veloci, celle fotovoltaiche nanostrutturate che hanno efficienze più alte rispetto a celle della dimensione del micron). Normalmente le tecniche sperimentali per costruire oggetti piccoli si chiamano tecniche litografiche che, ad oggi, riescono a costruire oggetti dell’ordine di qualche nm. Quindi dato l’interesse intorno a sistemi nanometrici e mesoscopici sia naturali che artificiali, si vogliono studiare le eccitazioni di questi oggetti risolvendoli singolarmente. Ad esempio in biofisica c’è un interesse fondamentale nel studiare il comportamento della singola cellula anche a livello sub-cellulare; una cosa fondamentale fatta negli anni 80’ è stato lo studio dell’assorbimento infrarosso di singole cellule durante il processo di mitosi (separazione cellulare). Focalizzando la radiazione infrarossa sulla cellula si può misurare lo spettro caratteristico del DNA, della membrana lipidica e di altre strutture sub-cellulari e illuminando la cellula che sta avendo un processo fisiologico non la si disturba molto (si aumenta la temperatura di qualche grado ma non la si uccide come accadrebbe ad esempio usando la luce UV). Si devono ovviamente scegliere cellule della dimensione di qualche decina di µm (un globulo bianco misura circa 5 µm), mentre i fili di Juss che sono oggetti a cavallo fra viventi e non viventi possono avere dimensioni anche delle centinaia di nm. La morte programmata di alcune cellule si può dedurre dallo spettro infrarosso perché si modificano in maniera molto evidente righe spettrali legate a gruppi chimici specifici, quindi studiando la singola cellula si può avere informazioni sia sulla cellula che sulla morte programmata stessa. Vogliamo ora parlare della risoluzione temporale. Nei sistemi condensati si ha a che fare sostanzialmente con le fluttuazioni : il sistema in equilibrio termodinamico ha una certa temperatura, pressione e altre quantità termodinamiche medie che sono relative sostanzialmente a una media su dimensioni fisiche e su una scala dei tempi macroscopica. Tuttavia un sistema in equilibrio termodinamico, istante per istante e punto per punto fluttua in maniera abbastanza consistente. In certi casi sono proprio le fluttuazioni che tendono a divergere che lo portano da una fase specifica ad un’altra (transizioni di fase): ad esempio se si prende un solido e ne si alza di molto la temperatura, si manifesta la liquefazione, cioè quando la distanza quadratica media della fluttuazione raggiunge circa un terzo della distanza di equilibrio fra gli atomi (nel NaCl passa da 0.01 Å a circa 0.3 Å). Quindi la fluttuazione dalla posizione di equilibrio determina un certo tipo di effetto. Nell’accezione generale, parlare di fluttuazioni è equivalente a parlare di eccitazioni di un sistema. Le eccitazioni che un sistema manifesta sono perciò quelle che determinano le sue fluttuazioni dalla posizione di equilibrio. Un sistema fluttua con delle eccitazioni proprie, che possono esse- 2 LA SPETTROSCOPIA (a) Stormo di storni. 9 (b) Banco di sardine. Figura 2: Modi collettivi nel mondo animale. re di tipo collettivo. Le fluttuazioni dalla posizione di equilibrio in un cristallo danno luogo a delle eccitazioni che modulano la densità (localmente) rispetto a quella media, e i quanti di oscillazione, cioè i quanti di fluttuazione di densità si chiamano fononi. Invece le onde di densità di carica in un cristallo che ha elettroni liberi, cioè le eccitazioni sono modi di densità di carica collettivi in cui tutti gli elettroni oscillano in fase, e i quanti di oscillazione si chiamano plasmoni. C’è una certa faunistica in materia di tipologie di fluttuazioni che hanno in meccanica quantistica una propria definizione. Un aspetto interessante è il seguente: se si prendono degli elettroni in un metallo questi sono fermioni che quindi obbediscono alla statistica di Fermi-Dirac, ma studiando il modo collettivo, i quanti corrispondenti sono dei bosoni che obbediscono a una statistica diversa, quella di Bose-Einstein. Lo studio dei modi collettivi, sia fenomenologico che formale è nato nello studio del mondo condensato, ma molte delle scoperte riferite a questi modi sono state successivamente applicate a mondi molto diversi. Un esempio sono i modi collettivi degli stormi di storni (a Roma si vedono) o dei banchi di sardine (fig. 2). Questi sono modi collettivi in cui viene modulata la densità "di storno" o "di sardina". Modi collettivi di questo tipo esistono in natura in molti campi. Se in cristallo le fluttuazioni di densità vengono determinate dalla temperatura, nei gruppi di animali ciò avviene per l’intervento di un fattore esterno, ad esempio un predatore. Questo tipo di modi collettivi dal punto di vista della meccanica quantistica viene descritto esattamente come i modi collettivi fononici in un cristallo. Un modo collettivo è determinato dalla presenza di un interazione fra i singoli componenti. Quando si crea una disomogeneità, essa si propaga attraverso i singoli componenti del modo, che quindi, affinché vi sia propagazione, devono "parlarsi". Quello che è interessante è anche studiare il moto di singola particella, di solito del tutto disordinato. La spettroscopia di neutroni è l’unica tecnica la cui misura fornisce informazioni contemporaneamente sul collettivo e sul singolo. L’interesse nello studiare entrambi gli aspetti è che si ottengono informazioni diverse sullo stesso sistema: i modi danno informazioni sui potenziali di interazione, i moti di singola particella sulla cinematica dell’oggetto preso come singolo. Quali sono i tempi caratteristici della materia condensata e quali tempi devono avere gli strumenti per seguirne la dinamica? Quando si parla di tempo caratteristico di un’eccitazione, pensando all’oscillatore armonico, per dire che l’oscillare abbia effettivamente oscillato si direbbe 2 LA SPETTROSCOPIA 10 che bisogna attendere almeno mezzo periodo. Il mezzo periodo è il tempo per cui possiamo dire che la vita di un’oscillazione la rende effettivamente definibile come tale. Ciò significa che, poiché il periodo di vita di un’oscillazione è 2π dove f è la frequenza caratteristica, possiamo dire che per un fonone T = f che ha frequenze caratteristiche dell’ordine del THz il tempo medio del periodo di oscillazione è 1 ps. Questo è generalizzabile a tutte le eccitazioni per calcolare il tempo necessario per misurare effettivamente un’oscillazione. Prendiamo ad esempio l’atomo di idrogeno, con un elettrone 1s ed energia caratteristica che è la costante di Rydberg cioè 1 Ry = 109737 cm−1 = 3.28984 · 1015 Hz. Si trova che il tempo caratteristico semi-classico di rivoluzione dell’elettrone nell’orbita 1s è di circa 800 · 10−18 s = 800 as. Tanto più l’energia è alta tanto più il tempo caratteristico risulta piccolo. Quindi se si vuole fare una fotografia temporale di questo fenomeno, la sonda spettroscopica deve avere una durata temporale almeno uguale o più piccola della vita media di quest’eccitazione. In questo caso si ha bisogno di un "otturatore" che si apra e chiuda con tempi dell’ordine di centinaia di attosecondi. Le vibrazioni di una macromolecola hanno tempi caratteristici dell’ordine di un centinaio di fs, quindi bisogna avere sonde con tempi delle decine di fs. Questo non è affatto banale: le sonde spettroscopiche standard sono di tipo steady-state (emettono in maniera continua e non permettono di fare fotografie temporali), mentre la spettroscopia risolta nel tempo è nata con l’invenzione dei laser titanio-zaffiro (il mezzo attivo è un cristallo di zaffiro Al2 O3 drogato con ioni di titanio T i3+ ), che ormai sono oggetti commerciali. Un laser che emette luce pulsata con range temporali nelle decine di fs costa circa 100 mila euro. Esistono laser più sofisticati in laboratori non commerciali per avere prestazioni più elevate: il record italiano è stato raggiunto al politecnico di Milano con 100 as, mentre il record mondiale (USA) si aggira intorno ai 20 as. Se si volesse coniugare la possibilità di fare una fotografia temporale in scala temporale piccola e simultaneamente una fotografia spaziale che risolva qualche decina di nm, si dovrebbe usare un laser ad elettroni liberi (Free-Electron Laser). I FEL si trovano uno a Triste (si chiama Fermi), un altro prototipo si trova a Frascati. Il FEL più potente che emette impulsi a di luce ad λ = 1 Å con una durata di 10 fs (cioè si hanno raggi x a 10 fs) si chiama SLAC e si trova in California, a Stanford. E’ attualmente in costruzione il FEL europeo, ad Amburgo e si chiama XFEL. Queste macchine sono installazioni di ricerca, non da laboratorio, soggette ad un comitato che valuta ogni singolo progetto ed assegna di conseguenza il tempo macchina. 2.1 Operatore di Scattering La situazione di partenza è schematizzata dalla figura 3. Un sistema condensato qualsiasi che possiamo chiamare target, è caratterizzato a tempi t < t∗1 da una b t e da stati |ti i. Si ha anche un certo probe spettroscopropria hamiltoniana H b p . Si accende pico caratterizzato da stati |pi i e da una propria hamiltoniana H l’interazione a tempi t ≥ t∗1 e la sorgente spettroscopica comincia ad interagire col sistema condensato dal quale vogliamo ottenere informazioni. L’interazione si manifesta nell’intervallo t∗1 ≤ t ≤ t∗2 , intervallo normalmente macroscopico 2 LA SPETTROSCOPIA 11 Figura 3: Schematizzazione di un processo spettroscopico. I pedici p e t indicano rispettivamente il probe e il target. (ma non necessariamente), e l’hamiltoniana totale si scrive come: b =H bt + H b p +Vb (t) H | {z } (2.1) H0 il termine Vb (t) è quello che determina l’interazione tra la sorgente spettroscopica del sistema in esame e quella che ci permette di studiare il sistema stesso. b =H bt + H b p = H0 perché non c’è Per tempi t ≤ t∗1 l’hamiltoniana è data solo da H interazione, mentre per tempi t ≥ t∗2 la sonda spettroscopica si divide in vari stati finali |pf i. Ad esempio se stiamo usando fotoni in un esperimento di diffusione, dopo l’interazione col sistema molti fotoni (la maggior parte) proseguirà nella stessa direzione di partenza mentre altri saranno scatterati in altre direzioni e con diverse energie. In generale gli stati del probe iniziale e finale contengono diversi parametri, come enegia, momento angolare, vettore d’onda ecc. : |pi i = |Epi , J i , k i i |pf i = |Epf , J f , k f i Lo stato iniziale lo si cerca di preparare al meglio, in modo "puro" nel senso quantistico del termine cioè con la miglior definizione possibile dei parametri generali dello stato cinematico (cioè con la migliore conoscenza possibile di energia, momento angolare, vettore d’onda ecc.). Lo stato finale invece tiene conto dei fenomeni scatteranti: se le energie del probe iniziale e finale sono identiche normalmente si parla di scattering elastico, ed è ciò che si vuole misurare. Per descrivere un sistema di questo tipo nell’intervallo t∗1 ≤ t ≤ t∗2 , lo stato dipendente dal tempo, che è autostato dell’intera hamiltoniana, viene chiamato |φ(t)i. Quest’oggetto ha le seguenti caratteristiche: |φ(t < t∗1 )i = |pi i |ti i |φ(t > t∗2 )i = |pf i |tf i Per tempi inferiori all’accensione dell’interazione l’hamiltoniana si riconduce ai due oggetti |pi i , |ti i che non sono interagenti e quindi al loro prodotto. Poi il sistema evolve in uno stato che non sarà più il prodotto dei due ket iniziali (potrebbe anche non essere la loro combinazione lineare), e infine per tempi superiori a t∗2 si ritorna al prodotto degli stati finali (con l’idea che possono esserci 2 LA SPETTROSCOPIA 12 tanti stati finali per effetto dell’interazione). La perturbazione può essere forte quanto si vuole e ciò che si impara con l’approssimazione della perturbazione al primo ordine è solo un caso particolare. Come si può calcolare |φ(t)i in modo generale? In presenza di perturbazioni che, in linea di principio, possono dipendere dal tempo (oscillazioni di un campo elettromagnetico, accensione e spegnimento di un interruttore), per studiare l’evoluzione degli stati quantistici si hanno a disposizione determinati strumenti matematici. Si potrebbe scrivere un’equazione di evoluzione temporale di Schrödinger: i d |φ(t)iS = (Ht + Hp + V ) |φ(t)S i ~ dt dove il pedice S indica che siamo in rappresentazione di Schrödinger. La rappresentazione di Schrödinger è quella in cui gli stati quantistici dipendono dal tempo ed evolvono nel tempo in base all’equazione appena mostrata. L’operatore che determina l’evoluzione è l’operatore totale Ht + Hp + V dato dalla somma di operatori che si ritengono indipendenti dal tempo. Quindi in questa rappresentazione tutta la dipendenza temporale si trova negli stati. Invece nella rappresentazione di Heisenberg sono gli stati che sono costanti e gli operatori invece che dipendono dal tempo, per cui in questo caso si scrive un’equazione evolutiva degli operatori tramite i commutatori. Esiste una rappresentazione intermedia, che noi useremo da ora in poi, che si chiama rappresentazione di Interazione (o di Dirac), in cui l’evoluzione temporale degli stati per effetto dell’interazione dipende solo dall’operatore di interazione, mentre l’evoluzione temporale degli operatori dipende dall’hamiltoniana imperturbata: i d |φ(t)iI = VI (t) |φ(t)iI (2.2) ~ dt d ∂VI (t) i~ VI (t) = i~ + [VI (t), Ht + Hp ] (2.3) dt ∂t il pedice I indica l’uso della rappresentazione di interazione. Il primo termine a destra dell’equazione (2.3) è presente solo se l’operatore è esplicitamente dipendente dal tempo, altrimenti l’unico termine a dare l’evoluzione temporale dell’operatore è il commutatore tra l’operatore di interazione e l’hamiltoniana parziale. Nella rappresentazione di Heisenberg l’unica equazione di evoluzione è la (2.3) in cui si trovano tutti gli operatori all’interno del commutatore. Siamo interessati a studiare come evolve il target, cioè le sue eccitazioni, e per farlo si misura macroscopicamente cosa succede al probe, da cui si deducono le informazioni microscopiche. Queste informazioni microscopiche sono contenute nello stato generale che dipende dal tempo per effetto dell’interazione probetarget. Nella rappresentazione di interazione l’equazione di evoluzione dello stato generale è la (2.2), che dipende da VI (t). Se V fosse zero lo stato non evolverebbe, cioè sarebbe: |φ(t)iI = |φ(t)iS = |pi i |ti i ∀t (2.4) Risolvendo l’equazione differenziale al primo ordine (2.2) con le date condizioni iniziali (2.4) si ottiene: Z ∗ i t2 c |φ(t∗2 )i = |ii − VI (t) |φ(t)i dt (2.5) ~ t∗1 2 LA SPETTROSCOPIA 13 cioè la soluzione integrale dell’equazione temporale in forma derivata, dove |ii è lo stato iniziale |pi i |ti i. Questa equazione è risolvibile come quella derivata, cioè è irrisolvibile. La soluzione infatti dipende dallo stato |φ(t)i ai tempi t∗1 e t∗2 , che è sconosciuto ed è proprio la soluzione che si sta cercando. Questo tipo di equazione è un’equazione integrale implicita detta di Fredholm. In forma integrale però si può trovare una soluzione iterativa: se V fosse nulla lo stato a tempi qualsiasi, come già detto, sarebbe |ii. Allora si può dire che la soluzione all’ordine zero è esattamente |ii. Sostituendo la soluzione di grado zero nella (2.5) si può ottenere quella di grado 1, di grado 2 e così via. Si ottiene: |ii grado 0 : (2.6) 1 |φ(t∗2 )iI = |ii − grado 1 : 2 |φ(t∗2 )iI grado 2 : i ~ i = |ii − ~ Z t∗ 2 t∗ 1 Z t∗ 2 t∗ 1 cI (t) |ii dt V " cI (t2 ) |ii − i V ~ (2.7) Z t0 t∗ 1 # cI (t1 ) |ii dt1 dt2 V (2.8) svolgendo la parentesi nella (2.8), si può scrivere esplicitamente la soluzione iterativa di grado 2, cioè: 2 Z t∗2 Z t0 Z t∗2 i 2 cI (t1 )+ i cI (t1 )V cI (t2 ) (2.9) |ii dt1 V dt1 dt2 V |φ(t∗2 )iI = |ii− |ii ~ ~ t∗ t∗ t∗ 1 1 1 E’ importante notare che vale per gli intervalli t1 > t2 per costruzione, cioè l’ordine temporale del prodotto fra gli operatori nell’integrale doppio è importantissimo. Agisce prima l’operatore a tempo t1 e poi quello a tempo t2 che essendo più piccolo si riferisce ad un istante successivo. Gli operatori V non necessariamente sono commutativi a tempi diversi. Se si lascia fluttuare un sistema autonomamente, ci si trova di fronte a quelli che sono chiamati sistemi ergodici, cioè sistemi che passano per tutti gli stati possibili, quindi a qualunque istante si fotografi il sistema, l’evoluzione non dipende dall’istante scelto. Nel momento in cui si accende una perturbazione esterna, se questa è abbastanza grande può spingere il sistema verso uno stato di equilibrio preferenziale e quindi perturbare l’ergodicità. Nel momento in cui viene spenta la perturbazione il sistema potrebbe raggiungere un nuovo stato di equilibrio diverso da quello iniziale. Si può scrivere formalmente lo stato che si sta cercando come il prodotto di un operatore per lo stato iniziale, cioè: b ∗1 , t∗2 ) |ii |φ(t∗2 )iI = S(t (2.10) e quest’operatore Sb si chiama operatore di scattering (o matrice di scattering) o operatore di evoluzione. Siamo interessati quindi a determinarlo, perché esso entra in tutte le quantità misurabili. Dai conti fatti, si vede che questa matrice si scrive, allo step n-esimo, come: i Sb = 1− ~ Z t∗ 2 t∗ 1 n Z t∗2 Z tn−1 i c c cI (tn ) (2.11) dt1 VI (t1 )+· · ·+ − dt1 VI (t1 ) ... dtn V ∗ ~ t∗ t 1 1 Il difetto di questa scrittura sta nel fatto che qualunque ordine maggiore del secondo ha integrali che coprono intervalli temporali sempre più piccoli. Infatti 2 LA SPETTROSCOPIA 14 per costruzione si ha che t1 > t2 > ... > tn−1 > tn , ma tali variabili temporali sono mute, per cui è possibile, mantenendo l’ordine temporale dei prodotti, permutare la variabile di integrazione. Ci sono n variabili di integrazione e quindi ci sono n! possibili permutazioni di variabili mute. Si possono scrivere termini equivalenti ai precedenti permutando la variabile di integrazione, e poi si può sommare su tutti gli n e dividere per n! (pur di mantenere l’ordine temporale dei prodotti fra gli operatori), così alla fine si ha per il termine n-esimo: b ∗ , t∗ )n = S(t 1 2 i − ~ n 1 n! Z t∗ 2 Z t∗ 2 dt1 ... t∗ 1 t∗ 1 dtn Tb[VI (t1 )...VI (tn )] (2.12) Dal termine non simmetrico di grado 2, si è potuto, integrando su tutto l’intervallo grazie alle variabili mute, integrare n volte su tutto l’intervallo rilassando la condizione di integrali sempre più piccoli, con la condizione di non perdere l’ordine temporale dei prodotti fra gli operatori V. L’operatore Tb è chiamato operatore temporale o ordinatore temporale di Dyson, che ristabilisce, dopo le permutazioni fatte, il giusto ordine temporale. Il suo funzionamento è il seguente: Tb[VI (t1 )VI (t2 )] → VI (t2 ) · VI (t1 ) con t2 > t1 con un segno proprio, sul quale torneremo. Si può dire che questo è uno dei pochi casi in cui la fisica delle particelle ha insegnato qualcosa dal punto di vista dell’apparato matematico di meccanica quantistica alla fisica dello stato condensato. Normalmente è avvenuto il contrario: tutta la teoria dei fenomeni critici, il gruppo di rinormalizzazione, ad esempio hanno insegnato a come correggere le divergenze infrarosse ed ultraviolette nelle più evolute teorie di campo. La soluzione generale, che dipende dall’intervallo temporale in cui agisce la perturbazione, è: b ∗1 , t∗2 ) = S(t X 1 i n Z t∗2 − dt1 ...dtn Tb[VI (t1 )...VI (tn )] n! ~ t∗ 1 n (2.13) in cui si riconosce lo sviluppo in serie dell’esponenziale. Per cui è possibile riscrivere: R t∗ i 2 b ∗ , t∗ ) = Tb e− ~ t∗1 VI (t)dt (2.14) S(t 1 2 Ricapitolando: data la condizione iniziale per cui a tempi t < t∗1 si ha che b ≡H bt + H b p e Vb = 0 e quindi vale che |φ(t)i = |ii = |pi i |ti i, il significato di Sb H sta nel fatto che lo stato finale a tempi t ≥ t∗2 è |φ(t)i = Sb |ii. Quindi calcolando Sb (a prescindere dall’intensità della perturbazione) si è in grado di prevedere tutta l’evoluzione temporale del sistema condensato o meno. Tuttavia avendo a disposizione la scrittura in serie dell’operatore di scattering è possibile scrivere soluzioni approssimate. Da questo punto di vista uno studio su quanto è intensa la perturbazione permette di capire a quale termine dello sviluppo in serie ci si può fermare. Vedremo che specificando opportunamente l’operatore di interazione, cioè la spettroscopia che si vuole fare, con i campi elettromagnetici ad esempio il primo ordine di Sb da l’assorbimento o l’emissione di un fotone, mentre il secondo ordine da lo scattering della luce (effetto Raman, Brillouin) e l’assorbimento e l’emissione a due fotoni ecc ecc. 2 LA SPETTROSCOPIA 15 Tabella 1: Schema dell’interazione tempo hamiltoniana stato t < t∗1 t > t∗2 b0 = H bt + H bp H |φ(t)i = |ii = |pi i |ti i |φ(t∗2 )i = Sb |ii Vediamo ora le proprietà di Sb e di Tb. Se il sistema prima dell’interazione è in uno stato |pi i |ti i, e dopo l’interazione passa ad uno stato (o vari stati) |pf i |tf i, la probabilità di transizione generica è: Pi→f = | hpf | htf | Sb |ti i |pi i |2 | {z } (2.15) |φ(t∗ 2 )i che come si vede, è una probabilità di transizione fra uno stato iniziale definito ed uno stato finale definito. Come evidenziato essa è la proiezione verso di tutti i possibili stati finali su uno stato dato |φ(t∗2 )i. Non facendo il modulo quadro b si ottiene l’ampiezza di transizione come elemento di matrice di S. P Inoltre la matrice di scattering è unitaria cioè vale che f |Sif |2 = 1. Ciò significa che partendo da uno stato iniziale e calcolando la probabilità di transizione verso tutti i possibili stati finali la probabilità totale è 1. Per quanto riguarda l’operatore di Dyson si supponga di trovare un prodotto del tipo Tb[V (t2 )V (t1 )] |ii con t1 > t2 . L’operatore Tb ripristina il giusto ordine temporale, cioè il primo operatore a destra è quello che agisce per primo. Tuttavia il modo in cui Tb agisce dipende dalla natura degli operatori V: se essi sono bosonici (hamiltoniana dell’oscillatore armonico) allora quando Tb li scambia, il segno non cambia. Se invece essi sono fermionici (operatori di creazione e distruzione fermionici) e Tb ristabilisce il giusto ordine, allora bisogna mettere un segno meno davanti agli operatori. Chiamiamo l’intervallo temporale in cui si manifesta la perturbazione come T = t∗2 − t∗1 che può essere macroscopico, nel senso che se si ha una sorgente spettroscopica che viene accesa e poi spenta si possono avere misure che durano anche mezza giornata, se invece si ha una sorgente pulsata i tempi caratteristici sono dettati dalla durata dell’impulso che può essere microscopico. In ogni caso nell’intervallo T si ha che Vb 6= 0. Si chiama probabilità di transizione nell’unità di tempo la quantità: 1 (2.16) Ṗi→f = | hf | Sb |ii |2 T che è la probabilità di transizione tra uno stato iniziale e uno finale totale nell’unità di tempo, diviso il tempo totale in cui si manifesta la perturbazione. La situazione è schematizzata nella tabella 1: lo stato finale |φ(t∗2 )i contiene potenzialmente molti stati finali sia del probe che del target. L’elemento di matrice nella (2.15) proietta lo stato finale (ottenuto dalla matrice di scattering applicata allo stato iniziale) su uno stato specifico. Tuttavia questo è un caso particolare, in quanto non è ciò che avviene normalmente. Il sistema target evolve verso tanti possibili stati finali e l’interazione con il probe fa si che anch’esso evolva versi stati finali diversi. Facciamo un esempio: prendiamo una molecola nello schema dell’oscillatore armonico. Siano n=0, 1, 2 gli stati vibrazionali distanziati del valore ~ω. A temperatura nulla l’unico stato popolato è n=0. Si 2 LA SPETTROSCOPIA 16 Figura 4: Schematizzazione di un processo spettroscopico. Stati iniziale e finale. manda sul sistema un fotone di energia ~ω e si ottiene la transizione 0 → 1. Lo stato iniziale è l’oscillatore armonico nello stato n=0 e un fotone di energia ~ω, lo stato finale è zero fotoni (il fotone è stato assorbito) e l’oscillatore armonico nello stato n=1. Si supponga ora di scaldare il sistema in modo da avere anche il livello n=1 parzialmente popolato. Mandando lo stesso fotone, si potrà avere la transizione 0 → 1 o anche quella 1 → 2. A parità di perturbazione gli stati finali, sempre con il probe a zero fotoni, potranno essere due in questo caso (n=1 o n=2). La soluzione del target può essere qualsivoglia in base allo stato termodinamico prima che avvenga l’interazione. Questo per far capire come lo stato finale che rappresenta il target in realtà possa contenere molti stati finali. Per descrivere matematicamente questo fenomeno cominciamo col descrivere meglio i possibili stati finali del probe. Si considera un solo stato iniziale del probe, che si può preparare al meglio, e molti stati finali del probe si possono provare ad esprimere usando l’espressione: ρ(Efp )dEfp dΩ (2.17) che sarebbe il numero di stati del probe con energia finale compresa tra Efp e Efp + dEfp e vettore d’onda compreso nel medesimo intervallo cioè fra kfp e kfp + dkfp . La situazione è schematizzata in figura 4. Gli stati finali sono in principio un insieme continuo o quasi continuo. Per descriverli quindi si definisce una densità di stati finali ρ(Efp ) e la si moltiplica per l’intervallo di energia in cui sono distribuiti dEfp per l’intervallo di angolo solido dΩ. Normalmente tutte le spettroscopie lavorano in questo modo, cioè nella configurazione assiale, in cui si fissa l’asse di propagazione del fascio incidente e si controllano tutti gli angoli possibili attorno a tale asse. L’espressione (2.17) misura il numero di stati finali del probe nell’unità di energia e di vettore d’onda (le variazioni di vettore d’onda sono mappate sull’angolo solido). In quasi tutti i casi, nei processi di interazione, il sistema probe+target costituisce un sistema chiuso, quindi c’è conservazione dell’energia e del vettore d’onda ecc. Questo è espresso dalle seguenti relazioni: ~ω = Eft − Eit = Eip − Efp q̄ = kit − kft = kfp − kip (2.18) (2.19) che in struttura della materia sono espresse dalle regole di selezione sui numeri quantici. Dal punto di vista matematico la quantità espressa dall’espressione (2.17) è uguale ad ~ω, perché lo stato iniziale è ben definito e quindi la variazione infinitesima da considerare nella differenza Efp − Eip è quella sugli stati finali, ed 2 LA SPETTROSCOPIA 17 è espressa dalla (2.17). Si è scritto nella (2.15) la probabilità di transizione tra uno stato iniziale e uno finale ben definiti, ma poiché in qualunque processo spettroscopico gli stati finali del probe sono tanti, l’espressione (2.16) può essere generalizzata definendo: d2 Ṗi→f = 1 ρ(Efp )dEfp dΩ| hf | Sb |ii |2 T (2.20) Semplicemente si è presa l’espressione (2.16) e la si è moltiplicata per gli stati finali compresi nell’intervallo infinitesimo di energia e di angolo solido, cioè la (2.17), e si è ottenuta la probabilità doppio differenziale di transizione nell’unità di tempo infinitesima da uno stato iniziale ben definito in una densità di stati finali compresi nell’intervallo dEfp dΩ. Si può allora scrivere semplicemente differenziando rispetto a Ω e Efp : 1 ∂ 2 Pi→f ρ(Efp )| hf | Sb |ii |2 p = ∂Ω∂Ef T (2.21) e questa tiene conto del fatto che durante il processo spettroscopico la sonda può andare in molti stati possibili finali, cioè verso un continuo o quasi-continuo finali. Il sistema condensato si trova in un certo stato di equilibrio termodinamico macroscopico prima dell’interazione, a cui corrisponde un numero elevato di stati microscopici possibili. Non si parte mai da un singolo stato iniziale del target, ed ovviamente durante la transizione si può andare in molti stati finali del target stesso. In realtà ciò che si misura è una quantità più complicata, la probabilità totale di transizione per unità di tempo: X 1 ∂ 2 Ṗ p λt (TK )| hf | Sb |ii |2 p = ρ(Ef ) ∂Ω∂Ef T i (2.22) |ti i,|tf i che è il prodotto della densità di stati finali del probe, la somma sugli stati iniziali e finali del target, il modulo quadro dell’elemento di matrice scattering per una nuova quantità λti che è la probabilità di occupazione termica dello stato iniziale del target (dipende dalla temperatura TK ). Questa dice, dato un certo sistema specifico ad una data temperatura, quali sono gli stati occupati. Questo termine è: 1 (2.23) λti (TK ) = e−βEti z che è una funzione decrescente dell’energia, dove z è la funzione di partizione P del sistema e vale z = ti hti | e−β Ĥt |ti i, e β = kB1TK , con TK temperatura e kB costante di Boltzmann. La (2.22) è ciò che si misura nei sistemi condensati in cui l’equilibrio termodinamico per il target implica molti stati iniziali possibili ciascuno con una propria probabilità termica, e di conseguenza facendolo interagire col sistema si può andare in tanti possibili stati finali. Visto che vale la relazione ~dω = dEfp , si può riscrivere la densità di stati finale del probe come ρ(ω) = ~1 ρ(Efp ), e la probabilità di transizione (2.21), in forma adimensionale è: ∂ 2 Pi→f 1 = ρ(ω)| hf | Sb |ii |2 (2.24) ∂Ω∂ω T 2 LA SPETTROSCOPIA 18 e la sua generalizzazione che porta a riscrivere la (2.22), X ∂ 2 Ṗ 1X λti (TK ) | hpf , tf | Sb |pi , ti i |2 = ρ(ω) ∂Ω∂ω T |ti i (2.25) |tf i Ricapitolando: a partire dalla definizione della matrice di scattering che è l’oggetto che collega gli stati finali con quelli iniziali per effetto dell’interazione (cioè che fa evolvere il sistema all’equilibrio termodinamico che ha interagito con una sonda spettroscopica esterna), la probabilità di transizione che tiene conto di tutti i possibili stati iniziali del target e di tutti i possibili stati finali in cui questo può transire per effetto dell’interazione è la (2.25). Si ha la somma su tutti gli stati iniziali pesati dalla probabilità di popolazione (a temperatura nulla tale quantità si riduce ad 1, cioè si ha un solo stato popolato: il ground state), la somma su tutti gli stati in cui il sistema può transire che tiene conto anche della densità di stati finali possibili. Quest’espressione è la più generale possibile e contiene un aspetto di meccanica quantistica (l’elemento di matrice di scattering) e un aspetto di meccanica statistica (la probabilità di popolazione termica), cioè è un’espressione quanto-termodinamica. 2.2 La sezione d’urto Un’altra quantità molto importante (spesso è quella ad essere realmente misurata) si chiama sezione d’urto. Si considera un sistema che contiene N particelle (atomi, molecole, macromolecole ecc ecc) ed un probe che ha un flusso di dimensioni [φ] = l−2 t−1 , cioè il numero di particelle che arrivano sul sistema per unità di tempo e per unità di superficie. Si definisce la sezione d’urto doppio differenziale come: 1 ∂2P ∂2σ = ∂Ω∂ω N φ ∂Ω∂ω (2.26) dato che la (2.24) è adimensionale (la probabilità di transizione è t−1 che si elide con la frequenza), la dimensione della (2.26) è il reciproco del flusso [φ] cioè una distanza al quadrato per un tempo. Essa dice il numero di eventi che avvengono per unità di tempo e unità di superficie. Qualche volta quello che si misura in certi esperimenti è: Z ∂2σ dωdΩ =σ (2.27) ∂Ω∂ω che si chiama sezione d’urto totale (con dimensioni [σ] = l2 , cioè una superficie). L’interpretazione geometrica della sezione d’urto è la dimensione del bersaglio che interagisce con il probe, in meccanica quantistica invece essa misura il raggio medio delle forze di interazione. Nella maggior parte dei casi l’unità di misura della sezione d’urto totale è il barn, dove 1 barn = 10−24 cm2 (approssimativamente pari alla sezione di un nucleo si Uranio). Integrando su tutte le energie scambiate e su tutto l’angolo solido la sezione d’urto totale tiene conto di tutti i possibili eventi che avvengono durante l’interazione. Per fare un esempio, un atomo ha una propria sezione d’urto elettromagnetica, dovuta alla densità di carica elettronica, e se la sonda è un campo elettromagnetico, l’interazione fra 2 LA SPETTROSCOPIA 19 atomo e campo avviene su una certa dimensione atomica, ed è misurata in barn (varie centinaia di barn). Se invece la sonda sono dei neutroni, il neutrone interagisce con il nucleo dell’atomo e la sezione d’urto, cioè la capacità del neutrone di interagire con l’atomo è qualche barn. In pratica a parità di atomo il neutrone interagisce molto meno di un campo elettromagnetico specifico. L’interpretazione meccanicistica di questa quantità è la grandezza del bersaglio, mentre l’interpretazione vera e propria è la dimensione media che definisce qual è il raggio di interazione della forza che accoppia l’atomo bersaglio con la sonda spettroscopica. In generale in un qualsivoglia processo, la sezione d’urto doppio differenziale si scrive come la somma di 3 termini, diffusione, assorbimento e riflessione: ∂ 2 σ ∂ 2 σ ∂ 2 σ ∂2σ + + = ∂Ω∂ω ∂Ω∂ω dif f ∂Ω∂ω assorb ∂Ω∂ω rif les (2.28) ogni processo di interazione con la materia che si può avere è scindibile in termini che tengono conto dei singoli fenomeni: ad esempio per la diffusione della luce su un sistema, quando si manda un fascio di radiazione sulla materia, parte dei fotoni vengono diffusi (effetto Raman e Rayleigh), parte dei fotoni vengono assorbiti e in parte riflessi (la differenza macroscopica fra riflessione e diffusione è che la riflessione avviene geometricamente allo stesso angolo di incidenza, mentre nella diffusione l’angolo di diffusione è in generale diverso rispetto all’angolo di incidenza). Data una sonda spettroscopica possono comparire diversi fenomeni legati ad elementi diversi della matrice di scattering ed ognuno con propria sezione d’urto. 2.2.1 Teorema della risposta lineare per la spettroscopia Prima di enunciare questo teorema facciamo un’osservazione: consideriamo la matrice di scattering (2.14): in molti casi l’hamiltoniana di interazione tra il proR be e la materia può essere scritta come integrale spaziale VbI (t) = dr̄VbI (r̄, t), dove VbI (r̄, t) è la densità di hamiltoniana di interazione, che significa che l’interazione fra la sorgente esterna e la materia può avvenire anche localmente nello spazio oltre che nel tempo (esempio è la densità di energia del campo elettromagnetico). Facciamo qualche esempio di hamiltoniana di interazione: Z 1 ¯ t) · Ā(r̄, t) VIem−mat (t) = − dr̄ J(r̄, (2.29) c Z VIN M R (t) = − dr̄ h̄(r̄, t) · M̄ (r̄, t) (2.30) Z ¯ (r̄, t) VIscatt (t) = c dr̄ Ā2 (r̄, t) ⊗ ᾱ (2.31) Nella (2.29) esprime l’interazione tra campo elettromagnetico e materia J¯ è la densità di corrente nel sistema bersaglio e Ā è il potenziale vettore del campo sonda. Quindi l’operatore locale di interazione è espresso da un prodotto scalare di due operatori che dipendono rispettivamente dai due sistemi che interagiscono. La (2.30) invece esprime la spettroscopia NMR (Nuclear Magnetic Resonance), 2 LA SPETTROSCOPIA 20 il cui operatore di interazione locale è espresso dal prodotto scalare fra gli operatori campo magnetico locale h̄ e magnetizzazione M̄ del sistema (la densità di spin). Anche in questo caso si ha il prodotto scalare fra un operatore che rappresenta la sonda (il campo magnetico) e uno che rappresenta il sistema in esame (la magnetizzazione). La (2.31) infine rappresenta l’operatore di interazione dello scattering della luce (Raman, Rayleigh) ed è dato dal prodotto tensoriale fra il quadrato del poten¯ (che esprime come un oggetto ziale vettore Ā2 e il tensore di polarizzabilità ᾱ costituito da elementi elettricamente carichi si distorce per effetto del campo esterno). Vediamo ora il Teorema 2.1 (della risposta lineare). La matrice di scattering Sb si può P scrivere come sviluppo in serie Sb = k Sk , i cui termini sono: k Z i dt1 ...dtk Tb[VI (t1 )...VI (tk )] Sk = − ~ Allora se si possono individuare uno o più termini k, la cui somma si può scrivere come: Z c W = dr̄dt φ̂p (r̄, t) · φ̂t (r̄, t) cioè un integrale sullo spazio e sul tempo del prodotto operatoriale tra φ̂p e φ̂t , che sono operatori che rappresentano rispettivamente il probe e il target (sempre vero al primo ordine come negli esempi visti), allora la probabilità di transizione doppio differenziale si scrive come: Z ∂ 2 Ṗ = ρ(ω) dr¯1 dr¯2 eiq̄(r¯1 −r¯2 ) eiω(t1 −t2 ) |Aφp (ω, q̄)|2 Cφt (r¯1 , r¯2 , t1 , t2 ) (2.32) ∂Ω∂ω dove |Aφp (ω, q̄)|2 è il modulo quadro dell’operatore di probe, che dà l’intensità della sonda spettroscopica, e Cφt (r¯1 , r¯2 , t1 , t2 ) è la funzione di correlazione dell’operatore di target coinvolto nella linearizzazione della matrice di scattering. La loro espressione esplicita è: |Aφp (ω, q̄)|2 = hpi | φ†p (ω, q̄) |pf i hpf | φp (ω, q̄) |pi i X Cφt (r¯1 , r¯2 , t1 , t2 ) = λti (t) hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i ti Dimostrazione. Si consideri la relazione (2.25). La somma sugli stati finali tf si può scrivere come: X X | hf | Sb |ii |2 = hpi | hti | Sb† |tf i |pf i hpf | htf | Sb |ti i |pi i ⇒ tf tf e dato che gli stati finali del target costituiscono un sistema completo per P definizione, vale la relazione di chiusura tf |tf i htf | = 1 e si può scrivere: ⇒ hpi | hti | Sb† |pf i hpf | Sb |pi i |ti i Inoltre per ipotesi vale che: Z c= Sk = W dr̄dt φ̂p (r̄, t) · φ̂t (r̄, t) 2 LA SPETTROSCOPIA 21 e sostituendo si può scrivere: Z ⇒ dr¯1 dr¯2 dt1 dt2 hpi | φ†p (r¯1 , t1 ) |pf i hpf | φp (r¯2 , t2 ) |pi i hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i La parte di target è contenuta nell’elemento di matrice diagonale che corrisponde proprio alla funzione di correlazione Cφt . Si risolve prima la parte relativa all’integrale temporale. Si scrive l’evoluzione temporale degli operatori in rappresentazione di interazione i i φp (r̄, t) = e ~ (Ht +Hp )t φp (r̄, 0)e− ~ (Ht +Hp )t L’operatore relativo al target (probe) agisce sulle variabili fisiche relative al target (probe), e matematicamente questo vuol dire che l’hamiltoniana di target e l’operatore di probe commutano fra loro. E’ quindi possibile scrivere che, per il probe: i i φp (r̄, t) = e ~ (Hp )t φp (r̄, 0)e− ~ (Hp )t come si vede non si considera più l’hamiltoniana di target nell’evoluzione dell’operatore di probe. Si sostituisce quindi nell’integrale. Si consideri solo il primo termine, si ha: p i p i i p p hpi | φ†p (r¯1 , t1 ) |pf i = e ~ Ei t1 hpi | φ†p (r¯1 , 0) |pf i e− ~ Ef t1 = e− ~ (Ef −Ei )t1 = eiωt1 perché si applica l’evoluzione dell’operatore sugli autostati iniziale e finale dell’hamiltoniana di probe. Facendo lo stesso conto per il secondo termine si ha: i p i p i p p hpf | φ†p (r¯2 , t2 ) |pi i = e− ~ Ei t2 hpf | φ†p (r¯2 , 0) |pi i e− ~ Ef t2 = e ~ (Ef −Ei )t2 = e−iωt2 Questi due termini insieme danno eiω(t1 −t2 ) che è esattamente il termine temporale presente nella trasformata di Fourier del teorema. Si osserva che ci sono due integrali temporali con t1 > t2 . Se si sostituisce t1 − t2 = T e t2 = τ e si fa il cambiamento di variabile, supponendo che la funzione di correlazione non dipenda in maniera separata da t1 e t2 ma solo dalla loro differenza (che significa che il sistema è stazionario, cioè qualunque sia il tempo iniziale di osservazione la sua evoluzione temporale è sempre la stesR RT sa) si ottiene per la parte temporale che dteiωt 0 dτ . L’integrale in dτ dà T (tempo totale di applicazione del probe) come risultato che si semplifica con T1 nella probabilità di transizione. Con quest’ipotesi la probabilità di transizione la si può scrivere come: Z ∂2P = ρ(ω) dr¯1 dr¯2 dt eiωt e−iq̄(r¯1 −r¯2 ) |Aφp (ω, q̄)|2 Cφt (r¯1 , r¯2 , t) (2.33) ∂Ω∂ω Ora vediamo la parte relativa all’integrale spaziale. In generale si possono scrivere gli stati iniziale e finale del probe come onda piana (e non c’è particolare limitazione nel farlo), cioè: p |pi i = eik̄i r̄ p |pf i = eik̄f r̄ il primo elemento di matrice si risolve in questo modo: p p hpi | φ†p (r̄1 , 0) |pf i = A∗ e−ik̄i r̄1 +ik̄f r̄1 2 LA SPETTROSCOPIA 22 dove A∗ rappresenta qual è l’ampiezza del probe (ad esempio se si avesse un campo elettrico sarebbe il numero di volt per centimetro). Per il secondo termine si ha: p p hpf | φp (r̄2 , 0) |pi i = A e−ik̄f r̄2 +ik̄i r̄2 che moltiplicati danno il fattore: p p |Aφp |2 ei(k̄f −k̄i )(r̄1 −r̄2 ) = |Aφp |2 e−iq̄(r̄1 −r̄2 ) che è esattamente il fattore spaziale presente nella trasformata di Fourier del teorema. E con questo la dimostrazione del teorema è conclusa. In sostanza il significato del teorema è questo: se valgono le condizioni citate, quello che si va a misurare, cioè la probabilità di transizione, è di fatto legata alla trasformata di Fourier spazio-temporale della funzione di correlazione dell’operatore del sistema che interagisce con il probe esterno. Facciamo un esempio: la radiazione elettromagnetica interagisce con le fluttuazioni di densità degli elettroni (la densità di la corrente). Prendendo la (2.29), che è scritta la primo ordine, si ha che φp è il potenziale vettore Ā, ¯ quindi la funzione di correlazione in mentre φt è la densità di corrente J, questoPcaso sarebbe una funzione di correlazione corrente-corrente del tipo CJ¯ = ti λti (t) hti | J¯† J¯ |ti i. Cosa si intende per correlazione (o autocorrelazione) in fisica statistica? Usiamo l’esempio della densità di corrente. Preparo il vettore densità di corrente, all’istante iniziale in un certo stato, lo lascio evolvere nel tempo (e l’evoluzione può essere causata da una naturale evoluzione del sistema o da un fattore esterno) e dopo un certo tempo misuro nuovamente il vettore densità di corrente. La funzione di correlazione indica come lo stato iniziale ha influenzato l’evoluzione del vettore di stato del sistema. Se la grandezza è scorrelata, il suo valore ad istanti successivi non dipende dallo stato iniziale. La variabile importante in questo caso è il tempo. Infatti il tempo di correlazione indica in quale intervallo di tempo lo stato che ho preparato inizialmente influenza l’evoluzione della grandezza stessa a tempi successivi. Evidentemente per tempi molto maggiori del tempo di correlazione il valore che la grandezza fisica assume è indipendente dal valore preparato all’istante iniziale. In termini probabilistici si può dire che la funzione di correlazione è una probabilità condizionata. L’aspetto potente di questo teorema è che ciò che si misura con la spettroscopia, se valgono le condizioni descritte, è l’immagine di Fourier spazio-temporale della funzione di correlazione: la dinamica che avviene nello spazio-tempo viene trasdotta nello spazio di Fourier cioè nello spazio vettore d’onda-frequenza, e quello che si misura di fatto è la funzione di correlazione nello spazio di Fourier. I neutroni ad esempio rilevano le fluttuazioni di densità e danno la funzione di correlazione di Fourier densità-densità, cioè in che vettori d’onda e in che frequenze la funzione di correlazione è diversa da zero, cioè in quale scala spaziale e dei tempi le fluttuazioni di densità sono correlate. Ricapitolando: se andando a vedere come è fatta l’interazione fra probe e target e scrivendo la matrice di scattering che determina l’evoluzione del sistema per effetto dell’interazione con il probe, ci si accorge che alcuni termini possono essere scritti come un integrale sullo spazio-tempo di un operatore che dipende 2 LA SPETTROSCOPIA 23 solo dal probe per uno che dipende solo dal target, allora la probabilità di transizione è la trasformata di Fourier della funzione di correlazione spazio-temporale dell’operatore che entra nella linearizzazione della matrice di scattering. Perché è importante misurare la correlazione spazio-temporale? I neutroni misurano le fluttuazioni di densità di un sistema: se si prende un liquido, le fluttuazioni di densità sono determinate da molti fenomeni, dalla variazione di temperatura locale, dalla variazione del numero di particelle locali, dalla variazione di pressione locale ecc ecc. ma queste fluttuazioni possono manifestarsi sia su scale spaziali ampie (sentiamo la voce del prof perché le sue corde vocali modulano la densità dell’aria su scale dell’ordine della lunghezza d’onda sonora con cui parla) che su scale molto piccole (angstrom, nm). Così come si può studiare cambiando la densità locale ad un certo istante e vedere come quella variazione di densità sopravvive ad un tempo successivo. Tuttavia quello che si è in grado di misurare non è la correlazione nello spazio fisico dello spazio-tempo, bensì tramite lo scambio energia-impulso che la sonda ha col sistema, la sua immagine di Fourier nelle frequenze e nei vettori d’onda. Nel momento in cui si considera lo scambio di impulso ed energia fra sonda e sistema, (le relazioni 2.18 e 2.19) si sta considerando lo scambio fra la sonda spettroscopica e l’eccitazione misurata da quella stessa sonda. Dal punto di vista matematico la trasformata di Fourier si fa su tutte le frequenze ω e su tutti i vettori d’onda scambiati q̄. Tuttavia dal punto di vista fisico ciò non è vero: quanto vettore d’onda si è grado di scambiare dipende dalla sonda spettroscopi~2 k̄ 2 ca. Se questa sonda sono neutroni, la relazione di energia-impulso è E = 2MN e se i netroni hanno energia media di 25 meV, allora k ∼ 108 cm−1 ' πa che è abbastanza grande, ma ovviamente non vale lo stesso se la sonda è la radiazione elettromagnetica. Considerando il vettore d’onda scambiato per i neutroni, che fenomeni possono manifestarsi nell’interazione? Quando i neutroni non interagiscono vale k¯i = k¯f , mentre se il neutrone è retrodiffuso si ha k¯i = −k¯f e quindi q̄ = 2k¯i cioè dell’ordine di 108 cm−1 . A seconda del processo considerato (scattering ad angolo piccolissimo in cui la variazione di vettore d’onda in modulo e verso è circa nulla oppure la retrodiffusione) si copre una zona di spazio di vettore d’onda piuttosto ampia (perché k¯i è grande). Se si fosse in grado di misurare solo i neutroni diffusi in un angolo solido dΩ abbastanza piccolo intorno alla direzione di propagazione, allora lo spazio di vettore d’onda che si è in grado di apprezzare è piccolo (perché k̄i ' k̄f ). Quindi matematicamente si ha una trasformata di Fourier i cui limiti fisici dipendono dalla possibilità o meno di apprezzare certe variazioni, cioè da come è fatto l’esperimento. Se si fosse in grado di misurare tutti i neutroni (anche quelli retrodiffusi) si andrebbe da un vettore d’onda 0 ad uno 2π a cioè tutta la prima zona di Brillouin, e quindi tutto lo spazio dei vettori d’onda disponibili. Si potrebbe osservare il sistema con una risoluzione spaziale δ ' λN = 10−8 cm = 1 Å, infatti il reciproco del vettore d’onda (cioè la lunghezza d’onda della sonda) definisce la capacità di risolvere oggetti spazialmente, quindi coprendo tutto lo spazio dei vettori d’onda si sarebbe in grado di apprezzare fluttuazioni che avvengono su scale spaziali molto piccole. Se invece è possibile captare solo i vettori d’onda nell’intorno di quello incidente, si è sensibili a scale spaziali macroscopiche, ovvero fluttuazioni su scale grandi, cioè il suono. Se invece di usare neutroni si usa la radiazione elettromagnetica, dato che 2 LA SPETTROSCOPIA 24 E = ck, i vettori d’onda nel visibile (il rosso ha energia di 2 eV) sono di 105 cm−1 , quindi rispetto ai neutroni si apprezzano distanze 1000 volte più grandi, in generale molto più grandi della distanza media fra le particelle in un liquido o in un solido, per cui non si è in grado di apprezzare fluttuazioni su scale microscopiche. Con la luce visibile infatti si misurano fluttuazioni di densità prodotte dal suono, cioè effetti macroscopici. Lo stesso discorso si può fare per quanto riguarda la parte temporale della trasformata di Fourier in cui si parla di scambio di energia (tramite la frequenza ω) e non di vettore d’onda: se si possono scambiare energie tali da coprire intervalli temporali microscopici allora si possono osservare fluttuazioni microscopiche, se invece non si può scambiare energia come si vuole si potranno osservare solo fluttuazioni macroscopiche. Si è visto nella dimostrazione del teorema di risposta lineare che si può considerare la funzione di correlazione come dipendente non da t1 e t2 , bensì dalla loro differenza, vero in generale per sistemi liquidi solidi, amorfi ecc. In linea di principio sarebbe possibile fare lo stesso discorso per la variabile spaziale e scrivere R̄ = r̄1 − r̄2 . Ci si chiede in quali casi la funzione di correlazione non dipenda separatamente da r̄1 ed r̄2 ma solo dalla loro differenza. Ebbene ciò avviene per sistemi traslazionalmente omogenei come ad esempio i liquidi. Qui viene mantenuta la distinzione fra r̄1 ed r̄2 per sottolineare il fatto che in generale non c’è invarianza spaziale completa. Se il sistema è completamente omogeneo dal punto di vista spaziale e temporale la funzione di correlazione dipenderà da |R̄| e da t, altrimenti si avranno dipendenze specifiche dalle singole variabili. Un’ultima cosa prima di trattare i vari tipi di spettroscopia nello specifico. Data l’espressione della funzione di correlazione: X Cφt (r¯1 , r¯2 , t1 , t2 ) = λti (t) hti | φ†t (r¯1 , t1 )φt (r¯2 , t2 ) |ti i (2.34) ti con λti (TK ) = 1 −βEtt i e z λtf (TK ) = 1 −βEttf e z (2.35) se si considera la transizione ti → tf e quella tf → ti , ci si può chiedere che relazione intercorre fra la probabilità di transizione Pti →tf e Ptf →ti . Se il sistema di target costituisce un sistema completo, calcolare l’elemento di matrice fra |ti i o |tf i non fa differenza, mentre ciò che cambia è la probabilità di occupazione termica, come messo in evidenza nelle espressioni (2.35). Il loro rapporto è: λtf t t = e−β(Ef −Ei ) = e−β~ω λ ti (2.36) quindi per le probabilità di transizione si ha: Pi→f = eβ~ω Pf →i (2.37) che ci dice che la probabilità di transizione considerata fin’ora, da uno stato a più bassa energia verso uno stato a più alta energia, è più grande della sua inversa, con un rapporto dato dal fattore esponenziale puramente quantistico (in un sistema classico le probabilità sono identiche) nella precedente espressione. Questo è il principio di bilancio dettagliato. Tutti i processi che ammettono transizioni tra uno stato iniziale e uno finale, ammettono in generale, essendo identico l’elemento di matrice, il processo inverso, ma con una probabilità diversa. 2 LA SPETTROSCOPIA 25 Quelle che viene chiamato processo Stokes, in cui una particella che incide sul sistema rilascia allo stesso energia e impulso e riparte con energia e impulso più bassi, è il processo in cui il sistema guadagna energia e quindi passa da uno stato a più bassa energia ad uno a più alta energia, mentre il processo anti-Stokes è quello inverso in cui il sistema cede energia alla particella incidente e transisce da uno stato a più alta energia verso uno a più bassa. La cessione di energia e impulso da parte del sistema implica che nel processo anti-Stokes il sistema abbia stati popolati che non siano quello fondamentale, ed è quindi legato alla probabilità di occupazione termica, quindi si può dire che nel limite di temperatura nulla sopravvive solo la transizione Stokes (perché è popolato solo lo stato fondamentale). Vogliamo ora vedere dei casi specifici in cui applicare il teorema della risposta lineare. 3 3 SCATTERING DA NEUTRONI TERMICI 26 Scattering da neutroni termici E’ una spettroscopia con qualche difficoltà tecnica di applicazione ma molto importante in molti campi della fisica, dallo stato solido alla biofisica, dalla soft-matter fino all’archeometria. Essa permette di studiare la struttura di un cristallo, le fluttuazioni all’interno di un cristallo o di un liquido (ad esempio legate alla presenza di fononi), permette di misurare la correlazione testa-coda di una macro molecola biologica, in alcuni casi permette di misurare la struttura dei cristalli delle proteine, la struttura magnetica di alcuni materiali ecc ecc. Le difficoltà tecniche stanno nel fatto che per avere una sorgente di neutroni bisogna avere a disposizione un reattore nucleare (che usa processi di fissione) ed esiste un network di reattori a fissione per uso spettroscopico in Europa e negli Stati Uniti, oppure usare una sorgente di spallazione, cioè dei protoni accelerati (prodotti bombardando una targhetta con degli elettroni) su un bersaglio di grafite, che espelle neutroni, ed una tecnologia di questo tipo la si può trovare al Rutherford Laboratory di Oxford in Inghilterra. I neutroni ottenuti tramite fissione sono estremamente energetici (quando si fonde Uranio 235 si ottengono neutroni con diversi MeV di energia) che possono risolvere vettori d’onda dell’ordine dei millesimi di Å e che non hanno nessun utilizzo dal punto di vista dello studio della struttura della materia (dove le distanze medie sono di qualche Å), inoltre neutroni di questo tipo hanno anche una pericolosità legata alla radioattività. Quindi questi neutroni vengono raffreddati (rallentati) facendoli urtare verso bersagli dell’ordine del nucleo atomico (tipicamente la grafite). Alla fine si hanno i cosiddetti neutroni termici, descritti da una distribuzione maxwelliana centrata a 25 meV (cioè 300 K) che corrispondono a una lunghezza d’onda di 1 Å e a un vettore d’onda di 108 cm−1 . Quindi si hanno grandi vettori d’onda e lunghezza d’onda paragonabile alla distanza fra le particelle in fase condensata. I neutroni termici interagiscono con la materia attraverso lo pseudopotenziale di Fermi che si scrive in questo modo: Vbf ermi (r̄, t) = X l bl 2π~2 δ(r̄ − R̄l (t)) MN (3.1) esso si chiama pseudopotenziale perché il neutrone è una particella che interagisce con i nuclei della materia con una forza forte, ma quando si ha una lunghezza d’onda come quella descritta (1 Å è circa 103 volte maggiore della dimensione media di un nucleo) non si è in grado di vedere i diversi nucleoni bensì il sistema come se fosse un oggetto omogeneo, e quindi interagisce con un potenziale medio che si chiama "pseudo" proprio per questo motivo. Si immagini di avere un sistema di oggetti microscopici che sono investiti dai neutroni. L’oggetto l al tempo t è individuato dal vettore R̄l (t). L’interazione quindi è puntuale, cioè se il neutrone di massa MN , individuato dalla coordinata r̄ coincide con quella dell’oggetto scatteratore cioè r̄ = R̄l (t) allora avviene l’interazione. La somma su l è quindi su tutti gli oggetti che scatterano mentre bl è un parametro detto parametro d’urto che in generale è una quantità complessa cioè b̃l = Re(bl ) + iIm(bl ). Com’è noto la parte immaginaria di una grandezza fisica è legata alle proprietà di assorbimento, e in questo caso essa è semplicemente diversa da zero in alcuni casi e significa che il nucleo scatteratore è in grado di assorbire il neutrone termico. Nell’uso spettroscopico dei neutroni 3 SCATTERING DA NEUTRONI TERMICI 27 termici si è interessati che questa parte immaginaria sia nulla e che quindi il parametro d’urto abbia solo la parte reale (perché si vuole che il neutrone viva e non che venga assorbito). bl è specifico per ogni sistema fisico e dipende dal numero di massa (neutroni+protoni) cioè dallo stato isotopico e dallo spin nucleare. Nello schema del teorema della risposta lineare si può vedere lo pseudopotenziale di Fermi come il prodotto di un fattore che dipende solo dal sistema (target) P 2 cioè l bl δ(r̄ − R̄l (t)) e uno che dipende solo dai neutroni (probe) cioè 2π~ MN , e poichè la matrice di scattering è un integrale sul tempo del potenziale, se il potenziale è fattorizzato allora lo è anche la matrice di scattering. Quindi dato un potenziale formato dal prodotto di due fattori, uno del probe e uno del target, viene soddisfatto il criterio base del teorema della risposta lineare. Il teorema quindi è applicabile in questo caso. Si consideri la relazione (2.33), e facendo le dovute sostituzioni si ha: 1 ∂2P ∂2σ = ⇒ ∂Ω∂ω N φN ∂Ω∂ω Z X |k̄fN | 1 −iq̄(r̄1 −r̄2 ) iωt d r ¯ d r ¯ dt e e h [b∗l δ(r̄1 − R̄l (t))][bl0 δ(r̄2 − R̄l0 (0))]i 1 2 |k̄iN | 2π 0 ll (3.2) I fenomeni di scattering li si preferisce trattare tramite la sezione d’urto doppio differenziale invece che con la probabilità di transizione doppio differenziale. La funzione di correlazione è X Cφt (r̄1 , r̄2 , t) = h [b∗l δ(r̄1 − R̄l (t))bl0 δ(r̄2 − R̄l0 (0))]i ll0 di cui si vuole illustrare il significato. Si prenda come esempio la grafite: essa è composta per la maggior parte da carbonio-12, in percentuale minore da C-13, e in misura ancora minore da C14. A parità di protoni quindi gli isotopi C-13 e C-14 hanno rispettivamente 1 e 2 neutroni in più rispetto al C-12. In base al numero di neutroni si avrà anche un diverso spin nucleare in cui figura il numero di nucleoni all’interno del nucleo. La media h i è sulla configurazione dello spin nucleare e del numero isotopico, e anche una media sulle posizioni R̄l . Nella maggior parte dei casi non ci sono motivi particolari per cui i primi vicini del C-12 siano C-13 o C-14, c’è una distribuzione statistica che esprime quanti C-12,13 o 14 si hanno nella miscela ma non le loro posizioni reciproche. Di solito dal punto di vista della massa isotopica e dello spin nucleare c’è completo disordine, in particolare non c’è nessuna correlazione tra la posizione del nucleo e il valore del suo parametro d’urto. Questo significa che la media che definisce la funzione di correlazione può essere decomposta nel modo seguente: X hb∗l bl0 ihδ1 δ2 i (3.3) ll0 Si può sempre pensare di scrivere una variabile termodinamica come il suo valore medio più la fluttuazione da quel valore, cioè si può scrivere che bl = b̂ + δbl . Ovviamente calcolando il valore medio di questa quantità si ottiene bˆl = b̂ in quanto il valore medio della fluttuazione è nullo. Il pedice l scompare nel fare 3 SCATTERING DA NEUTRONI TERMICI 28 la media in quanto essendo il valore medio fra tutti i possibili che assume il parametro d’urto nel sistema considerato esso non dipende dal sito, che invece rimane nello scarto. Sostituendo nella (3.3) si ha: X h(bˆ∗ + δb∗l )(b̂ + δbl0 )ihδ1 δ2 i ⇒ ll0 X [hbˆ∗ b̂i + hbˆ∗ δbl0 i + hb̂δb∗l i + hδb∗l δbl0 i]hδ1 δ2 i ll0 (attenzione a non confondere le fluttuazioni dal valore medio δb con le delta di Dirac δ1 e δ2 ). Il secondo e terzo termine in parentesi quadra si azzerano in quanto i valori medi delle fluttuazioni sono nulli per definizione, e rimangono così solo il primo e il quarto termine, cioè: X [|b̂|2 + hδb∗l δbl0 i]hδ1 δ2 i ll0 Si fa notare che la funzione di correlazione scarto-scarto hδb∗l δbl0 i è funzione velocemente decrescente della distanza fra i siti l − l0 , a meno di situazioni particolari si può assumere che essa sia la delta di Kronecher hδb∗l δbl0 i = δb∗l δbl0 δll0 . C’è un caso interessante: si consideri idrogeno molecolare. Esso è formato per 2/3 da orto-idrogeno molecolare (spin nucleare totale 1, nuclei con spin parallelo) e per 1/3 da para-idrogeno molecolare (spin nucleare totale 0, nuclei con spin antiparallelo). L’idrogeno molecolare sotto 21 K si liquefa e sotto 13 K solidifica. Ci si aspetta che, prendendo una molecola di orto-idrogeno, i suoi prima vicini siano per 2/3 di tipo orto e per 1/3 di tipo para, ma non è così. In questo caso si trova un addensamento di para con i para e orto con gli orto, e questo perché c’è una diffusione di spin nella fase condensata che fa convertire gli spin paro-orto e orto-para per cui i para e gli orto si avvicinano fra loro. In pratica c’è una separazione di fase di spin nucleare. In questo caso specifico quindi non è soddisfatta la condizione per cui la correlazione fra gli scarti può essere considerata come una delta di Kronecker. Se però si considera che hδb∗l δbl0 i = δb∗l δbl0 δll0 , vero nella maggior parte dei casi, si ottiene che, sostituendo nella funzione di correlazione: X [ |b̂|2 + δb∗l δbl0 δll0 ]hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l0 (0))i |{z} | {z } 0 ll (2) (1) Si consideri sola la prima parte, si può scrivere che: X X (1): |b̂|2 h δ(r̄1 − R̄l (t)) δ(r̄2 − R̄l0 (0))i l0 l Si definisce l’operatore densità come: X ρ(r̄, t) = δ(r̄ − R̄l (t)) (3.4) l che è una buona definizione di densità in quanto è la somma su tutte le particelle dell’operatore delta di Dirac che ha le dimensioni del reciproco della variabile che contiene. Per la parte (1) si può scrivere che: (1): |b̂|2 hρ(r¯1 , t)ρ(r¯2 , 0)i 3 SCATTERING DA NEUTRONI TERMICI 29 e si vede che questo termine è legato al valore medio del parametro d’urto, cioè il valore medio dell’interazione fra i neutroni e il sistema considerato. Il termine (1) misura la trasformata di Fourier spazio-temporale della funzione di correlazione densità-densità e si chiama risposta coerente dei neutroni. Per la parte (2) si ha: X (2): δb∗l δbl0 δll0 hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i ll0 che invece dà luogo a quella che viene chiamata la risposta incoerente dei neutroni. Quindi per la sezione d’urto si possono scrivere due termini distinti: |k N | 1 ∂ 2 σ 2 f = | b̂| ∂Ω∂ω coer |kiN | 2π Z dt eiωt Z dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) hρ(r¯1 , t)ρ(r¯2 , 0)i (3.5) Z Z |kfN | 1 ∂ 2 σ iωt ˆ 2 = |δbl | N dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) · dt e ∂Ω∂ω incoer |ki | 2π X · hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i (3.6) l La risposta coerente è legata alla risposta collettiva del sistema, in quanto la densità è la manifestazione delle eccitazioni delle particelle a livello locale, coerente perché misura la risposta di tutto il sistema di particelle, e come si vede dipende dal valore medio del parametro di interazione che di solito è una quantità ben definita. Per quanto riguarda il termine (2) legato alle fluttuazioni, esso dà luogo al termine incoerente della sezione d’urto. A causa della delta di Kronecker δll0 non è più possibile definire la densità, e la doppia sommatoria diventa una sommatoria singola, e ciò che si sta misurando è: 2 |δ bˆl | X hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i l che è la correlazione tra la posizione della particella l-esima con sè stessa al tempo zero e ad un tempo successivo t. Si chiama incoerente perché è una risposta legata alla singola particella e non alla collettività del sistema. 3.1 Funzione di Van Hove, funzione di scattering, fattore di struttura statico La funzione di correlazione densità-densità può essere scritta in termini di una grandezza generale detta funzione di Van Hove: G(r̄, t) = hρ(r̄, t)ρ(0̄, 0)i (3.7) che può essere trovata anche normalizzata rispetto alla densità media. La sezione d’urto coerente, con la definizione appena data è proprio la trasformata di Fourier (TdF) della funzione di Van Hove. Questa a sua volta può essere scritta come la somma di due termini, una parte self e una parte distinct: G(r̄, t) = Gs (r̄, t) + Gd (r̄, t) (3.8) 3 SCATTERING DA NEUTRONI TERMICI 30 La definizione generale della funzione di Van Hove, esplicitando la funzione di correlazione densità-densità è: X G(r¯1 , r¯2 , t) = hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i (3.9) ll0 e i termini self e distinct sono rispettivamente: X G self: Gs (r¯1 , r¯2 , t) = hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i (3.10) l G distinct: Gd (r¯1 , r¯2 , t) = X hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i (3.11) l6=l0 quindi nella G self è contenuta la dinamica di singola particella mentre nella G distinct è contenuta la dinamica di una particella con un’altra da essa distinta. Qui non si discute di particelle indistinguibili, per cui queste sono tutte definizioni classiche. La funzione di Van Hove è ben definita nelle variabili r̄ e t, e vale il seguente limite: lim G(r̄, t) = Gs (r̄, 0) + Gd (r̄, 0) (3.12) Gs (r̄, 0) −−−→ δ(r̄) (3.13) t→0 e ovviamente vale che: t→0 in quanto la correlazione della particella con sè stessa è 1 a tempi nulli (la particella o si trova in quel punto oppure non c’è). Vediamo ancora qualche definizione. Viene chiamata funzione di scattering la seguente espressione: Z S(q̄, ω) = dr¯1 dr¯2 dt e−iq̄(r¯1 −r¯2 ) eiωt G(r¯1 , r¯2 , t) (3.14) che come si vede è la TdF della funzione di Van Hove. Quindi per la parte coerente della sezione d’urto si può riscrivere: |kfN | 1 ∂ 2 σ = |b̂|2 N Sd (q̄, ω) ∂Ω∂ω coer |ki | 2π (3.15) la funzione di scattering essendo la TdF della funzione di correlazione densitàdensità è relativa al sistema. Facendo la decomposizione vista fra i termini self e distinct nella definizione di S(q̄, ω) si ottiene una Sself e una Sdistinct . La Sself è quella che entra nella parte incoerente della sezione d’urto cioè: |kfN | 1 ∂ 2 σ = |δbˆ2l | N Ss (q̄, ω) ∂Ω∂ω incoer |ki | 2π (3.16) A partire dalla definizione della funzione di scattering si definisce il fattore di struttura statico: Z S(q̄) = dωS(q̄, ω) (3.17) cioè l’integrale su tutte le energie scambiate della funzione di scattering (o fattore di struttura dinamico) dà il fattore di struttura statico che può essere spiegato 3 SCATTERING DA NEUTRONI TERMICI 31 guardando la figura 4: i neutroni dopo aver interagito col target vengono diffusi in tutte le direzioni, alcuni hanno lo stesso ki mentre altri avranno un kf 6= ki mentre altri ancora verranno retrodiffusi (cioè kf = −ki ). E’ importante, fissata una certa direzione di diffusione capire se l’energia dei neutroni diffusi sia uguale o meno a quella dei neutroni incidenti per capire se l’interazione è di tipo elastico o anelastico. Calcolare il fattore di struttura statico vuol dire scegliere una precisa direzione finale kf e integrare su tutte le ω, ricordando che ~ω = EfN − EiN , significa contare tutti i neutroni che arrivano in quella data direzione senza curarsi del fatto che abbiano subito uno scattering elastico o anelastico. Per capire meglio si pensi che della quantità di neutroni che incidono sul bersaglio circa il 99 % passano indisturbati; il 99 % dell’1 % rimanente subisce uno scattering elastico e solo la parte restante (cioè l’1 % dell’1 %) subisce uno scattering anelastico. Per contare tutti i neutroni diffusi si dovrebbe avere un detector emisferico attorno al bersaglio e integrare non solo su tutte le frequenze ma anche su tutti i vettori d’onda. Il fattore di struttura statico è interessante perché misura i picchi di Bragg di una struttura ordinata: essi sono i picchi di intensità dovuti a processi elastici in cui non viene scambiata energia (~ω = 0) ma viene cambiato solo il vettore d’onda. Il contributo elastico è enormemente maggiore di quello anelastico e il Bragg misura proprio questo. Dalla misura del Bragg si possono ottenere informazioni sulla struttura ordinata che costituisce il target. E’ facile mostrare che, data la (3.14) e la (3.17), integrando in dω, il fattore di struttura statico è la TdF spaziale della G(r̄, 0): Z S(q̄) = dr̄e−iq̄ · r̄ G(r̄, 0) R R questo perché si può scambiare dω con dt (perché le funzioniRcoinvolte sono iωt uniformemente continue, R e le funzioni fisiche come ω e t lo sono) e dωe = δ(t) che annulla l’integrale dt. Il significato fisico è che il fattore di struttura statico contiene le correlazioni a tempi nulli. Infine si consideri il fattore di struttura dinamico: Z S(q̄, ω) = dr̄dt e−iq̄ · r̄ eiωt hρ(r̄, t)ρ(0̄, 0)i (3.18) dove si è usata la definizione di G, cioè la correlazione densità-densità: dato un valore di densità nella posizione 0̄ al tempo 0, la funzione di correlazione misura come questo valore di densità influenza la densità stessa a valori spaziali r̄ e temporali t successivi. Qualunque grandezza fisica di solito può essere scritta come si è fatto per il parametro d’urto, cioè come data dal valore medio più le fluttuazioni da quel valore: ρ(r̄, t) = ρ̂ + δρ(r̄, t) (3.19) il valore medio ρ̂ è quello che si ottiene da una misura macroscopica termodinamica mentre le fluttuazioni δρ(r̄, t) sono quelle che si ottengono con un probe locale. Prendendo questa definizione e sostituendola nella funzione di correlazione densità-densità si ha: h(ρ̂ + δρ(r̄, t))(ρ̂ + δρ(0̄, 0))i = ⇒ ⇒ =|ρ̂|2 + hδρ(r̄, t)ρ̂i + hρ̂δρ(0̄, 0)i + hδρ(r̄, t)δρ(0̄, 0)i 2 ⇒ =|ρ̂| + hδρ(r̄, t)δρ(0̄, 0)i (3.20) 3 SCATTERING DA NEUTRONI TERMICI 32 cioè si è divisa la funzione di correlazione in una parte che dipende dal valore medio di ρ e di una parte che dipende dalla correlazione delle fluttuazioni. Sostituendo nella (3.18) si ha, per la prima parte che dipende solo da ρ̂: Z Z 2 iωt S(q̄, ω) = ρ̂ dt e dr̄ e−iq̄ · r̄ = ρ̂2 δ(q̄)δ(ω) (3.21) come si vede la parte dipendente dalla densità media macroscopica è 6= 0 solo se q̄ = 0 e ω = 0 e questo significa che essa riguarda i neutroni che attraversano il campione indisturbati, cioè quelli che non interagiscono. Si potrebbe dire che questi neutroni "interagiscano col valore medio della densità". Se non ci fossero fluttuazioni di densità quindi i neutroni passerebbero indenni, e il sistema da questo punto di vista sarebbe neutro. Questo in generale è vero per qualunque funzione di correlazione quando si scrive la variabile dinamica come la somma del suo valore medio più la correlazione fra le fluttuazioni: la parte dipendente dal valore medio di solito è quella che non restituisce risposta, mentre il contributo alla S(q̄, ω) viene dalla parte fluttuativa. Il Prof. Lupi usa intenzionalmente le parole eccitazione e fluttuazione come sinonimi proprio per questo motivo: la fluttuazione equivale a una eccitazione del sistema che si riflette dal punto di vista macroscopico in una modifica del probe, che viene misurato e quindi fornisce una misura dello "spettro spaziale e temporale delle fluttuazioni". Questo discorso vale per sistemi omogenei (liquido o fluido) mentre per un cristallo si usa una scrittura differente che vedremo più avanti. Distinguiamo ora dei casi semplici per capire meglio cosa si studia con lo scattering da neutroni. 3.2 Studio di un gas perfetto Un gas perfetto, per particelle massive, ha una hamiltoniana del tipo: b = H X p¯i 2 + 6 Vb 2m i (3.22) come si evince dal potenziale barrato 6 Vb in un gas perfetto non c’è interazione fra le particelle, e viene considerata solo l’energia cinetica. Che tipo di risposta si misura incidendo con i neutroni su gas molto rarefatto? L’assenza del potenziale di interazione particella-particella implica che l’unica risposta misurabile è quella incoerente. Una risposta collettiva sarebbe legata alla densità, ma se non c’è interazione fra le particelle, anche cambiando localmente la posizione di una o più particella non v’è alcun effetto su tutte le altre. Come visto la risposta incoerente è legata alla Gs (r̄, t) il cui limite è: lim Gs (r̄, t) = δ(r̄) t→0 Per calcolare lo spettro si dovrebbe calcolare la: Z Ss (q̄, ω) = dr̄dt eiωt e−iq̄ · r̄ Gs (r̄, t) (3.23) (3.24) perché la sezione d’urto incoerente è: |kfN | 1 ∂ 2 σ = |δbˆ2l | N Ss (q̄, ω) ∂Ω∂ω incoer |ki | 2π (3.25) 3 SCATTERING DA NEUTRONI TERMICI 33 Ciò significa che, se si arriva con N neutroni sul sistema, il numero di neutroni scatterati con una certa energia Ef e vettore d’onda kf è dato da: NEf ,kf = N · ∂2σ ∂Ω∂ω (3.26) Non conoscendo l’espressione della Gs si ipotizza una forma gaussiana, cioè: " # 23 r2 1 Gs (r̄, t) = (3.27) e− 4α(t) 2πα(t) in questo modo la non conoscenza della Gs si è spostata sulla non conoscenza del parametro α(t). La G come la Gs e la Gd , opportunamente normalizzate, sono delle probabilità condizionate (come un valore iniziale condiziona i valori successivi). Dal punto di vista probabilistico quindi è possibile definire il momento secondo della distribuzione cioè: Z 2 hr i = dr r2 Gs (r̄, t) (3.28) che è il valore medio della posizione quadratica. Esso è comunque definito, per un gas perfetto, come la media della velocità quadratica per il tempo al quadrato cioè hr2 i = hv 2 it2 (si hanno particelle libere). Il valore di hv 2 i è noto grazie al principio di equipartizione dell’energia: 1 3 3kB T mhv 2 i = kB T ⇒ hv 2 i = 2 2 m (3.29) dove T è la temperatura assoluta. Per cui si ha per il momento secondo: hr2 i = 3kB T 2 t m (3.30) Data la definizione probabilistica della Gs e conoscendo hr2 i, è possibile integrare la Gs a causa della forma funzionale gaussiana data e calcolare α(t), trovando che: kB T 2 hr2 i = 6α(t) ⇒ α(t) = t (3.31) 2m Ora, visto che è stato ben definito il parametro α(t) (che deve avere le dimensioni di una distanza al quadrato dato che l’esponente della (3.27) deve essere adimensionale) questo può essere inserito nella (3.27) per ridefinire la Gs e quindi calcolare la Ss e quindi la sezione d’urto, e ottenere così la risposta data dai neutroni termici che incidono contro un gas perfetto. Sapendo che la funzione gaussiana è autofunzione dell’operatore trasformata di Fourier (cioè sono invarianti sotto TdF) scrivendo in maniera esplicita la Ss si ha: # 12 " 2 m − mω Ss (q̄, ω) = e 2kB T q2 (3.32) kB T 2πq che come si vede è una funzione a sua volta gaussiana nelle variabili ω (TdF del tempo) e q̄ (TdF della posizione). In particolare la larghezza a mezza altezza di questa funzione (Full Width Half Maximum - FWHM) è: r 2 ln 2 kB T Γ(q) = 2 q (3.33) m 3 SCATTERING DA NEUTRONI TERMICI 34 Figura 5: Grafico della Ss in due direzioni differenti q1 e q2 . che in pratica è la sua varianza. In figura 5 è graficata la Ss . Si hanno in ascisse l’energia scambiata e in ordinata il momento scambiato. Il grafico in sostanza rappresenta le particelle scatterate in due direzioni differenti (q1 e q2 ). Alcuni neutroni sono scatterati in maniera elastica (la maggior parte visto che il picco si ha per ω = 0) e altri in maniera anelastica. Le linee verdi mostrano il valore del FWHM delle due gaussiane disegnate a differenti valori di q. Rispetto al segnale massimo (scattering elastico, ω = 0) vi sono processi anelastici Stokes e anti-Stokes per valori di ω rispettivamente negativi e positivi. Spostandosi da q1 verso q2 , cioè aumentando il vettore d’onda scambiato, Γ aumenta linearmente con q e di conseguenza la gaussiana si schiaccia. Ci si può chiedere se l’area sotto la prima gaussiana sia uguale a quella della seconda, o in altri termini se c’è una distribuzione isotropa di scattering a tutti i vettori d’onda scambiati, cioè da 0 a 2kiN oppure, in alternativa, se c’è un qualche tipo di cut-off nel vettore d’onda scambiato. Un gas perfetto a temperatura ambiente ha una funzione di distribuzione delp̄2m l’energia delle particelle maxwelliana, centrata sul valore 32 kB T = 2m dove p̄m è l’impulso più probabile; ci si aspetta che se si va ad una decina di volte il valore massimo dell’energia ci siano pochissime particelle che hanno un’energia media molto più grande di 32 kB T . In sostanza la maggioranza delle particelle ha un’energia molto vicina al valore centrale e solo pochissime particelle avranno un impulso molto più grande di p̄m . Per avere un processo in cui il vettore d’onda scambiato q̄ è molto grande, i neutroni devono interagire con particelle ad alto vettore d’onda, quindi in principio si può anche ottenere retrodiffusione, tuttavia il numero di particelle che subiscono processi di questo tipo è estremamente basso. Il calcolo è semplice: si consideri un gas di azoto N2 con massa m a 300 K. Si può calcolare l’impulso quadratico medio p̄ = ~k̄ da cui si ricava k e quindi il 3 SCATTERING DA NEUTRONI TERMICI 35 vettore d’onda più probabile nel processo. La statistica delle particelle, cioè come sono distribuite a livello energetico, e di conseguenza (data la relazione tra energia e impulso delle particelle) qual è il vettore d’onda più probabile, determina come è fatto lo spettro di scattering. In conclusione si può dire che per un gas perfetto la probabilità che avvengano processi con vettore d’onda scambiato grande è una quantità piccola, in quanto è piccolo il numero di particelle con vettore d’onda diverso da quello più probabile. Quindi cosa si vede fisicamente in questo sistema? Fissata una direzione di scattering si contano il numero di particelle che arrivano, e si fa una selezione in energia, si costruisce la funzione di distribuzione dei neutroni scatterati e per un dato vettore d’onda (quindi per una data direzione di scattering) si ottiene una gaussiana centrata in ω = 0, che mi dice che il processo più probabile è quello elastico. A parità di vettore d’onda la larghezza della gaussiana dipende da √ T , che riflette semplicemente la statistica delle velocità delle particelle. Quindi tanto più è alta la temperatura, tanto maggiore è la larghezza della gaussiana e quindi si ha un alto numero di particelle con velocità (energia cinetica) sufficiente per avere scattering elastico, quindi Γ è una misura della distribuzione di energia delle particelle che stanno diffondendo i neutroni. In teoria, andando a temperatura quasi nulla e supponendo che il gas perfetto in esame rimanga un gas, le gaussiane tendono a stringersi fino a diventare delle delta di Dirac; ad esempio per l’elio gassoso, che rimane gassoso fino a 4.2 K dopodichè liquefa (con un salto di densità di circa un fattore 1000), e non solidifica mai, si vede l’effetto di restringimento delle gaussiane in cui i processi anelastici diventano sempre meno probabili a vantaggio di quelli elastici, perché lo spettro di energia delle particelle che stanno diffondendo i neutroni è sempre meno largo. Vogliamo ora andare a vedere il caso di una gas reale, in cui c’è un poco di interazione fra le particelle. 3.3 Studio di un gas reale Come già detto, un gas reale, l’operatore di interazione Vb fra le particelle è piccolo rispetto all’energia cinetica ma non nullo. Quando il potenziale totale (media fra potenziale a corto range repulsivo e potenziale a lungo range attrattivo) assume un valore comparabile a quello dell’energia cinetica si ha la transizione verso lo stato liquido. Per un gas a densità sufficientemente elevata il potenziale particella-particella gioca un ruolo fondamentale e ha un effetto nello spettro osservabile tramite scattering di neutroni termici. Un gas reale ha un tempo caratteristico fra due urti τ : per tempi piccoli cioè t τ si è in approssimazione di particella libera, mentre per tempi sufficientemente grandi cioè t τ gli urti hanno un peso rilevante (consideriamo per semplicità urti elastici). Si può dire quindi che la dinamica dipende dal range temporale che si considera. L’effetto medio di tale dinamica permette di calcolare la funzione α(t). Come nel caso precedente infatti ci si vuole concentrare sulla forma della Gs , spostando la non conoscenza della Gs sulla non conoscenza di α(t): α(t) = D∗ t (3.34) dove D∗ è il parametro di diffusione di Einstein. La media per tempi tali per cui si abbiano sia le dinamiche di particella libera che quelle degli urti fa si che il 3 SCATTERING DA NEUTRONI TERMICI 36 Figura 6: Andamento di Γ(q) parametro α non sia più quadratico nel tempo, come nel caso di un gas perfetto, bensì sia lineare. Prendendo la (3.34) e inserendola nella (3.27), e calcolando la trasformata di Fourier, si ottiene per un gas reale: Ss (q̄, ω) = 1 D∗ q2 π (D∗ q 2 )2 + ω 2 (3.35) e la FWHM di questa funzione è: Γ(q) = 2D∗ q 2 (3.36) La nuova funzione è una lorenziana, mentre prima nel caso di particella libera si aveva una gaussiana. Anche questa funzione è centrata in ω = 0, cioè la probabilità massima si ha per processi elastici, e a differenza del caso precedente la Γ cresce con q 2 mentre prima cresceva linearmente con q. In figura 6 viene graficato il valore di Γ(q). Quando si hanno delle particellepche scatterano con altre particelle, si può definire il libero cammino medio l = hv 2 iτ . Per un gas τ è dell’ordine del ps, mentre hv 2 i è dell’ordine dei 105 m/s. Osservando spazialmente il sistema, quando la variabile spaziale è molto più grande del cammino libero medio r l si sta osservando una dinamica contraddistinta da molti urti. Ciò significa che Γ(q) è quello dato dalla (3.36), e lo spettro del processo è lorenziano. Questo significa che l’andamento quadratico di Γ è esclusivo di valori di q piccoli, perché l’inverso del vettore d’onda fornisce la risoluzione spaziale λ = 2π/q (per vettore d’onda scambiato piccolo si stanno considerando neutroni diffusi attorno alla direzione ki ) che quindi sarà grande e corrisponde alla dinamica appena descritta. Se invece si considerano vettori d’onda scambiati grandi, significa che dal punto di vista della risoluzione spaziale si è in grado di risolvere dinamiche molto piccole, tra due urti, per cui si è in grado di vedere una FWHM della distribuzione che varia linearmente con q. Si può dire che Γ(q) non ha solo il significato probabilistico di essere la FWHM della distribuzione di particelle (gaussiana, lorenziana o una via di mezzo), ma rende l’idea della dinamica che si è in grado di osservare. In termini rigorosi: dato un fluido reale, con un certo potenziale di interazione e distribuzione di energia, i processi di scattering in cui il vettore d’onda finale del neutrone è abbastanza vicino a quello incidente (quindi neutroni scarsamente 3 SCATTERING DA NEUTRONI TERMICI 37 Figura 7: Studio di un solido ordinato: cella elementare cubica deviati) stanno fotografando dinamiche collettive medie su distanze grandi (gli urti), i neutroni che vengono scatterati con vettore d’onda scambiato grande tengono conto delle dinamiche di singola particella (cammino libero). Ovviamente c’è una regione di transizione in cui si passa dalla dinamica mediata sugli urti a quella di singola particella (è un problema ancora aperto capire cosa succede nella regione di crossover sui sistemi reali per lo scattering di neutroni). In conclusione se si è in grado di registrare l’andamento di Γ si è in grado di studiare i regimi estremali: quello di particella libera e quello degli urti. 3.4 Studio di un solido ordinato Nel caso dei solidi ordinati, l’interazione che serve ad avere dinamiche collettive è tale per cui queste dinamiche possono propagarsi (ad esempio il suono). Per un sistema ordinato lo scattering di neutroni fornisce numerose informazioni utili sul sistema. Nei casi precedenti la variabile q è continua, e i neutroni possono essere scatterati in tutte le direzioni, mentre per i solidi ordinati l’invarianza traslazionale finita determina scattering solo lungo direzioni specifiche, e quest’effetto è chiamato scattering di Bragg. Un cristallo è un oggetto contraddistinto da una struttura periodica il cui elemento unitario è la cella elementare. Si consideri una cella elementare cubica e un sistema di riferimento esterno: il vettore x̄l indica lo spigolo della cella, e dato questo spigolo, il vettore che individua gli atomi all’interno della cella è x̄χ . Il sistema è schematizzato in figura 7. Si può dire che x̄l è un vettore macroscopico mentre x̄χ è un vettore di qualche Å. Quindi i pedici l e χ indicano rispettivamente la cella e l’atomo in essa. Data la periodicità del reticolo, se si trasla di un vettore R̄lχ = x̄l + x̄χ si ottiene una struttura equivalente (grazie all’invarianza per traslazione di un vettore principale del reticolo diretto). In generale gli atomi possono oscillare, a temperatura finita, attorno alla posizione di equilibrio, e questo determina una dipendenza dal tempo del vettore R̄lχ a causa del vettore ūlχ (t) che definisce la posizione istantanea e indica lo spostamento dalla posizione di equilibrio. Quindi si può scrivere che R̄lχ (t) = x̄l + x̄χ + ūlχ (t). Se si prendono due atomi nella 3 SCATTERING DA NEUTRONI TERMICI cella, si può vedere che: |x̄χ − x̄χ0 | √ 38 ū2 (3.37) che significa che lo scarto quadratico medio degli atomi che oscillano attorno ad una certa posizione di equilibrio è molto più piccolo della distanza media fra gli √atomi stessi. Per dare un’idea delle grandezze, se |x̄χ − x̄χ0 | ' 1 Å, allora ū2 ' 0.01 Å. Quando si aumenta tanto la temperatura, il valore di ū aumenta (oscillazioni sempre più ampie) e quando la distanza quadratica media dell’oscillazione passa da 1/100 a circa 1/3 della distanza media fra due atomi, allora il cristallo fonde e si ha la transizione di fase verso lo stato liquido. Si faccia quindi l’ipotesi di avere un cristallo stabile e cioè che il valore di ū sia piccolo rispetto alla distanza fra due atomi. In un sistema tridimensionale, in cui si hanno r atomi per cella e N celle, il numero totale di gradi di libertà (dof) è 3rN , un numero enorme. Per un tale sistema, l’energia cinetica è: T = 1X 2 Mχ (u̇α lχ ) 2 con α = x, y, z (3.38) lχα e per il discorso fatto prima si può dire che si hanno 3rN termini cinetici di questo tipo. Il potenziale d’azione cristallino non è a corto range in quanto se si muove un atomo in una cella tutti quelli vicini ne risentiranno. L’energia di interazione dipende quindi dall’insieme delle coordinate (parentesi graffe) e dato che non ne si conosce la forma si può pensare di svilupparlo in serie: φ(R̄lχ (t)) = φ0 + X φα (l, χ)uα lχ (t) + 1 X β φαβ (l, l0 , χ, χ0 )uα lχ (t)ul0 χ0 (t) + . . . 2 lχα l 0 χ0 β lχα (3.39) tale potenziale dipende dalla configurazione reticolare: φ0 è il potenziale calcolato nella configurazione di equilibrio cioè: φ0 = φ({x̄l + x̄χ }) (3.40) mentre per il termine lineare si ha: φα (l, χ) = ∂φ ∂uα lχ u=0 (3.41) questo termine all’equilibrio va a zero in quanto il sistema è stabile e il potenziale totale ha un minimo. Per il termine quadratico si ha: φαβ (l, l0 , χ, χ0 ) = ∂2φ β u=0 ∂uα lχ ∂ul0 χ0 (3.42) Se si tiene conto anche dei termini cubici, quarti ecc, si sta tenendo conto di fenomeni che ci sono nei sistemi reali, ad esempio per tenere conto della dilatazione termica si deve includere nel potenziale anche il termine di ordine 3 (quindi in sistemi armonici non si ha espansione termica). Normalmente per il potenziale di interazione in una cella e fra le varie celle, ci si ferma al secondo ordine, cioè si scrive il potenziale totale all’equilibrio più la derivata seconda, e questa scrittura si chiama approssimazione armonica. La φαβ (l, l0 , χ, χ0 ) è la costante della forza di richiamo, cioè la forza generalizzata 3 SCATTERING DA NEUTRONI TERMICI 39 di interazione fra l’atomo χ0 presente nella cella l0 con l’atomo χ nella cella l. L’atomo χ si muove in maniera istantanea con lo spostamento ulχ (t) mentre l’atomo χ0 si muove istantaneamente con lo spostamento ul0 χ0 (t). Si possono quindi scrivere le 3rN equazioni del moto: X φαβ (l, l0 , χ, χ0 )uβl0 χ0 (t) (3.43) Mχ ülχ (t) = − l0 χ0 α0 L’approssimazione armonica favorisce la soluzione delle equazioni del moto altrimenti irrisolvibili. Una possibile soluzione della (3.43) si può scrivere come: X 1 ēα (k̄j , χ)eik̄j · x̄l Qk̄j (t) uα lχ (t) = p N Mχ (3.44) k̄j Questa formula dice che la posizione dell’atomo χ nella cella l, nella sua componente cartesiana α al tempo t è una combinazione lineare (a parte il fattore di normalizzazione) di moti armonici di ampiezza Qk̄j (t), dove k̄j è il vettore d’onda con j che è l’indice di branca della dispersione fononica. L’oggetto ēα (k̄j , χ) si chiama versore di polarizzazione dei modi normali di vibrazione e indica il verso di oscillazione dei piani cristallini sollecitati da un’onda k̄: se l’oscillazione è parallela alla propagazione dell’onda si ha il modo longitudinale, se invece è perpendicolare ad essa si hanno i due modi trasversali ; questa situazione è diversa da quella dell’onda elettromagnetica in cui il versore di polarizzazione ha solo due componenti sempre trasverse rispetto alla direzione di propagazione dell’onda. Il fattore di fase eik̄j · x̄l altro non è che il teorema di Bloch, cioè è un fattore che tiene conto della periodicità del cristallo, e data la conoscenza di quello che avviene nella cella elementare, si conosce la dinamica su tutto il cristallo. Data la soluzione generale (3.44), inserendola nell’equazione del moto (3.43), si trova un’equazione del moto puramente armonica. L’approssimazione armonica fa si che ogni atomo si muova all’interno del cristallo come una combinazione lineare di moti armonici e questo è ciò che si chiama modo armonico di vettore d’onda k̄ e branca j. Ricapitolando si può scrivere che un modo armonico del cristallo Qk̄j (t) è definito da: • k̄ vettore d’onda del modo; • ē(k̄j , χ) versore di polarizzazione del modo armonico; • j indice di branca (longitudinale e trasversale); L’espressione (3.44) è uno sviluppo in serie e dice come oscilla un atomo rispetto ai modi normali di oscillazione. Quest’espressione può essere invertita per scrivere l’espressione del modo normale di oscillazione in funzione dello spostamento dei singoli atomi: 1 Xp Qk̄j (t) = √ Mχ e∗α (k̄j , χ)e−ik̄j · x̄l uα lχ (t) N lχα (3.45) Nel momento in cui, per effetto dell’interazione atomo-atomo all’interno del cristallo, viene spostato dalla posizione di equilibrio (o ciò avviene a causa della 3 SCATTERING DA NEUTRONI TERMICI 40 Figura 8: Grafico della relazione di dispersione per la branca acustica e quella ottica. La distanza 0-π/a rappresenta la metà della prima zona di Brillouin. temperatura) un singolo atomo, questa perturbazione locale si propaga all’interno del cristallo. La perturbazione locale si riflette in un’onda di perturbazione globale che si propaga nel cristallo. Per questo motivo il moto di singolo atomo è scrivibile come composizione di onde oscillatorie all’interno del cristallo. Se si guarda il cristallo nel complesso, il moto del cristallo è riconducibile alla somma di moti armonici di ampiezza uα lχ (t). Questo è il modo normale di vibrazione: una combinazione lineare dei moti di singolo atomo la cui quantizzazione dà luogo al concetto di fonone. In principio si può dire che il modo normale è un modo cooperativo di tutti gli atomi che si muovono all’interno del cristallo. Ma perché si chiama modo normale? perché esso soddisfa un’equazione del moto del tipo: Q̈k̄j (t) + ωk̄2j Qk̄j (t) = 0 (3.46) che è un’equazione di oscillatore armonico. La soluzione della (3.46) è evidentemente: −iω t (3.47) Qk̄j (t) = Qk̄j (0)e k̄j con ωk̄j che è la pulsazione del modo normale di vibrazione. Infatti il modo normale, a seconda di j è caratterizzato da una legge di dispersione data dalla pulsazione in funzione del vettore d’onda ωj (k̄); quella dei fotoni ad esempio è ω(k̄) = ck̄. Per i modi normali di vibrazione invece la legge è più complessa. Se si ha un cristallo tridimensionale con r atomi per cella, facendo riferimento alla figura 8, la linea blu rappresenta la branca acustica che di solito si splitta in tre linee, una più alta per il modo longitudinale e due più basse sovrapposte per i modi trasversali; la linea rossa invece rappresenta la branca ottica, che si presenta quando si hanno almeno due atomi per cella (con un solo atomo per cella si hanno solo le branche acustiche), ed essa non va a zero col vettore d’onda. Anche la branca ottica si splitta in una linea a più alta energia per il modo longitudinale e due linee più basse per i modi trasversali. Tutto questo, in generale, è un discorso classico. Per fare un passo avanti e studiare i modi normali nel caso quantistico bisogno introdurre il concetto di fonone. 3 SCATTERING DA NEUTRONI TERMICI 3.4.1 41 I fononi Data la posizione istantanea di un atomo, dal punto di vista della meccanica si può definire l’impulso dell’atomo come p̄lχ (t) = Mχ ū˙ lχ . La meccanica quantistica entra in queste considerazioni scrivendo il commutatore: β [ûα lχ (t), p̂l0 χ0 (t)] = i~δll0 δχχ0 δαβ (3.48) ed ora û e p̂ sono operatori. La relazione (3.48) rappresenta semplicemente un’altra relazione già nota e cioè il commutatore dell’oscillatore armonico [X̂, P̂ ] = i~. Il commutatore (3.48) significa che non è possibile misurare con infinita precisione e contemporaneamente la posizione e l’impulso istantanei dell’atomo in esame (per due atomi distinti invece è possibile). L’applicazione, in meccanica quantistica, di un commutatore posizione-impulso fa si che anche Q̂k̄j (t) diventi un operatore. ˙ Similmente, definendo il nuovo impulso per il modo normale come P̂k̄j = Mχ Q̂k̄j (t) si può mostrare che vale la relazione di commutazione a tempi uguali: [Q̂k̄j (t), P̂k¯0 j0 (t)] = i~δjj 0 ∆(k̄ − k̄ 0 ) (3.49) Quindi si può dire che il passaggio alla meccanica quantistica avviene imponendo la relazione di commutazione posizione-impulso nello spazio reale che è semplicemente l’estensione della proprietà di commutazione dell’oscillatore armonico unidimensionale, e anche la variabile modo normale e il suo impulso coniugato diventano operatori che soddisfano la relazione (3.49). Quest’espressione significa che la variabile modo normale e impulso coniugato sono contemporaneamente misurabili se si considerano branche diverse o se hanno vettori d’onda diversi. La quantità ∆(k̄ − k̄ 0 ) si chiama delta generalizzata o delta cristallografica ed essa è diversa da zero se k̄ = k̄ 0 + Ḡ con Ḡ vettore principale del reticolo reciproco. Come per la quantizzazione dell’oscillatore armonico unidimensionale, partendo dalla (3.45), si possono definire gli operatori a†k̄ e ak̄j : j "r a†k̄ j = "r ak̄j = ωj (k̄) † 1 Q̂k̄ + j 2~ i s ωj (k̄) 1 Q̂k̄j − 2~ i s 1 P̂ † 2~ωj (k̄) k̄j # 1 P̂ 2~ωj (k̄) k̄j # (3.50) (3.51) che sono gli operatori di creazione e distruzione, e soddisfano la relazione di commutazione [â†k̄ , âk̄j ] = δjj 0 ∆(k̄ − k̄ 0 ). E’ possibile definire l’hamiltoniana, j che diventa un operatore, tramite gli operatori appena scritti come una somma di hamiltoniane di singolo oscillatore armonico: X † 1 b b b ~ωj (k̄) (3.52) H =T +φ⇒ ak̄ ak̄j + j 2 k̄,j La quantità n̂k̄j = a†k̄ ak̄j è detta operatore numerico k̄j . j Lo stato fondamentale di un oscillatore armonico unidimensionale quantizzato 3 SCATTERING DA NEUTRONI TERMICI 42 Figura 9: Livelli energetici dell’oscillatore armonico unidimensionale quantizzato sovrapposti al potenziale V dell’oscillatore armonico classico. ha energia ~ω 2 detta energia di punto zero. I livelli energetici rispetto all’oscillatore classico sono discretizzati, tutti distanziati di ~ω, e in figura 9 li si vede sovrapposti al potenziale dell’oscillatore classico. In meccanica quantistica l’oscillatore ha un’energia di punto zero che è non nulla, questo a causa della relazione di commutazione a tempi uguali (3.49). A causa del principio di indeterminazione di Heisenberg, se l’oscillatore è fermo ha una indeterminazione infinita sull’impulso (e quindi sull’energia cinetica), viceversa se l’oscillare ha un impulso ben definito allora ha indeterminazione infinita sulla posizione. In questo quadro l’energia di punto zero ha il significato della minima indeterminazione posizione-impulso che minimizza l’indeterminazione sull’energia. Poichè posizione e impulso non sono simultaneamente misurabili cioè ∆p∆x ≥ ~, la minima indeterminazione soddisfacente la relazione appena scritta implica la minima indeterminazione sull’energia ∆E ≥ ~ω 2 . Quando si parla di operatori di creazione o distruzione, ciò che viene distrutto e creato è la popolazione corrispondente ai livelli. L’ampiezza di oscillazione classica significa a livello quantistico quanti livelli popolati si hanno. E’ possibile definire la coordinata generalizzata Q nonchè operatore di modo normale tramite gli operatori (3.50) e (3.51) e scrivere: s i ~ h † Qk̄j (t) = ak̄ (t) + ak̄j (t) (3.53) j 2ωk̄j e questa può essere sostituita nella (3.44) e ottenere: s i X ~ h † 1 ik̄j · x̄l α ulχ (t) = p ēα (k̄j , χ)e ak̄ (t) + ak̄j (t) j 2ωk̄j N Mχ (3.54) k̄j la coordinata istantanea ū dell’atomo χ nella cella l viene così espressa mediante gli operatori di creazione e distruzione, di cui vogliamo esplicitare il funzionamento. 3 SCATTERING DA NEUTRONI TERMICI 43 Se |nk̄j i è lo stato che indica l’n-esimo stato eccitato dell’oscillatore armonico allora l’operatore di creazione fononico (3.50) applicato a questo stato da: q a†k̄ |nk̄j i = nk̄j + 1 |nk̄j + 1i (3.55) j mentre per l’operatore di distruzione fononico (3.51) si ha: q ak̄j |nk̄j i = nk̄j − 1 |nk̄j i (3.56) cioè a†k̄ alza di uno il livello di eccitazione del sistema mentre ak̄j fa il lavoro j opposto: partendo da uno stato eccitato lo abbassa di livello energetico. Lo stato di eccitazione del cristallo si riconduce a considerare un insieme finito di 3rN oscillatori armonici indipendenti (cioè il numero di modi normali), caratterizzati dal proprio vettore d’onda e dallo loro legge di dispersione. Lo stato generale del cristallo si individua considerando la popolazione di ogni singolo oscillatore, cioè quali e quanto sono popolati i livelli energetici, nella forma del suo valore medio di eccitazione. Il fonone è una quantità distinta rispetto al modo normale di vibrazione: esso è la popolazione dell’oscillatore ed è dipendente dallo stato termodinamico in cui l’oscillatore si trova (dalla temperatura). Il livello di popolazione di ogni oscillatore dipende solitamente dalla comparazione fra energia termica ed energia caratteristica dell’oscillatore.Si vuole quindi individuare come siano popolati i singoli oscillatori. Si considerino quindi i 3rN oscillatori nella scrittura: |{nk̄j }i → |nk¯1j , nk¯2j , ...i 1 (3.57) 2 quindi la parentesi { } indica la configurazione di ciascun oscillatore. La (3.57) si calcola in meccanica quantistica nel modo seguente: |{nk̄j }i = qQ 1 k̄j (nk̄j )! (a†k¯ 1 j1 )nk¯1 j1 (a†k¯ 2 j2 )nk¯2 j2 ... |0i (3.58) che in sostanza è l’espressione dello stato più generale del cristallo. Si può notare che prendendo l’espressione (3.54) e calcolando il valore di aspettazione rispetto a uno stato generico in cui la popolazione è ben definita (cioè si conosce la popolazione per ogni oscillatore) si ha: hnk¯1j , ..., nk¯n jn | uα lχ |nk¯1j , ..., nk¯njn i = 0 1 (3.59) 1 Questo fatto non deve sorprendere in quanto in approssimazione armonica il valore medio dello spostamento dalla posizione di equilibrio dell’oscillatore è zero, e questo è stato semplicemente "tradotto" in meccanica quantistica. L’hamiltoniana (3.52), essendo una sommatoria di hamiltoniane di oscillatori armonici quantistici indipendenti si può scrivere come: X b = H ĥk̄j (3.60) k̄j e l’energia del sistema si calcola come valore di aspettazione della somma delle hamiltoniane cioè: X X 1 E(T ) = h ĥk̄j i = nk̄j (T ) + ~ωk̄j (3.61) 2 k̄j k̄j 3 SCATTERING DA NEUTRONI TERMICI 44 dove nk̄j (T ) è la distribuzione di Bose-Einstein: nk̄j (T ) = 1 n β~ωk̄j −1 (3.62) e contiene l’informazione su quanto è popolato l’oscillatore k̄j alla temperatura T . La popolazione termica del dato oscillatore si chiama fonone. I fononi sono il valore di aspettazione termico di popolazione dei 3rN oscillatori indipendenti e unidimensionali che si descrivono nello spazio reciproco con le equazioni (3.46). Volendo riassumere si può dire che inizialmente ci si trova in una situazione molto complicata: nello spazio reale si ha numero enorme (ma finito!) di atomi che oscillano secondo le equazioni (3.44) in approssimazione armonica. Da queste equazioni si può passare nello spazio reciproco usando le coordinate generalizzate (3.45) che rispondono all’equazione di oscillatore armonico (3.46) e di fatto rappresentano 3rN oscillatori armonici indipendenti e sono i modi normali di vibrazione. Passando alla meccanica quantistica viene definita la relazione di commutazione (3.48) fra la posizione dell’atomo e il suo impulso che sono ora degli operatori, e da questa si passa alle coordinate dei modi normali e relativo impulso (3.49) da cui vengono definiti gli operatori di creazione e distruzione (3.50-51). Con queste definizioni, facendo i conti si dimostra che l’hamiltoniana totale del cristallo (3.52) si scrive come somma di hamiltoniane di oscillatori armonici unidimensionali le quali sono definite tramite l’operatore numero, prodotto degli operatori a† e a. La popolazione termica di ogni oscillatore, cioè quanto sono popolati mediamente i livelli energetici di ogni oscillatore, è chiamata fonone, che è una quasi-particella indipendente che soddisfa la statistica di Bose-Einstein a potenziale chimico nullo. Si supponga che kB T ~ωk̄j , cioè l’energia termica sia sufficientemente grande rispetto all’energia caratteristica degli oscillatori; allora si ha che: nk̄j (T ) ' kB T ~ωk̄j (3.63) cioè la popolazione fononica aumenta linearmente con la temperatura. Da un sistema di atomi fortemente interagenti nello spazio reale si è passati ad un gas di bosoni non interagenti detti fononi, e si vuole misurare con lo scattering coerente dei neutroni la curva di dispersione e la popolazione fononica, che contengono l’informazione sulla struttura del solido in esame. Se si ha una macromolecola (proteina, DNA ecc.) data una certa struttura si può calcolare come si muove il sistema a livello collettivo e definire i modi normali di vibrazione. Non essendoci però ordine a lungo raggio ne’ invarianza traslazionale i conti sono molto più complicati. Normalmente la trasformazione di una macromolecola da uno stato fisico ad un altro avviene aumentando la temperatura e popolando sempre di più i modi normali fino a quando il sistema va fuori armonicità ed è costretto a cambiare stato di equilibrio. 3.4.2 Risposta Coerente e Risposta Incoerente Si vuole tornare ora, dopo questa digressione sulla modellizzazione di un solido ordinato e sui fononi, allo scattering di neutroni e su cosa viene effettivamente 3 SCATTERING DA NEUTRONI TERMICI 45 misurato. Lo scattering di neutroni, come visto, considerando la sezione d’urto, presenta due risposte, quella coerente e quella incoerente: ∂ 2 σ ∝ T dF [hρ(r̄, t)ρ(0̄, 0)i] ∂Ω∂ω coer ∂ 2 σ ∝ T dF hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l (0))i ∂Ω∂ω incoer (3.64) (3.65) dove T dF [ ] rappresenta l’operazione trasformata di Fourier spazio-temporale. La (3.64) è la TdF spazio-temporale della funzione di correlazione densitàdensità a tempi e spazi diversi mentre la (3.65) è la TdF spazio-temporale della funzione di correlazione del singolo atomo con sè stesso a tempi e spazi diversi, e misurano rispettivamente la risposta collettiva e quella di singola particella. Nel caso del gas perfetto si è visto che, dato che le particelle sono scorrelate, si ha solo la risposta incoerente. Nel caso di un cristallo invece, in cui le particelle sono fortemente interagenti, si hanno entrambe le risposte. Quella coerente si può dividere nella somma di due pezzi: la risposta coerente a 0 fononi, che da lo scattering Bragg da cui si ricava la struttura statica del cristallo, e la risposta coerente ad 1 fonone che permette di misurare la curva di dispersione ωk̄j . Dalla sezione d’urto incoerente si ha: la risposta incoerente a 0 fononi che non da particolari informazioni fisiche (è un segnale di background piatto), e la risposta incoerente ad 1 fonone che permette di misurare la densità degli stati fononica con cui si può calcolare il calore specifico. Ci si concentra ora sulla risposta coerente, che scritta in maniera esplicita è: Z Z |kfN | |b̂|2 ∂ 2 σ iωt = dt e dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) · ∂Ω∂ω coer |kiN | 2π (3.66) X · hδ(r¯1 − R̄l (t))δ(r¯2 − R̄l0 (0))i ll0 dove si possono fare le seguenti modifiche sulla notazione e i simboli: l → l, χ e R̄l (t) = x̄l + x̄χ + ūlχ (t), e in un cristallo generico composto da χ atomi ognuno avrà il proprio parametro d’urto che può essere scritto come il suo valore medio più le deviazioni cioè bχ = bχ + δbχ . Quindi l’espressione (3.66) si può riscrivere in maniera specifica per i cristalli come: |kfN | X |bχ bχ0 |2 ∂ 2 σ = N ∂Ω∂ω coer |ki | 0 2π Z dt eiωt Z dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) · ll χχ0 (3.67) · hδ[r¯1 − (x̄l + x̄χ + ūlχ (t))]δ[r¯2 − (x̄l0 + x̄χ0 + ūl0 χ0 (0))]i La TdF spaziale può essere scambiata con l’operazione funzione di correlazione cioè: Z Z dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) h...i = h dr¯1 dr¯2 e−iq̄(r¯1 −r¯2 ) ...i (3.68) e facendo questa operazione, quando si porta l’integrale dentro la funzione di correlazione allora e−iq̄ · r¯1 va ad agire sulla prima δ di Dirac, mentre eiq̄ · r¯2 va 3 SCATTERING DA NEUTRONI TERMICI 46 ad agire sulla seconda δ di Dirac. Allora si ottiene che: e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i (3.69) questo tenendo conto del lavoro che fa la delta sull’esponenziale nella (3.67) e tenendo conto che x̄l e x̄χ sono quantità che non dipendono dal tempo e quindi possono essere portate fuori dalla definizione di funzione di correlazione, che significa classicamente calcolare la correlazione sul tempo delle funzioni di spostamento u(t) (mentre in meccanica quantistica significa calcolare i valori di aspettazione). Si può dire quindi che la funzione di correlazione densità-densità in un cristallo si "mappa" in quella appena scritta cioè: hδ[r¯1 − (x̄l + x̄χ + ūlχ (t))]δ[r¯2 − (x̄l0 + x̄χ0 + ūl0 χ0 (0))]i → he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i (3.70) l’operazione è formalmente corretta, cioè esatta nei limiti in cui si possono esprimere le posizione degli atomi come la somma delle loro posizioni di equilibrio più le variazioni istantanee u(t), la cui correlazione attraverso gli esponenziali (che sono anch’essi degli operatori come u) sostituisce ora le funzioni densità nel mappare le variazioni di densità del cristallo. Per semplificare i conti l’obiettivo a cui si mira è trasformare la funzione di correlazione degli esponenziali nell’esponenziale della funzione di correlazione cioè: he( ) i → eh i (3.71) e vogliamo spiegare il motivo fisico di questo fatto. Facciamo ora alcune stime. Si sa che il vettore d’onda scambiato è dell’ordine di grandezza: |q̄| = |k̄fN − k̄iN | ≤ 2k̄iN ∼ 108 cm−1 inoltre vale che: p hui = 0 hu2 i ' 1 1 Å= 10−8 cm 100 100 quindi il prodotto (al massimo) chepsi trova nell’argomento degli esponenziali della funzione di correlazione è |q̄| · hu2 i ' 1/100. Se l’operazione (3.71) fosse possibile, si potrebbe scrivere: eh i ' 1 + h i (3.72) cioè fare uno sviluppo in serie. Dato che la quantità h i è un numero che si è stimato piccolo, si suppone che questa operazione si lecita. Purtroppo il problema da risolvere è il passaggio (3.71); per cui è necessario uno strumento matematico che lo renda possibile. Si suppone ora che il passaggio (3.71) si possa svolgere (verrà dimostrato in seguito). Si trascura il termine h i nello sviluppo in serie (3.72) e si scrive: he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i = 1 quindi per la risposta coerente della sezione d’urto si può scrivere: Z |kfN | X |bχ bχ0 |2 −iq̄ · (x̄ −x̄ 0 ) −iq̄ · (x̄χ −x̄ 0 ) ∂ 2 σ l l χ dt eiωt = N e e ∂Ω∂ω coer 2π |ki | 0 | {z } ll 0 χχ δ(ω) (3.73) (3.74) 3 SCATTERING DA NEUTRONI TERMICI 47 dove come evidenziato, avendo trascurato la correlazione h i a tempi distinti, l’integrale sul tempo si riduce ad una δ(ω). Si ricorda che ~ω = EiN − EfN = Eft −Eit , e δ(ω) significa che ~ω = 0 cioè che le energie iniziali e finali dei neutroni sono uguali così come l’energia finale e iniziale del target: non c’è scambio di energia tra i neutroni e il sistema target cioè si ha un processo elastico. Vediamo il caso semplice del reticolo di Bravais cioè si ha un atomo per cella (in natura esiste solo un sistema cubico P con un atomo per cella ed è il Polonio). Per questo motivo la sommatoria χχ0 sparisce e vale |bχ bχ0 |2 = |b|2 . Quindi l’espressione (3.74), assumendo invarianza per traslazione diventa: X X ∂ 2 σ = e−iq̄ · (x̄l −x̄l0 ) = N e−iq̄ · x̄l (3.75) ∂Ω∂ω coer 0 ll l dove N è il numero totale di celle e si è preso il riferimento x̄l0 = 0̄. Il reticolo ha invarianza traslazionale quindi vale che le proprietà fisiche rilevate in x̄l sono equivalenti a quelle in x̄l + x̄l00 dove x̄l00 è un vettore principale del reticolo diretto (il vettore che stabilisce la simmetria di traslazione). Quindi si può scrivere che: X X e−iq̄ · x̄l = e−iq̄ · (x̄l +x̄l00 ) ⇒ e−iq̄ · x̄l00 = 1 ⇒ q̄ = Ḡ, 0 (3.76) l l dove Ḡ è un vettore principale del reticolo reciproco. Fra vettori del reticolo diretto e quelli di reticolo reciproco infatti vale la relazione x̄l00 · Ḡ = 2πn con n intero. Pertanto riprendendo la (3.75) si può scrivere che: X e−iq̄ · (x̄l −x̄l0 ) = N 2 ∆(q̄ − Ḡ) (3.77) ll0 Dove la delta cristallografica ∆(q̄ − Ḡ) 6= 0 se q̄ = 0 o se q̄ = Ḡ. Se q̄ = 0 si ha un processo elastico senza scambio di vettore d’onda (il neutrone passa indisturbato). Se invece q̄ = Ḡ si ha un processo elastico con scambio di vettore d’onda uguale ad un vettore di reticolo reciproco. Questo significa che lo scattering dei neutroni non avviene uniformemente su tutto l’angolo solido ma solo per direzioni discrete e specifiche corrispondenti a vettori principali di reticolo reciproco, che vanno a formare i picchi di Bragg. E’ questo il fenomeno dello scattering di Bragg in cui si rilevano i neutroni solo in direzioni specifiche del reticolo reciproco, da cui tramite TdF è possibile ricavare il reticolo diretto. E’ questa una differenza importante rispetto al caso di gas perfetto in cui si aveva un processo continuo e i neutroni potevano essere scatterati in qualunque direzione. Torniamo ora alle espressioni (3.64-65) per studiarle nel dettaglio. Scriviamo esplicitamente la funzione di correlazione densità-densità già vista nella (3.71): he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = e− 2 Wχ (q) e− 2 Wχ0 (q) eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i 1 1 (3.78) questo passaggio è dato dal teorema operatoriale di Baker-Hausdorff. Se gli operatori che si trovano negli esponenti sono operatori bosonici, cioè che soddisfano le regole di commutazione bosoniche dell’oscillatore armonico allora è possibile trasformare la funzione di correlazione dell’esponenziale nell’esponenziale della funzione di correlazione. Questo come già scritto permette di svilup1 pare in serie l’ultimo oggetto della (3.78), dato che il prodotto |q̄ · ū| ≈ 100 . Gli esponenziali: 1 1 e− 2 Wχ (q) e− 2 Wχ0 (q) (3.79) 3 SCATTERING DA NEUTRONI TERMICI 48 si chiamano fattori di Debye-Waller. Il fattore di Debye-Waller si può calcolare in maniera analitica in due regimi diversi, quello classico per T ΘD e quello quantistico per T ΘD . A parte fattori di proporzionalità si ha che: X β Wχ (q) = h|q̄ · ūlχ (t)|2 i = q α q β hūα lχ (t)ūl0 χ0 (t)i = αβ ( ∝ T ΘD se T ΘD se T ΘD cost 6= 0 (3.80) dove ΘD è la temperatura di Debye del sistema. In un oscillatore armonico il valore quadratico medio dello scarto, per il teorema di equipartizione dell’energia va come la temperatura, quindi a parte la dipendenza dal vettore d’onda scambiato q̄ questi oggetti in regime classico dipendono esplicitamente dalla temperatura T e dicono che la temperatura influenza le intensità delle righe Bragg che si possono osservare. I fattori di D-W quindi, a parità di vettore d’onda e in regime classico tendono a decrescere al crescere della temperatura. In regime quantistico il valore di aspettazione di ū2 tende ad un valore costante diverso da zero, e questo perché gli atomi oscillano ugualmente anche a temperatura nulla (energia di punto zero). Ricapitolando si può scrivere l’espressione della sezione d’urto coerente considerando il passaggio dovuto al teorema di Baker-Hausdorff e i fattori di DebyeWaller: Z |kfN | X |bχ bχ0 |2 ∂ 2 σ = dt eiωt e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) · ∂Ω∂ω coer |kiN | 0 2π ll (3.81) 0 χχ ·e − 12 Wχ (q) − 12 Wχ0 (q) h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i e e dove si è visto che l’esponenziale della funzione di correlazione sviluppato in serie al primo ordine (cioè posto =1) permette di ottenere l’intensità delle righe Bragg. Quindi il primo termine è: Risposta coerente all’ordine zero: X 1 1 ∂ 2 σ = |bχ bχ0 |2 δ(ω)N 2 ∆(q̄ − Ḡ)e−iq̄ · (x̄χ −x̄χ0 ) · e− 2 Wχ (q) e− 2 Wχ0 (q) · 1 ∂Ω∂ω coer 0 χχ (3.82) che esprime lo scattering elastico dei neutroni che possono attraversare il campione indisturbati (circa il 99% con q̄ = 0) oppure essere scatterati in direzioni precise, cioè quando il vettore d’onda scambiato corrisponde a vettori principali del reticolo reciproco (q̄ = Ḡ). Il valore di N 2 , cioè il quadrato del numero di celle è in perfetta analogia con la diffrazione in cui l’intensità della riga di diffrazione ottica è proporzionale al numero di fenditure al quadrato. Nel caso di un atomo per cella si può scrivere: X ∂ 2 σ = δ(ω)N 2 ∆(q̄ − Ḡ)| bχ e−iq̄ · x̄χ · e−Wχ (q) |2 (3.83) ∂Ω∂ω coer χ dove la quantità presente nel modulo quadro è detta fattore di struttura. Si prova a fare un calcolo: si pone per semplicità il fattore di D-W uguale a 1. 3 SCATTERING DA NEUTRONI TERMICI 49 Si considera un cristallo cubico a corpo centrato (bcc) di lato a che ha 2 atomi per cella nelle posizioni x̄1 = a(0, 0, 0) e x̄2 = a( 21 , 12 , 12 ), e si considerano questi atomi uguali (quindi il valore di bχ non dipende più da χ). Si ha che: X 1 1 1 b e−iq̄ · x̄χ = b(1 + e−iḠ · a( 2 , 2 , 2 ) ) (3.84) 0,0,0 1 1 1 2,2,2 la condizione di conservazione dell’impulso ∆(q̄ − Ḡ) impone che q̄ = Ḡ vettore principale di reticolo reciproco. Il reticolo reciproco di un bcc è un cubico a facce centrate (fcc) ed ha un vettore minimo di reticolo reciproco (lato della cella elementare cubica a facce centrate) di modulo pari a |b̄| = 2π a e quindi i vettori principali di reticolo reciproco si scrivono come: Ḡ = b̄1 v1 + b̄2 v2 + b̄3 v3 con v1 , v2 , v3 ∈ N (3.85) Tenendo conto della relazione fra vettori elementari del reticolo reciproco e diretto è b̄i · āj = 2πδij , finendo il conto della (3.84) si ha: ( 0 con v1 + v2 + v3 dispari −iπ(v1 +v2 +v3 ) ⇒1+e = 6= 0 con v1 + v2 + v3 pari questo significa che alcune righe di diffrazione sono cancellate per effetto del fattore di struttura. Quando il fattore di struttura, che in sostanza è la somma di fattori di fase, è zero, significa che il neutrone è diffratto dagli atomi della cella con una combinazione di fasi tale per cui quella specifica riga di diffrazione viene annullata. La fase totale all’interno della cella dà luogo a un contributo nullo. Per sistemi con una base atomica (più di un atomo per cella) il fattore di struttura gioca il ruolo di annullare alcune righe di diffrazione. Nel caso visto non sono visibili i Ḡ con una combinazione di indici dispari. Considerando nel fattore di struttura anche il fattore di D-W si ha non un azzeramento totale delle righe ma una forte diminuzione di intensità dei picchi. Lo schema è quello mostrato in figura 10: la maggior parte dei neutroni non viene scatterato e prosegue con la stessa direzione di incidenza, altri invece vengono scatterati in direzioni specifiche dando luogo ai picchi di Bragg. Il detector copre l’angolo solido mostrato e conoscendo la direzione di propagazione e l’angolo di scattering si risale al vettore d’onda. Per sapere se la riga osservata è una riga di diffrazione, oltre alla sua direzione specifica, bisogna conoscerne l’energia (i neutroni Bragg sono scatterati in maniera elastica). Misurando i neutroni scatterati in maniera elastica e graficando l’intensità in funzione del vettore d’onda scambiato si ha una cosa del tipo figura 11: la FWHM della riga di scattering è legata in principio al fattore di D-W Wχ (q), che quindi non influenza solo l’intensità (l’altezza) del picco ma anche la sua larghezza, che sarà quindi proporzionale alla temperatura, grande in regime classico e decrescente man mano che la temperatura viene fatta diminuire e si va verso il regime quantistico (ma rimane comunque finita perché legata all’indeterminazione di punto zero). In principio quindi se si fosse in grado di misurare la FWHM della riga Bragg al decrescere della temperatura si avrebbe una misura degli effetti di punto zero sull’energia del cristallo, tuttavia questa misura 3 SCATTERING DA NEUTRONI TERMICI Figura 10: Diffrazione di neutroni secondo i picchi di Bragg Figura 11: Intensità dei picchi di Bragg 50 3 SCATTERING DA NEUTRONI TERMICI 51 è irrealistica in quanto le righe Bragg sono allargate soprattutto dal disordine cristallino (i cristalli non sono perfetti). Un certo insieme di righe che permette di determinare i vettori d’onda nel reticolo reciproco, permette, in TdF di determinare i vettori di reticolo diretto, cioè di ricostruire la struttura del reticolo nello spazio reale. Tutto ciò che è stato studiato fin’ora però è dovuto al fatto che non è stata considerata la correlazione e ci si è fermati all’ordine zero nello sviluppo della funzione di correlazione. Vogliamo ora studiare ora il primo ordine, in cui si ha: Risposta coerente al primo ordine: Z |kfN | X |bχ bχ0 |2 −iq̄ · (x̄ −x̄ 0 ) −iq̄ · (x̄χ −x̄ 0 ) ∂ 2 σ l l χ = N e dt eiωt · e ∂Ω∂ω coer 2π |ki | 0 (3.86) ll χχ0 1 1 · e− 2 Wχ (q) e− 2 Wχ0 (q) · h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i inoltre considerando solo il termine di correlazione si sa che: X β h−iq̄ · ūlχ (t) iq̄ · ūl0 χ0 (0)i = q α q β hūα lχ (t)ūl0 χ0 (0)i (3.87) αβ Ora tenendo presente l’espressione (3.54) dello sviluppo in modi normali tramite gli operatori di creazione e distruzione, la si può inserire nella (3.86) per avere questa cosa mostruosa: N 2 ∆(q̄−k̄) z }| {Z X |kfN | 1 X ∗ ∂ σ −i(q̄−k̄)(x̄l −x̄l0 ) B (q)Bχ0 (q) = N e dt eiωt · ∂Ω∂ω coer |ki | 2π χχ0 χ 0 ll X X 1 p · qα qβ ēα (k̄j , χ)ēβ (k̄j , χ0 ) 2ωj (k̄)N Mχ Mχ0 αβ k̄j i ih h · h a†k̄ (t) + ak̄j (t) a†k̄ (0) + ak̄j (0) i 2 j (3.88) j 1 dove si è posto che Bχ (q) = e−iq̄ · x̄χ e− 2 Wχ (q) bχ e k̄ è il vettore d’onda che definisce i modi normali di vibrazione. Vale che: X ∆(q̄ − k̄) = δ(q̄ − (k̄ + Ḡ)) Ḡ cioè si sta considerando un processo in cui un neutrone con un certo vettore d’onda k¯iN scattera con modo normale di vibrazione scambiando una quantità di vettore d’onda q̄ con la corrispondente quasi-particella fonone di vettore d’onda k̄, quindi c’è conservazione dell’impulso e il processo è possibile quando il vettore d’onda scambiato è uguale al vettore d’onda del fonone emesso o assorbito. In altri termini prima si aveva un processo a zero fononi, lo scattering Bragg, cioè quando k̄ = 0, invece ora per avere conservazione dell’impulso si deve considerare che il neutrone venga deviato per effetto dell’interazione con i fononi (cioè con la popolazione dei modi normali). Si prenda ora solo l’ultima riga della (3.88): si vuole conoscere il significato dei 3 SCATTERING DA NEUTRONI TERMICI 52 singoli prodotti fra gli operatori. Svolgendo esplicitamente si hanno 4 funzioni di correlazione: ha†k̄ (t)a†k̄ (0)i + ha†k̄ (t)ak̄j (0)i + hak̄j (t)a†k̄ (0)i + hak̄j (t)ak̄j (0)i j j j j (3.89) Si ricorda che per un operatore Ô la funzione di correlazione è data da: X λti hti | Ô† Ô |ti i ti quindi nella (3.89) si devono fare le somme sugli stati iniziali del target (degli oscillatori armonici corrispondenti al cristallo) pesati ognuno con la probabilità di eccitazione termica. Dei quattro termini scritti ne sopravvivono solo due, quelli con i prodotti misti, in quanto i prodotti fra operatori uguali danno prodotti fra stati ortogonali che sono nulli. A titolo d’esempio si studia il secondo termine ha†k̄ (t)ak̄j (0)i. Tutti gli operatori j considerati, nella rappresentazione di interazione, evolvono nel tempo nel modo seguente: a†k̄ (t) = eiωj (k̄)t a†k̄ (0) (3.90) ak̄j (t) = e−iωj (k̄)t ak̄j (0) (3.91) j j quindi per il termine di considerato si può scrivere, applicando la definizione di funzione di correlazione: ha†k̄ (t)ak̄j (0)i = eiωj (k̄)t ha†k̄ (0)ak̄j (0)i = j j | {z } n̂k̄j = X eiωj (k̄)t e −βEn z n = eiωj (k̄)t X1 nk̄j z e hn| n̂k̄j |ni = −β~ωk̄j nk̄j + 21 (3.92) nk̄j dove si è applicata la definizione di probabilità di eccitazione termica (2.23), con n̂k̄j operatore numerico e la definizione di autovalore di un’oscillatore armonico quantizzato En = ~ωk̄j nk̄j + 21 . L’ultimo termine della (3.92), a parte il primo esponenziale fuori dalla sommatoria rappresenta nk̄j ed proprio la somma che da la distribuzione di Bose-Einstein, cioè si ha: eiωj (k̄)t nk̄j = eiωj (k̄)t 1 e β~ωk̄j −1 (3.93) L’altro termine di correlazione, il terzo della (3.89) cioè hak̄j (t)a†k̄ (0)i da come j risultato, seguendo un procedimento analogo al precedente: 1 −iωj (k̄)t −iωj (k̄)t e nk̄j + 1 = e 1 + β~ω (3.94) e k̄j − 1 3 SCATTERING DA NEUTRONI TERMICI 53 Inserendo questo risultato nella (3.88) si ha: N 2 ∆(q̄−k̄) Z zX }| { |kfN | X ∗ ∂ σ −i(q̄−k̄)(x̄l −x̄l0 ) 1 = N B (q)Bχ0 (q) dt eiωt · e ∂Ω∂ω coer 2π |ki | χχ0 χ 0 ll 2 · X αβ · qα qβ X ēα (k̄j , χ)ēβ (k̄j , χ0 ) k̄j 2ωj (k̄) eiωj (k̄)t nk̄j + e−iωj (k̄)t nk̄j + 1 | {z } | {z } distruzione di 1 f onone 1 p · N Mχ Mχ0 (3.95) creazione di 1 f onone si può ora risolvere l’integrale sul tempo che si spezza nella somma di 2 integrali che danno luogo a due funzioni δ di Dirac cioè: Z 1 dt ei(ω±ωj (k̄))t = δ(ω ± ωj (k̄)) (3.96) 2π le due funzioni δ esprimono la conservazione dell’energia e la loro presenza è legata all’aver supposto che i modi normali oscillino in maniera armonica, cioè che valga l’approssimazione armonica. Se questo non vale le due delta hanno forme di riga diverse e si trasformano in lorenziane o gaussiane con una certa FWHM che corrisponde all’inverso del tempo di vita dello stato eccitato dal neutrone. Si può riscrivere la (3.95) in cui la sommatoria in k̄j scompare in quanto deve valere che k̄j = q̄; e si possono evidenziare esplicitamente i processi Stokes e Anti-Stokes: X X |kfN | ∂ 2 σ = N N ∆(q̄ − k̄) Bχ∗ (q)Bχ0 (q) · q α q β ēα (k̄j , χ)ēβ (k̄j , χ0 ) · ∂Ω∂ω coer |ki | 0 χχ αβ i h 1 1 1 p · + δ(ω − ωj (k̄)) 1 + β~ω δ(ω + ωj (k̄)) β~ω 2ωj (k̄) Mχ Mχ0 e k̄j − 1 e k̄j − 1 | {z } | {z } processo Anti−Stokes processo Stokes (3.97) nel processo di interazione dei neutroni con il cristallo, oltre al fenomeno Bragg (detto anche 0 phonon) in si cui osserva la struttura di equilibrio, il primo termine rilevante (detto anche 1 phonon) consiste in una somma di delta con q̄ uguale ad un particolare valore di k̄j . Quindi per un certo modo normale e per una certa branca si hanno due fenomeni: • il processo Stokes che corrisponde alla creazione di 1 fonone, cioè il neutrone cede energia e vettore d’onda al cristallo che eccitano quel dato modo di vibrazione aumentando di 1 il numero di fononi corrispondenti; • il processo Anti-Stokes che corrisponde alla distruzione di un fonone consiste in un modo normale già popolato che diminuisce di 1 la sua popolazione fononica per cedere al neutrone energia e impulso. Il rapporto fra i processi Stokes/Anti-Stokes è: nk¯ (T ) + 1 IS β~ω = j = e k̄j IAS nk¯j (T ) (3.98) 3 SCATTERING DA NEUTRONI TERMICI 54 che è l’espressione del già citato principio di bilancio dettagliato. Semplificando ancora, e riconoscendo l’espressione del prodotto scalare si può scrivere: X q α q β ēα (k̄j , χ)ēβ (k̄j , χ0 ) = |q̄ · ē|2 (3.99) αβ che è il prodotto scalare fra il vettore d’onda scambiato dal neutrone e la polarizzazione del modo normale (la direzione in cui oscillano i piani di atomi) che può essere parallela o perpendicolare a q̄. Questo prodotto definisce la regola di selezione neutronica: se q̄ ⊥ ē si ha un modo trasverso (ottico o acustico), il prodotto vale zero, quindi in principio i neutroni non eccitano modi trasversali ottici o acustici che quindi non possono essere studiati. Questo in realtà non è vero, perché i neutroni permettono di osservare tutti i modi, anche le curve di dispersione relative ai modi trasversi. Vogliamo dimostrare questo fatto, e scriviamo: |kfN | X X q̄ · ē(q̄j , χ) 2 ∂ 2 σ 1−phon =N N Bχ (q) p · ∂Ω∂ω coer |ki | j Mχ χ i 1 h nq̄j (T )δ(ω + ωq̄j ) + nq̄j (T ) + 1δ(ω − ωq̄j ) · 2ωj (q̄) (3.100) la regola di selezione citata si trova nel modulo quadro della sommatoria su χ. Se q̄ k ē si osservano i modi ottici e acustici longitudinali, mentre quelli trasversali in teoria non dovrebbero poter essere osservati. Tuttavia con la spettroscopia da neutroni termici è possibile aumentare il vettore d’onda scambiato a piacere (basta aumentare l’angolo di osservazione). Si può dire quindi che se q̄ · ē = 0 nella prima zona di Brillouin (1 BZ), si può andare in seconda zona di Brillouin (2 BZ) considerando un nuovo vettore d’onda scambiato q̄ → ā = q̄ + Ḡ con Ḡ solito vettore principale del reticolo reciproco. La polarizzazione ē è una funzione periodica nello spazio reciproco cioè ē(q̄j , χ) = ē(āj , χ) così come lo è la pulsazione ωj (q̄) = ωj (q̄ + Ḡ). Purchè si vada a osservare le direzioni di scattering corrispondenti a multipli del vettore di reticolo reciproco dove l’intensità delle righe è più alta, per compensare la diminuzione di intensità dovuta al fattore di D-W quando si aumenta il vettore d’onda scambiato, allora polarizzazione e pulsazione sono invarianti per traslazione. In questo modo in 2 BZ il prodotto scalare fra vettore d’onda scambiato e polarizzazione che in 1 BZ era nullo, diventa Ḡ · ē 6= 0. Quindi si può dire che basta andare oltre la 1 BZ per osservare i modi trasversi ottici e acustici, cioè aumentare molto il vettore d’onda scambiato, che significa, nello spazio reale, considerare angoli di osservazione grandi. Fisicamente vale questo perché rispetto ad un modo longitudinale, in cui le oscillazioni quadratiche medie come visto sono 1/100 Å, nei modi trasversali gli spostamenti di un atomo rispetto ad un altro (le variazioni di densità) sono molto più piccole. Per cui per essere risolti, i modi trasversali necessitano di un vettore d’onda molto più grande che come è noto corrisponde ad una risoluzione maggiore. La spiegazione di questo fatto può essere visualizzata in figura 12. Lo spostamento dei piani cristallini nella stessa direzione della propagazione dell’onda genera una variazione di densità apprezzabile cioè d = xχ + u con una variazione rispetto alla posizione di equilibrio di circa 2/100 Å. Lo spostamento 3 SCATTERING DA NEUTRONI TERMICI 55 Figura 12: differenza fra modi longitudinali e trasversali. dei piani cristallini trasversalmente rispetto alla direzione di propagazione delq 2 2 l’onda di 1/100 Å invece fa si che si abbia d = xχ + u con una variazione molto più piccola rispetto al caso longitudinale e una densità al primo ordine che in pratica non varia. Per questo motivo per apprezzare i modi longitudinali è necessaria una maggiore risoluzione e il vettore d’onda scambiato deve essere abbastanza grande da poter andare in 2 BZ. Per ora sono stati discussi solo due termini dello sviluppo della funzione di correlazione: il termine all’ordine zero detto anche termine di Bragg o termine 0 phonon tramite il quale è possibile studiare la struttura statica del cristallo ovvero l’ordine a lungo range, e il termine coerente al primo ordine detto termine 1 phonon che da il contributo più importante sulle modulazioni di densità del cristallo. Si potrebbe, nello sviluppo dell’esponenziale della funzione di correlazione andare a ordini superiori: 1 eh i = 1 + h i + h i2 + · · · 2 dove l’oggetto al secondo ordine conterrebbe il prodotto di 4 operatori che rappresentano i processi a 2 fononi, che sono però di intensità estremamente bassa. Ci si concentra ora sulla risposta incoerente, la cui espressione viene qui riscritta: Z |kfN | X ∂ 2 σ 2 1 = N |δbχ | dt eiωt e−iq̄ · (r̄1 −r̄2 ) dr̄1 dr̄2 · ∂Ω∂ω incoer 2π |ki | lχ (3.101) · hδ(r̄1 − R̄lχ (t))δ(r̄2 − R̄l0 χ0 (0))i sostituendo le espressioni esplicite: R̄lχ (t) = x̄l + x̄χ + ūlχ (t) r¯1 = x̄l + x̄χ r¯2 = x̄l0 + x̄χ0 sapendo che in questo caso si ha l = l0 e χ = χ0 in quanto la correlazione è riferita alla particella con sè stessa al tempo 0 e al tempo t si ha per gli esponenziali: e−iq̄ · (r̄1 −r̄2 ) = e−iq̄ · (x̄l +x̄χ −x̄l0 −x̄χ0 ) = e−iq̄ · (x̄l −x̄l ) e−iq̄ · (x̄χ −x̄χ ) = 1 P e infine sapendo che l 1 = N numero di celle nel cristallo, si può scrivere: Z |kfN | X ∂ 2 σ 2 1 =N N |δbχ | dt eiωt he−iq̄ · ūlχ (t) e−iq̄ · ūlχ (0) i (3.102) ∂Ω∂ω incoer 2π |ki | χ 3 SCATTERING DA NEUTRONI TERMICI 56 e come visto grazie al teorema di Baker-Hausdorff e considerando anche i fattori di D-W la parte di correlazione si può scrivere come: he−iq̄ · ūlχ (t) e−iq̄ · ūlχ (0) i = e− 2 Wχ (q) e− 2 Wχ (q) ehq̄ · ūlχ (t)q̄ · ūlχ (0)i 1 1 dove l’esponenziale della funzione di correlazione al secondo membro si può sviluppare in serie proprio come nella (3.72). E’ possibile quindi scrivere il primo termine della sezione d’urto incoerente a zero fononi: Risposta incoerente all’ordine zero: δ(ω) z Z }| { |kfN | X 1 ∂ σ 0−phon =N N |δbχ |2 dt eiωt e−Wχ (q) · 1 = ∂Ω∂ω incoer 2π |ki | χ X =N |δbχ |2 δ(ω)e−Wχ (q) · 1 2 (3.103) χ la δ(ω) che da la conservazione dell’energia implica che kfN = kiN . Il termine (3.103) non da informazione fisica: si traduce solo in un segnale di background che "sbrodola" le righe specifiche del segnale coerente che in quanto dipendenti da N 2 e non semplicemente da N come in questo caso saranno notevolmente più intense. Si vuole ora studiare la risposta incoerente al primo ordine della sezione d’urto che sarebbe il termine a 1 fonone: Riposta incoerente al primo ordine: Z XX |kfN | X ∂ 2 σ 1−phon 2 1 = N |δbχ | dt eiωt q α q β e−Wχ (q) hūlχ (t)ūlχ (0)i ∂Ω∂ω incoer 2π |ki | χ l αβ (3.104) e inserendo la (3.54) per le espressioni degli spostamenti ū e seguendo in generale lo stesso procedimento usato per il termine ad 1 fonone della risposta coerente si può scrivere: X ~2 |q̄ · ē|2 |kfN | X ∂ 2 σ 1−phon · |δbχ |2 e−Wχ (q) = N N ∂Ω∂ω incoer |ki | χ 2N Mχ ωj (k̄) k̄j h i · nq̄j (T )δ(ω + ωq̄j ) + nq̄j (T ) + 1δ(ω − ωq̄j ) (3.105) P −i(q̄−k̄)(x̄l −x¯0 ) l Nel caso della risposta coerente si aveva = N 2 ∆(q̄ − k̄) ll0 e P −i(q̄−k̄)(x̄ P − x ¯ ) l l = l 1 = N , per cui non mentre in questo caso si ha che l e è necessario che il vettore d’onda scambiato coincida con vettori del reticolo reciproco e la sommatoria su k̄j si mantiene. Per indagare il significato di questo risultato si studia un caso semplificato: si consideri solo il processo Stokes e un reticolo cubico con un atomo per cella, cioè un reticolo di Bravais. Per un reticolo di questo tipo vale che il prodotto scalare |q̄ · ē|2 = 31 q 2 che può essere portato fuori dalla sommatoria (dal punto di vista fisico significa che si sta mediando su tutto lo spazio a qualunque angolo 3 SCATTERING DA NEUTRONI TERMICI 57 considerando tutti i processi di scattering). Si può scrivere: ⇒ = |kfN | i 2 X −W (q) h e 21 2 ~ |δb| n (T ) + 1 · δ(ω − ω ) q k̄ k̄ j j 3 2M |kiN | ωj (k̄) (3.106) k̄j Nella situazione in cui la temperatura T è sufficientemente bassa vale che nk̄j (T ) + 1 ' 1 cioè la popolazione fononica si trova tutta nello stato fondamentale. L’espressione (3.106) viene mediata su superfici ad energia costante (si considerano tutti gli angoli e neutroni con la stessa energia), che significa considerare costante il termine 1/ωj (k̄) e portarlo fuori dalla sommatoria. Ciò che nella sommatoria rimane è: X δ(ω − ωk̄j ) = N (ω) (3.107) k̄j che è la densità degli stati dei modi normali di vibrazione. L’esperimento consiste nell’osservare molti angoli di scattering intorno alla direzione di incidenza: a differenza del caso precedente (sia il Bragg che lo scattering coerente ad 1 fonone) qui non c’è conservazione dell’impulso, quindi ci si può aspettare segnale in ogni direzione. Dopo aver selezionato solo neutroni di una energia precisa (questo vuol dire fare una media sulle superfici ad energia costante del cristallo) rimane la densità degli stati dei modi normali di vibrazione. Questo è abbastanza logico perché si è partiti considerando la correlazione dell’atomo con sè stesso: come abbiamo visto il modo normale è un modo cooperativo di tutti gli atomi, quindi se ci si pone sul singolo atomo in generale (a meno che non si sia in grado di eccitare 1 solo modo di vibrazione) questo oscilla con una combinazione di modi normali di vibrazione; questo significa che se si è in grado di misurare la correlazione dell’atomo con sè stesso, essa è intuitivamente legata alla densità degli stati vibrazionali, proprio perché l’atomo vibra con una combinazione di tutti i modi eccitati. Il peso relativo di un modo rispetto ad un altro è proprio la densità degli stati, cioè quanti stati di vibrazione esistono per un certo vettore d’onda e per una certa frequenza. La densità degli stati fononica (TdF della densità dei modi normali di vibrazione) è una grandezza fondamentale in quanto con essa si può calcolare ad esempio il calore specifico, la resistività ecc ecc. In figura 13 si vede ciò che misura la sezione d’urto coerente ad 1 fonone: un fonone viene creato o distrutto a favore dell’aumento o della diminuzione dell’energia e del vettore d’onda del neutrone incidente. Come già puntualizzato i processi vengono divisi in Stokes e Anti-Stokes: lo S. è l’emissione di un fonone grazie al neutrone scatterato e l’AS. è l’assorbimento di un fonone da parte del neutrone. Il grafico è un diagramma bidimensionale in cui è rappresentata l’energia scambiata ~ω vs il vettore d’onda scambiato q. Sull’asse q ci sono dei picchi di intensità molto elevata per q̄ = 0, Ḡ1 , Ḡ2 ... che sono i picchi di Bragg, che sono processi elastici (energia scambiata nulla) e vettore d’onda scambiato uguale a vettori principali del reticolo reciproco. Se si fa una scansione in vettore d’onda e impulso intorno ad un picco di Bragg quello che si misura sono dei picchi di intensità molto più bassa e in generale molto più larghi (per effetto della vita media dell’eccitazione) dei picchi di Bragg che corrispondo ai processi S e AS fononici. Ad un dato vettore d’onda si vede un primo picco a energia 3 SCATTERING DA NEUTRONI TERMICI 58 Figura 13: Figura riassuntiva che mostra i picchi di Bragg per k̄ = Ḡ e i processi S e AS. negativa (Stokes) e poi un secondo picco a energia positiva (anti-Stokes), simmetrico rispetto al primo rispetto all’asse ~ω = 0. Ad un vettore d’onda più alto i picchi si spostano, non si trovano alla stessa energia ma saranno sempre due picchi simmetrici. Spostandosi lungo q si campiona la curva di dispersione fononica. Dato un certo vettore d’onda, i picchi che vengono visualizzati forniscono informazioni sul cristallo: se ad esempio se ne vede uno solo vuol dire che c’è solo una branca di dispersione e quindi il cristallo ha un atomo per cella. In generale come mostrato in figura 14 spostandosi verso energia più alte per un cristallo complesso (più atomi per cella) si misurano un picco di bassa intensità corrispondente ai due modi acustici trasversi (degeneri), poi un picco relativo al modo acustico longitudinale, i picchi di intensità più alta corrispondenti ai modi ottici trasversali e infine il modo ottico longitudinale. Il CsCl è un sale con una struttura semplice: si vede che il range di frequenza campionato va da 0 a circa 5 T Hz che significa 150 cm−1 cioè siamo nella zona del lontano infrarosso. Il range di frequenze fononiche, nella maggior parte dei casi, è contenuto in un range di qualche centinaio di cm−1 cioè qualche T Hz (1 T Hz = 33 cm−1 ). Sulle ascisse è mostrato il vettore d’onda normalizzato per tre direzioni specifiche. Le curve continue sono curve teoriche mentre i puntini sono dati sperimentali: il CsCl ha due atomi per cella e pertanto mostra sia curve acustiche che ottiche. A parità di vettore d’onda (scansione verticale cioè vettore d’onda fisso), il modo LA ha energie molto maggiori del TA (costa molta più energia muovere i piani in maniera longitudinale che in maniera trasversa). Cambiando direzione di misura (sono tre direzioni di alta simmetria del cristallo) si vede come LA e TA tendono ad avvicinarsi e addirittura nel caso di LO e TO a sovrapporsi e degenerare nella direzione [111]. Si vede anche che i modi ottici disperdono poco: sono praticamente piatti, e in questo senso l’approssimazione di Einstein nel considerare i modi costanti si adatta bene ai modi ottici. A seconda della direzione che si sta considerando quindi, cambia il numero dei primi vicini e cambia il modo degli atomi di interagire fra loro e quindi le funzioni di dispersione cambiano anche di molto. I modi trasversi sono due di solito e in questo 3 SCATTERING DA NEUTRONI TERMICI 59 Figura 14: Dispersione dei modi acustici e ottici (trasversi e longitudinali) del CsCl per le direzioni [100], [110] e [111] caso degeneri fra loro, e per rimuovere tale degenerazione bisogna andare a simmetrie più basse di quella cubica. In figura 15 si vede la densità degli stati fononica che qui abbiamo chiamato n(ω), cioè il numero dei modi normali di vibrazione con frequenza compresa fra ω e ω + dω. Il modello di Debye mostra un andamento come ω 3 ed ha poi un cut-off: come si vede l’andamento reale è un pò diverso. In figura si hanno tre tipi di metalli alcalini, le curve tratteggiate mostrano il dato sperimentale mentre le linee continue sono le previsioni teoriche. Il primo picco che si vede mostra il modo acustico trasversale (a frequenza minore) e il picco a più alta frequenza è il modo ottico longitudinale; tutto ciò che vi è nel mezzo è difficile da definire. Di solito tuttavia i picchi ottici sono molto più definiti di quelli acustici, questo perché gli ottici disperdono poco, che significa che modi con alta dispersione hanno rappresentazioni in densità degli stati più allargate. Vogliamo riassumere i risultati trovati fino a questo punto nel calcolo della sezione d’urto, le formule e il loro significato. Si è divisa la sezione d’urto in una parte di risposta coerente, che fornisce informazioni sulla statica del cristallo nel suo complesso e sulle variazioni di densità, ed una risposta incoerente, che riguarda la correlazione della particella (nel caso solido la particella è una quasi-particella detta fonone) con sè stessa a tempi diversi. Per ognuna della due risposte, la parte della funzione di correlazione è stata sviluppata fermandosi al primo ordine dello sviluppo, avendo così due termini per i due tipi di risposta. Il primo termine è quello che rappresenta l’ordine zero dello sviluppo ed è detto a 0 fononi, mentre il secondo termine che rappresenta il primo ordine dello sviluppo è detto a 1 fonone. Nella tabella 2 sono riassunti i significati fisici dei termini di risposta della sezione d’urto studiati. E le relative formule per la 3 SCATTERING DA NEUTRONI TERMICI 60 Figura 15: Densità degli stati fononica in funzione della frequenza per metalli alcalini. Tabella 2: Schema delle risposte dello scattering da neutroni termici 0 phonon 1 phonon risp. coerente risp. incoerente picchi di Bragg processi S e AS segnale di fondo densità degli stati 3 SCATTERING DA NEUTRONI TERMICI 61 risposta coerente della sezione d’urto: X 1 1 ∂ 2 σ 0−phon = N 2 ∆(q̄ − Ḡ)δ(ω) |bχ bχ0 |2 e−iq̄ · (x̄χ −x̄χ0 ) · e− 2 Wχ (q) e− 2 Wχ0 · 1 ∂Ω∂ω coer 0 χχ (3.108) Z N X |kf | X ∂ σ 1−phon 1 = N |bχ bχ0 |2 e−iq̄ · (x̄χ −x̄χ0 ) dt eiωt · e−iq̄ · (x̄l −x̄l0 ) ∂Ω∂ω coer 2π |ki | χχ0 0 ll 2 1 1 · e− 2 Wχ (q) e− 2 Wχ0 h−iq̄ · ūlχ (t)iq̄ · ūl0 χ0 (0)i (3.109) E per la risposta incoerente della sezione d’urto: X ∂ 2 σ 0−phon = N δ(ω) |δbχ |2 e−Wχ (q) · 1 (3.110) ∂Ω∂ω incoer χ Z XX |kfN | X ∂ 2 σ 1−phon 1 = N |δbχ |2 dt eiωt q α q β e−Wχ (q) hūlχ (t)ūlχ (0)i ∂Ω∂ω incoer 2π |ki | χ l αβ (3.111) 3.5 Studio di un solido amorfo e di un liquido Questa parte si colloca idealmente a metà fra ciò che abbiamo visto per un gas perfetto e nello studio dei solidi. Il gas perfetto e il solido cristallino rappresentano in sostanza dei modelli in cui si ha nel primo caso solo la risposta incoerente, mentre nel secondo caso si ha sia la risposta coerente che incoerente sia elastica che anelastica. Ricordiamo cos’è il fattore di struttura statico: Z Z dσ S(q̄) ∝ = dωS(q̄, ω) ⇒ dr̄ e−iq̄ · r̄ G(r̄, 0) per t = 0 dΩ dove la G(r̄, t) è la già discussa funzione di Van-Hove che si può dividere nella somma di un fattore self e di un fattore distinct. L’ultimo integrale dice che il fattore di struttura statico è dato dalla trasformata di Fourier della funzione di Van-Hove al tempo t=0. Questo integrale fisicamente significa che data una certa direzione di scattering q̄ si misurano neutroni indipendentemente dal fatto che siano elastici o anelastici (perché si integra su ω), cioè si misurano tutti i neutroni uscenti sotto una certa direzione q̄. Poichè in generale il segnale predominante è quello del Bragg (come abbiamo già detto le componenti anelastiche rappresentano una percentuale molto piccola del segnale totale) esso è legato alla funzione di correlazione densità-densità a tempi uguali. Vogliamo vedere come è fatta la S(q̄) e conseguentemente la G(r̄, 0) per un cristallo per estendere la discussione al caso di un liquido e di un solido amorfo. Il caso di un cristallo si può vedere in figura 16: si hanno i picchi di Bragg per dei punti specifici nel reticolo diretto e per multipli di vettori del reticolo reciproco quando si fa la TdF. I due grafici quindi sono equivalenti per l’invarianza traslazionale e rappresentano rispettivamente l’informazione nello spazio reale e nello spazio reciproco. In generale sappiamo che la G(r̄, t) rappresenta 3 SCATTERING DA NEUTRONI TERMICI 62 Figura 16: Caso di un cristallo: la G(r̄, 0) e la S(q̄) mostrano picchi definiti sulla posizione dei punti reticolari del reticolo diretto e reciproco. la funzione di correlazione densità-densità e si può scrivere come: G(r̄, t) = Gs (r̄, t) + Gd (r̄, t) dove la densità è una somma di delta di Dirac che individuano le particelle: X ρ(r̄, t) = δ(r̄ − R̄l (t)) l e possiamo scrivere la Gs e la Gd esplicitamente come: X 1 Gs (r̄1 , r̄2 , t) = hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l (0))i ρ0 l X 1 Gd (r̄1 , r̄2 , t) = hδ(r̄1 − R̄l (t))δ(r̄2 − R̄l0 (0))i ρ 0 0 l6=l che sono state normalizzate rispetto alla densità media ρ0 termodinamica, cioè quella non correlata. La somma G = Gs + Gd vale a qualsiasi tempo, anche a tempo 0, e in generale limt→0 Gs (r̄, t) = δ(r̄) opportunamente normalizzata. Questo limite significa semplicemente che la particella o si trova in r̄ oppure non c’è. Vediamo che grafico della G(r̄, 0) ci si può aspettare nel caso liquido alla luce di quanto visto per un cristallo. Un liquido ha una densità media ρ0 dell’ordine di quella di un cristallo (comprimendo un gas per transire alla fase liquida la densità aumenta circa di un fattore 1000). Quindi anche per un liquido la distanza media fra le particelle è dell’ordine di qualche Å. Localmente un solido e un liquido sono analoghi, per questo la comparazione fra la G(r̄, 0) e la S(q̄) in un cristallo e in un liquido è ragionevole. Con riferimento alla figura 17, per quanto riguarda la Gs (r̄, 0) in zero vi è una δ(r̄) che rappresenta la presenza di una particella in zero, ed essa poi oscilla attorno al valore della densità media ρ0 con oscillazioni di ampiezza sempre minore. Il primo massimo lo si individua alla distanza media fra le particelle r̄, il secondo massimo a 2r̄ e così via. La distanza media fra le particelle è √ banalmente r̄ = 1/ 3 ρ0 . La forma di questa funzione è legata a quella del potenziale repulsivo fra le particelle, per cui per determinate distanze posso avere un probabilità più alta o più bassa (quindi oscillante) di trovare la particella rispetto al valore di densità media. A distanze "grandi" dalla particella di riferimento in zero la probabilità, data l’isotropia del liquido (vale per la maggior 3 SCATTERING DA NEUTRONI TERMICI 63 Figura 17: Caso di un liquido: la Gs (r̄, 0) e la S(q̄) oscillano attorno ad un valore medio ed esprimono il fatto che in un liquido si ha ordine a corto range che tende ad una densità costante a lungo range. parte dei liquidi), di trovare un’altra particella diventa costante, corrispondente alla densità media. Nel caso di un cristallo invece, a causa della simmetria traslazionale, per distanze comunque grandi da una particella di riferimento si ha la certezza di trovare la particella per alcuni valori di r̄ e la certezza di non trovarla per tutti gli altri valori. Passando per TdF alla S(q̄) (opportunamente normalizzata) si ha una forma analogamente oscillante. I picchi del caso liquido si manifestano solo nel corto range a mostrare che la correlazione avviene solo fra particelle vicine fra loro. Lavorando a vettori d’onda sufficientemente grandi si è in grado di osservare la correlazione delle particelle a corto range, mentre per vettori d’onda piccoli la lunghezza d’onda del neutrone è molto grande e non si è un grado di vedere la correlazione a corto range. In altri termini si è visto che per un cristallo, qualunque sia il vettore d’onda scambiato si osservano dei picchi, cioè si può apprezzare l’ordine cristallino a prescindere dal vettore d’onda scambiato. Nel caso di un liquido invece, visto che l’ordine esiste solo per distanze piccole, lo si può vedere in TdF solo se il vettore d’onda scambiato è grande. Questo è ciò che accade per correlazione a tempi nulli. Si vuole estendere questo discorso ad un tempo qualsiasi, e lo vediamo come fatto precedentemente prima per un cristallo e poi per un liquido. In figura 18 vediamo raggruppati i tre casi principali: solido liquido e amorfo (vetro). Consideriamo il caso della sezione d’urto coerente ad 1 fonone (perché ora siamo interessati al modo in cui la densità si modifica rispetto al suo valore medio). Supponiamo, nel caso del cristallo, di poter eccitare un solo modo di vibrazione mentre tutti gli altri rimangono nello stato fondamentale. Il cristallo si muove di moto armonico e la densità sarà: ρ(r̄, t) = ρ0 eiωt e−iq̄ · r̄ quindi la G(r̄, t) normalizzata rispetto a ρ0 applicando la definizione (3.7) è: G(r̄, t) = 1 2 iωt −iq̄ · r̄ ρ e e = ρ0 eiωt e−iq̄ · r̄ ρ0 0 e quindi se si fissa r̄ = R̄l si ottiene un’oscillazione armonica alla frequenza ω nel tempo da −∞ a +∞, e ciò significa che la TdF è semplicemente una δ(ω). Nel caso reale tuttavia, anche nell’approssimazione fatta, cioè la posizione fissata e tutti i modi nello stato fondamentale eccetto uno, il modo attivo non oscilla 3 SCATTERING DA NEUTRONI TERMICI Figura 18: Casi solido liquido e vetro: G(r̄, t) e S(q̄, ω) 64 3 SCATTERING DA NEUTRONI TERMICI 65 Figura 19: La Gs e la Gd nel caso liquido per diversi intervalli temporali. t all’infinito bensì si smorza nel tempo attraverso un fattore e− τ dove τ è il tempo di vita dell’oscillazione, normalmente dell’ordine del ps. La figura di riferimento quindi è la 18 nel caso solido, e l’espressione corretta della G diventa: G(r̄, t) = ρ0 eiωt e−iq̄ · R̄l e− τ t Se ω = 2π/T perché l’oscillazione sia visibile deve valere che τ ' T /2, per cui i periodi medi di vibrazione dei reticoli sono dell’ordine di qualche ps. Per quanto riguarda la S(q̄, ω), nel caso di un cristallo si ha che e−iq̄ · R̄l 6= 0 solo se R̄l è un vettore di reticolo diretto, quindi per un cristallo la S(q̄, ω) è centrata in zero, dove si ha la riga Bragg. Facendo una scansione in ω nel caso solido, se l’oscillazione fosse non smorzata si avrebbero delle δ per i casi S a AS, ma dato che il modo è smorzato le delta diventano dei picchi la cui larghezza a mezza altezza (FWHM) è 1/τ . In un liquido invece la G(r̄, t) oscilla brevemente ed è sovrapposta ad un esponenziale decrescente: i moti vibratori all’interno di un liquido esistono e sono simil-fononi, e si chiamano modi idrodinamici. Questi modi collettivi si manifestano solo su distanze sufficientemente grandi rispetto alla distanza media fra le particelle. Se le distanze sono piccole si osserva solo il moto di singola particella. L’oscillazione in t è generata da un moto oscillatorio che rappresenta il modo collettivo del sistema, sovrapposta ad una decrescita molto veloce in termini di r̄. Per capire meglio questo fatto si guardi la figura 19: si vede la G divisa nelle sue componenti Gs e Gd , plottate a tempo zero, per t ∼ τ e per t τ dove τ è il tempo caratteristico di urto. Il primo grafico, a tempo zero mostra una alta correlazione della particella con sè stessa, che scende e si allarga passando a tempi t ∼ τ a mostrare una probabilità minore ma finita che la particella si "ricordi" della posizione che aveva a tempo zero. La Gd mostra lo stesso comportamento: l’oscillazione si sta smorzando ma è ancora visibile, cioè la correlazione della particella con le altre in funzione di r̄ è ancora misurabile. Andando a tempi più lunghi cioè t τ la particella avrà fatto molti urti e la correlazione con sè stessa a tempo zero è andata persa, e parimenti per la Gd le particelle si sono "mischiate" raggiungendo subito il valore di equilibrio ρ0 . Alla luce di questa discussione è forse più comprensibile il grafico della G(r̄, t) in figura 18 nel caso liquido: il grafico è fatto in funzione del tempo a distanze fisse mostra che l’esponenziale spaziale decrescente ha un peso che dipende dalla distanza. Se ci si occupa di cercare la correlazione fra la molecola di riferimento ed altre lontane non si vedrà nulla in quanto il liquido non ha simmetria traslazionale. Il grafico di S(q̄, ω) in figura 18 mostra, nel caso liquido, un picco centrato in zero che è chiamato picco quasi-elastico, mentre i picchi laterali a +ω e a −ω sono gli equivalenti dei fononi longitudinali per il cristallo. Il segnale dinamico (cioè anelastico) per un liquido, equivale a due oscillazioni a frequenze 3 SCATTERING DA NEUTRONI TERMICI 66 simmetriche rispetto a zero come quel S e AS nel caso del cristallo. Ciò che cambia è che per ω = 0 non si ha una δ bensì una riga allargata che da luogo allo scattering Rayleigh per un liquido. Si può dire quindi che prendendo il grafico di S(q̄, ω) nel caso solido in figura 18, liquefando tale solido si ottiene il grafico sottostante, e di fatto scompaiono i modi trasversi, perché? Perché un liquido non ha piani di atomi che possano oscillare trasversalmente gli uni rispetto agli altri; inoltre il termine cinetico dell’hamiltoniana è dello stesso ordine di grandezza del termine potenziale, quindi se le oscillazioni sono determinate dalla parte repulsiva del potenziale le frequenze sono le stesse di quelle longitudinali nel caso solido, altrimenti se il potenziale è determinato prevalentemente dalla parte attrattiva esse cambiano. Infine vediamo il caso di un sistema amorfo, il vetro, facendo riferimento alla figura 18. Un sistema amorfo è un sistema solido privo di simmetria traslazionale in cui le shell sono inchiodate, rispetto ad un liquido, su posizioni fisse. C’è disordine locale come per un liquido ma i legami sono fissati come in un cristallo. Quindi le shell oscillano l’una rispetto all’altra ma con una distanza fissa che è la distanza media fra le shell. In questo senso il grafico di G del vetro è molto simile a quello del solido, con la differenza di un minor tempo di vita dell’oscillazione a causa del disordine strutturale. Dal punto di vista della S c’è sempre una riga elastica che corrisponde al Bragg del cristallo (si hanno comunque delle posizioni fisse anche se disordinate l’una rispetto all’altra) e i picchi laterali sono equivalenti a quelli del caso liquido e che possono essere equiparati ai fononi longitudinali, in quanto l’amorfo è un sistema isotropo come un liquido. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 4 4.1 67 Spettroscopia da campo elettromagnetico Dalle equazioni di Maxwell alla quantizzazione del campo elettromagnetico Le proprietà elettriche della materia sono descritte da una funzione scalare dello spazio e del tempo, la densità di carica ρ(r̄, t) mentre lo stato dinamico è descritto dalla funzione vettoriale v̄(r̄, t) il campo delle velocità. In questa accezione la materia è descritta come un continuo, e la densità di corrente elettrica è: ¯ t) = ρ(r̄, t)v̄(r̄, t) J(r̄, (4.1) La radiazione elettromagnetica viene rappresentata da due grandezze vettoriali: Ē(r̄, t) e B̄(r̄, t) rispettivamente campo elettrico e magnetico. Questi campi obbediscono alle equazioni di Maxwell, cioè un sistema di equazioni differenziali alle derivate parziali a cui devono venire imposte delle condizioni al contorno: ¯ · B̄ = 0 ∇ ¯ · Ē = 4πρ(r̄, t) ∇ ¯ ∧ Ē + 1 ∂ B̄ = 0 ∇ c ∂t 1 ¯ ∧ B̄ − ∂ Ē = 4π J(r̄, ¯ t) ∇ c ∂t c (4.2) (4.3) (4.4) (4.5) le quali per assenza di cariche (ρ(r̄, t) = 0) mostrano una particolare simmetria tra i campi elettrico e magnetico. Per la densità di carica vale l’equazione di continuità: ∂ρ ¯ J¯ = 0 +∇ ∂r (4.6) la quale esprime la conservazione della carica elettrica ed è conseguenza delle equazioni di Maxwell. Il sistema di equazioni può essere ridotto ad una forma più compatta introducendo il potenziale vettore Ā(r̄, t) e il potenziale scalare φ(r̄, t) (da ora in poi le barre vettoriali sui simboli di campo, sui nabla e sul potenziale vettore verranno omessi per velocizzare la scrittura.) L’equazione (4.2), che esprime l’assenza di monopoli magnetici si può scrivere come: B =∇∧A Ora, tenendo conto che il campo elettrico è esprimibile come il gradiente di una funzione scalare φ, e che ∇ ∧ (−∇φ) = 0, usando il potenziale vettore A si possono riscrivere le ultime due equazioni di Maxwell: 1 ∂∇ ∧ A 1 ∂A + ∇ ∧ (−∇φ) ⇒ E = −∇φ + c ∂t c ∂t 1 ∂E 4π ∇ ∧ B = ∇ ∧ ∇ ∧ A = ∇(∇ · A) − ∇2 A = + J c ∂t c ∇∧E =− (4.7) (4.8) dove nella (4.8) si è usata la relazione ∇ ∧ ∇ ∧ A = ∇(∇ · A) − ∇2 A e si nota che E + 1c ∂A ∂t è irrotazionale. La grandezza φ(r̄, t) è definita dalla (4.7) stessa. Le scelte fatte per i potenziali A e φ non li definiscono in modo univoco: infatti 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 68 A è definito a meno di un vettore ∇χ(r̄, t) a rotazione nulla mentre φ è definito a meno di una funzione scalare ψ a gradiente nullo. Si può scrivere quindi che: A0 = A − ∇χ φ0 = φ + ψ dove si ha ovviamente che ∇ ∧ A0 = ∇ ∧ A = B; ma A e φ devono essere tali che: 1 ∂A 1 ∂A0 + ∇φ0 = + ∇φ E(r̄, t) = c ∂t c ∂t e sostituendo nella precedente A0 = A − ∇χ e φ0 = φ + ψ si ottiene che: 1 ∂∇χ = ∇ψ c ∂t e la scelta ψ= 1 ∂χ c ∂t soddisfa l’uguaglianza rispetto ad E. Si possono scrivere quindi le trasformazioni di gauge: ¯ Ā0 = Ā − ∇χ(r̄, t) (4.9) 1 ∂χ φ0 = φ + (4.10) c ∂t e si sceglie una gauge particolare detta gauge di Coulomb per cui si ha: ∇·A = 0 (4.11) In questa gauge è possibile riscrivere l’equazione (4.8) usando anche l’espressione di E della (4.7): 1 ∂∇φ 1 ∂2A 4π − ∇2 A + 2 + 2 2 = J (4.12) c ∂t c ∂t c ma tale equazione è ancora complicata dal termine contenente φ. Tuttavia viene in aiuto il Teorema di Helmotz: ogni campo vettoriale può essere scritto come somma di due componenti: una detta trasversa (o soleonidale) a divergenza nulla e una detta longitudinale (o irrotazionale) a rotore nullo. Ad esempio per la densità di corrente J si può scrivere: ( ∇ · JT = 0 J = JT + JL con (4.13) ∇ ∧ JL = 0 Definizioni e nomenclature simili possono essere applicati agli altri campi vettoriali, ad esempio dal fatto che B = ∇ ∧ A è evidente che B è definito tramite AT (dato che ∇ ∧ AL = 0). Inoltre dal fatto che ∇ ∧ (∇φ) = 0 segue che ∇φ è longitudinale per tutte le funzioni di gauge χ. Infine la gauge di Coulomb identifica A come interamente trasversale. Usando queste assunzioni si trova che l’equazione completa del campo (4.12) può essere separata nella sua parte trasversa e longitudinale: Trasversa: Longitudinale: −∇2 A + 1 ∂2A 4π JT = 2 2 c ∂t c 1 ∂∇φ 4π = JL 2 c ∂t c (4.14) (4.15) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 69 Si fa la scelta del potenziale scalare ∇φ = 0 e si considera il caso del campo libero nel vuoto cioè JT = 0. Si ottiene così l’equazione delle onde per il potenziale vettore nel vuoto: 1 ∂2A =0 (4.16) − ∇2 A + c ∂t2 Come è possibile scrivere A? Applichiamo delle condizioni al contorno. Se si considera un volume V = L · L · L con condizioni periodiche al contorno del potenziale vettore: A(x, y, z, t) = A(x + L, y, z, t) = A(x, y + L, z, t) = A(x, y, z + L, t) (4.17) si può scrivere il potenziale attraverso uno sviluppo in serie di Fourier di onde viaggianti: X A(r̄, t) = Ak (r̄, t)eik̄ · r̄ + A∗k (r̄, t)e−ik̄ · r̄ (4.18) k Nello spazio di Fourier vale sempre che k̄ e Ak sono ortogonali cioè k̄ · Ak = k̄ · A∗k = 0. Quindi dato che k̄ è diretto come il vettore di Poynting, cioè nel verso di propagazione dell’onda elettromagnetica, allora gli Ak giacciono su di un piano ad esso ortogonale, e questo significa che il campo elettromagnetico (CEM) ha due diversi stati di polarizzazione e si può scrivere Akj con j = 1, 2. Sostituendo la (4.18) all’interno dell’equazione (4.16) si ottiene la dipendenza temporale: 1 ∂ 2 Akj (t) k 2 Akj (t) − 2 =0 (4.19) c ∂t2 con soluzione Akj (t) = Akj (0)e−iωkj t (4.20) con ωkj = ckj . Inserendola nell’espressione (4.18) si ha: X A(r̄, t) = Akj e+i(k̄ · r̄−ωkj t) + A∗kj e−i(k̄ · r̄−ωkj t) (4.21) kj La densità di radiazione di un CEM è: ED = 1 (|E|2 + |B|2 ) 8π da cui si può calcolare l’hamiltoniana del CEM: Z 1 dr̄(|E|2 + |B|2 ) H= 8π (4.22) (4.23) Abbiamo visto che il campo elettromagnetico è dato da derivate del potenziale vettore A. Ora si fa un passo avanti verso la quantizzazione del CEM ipotizzando che il potenziale vettore si possa esprimere come la somma di due operatori quantistici. Nello specifico come: s 2πc2 Ak j = ωkj Q̂kj + iP̂kj ¯kj (4.24) V ωkj s 2πc2 ∗ Ak j = ωkj Q̂kj − iP̂kj ¯∗kj (4.25) V ωkj 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 70 dove ¯kj rappresenta lo stato di polarizzazione. Da queste espressioni, ricavando i campi elettrico e magnetico e inserendoli nell’espressione dell’hamiltoniana si trova: X1 X (4.26) Pk2j + ωk2j Q2kj Hkj = H= 2 kj kj l’hamiltoniana totale è la somma di tutte le hamiltoniane con un dato vettore d’onda e polarizzazione, che sono tipiche hamiltoniane di oscillatore armonico. A questo punto si introducono gli operatori di creazione e distruzione bosonici, rispettivamente a†kj e akj attraverso cui esprimere gli P̂kj e Q̂kj , cioè: r P̂kj = i s Q̂kj = m~ωkj † akj − akj 2 ~ † akj + akj 2mωkj (4.27) (4.28) e sostituendo le precedenti nell’espressione dell’hamiltoniana (4.26) si ottiene: X 1 † H= ~ωkj akj akj + (4.29) 2 kj Dato uno stato |ni dell’oscillatore armonico, gli operatori agiscono su tale stato nel seguente modo: √ a†kj |ni = n + 1 |n + 1i (4.30) √ (4.31) akj |ni = n |n − 1i e si chiama operatore numero n̂ = a†kj akj e conta il numero di oscillatori in un dato stato cioè hn| n̂ |ni = hn| a†kj akj |ni = n Scriviamo per esteso il potenziale vettore espresso tramite gli operatori di creazione e distruzione: s X 2πc2 Akj (r̄, t) = akj e+i(k̄ · r̄−ωkj t) + a†kj e−i(k̄ · r̄−ωkj t) ¯kj (4.32) V ω kj kj Il campo elettrico quindi, che si può scrivere come E = − 1c ∂A ∂t , ha un valore di aspettazione nullo cioè hn| E |ni = 0. Questo è dovuto al fatto che anche i valori di aspettazione degli operatori di creazione e distruzione sono nulli: hn| a† |ni = 0 (4.33) hn| a |ni = 0 (4.34) Ciò significa che il valore aspettato del campo elettrico in regime quantistico è nullo, e questo risultato è insolito; infatti se si scrive il campo elettrico: E(r̄, t) = E0 e−iωt+iφ (4.35) considerando il principio di indeterminazione si può arrivare a scrivere: ∆E∆t ∼ ~ ⇒ ~∆ω∆t ∼ ~ (4.36) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO e dato che ∆ω = ω∆n e che ∆t = ∆φ ω 71 si può scrivere: ∆n∆φ ∼ 1 (4.37) quindi l’indeterminazione sulla fase per l’indeterminazione sul numero di fotoni, cioè sull’ampiezza è una costante, e questo si traduce proprio nel fatto che non posso avere contemporaneamente una informazione infinitamente precisa su fase e ampiezza, che sono due grandezze fondamentali per conoscere il campo elettrico; ciò significa che, come scritto inizialmente, il valore aspettato del campo elettrico, al contrario di quanto avveniva classicamente, è nullo. 4.2 Interazione radiazione-materia Fin’ora abbiamo considerato la radiazione elettromagnetica nel vuoto. Vogliamo studiare cosa avviene quando la radiazione interagisce con la materia. E’ possibile derivare l’interazione radiazione-materia direttamente dalla sostituzione minimale: se si ha una particella con impulso p immersa in un CEM, allora il suo impulso diventa p − ec A e questo nuovo impulso lo si inserisce all’interno dell’hamiltoniana della particella. L’hamiltoniana totale, data dalla somma delle hamiltoniane del sistema e della radiazione è: 1 e 2 (4.38) H= p − A + V ({R}) + Hrad 2m c il primo termine descrive l’interazione radiazione-materia, il secondo termine è il potenziale di interazione fra le particelle del sistema (ad esempio se studiamo un cristallo esso sarà il potenziale cristallino), mentre il termine Hrad rappresenta l’hamiltoniana di radiazione vista nell’espressione (4.23). Ora passiamo dall’interazione fra il campo e una particella ad un sistema di N particelle ognuna con carica Qi e si può scrivere svolgendo il quadrato nella (4.38): X p2 Q2 Qi i H= + 2 i A2 (r̄, t) − [pi A(r̄, t) + A(r̄, t)pi ]+ +V ({Ri })+Hrad 2mi 2c mi 2cmi i (4.39) dove V ({Ri }) dipende dalla mutua posizione delle particelle {Ri } e ovviamente impulso, posizione e potenziale vettore sono qui operatori quantistici. Non avendo informazione sulla distribuzione spaziale delle particelle della materia in esame si ipotizza una funzione densità del tipo (nel discreto e nel continuo): Z X ρ(r̄, t) = δ(r̄ − R̄i ) −−−−−−−→ dr̄ δ(r̄ − R̄i ) (4.40) i al continuo si introduce la precedente funzione densità per inserirla nel termine di interazione dell’hamiltoniana (4.39), la quale viene riarrangiata in modo da evidenziare 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 72 la dipendenza dalle potenze di A: X p2 i H= + V ({Ri }) + Hrad + 2mi i {z } | H0 Z − dr̄ X δ(r̄ − R̄i ) i | Qi [pi A(r̄, t) + A(r̄, t)pi ] + 2cmi {z } (4.41) H1 (A) X Q2 i A2 (r̄, t) + 2m 2c i i {z } | H1 (A2 ) Quindi l’hamiltonina totale si può scrivere come H = H0 + Hint dove Hint = H1 (A) + H1 (A2 ). Il termine H1 (A) è il prodotto tra la quantità di moto delle particelle e il potenziale vettore del CEM su cui agisce la funzione densità e può essere considerata come fattorizzata in una parte dipendente dal target per una parte dipendente dal probe, mentre il termine H1 (A2 ), quadratico in A, è il prodotto della somma del quadrato delle cariche del target per il quadrato del potenziale vettore ed anche questa come la precedente può essere considerata fattorizzata in una parte di probe per una parte di target. 4.2.1 Processi ad 1 fotone: assorbimento ed emissione Ricordando la sezione 2, in particolare la (2.14) abbiamo visto che l’operatore di scattering è ottenibile dal potenziale di interazione VI (che ha un termine lineare in A e uno in A2 ) attraverso l’espressione: i Ŝ = T̂ {e− ~ R +∞ −∞ dtVI (t) } Si è visto che la matrice di scattering sviluppata in serie fornisce, ad ogni ordine, i vari tipi di interazione. Qui possiamo anticipare che al primo ordine si trovano i processi ad un fotone, in particolare di assorbimento ed emissione di un fotone mentre al secondo ordine si trovano i processi a due fotoni come lo scattering Raman e Brillouin e l’assorbimento e l’emissione di due fotoni. Se il CEM è abbastanza piccolo il termine dominante è quello lineare in A. Vogliamo arrivare a scriverlo come fattorizzato in un termine di probe per uno di target, esattamente come nelle ipotesi viste del teorema della risposta lineare. E’ possibile definire l’operatore densità di corrente come: J(r̄, t) = X Qi X Qi [pi ρ(r̄, t) + ρ(r̄, t)pi ] = pi δ(r̄ − R̄i (t)) 2mi mi i i che è relativo al target. Quindi si può scrivere il termine H1 come: Z 1 H1 = − dr̄J(r̄, t) · A(r̄, t) c (4.42) (4.43) che è il potenziale di interazione al primo ordine in A fattorizzato in un termine di probe A(r̄, t) per un termine relativo al target J(r̄, t) (si noti come sia lo stesso 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 73 risultato anticipato nella (2.29)). E’ possibile quindi applicare il teorema della risposta lineare e ricavare così la probabilità di transizione doppio differenziale cioè: Z Z ∂ 2 Ṗ ρ(ωF ) dteiωt dr̄1 dr̄2 e−iq̄(r¯1 −r¯2 ) · = ∂Ω∂ω ~ (4.44) X · hpi | A†α (r̄1 , t) |pf i hpf | Aβ (r̄2 , 0) |pi i · hOα† (r¯1 , t)Oβ (r¯2 , 0)i αβ 2 ω La probabilidove ρ(ωF ) = (2πc) 2 è la densità degli stati e α, β = x, y, z. tà di transizione precedente è scritta in termini della funzione di correlazione corrente-corrente, infatti l’operatore O(r̄, t) è l’operatore momento di dipolo cioè: Jα (r̄, t) X Qi α Oα (r̄, t) = = p δ(r̄ − R̄i (t)) (4.45) c cmi i i Conviene usare per A(r̄, t) il seguente modo di scrittura: X A(r̄, t) = Bkj (r̄, t) + Bk∗j (r̄, t) (4.46) kj dove si ha che: s 2πc2 ¯k ei(k̄ · r̄−ωkj t) akj V ωkj j (4.47) 2πc2 ∗ −i(k̄ · r̄−ωkj t) † ¯ e akj V ω kj kj (4.48) Bkj (r̄, t) = s Bk∗j (r̄, t) = Si considera lo stato iniziale del probe |pi i come un’onda piana polarizzata di energia E = ~ω, momento q̄ e vettore di polarizzazione ¯. Il numero di fotoni iniziali è n e si vuole calcolare la parte della probabilità di transizione relativa al probe: X hn| Bkαj (r̄1 )e−iωkj t + Bk∗α (r̄1 )e+iωkj t |pf i · j kj · hpf | X kj0 0 = hn| X Bkβ0 (r̄2 ) j0 + Bk∗β0 (r̄2 ) j0 Bkαj (r̄1 )e−iωkj t |pf i hpf | X X kj0 0 kj + hn| |ni = Bk∗α (r̄1 )eiωkj t |pf i hpf | j kj X kj0 0 Bk∗β0 (r̄2 ) |ni + (4.49) j0 Bkβ0 (r̄2 ) |ni j0 il motivo per cui nell’ultimo passaggio della precedente espressione vi sono solo due addendi invece di quattro è dovuto al fatto che B contiene un operatore di distruzione e B ∗ uno di creazione e sopravvivono solo i termini misti cioè hn| akj |pf i hpf | a†k0 |ni e hn| a†kj |pf i hpf | akj0 0 |ni. j0 Distinguiamo ora i processi: 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 74 • quando |pf i = |n + 1i si ha l’emissione, cioè viene creato un fotone nel processo e il primo addendo dell’ultima espressione della (4.49) restituisce n(ω) + 1 mentre il secondo addendo si annulla; • quando |pf i = |n − 1i si ha l’assorbimmento, cioè viene distrutto un fotone nel processo e il primo addendo della (4.49) si annulla mentre il secondo addendo restituisce n(ω). Quindi si ha che, scrivendo tutte le costanti ed esplicitando i valori di B e B ∗ , il termine di probe che entra nell’espressione (4.44) si può scrivere come: 2π~c2 α ∗β [n(ω) + 1]e−iωt e−iq̄ · (r¯1 −r¯2 ) + ∗α β n(ω)e+iωt eiq̄ · (r¯1 −r¯2 ) (4.50) Vω Inserendo quest’ultima espressione nella (4.44) e semplificando le costanti si può riscrivere la probabilità di transizione con i termini di emissione e assorbimento: ∂ 2 Ṗ ω = 2 ∂Ω∂ω (2π) ~c3 V +∗α β n(ω) Z dr¯1 dr¯2 e−iq̄ · (r¯1 −r¯2 ) Z Xh α ∗β [n(ω) + 1] dt e−iωt + αβ Z i dt e+iωt hOα† (r¯1 , t)Oβ (r¯2 , 0)i (4.51) Ora bisogna risolvere la funzione di correlazione dell’operatore di target. Si considera un sistema di N atomi o ioni, ognuno formato da un nucleo di carica eZj , massa Mj e con Pj e Rj rispettivamente momento e coordinate nucleari. Si indicano poi con py e ry momento e coordinate degli elettroni, di massa m e carica −e e siano zj gli elettroni per atomo/ione. Si scrive per l’operatore: Z Oα (q̄, t) = dr̄e−iq̄ · r̄ Oα (r̄, t) = Z zj N X N X X e eZ j = dr̄e−iq̄ · r̄ − pα δ(r̄ − r̄y (t)) + Pjα (t)δ(r̄ − R̄j (t)) = mc j y y cM j j N =− zj N e X X α −iq̄ · r̄y (t) X eZj α p e + Pj (t)e−iq̄ · R̄j (t) mc j y y cM j j (4.52) dove si è applicata la definizione (4.45) e si è usata l’espressione Z e−iq̄ · r̄i (t) = dr̄e−iq̄ · r̄ δ(r̄ − r̄i (t)) La (4.52) si può riesprimere usando le coordinate e il momento relativi di elettrone e nucleo cioè rispettivamente: %̄y = r̄y − R̄j m Π̄y = p̄y − P̄j Mj 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 75 Allora l’ultima espressione della (4.52) si può riscrivere come: Oα (q̄, t) = N zj N −e X X m α −iq̄ · (%̄y +R¯j (t)) e X Zj α −iq̄ · R¯j (t) Πα + P e + P e = y mc j y Mj j c j Mj j N zj e XX α Π (t)e−iq̄ · (%̄y +R̄j (t)) + mc j y y # " zj N 1 X −iq̄ · %̄y e X −iq̄ · R̄j (t) α Zj e + Pj (t) − e c j Mj Mj y =− (4.53) di questo operatore va calcolato Oα† (q̄, t) e Oβ (q̄, 0) per poi fare la media quantistico termodinamica. Si considera, in prima approssimazione che gli stati elettronici siano poco perturbati dalle interazioni atomo-atomo (o ione-ione) e che si possa usare l’approssimazione di Born-Oppenheimer fattorizzando le funzioni d’onda nucleari ed elettroniche. Se Ĥ è l’hamiltoniana del target allora X Ĥj + V̂ ({R̄j (t)}) Ĥ = j dove Ĥj = Ĥje + ĤjN e si ha che |ψj i = |ψje i |ψjN i e quindi si può scrivere la funzione di correlazione fattorizzata in una parte elettronica per una parte nucleare: h i = h ie h iN (4.54) Inoltre vale che hPjα iN = hΠα y ie = 0 ∀ α, j, y in quanto gli atomi sono qui considerati fissi. Quindi gli unici termini che hanno medie non nulle sono: e2 X X iq̄ · %̄y (t) †α he Πy (t)Πβy0 (0)e−iq̄ · %̄y0 (0) ie heiq̄ · R̄j (t) e−iq̄ · R̄j0 (0) iN + m2 c2 0 0 jj yy 2 e X 1 heiq̄ · R̄j (t) Pj†α (t)Pjβ0 (0)e−iq̄ · R̄j0 (0) iN · + 2 0 c M M j j 0 jj Zj 0 Zj h ih i X X iq̄ · %̄y (t) · h Zj − e Zj 0 − e−iq̄ · %̄y0 (0) ie y y0 (4.55) Generalmente nel range della radiazione visibile e ultravioletta si ha q · %y 1 e quindi eiq̄ · %̄y (t) ∼ 1 (approssimazione di dipolo). 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 76 Introducendo le grandezze carica netta dello ione j e quantità di moto elettronico dello ione j che sono rispettivamente zj X Qj = e(Zj − zj ) α Πα y = Πj y dove la carica netta vale Qj = 0 per atomi neutri, si può scrivere la (4.55) come: e2 X †α hΠ (t)Πβj0 (0)ie heiq̄ · R̄j (t) e−iq̄ · R̄j0 (0) iN + m2 c2 0 j jj (4.56) 1 X Qj Qj 0 iq̄ · R̄j (t) †α β −iq̄ · R̄j 0 (0) + 2 he Pj (t)Pj 0 (0)e iN c Mj Mj 0 0 jj Il primo di questi termini da l’assorbimento o l’emissione dai livelli elettronici convoluto con la dinamica dei nuclei. Nel caso di atomi neutri della stessa specie si ha che Qj = 0 e l’unico termine di assorbimento è quello elettronico. Indicando con FS (q̄, t) la funzione di autocorrelazione dei nuclei si può scrivere: X e2 X † hΠj (t) · ¯∗ Πj (0) · ¯ie (4.57) ∗α β hO†α (q̄, t)Oβ (q̄, 0)i = FS (q̄, t) 2 2 m c j αβ e usando la definizione di h ie e le relazioni Πj (t) = e+i Ĥe ~ t Πj (0)e−i Ĥe ~ X t |λi hλ| = 1 λ si ottiene: hΠ†j (t) · ¯∗ Πj (0) · ¯i = ρj (En ) X e+iωλn t | hλ| Πj · ¯ |ni |2 (4.58) λ con e ρj (En ) = P ~ωλn = En − Eλ − kEnT m B e − kEmT B dove ρj (En ) è la probabilità che l’atomo j sia sullo stato elettronico |ni. Inoltre poichè vale: e hλ| Πj · ¯ |ni = −iωλn m hλ| d¯j · ¯ |ni (4.59) ¯ dove dj = e%¯j è l’operatore momento di dipolo elettronico. Usando la scrittura hλ| d¯j · ¯ |ni = (d¯j · ¯)λn si può scrivere: X X 1 2 +iωλn t ¯ F (q̄, t) ρ (E ) ωλn e |(dj · ¯)λn |2 (4.60) S j n c2 n λ Quindi possiamo scrivere infine, nel caso di atomi neutri della stessa specie, la seguente probabilità di transizione doppio differenziale: XX ∂ 2 Ṗ (q̄, ω) ω 2 +iωλn t ¯ = ρj (En )ωλn e |(dj · ¯)λn |2 · 2 3 ∂Ω∂ω (2π) ~c V λn j (4.61) Z Z −i(ω−ωλn )t i(ω+ωλn )t · [n(ω) + 1] dt e FS (q̄, t) + n(ω) dt e FS (q̄, t) proviamo a commentare i termini presenti in quest’ultima espressione: 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 77 • dato che ω è sempre positiva il termine con [n(ω) + 1] implica che ωλn > 0 cioè En > Eλ in quanto questo termine rappresenta l’emissione di radiazione che avviene se è En è occupato e si diseccita su Eλ . Moltiplicando la parentesi [n(ω) + 1] per l’integrale questo termine può essere a sua volta diviso in due parti: emissione spontanea è data dal termine con 1, essa quindi non dipende dal flusso di radiazione incidente. Rappresenta, come suggerisce il nome, i processi di diseccitazione spontanea dal primo livello elettronico occupato a quello fondamentale. Il fenomeno di emissione può avvenire casualmente in tutte le direzioni ed è spiegato in seconda quantizzazione considerando le fluttuazioni dello stato di vuoto del campo elettromagnetico incidente che pertanto transisce al primo stato eccitato fotonico quando l’atomo si diseccita e viene emesso il fotone; emissione stimolata è data dal termine con n(ω), essa quindi dipende dal flusso di radiazione incidente. Rappresenta tutti i processi di diseccitazione indotti dai fotoni incidenti che causano l’emissione di fotoni con frequenza e vettore d’onda uguale ai fotoni incidenti, causando l’amplificazione della radiazione. Questo fenomeno è usato per ottenere l’amplificazione laser; • dato che ω è sempre positiva il termine con n(ω) implica che ωλn < 0 e si chiama termine di assorbimento e descrive i processi in cui i fotoni del campo incidente vengono assorbiti dagli elettroni che transiscono da uno stato a più bassa energia Eλ verso uno stato a più alta energia En (ecco perchè questa volta ωλn = Eλ −En < 0). Con la trattazione fatta possiamo distinguere l’assorbimento dai livelli elettronici con l’assorbimento causato dai nuclei (cioè dai modi normali del reticolo, che tratteremo più avanti.) Abbiamo visto che l’operatore di interazione è piuttosto complicato: contiene almeno due termini di diversa intensità. In termini del potenziale vettore c’è un termine lineare ed uno quadratico in A. Al primo ordine dello sviluppo della matrice di scattering si avranno quindi due termini provenienti dall’hamiltoniana di interazione che sono rispettivamente il termine lineare e quadratico in A. Le considerazione fatte riguardano la matrice di scattering al primo ordine lineare nel potenziale vettore, che rappresenta i processi più intensi nell’ambito dell’interazione radiazione-materia e cioè i processi ad 1 fotone. Ĥint = c1 Ā · p̄ + c2 Ā2 ⇒ Ŝ1 (Ā) + Ŝ1 (Ā2 ) + Ŝ2 (Ā) | {z } | {z } processi a 1 f otone (4.62) processi a 2 f otoni/scattering Il termine lineare nella matrice di scattering ma quadratico nel potenziale che viene dal termine quadratico nel potenziale dell’hamiltoniana ha un’intensità paragonabile al termine lineare in A ma al secondo ordine della matrice di scattering e questi ultimi due termini contengono i processi di assorbimento ed emissione a 2 fotoni e i processi di scattering elastico e anelastico. 4.2.2 Proprietà ottiche e Modello di Drude Supposto che valga l’approssimazione di Born-Oppenheimer, ci si può preoccupare di cosa assorbano separatamente gli elettroni dalle altre unità fondamentali 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 78 Figura 20: Radiazione incidente, riflessa e trasmessa du un certo campione di spessore d. del target in esame. Nel caso di elettroni liberi, ad esempio per un metallo, si può scrivere il termine di interazione radiazione-materia, cioè l’hamiltoniana per elettroni liberi nel modo seguente: Z 1 ¯ t) dr̄Ā(r̄, t) · J(r̄, (4.63) Ĥint = − c dove la densità di corrente microscopica J si scrive come: X ¯ t) = − e J(r̄, P̄i δ(r̄ − R̄i (t)) c i (4.64) quantità comoda quando si trattano delle cariche in moto. Arriveremo a trattare lo scattering da CEM come fatto per i neutroni, scrivendo cioè la matrice di scattering e la sezione d’urto. Vogliamo ricordare ora alcuni aspetti di ottica generale che saranno utili per la descrizione delle proprietà dei metalli e presentare il modello semiclassico di Drude che funziona molto bene per la descrizione delle proprietà ottiche dei metalli. Le proprietà ottiche di un materiale possono essere descritte in una forma macroscopica ed una microscopica. Quando si fa una misura ottica di un oggetto si misura una quantità macroscopica (ad es. la trasmittanza, la riflettività ecc). In figura 20 vediamo un campione di spessore d e una radiazione I0 (ω) che incide su di esso; ciò che può avvenire a livello macroscopico è di avere una radiazione riflessa in modo speculare IR (ω) mentre una parte della radiazione incidente viene assorbita dal campione e un’altra parte ancora viene trasmessa. In generale si chiama riflettività il rapporto fra l’intensità riflessa all’angolo θ e l’intensità incidente all’angolo θ: R(ω, θ) = IR (ω, θ) I0 (ω, θ) (4.65) ed è una quantità macroscopica. Si ottiene facendo il rapporto fra lo spettro incidente e quello riflesso ed è compresa fra 0 e 1. La riflettività è vicina ad 1 nei metalli, ed è funzione in generale della frequenza perché si possono avere effetti di risonanza con meccanismi del sistema che possono far aumentare o diminuire la sua riflettività. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 79 Figura 21: Schema della diffusione microscopica da una superficie rugosa. Se il campione ha una superficie rugosa parte della radiazione viene anche diffusa, cioè deviata ad un angolo diverso da quello di incidenza, e si ottiene la riflettività diffusa. In generale, guardando la superficie di un oggetto a livello microscopico, la rugosità, nonostante tecniche di levigatura molto raffinate è qualcosa di non completamente eliminabile. In figura 21 è mostrato come la rugosità microscopica determini fasci riflessi con angolo che cambia da punto a punto. Quindi mediamente una certa frazione del fascio incidente può venire diffusa ad un angolo diverso da quello di incidenza perché le normali alla superficie possono cambiare punto per punto. Se la rugosità media è δ, la luce per non accorgersi di tale rugosità, cioè per evitare effetti di diffusione, deve avere una lunghezza d’onda λ δ. A partire dall’intensità di radiazione trasmessa si può definire la trasmittanza, quantità macroscopica definita come il rapporto tra l’intensità trasmessa e quella entrata nel campione cioè: T (ω, θ) = IT (ω, θ) (1 − R)I0 (ω, θ) (4.66) In generale si ha che: T +R+A=1 (4.67) dove A è una quantità chiamata assorbanza, cioè la quantità di luce assorbita dal campione e che in generale viene trasformata in calore. Quest’espressione rappresenta sostanzialmente la conservazione dell’energia. Quindi dal punto di vista ottico ciò che si misura sono le proprietà macroscopiche cioè R, T e A. Tutto ciò che si calcola dalla probabilità di transizione sono invece quantità microscopiche come la sezione d’urto. Il passaggio fra queste quantità sono una serie di grandezze già viste durante i corsi di ottica e che ora ricorderemo. Se l’angolo di incidenza è θ < 10◦ sia la riflettività che la trasmittanza non dipendono più dall’angolo e questo si chiama incidenza quasi-normale. In questo caso la riflettivià si scrive come: ñ − 1 2 R(ω) = (4.68) ñ + 1 dove ñ è l’indice di rifrazione microscopico e ed è una quantità complessa e adimensionale che si scrive come: ñ = n + iκ (4.69) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 80 con n indice di rifrazione reale mentre la parte immaginaria κ è chiamata indice di estinzione e tiene conto dei processi di assorbimento nel materiale. La riflettività (4.68) si può quindi riscrivere come: R(ω) = (n − 1)2 + κ2 no ass. (n − 1)2 −−−−→ (n + 1)2 + κ2 κ=0 (n + 1)2 (4.70) l’ultima espressione a destra è la formula classica della riflettività in assenza di assorbimento. Questa formula conoscendo la riflettività permette di ricavare l’indice di rifrazione di un dato materiale. Generalizzando il discorso si può dire che la riflettività si manifesta se c’è una discontinuità ottica: ad un certo punto l’indice di rifrazione (idr) cambia improvvisamente. Questo significa che fin’ora abbiamo considerato il materiale di indice di rifrazione microscopica ñ come immerso nel vuoto (cioè il numero 1 nelle formule precedenti è l’idr del vuoto), ma se esso è immerso in un dielettrico con idr microscopico ñd allora la riflettività generica è: ñ − ñ 2 d (4.71) R(ω) = ñ + ñd Si assume di solito che ñ ≥ 1, cosa che però non è del tutto vera in quanto è stato dimostrato che l’idr può essere anche un numero negativo, e sono stati prodotti alcuni metamateriali con interessanti applicazioni. L’indice di rifrazione è un esempio di proprietà ottica microscopica. Tuttavia ciò che si è in grado di misurare è R. Per sistemi assorbenti cioè in cui κ 6= 0 il problema sembra mal posto in quanto dalla misura di R si dovrebbero ricavare due quantità facenti parte della stessa equazione. Volendo si potrebbe anche misurare T che supponendo A = 0 è facile collegare direttamente ad n e κ dato che sarebbe T = 1 − R. Se si potesse misurare contemporaneamente la luce riflessa e quella trasmessa, in principio, invertendo numericamente le due equazioni, si potrebbero ricavare i valori di n e κ. Questo però non sempre è possibile in quanto alcuni materiali non possono essere resi sottili a piacere che quindi non danno alcuna intensità trasmessa. Quindi spesso si è in grado di misurare una singola proprietà ottica macroscopica. Un altro esempio di grandezza ottica microscopica già visto è la funzione dielettrica microscopica o permettività definita come: ˜(ω) = ñ2 (ω) (4.72) anch’essa è una quantità complessa che può essere scritta nel modo seguente: ˜(ω) = 1 + i2 con 1 = n2 (ω) − κ2 (ω) e 2 = 2nκ (4.73) che spiega come un campo elettrico viene modulato dalla presenza del materiale. Un’altra grandezza ottica usata spesso è la conducibilità ottica σ̃(ω) definita a partire dalla permettività nel seguente modo: ˜(ω) = 1 + iσ̃(ω) ω (4.74) ed è anch’essa una grandezza complessa cioè: σ̃(ω) = σ1 + iσ2 (4.75) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 81 dove la parte reale σ1 è detta parte assorbitiva o dissipativa mentre la parte immaginaria σ2 è chiamata parte reattiva. Affichè ˜(ω) e quindi l’idr sia adimensionale la conducibilità deve avere le dimensioni di una frequenza. Le relazioni che legano ñ,˜ e σ̃ non sono lineari e l’obiettivo di molti misuratori ottici è caratterizzare un sistema ottico, cioè determinare le parti reale e immaginaria di una delle tre grandezze microscopiche citate e di conseguenza determinarne anche le altre. Storicamente, se il materiale è un isolante, le sue proprietà ottiche vengono descritte tramite la parte reale e immaginaria della funzione dielettrica, se invece il materiale è metallico si usano le parti reale e immaginaria della conducibilità ottica. Tramite il modello di Drude si possono descrivere le proprietà ottiche di un metallo in maniera semiclassica. Le proprietà elettrodinamiche dei metalli che vedremo esposte tramite questo modello possono essere studiate con spettroscopia ottica nel visibile, nell’UV e nel IR. Si consideri un gas di elettroni dove ogni elettrone sia individuato da una posizione r̄i . Si applica un campo esterno Ē = Ē0 eiωt e l’equazione che regola il movimento degli elettroni è puramente classica e si scrive come: m dr̄i (t) d2 r̄i (t) + mΓ = −eĒ(t) 2 dt | {zdt } (4.76) termine dissipativo e se τ è il tempo medio tra due urti allora Γ = 1/τ è il rate di scattering. Si ricorda che Drude pensava che gli elettroni urtassero esclusivamente contro gli ioni. Per tempi sufficientemente grandi ci si può aspettare che una soluzione della precedente si possa scrivere come: r̄i (t) = r̄0 eiωt (4.77) prendendo questa soluzione stazionaria e sostituendola nella (4.76) si ricava r̄˜0 , grandezza complessa: e Ē0 r̄˜0 = (4.78) m ω 2 − iωΓ che in pratica è l’ampiezza dello spostamento dell’elettrone i-esimo per effetto dell’applicazione del campo. Se si hanno n elettroni nel materiale, che in un metallo è un numero dell’ordine di 1022 -1023 elettroni per cm3 , il momento di dipolo che si crea per effetto della posizione del campo è: 2 Ē0 ¯ = −er̄˜0 = − e d˜ m ω 2 − iωΓ (4.79) ˜¯ Conoscendo il momento di ˜ = nd. e il momento di dipolo totale sarà quindi D̄ dipolo si sa che questa grandezza e il campo elettrico sono legati dalla grandezza nota come polarizzabilità, cioè: ˜ = ᾱ ˜¯ (ω)Ē0 D̄ (4.80) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 82 dove la doppia barra indica che la polarizzabilità è in generale un tensore. La polarizzabilità per un gas di elettroni di massa m carica e e densità n è definita come: e2 n ˜ ¯ (ω) = α1 + iα2 = − ᾱ (4.81) m (ω 2 − iωΓ) A partire dalla polarizzabilità è possibile ricavare la funzione dielettrica dalla relazione: ˜¯ (ω) (4.82) ˜(ω) = 1 + 4π ᾱ Indichiamo ora le grandezze strettamente ottenute col modello di Drude con l’uso dell’apice "D". La parte reale della funzione dielettrica di drude si scrive come: D 1 (ω) = 1 − ωp2 ω 2 + Γ2 (4.83) ωp2 ωΓ + Γ2 (4.84) e la parte immaginaria come: D 2 (ω) = 2 ω2 dove ωp2 = 4πne è la frequenza di plasma al quadrato. Quindi si può concludere m che la funzione dielettrica di questo modello semplice per un gas di elettroni, in cui si è partiti da un’equazione classica con un fattore dissipativo proporzionale alla velocità degli elettroni, si può esprimere in funzione di soli due parametri: uno è Γ che sarebbe la frequenza degli urti, e l’altro è ωp il cui quadrato è sostanzialmente il rapporto densità-massa n/m. In generale n ed m si possono misurare in maniera indipendente mentre Γ è un parametro fenomenologico. Drude per impostare il suo modello per i metalli partì dall’osservazione fondamentale riassumibile con la legge di Ohm: la corrente che scorre in un metallo è proporzionale alla differenza di potenziale tramite una costante dissipativa che è la resistenza. Fissata la ddp quindi la corrente è costante, tuttavia dato che la velocità delle particelle è proporzionale al campo elettrico, una ddp costante significa applicare una forza costante, il che significa che gli elettroni dovrebbero accelerare all’infinito, ma questo come sappiamo non avviene. Quindi Drude ipotizzò un qualche fenomeno di scattering (gli urti con gli ioni) che costringa la corrente a rimane costante. Questo però non è vero, vediamo perché. Gli elettroni si muovono con libero cammino medio definito da l = vF τ dove vF è la velocità di Fermi. In un metallo il valore di l, se il metallo è purissimo (elettroni balistici), è circa 1 mm con τ ∼ 1 µs, mentre in un metallo non puro l ∼ 102 Å che è almeno di un fattore cento più alto delle distanze medie fra gli ioni in un metallo che sono dell’ordine di qualche Å, e quest’osservazione spiega come mai l’ipotesi iniziale fatta da Drude per cui gli elettroni scatterano con gli ioni è falsa. I fenomeni di scattering principali riguardano le interazioni con i fononi e con le impurezze. Si possono scrivere anche le parti reale e immaginaria per la conducibilità di 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 83 Figura 22: Dipendenza spettrale della riflettività di un metallo di elettroni liberi Drude: σ1D (ω) = σ2D (ω) = ωp2 1 1 ωp2 Γ 2 + ωΓ ω Γ 2 + ωΓ (4.85) (4.86) e la riflettività di Drude è: ˜D − 1 2 RD (ω) = D ˜ + 1 (4.87) Ora spigheremo il significato fisico, molto importante, della frequenza di plasma, che sostanzialmente definisce il colore del metallo. Si considera una radiazione elettromagnetica che incide su di un metallo nel vuoto. In figura 22 si vede il grafico tipico della riflettività rispetto all’energia espressa in eV: fino ad un certo valore di frequenza che è esattamente ωp il metallo riflette più del 99% della radiazione incidente e dopo questo valore la riflettività crolla improvvisamente e il metallo assorbe. Fino alla frequenza di plasma possiamo dire che il metallo si comporta come un filtro ottico passa-alto, che riflette tutte le frequenze fino a ωp e assorbe le altre. Il prof fa vedere il grafico di riflettività dell’oro (che non ho trovato) e spiega come l’oro ha una frequenza di plasma nel rosso a circa 15000 cm−1 , e se illuminato con luce solare che contiene tutte le frequenze nel visibile, riflette fino alla sua frequenza di plasma e questo si traduce nel fatto che noi vediamo l’oro con un colore dovuto alla somma di tutte le frequenze fino a circa 15000 cm−1 , una specie di miscela di giallo e rosso. Ho inserito in figura 23 il grafico di riflettività dell’alluminio per mostrare un caso reale. Il caso dell’alluminio (di colore bianco) si può discutere dicendo che questo metallo ha una frequenza di plasma intorno ai 15 eV (1 eV = 8000 cm−1 ) cioè nel UV spinto, ed essendo meno nobile dell’oro 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 84 Figura 23: Riflettività dell’alluminio. La diminuzione di riflettività a 1.4 eV è dovuta ad una transizione interbanda mentre il crollo a 15 eV identifica la frequenza di plasma tende naturalmente ad ossidarsi, formando in superficie uno strato di ossido di alluminio di diversi nanometri di spessore che ha come risultato quello di abbassare la frequenza di plasma. La curva di riflettività diventa più "smooth" e tende a calare rispetto ad 1 man mano che cresce il valore di Γ, cioè man mano che aumenta lo scattering, ma il taglio del filtro ottico rimane sempre a ωp . La temperatura entra nel valore di Γ in quanto questo valore rappresenta una media di tutti i processi di scattering che avvengono nel metallo, uno dei quali è dato dall’interazione con i fononi la cui popolazione dipende dalla temperatura. Nel caso dell’oro, mostrato dal prof, Γ = 90 e il grafico è spiegato molto bene con il modello di Drude (la figura 22 ricorda molto il caso Au). Dopo la frequenza di plasma la riflettività dell’oro scende al 30 % del suo valore iniziale. Gli elettroni riescono a rispondere alla radiazione elettromagnetica fino ad una frequenza del CEM paragonabile a Γ; dopo non riescono più a seguire l’oscillazione del campo il quale riesce ad attraversare il materiale. E’ interessante, partendo dalla riflettività modellistica di Drude, vedere come si comportano le grandezze ˜ o σ̃ al variare di Γ. Ad esempio vediamo σdc = ωp2 /Γ cioè il valore che si può misurare a frequenza nulla con un tester. Si vede dalla figura 24 che in principio, prendendo la legge σ1D (ω) = σdcω 2 in sostanza essa è 1+( Γ ) una lorenziana centrata in zero, cioè a frequenza nulla; se Γ = 0 essa si trasforma in una delta di Dirac, quindi un metallo perfetto (senza scattering) corrisponde ad una conducibilità a forma di delta centrata in zero. Quando Γ è diverso da zero il valore di σdc si abbassa e si alza il valore in "alternata" quindi vale che: lim σ1D (ω) = σdc ω→0 (4.88) dove σdc è detta conducibilità in continua ed è semplicemente il reciproco della resistività in continua cioè 1/ρdc . L’area sottesa dalla parte reale della conducibilità di Drude è costante ed è ωp2 ; questa si chiama regola di somma ed è legata 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 85 Figura 24: Conducibilità reale di un metallo nel modello di Drude a diversi valori dello scattering (in rosso) Γ. alla conservazione della probabilità di transizione. Peggiorando il metallo (aumento Γ), è vero che la conducibilità in continua σdc peggiora, però il rapporto n/m rimane costante e finito, cioè l’area sottesa. Per ricapitolare si può dire che il reale processo fisico consiste in misurare la riflettività da cui ricavare σ1 . Invece il limite per la parte immaginaria della conducibilità vale: lim σ2D (ω) = 0 ω→0 (4.89) e questa funzione verrà vista fra poco. Il rapporto fra parte immaginaria e reale della conducibilità è: 1 σ2D (ω) = ωτ > 1 con ω > τ σ1D (ω) (4.90) Per dare dei numeri, considerando ad esempio l’oro ed esprimendo la frequenza in cm−1 si ha che ωpAu ' 15000 cm−1 (rosso) con ΓAu ∼ 100 cm−1 (lontano IR) e quindi la regione ωτ > 1 significa considerare frequenze maggiori di 100 cm−1 ; quindi da una certa regione del lontano IR in poi la parte immaginaria della conducibilità ottica vince sulla parte reale. Vediamo questo concetto anticipando che la σ1 è chiamata parte dissipativa (o resistiva) e la σ2 è chiamata parte induttiva. Per capire cosa comporta ciò, dato che i nomi ricordano note componenti circuitistiche, facciamo un conto di fisica di base: si consideri il metallo come un filo in cui scorre corrente ad una certa frequenza. Si può scrivere la legge di Ohm microscopica cioè: ˜ J˜¯ = σ̃ Ē cioè la densità di corrente che è data dalla conducibilità per il campo elettrico. Il campo elettrico sia reale monocromatico e con fase φE : ˜ = Ē eiωt+iφE Ē 0 e si sceglie per semplicità φE = 0, questo perché l’obiettivo del conto è mostrare come sono legate la fase della corrente che si induce nel metallo per effetto di un campo esterno con la fase del campo stesso che viene per questo posta uguale a zero. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 86 Si può scrivere la corrente in condizioni di regime (cioè si applica un campo in alternata e si aspetta un tempo sufficientemente lungo tale per cui la corrente nel filo si mette ad oscillare alla stessa frequenza), che ha fase φJ , come: ˜ = |σ̃|eiφσ Ē eiωt ¯ = J¯0 eiωt eiφJ = (σ1 + iσ2 )Ē J˜ 0 posso quindi eliminare le parti temporali e scrivere che: J¯0 eiφJ = |σ̃|eiφσ Ē0 ⇒ φJ = φσ cioè quando si applica una corrente ad un circuito, la corrente ha una fase relativa rispetto a quella del campo (che può essere in anticipo o in ritardo) e questa fase relativa è determinata dalla fase della conducibilità intesa come grandezza complessa. Inoltre si sa che: q σ̃ = σ1 + iσ2 −→ |σ̃| = (σ1D )2 + (σ2D )2 = ωp2 τ si vede quindi che il modulo della conducibilità ottica di Drude è una costante. Inoltre si vede che: σ2 σD tan φσ = −→ 2D = ωτ σ1 σ1 facendo i limiti della tangente si trovano i limiti della fase cioè: 1 = Γ limite dissipativo τ 1 lim tan φσ = ∞ ⇒ ω = Γ limite induttivo ω→∞ τ lim tan φσ = 0 ⇒ ω < ω→0 (4.91) il primo limite significa che in continua la corrente è in fase col campo: per frequenze basse cioè per ω < τ1 il metallo si comporta come un resistore (la parte dissipativa è preponderante). Per il secondo limite si ha che φσ = π/2 cioè a frequenze molto alte ω τ1 = Γ la corrente che oscilla nel circuito è ortogonale al campo elettrico. Quando un circuito ha una corrente sfasata di π/2 in anticipo rispetto al campo si ha un circuito induttore, e questo implica nessuna dissipazione. Ecco spiegato come mai σ1 e σ2 si chiamano parte induttiva e parte resistiva: perché i nomi sono legati a quest’analisi di tipo circuitale. L’origine microscopica di ciò è la seguente: τ è il tempo fra due urti e si sa che la pulsazione è ω = 2πν = 2π T e questo significa che: 1 • nel limite induttivo 2π T τ ⇒ τ T cioè il tempo tra due urti è molto più grande del periodo di oscillazione del CEM, quindi il CEM oscilla molte volte prima che l’elettrone scatteri, e questo significa considerare l’elettrone come libero, quindi non c’è dissipazione; • nel limite dissipativo il campo non riesce ad oscillare nemmeno una volta mentre l’elettrone ha già subito molti urti e quindi l’effetto del CEM è ridotto dal punto di vista dell’accelerazione che può generare sulle cariche. In figura 25 si vedono le parti reale e immaginaria degli indici di rifrazione di un sistema a elettroni liberi. Ricordando la formula (4.70): prima della frequenza 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 87 Figura 25: Dipendenza spettrale di n e κ per un sistema a elettroni liberi. Le regioni III e IV sono caratterizzate rispettivamente da alta riflettività (R) e trasmittività (T). di plasma dove la riflettività è alta e il sistema si comporta come un metallo, n diminuisce vicino alla frequenza di plasma ed esplode per basse frequenze, che significa altissima riflettività. La parte immaginaria è legata a σ1 cioè alla parte dissipativa del materiale dove una alta riflettività è dovuta alla combinazione di n e κ entrambi alti. Al di sopra della frequenza di plasma l’unica quantità che sopravvive è n e il materiale si comporta come se non ci fosse dissipazione, cioè come se si avesse un materiale isolante. Possiamo vedere in figura 26 la funzione dielettrica (relazioni 4.73) cioè 1 e 2 . La prima è una quantità grande e negativa e tende a divergere per ω → 0 mentre la seconda è definita positiva. Il campo all’interno di un metallo, come si sa, è nullo a causa delle cariche libere che schermano il materiale dal campo esterno disponendosi sulla superficie del conduttore. La 1 negativa rappresenta proprio questo: lo screening indotto delle cariche libere all’interno di un materiale metallico. Pensate a quando entrate in ascensore e non avete campo sul cellulare: le pareti metalliche dell’ascensore schermano il campo nei GHz delle frequenze telefoniche. Il campo interno che si crea in un metallo è uguale e opposto al campo esterno che l’ha indotto portando ad un campo totale nullo. Quindi 1 negativa grande significa proprio schermatura quasi perfetta dal campo elettrico esterno ed è una caratteristica tipica dei sistemi con elettroni liberi. Questa caratteristica si annulla alla frequenza di plasma, in cui il sistema perde la caratteristica metallica (gli elettroni non riescono più a seguire il campo forzante) e in pratica il metallo diventa un dielettrico. Le relazione della funzione dielettrica in funzione della conducibilità sono: σ2D (ω) ω D σ (ω) 1 D 2 (ω) = ω D 1 (ω) = 1 − (4.92) (4.93) Un dielettrico rimane sempre un dielettrico a prescindere dalla frequenza mentre 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 88 Figura 26: Dipendenza spettrale di 1 e 2 per un sistema metallico a elettroni liberi. Si noti la differenza di scala fra la parte positiva e negativa dell’asse delle ordinate: 1 è sempre più grande di 2 tranne che per ω → 0. un metallo diventa un dielettrico una volta superata la frequenza di plasma. Dal punto di vista del comportamento forzante del campo esterno la frequenza di plasma è legata all’inerzia, cioè alla massa delle particelle che devono oscillare per seguire il campo: a parità di numero di elettroni è la massa a fare la differenza sul valore della frequenza di plasma. Se gli elettroni fossero leggeri la ωp si sposterebbe a frequenze sempre più alte in quanto questi riuscirebbero così a seguire il campo forzante. In un metallo standard il numero di elettroni è sempre 1022 -1023 , quello che cambia un po’ è la massa. Esistono dei materiali chiamati heavy fermions che sono materiali metallici basati su uranici o terre rare (atomi con elettroni in orbitali di tipo f), e in questo caso gli elettroni di conduzione sono così pesanti che la loro massa relativa rispetto a quella dell’elettrone libero è 200-300 volte maggiore con un numero di portatori standard, ma a causa della massa degli elettroni hanno frequenza di plasma bassissima (queste cose sono fisica della materia condensata trattata negli anni 80’). 4.2.3 Transizioni interbanda e intrabanda e processo sperimentale Prima di riprendere la teoria della sezione d’urto e della matrice di scattering per luce visibile, così come è stato fatto per i neutroni termici si vuole discutere il collegamento fra le proprietà ottiche e la teoria a bande. Com’è noto, in fisica dello stato solido i materiali sono descritti in termini di bande elettroniche, che sono generate dalla sovrapposizione coerente degli orbitali semipieni in cui gli elettroni si trovano a partire dagli atomi componenti il metallo. Ad esempio le bande elettroniche più esterne dell’oro sono ottenibili dalla ibridizzazione degli orbitali 4s. Se si pensa (ed è vero) che tutte le proprietà di un sistema siano relative alle bande più esterne (vuote, piene o 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 89 Figura 27: Bande di un metallo: banda di conduzione (semipiena) fino all’energia di Fermi EF da cui si possono avere transizioni alla banda vuota superiore (transizioni interbanda) o transizioni al di sopra dell’energia di Fermi ma nella banda semipiena stessa (transizioni intrabanda). semipiene), un metallo è caratterizzato da una banda semipiena, e di sopra ci sarà almeno una banda vuota. La banda semipiena significa che si hanno tutti gli elettroni a temperatura nulla che riempiono questa banda fino all’energia di fermi EF (figura 27). Quando si parla di transizioni nel modello di Drude, ovvero di elettroni che si muovono liberi sollecitati dal CEM, considerando le bande elettroniche si sta parlando, di transizioni intrabanda, cioè transizioni diagonali all’interno della stessa banda in cui gli elettroni passano da valori di energia appena sotto EF ad appena sopra. Se invece si fornisce un’energia sufficiente si può portare un elettrone dalla banda semipiena alla banda vuota superiore tramite una transizione verticale chiamata transizione interbanda. Si può dire che le transizioni intrabanda rappresentano ciò che avviene nell’ambito del modello di Drude e quindi prima della frequenza di plasma, mentre le transizioni interbanda rappresentano ciò che avviene dopo la frequenza di Plasma, fuori dalla validità del modello di Drude. In figura 28 si vede, guardando l’argento, al di sotto della lunghezza d’onda corrispondente alla frequenza di plasma, che la riflettività risale per effetto proprio delle transizioni interbanda, cioè gli elettroni sono in grado di salire alla banda vuota superiore e riflettere frequenze più alte (la riflettività può arrivare anche al 20-30 %.) Se si potesse trasformare il metallo in un isolante eliminando tutti gli elettroni 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 90 Figura 28: Riflettività di oro argento e alluminio in funzione della lunghezza d’onda. liberi, ci si troverebbe solo con le transizioni interbanda tra la banda semipiena e quella vuota e non si avrebbe la parte di riflettività massima prima della frequenza di plasma che è legata alle transizioni all’interno della stessa banda. In realtà esistono molti materiali, specialmente gli ossidi dei metalli di transizione (esempio Ossido di Vanadio V O2 , V2 O3 ), che sono interessanti perché cambiando una variabile termodinamica come temperatura o pressione esterna subiscono una transizione di fase isolante-metallo o viceversa. Il V O2 , scoperto negli anni 50’, ha già delle applicazioni industriali: esso a temperatura ambiente è un isolante, aumentando la temperatura al di sopra di 340 K diventa un metallo. In gergo tecnico questo tipo di materiali vengono definiti termocromici e sono usati per sensori e telecamere infrarosse, anche a scopo militare, perché ingegnerizzando opportunamente la temperatura di transizione permette di visualizzare fonti di calore. Un’altra interessante applicazione permette di ottenere vetri in cui viene fatta scorrere corrente e che quindi si scaldano per effetto Joule e che tendono a oscurarsi quando la corrente supera un certo valore. Come detto, sperimentalmente si è in grado di misurare solo la riflettività, ma si vogliono ottenere informazioni microscopiche ottiche ed elettrodinamiche sul materiale che si sta studiando. Vogliamo vedere la procedura sperimentale per determinare alcune caratteristiche in un problema che sembra mal posto. Se si ha un metallo si può supporre che esso segua il modello di Drude: i valori di n e κ sono determinati solo dai parametri ωp e Γ che possono essere estratti fittando il valore della riflettività R misurata e ricostruire quindi qualunque funzione microscopica. Per fare un fit però è essenziale che il modello usato funzioni: l’estrazione di ωp e Γ è fortemente dipendente dal modello usato. Se si vuole usare un procedimento che sia model-indipendent si usa il seguente procedimento. La riflettività R si può scrivere come: R(ω) = r(ω) · r∗ (ω) = |ρ2 (ω)||eiθ(ω) | (4.94) dove r(ω) è detto coefficiente di Fresnel di riflessione che abbiamo scritto in forma complessa. Dato che R(ω) è dato dal rapporto fra l’intensità del campo riflesso e l’intensità del campo incidente, per definizione r(ω) è dato dal rapporto 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 91 fra il campo elettrico riflesso e quello incidente: r(ω) = ˜ (ω) Ē |ĒR | iφR R = e Ē0 |Ē0 | (4.95) Nella maggior parte dei casi, nelle misure ottiche, si misura l’intensità, non il campo. Misurando l’intensità, cioè i moduli quadri del campo elettrico si perde l’informazione sulla fase, quindi se si fosse in grado di misurare r(ω) in termini del suo modulo e della sua fase si potrebbero ricavare immediatamente n e κ dalla relazione: n − 1 + iκ (4.96) r(ω) = ρ(ω)eiθ(ω) = n + 1 + iκ però misurare i campi in fase e ampiezza è qualcosa di molto difficile, come detto in generale si misurano le intensità. Tuttavia ρ(ω) e θ(ω) ovvero il modulo e l’angolo di fase sono legate da relazioni di causa-effetto note come relazioni di dispersione di Kramers-Kronig: Z 2Γω ∞ ln ρ(ω 0 )dω 0 (4.97) θ(ω) = − π 0 (ω 0 )2 − ω 2 Matematicamente è tutto ben posto ma in realtà fisicamente si presenta un problema: la misura di riflettività si è in grado di farla non fino a valori infiniti di frequenza, bensì in una regione finita ed anche piuttosto limitata, cioè dal lontano IR al vicino UV (ben che vada). E’ quindi importante anche in questo caso il modello per l’estrapolazione dei valori sperimentali di riflettività per capire come essa si comporta quando ω → 0 e ω → ∞. La finitezza della misura influenza il grado di approssimazione con cui si è in grado di calcolare il precedente integrale e quindi l’errore che si commette nel trovare θ. Questo metodo quindi non è completamente model-indipendent, bensì è un compromesso fra un modello per la riflettività di un materiale e la capacità di fare misure in una regione più o meno estesa di frequenze. 4.2.4 Interazione con un gas di elettroni liberi Fin’ora abbiamo considerato un approccio fenomenologico, ma abbiamo perso il contatto con l’apparato matematico, cioè la funzione di scattering e la sezione d’urto, che è stato usato per lo scattering da neutroni termici e che vogliamo ora riprendere. Possiamo modellizzare un solido, in particolare un metallo come un gas di elettroni liberi all’interno di un reticolo di ioni. Il modello di Drude ci ha permesso di ricavare la permittività di un gas di elettroni liberi così come il modello di Lorentz ci consentirà di ricavare la permittività di un reticolo ionico. Unendo le due trattazioni potremo analizzare la risposta alla radiazione da parte di un metallo. Vogliamo ora mostrare che considerando l’interazione fra la radiazione elettromagnetica e un gas di elettroni liberi si può ottenere l’espressione della conducibilità ottenuta tramite il modello di Drude. Nel prossimo paragrafo verrà aggiunta l’interazione con un reticolo di ioni. Riscriviamo il termine dell’hamiltoniana per l’interazione radiazione-materia: Z 1 ¯ t) · Ā(r̄, t) Ĥint = − dr̄J(r̄, c 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 92 dove Ā è il potenziale vettore che descrive il CEM e J¯ è la densità di corrente microscopica che si genera per effetto del campo e che si scrive, in gauge di Coulomb: X ¯ t) = − e J(r̄, p̄i δ(r̄ − r̄i (t)) (4.98) m i L’hamiltoniana di interazione è fattorizzata al primo ordine in un elemento che dipende dal campo (il probe) per uno che dipende dalla corrente (il target) e quindi si può applicare il teorema della risposta lineare. Normalmente un esperimento ottico viene fatto, come mostrato in figura 20, prelevando la radiazione riflessa ad un angolo θ uguale a quello di incidenza in condizioni di incidenza quasi-normale θ < 10◦ . In una trattazione quantistica si mandano un certo numero di fotoni n ad energia ~ω e se ne prelevano con un detector un certo numero n0 alla stessa frequenza. Nel caso dei neutroni termici quando è stata calcolata la probabilità di transizione e quindi la sezione d’urto, si è calcolata la ∂ Ṗ /∂Ω∂ω, cioè una doppia derivata dovuta all’ipotesi che il probe, dopo l’interazione col target andasse in vari possibili stati finali caratterizzati da vettori finali compresi in Ω e Ω + dΩ ed energie possibili comprese fra ω e ω + dω. Si è partiti da una probabilità di transizione Ṗ (q̄, ω) e si sono considerati tutti i processi in cui il probe era distribuito nello spazio con una certa densità finale di stati e con frequenze diverse, in pratica si aveva la configurazione mostrata in figura 10. Ora, se la configurazione dell’esperimento è quella della figura 20, l’angolo di ricezione rimane fisso, e quindi in questo caso non serve la probabilità di transizione doppio differenziale bensì la probabilità di transizione per un angolo e una frequenza fissati. L’espressione è la seguente: Z Z X Ṗ (q̄, ω) = |Ā|2 dteiωt dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i αβ (4.99) dove la funzione di correlazione è quella corrente-corrente. Il potenziale vettore si scrive come in (4.32) quindi il prodotto scalare Ā · J¯ si riconduce al prodotto scalare del vettore di polarizzazione della luce per la cor¯ rente microscopica ¯ · J. L’obiettivo di questo conto è di far vedere, usando il campo elettrico al posto del potenziale vettore, qual è il limite di quest’espressione microscopica quando si usa il modello di Drude, cioè sotto quali condizioni la funzione di correlazione corrente-corrente si riconduce al modello di Drude ovvero, detto in altra maniera, far vedere a quale funzione di correlazione equivale il modello di Drude. Sapendo che il campo si scrive come Ē(r̄, t) = − 1c ∂∂tĀ si può scrivere: Ṗ (q̄, ω) = − c2 |Ē|2 ω2 Z dteiωt Z dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) X α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i αβ (4.100) Questo significa che l’elemento di matrice del potenziale vettore è semplicemente proporzionale all’elemento di matrice del campo elettrico. Questa probabilità di transizione descrive il sistema in cui il fotone arriva, viene assorbito, e il target transisce in uno stato proprio. In termini di bande il fotone arriva, viene assorbito, e un elettrone della banda semipiena passa in uno stato vuoto a più alta energia all’interno della stessa banda (transizione intrabanda). Si 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 93 ricorda che la Ṗ ha dimensione [t−1 ], allora la potenza dissipata dal campo elettromagnetico è definita come: Z Z X ~c2 W = ~ω Ṗ = − |Ē|2 dteiωt dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i ω αβ (4.101) che è l’energia nell’unità di tempo che il CEM perde a favore degli elettroni di target che transiscono intrabanda. La 1◦ legge microscopica di Ohm dice che la potenza dissipata dal campo in un conduttore è pari alla parte reale della conducibilità per il modulo quadro del campo elettrico cioè W = σ1 · |Ē|2 . Uguagliandola alla precedente si ottiene, semplificando il campo: Z Z X ~c2 iωt dte dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) α β hJ¯α (r̄1 , t)J¯β (r̄2 , 0)i (4.102) σ1 = − ω αβ cioè la parte reale della conducibilità ottica è legata alla trasformata di Fourier spazio-temporale della funzione di correlazione corrente-corrente. Per capire il senso di questa espressione si considera un gas di elettroni all’equilibrio termodinamico, in assenza di perturbazione e di corrente elettrica. Si manda un campo in continua (ma lo stesso vale per un campo in alternata), cioè un certo numero di fotoni alla frequenza ω che vengono assorbiti. Si generano nel materiale delle transizioni elettromagnetiche all’interno della stessa banda e quindi nasce una corrente elettrica per effetto di questo campo. La corrente ¯ 0̄, 0), e questa si propaga nel momento iniziale, in cui essa si "accende", è J( nel materiale. Per effetto degli urti tuttavia essa avrà una vita media finita, cioè se non la si continua a sollecitare con un campo esterno essa si "spegne". Il significato della funzione di correlazione sta proprio qui: essa descrive come sono correlati i valori della corrente in (0̄, 0) con quello in (r̄, t). Se la corrente continuasse a propagarsi a qualunque r̄ e per ogni tempo t, dividendo la fun¯ 0̄, 0) si avrebbe una corrente che non si annulla mai. zione di correlazione per J( Purtroppo i fenomeni di urto la fanno decadere e la funzione di correlazione assume il significato precedentemente descritto. La conducibilità ottica in questo senso è una misura nello spazio reciproco di come la corrente si correla a tempi e spazi diversi rispetto a quella generata a tempo e spazio iniziali. Usando l’espressione della TdF per la corrente, passando così dallo spazio reale a quello reciproco si ha: Z α ¯ (4.103) J (q̄, t) = dr̄1 e−iq̄ · r̄1 J¯α (r̄1 , t) Z J¯β (q̄, 0) = dr̄2 e−iq̄ · r̄2 J¯β (r̄2 , 0) (4.104) allora si può scrivere la funzione di correlazione nello spazio reciproco come: X hJ¯α (q̄, t)J¯β (q̄, 0)i = α ∗β hJ¯α J¯β i = hJ T (q̄, t)J T (q̄, 0)i (4.105) αβ la sommatoria è sul prodotto scalare della polarizzazione della luce per la corrente microscopica e poichè la luce è polarizzata trasversalmente, cioè i campi oscillano in un piano ortogonale alla direzione di propagazione, allora il prodotto scalare seleziona la componente trasversa della corrente, ed ecco spiegata la 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 94 scrittura della corrente con gli apici J T . Si suppone che gli stati degli elettroni liberi che si stanno considerando siano definiti da onde di Bloch caratterizzate dal vettore d’onda, quindi |ki i rappresenta lo stato iniziale e |kf i lo stato finale. La funzione di correlazione, per definizione, si scrive come: X hJ T (q̄, t)J T (q̄, 0)i = ρk̄i (T ) hki | J T (q̄, t)J T (q̄, 0) |ki i (4.106) k̄i cioè la somma sugli stati iniziali del valore di aspettazione del prodotto delle correnti microscopiche a tempi diversi con la popolazione degli stati iniziali ad una certa temperatura; dove ρk̄i (T ) è la popolazione termica degli stati caratterizzati da vettore d’onda k¯i , e questa quantità, avendo a che fare con degli elettroni è la distribuzione di Fermi-Dirac 1/(eβ(Eki −EF ) + 1). Questa distribuzione come si sa afferma in sostanza che lo stato di energia Ek̄i è occupato al massimo da due elettroni di spin opposto. Quindi si può scrivere la conducibilità reale nello spazio reciproco come: Z X ~c2 (4.107) dteiωt ρk̄i (T ) hki | J T (q̄, t)J T (q̄, 0) |ki i σ1 (q̄, ω) = ω k̄i Si suppone ora, per semplicità, di stare a temperatura T=0 e quindi ρk̄i (0) = 1, e per ottenere l’approssimazione di Drude si inserisce la relazione di chiusura P dello stato finale caratterizzato dal vettore d’onda |kf i cioè kf |kf i hkf | = 1. Si può scrivere quindi la relazione, equivalente alla precedente: Z X ~c2 σ1 (q̄, ω) = dteiωt hki | J T (q̄, t) |kf i hkf | J T (q̄, 0) |ki i (4.108) ω k̄i ,k̄f Considerando l’espressione della corrente (4.98) e la sua TdF, e usando le proprietà della funzione delta si può scrivere che: X ¯ t) = − e J(q̄, p̄i e−iq̄ · r̄i (t) (4.109) m i X ¯ 0) = − e J(q̄, p̄i e−iq̄ · r̄i (0) (4.110) m i Fin’ora non sono state fatte approssimazioni di alcun tipo eccetto il fatto di considerare la temperatura nulla. Si fa ora l’approssimazione di dipolo elettrico cioè si considera che la lunghezza d’onda del CEM sia estremamente più grande delle dimensioni dell’oggetto che sta assorbendo. Se si considera assorbimento di radiazione nell IR, o nel visibile, o anche nel UV, le lunghezze d’onda di radiazione sono estremamente più grandi rispetto alle dimensioni degli atomi che assorbono (qualche Å) che sono normalmente dell’ordine del raggio di Bohr ρ0 . Quindi se q̄ = 2π λ , e se r̄i è la coordinata dell’elettrone che sta assorbendo rispetto al suo nucleo atomico che posso stimare con il raggio di Bohr ρ0 , allora e−iq̄ · r̄i (t) ' e−iq̄ · ρ0 ∼ 1 e posso trascurare il termine in vettore d’onda. Questo significa che non vi è variazione spaziale del CEM (comandata dalla sua 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 95 lunghezza d’onda) rispetto alla dimensione dell’oggetto che assorbe, cioè il campo si può considerare uniforme sulle dimensioni spaziali degli atomi assorbenti. In realtà in maniera formale si può dimostrare che l’elemento di matrice dell’impulso è equivalente all’elemento di matrice del dipolo (da cui il nome dell’approssimazione). Nel nostro caso si parla della capacità di un elettrone libero di assorbire radiazione: la lunghezza caratteristica, che nel nostro caso va confrontata con la lunghezza d’onda, è il cammino libero medio l = vF τ dove vF è la velocità di Fermi mentre τ è il noto tempo medio fra due urti. Questa quantità in un metallo ultra puro, per quelli che vengono chiamati elettroni balistici può anche arrivare ad 1 mm, ma normalmente in un metallo qualsiasi a temperatura ambiente è dell’ordine dei 10 − 100 Å. Per questo la conducibilità ottica diventa indipendente dal vettore d’onda e rimane la dipendenza dalla frequenza mentre sparisce la componente spaziale del campo. Si usano le definizioni di corrente (4.109-110) e si può scrivere: Z X e2 ~c2 dt eiωt hki | p̄i (t) |kf i hkf | p̄i (0) |ki i (4.111) σ1 (ω) = 2 m ω i,ki ,kf e a questo punto si fa una nuova approssimazione, cioè che l’impulso del i-esimo elettrone al tempo t lo si possa scrivere come t p̄i (t) = p̄i (0)e− τ Si è fatta qui un’ipotesi su come l’impulso dell’elettrone eccitato dal campo dipenda dal tempo, cioè che decada in maniera esponenziale. Quest’ipotesi come vedremo corrisponde all’approssimazione di Drude, cioè l’andamento in frequenza ricavato nel modello di Drude in tutt’altro modo viene qui fuori da un’ipotesi sull’andamento esponenziale della funzione di correlazione attraverso gli impulsi degli elettroni che generano la corrente. Quindi si può scrivere: Z X t e2 ~c2 σ1 (ω) = 2 dt eiωt hki | p̄i (0) |kf i hkf | p̄i (0) |ki i e− τ (4.112) m ω i,ki ,kf inoltre si può dimostrare che vale la relazione: N= X i,ki ,kf ~c2 | hkf | p̄i |ki i |2 mω (4.113) che è il numero totale N di elettroni, che inserita nella (4.112) porta a scrivere: Z t N e2 σ1 (ω) = dt eiωt e− τ (4.114) m | {z } 1 1−iωτ L’integrale evidenziato è noto ed è pari alla funzione scritta sotto di esso. Il risultato finale è quindi: 2 Ne 1 σ1 (ω) = Re (4.115) m 1 − iωτ 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 96 si considera la parte reale visto che si stavano trattando grandezze complesse, cioè si è risolto un integrale di grandezze oscillanti complesse. Questa parte reale è pari a: N e2 1 (4.116) σ1 (ω) = m 1 + (ωτ )2 σdc che nel modello di Drude abbiamo scritto come σ1D (ω) = 1+(ωτ )2 . La dipendenza in frequenza della conducibilità ottica ricavata a partire dalla ma1 trice di scattering è esattamente quella di Drude, ovvero 1+(ωτ )2 è esattamente l’immagine di Fourier di una funzione di correlazione che decade esponenzialmente nel tempo. Il modello di Drude (che è completamente classico), equivale dal punto di vista della funzione di correlazione corrente-corrente (che è quella che entra nella definizione di conducibilità) a supporre che la corrente generata da un impulso elettromagnetico, sia una funzione che decade esponenzialmente − τt ¯ = J(0)e ¯ . Questo significa, ed è vero anche applicando un nel tempo: J(t) campo in continua, che se abbiamo un gas di elettroni questi accelerano per effetto del campo con quella che viene chiamata velocità di drift diretta parallelamente al campo. Questa velocità implica la corrente che, una volta spento il campo, decade secondo Drude nel modo che abbiamo visto. Questo modello è semplice ma importante in quanto rappresenta un ulteriore esempio di come funzionino le funzioni di correlazione nello spazio dei tempi: dato che le misure avvengono nello spazio reciproco anche le funzioni di correlazione sono di conseguenza misurate nello spazio reciproco, e si vuole sapere però come vanno nello spazio dei tempi come in questo caso in cui si conosce il decadimento esponenziale. Le funzioni di correlazione comandate dagli urti presentano solitamente decadimenti esponenziali. La situazione è quella di elettroni che si muovono disordinatamente e a cui viene imposto un ordine temporaneo: la corrente. Il tempo che il disordine impiega a "vincere" sull’ordine è esattamente il decadimento temporale della corrente. Sapendo che τ ∼ 10−12 10−15 s basta considerare tempi più lunghi del ps per non vedere gli effetti della corrente. 4.2.5 Interazione con un reticolo di ioni e Modello di Lorentz Dato un metallo abbiamo visto lo scattering di elettroni. Tuttavia anche gli ioni, fissi in prima approssimazione, hanno i loro gradi di libertà che sono quelli dati dai modi normali di vibrazione. Facendo interagire il CEM con un metallo, scegliendo opportunamente la frequenza è possibile misurare i modi vibrazionali degli ioni e non solo la risposta elettronica. Se invece di un metallo poi si ha un isolante, non si hanno cariche libere e di conseguenza è assente la risposta "tipo Drude" del metallo, e il CEM può interagire con i gradi di libertà vibrazionali o con le transizioni interbanda come accennato precedentemente. Riferendoci ora solo ai modi normali di vibrazione, l’equivalente semiclassico per gli ioni del modello di Drude è il modello di Lorentz. Questo modello si basa sull’equazione semiclassica che descrive l’interazione dello ione contraddistinto dalla coordinata r̄i (t) in grado di interagire col campo Ē(t): e d2 r̄i (t) 1 dr̄i (t) + + ω02 r̄i (t) = − Ē(t) (4.117) 2 dt τ dt m 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 97 che è semplicemente l’equazione di un oscillatore armonico forzato che è uguale a quella del modello di Drude a parte il termine in più ω02 r̄i (t) che significa che lo ione è attratto da un centro di forza rispetto al quale oscilla in maniera forzata con frequenza ω0 . Considerando che il campo elettrico è Ē(t) = Ē0 eiωt si può scrivere che in condizioni stazionarie r̄i (t) = r̄0i eiωt che messa dentro nell’equazione (4.117) permette di ricavare l’ampiezza di oscillazione r̄0i . Esattamente come fatto per Drude è possibile quindi ricavare il momento di dipolo, la polarizzabilità e la funzione dielettrica. Per la funzione dielettrica questa è pari a: ˜L (ω) = 1 + 1 4πN e2 m (ω02 − ω 2 ) + iω τ (4.118) con N numero degli ioni di massa m e carica e e questa espressione si riconduce a quella di Drude per ω0 = 0 (l’apice "L" indica che ora si stanno considerando grandezze nell’ambito del modello di Lorentz). Da questa si possono ricavare come si sa le parti reale e immaginaria, l’indice di rifrazione, la conducibilità ottica ecc ecc. In generale si può immaginare che, dato un cristallo di ioni più un gas di elettroni liberi (quindi un metallo), la funzione dielettrica più generale la si possa immaginare come somma di quella di Drude e quella di Lorentz: ˜ = 1 + ˜D + ˜L L’ipotesi sotto questo risultato è che i gradi di libertà di elettroni e nuclei siano non interagenti. Se il cristallo è molecolare possono aggiungersi altri gradi di libertà come quello interno vibrazionale della molecola. Stesso discorso vale per gradi di libertà magnetici ecc, ovviamente supponendo che valga una generalizzazione del principio adiabatico e cioè che i gradi di libertà non interagiscano fra di loro. Il conto teorico fatto partendo dalla matrice di scattering da cui si ricava il modello di Drude semiclassico può essere replicato per i gradi di libertà vibrazionali. Nello studio dell’interazione radiazione-materia, abbiamo visto i termini di emissione e assorbimento, e consideriamo ora solo quello di assorbimento, cioè il termine nell’espressione (4.51) proporzionale a n(ω). Inoltre nello studio della funzione di correlazione dell’operatore momento di dipolo, abbiamo potuto dividere la correlazione dovuta agli elettroni da quella dovuta ai nuclei con carica netta Qj 6= 0, che abbiamo precedentemente tralasciato. Consideriamo ora questo termine, che è il secondo addendo nell’espressione (4.56). Si può scrivere quindi che la probabilità di transizione doppio differenziale per l’assorbimento di fotoni dovuto ad un sistema di ioni è: Z X Qj Qj 0 ∂ 2 Ṗ ω = n(ω) dt e+iωt · ∂Ω∂ω ass (2π)2 ~c3 V 0 Mj Mj 0 (4.119) jj −iq̄ · R̄j (t) ∗ iq̄ · R̄j 0 (0) · he (p̄ (t) · ¯)(p̄ 0 (0) · ¯)e i j j con gli indici j e j’ che identificano gli ioni interagenti di carica netta e massa rispettivamente Qj , Mj e Qj 0 , Mj 0 , ed n(ω) che indica il numero di fotoni alla frequenza ω incidenti sul sistema. Nella funzione di correlazione si trovano i prodotti scalari dell’impulso degli ioni per la polarizzazione della luce e i soliti 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 98 esponenziali. Questo vale per un sistema ionico, ma non necessariamente per un cristallo. Se ora si considera anche un reticolo cristallino si hanno delle semplificazioni dovute alle proprietà di simmetria. In particolare si può scrivere l’indicizzazione come fatto per i neutroni: j → l, χ dove l è l’indice di cella (macroscopico) e χ è l’indice di posizione dello ione all’interno della cella e di solito vale pochi Å. La coordinata ionica la si può scrivere allora come già fatto nel caso dei neutroni come: R̄j (t) = x̄l + x̄χ + ūlχ (t) con ūlχ (t) spostamento istantaneo dalla posizione di equilibrio dello ione l, χ. Posso sostituire questa definizione nella (4.119) e trovare così: Z X Qχ Qχ0 ω ∂ 2 Ṗ = n(ω) dt e+iωt e−iq̄ · (x̄l −x̄l0 ) e−iq̄ · (x̄χ −x̄χ0 ) · ∂Ω∂ω ass (2π)2 ~c3 V 0 Mχ Mχ0 ll χχ0 · he−iq̄ · ūlχ (t) (p̄∗lχ (t) · ¯)(p̄l0 χ0 (0) · ¯)eiq̄ · ūl0 χ0 (0) i (4.120) le semplificazioni che possono essere fatte a questo punto, dovute all’approssimazione di dipolo sono: • le x̄χ rappresentano le coordinate microscopiche all’interno di una cella e quindi sono di un ordine di grandezza di qualche Å, mentre per la luce visibile si hanno lunghezze d’onda λ definite dalla relazione del vettore d’onda scambiato q̄ = 2π λ dell’ordine della centinaia di µm e quindi il prodotto scalare q̄ · (x̄χ − x̄χ0 ) è piccolo perciò si può approssimare e−iq̄ · (x̄χ −x̄χ0 ) ∼ 1 • si pongono gli esponenziali e−iq̄ · ūlχ (t) ∼ 1 e−iq̄ · ūl0 χ0 (0) ∼ 1 per lo stesso motivo precedente. Fatte queste semplificazioni si può quindi scrivere: Z ∂ 2 Ṗ ωn(ω) X Qχ Qχ0 = dt e+iωt e−iq̄ · (x̄l −x̄l0 ) h(p̄∗lχ (t) · ¯)(p̄l0 χ0 (0) · ¯)i ∂Ω∂ω ass (2π)2 ~c3 V 0 Mχ Mχ0 ll χχ0 (4.121) per concludere il conto si vuole vedere che tipo di risultati da la funzione di correlazione così modificata. L’impulso di uno ione al tempo t è dato da: p̄lχ (t) = Mχ ū˙ lχ (t) (4.122) e si sa che la posizione ūlχ (t) a meno delle costanti è proporzionale agli operatori di creazione e distruzione fononici cioè ūlχ (t) ∝ [ak̄j (t) + a†k̄ (t)] j 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 99 dove ak̄j (t) = ak̄j e a†k̄ (t) = a†k̄ e j −iωk̄j t +iωk̄j t j quindi dato che in funzione di correlazione si hanno i prodotti degli impulsi i quali a loro volta sono combinazioni lineari degli operatori a e a† si ottengono i soliti 4 termini haa + a† a + aa† + a† a† i dove l’unica cosa che cambia rispetto al caso già trattato è che qui si considera la derivata temporale ū˙ (quindi ci saranno i fattori dovuti alla derivata degli esponenziali nelle definizioni degli operatori). Dei 4 addendi come già detto sopravvivono solo quelli con operatori misti (il secondo e il terzo) relativi ad emissione ed assorbimento di un fonone. Se consideriamo l’assorbimento di fotoni si ha solo il termine di l’emissione fononica e quindi la funzione di correlazione che si considera è quella dovuta al termine ha† ai. Questo perchè la conservazione dell’energia suggerisce che l’unico processo con un senso fisico è quello in cui l’energia del fotone assorbito viene convertita in un quanto di popolazione fononica. Per cui la probabilità di assorbimento doppio differenziale descrive l’assorbimento di un fotone da parte di un reticolo di ioni e la conseguente creazione di un fonone all’interno del cristallo: X X ¯ · ē(q̄j , χ)Qχ 2 ~ωq̄j ω ∂ 2 Ṗ p = n(ω) (nq̄j + 1)δ(ω − ωq̄j ) 2 3 ∂Ω∂ω ass (2π) ~c V 2 Mχ χ j (4.123) Riassumendo si può scrivere che la probabilità di assorbimento è proporzionale al numero di fotoni inviati contro il sistema, la somma su tutte le branche fononiche, la delta che da la conservazione dell’energia (processo possibile se la pulsazione del fotone coincide con l’energia del modo normale di vibrazione in cui si crea un fonone), la distribuzione di Bose-Einstein nq̄j + 1 che mi dice appunto che è aumentata di una unità la popolazione fononica relativa alla branca j. Quello che cambia rispetto ai neutroni è la parte relativa al modulo quadro dell’elemento di matrice di transizione: in questo caso si ha il prodotto scalare della polarizzazione dell’onda elettromagnetica ¯ per la polarizzazione del modo normale di vibrazione ē. I passaggi fisici che avvengono sono i seguenti: il fotone arriva sul campione, viene assorbito, viene creata un’onda normale di vibrazione nel cristallo (cioè aumenta di 1 la popolazione fononica della branca j), essa si propaga lungo q̄ con polarizzazione longitudinale o trasversa a seconda di ē. Il prodotto scalare quindi seleziona solo i modi normali trasversi ottici. Nel caso dei neutroni invece si aveva q̄ · ē. In questo caso la luce è trasversa, cioè il CEM oscilla trasversalmente rispetto alla direzione di propagazione, e questo impedisce al modo di vibrazione che si propaga nella stessa direzione del fotone di oscillare longitudinalmente: questa rappresenta la regola di selezione dello scattering da campo elettromagnetico. Se il cristallo non è ionico ma neutro gli atomi non possono assorbire radiazione, cioè per avere assorbimento ci deve essere una carica netta diversa da zero. Puntualizziamo qui che quando si è parlato dei modi normali di vibrazione, in 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 100 Tabella 3: Schema dei modi osservabili a piccolo vettore d’onda con radiazione elettromagnetica Modi acustici Modi ottici trasversi longitudinali NO SI NO NO particolare dei modi ottici, non si deve confondere il nome "ottico" col fatto che ci sia assorbimento di CEM. Un cristallo con almeno due atomi per cella presenta modi ottici ma questo significa solo che avrà dei modi con una peculiare legge di dispersione e non che c’è effettivamente assorbimento ottico. Il silicio ad esempio ha modi ottici ma non assorbe radiazione elettromagnetica nel lontano IR perché la carica netta degli atomi è zero. Ma perché solo i modi ottici? Il diamante è quello che ha i fononi più energetici a circa 100 mV di energia: per questo tipo di energie dato che deve valere per la luce ~ω = ~ωphon ∼ 100 meV ' 1000 cm−1 il vettore d’onda scambiato corrispondente è |q̄| ∼ 105 cm−1 , mentre il vettore d’onda di Brillouin è π 8 −1 e questo significa che si sta guardando una piccola parte della a ∼ 10 cm prima zona di Brillouin attorno a q̄ = 0. Quindi vengono assorbiti fotoni di piccolo vettore d’onda. Si può dimostrare che i modi acustici con vettore d’onda piccolo sono costanti, cioè non dipendono dall’atomo. Ma come si muovono gli atomi all’interno della cella quando sono sottoposti a un modo normale di vibrazione ottico oppure acustico di piccolo vettore d’onda? Nel caso degli acustici gli atomi all’interno della cella sono sostanzialmente fermi e la cella si muove in fase con le celle vicine. Nel caso del modo ottico le celle non si muovono, e gli atomi all’interno della cella si muovono in controfase fra loro. Questa è la distinzione fra modi ottici e acustici a piccolo vettore d’onda, e nel caso in cui si si abbia un acustico il prodotto scalare nel modulo quadro è indipendente da χ e può essere fuori dalla sommatoria, quindi per 2 Q portato Q2 2 1 √ √ atomi la sommatoria diventa M + M che per la neutralità elettrica vale 1 2 zero, cioè la carica totale all’interno della cella deve essere conservata e dato che i due atomi all’interno della cella sono fermi, non c’è un momento di dipolo netto e quella quantità si annulla. Per questo i modi acustici trasversi non sono eccitabili dalla radiazione elettromagnetica: non c’è un momento di dipolo netto diverso da zero. I modi che hanno momento di dipolo netto diverso da zero sono gli ottici dato che gli atomi all’interno della cella si muovono in controfase fra loro. E’ possibile riassumere la discussione appena fatta per lo scattering da CEM nella tabella 3. Si ricorda che invece con i neutroni si può misurare tutto ad ogni vettore d’onda. Tuttavia l’esperienza di scattering da CEM la si può effettuare in qualunque laboratorio mentre per lo scattering da neutroni si ha bisogno di una sorgente di neutroni (un reattore nucleare). In figura 29 vediamo la riflettività del N d2 CuO4 , un cristallo che drogato opportunamente può diventare un superconduttore ad alta temperatura di transizione, e questo materiale è un isolante. Si può riconoscere il contributo fononico alla riflettività: se non ci fossero modi normali di vibrazione atti ad assorbire radiazione, cioè se si avesse un cristallo covalente, la riflettività sarebbe nulla, ma dato che questo cristallo è ionico si hanno contributi a frequenze abbastanza 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 101 Figura 29: Riflettività del cristallo di N d2 CuO4 ben definite, e quindi il cristallo si comporta come un filtro riflettore a frequenze specifiche. Ce ne sono 4 a causa della struttura del cristallo. Se dalla riflettività si usano le relazioni di Kramers-Kronig si trova ciò che è graficato in figura 30: la parte reale e immaginaria della funzione dielettrica. Si trovano 4 bei picchi di forma lorentiana che se fittati con il modello di Lorentz darebbero un perfetto accordo. Questo vuol dire che il modello di Lorentz è abbastanza buono per descrivere le vibrazioni atomiche all’interno del cristallo così come il modello di Drude è in grado di descrivere le eccitazioni elettroniche all’interno di un metallo. 4.2.6 La polarizzabilità Rifacendosi al solito schema probe-target, dove il probe in questo caso è costituito dal CEM che presenta vettore d’onda, frequenza e polarizzazione iniziali k̄i , ωi , ¯i prima dell’interazione, e vettore d’onda, frequenza e polarizzazione finali k̄f , ωf , ¯f ; lo scattering da radiazione elettromagnetica può essere diviso in scattering elastico e anelastico. Lo scattering elastico è il caso in cui |k̄i | = |k̄f | e ~ωi = ~ωf ed è analogo allo scattering Bragg nel caso dei neutroni. Lo scattering anelastico da radiazione elettromagnetica è caratterizzato da |k̄i | = 6 |k̄f | ed è ricco di fenomeni: - si ha lo scattering Brillouin quando ~ωi ' ~ωf , ovvero quando i fotoni vengono scatterati dalle variazioni di polarizzabilità indotte dai modi normali di vibrazione nel cristallo, cioè dalle fluttuazioni di densità del reticolo; - si ha lo scattering Raman quando ~ωi 6= ~ωf , ovvero quando i fotoni vengono scatterati dalle variazioni di polarizzabilità indotte dai moti rotovibrazionali delle molecole che compongono il reticolo. Si riconoscono anche in questo caso i processi Stokes (ωi > ωf ) e i processi anti-Stokes (ωi < ωf ). Si chiama scattering Compton quello in cui la radiazione è costituita da raggi x mentre per avere scattering nucleare (dell’interno dei nuclei) si usano fotoni al altissima energia detti fotoni γ. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 102 Figura 30: Parte reale e immaginaria della funzione dielttrica ˜(ω) del cristallo di N d2 CuO4 In ogni caso i fenomeni di assorbimento ed emissione, se esistono, sono di gran lunga preponderanti rispetto ai fenomeni di scattering. Detto in un altro modo, il termine al primo ordine dell’hamiltoniana di interazione lineare nel potenziale vettore H1 (Ā) è molto più grande sia di H1 (Ā2 ) che di H2 (Ā). Normalmente, fuori dai casi di risonanza, l’effetto del CEM sulla materia è quello di indurre un dipolo: un campo elettrico dal continuo a frequenze via via crescenti può distorcere la distribuzione di carica all’interno del target: cariche di segno opposto subiscono forze di verso opposto dovute al campo e questo squilibrio di carica genera un dipolo indotto che si può sovrapporre, se esiste, al dipolo permanente del sistema (che di solito è molto più intenso per i campi elettrici medi a disposizione di quello indotto). Normalmente, per fonti elettromagnetiche comuni da laboratorio si hanno 1010 1012 fotoni per unità di frequenza e campi dell’ordine di 1 V /cm, mentre i campi magnetici sono molto più bassi di quello del pianeta che è di circa mezzo gauss. L’atomo di idrogeno nel suo stato fondamentale genera un campo magnetico di circa mezzo tesla cioè circa 105 gauss e un campo elettrico generato dall’elettrone alla distanza del raggio di Bohr di 1 V /Å, quindi campi elettrici e magnetici della materia sono solitamente molto più grandi di quelli generati dal probe. Tuttavia esistono sorgenti laser così intense da non far avere spettroscopia lineare bensì non-lineare, con risposte del sistema che vanno studiate ad ordini superiori della teoria delle perturbazioni. Dal punto di vista semiclassico, se si ha un campo elettrico associato ad un segnale luminoso o in continua, e lo si applica ad un sistema condensato chiedendosi quale dipolo si genera per effetto di questo campo, si usa la seguente 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 103 Figura 31: Molecola biatomica orientata lungo x e con origine centrata sul baricentro della molecola relazione: ¯ Ē d¯ = ᾱ (4.124) ¯ è il tensore polarizzabilità. Questo tensore è una caratteristica del dove ᾱ sistema su cui si sta applicando il campo: ad esempio per una molecola biatomica orientata come in figura 31 esso ha la forma diagonale αx ¯= αz ᾱ αz e con αx > αy , αz e αy = αz in quanto la carica è prevalentemente distribuita lungo x. In sostanza il tensore polarizzabilità descrive quanto il sistema si distorce per effetto del campo ed è al primo ordine indipendente da esso. Quindi si può dire che la simmetria del sistema influenza fortemente il tensore polarizzabilità: per un sistema triclino (bassa simmetria) si avranno tutte le componenti del tensore diverse mentre per un cubico (alta simmetria) si avrà un tensore diagonale a componenti uguali. Consideriamo ora un oggetto che vibra e ruota: ci si può aspettare che i moti interni influenzino il tensore polarizzabilità, cioè che esso sia funzione del modo rotazionale e vibrazionale della molecola. Nel caso della nostra molecola biatomica il moto vibratorio avviene lungo l’asse x ed è quindi unidimensionale, e in effetti esso modifica la distribuzione di carica. Anche quando la molecola ruota avvengono modificazioni della distribuzione di carica a causa di effetti centrifughi che portano la distribuzione di carica a gonfiarsi. In generale il tensore polarizzabilità è funzione sia della frequenza di rotazione che di quella vibrazionale della molecola. Si può scrivere infatti come, nel caso della molecola biatomica che vibra in maniera armonica e ruota come un rotatore libero: ¯ ¯ ∂ ᾱ ∂ ᾱ ¯ (ωV , ωR ) = ᾱ ¯0 + ᾱ sin ωV t + sin 2ωR t (4.125) ∂ R̄ R̄=R̄eq ∂ R̄ R̄=R̄eq ¯ 0 è il tensore polarizzabilità in condizioni di equilibrio (senza vibrazioni e dove ᾱ rotazioni) mentre le derivate parziali rispetto alle coordinate delle cariche all’equilibrio indicano rispettivamente l’intensità dei moti rotovibrazionali e infine il 2 nel seno della frequenza rotazionale è dovuto al fatto che si considera solo mezzo ciclo di rotazione in quanto la molecola ruotata di 180◦ subisce la stessa deformazione di quella nella posizione iniziale poichè le lunghezze d’onda del 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 104 campo nel visibile (che sia in continua o in alternata) sono molto molto più grandi della distanza fra gli atomi (500 nm contro 1 Å) e quindi non vedono la rotazione. Supponiamo ora di voler calcolare il momento di dipolo e supponiamo un campo elettrico monocromatico del tipo Ē = Ē0 sin ωt. Il momento di dipolo allora è: ¯ Ē = Ē0 sin ωt[ᾱ ¯ 0 + ᾱ ¯ V sin ωV t + ᾱ ¯ R sin 2ωR t] d¯ = ᾱ (4.126) da cui usando le formule di prostaferesi si ottiene: 1 ¯ ωV , ωR ) = ᾱ ¯ V [cos(ω − ωV )t + cos(ω + ωV )t] + ¯ Ē sin ωt + Ē0 ᾱ d(ω, } 2 | 0 0{z {z } | 1 2 1 ¯ R [cos(ω − 2ωR )t + cos(ω + 2ωR )t] + Ē0 ᾱ {z } |2 (4.127) 3 quindi il momento di dipolo che si genera come risposta all’applicazione del campo oscilla secondo 3 termini: 1 termine dovuto alla frequenza del campo esterno ω o della forzante con ¯0; un’ampiezza determinata da ᾱ 2 termine legato distorsione della carica dovuta alla vibrazione, che si divide in processi stokes e anti-stokes sono sfasati di 90◦ rispetto al campo (perché il coseno è sfasato di 90◦ rispetto al seno) ed oscillano a frequenze ω − ωV e ω + ωV ; 3 termine diviso anch’esso in stokes e anti-stokes, relativo alla distorsione della carica per rotazione. Le componenti sono sfasate anch’esse in fase di 90◦ , ed oscillano a frequenze ω − 2ωR e ω + 2ωR . Sempre classicamente, quando si ha un dipolo oscillante nel tempo che esso emette della radiazione con intensità proporzionale al modulo quadro della derivata seconda del dipolo cioè: ¨¯ 2 I ∝ |d| (4.128) e questa si chiama legge di Hertz. Nel momento in cui il dipolo si crea per effetto del campo esterno, e sono presenti moti propri dell’oggetto che si sta distorcendo, si generano come visto almeno tre componenti di dipolo che emettono a frequenze distinte. Ovviamente deve valere che ω > ωV , 2ωR perché siano eccitati dei livelli rotovibrazionali. Sapendo che le frequenze vibrazionali delle molecole si trovano nel medio IR (1000 cm−1 ) si devono usare sorgenti laser di frequenza maggiore perché valgano le precedenti relazioni. Classicamente i pesi dei processi Stokes e anti-Stokes sono uguali, cioè probabilità di emissione e assorbimento sono uguali. A livello quantistico ci si aspetta che i due processi siano uguali solo se KB T > ~ωV cioè se i livelli vibrazionali eccitati della molecola sono molto popolati. Ad esempio per la molecola di idrogeno H2 vale che ~ωH2 ' 4000 cm−1 alla temperatura di 300 K (∼ 200 cm−1 ) il primo livello eccitato praticamente è vuoto (si applica la statistica di Boltzmann), cioè tutte le molecole di idrogeno di un gas a temperatura ambiente si 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 105 Figura 32: Livelli energetici rotazionali sovrapposti a quelli vibrazionali per la molecola di H2 . trovano nello stato fondamentale. A temperature molto alte il processo antiStokes inizia ad essere rilevante. Quindi tanto è più alta la frequenza che si vuole rilevare, tanto più vive solo il processo Stokes. Valutando la differenza di area fra i picchi Stokes e anti-Stokes si possono fare quindi misure di temperatura. Lo stesso discorso vale per i processi rotazionali. Il primo passo verso la meccanica quantistica si fa considerando le ben note relazioni per l’energia vibrazionale e rotazionale: 1 EV = ~ωV (v + ) 2 ER = BJ(J + 1) (4.129) (4.130) dove v indica il numero quantico vibrazionale, B è la costante rotazionale e J è numero quantico del livello energetico rotazionale e si può vedere in figura 32 la disposizione di questi livelli. Facciamo un esempio: si consideri un gas di H2 su cui viene inviata una radiazione di frequenza ω che viene raccolta ad un angolo definito. Facendo uno scanning in frequenza si trovano un picco in zero che consiste nei fotoni elastici che escono quindi con la stessa energia del campo forzante, e secondo le scale energetiche i primi fotoni anelastici che si trovano sono quelli dovuti ai moti rotazionali delle molecole (BH2 ' 40 cm−1 ) e successivamente, molto più distanti si trovano le righe vibrazionali. L’esperimento con il relativo spettro è schematizzato in figura 33. Ovviamente le righe anelastiche saranno molteplici: ad esempio per quelle rotazionali si trova una prima riga a distanza B, una seconda a distanza 2B, una terza a distanza 6B per J = 0, 1, 2 ecc. con pesi che dipendono quantisticamente dalla popolazione dei diversi livelli. L’idrogeno che è una molecola biatomica omonucleare non ha spettro di assorbimento, perché? Perché non ha un dipolo. Se si prende una molecola biatomica eteronucleare come ad esempio HCl, essa ha un momento di dipolo permanente in quanto la distribuzione di carica è asimmetrica rispetto al centro di forza e vogliamo far vedere che a seconda che si considerino i processi di scattering o di assorbimento le frequenze rotazionali si dispongono in maniera diversa. Per eccitare il primo livello vibrazionale di que- 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 106 Figura 33: Spettro schematico di un gas di H2 . sta molecola bisogna scegliere una radiazione opportuna tale che la frequenza di eccitazione sia in risonanza (quindi quasi uguale) alla frequenza caratteristica del primo livello vibrazionale della molecola cioè ~ωV =1 ' 1000 cm−1 , che è una frequenza nell’infrarosso. Se però si sceglie un laser nel visibile, ad esempio nel rosso a 16000 cm−1 , allora non esiste un processo in meccanica quantistica che possa permettere l’assorbimento del fotone a tale frequenza e quindi questo fotone sarà scatterato. Esso fornisce comunque la frequenza vibrazionale ma la differenza con l’assorbimento è che il fotone sopravvive, questo cosa significa in termini di livelli energetici rotazionali? Basta vedere le regole di selezione rotazionali: nel caso dell’assorbimento infatti, visto che il momento angolare totale deve conservarsi e che l’unico momento angolare del fotone è legato solo allo spin che può essere ±1, e dato che dopo l’assorbimento non si ha nessun fotone deve valere che: ∆Jass = ±1 (4.131) nel caso dello scattering invece il fotone sopravvive al processo e le regole di selezione rotazionali cambiano, esse saranno infatti: ∆Jscatt = 0, ±2 (4.132) infatti in questo caso il fotone può arrivare con spin 1(-1) e uscire con spin 1(-1) per cui la differenza sarà 0, oppure può arrivare con spin 1(-1) e uscire cone spin -1(1) e la differenza sarà 2(-2). In questo senso le frequenze rotazionali intorno alla riga elastica si dispongono diversamente rispetto ai processi di assorbimento. 4.3 Scattering da campo elettromagnetico Nella sezione interazione radiazione-materia abbiamo visto che trattando il CEM tramite il potenziale vettore Ā abbiamo considerato due termini della matrice di scattering entrambi al primo ordine e con dipendenza rispettivamente lineare e quadratica dal potenziale vettore. Aggiungiamo ora, per la prima volta un termine al secondo ordine della matrice di scattering con dipendenza lineare da Ā. Scriviamo qui il termine al primo ordine con dipendenza quadratica e quello 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO al secondo ordine con dipendenza lineare dal potenziale vettore: Z 1 1 X qi2 2 S1 (Ā2 ) = − dr̄dt Ā (r̄, t)δ(r̄ − R̄ (t)) i ~ 2c2 i mi 2 Z 1 1 X qi qj S2 (Ā) = − dr̄1 dr̄2 dt1 dt2 · ~ 2c2 i,j mi mj n o · Tb p̄i · Ā(r̄1 , t1 )δ(r̄1 − R̄i (t1 )) p̄j · Ā(r̄2 , t2 )δ(r̄2 − R̄j (t2 )) 107 (4.133) (4.134) in particolare il termine (4.134) essendo al secondo ordine contiene un doppio integrale ma sopratutto l’operatore di ordinamento temporale di Dyson che ordina i prodotti della particella i-esima con il potenziale vettore secondo tempi crescenti, il tutto per rispettare il principio di causalità. Ricordiamo che il potenziale vettore si scrive nel modo seguente: r i 2~c2 X ¯k̄j h i(k̄ · r̄−ωk̄j t) −i(k̄j · r̄−ωk̄j t) ak̄j e j + a†k̄ e Ā(r̄, t) = √ j V ωk̄j k̄j dove gli elementi importanti sono la polarizzazione della luce ¯ e gli operatori di creazione e distruzione a† e a. Quando si tratta il problema della matrice di scattering ciò che si deve calcolare è l’elemento di matrice Ŝ fra lo stato finale e iniziale hf | Ŝ |ii (si ricorda che Ŝ applicato allo stato iniziale lo fa evolvere in un set di possibili stati finali che vengono proiettati su un singolo stato operatoriale). Consideriamo ora il termine S1 (Ā2 ). Dato che si inserisce il quadrato del potenziale vettore allora la somma degli operatori a† e a diventerà la somma dei quattro prodotti operatoriali aa, a† a, aa† , a† a† che verranno mediati rispetto a stati ad un numero definito di fotoni (la sorgente luminosa ha un numero di fotoni definito). Il primo e l’ultimo di questi prodotti daranno l’assorbimento e l’emissione a due fotoni, mentre i termini misti daranno lo scattering di fotoni. Calcoliamo l’elemento di matrice usando la (4.133), considerando al posto della carica e massa generica qi ed mi la carica e la massa dell’elettrone e ed m: 2 Z r 1 e 4π~c2 n ∗ 1 2 hf | Ŝ (Ā ) |ii = − ¯ ¯ dt eiωt · f ~ 2mc2 V ωi ωf i (4.135) Z −iq̄ · r̄ · dr̄ e htf | δ(r̄ − R̄(t)) |ti i dove n sono i fotoni che irradiano il campione e gli stati iniziale e finale sono |ii = |pi i |ti i e |f i = |pf i |tf i cioè i prodotti degli stati iniziale e finale di probe e target. Ricordando che la probabilità di transizione Ṗi→f si ottiene dal modulo quadro dell’elemento di matrice, facendo il modulo quadro della (4.135) si avranno 4 termini di polarizzazione e la funzione di correlazione delta-delta sommata su tutte le particelle (elettroni) che poi sarebbe la funzione di correlazione densità-densità. Quindi questo termine dal punto di vista della risposta, serve per sondare le fluttuazioni di densità del mezzo che è sottoposto ad irraggiamento luminoso. Questo ce lo potevamo aspettare in quanto si è partiti da una hamiltoniana fattorizzata in un prodotto di Ā2 per una delta (che rappresenta la risposta del 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 108 sistema alla sollecitazione da parte del CEM) che non può dare altro che una risposta sulle fluttuazioni di densità, proprio come si era trovato per i neutroni. La ragione fisica per cui mandando radiazione elettromagnetica non in risonanza col sistema si hanno fenomeni di scattering più deboli dell’assorbimento e dell’emissione (mentre se si è in condizione di risonanza i fenomeni di scattering saranno completamente cancellati dalla matrice al primo ordine lineare in Ā) è che la funzione di correlazione è la stessa usata per i neutroni cioè la correlazione densità-densità e lo scattering da luce visibile ha un vettore d’onda iniziale ed energia caratteristica (confrontato con i neutroni): ~ωiluce ∼ 2 eV |k̄i |luce ∼ 105 cm−1 ~ωineut ∼ 25 meV |k̄i |neut ∼ 108 cm−1 quindi facendo un esperimento di scattering con la luce nel visibile si vedono fluttuazioni su scale più grandi rispetto ai neutroni (circa 1000 Å contro distanza dell’ordine di 1 Å per i neutroni), e quindi tutte le fluttuazioni più piccole vengono mediate. Poi è vero che si possono vedere differenze di energie più grosse ma questo è dovuto alla relazione fra energia e frequenza della particella specifica (E = ~2 k 2 /2m per i neutroni e E = ~ω per i fotoni) e questo non fa una grande differenza rispetto alle fluttuazioni di densità. Quindi se avvengono fluttuazioni di densità macroscopiche nel mezzo che si sta studiando siamo in grado di vederle con la luce, altrimenti non si vede nulla. Gli integrali nelle formule sono ben definiti, ma a livello fisico funzionano a seconda della regione in q̄ e ω che si è in grado di vedere con la sonda che si sta usando. E’ possibile mostrare che il termine (4.134) da luogo anch’esso ai fenomeni: assorbimento ed emissione a due fotoni e scattering. Si può mostrare (ma non viene qui effettuato il conto) che lo si può riscrivere esattamente come viene scritta la (4.133). I due termini sono equivalenti dal punto di vista dell’intensità. Si riscrive qui la sezione d’urto doppio differenziale che si ottiene dalla somma dei termini (4.133) e (4.134) e contiene i fenomeni: • scattering elastico • scattering Brillouin (o quasi-elastico) • scattering Raman: - rotazionale - vibrazionale - fononico L’espressione della sezione d’urto ottenuta dal termine lineare e quadratico della matrice di scattering a dipendenza rispettivamente quadratica e lineare nel potenziale vettore è: ωi ωf3 X α β ∗γ ∗δ ∂σ 2 (q̄, ¯i , ¯f , ω) = f i f i · ∂Ω∂ω 2πc4 N αβ γδ · XZ dt eiωt Z j j dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) hααβ (r̄1 , t)αγδ (r̄2 , 0)i 0 jj 0 | {z Jαβγδ } (4.136) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 109 tutta la quantità evidenziata Jαβγδ è chiamata funzione di scattering. Come sappiamo la sezione d’urto doppio differenziale è legata alla probabilità di transizione doppio differenziale tramite il flusso di particelle del probe. La precedente scrittura tiene conto di un sistema di N particelle indicizzate da j e j 0 , c’è il solito integrale temporale, le polarizzazioni del fotone i e f prima e dopo lo scattering e infine α, β, γ, δ sono le componenti cartesiane. Inoltre se lo scattering è anelastico la pulsazioni iniziale e finale del fotone ωi ed ωf sono diverse fra loro. Se il processo è elastico la sezione d’urto allora va come ω 4 . L’ultima parte della formula è costituita dalla funzione di correlazione fra polarizzabilità, dove la polarizzabilità si scrive come: j j ααβ (r̄, t) = Pαβ δ(r̄ − R̄j (t)) (4.137) In generale il tensore polarizzabilità si scrive sempre come una parte intrinseca (la polarizzabilità intrinseca) per una parte baricentrale (la funzione delta), che poi sarebbe l’espressione del teorema di Born-Oppenheimer. Essa dipende dal tempo in quanto esistono i moti interni del sistema, che fanno si ad esempio che una molecola si gonfi e si sgonfi, cioè che cambi la distribuzione di carica e quindi la capacità di formare un dipolo indotto da un campo esterno. Tanto più il campo è vicino alla frequenza di risonanza del sistema, tanto più esso è in grado di forzare la molecola a distorcersi e creare un momento di dipolo. La polarizzabilità intrinseca si scrive nel modo seguente: # " X hej | dα |ej i hej | dβ |ej i hej | dβ |ej i hej | dα |ej i j 0 0 0 0 λ λ λ λ + (4.138) Pαβ (t) = E0 − Eλ − ~ωf E0 − Eλ − ~ωi λ quindi il tensore di polarizzabilità intrinseco è un oggetto che contiene i valori di aspettazione dell’operatore dipolo tra lo stato fondamentale |e0 i e un possibile stato eccitato elettronico |eλ i del sistema che si sta distorcendo per effetto del campo esterno. Il tensore dipende perciò da un doppio elemento di matrice dipolo-dipolo. L’espressione appena scritta, che ora ricaveremo in continua, cioè quando il campo esterno non dipende dalla frequenza, deriva dalla teoria delle perturbazioni al primo ordine. Anche la polarizzabilità intrinseca ha una dipendenza dal tempo, che è contentuta nelle funzioni d’onda elettroniche, dipendenti dal tempo per la presenza di moti interni che modulano la distanza nucleare: infatti le funzioni d’onda elettroniche dipendono in maniera parametrica dalla distanza nucleare delle cariche in approssimazione di Born-Oppenheimer (ovviamente tali moti interni non esistono nel caso di un atomo isolato). Supponiamo ora di essere in continua (ma vale lo stesso discorso in alternata), cioè di avere un campo elettrico costante; abbiamo visto che un dipolo indotto si scrive come: β d¯α (4.139) i = Pαβ (t)E ciò che vogliamo fare è arrivare a scrivere la (4.138) cioè dare una descrizione quanto-meccanica dell’effetto di distorsione di una molecola per la creazione di un dipolo. In generale quando si ha una perturbazione esterna un sistema fisico quantomeccanico subisce due effetti: uno è la modifica dell’energia del sistema (i livelli 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 110 energetici possono alzarsi o abbassarsi) e questo, se la perturbazione è abbastanza intensa, viene trattato al primo ordine della teoria delle perturbazioni; il secondo effetto della perturbazione è che anche le funzioni d’onda si modificano. Supponiamo che la perturbazione si possa scrivere come: V̂ = −d¯· Ē (4.140) se |e0 i è la funzione d’onda dello stato fondamentale del sistema con energia E0 e le |eλ i sono le funzioni d’onda eccitate con energie Eλ , esse si modificano tutte attraverso la perturbazione V̂ al primo ordine nel modo seguente: V̂ E0 −→ E00 = E0 + he0 | V̂ |e0 i X heλ | V̂ |e0 i V̂ |eλ i |e0 i −→ |e00 i = |e0 i + E0 − Eλ (4.141) (4.142) λ>0 Quindi il livello energetico perturbato si scrive come il livello imperturbato più l’elemento di matrice diagonale della perturbazione. La funzione d’onda che ha subito la perturbazione è la funzione d’onda imperturbata più la combinazione lineare di tutte le funzioni d’onda degli stati eccitati pesate con un termine di mixing che è dato dall’elemento di matrice non diagonale della perturbazione rispetto alle funzioni d’onda del sistema diviso la differenza di energia. A parità di elemento di matrice (diverso da zero), ciò che è fondamentale per "mischiare" le funzioni d’onda è che la differenza di energia al denominatore sia piccola. Se si vogliono mischiare livelli con energia troppo distante quella differenza sarà molto grande e quindi anche se l’elemento di matrice sarà diverso da zero, la perturbazione diventa poco efficace. Se il sistema in esame fosse un atomo, ad esempio l’atomo di idrogeno, la funzione d’onda fondamentale |e0 i sarebbe l’orbitale 1s mentre le funzioni d’onda dei livelli eccitati |eλ i sarebbero gli orbitali cioè 2s, 2p, 3s, 3p ecc. Quindi se volessimo calcolare la pertubazione per la funzione d’onda di un atomo di idrogeno dovremmo calcolare il valore: heλ | − d¯· Ē |1si E1s − Eλ vogliamo sapere che tipo di funzioni d’onda si mischiano insieme per dare un elemento di matrice diverso da zero. La risposta è basata su ragioni di simmetria (in fisica atomica è chiamato effetto Stark ). Infatti il campo elettrico esterno che nel caso di un atomo si accoppia con l’elettrone orbitante non permette di associare ad esempio i livelli 1s e 2s in quanto entrambi a simmetria sferica. Un atomo possiede la simmetria di parità (l’inversione) usata nelle regole di selezione atomiche, e quindi l’elemento di matrice è diverso se si accoppiano livelli con parità opposta, in pratica i p e gli f con gli orbitali s. Ora possiamo vedere che il momento di dipolo indotto dal campo esterno si calcola come elemento di matrice dell’operatore dipolo rispetto alle nuove funzioni d’onda pertubate. Ad esempio rispetto alle funzioni d’onda perturbate dello stato fondamentale il dipolo indotto sarà: d¯i = he00 | dˆ|e00 i (4.143) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 111 e mettendoci dentro l’espressione (4.142) si trova: ! ! X heλ | V̂ |e0 i X heλ | V̂ |e0 i ¯ ˆ ˆ di = he0 | d |e0 i + he0 | d | |eλ i i + h |eλ i | dˆ|e0 i + E0 − Eλ E0 − Eλ λ>0 λ>0 ! ! X heλ | V̂ |e0 i heλ0 | V̂ |e0 i |eλ0 i i |eλ i | dˆ| + h E − E E0 − Eλ0 0 λ 0 λλ (4.144) Ciò che abbiamo appena calcolato è il valore di aspettazione del momento di dipolo indotto rispetto alle nuove funzioni d’onda perturbate per effetto del campo elettrico esterno. Ci sono 4 termini: il primo rappresenta il dipolo intrinseco, cioè quello permanente dato che è calcolato rispetto agli stati imperturbati, poi ci sono i termini misti e infine il quarto termine, il quale sarà trascurabile in quanto già i termini misti che accoppiano lo stato fondamentale a quelli eccitati sono abbastanza piccoli. Possiamo scrivere infine per un generico dipolo indotto: d¯i = d¯perm + X he0 | dˆ|eλ i heλ | V̂ |e0 i + c.c. E0 − Eλ (4.145) λ Per un atomo qualunque il dipolo permanente vale zero (l’elemento di matrice è calcolato tra le stesse funzioni) per le stesse ragioni esposte precedentemente. Esso sarà diverso da zero quando le funzioni d’onda rispetto alle quali sto calcolando il momento di dipolo non hanno una parità definita: ad esempio la molecola di HCl presenta funzioni d’onda che sono 1s dell’idrogeno col 2p del cloro dalle quali si ottiene tramite LCAO (Linear Combination Atomic Orbitals) una funzione d’onda a parità indefinita; in questo caso fisicamente si vede che c’è una distribuzione di carica non omogenea che genera un momento di dipolo permanente. Per quanto riguarda i termini misti, ricordando che V̂ = −d¯· Ē, portando fuori il campo elettrico si ottiene quella che abbiamo visto essere la polarizzabilità intrinseca del sistema (4.138). Riassumendo possiamo dire che un oggetto può essere naturalmente già distorto dal punto di vista della distribuzione di carica elettrica (non negli atomi singoli) e in più si può aggiungere una ulteriore distorsione, il momento di dipolo indotto, dovuto dall’applicazione di un campo elettrico esterno che viene calcolata con la teoria delle perturbazioni al primo ordine. Facendo lo stesso conto per campi esterni in alternata compaiono nei denominatori ±~ω. Ciò che si può ulteriormente osservare è la simmetria sotto parità della polarizzabilità: la simmetria del dipolo sotto parità è negativa, cioè il dipolo cambia segno sotto parità, quindi accoppia funzioni d’onda con parità opposta, ma la polarizzabilità dipende dal quadrato del dipolo e se la parità è una grandezza definita allora la polarizzabilità non cambia segno sotto parità, accoppia funzioni d’onda con parità uguale. Quando vedremo lo scattering della luce fononico, cioè lo scattering da un cristallo, se questo possiede simmetria per inversione, allora i modi vibrazionali che l’assorbimento infrarosso può vedere nel cristallo sono diversi rispetto a quelli che si possono vedere con lo scattering Raman: perché le regole di selezione del dipolo (assorbimento ed emissione) o di scattering (polarizzabilità) sono opposte. Finchè il sistema presenta la simmetria per inversione ciò che vede il Raman è complementare a ciò che vede l’infrarosso. Se il sistema 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 112 Figura 34: Schema della geometria di un esperimento di scattering ha una bassa simmetria in cui non è presente l’inversione ciò che è IR attivo è anche Raman attivo e viceversa. Geometria di un esperimento di scattering Prima di vedere qualche esempio di molecole di cui studieremo la polarizzabilità vediamo come funziona la geometria di un esperimento di scattering. Si suppone che la molecola scatterante sia al centro del sistema di riferimento come in figura 34. Per definire la geometria di scattering bisogna conoscere come si propaga la luce incidente, cioè com’è fatto il vettore d’onda incidente della radiazione k̄i con energia ~ωi , sapendo che i fotoni andranno a modificare il vettore d’onda che diventerà quello finale k̄f . Supponiamo inoltre di conoscere perfettamente la polarizzazione iniziale ¯i . Vediamo un caso semplice: k̄i = (ki , 0, 0) x̂ ¯i = (0, 0, i ) ẑ k̄f = (0, kf , 0) ŷ ¯f = (0, 0, f ) ẑ quindi il fotone viene scatterato a 90◦ e la polarizzazione mantiene la stessa direzione iniziale. Un processo di questo tipo è detto processo completamente polarizzato in quanto la polarizzazione iniziale e quella finale sono uguali cioè ¯i = ¯f , diversamente il processo si dice depolarizzato e ovviamente il processo può essere elastico o anelastico. Per un oggetto scatterante rotondo (ad esempio un atomo) si ha un processo completamente polarizzato, mentre per una molecola biatomica la polarizzazione finale della radiazione dipende da come è disposto l’asse della molecola. Nel nostro esempio il vettore d’onda scambiato q̄ è: 1 1 q̄ = k̄i − k̄f = √ , − √ , 0 2 2 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 113 che si trova sulla diagonale del piano xy. Quindi la configurazione di scattering può essere di tipo elastico o anelastico, polarizzato o depolarizzato e i vettori d’onda possono dare scambio massimo quando sono l’uno l’opposto dell’altro cioè k̄i = −k̄f ottenendo così la configurazione di backscattering o scambio minimo quando sono uguali e si ha lo scattering in avanti, e poi tutti i casi di angoli intermedi compresi fra 0◦ e 180◦ . Sostanzialmente si ha la stessa configurazione geometrica che si aveva nel caso di scattering di neutroni, con la differenza che in questo caso c’è da tenere in conto anche la polarizzazione. Nel caso di una particella massiva non si parla di polarizzazione bensì di spin: per "polarizzare" particelle massive come i neutroni si usa un campo magnetico variabile che permetta lo spin-flip. Vediamo ora alcuni esempi. 4.3.1 Studio di un cristallo di atomi Si considera un cristallo di atomi, per cui la (4.137) che compare nella funzione di correlazione contenuta nella sezione d’urto (4.136) può essere riscritta seguendo lo schema di figura 7 della sezione 3.4: l’indice j che identifica le particelle che si distorcono può essere sostituito con due indici l, χ che fanno riferimento il primo ad un vettore macroscopico x̄l che indica la cella e il secondo ad un vettore microscopico x̄χ che identifica la posizione del singolo atomo all’interno della cella. Se poi si considerano anche gli spostamenti ūlχ (t) degli atomi dalla loro posizione di equilibrio, allora il vettore che identifica la posizione istantanea dell’atomo all’interno del solido R̄j (t) si può riscrivere come: R̄j (t) = x̄l + x̄χ + ūlχ (t) = R̄lχ (t) (4.146) e la polarizzabilità (4.137) diventa per un cristallo: X ααβ (r̄, t) = αχ δαβ δ(r̄ − R̄lχ (t)) (4.147) lχ dove la delta di Kronecher δαβ indica una matrice di polarizzabilità diagonale con componenti αχ che indicano la polarizzabilità del singolo atomo, ad esempio in un cristallo di NaCl si avrà la polarizzabilità del sodio αN a diversa da quella del cloro αCl . Quindi le matrici di polarizzabilità nel caso del solido di NaCl saranno del tipo: Na Cl α α αN a αCl Na = Cl = Na Cl α α Le componenti diagonali sono uguali fra loro in quanto abbiamo considerato un cristallo di atomi. Prendiamo ora un cristallo di molecole, ad esempio l’idrogeno solido che cristallizza sotto i 20 K in una fase esagonale. Per semplicità però immaginiamo che cristallizzi in una struttura cubica a facce centrate: su ogni spigolo e faccia del cubo vi sono quindi due atomi di idrogeno ovvero una molecola di H2 . Cosa otteniamo in questo caso per la matrice di polarizzabilità? Bisogna distinguere fra le molecole su spigoli e facce. Se ẑ è l’asse della molecola per entrambi i casi si ha: x x αH2 αH2 y=x y=x αH αH H2spigolo = H2centro = 2 2 z z αH2 αH2 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 114 Come si trasforma la funzione di correlazione polarizzabilità-polarizzabilità nel caso di un cristallo di atomi? La molecola ha gradi di libertà interni (rotazionale e vibrazionale) ma per gli atomi la distorsione non dipende dal tempo. Sostituendo la (4.146) nella funzione di scattering si ha per un cristallo di atomi potenzialmente diversi: '1 Jαβγδ = X }| {Z z 0 −iq̄ · (x̄l −x̄l0 ) −iq̄ · (x̄χ −x̄χ0 ) dt eiωt (αχ δαβ )(αχ δγδ ) · e e (4.148) ll0 χχ0 · he−iq̄ · ūlχ (t) e−iq̄ · ūl0 χ0 (0) i La sommatoria su jj’ ovviamente diventa una sommatoria su ll0 , χχ0 . Come già visto per i neutroni la trasformata di Fourier spaziale può essere scambiata con l’operazione di funzione di correlazione, cioè invece di calcolare l’integrale spaziale della funzione di correlazione è possibile calcolare la funzione di correlazione e portare fuori dall’integrale temporale i termini costanti e lasciando solo gli esponenziali dipendenti dal tempo in cui compare lo spostamento istantaneo. Questa è per ora un’espressione esatta. Bisogna ora definire quali sono le caratteristiche della luce che si vuole usare per il proprio esperimento di scattering. Nella maggior parte dei casi, in un normale laboratorio gli esperimenti di scattering si conducono con luce nel visibile. Il vettore d’onda nel visibile |k̄ilucevis | ' 105 cm−1 πa cioè molto più piccolo del passo reticolare che è al più dell’ordine di qualche Å, cosa non vera per i neutroni. Ciò significa che è possibile semplificare la precedente espressione esatta nel limite della luce visibile in quanto il vettore d’onda scambiato sarà al massimo q̄ = 2|k̄ilucevis | e il prodotto q̄ · (x̄χ − x̄χ0 ) vale 10−3 e l’esponenziale evidenziato nella (4.148) è approssimabile con 1 (cosa non fattibile con l’altro esponenziale in quanto i vettori x̄l , x̄l0 sono macroscopici). Ora si procede come con i neutroni, applicando cioè la relazione (3.78) data dal teorema operatoriale di Baker-Hausdorff: he−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0) i = e|− 2 Wχ (q){z e− 2 Wχ0 (q)} eh−iq̄ · ūlχ (t) eiq̄ · ūl0 χ0 (0)i 1 1 (4.149) 1 dove si hanno i fattori di Debye-Waller in cui Wχ ' h(q̄ · ū)2 i misura lo spostamento quadratico medio dell’atomo rispetto alla posizione di equilibrio pesato dal vettore d’onda scambiato, e li posso porre entrambi uguali a 1 per gli stessi ragionamenti precedenti sull’ordine di grandezza del vettore d’onda scambiato. Si può fare ora la stessa approssimazione già vista con i neutroni per la funzione di correlazione: 1 eh i = 1 + h i + h i 2 + · · · (4.150) 2 dove ci si ferma al primo ordine. Fin’ora è stato seguito lo stesso procedimento usato per i neutroni con la sola semplificazione di avere piccoli vettori d’onda perché si sta usando luce nel visibile. Ora come fatto per i neutroni discuteremo separatamente il termine costante per cui si aveva lo scattering di Bragg nel caso dei neutroni, e il termine di ordine uno per cui si avevano i processi stokes e anti-stokes. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 115 Termine di ordine 0 - scattering elastico Con il termine costante si ha lo scattering elastico. Sostituendo nella funzione di scattering si ottiene: X 0 Jαβγδ = e−iq̄ · (x̄l −x̄l0 ) (αχ αχ )δαβ δγδ δ(ω) (4.151) ll0 χχ0 le funzioni delta sono non nulle solo se gli indici sono α = β e γ = δ le quali dicono che entrambe le polarizzabilità microscopiche sono diagonali e anche la funzione delta dovuta all’integrale temporale deve essere ω = 0 dice che lo scattering è elastico (da questo punto di vista somiglia al Bragg). Nella formula generale della sezione d’urto la funzione di scattering appena scritta deve essere moltiplicata per la parte contenente le polarizzazioni. Visto che la polarizzabilità è diagonale le 4 componenti dei versori di polarizzazione saranno uguali a coppie per cui si ha che: X α ∗γ ∗γ α f · ¯i |2 (4.152) f i f i = |¯ αγ che significa che lo scattering è polarizzato, discorso già fatto precedentemente senza considerare formule matematiche ma solo la geometria del sistema. Infatti quel prodotto scalare è diverso da zero solo se polarizzazione finale e iniziale sono orientate nello stesso modo. In altri termini scegliendo una polarizzazione lineare, con un versore di polarizzazione a singola componente, necessariamente la polarizzazione finale deve essere la stessa di quella iniziale. Se il versore è a due componenti il prodotto scalare può essere diverso da zero con una modifica della polarizzazione finale. Normalmente però si sceglie la polarizzazione iniziale in base al target che si ha: se ad esempio il target è un gas di atomi che quindi non ha una direzione privilegiata della polarizzazione allora si può scegliere la direzione di polarizzazione iniziale a piacere; se invece il target è un cristallo si può scegliere una direzione particolare della polarizzazione incidente per avere informazioni sul sistema scatterante usando ad esempio in uscita un polarizzatore che selezioni solo una componente desiderata del vettore di polarizzazione. Si può così scoprire se il processo di scattering ha determinato o meno un cambiamento di polarizzazione della luce incidente. Il numero di fotoni scatterati per unità di frequenza e unità di angolo solido, se ρ è la densità del sistema e Ji è il numero di fotoni incidenti è la quantità che viene effetivamente misurata in un esperimento di scattering da radiazione luminosa, e vale: ∂2σ ∂ 2 J(q̄, ω) = Ji ρ (4.153) ∂Ω∂ω ∂Ω∂ω cioè la quantità di fotoni che vengono scatterati in una certa direzione definita dall’angolo solido Ω legato al vettore d’onda scambiato q̄ per unità di frequenza (e questo dice se sono elastici o anelastici). L’intensità delle righe che si osservano dipende propriamente da diverse quantità, ma in particolare dalla polarizzabilità del sistema. La polarizzazione quindi può far variare di poco l’intensità di alcune righe o può farne scomparire altre, ma l’entità delle righe dipende sopratutto dalla polarizzabilità del sistema. Analizziamo ora le risposte del sistema come fatto per i neutroni, considerando diversi sistemi target. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 4.3.2 116 Studio di un gas perfetto Nel caso di un gas di atomi rarefatto si considera solo l’energia cinetica del sistema. Nel dettaglio consideriamo oggetti rotondi senza gradi di libertà interni, dotati esclusivamente di energia cinetica. E’ possibile riscrivere la sezione d’urto tramite la funzione di scattering già usata per i neutroni, che si può dividere in parte self e parte distinct. Consideriamo la parte self per cui analizziamo la risposta di particelle non correlate, in quanto come detto si sta trattando un gas rarefatto di atomi in cui il potenziale tra le particelle viene trascurato. Si scrive allora: ωi ωf3 X α β ∗γ ∗δ 2 ∂2σ N f i f i |α| δαβ δγδ Ss (q̄, ω) = ∂Ω∂ω 2πc4 N (4.154) αβ γδ dove appunto Ss (q̄, ω) rappresenta la parte self della funzione di scattering. Come fatto nella sezione 3.2 per i neutroni si ipotizza la forma gaussiana della S-self: s M β − ω22q̄M2 β (4.155) Ss (q̄, ω) = e 2π q̄ 2 La S-self quindi determina sostanzialmente la grandezza (4.153) cioè la quantità di fotoni scatterati. Graficando questa quantità in funzione della frequenza e fissato il vettore d’onda scambiato (quindi fissata la direzione del detector) si trova il valore della sezione d’urto, proporzionale a sua volta alla S-self, cioè in ultima analisi la TdF spazio-temporale della funzione di correlazione della particella scatterata con sè stessa a tempi diversi. Essa è una curva gaussiana centrata in zero dove ω = 0 è il massimo di scattering che corrisponde al processo elastico e delle code a frequenza maggiore e minore che indicano i processi anelastici con guadagno o perdita di energia del fotone incidente a favore del sistema (figura 35 a). La differenza con i neutroni sta nella proprietà di polarizzazione della luce dovuP α te al prodotto scalare α α ¯f · ¯i e che il parametro d’urto b̂ che misurava f i = quanto i neutroni interagissero con la materia viene sostituito dalla polarizzabilità |α|2 . La grossa differenza fra neutroni termici e fotoni nel visibile, a parità di formule matematiche sta nella risoluzione, cioè nel vettore d’onda scambiato, come abbiamo già discusso in precedenza ciò è legato ai vettori d’onda peculiari di neutroni termici e fotoni nel visibile. Cambiando le due sonde spettroscopiche sono sensibile a distanze più piccole (neutroni) o più grosse (fotoni luminosi). Dal punto di vista dell’energia scambiata, i neutroni termici, se non fosse per l’apparato sperimentale grosso e costoso che necessitano per essere prodotti, danno luogo a esperimenti più "semplici". Consideriamo che in un gas di atomi a temperatura di 300 K gli atomi hanno energia termica media di 25 meV . I neutroni termici hanno energia tipica di 25 meV e in un processo completamente anelastico cedono quest’energia al sistema passando da 25 meV a 0. Nel caso di un fotone nel visibile l’energia tipica di un fotone nel verde è dell’ordine di 2.5 eV (1000 volte l’energia del neutrone), quindi in un processo completamente anelastico in cui l’atomo del gas si ferma e cede tutta la sua energia termica media al fotone, quest’ultimo sarà scatterato con una variazione di energia dello 0.001% ! Una quantità più difficile da rilevare rispetto al neutrone che cede 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 117 il 100% della sua energia. Perciò lo spettrometro che usa i fotoni dovrà avere una risoluzione decisamente maggiore rispetto a quello che usa neutroni termici. 4.3.3 Studio di un gas reale Se il sistema è correlato (gas reale o liquido) e quindi nell’hamiltoniana di tale sistema è compresa anche l’energia potenziale, dobbiamo scrivere la sezione d’urto nella sua forma estesa: Z XZ ωi ωf3 X α β ∗γ ∗δ 2 ∂2σ iωt = N |α| δ δ dt e dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) · αβ γδ f i f i ∂Ω∂ω 2πc4 N 0 jj αβ γδ · hδ(r̄1 − R̄j (t))δ(r̄2 − R̄j 0 (0))i (4.156) ricordandosi che scattering è: P j δ(r̄ − R̄j (t)) = ρ(r̄, t) è la densità, e che la funzione di Z S(q̄, ω) = dt eiωt Z dr̄1 dr̄2 e−iq̄ · (r̄1 −r̄2 ) hρ(r̄1 , t)ρ(r̄2 , 0)i si trova che: ωi ωf3 X α β ∗γ ∗δ 2 ∂2σ = N f i f i |α| δαβ δγδ S(q̄, ω) ∂Ω∂ω 2πc4 N (4.157) αβ γδ E’ la stessa trattazione svolta per i neutroni, in questo caso infatti non è possibile trascurare la correlazione fra le particelle. Tuttavia mentre con i neutroni era sempre possibile misurare la risposta coerente e quella incoerente distinguendo tra la risposta di densità del sistema e quella di singola particella, con i fotoni non è possibile fare ciò, quello che si misura infatti è la S(q̄, ω) totale. Calcolare la funzione di correlazione densità-densità è un problema numerico non banale: ci sono molte tecniche sviluppate recentemente per calcolare la funzione di correlazione densità-densità da principi più o meno fondamentali (c’è la LDA, la DFT ecc). Se l è il libero cammino medio degli atomi del sistema, supponendo che q̄ 1l e se τ è il tempo fra due urti, supponendo che il tempo di misura delle fluttuazioni sia t τ cioè vado a mediare su molti urti mi trovo in quello che viene chiamato regime idrodinamico; in queste condizioni si possono scrivere delle equazioni microscopiche per calcolare precisamente la funzione di correlazione densità-densità. Non lo dimostriamo (si trova il conto sulle dispense di Mazzacurati e un discorso più ampio sul testo Liquid State di Hansel-MacDonald ) e scriviamo direttamente l’espressione finale: 1 1 · S(q̄, ω) = V ρ2 kB T χT 1 − π γ 1 Γq 2 DT q 2 Γq 2 · + + 2γ (ω − vs q)2 + (Γq 2 )2 (ω + vs q)2 + (Γq 2 )2 ω 2 + (DT q 2 )2 (4.158) 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO (a) Intensità di fotoni scatterati da un gas ideale. 118 (b) Intensità di fotoni scatterati da un gas reale. Figura 35: Scattering di fotoni per un gas perfetto e un gas reale. a parte il fattore moltiplicativo iniziale si hanno tre termini lorenziani, centrati rispettivamente in ω = ±vs q e in ω = 0. I vari elementi dell’equazione sono: • ρ è la densità media del liquido; c • γ = cvp rapporto fra il calore specifico a pressione costante e a volume costante; • χT è la suscettività termica; • DT diffusività termica (il coefficiente di Einstein di diffusione); • vs velocità del suono nel liquido In questo caso il segnale che si misura restituisce tre contributi distinti che si possono vedere in figura 35 b: I picchi laterali sono sostanzialmente lo Stokes e l’Anti-stokes e si chiamano picchi di diffusione di Brillouin. Il picco centrale si chiama picco di diffusione di Rayleigh. Nel regime idrodinamico che può essere considerato "medio", le grandezze di scattering dipendono da parametri termodinamici (suscettività termica, calore specifico ecc). In generale cambiando il vettore d’onda scambiato cambia la larghezza a mezza altezza del picco centrale mentre i picchi di Brilluoin disperdono in maniera lineare con q̄: questi oggetti altro non sono che i fononi longitudinali del liquido (gli acustici, a meno di casi specifici). Misurando quindi in un certo numero di punti la frequenza di questi picchi al variare del vettore d’onda, è possibile ricavare una misura della velocità del suono nel materiale. Questo come visto è misurabile con i neutroni ma anche con i fotoni in quanto le fluttuazioni di densità implicano delle fluttuazioni delle proprietà dielettriche del mezzo e quindi della polarizzabilità, determinando proprietà di scattering diverse. La diffusione della luce quindi misura anche fluttuazioni di polarizzabilità generate da fluttuazioni di densità. Le onde sonore sono oggetti che si propagano e questo genera fluttuazioni di polarizzabilità che si propagano, che è indicato dal fatto che la frequenza del modo varia col vettore d’onda (c’è una dispersione spaziale). Il fatto che il picco centrale (che non si propaga) sia proporzionale al coefficiente di diffusione termica è legato alle fluttuazioni di densità indotte dalla temperatura cioè le fluttuazioni di calore. 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 119 Se γ = 1 cioè quando cp = cv tutta la funzione di scattering si annulla. I calori specifici a volume costante e pressione costante per i solidi e i liquidi si sono molto vicini, ma hanno la loro differenza, seppur piccola, è riferica alla compressione o all’espansione che è possibile applicare sul sistema. Se i calori specifici a pressione e volume costante sono uguali allora ci stiamo riferendo ad un caso ideale di un liquido perfettamente incomprimibile che pertanto non ammette fluttuazioni di densità, e la cui risposta ad un campo incidente non può che essere nulla. 4.3.4 Studio di un gas biatomico di molecole scorrelate: Raman vibrazionale e Raman Rotazionale Consideriamo ora un gas biatomico scorrelato. Che tipo di spettro di diffusione della luce ci si aspetta di vedere? Sappiamo che la polarizzabilità della molecola j si scrive come: j j ααβ = Pαβ δ(r̄ − R̄j (t)) ed è rappresentata da una matrice diagonale con elementi che dipendono dal tempo, in quanto condizionati da gradi di libertà interni vibrazionali e rotazionali. La sua capacità di distorsione quindi dipende fortemente da quanto la frequenza del campo eccitatore è vicina alle frequenze caratteristiche del sistema stesso. Classicamente abbiamo visto che la polarizzabilità la si può scrivere come un valore all’equilibrio più due fattori dipendenti dai coseni delle frequenze rotazionali e vibrazionali: ¯ (t) = ᾱ ¯ eq + ᾱ ¯ 0 cos(2ωR t) + ᾱ ¯ 00 cos(ωV t) ᾱ Quando si calcola la funzione di correlazione della polarizzabilità della molecola j j ¯ eq si ottiene lo con sè stessa hααβ αγδ i e si considera solo il termine all’equilibrio ᾱ stesso risultato che si avrebbe per un gas di atomi in quanto si sta considerando la molecola immobile e non rotante. Ci sono molecole (come quella di CO2 ) e in generale per oggetti particolarmente simmetrici, per cui il tensore di polarizzabilità è diagonalizzabile, cosa non vera per oggetti più complicati e in genere per sistemi a bassa simmetria, che quindi si portano dietro elementi fuori diagonale che dannoluogo a diversi effetti. ¯ ∂ ᾱ ¯ 0 = ∂R (R−Req ), è un oggetto La componente vibrazionale, ricordando che ᾱ Req che da contributi allo scattering legati alla possibilità di eccitare una vibrazione o di annullarla: il fotone che arriva cede parzialmente energia alla molecola, ad esempio facendole fare una transizione vibrazionale, e riparte con energia inferiore pari esattamente a un "quanto vibrazionale", oppure nel processo antistokes il fotone assorbe un quanto di energia vibrazionale da una molecola già eccitata ad un livello vibrazionale superiore al fondamentale e riparte con energia superiore di un quanto di vibrazione. Questi sono i processi di diffusione vibrazionali. L’oggetto rotazionale invece è legato a processi in cui il fotone fa fare una transizione rotazionale al sistema oppure assorbe un quanto di rotazione dalla molecola. Quindi possiamo riassumere i due termini chiamandoli Raman rotazionale e Raman vibrazionale. Quello che si osserva in un tipico spettro raman roto-vibrazionale è riportato in figura 36. Il picco di Rayleigh centrale è associato alla S-self ed esiste a prescindere che 4 SPETTROSCOPIA DA CAMPO ELETTROMAGNETICO 120 Figura 36: Spettro Raman roto-vibrazionale con relative regole di selezione. il gas sia molecolare o atomico. Le prime transizioni che si osservano poi sono quelle associate al creare o distruggere quanti di rotazione (cosa inesistente negli atomi). Il Raman rotazionale ha una regola di selezione, come abbiamo visto di ∆J = 0, ±2 e questo significa che se l’energia rotazionale è: ER (J) = BJ(J + 1) (4.159) per una transizione del tipo Ji → Ji + 2 ad esempio si ha: ∆ER (J) = B(Ji + 2)(Ji + 3) − BJi (Ji + 1) = 2(2BJi + 3) (4.160) che rappresenta il salto rotazionale. La regola di selezione per l’assorbimento è ∆J = ±1 che rende impossibile la transizione vibrazionale pura: in uno spettro rotovibrazionale d’assorbimento per una molecola eteroucleare, alla transizione vibrazionale si associa sempre uno spettro rotazionale. E’ possibile vedere la transizione vibrazionale pura per ∆J = 0 e ∆V = ±1 attorno alla quale è possibile vedere altre transizioni che vanno a comporre la rototransizione Raman. Se si ha un liquido, e quindi c’è un qualche tipo di correlazione, la rotazione è presente? In un mezzo di molecole eteronucleuari il potenziale di orientazione dipende dall’orientazione rispettiva dei dipoli, e le rotazioni non sono più libere, in quanto devono rispettare precise posizioni dovute al principio di minima energia. Si hanno al più delle librazioni ovvero delle oscillazioni attorno a un asse preferenziale. Per molecole omonucleari prive di momento di dipolo invece, entrano in gioco i quadrupoli, cioè l’accoppiamento di molecole con i secondi vicini che però è molto più debole e meno selettivo rispetto all’approssimazione di dipolo, e quindi le molecole possono ruotare abbastanza liberamente (azoto e idrogeno liquidi presentano uno spettro rotazionale abbastanza definito). 5 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 121 Applicazioni Biologiche della spettroscopia IR Vogliamo ora vedere alcune applicazioni della spettroscopia IR e THz nei campi della biologia e della biofisica. Da fenomeni di assorbimento di fotoni da parte della materia abbiamo visto che si possono dedurre alcune informazioni importanti sul sistema target, in particolare per un cristallo le interazioni principali avvengono con gli stati vibrazionali. Lo stesso principio è enormemente applicato per sistemi molecolari: le vibrazioni molecolari di cui si parla cadono nell’IR e riguaradano molecole biatomiche eteronucleari a strutture molto più complesse (proteine, DNA ecc), ma questo passaggio non implica una notevole complicazione del problema poichè, di fatto, ciò che si misura sono le vibrazioni di singoli gruppi chimici costituenti la molecola. I gruppi chimici costituiscono in sostanza "l’impronta digitale" di una molecola. Infatti lo spettro IR di una molecola (ad esempio l’etanolo in figura 37) Figura 37: Spettro IR della molecola di etanolo. è come la fotografia della stessa attraverso l’individuazione dei gruppi chimici che la compongono e che danno luogo ognuno ad assorbimento ad una diversa frequenza. Questo è particolarmente importante nell’ambito della biologia in quanto ad oggi si è in grado di registrare lo spettro IR di cellule e tessuti, anche in vivo (comportamento di una cellula sottoposta ad un farmaco, cellula in fase riproduttiva, pelle, ecc.). Un farmaco ad esempio interviene di solito su specifici legami chimici, e quindi registrando il cambiamento nella molecola o nella cellula di tali legami e gruppi è possibile risalire al meccanismo d’azione del farmaco. Si possono riassumere i vantaggi di questa tecnica per la biologia: • informazioni di livello molecolare; • quasi ogni gruppo chimico ha una specifica banda IR; • alta sensibilità (viene rilevato persino il debole legame a idrogeno); • tecnica non distruttiva/non ionizzante. I problemi invece possono essere riassunti dicendo che: • solitamente i tessuti biologici sono in soluzione acquosa, e l’acqua è un fortissimo assorbitore di radiazione IR; • gli spettri sono molto complicati: per oggetti complessi spesso le bande di assorbimento si sovrappongono e sono difficili da distinguere. 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 122 Figura 38: La parte di spettro elettromagnetico in cui lavora la spettroscopia IR. L’unità di misura principale della spettroscopia IR è il numero d’onda che si misura in cm−1 le cui conversioni sono: 200 cm−1 = 300 K = 25 meV = 50 µm = 7 T Hz Dato l’infrarosso, che normalmente si trova nella regione spettrale fra le microonde e il visibile, può essere suddiviso in sotto regioni specifiche: THz la regione THz è quella davvero vicina alle microonde, e si parla di frequenze < 100 cm−1 (vale che 1 THz=33 cm−1 ). In questa regione cadono i modi collettivi delle macromolecole; MIR la regione mid-infrared è quella compresa fra qualche centinaio di cm−1 e 4000-5000 cm−1 . In questa regione cadono le vibrazioni intra molecolari; NIR la regione near-infrared va da 5000 cm−1 fino al visibile (il colore rosso ha una frequenza di 15800 cm−1 ). In questa regione cadono gli ipertoni, cioè più vibrazioni che vengono eccitate contemporaneamente oppure le bande di combinazione. queste nozioni sono riassunte in figura 38. Buona parte dei sistemi di riconoscimento (telecamere a infrarossi ecc) lavora nella zona NIR a causa della maggiore lunghezza di penetrazione delle onde, anche se gli spettri del vicino IR sono molto più complicati da spiegare essendo generati da overtones e combinazione di bande vibrazionali. Quello che viene normalmente misurato è lo spettro di trasmissione di un materiale, che definisce la trasmittanza (che abbiamo trattato nella sezione 4.2.2). Questa quantità macroscopica è: T (ω) = IT (ω) I0 (ω) ed è legata al coefficiente di assorbimento, quantità microscopica: 1 α(ω) = − log T (ω) δ 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 123 Figura 39: Spettri di trasmissione: lo spettro in alto mostra l’intensità della luce trasmessa (rosso) e quella incidente (blu), mentre lo spettro verde in basso rappresenta la trasmittanza. dove δ è lo spessore del target nella direzione di propagazione della radiazione. In figura 39 si vedono gli spettri relativi alla trasmittanza: le scale sono "da chimici" (frequenze alte a sinistra) e mostrano rispettivamente quello in alto lo spettro di riferimento incidente I0 assieme allo spettro trasmesso IT che mostra le linee di trasmissione. Il rapporto fra i due spettri in alto da luogo alla trasmittanza (riga verde): in regione di alta frequenza si vede che il sistema trasmette 1 (cioè è trasparente) e poi cominciano ad esserci delle righe profonde che dicono che in quelle zone specifiche il sistema non è trasparente. Quindi i "buchi" nella trasmittanza definiscono le righe di assorbimento specifiche del materiale; facendo il logaritmo si ottengono dei picchi che rappresentano il coefficiente di assorbimento. Che tipo di vibrazioni ci si aspetta di misurare? Se si ha una molecola con n atomi, i gradi di libertà vibrazionali a seconda che la molecola sia lineare o non-lineare sono: Gradi di libertà molecola lineare 3n − 5 Gradi di libertà molecola non-lineare 3n − 6 Quindi ad esempio l’acqua che è una molecola triatomica non-lineare mostra 3 gradi di libertà vibrazionali che sono mostrati in figura 40. In particolare si ha: Stretching simmetrico: allungamento e contrazione dei legami fra gli atomi: può essere simmetrico quando gli atomi si allontano e si avvicinano fra loro insieme, in cui la molecola si gonfia e si sgonfia (breathing "il respiro" della molecola). Questo moto non altera la configurazione di carica e quindi non introduce un dipolo nel sistema e quindi è difficile che possa assorbire radiazione infrarossa; Stretching asimmetrico: la forma della molecola cambia completamente; Bending o scissoring: cambia l’angolo fra i legami. 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 124 Figura 40: Gradi di libertà vibrazionali di una molecola di H2 O. Figura 41: Moti vibrazionali per la molecola di CO2 (riquadro in alto) e per il gruppo chimico CH2 con relative frequenze caratteristiche (riquadro in basso). Per molecole più complicate possono aggiungersi altri tipi di moti come il wagging in cui gli atomi, ad esempio il CH2 che per esistere deve essere attaccato a qualcos’altro, possono muoversi fuori piano. I moti vibrazionali per la molecola eteronucleare lineare CO2 e per il gruppo chimico CH2 sono riassunti in figura 41. Per un dato gruppo chimico, a seconda della posizione spaziale in cui il gruppo è legato, ci si potrebbe chiedere se le frequenza caratteristiche dei moti appena descritti possono cambiare oppure no. Ebbene a prescindere dall’oggetto a cui il dato gruppo è legato le frequenze cambiano poco: le frequenze "modificate" continuano ad essere distribuite intorno ai valori che avrebbero se il gruppo chimico fosse libero. Per questo motivo le frequenze caratteristiche costituiscono l’impronta digitale di determinate molecole. Poi sapere quanto queste frequenza cambiano può dare un’idea di dove il gruppo è legato, o meglio di qual è l’ambiente chimico-fisico in cui esso si trova. 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 125 Figura 42: Tipico spettro di assorbimento di una cellula. Dal punto di vista fisico ciò significa che i potenziali rispetto ai quali il gruppo vibra sono molto più importanti dei potenziali dell’ambiente circostante che definiscono il come e dove il gruppo è legato: di fatto sono una piccola perturbazione rispetto al potenziale armonico che causa le vibrazioni specifiche del gruppo. Se si prende una cellula (di dimensioni sufficienti da poter essere misurata singolarmente) si deve essere in grado di concentrare sulla cellula le frequenze corrispondenti alla regione di frequenza in cui si vuole registrare lo spettro di assorbimento. Per questo ci si scontra con il limite di diffrazione: non è possibile concentrare la radiazione su regioni più piccole della sua lunghezza d’onda. Se la cellula in questione ha una dimensione minore della frequenza della radiazione che la dovrebbe misurare allora non è possibile usare per questa data cellula la spettroscopia IR. In figura 42 si vede il tipico spettro di assorbimento di una cellula: ad alte frequenze (a sinistra come nelle scale dei chimici) si individua una banda ben strutturata relativa ai grassi dovuta ai gruppi CH2 e CH3 , infatti una cellula è protetta da una membrana lipidica composta da lunghe catene costruite principalmente da gruppi CH2 e CH3 . I picchi prevalenti a circa 1600 cm−1 sono le così dette bande amidiche relative ai gruppi amidici (amide I, amide II) delle proteine che costituiscono la cellula. A frequenze ancora più basse l’assorbimento è dato sopratutto dalle vibrazioni dei gruppi C − O che costituiscono lo scheletro zuccherino del DNA e del RNA. Tutto il riconoscimento chimico a partire da vibrazioni molecolari è stato realizzato dagli anni 50’ in poi a partire da strutture modello: ad esempio il polietilene (la plastica) per le strutture lipidiche. Concentriamoci ora sulle componenti cellulari che abbiamo pocanzi citato. I Lipidi La spettroscopia IR rappresenta una tecnica importante per caratterizzare il contenuto lipidico di alcune strutture biologiche, in particolare per l’analisi chimica degli alimenti, ad esempio per la caratterizzazioni dei grassi saturi o insaturi, ma anche per la qualità di oli vegetali o animali, o banalmente per misurare la quantità di grassi presenti in un dato alimento. La misura degli assorbimenti caratteristici da informazioni sulla forma e sulle 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 126 Figura 43: Spettro di assorbimento dei lipidi e relatici moti vibrazionali associati ad ogni picco. Figura 44: Schema della struttura di una proteina. caratteristiche meccaniche delle membrane cellulari, in particolare grazie agli stretching dei gruppi chimici citati. In figura 43 si può vedere l’ingrandimento della zona di assorbimento dei lipidi descritta in figura 42 con i vari modi vibrazionali. Le proteine Le proteine sono strutture importantissime per l’esistenza della vita. Esse sono costituite essenzialmente da amminoacidi che costituiscono i mattoncini di base delle strutture proteiche. La struttura globale di una proteine è riassunta in figura 44 e può essere così riassunta: • la struttura primaria è costituita da elementari catene di aminoacidi; • la struttura secondaria è costituita dalle strutture che le catene della struttura primaria formano nello spazio: ad esempio possono avvolgesi (struttura α-elica) o formare strutture planari (struttura β-sheet); • la struttura terziaria è costituita dalla disposizione spaziale della struttura secondaria; • la struttura quaternaria è farmata da un insieme di strutture terziarie e costituisce la forma finale della proteina. Dal punto di vista della funzione specifica che una data proteina deve svolgere (enzimi ecc) la struttura secondaria ha un ruolo molto importante. L’efficacia chimica (e quindi la funzionalità biologica) della struttura è fondamentale, e le 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 127 Figura 45: Schema della struttura primaria di una proteina, formata dall’unione di più gruppi peptidici. spettro IR, a parità di struttura primaria, è diverso per strutture secondarie differenti. In figura 45 è possibile vedere un tipico caso di struttura primaria. Piccole differenze nella struttura primaria implicano funzioni biologiche completamente diverse. La struttura primaria è un oggetto complicato composto da molti atomi, nel quale è possibile riconoscere gruppi chimici specifici: sicuramente sono presenti gruppi a base carbonio (la vita è basata sul carbonio), l’azoto, gli ossigeni e gli idrogeni, fra gli elementi costituenti principali di una struttura primaria. Date le valenze specifiche di questi atomi, ad esempio il carbonio può formare un doppio legame con l’ossigeno, legarsi all’azoto che si lega a sua volta con un gruppo ad idrogeno singolo, e tutta questa struttura forma quello che è chiamato peptide. I peptidi sono i mattoni di base delle proteine e ognuno di questi oggetti può avere dei modi collettivi di vibrazione, ma essendo costruito da tanti atomi alcuni dei quali anche abbastanza pesanti può dar luogo a righe di assorbimento a basse frequenze (nel far-infrared). La vibrazione dei gruppi peptidici specifiche inoltre non mettono in moto l’intera struttura, ma il loro assorbimento può venire assimilato a quello dello stesso gruppo inerte, cioè non legato ad alcuna struttura più grande. Quanto cambiano le frequenze vibrazionali quando il gruppo è legato ad una struttura più complicata può dare informazioni sulla struttura stessa. Le lunghezze di legame e i relativi angoli fra gli atomi di queste catene sono ben caratterizzati, e le specifiche vibrazioni sono contenute in un intervallo di frequenze che va normalmente da 1000 a 1700 cm−1 . Queste vibrazioni molto ben definite e monocromatiche (la larghezza a mezza altezza di un dato picco è molto più piccola della frequenza caratteristica a cui il picco si trova) sono relative alla struttura mostrata in figura 46. Data la struttura primaria, una catena polipeptidica in sostanza, la sua ordinazione nello spazio va a formare la struttura secondaria, che può essere caratterizzata da tre configurazioni principali • la struttura α-elica; 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 128 Figura 46: Immagine di una tipico gruppo peptidico con relatici angoli e lunghezze di legame. • la struttura β-sheet; • la struttura β-turn. Inoltre fuori da queste tre configurazioni i segmenti di catena polipeptidica possono formare strutture chiamate random coil, che sono strutture non ripetitive nè regolari, spesso prive di legami idrogeno tra gli aminoacidi che le compongono. Nonostante la diversità delle forme primarie e secondarie, si hanno quasi sempre, per le proteine, ovviamente con frequenze e rapporti di intensità diversi, due picchi di assorbimento, distribuiti nella regione di frequenza caratteristica indicata precedentemente. Facciamo un esempio concreto: la struttura α-elica. Essa è solitamente avvitata in senso orario e la sua lunghezza dipende fortemente da che tipo di proteina si sta considerando. I gruppi chimici costituenti sono prevalentemente quelli peptidici. I legami che stabilizzano l’ordine tridimensionale sono "ponti a idrogeno", cioè appunto dei legami a idrogeno mostrati in figura 47 come linee tratteggiate. Questo fa si che le proteine siano fortemente dipendenti dalla temperatura: aumentando la temperatura non vengono distrutti i gruppi costituenti, però facilmente si distruggono le strutture tridimensionali che tali gruppi formano. Le energie di legame in termini di temperatura di queste strutture sono intorno ai 50-60 C ◦ , nel senso che superando queste temperature si rompe la conformazione di questa struttura ed essa torna ad essere bidimensionale come in un β-sheet. La banda di assorbimento della struttura ad α-elica è centrata intorno ai 1650 cm−1 . A partire dalla stessa struttura chimica, le strutture planari come i βsheet hanno assorbimenti diversi e cadono a 1630 cm−1 o 1680 cm−1 . Per una struttura disordinata gli assorbimenti sono di solito molto più larghi. Se la proteina, come spesso accade, racchiude in sè tutte queste sottostrutture, le bande di assorbimento saranno una somma di quelle delle singole strutture con pesi specifici diversi. La differenza fra le diverse righe di assorbimento e la loro larghezza è dovuta al fatto che l’approssimazione armonica in questo caso non fornisce un modello così accurato come può essere ad esempio per solidi cristallini da cui si ottengono delle bande molto strette. 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 129 Figura 47: Tipica struttura secondaria ad α-elica. Il fatto di avere tanti gruppi chimici con una precisa disposizione spaziale, può dar luogo a legami fra gruppi anche distanti fra loro nella singola catena, e ci può aspettare che la frequenza caratteristica del gruppo possa risentirne. Quella che dovrebbe essere una delta di Dirac per bande vibrazionali perfettamente armoniche, si allarga per il fatto che le frequenze caratteristiche delle vibrazioni cambiano punto per punto, e questo a causa di legami fra gruppi diversi che si "disturbano" a vicenda. Come detto le bande di assorbimento cambiano pesantemente al variare della temperatura, e questo permette di avere un’idea di come sta cambiando la sovrastruttura a causa della variazione di un parametro fisico esterno. In figura 48 si vede lo spettro di assorbimento per diversi intervalli di temperatura di una proteina a elica (spettro blu) che è completamente "srotolata" nello spettro nero. Quando, ad esempio, si cuoce della carne, le proteine all’interno subiscono Figura 48: Spettri di assorbimento per una struttura ad α-elica al variare della temperatura. un processo di perdita di acqua e cambiano fortemente la struttura. 5 APPLICAZIONI BIOLOGICHE DELLA SPETTROSCOPIA IR 130 Studio di una cellula Tutto ciò che si trova come applicazioni di spettroscopia IR su materiali biologici è stato ottenuto a partire da modelli semplici, andando a costruire vere e proprie banche dati. In figura 49 si può vedere un cellula rotonda, trasparente nella parte centrale, della dimensione di circa 10 µm. Se si è in grado di misurare lo spettro IR di questa cellula sul bordo, che assorbe radiazione, dovrebbe vedere principalmente i picchi relativi ai lipidi trattati in precedenza. Se invece si registra lo spettro nella parte centrale si dovrebbe ottenere l’assorbimento delle proteine. Con un laser IR viene campionata la cellula lungo una retta, quindi per diversi Figura 49: Studio di una cellula in fase di mitosi: in alto vi sono le immagini ottiche e in basso le ricostruzioni infrarosse nelle fasi di separazione cellulare. punti spaziali su cui si decide di focalizzare il laser si ottiene uno spettro IR. I diversi spettri a seconda delle bande che compaiono forniscono informazioni sulla composizione della cellula nei diversi punti, quindi a partire da questi spettri è possibile ricostruire delle immagini infrarosse della molecola stessa. Questa tecnica è chiamata spettromicroscopia. Prendendo una cellula viva, ci si potrebbe domandare quali ripercussioni può avere quando un fascio laser infrarosso è focalizzato su di esse. In sostanza non succede nulla: la cellula si riscalda di qualche grado, ma il processo fisiologico che la cellula avrebbe in assenza di radiazione IR continua praticamente indisturbato. In questo senso la radiazione infrarossa è non ionizzante, ed è possibile seguire ad esempio il processo di separazione cellulare, la mitosi, e di conseguenza come cambia lo spettro durante questo processo, come mostrato in figura 49. Come si vede dalle immagini, da una distribuzione sferica si raggiunge una configurazione bicentrica, e dalla membrana lipidica iniziale deve formarsi una membrana intermedia che permetta la separazione. La spettroscopia elettronica invece utilizza radiazioni che sono dannose per le cellule vive, e in questo senso la spettroscopia IR costituisce una tecnica potente. Vi sono moltissimi processi cellulari, dal rilascio di un farmaco anti tumorale alla morte programmata delle cellule che possono essere seguiti e studiati con gli spettri molecolari IR. 6 6 SPETTROSCOPIA RISOLTA NEL TEMPO 131 Spettroscopia risolta nel tempo Lo studio della materia non può limitarsi alla definizione di strutture cristalline stabili in condizioni di equilibrio. Come abbiamo visto nelle precedenti tecniche spettroscopiche il probe costituisce per il sistema sotto esame una perturbazione "debole", nel senso che non perturba lo stato del sistema in modo tale da indurre, ad esempio, una transizione di fase. Tuttavia una eccitazione indotta da una sonda spettroscopica porta il sistema a transire verso stati ad energia più elevata, o anche a diseccitarsi se possiede stati eccitati abbastanza popolati. Queste transizioni possono fornire notevoli informazioni sullo stato del sistema e sulla sua composizione. Lo studio del regime transiente quindi è fondamentale se si vuole davvero approfondire la conoscenza di un dato sistema fisico. Ed è qui che entra in gioco la spettroscopia risolta nel tempo: vogliamo essere in grado di registrare, con impulsi della durata adeguata, i processi che avvengono durante le transizioni (in senso generico) del sistema. Consideriamo il sistema costituito dal target e dalla sonda spettroscopica probe. Se fra target e probe non vi è interazione, cioè V̂int = 0 l’hamiltoniana del sistema può essere scritta come: Ĥ0 = X X p̄2 i ~ωk̄λ (n̂k̄λ + + φ({r̄i }) + 2mi i k̄,λ {z } | | {z target probe 1 ) 2 } Se facciamo ora l’ipotesi che target e probe interagiscano per un certo periodo, all’espressione precedente si deve aggiungere un termine che tiene conto appunto di tale interazione. Abbiamo visto che in regime di risposta lineare il potenziale di interazione può essere scritto come una parte di target per una di probe, e ciò significa che l’elemento di matrice di scattering è stato scritto usando stati che sono il prodotto di uno stato target per uno stato probe, infatti si è visto che: |ii = |ti i |pi i |f i = |tf i |pf i Con questi presupposti è stato mostrato che la sezione d’urto dipende da una funzione di correlazione calcolata fra stati di target, il cui significato può essere riassunto dicendo che gli stati di target non dipendono dall’intensità della sonda. Il tempo è una delle quantità fisiche con la più ampia variabilità (figura 50a), e le proprietà dinamiche del sistema che si vuole indagare con la spettroscopia risolta nel tempo mostrano intervalli che vanno dai millisec (ad esempio la fusione di un solido) a qualche decina di femtosec (ad esempio una transizione elettronica). Per studiare questo tipo di sistemi è necessario un probe di durata temporale compatibile con l’evento che si vuole studiare. Prima di tutto il sistema viene mandato fuori dal suo stato di equilibrio tramite un pump, ovvero un segnale abbastanza forte, tale da perturbare il sistema e portarlo fuori equilibrio. Il sistema quindi si riporta naturalmente verso lo stato di equilibrio, ovvero si dice che il sistema rilassa e in questa fase interviene il probe a "fotografare" la fase di rilassamento. Facciamo ora un esempio concre- 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) La scala dei tempi fisici. (b) Tempi caratteristici dei processi transienti. Figura 50 (a) Al tempo zero il pump agisce sul sistema. (b) Al tempo ∆t il probe registra il rilassamento del sistema eccitato. (c) Schema di un processo spettroscopico di tipo pump-probe. Figura 51 132 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Schema di un esperimento FTIR. 133 (b) Un interferogramma: ovvero in funzione del tempo e dello spostamento dello specchio. Figura 52 to: si consideri un materiale semiconduttore, che per un qualche stimolo esterno diventa metallico. Questo significa che il sistema aumenta la sua opacità e quindi l’intensità trasmessa del probe tenderà a diminuire. Per studiare un fenomeno del genere si usa la spettroscopia FTIR (spettroscopia infrarossa in trasformata di Fourier) che sfrutta uno schema interferometrico e uno specchio mobile. Per ottenere l’intensità trasmessa dal sistema in funzione della frequenza si può utilizzare un monocromatore, cioè una griglia (grating) che distribuisce spazialmente la luce proveniente dal campione in funzione della frequenza, oppure si utilizza un interferometro. In figura 52a si può vedere lo schema che stiamo considerando: quando i due specchi sono alla stessa distanza dal beam-splitter si ha il massimo di interferenza costruttiva, e l’interferenza rende sensibile la dipendenza in frequenza della sorgente rispetto al detector. In altre parole se si acquisisce l’intensità di radiazione in funzione della posizione dello spettro si ottengono delle frange di interferenza periodiche. Nel momento in cui si fa l’operazione di trasformata di Fourier, se si ha una funzione oscillante periodica, si ottiene una funzione piccata (nel limite di funzioni cosinusoidali si ottiene una delta di Dirac) proprio alla frequenza della radiazione della sorgente. Quindi se la radiazione della sorgente è formata da molte frequenze, la trasformata di Fourier della figura di interferenza che si ottiene dà una serie di picchi che sono proprio lo spettro del campione. Per ogni impulso di probe quindi si ricavano queste immagini del sistema dette interferogrammi, ovvero la scansione del segnale in funzione dell’andamento dello specchio (figura 52b). Man mano che il sistema rilassa, cioè da metallico ritorna semiconduttore, aumenta la sua trasmissione e il segnale del probe tende a crescere. Tuttavia se il ∆t di rilassamento è minore del tempo che impiega lo specchio a muoversi lungo il braccio dell’interferometro allora non si riesce ad ottenere una fotografia "a fuoco" del sistema. Per risolvere questo problema, ed è quello che si fa in esperimenti di questo tipo, si tiene fisso lo specchio e si campiona nel tempo ogni singolo punto. In pratica per ogni istante di tempo si campiona il segnale (usando un clock elettronico) e si cambia di volta in volta la posizione dello specchio senza la necessità che questo si muova con una velocità compatibile col rilassamento (metodo step-scan). La limitazione di questo metodo è ovviamente l’elettronica: il tempo di clock arriva fino a 10 ns. La molecola di H2 , ad esempio, ruota in circa 7 fs, quindi ben più veloce dei tempi accessibili con la tecnica appena descritta. 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Esempio di una molecola di cristallli liquidi. (b) Schema di funzionamento schermi a cristalli liquidi. 134 degli Figura 53 Invece se si vuole fotografare la propagazione del suono in un certo materiale, ciò è possibile dato che dato che un fonone acustico si muove ad una velocità di circa 1 Å ogni 100 fs. Negli anni 80’ c’è stato un forte sviluppo degli schermi cristalli liquidi (LCD): un cristallo liquido è una molecola fortemente anisotropa, come ad esempio la catena mostrata in figura 53a. Queste catene hanno un momento di dipolo molto grande, e se sottoposte ad un campo elettrico queste si allineano. Tuttavia questi cristalli liquidi sono fortemente ionici e questo significa che gli schermi lcd non possono essere alimentati in continua: infatti una differenza di potenziale statica porterebbe l’insieme dei cristalli a migrare verso i capi della ddp, formando una grande corrente ionica che può portare il cristalli liquido a bruciarsi. Quindi gli schermi sono alimentati in corrente alternata, ma con quale velocità? La velocità con cui è possibile cambiare il segno del campo elettrico dipende dalla velocità di orientazione dei cristalli: quindi dipende dal momento di dipolo della molecola e la tecnica pump-probe in trasformata di Fourier permette di valutare proprio questo rilassamento. In figura 54b vediamo, ammesso di misurare la vibrazione CN in funzione del tempo, che l’assorbimento del gruppo CN tende ad aumentare all’aumentare della frequenza del campo esterno che orienta le molecole. Successivamente, allo spegnimento del campo, il sistema tende a rilassarsi. Ciò significa che misurando questo tipo di oggetti, e facendo poi la TdF, ottengo uno spettro che mi dice che l’assorbimento del gruppo specifico aumenta in funzione dell’orientazione: quindi il sistema si orienta e successivamente si rilassa. Il pump in questo sistema è il campo elettrico applicato alla cella che contiene le molecole lcd. Se si vogliono studiare fenomeni più veloci di quelli disponibili con la tecnica descritta si è costretti a cambiare sorgente. Sorgenti spettroscopiche ultra-veloci si possono ottenere con i laser a luce pulsata. La caratteristiche dei laser a impulsi sono: • durata temporale dell’impulso, • repetition rate; • energia per impulso; • lunghezza d’onda di emissione; • fattore M2. 6 SPETTROSCOPIA RISOLTA NEL TEMPO 135 (a) TdF della figura di assorbimento del gruppo specifico. (b) Eccitazione e rilassamento di un gruppo specifico della molecola in funzione del tempo. Figura 54 6.1 Tecniche di laser pulsing Ci sono tre tecniche principali per realizzare laser a impulsi, e vogliamo qui brevemente riportarle. Q-Switching (>ns) Uno dei due specchi della cavità che racchiude il mezzo attivo viene sostituito con uno specchio rotante. Quindi la cavità si chiude e si apre con la frequenza di rotazione dello specchio, e il mezzo attivo si carica con la medesima frequenza generando un impulso laser di qualche ns. La limitazione di quest’oggetto è proprio la meccanica che fa ruotare uno dei due specchi. Mode-Locking (fs-as) Si supponga di avere un laser in continua (quindi il segnale è una sinusoide) con potenza media di circa 4 mW. La potenza media è data da: Potenza media = repetition rate · Energia per impulso Si immagini ora di prendere il segnale del laser e schiacciarlo in un pacchetto temporale limitato di forma gaussiana in modo tale che la potenza media rimanga costante. Quindi se si diminuisce il numero di impulsi al secondo (il repetition rate) è possibile aumentare l’energia di ogni impulso, che è data dalla potenza di picco per la durata temporale del pacchetto. La potenza di picco quindi può essere aumentata riducendo la durata temporale. Con una potenza media di 1 mW (che è 1/4 della potenza del nostro laser), a 800 nm l’energia di ogni impulso è qualche femto Joule. Ora con una repetition rate di 10 impulsi al secondo quel che succede è che ogni pulso trasporterà un’energia di 10 µJ. Se questi 10 µJ di energia sono schiacciati in 100 fs di durata 6 SPETTROSCOPIA RISOLTA NEL TEMPO 136 temporale si può avere fino a 1 GigaW di potenza di picco, e si è partiti da 1 mW di potenza media! Se vogliamo sciogliere un solido col nostro laser a impulsi, lo scioglimento avviene su scale temporali dei ms, ma il sistema sarà sensibile alla potenza media (il nostro 1 mW), ma gli elettroni sono molto più veloci (rispondono nelle decine/centinaia di fs) e la loro risposta ha una durata temporale compatibile con la durata del pacchetto laser ipotizzata. Tuttavia mentre lo scioglimento del materiale sente 1 mW di energia, gli elettroni sono investiti da 1 GW di potenza. Quindi con bassissima potenza, con gradi di libertà ultraveloci, si possono ottenere campi molto intensi in grado di guidare il sistema fuori dallo stato di equilibrio. Il concetto, per riassumere, è non aumentare la potenza media per aumentare enormemente quella di picco relativa ad ogni impulso. Per esperimenti di questo genere è altresì necessario realizzare delle statistiche. Per questo scopo c’è bisogno di un gran numero di eventi al secondo. Nel nostro caso abbiamo si 1 GW di potenza di picco ma solo 10 eventi/s per fare statistica. E’ possibile aumentare la statistica a discapito o della potenza di picco oppure aumentando la potenza media iniziale. Avere impulsi ultra corti è importante anche per fare tomografia: se ho un campione disomogeneo, le cui disomogeneità sono maggiori della durata temporale dell’impulso, allora non solo è possibile misurare l’assorbimento ma anche avere informazione sulla morfologia del campione usando l’impulso come un vero e proprio sonar. Come si fa a generare un impulso ultra corto tramite mode-locking? Si suppone di avere una cavità, che sarà popolata da n modi permessi (figura 55a), e per realizzare l’impulso il maggior numero possibile di modi devono essere in fase, cioè devono essere "lockati" (bloccati) in fase. In figura 55b i modi hanno una relazione di fase random che danno luogo ad un rumore di fondo all’interno della cavità, ma se si suppone di avere tutti gli n modi con la stessa relazione di fase (figura 55c) allora i modi si sommano coerentemente andando a costruire un modo che nel tempo è come se fosse una delta di Dirac. Aumentando il numero di modi in cavità diminuisce la durata temporale del pacchetto. Per realizzare ciò si può usare, ad esempio la tecnica del mode-locking passivo (figura 56): in cavità si trovano sia il mezzo attivo che produce il lasing sia un assorbitore saturabile che è un oggetto che riesce a fornire la giusta relazione di fase fra i modi. Esso trasmette il segnale al crescere dell’intensità: in pratica più intensità riceve più il sistema la trasmette. Quindi se la cavità è popolata da n modi, sono favoriti solo quelli più intensi mentre gli altri sono assorbiti. Inoltre se i modi si sovrappongono in fase l’intensità totale aumenta e quindi questi modi ancora più intensi saranno ancora più favoriti andando quindi, nel tempo, a selezionare solo i modi sovrapposti con fasi coerenti. Nel gergo della spettroscopia ultaveloce gli impulsi ultracorti sono chiamati seed. Il seed viene fatto passare attraverso un amplificatore rigenerativo (figura 57): un mezzo attivo viene caricato con un pump mentre viene fatto entrare il seed il quale, per emissione stimolata, causerà la diseccitazione del mezzo attivo alla sua stessa frequenza generando un impulso gemello ma con un’intensità molto maggiore. Vogliamo dare qualche numero per rendere l’idea dei tempi con cui si sta lavorando. Realizzare un impulso corto dipende dal numero di modi che vengono lockati e quindi dalla banda disponibile. Per il principio di indeterminazione, 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Modi permessi all’interno di una cavità. (b) Modi in cavità con fasi random danno luogo ad un rumore di fondo. (c) Modi in cavità con fasi uguali danno luogo a impulsi piccati e molto stretti nel tempo. Figura 55 Figura 56: Schema del Mode-Locking passivo Figura 57: Schema di un amplificatore rigenerativo 137 6 SPETTROSCOPIA RISOLTA NEL TEMPO 138 per un impulso gaussiano si ha che: ∆ν∆t ' 0.44 e questo significa che se l’impulso è di circa ∆t ' 100 f s allora ∆ν ' 4 T Hz =. In lunghezza d’onda questo significa che, se ho un laser alla frequenza di 800 nm con una banda di 20 nm, che in frequenza significa 4 THz, posso realizzare un impulso della durata temporale di circa 100 fs. Questo tipo di impulsi ha una difficoltà di propagazione: il chirping. Infatti se l’impulso è esteso in frequenza da 790 a 810 nm, e deve attraversare un materiale che risponde bene a 800 nm ma risponde diversamente per frequenze che sono maggiori o minori di questo valore, cioè l’indice di rifrazione del materiale varia con la frequenza che lo attraversa, allora succede che alcune frequenze del mio impulso viaggeranno più lentamente di altre, sparpagliando l’impulso stesso, cioè allargandolo. Questo fenomeno disturba quindi la compattezza dei miei impulsi. Questo è un limite tecnologico: non tutte le frequenze possono essere lockate, portando a impulsi non più piccoli di 100 fs a livello di lase commerciali. Fin’ora abbiamo visto che gli impulsi ultracorti vengono normalmente ottenuti in laboratorio con laser ottici, ma è possibile realizzarli anche, ad esempio, nei raggi x? E’ possibile fare ciò ma bisogna cambiare sorgente, cioè gli elettroni, e costruire un Free Electron Laser. Free Electron Lasers (fs-as) I FEL sono basati sull’accelerazione di elettroni. Sono grandi strutture inventate negli anni 80’, ma solo negli ultimi 15 anni sono stati investiti molti soldi, sia in Europa che negli Stati Uniti per realizzare FEL sempre più potenti e precisi. Rispetto ai laser ottici che al massimo possono occupare una stanza, i FEL possono essere lunghi anche 1.5 km. I FEL producono impulsi laser ad alta intensità e altissima risoluzione spaziale in un range di freqeunza che va dal lontano infrarosso a raggi x duri. Essi sono fatti principalmente da due parti: il fotoiniettore e l’ondulatore. Il fotoiniettore produce pacchetti di elettroni con caratteristiche controllate, che vengono mandati all’interno dell’ondulatore. Cosa succede al pacchetto di elettroni che entra nell’ondulatore? Descriviamo il fenomeno facendo riferimento alla figura 58a: l’ondulatore è costituito da una serie di dipoli magnetici alternati N-S e S-N che riproducono un campo magnetico sinusoidale. Questo campo magnetico agisce sul pacchetto di elettroni che risentiranno di una forza di Lorentz trasversale al campo e alla direzione di propagazione. Il pacchetto, formato quindi da cariche che oscillano e variano il loro vettore di velocità e quindi subiscono un accelerazione, emette radiazione. Infatti come predetto da Larmor alla fine dell’ 800’ una carica accelerata emette in tutto lo spazio radiazione elettromagnetica. In questo caso però gli elettroni sono accelerati fino a velocità relativistiche, e l’effetto che ne consegue (per una trattazione completa si rimanda a [3] cap. 2.7) è che la radiazione viene emessa in avanti entro un cono di apertura di pochi milli radianti, quindi in un fascio ben collimato. Inoltre la forza di Lorentz agisce sugli elettroni costringendoli a disporsi in micropacchetti (questo fenomeno è chiamato microbunching) distanziati esattamente di una lunghezza d’onda di emissione l’uno dall’altro. Questo fa si che la radiazione emessa da ogni micropacchetto sia in fase con quella del pacchetto successivo 6 SPETTROSCOPIA RISOLTA NEL TEMPO 139 (a) Schema di un ondulatore. (b) Schema di emissione coerente dovuta al micro bunching del pacchetto di elettroni (a sinistra) e dipendenza della potenza dalla distanza percorsa nell’ondulatore in scala logaritmica (a destra). Figura 58 (figura 58b a sinistra), facendo si che la radiazione totale emessa da tutto il pacchetto di elettroni iniettato nell’ondulatore subisca un incremento esponenziale proporzionale alla distanza che viene percorsa all’interno dell’ondulatore (figura 58b a destra). Il vantaggio di fare esperimenti con i FEL è il seguente: come è noto il problema dei raggi x è la dose, in quanto una dose eccessiva può essere molto dannosa ad esempio per tessuti biologici. Il tempo di esposizione per ottenere un’immagine a raggi x ad alta risoluzione diminuisce sensibilmente per questa categoria di macchine. Inoltre la bassissima divergenza angolare permette di mantenere l’alta potenza fortemente localizzata. 6.2 L’esperimento di spettroscopia pump-probe In figura 59 è riportato lo schema tipico di un esperimento pump-probe di assorbimento: dato un laser, in questo caso un laser pulsato al titanio-zaffiro, viene diviso in due canali, uno per il pump e uno per il probe che vengono preparati al meglio; dopo essere passo sul campione il segnale di probe passa su di un reticolo dopo viene diviso nelle sue varie frequenze ed analizzato da un computer. 6.2.1 Esempio di un metallo Vediamo ora un esempio tipico dell’esperimento appena descritto. Come abbiamo visto trattando il modello di drude, si possono trovare le proprietà ottiche dei metalli impostando l’equazione del moto per una carica (eq. 4.76) considerando il termine dissipativo dipendente dalla sua velocità, da cui ricavare il momento di dipolo totale e quindi le proprietà ottiche fondamentali come permettività e conducibilità. Inserendo le espressioni di 1 , 2 , σ1 , σ2 all’interno della riflettività si trova, come abbiamo già descritto nella sezione 4.2.3, che essa è prossima 6 SPETTROSCOPIA RISOLTA NEL TEMPO 140 Figura 59: Schema di un esperimento di assorbimento per spettroscopia pumpprobe ad 1 per i metalli prima della frequenza di plasma ωp (che dipende dal numero di portatori nel metallo) per poi crollare bruscamente a frequenza maggiori. Possiamo vedere i grafici relativi alla permettività, conducibilità e reflettività rispettivamente in figura 60a-b-c. Inizialmente il sistema è in equilibrio con una funzione di distribuzione degli stati di Fermi Dirac: 1 hni = e E−EF KB T +1 dove EF è l’energia di fermi e T rappresenta la temperatura del sistema all’equilibrio. Vi sono due gradi di libertà: uno reticolare, in quando il solido avrà delle eccitazioni reticolari, cioè i fononi, e un grado di libertà di assorbimento dovuto agli elettroni liberi. All’equilibrio la temperatura degli elettroni e quella del reticolo è la stessa. Se mandiamo sul campione un pump di 100 fs il reticolo risponde molto più lentamente rispetto agli elettroni, i quali quindi acquisiranno in qualche decina di fs l’energia trasmessa dal pump. Con un pump a 800 nm il fotone che viene assorbito dall’aelettrone acquisisce un’energia di 1.55 eV che va a modificare la funzione di distribuzione di Fermi, costringendo a definire una nuova energia di Fermi ed una nuova temperatura di equilibrio. L’ordine delle nuove temperature che si riesce a realizzare con energie di qualche mJ è di 3000-4000 K che possiamo spiegare tramite una relazione termodinamica nel modo seguente: l’energia assorbita è data da Ea = M CT ∆T dove M è la massa, CT è la capacità termica, ∆T è la variazione di temperatura ed anche con poca energia si hanno delle variazioni di temperatura del bagno elettronico molto elevata a causa della grande capacità termica degli elettroni. Tuttavia non tutti gli elettroni liberi sono influenzati dal pump, bensì solo quelli compresi in due volte l’energia del fotone assorbito. Successivamente al riscaldamento di solo una frazione del bagno elettronico, la funzione di Fermi tende a rilassare in qualche centinaia di fs (dipende dal tempo 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Permettività reale 1 e immaginaria 2 per un tipico esperimento di assorbimento su un metallo. 141 (b) Conducibilità reale σ2 ed immaginaria σ2 per un tipico esperimento di assorbimento su un metallo. (c) Riflettività R per un tipico esperimento di assorbimento su un metallo. Figura 60 6 SPETTROSCOPIA RISOLTA NEL TEMPO 142 di scattering) e a tempi ancora successivi interviene il reticolo (qualche ps) che assorbe l’energia residua degli elettroni tramite scattering elettrone-fonone. Dichiariamo le variabili: TE temperatura elettronica TL temperatura reticolare CE capacità termica elettronica CL capacità termica reticolare κ conduttività termica G costante di interazione elettrone-fonone H(t) energia depositata dall’impulso di pump e considerando le assunzioni fondamentali: i la termalizzazione e-e è molto più veloce del rilassamento e-ph ii la diffusione dovuta alle impurezze è trascurabile (buona approssimazione quando il cammino libero medio degli elettroni è piccolo) iii l’accelarazione dovuta a campi interni o esterni è trascurabile iv non vi sono altri importanti fenomeni di scattering allora è possibile studiare un sistema di questo tipo tramite le equazioni: ∂TE = ∇(κ∇TE ) − G(TE − TL ) + H(t) ∂t ∂TL CL (TL ) = G(TE − TL ) ∂t CE (TE ) che descrivono rispettivamente elettroni e reticolo. Per i metalli solitamente si ha che CL ≈ 100CE . In figura 61 sono riportate le quantità macroscopiche che vengono misurate in questi esperimenti, come la riflettività e la trasmittanza per un metallo all’equilibrio (blu) e dopo che questo ha assorbito un impulso di pump (in rosso). Si nota che la trasmittanza aumenta dopo l’impulso, che significa che il metallo sta perdendo la sua caratteristica metallica tendendo verso un dielettrico. Dall’altra parte ovviamente la riflettività peggiora, ma aumenta nel tempo in quanto il sistema tende spontaneamente a rilassarsi. Il modello rappresentato dalle due equazioni scritte permette di calcolare la variazione di temperatura in funzione del tempo (figura 62): si vede come quasi istantaneamente il bagno elettronico (blu) raggiunga una temperatura di 1000 K mentre il reticolo (rosso) abbia una risposta più lenta e raggiunga temperature inferiori. Le proprietà di un metallo tendono a peggiorare con la temperatura in quanto si riduce il tempo di scattering con conseguente diminuzione di riflettività e aumento della trasmittanza. Il tempo di scattering elettrone-elettrone va come τe−e ∼ 1 EF 6 SPETTROSCOPIA RISOLTA NEL TEMPO 143 Figura 61: Trasmittanza e riflettività di un metallo all’equilibrio (in blu) e tramittanza e riflettività di un metallo dopo un impulso di pump (in rosso). Figura 62: Variazione di temperatura in funzione del tempo del bagno elettronico (in blu) e del reticolo (in rosso). 6 SPETTROSCOPIA RISOLTA NEL TEMPO 144 In un sistema perturbato non si può definire una vera e propria energia di fermi, tuttavia si può definire una EF efficacie in quanto il sistema aumenta la sua energia perchè tende a riequilibrarsi. La conducibilità immaginaria σ2 in funzione della frequenza è una lorenziana descritta dai parametri frequenza di plasma ωp e tempo di scattering τ , ma il tempo di scattering è dato dalla somma in quadratura dei singoli tempi di scattering cioè: 1 1 1 = + τ τe−e τe−ph ma se taue−e diminuisce il tempo di scattering totale diminuisce, e se ωp rimane costante allora la σ2 si allarga e si abbassa, ma se la conducibilità ottica diminuisce diminuisce anche la riflettività, e la trasmittanza aumenta. 6.2.2 Esempio di un semiconduttore Quando un fotone incide su un semiconduttore e viene assorbito, un elettrone della banda di valenza viene promosso in banda di conduzione: si ha una transizione interbanda. Tuttavia non solo è possibile investigare questa transizione ma anche controllare lo stato di target. Se si ipotizza di promuovere molti elettroni dalla banda di conduzione a quella di valenza allora il semiconduttore dovrebbe aumentare le proprie caratteristiche metalliche e quindi la conducibilità e la riflettività. E’ possibile fare questo con un segnale ultracorto di elevata potenza. In figura 63a vediamo l’impulso di probe trasmesso prima e dopo il pump. Prima dell’impulso il probe vede un certo valore di trasmittanza che si riduce notevolmente dopo l’impulso in quanto il semiconduttore acquisisce caratteristiche metalliche. In figura 63b invece si vede la riflettività: prima dell’impulso il sistema riflette pochissimo ma quando ho la coincidenza fra pump e probe si registra un brusco aumento di riflettività. Se si hanno due segnali nell’ottico che durano circa 100 fs l’uno (∼ 30µm di lunghezza spaziale), che si propagano per il laboratorio su distanze tipiche di 5-10 m, si vuole ritrovare la coincidenza temporale di due impulsi lunghi 30 micron. Per fare ciò si usa un sistema campione, in genere il GaAs: l’aumento di riflettività funziona da rivelatore del fatto che i due impulsi sono sovrapposti (un cross-check). Questo tipo di esperimento su campioni di GaAs si effettua solitamente prima dell’esperimento vero e proprio, una sorta di calibrazione della sovrapposizione temporale dei due impulsi. Per quanto riguarda i processi di rilassamento, sempre considerando il GaAs, si possono avere diversi processi di diseccitazione: la diseccitazione diretta fra la banda di conduzione e la banda di valenza con l’emissione di un fotone di energia pari all’energia della gap; si può avere una ricombinazione di livelli eccitonici donori-accettori, oppure fra donore-valenza o fra accettore-conduzione. Inoltre si può avere il processo Auger: è un processo non radiativo in cui l’elettrone di diseccita dalla banda di conduzione a quella di valenza, ma l’energia prodotta nella transizione serve a far transire un elettrone vicino dalla banda di valenza a quella di conduzione. In generale si possono avere ricombinazioni interbanda ma anche combinazioni intrabanda che sono processi diagonali all’interno di una stessa banda a vettore d’onda scambiato grande e sono di solito i processi che coinvolgono i fononi. In figura 64 si vede a sinistra la parte immaginaria ed a destra la parte reale 6 SPETTROSCOPIA RISOLTA NEL TEMPO 145 (a) Impulso di probe trasmesso prima (in blu) e dopo (in rosso) l’impulso di pump. (b) Riflettività del GaAs prima e dopo l’impulso di pump.. Figura 63 dell’inverso delle funzioni dielettriche. Si vede che all’equilibrio si ha un fonone tra i 9 e 10 THz e nel momento in cui si stimola il sistema con un pump si vede la formazione di una quasi-particella e la transizione metallica descritta dal grafico che coincide con quello che si avrebbe seguendo il modello di Drude che modellizza i metalli. Questo processo crea un plasma di eccitoni (una nuvola di elettroni e lacune) che diseccitandosi emette un segnale a bassissima frequenza (circa 5 mev, nel lontano infrarosso) e quindi questo meccanismo può essere usato per realizzare sorgenti nel lontano infrarosso. 6.2.3 Esempio di un superconduttore Il fenomeno della superconduttività coinvolge la creazione di coppie di Cooper : una coppia di Cooper è uno stato legato fra due elettroni, la cui interazione è mediata dall’interazione con il reticolo. La differenza fra un fluido normale e un fluido superconduttivo è la seguente: un superconduttore in genere è un buon metallo, che quindi presenta una risposta metallica e può essere rappresentato come un fluido normale (di elettroni). Il passaggio da fluido a superfluido, e quindi da buon conduttore a superconduttore avviene quando una parte degli elettroni del fluido condenserà creando coppie di Cooper. Questa transizione avviene ad una temperatura specifica. I fenomeni superconduttivi sono stati scoperti all’inizio del ’900 quando si facevano esperimenti sul mercurio a 4 K. Ciò che avveniva è una vera e propria condensazione degli elettroni, dovuta all’interazione con il reticolo. In figura 65a si può vedere la transizione da conduttore a superconduttore: quella in rosso rappresenta la normale conducibilità reale del conduttore per temperature T > TC dove TC è la temperatura critica alla quale avviene la transizione a 6 SPETTROSCOPIA RISOLTA NEL TEMPO 146 Figura 64: Parte reale (a destra) e immaginaria (a sinistra) dell’inverso della funzione dielettrica del GaAs per tempi di sovrapposizione fra pump e probe diversi. tD è il delay time. superconduttore. Come sappiamo i semiconduttori conducono moltissimo: per piccoli potenziali applicati le coppie di Cooper all’interno del superconduttore acquistano una grande energia cinetica, e questo significa che si ha un grande termine induttivo. Invertendo la differenza di potenziale il sistema mostra una grandissima inerzia: le cariche impiegano molto tempo a rallentare e la conducibilità reale tende rapidamente a zero. Quando le coppie di Cooper condensano, si legano con una energie per elettrone pari a ∆ ovvero una coppia di Cooper "costa" 2∆ che rappresenta quindi l’energia di formazione della coppia. Se fornisco al superconduttore un fotone di energia ~ω > 2∆ avviene che le coppie si slegano e la risposta torna a tendere a quella di un normale metallo tipo Drude. La risposta della conducibilità può essere ricavata dal modello a due fluidi, in cui la risposta totale è una combinazione lineare delle due risposte. E’ possibile dividere l’effetto dello slegamento delle coppie di Cooper a causa dell’applicazione di un pump sulla densità degli stati in 3 step. Step 1 un impulso di energia ~ωIR nel vicino infrarosso (1.5 eV) rompe le coppie di Cooper (2∆ ∼ 10 meV) creando un eccitoni ad alta energia (fig 66a), cioè quasi particelle formate da elettroni slegati; Step 2 gli eccitoni acquistano energia dell’ordine del eV, dato che l’energia dell’impulso è molto maggiore di 2∆. Le coppie slegate quindi hanno alta energia e causano la rottura di altre coppie di Cooper scatterando e rilassandosi attraverso la gap; Step 3 le quasi particelle in eccesso (gli eccitoni) ricombinano e la gap ritorna al valore iniziale. Quando si rompono le coppie di Cooper eccitando il sistema, si ha una rottura delle coppie in cascata, portando la conducibilità σ2 verso una risposta tipo 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Parte reale della conduttività di un superconduttore sopra (in rosso) e sotto (in blu) la temperatura critica TC . 147 (b) Conducibilità ottica: la linea continua rappresenta la risposta superconduttiva e la linea tratteggiata rappresenta la conducibilità tipica dei metalli tipo Drude. Figura 65 metallo, e da cui, successivamente ci si aspetta un rilassamento per tornare alla risposta superconduttiva. Dopo 300 ps, che è un tempo molto grande per la fisica della materia, la risposta iniziale non è stata ancora ripristinata, e questo è dovuto all’effetto di rotture in cascata citato inizialmente. Questo è dovuto al fatto che si è usato un impulso troppo energetico, che rompe troppe coppie di Cooper, e qui si ha un limite tecnologico in quanto non si è ancora in grado di avere sorgenti abbastanza deboli (da 1 eV si vuole passare a 10 meV) nel lontano infrarosso. Il limite tecnologico si basa sul fatto che per ora non si è in grado di rompere poche coppie di Cooper e osservare quindi la dinamica intrinseca del superconduttore. Infatti questa dinamica ad oggi è mascherata da una dinamica esterna dovuta al fatto che si rompono troppe coppie di Cooper a causa dell’effetto cascata e questo maschera il rilassamento del sistema rendendolo troppo lento. Fin’ora abbiamo considerato metalli sondati con pump e probe entrambi nell’ottico; poi nei superconduttori si è visto un pump ottico (che costa di meno commercialmente) e un probe nel lontano infra rosso a bassa energia. Ora vogliamo cambiare tecnica spettroscopia e passare alla fluorescenza. 6.3 Spettroscopia tramite fluorescenza La spettroscopia tramite fluorescenza è molto usata nei sistemi biologici. Per spiegare come funziona questa tecnica facciamo un esempio. Si considera una molecola nello stato fondamentale. Si applica un pump nell’ottico e la molecola transisce verso un certo stato eccitato. Successivamente il sistema tende a rilassarsi tramite processi non radiativi, ad esempio per transizioni vibrazionali. Una volta arrivata allo stato elettroni più basso dopo varie transizioni vibrazionali verso il basso essa tenderà a diseccitarsi in maniera radiativa emettendo radiazione elettromagnetica: l’emissione di radiazione si esplica proprio nella fluorescenza del materiale. La fluorescenza è un fenomeno speculare all’assorbimento: si ha una transizione principale la quale però contiene transizioni vibrazionali minori (figura 67b), 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Step 1: l’impulso rompe molte coppie di Cooper creando un eccitoni. (b) Step 2: gli eccitoni ad alta energia che si sono formati scatterano e distruggono altre coppie di Cooper. (c) Step 3: le quasi particelle in eccesso si ricombinano restaurando il valore iniziale della gap. Figura 66 148 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Transizione di fluorescenza. 149 (b) Assorbimento e fluorescenza convoluti con transizioni vibrazionali. (c) Fluorescenza associata ad un rilassamento del sistema. Figura 67 per cui nello spettro di assorbimento ciò che si vede sono proprio le transizioni vibrazionali. Anche lo spettro di fluorescenza quindi avrà gli stessi picchi vibrazionali. Supponiamo di eccitare il sistema, il quale inizierà ad emettere luce per fluorescenza. Durante quest’emissione però il sistema potrebbe evolvere da uno stato al non equilibrio eccitato verso uno stato eccitato all’equilibrio (figura 67c), cioè durante il processo di fluorescenza vi è anche una dinamica di rilassamento del sistema. In figura 68 vediamo un caso concreto di questa tecnica. Si è considerata la molecola di Cumarina, molecola polare che viene immersa in un solvente anch’esso polare. Nel momento in cui viene eccitata, il momento di dipolo della molecola cambia. Il solvente quindi sente il cambio di momento di dipolo della molecola e l’intorno chimico del sistema tende a riarrangiarsi. Questo riarrangiamento del sistema avviene con la diminuzione di energia del livello eccitato, e questo si ripercuote sullo stato fondamentale della molecola che invece tenderà ad aumentare. Quindi lo spettro emesso subisce in frequenza un red-shift: la frequenza della fluorescenza si sposta verso lunghezze d’onda maggiori. Il tempo di spostamento dipende ovviamente dal tempo in cui le molecole intorno alla cumarina si riarrangiano. Si osserva (ma non lo dimostriamo) che questo processo è bifasico: la figura 68b è divisa in tempi corti (ps) e tempi lunghi (centinaia di ps) in cui vi è un cambio di concavità per la forma della curva di diseccitazione. Su 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Molecola di cumarina. 150 (b) Spettro di fluorescenza della molecola di Cumarina: c’è uno spostamento verso lunghezza d’onda maggiori a causa del riarrangiamento del solvente intorno alla molecola. Figura 68 Figura 69: Fotoemissione riolta in angolo e in tempo scale temporali più grandi infatti il sistema, che si è riarrangiato velocemente solo nell’intorno chimico della molecola, si riarrangia anche su scale maggiori, e questo da luogo al cambio di forma che si vede in figura. 6.4 Fotoemissione risolta in angolo e in tempo: Tr-Arpes La fotoemissione risolta in angolo permette di ottenere la dispersione a bande elettronica del campione. Negli ultimi anni si è riusciti ad implementare questo tipo di fotoemissione anche risolta nel tempo. In figura 69 vediamo lo schema di questa tecnica: il pump (1.55 eV) porta il sistema fuori dall’equilibrio, mentre il probe (6 eV) arriva con un certo ritardo con una energia molto maggiore del pump e fa si che il sistema fotoemetta elettroni. Si riesce ad avere uno studio dell’occupazione delle bande in funzione del tempo: in figura 69 si vede un sistema molto studiato in questi anni, un isolante topologico, cioè un sistema che misto metallo-isolante, fatto da un bulk di materiale isolante che all’interfaccia con un altro materiale forma degli stati metallici di superficie. Quello che può essere interessante studiare è proprio l’accoppiamento fra lo stato di bulk e lo stato di superficie. Abbiamo visto che eccitando un isolante que- 6 SPETTROSCOPIA RISOLTA NEL TEMPO 151 sto diventa metallico mentre un metallo tende a peggiorare le proprie proprietà metalliche e quindi tende a diventare isolante. Quello che succede, in linea di principio, è che l’isolante topologico, che possiede entrambe le fasi, se sottoposto ad un pump peggiora la parte metallica e migliora le proprietà di quella isolante. Guardando i risultati di fotoemissione si vedono le bande di bulk in basso e le bande di superficie che si incrociano e che sono metalliche. Al tempo zero si promuovono elettroni dalla banda di valenza a quella di conduzione del bulk; dopo pochi istanti, dal bulk, attraverso transizioni radiative e non, tendono a ricadere sulla banda di valenza. La cosa interessante è che si vede un accoppiamento fra gli stati di bulk e quelli di superficie: il bulk eccitato inietta portatori nelle bande di superficie che si riempiono nell’intervallo di circa 5 ps. Anche in questo caso l’iniezione da bulk a superficie è mediata dall’interazione elettrone fonone. 6.5 Diffrazione a raggi-x ultraveloce Tramite i FEL possono essere effettuati esperimenti di spettroscopia ultraveloce non convenzionali. La sorgente FEL di Stanford (LCLS) che attualmente è la più grande al mondo, produce impulsi che possono essere tunati fino a una lunghezza di 4 nm e una durata temporale di 10 fs (durata compatibile con un transizione elettronica). La repetition rate è anch’essa molto elevata: si hanno circa 30mila impulsi al secondo. Con questo laser è possibile fare diffrazione da raggi-x: se si ha un campione biologico in particolare tramite l’impulso non solo cambio lo stato del campione ma per tempi abbastanza lunghi lo posso distruggere. La velocità del suono, su scale atomiche è circa 0.1 Å in 100 fs, e ciò significa che l’impulso dura circa 10 fs, in questo tempo qualsiasi atomo all’interno del campione percorre meno di un centesimo di Å. Questo spazio è inferiore allo spazio di slegamento degli atomi del sistema sottoposti all’impulso: in pratica la sonda è così veloce da permettere di ottenere immagini del sistema prima ancora che esso si disgreghi a causa dell’impulso stesso. In figura 70 si vede che per ottenere ciò si usa un iniettore di particelle che "spara" il campione sul laser per ottenerne un’immagine prima che il campione stesso sia disintegrato. Uno dei primi esperimenti fatti con LCLS è stato lo studio dei Mimivirus: questi sono virus macroscopici rispetto ai virus normali, tanto da tendere verso la dimensione dei batteri. Questi oggetti sono virus o batteri? E’ stato dimostrato che i batteri sono in grado di prendere decisioni, e sono considerati esseri viventi, mentre i virus sono inanimati. Qual è la transizione tra vivente e non vivente? Si sono studiati i mimivirus proprio per tentare di dare una risposta a questa domanda. Per fare la diffrazione a raggi-x di una proteina la si mette in un array di proteine, cioè si tende a formare un cristallo; questo perchè la diffrazione su un cristallo produce una amplificazione coerente, e quindi si ha un’immagine di diffrazione che ha un alto contrasto anche con una radiazione di bassa intensità. Se invece prendo la singola proteina bisogna aumentare l’intensità della radiazione, che però danneggia la proteina, e quindi bisogno notevolmente ridurre la durata temporale dell’impulso. Queste condizione sono soddisfatte dai FEL. Quindi i mimivirus sono stati iniettati sul fascio di impulsi: non è stato possibile controllare l’orientazione di ogni particella, ma analizzando ogni immagine si può 6 SPETTROSCOPIA RISOLTA NEL TEMPO 152 Figura 70: Schema di un esperimento di diffrazione a raggi x ultraveloce tramite FEL. effettuare una ricostruzione della struttura del mimivirus. Quello che è stato dimostrato è che queste particelle in realtà sono dei virus, e non dei batteri, ma hanno un genoma completo e allo stato attuale sono i virus più complessi che si conoscano. 6 SPETTROSCOPIA RISOLTA NEL TEMPO (a) Il mimivirus a confronto. (b) Varie immagini di diffrazione del mimivirus: ad ogni immagine corrisponde un mimivirus diverso. (c) Ricostruzione 3D del mimivirus. Figura 71: Mimivirus studiato tramite FEL 153 RIFERIMENTI BIBLIOGRAFICI 154 Riferimenti bibliografici [1] Dispense Mazzacurati; [2] F. Bassani, U.M. Grassano; Fisica dello stato solido. [3] S. Mobilio, F. Boscherini; Syncrothron Radiation; Edizioni Springer. [4] Presentazione sulle applicazioni biologiche della spettroscopia IR, Prof. Stefano Lupi; [5] Presentazione sulla spettroscopia pump-probe, Dott. Flavio Giorgianni;