Prof. Michele Cini CORSO DI FISICA ATOMICA E MOLECOLARE Introduzione alla Fisica Teorica per Strutturisti 10 5 -2 -1 1 2 -5 -10 3 2.5 2 1.5 1 0.5 -2 -1 1 2 3 -1- Indice Capitolo 1- Preliminari 1-1 Precessione di Thomas 1-2 Variabili d'azione e angolari della meccanica e formula di Sommerfeld 1-3 Interazione di Van der Waals 3 7 14 Capitolo 2- Complementi sulla teoria di Schro "dinger 2-1 Teoria di Huckel dei doppi legami coniugati 2-2-Invarianza di gauge e covarianza galileiana 2-3-Determinanti di Slater: tecnica di calcolo degli elementi di matrice 2-4 Seconda quantizzazione per i fermioni 2-5-Funzioni di Green e rappresentazione di interazione 2-6 Spinori di Pauli e rotazioni 27 32 37 42 48 Capitolo 3-Meccanica Quantistica Relativistica Particelle di spin 0 3-1 Introduzione 3-2 Equazione di Klein-Gordon (o di Schro"dinger relativistica) 3-3 Atomi π - mesici 3-4 Interpretazione basata sulla teoria dei campi 54 56 62 58 Capitolo 4-L'elettrone relativistico 4-1 4-2 4-3 4-4 4-5 4-6 74 4-7 Una identita' matematica che useremo spesso Particella di spin 1/2 nonrelativistica Equazione di Dirac Onde piane Campo elettromagnetico esterno Rotazioni , momento angolare e covarianza relativistica 65 66 67 71 73 Equazione di continuita' 81 -2- 4-8 Parita' 83 4-9 Inversione temporale 85 4-10 Necessita' di una nuova interpretazione fisica dell'equazione di Dirac 88 4-11 Coniugazione di carica 90 4-12 Quantizzazione del campo di Dirac 92 4-13 La teoria di Dirac come generalizzazione di quella di Pauli 97 4-14 Il momento magnetico anomalo dell'elettrone Capitolo 5-L'Atomo idrogenoide 5-1-Moto in un campo centrale V(r) r 5-2 Operatore pseudoscalare r 5-3 Equazione di Dirac in forma radiale 5-4 Funzioni radiali idrogenoidi 5-5 Livelli idrogenoidi: confronto col caso non relativistico 5-6 Atomi superpesanti 5-7 Lamb shift e correzioni radiative 103 110 112 114 118 121 124 Capitolo 6-Interazioni iperfini 6-1 6-2 6-3 6-4 6-5 6-6 Natura delle interazioni iperfini Interazione col dipolo magnetico nucleare Interazione iperfine-Stati s Interazione iperfine-Stati con L≠0 Risonanze magnetiche di spin 135 1H in campo magnetico: livelli iperfini e transizioni EPR 6-7 Ricerche su H↓ 6-8 Spettri EPR di molecole 139 6-9 Costanti di schermo in NMR. Knight shift 6-10 Effetti molecolari e di stato solido in NMR: spin-spin splitting 6-11 Struttura iperfine dovuta al momento di quadrupolo elettrico del nucleo 151 6-12 Effetto Overhauser -3- 130 130 132 134 136 139 142 147 153 Capitolo 7- Il metodo di Hartree-Fock e il teorema del viriale 7-1 7-2 7-3 7-4 Stato fondamentale dell'atomo di He Lo stato piu' basso dell'Ortoelio Generalizzazione ad N elettroni Significato fisico del termine di scambio: coesione di un metallo "semplice" 7-5 Calcoli HF per gli atomi 7-6 Calcoli HF molecolari-equazioni di Roothaan 7-7 Successi e limiti del metodo di HF 7-8 Interazione di configurazioni (CI) 7-9 Risultati esatti: teoremi del viriale e di Hellmann-Feynman 156 159 164 168 170 176 Capitolo 8- Multipletti atomici. Effetto Auger 8-1 Struttura dell'atomo nell'approssimazione del campo centrale 8-2 Calcolo dei Coefficienti di Clebsh-Gordan 8-3 Simboli 3j, 6j e 9j 1 8-4 Espansione di in armoniche sferiche r12 8-5 Integrali Coulombiani atomici 201 8-6 Multipletti nella pittura LS:metodo della traccia 8-7 Stati con L e S definiti: Calcoli espliciti per la configurazione d2 8-8 Matrice dell'interazione spin-orbita per la configurazione d2 e accoppiamento intermedio 8-9 Effetto Auger 8-10 Regole di selezione Auger 185 192 194 199 205 211 216 218 223 Capitolo 9- Rappresentazioni dei Gruppi 9-1 Simmetrie delle molecole 9-2 Operatori di simmetria 9-3 Modello di Huckel del Benzene metodo elementare 9-4 Caratteri di Dirac e rappresentazioni irriducibili 9-5 Simmetria e degenerazione 9-6 Grande Teorema di ortogonalita'(GOT) 9-7 Piccolo Teorema di ortogonalita' (LOT) 9-8-Operatori di proiezione 9-9-Rappresentazione regolare -4- 227 230 235 240 246 249 253 254 Capitolo 10-Applicazioni della teoria della simmetria agli stati elettronici ed alle vibrazioni 10-1 10-2 10-3 10-4 10-2 Orbitali di H 2O,NH 3,CH4 e Benzene Il Gruppo Oh Ligand Group Orbitals Crystal field Modi normali di vibrazione 257 266 273 274 277 Capitolo 11-Tensori irriducibili:teorema di Wigner-Eckart 11-1 Operatori non invarianti 11-2 ITO (Irreducible tensor operators) 11-3 Prodotto diretto di rappresentazioni 11-4 Effetto Jahn-Teller 11-5 Riduzione della base e dei rappresentativi di un prodotto diretto 11-6 Gruppi doppi 11-7 Fractional Parentage 11-8 Teorema di Wigner-Eckart 11-9 Alcune applicazioni fisiche del Teorema di Wigner-Eckart 285 287 289 294 297 300 302 307 309 Capitolo 12-Risonanze 12-1 12-2 12-3 12-4 Risonanze:qualche esempio Risonanze di Fano Impatto di elettroni su molecole Chemisorbimento: modello di Newns 312 314 324 329 Capitolo 13- Spettroscopie elettroniche ed effetti a molti corpi 13-1 ESCA 13-2 Chemical shifts 13-3 Sdoppiamento dei livelli di core nelle molecole paramegnetiche 13-4 Shake-up, shake-off, rilassamento 13-5 Formalismo della risposta quadratica. Effetti di coerenza fra fotoemissione ed effetto Auger Capitolo 14- Spettroscopie ottiche -5- 338 341 342 345 351 effetti anelastici ed a piu' fotoni 14-1 Diffusione della radiazione in approssimazione di dipolo 358 14-2 Generazione di seconda armonica 368 14-3 Modo efficace 370 14-4 Diffusione di luce coerente 372 14-5 Fenomeni a molti fotoni: Effetto Stark dinamico 373 Capitolo 15- Correzioni relativistiche per sistemi a molti elettroni 15-1 Propagatori 15-2 Il "Mo/ller scattering" e l'interazione di Breit fra gli elettroni 15-3 Significato fisico dell'interazione di Breit 15-4 L'atomo relativistico e il metodo di Dirac-Fock 15-5 Teoria relativistica dell'interazione di Van Der Waals 384 389 393 Capitolo 16 Metodo ricorsivo di Haydock 16-1 16-2 16-3 16-4 Catena lineare e sua funzione di Green locale Funzione di Green di un sistema qualsiasi Terminatore Momenti 395 398 402 407 Capitolo 17- Metodo delle ampiezze di eccitazione 17-1 17-2 17-3 17-4 Formulazione Polarone Locale Effetto Raman risonante Complessi accettore-donore 410 412 415 417 Capitolo 18- Diagrammi di Feynman con applicazioni 18-1 18-2 18-3 18-4 Regole diagrammatiche ed equazione di Dyson 422 Fermioni non interagenti in un potenziale esterno 431 Elettroni interagenti:Self-Energy del primo ordine 432 Elettroni interagenti:Self-Energy del secondo ordine 434 18-5 Regole di Feynman per la QED 18-6 Divergenze e rinormalizzazione. Polarizzazione del vuoto -6- Capitolo 19: Interazione dinamica atomo-solido. Formalismo di Kadanoff-Baym e di Keldysh 19-1 Osservazioni sui problemi dinamici e sui sistemi lontani dall'equilibrio termodinamico 19-2 Evoluzione sul contorno: elettroni 19-3 Tecnica per calcolare combinazioni di funzioni di Green che evolvono sul Contorno 19-4 Equazione di Dyson 19-5 Contorno di Keldysh 19-6 Evoluzione sul contorno: Bosoni 19-7 Modello di Anderson non interagente per l'interazione dinamica atomo-superficie Bibliografia essenziale 438 441 444 447 452 456 457 466 -7- Prof. M. Cini -Corso di Fisica Atomica e Molecolare Premessa alla prima edizione (1992) Un corso di Fisica Atomica e Molecolare si trova a mezza strada fra la la Fisica fondamentale e la Chimica, e puo' essere impostato in molti modi ugualmente validi. Questo corso si propone come introduzione alla fisica teorica per gli studenti che, dopo aver superato gli esami del terzo anno, intendono specializzarsi in struttura della materia. Si richiede una buona conoscenza dei Corsi di Istituzioni di Fisica Teorica e Struttura, anche se certi argomenti tradizionalmente ostici vengono ripresi ed approfonditi nella parte iniziale (Capitoli 1 e 2). I Capitoli 3, 4 e 5 sono dedicati alla Meccanica Quantistica Relativistica. Ho posto in primo piano tutto cio' che e' utile agli strutturisti, sacrificando quegli aspetti che interessano essenzialmente la Fisica delle Alte Energie. Pero', ho cercato di rendere la trattazione auto-contenuta, ed il quadro teorico autosufficiente; inoltre, ho dato spazio ai risultati di ricerche recenti. Il Capitolo 6 sulle interazioni iperfini completa la descrizione dell'atomo idrogenoide, con una descrizione delle risonanze di spin e dell'effetto Overhauser. Con i Capitoli 7 e 8 inizia lo studio degli effetti dell'interazione fra gli elettroni; viene esposto il metodo di Hartree-Fock e le equazioni di Roothaan per gli orbitali molecolari, per poi sviluppare la teoria elementare degli atomi pluri-elettronici e dell'effetto Auger. I Capitoli 9-11 sono dedicati ai Gruppi, con particolare riguardo a quelli puntuali ed alle loro applicazioni. Il resto e' dedicato agli effetti a molti corpi, alle spettroscopie con cui possiamo osservarli ad a una varieta' di approcci teorici che permettono di comprenderli. Uso espressioni come "si puo' dimostrare che..." con molta parsimonia, e solo per questioni veramente marginali, perche' sono convinto che, di regola, quando una cosa si e' veramente capita, non c'e' alcuna difficolta' a dimostrarla. Gli esercizi fanno parte integrante del testo, e sono tutti svolti; lo studente dovrebbe provare a risolverli prima di guardare lo svolgimento. Non mi piace la tecnica di camuffare come esercizio quello che in realta' e' uno sviluppo della teoria generale; cosi', si tratta sempre di applicazioni piuttosto semplici che hanno lo scopo di illustrare come gli argomenti generali funzionano in pratica. Negli ultimi 5 anni, ho usato parte dei capitoli 1,2,6 e 7 per cicli di lezioni che ho tenuto per gli Studenti del Corso di Struttura della Materia, di cui e' titolare nella nostra Universita' il Prof. A. Balzarotti. Il grosso del lavoro e' stato sviluppato per non inondare di articoli e di testi consigliati i miei Studenti di Fisica Molecolare all'Universita' dell'Aquila, e successivamente quelli di Fisica Atomica e Molecolare a Tor Vergata. I capitoli finali, e specialmente il 16, il 17 e il 19, hanno un carattere piu' specialistico degli altri, e sono stati utilizzati diverse volte nei Corsi di Dottorato di Ricerca. 1 Premessa alla seconda edizione (1997) L'esaurimento della prima edizione mi da' finalmente l'opportunita' di correggere qualche mia noiosa svista e qualche errore tipografico, ed anche di aggiornare il manuale su questioni come gli atomi superpesanti, su cui la ricerca evolve rapidamente. Anche il corso si e' andato modificando, perche' ho sempre sollecitato ed ascoltato le richieste degli studenti. Cosi' ho aggiunto elementi di QED e diversi altri argomenti alla parte piu' avanzata, perche' gli studenti sono curiosi e vogliono imparare, se pensano di averne una buona 1Per una decisione del CUN, il corso si chiama adesso FISICA ATOMICA, e non piu' FISICA ATOMICA E MOLECOLARE. =2= Prof. M. Cini -Corso di Fisica Atomica e Molecolare opportunita'. Ho anche migliorato la presentazione in parecchi paragrafi, e soppresso qualche pagina inessenziale per non allungare il lavoro. =3= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Capitolo 1- Preliminari Anche i modelli piu' semplificati possono talvolta dare risultati utili, ed aiutare a capire meglio le teorie generali. 1-1 Precessione di Thomas In questo corso, studieremo la teoria relativistica del'atomo, trattando gli elettroni come particelle di Dirac interagenti attraverso il campo elettromagnetico quantizzato. Questo richiedera' una vera rivoluzione del quadro concettuale, ed e' importante non perdere di vista il fatto che alcuni risultati importanti si possono trovare anche con un formalismo molto piu' semplice e familiare, basato sul modello di Bohr e sulla meccanica relativistica. Vedremo parecchi esempi; cominciamo ora con l'interazione spin-orbita. Il momento magnetico di un elettrone e' legato al momento angolare di spin da = γS, (1) gµB dove, usando notazioni ovvie,γ= , g=2.0032, h / e h / µB=2mc =0.927 10-20 erg/Gauss. (2) Qui, e>0 ed il segno - e' dovuto alla carica negativa dell'elettrone. In questo paragrafo, tratteremo tutto come in fisica classica, ma ammetteremo che / h |S|= . (3) 2 In un campo magnetico esterno H, l'energia del dipolo magnetico e' ∆E=- .H. (4) eH Il dipolo precede con la pulsazione di Larmor ω L = g . 2mc Infatti la coppia ∧H che agisce sul dipolo deve essere uguale alla derivata del momento angolare del sistema, dS = γ S∧H ; (5) dt prendendo H parallelo all'asse z, si ha: dSz =0 dt dSx =γHS y dt =4= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dSy =- γHS x. (6) dt Chiamando allora S⊥ la componente di S perpendicolare al campo, e sostituendo in luogo di S x ed Sy S = S ⊥cos(ωt) x Sy = S ⊥sin(ωt) si ottiene una soluzione 1 se ω=-γH = - ω L . Notare che ω>0 vuol dire che la precessione avviene in senso antiorario; questo avverra' nel caso dell'elettrone, con γ<0, se H>0. Consideriamo ora l'interazione spin-orbita in un semplice modello di Bohr-Sommerfeld. Lo spin "vede" il campo prodotto dal nucleo, considerato qui come un punto con carica Ze; se l'elettrone gira in senso antiorario nel riferimento K del nucleo, sara' antiorario anche il moto del nucleo visto dall'elettrone in un riferimento K' in cui esso e' in quiete. Il campo nel riferimento K , di coordinate cartesiane x,y,z e' Ze E= - ( ), H=0. (7) r Troviamo quello nel riferimento K' dell'elettrone; lo identificheremo con il campo osservato in un sistema inerziale di coordinate x'y'z' in cui l'elettrone e' ad un certo momento istantaneamente in quiete. L'asse z lo abbiamo gia' scelto ortogonale al piano dell'orbita, ed orientato in senso tale che il moto dell'elettrone rispetto ad esso e' antiorario; naturalmente, scegliamo l'asse z' parallelo. Gli assi y e y' li prenderemo in direzione radiale. Perche' la terna sia orientata correttamente, bisogna scegliere il senso dell'asse y' in modo che punti verso il nucleo.Se x'y'z' si muove con velocita' v || all'asse x rispetto a x,y,z, si ha la trasformazione di Lorentz: E'x=Ex H' x=H x E'y = Ey -βH z H' y = v con β= e γ= 1-β 2 . c γ H y +βEz γ E'z= Ez+βH y H' z= γ H z-βEy γ , (8) 1Quantisticamente, si hanno due livelli energetici di autovalore +-∆E, e la 2∆E eH delle transizioni fra di esso vale γΗ = ω L = g . Questa e' la h / 2mc frequenza di Larmor, cioe' la frequenza di precessione classica. pulsazione =5= Prof. M. Cini -Corso di Fisica Atomica e Molecolare y x y' x' Supponendo β«1, poiche' H=0, si ha E'=E, v H' = - ∧ E. (9) c Cosi' H' ha solo la componente z', di intensita' H' z' = -βE. Si noti che la componente y' di E e' <0 (l'asse y' punta all'interno dell'orbita ed il campo elettrico e' tale da respingere una carica positiva); H'z' e' pertanto positivo e la precessione dello spin avviene in senso antiorario. Calcolando ∆E nel sistema dell'elettrone, si ottiene gµB ∆E' = - ⋅H' = S⋅(v ∧E) . (10) h /c p dV r Posto v≈ , eE = si trova m dr r g dV g dV ∆E' = S⋅(p ∧r) = S⋅L 2 m 2c 2r dr 2 m 2c 2r dr 1 dV ≈S⋅L , (11) 2 2 m c r dr dal momento che g≈2. Vedremo a suo tempo che la teoria di Dirac per β«1 fornisce per l'interazione spin-orbita un valore che e' la meta' di questo. Il fattore 2 in questione e' dovuto alla precessione di Thomas: detto grossolanamente, dipende dal fatto che il sistema dell'elettrone, osservato dal nucleo, ruota su se stesso. Vediamo meglio di che si tratta. v L'elettrone e' visto dal nucleo girare con frequenza ν = 2πr v , ovvero con pulsazione ω = . Supponiamo che l'elettrone r emetta un segnale ogni volta che attraversa l'asse x; un osservatore sul nucleo potrebbe contare le orbite dell'elettrone semplicemente contando i segnali. L'elettrone invece vedrebbe il =6= Prof. M. Cini -Corso di Fisica Atomica e Molecolare nucleo ruotare intorno a se', e constaterebbe che esso compie una rivoluzione completa nel tempo fra un segnale e l'altro. In altri termini, due osservatori nei due sistemi sarebbero d'accordo sul numero di giri fatti fra il segnale n e quello n+1000. Pero', non concorderebbero sulla durata dell' intervallo di tempo intercorso: tempi e frequenze stanno nella relazione ν't' =νt. (12) I due sistemi di riferimento non sono affatto equivalenti, perche' quello dell'elettrone e' accelerato. Il tempo misurato nel sistema dell'elettrone e' un tempo proprio, e percio' t'=t 1-β 2 . (13) Ma se il tempo impiegato per percorrere un certo numero di giri ν e' piu' corto in K', la frequenza ν' = con cui l'elettrone 1-β 2 vede girare il nucleo e' maggiore che in K. La differenza fra le due frequenze e' ν' β2 v v2 ∆ν ≡ ν'-ν = ν[ ν - 1] ≈ ν [1+ -1] = . 2 2πr 2c 2 C'e' un modo ovvio per giustificare classicamente il fatto che le frequenze sono diverse: il sistema dell'elettrone ruota anche su se stesso, in modo da accelerare la frequenza apparente del moto del nucleo. Poiche' il nucleo viene visto girare in senso antiorario, il sistema K' sta ruotando su se stesso in senso orario. y' x' La precessione dello spin avviene, come si e' visto, in senso antiorario; precisamente, la pulsazione con cui avviene e', in K' ω' = 2∆E' 2 gµB =| S⋅(v ∧E.) |≈ h / h / h /c 2 e h / 1 h / evE ≈ | ⋅2⋅ ⋅v E.| = . h / 2mc h /c 2 mc 2 =7= (14) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Noi vogliamo conoscere l'interazione spin-orbita nel sistema del laboratorio, e quindi dobbiamo convertire ω' nella quantita' corrispondente ω misurata in K. A tal fine dovremo sottrarvi la pulsazione v v2 ∆ω = 2π ∆ν = ; 2c 2 r v2 eE ma e' l'accelerazione , uguale ad in questo modello; quindi r m ω' v eE ∆ω = = ; (15) 2 2c m 2 questo finalmente spiega perche' il risultato debba essere dimezzato. 1-2 Variabili d'azione e angolari della meccanicae formula di Sommerfeld Variabili d'azione e angolari Consideriamo il moto di un sistema classico con un grado di liberta', cioe' di un punto materiale in un potenziale arbitrario ad una dimensione. Supponiamo che per una certa energia E la particella sia in uno stato legato. La particella oscilla fra due punti di arresto tali che U=E, dove U e' l'energia potenziale, ed il moto e' periodico. Vogliamo mostrare che il problema meccanico e' ridotto alle quadrature, e la frequenza puo' essere ottenuta calcolando un integrale ed una derivata. Sia q la coordinata lagrangiana. L'equazione H(p,q) = E (1) consente di conoscere la curva p=p(q), che definisce la traiettoria del sistema nello spazio delle fasi. Definiamo allora la variabile d'azione J = ∫o pdq (2) dove l'integrale e' preso lungo il contorno, e pdq>0 ovunque. Poiche' J e' l'area della curva, e questa e' percorsa sempre allo stesso modo, ci aspettiamo che J sia una costante del moto; verificheremo questa proprieta'. Il legame fra J ed il periodo T si stabilisce come segue. Poiche' nella regione esterna alla curva H cresce senza limiti, la regione interna e' caratterizzata da E>H; quindi J =∫ ∫ dpdq θ(E-H(p,q)), (3) =8= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e si ha ∂J = ∫ ∫ dpdq δ(E-H(p,q)) . ∂E Integriamo su p usando la nota formula1 ∞ ∞ ⌠ δ(x-x ) ∫dxδ(g(x)) = ∑α dx dg α -∞ | | dx ⌡ -∞ , dove l'indice α corre sulle radici di g(x)=0. Nel presente problema, ci si possono aspettare due valori di p, l'uno positivo e l'altro negativo, che contribuiscono all'integrale per ogni q. Il risultato e' p dq | | q qmax ∂J = ∫ dq ∂E qmin {[ 1 ∂H | | ∂p ]E=H(p,q),p>0 +[ ∂H1 ]E=H(p,q),p<0}. | ∂p | (4) Ma, per l'equazione di Hamilton ∂H =q , ∂p (5) 1Questa formula puo' pensarsi ottenuta spezzando l'asse x in tanti intervalli dove g(x) e' monotona ed eseguendo un cambiamento di variabili in ciascun intervallo. =9= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dq , pari ai due dq dt tempuscoli trascorsi in dq all'"andata" e al "ritorno". Possiamo convertire il risultato in un integrale sulla traiettoria, scrivendo ed ogni dq dara' due contributi positivi ∂J = ∂E 1 ∫o dq [ ∂H ]E=H(p,q) = ∫o ∂p dq = ∂q ∂t = ∫o dt = T. (6) Di conseguenza, la frequenza e' data da ∂E = ν. (7) ∂J Questa a sua volta puo' essere considerata come una nuova equazione di Hamilton, in cui E = E(J) e' la nuova hamiltoniana e J il nuovo momento. Sia W la nuova coordinata, canonicamente coniugata a J, che prende il nome di variabile angolare. Si ha ∂E dW = = ν ⇒ W=νt + costante. ∂J dt Il moto e' quindi uniforme. Inoltre, (8) ∂E dJ = =0, (9) ∂W dt il che conferma che J e' una costante del moto. In un sistema con piu' gradi di liberta' qk bisogna cercare di separare le variabili in modo che sia Jk sia una costante del moto. Se questo e' possibile, ed il moto e' periodico, possiamo usare questa tecnica per ricavare le frequenze. Problema di Keplero Poiche' il potenziale e' U=U(|r|), M=r∧p e' conservato ed il moto e' piano. Prendiamo coordinate polari. La lagrangiana e' dφ 1 dr L= m [ ( ) 2 + r2 ( ) 2 ] -U(r), 2 dt dt (10) con Mm . (11) r Passiamo al formalismo hamiltoniano. La variabile φ e' ciclica, U(r)= -G =10= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∂L dpφ dφ ∂φ = dt =0 ⇒ pφ =mr2dt e' conservato. Pertanto, la variabile d'azione J φ = ∫opφ dφ = 2π pφ (12) e' una costante del moto. dr Inoltre, pr =m e l'hamiltoniana e' dt dqi pr 2 pφ 2 H= ∑ pi -L = + + U(r). dt 2m 2mr2 i Quindi ricaviamo pr = 2mE + 2GMm2 pφ 2 r r2 (13) . (14) Il problema e' ormai unidimensionale, ed anche Jr e' un integrale del moto: si ha 1 J r = ∫opr dr = -2πpφ + πGMm La relazione Jr =-J φ +πGMm 2m . -E (15) 2m , risolta per E, da' la nuova -E hamiltoniana 2π 2G2M2m3 E=; (J r +J φ ) 2 quindi le frequenze (16) 1 J e' l'area della superficie delimitata dalla curva r pφ 2 γ y2 + = 2m(E+ ), dove γ =GMm. Si tratta di una superficie simmetrica x2 x x2 ⌠ rispetto all'asse x, e l'area puo' scriversi come 2 dx ⌡ γ α2 2m(E+ )- 2 , dove x1 x x x1 x-x 1 2 e x2 sono le radici di y=0. Posto =t , si puo' trasformare l'integrale in x2-x ∞ J r = 2(x2-x 1) 2 ⌠ t2 -2mE dt ; il calcolo si completa col teorema ⌡ (1+t2) 2(x 1+x2t2) -∞ dei residui, e non presenta problemi,anche se e' noioso. =11= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∂E 4π 2G2M2m3 νr =νφ = = (17) ∂J r (J r +J φ ) 3 sono uguali. Questo implica che le orbite nello spazio reale sono chiuse. Nel modello di Bohr dell'atomo idrogenoide, GMm → Ze2, 2π 2Z2e4m E=; (J r +J φ ) 2 (18) con la condizione di quantizzazione Ji = ni h si ottiene Z2e4m , 2h / 2n2 con n = nr +nφ numero quantico principale. En =- (19) Atomo di Bohr-Sommerfeld relativistico Il metodo si applica altrettanto bene in relativita' ristretta. La lagrangiana di una particella in un campo elettromagnetico e' e L = L0 + v⋅A - U c dove v2 c2 e' quella di una particella libera1. Per il problema dell'atomo, la lagrangiana e' dunque L0 = - m c 2 L=-mc2 1- dφ 1 dr Ze2 1- 2[( ) 2 + r 2( ) 2] + . c dt dt r (20) Eseguendo le derivate richieste, si trova 1 Ad esempio, in coordinate cartesiane, ∂L ⋅ = ∂xi ⋅ mxi + e A . c i v2 c2 Nel formare le equazioni di Lagrange 1- d ∂L ∂L = dt ⋅ ∂xi ∂xi si deve tener presente che dAi ∂A i ∂A i = + vk ; dt ∂t ∂xk e' immediato allora ottenere le corrette equazioni del moto, con la forza di Lorentz. =12= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dr dt , v2 1- 2 c m pr = dφ mr2 dt pφ = ; v2 1- 2 c quindi H= pφ 2 m2c 4+c 2(p r 2+ 2 ) r - Ze2 . r (21) Giova notare che dφ dr 2 ) +(mr )2 2 p dt dt m2v2 φ pr 2+ 2 = = = p2. r v2 v2 (1- 2) (1- 2) c c Di nuovo, pφ e' conservato,e Jφ =2πpφ e' una costante del moto. Posto H=E, ricaviamo p r da m2( Ze2 2 pφ 2 [E+ ] = m2c 4 +c 2[pr 2+ 2 ] ; r r otteniamo pr = Ze2 2 [E+ ] r p 2 2 - φ . m c c2 r2 (22) Quindi, Jr = ∫o pr dr e' lo stesso integrale di prima, con le sostituzioni E2 Z2e4 2mE → 2 -m 2c 2 , pφ 2 → pφ 2 - 2 c c Viene J r =2π { - pφ 2- Z2e4 + c2 , 2GMm 2 → Ze2E c2 E2 m2c 2 - 2 c }. 2Ze2E . c2 (23) Con un po' di algebra, possiamo di nuovo esprimere E in termini di J, ottenendo =13= Prof. M. Cini -Corso di Fisica Atomica e Molecolare mc 2 E= . 4π 2Z2e4 c2 1+ [Jr +Jφ 1- (24) 4π 2Z2e4 ]2 c 2J φ 2 ∂E ∂E In questo caso le frequenze νr = e νφ = sono diverse, il che ∂J r ∂J φ significa fisicamente, nell'ambito della teoria classica, che l'elettrone compie orbite a rosetta. Dopo aver imposto condizioni di quantizzazione alla BohrSommerfeld, occorrono due distinti numeri quantici per individuare un livello energetico. Posto Jr =Nh, Jφ =Kh, mc 2 E(N,K) = 1+( Zα , )2 N+ K2-Z2α 2 e2 dove α= e' la costante adimensionale di struttura fine. /c h Ritroveremo questa formula nella teoria di Dirac1. 1-3-Interazione di Van der Waals L'interazione fra atomi o molecole in un gas o in un liquido e' dovuta essenzialmente alle forze di dispersione. Nell'approssimazione di Hartree-Fock, il campo elettromagnetico generato da un atomo e' dovuto ad un nucleo pressoche' puntiforme circondato da una nuvola di elettroni. Riducendo cosi' il problema all'elettrostatica, si dovrebbe concludere che due atomi in stati S, le cui densita' di carica hanno simmetria sferica, e decrescono esponenzialmente con la distanza dal nucleo, a grande distanza hanno interazioni elettriche di intensita' esponenzialmente decrescente. Ma in realta' il potenziale di Van der Waals decresce con la sesta potenza inversa della distanza. Si tratta di un effetto di correlazione. Gli elettroni sono cariche puntiformi, e la nuvola descrive solo la loro distribuzione media; anche se i due atomi sono distanti, i singoli elettroni dell'uno possono correlarsi con quelli dell'altro, e la conseguenza e' il potenziale di Van der Waals. Per far risaltare le 1Non vi e' dubbio che tale coincidenza sia in parte fortuita. Vedremo che nella teoria di Dirac gioca un ruolo essenziale lo spin dell'elettrone, che ai tempi della teoria di Bohr-Sommerfeld non era stato ancora scoperto. Inoltre, la formula perde senso se Z cresce al di la' di un valore critico. Parleremo di questo a tempo debito. =14= Prof. M. Cini -Corso di Fisica Atomica e Molecolare caratteristiche essenziali di queste forze dispersive, cominceremo usando un modello ultra-semplificato dell'atomo. 1-Modello semiclassico Consideriamo un atomo di Thomson. Un elettrone si muove dentro una sfera di raggio a dove e' distribuita uniformenente una carica |e|, e quindi e' soggetto alla forza elastica -e 2 e2 F= 3 r =-fr, f= 3 ; (1) a a f la pulsazione del moto e' ω0= . Se il centro dell'atomo e' in m Rc , il potenziale generato in un punto x fuori dall'atomo e' V(x)= e{ 1 1 }; |Rc -x| |Rc +r-x| (2) lontano dall'atomo (||x-Rc |>>a) si puo' usare la nota formula 1 1 d⋅R 1 -d2 3(d⋅R) 2 ≈ + 3 + [ 3 + ] +... |R-d| R R 2 R R5 (3) Per inciso, non occorre calcolare la serie di Taylor per proseguire questa espansione. E' molto piu' efficiente scrivere 1 1 = |R - d| R dove n = d d⋅n d 1+( ) 2-2( )( ) R d R , R , e utilizzare la funzione generatrice dei polinomi di Legendre R 1 dove 1 1-2hz+h 2 = ∞ n ∑ h P n(z). n=0 1 d Pn(x) = n ( ) n(x 2-1) n. dx 2 n! I primi sono 3x2-1 5x3-3x P 0 =1, P1=x, P2= , P3= , 2 2 e tutti gli altri si possono trovare con la formula di ricorrenza (n+1)Pn+1(x) -(2n+1)xPn(x) +nP n-1 (x) =0. d d⋅n Pertanto, con h= , z=( ), abbiamo R r =15= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 1 3z2-1 5z3-3x = {1+hz +h2 +h3 +...} |R - d| R 2 2 ed i primi termini sono quelli scritti sopra. Fermandosi al primo ordine, si trova la forza su un secondo elettrone in x -r 3(r⋅R)R e∇ xV(x)= e 2{ 3 + }, R R5 (4) dove R=Rc -x. r1 1 r 2 x R Se ora abbiamo due atomi a distanza R, l'equazione del moto per l'elettrone 1 e' (usando la forza al centro del primo atomo) d2r1 -r2 3(r2⋅R)R m =-fr1 + e2{ 3 + }; (5) 2 dt R R5 in componenti, se R e' parallelo all'asse x, d2x1 =-fx 1 + 2γx2 dt2 d2y1 m =-fy1 - γy2 dt2 d2z 1 m =-fz1 + -γz 2 dt2 m dove e2 γ= 3 . R Le equazioni del moto dell'elettrone 2 si ottengono scambiando gli indici; ne risulta che abbiamo i seguenti oscillatori armonici: x1+x2 x1-x 2 ω 2= ω1= f-2γ γ γ2 ≈ ω 0[1 - ] m f 2f2 f+2γ γ γ2 ≈ ω 0[1 + ] m f 2f2 =16= Prof. M. Cini -Corso di Fisica Atomica e Molecolare y1+y2 ω3= z 1 +z 2 ω4=ω3 y1-y2 ω 5= z 1-z 2 f+γ γ γ2 ≈ ω 0[1 + ] m 2f 8f2 f-γ γ γ2 ≈ ω 0[1 ] m 2f 8f2 ω6=ω5 . x x2 Poiche' γ<<f, si puo' espandere con (1+x)1/2≈1+ . 2 8 Quantizzando, troviamo l'energia dello stato fondamentale 3γ2 1 6 E(R) = h / ω 3h / ω h / ω (6) ν= 0 0 4f2 . 2 ∑ ν=1 Il potenziale di Van der Waals risulta dato dalla correzione 3 a ∆E(R) = - h /ω 0 ( ) 6. Sostituendo a 3 con la polarizzabilita' α ( 4 R cioe' trattando l'atomo come una sferetta metallica classica) e /ω 0 con una energia caratteristica di eccitazione, o con il h potenziale di ionizzazione I ( il che e' corretto come ordine di grandezza) si ottiene 3 α2 I . (7) 4 R6 Per esempio, per due molecole di CH4 a distanza di 3.8Å, che e' la separazione media nel liquido, l'interazione vale 0.02 eV. ∆E(R) = - 2- Teoria quantistica non relativistica La geometria e' illustrata in Figura =17= Prof. M. Cini -Corso di Fisica Atomica e Molecolare r 12 1 r 2 r b2 r b1 a1 r a2 r a b ab L'energia potenziale di interazione fra gli atomi e', in unita' atomiche, 1 1 1 1 1 1 1 1 + = + ; rab ra2 rb1 r12 R |R+rb2| |R-ra1| |R-ra1+rb2| (8) R dove R=rab; espandiamo tutto; con n= , R V= V= 1 1 + R R ∑ {-( -rb2⋅n ra1⋅n rb2 n ra1 n ) Pn ( ) -( ) Pn ( )+ R rb2 R ra1 n (ra1-rb2)⋅n |ra1-r b2| n +( ) Pn ( )}. R |ra1-r b2| (9) I termini con n=0 e con n=1 danno 0. Per n=2, con un po' di algebra, si ottiene l'interazione dipolo-dipolo -(ra1⋅rb2)+3(ra1⋅n)(rb2⋅n) V= +...; R3 (10) per n=3 c'e' l'interazione dipolo-quadrupolo , in R-4 , per n=4 la quadrupolo-quadrupolo, in R-5 , etc 1. Le espressioni di questi termini sono complicate. 1lo sviluppo formale della teoria dei multipoli si trova ad esempio sul volume "Teoria dei campi" di Landau e Lifchitz, Capitolo V. =18= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Come vedremo, il momento di dipolo medio di un atomo e' sempre nullo, su qualsiasi stato stazionario, ma se L≠0 e J> 1/2, il momento di quadrupolo1 e' diverso da 0. Vediamo un esempio. Esercizio: a) Mostrare che Q=0 per gli stati s e p. b)Determinare Q per un atomo di Idrogeno nello stato |nlm>=|322>. Soluzione: Dobbiamo trovare il valore di aspettazione di Qzz=-|e| (3z2- r 2)=-|e| r2(3cos2(θ)-1). Allora a) E' chiaro che 1 1 ∫d(cos(θ))(3cos2(θ)-1) = ∫d(cos(θ))cos(θ)(3cos 2(θ)-1) =0. -1 -1 b)Per la media angolare con l' armonica sferica Y 22= si ha 15 sin 2(θ) e 2i φ 32π 15 1 ∫dx(1-x 2) 2(3x2-1)= -4 . <Y22|(3cos 2(θ)-1)|Y 22>= 16 -1 7 a2n 4 3 L(L+1)-1/3 Inoltre si sa che <r2>nlm= 2 [1 + {1}], 2 Z n2 dove a e' il raggio di Bohr; pertanto, <r2>322= 126a2; infine, <Qzz>322=72|e|a2. Se Q≠0, la distribuzione media di carica dell'atomo da' luogo ad un potenziale che decresce con R-3 . Pertanto, l'interazione fra due atomi dotati di momento di quadrupolo si ottiene gia' al primo ordine della teoria delle perturbazioni, e va come R -5 . Pero', dipende dall'orientazione relativa dei momenti angolari, ed e' nullo in media. Se Q=0, il potenziale medio decresce rapidamente con la distanza ed il contributo che decresce piu' lentamente viene dal secondo ordine. Infatti, supponiamo di avere due atomi identici nello stato fondamentale, e che questo sia di tipo S. Il termine dominante dell'interazione si ottiene trattando al secondo ordine -(da⋅db)+3(da⋅n)(db⋅n) R3 dove d e' l'operatore dipolo; cosi' ~ <g|V|α><α|V|g> ∆E = ∑ , Eg -Eα α V= dove ~ ∑ (11) (12) esclude α=g; esplicitando gli stati dei due atomi, α≠g |g>=|00> e gli |α> sono stati eccitati del tipo |α>=|ij>; le energie, in 1Si chiama momento di quadrupolo Q di un atomo la componente zz del tensore di quadrupolo Qik =-|e| elettroni. ∑ {3 xpi xpk - δik r p2}, dove ∑ somma sugli p p =19= Prof. M. Cini -Corso di Fisica Atomica e Molecolare termini dei livelli atomici sono, in notazione ovvia, Eg =2ε0 , Eα = εi +εj . Prendendo n lungo l'asse x, a numeratore di V abbiamo 2dax dbx -day dby -daz dbz; sostituendo nella (12), i termini "in croce" del tipo <00| dax dbx |ij><ij|day dby |00>= <0|dax |i><i|day |0><0|dbx |j><j|dby |0> sono nulli per simmetria. Infatti , <0|dax |i> ≠0 se |i> si trasforma come un orbitale Px; ma in tal caso <i|day |0>=0. Rimangono i contributi del tipo <00| dax dbx |ij><ij|dax dbx |00> e quelli dove figurano le componenti y e z. Gli elementi di matrice ovviamente dipendono dalla componente, ma la somma su i e j no, perche' comporta la somma sulle componenti Px, Py ,Pz degli stati dei due atomi. Pertanto, ~ 6 ∆E= 6 R |(d ax ) 0i|2|(d bx ) 0j|2 . 2ε0-εi -εj ∑ ij (13) Fare calcoli dettagliati con questa formula non e' banale, perche' ci sono infiniti stati discreti ed un continuo per ogni atomo. E' utile vedere la relazione fra ∆E e la polarizzabilita' α. Calcoliamola a partire dalla definizione P α= , E dove P e' il momento di dipolo indotto ed E l'intensita' del campo elettrico. La perturbazione e' H' =-eEx, quindi la funzione d'onda perturbata al primo ordine e' |ψ> = |0> + e il dipolo e' (H') i0 ∑ ε - ε |i>, i≠0 0 i P= <ψ|ex|ψ> = 2 pertanto, α =2 Ora, ∑ i≠0 ∑ i≠0 <0|ex|i><i|-eEx|0> ; ε 0- ε i |<0|dx |i>|2 . εi - ε0 ε i +ε j-2ε 0 1 1 + = ε i - ε 0 ε j- ε 0 (ε i - ε 0)(ε j- ε 0) ; ne segue che =20= Prof. M. Cini -Corso di Fisica Atomica e Molecolare α 2=4 8 = I ∑ |<0|dx |i>|2|<0|dx |j>|2 1 1 [ + ]= ε i +ε j-2ε 0 ε i - ε 0 ε j- ε 0 ij≠0 ∑ |<0|dx |i>|2|<0|dx |j>|2 , ε i +ε j-2ε 0 ij≠0 dove I e' una qualche media delle energie di eccitazione ε i - ε 0 dell'atomo. La somma che abbiamo ottenuta e' la stessa che compare nell'espressione del 3 α2 potenziale di Van der Waals, e permette di scrivere ∆E(R) = - I 6 , come 4 R nella teoria semiclassica. In questo spirito fenomenologico si usa, per l'interazione fra oggetti diversi, come un atomo ed una molecola, la seguente forma simmetrizzata del potenziale di interazione: 3 I aI m α aα m ∆E(R) = 2 I a+I m R 6 Occorre una stima degli ordini di grandezza. Per la polarizzabilita' e2 dell'atomo di H, possiamo sostituire ε i - ε 0 sotto la sommatoria con ; allora 2a0 resta ∑ |<0|dx |i>|2 α≈2 i≠0 = 4 e2 2a0 Poiche' |<0|dx 2|0> = <0|dx 2|0> e2 a0 . 1 |<0|r2|0> = a02, resta α≈ 4a03. Una stima piu' accurata 3 9 3 a . Si puo' dare una stima analoga dell'ordine di grandezza 2 0 del potenziale di Van der Waals fra due atomi di H nello stato fondamentale; e2 con 2ε 0- ε i - ε j≈ − si ha a0 darebbe α≈ 6a0 6 ~ 2|(d ) | 2 = ∆E= |(d ) | (dax 2) 00(dbx 2) 00= ∑ ax 0i ax 0j e 2 ij R 6e2 6 R a0 6a0e2 1 2 6e2a05 2==| (r ) | 00 3 R6 R6 Margenau nel 1931 ha continuato l'argomento dando stime dei contributi che vengono (al secondo ordine) dalle interazioni di dipolo-quadrupolo e di quadrupolo-quadrupolo. Il risultato e' ∆E ≈ - 6e2a05 - 135e2a07 - 1416e2a09 ; R6 R8 R 10 e' evidente che le correzioni diventano importanti alle piccole distanze. Aumentando di uno l'ordine del multipolo, si ha un ulteriore fattore R-1 nella perturbazione, e quindi un fattore R -2 in ∆E. Per R cosi' piccolo che le nuvole elettroniche degli atomi si sovrappongono significativamente, entrano in gioco i legami chimici, e infine una intensa repulsione dovuta in ultima analisi al fatto che la densita' di energia cinetica di un gas di =21= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elettroni cresce con la potenza 5/3 della densita'. Quando possiamo prescindere dalle forze chimiche, come ad esempio nel caso dei gas nobili, dobbiamo completare il potenziale attrattivo con un nocciolo duro repulsivo. Di solito si usano forme parametrizzate del potenziale di interazione. Il piu' comune e' il potenziale di Lennard-Jones r m 12 rm ) -2( ) 6], R R dove A e' la profondita' e rm la posizione del minimo. La teoria su esposta e' quantistica ma non relativistica (quella relativistica e' presentata nel Capitolo 15). Non e' rigoroso usare l'elettrostatica quando si tratta di cariche in movimento, come gli elettroni. Benche' noi abbiamo supposto R grande, l'uso dell'elettrostatica comporta che R sia piccolo rispetto alla lunghezza d'onda λ della prima transizione atomica. Infatti, per R>> λ si trova 23 α 2 ∆E = . 4π R 7 Tuttavia R>>λ comporta distanze dell'ordine delle migliaia di Å; l'espressione non relativistica proporzionale a R -6 vale gia' a qualche Å di distanza ed e' quella che interessa nei fenomeni chimici e nella maggior parte delle applicazioni. ∆E(R) = A[( 3-Il problema dell'additivita' Le forze di polarizzazione classiche non sono additive: basta pensare ad una carica puntiforme che interagisce con due sfere metalliche. Nemmeno l'interazione di Van der Waals fra N atomi puo' essere espressa rigorosamente in termini di interazioni fra coppie di atomi. I contributi a 3 corpi sono complicati, e diventano importanti a breve distanza; ci sono poi i contributi a 4 corpi, che diventano importanti a distanza un po' piu' breve, e cosi' via. Quindi il potenziale di Van der Waals non e' un potenziale in senso ordinario, ed e' difficile lavorare con una teoria rigorosa delle forze di dispersione che descriva ad esempio le interazioni fra solvente e soluto. Fra l'altro, la serie (termine a 2 corpi +termine a 3 corpi+...) ∞ = ∑ ∆ En converge assai lentamente. Altrettanto difficile e' dare n una stima analitica quantitativa della parte repulsiva. Tuttavia le cose si semplificano se le distanze sono cosi' grandi da rendere trascurabili i termini di dipolo-quadrupolo e superiori. Al second'ordine, e' facile verificare che l'interazione diventa additiva. Per esempio, per 3 atomi, potremo porre |ikl>=ψai (1)ψbk (2)ψcl (3), ∆E = ~ ∑ ikl |<000|V|ikl>| 2 , εa0+εb0+εc0-εai -εbk -εcl =22= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove V=V(1,2)+V(1,3)+V(2,3) e' la somma delle interazioni dipolari. Tutti i termini con i≠0,j≠0, k≠0 sono nulli perche' <ψai |ψaj >=δij ; i termini con un solo indice diverso da 0 sono nulli anch'essi, perche' (d) 00=0; rimane ∆E = |<000|V|ik0>| 2 |<000|V|0kl>| 2 |<000|V|i0l>|2 + ∑ + ∑ . εa0+εb0-εai -εbk εb0+εc0-εbk -εcl εa0+εc0-εai -εcl i≠0k≠0 l≠0k≠0 i≠0l≠0 ∑ Inoltre, e' immediato vedere che <000|V|ik0>=<00|V(a,b)|ik>,quindi ogni termine e' giusto l'interazione di una coppia di atomi. 4-Fisisorbimento con interazione a coppie Consideriamo un atomo a distanza d da una superficie, e supponiamo che l'interazione con la superficie sia la somma delle interazioni con ciascuna molecola. Questo richiede che nel solido le molecole conservino la loro individualita', e questo e' ragionevole per certi cristalli isolanti. Allora, in notazione ovvia, 3 IaImα aα m 1 . (14) ∑ 2 Ia+Im R 6 m am Se d e' grande rispetto al parametro reticolare, possiamo passare al continuo con ∆E(d) = - ∑ → ρ ∫ d r, m dove ρ e' la densita' di molecole; α mρ e' la polarizzabilita' per unita' di volume. Poiche' ∞ ∞ ∞ 1 ∞ ∞ ∞ ∞ 1 1 dz dx dy = dz 2π τdτ = π ∫ ∫ ∫ r6 ∫ ∫ (τ2+z2) 3 ∫dz ∫du(u+z 2) 3 d -∞ -∞ d 0 d 0 ∞ 1 π = π ∫dz 4 = 3; 2z 6d d ∆E(d) = - π 3 IaImα aα m ρ . 2 Ia+Im 6d3 =23= (15) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Quindi, la parte attrattiva dell'interazione e' inversamente proporzionale al cubo della distanza. Questa legge e' qualitativamente corretta, e mostra che l'interazione ha relativamente lungo raggio; cio' spiega perche' sia cosi' difficile lavorare con superfici pulite. Tenendo conto della parte repulsiva, che in pratica fissa la distanza di equilibrio, si ottengono energie di legame dell'ordine di 0.2 eV. Per l'adsorbimento su un metallo, Lennard-Jones nel 1932 propose un modello, basato sull'ipotesi che il conduttore schermi i campi in modo perfetto. Una carica q a distanza d dalla superficie interagisce con la sua immagine. -q q d d L'energia dell'interazione con una carica -q esterna sarebbe -q 2 ; 2d trattandosi di una energia di polarizzazione, il potenziale immagine e' -q 2 ∆E= . 4d Il fattore 1/2 viene dall'integrazione su q. Per un atomo di Idrogeno, con il nucleo a distanza d dalla superficie e l'elettrone che ha un raggio vettore r=(x,y,z) rispetto al nucleo, -e e d d -e e =24= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∆E(d) = 1 -e 2 -e 2 { + +2 2 2d 2(d+z) e2 x2+y2+(z+2d)2 }= -e 2(x 2+y2+2z 2) = +O(d -4 ), 16d3 (16) <r2> e per un atomo sferico, con <x2>=<y2>=<z 2>= , si ottiene 3 -e 2<r2> . (17) 12d3 In sostanza, l'andamento e' quello trovato prima per il caso dell'isolante. Il difetto maggiore di questo argomento e' che un metallo non puo' rispondere istantaneamente al moto dell'elettrone; tipicamente, le frequenze atomiche ultraviolette dei gas inerti sono piu' alte della frequenza di plasma, e quindi il metallo e' trasparente ed incapace di uno schermo perfetto come quello descritto dal potenziale immagine. Per questi motivi, Margenau e Pollard (1941) proposero di dividere il metallo in elementi di volume e di trattarli come le molecole dell'isolante; Im viene interpretato come l'energia di plasma. Per la polarizzabilita' per unita' di volume α mρ il risultato dipende dalla 3 forma: per una sferetta di raggio a, α=a3 , e troviamo ; per una 4π 1 lastra, troveremmo ; Margenau e Pollard salomonicamente 4π 1 presero α mρ= . Allora, con le approssimazioni usuali per 2π 1 l'atomo di H (α a≈4a03, Ia≈ ) e con <r2>=3a02, si ottiene 2a0 ∆E(d) = -e 2<r2> Im ; 12d3 Ia+Im il risultato di Lennard-Jones e' confermato se I a<<Im. ∆E = (18) 5)Interazioni di Van der Waals intramolecolari e conformazioni. Consideriamo una molecola organica complicata 1 come la S-metil-L-metionina (SMM), che si trova nelle piante superiori e viene impiegata nella cura dell'ulcera. 1Questo esempio e' tratto da recenti lavori pubblicati dal gruppo del Prof. Claudio Quagliata dell'Universita' di Roma 1, che ringrazio per utili conversazioni sul problema. =25= Prof. M. Cini -Corso di Fisica Atomica e Molecolare OH O C SMM Ψ1 NH2 CH CH3 CH3 CH2 Ψ4 S Ψ2 Ψ3 CH2 Le distanze interatomiche sono note dai raggi X per la forma standard cristallina; gli angoli delle sezioni rigide sono noti e sono quelli che si trovano in molecole simili. I legami σ hanno simmetria cilindrica intorno al loro asse e sono sono "girevoli" , cioe' basta poca energia per farli ruotare su se stessi; sono indicati gli angoli Ψ che determinano la conformazione. Quella dello stato fondamentale e' stabilizzata dalle forze elettrostatiche e da quelle dispersive. Per determinare la conformazione, occorre: 1)Esprimere tutte le distanze interatomiche in funzione dei quattro Ψ. 2)Calcolare le cariche qi sui singoli atomi (con metodi semiempirici). 3)Calcolare il contributo elettrostatico all'energia ∑ qi qj . rij 4)Aggiungere l'interazione di Van der Waals usando e-br V(r)= a d -cr-6 , (19) r con parametri a,b,c,d semiempirici (ottenuti da dati di mobilita' nei solidi, viscosita' dei gas, secondo coefficiente del viriale, fit della distanza di equilibrio, etc.). Questi parametri sono diversi per ogni coppia di atomi. 5)Minimizzando l'energia rispetto agli Ψ, si trova la conformazione di equilibrio (a T=0); si possono studiare poi anche le barriere rotazionali. Se i minimi sono piatti, vuol dire che la molecola e' deformabile. Il metodo conduce di solito a buoni risultati, anche se la conformazione calcolata non corrisponde sempre al minimo assoluto. L'approccio e' pero' inadeguato se ci sono legami a =26= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ponte di Idrogeno. Questi ultimi sono dovuti ad un protone che si delocalizza in un potenziale a doppio minimo, e richiederebbero una descrizione quantistica dei gradi di liberta' nucleari. Capitolo 2- Complementi sulla teoria di Schro "dinger Approfondiremo svariati argomenti di meccanica quantistica, in parte noti dai Corsi di Istituzioni di Fisica Teorica e Struttura della Materia, che hanno immediate applicazioni in Fisica Atomica e Molecolare o che sono particolarmente importanti per il seguito. 2-1 Teoria di Huckel dei doppi legami coniugati Nel metodo LCAO gli orbitali molecolari Ψ i ed i livelli energetici Ei si ottengono espandendo gli orbitali sulla base degli orbitali atomici φν , Ψi = ∑ ν c iν φν (1) e risolvendo le equazioni S µν =(φµ|φν ) (2) ∑ c iν [H µν -Ei Sµν ] = 0, ν che estremizzano <H> sotto il vincolo della normalizzazione. La teoria di Huckel e' un particolare approccio LCAO, specializzato al calcolo di orbitali associati ai doppi e tripli legami C-C che sono tipici degli idrocaburi insaturi. Piu' in generale, la teoria si applica alle molecole con doppi legami coniugati, contenenti catene del tipo = C - C = C - C = C -, che sono molto studiate in chimica organica, in biologia molecolare, etc. Fra gli esempi piu' semplici, possiamo citare il Butadiene CH2 = CH - CH = CH2, e gli altri Polieni; gli Idrocarburi Aromatici come il Benzene, il Naftalene, l'Antracene; eteromolecole come la Piridina, il Furano, la Purina (che e' una base del DNA) etc. =27= Prof. M. Cini -Corso di Fisica Atomica e Molecolare BENZENE NAFTALINA ANTRACENE FURANO HC CH HC CH O PIRIDINA PURINA N CH HC C NH CH N N C N I doppi legami constano di legami σ, dovuti ad orbitali con simmetria cilindrica attorno all'asse C - C, e legami π che hanno un piano nodale. I legami σ sono dovuti a stati localizzati, relativamente profondi e poco reattivi, mentre al contrario quelli π sono delocalizzati, reattivi e poco legati. Al punto che per descrivere gli stati di valenza meno legati in molecole del tipo dell'esatriene CH2 = CH - CH = CH - CH = CH 2 dovuti ai 6 eletroni π, si puo' usare in prima approssimazione il metodo FEMO (=Free Electron Molecular Orbital) , in cui gli elettroni si considerano contenuti in una scatola unidimensionale. Aggiustando la lunghezza della scatola (L = 1.2*{n0 di legami +2}Å) si ottiene una prima approssimazione alle frequenze di assorbimento ottico fondamentali di varie molecole. La specificita' del metodo di Huckel sta nel fatto che tutti gli orbitali atomici φν sono del medesimo tipo (diciamo, orbitali 2pz del C) ed i parametri del metodo LCAO possono essere trasferiti, in =28= Prof. M. Cini -Corso di Fisica Atomica e Molecolare certa misura, da una molecola all'altra. La ricetta 1 per fare un calcolo col metodo di Huckel consiste nel porre: Sµν = δµν (3) H µµ = α (4) (questo parametro e' detto 'integrale di Coulomb') β s e µ e ν sono legati direttamente H µν = 0 altrimenti. (5) Questo insomma e' il metodo che i solidisti chiamano "tightbinding"; β e' un parametro empirico, dell'ordine2 di ≈-1 eV. Con cio', l'equazione di Schro"dinger diventa _ Cµ (α -E) + ∑ Cν β =0, (6) ν _ dove ∑ indica che µ e ν sono legati direttamente. La teoria in ν effetti ha un solo parametro, perche' possiamo porre α - E x= (7) β e scrivere _ x Cµ + ∑ Cν =0. (8) ν Ad esempio, per l'Etilene CH2 = CH2 si ha l'equazione secolare x 1 1 x = x2-1 =0. Dalle radici x = ±1 si hanno i seguenti orbitali: Ψ = 1 [φ +φ ] 1 2 1 2 Ψ2 = 1 [φ1- φ2] 2 E=E 1 = α+β legante . E=E 1 = α-β antilegante 1Si fa' presto a criticare la rozzezza di questo approccio: pero', per quanto potente sia il nostro calcolatore, esisteranno sempre molecole interessanti che sono cosi' complesse che non si puo' fare di meglio. Il rapporto costibenefici e' spesso favorevole, dato che i costi sono molto bassi; i risultati vanno poi esaminati "cum grano salis.". 2il segno - e' puramente convenzionale; e' facile dimostrare che i livelli e gli altri osservabili non ne dipendono. =29= Prof. M. Cini -Corso di Fisica Atomica e Molecolare _ _ Lo stato fondamentale |Ψ 1Ψ 1 |, dove Ψ 1 denota lo spinorbitale di spin opposto a Ψ 1, ha energia E=2α+2β (trattando gli elettroni come non interagenti). Per il Butadiene CH2 = CH - CH = CH2 le equazioni xC1+C2 = 0 2+C3=0 CC1+xC 2+xC3+C4 = 0 C3+xC4 = 0 portano a x 1 0 0 10 x1 1x 01 = x4 -3x 2+1 =0, ⇒ x=±1.62, x= ±0.62. 0 0 1 x Cambiando α e β cambieremmo l'energia degli orbitali, ma non i valori dei Cµ che dipendono solo dalla forma delle equazioni. Sostituendo nel sistema e normalizzando si trovano gli orbitali molecolari Ψ 1=0.37φ1+0.60φ2+0.60 φ3+0.37φ4 , E1=α +1.62β Ψ 2=0.60φ1+0.37φ2-0.37 φ3-0.60φ4 , E2=α +0.62β Ψ 3=0.60φ1-0.37φ2-0.37 φ3+0.60φ4 , E3=α -0.62β Ψ 4=0.37φ1-0.60φ2+0.60 φ3-0.37φ4 , E4=α -1.62β. _ _ Lo stato fondamentale e' |Ψ 1Ψ 1 Ψ 2Ψ 2 |, e l'energia totale (per elettroni non interagenti) e' uguale a 4α+4.48β. Per due legami etilenici indipendenti avremmo trovato 4α+4β ; quindi, 0.48β e' l'energia di stabilizzazione, che si puo' attribuire alla delocalizzazione dei doppi legami. Il procedimento si estende facilmente ad una grande varieta' di molecole. Per esempio, possiamo considerare le molecole lineari coniugate come l'esatriene CH2 = CH - CH = CH - CH = CH 2 o le omologhe superiori con n atomi di C. Il sistema di equazioni e' risolto dagli orbitali molecolari n jµπ 2 Ψj = φµ sin[ ]. ∑ n+1 n+1 µ=1 (9) Noti gli orbitali molecolari, si puo' calcolare la carica totale del sistema di elettroni π sull'atomo µ: qµ = 2 occ ∑ r c r µ2, (10) dove la somma e' sugli orbitali occupati. Anche se il metodo non e' autoconsistente, i risultati sono spesso qualitativamente accettabili =30= Prof. M. Cini -Corso di Fisica Atomica e Molecolare perche' le cariche nette in gioco in queste molecole covalenti sono comunque piccole. L' elemento fuori diagonale della matrice densita' che corrisponde ad atomi fra loro direttamente legati occ Pµν = 2 ∑ c r µc r ν , µ e ν legati, (11) r prende il nome di 'ordine di legame' (bond order). Esso misura la densita' di elettroni π sul legame: infatti vale 0 per legami semplici (c r µ=0), 1 per l'Etilene CH2 = CH2 e cresce verso i tripli legami. Per il Butadiene, numerando gli atomi di C da 1 a 4, si trova P12 = 0.89 e P23=0.45 , e cio' corrisponde al fatto che il legame doppio tende a delocalizzarsi. L'esperimento mostra che i legami si accorciano passando da semplici a doppi e a tripli. Ed esiste una buona correlazione lineare fra Pµν e la lunghezza di legame. E' naturale chiedersi qual'e' il valore di β che meglio si accorda coi dati sperimentali. Per la classe di Idrocarburi aromatici fatti di anelli benzenici condensati (naftalina, pirene, etc.) si osserva una netta correlazione lineare fra la frequenza osservata del primo assorbimento elettronico e la differenza LUMO - HOMO fra il livello piu' basso vuoto e il piu' alto occupato. Si ricava β= -2.71 eV. Anche l'affinita' elettronica di questi Idrocarburi e' correlata linearmente con LUMO. Si ottiene pero' β=-2.37 eV. L'energia di stabilizzazione puo' essere ottenuta sperimentalmente come differenza fra il calore di combustione dell'Idrocarburo e la somma di quelli associati ai singoli legami (es. 54.0 KCal/Mole per C - H, 49.3 KCal/Mole per C - C, 121.2 KCal/Mole per C = C, etc.)Sempre per gli stessi Idrocarburi aromatici la correlazione c'e', ma fornisce β= -0.69 eV. In conclusione, per grandi classi di composti si possono dare β empirici, che pero' dipendono dall'esperimento che si considera. Inoltre, anche quando le correlazioni per una certa classe di molecole sono buone, esistono pur sempre casi particolari in cui le cose vanno male. Da un metodo cosi' semplice non si puo' pretendere troppo. Nel 1963, Hoffmann ha proposto un "metodo di Huckel esteso" per trattare anche gli elettroni dei legami σ. A tal fine occorre almeno un set di valenza, che include gli orbitali 1s di H, nonche' 2s e 2p di C, e ciascun livello atomico ha il suo integrale di Coulomb. La ricetta di Hoffmann per gli elementi di matrice diagonali e' H pp =-11.4 eV per il 2p del C H ss =-21.4 eV per il 2s del C H' ss =-13.6 eV per l'orbitale 1s dell'Idrogeno. =31= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ci sono anche diversi integrali di risonanza. La proposta e' allora di calcolare Sµν esplicitamente1 e poi di usare per gli elementi fuori diagonale di H l'espressione H µν = K Sµν [H µµ +H νν ], (12) dove K e' un parametro. I valori raccomandati di K possono variare, a seconda dei legami, in un intervallo abbastanza ristretto (fra 0.7 e ≈1). Beninteso, gli elementi diagonali dipendono dallo zero delle energie, e questo metodo richiede che esso sia fissato: il livello 1s di H viene assegnato a -13.6 eV, etc. Per quanto il metodo sia privo di una chiara base teorica, esso si rivela di una certa utilita'. E' stato usato per calcolare le distanze ed anche gli angoli di legame negli Idrocarburi, con risultati non irragionevoli. Nello spirito fenomenologico e semiempirico di un metodo tight-binding, il metodo e' stato poi esteso ai sistemi piu' disparati. Certo. la mancanza di autoconsistenza ne limita molto il potere predittivo, specie quando vi sono legami ionici. 2-2-Invarianza di gauge e covarianza galileiana La teoria di Schro "dinger soddisfa alle due invarianze -per trasformazioni dei potenziali elettromagnetici e per cambiamenti del sistema di riferimento inerziale- senza le quali non avrebbe senso fisico. Tuttavia, il modo in cui si realizzano queste invarianze e' un po' piu' sottile che nella meccanica classica. Infatti, l'equivalenza delle varie Gauges nel caso classico e' banale, perche' nelle equazioni del moto classiche di una particella compaiono solo i campi, non i potenziali. Inoltre, nel caso non relativistico, avremo a che fare con forze istantanee ed indipendenti dalla velocita' (il che esclude la forza di Lorentz). Cosi', in ambedue i casi, sono le equazioni del moto ad essere invarianti. Invece, ambedue le trasformazioni modificano sia l'equazione di Schro"dinger che le funzioni d'onda. Invarianza di Gauge della teoria L'Hamiltoniano di una particella senza spin in presenza di un campo elettromagnetico e', in notazione ovvia eA (p- ) 2 c H= +eφ(x,t). (1) 2m 1 Gli overlap S µν sono inclusi da Hoffmann anche nell'equazione secolare. =32= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Qui, p e' il momento canonico ed A il potenziale vettore; nessuno dei due puo' essere misurato 1. La funzione d'onda Ψ soddisfa ∂Ψ HΨ = i / h . (2) ∂t Se fossimo partiti invece con potenziali A' e φ' legati ai precedenti dalla trasformazione di Gauge χ (3) ∂χ , (4) ∂t e' una funzione arbitraria del punto e del tempo, "dinger avremmo scritto l'equazione di Schro A' = A + 1 φ' = φ c dove χ(x,t) eA' 2 (p ) ∂Ψ' c { +eφ'(x,t)}Ψ'(x,t)= i h / ; 2m ∂t in termini dei vecchi potenziali, questa si scrive e[A + χ] (p )2 ∂Ψ' c 1 ∂χ { +e(φ )}Ψ'(x,t)= i h / . 2m c ∂t ∂t (5) (6) La trasformazione e' dunque e χ ∂Ψ ∂ e ∂χ pψ→(p )Ψ' , i h / →(ih / + )Ψ' (7) c ∂t ∂t c ∂t ed e' evidente che Ψ'≠Ψ. Le due funzioni d'onda sono legate dalla relazione Ψ'(x,t) = Ψ(x,t) exp[ (8) ieχ(x,t) ]. /c h Infatti, ∂ ieχ(x,t) ∂ e ∂χ ih / Ψ ' = ih / exp[ ] Ψ - Ψ' , ∂t /c h ∂t c ∂t ieχ(x,t) e -ih / ∇Ψ' = -ih / exp[ ] ∇Ψ + Ψ ' ∇χ , /c h c e sostituendo nella l'equazione di Schro " dinger per Ψ ' si ritrova quella per Ψ. 1anche se la circuitazione 0 (s) ∫dsA equivale al flusso ∫dS B⋅n ed e' ovviamente osservabile. =33= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Il fatto che la fase sia cambiata, e per giunta in modo arbitrario ed indipendente in tutti i punti ed a tutti i tempi, non inficia la teoria, perche' tutte le conseguenze fisiche sono contenute negli elementi di matrice. In effetti, gli elementi di matrice della coordinata sono banalmente invarianti. Inoltre, il momento canonico p =-ih / ∇ ha elementi di matrice e <Ψ' m|p|Ψ' n > = <Ψ m|p|Ψ n > + <Ψ m|∇χ|Ψ n > ; (9) c in altri termini, il momento canonico subisce la trasformazione notata sopra, ma questo non ci deve preoccupare. Non e' il momento canonico ad essere osservabile, ma quello meccanico, dato da eA = (p ); evidentemente, non cambia. Analogamente, le c energie degli stati possono ben cambiare, ma cio' che conta e' che non cambiano le differenze di energia. Covarianza galileiana della teoria Consideriamo due sistemi di riferimento K e K' connessi da una trasformazione di Galileo1 x t = x' + vt = t'. (1) Il sistema K' si muove rispetto a K con velocita' v. L'osservatore in K descrive il moto della particella con - ∂ h2 ∂2 / Ψ(x,t) + U(x,t)Ψ(x,t) =ih / Ψ(x,t). 2m ∂x2 ∂t (2) La covarianza galileiana richiede che il moto di una particella sia descritto in K' da - ∂ h2 ∂2 / Ψ'(x'.t') + U'(x',t')Ψ'(x'.t') =ih / Ψ'(x'.t') (3) 2 2m ∂x' ∂t' e che le due descrizioni siano fisicamente equivalenti. Ma tutto dipende da come si trasforma l'energia potenziale. Supponiamo ora per semplicita' che U' sia uno scalare, e cioe' che il suo valore in un dato punto ed in un dato istante non dipenda dal sistema di riferimento. Piu' precisamente, se in K' si osserva U'(x',t'), allora in K si osserva 1Ignoriamo le coordinate y e z, inessenziali in questo problema. =34= Prof. M. Cini -Corso di Fisica Atomica e Molecolare U'(x',t') = U'(x-vt,t) = U(x,t) . (4) In una teoria non relativistica non sapremmo trattare altro che un tale potenziale, che si propaga istantaneamente. Prima di tutto dovremo vedere come si scrive l'equazione (3) nelle coordinate (x,t) di K. Dovremo cioe' eseguire una trasformazione di variabili. Per farlo, avremo da sostituire x' e t' con x e t secondo la (1), dovunque x' e t' compaiono negli argomenti delle funzioni; inoltre dovremo trasformare anche le operazioni di derivazione parziale. Ad esempio, data una funzione arbitraria f(x,t) avremo ∂ ∂ ∂ ∂ f(x,t) = f(x' +vt',t') = f(x,t)+ v f(x ,t) ; ∂t' ∂t' ∂t ∂x quindi, la prescrizione e' ∂ ∂ ∂ = + v ∂t' ∂t ∂x ∂ ∂ = ∂x' ∂x . (5) L'equazione valida in K' , scritta nelle coordinate di K , e' quindi h2 ∂2 / Ψ'(x-vt,t) + U'(x-vt,t)Ψ'(x-vt,t) = 2m ∂x2 ∂ ∂ = ih / Ψ'(x-vt,t) +ih / v Ψ'(x-vt,t). ∂t ∂x (6) Come deve trasformarsi la funzione d'onda per soddisfare ambedue le descrizioni (2) e (6)? La condizione che Ψ sia uno scalare richiederebbe Ψ(x,t) = Ψ'(x-vt,t) = Ψ'(x',t') ma non puo' essere soddisfatta; in realta' l'equivalenza fisica di K e K' richiede solo che sia vera a meno di un fattore di fase: Ψ'(x-vt,t) = Ψ(x,t)⋅e-iφ(x,t). Sostituendo nella equazione per Ψ' scritta in termini di x,t , si trova - ∂2φ ∂φ ∂Ψ ∂φ ∂2Ψ h2 / { -i 2 Ψ − 2i - ( ) 2 Ψ + 2 } + U'(x-vt,t)Ψ = 2m ∂x ∂x ∂x ∂x ∂x =35= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∂Ψ ∂φ ∂φ ∂Ψ =ih / +h / Ψ +ivh / [ -i Ψ + ]. ∂t ∂t ∂x ∂x (7) L'ultimo temine in parentesi graffa, il termine in U' ed il primo termine del secondo membro sono attesi; la condizione di ∂Ψ equivalenza e' che si annullino i coefficienti di Ψ e di negli ∂x ∂Ψ altri termini. I coefficienti di danno: ∂x / 2i ∂φ h mvx = ivh / ⇒ φ(x,t) = + C(t), m ∂x / h ∂2φ dove C(t) non dipende da x. In particolare, =0. I coefficienti ∂x2 di Ψ danno ∂φ h2 ∂φ 2 = ∂φ / ( ) / h +h /v 2m ∂x ∂t ∂x ⇒ ∂φ mv2 =. ∂t 2h / Cosi' l'equivalenza e' dimostrata con φ(x,t) = mvx mv2t . / h 2h / (8) Cosi', non e' uno scalare la funzione d'onda, ma lo e' la densita' di probabilita' |Ψ|2 . Energia ed impulso si trasformano in modo galileiano, come si puo' vedere eseguendo la trasformazione su un'onda piana. 2-3 Determinanti di Slater: tecnica di calcolo degli elementi di matrice Consideriamo un set completo di spin-orbitali a particella singola vi ≡ vi (x)χ i e la seguente funzione d'onda determinantale Ψ(1,2,...,n) = (1) 1 n! v1(1) v 2(1) .... v n (1) v1(2) v 2(2) .... v n (2) ....... ..... ...... ....... v1(n) v 2(n) .... v n (n) =36= ; Prof. M. Cini -Corso di Fisica Atomica e Molecolare l'insieme di tutte le Ψ siffatte e' un set completo per espandervi le funzioni d'onda antisimmetriche di n elettroni; occorre fissare una volta per tutte un ordinamento nell'insieme {vi } perche' altrimenti otterremmo un set piu' che completo. Ci sono n! permutazioni di n oggetti. Per esempio, con 3 oggetti ho 3!=6 permutazioni Q≡(q 1,q2,q3) date da (1,2,3), (2,1,3),(2,3,1),(3,2,1),(1,3,2),(3,1,2). Definiamo pari o dispari una Q a seconda del numero di scambi necessari per ottenerla da quella fondamentale (1,2,...n). Il determinante e' una somma sulle permutazioni 1 Ψ(1,2,...,n) = (2) ∑(-) Q v q1(1)v q2(2)...vqn (n). n! Q Scambiando due righe (cioe' due elettroni) il determinante cambia segno. Se P e' una permutazione arbitraria P: (1,2,...,n)→(p 1,p2,...,pn ) il suo effetto su Ψ e' PΨ(1,2,...,n) = Ψ(p 1,p2,...,pn ) = 1 ∑(-) Q v q1(p1)vq2(p2)...vqn (pn ) = n! Q = (-)P Ψ . (3) Supponiamo di avere un altro set di spinorbitali ui ≡ ui (x)χ i (eventualmente coincidenti con i vi ) e di costruire con essi la funzione d'onda determinantale per n elettroni Φ(1,2,...,n) = 1 n! u1(1) u 2(1) .... u n (1) u1(2) u 2(2) .... u n (2) ....... ..... ...... ....... u1(n) u 2(n) .... u n (n) ; (4) il nostro problema e' quello di calcolare l'elemento di matrice di un qualche osservabile f, che dovra' dipendere simmetricamente dalle coordinate di tutte le particelle. Il calcolo diretto di <Φ| f |Ψ> = 1 ( - ) P∑ ( - ) Q • n! ∑ P Q •<up1(1)up2(2)⋅⋅⋅upn (n)|f|v q1(1)v q2(2)⋅⋅⋅vqn (n)> diventa rapidamente proibitivo al crescere di n, perche' lo sviluppo comporta (n!) 2 termini. Ma, cambiando nome alle variabili mute, possiamo riscrivere ogni termine nella forma =37= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <⋅⋅⋅>= <up1(p 1)u p2(p 2)⋅⋅⋅upn (p n )|f|v q1(p 1)vq2(p 2)⋅⋅⋅vqn (p n )>; f non risente del cambiamento, perche' e' simmetrico. Quale che sia P, il bra e' giusto il prodotto u1(1)u2(2)⋅⋅⋅un (n) dei termini lungo la diagonale del determinante Φ. La somma su Q da' il determinante Ψ moltiplicato per (-)P , come abbiamo appena visto. Pertanto, <Φ| f |Ψ> = 1 ( - ) 2P• n! ∑ P • <u1(1)u2(2)⋅⋅⋅un (n)|f| v1(1) v 2(1) .... v n (1) v1(2) v 2(2) .... v n (2) ....... ..... ...... ....... v1(n) v 2(n) .... v n (n) >. La somma contiene n! termini, tutti indipendenti dalla permutazione; quindi, <Φ| f |Ψ> = <u1(1)u2(2)⋅⋅⋅un (n)|f| v1(1) v 2(1) .... v n (1) v1(2) v 2(2) .... v n (2) ....... ..... ...... ....... v1(n) v 2(n) .... v n (n) >; ovvero, in forma espansa, <Φ| f |Ψ> = 1 = <u1(1)u2(2)⋅⋅⋅un (n)|f| ∑ ( - ) Qvq1(1)v q2(2)⋅⋅⋅vqn (n)>.(5) n! Q Overlap fra determinanti Se f≡1, si ottiene <Φ| Ψ> = ∑ Q ( - ) Q<u1(1)|v q1(1)><u2(2)|v q2(2)>⋅⋅⋅<un (n)| v qn (n)> = =38= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = . <u1|v1> < u 1|v2>.... <u 1|vn > <u2|v1> < u 2|v2>.... <u 2|vn > ....... ..... ...... ....... <un |v1> < u n| v2>.... <u n |vn > (6) In altri termini, l'overlap di due determinanti di Slater e' il determinante degli overlap. Fra l'altro, questo verifica che <Ψ| Ψ> =1 , cioe' che abbiamo correttamente normalizzato i determinanti di Slater. D'ora innanzi supporremo, per semplicita', che gli stati a particella singola uk e vk appartengano ad un unico set completo e ortonormale. Questo e' il caso in molti problemi che si incontrano in pratica. Operatori ' a un corpo' f= Nel calcolo del generico contributo a n ∑ f(i) i=1 ∑ Q dall'elettrone i-esimo <u1(1)⋅⋅⋅ui (i)⋅⋅⋅un (n)|f(i)|vq1(1)⋅⋅⋅vqi (i)⋅⋅⋅vqn (n)> per k≠i compaiono gli overlap a particella singola <uk (k)|vqk (k)>= δ(k,q k ); tutti i v devono coincidere con gli u, con la sola possibile eccezione del termine i-esimo, dove agisce l'operatore. Pertanto, perche' l'elemento di matrice di un operatore a un corpo sia non nullo, Φ e Ψ possono differire al piu' di uno spin-orbitale1. Nel caso del valore di aspettazione <Ψ |f|Ψ> tutti i v coincidono con gli u corrispondenti e contribuisce solo la permutazione identica Q={1,2,3,⋅⋅⋅}; cosi' <u1(1)⋅⋅⋅ui (i)⋅⋅⋅un (n)|f(i)|vq1(1)⋅⋅⋅vqi (i)⋅⋅⋅vqn (n)>= =<ui (i)|f(i)|ui (i)> , 1Ne consegue, ad esempio, che le transizioni elettromagnetiche sono consentite solo fra stati determinantali che differiscono di un solo orbitale. Un solo elettrone transisce, mentre gli altri sono "spettatori". =39= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ed in definitiva1 n <Ψ |f|Ψ> = ∑<ui |f|ui > . (7) i=1 Questo e' lo stesso risultato che avremmo ottenuto da una Ψ prodotto non antisimmetrizzato. Esempio: la densita'. Se prendiamo f(i)=δ(x- xi ), f coincide con la densita' di numero ρ(x) tale che Ω . Si ha ∫d3xρ(x) e' uguale al numero di elettroni nel volume Ω ∫ <ui |f|u i > = d3xi ui ‡ (xi )δ(x- xi )u i (xi ) = |ui (x)| 2, dove il secondo membro e' la norma quadrata dello spinore (la somma dei moduli quadrati delle due componenti di spin). Quindi, n ρ(x) = ∑ |u i (x)| 2, i come e' fisicamente ovvio per un sistema di elettroni non interagenti. Per gli elementi fuori diagonale <Φ|f|Ψ> , supponiamo che vk ≠uk sia l'unico spin-orbitale non comune a Φ e Ψ . Allora per i ≠k <u1(1)⋅⋅⋅uk (k)⋅⋅⋅un (n)|f(i)|u1(1)⋅⋅⋅vk (k)⋅⋅⋅un (n)>=0, e rimane solo il contributo di f(k). Cosi'2 <Φ|f|Ψ> = <uk |f|vk > = ∫d3x uk ‡ (x)f(x)vk (x). (8) Operatori a due corpi del tipo f= ∑grs r≠s Gli elementi di matrice dell'interazione Coulombiana e degli altri operatori a due corpi <Φ| f |Ψ> = ∑ <u1(1)u2(2)⋅⋅⋅un (n)|g rs | ∑ ( - ) Qvq1(1)v q2(2)⋅⋅⋅vqn (n)> , r≠s Q 1 Si noti che a primo membro di questa equazione compare l'operatore n f= ∑ f(i) che agisce sugli stati ad n elettroni, mentre a secondo membro figura i=1 f(i), con l'argomento i omesso perche' muto. Questo non puo' creare malintesi. 2Anche in questo caso, le cose funzionano come se invece dei determinanti avessimo usato semplici prodotti. =40= Prof. M. Cini -Corso di Fisica Atomica e Molecolare possono connettere stati che differiscano al piu' di due spinorbitali, poiche' in ogni termine della somma u(k) e v(k) con k≠r,s devono coincidere. Consideriamo il caso in cui ui ≠vi e uj ≠vj , cioe' ui e uj non siano occupati in Ψ. La permutazione Q deve coincidere con quella identica eccetto che per gli elementi i e j; rimane possibile anche la permutazione con gli elementi i e j scambiati. Quest'ultima ha parita' opposta alla precedente. Cosi' <Φ| f |Ψ> = <ui (i)u j (j)|gij |vi (i)v j (j)> - <ui (i)u j (j)|gij |vi (j)v j (i)>. In questa espressione compaiono indici i e j che servono per distinguere gli spinorbitali, nonche' argomenti i e j che etichettano le variabili di integrazione. Queste ultime sono mute, quindi potremo riscrivere il risultato nella forma <Φ| f |Ψ> = <ui (1)uj (2)|g12|vi (1)v j (2)> <ui (1)uj (2)|g12|vi (2)v j (1)>, ovvero <Φ| f |Ψ> = <ui uj |g|vi vj >- <ui uj |g|vj vi >. (9) Il secondo termine non e' altro che il termine di scambio, e quando g non dipende dallo spin, potra' essere diverso da 0 solo se gli spinorbitali i e j hanno spin paralleli. Se vk ≠uk ma gli altri spinorbitali coincidono, si trova <Φ|f|Ψ> = ∑ [<uk uj |g|vk uj >- <uk uj |g|uj vk >] . j≠k (10) Analogamente, il valore di aspettazione e' dato da <Ψ|f|Ψ> = ∑ [<ui uj |g|ui uj >- <ui uj |g|uj ui >] . i≠j (11) 2-4 Seconda quantizzazione per i fermioni Nessun operatore considerato finora connette stati con un numero diverso di elettroni; infatti, ci siamo limitati a studiare fenomeni in cui il numero di particelle non cambia. Il metodo della seconda quantizzazione e' stato inventato per studiare processi in cui particelle di spin sia intero che semi-intero vengono create o distrutte. Basti pensare al decadimento β di un =41= Prof. M. Cini -Corso di Fisica Atomica e Molecolare neutrone in un protone, un elettrone ed un antineutrino, n ⇒ p + _ e + ν , in cui tutte le particelle sono fermioni che vengono o creati o annichilati. Operare fra stati con numeri diversi di particelle e' necessario anche per studiare i processi che avvengono comunemente nella materia ordinaria: ad esempio, uno puo' desiderare di impostare un problema di meccanica statistica nell'Insieme Gran-Canonico, in cui il numero di particelle non e' fissato, essendo fissato invece il potenziale chimico. Inoltre, nella dinamica delle molecole e dei solidi compaiono vari tipi di eccitazioni elementari, di spin sia intero che semiintero, che vengono create e distrutte. Peraltro, nella descrizione dei processi fisici in cui il numero di particelle e' conservato, il formalismo e' equivalente a quello dei determinanti di Slater, ma per molte applicazioni si rivela piu' conveniente e agile. Cominciamo col cambiare nome agli stati determinantali1 secondo la regola seguente: Stato senza particelle (vuoto) Stato a un elettrone uk ⇒ |v> (1) ⇒c k ‡ |v> (2) Stato a due elettroni Ψ(m,n) = um(1) u n ( 1 ) 2! um(2) u n ( 2 ) 1 ⇒c m‡ c n ‡ |v> (3) Stato a tre elettroni Ψ(m,n,r) = um(1) u n (1) u r (1) um(2) u n (2) u r (2) ⇒c m‡ c n ‡ c r ‡ |v> 3! um(3) u n (3) u r (3) 1 (4) e cosi' via. L'operatore ck ‡ si chiama operatore di creazione dello spinorbitale k. Se si tenta di creare due volte un elettrone nello stesso k si ottiene un determinante con due colonne uguali, e percio' nullo. In altri termini, (c k ‡ ) 2=0. (5) 1In linguaggio matematico, il cambiamento di nome e' un isomorfismo fra lo spazio dei determinanti ed uno spazio vettoriale astratto V che ha per elementi gli stati determinantali con 0,1,2,⋅⋅⋅ particelle. =42= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Scambiando due colonne, il determinante cambia segno; quindi, vale la regola di anticommutazione [c m‡ ,c n ‡ ]+ ≡ c m‡ c n ‡ + c n ‡ c m‡ =0. (6) Per definizione, c m‡ {cn ‡ c r ‡ |v>} ≡ c m‡ c n ‡ c r ‡ |v>. (7) La notazione suggerisce che un operatore di creazione cm‡ e' il coniugato hermitiano di un operatore c m. Prendiamo formalmente il coniugato hermitiano di questa equazione, {<v|cr c n }cm = <v|cr c n c m e moltiplichiamo scalarmente per lo stato a tre elettroni c m‡ c n ‡ c r ‡ |v>. Il prodotto scalare di uno stato normalizzato con se stesso fa' 1, pertanto {<v|cr c n }cm |c m‡ c n ‡ c r ‡ |v> =1. (8) Se ora consideriamo cm come un operatore che agisce a destra, vediamo che il suo effetto e' quello di convertire cm‡ c n ‡ c r ‡ |v> nello stato a due elettroni c n ‡ c r ‡ |v>. Per questo, c m e' detto operatore di distruzione. Esso obbedisce al coniugato hermitiano delle relazioni di anticommutazione gia' ricavate, e cioe' [c m,c n ]+ ≡ c mc n + c n c m =0; (9) in particolare, cm2=0. Torniamo alla (8), e riscriviamola nella forma c m c m‡ c n ‡ c r ‡ |v> = cn ‡ c r ‡ |v>. Supponiamo di voler calcolare c n c m‡ c n ‡ c r ‡ |v>, in cui gli indici m,n,r si riferiscono a spinorbitali diversi. Usando le regole di anticommutazione per gli operatori di creazione, otteniamo c n c m‡ c n ‡ c r ‡ |v>=-c n c n ‡ c m‡ c r ‡ |v>=-c m‡ c r ‡ |v>. Avremmo ottenuto lo stesso risultato facendo anticommutare cn con cm‡ : c n c m‡ c n ‡ c r ‡ |v>= - c m‡ c n c n ‡ c r ‡ |v>= -c m‡ c r ‡ |v>. Quindi, gli operatori di creazione e distruzione di stati diversi anticommutano fra loro: c mc n ‡ + c n ‡ c m =0. (10) =43= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Finche' gli indici sono diversi, gli operatori c e c† anticommutano tutti fra loro; un prodotto di due di essi ( cc, cc† , c † c, c† c † ) commuta con qualsiasi prodotto di c† , e puo' essere trasportato attraverso di esso come se si trattasse di numeri. Tornando di nuovo all'esempio (8) c m c m‡ c n ‡ c r ‡ |v> = cn ‡ c r ‡ |v>, vediamo che c m c m‡ ha autovalore 1 su qualsiasi stato in cui lo spinorbitale m e' vuoto. D'altra parte, se lo spinorbitale m e' occupato, il risultato e' 0, perche' possiamo trasportare cm c m‡ attraverso il prodotto fino ad ottenere cm c m‡ 2=0. Invece, cm‡ c m ha autovalore 0 su qualsiasi stato in cui lo spinorbitale m e' vuoto, e 1 se e' occupato. In tutti i casi, cm‡ c m+c m c m‡ =1. Una relazione che vale per tutto il set completo e' una identita' operatoriale. La regola generale e' pertanto [c m,c n ‡ ]+ ≡ c mc n ‡ + c n ‡ c m =δmn . (11) Per quanto si e' appena detto, nk =c k ‡ c k si chiama operatore numero di occupazione dello stato k; e' ovvio che nk ‡ =nk ; inoltre, nk 2=nk , cioe' nk e' un operatore di proiezione. Nella rappresentazione di Schro "dinger, le variabili indipendenti sono le coordinate delle particelle. Tutto il nuovo formalismo serve per passare ad una rappresentazione in cui le variabili sono i numeri di occupazione dei diversi stati di un set completo {u n( x)}. Tutti gli operatori, che conservino o meno il numero di particelle, possono essere riscritti in tal modo. Il processo e' analogo a quello elementare per passare uno spinorbitale1 dalla rappresentazione delle coordinate Ψ(x) alla rappresentazione dei momenti Ψ(p). In quel caso si esegue una trasformata di Fourier, il che equivale ad espandere la Ψ nelle autofunzioni del momento, che sono le onde piane. Qui invece espandiamo in autofunzioni degli operatori nk , cioe' scriviamo Ψ † (x) = ∑ c n † un( x) * , n (12) e quindi anche Ψ(x) = ∑ c n un( x). n A questo punto, pero', Ψ(x) non e' piu' una funzione d'onda, ma un "operatore di campo". E, a differenza delle onde 1Per semplificare la notazione omettero' di indicare il carattere spinoriale degli stati e quello vettoriale di x, dato che non giocano qui alcun ruolo. =44= Prof. M. Cini -Corso di Fisica Atomica e Molecolare piane, gli operatori di campo non commutano. E' immediato verificare che [Ψ(x),Ψ(y)] +=0; (13) [Ψ ‡ (x),Ψ ‡ (y)] +=0; (14) inoltre, [Ψ(x),Ψ ‡ (y)] + = ∑ ∑ [c m ,c n ‡ ]+um(x)un * (y) = mn = ∑ ∑ δmn um(x)un * (y) = ∑ un (x)un * (y) = <x|y> = δ(x-y). mn n (15) Per questa ragione, occorre esaminare separatamente gli operatori a un corpo e a due corpi. Supponiamo di calcolare , nella teoria di Schro"dinger, il valore di aspettazione di un operatore a un corpo, come per esempio un potenziale V(x) <Ψ(x)|V(x)|Ψ(x)> = ∫dx Ψ * (x)V(x)Ψ(x)= ∑ ∑ c m* c n Vmn . mn (16) Per passare in seconda quantizzazione, interpretiamo adesso cn come un operatore di distruzione e cm* come l'operatore di creazione cm‡ ; allora V= ∫dx Ψ†(x)V(x)Ψ(x)= ∑ ∑ c m‡ c n Vmn , mn (17) con l'operatore di creazione a sinistra, e' l'espressione cercata dell'operatore V in seconda quantizzazione. Questo significa che gli elementi di matrice che fornisce sono gli stessi che si otterrebbero nella rappresentazione di Schro"dinger maneggiando i molto piu' ingombranti determinanti di Slater. Verifica. Dato uno stato determinantale per N elettroni |Ψ > = c1† ....c N† |v>, ‡ c m c n da' 0 se lo spinorbitale n e' vuoto; altrimenti cm‡ c n c 1† ..c n† ..c N† |v> = c1† ...c m‡ c nc n† ..c N† |v> = c1† ...c m‡ ..c N† |v> ci da' lo stato di partenza con n sostituito da m. L'elemento diagonale e' <Ψ |V|Ψ > = ∑ ∑ δmnV mnn n = ∑ Vmmn m , mn m =45= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove n m restringe la somma agli spinorbitali occupati; si riottiene la (3.7). I soli elementi furi diagonali di V sono quelli con determinanti che differiscono da |Ψ > per la sostituzione di uno spinorbitale n con un altro m e valgono Vmn, in accordo con la (3.8). Per un operatore a due corpi, come ad esempio un potenziale U(x,y), il metodo per metterlo in seconda quantizzazione e' analogo: in termini di operatori di campo, U = ∫dx ∫dy Ψ † (x)Ψ † (y)U(x,y)Ψ(y)Ψ(x) . (18) Notare l'ordine degli operatori di campo. Sviluppando, U = ∑ ∑ ∑ ∑ U mnpq c m‡ c n ‡ c qc p , mn p q (19) (notare di nuovo l'ordine!) dove compaiono gli elementi di matrice, definiti nel modo standard U mnpq = ∫dx ∫dy um* (x)un * (y)U(x,y)up(x)uq(y) . (20) Esempio: Hamiltoniano di Fano-Anderson Formulare un modello fisico significa, in ultima analisi, specificare gli elementi di matrice dell'hamiltoniano; ma fare questo puo' essere complicato per i sistemi a molti corpi, finche' si rimane nella rappresentazione delle coordinate. La seconda quantizzazione consente di formulare in modo semplice i modelli fisici direttamente in termini degli elementi di matrice fra stati a molte particelle. Nel Capitolo 12 studieremo l'interazione fra uno stato localizzato |0σ> di energia ε0 ed un continuo di stati delocalizzati |kσ> di energia εkσ. Questa situazione si presenta nei contesti piu' disparati. Per esempio, |0σ> puo' rappresentare uno stato atomico da cui l'elettrone puo' "saltare" nel continuo degli stati di particella libera; allora il livello discreto diventa una risonanza, come lo stato 2s2p1P dell'atomo di He. Oppure, puo' saltare nel continuo degli stati di Bloch di una banda di un solido: questo accade se l'atomo si chemisorbe, cioe' si lega chimicamente ad un solido. Nel modello di Fano-Anderson, il processo di salto e' descritto dagli "integrali di hopping" Vkσ, e l'hamiltoniano e' =46= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H= ∑ kσ εkσnkσ + ∑ ε0 n0σ + σ ∑ {V kσckσ‡c0σ + h.c.} , kσ (21) dove h.c. sta per il coniugato hermitiano di quanto precede. Se il sistema contiene un solo elettrone, allora e' facile formulare lo stesso modello in "prima" quantizzazione, scrivendo ε0 |0σ><0σ| + ∑ {V kσ|kσ><0σ| + h.c.} ; ∑ εkσ|kσ><kσ| + ∑ σ kσ kσ il vantaggio dell'hamiltoniano (21) e' che rimane valido con qualsiasi numero di elettroni. Nondimeno, poiche' esso e' lineare nei prodotti di operatori di creazione e distruzione, si dice che descrive un problema essenzialmente "ad un corpo". Con questo si intende che il sistema puo' anche contenere molte particelle, ma, poiche' queste non interagiscono, gli autostati sono determinanti di Slater di spin-orbitali che si ottengono diagonalizzando l'Hamiltoniano per un elettrone solo. Questo problema e', infatti, risolvibile esattamente, come vedremo. In certi casi, pero', e' importante arricchire il modello aggiungendo un termine di interazione fra due elettroni di spin opposti sull'orbitale localizzato. Anderson infatti ha introdotto il termine ulteriore H= H' = U n0+n0- . (22) Questo basta per introdurre interessanti effetti di correlazione. Risolvere il modello di Anderson e' molto difficile, ma la seconda quantizzazione ci ha consentito almeno di scriverlo in modo agevole. Analogia con il caso dei bosoni Si ricordera' che nella teoria elementare dell'oscillatore armonico di Hamiltoniano mω2x2 p2 H= + , (23) 2m 2 si passa alla teoria quantistica imponendo [p,x]- =-ih /. Introducendo operatori di creazione e distruzione con 1 i 1 i a† = { mω x p}, a = { mω x + p} (24) mω mω 2 2 =47= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 si trova [a,a † ]- =1, H=h / ω (a † a+ ). Usando commutatori in luogo 2 degli anticommutatori, il concetto di operatore di campo si estende immediatamente al caso dei bosoni. 2-5-Funzioni di Green e rappresentazione interazione di Consideriamo un sistema dipendente dal tempo e separiamo l'hamiltoniano come segue: H(t) = H0 + V(t). (1) Supponiamo che V(t) rappresenti una 'perturbazione' di un sistema H 0 statico e facile da trattare; non e' necessario che V(t) sia piccolo e nemmeno che dipenda effettivamente dal tempo. H(t) e' l'hamiltoniano nella rappresentazione di Schro"dinger, quindi lo denoteremo anche con H S e denoteremo la funzione d'onda Ψ S ogni volta che vorremo sottolineare questo fatto. Cosi' scriveremo ∂ i |Ψ S(t)> = HS(t)|Ψ S(t)> (2) ∂t Introduciamo l'operatore di evoluzione temporale US tale che |Ψ S(t)> = US(t,t0)|Ψ S(t 0)>. (3) Il tempo t0 e' arbitrario, e nei problemi in cui HS e' indipendente dal tempo, si puo' prendere t0=0. Quando invece H S=H S(t), conviene caratterizzare il tempo t0 assumendo che, per t<t0, V(t) sia nullo e che il sistema si trovi in un autostato di H 0 con energia E0. Questa ipotesi apparentemente drastica in realta' e' un puro artificio matematico. Anche nei problemi in cui non vi e' alcuna accensione di V(t) ad un determinato istante potremo sempre supporre t0→- ∞ ; anche i problemi statici possono essere trattati con l'artificio della " accensione adiabatica ", supponendo cioe' che l'interazione sia stata 'accesa' con infinita lentezza a partire da una eta' dell'oro t=t 0→- ∞ in cui l'Hamiltoniano era H 0 e tutto era facile. Dalla (3) si trova che US e' unitario (US† = U S-1 ) ed obbedisce all'equazione di Schro"dinger ∂ i U S(t,t0) = HS(t)U S(t,t0), ∂t equivalente a t U S(t,t0) = 1-i ∫dt1 H S(t 1)U S(t 1,t 0); t0 =48= Prof. M. Cini -Corso di Fisica Atomica e Molecolare risolvendo per iterazione, si ha t t t1 2 U S(t,t0) = 1-i ∫dt1 H S(t 1)+(-i) ∫dt1 ∫dt2H S(t 1)H S(t 2) + ... t0 t0 t0 t t1 tn-1 + (-i)n ∫dt1 ∫dt2... ∫dtn H S(t 1)H S(t 2)...H S(t n ) +... t0 t0 t0 Il generico integrale si estende a quella parte dello spazio t1..t n in cui l'ordinamento temporale e' t>t1>..>t n >t0, e puo' essere scritto t t1 tn-1 ∫dt1 ∫dt2... ∫dtn HS(t 1)HS(t 2)...HS(t n ) = t0 t0 t0 t t t = ∫dt1 ∫dt2... ∫dtn H S(t 1)H S(t 2)...H S(t n )θ(t 1-t 2)⋅⋅θ(t n-1 -t n ) t0 t0 t0 Una permutazione delle etichette t 1...tn trasforma quest'ultimo integrale in un altro di identico valore, in cui i fattori HS hanno argomenti tk che possono essere scritti in un ordine qualsiasi; rimane comunque salva la regola che i tempi precedenti stanno a destra. Possiamo sommare su tutte le permutazioni, dividendo per il loro numero n!. Si ottiene cosi' t t 1 t dt dt ... dt P[HS(t 1)H S(t 2)...H S(t n )] , n!t∫ 1 t∫ 2 t∫ n 0 0 0 dove P e' l'operatore di ordinamento temporale, che dispone a destra i tempi precedenti: P[HS(t 1)H S(t 2)...H S(t n )] =HS(t 1)H S(t 2)...H S(t n )θ(t 1-t 2)⋅⋅θ(t n-1 -t n ) + + H S(t 2)H S(t 1)...H S(t n )θ(t 2-t 1)⋅⋅θ(t n-1 -t n ) + ⋅⋅⋅⋅⋅⋅⋅ Sotto l'azione di P, gli operatori HS possono essere trattati come se commutassero, perche' lo stesso operatore provvede ad ordinare i fattori in ciascuna regione dello spazio t 1...tn nel modo corretto. Sara' utile nel seguito l'operatore cronologico T di Wick che e' definito come P ma con l'ulteriore regola che due operatori di creazione o distruzione di fermioni vanno trattati come anticommutanti; questa e' una convenzione, che ci sara' utile per semplificare la definizione delle funzioni di Green. Nei problemi a molti elettroni interagenti, possiamo usare indifferentemente T al posto di P, dal momento che in HS gli operatori dei fermioni compaiono sempre a coppie. L'operatore cronologico ci permette di sommare formalmente la serie: t U s (t,t0) = T exp(-i ∫dt'H s (t') ). (4) t0 =49= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Se A = As e' un operatore di Schro"dinger indipendente dal tempo, il suo valore di aspettazione e' <A(t)> = <Ψ S(t)|A|Ψ S(t)>, (5) ovvero <A(t)> = <Ψ S(t 0)|U †S(t,t0)AU S(t,t0)|Ψ S(t 0)> . Analogamente, possiamo ottenere tutti gli elementi di matrice, e le probabilita' di transizione. Abbiamo cosi' una soluzione formalmente esatta, che pero' rappresenta un programma inattuabile, se non nei casi piu' semplici. Il calcolo della funzione d'onda e' troppo complicato perche' si possa davvero pensare di intraprenderlo; esso coinvolge tutta l'informazione possibile sul sistema, mentre noi ci proponiamo lo scopo ben piu' ristretto di interpretare un esperimento di un certo tipo. Nessun esperimento da' una informazione completa sul sistema in esame. Ad esempio, studieremo la fotoemissione, cioe' la misura della corrente di elettroni emessa da un campione irradiato con luce monocromatica in funzione dell'energia cinetica degli elettroni stessi. Vedremo che con la regola d'oro di Fermi, e con alcune approssimazioni di solito ben giustificate, possiamo esprimere la probabilita' di transizione in termini di una densita' di stati finali che puo' ottenersi da una funzione di Green a particella singola1. Il calcolo della funzione di Green e' gia' difficile, perche' descrive la propagazione di una particella in un sistema interagente. Ma la conoscenza della funzione d'onda consentirebbe di trovare anche le densita' di stati a due o piu' corpi, il che non ci serve; cosi', il grosso dell'informazione contenuta nella funzione d'onda e' semplicemente irrilevante al nostro scopo. D'altra parte, le funzioni di Green, che sono direttamente connesse con gli osservabili, sono definite come valori di aspettazione nella rappresentazione di Heisenberg . In tale rappresentazione, il valore di aspettazione si scrive <A(t)> = <Ψ H|AH(t)|Ψ H> (6) dove la funzione d'onda |Ψ H> ≡ |Ψ S(t 0)> e' indipendente da t e l'operatore e' AH(t) =U†S(t,t0)A SU S(t,t0) . (7). 1In fisica matematica, ad ogni equazione differenziale lineare omogenea si associa una funzione di Green che risolve la stessa equazione con una delta di Dirac a secondo membro. Nel nostro contesto, si parla di funzioni di Green in senso generalizzato; esse sono funzioni di Green dell'equazione di Schro "dinger nel senso usuale nel caso dei problemi non interagenti. =50= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Sia Ψ α † l'operatore che crea la particella in uno stato individuato da un set α di numeri quantici1. Cominciamo con l'introdurre la funzione di Green "a un corpo" g<(t,t') = <Ψ H†(t')Ψ H(t)> (8) dove Ψ H(t) e' l'operatore di campo, nonche' la funzione che si ottiene scambiando gli operatori, e cioe' g>(t,t') = <Ψ H(t)Ψ H†(t')>. (9) Si noti che in queste definizioni l'ordine fisico dei tempi (cioe' se t<t' o t'<t) non entra in nessun modo, mentre e' importante l'ordine degli operatori Ψ e Ψ †. In equilibrio, g< si associa agli stati occupati (sotto il livello di Fermi) e g>agli stati occupabili. In termini di g> e g< possiamo definire anche le funzioni avanzate e ritardate, che separano i contributi a seconda che t venga dopo o prima di t': igr (t,t') = (g<(t,t')+g>(t,t'))θ(t-t') =<[Ψ † (t'),Ψ(t)] +>θ(t-t') -iga(t,t') = (g<(t,t')+g>(t,t'))θ(t'-t). Spesso viene piu' naturale esprimere gli osservabili in termini di queste nuove funzioni di Green. E' immediato controllare che [gr (t,t')]* = ga(t',t); esplicitando gli indici di stato scriveremo anzi [gr,αβ(t,t')]* = ga,βα(t',t). Dunque, nella rappresentazione di Heisenberg, gli stati non dipendono da t, perche' l'evoluzione temporale e' descritta dagli operatori; questi ultimi pero' sono noti esplicitamente solo quando si conosca US(t,t0); in generale non possiamo calcolare nemmeno l'Hamiltoniano H H(t)=U †S(t,t0)H S(t)U S(t,t0). L'unico caso semplice e' quello dei problemi stazionari, quando AH (t) = exp[iHS(t-t 0)]A Sexp[-iH S(t-t 0)], ed in particolare HH=HS. Quando AS e' indipendente dal tempo ma HS ne dipende, d d d i AH (t) = [i U†S(t,t 0)]A SUS(t,t 0) + U†S(t,t 0)A S[i US(t,t 0)]. dt dt dt ∂ Usando -i U† S(t,t 0) = U† S(t,t 0)H S(t), si ha ∂t d i AH (t) =[- U†S(t,t 0)H S(t)]ASUS(t,t 0) + U†S(t,t 0)A S[HS(t)US(t,t 0)]= dt =U†S(t,t 0)[A SHS(t)-H S(t)A S]US(t,t 0) = [AH (t),H H (t)], dove appare l'Hamiltoniano nella rappresentazione di Heisenberg. 1per evitare di appesantire troppo la notazione, l'indice α sara' di solito sottinteso nel seguito quando non gioca un ruolo essenziale. =51= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Nel seguito faremo largo uso della rappresentazione di Heisenberg, ed anzi i valori di aspettazione del tipo <A(t)> si intenderanno senz'altro definiti secondo la (6) su un autostato di H0 (in pratica, quasi sempre lo stato fondamentale). Possiamo anche supporre che il sistema descritto da H0 si trovava fino al tempo t 0 non in un autostato, ma in equilibrio termico a temperatura (KB β) -1 ; in tal caso si intende che <A(t)> = Tr {ρ 0AH(t) }, (10) e- βΗ0 ρ0 = . (11) Tr{e- βH0} Il calcolo degli operatori di Heisenberg richiede quello di US, e questo e' molto difficile con l'Hamiltoniano H(t); l'approccio perturbativo prevede di espandere in potenze di V(t). A tal fine si introduce la rappresentazione di interazione in cui gli operatori evolvono solo con H0 : AI (t) = exp[iH0t]ASexp[-iH 0t]; (12) mentre la funzione d'onda e' definita a partire da quella di Schro"dinger |Ψ I (t)> = exp[iH0t]|Ψ S(t)>. La fisica e' la stessa che nella rappresentazione di Schro"dinger perche' valori di aspettazione degli operatori sono gli stessi: infatti, <A(t)> = <Ψ S(t)|AS|Ψ S(t)> = =<Ψ S(t)|exp[-iH0t]{exp[iH0t]Aexp[-iH 0t]}exp[iH0t]|Ψ S(t)> = =<Ψ I (t)|AI (t)|Ψ I (t)> . (13) La funzione d'onda nella rappresentazione di Heisenberg Ψ H coincide con Ψ S per t=t 0 e quella di interazione Ψ I coincide con Ψ S per t=0. V=0 per t<t0 Ψ H=Ψ S Ψ I =Ψ S _______________________|____________________|______> Sistema in autostato t0 0 t di H0 Fig.1 Si ha: ∂ |Ψ (t)> = exp[iH0t] V(t)|Ψ S(t)> = VI (t) |Ψ I (t)> ∂t I La forma e' analoga a quella dell'equazione di Schro "dinger, ma la parte ovvia della dinamica, determinata da H0, e' stata divisa dalla parte complicata dovuta all'interazione V. Possiamo definire i =52= Prof. M. Cini -Corso di Fisica Atomica e Molecolare un nuovo operatore di evoluzione temporale da un tempo τ arbitrario |Ψ I (t)> = UI (t,τ)|Ψ I (τ)> , (14) che deve soddisfare ∂ i U I (t,τ) = V I (t)U I (t,τ). (15) ∂t La soluzione formale t U I (t,τ) = T exp[-i ∫dt'VI (t') ]. (16) τ e' alla base di tutti gli approcci perturbativi. Occorre saper passare da una rappresentazione all'altra. Nella rappresentazione di Heisenberg, <A(t)> = <Ψ H|AH(t)|Ψ H>, dove |Ψ H> ≡ |Ψ S(t 0)>, e t0 e' un tempo di riferimento arbitrario. Il valore di aspettazione puo' esser preso anche sulla funzione della rappresentazione di interazione, |Ψ I (t 0)> = exp[iH0t0]|Ψ S(t 0)> = exp[iE0t0]|Ψ S(t 0)>. e risulta <A(t)> = <Ψ I (t 0)|A H(t)|Ψ I (t 0)>. (17) Se esprimiamo anche l'operatore nella rappresentazione di interazione, scriviamo invece <A(t)> = <Ψ I (t)|AI (t)|Ψ I (t)> = = <Ψ I (t 0)|U †I (t,t0)A I (t)U I (t,t0)|Ψ I (t 0)>. (18) Affinche' la (17) sia identica alla (18) occorre che sia AH(t) = U†I (t,t0)A I (t)U I (t,t0). (19) Cosi', siamo riusciti nello scopo di esprimere gli operatori di Heisenberg in termini di quelli di interazione, e potremo espanderli in serie di VI . 2-6 Spinori di Pauli e rotazioni Le matrici di Pauli sono, com'e' noto, le tre componenti di 0 1 0 -i 1 0 σ1= 1 0 σ2= i 0 σ3= 0 -1 che soddisfano le regole di anticommutazione [σi ,σj ]+ = 2 δij I, dove I e' la matrice unitaria 2X2. Inoltre, σi σj = iεijk σk . Consideriamo uno spin in un campo magnetico, privo dei gradi di liberta' orbitali. L'equazione di Pauli e' della forma (σ⋅B ) ψ = ηψ, (1) in un sistema di riferimento cartesiano K. Ruotando K di un angolo α in senso antiorario intorno a un asse arbitrario si ottiene un altro sistema K'. Scegliamo l'asse z =z' parallelo all'asse di rotazione. La trasfomazione dei vettori x e' data da x'i =aik xk , dove =53= Prof. M. Cini -Corso di Fisica Atomica e Molecolare cos(α) sin(α) 0 {aik } = -sin(α) cos(α) 0 (2) 0 0 1 x' appare come x ruotato in senso orario. Come si scrive la (1) in K'? Dovendo le leggi della fisica essere indipendenti dall'orientazione degli assi, la risposta corretta e' (σ⋅B ') ψ' = ηψ', (3) con le stesse marici di Pauli di prima. Sia R l'operatore che ruota lo spinore ψ in senso antiorario: evidentemente, ψ' = R†ψ. La (3) portata in K diviene (RσR†⋅B ') ψ = ηψ. (4) Poiche' B'i =aik Bk , il risultato e' compatibile con la (1) solo se Rσi R† = aik σk , (5) † nel qual caso (RσR ⋅B ') = (σ⋅B ). Per stabilire la covarianza della teoria per rotazioni, bisogna trovare la R che soddisfa le (5); e' facile vedere che -iασz R = exp( ). (6) 2 Poiche' σz2n =I, si ottiene facilmente e- i α/ 2 0 R = I cos (α/2) -i σz sin(α/2) = 0 e i α/2 . (7) 1 1 1 1- , autostato di σx , otteniamo Ruotando di α=π/2 lo spinore 2 2 1 i,1+i)), autospinore di σy con autovalore 1 e cioe' orientato lungo l'asse y. Tutto cio' realizza appieno l'idea intuitiva di cio' che deve fare un operatore di rotazione. Ora, le (5) valgono perche' -iασz iασz RσzR†=exp( )σzexp( )=σz, 2 2 e- i α/ 2 0 0 1 ei α/ 2 0 0 e - i α RσxR† = 0 e i α/2 1 0 0 e - i α/2 = ei α 0 =σxcos(α)+σy sin(α), e analogamente Rσy R† = -σxsin(α)+σy cos(α). Per trovare la trasformazione degli operatori, introduciamo in K gli spinori φk =σk ψ; in K' deve aversi φk '=σk 'ψ'. Dunque, R†φk =σk' R†ψ, ovvero, σ' k =R†σk R; la trasformazione e' l'inversa di quella che compare nella (5). In particolare, σ⋅B non e' uno scalare per rotazioni. =54= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Capitolo 3-Meccanica Quantistica Relativistica: Particelle di spin 0 Anche in Fisica Atomica e Molecolare, come in Fisica dei Solidi, la descrizione non relativistica e' insufficiente. Questo pone problemi fondamentali, di cui daremo una trattazione auto-contenuta, privilegiando gli aspetti importanti per la struttura della materia. Cominceremo con le particelle prive di spin. 3-1 Introduzione La teoria di Schro "dinger-Pauli nata dopo la Relativita', ed e' stata considerata fin dall'inizio come una teoria parziale e provvisoria. Abbiamo visto che essa e' covariante per trasformazioni di Galileo, e non di Lorentz, e d'altra parte l'equazione di Schro"dinger, che e' del secondo ordine nelle derivate spaziali ma del primo in quella temporale, viola il principio einsteiniano di relativita' in modo evidente. E gia' nella fisica atomica e molecolare ci sono effetti relativistici, la cui importanza aumenta procedendo verso i numeri atomici grandi. Dal momento che una teoria fondamentale deve essere quantistica e relativistica, conviene ripensare la meccanica quantistica (nonrelativistica) per una particella per vedere se la si puo' generalizzare. Essa si puo' compendiare in 4 postulati fondamentali. 1) Lo stato dinamico di un sistema e' definito dai valori di tutte quelle variabili che sono compatibili, cioe' osservabili simultaneamente. Se a={A,B,C,...} e' un insieme di variabili compatibili, possiamo associare allo stato una funzione di stato Ψ a(r,t), complessa. 2) Le variabili dinamiche classiche q sono associate con operatori Q lineari [cioe' Q(Ψ 1+Ψ 2) = QΨ 1+QΨ 2], Hermitiani [cioe' (QΦ,Ψ) = (Φ,QΨ)], aventi spettri completi di autofunzioni. I soli risultati possibili di misure di tali variabili sono gli autovalori degli operatori corrispondenti. ∫dVΨa* QΨa 3) <Q>a = . ∫dVΨa* Ψa N.B. In generale, <Q>a dipende dal tempo: anche se gli autovalori sono costanti, la distribuzione statistica puo' evolvere. 4) L'evoluzione temporale di Ψ e' data dall'equazione di Schro"dinger __ ∂Ψ HΨ=i h ; ∂t =55= Prof. M. Cini -Corso di Fisica Atomica e Molecolare a partire dall'integrale del moto classico H=E, uno puo' pervenirvi __ __ ∂ eseguendo le sostituzioni p→-i h ∇ , E→ i h , ed applicando alla Ψ ∂t l'equazione cosi' ottenuta. A parte c'e' lo spin, introdotto da Pauli nello schema quantistico in modo fenomenologico. Il suo accoppiamento col campo magnetico poteva far sospettare una relazione con la relativita', ma quale? L'approccio seguito intorno al 1930 e' stato quello di conciliare la relativita' con i quattro postulati, cercando generalizzazioni relativistiche dell'equazione di Schro"dinger. I successi cosi' conseguiti sono molto notevoli. Nel problema dell' atomo di H si e' ottenuto un accordo accurato con l'esperimento, e le varie correzioni relativistiche che erano state formulate in precedenza in modo euristico ed inserite nella teoria precedente discendono automaticamente dal nuovo quadro teorico. Tuttavia, l'interpretazione 'alla Schro"dinger' delle equazioni d'onda relativistiche conduce a difficolta' cosi' fondamentali che Dirac ne fu indotto a predire l'esistenza dell'antimateria prima della scoperta sperimentale. I quattro postulati sono infatti incompatibili con la relativita' per motivi di principio. La funzione d'onda Ψ a(r,t) e' l'ampiezza di trovare la particella in (r,t) ed ha senso se si puo' localizzare la particella in un punto, esattamente. Pero', poiche' ∆r∆p ≈ __ h , per ∆r→0, ∆p → ∞ . Nella teoria di Schro"dinger, questo non crea problemi; significa solo che una misura di r richiede tanta piu' energia quanto piu' e' precisa. Ma nel caso relativistico esiste una velocita' limite c; ad ogni particella e' allora associata la lunghezza d'onda di __ h Compton ∆rc = . Quando si misura r con precisione ∆rc la mc particella e' relativistica, l'energia in gioco e' ≈mc 2 e l'equivalenza di massa ed energia consente la creazione di coppie particellaantiparticella. Non conservandosi il numero di particelle, non si conserva nemmeno la probabilita' |Ψ a(r,t)|2 ed a rigore bisogna abbandonare il concetto stesso di funzione d'onda. Nonostante cio', la teoria parziale, che viene oggi definita "quasi relativistica", deve essere studiata per prima, ed occorre conoscere i motivi profondi che conducono alle difficolta'. Noi studieremo la teoria "quasi relativistica", basata su una Ψ normalizzata a 1. In pratica, essa e' adeguata per lo studio della materia ordinaria, perche' per un elettrone la lunghezza ∆rc ≈ 3.9.10 -11 cm e' piccola su scala atomica. D'altra parte, con un quadro teorico provvisorio, dobbiamo aspettarci difficolta' e paradossi; noi li metteremo in evidenza, ne discuteremo il significato fisico e ne indicheremo la interpretazione moderna. Infine, mostreremo come queste difficolta' sono state superate. =56= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 3-2 Equazione di Klein-Gordon (o diSchro "dinger relativistica) Non e' possibile dedurre una teoria generale a partire da una speciale. Quanto segue va inteso come un argomento euristico, che conduce a una ragionevole ipotesi di teoria generalizzata; la bonta' dell'ipotesi viene poi sanzionata dal confronto con l'esperimento. E' un fatto assai notevole che, sia per l'equazione di Klein-Gordon (particelle di spin 0) che per quella di Dirac (spin 1/2) un plausibile argomento euristico conduce semplicemente al risultato corretto! L'Hamiltoniana relativistica per una particella libera e' H= [p2c 2 + m2c 4]1/2 (1) __ __ ∂ Ponendo formalmente p→-i h ∇ , E→ i h , si ottiene ∂t __ ∂Ψ __ i h = [ - h 2c 2∇ 2 + m2c 4]1/2 Ψ (2) ∂t il cui significato matematico e' ambiguo. Piu' che una soluzione, abbiamo trovato un problema. Possiamo provare a quadrare: allora H 2= p2c 2 + m2c 4, (3) e si ottiene l'Equazione di Klein-Gordon (originariamente proposta da Schro"dinger) __ ∂2Ψ __ - h 2 2 = [- h 2c 2∇ 2 + m2c 4] Ψ. (4) ∂t Possiamo riscriverla _ mc [|_|-( __ ) 2]Ψ =0, h _ 2 |_| ≡ ∇ 2 - 1 ∂ c 2∂t2 (5) Quadrando abbiamo pero' introdotto anche H= -[p 2c 2 + m2c 4]1/2, il che appare come una difficolta'. Infatti per una particella libera con impulso p si hanno come soluzioni due onde piane, normalizzate sul volume V, 1 i Ψ± = exp[ __(p.r-ε(p)t)] h V + 2 2 2 con ε(p) = - c [p + m c ]1/2. Soluzioni di energia negativa sono fisicamente inammissibili, perche' una particella dovrebbe irraggiare all'infinito, non essendoci limite inferiore allo spettro; inoltre il vuoto dovrebbe decadere creando tali particelle di energia negativa. Il rimedio ovvio sarebbe quello di ignorare quelle soluzioni, ma cio' non e' lecito, perche' esse sono =57= Prof. M. Cini -Corso di Fisica Atomica e Molecolare necessarie perche' il set sia completo (postulato 2). In presenza di un campo esterno si mescolano con le altre. Vi e' per l'interpretazione usuale un'altra difficolta', strettamente connessa con la precedente. A differenza di quella di Schro"dinger, ∂2 l'equazione di Klein-Gordon e' in 2, e per determinare Ψ(r,t) occorre ∂t • ∂Ψ specificare sia Ψ che Ψ ≡ per t=0. L'equazione di continuita' ∂t ∂ρ + divJ =0 (6) ∂t si ottiene come nel caso di Schro"dinger moltiplicando la (4) per Ψ * , il complesso coniugato della (4) per Ψ, e sottraendo. Risulta cosi' che __ h J = (Ψ * ∇ Ψ - Ψ ∇ Ψ *) (7) 2mi __ ∂Ψ ∂Ψ * ih ρ= * ) (Ψ Ψ (8) 2mc 2 ∂t ∂t • E' un problema evidente che, essendo Ψ e Ψ ambedue da specificare, ρ non e' positiva definita e non rappresenta una probabilita'. Questo fece accantonare frettolosamente la (4) intorno al 1930. In realta' la (4) e' corretta: e' l'interpretazione "non relativistica" che non va. Nella teoria di Schro"dinger, gli ∂ autovalori dell'operatore energia E= ih / corrispondono, per il ∂t postulato 2, ai possibili valori dell'energia della particella. Nella teoria relativistica esistono, accanto alle particelle che evolvono con exp(-i|E|t) ed hanno energia |E|, anche le antiparticelle, che evolvono con exp(i|E|t) ed hanno anch'esse energia positiva |E|. Si perviene ad una interpretazione coerente solo in quadro a molte particelle, dove Ψ e' un campo. Interpretiamo ρ (moltiplicata per la carica elementare e) come densita' di carica elettrica; Je diviene allora la densita' di corrente elettrica, e __ ∂Ψ ∂Ψ * ie h * ) Q= d x(Ψ Ψ (9) ∫ 2mc 2 ∂t ∂t e' la carica totale conservata. Scambiando Ψ con Ψ * , si cambia il segno di Q, e questo significa che campi complessi coniugati hanno la stessa massa ma cariche opposte. Questo e' il caso dei pioni π + e π - , particelle di massa mπ = 139.58 MeV prodotte in interazioni forti del tipo p+p→ p+n+ π + , p+n→ p+p+ π - . D'altra parte, una Ψ reale ha Q=0, ed e' il campo di una particella neutra, come ad esempio il π 0, anch'esso prodotto in interazioni forti, come p+p→ p+p+ π 0. =58= Prof. M. Cini -Corso di Fisica Atomica e Molecolare _ Poiche' |_| e' invariante per trasformazioni di Lorentz, la teoria e' covariante se Ψ si trasforma come uno scalare, Ψ'(x')= Ψ(x). L'equazione e' invariante anche per l'operazione di parita' Π che cambia segno alle coordinate (r→-r); questo comporta che Π Ψ=Ψ (funzione scalare) oppure Π Ψ=-Ψ (funzione pseudoscalare). Non vi sono particelle di spin 0 stabili, ma i mesoni π e K ci si avvicinano. Il fatto che il π - e' pseudoscalare fu stabilito1 osservando che il deutone π-mesico nello stato fondamentale puo' decadere in 2 neutroni. Si sapeva che il deutone ha parita' + e J=1. Due neutroni possono avere funzione spaziale pari (L pari) in un singoletto o L dispari in un tripletto, ma l'unica possibilita' con J=1 e' 3P1. Poiche' P corrisponde a parita' negativa, un π - deve avere parita' intrinseca -. 3-3 Atomi - mesici I mesoni π decadono per interazione debole (ad es. π + → µ+ + ν ) con un tempo di vita τ ≈ 10−8 s, che e' lungo su scala atomica. Un π lento, quando interagisce con un atomo, puo' esserne catturato saltando su livelli energetici sempre piu' legati, senza esserne impedito dal principio di Pauli. A causa della massa mπ >> me, i raggi degli orbitali sono piu' piccoli di quelli elettronici. Si possono cosi' studiare atomi π-mesici, in cui un π - sostituisce un elettrone. Lo spettro energetico dei raggi X emessi durante il processo puo' essere compreso in termini di interazioni elettromagnetiche, a meno di correzioni ai livelli piu' interni dovute alle interazioni forti col nucleo. Poiche' in un campo elettromagnetico H= [|p-eA/c| 2c 2 + m2c 4]1/2 +eφ (1) cioe' pµ →pµ - eA µ/c, il modello per un atomo π-mesico (A=0, eφ=Ze2/r) sara' __ { - h 2c 2∇ 2 + m2c 4 - (E + Ze2/r) 2} Ψ =0 . (2) In questo problema gli effetti relativistici sono moderati, per cui e' possibile interpretare approssimativamente la (2) come equazione a particella singola. Il nucleo e' considerato fermo, ed il parametro m rappresenta la massa ridotta. Ponendo Ψ = (1/r)RL (r) Y Lm (θ,φ) si ottiene 1Panofsky,Adenot e Halley, Phys. Rev. 81,565, 1951. =59= Prof. M. Cini -Corso di Fisica Atomica e Molecolare L(L+1)-Z2α 2 2ZαE m2c 4-E2 d2 + (3) __ - __2 2 }RL (r)=0 dr2 r2 h cr h c e2 1 dove la quantita' adimensionale α= __ ≈ e' la costante di h c 137.035963 struttura fine. La lunghezza caratteristica nel problema e' β -1 , dove1 { m2c 4-E2 β 2 = 4 __ , h 2c 2 quindi conviene introdurre la variabile adimensionale ρ=βr. Cosi' scriviamo L(L+1)-Z2α 2 2ZαEβ β 2 d2 2 β + - } RL (ρ)=0 , (4) __ d ρ2 ρ2 4 h cρ e, definendo l'energia ridotta 2ZαE λ= __ , βh c poniamo l'equazione radiale in forma adimensionale2 L(L+1)-Z2α 2 λ 1 d2 { + ρ - } RL (ρ)=0 . (5) 2 2 dρ ρ 4 Dobbiamo trovare gli autovalori λ: quelli dell'energia si ottengono poi 2ZαE risolvendo λ= , che comporta β(E)h /c mc 2 . E= (6) Z2α 2 1+ 2 λ E' utile soffermarsi sul limite non relativistico α →0, quando Z2α 2 E ≈ mc 2 {1}; 2λ 2 dalla soluzione dell'equazione di Schro"dinger, ci aspettiamo Z2α 2mc 2 Z2e4m E ≈ mc 2 = mc 2 ; __ 2n2 2n2 h 2 pertanto in tale limite λ si riduce al numero quantico principale n. L'analogia col caso non relativistico e' utile per trovare la soluzione esatta. Per lo stato fondamentale, con L=0, poniamo Ψ∝ρ seρ/2, cioe' {β 2 1Il fattore 4 evidentemente non e' essenziale alla definizione di β, ma tornera' comodo. 2Nel caso di Schro "dinger l'equazione radiale in unita' atomiche e' 2 d L(L+1) 2Z [ 2+ ρ +2ε] R L (ρ)=0. dρ ρ2 =60= Prof. M. Cini -Corso di Fisica Atomica e Molecolare R0(ρ) = W ρ s+1 e- ρ/2 , (7) con W costante di normalizzazione. Nel limite non relativistico, s→0, λ→1. L'equazione (5) e' soddisfatta se s(s+1) = -Z2α 2 , s+1=λ. Risolvendo, si hanno due radici, ambedue con s<0, s=- 1+ 2 - 1 - Z 2α 2 4 , λ= 1+ 2 - 1 - Z 2α 2 4 ma poiche' deve essere s→0, λ →1 per α →0, si deve scegliere il +. Cosi' Ψ ha una singolarita' integrabile nell'origine. Notare tuttavia che le formule perdono senso se Zα>1/2; per esercizio, si puo' verificare che allora la lunghezza β -1 e' dell'ordine o piu' piccola di quella di Compton. Nel caso generale, con L che puo' essere non nullo, W e' un polinomio in ρ. Come si puo' verificare per sostituzione, esso soddisfa {ρ d2 d +(2s+2-ρ) + (λ-s-1)} W(ρ)=0 . 2 dρ dρ (8) Sia ν il grado di W. Le condizioni su s e λ ora sono s(s+1) = L(L+1) - Z2α 2 , s+1=λ−ν. Quindi, 1 (L+ ) 2 - Z 2α 2 , 2 1 1 λ = λ νL = ν + + (L+ ) 2 - Z 2α 2 (9) 2 2 Lo spettro energetico e' predetto dalle equazioni (6,9) con i numeri quantici ν , L che assumono valori interi (=0,1,2,...); il numero quantico principale non relativistico e' dato dalla (9) con α=0, cioe' n=ν+L+1. Definiamo l'energia di legame E(B) =mc 2-E, e il suo limite non relativistico E(B) NR ; la seguente tabella confronta i primi livelli per Z=40 ottenuti con le due teorie, ponendo m=m(π - )=139.58 MeV. s=- 1 + 2 _____________________________________________________________________ E(B) NR E(B) ν L n stato mc 2 mc 2 ________________________________________________________ ___ 0 0 1 1s .0426 .04818 1 0 2 2s .01065 .01152 =61= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 0 1 2 2p .01065 .01078 2 0 3 3 .00473 .00501 1 1 3 3p .00473 .00479 0 2 3 3d .00473 .00475 ________________________________________________________ ___ La degenerazione fra stati con lo stesso n e L diversi e' rimossa, e l'energia dello stato cresce con il momento angolare. I risultati sono in contrasto con quelli usuali, che forniscono un guscio L diviso in 3 sottogusci, uno M diviso in 5, etc. 3-4 Interpretazione basata sulla teoria dei campi Nel caso delle equazioni di Maxwell, e' ben noto che esse descrivono il campo elettromagnetico classico; e' noto anche che il campo elettromagnetico puo' essere quantizzato, ed i quanti sono fotoni1. Anche nel caso in esame, si esce dalle difficolta' solo "inventando" (e non "deducendo") una teoria di campo. L'idea generale e' la seguente. Per un oscillatore armonico ("campo" con 1 grado di liberta') _ a+a+ a-a+ h x= , p= , purche' si misuri x in unita' . Si abbia un mω 2 2 campo Ψ(r) che ha un grado di liberta' per ogni punto r e modi eik.r normali |k>= , dove V e' il volume di quantizzazione, V quantizzati con [a k ,ak' †]- =δkk' .La corrispondenza e': a→a(r)= ∑ak |k> , che e' l'operatore di campo, k ak eik ⋅r +ak †e-ik ⋅r ak eik ⋅r -a k †e-ik ⋅r x→Ψ(r)= , p→Π(r)= , 2 2 k k ∑ ∑ dove Π e' il campo canonicamente coniugato. Non ci sono molle ne' massette che facciano oscillazioni armoniche, e x non e' uno spostamento nello spazio reale, ma l'ampiezza del campo Ψ in un punto. Il campo Π non e' noto a priori, ma sara' individuato nel quadro del formalismo hamiltoniano che genera Ψ. Risulta in particolare che ih / [Ψ(r,t),Π(r',t)]- = δ exp[i(k'r-kr')]= V ∑ kk' kk' = ih / δ(r-r') (1) e questa e' la regola di quantizzazione che ora useremo. 1I dettagli tecnici di questa teoria saranno discussi nel Capitolo 15. =62= Prof. M. Cini -Corso di Fisica Atomica e Molecolare L'equazione di Klein-Gordon non e' cosi' semplice da quantizzare, perche' descrive una coppia di campi complessi coniugati; per questo noi non sappiamo a priori come introdurre gli operatori di creazione e annichilazione. Benche' contenga h / , ci proponiamo di ottenerla da una lagrangiana classica L= ∫ d xΛ(x,t), (2) dove la densita' lagrangiana Λ dipende in generale anche dalle derivate della Ψ ∂Ψ ∂Ψ ∂Ψ ∂Ψ Λ(x,t) =Λ(Ψ, , , , ,x,t ) . (3) ∂x ∂y ∂z ∂t Il principio di minima azione δ∫dtL(t) =0 diventa cosi' ∂Λ(x) ∂Λ(x) ∂Ψ(x) δ∫dxΛ(x) = ∫dx{ ∂Ψ δΨ + ∂Ψ δ( )}=0, (4) ∂xµ ∂( ) ∂xµ dove l'indice µ corre sulle coordinate spazio-temporali e dx sta ∂Ψ(x) ∂ per dxdt. Poiche' δ( )= δΨ(x) , con una integrazione per ∂xµ ∂xµ parti si ottiene ∫dx{ ∂Λ(x) ∂ ∂Ψ −( ∂xµ ) ∂Λ ∂Ψ }δΨ=0 ∂( ) ∂xµ (5) e le equazioni del moto sono ∂ ∂t ∂Λ ∂Λ ∂Λ(x) ∂Ψ + ∇⋅ ∂(∇Ψ) = ∂Ψ . ∂( ) ∂t (6) Nel caso in esame abbiamo non uno ma due campi, Ψ e Ψ * , che soddisfano l'equazione di Klein-Gordon. Per formare Λ abbiamo a disposizione gli scalari Ψ * Ψ e ∂µΨ * ∂µΨ. E' immediato verificare che l'equazione di Klein-Gordon si ottiene da ∂Ψ*∂Ψ mc 2 2 * Λ= -c 2∇Ψ * ⋅∇Ψ -( ) Ψ Ψ; ∂t ∂t / h i momenti canonicamente coniugati alle coordinate sono ∂Λ ∂Ψ* ∂Λ ∂Ψ π = π∗ = = (7) ∂Ψ = ∂t ∗ ∂Ψ ∂t ∂( ) ∂( ) ∂t ∂t =63= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e la densita' hamiltoniana viene H=π ∂Ψ ∂Ψ* + π∗ -Λ= ∂t ∂t ∂Ψ*∂Ψ mc 2 2 * + c 2∇Ψ * ⋅∇Ψ + ( ) Ψ Ψ. ∂t ∂t / h (8) Rimanendo nell'ambito classico, espandiamo Ψ in soluzioni p dell'equazione di Klein-Gordon. Per ogni k= ve ne sono due / h _ωk , quindi dovremo considerare indipendenti, a causa di ε(p)=±h la soluzione generale Ψ k = Nk (α k exp[-iωk t] +β k exp[iωk t] ) e ikr , (9) dove Nk e' un fattore di normalizzazione e |α k |2+|β k |2=1. / ωk h Scegliamo Nk tale che H = , cioe' la densita' di energia V associata alla Ψ k corrisponde a un quanto nel volume di normalizzazione. Si verifica facilmente che Nk = h / . 2Vωk (10) Passiamo in seconda quantizzazione con la (1), usando π(r')= ∂Ψ † . Quando facciamo commutare ∂t Ψ(r) = ∑ k' h / (α exp[-iωk't] +β k'exp[iωk't] ) e ik'r 2Vωk' k' (11) con ∂Ψ * (r') =i∑ ∂t k hωk / (α k * exp[iωk t] - β k * exp[-iωk t] ) e -ikr', 2V (12) =64= Prof. M. Cini -Corso di Fisica Atomica e Molecolare con l'idea di considerare gli α e β come operatori, supponiamo che gli α commutino con i β, perche' si riferiscono a stati diversi; gli altri commutatori vengono nella combinazione [α k' ,α k *]- - [β k' ,β k * ]- . (13) Quel segno -, che deriva dalle opposte dipendenze temporali delle soluzioni, comporta che il passaggio agli operatori di creazione e distruzione avviene con α k →ak , α k * →ak † , ma β k →bk † , β k * →bk ; le regole di commutazione bosoniche [ak ,ak' † ]- = [bk ,bk' † ] = δkk' forniscono allora [α k' ,α k * ] - [β k' ,β k * ] → 2 δkk' , e quindi si ottiene la (1). Ora, sostituendo l'operatore di campo Ψ(r) = ∑ k h / (a exp[-iωk t] +bk † exp[iωk t] ) e ikr (14) 2Vωk k nell'Hamiltoniano H= ∫ d r H (r) = ∫ d r{ ∂Ψ † ∂Ψ m2c 4 † + c 2∇Ψ † ⋅∇Ψ + Ψ Ψ}, ∂t ∂t /2 h (15) ed usando le regole di commutazione, si arriva a H= ∑h / ωk {ak † ak + bk † bk +1}; k (16) gli autovalori dell'energia sono sempre positivi. Sostituendo nell'operatore della carica totale, si ha invece Q=e (17) ∑ {ak † ak - b k † bk }. k Evidentemente, ak † ak e' il numero dei quanti positivi e bk † bk quello dei quanti negativi. Qualsiasi interazione mescolera' stati ad una particella, come ak † |0>, con stati a piu' particelle; infatti, espandendo un operatore U con la ψ dell'Equazione (14), si vede che esistono elementi di matrice del tipo <π +π +π - |U|π +>. Nei problemi di bassa energia, il mescolamento fra soluzioni di "energia positiva" e "negativa" e' debole, e si puo' ancora interpretare l'equazione di Klein-Gordon come equazione a particella (o antiparticella) singola. =65= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Capitolo 4L'elettrone relativistico Quello che ogni strutturista deve sapere sull'equazione di Dirac. 4-1 Una identita' matematica che useremo spesso Le matrici di Pauli sono, com'e' noto, le tre componenti di 0 1 0 -i 1 0 σ1= 1 0 σ2= i 0 σ3= 0 -1 che soddisfano le regole di anticommutazione [σi ,σj ]+ = 2 δij I, 1 0 dove I= 0 1 e' la matrice unitaria 2X2. Inoltre, σi σj = iεijk σk . Siano A e B vettori qualsiasi. E' immediato controllare che Az A x-iAy = A +iA - A ; x y z ( )( AzBz+(A x-iAy )(B x+iBy ) A z(B x-iB y )-(A x-iAy )B z ) = A +iA )B A (B +iB ) ( A +iA )(B -iB )+A B . ( x y z- z x y x y x y z z Questo si puo' riscrivere ( ⋅ )( ⋅ ) = ( A⋅B) I + i ⋅A∧B (1) valida anche se A e B sono operatori. Spesso la si scrive sottintendendo l'identita' 2x2 I. 4-2 Particella di spin 1/2 nonrelativistica Per una particella di spin 1/2 l'Hamiltoniano e' una matrice 2x2 che agisce su funzioni d'onda spinoriali. Per una particella libera, p2 niente dipende dallo spin, e si potrebbe pensare di prendere H= I. 2m Ma questo e' un modo posticcio e artificioso di introdurre lo spin, perche' tutte le interazioni che ne dipendono vanno poi postulate a parte. Esiste anche nel quadro non relativistico una alternativa molto piu' interessante. Se A=p e B=p allora ( .p)( .p)=p 2I . Per uno spinore a 2 componenti l'Hamiltoniano appropriato e' =66= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H= ( .p).( .p) 2m (1) e Infatti, se ora introduciamo un campo magnetico con p→ p- A, c otteniamo invece eA (p- ) 2 i c eA eA + H= ⋅ [(p- )∧(p- )] . (2) 2m 2m c c Ma eA eA e e2 (p- )∧(p- )= p∧p - [p∧A+A∧p] + 2A∧A , c c c c ed il termine intermedio non e' nullo. Usando l'identita' ∇ ∧(Aφ) = φ ∇ ∧A + ( ∇ φ)∧A (3) __ eA eA ie h si trova (p- )∧(p- )= rot A. Dal momento che rotA=B, il c c c risutato finale e' eA __ (p- ) 2 c eh H= B. (4) 2m 2mc Cosi' emerge che allo spin e' associato un momento magnetico. Invece di postularlo "ad hoc" lo abbiamo trovato automaticamente col fattore giromagnetico corretto1. Inoltre l'idea e' adatta alla formulazione della teoria relativistica di una particella con spin. 4-3 Equazione di Dirac __ Con p→ -i h ∇ , la prescrizione per spin 1/2 e' dunque pclassico2 →( ⋅p) 2. La relazione E2/c 2 -p2 = m2c 2 , ovvero (E/c-p)(E/c+p)= m2c 2 diventa allora __ ∂ __ __ ∂ __ [i h + i h ∇ ] [i h - i h ∇ ] Φ = m2c 2 Φ . (1) ∂ct ∂ct Questa e' l'equazione di Van der Waerden, equivalente a quella di ∂ Dirac. Per renderla lineare in poniamo ∂(ct) __ ∂ __ [i h - i h ∇ ] Φ ∂ct ΦL =Φ, ΦR = , mc ed otteniamo le due equazioni accoppiate / 1Il termine di interazione col campo e' cioe' -gµ S⋅B, con S=h B e g=2. 2 Sperimentalmente, un elettrone ha g≈2.002 e la piccola correzione necessaria e' dovuta ad effetti di elettrodinamica quantistica. =67= Prof. M. Cini -Corso di Fisica Atomica e Molecolare [i __ h __ [i h ∂ __ + i h ∇ ] ΦR = m c ΦL ∂ct ∂ __ - i h ∇ ] ΦL = m c ΦR ∂ct (2) Per metterle nella forma originale di Dirac , poniamo Ψ A = ΦL + ΦR (3) B R L Ψ =Φ -Φ (4) e cambiamo tutto di segno. Prendendo la somma e la differenza delle equazioni si ottiene __ ∂Ψ A -i __ (5) h .∇ΨB - i h ∂ct = - m c ΨA __ ∂Ψ B i h .∇ΨA + i __ h = - m c ΨB (6) ∂ct L'equazione di Dirac e' pero' scritta di solito in forma matriciale, con x0=ct, x1=x, x 2=y e x3=z: ∂ __ - i h .∇ ∂x0 ∂ __ __ i h .∇ i h ∂x0 __ i h ΨA ΨA Ψ B =-mc Ψ B . (7) Dal momento che lo spinore di Dirac ΨA Ψ= Ψ B ha 4 componenti, e' naturale normalizzarlo con ∫[|Ψ A |2+|Ψ B |2]d3r=1. Vedremo a suo tempo che questa e' la scelta corretta. La matrice ∂ __ e' 4X4. In essa, dopo aver diviso per h , si nota che - i moltiplica ∂x0 1 0 0 0 0 1 0 0 I 0 γ4 = 0 0 - 1 0 = 0 -I , (8) 0 0 0 - 1 ∇ x moltiplica 0 0 0 0 γ1 = 0 i i 0 0 -i 0 0 -i 0 0 0 0 -iσx = iσ 0 , x =68= (9) Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∇ y moltiplica 0 0 0 - 1 0 0 1 0 γ2 = 0 1 0 0 - 1 0 0 0 0 -iσy = iσ 0 , y (10) e ∇ z moltiplica 0 0 - i 0 0 0 0 i γ3 = i 0 0 0 0 - i 0 0 0 -iσz = iσ 0 . z (11). Cosi' l'equazione di Dirac si scrive nella forma originale ∂ mc + .∇ ) Ψ + __ Ψ =0 . (12) ∂xo h In termini delle coordinate xµ=(x 1,x 2,x 3,x 4= ix0) = (x, ict), si ha mc γµ∂µΨ + __ Ψ= 0 . (13) h (-i γ4 Ovviamente, questa va intesa come una equazione matriciale 4 mc {(γµ)αβ∂µ + __ δαβ}Ψ β=0. (14) h β=1 ∑ Mentre gli operatori ∂µ descrivono il moto della particella 1 di spin 1/2, la presenza delle matrici γ e' dovuta ai gradi di liberta' interni (spin e stato di carica). E' immediato controllare che: 1) le matrici γ hanno traccia nulla e sono Hermitiane (㵆 = γµ) 2) soddisfano le regole di anticommutazione [γµ,γν ]+ = 2 δµν I. In effetti, la moltiplicazione righe per colonne delle matrici a blocchi puo' essere eseguita formalmente come se gli elementi fossero numeri, e ad esempio, se k e m sono 1,2 o 3, 0 -iσk 0 -iσm σk σm 0 iσk 0 iσm 0 = 0 σk σm ; 1Spesso per brevita' parleremo dell'elettrone, ma la teoria si applica ad altre particelle di spin 1/2, come i µ; pero' per le particelle, come il protone, che hanno struttura, la descrizione vale solo fenomenologicamente e finche' non entrano in gioco i gradi di liberta' interni. Per esempio il momento magnetico del neutrone non e' nullo, ed e' interamente "anomalo" rispetto alla teoria di Dirac. =69= Prof. M. Cini -Corso di Fisica Atomica e Molecolare quindi [σk ;σm]+ 0 [γk ,γm]+ = 0 [ σ ;σ ] k m + il risultato consegue dalle regole di anticommutazione delle componenti di . Queste proprieta' sono piu' significative della forma concreta delle matrici. Consideriamo una matrice 4x4 S unitaria (S -1 = S† ) e il set di matrici γ' µ = SγµS-1 . E' immediato vedere che anche il set γ' µ ha traccia nulla, e' hermitiano e rispetta le regole di anticommutazione. L'equazione di Dirac scritta con i nuovi γ' e' risolta da Ψ' = SΨ ed ha lo stesso contenuto fisico di quella di partenza. La trasformazione dai γ ai γ' e' solo un cambiamento di rappresentazione1: tutto quello che accade e' un cambiamento della base usata per descrivere i gradi di liberta' interni dell'elettrone. La rappresentazione da noi usata e' quella piu' comune e si chiama rappresentazione di Dirac-Pauli. E' facile mettere l'equazione di Dirac nella forma Hamiltoniana. __ Moltiplicando la (12) a sinistra per - h cγ4, dal momento che γ42=I, si trova __∂Ψ __ ih = -ic h (iγ4 .∇ )Ψ +mc 2γ4Ψ (15) ∂t Definite allora le matrici I 0 α k = i γ4γk = i 0 -I 0 -iσk 0 σk iσk 0 = σk 0 (16) si ha __∂Ψ HΨ = i h (17) ∂t con l'Hamiltoniano 2 H= -ich / ⋅∇ +βmc 2 = c ⋅p+βmc 2 , (18) dove β=γ4. E' facile verificare che [α k ,β]+=0 e [α k ,α q]+= 2δkq . 4-4 Onde piane 1Pauli ha dimostrato il teorema inverso: dati due set γ e γ ' con le proprieta' descritte esiste sempre una trasformazione S che permette di passare da una rappresentazione all'altra. 2Grazie alle relazioni di anticommutazione, che eliminano i termini misti, si ha H 2=p2c 2+m2c 4. Si vede cosi' che le matrici 4x4 anticommutanti sono giusto quanto serve per poter formalmente estrarre la radice quadrata nella (3.2.2) ottenendo una espressione lineare nelle derivate spaziotemporali. Questo e' stato l'approccio originario di Dirac ed ha anche il vantaggio che lo spin entra naturalmente nella teoria senza bisogno di postularlo. La via alternativa seguita qui evidenzia forse meglio il nesso con la teoria di Pauli. =70= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Consideriamo l'equazione di Dirac che descrive il moto libero di una particella di impulso definito P=h / k; cerchiamo stati stazionari di -iω t onda piana Ψ k (r,t)=Ψ k (r) e =u(k)exp(ik⋅r-iωt), con E(k)=h / ω. L'equazione di Dirac per p arbitrario -E ch / ⋅k 2 -ch / ⋅k E u = -mc u (1) conduce all'equazione secolare mc 2- E det -ch / ⋅k ch / ⋅k m c 2+E = 0. (2) Sviluppando il determinante, otteniamo m2c 4-E2 +[ch / ⋅k]2=0. Applicando la (1.1), si trovano non gia' 4 radici, ma due radici doppie E=± (ch / k) 2+m2c 4 . L'equazione di Dirac ha 4 autospinori us(k), s=1,⋅⋅⋅4, con h / ωs = E s=E+ = (ch / k) 2+m2c 4 s=1 s=2 h / ωs = E s=E_ = - (ch / k) 2+m2c 4 s = 3 s = 4 . (3) Lo spettro energetico consta di due continui separati da una banda proibita fra -mc2 e mc 2. E' facile ricavare gli autospinori us esplicitamente; scrivendo φa u = φb , dove i φ sono spinori a 2 componenti,e sostituendo, si ha un sistema di due equazioni per due incognite; scegliendo l'autovalore E+, dalla seconda equazione si ricava φb = ch / ⋅k φ . E++mc 2 a (4) Se sostituiamo nella prima equazione, troviamo che e' identicamente soddisfatta. L'equazione di Dirac e' quindi risolta da φa , / ⋅k u = N ch (5) E+mc2 φa dove N e' un fattore di normalizzazione. Poiche' possiamo prendere =71= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 0 φa = 0 , oppure φa = 1 , abbiamo ottenuto due soluzioni indipendenti (s=1,2). Le altre due 1 appartengono a E=E- e si trovano analogamente, prendendo φb= 0 , 0 oppure φb = 1 e ricavando φa dalla prima equazione. Si ottiene ch / ⋅k φ b , u = N E- -mc 2 φb s=3,4. (6) Esplicitamente, per E=E+ si ha 10 ch/kz2 , u(s=1)=N ch/E+mc (k +ik ) x y E+mc 2 01 ch/(k x-ik2y) u(s=2)=N E+mc -ch / k E+mcz2 , (7) mentre per E=E- si trova -ch /kz |E|+mc 2 -ch / (k +ik ) x 2y , u(s=3)=N |E|+mc 10 (k x - ik y ) -ch/|E|+mc 2 ch/kz 2 . u(s=4)=N |E|+mc 01 (8) Per determinare N, normalizziamo su una grande scatola di volume V, tale che ∫ d x exp[(i(k-k')⋅x] = V δkk'. Sappiamo a priori che le soluzioni di HΨ sk (r)=EsΨ sk (r) devono costituire un set completo e ortonormale. Perche' le soluzioni Ψ sk (r) siano ortonormali, ∫ u s† (k)u s'(k) exp[(i(k-k')r] d3r = δss'δkk' , occorre che sia =72= Prof. M. Cini -Corso di Fisica Atomica e Molecolare p2c 2 N2V[1+ ] =1. (|E|+mc2) 2 p2c 2 2|E| Poiche' 1+ = , (|E|+mc2) 2 |E|+mc2 viene N= |E|+mc2 . 2|E|V (9) 4-5 Campo elettromagnetico esterno Descrivendo le coordinate con xµ=(x,y,z,ict) e il potenziale con Aµ=(A,iφ), adotteremo la prescrizione usuale (minimal coupling) __ __ eAµ -i h ∂µ→ _i h ∂µ _ , c eA __ ∂ __ ∂ _ che comporta p→p_ , i h →i h eφ. La (3.13) diviene c ∂t ∂t ieAµ mc γµ(∂µ _ __ )ψ + __ Ψ=0 (1) h h e la (3.7) diviene ∂ eA - i __ ΨA h ∂t + e φ c .(p _ c ) ΨA 2 =-mc (2) Ψ B Ψ B . ∂ eA __ _c (p _ ) i h _ eφ c ∂t Un cambiamento di gauge A'µ=Aµ+∂µχ comporta un fattore di fase ieχ(x,t) exp[ ], come si e' visto in 2-2. /c h 4-6 Rotazioni, momento angolare e covarianza relativistica A prima vista, la covarianza relativistica della (3.13) e' evidente, in quanto γµ∂µ ha tutta l'apparenza di un operatore scalare. In effetti, ∂µ si trasforma come un quadrivettore. Denotiamo la trasformazione di Lorentz con x' µ = aµν xν e l'inversa con x ν = bνµ x' µ . Poiche' deve risultare xµxµ= x' ν x' ν (conservazione dell'intervallo), l'inversa e' uguale alla trasposta, cioe' b νλ = aλν. Pertanto, ∂ ∂xν ∂ ∂ ∂ = = bνµ =aµν ∂x' µ ∂x' µ ∂xν ∂xν ∂xν ∂ e quindi si trasforma come xµ ed e' un quadrivettore. Se potessimo ∂xν trattare come tale anche γµ, allora γµ∂µ sarebbe ovviamente invariante, e Ψ sarebbe uno scalare. =73= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ma γµ non e' un quadrivettore, perche' non e' un osservabile. Abbiamo introdotto i γ con un ragionamento che puo' esser fatto in qualunque sistema di riferimento, e l'equazione e' covariante se nel sistema K' possiamo scrivere ∂ mc γµ Ψ'(x') + __ Ψ'(x')=0. (1) ∂x' µ h con gli stessi γµ. Il problema della covarianza relativistica e' quindi piu' delicato di quello che sembrava a prima vista; per fortuna, e' strettamente connesso con quello piu' ovvio della 'covarianza' della teoria per rotazioni del laboratorio nello spazio ordinario. Infatti, la trasformazione vx t- 2 x-vt c x'= , t'= , 1-β 2 1-β 2 puo' riscriversi x' 1=x1cosh(χ)+ix 4sinh(χ), x'4=-ix 1sinh(χ)+x 4cosh(χ), v dove tanh(χ) = β = , ed equivale ad una rotazione di un angolo iχ nel c piano x1x4. Potremo ragionare come nel paragrafo 2-6. Tratteremo simultaneamente di rotazioni ordinarie e di trasformazioni di Lorentz, denotando entrambe con x' µ = aµν xν . Supponiamo che l'elettrone sia descritto nel sistema K' dalla (1) con gli stessi γµ che usiamo in K, ad esempio con quelli della rappresentazione di Dirac-Pauli. Dobbiamo dimostrare che la (1) e' compatibile con l'equazione di Dirac scritta in K e vedere come si trasforma Ψ. Porremo Ψ'(x') = SΨ(x), con S che iωσz gioca lo stesso ruolo che R† = exp( ) giocava nel caso dello spinore 2 ∂ ∂ di Pauli. Sostituendo nella (1) con = aµν otteniamo ∂x' µ ∂xν ∂ mc γµaµν SΨ(x) + __ SΨ(x)=0, ∂xν h cioe' S-1 γµSaµν ∂ mc Ψ(x) + __ Ψ(x)=0. ∂xν h La condizione per la covarianza e' quindi S-1 γµSaµν =γν ; poiche' a µν aλν =δµλ , moltiplicando per aλν e sommando su ν si ottiene la forma equivalente S-1 γλ S = aλν γν , (2) =74= Prof. M. Cini -Corso di Fisica Atomica e Molecolare analoga alla (5) del paragrafo 2-6. La S richiesta puo' essere costruita esplicitamente. Nel caso di una rotazione intorno all'asse z, descritta dalla trasformazione di coordinate cosα sinα 0 0 -sinα c o s α 0 0 {aµν } = 0 1 0 0 0 0 0 1 deve venire S-1 γi S = aik γk , S -1 γ4S = γ4. La trasformazione S dello iασz spinore di Dirac e' la naturale generalizzazione di exp( ) : sotto 2 rotazioni, Ψ Α e Ψ B si trasformano come gli spinori di Pauli. Pertanto, σz σz 0 , e si ha Ψ'(x') = S Ψ(x) con →Σz ,dove Σz = 0 σz iα R†0 S =exp( Σz)= cos (α/2) +i Σz sin(α/2) = 0 R † = 2 iα/2 =diag(e ,e -iα/2,e iα/2,e -iα/2). (3) -1 Mandando α in -α, si ottiene S . Ora, R0 0-iσi R†0 0 R ( - i σi )R† 0 - i a ik σk -1 S γi S = 0 R iσ 0 0 R † = R(iσ )R† 0 = iaik σk 0 i i =aik γk ; per µ=4, si ha R0 I 0 R†0 RR† 0 S-1 γ4S= 0 R 0 -I 0 R † = 0 - R R † = γ4. Poiche' S e' diagonale a blocchi, Ψ Α e Ψ B non si mescolano fra loro. Ora e' importante notare che Σz=-iγ1γ2 e che la rotazione di un angolo α che abbiamo appena descritta avviene intorno all'asse z, cioe' nel piano x1_x2. Questa osservazione consente di estendere immediatamente l'argomento alle trasformazioni di Lorentz coshχ 0 0 i s i n h χ 0 1 0 0 {aµν } = 0 -isinhχ 00 01 c o s 0h χ con α →iχ, γ2→γ4, in modo che Srot = cos(α/2)+γ1γ2 sin(α/2) →SLorentz =cosh(χ/2)+ iγ1γ4 sinh(χ/2) . (4) =75= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 0 - σ1 Nella rappresentazione di Dirac-Pauli, iγ1γ4 = -σ 0 . 1 In definitiva, Ψ'(x') = S Ψ(x), dove c ( - σ1s) S= (-σ s ) (5) c , 1 dove c=cosh(χ/2), s=sinh(χ/2), tanhχ =v/c. S-1 si ottiene con χ→-χ; S non e' unitaria, anzi, S † =S, ma cio' non crea problemi. Fra poco useremo il fatto che S-1 =γ4Sγ4. Si puo' verificare che S-1 γλ S = aλν γν ; per esempio, S-1 γ4S = (c2+s2)γ42iscγ1 =a44γ4+a41γ1, dal momento che c2+s2=cosh(χ) e 2sc=sinh(χ). Spesso nei calcoli conviene esprimere tutto in termini di β=v/c a 1+β . 1-β Una trasformazione lungo l'asse z si ottiene dalla (5) con σ1→σ3. Sotto trasformazioni di Lorentz, Ψ Α e Ψ B non sono indipendenti come nel caso delle rotazioni, ma si mescolano fra loro. Esercizio Ritrovare lo spinore con s=1 del paragrafo 4-4 trasformando -mv di Lorentz u=(1,0,0,0) lungo l'asse z con velocita' v tale che _ h k= . 1-β 2 partire da exp(χ)= 4-7 Equazione di continuita' ∂ρ L'equazione di continuita' +divJ=0, scritta in forma ∂t manifestamente covariante, diventa ∂µJ µ=0; ρ e' la quarta componente di Jµ, e non e' scalare. Si puo' ottenere un quadrivettore Jµ da Ψ? E, se ρ non e' uno scalare, esistono invarianti per trasformazioni di Lorentz ψψ1 2 associati a Ψ? Dato Ψ= ψ3 , conviene definire, accanto allo spinore ψ4 aggiunto hermitiano: Ψ †=(ψ1* ψ2* ψ3* ψ4* ), (1) anche lo 'spinore aggiunto di Dirac' _ Ψ = (ψ1* ψ2*_ ψ3* _ ψ4* ) = Ψ † γ4. (2) Data una trasformazione Ψ'(x')=SΨ(x), si ha Ψ'(x') †=Ψ(x) †S† = Ψ(x) †S; quindi _ _ Ψ '(x')= Ψ(x) †Sγ4 = Ψ(x) †γ4γ4Sγ4 = Ψ (x) S-1 . _ Cosi' ΨΨ e' un invariante per trasformazioni di Lorentz. Inoltre, =76= Prof. M. Cini -Corso di Fisica Atomica e Molecolare _ _ _ _ Ψ γµ Ψ e' un quadrivettore, perche' Ψ ' γµ Ψ'=Ψ (x) S-1 γµ SΨ(x) = aµν Ψ γν Ψ. _ La quadricorrente di carica e' infatti definita da Jµ =iec Ψ γµΨ. Consideriamo un oggetto antisimmetrico negli indici, σµν = -i γµγν con µ≠ν, σµν =0 per µ=ν. _ Analogamente, Ψ σµν Ψ e' un tensore antisimmetrico, perche' _ _ _ _ Ψ ' γµ γν Ψ'=Ψ (x) S-1 γµγν SΨ(x) = Ψ (x) S-1 γµSS-1 γν SΨ(x) =aµρaνλ Ψ γργλ Ψ. Possiamo esprimere J µ in termini di Ψ † usando il fatto che iγ4γk =α k ; viene J µ = ec(Ψ † Ψ, iΨ † Ψ) ; (3) si noti che la corrente J non implica derivazioni spaziali, come nella teoria di Schro"dinger, ma e' proporzionale alla "velocita' di Dirac" c . La componente µ=4 di Jµ e' iecρ, dove ρ=Ψ †Ψ e' la somma dei moduli quadrati delle 4 componenti dello spinore. Tale quantita' e' definita positiva e fisicamente possiamo aspettarci che rappresenti la densita' di probabilita' ρ da normalizzare a 1. Non resta che controllare che l'equazione di continuita' consegue da quella di Dirac. Il coniugato Hermitiano della equazione ∂ mc ( .∇ +γ4 ) Ψ + __ Ψ =0 (4) ∂x4 h e' ∂ ∂ mc † †γ Ψ † γk + Ψ (5) __ Ψ =0; 4 + ∂xk ∂x4* h moltiplicando a destra per γ4 e tenendo conto che x4* =-x 4 , si trova ∂ ∂ _ mc _ Ψ † γk γ4 Ψ γ4 + __ Ψ =0; (6) ∂xk ∂x4 h ma γk γ4 = _ γ4γk , quindi si ha l'equazione aggiunta di Dirac __ ∂ __ _ Ψ γµ + mc Ψ= 0 ; (7) __ ∂xµ h _ moltiplicandola a destra per Ψ, moltiplicando a sinistra la (4) per Ψ e sottraendo si ha finalmente ∂ __ ∂ iec { Ψ γµΨ}= J =0. (8) ∂xµ ∂xµ µ 4-8 Parita' L'immagine speculare di un fenomeno descritto dall'equazione di Dirac in un campo elettromagnetico e' anch'esso un fenomeno =77= Prof. M. Cini -Corso di Fisica Atomica e Molecolare possibile? L'immagine speculare si forma con l'operazione σ={x→x,y→y,z→-z}. Indichiamo con P(0) l'operatore che esegue l'inversione delle coordinate spaziali: P(0) x = -x =x'. Poiche' σ si ottiene componendo P(0) con una rotazione di 1800, basta che ci occupiamo di P (0) . Consideriamo il passaggio da un sistema di riferimento K ad uno K' che ha gli assi invertiti. Se x rappresenta un punto in K, x' rappresenta lo stesso punto in K'; inoltre A'(x')=-A(x), A'4(x')=A 4(x). Questo assicura che E e' un vettore, B uno pseudovettore e l'equazione classica del moto d v v m =eE+e ∧B 2 dt 1 - β c e' invariante per parita'. In meccanica quantistica, siano Ψ(x,t) e Ψ'(x',t) le rispettive funzioni d'onda. La parita' e' un operatore Π, tale che ΠΨ(x, t ) ≡ Ψ'(x,t) rappresenta (nel sistema K) la Ψ come e' vista in K'. Per una funzione scalare, f(x)=f'(x') e possiamo confondere P(0) e Π, perche' evidentemente Πf(x) = f(-x) = P(0) f(x). Nell'equazione di Schro"dinger ed in quella di Klein-Gordon p'=-p, e e ma (p'- A') 2=(p- A) 2 ed e' ovvio che anche nel sistema invertito vale c c una equazione della stessa forma che nel sistema originale; Ψ puo'essere scalare o pseudoscalare. Inoltre, se H commuta con P(0) , avremo un numero quantico per classificare gli stati stazionari; e' ben noto che le armoniche sferiche hanno parita' ben definita, perche' P(0) Ylm = (-)l Ylm . Nell'equazione di Pauli compare in piu' il termine in σ⋅B, ma poiche' B'=B questo termine e' banalmente invariante, e Π=P(0) . Anche nel caso degli spinori di Dirac vogliamo trovare un operatore Π, che rappresenti (in K) la Ψ come e' vista in K'; in questo caso, pero', Π va tenuto distinto dall'operatore P(0) che opera solo sulle coordinate, perche', come vedremo, Ψ'(x') e' diverso da Ψ(x). Si tratta di: 1) verificare che l'equazione di Dirac in un campo elettromagnetico e' invariante per trasformazioni di parita', e cioe' che la situazione fisica descritta in un dato sistema K da ∂ ieAµ mc - __ )Ψ(x,t) + __ Ψ(x,t)=0 ∂xµ c h h e' descritta nel sistema invertito K' da ∂ ieA'µ mc − γµ ( )Ψ'(x',t) + __ Ψ'(x',t)=0 __ ∂x' µ h ch con x'=-x, t'=t e con qualche Ψ'(x',t); 2) esprimere Ψ'(x',t) in termini di Ψ(x,t); γµ ( =78= (1) (2) Prof. M. Cini -Corso di Fisica Atomica e Molecolare 3) trovare Π esprimendo il risultato nel sistema K, cioe' calcolando Ψ'(x). I primi due punti si soddisfano mostrando che il passaggio fra i due sistemi di riferimento comporta solo un cambiamento di rappresentazione. Portando la (2) nel sistema K, si ha ∂ ∂ ieAk ieA mc − __ 4)}Ψ'(x',t) + __ Ψ'(x',t)=0 {_γk ( - __ ) + γ4( (3) ∂xk ∂x4 h c h c h Poniamo allora Ψ'(x',t) = SΨ(x,t). [Notare che si fanno due cose: x→x' e Ψ →SΨ]. Moltiplicando a sinistra per S -1 si ottiene ∂ ∂ ieA ieA mc − __ k ) + S -1 γ4( − __ 4)}SΨ(x,t) + __ S-1 SΨ(x,t)=0 . (4) {-S-1 γk ( ∂xk ∂x4 h c h c h La covarianza richiede che Ψ(x,t) soddisfi la (1), cioe' che S sia tale che S-1 γk S = _γk e S-1 γ4S = γ4 . E' facile vedere che S=γ4 e' adeguato allo scopo. Pertanto, Ψ'(x',t) = γ4Ψ(x,t). Soddisfaciamo allora il punto 3): ΠΨ(x,t) ≡ Ψ'(x,t)= γ4Ψ(x,t)=γ4P(0) Ψ(x,t). Quindi, Π=γ4P(0) . (5) La parita' e' un buon numero quantico per il moto in un campo centrale; Π2=1 e gli autovalori possibili sono +-1.Gli spinori di Dirac di parita' ben definita sono tali che Ψ Α (x,t) I 0 Ψ Α (-x,t) Ψ Α (x,t) ΠΨ(x,t) = 0 -I Ψ (-x,t) = -Ψ (x,t) = +- Ψ (x,t) . B B B Vi sono le due possibilita' Ψ (-x,t)=Ψ (x, t ) Ψ (-x,t)=-Ψ (x, t ) A Α A Α , Ψ (-x,t)= Ψ (x,t) Ψ (-x,t)= -Ψ (x,t) Β B Β B (6) . Quindi le componenti superiori e inferiori hanno parita' ben definite ma opposte 1. L'invarianza per parita' e' tutt'altro che ovvia e non vale per le interazioni deboli. Questo fatto e' rilevante per la fisica atomica per il seguente motivo. Weinberg, Salam e Glashow hanno mostrato che le interazioni deboli e quelle 1E' opportuno anticipare qui che questa discussione sulla parita' non e' di solo interesse matematico ma ha importanti conseguenze fisiche. Non solo essa fornisce un buon numero quantico per classificare gli stati dell'Idrogeno, ma conduce ad assegnare una parita' intrinseca ad ogni particella. In generale, particelle e antiparticelle hanno la stessa parita' intrinseca nel caso dei bosoni e parita' intrinseca opposta nel caso dei fermioni. Ad esempio, lo stato 1s del positronio e' dispari, e puo' decadere solo in stati dispari del campo elettromagnetico. =79= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elettromagnetiche sono casi particolari di una unica interazione elettrodebole. Due particelle cariche si scambiano fotoni, ma anche bosoni vettori Z 0, sia pure con probabilita' molto piu' bassa. Le costanti di accoppiamento sono in effetti simili. L' ampiezza di diffusione elettromagnetica (trasformata di Fourier del potenziale di interazione) e': e2 Aem ≈ 2 , q dove q e' il quadrimomento trasferito. Sia Aw ampiezza associata con scambio di Z 0 . Risulta che g2 Aw ≈ , M(Z 0) 2c 2+q2 con g2 ≈ e2, ma M(Z0)≈100 GeV, Aw non dipende dall'energia fino a una frazione apprezzabile di 100 GeV. Per questa ragione, le correnti deboli neutre Z 0 hanno un raggio d'azione molto corto. / h Il range del'interazione mediata dallo Z0 e' ≈ 10-16 cm . M(Z 0)c Aw q2 Alle basse energie, ≈ . Aem M(Z 0) 2c 2 Negli atomi, usando a0= _ h 2 me / h e2 0 _ hc 2, si ha q ≈ a ≈ mecα , α= , e viene me2α 2 Aw ≈ ≈ 10-14. Aem M(Z 0) 2 Le probabilita' vanno col quadrato, quindi gli effetti sono piccolissimi, e gli spostamenti attesi dei livelli atomici sono dell'ordine di 10-25 eV. Dalla fine degli anni '70 vari gruppi hanno osservato debolissime transizioni che sarebbero proibite secondo la teoria elettromagnetica, trovando risultati in accordo con quella elettrodebole. Nel caso del Cs, un gruppo di Berkley ha eccitato la transizione proibita 6S1/2→7S1/2, ed ha osservato la fluorescenza emessa nel decadimento 7S1/2->6P1/2. La motivazione di questi studi e' quella di esplorare le interazioni deboli anche a bassa energia. 4-9 Inversione temporale Consideriamo in un sistema di riferimento K una particella di Dirac in un campo elettromagnetico, generato da cariche _ 4π _ ρ(x,t) e correnti J(x,t); i potenziali sono dati da |_|A=- J, |_|A0 =c 4πρ , ed avremo =80= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∂Ψ eA = [c ⋅(p- ) +βmc 2 +e A0]Ψ(x,t). (1) ∂t c L'operazione di inversione temporale manda t in t'=-t; questo significa che ci mettiamo in un nuovo sistema K' di coordinate x,t' che ha l'asse dei tempi invertito. Beninteso, nel nuovo sistema andranno "al contrario" non solo i campi elettromagnetici, ma anche l'evoluzione temporale della particella di Dirac. Le nuove cariche saranno ρ'(x,t')=ρ(x,t) e le correnti J'(x,t')=-J(x,t), essendosi invertita la velocita' delle cariche ; di conseguenza, avremo A0'(x,t')=A0(x,t), ma A'(x,t')=A(x,t). Nel nuovo sistema, l'equazione di Dirac sara' ∂Ψ' eA'(x,t') ih / = [c ⋅(p') +βmc 2 +e A0'(x,t')]Ψ'(x,t'), (2) ∂t' c ih / dove Ψ'(x,t') e' il nuovo spinore. Vogliamo trovare un operatore T che ci fa' passare da K a K'. Il suo effetto sullo spinore e' TΨ(x,t)=Ψ'(x,t') = Ψ'(x,-t); se O e' un operatore in K, avremo in K' che T[OΨ] =O'Ψ', e questo richiede che gli operatori si trasformino secondo la regola O=T-1 O'T. Evidentemente, T deve essere tale che se Ψ'(x,t') risolve l'equazione di Dirac in K' allora Ψ(x,t) deve risolvere la corrispondente equazione in K. Vediamo prima le teorie non relativistiche. Nel caso dell'equazione di Schrödinger, T=K, dove K e' l'operatore che prende il complesso coniugato. Nel caso di Pauli, si ha in piu' il termine in σ⋅B. Poiche' T-1 B'T=-B, l'invarianza richiede T-1 'T=- , cioe' lo spin deve cambiar segno per inversione temporale, come ogni momento angolare deve fare. Poniamo allora T=T0K, e cerchiamo T 0. Dal momento che σ2 e' immaginario e le altre componenti sono reali, imponiamo T0-1 σ1T0=-σ1, T0-1 σ3T0=-σ3, T0-1 σ2T0=σ2, col risultato che a meno di una fase T0=σ2, T=σ2K . Il risultato e' in accordo col fatto che lo spin e' un momento angolare: σ2 capovolge lo spin e si trova in K' una soluzione in cui spin e campo magnetico sono opposti a quelli di K. Tornando a Dirac, ci aspettiamo T=Σ2K . Infatti nella (2), ih / cioe' ∂TΨ eA'(x,t') = [c ⋅(p') +βmc 2 +e A0'(x,t')]TΨ(x,t), ∂t' c ∂ }TΨ = ∂t' eA'(x,t') T-1 [c ⋅(p') +βmc 2 +e A0'(x,t')]TΨ(x,t), c T-1 {ih / =81= (3) Prof. M. Cini -Corso di Fisica Atomica e Molecolare poniamo T=T0K, dove T0 un operatore da determinare. Allora T-1 p'T = T-1 {-ih / ∇}T = -p. I potenziali si trasformano come sappiamo: T-1 A'(x,t')T = -A(x,t), T-1 A0'(x,t')T = A 0(x,t). Si ha cosi' ∂Ψ(x, t ) ih / = ∂t eA(x,t) [c [T-1 T]⋅(-p+ ) +[T-1 βT]mc2 +e A0(x,t)]Ψ(x,t); c Perche' questa equazione sia della forma dell'equazione di Dirac, occorre che β rimanga immutato ed si comporti come una velocita': T-1 βT=β, T-1 T= - ; (4) 0 σk Nella rappresentazione standard, con α k = σ 0 , Σ2 soddisfa. k Abbiamo cosi' dimostrato che l'equazione di Dirac e' invariante per φφ1 2 inversione temporale, e l'inverso temporale di Ψ= φ3 e' φ4 -iφ2* iφ1* Ψ '= -iφ * . Le componenti superiori non si mescolano con quelle 4* iφ3 inferiori, ma ciascuno dei due spinori a due componenti si inverte. Nei problemi stazionari, l'hamiltoniano e' invariante per inversione temporale, e TΨ, se non coincide con Ψ, fornisce una nuova soluzione degenere con la precedente (degenerazione di Kramers). L'invarianza per inversione temporale richiede che un processo e il suo inverso abbiano la stessa ampiezza, e non e' "ovvia": nel 1964 Christiansen et al. scoprirono che essa e' violata (sia pure di poco) quando il mesone K0 decade in una coppia di π, per interazione debole. Non sono note altre violazioni. 4-10 Necessita' di una nuova interpretazione fisica dell'equazione di Dirac Se si vuole interpretare l'equazione di Dirac come una generalizzazione relativistica di quella di Schro"dinger che descrive un elettrone si incontrano difficolta'. 1) Le 4 componenti. =82= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per una particella di spin 1/2 aspettavamo 2 componenti, e ne troviamo 4. Un elettrone di Dirac manifesta un grado di liberta' interno che giunge inatteso. 2) Le soluzioni di energia negativa. L'approccio iniziale di Dirac era stato quello di "estrarre la radice quadrata" nella equazione classica H= [p2c 2 + m2c 4]1/2 in un modo non convenzionale, al fine di evitare di includere le soluzioni di H=-E. ∂ L'avere introdotto una equazione lineare in non ci libera pero' dal ∂t problema degli stati "di energia negativa". Questi non possono essere semplicemente ignorati, perche' fanno parte del set completo (secondo postulato).Tuttavia essi sono inaccettabili fisicamente, perche' la teoria non avrebbe uno stato fondamentale. Un elettrone atomico dovrebbe emettere un fotone di energia ≈2mc 2 , raggiungere uno stato di energia negativa e quindi (non essendoci limite inferiore allo spettro) dovrebbe continuare a irraggiare senza fine. Proprio queste difficolta' spinsero Dirac nel 1930 a predire l'esistenza del positrone, scoperto poi da Anderson nel 1932. Il fenomeno della creazione e annichilazione di coppie (elettronepositrone, protone-antiprotone, etc.) costringe ad abbandonare la nozione che |Ψ|2 sia una densita' di probabilita'. Questo significa che la teoria deve essere riformulata, tanto piu' che esistono processi come il decadimento β del neutrone in cui la probabilita' di trovare l'elettrone non si conserva. 3) lo Zitterbewegung. Nella teoria di Dirac, la velocita' non e' legata semplicemente all'impulso e non si conserva in un moto libero; l'elettrone esegue un moto tremolante (=Zitterbewegung.) su frequenze ≈2mc 2. Per vederlo, calcoliamo dx i[H , x] = __ (1) dt h con H=c p+βmc 2. La velocita' risulta essere c , un operatore che ha autovalori +c e -c per ogni componente. Le onde piane, che sono autostati di p e di H, non sono autostati di . Questa velocita' e' ben strana. E se nonostante tutto tentiamo di insistere in quella d i[H , ] interpretazione, vi sono altri problemi. Calcoliamo = __ . Per la dt h __ prima componente abbiamo, in unita' di h , usando [α i ,α j ]+=0= [α i ,β]+, d 1 = ic{[α 2, α 1]p2 + [α 3, α 1]p3} +[β,α 1]mc 2= dt = ic{-2α 1α 2p2 -2 α 1α 3p3} -2α 1β mc 2 . Poiche' α i 2=I, puo' anche scrivere =83= Prof. M. Cini -Corso di Fisica Atomica e Molecolare d = i[-2 H +2cp]. dt Non solo questo non e' zero, ma puo' essere integrato, essendo H e p costanti del moto. (Notare che H e sono matrici 4x4, ma questo non impedisce di fare l'integrazione come se si trattasse di funzioni ordinarie). Si ottiene (t) = c p H -1 + { (0)-cpH -1 } exp[-2iHt]. (2) mv Il primo termine e' atteso classicamente, in base a p= , 1-v2/c 2 mc 2 E= . Il secondo rappresenta oscillazioni molto rapide (di 1-v2/c 2 2mc 2 frequenza ≈ ) delle 3 componenti della "velocita'", sovrapposte al / h moto rettilineo. Lo Zitterbewegung e' dovuto al fatto che le coordinate di una particella non sono definibili esattamente in una teoria relativistica. 4) altri paradossi. Consideriamo un pozzo di potenziale sferico, attrattivo per l'elettrone. Uno si aspetta soluzioni legate, che decadono esponenzialmente fuori. La teoria di Dirac si comporta in questo modo se il potenziale e' "debole", ma per profondita' >2mc2 le soluzioni fuori diventano oscillatorie e non smorzate. Il piu' famoso paradosso di questo tipo e' quello di Klein (1930). Con un potenziale a gradino uno si aspetta che la funzione d'onda, oscillatoria nella regione dove V=0, decada esponenzialmente nella regione classicamente proibita (V>E), e questo effettivamente succede se V<mc2. Ma per V grandi si trova che la corrente riflessa eccede quella incidente mentre dentro la regione proibita si hanno soluzioni oscillatorie non smorzate. Questi "paradossi" sono stati chiariti, e si spiegano con il fenomeno della creazione di coppie in presenza di campi intensi. Vediamo come. 4-11 Coniugazione di carica Il problema piu' acuto che abbiamo e' quello delle soluzioni di "energia negativa", che evolvono con eiEt invece di e-iEt ; e' naturale che ci chiediamo che equazione soddisfa Ψ * . Prendendo il complesso coniugato di ieAµ mc γµ(∂µ − (1) __ )Ψ(x,t) + __ Ψ(x,t)=0 h ch ∂ dove ∂µ= , notiamo che γ1 e γ3 sono immaginari puri, come ∂4, ∂xµ mentre sono reali ieA 4 e =84= Prof. M. Cini -Corso di Fisica Atomica e Molecolare γ2 0 0 0 - 1 0 0 1 0 = 0 1 0 0 - 1 0 0 0 . Quindi viene: ieA ieA [ -γ1(∂1 + __1) + γ2(∂2 + __2) ch ch ieA3 ieA4 mc -γ3(∂3 + __ )-γ4(∂4 + __ )+ __ ]Ψ ∗(x,t)=0 . (2) h ch ch Questa e' della forma di un'equazione di Dirac con e→-e, tranne che i termini in γ1,γ3 e γ4 hanno il segno sbagliato. Ma a questo e' facilissimo rimediare: moltiplichiamo a sinistra per γ2, e lasciamolo anticommutare con gli altri γ. Il risultato e' ∂ ieAµ C mc + γµ ( )Ψ (x,t) + __ Ψ C(x,t)=0 , (3) __ ∂xµ h ch dove compare il coniugato di carica di Ψ, Ψ C = γ2 Ψ * ; (4) * -φ4 φφ1 φ * 2 C= 3 . se Ψ= , viene Ψ φ3 φ2** φ4 -φ1 Questa e' una simmetria che mette in corrispondenza le soluzioni dell'equazione di Dirac in un dato campo elettromagnetico per particelle elettricamente positive e negative di eguale massa. Niente del genere esiste nella teoria non relativistica. Invece di parlare di insensate "energie negative", potremo interpretare quelle soluzioni come pertinenti a particelle di carica -e. Riprendendo le onde piane del paragrafo 4-4, si puo' ora notare che u(s=2)C(k)= u (s=3)(-k), u(s=1)C(k)= -u (s=4)(-k). Queste relazioni si estendono immediatamente agli autospinori completi Ψ sk (r,t): Ψ 2k (r,t) C= Ψ 3,-k (r,t), Ψ 1k (r,t) C= -Ψ 4,-k (r,t). (5) (6) Per un elettrone, le soluzioni "di energia negativa" coniugate a stati di impulso _ h k e spin σ descrivono stati di carica |e|, e di massa m, di momento opposto e di spin opposto. L'assenza di un =85= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elettrone in uno di questi stati verra' ora interpretata come la presenza di un positrone. L'invarianza C per coniugazione di carica e' violata dalle interazioni deboli. L'invarianza ritenuta esatta e' PCT. 4-12 Quantizzazione del campo di Dirac . Dirac propose che tutti gli stati "di energia negativa" fossero riempiti in condizioni normali e valesse il principio di Pauli. Il vuoto divento' cosi' un mare infinito di elettroni di energia negativa (mare di Dirac)1. Un elettrone del mare, se assorbe un fotone di energia >2mc2, va in uno stato di energia positiva e lascia un "buco" nel mare di Dirac. Il buco si comporta come una particella di massa m, carica +|e| ed energia positiva; questo e' appunto un positrone, che ha anche spin e impulso opposti a quelli dello stato elettronico mancante. Non importa che questo vuoto sia infinitamente diverso da quello che i filosofi hanno immaginato per secoli. Il vuoto dei filosofi, cioe' un luogo dove non c'e' nulla, non esiste. Occorre un formalismo che realizzi questa idea. Dapprima lavoriamo nello schema a particella singola. L'equazione di Dirac per una particella libera ha 4 soluzioni di impulso definito / hk; formiamo al tempo t=0 un pacchetto d'onde, contenente stati di energia sia positiva che negativa; esso rappresenta la piu' generale soluzione dell'equazione di Dirac in assenza di campi esterni, ed e' della forma 4 Ψ(r,t=0) = ∑ ∑ c s(k)u s(k) e ik ⋅r . k s=1 Questo e' il campo da quantizzare. Al tempo t diventa Ψ(r,t) = ∑ ∑ c s(k,t)u s(k) e ik ⋅r , k s (1) (2) con cs(k,t)=cs(k,0)exp(-iωs(k)t). Indichiamo con H il valore di aspettazione di H sul pacchetto d'onde; in virtu' delle relazioni di ortogonalita' troviamo H=(Ψ,HΨ) = ∫d3r[ ∑ c s'(k')u s'(k') e ik' ⋅r ]† H [ ∑ c s(k)u s(k) e ik ⋅r ] = k's' ks 1Questo e' un famoso esempio di una idea che puo' apparire stravagante a prima vista, ed invece e' profonda. Una 'rinormalizzazione' del vuoto d'altra parte e' necessaria anche per accomodare le oscillazioni di punto zero del campo elettromagnetico. =86= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = ∑h / ωs(k)c s* (k)c s(k) ks 2 4 = ∑ [ε(k) ∑ c s* (k)c s(k)-ε(k) ∑ c s* (k)c s(k)], k s=1 s=3 (3) _ dove ε(k) = h 2k 2c 2+m2c 4 . Analogamente, per l'impulso, calcoliamo il valore di aspettazione P , che risulta P =(Ψ,pΨ) = ∫d3r[ ∑ c s'(k')u s'(k') e ik' ⋅r ]† p [ ∑ c s(k)u s(k) e ik ⋅r ] = k's' ks = ∑h / kc s* (k)c s(k). ks (4) La densita' di carica elettrica e' uguale alla carica elementare e moltiplicata per la densita' di probabilita' Ψ †Ψ; la carica elettrica totale Q e' l'integrale spaziale, e si ottiene Q = e ∑ c s* (k)c s(k). (5) ks Per passare in seconda quantizzazione occorre trasformare i coefficienti complessi in operatori, cs* (k)→ c s†(k), ma come? La Fisica richiede che le regole matematiche realizzino l'idea del mare di Dirac. Se usiamo le regole adatte ai bosoni, [c,c†]=1, e' il disastro; abbiamo oscillatori di energia negativa, e lo spettro e' privo di un limite inferiore. Dobbiamo usare regole adatte ai fermioni, e rispettare il principio di Pauli. Allora supponiamo: 1) che il vuoto sia uno stato in cui tutti i livelli con s=3,4 sono occupati 2) che abbiano significato fisico non i valori di aspettazione ma le loro differenze rispetto al vuoto. Allora scriveremo l'Hamiltoniano in seconda quantizzazione nella forma 4 H=H - ∑ ∑ h / ωs(k) = k s=3 2 4 =∑ ∑ h / ωs(k) c s† (k)c s(k) + ∑ ∑ h / ωs(k)[ cs† (k)c s(k) -1]. k s=1 k s=3 (6) Applicando le regole di anticommutazione dei fermioni, c s† c s -1= -c sc s† , otteniamo =87= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 2 4 H=∑ ∑ h / ωs(k) c s† c s - ∑ ∑ h / ωs(k) c sc s† . (7) k s=1 k s=3 cioe' 2 4 H= ∑ ε(k) { ∑ c s† (k)c s(k) + ∑ c s(k)c s† (k)}. k s=1 s=3 (8) Questo Hamiltoniano ha valore di aspettazione nullo sul vuoto e positivo in ogni altro stato, e csc s† agisce come operatore numero dei positroni. In tal modo, la teoria spiega la familiare regola per cui le funzioni d'onda dei fermioni devono essere antisimmetrizzate, e non simmetrizzate (tertium non datur, per particelle identiche). Finora abbiamo usato il formalismo della seconda quantizzazione sulla base degli autospinori dell'equazione di Dirac. E' naturale adesso modificare la base, per quanto riguarda gli stati "di energia negativa", in modo che essi compaiano per quello che sono, cioe' stati di antiparticella. Poiche' il coniugato di carica di u (s=2)(k) e' u(s=3)(-k), ma u (s=1)C(k)= -u (s=4)(-k), definiamo gli operatori dei positroni bs e bs† con s=1,2 b1† (k) =-c 4(-k) b 2† (k) =c 3(-k). (9) Cosi' lo spin del positrone e' opposto a quello dello stato di elettrone del mare di Dirac annichilato. In tal modo, 2 4 (10) ∑ b s†(k) bs (k)= ∑ c s(-k) cs†(-k) . s=1 s=3 Adesso, 2 H = ∑ ∑ ε(k)[c s† (k)c s(k) +bs† (k)b s(k) ], (11) k s=1 Analogamente, sottraendo l'impulso del vuoto, troviamo 4 (Ψ,pΨ) - ∑ ∑ h / kc s* (k)c s(k)→ k s=3 2 4 → P= ∑ ∑ h / k c s† c s - ∑ ∑ h / k c sc s† . (12) k s=1 k s=3 che diventa 2 P= ∑ ∑ h / k [c s† (k)c s(k) +bs† (k)b s(k) ]; (13) k s=1 la carica, sottratta quella del vuoto, diventa 2 Q = e ∑ ∑ [c s† (k)c s(k) - bs† (k)b s(k) ], (14) k s=1 =88= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e l'idea di Dirac si e' tradotta in un formalismo adeguato e privo di inconsistenze. Il pacchetto d'onde (2) diventa l'operatore di campo 2 4 Ψ(r,t) = ∑ { ∑ c s(k)u s(k) e i(k ⋅r - (k)t) + ∑ c s(k)u s(k) e i(k ⋅r+ (k)t) } k s=1 s=3 2 → ∑ { ∑ c s(k)u s(k) e i(k ⋅r - (k)t) + k s=1 +[b2†(-k)u 3(k) - b1†(-k)u 4(k)] e i(k ⋅r+ (k)t) }. Introducendo gli stati di positrone v1(k)=u 1C(k), v 2(k)=u 2C(k), si ottiene 2 Ψ(r,t)= ∑ ∑ {cs(k)u s(k) e i(k ⋅r - (k)t) k s=1 +bs†(k)vs(k) e -i(k ⋅r - (k)t). (15) E' chiaro, ad esempio, che un potenziale come quello del paradosso di Klein, messo in seconda quantizzazione, contiene termini in c s† (k)b s'† (k'), che corrispondono alla creazione di coppie. Partiamo ad esempio da uno stato a particella singola, = |1,k >= c † 1(k)|v>, di energia E(0) = εk ; il campo ha stati contenenti una coppia , come ad esempio φ = c † 1(k')c † 1(k')b † 1(k"')|v>, <φ |V |φ0> che entrano al primo ordine perturbativo con ampiezze . E-E0 φ (0) Le ampiezze hanno al denominatore una energia che vale almeno 2mc2. Nei problemi atomici, tali termini sono di solito trascurabili. Allora il campo di Dirac ha in effetti una sola particella, e l'interpretazione secondo i 4 postulati e' valida. Con un campo elettromagnetico non nullo, avremo un diverso set completo di stati {|n>} con cui ripetere il procedimento in seconda quantizzazione; quelli di energia positiva sono stati elettronici, e tali saranno anche gli stati discreti dell'atomo di H che ricaveremo piu' avanti. Essi pero' saranno puramente elettronici solo in quanto c'e' il potenziale, ed avranno overlap non nullo con gli stati liberi "di energia negativa". Il vuoto stesso e' modificato, cioe' polarizzato, dal campo; in esso sono occupati gli stati di energia negativa, che hanno overlap non nullo con gli stati elettronici liberi. Ci sono coppie virtuali. Se per qualche ragione il potenziale viene rimosso, o anche fatto variare rapidamente, coppie potranno ipso facto trovarsi ad essere reali. Cosi' il fenomeno della produzione di coppie emerge naturalmente dalla teoria. 4-13 La teoria di Dirac come generalizzazione di quella di Pauli La struttura della teoria quasi-relativistica differisce tanto da quella di Pauli da rendere il confronto non immediato. Denotando con V il potenziale coulombiano, scriviamo l'equazione di Dirac =89= Prof. M. Cini -Corso di Fisica Atomica e Molecolare __ ∂ i h + eV ∂t eA _c (p _ ) c eA Ψ A Ψ A c .(p _ ) c 2 =-mc __ ∂ _ h i eV ∂t Ψ B Ψ B . (1) e vediamo come si semplifica per campi deboli e basse energie. Prima di tutto, nell'equazione di Pauli e' naturale prendere come origine delle energie lo stato di elettrone libero di energia cinetica nulla, che corrisponde all'energia mc 2 nella (1). Quindi, conviene eliminare __ ∂ __ ∂ l'energia di riposo con la trasformazione i h →i h +mc 2, che ∂t ∂t equivale a mettere in evidenza nella Ψ un fattore di fase exp[-imc2t/ __ h ] . Cosi' otteniamo ∂ eA ( i __ h ∂t - e V )ΨA = c .(p _ c )ΨB __ ∂ (2) eA A ( i h 2 B _ - e V + 2 m c )Ψ = c .(p )Ψ ∂t c Risolviamo iterativamente. All'approssimazione piu' bassa nella __ ∂ seconda si puo' trascurare i h - eV rispetto a 2mc2 e rimane ∂t eA .(p _ ) c B Ψ = ΨA ; 2mc quindi Ψ B e' la componente "piccola". Sostituendo nella prima si ottiene per la componente "grande" eA 2 _ [ .(p )] __ ∂ c A h (i - eV)Ψ = ΨA ∂t 2m che gia' sappiamo essere equivalente all'equazione di Pauli. Cosi' nel limite non relativistico Ψ A diventa lo spinore di Pauli e Ψ B perde importanza fisica. Tutto cio' e' corretto fino all'ordine 1/c. Vogliamo adesso ottenere le correzioni di ordine O(1/c2) per gli stati stazionari dell'atomo idrogenoide. Riscriviamo allora __ ∂ le (2) ponendo A=0 e i h =ε ; otteniamo ∂t ( ε - e V )Ψ A = c . p Ψ B (ε - e V + 2 m c 2)Ψ B = c . p Ψ A (3) (4) .pΨ Α In prima approssimazione ; per avere la seconda 2mc approssimazione, riscriviamo la (4) ΨB = =90= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 2mc 2Ψ B = (-ε +eV)Ψ B +c .pΨ A (5) ed inseriamo a secondo membro la prima approssimazione a Ψ B . Si ottiene ε-eV 1 ΨB = [1]( p)Ψ A . (6) 2mc 2mc 2 Inserendo questa nella (3) otteniamo la seconda approssimazione per Ψ A ε-eV 1 ( ε - eV)Ψ A = c .p [1]( p)Ψ A (7) 2mc 2mc 2 In questo modo si e' completata la seconda approssimazione alla teoria di Dirac, e sarebbe facile procedere oltre. Tuttavia, per la presenza delle 4 componenti si e' perso il contatto con la teoria di Pauli. Nella teoria di Pauli, lo spinore φ a ∂φ due componenti obbedisce a Hφ=i / h , dove H e' l'Hamiltoniano ∂t non relativistico; se gli effetti relativistici sono deboli, dovremmo poterli includere nella teoria non relativistica come correzioni di ordine (v/c)2 all' Hamiltoniano. L'identificazione dello spinore φ della teoria non relativistica con le componenti grandi vale solo al primo ordine in 1/c; in generale le componenti grandi e quelle piccole entrano insieme nella normalizzazione della Ψ, e quindi Ψ A da solo non e' normalizzato e non ha il senso di uno spinore di Pauli. Tuttavia, se ci fermiamo al secondo ordine, e' sufficiente fare intervenire nella normalizzazione la Ψ B del primo ordine; __2 ⌠ h 3r[|Ψ A |2 + 1=∫d3r[|Ψ A |2 + | Ψ B |2] = d | .∇ Ψ A |2] (8) 4m2c 2 ⌡ Dunque, possiamo normalizzare correttamente (al secondo ordine) conoscendo solo le componenti grandi. Cio' suggerisce di riformulare il problema in termini di un solo spinore a due componenti φ, normalizzato con 1=∫d3r|φ|2, e collegato a Ψ A da una qualche trasformazione φ=AΨ A . Se riusciamo a determinare A ed a riscrivere il problema nella forma Hφ=Eφ potremo interpretare H come l'hamiltoniano che contiene le correzioni relativistiche fino all'ordine 1/c 2. Vedremo subito che p2 A=1+ . 8m2c 2 Per trovare A, trasformiamo l'integrale di normalizzazione (8). Il termine piu' complicato e' __2 __2 ⌠ ⌠ h h 3 d r ∇ Ψ A |2= d3r | . ( ∇ Ψ A†. )( .∇ ) Ψ A , 2 2 4m c 4m2c 2 ⌡ ⌡ e conviene integrare per parti rispetto al primo ∇ riscrivendolo come =91= Prof. M. Cini -Corso di Fisica Atomica e Molecolare __2 ⌠ h 3 d r {div[Ψ A†. ( .∇ Ψ A ) ] - Ψ A†.( ∇ )( .∇ ) Ψ A } ; 4m2c 2 ⌡ l'integrale della divergenza e' uguale al flusso all'infinito, che e' nullo. Applicando ancora l'identita' (1.1) si ha che ( ∇ )( .∇ )= ∇ 2. Quindi, ∫d3r | .∇ ΨA|2 =-∫d3rΨA†∇2ΨA, e trattandosi di quantita' reale potremo metterla nella forma piu' simmetrica -(1/2)∫d3r{Ψ A†∇ 2Ψ A + Ψ A ∇ 2Ψ A†} . Con cio' la condizione di normalizzazione diventa ⌠ p2 p2 3 A |2 +Ψ A† A +Ψ A 1= d r{|Ψ Ψ Ψ A†)= 8m2c 2 8m2c 2 ⌡ ⌠ p2 p2 A†+ A†)(Ψ A + A 4 = dV(Ψ Ψ 2c 2 2c 2Ψ ) + O(1/c ). 8m 8m ⌡ Quindi, p2 φ ≈ (Ψ A + Ψ A ). 8m2c 2 p2 )φ. 8m2c 2 Per ottenere una equazione per φ, basta inserire la trasformazione nella equazione (7) che determina Ψ A : A questo ordine, la trasformazione inversa e' Ψ A ≈(1 - ( ε - eV)(1 - p2 )φ = 8m2c 2 .p ε-eV 1 p2 [1]( p)(1 )φ 2m 2mc 2 8m2c 2 . (9) Si vede ad occhio che il limite non relativistico e' l'equazione di Pauli. Ma noi vogliamo una equazione corretta al secondo ordine, ed anzi nella (9) c'e' ancora un termine di ordine superiore da trascurare. Svolgendo il prodotto a secondo membro, escludiamo il termine del quarto ordine, e resta .p ε-eV 1 p2 .p ( p)(1 )φ ( p)φ , 2m 8m2c 2 2m 2mc 2 mentre il primo membro e' ( ε - eV)φ - p2 p2 ε φ + eV φ. 8m2c 2 8m2c 2 A questo punto il problema e' quello di mettere in forma hamiltoniana questa equazione. Il primo membro contiene un termine εφ, che e' necessario allo scopo; si deve notare che ε compare anche altrove, sia a primo che a secondo membro, ma sono termini in cui εφ figura sotto l'azione di un operatore O(1/c2). Per eliminare ε da questi termini, =92= Prof. M. Cini -Corso di Fisica Atomica e Molecolare non compatibili con la forma hamiltoniana, ma piccoli, possiamo p2 sostituirvi εφ con la sua approssimazione 0, cioe' con ( +eV)φ. Cosi' 2m p2 p2 p2 εφ≈. ( +eV)φ. 8m2c 2 8m2c 2 2m Raccogliendo i termini, si trova p2 p2 p2 (ε-eV)φ [ +eV]φ +eV φ= 8m2c 2 2m 8m2c 2 ( p)( p) ( p)( p) p2 p2 e =[ (1) ( +eV) + ( p)V( p)]φ. 2 2 2 2 2m 8m c 4m c 2m 4m2c 2 Poiche' ( p)( p)=p 2I si puo' finalmente riscrivere l'equazione nella forma Hφ=εφ, con p2 p4 e 1 2 H= + eV + [( p)V( p)(p V+Vp2)] . (10) 2m 8m3c 2 4m2c 2 2 Il nostro scopo e' cosi' raggiunto, ma possiamo riscrivere il risultato in forma piu' semplice, applicando ripetutamente la (1.1). Notiamo che __ ( p)V( p) = V( p)( p) + ( pV)( p) = Vp2 +i h ( E)( p); ma ( E)( p) = Ep+i (Exp); quindi __ __ ( p)V( p) = Vp2 +i h Ep- h (Exp). Pertanto, i termini complicati contenenti V sono 1 -1 __ __ [( p)V( p)- (p 2V+Vp2)] = (p 2V-Vp2) +i h Ep- h (E∧p). 2 2 Il commutatore si calcola, come al solito, facendolo agire su una funzione di prova, e risulta: __ __ __ __ (p 2V -Vp2) = - h 2∇ 2V -2i h ∇ V.p= h 2divE+2i h Ep. Alfine, otteniamo l'espressione cercata, __ p2 p4 eh H= +eV 2m 8m3c 2 4m2c 2 __ eh 2 (Exp)divE . 8m2c 2 (11) Le correzioni relativistiche hanno la seguente interpretazione fisica. Il termine in p4 viene evidentemente dall'espansione dell'energia cinetica. Nel termine successivo, se V ha simmetria centrale, si puo' dV r scrivere E=e si ottiene dr r __ __ eh eh dV e dV ( (Exp)) = ( (rxp)) = (sL) = HSO. 4m2c 2 4m2c 2r dr 2m2c 2r dr =93= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Evidentemente, HSO e' l'interazione spin-orbita, che agisce su tutti gli stati atomici esclusi gli stati s. Il termine in divE, che agisce solo sugli stati s, ed e' noto come termine di Darwin, puo' essere interpretato qualitativamente come una manifestazione dello Zitterbewegung. A breve distanza dal nucleo, dove il campo e' piu' forte, si fa' sentire il fatto che la posizione dell'elettrone non puo' essere definita esattamente. La coordinata r ha fluttuazioni di __ frequenza caratteristica 2mc2/ h con spostamenti δr in tutte le __ h 1 direzioni di entita' δx ≈ . Un elettrone che fluttuando mc intorno a r si trovasse a un certo istante in r+δr sentirebbe un potenziale effettivo ∂2V V(r+δr) = V(r) +δr. ∇ V +(1/2)Σij δri δrj + ... ∂ri ∂rj Se facciamo una media temporale, δij __ h 2 2 <δri>=0 e <δri δrj > = (1/3) δij <δx > ≈ ) . ( 3 mc Cio' comporta una correzione al potenziale di __ h 2 ∇2 <V(r+δr) - V(r)> ≈ (1/2)(1/3) ( ) V. mc Questo corrisponde al termine di Darwin (il fattore e' 1/6 anziche' 1/8, ma l'argomento e' molto euristico). Nell'ambito della teoria del mare di Dirac, l'effetto puo' essere descritto come segue 2. Nelle sue immediate vicinanze, il forte campo del nucleo crea coppie virtuali elettrone-positrone (polarizzazione del vuoto). Queste sono analoghe alle coppie elettrone-lacuna che producono la polarizzabilita' di un dielettrico. Il fatto che Ψ ha componenti positroniche virtuali3 comporta che l'elettrone atomico puo' annichilarsi con il positrone di una coppia, e l'elettrone della coppia diventa allora l'elettrone atomico. La violazione della conservazione dell'energia associata alla creazione di una coppia virtuale e' ≈2mc 2 , quindi essa vive per un __ h tempo ∆t ≈ , nel quale tempo l'elettrone della coppia puo' 2mc 2 1nel senso che tutte le componenti fluttuano. 2Questo argomento e' svolto nel libro di J.J. Sakurai, Advanced Quantum Mechanics", Addison-Wesley (1967) pag. 138 e seguenti. 3Piu' propriamente, Ψ ha overlap non nullo con stati di onda piana di energia negativa, che vanno interpretati come stati di positrone. Tutto cio' e' contenuto nell'equazione di Dirac interpretata come equazione di campo. La descrizione fisica andrebbe poi completata con le correzioni radiative della elettrodinamica quantistica. Il termine di Darwin e' cio' che rimane di questi fenomeni se si insiste nella interpretazione a particella singola. =94= Prof. M. Cini -Corso di Fisica Atomica e Molecolare __ h aver percorso al piu' una distanza c∆t ≈ , che e' dell'ordine di 2mc δx. La polarizzazione del vuoto rivela la struttura complessa del vuoto fisico, che e' profondamente diverso dall'idea ingenua di una regione di spazio priva di particelle e di campi. Tale struttura e' un fatto reale, che ha sui livelli energetici degli atomi effetti osservabili. Vi sono ulteriori effetti della polarizzazione del vuoto che non sono contenuti nell'equazione di Dirac; si tratta di correzioni di elettrodinamica quantistica, e ne riparleremo piu' avanti. Il procedimento or ora eseguito per ottenere una Hamiltoniana effettiva corretta fino all'ordine 1/c2, che agisce su uno spinore di Pauli e' una trasformazione canonica approssimata che partendo dagli spinori Ψ A e Ψ B accoppiati conduce a due spinori (φ e 0) disaccoppiati. Il procedimento si puo' iterare e fornisce (in linea di principio) una H relativistica valida a tutti gli ordini, che ha un numero infinito di termini. Un metodo sistematico per iterare la trasformazione e' stato fornito nel 1950 da Foldy e Wouthuysen. Avendo da poco apprezzato le ragioni per cui le componenti per uno spin 1/2 devono essere 4, il lettore puo' essere disorientato a sentire che la teoria puo' essere riformulata con 2 componenti; e che per giunta si tratta ∂ di una una formulazione del primo ordine in , che rientra in un quadro ∂t teorico "alla Pauli". Ma occorre tenere nel debito conto il fatto che cio' richiede una H con un numero infinito di termini. Con un H infinitamente complesso, si puo' far di tutto, anche simulare la realta' con un quadro teorico "sbagliato". L'approccio e' trattabile solo per piccoli v/c, quando quelle che si cercano sono "correzioni" relativistiche. 4-14 Il momento magnetico anomalo dell'elettrone Per un elettrone libero, la densita' hamiltoniana e' lo scalare _α⋅∇+βmc2}Ψ =εΨ†Ψ, H= Ψ†HDΨ=Ψ†{-ich (1) dove HD e' l'hamiltoniana di Dirac. Introducendo l'interazione eA col campo elettromagnetico con p→p, ε→ε-eφ, si ha il c termine aggiuntivo Hint= -e Ψ† αΨA +eΨ†Ψφ. Ricordando che φ=-i A4 , =i γ4 , si trova _ Hint = -ie Ψ γµ ΨΑ µ =-J µAµ, =95= (2) Prof. M. Cini -Corso di Fisica Atomica e Molecolare che e' anch'esso ovviamente uno scalare. In termini non relativistici, essa ha due contributi distinti: l'interazione fra la carica ed il campo, e quella fra il momento magnetico di spin e il campo. Nella teoria di Dirac, il fattore giromagnetico e' g=2. In realta' g≈2.0023, κ=(g2)/2=1,1596 10-3 . L'elettrodinamica quantistica spiega questo fatto in termini di una "correzione al vertice" e da' e2 g=2(1+κ )≈2[1+ + ...]. (3) 8π 2ch / Possiamo modificare la teoria di Dirac in modo da tenere conto del valore corretto di g. Bastano a tal fine pure considerazioni di simmetria. Il campo elettromagnetico e' il tensore antisimmetrico ∂Aν ∂Aµ Fµν = , ∂xµ ∂xν di componenti F 0 −B = 3 B 2 iE 1 −B 2 B 1 0 iE 3 B 3 0 −B 1 iE 2 −iE 1 −iE 2 −iE 3 0 (4) Riprendiamo l'oggetto antisimmetrico visto nel paragrafo 4-7, σµν = -i γµγν con µ≠ν, σµν =0 per µ=ν, che, omettendo i termini sotto la diagonale, che sono ovvi, e' 0 −i 1 . 0 = . . . . 2 −i −i −i −i −i 1 3 2 3 0 . 1 4 2 4 . 3 4 0 (5) 0 -iσk Ora, ricordando che γk = iσ 0 , si ha subito che γi γj = i εijk Σk , k cioe' γ1γ2=iΣ3 e cicliche. Quindi, commutando γ4 e le componenti di , 0 Σ3 . 0 = . . . . −Σ 2 Σ1 0 . i i i 4 1 . 4 3 0 4 2 =96= (6) Prof. M. Cini -Corso di Fisica Atomica e Molecolare _ Sappiamo che Ψ σµν Ψ e' un tensore antisimmetrico. Possiamo allora combinarlo col tensore elettromagnetico per fare lo scalare _ -eh / κ h'= 2mc [Fµν Ψ σµν Ψ ] , (7) 2 dove κ e' una opportuna costante numerica. Tenendo conto dell'antisimmetria dei tensori, possiamo scrivere: Fµν σµν = contributo sopra le diagonali 2 =B3Σ3+B2Σ2+E1γ4γ1 +B1Σ1+E2γ4γ2+E3γ4γ3 = =B⋅Σ +E⋅γ4 Pertanto, la correzione e' _ -eh / h'= 2mc κ[ B⋅(Ψ ΣΨ) +E⋅(Ψ † Ψ)] . (8) _ Ora, Ψ = Ψ † γ4=(Ψ A † ,-Ψ B † ), e quindi σ 0 ΨA _ A † B † (Ψ Ψ) = (Ψ ,-Ψ ) 0 σ Ψ B =(Ψ A † Ψ A )-(Ψ B † Ψ B ), A dove Ψ e' la componente grande, mentre (Ψ † Ψ) = -i[Ψ A † σ Ψ B )-(Ψ B † σ ΨA )]. Nel limite non relativistico, vanno a 0 le componenti piccole ed i termini in E che sono ad esse proporzionali, e percio' -eh / -eh / h' → 2mc κ ⋅ (Ψ A † σΨA ) = 2κ ⋅ (Ψ A † S Ψ A ) . 2mc Pertanto, h' ha il significato fisico di una interazione ulteriore fra spin e campo magnetico ed e' usata, di fatto, per rappresentare fenomenologicamente, nell'equazione di Dirac, la parte anomala "aggiuntiva" del fattore giromagnetico. La QED giustifica la forma di h' e consente anche di calcolare κ in accordo con l'esperimento. La modifica serve anche per poter descrivere fenomenologicamente le particelle di spin 1/2 che non sono di Dirac perche' hanno struttura interna (protone e neutrone). Il termine elettrico e' necessario perche' nel sistema di riferimento dell'elettrone il campo elettrico comporta un campo magnetico che si accoppia con lo spin; ora in un atomo questo termine va come r -2 e diventa il piu' importante vicino al nucleo. Questo ha conseguenze spettacolari negli atomi superpesanti (paragrafo 5-6). =97= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Capitolo 5: L'Atomo idrogenoide Lo studio del sistema idrogenoide ci porta a ritrovare la formula semiclassica di Sommerfeld, ma ci conduce anche nel pieno di problematiche scientifiche di punta. 5-1-Moto in un campo centrale V(r) Consideriamo l'Hamiltoniano H=c .p +βmc 2 +V(r). Vogliamo mettere in risalto la peculiare struttura spin-angolare degli stati di Dirac in un potenziale centrale, e, analogamente a quanto si fa' nel caso non relativistico, trovare costanti del moto. La differenza fondamentale rispetto al caso di Pauli e' che lo spin qui gioca un ruolo essenziale, mentre la' entrava fenomenologicamente, come un concetto estraneo introdotto ad hoc nella teoria di Schro"dinger. Cosi' le stesse operazioni di simmetria, da cui si ricavano le costanti del moto, mescolano i gradi di liberta' orbitali e di spin. P(0) V(r)=V(r), parita' Poiche' gli spinori che cerchiamo sono autostati della parita' , e sappiamo che le componenti grandi Ψ A e quelle piccole Ψ B sono di parita' definita, ma opposta. momento angolare Il momento angolare totale conservato e' __ h J = L+ . (1) 2 Mentre nella teoria di Pauli eravamo costretti a postulare una interazione spin-orbita H SO ad hoc e ad aggiungerla all'Hamiltoniano per stabilire una connessione fra gradi di liberta' di spin ed orbitali, questa connessione si ottiene naturalmente nella teoria di Dirac. Infatti: __ [L, H] - = ic h ( ∧ p), e quindi il momento angolare orbitale L non si conserva. Ricordando __ che [x i ,pk ] = i h δik , [Lz,H] = [Lz,cα.p] = c[xp y -ypx, α xpx +α y py ] = c[xp y ,α xpx] -c[ypx,α y py ] = __ =cpy α x[x,px]-cp xα y [y,py ] =i h c( ∧p) z. Abbiamo gia' incontrato l'operatore dello spin, 0 = 0 (2) =98= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e vediamo se si conserva 1. σz 0 mc 2+V c .p 0 c [ σz; ⋅p] [Σz,H] - = [ 0 σ , c .p - m c 2+V ]- = c [ σ ; ⋅p] 0 ] z z Ma [σz, ⋅p] = [σz,σxpx+σy py ] =px[σz,σx] + py [σz,σy ], ed utilizzando [σz,σx]- =2iσy etc. verifichiamo che [Σz,H] - =-2ic( x p) z. (3) Possiamo etichettare lo spinore di Dirac con mj ; Ψ A e Ψ B lo hanno in comune. Il quadrato di un momento angolare commuta con le singole componenti. Insieme con H e Jz, si puo' diagonalizzare J2, / h con autovalori J(J+1)h / 2. Poiche' J =L+ e' diagonale a blocchi, lo e' 2 anche J 2Pauli 0 ; J2 = 0 J 2 Pauli gli autostati simultanei si ottengono da ΨA ΨA J 2Ψ = J 2 Ψ B = J(J+1)h / 2. Ψ B , (4) e sono composti da due spinori di Pauli degli stessi J e mj . Cio' e' in accordo col fatto che i due spinori si trasformano indipendentemente per rotazioni. Dati J e mj , ci sono due possibilita', che sono le armoniche sferiche generalizzate: J=L+1/2 1 0 L+mj +1/2 L L-mj +1/2 L Y(J,mj ,L)= Ym -1/2 0 + Ym +1/2 1 2L+1 2L+1 j j J=L-1/2 1 0 L-mj +1/2 L L+mj +1/2 L Ym -1/2 0 + Ym +1/2 1 . 2L+1 2L+1 j j Le radici sono coefficienti di Clebsh-Gordan e queste soluzioni sono autostati anche di L2 e S2. Poiche' ciascuno spinore deve avere parita' definita, queste soluzioni non si possono mescolare; ma le parita' devono essere opposte, quindi ci sono due possibilita': J=LA +1/2=LB 1/2 o viceversa J=LB +1/2=LA -1/2. Ci sono stati di ambedue i tipi. Y(J,mj ,L)=- 1Sono talora costretto dal word processor ad indicare il commutatore con [ ] ; anziche' con [ ,]. =99= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Cosi' risorge il numero quantico L; non va bene per Ψ, ma possiamo decidere di etichettare Ψ con L=LA , dando la prevalenza alla componente "grande". Possiamo scrivere 1 Ψ A f(r) Y (m j ,J,LA ) Ψ = B = , (5) Ψ ig(r)Y (m j ,J,LB ) dove f e g sono funzioni radiali. Ambedue gli spinori di Pauli sono autostati di 3 (σ⋅L) = J2 - L24 3 con autovalori (in unita' atomiche) J(J+1)-L(L+1)- . Le due possibilita' 4 sono: J = L + 1 / 2 J = L - 1 / 2 ( σ⋅L) = L = J - 1 / 2 ( σ⋅L) =-L-1=-J-3/2. Operatore K Vi e' una ulteriore costante del moto, che e' caratteristica della teoria di Dirac. Per scoprirla, riscriviamo i due casi : J = L + 1 / 2 ( σ⋅L) +1= L =J+1/2 ( σ⋅L)+1 =L-1=-J-1/2. J = L - 1 / 2 Cosi' troviamo un numero quantico per tutto lo spinore di Dirac definendo l'operatore .L+ __ h 0 __ K = __ = β[ L + h ] . (6) - ( .L+ h ) 0 Si puo' verificare che K e' conservato, anche se cio'comporta parecchia algebra banale e noiosa. In effetti, K commuta con V perche' V commuta con L ; e' presto visto che K commuta con βmc 2 ; quindi, 0 X [K,H] - = c[K, .p]-. =c -X 0 , ( ) __ __ dove X=( p)( L + h ) + ( .L+ h )( p).; cioe' X=2h /σ⋅p +( ⋅p)( ⋅L ) +( ⋅L )( ⋅p) . Possiamo semplificarlo usando l'identita' (4.1.1), ( ⋅p)( ⋅L )=p⋅L +i ⋅(p∧L ) ( ⋅L )( ⋅p)=L ⋅p+i ⋅(L ∧p). ed il fatto che p⋅L =px (yp z-zp y)+py(zpx -xp z)+pz(xp y-yp x )=L ⋅p=0. Rimane 1Le fasi sono scelte in modo che alla fine f e g risultino reali. =100= Prof. M. Cini -Corso di Fisica Atomica e Molecolare X=2( .p) __ h +i .(p ∧ L + L ∧ p). Ora, dimostrare che X=0 e' elementare, anche se un po' lungo; calcoliamo (p ∧ L + L ∧ p) x =pyL z-p zL y+L ypz- L zpy. Si ha il commutatore pyL z- L zpy=py(xp y-yp x )-(xp y-yp x )p y=ih /px , e analogamente Lypz-p zL y=ih /px ; si verifica cosi' che (p ∧ L + L ∧ p) = 2i __ h p, e ne consegue che K e' conservato. Poiche' J commuta con ⋅L, K e J sono conservati simultaneamente. Ne consegue che possiamo diagonalizzare simultaneamente gli operatori H, K, J 2, J z e la parita'. Inoltre, gli autovalori possibili di K sono k=+-(J+1/2) = +-1,+-2,+-3,... k=0 e' escluso. Mentre |k| non ci dice niente di nuovo per classificare uno stato di J definito, il segno di k e' una etichetta in piu'. In sostanza, k>0 significa in termini semiclassici che lo spin e' parallelo al momento angolare orbitale. Per esempio, per J=1/2, k=±1. Per k=+1, mj =1/2, f(r) Y (m j =1/2,J=1/2,LA =0) ; Ψ(1/2,1/2,1)= ig(r)Y (m ,J,L =1) j B cosθ 1 f(r) moltiplica 0 mentre ig moltiplica sinθeiφ sinθe-iφ 0 Per k=+1, mj =-1/2, f(r) moltiplica 1 mentre ig moltiplica cosθ ; cosi' le componenti A sono di tipo s e quelle B di tipo p. cosθ 1; Con k=-1 le parti si invertono. Per mj =1/2, Ψ A ∝ sinθeiφ e Ψ B ∝ 0 ; sinθe-iφ 0; Per mj =-1/2, Ψ A ∝ cosθ e Ψ B ∝ 1 . Convenzioni Le YL m , definite come autofunzioni ortonormali di L2 e Lz, hanno un fattore di fase arbitrario, e bisogna che i coefficienti di ClebshGordan siano definiti in modo da essere coerenti con la scelta della fase. Noi seguiamo il Condon-Shortley, il Sakurai, il Kenyon1 e molti altri libri usando la definizione (in termini di polinomi di Legendre) 1I.R.Kenyon, "Elementary Particle Physics", Routledge&Kegan Paul,London and New York 1987 =101= Prof. M. Cini -Corso di Fisica Atomica e Molecolare YL m(θ,φ) =(-1)(m+|m|)/2 (2L+1)(L-|m|)! |m| PL (cosθ)e imφ , 4π(L+|m|)! da cui consegue in particolare che Y00= Y11= - 1 4π , Y10= 3 cosθ, 4π 3 sinθ eiφ , Y1-1 = 8π 3 sinθ e-iφ . 8π Altri Autori pero' usano definizioni diverse. .r r Se usiamo la (4.1.1) per calcolare ( .r)( .r) otteniamo r2. .r Pertanto l'operatore e' a quadrato unitario. Esso ha la peculiarita' r di essere pseudoscalare, perche' un' operazione di parita' trasforma r in -r e in . Calcoliamo il commutatore 5-2 Operatore pseudoscalare σz 1 1 r] = [Lz+ ,xσx+yσy +zσz] = σx[Lz,x]+σy [Lz,y]+x [σz,σx]+y [σz,σy]. 2 2 2 Ricordando le note relazioni [σi ,σj ]= 2iεijk σk [Li ,r j ] = i εijk rk, concludiamo che [J z, r] =0. Quindi anche [J2, r] =0. .r Dunque, l'operatore e' a quadrato unitario, e commuta con r .r J2 e J z. Se Ψ A ha J2 e J z definiti, Ψ A ha gli stessi J e m j , ma parita' r opposta a quella di Ψ A per la natura pseudoscalare dell'operatore. Dal .r momento che Ψ A e' autofunzione di L2 con autovalore LA , Ψ A deve r essere una somma di componenti con L=LA +-1,LA +-3,LA +-5 etc. che hanno parita' opposta. Ma il J deve essere lo stesso di Ψ A , e si hanno solo i due casi J=LA ±1/2. Se LA =J+1/2, rimane solo L=J-1/2, mentre se LA =J.r 1/2, rimane solo L=J+1/2; in ogni caso, Ψ A ha L=LB . In effetti, r vogliamo mostrare che [J z, =102= Prof. M. Cini -Corso di Fisica Atomica e Molecolare . .r Y(J,mj ,LA) = - Y(J,mj ,LB ) r .r Y(J,mj ,LB ) = - Y(J,mj ,,LA ) r (1) . (2) Che la relazione comporti un fattore di fase +-1, lo stesso in ambedue i casi, e' ovvio perche' ( .r/r) 2=1; che sia proprio un (-) dipende dalle convenzioni di fase con cui si definiscono le armoniche sferiche (e quindi si costruiscono gli Y ). Uno puo' convincersene applicando l'operatore agli spinori espliciti degli esempi precedenti. Ad esempio, J=1/2 puo' aversi con LA =0 e LB =1. Allora, Y(J z=1/2,J=1/2,LA =0) si ottiene scegliendo J=L+1/2, e risulta 1 1 ; 4π 0 d'altra parte, con le nostre convenzioni, scegliendo J=L-1/2, Y(J=1/2,mj =1/2,LA=0) = Y(J=1/2,mj =1/2,LB =1)=- 1 3 1 Y10 0 + 2 1 0 Y =3 1 1 1 cosθ ; 4π sinθeiφ usando l'operatore pseudoscalare ⋅r cosθ s i n θe-iφ = sinθeiφ - c o s θ , r si trova ⋅r 1 cosθ Y (J z=1/2,J=1/2,LA =0)= = - Y(J z=1/2,J=1/2,LB =1). r 4π sinθeiφ 5-3 Equazione di Dirac in forma radiale ∂ 1∂ 1 , ∂θ , ∂r r rsin(θ) \f(∂ ,∂φ)) , e separare le derivate radiali da quelle angolari. Poiche' 0 p p= . p 0 , occupiamoci di .p. Sapendo che ( r/r) e' a quadrato unitario, scriviamo ⋅r ⋅r ( ⋅p) = ( ) 2( ⋅p) = 2 ( ⋅r)( ⋅p), r r ed usando di nuovo la (4.1.1) otteniamo ⋅r ( ⋅p) = 2 {r⋅p + i ⋅L} . (1) r Vogliamo passare a coordinate sferiche, con ∇=( =103= Prof. M. Cini -Corso di Fisica Atomica e Molecolare r⋅p __ ∂ =-i h che e' in forma radiale. r ∂r ⋅r 0 {r⋅p + i ⋅L} r2 Cosi' ⋅p= ⋅r . 2 {r⋅p + i ⋅L} 0 r ⋅r Possiamo "mettere in evidenza" un fattore come segue: r dove compare 0 ⋅r r⋅p r r ⋅p= ⋅r 0 0 r + i ⋅L 0 r r⋅p i ⋅L + r r r⋅p = αr [ .I +i ⋅L/r] . r (2) . 0 ⋅r r L'operatore α r = ⋅r = 0 r ⋅r/r si chiama velocita' radiale di Dirac. In luogo di ⋅L conviene pero' far comparire K = β[ ⋅L +I], che e' una costante del moto e puo' essere sostituito dal suo autovalore k. Poiche' β 2=I, ⋅L = βK - I, e quindi icα r βk H = cα r pr + +βmc 2 +V(r) (3) r dove si e' posto, seguendo una notazione tradizionale, r⋅p h / __ pr = ( -i ) =-i h (∂ /∂r +1/r) . r r Le sole derivate rimaste sono rispetto a r. Esplicitamente, ponendo c=1, V + m ( ⋅r)[p -ik] r r r H = ⋅r ( )[pr +ik] V - m r r (4) e l'equazione di Dirac diventa (V+m)ΨA + ⋅r ( )[pr +ik] r r ( ⋅r k )[p r -i ] Ψ B = E Ψ A r r ΨA + ( V - m ) ΨB = E ΨB . Non resta che separare le variabili spin-angolari con =104= (5) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ψ A f(r) Y(J,m j ,LA ) , Ψ = Ψ B = ig(r)Y(J,m j ,LB ) ricordando le proprieta' dell'operatore pseudoscalare. Si trovano finalmente le equazioni radiali (V+m)f -ip g - kg = E f r r -pr f -i kf + i ( V - m ) g = E r i g . (6) La tecnica di soluzione e' ora analoga a quelle usate nei casi di Schro"dinger e di Klein-Gordon. Posto f=F/r, g=G/r, cosicche' ad esempio ∂ 1 G 1 ∂G ( + )( )= , ∂r r r r ∂r si ottiene la forma ridotta ; ripristinando c, E-mc2-V F + dG + KG = 0 __ dr r h c E+mc 2 __ -V G - dF + KF = 0 (7) h c dr r Occorre notare che le (7) prendono varie forme diverse nei vari libri a causa di diverse convenzioni e notazioni. 5-4 Funzioni radiali idrogenoidi Ci limiteremo agli stati dello spettro discreto. Se E e' compreso mc 2 +E mc 2 - E fra -mc2 e mc 2, A= e B= sono positivi; si tratta di __ __ h c h c lunghezze inverse che caratterizzano gli stati legati. Per un atomo -Ze 2 Ze2 idrogenoide, V= , e conviene riscrivere le (3.7) con Zα = __ , r h c e cioe' [-B + Zα] F + dG + kG = 0 r dr r [A + Zα ] G - dF + kF = 0 . (1) r dr r =105= Prof. M. Cini -Corso di Fisica Atomica e Molecolare E' meglio rendere il tutto adimensionale, introducendo la m2c 4 - E 2 lunghezza caratteristica inversa D = AB = e ponendo ρ __ h c =rD. Si ottiene la forma adimensionale [ B D A [ D Zα dG kG ρ ]F(ρ) = dρ + ρ Zα dF kF + ρ ]G(ρ) = - ρ dρ - . (2) La cosa migliore e' cercare una soluzione particolare, valida per lo stato fondamentale e gli stati s, per poi generalizzarla. Caso particolare . Inseriamo nelle (2) la soluzione tentativa (ansatz) F(ρ) = a ρ s e - ρ G(ρ) = b ρ s e - ρ. (3) analoga al caso di Klein-Gordon; s e' un parametro reale da determinare. Il sistema diventa [ B D A [ D - Zα s+K ρ ] a = (-1 + ρ ) b Zα s-K + ρ ] b = (-1 + ρ ) a ; (4) I termini in 1/ρ devono annullarsi separatamente, cioe' b(s+K) = -aZα a(s-K) = Zαb (5) quindi s2-K2 = -Z2α 2. Poiche' abbiamo supposto s reale, e il minimo valore di K2 e' 1, il nostro ansatz vale solo per Zα<1; tutti i nuclei, d'altra parte, hanno Z<137. Ci sono due radici reali, ma solo quella positiva s= K2-Z2α 2 (6) =106= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 e' accettabile, perche' s<0 farebbe divergere l'integrale < ρ > nell'origine. Se ne deduce che s<|K| . Dai termini costanti si hanno le condizioni B D A D a = -b b =-a (7) AB =1; le D2 (7) fissano quindi il rapporto b/a=-B/D. Questo rapporto e' negativo, e -Zα dalla prima delle (5) risulta uguale a ; dal momento che s<|K| cio' s+K comporta che questo tipo di soluzioni ha K>0. che sono compatibili perche' dalla definizione di D consegue Ricaviamo gli autovalori dell'energia. Dalle (7), B-A -b a = + . D a b I due rapporti a secondo membro possono essere ricavati dalle (5), ed 2s -2s il secondo membro risulta uguale a Zα 2 2 = (dove si e' usata la s -K Zα (6)); la condizione agli autovalori e' quindi A-B 2s = ; (7 bis) D Zα ora basta inserire in luogo di A,B e D le loro definizioni mc 2+E mc 2-E __ __ ( h c) ( h c) m2c 4-E2 __ ( h c) ≡ 2E m2c 4-E2 = 2s Zα e risolvere per E per ottenere gli autovalori E= mc 2 Zα 1+( ) 2 s = mc 2 1+( Zα (8) )2 K2-Z2α 2 Controlleremo che gli stati ottenuti corrispondono agli stati 1s1/2, 2p3/2, 3d5/2, ... della teoria non relativistica, cioe' quelli di massimo j per ogni n. Soluzione generale (per livelli discreti, con Zα<1) =107= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Poniamo F( ρ) = ρse- ρ ∑N aν ρν ν=0 G(ρ) = ρse- ρ ∑N bν ρν ν=0 (9) Quelle appena trovate sono le soluzioni che corrispondono a N=0. Poiche' s+ν d [ρ s+ν e- ρ] = [ρ s+ν e- ρ] {-1 + ρ }, dρ inserendo nelle (2) si ottiene, in luogo delle (4) B D A D N N N N ν ν−1 ν a ρ Z α a ρ = b ρ + ∑ν ∑ν ∑ ν ∑bν (s+ν+K)ρν−1 0 0 0 0 N ∑bν ρν 0 +Zα N ∑bν ρν−1 0 = - N ∑aν ρν 0 + N ∑aν (s+ν-K)ρν−1 0 . (10) Eguagliando a 0 i coefficienti di ρ -1 si ottiene -Zαa = b (s+K) 0 0 Zαb = a (5) 0 0 (s-K); si e' cioe' ritrovato il sistema (5), da cui segue la (6), s= K2-Z2α 2 . Eguagliamo ora a 0 i coefficienti di ρ ν-1 con ν>0. La generalizzazione del sistema (7) e' B a - Z αa = -b + b ( s + ν + K ) D ν-1 ν ν-1 ν A b ν-1 + Z αbν = -a ν-1 + a ν ( s + ν - K ) ; (11) D in generale b0/a0 puo' essere sia positivo che negativo, e K puo' essere qualsiasi intero non nullo. Per eliminare aν-1 e bν-1 , moltiplichiamo la prima per D e la seconda per B; Baν-1 - Z αDaν = -Db ν-1 +Db ν ( s + ν + K ) AB D b ν-1 + Z αBbν = -Ba ν-1 +Ba ν ( s + ν - K ) e sottraiamo, usando AB/D=D. Resta =108= (12) Prof. M. Cini -Corso di Fisica Atomica e Molecolare aν [ -ZαD + B(s +ν -K)] = bν [D(s+ν +K) +BZα] . (13) La condizione per gli autovalori e' analoga a quella del modello di Schro"dinger: si impone, cioe' che i polinomi siano di grado finito. Riscrivendo il sistema (12) con ν-1 =N si impone aN+1=bN+1=0. Le condizioni BaN = -D b N AbN=-Da N sono in realta' identiche perche' AB=D2. Il rapporto aN/bN e' pero' gia' fissato dalla (13) se adesso poniamo ν=N. Sostituiamovi dunque bν con -Ba ν con ν=N e semplifichiamo. La dipendenza da k scompare. D Otteniamo la condizione B2 A-B 2B(s+N) = Zα(D) ≡ ZαB( ). D D Rispetto al caso particolare N=0 (Equazione 7 bis) l'unico cambiamento e' s→s+N. E' ovvio quindi che risolvendo per E si ottiene finalmente la formula generale per gli autovalori1 nella forma EN,K = mc 2 Zα 1+( )2 s+N mc 2 = 1+( Zα . (14) )2 N+ K2-Z2α 2 5-5 Livelli idrogenoidi: confronto col caso non relativistico Osserviamo lo schema dei livelli e la sua corrispondenza con quanto previsto dalla teoria di Pauli con correzioni relativistiche. I livelli piu' bassi sono: 3d5/2 _________ N=0, k=3 3d3/2,3p3/2 _________ N=1, k=±2 3s 1/2 ,3p1/2 2p3/2 2s 1/2 ,2p1/2 _________ N=2, k=±1 E= 1 mc2 9-Z 2α 2 3 mc 2 Zα 1+( )2 2 2 1+ 4-Z α mc 2 Zα 1+( )2 2 2 2+ 1-Z α _________ N=0,k=2 1 mc2 4-Z 2α 2 2 _________ N=1,k=±1 mc 2 1+ 1-Z 2α 2 2 1La coincidenza con la formula di Sommerfeld e' esatta, ma evidentemente alquanto fortuita. Nel 1916 Sommerfeld non poteva sapere nulla dello spin. =109= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1s 1/2 _________ N=0,k=1 mc2 1-Z 2α 2 Si nota che il numero quantico principale e' dato da n = N +|k|. Espandiamo EN,K per Zα<<1 (campo basso, moto non relativistico); espandiamo dapprima in potenze di Zα x ≡( ), N+ K2-Z2α 2 1 x2 3x4 con ≈1 + +... 2 8 1+x2 Trascurando termini di ordine superiore al quarto, Zα 1 3 Zα 4 2 + ( ) ( ) }. 2 N+ K2-Z2α 2 8 N+|K| 1 Zα 2 Espandiamo anche x. Poiche' K2-Z2α 2 ≈ |Κ|[1 ( ) ], 2 K Zα Zα Zα (Zα) 2 1 x≈ = ≈ {1+ }. Z2α 2 N+|k| (Zα) 2 N+|k| 2|k|[N+|k|] N+|k| 1 2|k| 2|k|[N+|k|] Ormai e' evidente che tutto dipende solo da |k| = J+1/2 e da n=N+|k|. Eliminando ancora termini di ordine superiore, si ottiene 1 (Zα) 2 (Zα) 4 1 3 2 EN,K = mc { 1 [ ]} (1) 2 n2 2n3 |K| 4n EN,K = mc 2{ 1 - Il primo termine e' l'energia di riposo. Il secondo e' l'approssimazione non relativistica, con n= N+|K| = 1,2,3 ... numero quantico principale. Come nella teoria di Sommerfeld, esso ha un contributo da un integrale del moto "angolare". L'ultimo termine da' le correzioni di struttura fine; per dato n, i livelli sono individuati da |K| = J+1/2. La scissione dei livelli e' importante per Z grandi ed n piccoli. Per i livelli interni di atomi pesanti occorre la formula esatta. Per esempio, con Z=92, (Zα) 2 ≈ (92/137)2 ≈ 0.45096, e la formula non relativistica con n=1 da' una energia di legame ≈0.22548 mc2, mentre quella di Dirac da' ≈ 0.259028 mc2. La differenza e' pari a 0.03355 mc2; nel caso di un elettrone, mc2≈ 0.5 MeV, l'energia di legame ammonta a ≈ 129 KeV e la correzione e' di circa 16,8 KeV; per un muone ovviamente sarebbe ancora piu' grossa1 . La correzione in (Zα) 4 e' solo di .02542 mc 2, e ci lascia con un errore di 4 KeV. Nella teoria di Dirac, i numeri quantici sono Π, J z, J 2, k, N ; pero' |k|=j+1/2, e quelli indipendenti sono Π, J z,J 2, sign(k), N. Nello schema di Pauli, viene assegnato LA ; questo ci informa sulla parita' Π=(-) L A e su 1Il mesone µ e' una particella di Dirac con spin 1/2, massa ≈ 207 volte quella dell'elettrone e tempo di vita τ≈ 2.2 10-6 s. =110= Prof. M. Cini -Corso di Fisica Atomica e Molecolare sign(k) (positivo se LA =j-1/2). Quindi, i numeri quantici di Pauli sono adeguati allo scopo di classificare gli stati. I livelli energetici dell'atomo di Schro"dinger dipendono solo da n. Questo e' un esempio di degenerazione "accidentale" , cioe' non spiegata dalla sola simmetria sferica del problema. Con un potenziale centrale ma non coulombiano, i livelli dipenderebbero anche da L. La struttura fine relativistica rimuove quasi tutta questa degenerazione; rimangono degeneri nella teoria di Dirac le coppie di stati con lo stesso J ma L diverso, come per esempio (2s 1/2 ,2p1/2), (3s1/2 ,3p1/2), (3p3/2 ,3d3/2) ... che differiscono solo per il segno di k. Come vedremo, questo e' un altro esempio di degenerazione "accidentale". 5-6 Atomi superpesanti La soluzione del problema idrogenoide che abbiamo discusso vale non per tutto lo spettro discreto -mc2<E<mc2, ma solo per 0<E<mc2. Infatti, al crescere di Z accade qualcosa di veramente /c h peculiare. La lunghezza caratteristica D -1 = , che compare m2c 4-E2 nelle equazioni radiali e diverge alla soglia dei due continui (per E=±mc 2), diminuisce fino a diventare una lunghezza di Compton per E→0: allora, l'elettrone e' localizzato al punto che l'interpretazione di Ψ come funzione d'onda cessa di avere senso fisico. Inoltre in tali condizioni l'interazione dominante e' quella (elettrica) dovuta al momento magnetico anomalo! Bisogna tenerne conto per calcolare i livelli, che dipendono dal segno di k. L'equazione radiale in unita' m=1,c=1 e' 1-Zα - d -k - µZα F F r dr r r2 d k Zα = E , - - µ 2 - 1 - Zα G G dr r r r dove µ = 0.00058. Anche se non c'e' soluzione esatta, il calcolo e' stato esteso numericamente1 alle energie negative. Per -mc2< E <0, gli stati restano localizzati, anche se D-1 aumenta di nuovo. Questo si capisce facilmente considerando l'andamento per ρ→∞ delle equazioni radiali (4.2), che valgono per A e B positivi, e quindi per -mc2 < E< mc2: B dG F(ρ) = D dρ A dF G(ρ) = . (1) D dρ 1Bernd Thaller, "The Dirac Equation", Springer Verlag (1992) =111= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Le (1) non dipendono esplicitamente da Zα (ne dipendono solo attraverso E) ed ammettono soluzioni localizzate della forma F(ρ) =a e- ρ, G(ρ)=be- ρ. L' energia dello stato fondamentale, che e' ≈0 per Z=137, per Z poco piu' grandi e' negativa e compresa fra -mc 2 e 0; per Z ancora maggiori, infine, lo stato fondamentale si immerge nel continuo di energia negativa. Poi si immergono anche gli stati 2s1/2 e 2p1/2, etc. Quando l'energia dello stato e' nel mare negativo, D e' immaginario: le funzioni radiali cessano di essere esponenzialmente confinate entro l'atomo ma acquistano una componente oscillatoria non smorzata. Gli stati diventano 'risonanze'1. Non ci sono problemi per la materia ordinaria, neppur per l'elettrone piu' interno dell'atomo di U, che conserva il 74.1% della massa-energia di un elettrone libero. Ma questa non e' una buona ragione per non cercare di capire che fenomeni predice la teoria. Il fatto che per ragioni di Fisica Nucleare non esistano atomi con Z ≥α -1 non toglie che il risultato contiene uno dei famosi "paradossi" della teoria di Dirac, simile a quello di Klein. Dobbiamo quindi interpretarlo, e chiederci se vi sono conseguenze osservabili. Vedremo che ve ne sono. La singolarita' del potenziale coulombiano e' responsabile solo in parte della patologia della (5.2). Sono stati fatti recentemente calcoli piu' raffinati che tengono conto delle dimensioni finite del nucleo2, con il risultato che l'energia di legame EB del livello 1s raggiunge mc2 per Z=150 e 2mc 2 per Z= Zcrit =173. Da quel punto in poi, il livello si immerge nel continuo di energia negativa, e si trasforma in una risonanza che per esempio per Z≈190 ha una larghezza ≈ qualche KeV. Tale larghezza corrisponde ad un tempo di vita dell'ordine di 10-19 s. L'interpretazione fisica corretta e' che stiamo assistendo ad un fenomeno nuovo, cioe' al collasso del vuoto. C'e' una chiara analogia col breakdown dielettrico che avviene in un solido se il campo E e' cosi intenso che eEa ≈ Egap (a= parametro reticolare ≈ 1Å , Egap ≈10 eV ⇒ E = 109V/cm ci porta in pieno breakdown: in realta' questo e' un limite superiore). Il campo elettrico straordinariamente intenso di un nucleo superpesante (da Zcrit in poi) rende instabile il vuoto rispetto alla creazione di coppie reali3. Il criterio analogo e' 1cioe' hanno una certa larghezza in energia che corrisponde ad un tempo di vita finito. Non c'e' un vero spettro discreto. 2Questo e' facile da farsi, perche' il volume del nucleo cresce linearmente col numero di nucleoni, e la densita' di carica e' approssimativamente uniforme. 3Si ritiene che nuclei di Z sufficientemente alto, se si potessero formare, sarebbero stabili, perche' il collasso del vuoto schermerebbe il campo Coulombiano abbastanza da far vincere di nuovo le interazioni forti. =112= Prof. M. Cini -Corso di Fisica Atomica e Molecolare eEλ C = 2mc 2 ≈106eV con λ C =4 10-11 cm ⇒ E = 2.5 1016 V/cm. Normalmente, un livello che si trova nel continuo di energia negativa e' pieno. Supponiamo allora di creare un tale nucleo privo di elettroni 1s. Ben presto, il livello sarebbe doppiamente riempito dagli elettroni del mare, che lascerebbero cosi' due buchi. Dopo la doppia creazione spontanea di coppie, gli elettroni resterebbero legati, ma i positroni sarebbero liberi. Si assisterebbe alla emissione spontanea di due positroni monocromatici, ciascuno di energia cinetica |EB | -2mc2. Attualmente sono in corso esperimenti volti allo studio di tali positroni, da parte del gruppo di Christoph Schmelzed alla Gesellshaft fu "r Schwerionenforschung di Darmstadt. La tecnica usata consiste nello studio di collisioni, con piccolo parametro di impatto, di ioni pesanti (ad esempio Pb+Pb, U+U) accelerati fino a 1 GeV ed oltre, a velocita' dell'ordine di 0.1 c. La distanza minima fra i due nuclei e' tipicamente dell'ordine di 20 fm (1 fm = 10 -13 cm). Durante la collisione, gli elettroni sono sotto l'influenza di ambedue i nuclei e si aggiustano quasi adiabaticamente man mano che la loro distanza cambia. Per ogni posizione istantanea dei nuclei, si puo' parlare di stati elettronici quasi-molecolari, ottenibili risolvendo l'equazione di Dirac a due centri1. Tuttavia, poiche' gli atomi si muovono, e vi possono essere collisioni anche con gli altri elettroni del sistema, esiste una probabilita' finita e misurabile che gli elettroni appartenenti al livello quasi-molecolare piu' interno vengano promossi o allontanati, e cioe' che si crei una lacuna K reale. Quando questo accade e il livello si trova nel continuo di energia negativa, l'emissione spontanea di positroni e' possibile. Per U+U, questo richiede una distanza internucleare <30 fm, e tale condizione e' soddisfatta nelle condizioni sperimentali descritte per tempi dell'ordine di 10-21 s. In tale tempo il livello energetico percorre un certo intervallo di valori e quindi ci aspettiamo di vedere uno spettro continuo, piuttosto che una riga monocromatica. Un altro contributo al continuo di positroni deriva dalla rapida variazione del potenziale, che e' anch'essa capace di creare coppie (uno stato elettronico di energia positiva che e' autostato del problema al tempo t non e' ortogonale con gli autostati di energia negativa di un tempo successivo t + ∆t). Una emissione di positroni e' stata osservata2. Gli spettri sono larghi ~ – 1MeV e mostrano una componente continua, alla quale sono sovrapposte righe strette (di larghezza ~ – 100 KeV). Tenendo conto della + _ produzione di coppie e e dovuta al campo variabile dei nuclei e della emissione di e+ da parte delle lacune K e' stato possibile interpretare in dettaglio l'andamento della componente continua nonostante le molte 1Cfr. W. Greiner, Theoretical Physics 3, Relativistic Quantum Mechanics, Springer Verlag Berlin 1990 2P.Kienle, "Strong Field Atomic Processes", Europhysics News 20,99 (1989) =113= Prof. M. Cini -Corso di Fisica Atomica e Molecolare complicazioni che intervengono in siffatti processi di alta energia. La teoria quantitativa e' ovviamente complicata, ma ha successo. Le righe discrete, d'altra parte, sono difficili da spiegare per i motivi seguenti: 1) Sono presenti anche per Z<Z crit. 2) La loro larghezza indica il tempo di vita dello stato che decadendo genera i positroni; il problema e' che risulta piu' lungo della durata del quasi-atomo. 3) Studiando diversi sistemi, come U+U, U+Th, Th+Th, etc., si e' visto che le energie delle righe discrete sono indipendenti dalle coppie di atomi partecipanti alla collisione. Le energie osservate si addensano attorno ad alcuni valori caratteristici; c'e' un gruppo a ~ – 250 KeV , un altro piu' largo fra ~ – 320 e ~ – 360 KeV che e' stato anch'esso osservato per un largo intervallo di Z, e c'e' evidenza di almeno un'altra energia caratteristica a ~ – 400 KeV. Si ipotizza che questi e+ vengano da coppie e+e- prodotte dal decadimento di una particella neutra e dei suoi stati eccitati; questa ipotetica particella non dovrebbe coincidere con alcuna di quelle prodotte fin qui negli esperimenti di alta energia. Diversi stati eccitati della particella avrebbero masse diverse e le energie caratteristiche dei positroni corrisponderebbero allo spettro delle masse. 5-7 Lamb shift e correzioni radiative In questo paragrafo parliamo qualitativamente di effetti che non sono contenuti nell'equazione di Dirac e che richiedono, per una comprensione quantitativa, i metodi della elettrodinamica quantistica (QED). Anche se abbiamo in programma qualche semplice calcolo di questo tipo, ci contentiamo per ora di un approccio fenomenologico. Nella teoria di Dirac, gli stati dell'Idrogeno con gli stessi n,J ma con diverso LA sono, come si e' visto, degeneri. Nel 1947 pero' Lamb e Retherford scoprirono una separazione fra 2s1/2 e 2p1/2 . Si tratta di una differenza piccolissima, che corrisponde a una frequenza di 1060 Mhz, cioe' 3.5 10-2 cm -1 , ovvero 4.3 10 -6 eV. Il livello 2s1/2 e' il piu' alto1. L'esperimento consisteva nel provocare con una radiofrequenza transizioni stimolate 2 dal 2s1/2 al 2p1/2 o al 2p3/2. Eccitando con elettroni da 10.2 eV un fascio di atomi di H, si popolavano i livelli n=2; mentre pero' i 2p decadono in ≈1.6 10-9 s, il 2s e' metastabile3, con un 1Si tratta, beninteso, di deviazioni davvero minuscole dalla teoria di Dirac. Se non ci fosse stata una teoria relativistica cosi' precisa, non avremmo certo potuto apprezzare nello spettro dell'Idrogeno effetti piccolissimi ma di grande interesse fisico. 2Ricordiamo che le regole di selezione di dipolo impongono ∆ L=±1 e parita' opposta, mentre ∆J = 0,±1. Qui sono evidentemente rispettate. 3il decadimento avviene per un processo a due fotoni; studieremo questo genere di processi nel Capitolo 14. =114= Prof. M. Cini -Corso di Fisica Atomica e Molecolare tempo di vita di ≈1/7 s. Gli atomi eccitati sono facilmente rivelabili perche' se incidono su una superficie possono cedere l'energia di eccitazione causando l'emissione di elettroni. Sottoponendo alla radiofrequenza il fascio contenente gli atomi eccitati , gli atomi nel 2s transiscono al 2p e quindi rapidamente allo stato fondamentale. Una radiofrequenza corrispondente alla separazione 2s 1/2 -2p1/2 o alla separazione 2s 1/2 -2p3/2 provoca pertanto una diminuzione del numero di atomi eccitati nel rivelatore1. Dobbiamo quindi chiederci cosa manca al modello idrogenoide di Dirac, che non prevede una separazione fra 2s1/2 e 2p1/2 . Piu' in generale, vogliamo capire quali effetti fisici occorre ancora includere nella teoria di Dirac, che gia' sappiamo essere fondamentalmente corretta, per avere un modello veramente realistico. Ebbene, dopo aver descritto correttamente l'elettrone, bisogna fare altrettanto col nucleo e col campo. Il fatto che il nucleo non sia in realta' un punto materiale carico provoca le correzioni iperfini, che studieremo. Inoltre, la teoria di Dirac tratta l'elettrone in modo quantistico e relativistico, ma il campo in modo classico, come un campo elettrostatico; e' vero che le conseguenze della massa finita del nucleo possono essere incluse in larga misura usando la massa ridotta, ma, se il nucleo si muove, il campo non e' piu' esattamente coulombiano. La correzione che ne risulta e' nota come Dirac shift2. La QED si occupa delle correzioni necessarie per trattare adeguatamente il campo. Il calcolo quantitativo e' complesso, anche perche' concorrono diverse correzioni. Il campo devia da quello coulombiano soprattutto per la polarizzazione del vuoto. Si e' gia' parlato della polarizzazione del vuoto a proposito dello Zitterbewegung e del termine di Darwin; vi sono pero' effetti ulteriori, che non sono contenuti nell'equazione di Dirac. L'elettrone ed il nucleo, come ogni particella carica, emettono fotoni virtuali che possono convertirsi in coppie, anch'esse virtuali. Le coppie prodotte si polarizzano nel campo , perche' gli elettroni sono attratti e i positroni respinti dal nucleo. Le cariche negative indotte presso il nucleo sono compensate da cariche positive a distanza infinita, analogamente a quanto avviene in un dielettrico polarizzabile. In questo senso, cio' che manca al modello di Dirac e' - se vogliamo dirlo in termini molto semplificati - l'autoconsistenza. La carica osservata a grandi distanze e' la carica totale, non quella nuda. A brevi distanze, il campo cresce piu' rapidamente di quanto sia atteso per la legge di Coulomb; questo 1In pratica l'esperimento si faceva con una radiofrequenza costante, modulando i livelli atomici per effetto Zeeman. 2Essa sposta tutti i livelli di un dato n della stessa piccola quantita'; per questo stesso motivo lo shift di Dirac e' stato predetto teoricamente, ma non e' stato ancora misurato. Dovrebbe portare a correzioni di alcuni miliardesimi degli intervalli 1s-2s e 2s-4s. =115= Prof. M. Cini -Corso di Fisica Atomica e Molecolare effetto e' grande negli esperimenti di alta energia, ma e' sensibile anche in Fisica Atomica, perche' sposta gli stati s in modo preferenziale (Vedi Capitolo 18). Nell'Idrogeno, il 2s1/2 e' abbassato da questo effetto di 27 MHz (0.11 µeV), cioe' di poco rispetto al Lamb shift complessivo. Nel caso degli atomi µ-mesici con Z grande, le correzioni di QED legate a questo effetto sono predominanti e recenti misure hanno rivelato correzioni dell'ordine di 100 eV1. Ma nel caso dell'Idrogeno atomico la causa principale del Lambshift e' che il campo e' quantizzato. L'effetto piu' importante puo' essere descritto in modo semplice ed euristico (Welton 1948) come dovuto alla interazione dell'elettrone (trattato non relativisticamente) con le fluttuazioni del campo nel vuoto. Mentre l'energia di punto zero contenuta in un volume L3 di vuoto e' infinita ed inosservabile, le quantita' osservabili possono essere calcolate correttamente. __ h ω Ogni modo normale ha una energia di punto zero pari a ,e 2 benche' il campo medio nel vuoto sia <E>= 0, il campo quadratico medio <E2> non e' nullo. Il campo quadratico medio e' dato da 1 <E2(ω)> = 3∫ d 3rE2(r,ω) (1) L dove E(r,ω) e' la componente di Fourier del campo dovuto ai modi di frequenza ω, e L3 e' il volume di quantizzazione. Possiamo stimarlo come segue. I contributi alla densita' di energia del vuoto in diversi intervalli di frequenza dω sono additivi, perche' si riferiscono a modi normali diversi. Classicamente, la densita' di energia a frequenza ω e' data da 1 1 1 1 1 ρ(ω) = 3 d 3r[E2(ω) + B2(ω)] = 3 d 3rE2(ω) = <E2(ω)>. ∫ ∫ L 8π L 4π 4π La densita' di energia totale e' ovviamente ∫ρ(ω)dω . Quantisticamente, la densita' di energia di punto zero e' data dalla espressione divergente / ω(k) h 1 , (2) ∫ρ(ω)dω = L3 ∑ 2 λ;k dove la somma sulle polarizzazioni λ comporta un fattore 2, mentre L3 L3 L3 3 2 → d k = . 4π k dk =. ω2dω ∑ ∫ (2π) 3 ∫ (2π) 3 2π 2c 3 ∫ k tenendo conto che ω=ck. Pertanto, la densita' di energia nell'intervallo 1 dω e' ρ(ω)dω= ω3dω. Confrontando le due espressioni, 2π 2c 3 otteniamo dunque 1Fra gli atomi esotici che sono stati studiati si annovera anche il muonium (µ+e- ). =116= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <E2(ω)> = 2ω3 . πc 3 (3) Il campo causa fluttuazioni nelle coordinate dell'elettrone. Classicamente, d2r eE = , 2 dt m ed in componenti di Fourier -eE(ω) r(ω) = . mω2 Lo spostamento medio e' nullo, ma lo spostamento quadratico medio indotto dalle fluttuazioni del campo a frequenza ω e' e2<E2(ω)> <δr2(ω)> = . (4) m2ω4 Lo spostamento quadratico medio totale 1 dovuto ai modi in un dato ωmax 2 intervallo di frequenza e' <δr > = ∫<δr(ω) 2>dω. ωmin La (4) direbbe che i modi di bassa frequenza producono δr grandissimi, ma in effetti il problema ha la lunghezza caratteristica aB = /2 h = (Zmα) -1 : onde piu' lunghe di cosi' hanno campi elettrici circa me2Z uniformi sull'atomo, e non e' corretto supporre che si sommino in modo incoerente. Poiche' non producono fluttuazioni, noi le ignoriamo, prendendo ω>ωmin , con ωmin =c/a B = mc 2Zα . / h __ h L'altra lunghezza caratteristica e' la lunghezza d'onda di Compton ; mc non ha senso considerare fluttuazioni piu' piccole, quindi prendiamo mc 2 ωmax = . / h Pertanto, ωmax ωmax ⌠ 2e2h / 2e2h / 1 dω <δr2> = <δr(ω) 2>dω = = ln( ) ∫ ω 2 3 ⌡ 2 3 πm c ω πm c Zα ωmin min 1Si ammette in questo ragionamento euristico che i moti sulle diverse frequenze siano totalmente incoerenti e gli spostamenti quadratici siano additivi. =117= (5) Prof. M. Cini -Corso di Fisica Atomica e Molecolare In conclusione, l'elettrone compie oscillazioni erratiche di questa entita', sotto l'effetto dei campi del vuoto; tali fluttuazioni si sovrappongono a quelle causate dallo Zitterbewegung. Il calcolo della correzione al potenziale visto dall'elettrone puo' essere fatto come per il termine di Darwin, con la differenza1 che la fluttuazione quadratica media e' ora data dalla (5). Si ha ∆En =e<V(r+δr) - V(r)>, con ∂2V V(r+δr) - V(r) ≈ (1/2)Σij δri δrj ≈(1/6)∇ 2V<δr2> , ∂xi ∂xj Come nel caso di Darwin, la correzione si applica solo agli stati s; in questa approssimazione essa vale 2πZe2 4Ζe4h / 1 ∆En = |Ψ n (r=0)| 2<δr2> = |Ψ n (r=0)| 2ln ( ) = 2 3 3 3m c Zα 2 3 4Ζα h / 1 = |Ψ n (r=0)| 2 ln ( ) . (6) 2 3m c Zα Per il 2s del'atomo di H si ottiene un ∆E di circa 1000 MHz, e quindi possiamo dire di aver capito il grosso dell'effetto. L'elettrodinamica quantistica consente di calcolare con grande accuratezza lo spostamento in su del 2s di 1040 MHz e del 2p3/2 di 8MHz, nonche' quello in giu' del 2p 1/2 di 17 MHz. Come si vede, gli stati p sono anch'essi spostati, ma in misura molto minore. Lo stato 1s dell'H ha anch'esso il suo Lamb shift, maggiore anzi di quello degli altri stati,ma esso e' piu' difficile da osservare perche' non causa alcuna rimozione di degenerazione. Occorre misurare con estrema precisione la separazione dagli altri stati. Per il 4p il Lamb Shift e' molto piu' piccolo che per l'1s. La misura precisa della separazione non puo' essere fatta direttamente, perche' non c'e' un laser alla frequenza giusta; percio' e' stata fatta2 con tecniche di ottica non lineare. La separazione 1s-2s e' stata misurata mediante l'assorbimento di due fotoni. Eccitando con un dye laser a 4860 Å, in risonanza con la transizione 1s-2p, e' possibile tenere popolato il 2p e misurare l'assorbimento 2p1/2-2s 1/2. E' stato possibile effettuare la misura con tale precisione da mettere in chiara evidenza lo sdoppiamento iperfine. Con un'altra tecnica ottica nonlineare, la saturation spectroscopy, e' stata misurata la transizione 2s-4p; in questo caso, la tecnica non lineare e' necessaria per eliminare l'allargamento Doppler delle righe, che altrimenti comprometterebbe la precisione delle misure. 1Un'altra importante differenza e' che, ovviamente, il termine di Darwin e' contenuto nella teoria di Dirac, mentre l'effetto che stiamo calcolando e' una correzione radiativa che esula da essa. 2S.A.Lee,R.Wallenstein and T.W. Ha " nsch, Phys. Rev. Letters (1975) =118= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Sia ω0 la frequenza propria dell'atomo. Per misurare il coefficiente di assorbimento di un campione gassoso, supponiamo di usare un fascio di luce diretto lungo l'asse z. Un atomo che si muove con velocita' v lungo l'asse z allontanandosi dalla sorgente S vede il fotone spostato verso il rosso, quindi noi dobbiamo inviargli una frequenza piu' alta; cosi' l'atomo assorbe a ω0+δω, dove δω/ω=v/c. v ω0 S laser ω rivelatore ω Supponiamo che la misura sia eseguita in presenza di un fascio laser di pulsazione ωL , orientato lungo l'asse z negativo. Il fascio laser viene assorbito dagli atomi con velocita' v tale che ωL=ω0(1-v/c); ad esempio, se l'atomo va verso i laser, vede la sua luce spostata verso il blu e si ha assorbimento se il laser ha frequenza piu' bassa di quella propria. Per questi atomi il laser satura la transizione, eguagliando le popolazioni dei due livelli; essi non partecipano piu' allo spettro di assorbimento. La curva di assorbimento presenta un "buco" per ω=ωB = ω0(1+v/c). Conoscendo la frequenza ωL del laser e misurando quella ωB del "buco", si puo' fare sistema ω =ωL+ωB 0 2 ωB=ω0(1+v/c) ⇒ ωL=ω0(1-v/c) v/c= ωB-ωL ωB+ωL z e risalire a ω0 con grande precisione. Conoscendo le separazioni 1s-2s e 2s-4p conosciamo la separazione 1s-4p con grande precisione e quindi il Lamb Shift dello stato 1s. E' stato possibile apprezzare una piccola discrepanza con le separazioni predette dalla teoria di Dirac, da cui e' stato ottenuto un Lamb Shift di 8.20 ± 0.10 GHz per H e di 8.25±0.11 GHz per D, in accordo con la teoria. Capitolo 6-Interazioni iperfini Si vedra' quanto possono essere interessanti anche effetti molto piccoli. 6-1 Natura delle interazioni iperfini =119= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Sulla scala dei milionesimi di eV, gli elettroni atomici risentono del fatto che il nucleo puo' avere spin e produrre campi di quadrupolo elettrico e di dipolo magnetico. Essendo il raggio nucleare dell'ordine di 1 fm=10-13 cm, un elettrone atomico non ha un "potere risolutivo" che gli consenta di evidenziare nello spettro atomico alcun dettaglio della dinamica interna del nucleo; misurando lo spettro atomico si vengono a conoscere solo proprieta' nucleari globali come lo spin, il fattore giromagnetico e il momento di quadrupolo. Per la stessa ragione non avremo bisogno di una teoria nucleare per i nostri scopi, ma saranno sufficienti alcune informazioni di carattere generale. Lo spin I di un nucleo e' il momento angolare totale che risulta dai momenti orbitali e dagli spin 1/2 dei protoni e dei neutroni che lo compongono. Esistono regole semplici per stabilire quali nuclei hanno I intero e quali semiintero nello stato fondamentale. Sia A il numero di massa, uguale alla somma del numero Z dei protoni e del numero di neutroni. Si ha: ⇒ I semiintero A dispari (es: 1H, 19F, 31P hanno I=1/2) ⇒ I=0 A e Z pari (es: 12C, 16O) A pari, Z dispari ⇒ I intero (es: 2H, 6Li, 14N hanno I=1). Discutiamo per primi gli effetti magnetici. 6-2 Interazione col dipolo magnetico nucleare Per un elettrone dovremo considerare il momento magnetico orbitale e quallo associato allo spin S ; quest'ultimo e' me=__ geµBS/ h , con il fattore giromagnetico ge quasi esattamente __ eh uguale a 2 e con il magnetone di Bohr µB = . Anche gli spin 2mc nucleari hanno un momento magnetico associato, m = gNµN I, __ eh dove µN = , con M massa del protone. Poiche' M=1800 m, la 2Mc scala dei momenti magnetici nucleari e' di circa tre ordini di grandezza piu' piccola di quella dei momenti elettronici. Per calcolare gN occorrerebbe invero un modello nucleare molto dettagliato; noi considereremo i fattori giromagnetici come quantita' empiriche ricavabili da apposite tabelle come la seguente. ___________________________________________________ _______ Nucleo I gN ________________________________________________ =120= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1H 1/2 1/2 1/2 1 5/2 13C 15N 14N 17O 5.585 1.405 -0.567 0.403 -0.757 ___________________________________________________ _____ Per i nostri scopi e' sufficiente trattare il nucleo come una sferetta classica di raggio R uniformemente magnetizzata con 4πR3 densita' M. Il momento di dipolo magnetico e' m= M ed il 3 campo B prodotto e' ben noto1. Per r>R si ottiene lo stesso campo di un dipolo m puntiforme; il potenziale vettore e' m∧r 1 A=-m∧∇ ( ) = ; (1) r r3 il campo e' dato da B=∇ ∧A , e risulta m ( m.r)r B= - 3 + 3 . r r5 Dentro la sferetta (r<R) si ha una induzione magnetica uniforme, data da 8π B = M. (2) 3 In pratica potremo sempre prendere il limite R→0 nelle nostre espressioni, perche' il nucleo puo' essere trattato come puntiforme nella maggior parte dei problemi atomici. Tale limite va preso tenendo m costante, ed ammettendo che M→∞ in modo tale che ∫d3rB = 8π m; 3 r<R Quindi B e' singolare nell'origine, e la singolarita' e' una δ di Dirac. Tenuto conto del primo termine 'dipolare', si ha l'espressione B = - m (m.r)r 8π + 3 + δ(r) m. r3 r5 3 che vale in tutto lo spazio. 1vedi ad esempio J.D.Jackson,"Classical Electrodynamics", Capitolo 5. =121= (3) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Il campo magnetico del nucleo interagisce sia con l'orbitale A⋅p che con lo spin dell'elettrone. La prima perturbazione e' , mc dove A e' il potenziale vettore (1) e p e' l'operatore impulso, e 2µB conviene riscriverlo L⋅m, in termini del momento angolare L. / r3 h L'energia di interazione fra B ed il momento magnetico dello spin me e' -meB, e cioe' m.me (m.r)(r.me) 8π -{+ 3 + δ(r) m.me}= r3 r5 3 I.S (I.r)(r.S) 8π =geµBgNµN{- 3 + 3 + δ(r) I.S}. r r5 3 Cosi' la perturbazione totale e' 2µB m.me (m.r)(r.me) 8π H' = L⋅m + 3 δ(r) m.me, (4) / r3 h r3 r5 3 e noi la tratteremo al primo ordine. 6-3 Interazione iperfine-Stati s. Il caso piu' semplice, e piu' importante in pratica, e' quello degli stati con L=0, che sono privi di momento magnetico orbitale. La correzione all'energia si ottiene dai valori di aspettazione di H' fra funzioni imperturbate. Queste ultime sono della forma Ψ=Ψ eorbΨ en spin , dove Ψ eorb e' la funzione d'onda orbitale dell'elettrone nell'approssimazione non relativistica e Ψ en spin e' il prodotto delle funzioni di spin dell'elettrone e del nucleo. Nel problema imperturbato vi sono 2(2I+1) stati di spin degeneri fra loro. Conviene intanto prendere la media su Ψ eorb, perche' le energie in gioco nelle interazioni iperfini sono cosi' piccole che i gradi di liberta' orbitali possono considerarsi "congelati" e non hanno alcun ruolo attivo nella dinamica; il primo termine della (2.4) non contribuisce. Fatta la media su Ψ eorb, otterremo una Hamiltoniana efficace H'eff che opera solo sui gradi di liberta' dello spin e contiene tutta la dinamica che ci interessa. Qui ci limiteremo per ora ai soli stati s. In tal caso si ha evidentemente per ragioni di simmetria ri rj < 5 > =0 se i≠ j r x2 y2 z2 1 < 5 > =< 5 > =< 5 > =< 3 > . r r r 3r La media sull'interazione dipolare e' quindi =122= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 m.me < 3 > -3 r ∑ ∑ mi me j < ij 1 = m.me < 3 > -3 r ri rj > = r5 mi me i < i ri 2 > = 0. r5 (2) Rimane solo l'interazione "di contatto". Chiamando semplicemente Ψ la funzione d'onda orbitale, abbiamo < δ(r) > = |Ψ(0)|2, e quindi 8π 8π H' eff = |Ψ(0)|2 m.me = |Ψ(0)|2 γµB .I , (3) 3 3 avendo posto ge≈2, γ=gNµN. Denoteremo questo termine con Hc . Con questa interazione, le componenti di ed I cessano di commutare con H, ma deve conservarsi il momento angolare totale (con h /=1) 1 F=( +I) . (4) 2 Possiamo eleggere come buoni numeri quantici Fz e F2. In particolare, F2 = 2 +I2 + .I 4 ha autovalori F(F+1); ma 2 =3, quindi 3 .I = F2 - I2 4 3 ha autovalori F(F+1) - I(I+1) sugli autostati di F2 ed Fz. Il 4 problema di diagonalizzare H' eff e' cosi' risolto. Nel caso I=1/2, si hanno gli stati T r i p l e t t o S i n g o l e t t o F=1 F=0 . I = 1/2 . I = -3/2. Per la (4), lo stato fondamentale e' il singoletto quando γ>0, 1 come nel caso di 1H. In tal caso, |Ψ(0)|2 = e possiamo πa03 calcolare la separazione fra i livelli. Si ottiene ∆E = 5.885 10-6 eV, che corrisponde ad una frequenza di 1422.8 MHz ovvero ad una lunghezza d'onda di circa 21 cm. E' una delle grandezze fisiche che possono essere piu' accuratamente misurate e calcolate (introducendo piccole correzioni come il fattore giromagnetico anomalo dell'elettrone). Essa corrisponde all'energia di uno spin elettronico in un campo magnetico efficace Beff ≈500 Gauss. =123= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La transizione fra F=0 e F=1 e' proibita di dipolo elettrico, ma e' permessa di dipolo magnetico. Per questo motivo, e per la piccolezza della separazione in gioco che produce un fattore ν3 particolarmente basso, la velocita' di decadimento spontaneo risulta bassissima, Λ = 2.85 10-15 s-1 , ed il tempo di vita τ dello stato eccitato e' dell'ordine di 10 milioni di anni. Con un τ cosi' lungo, sono probabili molte collisioni anche in un gas diluito come una nube interstellare. Si raggiunge pertanto l'equilibrio termico, e si ha il rapporto di popolazioni nF=1 g1 - h ν , = e nF=0 g0 KT hν dove i g sono le degenerazioni. Poiche' = 0.07 0K, mentre la K temperatura di fondo dell'universo e' di 2.7 0K, anche nei luoghi piu' freddi 3/4 degli atomi di H sono eccitati. Se n e' il numero 3 n Λ di atomi di H per cm3, ogni cm 3 della nube irraggia 4 fotoni da 21 cm al secondo. Dallo spostamento Doppler della riga si ricava anche la componente radiale della velocita' della nube rispetto a noi. Le onde radio non sono assorbite dal pulviscolo interstellare e giungono a noi anche da regioni remote e non visibili. Cosi' negli anni '50 si e' potuta ricostruire la struttura a spirale delle nubi di H nella Galassia. Anche una emissione del radicale OH a 18 cm viene molto studiata. Decine di "maser" OH sono noti nel cosmo, ma la loro natura fisica e' ignota. 6-4 Interazione iperfine-Stati con L ≠0 Per tutti gli stati, esclusi quelli s, il termine in L⋅m nella (2,4) contribuisce, mentre l'interazione di contatto e' nulla. Di nuovo, H' potra' essere diagonalizzata simultaneamente con F2 ed Fz, ma il momento angolare totale (3,4) si generalizza a F=J+I, dove J=L+S e' il momento angolare totale dell'elettrone; calcolando i valori di aspettazione di H' fra funzioni imperturbate del tipo |LSJFMF> si ottengono le correzioni iperfini ai livelli. I gradi di liberta' orbitali non sono del tutto 'congelati' in questo caso, perche' gli stati elettronici con lo stesso L e diverso ML , essendo degeneri, vengono mescolati dall'interazione iperfine. Il calcolo dei valori di aspettazione e' agevolato dall'uso del teorema di Wigner-Eckart , come vedremo ( Capitolo 11.9). =124= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 .i.6-5 Risonanze magnetiche di spin In un campo magnetico B, che supponiamo uniforme e costante, l'Hamiltoniano di spin ha il termine di interazione H m = -(-geµBS.B) (1) nel caso di un elettrone, e H m = -gNµN I.B (2) nel caso di un nucleo. In ambedue i casi si hanno livelli energetici che dipendono linearmente dal campo. Pero' nel caso dell'elettrone e di certi nuclei, g<0 e il livello piu' basso ha spin β, mentre per un protone per la maggior parte dei nuclei di spin 1/2 ha spin α. A parita' di campo magnetico, la separazione fra stati di mI diverso e' circa tre ordini di grandezza piu' piccola che nel caso elettronico. Transizioni fra i sottolivelli magnetici possono essere indotte dalla radiazione elettromagnetica che soddisfa alle condizioni di risonanza hν=gNµΝ B (risonanza magnetica nucleare, o N.M.R.) o hν=geµeB (risonanza di spin elettronico E.S.R. , detta anche E.P.R. = Electron Paramagnetic Resonance o E.M.R. = Electron Magnetic Resonance). Le frequenze di risonanza per spin liberi in un campo B=10000 Gauss sono, ad esempio: Elettrone 1H 19F 13C 31P 28026 Mhz 42.577 Mhz 40.055 Mhz 10.705 Mhz 17.235 Mhz Il campo elettrico della radiazione non si accoppia con gli spin, e le transizioni sono proibite di dipolo elettrico. E' il campo magnetico che agisce, e produce quindi transizioni di dipolo magnetico. Sia B' questo campo oscillante. Un B' parallelo a B, che scegliamo lungo l'asse z, e' capace di modulare i livelli, ma 1Vedere per esempio A.C.Carrington, F.R.S and A.D. McLachlan, "Introduction to Magnetic Resonance", Chapman and Hall, John Wiley & Sons, Inc. New York (1978). =125= Prof. M. Cini -Corso di Fisica Atomica e Molecolare non di produrre transizioni1. Per questo si usa radiazione polarizzata con il campo magnetico B' lungo (diciamo) l'asse x. La perturbazione e' allora H''(t) = (geµBSx - gNµN Ix) B' (eiω t + e-iω t) ≡ 2Vcos(ωt) (3) e la probabilita' di transizione n→m e' 2π Pnm = __ |<n|V|m>|2 δ(ωmn - ω). h (4) Il termine in Sx produce transizioni di EPR del tipo α eα N → β eα N, mentre il termine in Ix produce quelle NMR ; le transizioni che cambiano lo stato di spin di ambedue le particelle richiedono il prodotto I xSx e sono proibite in questa prima approssimazione, ed in effetti assai meno intense. Il grande interesse di EPR ed NMR come tecniche analitiche nasce dal fatto che le condizioni di risonanza vengono influenzate da deboli effetti correttivi che dipendono dallo stato chimico dell'atomo. Questi deboli effetti hanno conseguenze ben osservabili sugli spettri e consentono di estrarne molta informazione utile. Nel seguito ne studieremo alcuni. 6-6 1H in campo magnetico: livelli iperfini e transizioni EPR L'Hamiltoniano di spin per un atomo di 1H in un campo B diretto lungo l'asse z, e' H = H c +H M = a I.S + (γeSz-γNIz)B (1) 16π |Ψ(0)|2 γµB.. Calcoliamone la matrice sulla base degli 3 stati imperturbati αα,αβ,βα,ββ, dove il primo simbolo si riferisce allo stato dell'elettrone e il secondo a quello del protone. La matrice del secondo termine HM e' diagonale, con elementi (γe-γ`N)B (γe+γN)B (-γe-γN)B (-γe+γN)B , , , . 2 2 2 2 La matrice di Hc si ottiene nel modo piu' diretto da S+I- +S- I+ H c = a{ IzSz + }. (2) 2 con a = I soli elementi di matrice non nulli dei termini misti sono 1questo e' strettamente vero al primo ordine: al secondo le transizioni sono permesse, ma in pratica sono molto deboli e noi le trascuriamo. =126= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <αβ| S+I- |βα> = 1 <βα| S- I+ |αβ> = 1. Pertanto l'intera matrice hamiltoniana e' (γ -γ )B +a 0 0 0 2 4 a 0 (γ +γ )B -a 0 2 4 2 H= (-γ -γ )B a 0 a 0 2 2 4 (-γ +γ )B a 0 0 0 + e n e n e n e n 2 αα . αβ . βα . ββ (3) 4 e possiamo ottenere autostati ed autovalori risolvendo l'equazione secolare ||Hij - Eδij || =0. αβ αα EPR EPR (Gauss) ββ βα Per B→ 0, lo stato fondamentale e' il singoletto, mentre i 3 stati degeneri con F=1 sono piu' alti in energia di 2a. Un piccolo campo stabilizza ulteriormente il singoletto, mentre risolve il tripletto: una componente dipende poco dal campo, una viene stabilizzata e la terza destabilizzata al crescere di B. Quando il campo e' dell'ordine di B eff ≈500 Gauss, lo schema dei quattro livelli differisce qualitativamente da quello iniziale, perche' il piu' basso dei livelli del tripletto si e' avvicinato al singoletto mentre gli altri due sono rimasti molto vicini. Per B>>Beff siamo nel regime di Paschen-Back; l'accoppiamento fra gli spin elettronico e nucleare e' dominato dall'accoppiamento di ciascuno spin con il campo esterno. I due livelli del tripletto che sono rimasti vicini in energia possono essere identificati, per grandi campi, con gli stati αβ e αα, in ordine decrescente di =127= Prof. M. Cini -Corso di Fisica Atomica e Molecolare energia; gli altri due sono ββ e βα. L'interazione di contatto puo' allora essere trattata come una perturbazione al primo ordine rispetto ad H M, e poiche' al primo ordine si considerano solo gli elementi diagonali di una perturbazione, possiamo trascurare gli elementi fuori diagonale di H. Gli autovalori sono quindi dati dagli elementi diagonali, e decrescono nell'ordine E(αβ),E(αα),E(ββ), E(βα). Le transizioni EPR permesse sono due, ed a a hanno le energie E(αα)-E(βα) = γeB + , E(αβ)-E(ββ) = γeB - .Lo 2 2 spettro EPR consiste quindi di due righe separate da a. 6-7 Ricerche su H H↓ denota l'Idrogeno atomico polarizzato in spin1. L'Idrogeno atomico si puo' produrre con una scarica elettrica in H 2, ma si ricombina molto rapidamente a meno che la pressione parziale non sia molto bassa. Mettendo H atomico in campo magnetico si ottiene una mistura di H↑ e H↓, ma un campo magnetico disomogeneo consente di separarli come si farebbe con tante piccole calamite e di produrre H↓ puro. A meno delle deboli interazioni iperfini, un gas di H↓ e' stabile: due atomi di H↓ non possono combinarsi per formare H2, perche' un legame covalente e' un singoletto di spin. In effetti, come si e' visto, H↑ e H↓ non sono autostati esatti dell'Hamiltoniano, e la ricombinazione infine avviene, ma molto lentamente. Silvera e Walraven nel 1980 lo hanno ottenuto con le seguenti caratteristiche di temperatura e pressione: T = 270 mK ρ=1.8 1014cm -3 . Cosi' e' possibile formare un gas polarizzato in spin relativamente denso ed osservarlo per un tempo dell'ordine di 1 secondo, che e' lunghissimo dal punto di vista spettroscopico. Fin dal 1958 ci sono stati studi teorici su H↓ promossi dalla NASA. Un gas polarizzato in spin sarebbe un propellente ideale per razzi: basterebbe togliere il campo per ottenere H + H → H 2 + 4.8 eV che fornisce la piu' grande energia per unita' di massa fra tutte le reazioni chimiche. Questo obiettivo e' ancora lontano, ma sono in corso studi per ottenere la condensazione di BoseEinstein di H↓, che e' un bosone. La condizione che determina la temperatura critica T C in un gas perfetto di particelle di spin intero S e' 2 1gli spin allineati sono ovviamente quelli elettronici. 2L.Landau e L.Lifshitz, Fisica Statistica, Paragrafo 59. =128= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ρ h2 / [ ]2/3. (1) m 2S+1 Si ritiene che le condizioni di temperatura e pressione necessarie per osservare un nuovo tipo di superfluido possano essere raggiunte in un futuro non lontano. KTC = 3.31 6-8 Spettri EPR di molecole1 La tecnica EPR applicata a molecole e solidi da' informazioni strutturali (cioe' sulla formula di struttura di composti ignoti) e di struttura elettronica (cioe' sulla Ψ). Occorrono sistemi che abbiano spin elettronici spaiati, come i radicali ed i metalli. Consideriamo un elettrone spaiato in un orbitale ψ0 non degenere. L'hamiltoniano di interazione con un campo magnetico esterno e' H m = µB B⋅L + geµB B⋅S. (1) Possiamo ridurre Hm ad un hamiltoniano di spin mediando sui gradi di liberta' orbitali. Poiche' non e' degenere, ψ0 puo' essere ∂ preso reale, ed il valore di aspettazione di Lz = -ih / ∂φ e' immaginario puro. D'altra parte, il valore di aspettazione deve anche essere puramente reale, perche' Lz e' hermitiano. Dobbiamo concludere che <L z >=0, e poiche' l'asse z non ha nulla di speciale, <L >=0. A questa approssimazione, Hm = geµB B⋅S come per un elettrone libero. In realta', la frequenza di risonanza differisce leggermente da quella che ci si aspetta per un momento magnetico µ= -geµBS nel campo magnetico applicato B. Una ragione fisica e' che il campo visto dallo spin e' un po' diverso da quello applicato, un'altra e' che l'interazione spinorbita mischia allo spin dell'elettrone anche un contributo orbitale. Per vederlo, includiamo anche l'interazione spin-orbita L+S- +L - S+ H SO=ζ L⋅S= ζ[LzSz + ], (2) 2 trattandola al primo ordine. Lo spinorbitale |ψ0α> dell'approssimazione 0 viene mescolato da LzSz con gli stati |ψn α> e da L+S- con gli stati |ψn β> , mentre L- S+ da' 0. Possiamo scrivere lo spinorbitale di prima approssimazione: |+>= |ψ0α> - ζ 2 ∑ { n Analogamente, si trova |ψn α><ψn |Lz|ψ0>+|ψn β><ψn |L+|ψ0> }. (3) En -E0 1Vedere anche Melvin W. Hanna, "Quantum Mechanics in Chemistry", W.A.Benjamin, Inc., London (1969) =129= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |->= |ψ0β> - ζ 2 ∑ n { |ψn β><ψn |Lz|ψ0>+|ψn α><ψn |L- |ψ0> }. En -E0 (4) Lo splitting fra i due stati viene modificato. I nuovi livelli si ottengono diagonalizzando la matrice di H m= B⋅[µB L + geµB S] sulla base degli spinori perturbati <+|L + g eS|+> <+|L + g eS|-> H m=µB B⋅ <-|L + g S|+> <-|L + g S|-> (5) e e e questa puo' essere espressa in termini degli elementi di matrice di L fra gli orbitali. Il problema di calcolare i livelli magnetici puo' considerarsi risolto1. Occorre pero' saper passare da questo formalismo spinoriale ad un altro, a tre tridimensioni, che mette in risalto le relazioni nello spazio reale. Ogni matrice 2x2 puo' essere scritta come combinazione lineare delle matrici di Pauli. In questo modo, Hm puo' essere scritta come una combinazione / h lineare delle tre componenti di S= ; inoltre e' anche una 2 combinazione lineare delle tre componenti di B. Lo scalare H m si ottiene combinando i due vettori con un tensore del secondo ordine, che si chiama tensore g. gxx g xy g xz Sx H m = µBBgS = µB(Bx B y B z) gyx g yy g yz Sy . gzx g zy g zz Sz (6) Questo si puo' interpretare fisicamente dicendo che il g efficace dell'elettrone differisce da g e, varia da molecola a molecola ed assume carattere tensoriale perche' diventa anisotropo. Se prendiamo B lungo l'asse z, abbiamo H m = µB B[gzxSx+gzySy +gzzSz] µB B h / gzz g zx-igzy = (7) gzx+igzy - g zz . 2 Ne consegue fra l'altro / gzz h = <+|Lz + geSz|+> = -<-|Lz + geSz|-> (8) 2 e analogamente abbiamo espressioni per gzx ±igzy da cui ricavare queste componenti. C'e' un altro modo di dire quanto sopra: H m=µBB'⋅S,con B'=Bg che punta in genere in una direzione diversa da B. Ma se prendiamo B lungo un asse di simmetra allora B' deve essere 1il calcolo esplicito degli elementi di matrice e' un esercizio di meccanica quantistica. Per ulteriori dettagli, vedere A.C.Carrington, F.R.S and A.D. McLachlan, "Introduction to Magnetic Resonance", Chapman and Hall, John Wiley & Sons, Inc. New York (1978). =130= Prof. M. Cini -Corso di Fisica Atomica e Molecolare parallelo a B. Quindi per molecole dotate di simmetria il tensore g e' simmetrico e puo' essere diagonalizzato. Esperimenti EPR su campioni cristallini contenenti molecole orientate forniscono informazioni di tipo strutturale. Effetto del'interazione iperfine Per un elettrone lo spettro EPR consiste di una riga, e se si tiene conto dell'interazione spin-orbita, quello di una molecola mostra una transizione sola attribuibile ad un g modificato. Ma se c'e' l'interazione iperfine, che contribuisce a rendere il campo magnetico effettivo diverso da quello applicato, la riga si separa in multipletti strettissimi. Consideriamo ad esempio il radicale CH3, che ha struttura planare, angoli di 1200 e 3 protoni equivalenti. Poiche' 12C ha I=0, l'elettrone "sente" solo gli spin dei protoni. I campi possibili sono 4, a seconda di come questi sono orientati: (+ + +) (+ + -) (+ - +) (- + +) (+ - -) (− + −) (− − +) (− − −). A temperatura ambiente, queste configurazioni sono tutte equiprobabili, perche' le differenze di energia sono molto piu' piccole di KT. In effetti, lo spettro EPR ha 4 righe, di intensita' relativa 1:3:3:1, equidistanti sia in B (a parita' di ν) che in ν (a parita' di B). In pratica, gli spettri EPR si misurano a ν costante. La distanza fra i picchi e' uguale alla costante di accoppiamento a dell'interazione di contatto e ci permette di dedurre la |Ψ|2 dell'elettrone spaiato sui protoni; per il modo in cui e' fatta la misura, e' naturale esprimere a in Gauss. Gruppi di protoni non equivalenti hanno a diverse. Ad esempio, nel radicale Etile (CH3CH2) occorre distinguere a(CH 3)=26.87 Gauss da a(CH 2)=22.38 Gauss. Se ci fosse solo a(CH 3), lo spettro consisterebbe di 4 righe, distanti 26.87 Gauss, di intensita' relative 1:3:3:1. | | | | | | | | Ma ogni riga va risolta in 3 componenti separate di 22.38 Gauss, di intensita' relativa 1:2:1. Cosi' si puo' sintetizzare a tavolino un complicato spettro di 12 righe, che e' in eccellente accordo con quello osservato. Vicecersa, se non avessimo conosciuto la =131= Prof. M. Cini -Corso di Fisica Atomica e Molecolare formula di struttura del radicale, lo spettro EPR ci avrebbe informato che ci sono due gruppi di protoni equivalenti, uno di 3 ed uno di 2. Inoltre, abbiamo l'informazione sulla |Ψ|2 sui due gruppi. 6-9 Costanti di schermo in NMR. Knight shift La condizione di risonanza NMR, hν=gNµNB, subisce lievi modifiche in dipendenza dello stato chimico dell'atomo, in quanto il campo B eff sul nucleo differisce da quello applicato. I principali effetti sono: 1) il "chemical shift", che e' dovuto allo schermaggio del campo da parte delle correnti indotte nei vari gusci elettronici interamente occupati. 2) i campi di eventuali spin elettronici spaiati (Knight shift, importante nello studio dei metalli e dei radicali) 3) i campi degli altri dipoli nucleari (spin-spin splitting). Per studiare il "chemical shift", cominciamo con un atomo di gas nobile: i suoi elettroni occupano gusci chiusi, la densita' di carica ρ(r) ha simmetria sferica e nessuno spin elettronico e' spaiato. Poiche' gli stati eccitati distano da quello fondamentale di svariati eV, l'atomo e' poco polarizzabile. Un orbitale ψ ha una densita' di corrente J0 = e { ψ* pψ + ψ p* ψ* } , 2m (1) __ dove p* = - p = i h ∇ . Gli orbitali possono essere scelti reali, e questa scelta e' oculata perche' J0 si annulla identicamente. E' ovvio che, comunque uno scelga di prendere gli orbitali, la corrente totale in un guscio chiuso e' nulla. Immergiamo l'atomo in un campo magnetico uniforme B=(0,0,B), descritto nella gauge div A=0 dal potenziale vettore B∧r B A= = (-y,x,0). Ora, per il fatto stesso che A≠ 0 compaiono 2 2 delle correnti. Infatti la prescrizione per introdurre il potenziale e vettore e' p→ p - (- A), e la corrente diventa, in presenza del c campo, e e2 J= { ψ* pψ + ψ p* ψ∗ } A ψ* ψ = J0 +Jd. (2) 2m mc A rigore, anche gli orbitali ψ cambiano a causa del campo, ma se i livelli eccitati sono molto distanti in energia e' ragionevole =132= Prof. M. Cini -Corso di Fisica Atomica e Molecolare trascurare tali cambiamenti. Il campo prodotto sul nucleo (r=0) dalle correnti diamagnetiche1 e2 Jd = A ψ* ψ (3) mc e' dato dalla legge di Biot e Savart B(r) = 1 c ⌠ J(r')∧(r-r') 3 d r ' |r-r'|3 ⌡ , ed e' ⌠ e2 [ -1 mc d3r ' Bd(r→0) = c ⌡ ψ* (r')ψ(r')A(r')]∧ r' |r'|3 . Per simmetria, solo la componente z puo' essere non nulla. Omettendo i primi, ed usando (A∧r) z = Axy-Ay x, si ottiene (Bd) z = -e 2B ⌠ x2+y2 3 2 d r |ψ| . 2mc 2 r3 ⌡ (4) Notare il segno - , che implica che il campo diamagnetico si oppone a quello applicato. In un sistema sferico-simmetrico <r2> <x2>=<y2>=<z 2>= . Inoltre, sommando su tutti gli orbitali 3 occupati, si puo' fare intervenire al posto di |ψ|2 la densita' totale ρ. Il campo efficace sul nucleo e' percio' Beff = (1-σ)B dove la costante di schermo (=scielding constant) σ e' data dalla formula di Lamb σ= e2 1 < >. 3mc 2 r (5) 1Qui si puo' avere l'impressione falsa che un cambiamento della gauge comporti un cambiamento di J. Ma occorre ricordare che in un cambiamento di gauge ieχ(x,t) e A' = A + χ, si avrebbe Ψ '(x,t) = Ψ (x,t) exp[ ], e allora 2m { /c h ψ* pψ + ψ p* ψ* } non sarebbe la corrente in assenza di campo e non sarebbe nullo; avremmo un J 0 tale da garantire la stessa corrente di prima. Gli osservabili fisici sono indipendenti dalla gauge. =133= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Si trova σ=59.93 10-6 per He, σ= 547 10-6 per Ne, ed in generale σ<<1 ma cresce rapidamente con Z. Per atomi non di gas nobile dobbiamo aggiungere al campo magnetico due contributi. Quello che viene di solito definito "paramagnetico" e' dovuto alla modifica delle ψ orbitale da parte del campo; poi c'e' quello dovuto agli effetti degli spin. Nel contributo "paramagnetico" lo spin non entra per niente, e in questo senso la teminologia e' infelice. Esso e' dovuto al fatto che l'Hamiltoniano di ogni elettrone ha il termine in piu' e A⋅p = µB B⋅L, (6) mc mentre il termine in A2 e' trascurabile. Se indichiamo con |0> la funzione d'onda imperturbata, in presenza del campo avremo |n><n|Lz|0> ψ= |0>- µB B∑ , (7) (En -E0) n dove n corre sugli stati eccitati. Ci basta la correzione di ordine piu' basso, e non occorre correggere il termine diamagnetico, che e' gia' di primo ordine in B; la correzione viene dai termini e in { ψ* pψ + ψ p* ψ∗ }, che, inseriti nella legge di Biot e Savart, 2m danno un contributo extra Bp(r→0)= eh / 2mc -eh / = 2mc ∫dr' [ψ* (r')pψ(r')]∧r' +c.c. r' 3 L ∫dr' ψ* (r') r'3ψ(r')] +c.c., dove, essendo hermitiano l'operatore, il complesso coniugato comporta semplicemente un fattore 2. In generale in una molecola il campo indotto non e' parallelo a quello applicato, e la costante di schermo e' un tensore. Da quanto sopra consegue che il contributo paramagnetico alla componente (σp) zz e' dato da Lz -eh / <ψ| 3 |ψ>. (8) mc r' Sostituendovi la ψ corretta e sommando su tutti gli elettroni si ha (σp) zz. Si puo' notare che gli stati s non contribuiscono, perche' hanno Lz nullo e sono accoppiati a stati |n> che hanno la stessa proprieta'; ma, in presenza di stati p e d, σp puo' essere dominante. Aggiungendovi il contributo diamagnetico si ha una espressione esplicita di σzz (formula di Ramsey), che non riportiamo, ma lasciamo per esercizio. =134= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Gli effetti dello spin elettronico in N.M.R. sono importanti solo in sistemi che abbiano spin spaiati, come metalli e molecole o radicali paramagnetici; in tali casi, pero', si osservano shift molte volte piu' grandi del consueto (Knight shift). Consideriamo un nucleo soggetto ad un campo magnetico B = H diretto lungo l'asse z ed all'interazione iperfine di contatto con un elettrone. La sua Hamiltoniana conterra' i termini Sz -µNgNIzB + aIzSz = -µNgNIz(B - a ). (9) µNgN Poiche' le frequenze associate allo spin nucleare sono basse, e il moto dell'elettrone e' poco influenzato dal nucleo, possiamo approssimare l'hamiltoniana del nucleo con la sua media sui gradi di liberta' elettronici -µNgNIz(B +Be) , (10) dove il campo prodotto dallo spin elettronico e' Be = - a <Sz> . µNgN (11) La risonanza risulta spostata di Be , e la misura ∆H di tale spostamento fornisce la densita' di spin elettronico sul nucleo (stiamo supponendo B=H per semplicita'). Ma <Sz>>∝H, poiche' il momento magnetico di equilibrio nel campo esterno e' dato da M=χH=-NµBg<Sz>. (12) Per spin elettronici S indipendenti, di componenti z MS, la media S ∑ gµBMSexp[gµBMSH/KT] MS=-S M=N (13) S exp[gµ M H/KT] ∑ B S MS=-S e' data da gµBSH M=NgµBS B S( ), (14) KT dove la funzione BS di Brillouin e' data da 2S+1 (2S+1)x 1 x coth( )coth( ). 2S 2S 2S 2S Per H→0, si ottiene facilmente BS(x) = Ng2µB2S(S+1) χ= . 3KT Quindi, (15) (16) =135= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∆H µB g S(S+1) =a . (17) H µNgN 3KT Quindi il Knight shift dipende fortemente dalla temperatura. .i6-10 Effetti molecolari e di stato solido in NMR: spinspin splitting Consideriamo ad esempio lo spettro dei protoni dell'alcool etilico CH 3CH2OH. Osservato in bassa risoluzione, esso mostra tre picchi, di intensita' relative 1:2:3 in ordine di B crescente. Questi picchi possono essere etichettati rispettivamente OH, CH2 e CH3, e sono dovuti al diverso schermaggio elettronico dei protoni dei diversi gruppi. Ecco un disegno schematico dello spettro : Segnale CH 3 CH 2 OH B E' facilmente comprensibile che il protone di OH, essendo ionico, e' il meno schermato. Dobbiamo ora stimare l'effetto dell' interazione fra gli spin nucleari. Quella fra i momenti magnetici di due protoni e' data (Sezione 2) da I1.I2 (I1.r)(r.I2) H' D = gN2µN2{ 3 - 3 }, (1) r r5 dove r e' la separazione fra i due protoni. Possiamo anche scrivere H' D = gN2µN2 I1DI2 , (2) dove D e' il tensore con componenti cartesiane δij xi xj Dij = 3 - 3 5 . (3) r r =136= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H' D crea una scissione fra gli stati di singoletto e di tripletto del sistema. Se aggiungiamo un campo esterno B, che tende ad orientare gli spin, i livelli dipendono dall' angolo fra r e B. Una analisi dello spettro NMR in funzione degli angoli contiene dettagliate informazioni sulla distanza fra i protoni e sull'orientazione della molecola cui appartengono. Questo si puo' fare con un campione di molecole rigidamente orientate, come ad esempio le molecole di acqua in un cristallo di gesso (CaSO 4 . 2 H 2O). In un liquido, invece, le molecole non hanno una orientazione definita e l'informazione legata alla direzione di r e' perduta. In effetti, poiche' δij xi xj < 5 >=< 3> r 3r la media di D sugli angoli e' nulla e l'interazione magnetica dipolo- dipolo si media a 0 in un liquido. Nondimeno, esiste ancora un'altra, ancora piu' tenue interazione spin-spin fra due nuclei 1 e 2 che non si media a 0. Essa e' della forma H"=J 12I1⋅I2, (4) con J 12 che si chiama "spin-spin splitting constant". Si tratta di una interazione indiretta, mediata dagli elettroni. Un protone di spin α favorisce leggermente attraverso l'interazione iperfine una orientazione β dell'elettrone piu' vicino. Se questo e' impegnato in un legame covalente, l'altro elettrone del legame avra' una certa preferenza per l'orientazione α, e tendera' ad orientare i protoni vicini ad avere uno spin β. Per vederlo, dobbiamo tornare alla forma (2.4) dell'interazione di contatto fra un elettrone in r e un nucleo in R, cioe' H'(r,R)=C(N)δ(r-R) I.S, (5) con 8πgµB gNµN . 3 Se ci sono due nuclei A e B e due elettroni, C(N)= (6) H''(r1,r2,RA ,RB ) = C(A)IA ⋅[S1δ(r1-RA )+S2δ(r2-RA )] + C(B)IB ⋅[S1δ(r1-RB )+S2δ(r2-RB )] dove = C(A) IA ⋅SA +C(B) IB ⋅SB , 2 Sα = ∑ i=1 δ(ri -Rα ) Si (7) (8) =137= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e' la densita' di spin sul nucleo α. L' Hamiltoniano di spin nucleare si ottiene mediando sui gradi di liberta' (orbitali e di spin) degli elettroni. Lo stato imperturbato e' un singoletto, che scriveremo |0> = φ0(r1)φ0(r2)χ S; ora, H'' e' lineare negli operatori di spin elettronico. Questi convertono il singoletto in componenti del tripletto: ad esempio, σ1z[α(1)β(2)+β(1)α(2)] =α(1)β(2)-β(1)α(2); e' presto visto che 1 1 1 T T S1zχ S= χ T0, S2zχ S= - χ T0 , S1xχ S = (χ 1-χ -1 ), 2 2 8 1 T T i -i T S2xχ S= (χ 1-χ -1 ) , S1yχ S= (χ T1+χ T-1 ) ,S2yχ S= (χ 1+χ T-1 ), 8 8 8 dove χ T e' una funzione di tripletto. Quindi non c'e correzione al primo ordine. Al secondo, entrano gli stati eccitati della forma 1 |n>= [φ (r1)φ (r2) - φ (r2)φ (r1)]χ T n2 n1 n2 2 n1 e gli stati |n> che sono accessibili da |0> con una componente di Sα non lo sono con le altre, come ci si poteva attendere per motivi di simmetria. Si ha la correzione agli autovalori ∆E(2) = ∑ |<n|H'|0>| 2 , E0-En (9) n che diventa un hamiltoniano efficace se integriamo sugli r e gli Si ma non sugli spin nucleari. L'interazione che cerchiamo e' contenuta nei termini bilineari, proporzionali a IA ed a IB . Nel calcolo di <0|H'|n><n|H'|0> terremo i termini in cui figura IA nel primo fattore e IB nel secondo e viceversa. Ma, come si e' visto, gli stati |n> che sono accessibili da |0> con una componente di Sα non lo sono con le altre, cosicche' ad esempio IAx <0|SAx |n> moltiplica IBx <n|SBx |0>. Cosi' |<n|H'|0>| 2 ∝ (I Ax IBx <0|SAx |n><n|SBx |0>+IAy IBy <0|SAy |n><n|SBy |0> + IAzIBz<0|SAz|n><n|SBz|0>) + i termini con A e B scambiati. (10) Dopo la somma su n, i coefficienti di IAx IBx sono identici a quelli di IAy IBy e di IAzIBz , quindi la (9) e' proporzionale a IA ⋅IB . E' facile, con un po' d'algebra, costruire una espressione per JAB . Se ad esempio lo facessimo per una molecola di H2, il contributo piu' grosso verrebbe dal primo tripletto eccitato, che darebbe J≈200 Hz. L'ordine di grandezza e' dato dalla (9), dove <n|H'|0> =138= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ≈a≈10-6 eV (la costante dell'interazione iperfina), mentre il denominatore e' dell'ordine degli eV. Cosi', J≈10-12 eV. Gli effetti dell'interazione spin-spin sono molto piccoli, ma ben osservabili in alta risoluzione. Nello spettro del CH 3CH2OH , il picco del CH 2 si risolve in 4 righe, di intensita' relative 1:3:3:1, mentre quello del CH3 si risolve in tre righe di intensita' 1:2:1. Segnale CH 3 CH 2 OH B I 3 picchi del multipletto CH3 dipendono dai 3 modi diversi in cui possono disporsi i protoni del gruppo CH2, ed i 4 picchi del multipletto CH2 dai 4 modi in cui possono disporsi quelli del CH3. Il protone OH e' lontano dagli altri, ed occorrerebbe una risoluzione ancora maggiore per vederne il multipletto. A prima vista, puo' sembrare strano che un protone non mostri spin-spin splitting a causa dei campi di spin degli altri protoni del suo stesso gruppo. Per spiegare questo fatto, scriviamo l'Hamiltoniana di spin per i tre protoni equivalenti del CH3, trascurando ogni altra interazione. H = -γNBFz + J{I1I2 + I2I3 + I1I3 }. (11) La componente z ed il quadrato dello spin totale F = I1 +I2 +I3 si conservano, e poiche' F2 = ∑Ij 2 +2 {I1I2 + I2I3 + I1I3 } j possiamo immediatamente diagonalizzare H: H = -γNBFz + J 9 [ F2 - ] . 2 4 (12) (13) =139= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Gli autovalori di H dipendono solo da Fz e da F. Il secondo termine pero' non ha effetto sull'energia delle transizioni permesse in NMR. Infatti, l'operatore (5.3) che le provoca e' proporzionale a Fx, che commuta con F2, e puo' causare transizioni solo fra stati dello stesso F. Pertanto, J non ha alcun effetto sullo spettro. 6-11 Struttura iperfine dovuta al momento di quadrupolo elettrico del nucleo Oltre al momento di dipolo magnetico, i nuclei con spin I>1/2 hanno un momento di quadrupolo elettrico. Esso e' definito dal tensore Q ik = ∑ {3 xpi xpk -δik rp2} , (1) p dove xpi e' una componente cartesiana del raggio vettore rp del generico protone del nucleo. Il potenziale1 generato dal nucleo posto all'origine delle coordinate in un punto di raggio vettore R e' φ(R) = Ze e + Q ik ni nk , R 2R 3∑ ik R dove figurano le componenti di n= ; se Qik non e' nullo, il R campo del nucleo non e' esattamente centrale. In un potenziale esterno V, il quadrupolo ha l'energia ∂2V 1 3 ∆E = ∑ Q ik . (2) 6 ∂xi ∂xk ik Per una densita' di carica sferico-simmetrica, <Qik > ≡0. In effetti, il momento di quadrupolo misura la deviazione dalla sfericita' della distribuzione di cariche. Come e' intuitivo, un nucleo di momento angolare I=0, non avendo nello spazio direzioni privilegiate, ha Qik nullo; anzi, l'informazione essenziale sulle componenti di Q ik e' esprimibile in termini di I, a meno di una costante di scala. Mostreremo nel Capitolo 11 che dalla teoria della simmetria consegue l'espressione2 Q ik = 3Q 2 {Ii Ik + Ik Ii - δik I2}, 2I(2I-1) 3 (3) 1L.Landau e E.Lifschitz, "Theorie du Champ", Editions Mir, Moscou 1966, Paragrafi 41 e 42. 2La formula perde senso se I=1/2, ma vedremo che in tal caso Q ≡0. ik =140= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove Q e' una costante che prende a sua volta il nome di momento di quadrupolo. Consideriamo un atomo con un solo elettrone ottico. L'orbitale dell'elettrone interagisce col campo del quadrupolo se corrisponde a sua volta ad una densita' di carica non sferica, il che esclude gli stati s. Cio' che caratterizza l'elettrone da questo punto di vista e' il suo momento angolare J, e l'Hamiltoniano di interazione H' deve essere uno scalare. Lo scriveremo nella forma C H' = JQ J (4) J(2J-1) i ik k dove C e' una costante di proporzionalita', e si somma su i e k. Poiche' [Ii ,Ik ]- = iεikm Im, possiamo scrivere 2 2 J i Ii Ik J k + J i Ik Ii J k - J 2 I2 = 2J i Ii Ik J k + J i (-i)εikm ImJ k - J2 I2 3 3 ; 2 ma εikm J i J k = (J∧J) m = iJm, e viene 2(I⋅J) 2+(I⋅J)- J2 I2. Ne 3 consegue la formula di Casimir 3 I⋅J[2I⋅J+1] -I2J2 2 H' = CQ . I(2I-1)J(2J-1) (5) Poiche' I⋅J = K/2, dove K=F(F+1) - I(I+1)-J(J+1), l'energia di interazione al primo ordine e' 3 K(K+1)-2I(I+1)J(J+1) CQ 2 ∆E = <JIFMF| H' |JIFMF >= . 2 I(2I-1)J(2J-1) (6) In una molecola, d'altra parte, un nucleo e' soggetto al potenziale elettrostatico V degli altri nuclei e degli elettroni, che puo' essere fortemente anisotropo. Ad esempio, se la molecola e' simmetrica intorno all'asse z , il campo elettrico sull'asse ha solo la componente Ez ; inoltre, e' facile convincersi che Ez ha un estremo sull'asse, e quindi ha derivate prime nulle rispetto a x e y. Allora, per la (2) l'interazione fra il quadrupolo e il potenziale e' descritta da ∂2V 3mI 2-I(I+1) Q zz∂2V H' = = Q , (7) 6 ∂z 2 ∂z 2 6I(2I-1) con m I =Iz. I nuclei di spin 1 , come 14N danno due livelli, mI =±1, mI =0; quelli di spin 3/2 , come 35Cl ne danno ancora due (m I =±3/2,1/2); i nuclei di spin 5/2 come 127 I ne danno tre, etc. Questi livelli possono essere osservati in esperimenti di risonanza (risonanza di quadrupolo elettrico nucleare), anche in =141= Prof. M. Cini -Corso di Fisica Atomica e Molecolare assenza di campo magnetico. Si puo' ottenere informazione sia sul nucleo che sul campo nell'intorno di un nucleo in una data molecola. 6-12 Effetto Overhauser Si tratta di un forte aumento dell'intensita' del segnale NMR, ottenuta saturando una transizione EPR. L'intensita' NMR e' proporzionale alla differenza N+- N- fra i numeri di spin nucleari su e giu' nel campione, e lo sbilanciamento e' molto piccolo, a meno di non andare a temperature estremamente basse, perche' i sottolivelli di spin sono prossimi in energia. Per accrescerlo, e quindi intensificare il segnale, c'e' pero' un'altra possibilita': indurre distribuzioni non termiche agendo sugli spin elettronici. In tal modo, possiamo costringere il sistema ad un equilibrio artificiale, in cui gli stati di spin dei nuclei sono separati da energie molto maggiori del solito. Consideriamo un sistema composto di uno spin elettronico 1/2 ed uno spin nucleare 1/2 in un campo magnetico. Se gli spin sono disaccoppiati, si hanno 4 stati, che in ordine di energia crescente (prendendo g N >0) sono β eα N , β eβ N , α eα N ,α eβ N . Poniamo il sistema in un bagno termico a temperatura T. I rapporti fra le popolazioni P dei quattro stati sono fissati dai fattori di Boltzmann: P(β eβ N )= e -2q P(β eα N ); P(α eα N )= e -2p P(β eα N ); P(α eβ N ) = e -2q-2p P(β eα N ), (1) gµBH gNµNH dove p= , q= . 2KT 2KT Se ci sono N sistemi, composti di uno spin elettronico e di uno spin nucleare, poniamo x= P(β eα N ) e determiniamolo imponendo che la somma sia N: le popolazioni assolute vengono N N e -2q P(β eα N)= ; P(β β )= , e N (1+e -2p )(1+e-2q ) (1+e -2p )(1+e-2q ) Ne-2p e-2p-2q P(α eα N)= ; P(α β )= N . e N (1+e -2p )(1+e-2q ) (1+e -2p )(1+e-2q ) Il numero totale di spin nucleari α e' 1 N+ = P(β eα N)+P(α eα N)=N ; 1+e-2q quello di spin nucleari β e' e-2q N- = P(β eβ N)+P(α eβ N)=N ; 1+e-2q quindi, gNµNH N+ = e2q = exp[ ] N KT =142= Prof. M. Cini -Corso di Fisica Atomica e Molecolare N+- N- =N 1-e -2q ≈Nq, 1+e-2q (2) essendo q<<1, e il coefficiente di assorbimento NMR e' piccolo. Qual'e' il meccanismo microscopico che fissa queste popolazioni? Esse sono mantenute da vari "processi di rilassamento", che inducono continuamente transizioni α e ↔ β e , α eβ N ↔ β eα N , etc, e, se sono lasciati indisturbati, garantiscono i rapporti di equilibrio fra le popolazioni. Succede di tutto. Ad esempio, si ricordera' che le transizioni α eβ N ↔ β eα N non possono ottenersi con lo scambio di un singolo fotone: tuttavia in molti materiali esse sono prodotte da processi di rilassamento molto rapidi. L'interazione di contatto puo' realizzare tali transizioni grazie ai termini in I+S- e in I- S+. Anche processi del tipo β eβ N ↔ α eα N sono possibili, e vengono indotti dall'interazione dipolare fra lo spin m.me (m.r)(r.me) elettronico e quello nucleare -3 3 r r5 (l'interazione dipolare e' nulla solo in media, su un orbitale s, ma ha termini proporzionali a Ix Sx ed a IySy ). Quello che importa e' che in equilibrio tutti i processi avvengano con la stessa velocita' media dei loro inversi. Se una popolazione eccede il suo valore di equilibrio, i processi che svuotano quello stato cominciano ad andare piu' veloci dei loro inversi, fino ad equilibrio ristabilito. Se ora saturiamo la risonanza di spin elettronico, inviando una intensa radiofrequenza gµBH, le popolazioni saranno modificate in modo che N'(β eα N)= N'(α eα N), N'(β eβ N)= N'(α eβ N). (3) αe β n α eα n RF rilassamento dipolare rilassamento di contatto β e βn β α e n Per determinare gli N' , supponiamo che l'unico processo di rilassamento importante sia l'interazione di contatto1. Esso si 1Studi di ioni in soluzione hanno evidenziato casi in cui occorre tener conto di meccanismi di rilassamento diversi da α eβ N ↔ β eα N, che richiederebbero una analisi piu' dettagliata: dovremmo =143= Prof. M. Cini -Corso di Fisica Atomica e Molecolare mettera' in un equilibrio dinamico, tale che α eβ N → β eα N e α eβ N ← β eα N avvengano con velocita' identiche. L'equilibrio dinamico richiede che il rapporto N ' (β eα N) = e2p+2q (4) N'(α eβ N) sia lo stesso che in equilibrio termico; allora la condizione di equilibrio termico N +/N- =e2q viene alterata. Infatti, per definizione N'+ N'(β eα N)+N'(α eα N) ≡ , N'N'(β eβ N)+N'(α eβ N) ma due termini al numeratore sono uguali fra loro in condizioni di saturazione, e anche i due termini al denominatore sono uguali fra loro; cosi' N ' (β eα N) N'+ = = e2p+2q. (5) N'N'(α eβ N) equilibrio β popolazioni basse α circa uguali Overhauser popolazioni basse β uguali α β α popolazioni alte uguali β α popolazioni alte circa uguali E' come se il momento magnetico nucleare fosse stato sostituito con la somma dei due momenti magnetici (nucleare ed elettronico). Poiche' N'+ +N'- =N, possiamo risolvere per le popolazioni e trovare che 1-e -2p-2q N'+-N'- =N ≈(p+q) N, 1+e-2p-2q (6) cosicche' la differenza fra le popolazioni risulta accresciuta di un fattore gµB p+q f= =1+ . q gN µN (7) Per un elettrone ed un protone, f=659, e di altrettante volte si intensifica il segnale nmr. Per esempio, il Na si scioglie in NH3 conoscere le velocita' dei processi di rilassamento α eβ N ↔ β eα N e dN'(β eα N) α eα N ↔ β eβ N, e scrivere equazioni "di rate" per , etc. dt =144= Prof. M. Cini -Corso di Fisica Atomica e Molecolare liquida formando una soluzione paramagnetica, cedendo l'elettrone di valenza che si delocalizza fra le molecole del solvente. Lo spin dell'elettrone sente l'interazione di contatto con i protoni dell'Ammoniaca e da' luogo ad effetto Overhauser; sperimentalmente, l'incremento del segnale e' di un fattore 400. L'effetto si osserva comunemente nei metalli. Capitolo 7- Il metodo di Hartree-Fock e il teorema del viriale Questo capitolo presenta il metodo di HF partendo dall'esempio piu' semplice - il problema dei due elettroni - per poi generalizzare a N; in conclusione sara' possibile capire quali aspetti del problema dei molti corpi sono contenuti nelle equazioni di HF, e quali no. Troveremo infine un risultato esatto. 7-1 Stato fondamentale dell'atomo di He; Consideriamo l'atomo di He, descritto nell'approssimazione non relativistica dall'Hamiltoniano modello 1 1 H= h1 + h2 + ; r12 (1) qui stiamo usando unita' atomiche , con e 2 =1, h / =1, ed indichiamo con hi l'Hamiltoniano "a un corpo" dell'elettrone iesimo; vale a dire, ∇i 2 Z + ; (2) 2 ri ∇ i deriva rispetto alle coordinate dell'elettrone iesimo, che si trova a distanza ri dall'origine. Vogliamo trovare una descrizione approssimata dello stato fondamentale usando il metodo variazionale. hi = - Questo metodo e' ben noto, e ci limiteremo a richiamarlo con alcune importanti osservazioni. 1)Sia φ la funzione d'onda del sistema ed η una funzione complessa arbitraria delle stesse variabili da cui dipende φ; sia α un parametro 1e' chiaro che stiamo trascurando, oltre agli effetti relativistici, altri piccoli effetti, come quelli del moto del nucleo. =145= Prof. M. Cini -Corso di Fisica Atomica e Molecolare complesso. La funzione d'onda e' normalizzata con N=<φ|φ>=1. La variazione dell'energia E=<φ|H|φ> che consegue da φ→φ+αη, al primo ordine in α, e' δE=α *<η|H|φ>+α<φ|H|η> + O(α 2), mentre δN=α *<η|φ>+α<φ|η> + O(α 2). La condizione che E sia un estremo, soggetta al vincolo che N=1, si puo' imporre con un moltiplicatore di Lagrange λ, scrivendo δ(E+λN)=0. Ne risulta che α *<η|H-λ|φ>+α<φ|H-λ|η>=0. Scegliendo α reale, ne concludiamo che <η|H-λ|φ>+<φ|H-λ|η>=0; scegliendolo immaginario puro, ne concludiamo che <η|H-λ|φ>-<φ|H-λ|η>=0; poiche' α e' del tutto arbitrario, occorre che sia <η|H-λ|φ>=0. Pertanto, {Hφ=Eφ, <φ|φ>=1} ⇔ {δ(E+λN)=0, λ=-E} ⇔ {δ(E)=0, col vincolo N=1}. Abbiamo un altro modo di scrivere l'equazione di Schro " dinger. Il principio variazionale vale per tutti gli autostati, ed il moltiplicatore di Lagrange e' l'autovalore dell'energia cambiato di segno. 2) Se variamo solo il bra, cioe ridefiniamo δE e δN con δE=α *<η|H|φ>, δN=α *<η|φ>, non commettiamo alcun errore, perche' la variazione del ket da' una informazione ridondante. Otteniamo lo stesso principio variazionale con meno algebra. Quindi la regola e': basta variare il bra. 3) Fin qui tutto e' esatto, e non c'e' niente che escluda gli stati eccitati. Pero' l'utilita' del metodo sta nella possibilita' di generare approssimazioni. Si sceglie una classe limitata di φ, e si cerca l'estremo entro quella classe. Allora, il minimo di E fornisce un'approssimazione all'energia dello stato piu' basso che non e' ortogonale ai φ della classe. Ma, anche se i veri autostati sono tutti ortogonali fra loro, la stessa proprieta' non e' garantita per le φ che corrispondono agli estremi in una classe limitata di funzioni. In certi casi (vedi metodo LCAO) tutti gli autostati approssimati sono ortogonali, ma il principio variazionale da solo non assicura che questo si verifichi. Quindi, in generale, siamo limitati allo stato piu' basso di ogni tipo di simmetria. Come funzione di prova, prendiamo un determinante di Slater che rappresenta due elettroni in un orbitale a(r), ovvero il singoletto Φ = \f(1,\r(2)) \b(\a( a(1)α(1) a(2)α(2) , a(1)β(1) a(1)a(2)[α(1)β(2)-β(1)α(2)] a(2)β(2) )) = 2 =a(1)a(2)χS, (3) senza alcuna restrizione sulla forma di a(r); cerchiamo cioe' la migliore soluzione determinantale. Calcoliamo E = <Φ|H|Φ> ; (4) poiche' l' autofunzione di singoletto χS e' gia' normalizzata a 1 e lo spin non figura in H, si ottiene E = <Φ|H|Φ> = <a(1)a(2)|H|a(1)a(2)> . =146= (5) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Dobbiamo richiedere δE=0 soggetto alla condizione N = <a|a>=1. Si ha: E =<a(1)|h(1)|a(1)> +<a(2)|h(2)|a(2)> + <a(1)a(2)| |a(1)a(2)>. (6) 1 r12 Ma i primi due termini coincidono ; inoltre, nei problemi variazionali basta variare il bra; cosi' otteniamo δE = 2<δa(1)|h(1)|a(1)> + <δa(1)a(2)| +<a(1)δa(2)| 1 |a(1)a(2)> = r12 1 |a(1)a(2)> + r12 1 |a(1)a(2)> , r12 dove l'ultimo passaggio e' solo un cambiamento di variabili. D'altra parte, variando ancora il solo bra, 2<δa(1)|h(1)|a(1)> + 2<δa(1)a(2)| δN = <δa|a> . Il metodo dei moltiplicatori di Lagrange porta alla condizione unica δE = ε δN dove ε ∫ e' appunto il moltiplicatore; possiamo scrivere δa* (1)h(1)a(1)d3r1 + ∫ ∫ δa* (1)a* (2) d3r1d3r2 =ε ∫ 1 a(1)a(2) r12 δa* (1)a(1)d3r1. Dal momento che δa e' arbitrario, deve aversi \X( h(1)a(1) + a(1) \i(,, )a * (2) \f(1,r12) a(2) d3r2 = ε a(1). ) (7) Con questa equazione di Hartree possiamo determinare l'orbitale a(r) che e' ottimale in senso variazionale. Essa e' della forma di una equazione di Schro "dinger; al potenziale del nucleo e' aggiunto il potenziale di Hartree =147= Prof. M. Cini -Corso di Fisica Atomica e Molecolare VH(r) = ∫ a * (2) (8) 1 a(2) d 3r2 r12 , di interpretazione fisica immediata: e' il potenziale elettrostatico dovuto alla densita' di carica |a|2, la distribuzione di carica media dell'altro elettrone. Usando una funzione variazionale ad un solo parametro Z della forma a(r) = Z3 -Zr π e si ottiene per l'atomo di He, com'e' ben noto, una energia di legame Eb=77.483 eV, contro il valore sperimentale Eb≈79.0 eV. Nell'equazione di Hartree non si e' imposta alcuna restrizione alla forma dell'orbitale, e i calcoli sono considerevolmente piu' complicati. Con metodi numerici, si ottiene alla fine Eb = 77.866 eV, con un miglioramento di soli 0.383 eV. Resta tutta da capire, a questo punto, una "energia di correlazione" di ≈ 1.1 eV (a parte piccole correzioni dovute ad effetti relativistici, alla massa finita del nucleo, etc.). Gli effetti di correlazione consistono nel fatto che la vera funzione d'onda non e' della forma determinantale; il potenziale dell'altro elettrone puo' solo approssimativamente essere sostituito da V H. Infatti, l'atomo di He e' descritto molto piu' accuratamente dalle funzioni d'onda non determinantali di Hylleraas. Queste sono funzioni d'onda bielettroniche della forma φ(s,d,r 12) = e-ks ∑ C(a,b,c)sadbr 12c abc dove s=r1+r 2, d=r1- r 2 ; si somma su molti esponenti a,b,c e si minimizza l'energia rispetto ai parametri variazionali C(a,b,c). La dipendenza da r12 e' un ingrediente essenziale del metodo, e consente di tener conto delle fluttuazioni di distanza fra i due elettroni. Tuttavia il numero di parametri variazionali cresce in modo proibitivo con il numero di particelle. Pur essendo meno preciso, il metodo di Hartree-Fock e' importante perche' e' piu' semplice e si presta molto meglio ad essere esteso a sistemi complicati. 7-2 Lo stato piu' basso dell'Ortoelio Come l'equazione di Schro"dinger ha infinite soluzioni in un dato potenziale, anche quella di Hartree ha infinite soluzioni "eccitate"; ma solo quella con ε piu' bassa corrisponde al principio di minimo. E' importante notare che non e' generalmente possibile ottenere gli stati eccitati =148= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dall'equazione di Hartree: solo stato piu' basso di ogni data simmetria e' un vero estremo. Le altre soluzioni, per essere accettabili, dovrebbero essere ortogonali al vero stato fondamentale ed agli stati eccitati sottostanti; ma questo in generale non si puo' garantire. Lo stato piu' basso di ogni data simmetria e' pero' ottenibile da un principio di minimo. Questo si applica anche allo stato 1s2s 3S, e per la componente con MS=1 possiamo usare un singolo determinante. Prendiamo quindi come funzione di prova Φ=[ a(1)b(2)-a(2)b(1) 2 ] α(1)α(2) . (1) Allora, E = <Φ|H|Φ> = <a(1)b(2)|H|a(1)b(2)> <a(1)b(2)|H|b(1)a(2)>. Imponendo <a|a>=<b|b>=1, E=<a(1)|h(1)|a(1)> + <b(2)|h(2)|b(2)> + <a(1)b(2)| 1 |a(1)b(2)> + r12 -{<a(1)|h(1)|b(1)><b(2)|a(2)> + <a(1)|b(1)><b(2)|h(2)|a(2)> + +<a(1)b(2)| }. 1 |b(1)a(2)> r12 Se inoltre supponiamo <a|b>=0, otteniamo semplicemente E=<a(1)|h(1)|a(1)> + <b(2)|h(2)|b(2)> + <a(1)b(2)| 1 |a(1)b(2)> + r12 -<a(1)b(2)| 1 |b(1)a(2)> ≡Ia+Ib+Cab -Eab . r12 Il problema variazionale e' δE=0, soggetto alle condizioni <a|a>=1, <b|b>=1. Avremo cosi' i moltiplicatori di Lagrange εa e εb.Noi non seguiamo il procedimento standard, in quanto non imponiamo la condizione <a|b>=0 con un altro =149= Prof. M. Cini -Corso di Fisica Atomica e Molecolare moltiplicatore di Lagrange; potremo farne a meno per ragioni che saranno evidenti nel seguito. Variando a, troviamo δE = <δa(1)|h(1)|a(1)> + <δa(1)b(2)| 1 |b(1)a(2)>, r12 δ<a|a> = <δa|a>. 1 |a(1)b(2)> + r12 -<δa(1)b(2)| Introducendo il moltiplicatore di Lagrange, abbiamo δ[Eεa<a|a>]=0, cioe' 1 ∫d31 δa* (1)h(1)a(1) + ∫d31 ∫d32 δa* (1)b* (2) r12 a(1)b(2) - ∫d31 ∫d32 δa* (1)b* (2) δa* (1)a(1). 1 b(1)a(2) = εa∫d31 r12 Poiche' δa e' arbitrario, 1 1 h(1)a(1) + a(1)∫d32 b* (2) b(2) -b(1)∫d32b* (2) a(2) r12 r12 =εaa(1) (2) Analogamente, variando b, otteniamo h(1)b(1) + b(1)\i(,,d32) a * (2) \f(1,r12) a(2) - a(1) 1 ∫d32 a* (2) r12 b(2) (3) =εbb(1). Queste sono le equazioni di Hartree-Fock per il problema in esame. Per spin paralleli si ha, oltre al potenziale di Hartree, anche un potenziale di scambio, non locale. Il potenziale di Hartree, o potenziale diretto, e' tale che Vd(x) a(x) = a(x) ∫dy |b(y)| 2 , |x-y| (4) =150= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e gia' lo abbiamo capito fisicamemte; quello di scambio e' piu' difficile da interpretare. Intanto, non e' un potenziale nel senso usuale, ma un operatore che da' Vex (x) a(x) = b(x) ∫dy b* (y)a(y) . |x-y| (5) Si dice che V ex e' un potenziale non locale perche' il secondo membro non dipende solo dal valore "locale" di a nel punto x. La sua origine sta nell' antisimmetria della funzione d'onda per scambi di fermioni e quindi non c'e' nessun analogo classico. Infatti, se fossimo partiti da un semplice prodotto non antisimmetrizzato, invece che da un determinante di Slater, avremmo ottenuto Vd ma non Vex . La verifica di questa affermazione nel caso dell'Ortoelio e' un esercizio immediato. Il procedimento che parte da un prodotto semplice e' il metodo di Hartree, ed e' stato anch'esso largamente applicato agli atomi con molti elettroni. Non perche' Vex e' meno intuitivo, il che non costituirebbe un vero problema, ma perche' il potenziale di scambio complica i calcoli in modo considerevole. Va notato che il metodo di Hartree non ignora del tutto il principio di Pauli, in quanto tale principio e' usato nel riempire gli orbitali (aufbau). Torniamo ora alla questione dell' ortogonalita' di a e b. Riprendiamo l'equazione di HF per a e moltiplichiamola scalarmente per |b>. b* (1)a(1)|b(2)|2 -|b(1)| 2b* (2)a(2) <b|h(1)|a> + ∫d31∫d32 = r12 εa<b|a>. L'integrale dall'aspetto formidabile e' nullo, come si vede scambiando 1 e 2 nel secondo termine. Quindi, <b|h(1)|a> = εa<b|a> e scambiando i ruoli di a e b, <a|h(1)|b> = εb<a|b>. Prendendo il complesso coniugato di quest'ultima, dal momento che h e' hermitiano, si ottiene =151= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <b|h(1)|a> = εb<b|a> e sottraendo questa dalla prima si trova. in perfetta analogia con l'equazione di Schro"dinger, 0=( εa - εb)<b|a>. (6) Gli orbitali che corrispondono ad autovalori diversi sono ortogonali; d'altra parte, in caso di degenerazione uno puo' sempre pensare di rimuoverla con un potenziale infinitesimo, ottenendo cosi' un set di orbitali ortogonali senza cambiare la fisica. Non importava, allora, usare un moltiplicatore di Lagrange apposta per garantire <b|a>=0. Consideriamo il prodotto scalare della equazione di Hartree-Fock per |a> con lo stesso orbitale |a>. Otteniamo 1 <a(1)|h(1)|a(1)> + ∫d31∫d32|a(1)|2|b(2)|2 r12 1 ∫d31∫d32a* (1)b(1)a(2)b* (2)r12 = εa , cioe' εa = Ia +Cab - Eab. (7) Analogamente, εb = Ib +Cba - Eba; (8) ma Cba =Cab , Eba =Eab , com'e' evidente dalle definizioni. Se vogliamo attribuire energie agli orbitali, le ε sono certamente possibili candidate, ma il concetto stesso di "energia di un orbitale " e' piuttosto vago e va usato con cautela nei problemi interagenti. Ad esempio, εa + εb = Ia + Ib + 2(Cab - Eab) ≠ E= Ia + Ib + Cab - Eab, quindi l'energia dell'atomo non e' la somma delle energie degli orbitali. Il significato fisico degli ε in questo modello e' piuttosto quello di potenziale di ionizzazione. Se da un atomo di He 1s2s 3S, di energia E= Ia + Ib + Cab - Eab togliamo l'elettrone b, dobbiamo sottrarre dall' energia sia Ib che Cab e -Eab ; in tutto, dovremo sottrarre giusto εb. Cio' che resta e' uno ione He+ in cui pero' l'altro elettrone continua ad avere l'orbitale a(x) adatto ad un atomo neutro. Sarebbe piu' realistico lasciare "rilassare" questo orbitale, che si trasformerebbe cosi' in uno stato idrogenoide. In conclusione, gli ε sono potenziali di ionizzazione =152= Prof. M. Cini -Corso di Fisica Atomica e Molecolare nell'approssimazione in cui gli orbitali rimangono "congelati" durante e dopo il processo di fotoionizzazione. Questo fatto e' noto come teorema di Koopmans., ed e' importante perche' significa che dopo tutto i calcoli Hartree-Fock una certa informazione sugli stati eccitati la contengono. Ma in realta' l'ipotesi degli orbitali congelati e' poco accurata. Ad esempio, un calcolo HF applicato allo ione Cu+,che ha tutti i gusci chiusi1, ha dato i seguenti livelli: Guscio 1s Autovalori di Koopmans Energia (a.u.) sperimentale 658.4 662.0 2s 82.3 81.3 2p 71.83 61.6 3s 10.65 1.6 3p 7.27 6.1 3d 1.6 0.71 Per gli orbitali profondi c'e' un accordo approssimativo, ma per il guscio piu' esterno l'errore supera il 100%. Mentre l'energia del vero stato fondamentale e' sempre piu' negativa di quella calcolata in approssimazione di HF, non c'e' alcuna relazione semplice fra gli autovalori ε ed i veri livelli del sistema. Questi ultimi non possono essere riferiti ad un orbitale, ma a stati ad N elettroni; quindi, una discussione adeguata esula dallo schema a particella singola, e si puo' ottenere da un fomalismo a molti corpi come quello delle funzioni di Green. Non si tratta nemmeno di complicare la teoria per avere valori piu' precisi dei livelli: in realta', se si migliora la risoluzione sperimentale, si scopre che i livelli non esistono piu'. Le righe spettrali sono risonanze, con una larghezza finita ed una struttura interna. Ne riparleremo. 7-3 Generalizzazione ad N elettroni 1La configurazione e' 1s 22s22p63s23p63d10 e tutti i gusci sono completamente occupati. Questo comporta che e' possibile scrivere per lo stato fondamentale una funzione d'onda di prova monodeterminantale con L e S corretti, ed il metodo di HF e' particolarmente adatto a questi casi. =153= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Non occorre impostare di nuovo il calcolo variazionale per generalizzare questi risultati. Ad esempio, per lo stato fondamentale di un atomo di Be (Z=4, configurazione 1s22s2) avremo da determinare i 4 spinorbitali u1s,σ e u2s, σ ottenuti dai due orbitali u1s e u2s. Tenuto conto che ciascun elettrone 'sente' il potenziale diretto di tutti gli altri elettroni e quello di scambio dovuto agli elettroni del suo stesso spin, u 1s e' dato dall'equazione di HF 2 p Z [2m + Vd1s(r) + 2V d2s(r) - V ex 2s(r) ]u1s(r)= ε1su1s, |r| (1) con il potenziale elettrostatico, locale, dovuto all'altro elettrone 1s, Vd1s(r) = ∫dr' |u1s(r')| 2 , |r-r'| l'analogo dovuto ai due elettroni nel 2s, ed il potenziale di scambio dovuto all'elettrone 2s di spin parallelo a quello considerato; quest'ultimo e' non locale, cioe' e' un operatore che agendo su una funzione f(r) da' Vex 2s(r) f(r) = u 2s(r) ∫dr' u2s(r') * f(r') . |r-r'| L'altra equazione e', evidentemente, 2 p Z [2m + 2Vd1s(r) + V d2s(r) - V ex 1s(r) ]u2s(r)= ε2su2s. |r| (2) Per lo stato fondamentale dell'atomo di Li (Z=3) possiamo scegliere arbitrariamente che l'elettrone spaiato 2s ha spin α. Questo comporta che l'equazione per l'orbitale 1s di spin α ha il termine di scambio, mentre per lo spin β lo scambio non c'e'. Per sistemi con gusci parzialmente occupati in generale le equazioni per uno stesso stato orbitale e spin opposti sono diverse, e quindi gli orbitali spaziali dipendono dallo spin. Tutto cio' si riferisce al metodo di HF nella sua forma generale, o, come si dice, "unrestricted", o "spin-polarized" HF. Infatti, per semplificare i calcoli e' stato spesso usato un metodo "Restricted HF", in cui si impone un unico orbitale per spin α e β assegnandogli un potenziale di HF mediato sugli spin. Nel =154= Prof. M. Cini -Corso di Fisica Atomica e Molecolare caso del Li, tale orbitale sentirebbe mezzo potenziale di scambio. Si noti che per Li nel metodo 'unrestricted' vi sono 3 orbitali diversi da determinare, contro i 2 del Be che ha un elettrone in piu'. I problemi con i gusci aperti sono sempre molto piu' duri. In generale, Φ sara' un determinante di Slater costruito con N spin-orbitali u 1σ , u2σ, ⋅⋅⋅⋅ dove uiσ ovviamente sta per uno dei due spinorbitali appartenenti all'orbitale i-esimo, con la proiezione z dello spin σ=±1/2. Vale l'immediata generalizzazione delle equazioni che abbiamo visto, che puo' essere ottenuta con considerazioni analoghe, compreso il teorema di Koopmans, etc. Per N generico, nell'equazione di HF per uno spinorbitale uν compare il potenziale diretto complessivo Vd(r) = ∑Vdµ(r) , µ (3) dove la somma e' su tutti gli spinorbitali; compare anche il potenziale complessivo di scambio, Vex (r) = ∑' Vex µ(r) µ (4) dove la somma ∑' µ include solo gli spinorbitali con lo spin parallelo a quello di ν; introducendo l'operatore di Fock p2 Z f=[ + Vd(r) - V ex (r) ] 2m |r| (5) l'equazione di HF assume la forma apparentemente semplice 1 (6) f uν (r) = εν uν . 1In effetti si ha un sistema di equazioni integrodifferenziali non lineari accoppiate che solo i moderni calcolatori possono trattare in modo virtualmente esatto, e limitatamente a sistemi atomici o comunque relativamente semplici. Non sfugga pero' l'enorme semplificazione che il metodo comporta rispetto alla soluzione dell'equazione di Schro "dinger. E' molto piu' facile trattare molte equazioni in poche variabili che una in molte variabili! =155= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Z + Vd(r) - V ex (r) si chiama |r| potenziale di HF; non si deve perdere di vista il fatto che si tratta di un operatore non locale. I contributi dello spinorbitale uν a Vd ed a Vex si cancellano automaticamente, Il potenziale totale VHF = - ∫dr' |uν (r')| 2 uν (r) - u ν (r) |r-r'| ∫dr' uν (r') * uν (r') =0, |r-r'| quindi un dato elettrone non interagisce con se stesso. Includendo questi contributi si ha il vantaggio che VHF si scrive allo stesso modo per tutti gli spinorbitali di un dato spin. VHF dipende funzionalmente dagli spin-orbitali uν occupati e deve essere determinato insieme a loro. Pero', supponiamo di avere risolto il problema, trovato il potenziale VHF, e costruito l'operatore di Fock f. Questo e' un particolare Hamiltoniano a particella singola, che descrive approssimativamente gli elettroni come se fossero del tutto indipendenti: ciascuno si muove nel potenziale autoconsistente, e lo stato a N corpi e' un determinante di Slater, come in assenza di interazioni. Se cerchiamo gli autostati di f, troviamo che N di loro, i piu' bassi in energia, coincidono ovviamente con gli uν . Ma ce ne sono infiniti altri, gli spinorbitali virtuali. Anche se V HF e' un potenziale non locale, dal punto di vista matematico questo e' un problema lineare agli autovalori, analogo all'equazione di Schro"dinger; pertanto, ci devono essere infinite altre soluzioni di f uν (r) = εν uν . Come interpretarle? Si potrebbe pensare che fossero stati di un elettrone aggiunto al sistema, ma di questo elettrone non c'e' traccia in VHF, e quindi tale interpretazione non e' soddisfacente. Si potrebbe sperare di usarli per costruire stati eccitati, ottenuti promuovendo un elettrone da uno spinorbitale occupato uν ad uno virtuale uλ . Ma il potenziale usato per trovare u λ e' calcolato in presenza dell'elettrone nello stato ν, e quindi non e' adatto allo scopo1. Si deve concludere che gli spinorbitali virtuali non hanno un significato fisico ben definito. 1Poiche' il potenziale nello stato eccitato del sistema e' diverso da quello dello stato fondamentale, la cosa migliore che possiamo fare e' riscrivere le equazioni di Hartree-Fock a partire dalla configurazione eccitata e risolverle ex novo. Tuttavia, proprio per il fatto che il potenziale e' diverso, il determinante di Slater cosi' ottenuto in genere non e' ortogonale allo stato fondamentale ed agli stati eccitati piu' bassi. Non esiste nel metodo di Hartree-Fock una soluzione soddisfacente al problema degli stati eccitati, =156= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per ogni spinorbitale uλ , potremo definire come nel caso dell'He p2 Z |u >, 2m |r| λ e per ogni coppia di spinorbitali c'e' un integrale coulombiano Iλ = <uλ | (7) 1 Cλµ = (u λ (1)uµ(2)| |uλ (1)uµ(2)), r (8) 12 ed uno di scambio, \B\lc\{(\S(Eλµ = (u λ (1)uµ(2)|\f(1,r12)|u λ (2)uµ(1)) se gli spin sono paralleli,,,Eλµ = 0 se gli spin sono antiparalleli.)) L'energia totale e', per il sistema di N elettroni, 1 (C λµ - Eλµ ); 2 ∑ λµ gli autovalori di Koopmans sono dati da EN = ∑ λ Iλ + (9) ελ = Iλ + ∑ ( C λµ - Eλµ ) = EN -E(λ)N-1 , (10) µ dove E(λ)N-1 si riferisce al sistema ionizzato nello stato λ, supponendo che tutti gli orbitali rimangano congelati. Gli spinorbitali che appartengono ad autovalori di Koopmans diversi sono ortogonali. 7-4 Significato fisico del termine di scambio: coesione di un metallo "semplice" In tutti i metalli, gli elettroni di conduzione schermano il campo elettrico degli ioni. Nell'Alluminio ed in altri metalli con bande di conduzione s e p, lo schermo e' cosi' efficace che il potenziale cristallino e' quasi piatto. Questi metalli si chiamano "semplici" perche' molte loro proprieta' si possono spiegare col modello degli elettroni liberi. Il modello di approssimazione zero (teoria di Sommerfeld) considera un gas di Fermi con N elettroni in N k F3 un volume V, con N e V molto grandi ma tali che = n = , dove V 3π 2 n e' la densita' di numero degli elettroni di conduzione nel metallo. Come e' noto, gli elettroni occupano tutti gli stati fino al livello di tranne che per gli stati piu' bassi di ogni simmetria; bisogna ricorrere alle teorie a molti corpi. E, d'altra parte, non c'e' nessuna osservazione che non produca eccitazioni reali, o almeno virtuali, nel campione. =157= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Fermi di energia EF= _ h 2k F2 2m , e la densita' di energia del gas di elettroni _ E 3 h 2k F5 = EF= V 5 10π 2m e' positiva, perche' gli elettroni hanno solo energia cinetica. In questo modello gli elettroni non sfuggono al metallo solo perche' sono contenuti in una "scatola". La vera natura della scatola e' ovviamente elettrostatica, ma la coesione di un metallo e' piu' difficile da capire di quella di un cristallo ionico, che si spiega anche classicamente. La teoria di Sommerfeld non basta. Il Jellium e' un ipotetico metallo in cui un "liquido" di Fermi, cioe' un gas di elettroni interagenti, e' neutralizzato da un fondo di carica positiva uniforme. In tal modo, gli effetti elettrostatici sono inclusi nella teoria, e la migliorano considerevolmente. Fra le questioni che possiamo cominciare a trattare in questo contesto, la piu' fondamentale e' appunto quella della coesione di un pezzo di metallo. E' evidente che, affinche' il metallo sia stabile, e' necessario che un elettrone sia attratto da esso, e quindi la sua energia al livello di Fermi sia piu' negativa che nel vuoto. Deve essere piu' negativa nonostante l'energia cinetica dovuta al principio di Pauli ed alla sfera di Fermi. Ma, pur facendo astrazione dalla struttura discreta di un metallo reale, questo modello e' cosi' complesso che non se ne conosce ancora la soluzione esatta. Esso e' un tradizionale banco di prova della teoria dei molti corpi, ed una costante sorgente di idee che poi vengono applicate ai calcoli realistici.Vediamo che cosa possiamo imparare dall'approssimazione SCF. Il metodo di Hartree descrive lo stato del Jellium con una funzione di prova prodotto Φ(1,2,⋅ ⋅ ⋅ ,N) = u1σ(r1) u 2σ(r2)⋅ ⋅ ⋅ uNσ(rN) (1) di N →∞ spin-orbitali ortonormali, determinati dalle equazioni p2 [2m +V+ Vd(r) ]uν (r)= εν uν (2) dove V e' il potenziale elettrostatico del fondo di carica uniforme. Le equazioni sono facilmente risolte grazie alla simmetria. Il sistema e' invariante per traslazioni, e noi vogliamo una soluzione spazialmente uniforme, quindi gli spinorbitali possono essere etichettati con k, e sono onde piane. Per spin su, ad esempio, scriveremo lo spinorbitale eik ⋅r ukα = α (3) V come se le interazioni non ci fossero. In tal modo, ogni spin-orbitale da' una densita' di carica uniforme, ed il potenziale diretto =158= Prof. M. Cini -Corso di Fisica Atomica e Molecolare complessivo V d(r) = ∑Vdµ(r) e' il potenziale Coulombiano generato µ da N cariche negative distribuite uniformemente nel volume V. Le equazioni sono soddisfatte, V+ Vd(r) ≡0, e gli elettroni rimangono con la sola energia energia cinetica, positiva. La risposta, poco realistica, e' che il metallo non puo' esistere. Il metodo di Hartree-Fock descrive lo stato del Jellium con una funzione di prova determinantale, e noi dobbiamo decidere la configurazione. Sapendo che i metalli semplici non sono ferromagnetici, decidiamo di cercare una soluzione non magnetica1 (lo stesso orbitale figura nel determinante con ambedue gli spin). Gli spin-orbitali sono determinati dalle equazioni di HF p2 [2m +V+ Vd(r) - V ex (r) ]uν (r)= εν uν . (4) La simmetria suggerisce che le soluzioni siano le stesse onde piane di prima, e verificheremo fra poco questo fatto. Quindi, V+ Vd(r) ≡0, e l'unico potenziale superstite e' quello di scambio Vex (r)= ∑' Vex k' (r), dove la somma e' estesa a tutti gli elettroni che k' hanno lo spin parallelo a quello considerato. Vex si ottiene al solito dall'espressione del termine diretto 1 Vd(r)u k (r) =u k (r) ∑ ∫dr' u (r')*uk' (r') |r-r'| k' k' operando il caratteristico scambio di funzioni. Viene Vex (r)u k (r) = ∑ uk' (r) k' = = ∑ k' 1 eik' ⋅r V3 ∑ V3 1 ∫dr' |r-r'| uk' (r')*uk (r')= 1 ∫dr' |r-r'| ei(k- k')⋅r' = eik' ⋅r ei(k- k') ⋅r ∫dr' 1 ei(k- k') ⋅(r'-r) = |r'-r| k' 4π 1 = eik ⋅r . (5) ∑ V3 k' |k'-k|2 Cosi' il termine di scambio va con e ik ⋅r , e la (4) diventa 4π eik ⋅r eik ⋅r p2 1 [2m ] = ε (k) ∑ V |k'-k|2 V V k' 1Soluzioni magnetiche delle equazioni di Hartree-Fock, note come "spin density waves", hanno per basse densita' n energie piu' basse di quella non magnetica. Il Cesio e' un metallo che ha un basso n e dovrebbe avere uno stato fondamentale magnetico. In realta' non ce l'ha, ma la questione e' complicata e non possiamo affrontarla qui. =159= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Le equazioni di Hartree-Fock sono soddisfatte dalle onde piane, come avevamo previsto. L'autovalore di Koopmans e' dato da _ 4π 4π 1 h 2k 2 1 3k' = ∫ d .(6) ∑ 2 3 2m V |k'-k| 2m (2π) k'<k |k'-k|2 k' F L' integrale e' immediato per k=0, e puo' essere calcolato analiticamente in coordinate polari, col risultato che1 ε(k) = _ h 2k 2 - _ h 2k 2 2e2 k - π k F F( ), (7) 2m kF 1 1-x 2 1+x F(x)= + ln| |. (8) 2 4x 1-x La funzione F(x) ha l'andamento a scodella rovesciata riportato in figura, ed a causa del segno - nella (7) possiamo pensare che l'elettrone si muova in una "buca" di potenziale nello spazio k. ε(k) = Il termine di scambio e' attrattivo, e questo fatto ha una semplice interpretazione fisica. Ciascun elettrone viaggia circondato da una regione di spazio (Fermi hole) in cui vi e' carenza di elettroni del suo stesso spin; l'interazione dell'elettrone con la carica positiva della Fermi hole produce l'attrazione. L' elettrone e la Fermi hole costituiscono insieme una quasi-particella, che si propaga con la la legge di dispersione (6), diversa da quella di un elettrone libero. Il Jellium e' stabile se un elettrone al livello di Fermi e' legato (ε(k F)<0). Che questo accada oppure no dipende dalla competizione fra il contributo negativo del termine di scambio e quello positivo dell'energia cinetica. L'esito della competizione dipende da kF, cioe' dalla densita' n del Jellium. E' chiaro dalla (7) che per densita' sufficientemente piccole (k Fa0<<1) l'attrazione prevale, e consente al metallo di esistere. Il fatto che per n crescenti finisca per prevalere la repulsione e' fisicamente corretto: non esistono metalli con kFa0>>1. 1vedi ad esempio Ashcroft-Mermin, Solid State Physics, Harcourt Brace College Publishers, Fort Worth (1976) ,Capitolo 17. =160= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La funzione F(x) ha una singolarita' logaritmica per x=1, dove la sua derivata diverge. Non esiste in realta' un comportamento patologico della legge di dispersione degli elettroni al livello di Fermi, e questa singolarita' scompare nella teoria a molti corpi. Nondimeno, il nostro semplice calcolo ci ha portato a risultati utili. Il termine di scambio rappresenta un importante contributo all'energia di coesione di un metallo reale, anche se, per una comprensione quantitativa del problema, e' sempre necessario includere gli effetti di correlazione. Si e' visto che Vex e' dell'ordine di kF, cioe' dell'ordine dell'inverso della distanza media fra gli elettroni. Per questo, in molti calcoli di molecole e solidi si usa al posto del termine di scambio il potenziale locale semiempirico proposto da Slater U Slater (r)= -2.95 [a03 n(r)] 1/3 Ry . (9) Questa estrapolazione dalla teoria del Jellium a quella di sistemi a densita' variabile e' un passo un po' azzardato, che pero' si e' rivelato utile per la semplificazione che consente in calcoli semiquantitativi. La teoria di Hartree-Fock del liquido di Fermi e' inadeguata da molti punti di vista, ma rimane un primo passo essenziale verso quella moderna. 7-5 Calcoli HF per gli atomi La configurazione dello stato fondamentale di ogni specie atomica, riportata sulle tabelle di Mendelejeff, e' quella che da' la minima energia col metodo di HartreeFock. Ogni calcolo con questo metodo, infatti, assume in partenza una data configurazione ed un dato insieme di numeri quantici dello schema LS (cioe' L2, Lz, S2, S z ). Si usa poi lo schema seguente, che porta ad una soluzione numericamente accurata delle equazioni autoconsistenti (vedi Figura). =161= Prof. M. Cini -Corso di Fisica Atomica e Molecolare u λ di prova V d , V ex Soluzione equazioni nuovi Nuovi V d u ,V λ ex no Autoconsistenza? si STOP Questa si chiama procedura SCF (=Self-consistent Field). Spesso in passato ci si doveva accontentare di soluzioni approssimate, anche per problemi come quelli atomici,che pure sono relativamente semplici (meno di 100 elettroni, elevata simmetria). Una prima semplificazione si ottiene usando lo schema Restricted HF, che prevede di mediare sullo spin. Un'altra suppone che VHF abbia simmetria centrale; allora, integrando sugli angoli le equazioni integrodifferenziali, si ottengono equazioni solo radiali, le cui soluzioni Rnl (r) sono indipendenti da ml e da ms. Tutti gli spinorbitali di un dato l hanno cioe' la stessa funzione radiale, e si distinguono per l'armonica sferica e la funzione di spin. Ambedue queste ipotesi, o "restrizioni di equivalenza", sono pero' pienamente giustificate solo per atomi di gas nobile; in generale VHF non e' rigorosamente centrale, anche se la deviazione e' sempre piccola. Soluzioni praticamente esatte dei problemi atomici si possono ottenere anche usando funzioni di prova uλ con un numero adeguato di parametri variazionali e minimizzando <H>. Nei calcoli atomici si usa spesso la seguente forma funzionale per gli orbitali spaziali: =162= Prof. M. Cini -Corso di Fisica Atomica e Molecolare nmax (1) ∑ c (i) n L χ(i) nLm (x), i=1 dove i χ sono i cosiddetti STO (=Slater-type orbitals) uLmn = χ (i) nLm (x)=Nn rn-1 e-Z i r YLm (θ,φ), (2) i c (i) e gli Zi sono parametri variazionali ed il fattore di normalizzazione si trova elementarmente, Nn = (2Z i ) n+1/2 . (3) (2n!) L'uso delle armoniche sferiche implica che V HF viene considerato come un potenziale centrale. Come abbiamo visto, questo e' rigoroso solo per gusci chiusi, ma e' generalmente una buona approssimazione. Clementi e Roetti hanno pubblicato nel 1974 una vasta tabulazione di orbitali per atomi ed ioni della prima meta' del sistema periodico. Cosi' si dispone di attendibili funzioni d'onda HF analitiche. 7-6 Calcoli HF molecolari-equazioni di Roothaan Nei calcoli molecolari manca la simmetria centrale del caso atomico e non conviene tentare di risolvere le equazioni di HF in quanto equazioni integro-differenziali. Il metodo che si usa si basa sull'espansione in orbitali atomici, generalizzando l'approccio LCAO. Consideriamo una molecola, e supponiamo per ora che abbia una configurazione a gusci chiusi (2n elettroni in n orbitali). Giova convertire le somme sugli spin-orbitali in somme sugli orbitali molecolari spaziali φj e riscrivere cosi' le equazioni di HF nella forma occ φi * (y)φi (y)φj (x) φi * (y)φi (x)φj (y) h(x)φj (x) + ∑ [2 ∫d3y - ∫d3y |x-y| |xi y|)] = εj φj (x). (1) dove h include il termine cinetico e l'interazione coi nuclei. Espandiamo gli orbitali molecolari in orbitali atomici spaziali ψµ centrati sui vari atomi che compongono la molecola; li ordineremo in modo arbitrario e li =163= Prof. M. Cini -Corso di Fisica Atomica e Molecolare etichetteremo con indici greci, riservando quelli latini agli orbitali molecolari. Sostituendo φj (x) = ∑ ν c νj ψν (x) (2) nelle equazioni di HF otteniamo \i\su(ν, , ) cνj h(x) ψν (x) + \i\su(i,occ, )[2 ψν * (y)ψλ (y)ψσ(x) ∑ c νi * c λi c σj ∫d3y |x-y| νλσ (3) - ∑ c νi * c λi c σj νλσ ∫ ψν * (y)ψλ (x)ψσ(y) 3 d y ] |x-y| = εj ∑ c νj ψν (x) ν . Gli orbitali molecolari sono ortogonali, ma quelli atomici centrati su atomi diversi avranno overlap Sµν ; dovra' quindi aversi (φi ,φj ) = ∑ c µi * c νj Sµν = δij . µν (4) Moltiplicando scalarmente la (3) per un orbitale atomico ψµ, si ha ∑ ν c νj hµν + occ ∑ [2 i ∑ νλσ ψν * (y)ψλ (y)ψµ* (x)ψσ(x) c νi * c λi c σj ∫d3x∫d3y |x-y| ψν * (y)ψµ* (x)ψλ (x)ψσ(y) - ∑ c νi * c λi c σj ∫d3x∫d3y ] = εj ∑ |x-y| νλσ ν c νj Sµν . Le nostre incognite sono c νj e εj , mentre sappiamo calcolare ψν * (y)ψλ (y)ψµ* (x)ψσ(x) = (νλ | µσ), |x-y| ∫d3x∫d3y (5) =164= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ν µ y = (νλ|µσ) x λ σ che sono integrali coulombiani fra orbitali noti, e anche gli integrali di scambio ∫ ∫ d3x ψν * (y)ψλ (x)ψµ* (x)ψσ(y) 3 d y |x-y| = (νσ | µλ). (6) L' equazione di HF per l'orbitale molecolare j diventa ∑ ν c νj hµν + occ ∑ [2 i ∑ c νi * c λi c σj (νλ | µσ) νλσ - ∑ c νi * c λi c σj (νσ | µλ)] = εj ∑ c νj Sµν (7) νλσ µ ed invece del sistema di equazioni integrodifferenziali abbiamo un sistema infinito di equazioni nonlineari agli autovalori. Per vedere il nesso col metodo LCAO, eseguiamo formalmente la somma su i introducendo la matrice densita' occ Pµν = 2 ∑ c µi * c νi ; i (8) e' ovvio dalla definizione che la densita' totale ρ(x) = occ ∑ i φ* i (x)φi (x) si puo' scrivere in termini di orbitali atomici come P µν ψµ(x)ψν (x), donde il nome. Riscriviamo ∑ µν l'equazione per l'orbitale molecolare j: =165= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∑ ν c νj hµν + 1 [ ∑ Pνλ c σj (νλ | µσ) ∑ Pνλ c σj (νσ | µλ)] = 2 νλσ νλσ = εj ∑ c νj Sµν . ν (9) E' chiaramente vantaggioso ruotare gli indici muti con σ→ν , ν→λ, λ→σ , affinche' il coefficiente c figuri sempre essere cνj ; difatti, si ottiene ∑ ν c νj hµν + 1 [ ∑ Pλσ c νj (λσ | µν) ∑ Pλσ c νj (λν | µσ)] = 2 νλσ νλσ = εj ∑ c νj Sµν , ν (10) e cioe' l'equazione di Roothaan, ∑ [ Fµν - εj Sµν ] c νj =0. ν (11) Questa equazione ha l'apparenza di un problema lineare simile a quello che si incontra nel metodo LCAO; ma in realta' la matrice di Fock 1 Fµν = hµν + ∑ Pλσ (λσ | µν) (12) ∑ Pλσ (λν | µσ) , 2 λσ λσ che possiamo anche scrivere con ideogrammi1, λ F = h + µν µν Σλσ P λσ{ µ λ µ ν σ − 1/2 σ ν } dipende (quadraticamente) dai coefficienti c, ed e' necessaria una soluzione iterativa. In linea di principio, se l'espansione usasse un set completo di stati, si otterrebbe la soluzione esatta delle equazioni di HF; in pratica si usano set troncati. Quelli piu' usati sono: 1Si noti che in letteratura si incontrano vari modi diversi di scrivere i risultati di questo paragrafo, in seguito a convenzioni diverse. =166= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1) "minimal basis " che comprende tutti gli orbitali di tutti gli atomi fino a quelli di valenza compresi. 2)"extended basis " in cui si aggiungono quelli di un guscio vuoto. 3) "valence basis " in cui si omettono quelli di core. Consideriamo infine una molecola con un guscio aperto; tali sono necessariamente tutte quelle con un numero dispari di elettroni, come NO, O2+, etc. Si puo' anche pensare ad una configurazione del tipo ↓ ↓ ↓ che si incontra nei complessi di certi metalli di transizione1. E' essenziale un trattamento "unrestricted" se si vogliono capire le proprieta' magnetiche o interpretare spettri EPR o NMR. Ma il metodo in cui gli orbitali possono dipendere dallo spin e' superiore anche nel caso di gusci chiusi. Ad esempio, nel metodo "restricted" in cui due elettroni di spin opposto sono obbligati ad avere lo stesso orbitale spaziale, le molecole si dissociano in modo sbagliato: al crescere delle distanze interatomiche non si ottengono atomi separati. Separando i due H in una molecola di Idrogeno, nel metodo "restricted" si ottengono due H ciascuno dei quali ha mezzo elettrone di spin ↑ e mezzo di spin ↓. La risposta giusta e' che ciascun H avra' un elettrone ed uno spin elettronico 1/2. Ci sono ovviamente due soluzioni diverse, degeneri in energia, in ciascuna delle quali gli orbitali molecolari tendono verso orbitali atomici. Ma per ottenere questo occorre il metodo "unrestricted". Supponiamo che ci siano p elettroni di spin α e q>p elettroni con spin β. Nel metodo "unrestricted", gli orbitali molecolari spaziali dipendono anche dallo spin e noi dovremo distinguere φα i e φβi ; il determinante polarizzato in spin sara' del tipo2 |φα 1α φβ1β φα 2α φβ2β⋅⋅⋅⋅⋅⋅ φβq-1 β φβqβ| . In generale un tale determinante non e' autostato di S2, perche' di determinanti ne occorrerebbero piu' di uno. Poniamo pero' che lo sia. Nulla di concettuale cambia rispetto al caso dei gusci chiusi; scriveremo le equazioni di HF in termini di somme sugli orbitali spaziali φαj e φβj 1Gli spin si polarizzano perche' c'e' un guadagno di energia elettrostatica. Incontreremo questi complessi nel Capitolo 10. 2Usiamo una notazione abbreviata, indicando gli spinorbitali nell'ordine in cui compaiono sulla diagonale principale del determinante. =167= Prof. M. Cini -Corso di Fisica Atomica e Molecolare tenendo conto di quali stati sono occupati nella configurazione considerata. Lo sviluppo degli orbitali spaziali in orbitali atomici , che potranno di per se' essere diversi per i due spin o no, sara' fatto separatamente per i due spin, φαj (x) = ∑ ν c νj (α) ψν (x) φβj (x) = ∑ ν c νj (β) ψν (x). ed avremo densita' di elettroni di spin su e giu' ρ α(x) = ρ β(x) = p ∑|φαi (x)| 2 i=1 q ∑|φβi (x)| 2 = P µν (α)ψµ(x)ψν (x) , ∑ µν (13) = P µν (β)ψµ(x)ψν (x) , ∑ µν (14) i=1 dove si sono introdotte le matrici densita' polarizzate in spin, p q Pµν (α) = 2 ∑ c µi (α)* c νi (α) , Pµν (β) = 2 ∑ c µi (β)* c νi (β) . (15) i i Naturalmente, la matrice densita' totale e' Pµν = Pµν (α) +Pµν (β) , (16) ma in piu' potremo considerare anche la "spin density function" ρ spin (x) = ρ α(x) - ρ β(x) (17) e la "spin density matrix" ρ spin µν = Pµν (α) - Pµν (β) . (18) Considerazioni analoghe a quelle svolte portano alle equazioni di Roothaan per gusci chiusi; esse si sdoppiano, rimanendo accoppiate, ∑ν ∑ ν [ F µν (α) - εj (α)Sµν ] c νj (α) = 0 [ F µν (β) - εj (β)Sµν ] c νj (β) = 0 e si hanno gli operatori di Fock =168= , (19) Prof. M. Cini -Corso di Fisica Atomica e Molecolare F µν(α)= h µν+ λσ ∑ {P λσ ( λσ F (β)= h + ∑ {P ( λσ | µν µν λσ λσ | µλ) - P λσ (α) ( λν | σµ)] µν) - Pλσ (β) (λν | µσ)]))(20) dove in luogo del fattore 1/2 davanti al termine di scambio abbiamo il computo dettagliato degli stati occupati fatto nella (15). Una difficolta' pratica grave del metodo e' il calcolo degli integrali del tipo (λσ | µλ). Anche tenendo conto di varie simmetrie che li legano, il loro numero cresce con la quarta potenza del numero degli orbitali atomici. Per questo sono stati proposti e largamente usati i popolari metodi semiempirici (Extended Huckel, CNDO, etc.) in cui essi sono sostituiti con parametri aggiustabili, o trascurati. Anche i modelli non "ab initio" sono utili, purche' adoperati con senso fisico. 7-7 Successi e limiti del metodo di HF Che progresso abbiamo fatto nella soluzione del problema dei molti elettroni? Facciamo il punto della situazione. 1)-Vantaggi del metodo di HF Un problema con N elettroni interagenti e' formidabile per il grande numero di variabili indipendenti. Nell'approssimazione di HF uno deve risolvere N problemi ad elettrone singolo, accoppiati. Benche' anche questo sia complicato, e' pur sempre incommensurabilmente piu' semplice del problema originario. Si tratta in definitiva di un modo per separare approssimativamente le variabili. L'approssimazione di HF e' interamente quantistica, cioe' non contiene approssimazioni semiclassiche come ad esempio il metodo di Thomas-Fermi; inoltre tratta correttamente la simmetria di permutazione. Inoltre, soddisfa esattamente il teorema del viriale per lo stato fondamentale (vedi il paragrafo 8). L'energia di correlazione, definita come la differenza rispetto all'energia dello stato fondamentale esatto dell'equazione di Schro"dinger, e' relativamente piccola (tipicamente dell'ordine del %.) Quasi sempre, i livelli a particella singola (autovalori di Koopmans) predetti dai calcoli HF possono essere =169= Prof. M. Cini -Corso di Fisica Atomica e Molecolare osservati sperimentalmente nelle spettroscopie di atomi e molecole. Ad esempio, gli spettri di raggi X emessi dagli atomi mostrano righe che corrispondono a transizioni elettroniche fra i livelli. Di solito, la teoria predice anche l'ordine corretto dei livelli sulla scala delle energie. Benche' il principio variazionale garantisca in primo luogo le energie degli stati a cui puo' essere applicato, anche le funzioni d'onda di Hartree-Fock sono molto utili per calcolare i piu' svariati osservabili con un buon livello di affidabilita'. Ad esempio, i fattori di forma atomici (essenzialmente, le densita' di carica) sono in buon accordo con quelli dedotti dalla diffusione di raggi X dai cristalli. 2)- Problemi , limitazioni, cautele, estensioni Il metodo ignora gli effetti relativistici. L'estensione relativistica sara' discussa nel seguito, e non e' affatto ovvia. Sarebbe concettualmente sbagliato attribuire una realta' fisica all' orbitale di un elettrone singolo in un sistema di molti elettroni. Anche se la funzione d'onda fosse adeguatamente approssimata da un determinante di Slater Φ, questo non vorrebbe dire che ciascun elettrone ha realmente uno spinorbitale ben definito in cui muoversi. Si puo' prendere una combinazione lineare degli orbitali (trasformazione unitaria) tale che Φ rimanga immutato1. Cosi', tutti gli orbitali cambiano senza che cambi la fisica. Analogamente, non esistono in realta' livelli a particella singola in un sistema interagente, ma solo energie di eccitazione di tutto il sistema nel suo complesso. Queste energie possono essere piu' o meno ben definite, ma aumentando la risoluzione sperimentale si scopre sempre che le righe spettrali non sono picchi discreti, ma hanno un andamento continuo e struttura interna. Ci sono anche molti problemi in cui gli effetti di correlazione giocano un ruolo decisivo, come nella teoria degli elettroni di conduzione dei metalli ed in quella del magnetismo. Gli errori sulle energie di legame possono bene essere dell'ordine degli eV; per elettroni di valenza tali errori sono grandi, in quanto sono confrontabili con le energie dei legami chimici. In presenza di gusci aperti, non basta in generale un solo determinante di Slater per rappresentare una autofunzione di L2,S2,J2 e J z. Per esempio, uno stato di 1in conseguenza della relazione det(AB) = det(A)det(B). =170= Prof. M. Cini -Corso di Fisica Atomica e Molecolare singoletto ottenuto con due elettroni in orbitali diversi richiede due determinanti. Occorre allora estendere il metodo a Φ multideterminantali. Benche' non ci sia nulla di nuovo sul piano concettuale, i calcoli si complicano. Un metodo per farlo in modo piu' efficiente e' stato inventato da Lowdin e si chiama "Extended HF". Supponiamo di voler calcolare lo stato fondamentale |LSJJz> di un atomo, conoscendo i suoi numeri quantici. Possiamo sempre costruire un operatore O che proietta sui numeri quantici LSJJz, cioe', che manda a zero le componenti di uno stato con numeri quantici diversi. In effetti, O puo' essere costruito con pure considerazioni di simmetria. Ad esempio, 1 0 per uno spin 1/2, O= 0 0 proietta sulla componente di spin su. Allora, se D denota il generico deteminante; O |D> e' una combinazione lineare di determinanti, con numeri quantici LSJJz, i cui coefficienti sono determinati dalla simmetria e non dal principio variazionale. "Extended HF" usa il principio variazionale "mirato" <D| O †HO |D> δ =0. <D| O |D> [ ] Questo semplifica molto il problema computazionale, anche se complica il formalismo. L'applicazione a stati eccitati (che non siano i piu' bassi della loro simmetria), partendo da funzioni determinantali fatte con spinorbitali eccitati, puo' dare talora risultati utili. Pero' un tale calcolo e' delicato, come in tutti i metodi variazionali. Lo stato eccitato dovrebbe essere scelto in un sottospazio ortogonale a quello che contiene lo stato fondamentale e gli stati eccitati sottostanti, e questo non si ottiene automaticamente. Non sempre i livelli predetti da calcoli HF si trovano nelle spettroscopie di atomi e molecole, e non sempre l'ordine e' corretto: per esempio, nel caso di N2 viene sbagliato. 7-8 Interazione di configurazioni(CI) C'e' un modo ovvio per migliorare sistematicamente la teoria rispetto al metodo di HF : mescolare molti determinanti D, ponendo Φ ∝ D0 + ∑ k C k Dk , =171= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove D0 e' la soluzione HF e i D k possono essere ottenuti da D0 "promuovendo" elettroni a nuovi orbitali ortogonali a quelli occupati. Per esempio, si possono usare gli spinorbitali virtuali; l'equazione di HF per stati eccitati, anche se non puo' avere un significato fisico diretto, funziona almeno da "generatore di orbitali" . Va da se' che i numeri quantici dovranno essere gli stessi per tutti i determinanti considerati. Supponiamo di avere una molecola con N elettroni in gusci chiusi, per cui l'approssimazione zero e' un singolo determinante, e di avere risolto le equazioni di Roothaan per 2K spinorbitali, con 2K>N. Con essi, possiamo formare in generale un grande numero di determinanti con cui n elettroni sono promossi ad orbitali virtuali. Possiamo N scegliere gli spinorbitali di partenza in (n ) modi, e quelli di 2K-N arrivo in ( n ) modi; quindi il numero totale di eccitazioni N 2K-N n-uple e' (n )( n ). Anche per molecole piccole e per set di base non troppo grandi tale numero e' enorme eccetto per n=0,1. E' ben vero che molti dei determinanti possono essere eliminati in quanto non hanno i numeri quantici dello stato fondamentale; tuttavia la crescita del loro numero con K e con n e' disastrosa. Inoltre, non basta certo considerare i soli determinanti con n =1, in cui cioe' un solo elettrone e' promosso; anzi, se prendiamo il determinante | ψaψbψc ⋅⋅⋅ψn | e formiamo una combinazione lineare del tipo | ψaψbψc ⋅⋅⋅ψn | + γ | ψpψbψc ⋅⋅⋅ψn | in cui ψp e' l'orbitale virtuale, e γ un coefficiente variazionale, non facciamo alcun progresso. Infatti, | ψaψbψc ⋅⋅⋅ψn | + γ | ψpψbψc ⋅⋅⋅ψn | = | (ψa+γψp)ψbψc ⋅⋅⋅ψn | ; quindi, se siamo partiti gia' dal migliore determinante, il valore ottimale e' γ=0. Immaginiamo di intraprendere un calcolo variazionale con una funzione di prova | ψaψbψc⋅⋅⋅ψ n| + γ | ψpψbψc⋅⋅⋅ψ n| . Otterremmo un'equazione secolare, e fuori diagonale avremmo l'elemento di matrice di H fra i due stati che vogliamo mescolare. Abbiamo visto che deve risultare γ =0, e possiamo concludere che l'elemento di matrice di H fra lo stato fondamentale HF e gli stati con n=1 e' nullo (teorema di Brillouin). =172= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Bisogna quindi considerare gli stati con almeno due elettroni promossi, n≥2. Quale valore di n e' adeguato? Purtroppo i risultati di tali CI "troncati" peggiorano molto rapidamente con l'aumentare delle dimensioni della molecola, perche' le energie delle eccitazioni virtuali decrescono. Finora sono stati fatti calcoli CI molto accurati di molecole come H2, BeH2, H 2O; questo da' una idea di quello che attualmente si puo' fare con questo metodo "brute force". Quello dei molti corpi non e' solo un problema solo computazionale. 7-9 Risultati esatti: teoremi del viriale e di Hellmann-Feynman Teorema del Viriale. E' ben noto che per una particella di Schro"dinger in un potenziale V vale il teorema del viriale <2T> = <r⋅∇V>. Questo risultato ammette una interessante generalizzazione. Consideriamo un sistema di q particelle (elettroni e nuclei) in interazione coulombiana, descritti dall'Hamiltoniano non relativistico H=- q ei ej 1 q ∇i 2 +∑ ∑ 2 m r i=1 i i<j ij q ei ej ∂2 1 q 1 3 + , (1) ∑ ∑ ∑ 2 mi ∂xαi 2 rij i=1 α=1 i<j dove l'indice α corre sulle coordinate cartesiane. Supponiamo di conoscere la funzione d'onda Φ({x αi }) dello stato fondamentale1. Consideriamo la famiglia di funzioni Φ({ηxαi }), dove ogni coordinata e' moltiplicata per uno stesso fattore di scala η; ovviamente, per η=2 la funzione d'onda e' 'contratta' di un fattore 2. Dovremo normalizzare di nuovo le funzioni 'riscalate', e considerare Φη = η3q/2Φ({ηxαi }), (2) in modo che ≡ - ∫ η3q/2Φ({ηxαi })* η3q/2Φ({ηxαi })d3qr = 1Oltre che dalle coordinate, essa dipendera' anche dagli spin, ma qui non ci interessa come. =173= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = ∫ ∫ Φ({ηxαi })* Φ({ηxαi })d3q(ηr) = Φ({x αi })* Φ({x αi })d3q(r)=1, q ∏ d x i dyi dzi . Come scala con η l'energia i cinetica? Indichiamo con <T> (η) quella calcolata con Φη. Si ha: dove d3qr sta per <T>(η) ≡<Φη|T|Φη> = η3q ∫ Φ({ηxαi })* [- ∂2 1 q 1 3 2 ∑ mi ∑ ∂xαi 2 i=1 α=1 ]Φ({ηxαi })d3qr= = η2 ∫ Φ({ηxαi })* [- ∂2 1 q 1 3 ]Φ({ηxαi })d3q(ηr) ∑ ∑ 2 mi ∂(ηxαi ) 2 i=1 α=1 = = η2<T>(1) . Analogamente, (3) q ei ej q ei ej <V>(η) ≡<Φη| ∑ |Φη> = η<Φη| ∑ |Φ > = η <V>(1) rij (ηrij ) η i<j i<j . (4) Quindi, <H> (η) = η2<T>(1) + η <V>(1) . (5) Se consideriamo η come un parametro variazionale, otteniamo la condizione di minimo 2η<T>(1) + <V>(1) =0, (6) <V>(1) quindi l'optimum e' η = . Ma η=1 e' gia' 2<T>(1) l'optimum, perche' Φ e' lo stato fondamentale esatto; questo prova il teorema del viriale. Si tratta di uno dei pochi risultati esatti che si conoscono per sistemi di molte particelle interagenti. Il vero stato fondamentale di Hartreefock soddisfa il teorema del viriale, ed un calcolo autoconsistente approssimato puo' essere migliorato "riscalandolo". La soluzione esatta, rispetto a quella di =174= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Hartree-Fock, ha energia piu' bassa: in effetti, <T> e' piu' alta, ma questo e' piu' che compensato dall'abbassamento di <V>, perche' gli elettroni, eseguendo moti piu' complicati, trovano il modo di respingersi di meno. L'argomento precedente richiede che noi disponiamo di una Φ({x αi }) che dipende dalle coordinate degli elettroni e dei nuclei: lo stesso η si applica alle funzioni d'onda degli elettroni ed alle distanze internucleari. In pratica, noi dovremo usare approssimazioni che trattano i nuclei in modo diverso. Nello spirito dell'approssimazione di BornOppenheimer, i nuclei sono di massa infinita e di energia cinetica nulla, ma sono trattati come parte integrante del sistema in interazione coulombiana. Esercizio. Calcolare <T> per lo stato fondamentale di H2+ nel modello LCAO. Soluzione L' orbitale molecolare pari, che corrisponde allo stato fondamentale, e' espresso in termini di quelli atomici φ a,b e del loro overlap da 1 φ+ = (φ a + φ b) ; 2+2S <φ a|T|φ a> + <φ a|T|φ b> <T> = ; 1+S ma <φ a|T|φ a> = |E(1s)| = 1/2 a.u., per il teorema del viriale (per 1 particella); inoltre, moltiplicando scalarmente per φ b l'equazione 1 Tφ a φ = E(1s) φ a ra a 1 si ha che <φ b|T|φ a> = E(1s)S + K, dove K = <b| |a>; quindi ra 1 1-S + 2K <T> = . 2 1+S R2 Usando K = (1 + R )e-R , S=e-R [1+R+ ], dove R e' la distanza 3 internucleare, si ottiene infine 1 1+ e -R ( 1 + R - R 2/3) . 2 1+ e -R ( 1 + R + R 2/3) Con la distanza di equilibrio Req =1.32 Å = 2.495 a.u. che si ottiene minimizzando l'energia nel modello LCAO si ottiene <T> = 0.3827 a.u. <T> = Esercizio. Calcolare, indipendentemente, anche <V>, inclusa la repulsione fra i nuclei. Soluzione 1 1 <φ a + φ b| + |φ a + φ b> r r 1 a b <V> = = R 2+2S 1 = R <φ a | 1 1 + |φ + φ b> ra rb a 1 1 + J + 2K = , 1 + S R 1+S =175= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 1 - ( 1 + R ) e -R |φ a> = . rb R Sostituendo si trova dove J = <φ a| <V> = 1 R 1 + 2(1+R)e -R 1 1 + - ( +1)e -2R R R 1+ e -R ( 1 + R + R 2/3) = - 0.94758 a.u. Dagli esercizi precedenti risulta che nel modello LCAO E = <T> + <V> = - 0. 56844 a.u. il che corrisponde ad una energia di legame EB = 0. 06844 <V> a.u. = 1.76 eV. Inoltre, = -1.238, e il modello non e' 2<T> ottimale. Dunque, seguendo Finkelstein e Horowitz che discussero la questione nel 1928, riscaliamolo con η = 1.238, e ne otterremo uno migliore. Allora Req si contrae, e diventa 1.32/1.238 = 1.066 Å, <T> viene moltiplicato per 1.2382 , e <V> per 1.238. Abbiamo ottenuto un grande miglioramento con pochi calcoli. Req Eb Non scalato 1.32 Å 1.76 eV Scalato 1.066 Å 2.354 eV Esatto 1.06 Å 2.791 eV Nell'approssimazione di Born-Oppenheimer, si pone anche il problema di determinare lo stato fondamentale di una molecola biatomica in funzione della distanza internucleare R, presa come parametro. Anche in questo caso, la famiglia di funzioni di prova prevede un riscalamento generale; la differenza e' che nelle equazioni (3,4,5) si mediava anche su R, mentre ora R e' un parametro fisso, quindi la funzione di prova φη = η3N/2φ({ηri },ηR) e' normalizzata tenendo conto del numero N degli elettroni; inoltre, i valori medi dipendono fuzionalmente da ηR. Di conseguenza, indicando in parentesi quadra il valore della distanza internucleare, <T[R]>(η) = η2<T[ηR]>, (7) (η) <V[R]> =η<V[ηR]>, (8) e l'energia dello stato fondamentale con la funzione d'onda elettronica riscalata e' E[R](η) =η2<T[ηR]>+η<V[ηR]>. (9) Minimizzando rispetto al parametro variazionale η troviamo =176= Prof. M. Cini -Corso di Fisica Atomica e Molecolare d d d E[R](η) =2η<T[ηR]>+η2R <T[ηR]>+<V[ηR]>+ηR <V[η dη d(ηR) d(ηR) R]>=0. Per la soluzione esatta, η=1, quindi d d 0=2<T[R]>+R <T[R]>+<V[R]>+R <V[R]>= dR dR d =<2T+V>+R E[R]. (10) dR Per la distanza di equilibrio, questo si riduce a <2T+V>=0. Teorema di Hellmann-Feynman. E' un altro dei rari risultati esatti che valgono anche per sistemi a molti corpi in interazione. Sia H=H(λ) un hamiltoniano dipendente da un parametro, e sia HΨ = E Ψ. Il teorema dice che dE dH = <Ψ| |Ψ>. (11) dλ dλ Questo consegue da E(λ)= <Ψ|H|Ψ> e dal fatto che una variazione infinitesima dλ del parametro provoca (teoria delle perturbazioni alla mano) un dΨ che e' ortogonale a Ψ. Per esempio, con questo teorema si possono calcolare forze agenti sugli atomi a partire dalla conoscenza della Ψ fondamentale. Capitolo 8- Multipletti atomici. Effetto Auger Studieremo la teoria elementare dei multipletti atomici, cioe' dei termini e dei livelli cui puo' dare luogo una data configurazione elettronica. In prima approssimazione, bisogna trattare esplicitamente i soli elettroni dei gusci aperti; gli altri non partecipano alla dinamica, ma producono un campo centrale, che puo' essere determinato con un metodo autoconsistente, come per esempio quello di Hartree-Fock. Alcune tecniche sperimentali, come la spettroscopia Auger, permettono di osservare i multipletti e di valutare l'accuratezza di questa descrizione. 8-1 Struttura dell'atomo nell'approssimazione del campo centrale Discutiamo l'atomo con Z elettroni a partire dall'hamiltoniano modello Z pi 2 Ze2 Z e2 H= ∑ [ ]+ +H' rel (1) ∑ 2m ri rij i i<j dove pi sono i momenti dei singoli elettroni, ri le loro distanze dal nucleo, rij le distanze reciproche e =177= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H' rel = Z ∑ ξ(r i )Li ⋅Si (2) i contiene la principale correzione relativistica, l'interazione spinorbita. Le simmetrie esatte dell'atomo sono espresse da [H,J]- =0, [H,Π]- =0, (3) dove J e' il momento angolare e Π e' la parita'. Schema L-S Per gli atomi leggeri, e' utile prendere come approssimazione 0 quella in cui H'rel viene trascurata. In presenza delle interazioni coulombiane, H non commuta con i momenti angolari orbitali Li dei singoli elettroni; bisogna considerare i momenti angolari dell'atomo nel suo complesso Z Z Z L=∑ Li , S=∑ Si , J=∑ Ji =L+S. i i i 2 H commuta con L ,S2,J2,Lz,Sz,Jz. Pero', perche' si possano etichettare gli stati con buoni numeri quantici, occorre che siano numeri quantici simultanei, e cioe' che i rispettivi operatori commutino, oltreche' con H, anche fra di loro. E' noto che le componenti dei momenti angolari soddisfano alle regole di commutazione [Li ,Lj ]- = ih / εijk Lk . (4) La complicazione nasce dal fatto che 2 2 2 J =L +S +2(LxSx+Ly Sy +LzSz) non commuta con le componenti di L e di S. Pero' commuta con L2 e S2, perche' il quadrato di un momento angolare commuta con le sue componenti. In effetti, da [L x ,L y]- =ih /L z si ottiene [L x 2,L y]- = L x [L x ,L y]- +[L x ,L y]- L x = ih / [L x L z+L zL x ], e da [L z,L y]- =-ih / L x si ottiene [L z2,L y]- =-ih / [L x L z+L zL x ], 2 cosicche' [L ,L y]- =0. Possiamo decidere di etichettare gli stati diagonalizzando simultaneamente gli operatori compatibili in due modi diversi: 1) H, L2,S2,Lz,Sz,Jz ; i numeri quantici sono E,L,ML ,S,MS,M J . 2) H,L2,S2,J2,Jz; i numeri quantici sono E,L,S,J,MJ . Gli autostati simultanei di ciascun insieme di operatori compatibili sono una base per descrivere gli stati atomici, e le due basi sono connesse da una trasformazione unitaria. Ora l'uno ora l'altro schema viene indicato in leteratura come schema L-S o di Russell-Saunders. I livelli energetici di questa approssimazione zero, o "termini" atomici, sono definiti da L e S e vengono denotati con simboli del tipo 2S+1L : ad esempio, 2P ha L=1, S=1/2; essi sono degeneri (2L+1)(2S+1) volte. Gli effetti relativistici scindono i termini degeneri in livelli etichettati da J, e la degenerazione dei livelli di struttura fine e' 2J+1. Per i livelli, si usa la notazione 2S+1LJ : ad esempio, 2P da' luogo a 2P1/2 e 2P3/2.La =178= Prof. M. Cini -Corso di Fisica Atomica e Molecolare minore degenerazione dipende dal fatto che non c'e' piu' invarianza per rotazioni indipendenti di L e di S. Per assegnare una configurazione ben definita ad un atomo con Z elettroni, occorre immaginare che ogni elettrone abbia un orbitale unLM M , e questo richiede che il potenziale V(r) L S dell'atomo abbia simmetria sferica (approssimazione del campo centrale). Possiamo giustificarlo, ponendo in V il grosso dell'interazione coulombiana, che e' dovuto soprattutto agli elettroni dei gusci chiusi. Il resto, cioe' l'interazione residua H'C , potra' essere trattato perturbativamente. Si ha quindi una redistribuzione dei contributi all'hamiltoniano, con Z pi 2 H= ∑ [ +V(r i ) ] + H'C, (5) 2m i e quindi Z Z e2 Ze2 H' C =∑ [ -V(ri )] + (6) ∑ rij +H' rel ri i i<j Molti fatti qualitativi importanti si possono capire senza bisogno di specificare ulteriormente V(r). Vediamo come una data configurazione si risolve in termini L-S. Il problema e' banale nel caso di gusci chiusi, quando gli stati con lo stesso numero quantico principale n sono tutti occupati o tutti vuoti. Allora, ML =∑ M L =0, M S=∑ M S =0, (7) i i i i 1 e l'unico termine e' S. Se si ha un solo elettrone 'ottico" fuori dai gusci chiusi, l'intero atomo avra' i numeri quantici L,ML e MS dell'elettrone. Se manca un solo elettrone per fare gusci chiusi, cioe' se c'e' una sola lacuna, questa conta come un elettrone con valori opposti di ML e MS. Se ci sono 2 elettroni non equivalenti (n diversi) si dovranno comporre i loro L e S. Ad esempio, np,n'p → 1S, 3S, 1P, 3P,1D, 3D. Con 2 o piu' elettroni equivalenti, i termini possibili vengono limitati dal principio di Pauli. Esempio: atomo di C (configurazione 1s22s22p2). Senza il principio di Pauli avremmo 1S, 3S, 1P, 3P,1D, 3D, ma non possiamo occupare due volte lo stesso stato. Gli stati disponibili sono (m,σ) con m=1,0,-1 e σ= ±1/2, e sono 6; 6 dobbiamo sceglierne 2, e possiamo farlo in 2 =15 modi. Il massimo M L e' 2, e corrisponde a (1,+) ,(1,−); ma allora MS=0, e lo stato e' 1D. 1D comporta 5 stati, con ML = 2,1,0,-1,-2. =179= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Con ML =1 si hanno i 4 stati (1,±),(0,±); tolto quello che abbiamo usato, ne restano 3. Il massimo MS e' 1. Quindi abbiamo 3P. 3P comporta 3x3=9 stati. Abbiamo usato 5+9=14 dei 15 stati disponibili. C'e' spazio solo per un 1S. Quindi, p2 → 1S, 3P,1D. Esempio: atomo di N (configurazione 1s22s22p3). 6 Gli stati a 3 elettroni sono 3 =20. Ragioniamo come sopra. Stati con ML massimo (1,+),(1,-),(0,±): ML =2, MS=±1/2. C'e' un 2D, con 2x5=10 stati. Stati con ML =1: (1,+),(1,-),(-1,±), (1,±),(0,+),(0,-) Ce ne sono 4. Lo spin massimo e' 1/2. Poiche' 2 stati sono usati da 2D, rimane un 2P (2x3=6 stati). Poi c'e' ML =0. Abbiamo trovato 16 stati su 20, e quelli rimanenti fanno un 4S. Quindi, p3→ 4S, 2P,2D. Esempio: atomo di Ti (configurazione 1s22s22p63d2). 10 Ci sono 10 stati a 1 elettrone, e d 2 ha 2 =45 stati. ML massimo =4 (2+,2-) MS=0 → 1G 9 stati. ML =3 (2±,1±) 4 stati, di cui uno gia' usato → 3F 21 stati. 1 ML =2 ha 5 stati: (2±,0±), (1+,1-), di cui 4 gia' usati → D 5 stati. ML =1 ha 8 stati: (2±,-1±), (1±,0±), di cui 5 gia' usati → 3P 9 stati. Abbiamo in tutto 44 stati, e resta solo un 1S. Quindi, d2→ 1S, 3P,1D, 3F,1G. La parita' dello stato e' il prodotto di quelle (-)L i dei singoli orbitali. Ad esempio, lo stato fondamentale dell'atomo di C (configurazione 1s22s22p2) e' pari. Da essa deriva un 3P. Dalla configurazione eccitata 2s2p3 si ottiene un termine 3Po, dove o sta per odd (dispari). Dalla configurazione fondamentale si puo' stabilire subito il termine fondamentale grazie ad una regola stabilita da Hund, su base empirica, ed oggi verificata dai calcoli caso per caso. Prima regola di Hund: il termine piu' bassoe' quello che ha il valore massimo di S, ed il valore massimo di L compatibile con tale S. Benche' non si tratti di un teorema, la regola si puo' capire , perche' un alto spin comporta una funzione d'onda orbitale altamente antisimmetrica, e una bassa repulsione. Esempi: Z=6 C configurazione 2p2 → termine fondamentale 3P. Z=74 W configurazione 5p65d46s2. Il guscio incompleto e' 5d4. Con ML =-2,-1,0,1,2, ci sono abbatanza stati per sistemare gli elettroni con spin paralleli, S=2. Allora, il valore masimo di ML e' 2+1+0+(-1)=2. Il termine fondamentale e' 5D. =180= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Trovati i termini L-S, ci dobbiamo preoccupare delle correzioni dovute a H' rel . Si ricordera' che nel caso idrogenoide L e' un buon numero quantico anche in presenza dell'interazione spin-orbita, e gli stati possono essere etichettati con |LSJMJ >; inoltre, esprimendo L⋅S in termini di J2=(L+S) 2, si arriva alla regola degli intervalli di Lande' E(J)-E(J-1) ∝ J. Nel caso di piu' elettroni, con H'rel = Z ∑ ξ(r i )Li ⋅Si , si ha ancora i che [J,H' rel ]=0, come vogliono i principi generali; d'altra parte, Z J=∑ ( Li +Si ), e gli operatori di elettroni diversi commutano; per i quelli di un dato elettrone, il commutatore con Li ⋅Si si annulla come nel caso idrogenoide. La novita' e' che L2 ed S2 non commutano piu' con H'rel ; possiamo dire che L e S non solo precedono, ma fluttuano anche in modulo. Infatti, Z Z Z L2 =( ∑ Li ) 2= ∑ Li 2+∑ Li ⋅Lj , i i ij e le singole componenti di Li non commutano con H'rel . Pertanto, H' rel mescola i termini di uno stesso J con L e S diversi. Solo se H' rel e' piccola rispetto alla separazione in energia dei termini potremo trascurare i suoi elementi di matrice fra termini diversi. In tale approssimazione, rimane solo l'effetto di H'rel fra gli stati degeneri dell'approssimazione zero, che hanno L e S definito. Si avra' la correzione ∆EJ = <LSJM| Z ∑ ξ(r i )Li ⋅Si |LSJM>. (8) i Per ragioni di simmetria (teorema di Wigner-Eckart) l'elemento di matrice e' proporzionale a quello dell'operatore L⋅S , e questo consente di scrivere ∆EJ = K [J(J+1) - L(L+1) - S(S+1)] (9) e di ritrovare le regola degli intervalli. Per conoscere l'ordine dei livelli ocorre sapere il segno della costante di proporzionalita' K. Ma non occorre fare calcoli perche' vale in propoito un'altra regola empirica. Seconda regola di Hund. Il livello di J piu' basso ha l'energia piu' bassa (K>0) se il guscio e' meno che mezzo pieno.Il livello di J piu' alto ha l'energia piu' bassa (K<0) se il guscio e' piu' che mezzo pieno. Se il guscio e' mezzo pieno, K=0. Esempio: l'ordine dei livelli per l'atomo di Carbonio =181= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 S0 2 2p 1 3 D2 P2 3 P1 3 P 0 Schema J-J Invece di sommare i momenti angolari secondo il metodo di Z Z Russell-Saunders, L=∑ Li , S=∑ Si , J=L+S, possiamo formare i i prima il momento angolare totale di ogni elettrone, Ji =Li +Si , e poi avremo J=∑ Ji . Questo procedimento e' esatto come l'altro, i ma si presta ad una approssimazione (schema J-J ) in cui l'hamiltoniano imperturbato e' Z pi 2 H0 = ∑ [ +V(r i ) + ξ(r i )Li ⋅Si ] , 2m i mentre la perturbazione e' l'interazione coulombiana residua H C. Faremo agire HC fra determinanti di Slater costruiti con spinorbitali u i che sono autostati di Ji . Un tale approccio e' il piu' naturale se H'rel >>H C. Benche' questo non sia mai vero per gli stati fondamentali degli atomi, lo schema J-J e' preferibile a quello L-S per Z grandi. Inoltre, anche per Z piccoli o intermedi, H' rel >>H C in molti stati eccitati. Ad esempio, per un atomo di Si nella configurazione 3s23p6s l'interazione coulombiana e' piccola perche' lo stato 6s e' molto diffuso, e siamo nello schema J-J. Cominciamo con il limite HC→0. L'elettrone s appartiene a J=1/2, mentre quello p ha a disposizione gli stati J=1/2,3/2. Quindi, gli stati a due elettroni dell'approssimazione zero sono (1/2,1/2) e (1/2,3/2). Ora, in termini del J totale, che e' conservato, (1/2,1/2) si risolve in due livelli degeneri J=1 e J=0, mentre (1/2,3/2) da' J=1 e J=2. Quando introduciamo HC, che e' diagonale in questa base ma risolve i livelli degeneri, troviamo ovviamente gli stessi stati che risultano dallo schema LS: =182= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 P J=1 1 sp (3/2,1/2) sp J=2 Schema LS Schema jj J=1 3 P J=0 (1/2,1/2) La transizione dallo schema LS a quello jj si puo' osservare anche negli spettri ottici di C, Si, Ge, Sn, Pb .Si noti come il 4 principio di Pauli limiti le componenti (3/2,3/2) a 2 =6, invece delle 42 che avremmo per elettroni non equivalenti. Infatti, lo stato di J piu' alto si ottiene combinando MJ =3/2 con MJ =1/2; si ha quindi J=2, che implica 5 stati. L'ultimo stato non puo' essere che J=0. Lo schema del diagramma obbedisce alla regola del non incrocio1. 1 p S 1 S0 J =0 (3/2,3/2) 2 Schema LS 1 D 3 P 1 D2 J =2 (3/2,1/2) p 2 Schema jj J =2 (1/2,1/2) J =1 J =0 I due casi limite sono utili, ma la descrizione completa (intermediate coupling) e' quella che tratta esattamente sia H C che H'rel ; e' questo lo schema che useremo per calcoli realistici. 8-2 Calcolo dei Coefficienti di Clebsh-Gordan Basta un personal computer per generare uno qualsiasi di questi coefficienti in modo istantaneo, e molto trucchi che si insegnavano quando l'autore era studente sono ormai inutili. Pero', bisogna sapere come calcolarli 'a mano', anche perche' se no non potremmo generalizzare il concetto nei capitoli dedicati 1nei diagrammi di correlazione come questo, non possono esistere incroci fra due curve che hanno gli stessi numeri quantici, e rappresentano stati della stessa simmetria. Se esistessero, vorrebbe dire che per qualche valore del parametro Z i due stati sono degeneri. Non resterebbe alcun numero quantico a distinguerli, in contrasto col primo postulato della meccanica quantistica (paragrafo 3.1) =183= Prof. M. Cini -Corso di Fisica Atomica e Molecolare alla simmetria. Il calcolo di <J1m1J 2m2|J 1J 2Jm > e' una questione molto semplice concettualmente, anche se molto ripetitiva. Un primo coefficiente di CG e' noto (a parte la fase arbitraria) ed e' quello con J massimo ed m massimo; tale stato si puo' ottenere in un solo modo, prendendo m1 e m2 massimi, e quindi il coefficiente di CG puo' essere fissato uguale a 1. Prendiamo per esempio due spin 1/2. |J 1=1/2 J 2=1/2 J=1 m=1> = |J 1=1/2 m1=1/2 J 2=1/2 m2=1/2> . (1) Introduciamo gli operatori di shift J + e J - ; J ± |J,m j > = J(J+1)-mj (m j ±1) h / |J,m j ±1>. Applicato al primo membro della (1) fornisce J - |J 1=1/2 J 2=1/2 J=1 m=1>= 2 / h|J 1=1/2 J 2=1/2 J=1 m=0>. Se a secondo membro applichiamo J 1- + J2- =J- , otteniamo lo stesso stato espanso nell'altra base, J(J+1)-mj (m j -1)=1, h / { |J1=1/2 m1=-1/2 J 2=1/2 m2=1/2> + + |J 1=1/2 m1=1/2 J 2=1/2 m2=-1/2> } da cui, per confronto, otteniamo due coefficienti di CLEBSH GORDAN <J 1=1/2 1 m=0>= 2 m1=1/2 (2) <J 1=1/2 m1=-1/2 1 m=0>= . 2 Infine, il fatto che J 2=1/2 J 2=1/2 m2=-1/2|J 1=1/2 J2=1/2 J=1 m2=1/2|J 1=1/2 J2=1/2 J=1 <J 1 m1=-1/2 J 2 m2=-1/2|J 1J 2 J=1 m=-1> =1 si puo' controllare applicando di nuovo S- . Rimangono da calcolare i coefficienti del singoletto, J=0; ma poiche' m=0, |J1J 2 J=0 m=0> deve essere combinazione di |J1 m 1=1/2 J2 m 2=-1/2> e di =184= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |J 1 m1=-1/2 J2 m2=1/2>; ma la somma da' il tripletto; il singoletto, che deve essere ortogonale in quanto autostato di S2 con diverso autovalore, e' dato dalla differenza; pertanto, <J 1=1/2 m1=1/2 J 2=1/2 m2=-1/2|J 1=1/2 J 2=1/2 J=0 m=0>= 1 2 (3) 1 <J 1=1/2 m1=-1/2 J2=1/2 m2=1/2|J 1=1/2 J2=1/2 J=0 m=0>= - . 2 Come esercizio un po' meno banale, possiamo considerare due elettroni d, e calcolare i coefficienti CG con J 1=J 2=2. Schematicamente: Massimo J =4 Massimo m =4 ⇒ |J=4 m=4>=|m 1=2 m2=2>. Ricordando ancora che <J m±1|J ± |Jm> = h / J(J+1)-m(m±1) ed applicando J a primo membro, troviamo J - |J=4 m=4>= 8 h / |J=4 m=3>; applicando J1- + J 2- a secondo membro, troviamo (J1- + J 2- )|m 1=2 m2=2> = 4 h / {|m1=1 m2=2> +|m1=2 m2=1>}. Pertanto, 1 |J=4 m=3> = {|m1=1 m2=2> +|m1=2 m2=1>}. 2 Insistendo con questo metodo, si trovano gli stati con J=4 e con m=2,1,0,-1,-2,-3,-4. Dopo gli stati G (J=4) vengono quelli F (J=3); al massimo, m=3, che puo' ottenersi con m1=1 m2=2 o viceversa; poiche' la combinazione col + e' lo stato G con m=3, prenderemo quella col -, |J=3 m=3> = 1 {|m1=1 m2=2> - |m 1=2 m2=1>}. 2 operando su questo stato con J- , otteniamo tutti gli stati F. Continuando l'argomento si trovano poi in successione gli stati D,P e S. Per quanto laboriosa, tutta questa procedura e' elementare. L'alternativa e' una elegante teoria matematica, che conduce a formule chiuse per i coefficienti, ma e' essa stessa laboriosa. Le formule, poi, sono cosi' complicate da non offrire alcun vantaggio, a meno che non vogliamo scrivere un nuovo software. 8-3 Simboli 3j, 6j e 9j =185= Prof. M. Cini -Corso di Fisica Atomica e Molecolare I simboli 3j sono solo un altro modo di scrivere i coefficienti di Clebsh-Gordan. La definizione di Wigner e' la seguente: (1) j1 j2 j3 j1-j 2-m 3(2j -1)-1/2 <j m j m |j j j -m > . 3 1 12 2 123 3 m1 m2 m3 = (-) Il vantaggio di questa notazione e' che i nuovi simboli hanno molte speciali proprieta' di simmetria; per esempio, una permutazione pari delle colonne lascia in simbolo immutato, mentre una dispari lo moltiplica per (-) j1+j2+j3. Simili proprieta' di simmetria erano essenziali per svolgere efficientemente i calcoli quando questi si dovevano fare con carta e penna; noi qui risparmieremo molto spazio e molto lavoro considerando questi e gli altri simboli come sottoprogrammi di libreria, facilmente disponibili anche sui personal computers. Sapendo comporre due momenti angolari (con i simboli 3j) siamo in grado di fare altrettanto con qualsiasi numero di essi. Per esempio, il momento angolare totale F di un atomo si ottiene componendo tre momenti angolari, e cioe' S,L e in momento angolare nucleare I. Esiste anzi piu' di un modo di comporli. Tre momenti angolari j1, j2 e j3 si possono accoppiare in due modi diversi: si possono comporre j1 e j2 in un momento risultante j12 e questo con j3 per ottenere quello totale J; oppure si puo' comporre j1 con il risultante j23 degli altri due. I risultati sono fisicamente equivalenti e sono connessi da una trasformazione unitaria. Potremo scrivere, essendo i coefficienti reali: |(j 1j2)j 12j3JM > = ∑ |j1(j 2j3)j 23JM><(j1j2)j 12j3JM|j 1(j 2j3)j 23JM> j23 (2) . Ma i coefficienti di questa espansione sono indipendenti da M, perche' tutti gli stati con M definito devono trasformarsi allo stesso modo sotto rotazione. Omettendo quindi la dipendenza spuria da M, definiamo il simbolo 6j come segue1: 1Il simbolo 6j non tiene conto, ovviamente, delle proprieta' di simmetria connesse con la statistica delle particelle. La funzione d'onda deve poi essere simmetrizzata o antisimmetrizzata a seconda dei casi. =186= Prof. M. Cini -Corso di Fisica Atomica e Molecolare j1 j3 j2 j12 J j23 = (-) j 1+j2+j3+J [(2j 12 +1)(2j23 +1)] -1/2 <(j 1j2)j 12j3J|j 1(j 2j3)j 23J> . (3) Calcolando esplicitamente gli stati e prendendo il prodotto scalare, il simbolo 6j puo' ovviamente essere espresso in termini di simboli 3j, ovvero di coefficienti di CLEBSH GORDAN. L'espressione e', verosimilmente, complicata, e noi la tralasciamo 1. Nei problemi a 2 elettroni vi sono 4 momenti angolari da sommare. Un altro caso importante e' quello di un atomo con due gusci parzialmente occupati, ciascuno dei quali e' caratterizzato da L e S. La somma puo' essere fatta in vari modi equivalenti. In notazione analoga a quella usata sopra, si ha |(j 1j2)j 12(j 3j4)j 34JM > = ∑ j12j34 |(j 1j3)j 13(j 2j4)j 24JM > • <(j 1j3)j 13(j 2j4)j 24JM |(j1j2)j 12(j 3j4)j 34JM > (4) Di nuovo, i coefficienti di questa espansione possono esser presi reali e sono indipendenti da M. Per esaltarne le proprieta' di simmetria, in pratica si scrivono in termini dei simboli 9j di Wigner definiti da <(j 1j3)j 13(j 2j4)j 24JM |(j1j2)j 12(j 3j4)j 34JM > ≡ j1 j 2 j 12 j34 . (5) =[(2j 13 +1)(2j24 +1)(2j12 +1)(2j34 +1)] +1/2 j3 j4 j13 j24 J Anche per i simboli 9j esistono complicate espansioni in simboli 3j, ed anche per essi sono disponibili tabulazioni e sottoprogrammi di libreria. Per sommare 5,6 o 7 momenti angolari, sono stati introdotti i simboli 12j,15j e 18j, dei quali pero' non avremo bisogno. 1Vedere ad es. B.L.Silver,'Irreducible Tensor Methods',Academic Press New York (1976) =187= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 in armoniche sferiche r12 La funzione di Green dell'equazione di Poisson, \f(1,r12) = 8-4 Espansione di 1 puo' essere espansa in multipoli intorno ad un centro |r1-r2| arbitrario. Passando a coordinate polari, ri →(r i ,θi ,φi ), si dimostra facilmente la formula ∞ 1 = r12 ∑ K ∑ K=0 m=-K 4π (r <) K Y* KM (θ1,φ1)YKM (θ2,φ2), (2K+1) (r >) K+1 (1) dove r> = r1θ(r 1- r 2)+ r 2θ(r 2-r 1),r < = r1θ(r 2- r 1)+ r 2θ(r 1-r 2). 8-5 Integrali Coulombiani atomici Il calcolo di <Φ |HC|Ψ> fra Φ e Ψ determinantali si riduce a quello di integrali coulombiani fra spin-orbitali, del tipo 1 r12 |c(1)d(2))= (u aub| |uc ud) ≡ δ(m sa,m sc ) δ(m sb ,m sd)(a(1)b(2)| 1 =δ(m sa,m sc ) δ(m sb ,m sd) ∫a(1)* b(2)* c(1)d(2)d31d32 . r 12 1 r12 (1) Affinche' il risultato non sia identicamente nullo, occorre che sia msa = msc , msb =msd . Fra autostati del campo centrale, della forma a(r) = Ran L YLM (θ,φ), etc., l'integrale si puo' sviluppare usando i risultati del paragrafo precedente, nella forma ∞ ∑ K ∑ ∞ ∞ ∫dr1 ∫dr2RanL(a) (r 1)Rc nL(c) (r 1)RbnL(b) (r 2)RdnL(d)(r 2) 0 K=0 m=-K 0 • 4π (r <) K • r12r22 • K+1 (r >) (2K+1) • ∫dΩ1Y* L(a)M(a) (Ω1) YKM (Ω1))Y L(c)M(c) (Ω1) • (2) • ∫dΩ2Y* L(b)M(b) (Ω2) Y* KM (Ω2))Y L(d)M(d)(Ω2) , dove dΩ=sin(θ)dθdφ. Gli integrali radiali Rk , gli unici il cui calcolo richiede un modello dettagliato del potenziale, sono definiti da Rk (ab,cd) ≡ (3) =188= Prof. M. Cini -Corso di Fisica Atomica e Molecolare \i(0, ∞ ,dr1)\i(0,∞ ,dr2)RanL(a) (r 1)Rc nL(c) (r 1)RbnL(b) (r 2)RdnL(d) (r (r <) K 2) r12r22 (r ) K+1 > Per calcolare gli integrali angolari , e' desiderabile ridurre a due il numero delle armoniche sferiche nell'integrando, per poter usare la relazione di ortogonalita' (4) ∫dΩ Y* L'M'YLM = δ(L,L')δ(M,M') . Cio' e' possibile, perche' quelli di Legendre sono polinomi ortogonali, ed il prodotto di due polinomi di Legendre e' un altro polinomio (in cos(θ)) che a sua volta ammette una unica espansione in polinomi di Legendre. Si dimostra la seguente proprieta' delle armoniche sferiche: YL1,M1(θ,φ)YL2,M2(θ,φ)= L1+L2 ∑ L=|L1-L2| L ∑ M=-L (2L1+1)(2L2+1) • 4π(2L+1) •<L1L200|L0><L1L2M1M2|LM>YLM (θ,φ). (5) Notando che Y * LM = (-)MYL-M , mettiamo il risultato nella forma simmetrica ∫dΩYL1M1(Ω)YL2M2(Ω)YL3M3(Ω) = (6) (2L1+1)(2L2+1) <L1L200|L30><L1L2M1M2|L3-M 3>. 4π(2L+1) Gli integrali angolari si possono quindi calcolare con i coefficienti di CLEBSH GORDAN; ad ogni buon conto, essi stessi sono tabulati. Piu' precisamente, si tabulano i coefficienti reali c k definiti da (−) Μ3 ∫dΩY* L(a)M(a)(Ω) YKM (Ω))Y L(c)M(c) (Ω) = (7) = 2k+1 k c (L(a)M(a),L(c)M(c)) δ(M,M(a)-M(c)) . 4π La presenza della δ risulta banalmente dall'integrazione in dφ e comporta che affinche' il risultato non sia identicamente nullo deve aversi M(a)+M(b) = M(c)+M(d). Riscriviamo cosi' lo sviluppo con la notazione piu' conveniente =189= Prof. M. Cini -Corso di Fisica Atomica e Molecolare (ab| 1 |cd) = δ(M(a)+M(b),M(c)+M(d)) r12 • • ∞ ∑ c k (L(a)M(a),L(c)M(c))ck (L(d)M(d),L(b)M(b))Rk (ab,cd). k=0 (8) Uno qualsiasi degli L, ad esempio L(c) , puo' pensarsi come 'somma' degli altri due; anche k puo' pensarsi come la 'somma' degli L, e quindi devono valere le regole triangolari |L(d)-L(b)| ≤ k ≤ L(d)+L(b), |L(a)-L(c)| ≤ k ≤ L(a)+L(c) . Inoltre, k+L(a)+L(c) deve essere pari, altrimenti (9) ∫dΩY* L(a)M(a)(Ω) YKM (Ω) YL(c)M(c) (Ω) =0 perche' e' l'overlap di funzioni di parita' opposta. In pratica, nonostante l'apparenza terribile, la (2) ha solo pochi termini. Per gli elementi diagonali, quando il set (c,d) coincide con (a,b), e' in uso una notazione speciale; indicando con na ,nb i numeri quantici principali, si usano i cosiddetti integrali di Slater Fk (naLa,nbLb) ≡ Rk (ab,ab) (10) per il termine diretto e Gk (naLa ,nbLb) ≡ Rk (ab,ba) (11) per quello di scambio 1. Cosi', (ab| ∞ 1 |ab) = ∑ak (LaMa,LbMb) Fk (naLa,nbLb) , r12 k (12), dove a k e' un'altra abbreviazione convenzionale universalmente usata, ak (LaMa,LbMb)) k c (L(a)M(a),L(a)M(a))ck (L(b)M(b),L(b)M(b)); 1 Per elettroni equivalenti (stessi n,L) R a≡R b , e quindi F k ≡Gk . =190= ≡ Prof. M. Cini -Corso di Fisica Atomica e Molecolare d'altra parte, il termine di scambio (ab| nel calcolo solo per spin paralleli vale (ab| 1 |ba), che interviene r12 ∞ 1 |ba) = ∑bk (LaMa,LbMb) G k (naLa,nbLb) , r12 k dove bk ≡|c k |2. (13), (14) Tabelle dei ck e degli ak sono facilmente reperibili1, ed oggigiorno essi sono ottenibili anche piu' rapidamente da routines di libreria. 8-6 Multipletti nella pittura LS: metodo della traccia Consideriamo un atomo con un solo guscio aperto, quello di valenza. Supponiamo che gli elettrono dei gusci "di core" concorrano, insieme al nucleo, a formare un campo centrale in cui gli elettroni di valenza si muovono, ma non partecipino esplicitamente alle transizioni che stiamo studiando; cio' avverra' ad esempio nei processi di energia cosi' bassa che gli stati profondi non possono subire eccitazioni reali. Una data configurazione di valenza puo' dare luogo a molti termini spettrali, perche' l'interazione coulombiana H C commuta con L e con S, e non gli Li dei singoli elettroni. Anche se l'intera HC dell'atomo e' troppo grande per essere trattata come una perturbazione, possiamo sperare di trattare al primo ordine quella parte di HC che descrive le interazioni fra elettroni di valenza. In effetti, la separazione fra i vari termini di un multipletto puo' arrivare a 20 o 30 eV, ma e' piccola rispetto all'energia totale dell'atomo. Se e' noto il campo centrale, possiamo calcolare esplicitamente gli orbitali degli elettroni di valenza e gli elementi di matrice di HC. Ma la grande utilita' del metodo sta nel fatto che complicate strutture di multipletto si comprendono in termini di pochi integrali radiali. Se gli stati sono determinanti di Slater, sappiamo come esprimere gli elementi di matrice in termini di integrali Coulombiani. In assenza di correzioni relativistiche, che saranno introdotte in un secondo tempo, conviene usare una base che 1Vedi ad es. Condon e Shortley, pagg. 178-80; J.C.Slater,"Quantum Theory of Matter",pagg.233-34. =191= Prof. M. Cini -Corso di Fisica Atomica e Molecolare abbia i buoni numeri quantici L e S, perche' su tale base HC e' diagonale, e gli elementi diagonali sono gli spostamenti in energia dei vari termini del multipletto. In effetti, per alcuni stati basta un solo determinante, ma per gli altri occorrera' qualche artificio. Comunque, diagonalizzando HC, si ottengono gli stati del multipletto LS che origina dalla configurazione considerata. E' una approssimazione relativamente semplice, rispetto al metodo di Hartree-Fock, ma ha il vantaggio di essere utile anche per stati eccitati. Esempio: configurazione 1s2s I termini possibili sono 1S e 3S. Per il 3S , lo stato con Ms=1 ha il fattore di spin αα e' un determinante singolo, |φ1sαφ2sα| ; quindi 1 1 |1s2s) - (1s2s| |2s1s). r12 r12 Ci sono un integrale diretto ed uno di scambio. Per calcolare il termine diretto, che e' del tipo diagonale, occorrono gli ak , <H C>=(1s2s| Tabella degli ak (LaMaLbMb) L aL b Ma Mb s s 0 0 s p 0 0 s p 0 ±1 k=0 1 1 1 k=1 0 0 0 ⋅⋅⋅⋅ k=2 0 0 0 k=3 0 0 0 k=4 0 0 0 e dalla tabella troviamo che ak =1 per k=0, ak =0 altrimenti. Quindi (1s2s| 1 |1s2s) = F0(1s,2s). r12 Per il termine di scambio ci vuole bk = |c k |2, Tabella dei ck (LaMaLbMb) L aL b Ma Mb s s 0 0 k=0 1 s p 0 0 0 s p 0 ±1 0 k=1 0 1 3 1 3 =192= k=2 0 k=3 0 k=4 0 0 0 0 0 0 0 Prof. M. Cini -Corso di Fisica Atomica e Molecolare ⋅⋅⋅⋅ 1 |2s1s) = G0(1s,2s), e l' elemento diagonale di r12 H C e' F0(1s,2s)-G0(1s,2s). Questa e' la correzione all'energia degli stati con M s= ±1, ma noi ben sappiamo che lo stato 3S con Ms=0 e' degenere con essi. Ma come fare per il 1S? Qui possiamo usare un metodo generale, dovuto a Slater, che si chiama il metodo della traccia. Con Ms=0 c'e' 1S ed una componente di 3S. I determinanti coinvolti sono |φ1sαφ2sβ| e |φ1sβφ2sα|. Per ciascuno di essi, mancando il termine di scambio, <HC> = F 0, e quindi la matrice di H C con Ms=0 in questo sottospazio ha traccia 2F0. Ma la traccia e' invariante per cambiamenti di base1, quindi la somma delle correzioni per 3S e per 1S deve essere 2F0. Poiche' per 3S la correzione e' F0-G0, per il 1S deve essere F0+G0. Poiche' G0>0, questo e' in accordo con la regola di Hund. quindi (1s2s| Esempio: configurazione 1s2 equivalenti, 1S e' un singolo αβ-βα determinante φ1s(1)φ1s(2) . 2 Poiche' gli spin sono opposti, non c'e' termine di scambio. La correzione all'energia e' quindi F0, e differisce dal valore F0+G0 trovato prima per 1s2s 1S. Con due elettroni Esempio: configurazione 1s2p I termini sono 1P e 3P. Determiniamo prima la correzione per 3P, e poi ricaveremo l'altra col metodo della traccia. Lo stato con M s=1 (spin massimo) che ha il fattore di spin αα ed appartiene al tripletto e' un determinante singolo, con 1 1 |1s2p) - (1s2p| |2p1s). r12 r12 Per calcolare il termine diretto, che e' del tipo diagonale, occorrono gli ak , e dalla tabella troviamo che ak =1 per k=0, ak =0 altrimenti. Quindi <H C>=(1s2p| 1Tr{ABC}=A B C -1 -1 ij jk ki = Cki A ij B jk = Tr{CAB} ⇒Tr{S AS}=Tr{SS A}=Tr{A}. =193= Prof. M. Cini -Corso di Fisica Atomica e Molecolare (1s2p| 1 |1s2p) = F0(1s2p). r12 1 Per il termine di scambio ci vuole bk = |ck |2, che vale per k=1, 3 ed e' 0 altrimenti. Quindi, (1s2p| 1 1 |2p1s) = G1(1s2p). r12 3 Pertanto, <3P|HC|3P> = F0(1s2p) - 1 1 G (1s2p). 3 Per determinare <1P|HC|1P> scegliamo ML =1, che e' il valore massimo ammesso. Vi sono due determinanti con ML =1, Ms=0, e cioe' |1sα,2p+β| e |1sβ,2p+α| , dalla cui combinazione devono venire il singoletto ed una componente del tripletto. Qui, p+ e' la componente p con m=1. Su questa base, la traccia e' 2F0, dal momento che si tratta di termini del tipo diagonale con spin opposti e non c'e' termine di scambio. Quindi, <3P|HC|3P> + <1P|HC|1P> = 2F0=F0 - 1 1 G + <1P|HC|1P>; 3 1 1 G (1s2p). 3 Essendo G1>0, di nuovo la regola di Hund e' soddisfatta. Con il metodo della traccia di Slater, possiamo trovare le correzioni agli autovalori dell'energia senza bisogno di trovare le autofunzioni per un gran numero di configurazioni semplici. ⇒<1P|HC|1P> = F0(1s2p) + Esempio: configurazione d2 Gli stati ammessi dal principio di Pauli sono 1G,3F,1D, 3P,1S. Notazione per i determinanti: Con due elettroni d equivalenti possiamo coprire lo spazio di Hilbert con determinanti di Slater (m 1ms1,m 2ms2); i determinanti corrispondono univocamente a vettori di base dello spazio solo se e' prefissato l'ordine degli spin-orbitali a particella singola. Quindi, conveniamo che sia m1≥m2 e, se m1=m2, allora ms1>ms2. Conviene una notazione abbreviata del tipo (2+2-)≡(m 1=2, m s1=1/2,m2=2,ms2=-1/2). =194= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La tabella degli ak per gli stati dd e' L a L b Ma Mb k=0 d d ±2 ±2 1 d d ±2 ±1 1 d d ±2 0 1 d d ±1 ±1 1 d d ±1 0 1 d d 0 1 0 k=2 4 49 -2 49 -4 49 1 49 2 49 4 49 k=4 1 441 -4 441 -6 441 16 441 -24 441 35 441 Per 1G con M L =4 c'e' il solo determinante αβ-βα φ22(1)φ22(2) . 2 Da (ab| 1 |ab) = r12 ∑ak Fk si ottiene k 4 2 1 4 <1G| HC|1G> = F0+ F + F . 49 441 E' di uso comune definire F0=F0 , F2= F2 , 49 F4= F4 , 441 etc., (15) e cioe' di riassorbire i denominatori negli F e nei G, abbassando gli indici. Cosi' scriviamo E(1G) = <1G| HC|1G> = F0+ 4 F2 + F4. Con ML =3 si hanno i 4 stati determinantali (2±,1±), dalle cui combinazioni devono venire 1G e 3F. Per spin paralleli, occorre includere lo scambio. Ecco la tabella dei ck : L aL b Ma Mb d d ±2 ±2 k=0 1 k=2 k=4 - 4 49 =195= 1 441 Prof. M. Cini -Corso di Fisica Atomica e Molecolare d d ±2 ±1 0 d d ±2 0 0 d d ±1 ±1 1 d d ±1 0 1 d d 0 1 0 6 49 4 49 1 49 1 49 4 49 d d ±2 +- 2 0 0 d d ±2 +- 1 0 0 d d ±1 +- 1 0 - 6 49 5 441 15 441 16 441 30 441 36 441 30 441 35 441 40 441 Calcoliamo le correzioni all'energia dei determinanti. Usando le tabelle, si ha: E(2+,1+)= E(2-,1-)= F0 - 2F2 -4F4 -6G2 - 5G4 F0 - 2F2 -4F4 -6G2 - 5G4 E(2-,1+)= E(2+,1-)= F0 - 2F2 -4F4 F0 - 2F2 -4F4 I primi due determinanti appartengono a 3F, perche' gli spin sono paralleli. Poiche' consideriamo una configurazione d2, e quindi elettroni equivalenti, G≡F ed otteniamo E(3F) = <3F|HC|3F> = F0-8 F2-9F4. I due determinanti rimanenti devono dare la terza componente di 3F e la componente ML =3 di 1G, ed in effetti possiamo verificare che la traccia calcolata nelle due basi e' la stessa. Scendendo a ML =2, si devono considerare i 5 determinanti (2+,0+),(2+,0-),(2-,0+),(2-,0-),(1+,1-). Questi devono dare un 1G, i tre stati di 3F, ed un 1D. Per calcolare E(1D), consideriamo i soli determinanti di spin nullo, per i quali si trova, con l'ausilio delle tabelle E(2+,0-)= E(2-,0+)= E(1+,1-)= F0 - 4F2 +6F4 F0 - 4F2 +6F4 F0 + F2 +16F4 =196= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La traccia su questa base e' 3F0-7F2 +28F4. Togliendo E(1G)+E(3F) otteniamo E(1D) = F0-3F2+36F4. Con un ragionamento simile si determinano anche E(3P) = F0+7F2-84F4 E(1S) = F0+14F2+126F4. Molte configurazioni si trovano tabulate sui trattati di Fisica Atomica. 8-7 Stati con L e S definiti: Calcoli espliciti per la configurazione d2 Useremo la configurazione d2 per illustrare i multipletti atomici in un caso molto interessante ma non particolarmente complicato. Con piu' di due elettroni ottici o piu' di un guscio aperto i calcoli diventano molto piu' gravosi; tuttavia il metodo qui illustrato puo' sempre essere realizzato, se non altro con il calcolatore. Metodi piu' formali sono ben descritti in letteratura1, e richiederebbero troppo spazio. Anche se abbiamo potuto fare a meno delle funzioni d'onda per trovare le energie dei termini2, vogliamo ora determinarle per altri usi. Conoscendo gli stati a particella singola, con essi formeremo stati a due elettroni del tipo |m1ms1m2ms2>; in tale base, possiamo espandere gli stati con L e S definiti |LSML MS> usando i coefficienti di CLEBSH GORDAN. |LSML MS>= ~ ∑ m1m2 |m1ms1m2ms2>•<2m12m2|LML ><1/2ms11/2ms2|SM S> (1) ~ ∑ ms1ms2 ~ in cui ∑ sta a ricordare le convenzioni sull'ordine degli stati ed anche il fatto che, essendo gli elettroni equivalenti, si dovra' alla fine ricalcolare la normalizzazione dello stato. I coefficienti di CLEBSH GORDAN di per se' non tengono conto del principio di Pauli. Per illustrare il metodo, calcoliamo la funzione d'onda di αβ+βα |d2 3P ML =0 MS=0>. Il tripletto con MS=0 e' , quindi 2 δ(m s1,-m s2) <1/2ms11/2ms2|S=1M S=0> = . (2) 2 1Ad esempio, vedi il libro di B.L.Silver,"Irreducible tensor Methods",Academic Press 1976 . 2Si intende che si tratta delle correzioni al modello del campo centrale, dovute ad HC. =197= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Dalle tabelle dei coefficienti di CG <2m12m2|L=1,ML =0> si ottengono i seguenti valori: m2=2 - m2=-2 2 5 2 5 m2=1 m2=-1 - 1 10 1 10 m2=0 0 . Quindi non capita mai qui il caso m1=m2. Pertanto, con m1>m2, ~ ha solo due termini, ∑ m1m2 |d2 3P ML =0 MS=0>= 1 δ(ms1,-m s2)• ∑ 2 ms1ms2 2 1 +(1m s1- 1ms2)()} = 5 10 2 {(2ms1- 2-m s1) +(1m s1- 1-m s1)(5 •{(2ms1- 2ms2) = 1 ∑ 2 ms1 (3) 1 )} . 10 Dato che questa somma e' libera, si ha |d2 3P ML =0 MS=0>= 1+)}. 1 20 {2(2+,-2 - ) +2(2- ,-2 +) - (1+,-1 - )- (1- ,- (4) Come preavvertito, la normalizzazione deve essere modificata, con 1 1 → . 20 10 (5) Possiamo procedere in questo modo per tutti gli stati |LSML MS>, e trovare l'espansione in determinanti degli altri stati di d2, cioe' 1S, 1D, 3F e 1G, nello schema LSML Ms. Esercizio: Dallo stato |d2 3P M L =0 MS=0>, ottenere gli altri appartenenti a |d2 3P M L MS> per mezzo degli operatori di shift. Soluzione Per stati a due elettroni, L±=L1±+L 2±. Per 3P, L=1, e si ha da <J m±1|J±|Jm> = /h J(J+1)-m(m±1) che L+|0>= 2 |1> , L- |0>= 2 |-1>. In particolare, la componente con ML =1 viene 1 + 23 |d2 3P M L =1 MS=0>= L |d P M L =0 MS=0> = 2 =198= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = 1 2 [L 1+ +L2+ ] 1 10 {2(2+,-2 - ) +2(2- ,-2 +) - (1 +,-1 - )- (1- ,-1 +)} . Portando gli operatori ad agire sui rispettivi stati a particella singola, si ha, (dal momento che L+|2> =0 ), 1 {2(2+,L 2+[-2 - ]) +2(2- ,L 2+[-2 +]) - (L 1+[1+],-1 - )- (L 1+[1- ],-1 +) 20 -(1+,L 2+[-1 - ])-(1- ,L 2+[-1 +])}. Per stati d, denotati da |M L >, L +|2> =0 L+|1> = 2 |2> L+ |0> = 6 |1> + L |-1> = 6 |0> L+|-2> = 2 |-1> L - |2> =2 |1> L- |1> = 6 |0> L- |0> = 6 |-1> L - |-1> = 2 |-2> L- |-2> = 0. Sostituendo, si trova |d2 3P M L =1 MS=0>= 1 = {2(2+,-1 - )+2(2- ,-1 +) - 6 (1+,0- ) - 6 (1- ,0+) }, 20 con la normalizzazione corretta. Analogamente, si trova anche |d2 3P M L =-1 MS=0>= 1 = {2(1+,-2 - )+2(1- ,-2 +) 20 6 (0+,-1 - ) - 6 (0- ,-1 +) }. Anche gli stati con MS diverso si trovano con gli operatori di shift. Ad esempio, da 1 ± 23 |d2,3P,M L ,MS=±1> = S |d , P,M L ,MS=0>, 2 si trova 1 |d2,3P,M L =0,MS=1> = {2(2+,-2 +) - (1 +,-1 +)}. 5 Esercizio: Verificare che questo stato |d2,3P,M L =0,MS=1> e' effettivamente un 3P con ML =0 e Ms =1, normalizzato. Soluzione La normalizzazione e' evidente. E' un tripletto perche' la parte di spin e' αα; ha ML =0 perche' ML1 +ML2 =0. Per vedere che e' uno stato P occorre l'operatore L 2=L12 +L22 +2L1zL 2z +L1+L 2- +L 1- L 2+. Ora, trattandosi di stati d, L12=L22=2*3; 2L 1zL 2z {2(2+,-2 +) - (1+,-1 +)}=2⋅2⋅2⋅(-2) (2+,-2 +)-2⋅1⋅(-1) (1+,-1 +). Applicando L1+L 2- si ottiene -2⋅2 (2+,-2 - ); applicando L1- L 2+ si ha 2⋅2⋅2 (1+, -1 - ). Sommando tutto, lo stato e' autostato con autovalore 2, quindi L=1, c.v.d. =199= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Esercizio: Ripetendo i calcoli per Ms =-1 e poi per gli altri ML , ottenere i 9 stati di 3P nello schema LSM L MS. Soluzione 1 |d2 3P M L =1 MS=1> = {2(2+,-1 +) - 6 (1+,0+) } 10 |d2 3P M L =1 MS=0>= 1 = {2(2+,-1 - )+2(2- ,-1 +) - 6 (1+,0- ) - 6 (1- ,0+) } 20 1 |d2 3P M L =1 MS=-1> = {2(2- ,-1 - ) - 6 (1- ,0- ) } 10 |d2,3P,M L =0,MS=1> = 1 |d2,3P,M L =0,MS=0> = |d2,3P,M L =0,MS=-1> = |d2 3P M L =-1 MS=1> = 5 1 {2(2+,-2 +) - (1 +,-1 +)}. 10 1 5 {2(2+,-2 - ) +2(2- ,-2 +) - (1 +,-1 - )-(1 - ,-1 +)}. {2(2- ,-2 - ) - (1 - ,-1 - )}. 1 10 {2(1+,-2 +) - 6 (0+,-1 +) } |d2 3P M L =-1 MS=0>= 1 = {2(1+,-2 - )+2(1- ,-2 +) - 6 (0+,-1 - ) - 6 (0- ,-1 +) } 20 1 |d2 3P M L =-1 MS=-1> = {2(1- ,-2 - ) - 6 (0- ,-1 - ) }. 10 Lo schema LSJM, che ha il vantaggio di far comparire come buon numero quantico J, e' fisicamente equivalente a LSML MS: i due schemi sono connessi dalla trasformazione unitaria |LSJM> = ∑ |LML SM s><LSML MS|LSJM>. (6) ML Ms Gli stati |LML SM s> sono gia' etichettati in modo da tenere conto del principio di antisimmetria, senza bisogno di speciali ordinamenti, e questa volta le somme sono libere; |LSJM> ha automaticamente la normalizzazione corretta. Calcoliamo per esempio il 3P0. La tavola1 dei coefficienti di CG riporta: J m 2=1 m2=0 J 1+1 \r(\f((J1+m)(J1+m+1),(2J1+1)(2J1+2))) (J 1-m)(J 1-m+1) m+1)(J1+m+1),(2J1+1)(J1+1))) (2J1+1)(2J1+2) 1che si trova ad es. a pag. 76 del Condon-Shortley =200= m2=-1 \r(\f((J1- Prof. M. Cini -Corso di Fisica Atomica e Molecolare J1 \r(\f((J1+m)(J1-m+1),2J1(J 1+1))) (J 1-m)(J 1+m+1) 2J 1(2J1+1) m J 1(J 1+1) J 1-1 \r(\f((J1-m)(J 1-m+1),2J1(2J1+1))) (J 1+m+1)(J1+m) m)(J 1+m),J1(2J1+1))) 2J 1(2J1+1) -\r(\f((J1- Identificando m2 con M s, dobbiamo combinare il momento angolare orbitale L ≡ J 1=1 con quello di spin S≡J 2 anch'esso =1 per fare J=0, M=0. Quindi, scegliamo l'ultima riga (J=J1-1) con (-) 1+m2 J 1=1, m=0, ed otteniamo i coefficienti . Pertanto, 3 tenendo conto che ML +Ms =0, si trova |d2,3P 0> = (7) 1 3 { | 3P,M L =1,Ms =-1> - |3P,M L =0,Ms =0> + |3P,M L =1,Ms =-1>} ; esso puo' essere espresso in termini di determinanti usando le espansioni ricavate sopra, ottenendo |d2, 3P0> = 1 30 {2(1+,-2 +) - +(1 +,-1 +) + +(1 - ,-1 +) +2(2- ,-1 - ) (8) 6 (0+,-1 +) - 2(2+,-2 - ) - 2(2- ,-2 +) 6 (1 - ,0- ) }, che evidentemente non e' autostato di ML ,MS ma lo e' di J,M. Cosi' il calcolo di tutti i termini nello schema |LSJM> e' chiaramente fattibile, anche se richiede un po' di pazienza. L'interazione Coulombiana HC, che e' diagonale sulla base |LML SM s> , lo e' anche nella nuova base |LSJM>, perche' commuta anche con J2 e Jz. Con ambedue le basi, siamo nello schema LS di Russell-Saunders. La nuova base ha il vantaggio che J,M rimangono buoni numeri quantici anche in presenza dell'interazione spin-orbita H SO, che pero' non e' diagonale in L e S. =201= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 8-8 Matrice dell'interazione spin-orbita configurazione d2 e accoppiamento intermedio Calcoliamo ora la struttura fine a nell'interazione spin-orbita, all'interno configurazione. Per calcolare la matrice di per la tutti gli ordini di una data H' rel =H SO=ζ{L1⋅s1+L2⋅s2} (1) conviene usare l'espansione L1⋅s1+L2⋅s2 = (2) = L1z⋅s1z+L2z⋅s2z + 1 [(L +⋅s - +L1- ⋅s1+)+(L2+⋅s2- +L2- ⋅s2+)] 2 1 1 che sappiamo come fare agire direttamente sui determinanti (m 1σ,m 2σ'), usando la tabella degli operatori di shift; ad esempio, [L1⋅s1+L2⋅s2](1 +, -2 +)= 1 1 1 ={1⋅ +(-2)⋅ }(1+, - 2+) + {2(2- ,-2 +)+2(1+,-1 - )}, (3) 2 2 2 e, analogamente, -1 1 (0 +,-1 +)+ [(1 - ,-1 +) 6 + 6(0 +,0- ), 2 2 + + [L1⋅s1+L2⋅s2](2 , - 2 )=2(2 ,-2 ), [L1⋅s1+L2⋅s2](2 - , - 2+)=2(2- ,-2 +)+(1+,-2 +)+(2- ,-1 - ), [L1⋅s1+L2⋅s2](1 +, - 1- )=(1+,-1 - )+(2- ,-1 - )+(1+,-2 +), [L1⋅s1+L2⋅s2](0 +, -1 +)= [L1⋅s1+L2⋅s2](1 - , - 1+)=-(1- ,-1 +)+ 6 + + 6 (0 ,-1 )+ (1 - ,0- ), 2 2 1 [L1⋅s1+L2⋅s2](2 - , - 1- )=- (2 - ,-1 - )+(1+,-1 - )+(2- ,-2 +), 2 -1 1 [L1⋅s1+L2⋅s2](1 - ,0 - )= (1 - ,0- )+ [(0 +,0- ) 6 + 6(1 - ,-1 +). 2 2 E' possibile ora calcolare l'effetto di HSO sugli stati della base |LSJM>. Usando lo sviluppo precedentemente ottenuto, si ha ad esempio: H SO|d2, 3P0> = -ζ {-2(1 +,-2 +)+8(2- ,-2 +)+ 6(0 +,-1 +)-7(1- ,-1 +)30 -6(0+,0 - ) -4(2+,-2 - )-2(2- ,-1 - )+5(1+,-1 - )+ 6(1 - ,0- )}. (4) =202= Prof. M. Cini -Corso di Fisica Atomica e Molecolare In particolare, possiamo dedurne che <d2, 3P0|H SO|d2, 3P0> = -ζ. (5) Inoltre, poiche' |d2, 1S0> = -1 5 {(2+,-2 - )-(2 - ,-2 +)-(1 +,-1 - )+(1- ,-1 +)+(0+,0- )}, (6) si ottiene <d2, 1S0|H SO|d2, 3P0> = -ζ 6. (7) In questo modo si puo' costruire l'intera matrice di HSO. Questa matrice e' a blocchi, perche' HSO commuta con J e non c'e' accoppiamento fra J diversi. Posto ζ=2α, si trovano le sottomatrici 1G4 3F4 1G4 0 2α 3F4 2α 3α 3F3 3F3 3F 2 3F 2 1D2 -4α -4 3P2 3P0 1D2 -4 3 α 5 0 3 α 5 -α 3P2 0 0 42 α 5 42 α 5 α 1S0 3P1 =203= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 3P0 -2α 1S0 -2 6 α -2 6 α 3P1 -α 0 La matrice Coulombiana H C e' diagonale nella base LSJM, e la conosciamo. La matrice completa HC+H SO e' quasi diagonale se α e' piccolo rispetto agli integrali di Slater. In generale, diagonalizzando la matrice completa, si ottengono gli stati dell' accoppiamento intermedio e le loro energie. La rimozione della degenerazione corrisponde al semplice schema 1S → 1S0, 3P → 3P0, 3P1, 3P2, 1D → 1D2, 3F → 3F2, 3F3, 3F4, 1G → 1G4, Beninteso, i simboli LS hanno significato rigoroso solo se ζ →0; essi sono usati anche in accoppiamento intermedio per indicare i termini LS che danno il contributo prevalente all'autovettore. 8-9 Effetto Auger1 Nel 1925, P.Auger scopri' l'effetto che porta il suo nome mentre studiava la fotoemissione, cioe' (per dirlo in termini moderni) il processo di emissione di un elettrone da parte di un atomo che assorbe un fotone. Bombardando con raggi X di frequenza ν definita gli atomi di gas nobile presenti in una camera di Wilson, si osservano le tracce lasciate dagli elettroni; la lunghezza di ogni traccia e' proporzionale all'energia cinetica dell'elettrone fotoemesso. Se l'energia di legame dell'elettrone nell'atomo e' Eb, l'energia cinetica e' Ek =hν−Eb. Ogni elemento e' caratterizzato da diversi valori possibili di Eb. Ma la scoperta inattesa e' che da uno stesso centro talvolta si vedevano irradiare piu' tracce, e mentre una di queste obbediva alla relazione Ek =Eb-hν, le altre avevano energie EA caratteristiche della specie atomica, ma indipendenti da ν. Questi sono gli elettroni Auger. La legge empirica trovata da P. Auger per descrivere i fenomeni osservati e' EA (ijk) = E B (i)-EB (j)-E B (k) (1) 1Le nozioni generali sulla natura dell'effetto Auger sono esposte in un mio articolo scritto per il Dizionario delle Scienze Fisiche della Treccani. Per gli spettri atomici e la loro interpretazione, il libro di Chattarji, "Theory of Auger Transitions", (1976) e' un riferimento essenziale. =204= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove EB (α) e' una qualsiasi delle energie di legame permesse per la specie atomica in esame; dunque, EA (ijk) e' legata a 3 livelli elettronici, ed ogni atomo e' capace di emettere un suo spettro Auger, perche' ogni specie atomica ha solo certe EB (α) caratteristiche. La legge empirica suggerisce un'interpretazione : i raggi X producono una lacuna primaria nello stato di energia di legame EB (i), ed un normale fotoelettrone; successivamente, la lacuna primaria viene riempita dall'elettrone j, in un livello soprastante, e l'energia guadagnata nel processo viene ceduta in qualche modo ad un elettrone in uno stato k, che si trasforma cosi' in elettrone Auger. Perche' una transizione possa avvenire, occorre che la lacuna primaria sia abbastanza profonda; la sua energia di legame deve superare la somma di quelle delle buche finali. Beninteso, la conservazione dell'energia e' compatibile con ambedue i processi a) e b) della figura, che sono indistinguibili. Di piu' non si poteva fare in un'epoca in cui la meccanica quantistica era agli albori. k j k j i i a) b) Anche oggi, le transizioni Auger vengono denotate con i simboli spettroscopici dei gusci (o, piu' precisamente, dei sotto-gusci) coinvolti: cosi' una transizione KL1M2 e'dovuta ad una buca primaria nel guscio K che decade lasciando nello stato finale due buche L1 ed M2 piu' un elettrone Auger1. Si parla di transizioni di core-core-core, di core-valenza-valenza, etc., a seconda dei livelli profondi o periferici che sono coinvolti. 1Le transizioni Auger in cui le buche i,j e k appartengono ad uno stesso guscio atomico si chiamano di Coster-Kronig; quelle in cui appartengono ad uno stesso sotto-guscio si chiamano di super-Coster-Kronig. Transizioni di questo genere si osservano spesso nel decadimento di lacune appartenenti a gusci periferici di atomi complessi, e possono dar luogo ad elettroni Auger di energia molto bassa, anche solo di qualche eV; in altri casi, le transizioni risultano energeticamente proibite. =205= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Gia' nel 1927 Wentzel produsse una prima teoria quantistica per spiegare il decadimento della buca primaria. Supponiamo di aver risolto le equazioni di Hartree-Fock dell'atomo nello stato fondamentale Φ0 e di aver ricavato gli Z spinorbitali occupati uα (x), ottenendo cosi' la funzione d'onda determinantale Z Φ0= ∏c α † |vac>, (2) α=1 dove |vac> e' il vuoto degli elettroni. Trattiamo gli elettroni legati come indipendenti nel campo autoconsistente dell'atomo neutro. Lo spinorbitale dello stato libero h si puo' considerare ortogonale a quelli legati; potra' essere una combinazione opportuna degli orbitali virtuali o si potra' approssimare con un'onda piana opportunamente ortogonalizzata agli stati legati. Lo stato con la buca primaria i e' Φi =c i Φ0, ed ha Z-1 elettroni; lo stato finale con due lacune j e k e con un elettrone Auger nello stato h e' Φf =c h † c j c k Φ0. Ora, Φi e Φf hanno la stessa energia e sono accoppiati dall'interazione Coulombiana, che e' una interazione a due corpi. Poiche' Φi e Φf differiscono di due spinorbitali (gli stati j e k, occupati in Φi vengono rimpiazzati da i e h nello stato finale), sappiamo dal Cap.2 che <Φi | H c |Φf > = <uj uk |r 1 |ui uh >- <uj uk |r 12 1 |uh ui >; 12 (3) questi elementi di matrice comportano i prodotti scalari fra gli spin, e il termine di scambio e' diverso da zero solo per lacune finali che hanno spin paralleli. La probabilita' di transizione e', per la regola d'oro di Fermi, 2π Pif = |<Φi | H c |Φf >|2. / h (4) Dunque, l'effetto Auger e' dovuto all'interazione coulombiana fra gli elettroni, che rende instabile qualsiasi stato con una lacuna profonda. Anche le lacune finali potranno decadere allo stesso modo, finche' non si giunge ad uno stato in cui tutte le lacune sono nei livelli piu' esterni. L'elemento di matrice Auger e' particolarmente grande se gli stati i,j e k sono vicini in energia, perche' l'interazione coulombiana e' piu' grande quando gli u hanno dimensioni simili. Le transizioni di Coster-Kronig, purche' energeticamente permesse, sono di regola le piu' intense. Questo e' in contrasto con il comportamento della probabilita' di transizione radiativa, che cresce con la separazione energetica dei livelli. Per questa ragione, l'effetto Auger e' il meccanismo =206= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dominante di decadimento delle lacune interne degli atomi leggeri, mentre in quelli pesanti domina il decadimento X. Viene in mente un meccanismo alternativo per arrivare da Φi a Φf . Uno degli elettroni j,k potrebbe riempire la lacuna i con un normale processo radiativo, emettendo cioe' un fotone X; questo fotone potrebbe poi causare la fotoemissione del secondo elettrone. Ebbene, anche questo processo esiste, ed ha il nome di fotoemissione interna; a differenza dell'effetto Auger, esso e' soggetto alle regole di selezione ottiche, e per esempio non puo' causare la transizione KL1L1 che invece viene osservata. La probabilita' di transizione della fotoemissione interna e' stata calcolata con la teoria delle perturbazioni, ed il risultato e' che la fotoemissione interna puo' essere tranquillamente trascurata rispetto all'effetto Auger. Uno spettro Auger e' un grafico della corrente in funzione dell'energia cinetica degli elettroni. Per misurare gli spettri di molecole e solidi si usano apparecchi in cui il campione, la sorgente eccitatrice e l'apparato rivelatore-analizzatore degli elettroni si trovano in una camera a vuoto. La sorgente eccitatrice puo' essere un cannone elettronico o una sorgente di raggi X, come negli apparecchi ESCA1. L'analizzatore consiste in un cilindro in cui viene prodotto un campo elettrico radiale; a seconda dell'energia cinetica, gli elettroni vi percorrono traiettorie diverse, e cio' consente di selezionarli in energia ed inviarli ad un rivelatore. Tipicamente, si puo' avere una risoluzione energetica dell'ordine di ∆E/E≈10-2 ; si puo' avere un risultato migliore usando invece un analizzatore emisferico. Le transizioni prese in considerazione per scopo analitico hanno energie comprese fra varie decine e poche migliaia di eV, quindi l'energia di una transizione puo' essere misurata, in casi favorevoli, entro una frazione di eV. Il campione e' di solito una superficie solida, e per limitare il problema della contaminazione da gas residui e' necessario arrivare al vuoto ultra-alto2. Il cammino libero medio degli elettroni in un solido dipende dalla loro energia, ma per le transizioni che si osservano comunemente e' solo di alcuni Å; la tecnica e' quindi sensibile alla superficie. Poiche' dall'energia dei picchi dello spettro si puo' risalire alla specie atomica, la tecnica Auger si presta ad analisi chimiche delle superfici. Con tecniche a scansione, si possono ottenere immagini ingrandite della superficie in cui viene visualizzata la distribuzione di un dato elemento. In effetti, gli atomi che 1acronimo per Electron Spectroscopy for Chemical Analysis. 2se il campione e' un fascio di molecole, e' sufficiente un vuoto basso, che consenta agli elettroni un cammino libero superiore alle dimensioni della camera di misura. =207= Prof. M. Cini -Corso di Fisica Atomica e Molecolare appartengono a molecole e a solidi hanno energie di transizione core-core-core un po' diverse dagli atomi liberi, ed una analisi dettagliata degli spostamenti chimici fornisce ulteriore informazione. Ancora di piu' si puo' imparare dallo studio delle forme di riga Auger di core-valenza-valenza, dal momento che i gusci piu' esterni sono i piu' sensibili ai legami chimici; l'interpretazione delle forme di riga e' attualmente un interessante argomento di ricerca1. La formula originale di Auger fornisce le energie delle transizioni con un errore che puo' essere piccolo in senso relativo, ma e' tipicamente dell'ordine di qualche decina di eV. Un tale errore e' enorme rispetto alla precisione con cui le misure possono essere fatte di routine nei moderni apparati. Il problema principale e' che nello stato finale ci sono due lacune, ed occorre tenere conto della loro repulsione, che sposta i picchi dello spettro e li suddivide in multipletti. Inoltre, ogni transizione diagrammatica (cioe', prevista dalla precedente discussione) ha in realta' vari satelliti, che corrispondono a stati eccitati dello ione finale. Anche la formula di Wentzel si basa su un certo numero di ipotesi che la rendono inadeguata per scopi quantitativi, ed in particolare trascura sia gli effetti di correlazione che quelli relativistici. Si comprende cosi' che una teoria dettagliata degli spettri e' necessariamente complessa, anche nel caso di un campione di atomi liberi. 8-10 Regole di selezione Auger Fra lo stato iniziale |i> e quello finale |f> del sistema totale (incluso l'elettrone Auger) si conservano J2,J z e la parita'. Nella approssimazione LS si conservano anche L2,Lz,S2 e Sz. Nel limite jj puro, gli stati sono etichettati dai j delle due lacune. In prima approssimazione possiamo ignorare le complicazioni che derivano dalla presenza eventuale di gusci di valenza aperti. E' notevole come i diversi schemi diano descrizioni diverse, anche per quanto riguarda il numero di righe: la descrizione piu' generale si ha ovviamente nello schema dell'accoppiamento intermedio. Vediamo il caso piu' semplice. Esempio: transizioni KLL Nello schema jj puro, sono predette le 6 transizioni KL1L1,KL1L2,KL1L3,KL2L2,KL2L3,KL3L3. Parte della degenerazione e' poi risolta dalla interazione Coulombiana. 1per un articolo di rassegna, vedere ad esempio M.Cini, J.Phys.C, Condensed Matter 1 (1989). =208= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Nello schema LS si hanno le Tabella. transizioni elencate nella Configuraz. elettronica L S Termine finale ...................................................................................................... ........................ 2s02p6 0 0 1S ...................................................................................................... ....................... 1 0 1P 1 1 3P 2s12p5 ...................................................................................................... ....................... 2s22p4 0 0 1S 1 1 3P proibita 1D 2 0 ...................................................................................................... ....................... Si noti che dei due termini 3P uno e' permesso e l'altro e' proibito. Infatti, uno stato finale con L=1 dello ione e' accessibile solo se l'elettrone Auger e' in uno stato p, che e' dispari. Ora, 2s12p5 e' anch'esso dispari e la parita' si conserva, mentre 2s22p4 e' pari e la transizione violerebbe la parita'. Pertanto, nello schema LS puro ci si aspetterebbe di vedere 5 transizioni KLL. Una debole interazione spin-orbita, come quella che si ha in atomi leggeri, basta per scindere la transizione 3P permessa ed in tutto le transizioni attese divengono 7. Al crescere dell'interazione spin-orbita, pero', la transizione proibita 2s22p4 3P si scinde in 3P2, 3P1 e 3P0. In accoppiamento intermedio, 3P2 si mescola con 1D2 e 3P0 con 1S0; queste due transizioni divengono percio' sempre piu' permesse =209= Prof. M. Cini -Corso di Fisica Atomica e Molecolare al crescere di Z. Invece, 3P1 rimane puramente P e proibito1. Il numero delle transizioni KLL nel caso generale (intermediate coupling) sale cosi' a 9. Sia per il calcolo delle energie delle transizioni che per quello delle intensita' la teoria non relativistica utilizza l'integrale 1 (ab| |cd) . r12 Le funzioni radiali si ottengono da calcoli autoconsistenti per gli orbitali discreti, ma sono spesso approssimati da onde Coulombiane per gli orbitali nel continuo. Una tale approssimazione si e' dimostrata utile in pratica in un gran numero di casi, ma non e' affatto ovvio come a rigore si debba scegliere il potenziale per descrivere l'elettrone Auger. In realta' non si tratta di un problema stazionario "a un corpo" in cui un unico elettrone si muova in un potenziale esterno locale e ben definito. Entro i limiti di questa approssimazione, le tecniche che abbiamo appreso per il calcolo dei multipletti atomici sono adeguate allo scopo. Ne' puo' sorprendere il fatto che in alcuni casi per avere un buon accordo quantitativo con l'esperimento occorre includere anche l'interazione fra diverse configurazioni. Per esempio, nelle transizioni KLL, il termine 1S0 che viene da 2s02p6 interagisce sensibilmente con termine 1S0 che viene da 2s22p4; cio' ha effetto sia sulle energie che sulle funzioni d'onda, e quindi sulle intensita'. Il calcolo delle intensita' e' piu' semplice se e' possibile approssimare |i> ed |f> come stati a due buche; una delle buche in |i> rappresenta l'elettrone Auger nello stato finale. Non di rado questa e' una utile approssimazione (ad esempio, nei gas nobili, ed in alcuni metalli di transizione). Allora si usa spesso, come ulteriore semplificazione, il 'mixed coupling scheme' , che consiste nel trattare |i> nello schema jj ma |f> in quello LS. Il 'mixed coupling scheme' e' utile in un largo intervallo di Z, quando lo spin-orbita e' piccolo per le buche di valenza mentre e' gia' importante per quelle di core. Ma anche nel caso generale, in cui compaiono vari gusci aperti, i calcoli possono essere fatti con i metodi gia' esposti, anche se potranno risultare assai laboriosi 2. 1Beninteso, purche' si trascuri il debole mescolamento con altre configurazioni. 2E' possibile condensare il procedimento di calcolo delle intensita' in formule chiuse, adatte al calcolo numerico. Le formule risultanti sono di una complessita' inusitata, e l'algebra di Racah che permette di ricavarle e' una teoria matematica bella, ma laboriosa. I metodi di Racah sono di grande aiuto per sistematizzare il procedimento ed eseguire calcoli complessi. Deve essere chiaro pero' che i semplici metodi diretti qui esposti sono fisicamente equivalenti. =210= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Il vero problema fisico e' quello dell'applicabilita' di questa formulazione, che tratta gli effetti relativistici come correzioni ed e' condizionata dal modello a due stadi. Ne riparleremo nei Capitoli 13 e 15. Capitolo 9- Rappresentazioni dei Gruppi Invece di sviluppare la teoria dei Gruppi astratti per poi applicarla alla meccanica quantistica, useremo la meccanica quantistica come introduzione alla teoria della simmetria. 9-1 Simmetrie delle molecole E' molto probabile che il lettore abbia gia' incontrato i Gruppi astratti; e' opportuno pero' richiamare la definizione ed i risultati necessari man mano che sviluppiamo la teoria delle rappresentazioni. Un Gruppo G e' un insieme dotato di una regola di composizione o "moltiplicazione" fra i suoi elementi. Per definizione, il Gruppo e' 'chiuso' rispetto alla moltiplicazione, cioe' a∈G, b∈G ⇒ ab∈G; inoltre vale la proprieta' associativa a(bc)=(ab)c; esiste un elemento e, l'identita', tale che ea=ae=a ∀a∈G; esiste l'inverso di ogni elemento, cioe' a∈G ⇒ ∃ a-1 , aa-1 =a-1 a =e. Non e' necessario, invece, che la moltiplicazione sia commutativa; quando lo e', si dice che il Gruppo e' abeliano. In genere, le matrici e gli operatori quantistici sono oggetti non commutanti, e noi lavoreremo soprattutto con Gruppi non abeliani. Il numero g di elementi si chiama ordine del Gruppo G. H si dice Sottogruppo di G se H e' un sottoinsieme di G che e' ancora un Gruppo. Il Laterale destro di H in G e' un sottoinsieme Hg= {hg,h∈H, g ∈G}. Se g ∉Η, hg ∉H [perche' da hg=h' avrei g=h-1 h'∈Η]. Hg ha h elementi. Prendiamo g2 che non sia ne' in H ne' in Hg : Hg 2 ha h elementi ne' in H ne' in Hg. Proseguendo fino all'esaurimento degli elementi, si trova una partizione di G: H,Hg,Hg 2,....Hgs. Ne segue il Teorema di Lagrange: L'ordine di un sottogruppo H di G e' un divisore dell'ordine di G. Si definisce il Prodotto Diretto AxB di due Gruppi A e B con gli elementi di A tutti diversi ( a parte l'identita' e) da quelli di B e =211= Prof. M. Cini -Corso di Fisica Atomica e Molecolare commutanti con quelli di B: e' il Gruppo che ha per elementi i prodotti ab. Ovvio vedere che e' un Gruppo. Ci occuperemo di Gruppi di simmetria, i cui elementi sono le rotazioni o riflessioni che portano una molecola in uno stato indistinguibile da quello iniziale; tali Gruppi si chiamano puntuali, e le operazioni di simmetria dipendono dalla geometria della molecola. Dapprima tratteremo funzioni d'onda scalari, poi introdurremo lo spin. Le applicazioni dei Gruppi alla meccanica quantistica ben si prestano come introduzione alla teoria generale della simmetria. I nomi dei Gruppi sono puri purissimi accidenti e i vari Autori seguono simbologie diverse 1; cio' che caratterizza un Gruppo sono le operazioni di simmetria. Avremo a che fare solo con rotazioni 2π discrete R n di un angolo intorno ad un asse di ordine n n (denotato con C n ) o riflessioni σ rispetto a un piano. Il piano di simmetria si dice "verticale" se contiene l'asse di simmetria di ordine massimo 2; altrimenti, il piano deve essere ortogonale all'asse e si chiama "orizzontale". Le riflessioni si denotano con σv o σh a seconda del tipo di piano a cui si riferiscono. Sono tutte operazioni semplici ed intuitive; l'unico caso che richiede un minimo di attenzione e' quello delle rotazioni improprie, che si denotano con Sn . Una rotazione impropria e' del tipo Sn =Rn σ, dove il piano di riflessione e' ortogonale all'asse di rotazione. Ora e' ovvio che se c'e' un asse C n ed un piano di simetria ortogonale ad esso, il Gruppo avra' come elementi R n , σ e Sn . Talvolta pero' S n esiste, anche se C n e σ separatamente non esistono. Per esempio, consideriamo l' Etano, CH3 - CH 3. L'asse verticale e' C 3, cioe' tale che la molecola assume 2π una configurazione equivalente con una rotazione di ; con una 3 2π rotazione di otterremmo una configurazione distinta, quindi R6 6 non esiste. 1noi useremo la notazione di Scho "nflies, la piu' usata in fisica molecolare. 2se ce n'e' piu' di uno, la scelta e' arbitraria. =212= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 3 3 2 R 1 6 σ 2 6 6 4 4 5 6 5 3 4 1 2 5 Pero' con una riflessione σ rispetto a un piano ortogonale si porta la molecola in una configurazione indistinguibile da quella originale, quindi S6 esiste. Si puo' notare che S6 = σR6 = R6σ, e l'ordine non ha importanza. Ogni molecola puo' essere attribuita ad uno dei Gruppi puntuali possibili; in tutto, ce ne sono 32. Se uno tralascia qualche operazione di simmetria, ottiene un Gruppo che e' un sottogruppo di quello ottimale, ma non ne consegue alcun errore. L' individuazione precisa del Gruppo piu' grande possibile e' pero' necessaria per un uso ottimale della simmetria. L'attribuzione e' particolarmente semplice se la simmetria e' bassa: C1 ha solo l'identita' E Esempio: C F Cl Br I Cs ha solo E, e la riflessione σh rispetto al piano "orizzontale" della molecola Esempio: ONCl L'attribuzione e' particolarmente semplice anche quando la simmetria e' molto alta: Td se la molecola e' un tetraedro Esempio: CH4 O h se e' un ottaedro Esempio: SF6 Negli altri casi, si sceglie l'asse di simmetria di ordine n piu' alto (in caso di parita', si sceglie arbitrariamente; tutti i Gruppi tranne C1 e Cs ne hanno.) Se la rotazione di ordine n e' impropria, la classificazione e' gia' fatta: il Gruppo e' S n . Ad esempio, il Tetrafenilmetano appartiene ad S4. Altrimenti, se vi sono assi C2 ortogonali all'asse molecolare, il Gruppo e' Dn , se non ve ne sono e' C n . Una molecola del Gruppo D n puo' avere piani di simmetria. Se ne ha di "orizzontali", potremo allargare il Gruppo e chiamarlo Dn h . =213= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Esempio: il Benzene appartiene a D6h Analogamente, se i piani sono verticali, attribuiremo la molecola a Dnd Esempio: l'Allene CH2=C=CH2 appartiene a D2d. Ci si regola analogamente nel caso Cn . Se ci sono piani di simmetria orizzontali il Gruppo e' Cn h Esempio: CHCl = CHCl appartiene a C2h; l'asse e' ⊥ al piano della molecola. Se ci sono piani di simmetria verticali abbiamo Cnv : Esempi: H2O e' C 2v, NH3 e' C3v Una molecola di C n puo' anche non avere piani di simmetria. Tali molecole, come H2O 2, rimangono semplicemente in Cn . Vanno classificate a parte le molecole lineari. Esse appartengono a C∞ v se non hanno un piano di simmetria "orizzontale" (ad esempio: HCl) ed a D ∞ h se ce l'hanno (ad esempio: CO2). 9-2 Operatori di simmetria Indicando con x'y'z' il sistema ruotato di α attorno all'asse z, l'operatore che compie la rotazione in senso attivo e' definito, come sappiamo, da Rα ψ(x,y,z) = ψ(x',y',z')=ψ(xcosα+ysinα,-xsinα+ycosα,z). (1) Sappiamo anche che la rotazione attorno ad un asse arbitrario si ottiene, definendo un vettore, con l'operatore unitario1 R =exp[-i ⋅L/h / ]. (2) Supponiamo che per qualche si abbia [H,R ]=0; allora R e' un operatore di simmetria. .Inoltre potremo avere [H,σ]=0, dove σ e' una opportuna riflessione, [H,i]=0 dove i e' l'inversione. L'altro tipo di operazione che ci capitera' di considerare e' la rotazione impropria, usualmente denotata da S. Quando una molecola ha come operazioni di simmetria un R ed una riflessione σ in un piano ortogonale ad il prodotto S = R σ e' anch'essa una operazione di simmetria. Come si e' visto, si danno anche casi in cui S esiste come simmetria mentre σ e R non esistono. Sia ora S un generico operatore di simmetria. Scelta una base, potremo rappresentarlo su di essa con una matrice Dµν (S) = (ψµ |S| ψν ), (3) e quindi potremo scrivere S |ψν ) = ∑ |ψµ ) D µν (S). (4) µ Se abbiamo due operatori di simmetria R e S, anche [RS,H]=0. Notiamo che 1Ogni operatore R di simmetria deve essere unitario (R†=R-1 ) perche' conserva la normalizzazione. =214= Prof. M. Cini -Corso di Fisica Atomica e Molecolare RS |ψν )= R ∑ |ψµ ) D µν (S) = ∑ ∑ |ψρ ) D ρµ(R) Dµν (S) = µ ρ µ ∑ |ψρ ) D ρν(RS) ρ (5) con Dρν(RS) = ∑ Dρµ(R) Dµν (S). (6) µ Quindi le matrici si moltiplicano come gli operatori, nel medesimo ordine. Esse sono una rappresentazione del Gruppo. Il problema piu' importante della meccanica quantistica e' quello di diagonalizzare l'Hamiltoniano H, cioe' la sua matrice di elementi (Ψ µ |H| ψν ). Nei casi piu' semplici, gli operatori di simmetria commutano tutti fra loro, e possiamo diagonalizzarli simultaneamente ad H. In questo caso, sceglieremo la base in modo che essi siano gia' diagonali. Allora, potremo limitarci a diagonalizzare H in ciascun sottospazio dello spazio di Hilbert che si ottiene etichettando gli stati con le costanti del moto. Potremo cosi' trarre dalla simmetria il massimo della semplificazione senza alcun bisogno della teoria dei Gruppi. I nomi dei Gruppi servono allora solo come acronimi per indicare il tipo di simmetria, e non occorre sapere altro. Esempio:il Gruppo C2v (il Gruppo di H2O, CH 2O, etc.) Supponiamo di voler calcolare gli stati elettronici della molecola d'acqua. Ponendo l'asse molecolare parallelo all'asse z, e gli H sul piano yz, abbiamo le seguenti operazioni di simmetria, ed i seguenti effetti: z O y H H x C2 rotazione di 180 0 attorno all'asse: xyz→-x-yz σv (xz) riflessione sul piano xz: xyz→x-yz σ' v (yz) riflessione sul piano yz xyz→−xyz. =215= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Si vede subito che tutte le operazioni commutano, e che tuttehanno come quadrato la trasformazione identica E. Ne consegue che hanno autovalori ±1 e che gli autostati di H potranno essere classificati come pari o dispari. Se la base prescelta {ψν } non fosse gia' adatta alla simmetria [cioe' se le funzioni di base non fossero gia' pari o dispari rispetto a C2 ed ai σ] potremmo costruire una base adatta con le funzioni 1 1 1 [ψν ±C2ψν ], [ψν ±σv ψν ], [ψν ±σ' v ψν ]. 2 2 2 Ma in generale, quando gli operatori di simmetria non commutano tutti fra loro, non e' possibile diagonalizzarli simultaneamente. E' in questi casi che, per sfruttare appieno la simmetria, occorre la teoria dei Gruppi1. Esempio: il Gruppo C3v ( il Gruppo di NH3) N si trova "sopra" il centro di un triangolo equilatero con ai vertici i tre H. L'asse di simmetria passa per il centro e per N. Gli elementi di simmetria sono la rotazione C3 intorno all'asse di 2π/3 ed il suo quadrato C32. Poi abbiamo tre piani "verticali', ciascuno contenente il centro ed uno dei tre H. Siano a,b,c le etichette dei tre H e σa,σb e σc le riflessioni in questi piani. A questo punto si deve convenire un senso di rotazione: si puo' prendere arbitrariamente, con l'Azoto sopra la pagina, C3(abc)=(cab); Per le riflessioni, si intende che σa(abc)=(acb); si conviene anche che gli elementi di simmetria (in particolare, i piani) non si spostino durante le operazioni di simmetria. Cosi' ad esempio σaC3(abc)=σa(cab)=(cba). Si nota cosi' che σaC3 = σb. Inoltre, C3σa = σc ≠ σaC3. E' solo con assi binari che gli operatori commutano tutti. Denotando con I la trasformazione identica, la tabella di moltiplicazione del Gruppo C3v e' data dalla seguente Tabella. Ogni riga ed ogni colonna contengono tutti gli elementi del Gruppo, sia pure in ordine diverso. Questo risultato deve valere per un Gruppo arbitrario, di g elementi, ed e' noto come rearrangement theorem. In effetti, ogni riga [colonna] ha g elementi, e questi sono tutti distinti perche', ad esempio, C3X = C3Y ⇒X=Y. I I C3 C32 σa σb σc I C3 C32 σa σb σc 1Studieremo in maggiore dettaglio il caso di H O nel seguito. 2 =216= Prof. M. Cini -Corso di Fisica Atomica e Molecolare C3 C32 σa σb σc C3 C32 σa σb σc C32 I σb σc σa I C3 σc σa σb σc σb Ι C32 C3 σa σc C3 I C32 σb σa C32 C3 I I vari elementi del Gruppo non fanno altro, in definitiva, che permutare fra loro i vertici del triangolo nei vari modi possibili. Questo e' il teorema di Cayley che dice che ogni Gruppo finito di ordine N e' isomorfo con un sottogruppo di SN, che e' il Gruppo delle permutazioni di N oggetti. Il metodo elementare che nel caso del Gruppo C2v era adeguato ottiene scarso successo con il C3v. Potremmo diagonalizzare simultaneamente con H solo C 3 (e C32, ma cio' non aggiungerebbe nulla) oppure una delle σ. In tutti i casi, il metodo elementare trascura la maggior parte dell'informazione sulla simmetria, e l'uso dei metodi gruppali si impone. Riprenderemo dopo il problema dell'Ammoniaca. Ora ci occorre un altro esempio per illustrare il fatto che i metodi della teoria dei Gruppi sono necessari per ottenere non tanto gli orbitali molecolari ma le costanti del moto. .9-3 Modello di Huckel del Benzene: metodo elementare Nel metodo di Huckel, si cercano 6 orbitali molecolari (denotati dall'indice i) come combinazione di 6 orbitali φ dove pz l'asse z e' ortogonale al piano della molecola. Dobbiamo risolvere x c µi + i=1,...6 (1) ∑ c νi =0, ν=µ±1 dove x e' l'energia resa adimensionale, e l'equazione secolare e' det x1 1x 01 00 00 10 0 1 x 1 0 0 0 0 1 x 1 0 =0. 0 0 0 1 x 1 1 0 0 0 1 x (2) Benche' non sia difficile espandere, e' piu' opportuno rifarsi alla simmetria D 6h della molecola. Ma, con un minimo di accortezza, la teoria dei Gruppi non e' affatto necessaria. =217= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 2 6 5 3 4 L'operazione di simmetria che coinvolge nel modo piu' semplice piu' coefficienti c e' una rotazione di π; chiamiamola R. 1 4 2 6 3 5 R 5 3 6 2 4 1 Poiche' R2=1, le soluzioni sono pari o dispari ed e' evidente che ci sono due casi: a) c 1=c 4 c 2=c 5 c 3 =c 6 xc 1+c 2+c 3=0 xc 2+c 1+c 3=0 xc 3+c 2+c 1=0 ≡ xc 3+c 2+c 4=0 e poi la sequenza si ripete, oppure b) c 1=-c 4 c 2=-c 5 c 3 =-c 6 xc 1+c 2-c 3=0 xc 2+c 1+c 3=0 xc 3+c 2-c 1=0 ≡ xc 3+c 2+c 4=0 e poi la sequenza si ripete. Cosi' abbiamo due sistemi 3x3. Ma volendo, possiamo spezzare ancora, con la simmetria σv di riflessione rispetto al piano perpendicolare a quello della molecola che passa per 5 e 2. =218= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 2 6 5 3 4 Si controlla agevolmente che [R,σ]=0; infatti applicando prima R e poi σ si ha (1 2 3 4 5 6) → (4 5 6 1 2 3) → (6 5 4 3 2 1) mentre applicando prima σ e poi R si trova (1 2 3 4 5 6) → (3 2 1 6 5 4) → (6 5 4 3 2 1) che e' lo stesso. Ciascun caso si spezza allora nei sottocasi 1) c1=c 3 2) c 1=-c 3. Si trovano facilmente gli stati, ed i livelli; questi corrispondono al seguente schema, dove b2g ,e 2u,etc. sono simboli gruppali che saranno spiegati nel seguito: x=2 O b2g } antileganti x=1 O O e2u x=-1 O O e1g } leganti x=-2 O a2u lo stato fondamentale ha la configurazione (a2u) 2(e g ) 4, l'energia e' E= 6α+8β e l'energia di stabilizzazione e' 2β. Le ψ sono cosi' ottenute. Perche' dedicarsi ad uno studio piu' approfondito della simmetria? C'e' una serie di ragioni. 1) Esistono molti problemi altamente simmetrici, ma ben piu' complicati di questo, dove i metodi gruppali offrono importantissimi vantaggi computazionali. La separazione fra =219= Prof. M. Cini -Corso di Fisica Atomica e Molecolare semplificazioni computazionali e concettuali non e' cosi' netta come puo' sembrare a prima vista. 2) E' molto importante risolvere e codificare a parte gli aspetti legati alla simmetria, separandoli da quelli legati alla dinamica. Gli aspetti legati alla simmetria sono sempre gli stessi e non e' il caso di inventarli di nuovo in tutti i problemi simili. 3)La teoria dei gruppi offre uno schema teorico ed anche una notazione che si ritrova poi in tutti i campi della fisica. Questo ha importanti aspetti semantici e di unificazione culturale di contesti disparati. In particolare, non si leggono molti lavori di fisica molecolare se non si acquisisce l'essenziale di questo linguaggio. 4)Quando l'informazione dinamica e' incompleta, l'uso della simmetria e' essenziale per impostare e parametrizzare i problemi. Questo e' vero in molecole complicate come in Fisica delle particelle elementari. 5)Anche in un problema semplice come quello degli orbitali di Huckel del Benzene, e' rimasto in realta', a dispetto delle apparenze, molto da desiderare. Noi abbiamo classificato le ψ con gli autovalori ±1 di R e di σ. Abbiamo ottenuta la corrispondenza seguente fra autovalori e livelli: R σ - + x simbolo gruppale 2 - 1 + - - -1 + + b2g + + -2 e2u e1g a2u + Lo schema dei livelli non corrisponde alle etichette R e σ. Questi sono buoni numeri quantici, ma lo schema dipende evidentemente da altri numeri quantici che la precedente analisi non rivela. In effetti, la teoria dei Gruppi non dice nulla sugli aspetti quantitativi del problema, come le energie; ma mostra che tutti gli aspetti =220= Prof. M. Cini -Corso di Fisica Atomica e Molecolare qualitativi dello schema dei livelli sono dettati dalla simmetria. Ogni simbolo gruppale corrisponde ad un diverso insieme di buoni numeri quantici. Ora, a seconda dell'uso che vogliamo fare delle funzioni d'onda, puo' essere molto importante conoscere tutte le costanti del moto che contraddistinguono gli stati. Per esempio, potremmo voler dire qualcosa sugli elementi di matrice di un operatore di cui si conoscano solo le proprieta' di simmetria. Per fare una analogia, possiamo pensare al moto di una particella in un campo centrale: allora uno constata che [Li ,H]=0, ma [Li ,Lj ] = i εijk Lk . Quello che noi abbiamo fatto finora corrisponde alla scelta di diagonalizzare insieme H e Lz. Per capire lo spettro dell'atomo di Idrogeno e' allora molto utile scoprire che c'e' una funzione degli Li , e cioe' L2, che commuta con L z e con H e fornisce un altro buon numero quantico. 9-4 Caratteri di Dirac e rappresentazioni irriducibili Dobbiamo quindi trovare funzioni degli operatori T del Gruppo G che commutino (oltreche' con H, fatto questo scontato perche' [T,H]=0) con tutti gli altri elementi S∈G. Potremmo considerare potenze T k o prodotti TT' arbitrari, ma poiche' il prodotto di due elementi di G e' ancora un elemento di G, la piu' generale funzione e' una combinazione lineare. g Una buona idea e' prendere Ω = ∑ T , che intuitivamente T∈G deve essere un oggetto totalsimmetrico. In effetti, si e' gia' osservato nel paragrafo precedente che tutti gli operatori del Gruppo si trovano, in ordine diverso, su tutte le righe e su tutte le colonne (rearrangement theorem). Questo ci dice che ∑TS= ∑T . (1) T∈G T∈G Lo stesso discorso si puo' fare a proposito dei prodotti ST, e porta alla conclusione che S ∑T T∈G = ∑T T∈G ; (2) ∑ T commuta con ogni operatore del Gruppo. Poiche' T∈G [Ω,H]=0, Ω e' una costante del moto simultanea con qualsivoglia T∈G, e ci da' un nuovo numero quantico. quindi Ω = =221= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ma in effetti possiamo fare ancora di meglio, introducendo il concetto di classe . Due operatori A e B sono coniugati, cioe' appartengono alla stessa classe, se esiste un qualche X∈G tale che A = X-1 BX. (3) Fisicamente questo significa, in termini intuitivi, che eseguire A equivale a trasferirsi in un sistema di riferimento accessibile con una operazione di simmetria X, eseguire B e poi "tornare indietro" con X -1 . Cosi' ad esempio C3v ha 3 classi di operazioni, di cui una contiene I, un'altra C3 e C32 e la terza le riflessioni. Con la tabella di moltiplicazione del Gruppo si puo' agevolmente verificare che se B e' una rotazione anche A lo e', e se B e' una riflessione anche A lo e'. Cio' corrisponde alla nozione intuitiva che operazioni "di tipo diverso" stanno in classi diverse per ogni Gruppo1. Definiamo per ogni classe C, contenente n c elementi, il carattere di Dirac nC Ωc = ∑ T . (4) T∈C Ora, ∀X,∈G, X-1 Ωc X = nC ∑ X -1 TX , ma X-1 TX appartiene alla classe C; T∈C la somma contiene nC termini; questi termini sono tutti distinti perche' X -1 TX=X-1 T'X ⇒ T=T'; ne consegue che X -1 Ωc X = Ωc . In altri termini, Ωc commuta con tutti gli X∈G e per ogni classe abbiamo una costante del moto. Per il Gruppo C3v si hanno i seguenti caratteri: ΩI = I ΩR = C3 + C32 Ωσ = σa +σb +σc . Questi operatori sono tutti diagonalizzabili simultaneamente, e ci interessa innanzitutto di trovare gli autovalori, con i quali potremo poi etichettare gli stati. Il metodo migliore e' quello di determinare relazioni fra gli operatori; queste infatti devono essere obbedite identicamente dai loro autovalori, e permettono di determinarli. Il fatto che gli Ωc si possano diagonalizzare insieme tuttavia non significa che gli autovalori associati ad ogni operatore sono indipendenti gli uni dagli altri. Come vedremo subito, sono ammesse solo certe combinazioni di ωc , ed a ogni combinazione corrisponde un tipo di simmetria diverso. Per chiarire la situazione, utilizziamo l'esempio del Gruppo C3v. ΩI ha autovalore ωI =1. Si ha poi,dalla tabella di moltiplicazione, ΩR 2= (C3+C32)(C 3+C32)= C32+C33+C33+C34= 1per i Gruppi commutativi ovviamente ogni elemento fa' classe a se'. =222= Prof. M. Cini -Corso di Fisica Atomica e Molecolare =C32 +I+I+C3 = 2ΩI +ΩR . Ωσ2 = (σa +σb +σc )(σa +σb +σc )= =σa2+σaσb+σaσc +σbσa+σb2+σbσc +σc σa+σc σb+σc 2= =I + C3 +C32 + C32 +I + C3 + C3 + C32 +I = 3ΩI + 3ΩR . Ne consegue che gli autovalori sono dati da ωR 2= 2 + ωR ωσ2 = 3+3ωR . La prima ha radici ωR = 2, ωR = -1. Per ωR =2, la seconda da' ωσ2=9 ⇒ωσ=±3, mentre per ωR =-1 ωσ =0. Le combinazioni ammesse sono le seguenti: ωI =1 ωI =1 ωI =1 ωR =2 ωR =2 ωR =-1 ωσ =3 ωσ =-3 ωσ =0. oppure oppure (5) (6) (7) Ad ogni combinazione corrisponde un tipo diverso di simmetria. Tutte le funzioni appartenenti a un dato tipo di simmetria sono caratterizzate dagli stessi ωc . Tutti gli autostati di H devono appartenere a una di loro Autostati di tipo diverso non vengono mescolati dalle operazioni del Gruppo perche' ∀X∈G, Ωc |Ψ>=ωc |Ψ>→Ωc X|Ψ>=ωc X|Ψ>. La scelta (5) corrisponde a caratteri uguali al numero di elementi della classe, cioe' ωc =nc . Essa e' adatta alle funzioni d'onda totalsimmetriche, che sono autostati di tutti gli X∈G con autovalori 1. Su queste autofunzioni, si ottiene la rappresentazione banale del Gruppo sostituendo ogni operatore con la moltiplicazione per 1: con cio' , la tabella di moltiplicazione del Gruppo e' banalmente soddisfatta. Tutti i Gruppi hanno la rappresentazione banale, ed anche altre che, come la (6), corrispondono a caratteri uguali, a parte il segno, al numero di elementi della classe, cioe' ωc =±nc . In questi casi ogni operatore e' rappresentato da ±1, e le combinazioni possibili dei segni sono quelle che rispettano la la tabella di moltiplicazione del Gruppo. Il tipo di simmetria corrisponde evidentemente alla scelta di autofunzioni simmetriche o antisimmetriche rispetto agli X∈G. Ma nei Gruppi non commutativi non e' in genere possibile rappresentare gli operatori con numeri, ed un esempio e' fornito dalla (7). Ricorreremo allora a matrici mxm, e la rappresentazione di m piu' basso che soddisfa la tabella di moltiplicazione e corrisponde ad una data scelta degli ωc si chiama rappresentazione =223= Prof. M. Cini -Corso di Fisica Atomica e Molecolare irriducibile ( o irrep) del Gruppo1. La (7) si ottiene con m=2, prendendo -1/2 - 3/2 -1/2 3/2 1 0 , σ = -1 0 , 2 I= 0 1 , C3= , C3 = a 0 1 3/2 -1/2 - 3/2 -1/2 1/2 . 3/2 1 / 2 - 3/2 . 2 σb= σaC3= , σc=σaC3 = 3/2 -1/2 - 3/2 -1/2 E' immediato controllare che la tabella di moltiplicazione del Gruppo e' obbedita. Queste matrici eseguono rotazioni e riflessioni nel piano, e la base di questa irrep consta di una coppia di funzioni (Ψ x,Ψ y ), che si trasforma come la coppia (x,y). Quanto all'Hamiltoniano, gia' sappiamo che deve essere diagonale in questa base, e quindi deve aversi HΨ x=εxΨ x, HΨ y =εy Ψ y . E' facile vedere εx=εy . Infatti, ogni S∈G trasforma Ψ x in una combinazione lineare SΨ x=αΨ x+βΨ y , e poiche' [S,H]- =0, SΨ x deve corrispondere allo stesso ε. Ne consegue che l'autovalore corrispondente ad una irrep degenere (m>1) deve essere degenere. Con una trasformazione unitaria, possiamo cambiare base e matrici in modo da continuare a rispettare le tabelle di moltiplicazione e mantenere gli stessi ωc . Prendendo combinazioni lineari delle basi di due o piu' rappesentazioni irriducibili, si ottiene una base di una nuova rappresentazione del Gruppo; viceversa, una generica rappresentazione puo' essere 'ridotta' con una trasformazione unitaria, separando la base in parti che non vengono mescolate da alcuna operazione di simmetria. In tal modo, e' possibile porre tutti i rappresentativi in una forma "a blocchi", ciascuno dei quali appartiene ad una irrep. Ma in una irrep, la base non puo' essere separata in parti che non vengono mescolate da alcuna operazione di simmetria. Essa infatti e' per definizione la piu' 'piccola' rappresentazione che ha i numeri quantici ωc prescelti 2. Come si e' visto, i rappresentativi di H e dei caratteri di Dirac devono essere diagonali, ed avere elementi diagonali tutti uguali. La proprieta' degli Ωc e di H di avere rappresentativi multipli dell'unita' e' di solito dimostrata come una conseguenza del fatto che essi devono commutare con tutti i Dµν (R). Vale infatti il lemma di Schur: una matrice che commuta con tutte le matrici di una IRREP deve essere un multiplo dell'unita'.In sostanza, il lemma dice che nella IRREP, una matrice che commuta con tutte rappresenta l'elemento identita', che e' l'unico che commuta con 1Nel caso di un Gruppo abeliano, cioe' commutativo, i rappresentativi si riducono a semplici numeri e m=1. La discussione seguente e' necessaria se m>1. 2Si intende che d'ora in poi considereremo identiche le rappresentazioni che differiscono solo per una trasformazione unitaria, ed hanno quindi gli stessi caratteri. =224= Prof. M. Cini -Corso di Fisica Atomica e Molecolare tutti gli elementi del Gruppo. Noi siamo arrivati alla stessa conclusione per altra via. Data la grande importanza del lemma, noi ne daremo anche la dimostrazione standard1 , che fa' vedere che si tratta di una semplice questione di algebra. Dimostrazione del lemma di Schur Cominciamo dal caso di una matrice diagonale e poi generalizziamo. Sia dunque D una matrice diagonale di elementi dµν =dµδµν ed imponiamo che commuti con una generica matrice A di elementi aµν : [A,D]µν = aµν(dµ-dν )=0 = aνµ(dµ-dν ), ∀µ,ν. Se D e' costante, cioe' multipla dell'unita', la condizione e' soddisfatta senza che cio' ponga limiti alla struttura di A. Supponiamo che invece d1-dν ≠0, ν=2,...m. Allora deve essere a1ν =aν1=0, ν=2,...m, e questo implica che A deve avere una struttura a blocchi, con l'elemento 11 isolato dagli altri. Se vi fossero piu' differenze (dµ-dν ) non nulle, a maggior ragione A dovrebbe essere a blocchi, o addirittura diagonale. Per una sola A, cio' puo' accadere. Ma se A e' una delle g matrici A (i) di una irrep, D non puo' commutare con tutte, senza essere costante, perche' altrimenti tutte le matrici avrebbero la stessa struttura a blocchi, e la rappresentazione sarebbe di fatto ridotta. Nel caso 2X2, [ A,D ] = 0 a21 (d1 − d2 ) a12 (d2 − d1 ) ; quindi se d1≠ d2 , A deve essere diagonale, 0 e cio' non puo' essere vero per tutte le A. Nel caso 3X3, 0 [ A,D ] = a21 (d1 − d2 ) a31 (d1 − d3 ) Se d1≠d2 e d1≠ d3 a11 A = 0 0 0 a22 a32 a12 ( d2 − d1 ) 0 a32 ( d2 − d3 ) a13 ( d3 − d1 ) a23 ( d3 − d2 ) . 0 0 a23 a33 e se cio' vale per tutte la irrep e' blocchizzata. Resta da vedere che ci possiamo sempre ridurre al caso diagonale. Se facessimo l'ipotesi piu' debole che la matrice e' hermitiana, sapremmo che esiste almeno una base che la rende diagonale; concluderemmo che la matrice e' costante e che rimane tale per trasformazioni unitarie. Possiamo fare a meno anche di supporre a priori l'hermiticita'. Se M e' una matrice che commuta con tutte le A(i) , anche M† commuta; infatti, prendendo il coniugato hermitiano di A (i) M=MA(i) , si trova M† A (i) † =A(i) † M† ; moltiplicando a sinistra e a destra per A(i) ed usando il fatto che queste ultime sono unitarie, si trova appunto che A (i) M† =M† A (i) ; quindi devono commutare anche le matrici hermitiane 1 in sostanza quella che si trova sul libro di M. Tinkham, "Group Theory and Quantum Mechanics", Mc.Graw-Hill (1964). =225= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H1=M+M† e H2=-i(M-M † ). Ma allora H1 e H2 saranno costanti, e lo sara' anche M=(H1-iH 2)/2. Con cio', il lemma e' dimostrato. Poiche' le matrici di H e degli Ωc sono multiple dell'unita', le loro tracce sono Tr(H) = ε m , Tr(ΩI ) = m, Tr(Ωc ) = m ωc . (8) Tutti i rappresentativi degli elementi di una classe C hanno la stessa traccia. Infatti, la traccia di una matrice e' invariante per trasformazioni unitarie, e gli operatori A,B∈C sono coniugati, cioe' legati da trasformazioni unitarie del tipo A = X-1 BX. Il numero ∑ µ D µµ (A) = ∑ µ D µµ (B) = χ(C) (9) si chiama carattere, ed e' distinto dal carattere di Dirac. Peraltro con esso e' strettamente legato. Infatti, indicando con nc il numero di elementi in C Ωc = nc ∑T ⇒ Tr(Ωc ) = m ω c = nc χ(c) ⇒ χ(c) = mω c . nc (10) T∈C Ogni gruppo ha un piccolo numero di RAPPRESENTAZIONI IRRIDUCIBILI1 (si puo' dimostrare che il loro numero e' uguale a quello delle classi). Per ogni Gruppo e per ogni IRREP i caratteri χ(c) sono tabulati. Esercizio: scrivere la tabella dei caratteri per C 3v. Ora, il problema di diagonalizzare H si spezza finalmente in tanti sottoproblemi, in ciascuno dei quali gli autostati vanno ricercati fra le funzioni di base di una data irrep. Potremo inoltre diagonalizzare un set di elementi S∈G mutuamente compatibili2. 9-5 Simmetria e degenerazione Supponiamo che H abbia un livello d volte degenere con autovalore ε ed autostati ψ 1 ⋅⋅⋅ψ d. Le considerazioni precedenti sono immediatamente utili se conosciamo una delle soluzioni, ad esempio ψ 1, corrispondente a un ε ed a uno delle possibili scelte di ωc . Tutte le g funzioni XΨ con X∈G hanno lo stesso ε e gli stessi ωc , e possiamo combinarle per formare una base della irrep a cui appartiene ψ 1. In generale, queste funzioni non sono tutte linearmente indipendenti: con un procedimento di ortogonalizzazione, si potra' costruire una base ψ 1 ⋅⋅⋅ψ m di autostati 1 Che ne esiste solo un piccolo numero lo vedremo prossimamente. 2Nei Gruppi piu' complessi il set comprende piu' operatori, e la sua scelta e' in parte arbitraria. Ovviamente in tutti i casi almeno un elemento di G puo' essere inserito fra le costanti del moto. =226= Prof. M. Cini -Corso di Fisica Atomica e Molecolare appartenenti tutti all'autovalore ε. Di combinazioni indipendenti ne troveremo esattamente m, perche' m e' la degenerazione della irrep. La degenerazione effettiva d del livello non puo' essere inferiore a m. Se d>m, parte della degenerazione rimane inspiegata, e si parla di degenerazione accidentale. Come puo' accadere che autostati differenti di H sono esattamente degeneri? Che due energie risultino esattamente uguali senza che ci sia un motivo di simmetria e' un evento di probabilita' zero: bisogna che l'hamiltoniano dipenda da un parametro e questo sia fissato ad hoc con infinita precisione. In questo senso, si puo' dire che la degenerazione e' dettata unicamente dalla simmetria. Quando si verifica una degenerazione accidentale, e' segno che stiamo usando un sottogruppo del Gruppo ottimale: alcuni elementi di simmetria non sono stati considerati, o non sono stati ancora scoperti. Ad esempio, nello studio dell'atomo di H non relativistico, si trova che gli autovalori sono indipendenti da L, mentre la simmetria spaziale giustifica solo l'indipendenza da ML . La degenerazione accidentale e' spiegata da una simmetria dinamica, specifica del potenziale 1/r. Nel problema classico di Keplero, con p2 κ Hamiltoniana H= - , il vettore di Runge-Lenz 2m r p∧L r M= -κ (1) m r e' diretto dal "sole" al perielio dell'orbita ed e' una costante del moto. Quantisticamente, si ha la costante del moto p∧L-L∧p r M= -κ (2) 2m r che giustifica la degenerazione extra 1. Nel caso relativistico, l'operatore di Dirac-Coulomb -Ze 2 H = c ⋅p + βmc 2 + , |r| commuta con l'operatore di Biedenharn-Johnson-Lippman (BJL) i -Ze 2 Σ⋅r 2 B= K γ (H-βmc ) + , 5 mc 2 c |r| dove 0 1 γ5 = 1 0 , K = β (Σ⋅L +1). Questo e' il motivo per cui le energie sono indipendenti dal segno di K. Quindi affermiamo che sono degeneri solo gli autostati che si mescolano fra loro per simmetria. Allora la simmetria deve 1La questione e' discussa in dettaglio da Leonard I. Schiff, Quantum Mechanics, McGraw-Hill Book Company, New York Cap.7. =227= Prof. M. Cini -Corso di Fisica Atomica e Molecolare mescolarli tutti, e non e' possibile ridurre il problema a sottoproblemi piu' semplici. Il set di autofunzioni degeneri ψ ν , ν=1,⋅⋅⋅m appartenenti ad un autovalore ε e' caratterizzato da una certa combinazione di ωc ed e' base di una irrep del Gruppo. Come sappiamo, rappresentativi di H e dei caratteri di Dirac sono multipli dell'identita' mXm. Gli autostati sono individuati solo a meno di una trasformazione unitaria: abbiamo ancora in generale una certa arbitrarieta' nella scelta dell'operatore (o degli operatori) del Gruppo che possiamo simultaneamente diagonalizzare. Fatta la scelta come piu' ci aggrada, la base ψ ν , ν=1,⋅⋅⋅m e' determinata, e tutti gli operatori hanno una matrice univoca. I rappresentativi Dµν (R) sono matrici quadrate, alcune delle quali possono essere diagonali. Alcuni rappresentativi devono comunque avere elementi fuori diagonale, perche' le funzioni di base devono tutte essere mischiate da operazioni di simmetria. Se fosse possibile trovare una trasformazione unitaria tale da porre tutti i rappresentativi in una forma "a blocchi", separando la base in parti che non vengono mescolate da alcuna operazione di simmetria, questo vorrebbe dire che la nostra rappresentazione era in realta' riducibile. Sappiamo ora costruire la base e le matrici dei rappresentativi, ma per cominciare abbiamo bisogno di conoscere una delle Ψ. La tecnica per ottenerla richiede la dimostrazione di alcuni teoremi. 9-6 Grande Teorema di ortogonalita(GOT) Va sotto il nome di GOT il risultato centrale della teoria delle rappresentazioni dei Gruppi. Si tratta di un teorema di ortogonalita' fra i rappresentativi delle operazioni di simmetria nelle varie rappresentazioni irriducibili, ed e' estremamente potente, perche' i rappresentativi risultano essere ortogonali in tutti i loro indici. Facciamo qualche osservazione preliminare. Osservazione 1. Supponiamo di avere diagonalizzato H, e di aver trovato un livello m volte degenere, con autostati φµ. Allora {φµ} e' una base di una irrep, diciamo la i-esima. Quindi scriveremo mi , φµi , ed i rappresentativi saranno denotati da Di µν (R). Siano allora ψνj le funzioni di base di una irrep (la stessa o un'altra); per esempio, supponiamo di aver perturbato H con una perturbazione della sua stessa simmetria, di aver diagonalizzato di nuovo, e di avere scelto un autovalore, a cui corrisponderanno mj , ψν j e D j µν (R). Dato un operatore invariante (cioe' totalsimmetrico) I, deve aversi <φµi | I | ψν j > = 0 se i≠j, perche' allora I | ψν j > e |φµi > hanno buoni numeri quantici diversi. Se i=j, poiche' [I,R]=[I,Ωc ]=0 ∀R,Ωc , la matrice <φµi | I | φν i > deve commutare con tutti i Di µν (R) , e per il lemma di Schur deve essere <φµi | I | φν i > = I(i) δµν . In definitiva, =228= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <φµi | I | ψν j > = I(i) δij δµν . (1) Gli elementi diagonali possono dipendere da i , ma non da µ. Consideriamo ad esempio le coordinate (x,y,z) , ovvero le corrispondenti 3 componenti di un orbitale p scritto in forma cartesiana. La tabella dei caratteri del Gruppo cubico Oh mostra che (x,y,z) si trasformano come una base della irrep T1u. Applichiamo il risultato appena dimostrato al problema di due set di autostati imperturbati che hanno la simmetria degli orbitali p, φ 1(r ) = xf(r) φ 2(r ) = yf(r) φ 3(r ) = zf(r) ψ1(r ) = xg(r) ψ2(r ) = yg(r) ψ3(r ) = zg(r) , soggetti ad una perturbazione sfericosimmetrica V(r). Il fattore δij comporta che V non ha elementi di matrice fra questi stati e stati s,d,f, etc. Il fattore δµν implica che ∫ dr xf(r)V(r)yg(r) =0, e simili. L'indipendenza dagli indici µ e ν vuol dire che i 3 elementi di matrice non nulli sono uguali. Osservazione 2.Consideriamo ora un operatore X qualsiasi. Possiamo prenderlo dissimmetrico, strano e irregolare quanto ci pare: con esso, possiamo costruire comunque un operatore invariante, cioe' I= ∑ R R -1 X R. (2) L'invarianza di I e' di immediata verifica: ∀Τ∈G, IT = ∑ R -1 X R T = TT-1 ∑ R -1 X R T = R R =T ∑ ( T -1 R-1 )X R T = T ∑ (RT) -1X R T = TI. (3) R R Osservazione 3. Riprendiamo la IRREP bidimensionale (m=2) di C3v. -1/2 - 3/2 1 0 ; C 2= -1/2 3/2 ; σ = -1 0 , I= 0 1 , C3= 3 a 0 1 3/2 -1/2 - 3/2 -1/2 1/2 . 3/2 , σ = 1 / 2 - 3/2 . σb= 3/2 -1/2 c= - 3/2 -1/2 L'operazione C32 e' l'inversa di C3 e la sua matrice e' la trasposta. E' generale. Infatti, R-1 =R† e Dj µ'ν'(R)*= <ψµ'j|R|ψν'j>*= <ψν'j|R† |ψµ'j>=<ψν'j|R-1 |ψµ'j>=Dj ν'µ'(R-1 ); cioe', prendere il complesso coniugato e' come prendere l'operatore inverso e scambiare gli indici. Osservazione 4. (esempio di GOT) Formiamo vettori a g=6 componenti con gli elementi nel modo seguente: =229= Prof. M. Cini -Corso di Fisica Atomica e Molecolare el. 11 (1,-1/2,-1/2,-1,1/2,1/2); el. 12 (0,- 3/2, 3/2,0, 3/2,- 3/2,); el. 21 (0, 3/2,- 3/2,0, 3/2,- 3/2,); el. 22 (1,-1/2,-1/2,1,-1/2,-1/2); notiamo che sono tutti normalizzati a 3=g/m e ortogonali fra loro; inoltre sono ortogonali ai vettori analoghi ottenibili da A1 e A2 A1 (1,1,1,1,1,1); A2 (1,1,1,-1,-1,-1). Veniamo ora al GOT: ∑ R D i µν (R) * Dj µ'ν'(R) = g δ δ δ . mi ij µµ' νν' (4) Per dimostrarlo, facciamo intervenire i D nella (1), ricordando che Rψν j = ∑ µ ψµj Dj µν (R) e prendiamo I nella forma (2), con X qualsiasi. Un calcolo diretto da' <φν i | I | ψν'j > = ∑ < φν i | R† X R | ψν'j >, R dove si e' tenuto conto che R-1 = R† . Poiche' R|ψν'j > = ∑ ρ | ψρj > Dj ρν'(R)⇒<φν i | R† = ∑ σ < φσi | Di σν (R) * si ha <φν i | I | ψν'j > = Dobbiamo eliminare < φσi | X ∑ ∑ ρσ R ∑ ρσ | ψρj >Dj ρν'(R)Di σν (R) * . e l'elemento di matrice. Ma X e' qualsiasi, e non occorre nemmeno che sia Hermitiano. Possiamo anche scegliere arbitrariamente µ e µ' e prendere l'operatore di proiezione generalizzato X ≡Xµµ ' = | φµi ><ψµ' j | (5) con la conseguenza che <φσi | X | ψρ j > = δµσδµ'ρ. Cosi' possiamo concludere che =230= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∑ D j µ'ν'(R)Di µν (R) * =Q µµ '(i) δij δνν' , (6) R con Q indipendente da ν e ν'. Cosi', per ora, abbiamo dimostrata l'ortogonalita' sui secondi indici. Pero', essa implica anche quella su µ e µ'. Infatti, R-1 =R† e prendere il complesso coniugato e' come prendere l'operatore inverso e scambiare gli indici: ma [ ∑ ∑ = R D j µ'ν'(R)Di µν (R) * ]* = ∑ R-1 ∑ R D j ν'µ'(R-1 )D i νµ (R-1 ) * , , ed adesso i secondi indici sono µ e µ'. R Riassumendo quanto sopra, possiamo scrivere che ∑ D i µν (R) * Dj µ'ν'(R) = Q i δij δµµ'δνν' , R con Q i da determinare. Per calcolare Qi , scegliamo i=j, µ=µ' e ν=ν' ∑ D i µν(R) * Di µν(R) = Qi , R ed osserviamo di nuovo che D i µν (R) * = Di νµ (R-1 ) . Sommando su µ, mi ∑ 1 = mi Q i R µ=1 dove mi e' la degenerazione della r.i. Quindi, ∑ ∑ µ ∑ D i νµ (R-1 ) D i µν (R) = Q i D i νν'(R-1 R) = mi Q i δνν' R e poiche' Di νν'(E) = δνν', g=mi Q i , dove g e' l'ordine del Gruppo. Abbiamo cosi' dimostrato il GOT. Il teorema e' una relazione di ortogonalita' fra vettori a g componenti. Per ogni irrep ci sono mi 2 tali vettori, uno per ogni componente di D i µν (R). Perche' possano essere tutti ortogonali, occorre che sia ∑ m i 2 ≤ g. ∑ m i 2 = g. i Questa e' una restrizione molto importante sul numero e sulle dimensioni delle rappresentazioni irriducibili. Vedremo piu' avanti che vale sempre il segno =, cioe' (Teorema di Burnside) i =231= (7) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Un altro teorema, che non dimostreremo1, perche' per noi non e' essenziale, assicura che il numero delle rappresentazioni irriducibili e' uguale al numero delle classi. 9-7 Piccolo Teorema di ortogonalita (LOT) Il GOT e' cosi' potente che spesso bastano anche certi suoi casi particolari. Scriviamo il Grande Teorema per µ=ν e µ'=ν ', ∑ R D i µµ (R) * Dj µ'µ'(R) = g δ δ mi ij µµ' , sommiamo su µ, ricordando che ∑ R χ i (R) * Dj µ'µ'(R) = ∑ µ (1) D i µµ (R) = χ i (R), g δ mi ij , (2) ed infine sommiamo anche su µ'. Il risultato e' il Piccolo Teorema ∑ R χ i (R) * χ j (R) = g δij , (3) detto anche Teorema di ortogonalita' dei caratteri. In particolare, per una irrep deve aversi ∑ R | χ i (R) |2 = g , (4) e questo e' un modo di verificare se una rappresentazione data e' appunto irriducibile. Se ad esempio ne mescoliamo due (diverse o identiche) con coefficienti [interi] a e b, χ(R)=a χ (i) (R)+bχ (j)(R) viene ∑ |χ(R) |2 =g[a2+b2+2abδij ] R e ce ne accorgiamo. Supponiamo di avere una rappresentazione riducibile: per trovare il numero di volte ni che essa contiene la irrep i-esima, calcoliamo i 1Cfr ad esempio il libro di M. Tinkham. =232= Prof. M. Cini -Corso di Fisica Atomica e Molecolare caratteri χ(R). Sappiamo che χ(R) = χ i (R) * ∑ j n j χ j (R). Moltiplicando per e sommando su R si trova ∑ R χ i (R) * χ(R) = ⇒ ni = 1 g ∑ R ∑ n j∑ j R χ i (R) * χ j (R) = ∑ χ i (R) * χ(R) . j n j g δij =g ni . (5) Poiche' il carattere e' funzione della classe, la somma puo' essere fatta direttamente sulle classi, scrivendo ni = 1 g ∑ g(c) χ i (C)*χ(C) , C dove g(c) e' il numero di operatori della classe C. 9-8-Operatori di proiezione Un operatore di proiezione Pi µν =|ψi µ ><ψi ν| ha la proprieta' che agendo sulla componente λ dellairrep j-esima, cioe' su ψj λ , da' 0 se la irrep o la componente sono diverse da i e ν; se invece ambedue sono "giuste", il risultato e' la componente µ-esima ψi µ. In altri termini, Pi µν ψj λ = δij δνλ ψi µ . (1) E' facile verificare che Pi µν = mi g ∑ R D i µν (R) * R , (2) dove mi e' la degenerazione della irrep. Infatti, R ψj λ = Pi µν ψj λ = ∑ ρ ψj ρ Dj ρλ(R) , mi g ∑ R D i µν (R) * (3) ∑ ρ D j ρλ(R)ψj ρ , =233= (4) Prof. M. Cini -Corso di Fisica Atomica e Molecolare ed usando il GOT si ottiene immediatamente il risultato. Cosi' Pi µν a) genera tutte le ψi λ di una irrep i se ne e' nota una; b) se ψ appartiene ad una rappresentazione riducibile- cosa che accade in generale se il problema di diagonalizzare H non e' ancora risolto- si avra' ψ= ∑ jν e quindi α jν ψj ν Pi µµ ψ = α iµ ψi µ. (5) Cosi', purche' ψ abbia una componente α non nulla, otteniamo una base per la irrep i-esima. Il problema di trasformare una base con elementi ψ qualsiasi in una adattata alla simmetria si riduce a quello, puramente geometrico, di determinare l'effetto di ogni R sugli elementi della base; i D sono una proprieta' del Gruppo astratto. Tutto cio' e' facile, ma spesso un po' macchinoso, specialmente il passo di ricavare i D. Questo pero' puo' essere evitato. Infatti, sommando su µ, si trova ∑ µ P i µµ ψ = ∑ µ α iµ ψi µ . (6) A secondo membro si ha una combinazione lineare di ψ tutte della irrep i-esima. A primo membro compare Pi = ∑ µ P i µµ = mi g ∑ χ i (R) * R. R Basta quindi conoscere i caratteri dati dalle tavole per ottenere P i ψ = funzione della irrep i. Ripetendo l'operazione con abbastanza ψ diverse ed ortonormalizzando, si ha una base della irrep. D'altra parte, questa e' la naturale estensione del procedimento elementare per ottenere, ad esempio, funzioni pari e dispari come combinazioni di funzioni qualsiasi. 9-9-Rappresentazione regolare Dato un Gruppo di ordine g, di elementi R1,....Rg , associamo ad 1 0 0 1 ogni elemento un vettore colonna: R 1→.. , R2→.. , etc. La .. .. tabella di moltiplicazione mostra che moltiplicando a sinistra per =234= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ri si ottiene una permutazione degli elementi del Gruppo. Si puo' rappresentare Ri con una matrice gxg che opera questa permutazione. Riprendiamo la tabella del Gruppo C3v. Ordinati gli operatori nel modo ovvio, si ha ad esempio che l'effetto di C3 e' 1→2 2→3 3→1 4→6 5→ 4 6→5 e si puo' rappresentare con una matrice che ha un 1 in ogni riga e colonna, e il resto e' 0: 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 D(C 3)= ' 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 D(I) =Diag(1,1,1,1,1,1). Nessun altro elemento puo' avere 1 sulla diagonale, perche' RX=X⇒R=I. Quindi per questa rappresentazione "regolare" che c'e' per ogni Gruppo, χ(I)=g, mentre per tutte le altre classi χ=0. Quante volte e' contenuta la irrep i-esima in quella regolare? 1 1 i * ni = ∑ χ i (R) * χ(R) = χ (I) χ(I) = χ i (I)* =mi g g R cioe' un numero di volte uguale alla degenerazione. Riducendo la rappresentazione "regolare" avremo sulla diagonale mi volte un blocchetto di dimensione m i . Ma la diagonale e' lunga g, quindi ∑ m i 2 =g i Questo e' il Teorema di Burnside. Capitolo 10-Applicazioni della teoria della simmetria agli stati elettronici ed alle vibrazioni Vedremo che i risultati del Capitolo 9 sono di grande utilita' in Fisica Molecolare. 10-1 Orbitali di H2O,NH3,CH4 e Benzene =235= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Illustriamo la teoria del Capitolo 9 con alcuni esempi. Determineremo gli orbitali molecolari secondo lo schema LCAO, trascurando gli integrali di sovrapposizione. Orbitali molecolari di H 2O Poniamo la molecola sul piano xz, con l'asse z come asse di simmetria. Essa appartiene al Gruppo C2v. Tenuto conto che C2 : x y z → -x -y z σv : x y z → x -y z σ' v : x y z → -x y z, gli orbitali atomici si trasformano come segue1: orbitali E C2 σv (xz) σ' v (yz) ____________________________________ 2s 2s 2s 2s 2s 2px 2px -2px 2px -2px 2py 2py -2py -2py 2py 2pz 2pz 2pz 2pz 2pz s1 s1 s2 s1 s2 s2 s2 s1 s2 s1 ___________________________________ χ(Γ) 6 0 4 2 Nell'ultima riga sono riportati i caratteri della rappresentazione Γ di dimensione 6 che ha per base l'insieme degli orbitali di valenza. I caratteri sono determinati come segue. Supponiamo ad esempio di avere due funzioni f1 ed f2 e che una operazione R del Gruppo le trasformi in due nuove funzioni f'1 e f' 2 tali che f' 1= af1+bf2 , f' 2= cf 1+df2. Scrivendo questo in forma matriciale, a b f1 f' 1 c d f2 = f' 2 , a b si ha che il rappresentativo di R su questa base e' c d , ed il carattere e' a+d. Chiaramente, a e' l'ammontare di f1 che resta in f' 1 dopo la trasformazione, mentre d e' l'ammontare di f2 che resta in f' 2. In casi semplici come questo, ogni funzione o resta immutata, o cambia segno, o viene cambiata in un'altra funzione ortogonale (o assunta tale). Una funzione immutata contribuisce +1 al carattere, una che cambia segno contribuisce -1, ed una che si trasforma in altra ortogonale contribuisce 0. Cosi' si ottengono i caratteri della 1Notare che le colonne della tabella corrispondono a diverse operazioni, ma anche a diverse classi: in un Gruppo abeliano, ogni elemento fa' classe a se'. =236= Prof. M. Cini -Corso di Fisica Atomica e Molecolare rappresentazione Γ. Per decomporla in r. i, usiamo la tabella dei caratteri del Gruppo. C2v E C2 σv (xz) σ' v (yz) _________________________________________ A1 1 1 1 1 z A2 1 1 -1 -1 B1 1 -1 1 -1 x B2 1 -1 -1 1 y __________________________________________ E' evidente che 2s e' totalsimmetrico e si trasforma come A1 ; ad A1 appartiene anche z, ed e' consuetudine che le tabelle dei caratteri riportino le componenti di x, o le loro combinazioni semplici, che si trasformano secondo una data R.I. Ovviamente, 2p z si trasforma come z, 2px appartiene a B1 e 2py a B2. Invece, s 1 ed s2 si trasformano fra loro. Per esercizio, effettuiamo la decomposizione della rappresentazione Γ di dimensione 6, usando la formula ni = 1 g ∑ R χ i (R) * χ(R) . Si trova 1 (6+0+4+2) =3, 4 1 e analogamente nA = 0, nB =2, nB =1. Quindi, la 1 2 2 rappresentazione degli orbitali di valenza e' Γ = 3A1+2B1+B2. Gia' abbiamo trovato due funzioni A1, una B1 ed una B2; bisogna combinare s 1 ed s2 per specificare un'altra funzione A 1 ed un'altra B1. Benche' questo sia banale, usiamo per esercizio gli operatori di proiezione. Partendo ad esempio da s1, formiamo nA = mi Pi s1= g ∑ R χ i (R) * R s1. Per A1, tutti i χ sono =1 e ∑ χ i (R) * R s1 = s1 +s2 +s1 +s2. R s 1 +s2 Normalizzando otteniamo . Per B1, i caratteri sono 1,-1,1,-1 2 s 1 - s2 e si ha . Quindi, gli orbitali di simmetria di H2O sono 2 A1 2s,2pz, s 1 +s2 2 =237= Prof. M. Cini -Corso di Fisica Atomica e Molecolare A2 B1 2px, B2 2py _____ s 1 - s2 2 Poiche' gli elementi di matrice di H (e gli overlaps) fra stati che appartengono a R.I. diverse sono nulli, il determinante 6x6 del metodo LCAO risulta fattorizzato in uno di ordine 3 (A 1), uno di ordine 2 (B 1) ed uno di ordine 1(B 2), cioe' A1 B1 B2 2s 2pz s1+s2 2px s1-s 2 2py ___________________________________________ E2s-E 0 β1 0 0 0 0 E2p-E β2 0 0 0 β1 β2 EH-E 0 0 0 ___________________________________________ =0, 0 0 0 E2p-E β 3 0 0 0 0 β 3 EH-E 0 ___________________________________________ 0 0 0 0 0 E2p-E dove i β rappresentano gli elementi di matrice di interazione fra atomi diversi che possono essere non nulli. Fra 2s e 2pz prendiamo 0 come ragionevole approssimazione, dal momento che appartengono al medesimo atomo. Si perviene cosi' ad uno schema dei livelli in cui e' possibile indicare il carattere approssimativo degli orbitali molecolari corrispondenti. I due livelli piu' alti risultano vuoti (σ antileganti) mentre tutti gli altri sono doppiamente occupati. I livelli 2a1 e 1b1 sono i σ leganti cui si deve il maggior contributo all'energia di legame. Invece, b2 e' "non legante" ed i suoi due elettroni vengono chiamati "lone pair". Anche 1a1 ha prevalente carattere O 2s e puo' essere considerato quasi un "lone pair". =238= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 2b1 3a1 b2 O 2p O 2s b2 a1 a1 2a1 b1 1b1 2H b1 1a1 a1 L'ordine dei livelli sulla scala delle energie dipende dai parametri, e non e' con modelli cosi' semplici che si puo' sperare di determinarlo; tuttavia, la classificazione degli stati ed il riconoscimento del loro carattere qualitativo sono risultati importanti che abbiamo ottenuto senza sforzo. Calcoli autoconsistenti permettono di ottenere le energie degli orbitali in funzione dell'angolo HOH. Un grafico di tali dipendenze si chiama diagramma di Walsh. Per H2O esso mostra che b2 e' quasi indipendente dall'angolo, e 1a1 ha anch'esso una dipendenza molto debole; tutto cio' e' comprensibile da quanto sopra. Invece, 2a1 ha carattere 2p z e diventerebbe non legante in una geometria lineare: difatti, la sua energia cresce aumentando l'angolo da 90 a 1800, quindi si puo' dire che esso favorisce il piegamento. Al contrario, 1b1 deriva dal 2px e favorisce l'angolo di 180 0 che massimizza la sua sovrapposizione con gli orbitali di H. Vedremo che queste considerazioni sono utili, ad esempio, per interpretare lo spettro di fotoemissione della molecola. Orbitali molecolari di NH3 La distanza N - H e' 1,015 Å , e l'angolo HNH e' di 106,60 . I tre H si trovano ai vertici di un triangolo equilatero, che possiamo porre sul piano xy; facciamo passare l'asse z per N, e l'asse x per l'Idrogeno numero 1. L'operatore di riflessione rispetto al piano verticale che contiene l'Idrogeno k-esimo sara' σv (k). Il Gruppo e' C3v, ed ha la seguente tabella di caratteri: C3v E 2C3 3σv A1 A2 1 1 1 1 1 -1 =239= z Prof. M. Cini -Corso di Fisica Atomica e Molecolare E 2 -1 0 (x,y) Il set di valenza comprende i 7 orbitali: 2s 2px , 2py , 2pz dell'Azoto, s1, s 2, s 3 per gli Idrogeni. Mentre 2s e 2p z sono totalsimmetrici ed appartengono ad A 1, gli orbitali 2px e 2py si trasformano come (x,y) e costituiscono una base per E, come indica la tabella. E' facile verificarlo come segue. L'effetto di una rotazione di un angolo α attorno all'asse z e' x cosα - s i n α x Rα y = sinα c o s α y , -1/2 - 3/2 2π . e per α = , Rα = 3 3 / 2 - 1 / 2 Su questa stessa base, troviamo la matrice di σv (1). L'operazione 1 0 manda x →x , y→ -y, e la matrice e' 0 - 1 . Poiche' i caratteri sono funzioni di classe, questo basta per dire che la rappresentazione che ha per base x e y ha caratteri di E. Gli sk si trasformano come segue: E C3 C32 σv (1) σv (2) σv (3) s1 s2 s3 s1 s2 s3 s2 s3 s1 s3 s1 s2 s1 s3 s2 s3 s2 s1 s2 s1 s3 χ123 3 0 0 1 1 1 I caratteri χ sono quelli della rappresentazione che li ha come base, 1 e che si decompone in A 1 + E usando ni = ∑ χ i (R) * χ(R) . g R s1+s2+s3 La combinazione lineare di tipo A1 e' ovvia : Ψ 1 = . Per 3 trovare la base di E useremo gli operatori di proiezione. Se partiamo da s1 ed applichiamo ∑ χ E(R) * R troviamo 2*s1 + (R 1)*(s2+s3 ) + 0 ; 2s1 - s 2 - s 3 normalizzando, abbiamo Ψ 2= . Se partiamo da s 2 6 2s2 - s 3 - s 1 troviamo ovviamente Ψ' 3= , che pero' non e' 6 ortogonale a Ψ 2. Poiche' <Ψ 2|Ψ' 3> =-1/2, troviamo s2-s 3 Ψ 3 =N{Ψ' 3 - <Ψ 2|Ψ' 3>Ψ 2 } = . 2 =240= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Abbiamo cosi' gli orbitali di simmetria: C3v E 2C3 3σv A1 A2 E 1 1 2 1 1 -1 1 -1 0 2s, 2pz, Ψ 1 ____ (2p x,2py ), (Ψ 2,Ψ 3) ed il determinante 7x7 del metodo LCAO e' spezzato in uno 3X3 ed uno 4X4. Ma si puo' fare di meglio ricordando che possono interagire fra loro (vale a dire, avere elementi di matrice di H non nulli) solo stati che abbiano tutti i buoni numeri quantici uguali. Consideriamo per esempio σv (1), che scambia le etichette 2 e 3: Ψ 3 e' dispari come p y , mentre Ψ 2 e' pari come p x. In generale, si hanno blocchi distinti per le diverse componenti di una R.I. Inoltre, gli elementi di matrice di H e di ogni altro operatore totalsimmetrico non dipendono dalla componente. In definitiva, A1 E E 2s 2pz Ψ1 2px Ψ2 2py Ψ 3 ___________________________________________ Es-E 0 β1 0 0 0 0 0 Ep-E β2 0 0 0 0 β1 β2 EH-E 0 0 0 0 ___________________________________________ =0, 0 0 0 Ep-E β 3 0 0 0 0 0 β 3 EH-E 0 0 ___________________________________________ 0 0 0 0 0 Ep-E β 3 0 0 0 0 0 β 3 EH-E Il diagramma di correlazione che mostra i livelli molecolari e la loro composizione in orbitali atomici (il "carattere", come si dice) e': =241= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 3a1 N H 2e 2p a1 e 2s a1 2a1 Ψ1+Ψ2+Ψ3 e 1e 1a1 a1 I cerchietti rappresentano coppie di stati e quelli pieni sono occupati. Il 2a 1 e' quasi non legante. Risulta infatti da calcoli autoconsistenti che ha un carattere 2p z pari a 0.94. Simmetrie ed orbitali molecolari del CH4 La molecola e' tetraedrica ed appartiene al Gruppo Td, che ha g=24 e le operazioni di simmetria E, 8C3, 3C2, 6σd,6S 4. Le operazioni sono le seguenti. Se mettiamo il C nell'origine ed uno degli H lungo l'asse z, allora questo asse e' sede delle due operazioni C 3 e C32 che ruotano fra loro gli altri H. Ci sono 4 di tali assi, e in tutto 8 operazioni di questa classe. Se invece orientiamo l'asse z in modo che unisca i punti di mezzo di spigoli opposti del tetraedro, esso e' sede di una operazione C2. Ci sono 3 di tali assi, e quindi 3C2. z 1 2 y 4 3 Sempre in questa posizione, l'asse z e' anche sede di S4 (una rotazione di 90 0 seguita da una riflessione nel piano xy). Poiche' ci sono 2 operazioni di questa classe per ogni asse (2 sensi di rotazione), esse sono 6 in tutto. I piani che contengono due legami C-H (e quindi uno spigolo del tetraedro) sono sede di σd, e ce ne sono 6. =242= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Come base, prendiamo quella di valenza, che include 2s, 2px, 2py e 2pz del C ed i quattro 1s di H. Il 2s appartiene banalmente ad A1, e la tabella del Gruppo mostra che gli orbitali 2p appartengono a T2. Td E A1 A2 1 1 E 2 8C3 1 1 -1 3C2 6σd 6S4 1 1 1 -1 1 -1 2 0 0 x 2-y 2 2z2-(x 2+y2) T1 3 0 -1 -1 1 T2 3 0 -1 1 -1 Γ(H 4) 4 1 0 2 x2+y2+z2 Rx ,R y,R z {xxyyxzz yz 0 I caratteri per i 4 H, che formano la rappresentazione Γ(H 4) , si trovano contando per ogni operazione quanti H restano fermi. Cosi' E tutti fermi χ=4 C3 1 fermo,3 mossi 1. C2 tutti mossi 0 S4 tutti mossi 0 σd 2 fermi,2 mossi 2 Tenendo conto che g=24, si trova Γ(H 4) = A 1+T2. La combinazione che si trasforma secondo A1 e' banalmente s1+s2+s3+s4 Ψ 1= . 2 dobbiamo ora trovare 3 combinazioni ortogonali a questa che si trasformino come le coordinate. Potremmo farlo con gli operatori di proiezione, ma c'e' un modo piu' spiccio. Dobbiamo considerare l'azione dei singoli operatori. Notiamo che z e' invariante per la riflessione che scambia 1 con 2, ed anche per quella che scambia 4 con 3, ma cambia segno per una rotazione di 1800 attorno all'asse y (1 → ← 3e2→ ← 4); tanto basta per dire che la componente z e' s1+s2-s 3-s 4 Ψz = . 2 Analogamente, s1-s 2+s3-s 4 s1-s 2-s 3+s4 Ψy = , Ψx = . 2 2 =243= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Poiche' si mescolano solo orbitali della stessa simmetria, il determinante 8X8 del CH4 si fattorizza in 4 determinanti 2X2, dei quali per giunta 3 risultano identici perche gli elementi di matrice sono indipendenti dalle componenti: E - E β 1 s β 1 E H-E = 0, con base (2s, Ψ 1); (2p z, Ψ z) = 0, con basi (2p x, Ψ x) . (2p , Ψ ) y y Poiche' ogni determinante da' una coppia di stati, si hanno 4 stati leganti (un livello a1 ed uno 3 volte degenere t2 ) e le loro controparti antileganti. La teoria dei Gruppi non puo' specificare l'ordine, ma nello spettro di fotoemissione c'e' un picco con energia di legame EB ≈15eV, largo alcuni eV, che e' stato indentificato con 1t2, ed un altro a EB ≈22eV che corrisponde ad 1a 1. E - E β 2 p β 2 E H-E Benzene E' ovvio che questo metodo consente di ritrovare i noti risultati per i livelli del Benzene nel modello di Huckel, ma questo e' lasciato per esercizio. La tabella dei caratteri e' la seguente: D6h E 2C6 2C3 C2 3C'2 3C"2 i 2S3 2S6 σh 3σd 3σv A1g 1 1 1 1 1 1 1 1 1 1 1 1 A2g 1 1 1 1 -1 -1 1 1 1 1 -1 -1 Rz B1g 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 B2g 1 -1 1 -1 -1 1 1 -1 1 -1 -1 1 E1g 2 1 -1 -2 0 0 2 1 -1 -2 0 0 (Rx, R y) (xz,yz) E2g 2 y 2,xy) A1u A2u B1u B2u E1u E2u -1 -1 1 1 1 1 1 1 -1 -1 1 1 1 1 2 2 1 -1 -1 -1 2 0 0 1 1 -1 -1 1 -1 1 -1 1 -1 -1 1 -2 2 0 0 0 0 2 -1 -1 2 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 -1 1 -1 1 -1 1 -2 -1 1 2 -2 1 1 -2 0 0 -1 -1 1 1 -1 1 1 -1 0 0 0 0 Gli assi di C' sono diagonali dell'esagono e quelli di C" sono ortogonali a lati opposti; i piani di σd e σv sono verticali e contengono questi assi. =244= (x 2- z (x,y) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Il Gruppo Oh Consideriamo un cubo con un sistema di assi cartesiani che puntano dal centro del cubo al centro delle facce. I centri delle facce sono i vertici di un ottaedro. z z y y x Le operazioni di simmetria del cubo lo sono anche per l'ottaedro, e viceversa. Etichettiamo i vertici dell'ottaedro come segue : z A E F B x C y D Gli assi di simmetria del Cubo sono: 3 assi C4 (rotazioni di 2π/4) attorno agli assi x,y e z. Rotazioni C4 intorno all'asse z: A→A inversa A→A Rotazioni C4 intorno all'asse x: A→C inversa A→F Rotazioni C4 intorno all'asse y: A→B inversa A→E Queste operazioni formano la classe 6C4. Questi assi sono anche binari, le rotazioni essendo i quadrati delle precedenti. In letteratura si indica la classe corrispondente come 3C 2, o anche 3C42. asse z A→A asse x A→D asse y A→D =245= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Assi C3 (rotazioni di 2π/3 intorno alle diagonali del cubo. ci sono 4 diagonali, due sensi di rotazione, e la classe e' 8C 3). z y Questi assi sono ⊥alle facce dell'ottaedro nei loro centri. Indichiamo qui ogni asse con la faccia "superiore" a cui e' ⊥. Gli effetti sono: Asse ABC A→B A→C Asse ACE A→C A→E Asse AEF A→E A→F Asse AFB A→F A→B Assi C'2 che uniscono i centri di due spigoli opposti. Ci sono 12 spigoli, quindi 6 assi binari, e la classe e' 6C2 (talora indicata con 6C'2) z y Effetto: anche l'ottaedro ha 12 spigoli, e gli stessi assi binari uniscono i centri di spigoli opposti. possiamo indicare un asse dando uno degli spigoli. Asse EC A→D Asse CB A→D Asse AB A→B =246= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Asse AC Asse AE Asse EF A→C A→E A→F Inversione A→D Riflessioni σh : z y cambiano di segno una delle coordinate cartesiane. ciascun piano contiene 4 vertici dell'ottaedro. Ce ne sono 3, con A→A,A→A,A→D. Riflessioni σd: z A z E F B x C x y y D bisecano facce opposte (3 possibili scelte) in due modi (/ e \). Nell'ottaedro, ogni piano σd contiene due vertici opposti e biseca gli spigoli che non li contengono. Due piani contengono A e D e mandano A→A A→A; due piani contengono i vertici opposti B ed E . Quello che biseca AC ha l'effetto A→C; quello che biseca AF ha l'effetto A→F. =247= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Altri due piani contengono i vertici opposti C ed F . Quello che biseca AE ha l'effetto A→E; quello che biseca AB ha l'effetto A→B. Rotazioni improprie S 4: sono rotazioni C4 seguite da una riflessione in un piano σh ⊥ all'asse. Cosi' l'effetto e', tenuto conto dei due sensi di rotazione: → → → → asse z: A C A S D oppure A C A S D 4 4 4 4 → → → → asse x: A C C S C oppure A C F S F 4 4 4 4 → → → → asse y: A C B S B oppure A C E S E 4 4 4 4 La classe e' 6S 4. Rotazioni improprie S 6: gli assi sono gli stessi delle rotazioni C 3, che corrispondono alle diagonali del Cubo ed uniscono i centri di facce opposte dell'Ottaedro. Se guardiamo lungo uno dei 4 assi, vediamo le due facce opposte come due triangoli concentrici, e la figura e' invariante per rotazioni di C3 (cioe' di 2π/3). =248= Prof. M. Cini -Corso di Fisica Atomica e Molecolare A F B E C D Con una rotazione di 2π/6 otterremmo invece B A F C D E che, con una riflessione nel piano di simmetria ⊥ all'asse di rotazione, ripristina la figura originaria (con uno scambio di etichette). Con 4 assi e 2 sensi di rotazione, la classe e' 8S6. Denotando di nuovo gli assi con le facce "superiori" a cui sono perpendicolari, si trovano i seguenti effetti: asse ABC A→F in senso orario A→E in senso antiorario; asse ACE A→B in senso orario A→F in senso antiorario; asse AEF A→C in senso orario A→B in senso antiorario; asse AFB A→E in senso orario A→C in senso antiorario. =249= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Questo esaurisce le 48 operazioni di simmetria del Gruppo Oh . Le classi dunque sono: I,6C4,3C2,6C'2,8C3,i,6S 4,3σh ,6σd,8S 6. Consideriamo la rappresentazione Γ che ha per base i 6 orbitali A,..F. Sulla diagonale del rappresentativo c'e' 1 per ogni orbitale che resta fermo e 0 per ogni orbitale che si muove (cioe', RΨ puo' essere Ψ o 0). I caratteri sono: I tutti fermi χ(I)=6 6C4 fermi i due sull'asse χ(6C4)=2 3C2 fermi i due sull'asse χ(3C2)=2 6C'2 tutti mossi χ(6C' 2)=0 8C3 tutti mossi χ(8C3)=0 i tutti mossi χ(i)=0 6S4 tutti mossi χ(6S 4)=0 3σh fermi i 4 sul piano χ(3σh )=4 6σd fermi i 2 sul piano χ(6σd)=2 8S6 tutti mossi χ(8S 6)=0. Riassumendo: I 6C4 3C2 6C'2 8C3 i 6S4 3σh 6σd 8S6 Γ 6 2 2 0 0 0 0 4 2 0 1 Per decomporre Γ, usiamo ni = ∑ χ i (R) * χ Γ(R), ed una tabella dei g R caratteri delle R.I. Questi sono tutti 1 per A1g, e si trova n(A1g)=1. Oh A 1g A 1u A 2g A 2u Eg Eu T1g T1u T2g T2u I 6C4 1 1 x 2 +y 2 +z2 1 1 1 -1 1 -1 2 0 (x 2 - y 2 ,2z 2 x 2 +y 2 ) 2 0 3 1 (Rx,Ry,Rz) 3 1 (x,y,z) 3 -1 (xy,xz,yz) 3 -1 3C2 1 TABELLA DEI CARATTERI 6C'2 8C3 i 6S4 1 1 1 1 3σh 1 6σd 1 8S6 1 1 1 1 2 1 -1 -1 0 1 1 1 -1 -1 1 -1 2 -1 -1 1 0 -1 1 -1 2 -1 -1 1 0 -1 1 -1 -1 2 -1 0 -1 -1 0 -2 3 0 1 -2 -1 0 -1 1 0 -1 -1 0 -3 -1 1 1 0 -1 1 0 3 -1 -1 1 0 -1 1 0 -3 1 1 -1 0 Quindi A1g c'e' una volta: togliendo 1 a tutti i caratteri , rimane una rappresentazione di ordine 5, in cui non c'e' A1g. I 6C4 3C2 6C'2 8C3 i 6S4 3σh 6σd 8S6 =250= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Γ(5) 5 1 1 -1 -1 -1 -1 3 1 -1 Risulta che n(Eg )=1. Sottraendo i caratteri di E g si trova Γ(3) I 3 6C4 1 3C2 -1 6C'2 8C3 -1 0 i -3 6S4 -1 3σh 1 6σd 1 8S6 0 Ma questi sono i caratteri di T 1u. Pertanto, Γ = A1g+Eg +T1u . Ligand Group Orbitals Quali combinazioni di A,B,... si trasformano come basi delle varie IRREP? Useremo gli operatori di proizione nella forma semplificata P(i) =∑ χ (i) (R) * R . Per ogni classe C, dobbiamo calcolare ∑ RA R R∈C dove A e' il primo degli orbitali (ovviamente, uno qualsiasi va bene); poi dobbiamo moltiplicare per il carattere e sommare sulle classi. Abbiamo gia' visto gli effetti di tutti gli R su A. Volendo ad esempio un Ligand Group Orbital appartenente a T1u, avremo: Classe ∑ RA χ (T1u) contributo R∈C I A 3 3A 6C4 2A+B+C+E+F 1 2A+B+C+E+F 3C2 A+2D -1 -(A+2D) 6C'2 2D+B+C+E+F -1 -(2D+B+C+E+F) 8C3 2(B+C+E+F) 0 0 i D -3 -3D 6S4 2D+B+C+E+F -1 -(2D+B+C+E+F) 3σh 2A+D 1 2A+D 6σd 2A+B+C+E+F 1 2A+B+C+E+F 8S6 2(B+C+E+F) 0 0 ___________________________________________________ _ Totale P(T1u) A = 8A-8D Normalizzando, Ψ (1)( T1u) = A-D . Operando allo stesso modo su D 2 otterremmo di nuovo Ψ (1)( T1u). Operando sugli altri, si ottengono =251= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Ψ (2)( T1u) = B-E e Ψ (3)( T1u) = C-F . Con questo metodo si ottengono 2 2 basi per tutte le R.I., e si puo' costruire un modello LCAO di una molecola ottaedrica. Il gruppo Oh si incontra sovente come gruppo di simmetria puntuale (cioe', escludente le traslazioni) nei solidi. Ad esempio, CuSO4⋅5 H 2O, e FeCl3 sono"complessi" che hanno uno ione di transizione legato ottaedricamente1 a 6 molecole o anioni. La teoria delle loro proprieta' basata su un modello LCAO si chiama ligand field theory . Crystal field Sono di particolare interesse le proprieta' magnetiche dei complessi. Il Fe bivalente, che ha configurazione 3d6, forma i complessi [Fe(H2O) 6]2+ , verde, paramagnetico (4 elettroni spaiati) [Fe(CN)6]4- , giallo, diamagnetico (0 elettroni spaiati). Dunque, lo ione isolato e' paramagnetico, ma i composti in cui entra possono esserlo o no. Questi fatti si possono gia' capire con la teoria del campo cristallino, in cui i leganti si comportano come cariche puntiformi, o comunque generano un campo a simmetria ottaedrica che risolve la degenerazione dei termini atomici (per la prima serie di transizione lo spin-orbita e' una piccola perturbazione da introdurre successivamente). Una trattazione piu' quantitativa si ottiene poi dalla ligand field theory . Il numero di elettroni d e' M2+ M3+ Ti V Cr Mn Fe Co Ni Cu 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 e i termini fondamentali che conseguono alle regole di Hund sono: d1 d2 d3 d4 d 5 2D 3F 4F 5D 6S elettroni spaiati 1 2 3 4 5 d6 d7 d8 d9 5D 4F 3F 2D 4 3 2 1 In assenza del campo cristallino, si avrebbe sempre paramagnetismo. 1Sovente la simmetria ottaedrica e' approssimata. Nel CuSO ⋅5 H O il Cu++ e' 4 2 legato a 4 molecole di H 2O complanari e a 2 ioni SO4- - . =252= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Consideriamo uno stato D: esso e' 5 volte degenere, e la degenerazione si deve risolvere in un campo ottaedrico, dove la degenerazione piu' alta e' 3. Uno stato D si trasforma per rotazioni come uno stato d, cioe' come le armoniche sferiche con L=2. Queste sono la base per una rappresentazione riducibile di O h . Ovviamente, χ(I)=5 e χ(i)=5 (perche' gli stati sono pari). Per trovare i caratteri delle rotazioni, scegliamo l'asse z coincidente con quello di rotazione, cosicche' le funzioni di base sono (e 2iφ , e iφ ,1, e -iφ , e -2iφ ). Se ruotiamo di α, le funzioni diventano (e 2i(φ+α) , e i(φ+α) ,1, e -i(φ+α) , e -2i(φ+α) ). Il rappresentativo di Rα e' una matrice diagonale con elementi (e 2iα , e iα ,1, e -iα , e -2iα ) che ha traccia χ=e2iα +eiα +1+e-iα +e-2iα . Per un L generico, il carattere e' 2L ei(2L+1)α -1 χ= eiLα + ei(L-1)α +...+e-iLα = e-iLα ∑ e irα = e-iLα eiα - 1 r=0 = = \f(e i(L+1)α -e-iLα ,e iα -1 ) = \f(ei(L+1/2)α -e-i(L+1/2)α ,e iα -1 ) ei(L+1/2)α -e-i(L+1/2)α eiα/2 = = eiα/2 -e -iα/2 sin[(L+1/2)α] = . sin(α/2) Poiche' i caratteri dipendono solo dalle classi, possiamo gia' sin(5π/4) scriverne parecchi; ad esempio, per C 4, α=π/2, χ= = -1; sin(π/4) cosi' si arriva a I 6C4 3C2 6C'2 8C3 i 6S4 3σh 6σd 8S6 χ 5 -1 1 1 -1 5 ? ? ? ? Questa e' giusto la somma dei caratteri di Eg e di T2g, e cio' basta. A dire il vero, bastava gia' la tabella dei caratteri, che riporta (d xy ,dyz,dxz) come base di T 2g e (d x2-y 2,dz2) come base di Eg . Scriviamo le armoniche sferiche per stati d in forma reale: 15 x2-y2 xy |2>+|-2> |2>-|-2> |m|=2 15 cioe' , 2 4 r r 2 2 xz yz |m|=1 15 15 cioe' |1>,|-1> r r 52z 2-x 2+y2 m=0 ≡ |0>. 2 r2 =253= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 Possiamo ignorare i fattori 2 ; e' chiaro che xy, xz e yz hanno lo r stesso tipo di simmetria, e dovendo andare insieme fanno una base di T2g, mentre gli altri due stati sono base di Eg . Come riprova, prendiamo il comportamento sotto σh , che cambia di segno una delle coordinate. Una siffatta operazione cambia di segno due delle funzioni (xy,xz,yz), ed il carattere e' -1 (T2g); invece le altre due funzioni sono invariate, ed il carattere e' 2 (Eg ). Le basi sono pertanto |2>+|-2> 2 Eg |0>. T2g |2>-|-2> 2 |1> |-1>. Sia ∆ =E(Eg ) - E(T2g). Nei complessi dei metalli di transizione, ∆>0. L'ordine di rimpimento dei livelli al crescere del numero di elettroni e' diverso se ∆ e' grande o piccolo rispetto alla interazione coulombiana fra gli elettroni. Sia U l'ordine di grandezza di quest'ultima. Per ∆<<U, vale la regola di Hund atomica, e si ha il paramagnetismo. Per ∆>>U, la regola di Hund vale entro i livelli degeneri T2g ed Eg , ma si puo' cominciare a popolare Eg solo quando T2g e' gia' pieno. Allora, si ha d1 d2 d3 d4 d 5 d6 d7 d8 d9 elettroni spaiati 1 2 3 2 1 0 1 2 1 Nel caso generale, la teoria deve trattare simultaneamente gli effetti coulombiani e quelli del potenziale cristallino V, che ha simmetria ottaedrica. Nel seguito daremo il principio del calcolo. Non ci proponiamo di determinare le posizioni assolute dei livelli, ma solo le loro separazioni; sulla base degli orbitali di simmetria, che descrivono gli stati di un elettrone, la matrice di V 3∆ -2∆ e' diagonale, con elementi E(Eg )= e E(T2g)= , in modo che 5 5 Tr(V)=0 e non c'e' spostamento rigido dello spettro a particella singola. Nel caso di piu' elettroni, dovremo includere il termine coulombiano Hc , che e' diagonale sulla base |LML SM S>; sappiamo sviluppare tale base in termini di determinanti con mL definiti; =254= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dunque, se vogliamo la matrice di V sulla base |LML SM S>, dobbiamo prima trovarla sugli stati a particella singola |m>. Gli stati |±1> e |0> sono orbitali di simmetria, e quindi non sono mescolati da V ne' fra loro ne' con altri; gli elementi diagonali corrispondenti sono E(T2g) ed E(Eg ). D'altra parte, <2|V|2>=<-2|V|-2> perche' si tratta di armoniche sferiche ∆ complesse coniugate, ed imponendo TrV=0 si trova <2|V|2>= .I 10 soli elementi non nulli fuori diagonale sono <2|V|-2> e il suo complesso coniugato. Ma <2|V|-2>* =<2|V|-2> , e ambedue sono reali. Imponendo 3∆ <2|+<-2| |2>+|-2> { }V{ } = E(Eg )= 5 2 2 ∆ si ricava che <2|V|-2> = . In definitiva, la matrice a particella 2 singola e' ∆ 10 0 V= 0 0 ∆ 2 0 0 0 -2∆ 5 0 0 3∆ 5 0 0 0 0 -2∆ 5 0 0 0 0 0 0 ∆ 10 ∆ 2 |2> |1> |0> . |-1> |-2> Usando questo risultato, potremmo ottenere la matrice di V su una base determinantale di stati con m definiti, e sapremmo come impostare il calcolo per una configurazione dn in un campo ottaedrico. 10-5 Modi normali di vibrazione Nell'approssimazione di Born-Oppenheimer, il potenziale che governa il moto degli elettroni dipende parametricamente dalle posizioni dei nuclei. L'energia totale della molecola U e' calcolata in funzione delle coordinate nucleari e la configurazione di equilibrio corrisponde ad un minimo in funzione di esse. Si possono allora studiare le vibrazioni, considerando U come una energia potenziale dei nuclei. =255= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La configurazione della molecola e' data da un vettore v che specifica le coordinate di tutti gli N nuclei, v=(δx1,δy1δ,z 1,⋅⋅⋅,δxN,δyN,δz N) = (v 1,⋅⋅⋅v3N), (1) dove i δ rappresentano gli spostamenti dall'equilibrio e si e' introdotta una notazione vi per la generica componente cartesiana. Tutti i moti possibili dei nuclei sono descritti classicamente dalle equazioni di Newton ∂U " mi vi = , (2) ∂vi dove mi e' la massa associata a v i nel modo ovvio x1,y1,z 1 →m1 etc. Nell'approssimazione armonica, espandendo intorno ad una 1 configurazione di equlibrio, U = ∑ U ij vi vj , e la trasformata di 2 ij Fourier delle equazioni del moto e' ω2vi = ∑ j U ij v . Conviene mi j introdurre Qi = mi vi e la matrice simmetrizzata Wij = equazioni del moto si scrivono allora ω2Q i = ∑ W ij Q j . U ij mi mj ; le (4) j Le soluzioni , cioe' gli autovettori Qα della matrice W, sono i modi normali, e le loro frequenze ωα si ottengono dalla equazione secolare (5) |Wij - ω2δij |= 0. Tre modi, di frequenza nulla, corrispondono a traslazioni rigide della molecola, ed altre 3 (o 2, per le molecole lineari) a rotazioni rigide. Anche queste ultime hanno ω=0, perche' l'energia della molecola non dipende dalla sua orientazione rispetto agli assi. Le rimanenti 3N-6 (o 3N-5) frequenze sono vibrazionali. La teoria dei gruppi puo' semplificare la soluzione dell'equazione secolare. Ogni operazione R del Gruppo di simmetria della molecola manda ciascun nucleo in se stesso o in un altro nucleo identico che si trova in una posizione equivalente; inoltre, ruota o riflette in vario modo il sistema di assi cartesiani che possiamo immaginare attaccato a ciascun nucleo. In generale, l'effetto sara' quello di trasformare ogni componente di Q in una combinazione lineare delle componenti. In tal modo, associamo ad ogni R una matrice D(R), ed otteniamo una rappresentazione del Gruppo nello spazio dei i vettori Q. Ogni D(R) commuta con W, perche' se Qα e' soluzione dell'equazione secolare, anche D(R)Qα deve esserlo, e con lo stesso ω. Quindi, possiamo diagonalizzare W simultaneamente con il massimo numero di matrici D(R) =256= Prof. M. Cini -Corso di Fisica Atomica e Molecolare commutanti fra loro. La teoria dei Gruppi aggiunge a questo insieme di matrici commutanti anche i caratteri di Dirac; questo significa che passando ad una nuova base i cui elementi sono vibrazioni appartenenti a rappresentazioni irriducibili del Gruppo, si converte W in una matrice diagonale a blocchi. I modi normali possono essere classificati assegnandoli alle varie IRREP del Gruppo; la riduzione della rappresentazione che ha per base i Q, o equivalentemente i v, consente di ricavare in modo semplice la simmetria e la degenerazione dei modi normali, senza dover risolvere l'equazione secolare. Prendiamo come esempio la molecola H2O, che appartiene al ben noto Gruppo C2v, e che richiede un vettore v con 3N=9 coordinate. Poniamo la molecola sul piano xz. 4 5 8 7 2 6 1 H 9 O H 3 z y riferimento: x Le componenti cartesiane dello spostamento dalla posizione di equilibrio di un atomo vengono trasformate dalle operazioni di simmetria come i corrispondenti orbitali p. Le frecce 2,5,8 sono parallele all'asse molecolare z, mentre 1,4,7 sono parallele all'asse y e ortogonali al piano della molecola. Le operazioni sono E, C2, σv (xz), σ' v (yz); e' ovvio che il rappresentativo di E e' l'identita' 9X9. L'operazione C2 ha il rappresentativo 0 0 0 0 0 0-1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0-1 0 0 0-1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 D(C 2)= , 0 0 0 0 0-1 0 0 0 -1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0-1 0 0 0 0 0 0 (6) =257= Prof. M. Cini -Corso di Fisica Atomica e Molecolare perche' gli effetti di C2 sulle varie frecce sono 1↔-7, 2↔8,3↔-9 , etc.; D(C2) e' una matrice a blocchi, che possiamo riscrivere 0 0 b D(C 2)= 0 b 0 , b 0 0 (7) - 1 0 0 dove ora 0 sta per un blocco 3X3 nullo, e b= 0 1 0 0 0-1 rappresenta l'azione di C2 su una terna all'origine. Per costruire la matrice a blocchi basta sapere quali atomi vengono scambiati fra loro dall'operazione, mentre b e' questione di geometria elementare. Cosi', D(σ' v (yz)) ha la stessa matrice a blocchi, ma 1 0 0 con b= 0 1 0 , mentre la riflessione σv (xz) sul piano della 0 0-1 - 1 0 0 molecola ha una matrice a blocchi diagonale, con b= 0 1 0 . 0 0 1 Dalle matrici ricaviamo i caratteri χ(E)=9, χ(C2)=-1, χ(σ' v (yz))=1, χ(σv (xz))=3. Potevamo arrivare a questo risultato senza scrivere i rappresentativi 9X9, tenendo conto che: 1) gli atomi che cambiano posizione sotto una certa operazione di simmetria contribuiscono 0 al carattere; 2)ogni freccetta (spostamento cartesiano) che resta invariata contribuisce +1, ed ogni freccetta che cambia segno -1. Piu' in generale, gli spostamenti cartesiani di un atomo che non cambia posizione si comportano come x,y,z. La rappresentazione Γ dei vettori v che ha i caratteri E C2 σv σ' v Γ 9 -1 3 1 (8) e' chiaramente riducibile, e puo' essere analizzata in R.I. con i metodi che abbiamo studiato. Essa include tutti i possibili spostamenti degli atomi, quindi non solo le vibrazioni, ma anche le rotazioni e traslazioni della molecola come un tutto. Per classificare le vibrazioni, occorre innanzitutto separarle dai moti rigidi. Le traslazioni rigide si trasformano fra loro per effetto delle operazioni del Gruppo, ed i Q che le descrivono sono base di una rappresentazione, quella dei vettori polari. Sommando i caratteri di x, y e z, si hanno per l'insieme delle 3 traslazioni i caratteri: E C2 σv σ' v Γtrasl 3 -1 1 1 (9) =258= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Abbiamo separato 3 coordinate del baricentro e ne restano N-3. Il moto che esse descrivono puo' essere scomposto in una rotazione rigida piu' una vibrazione. Cosi', possiamo separare altri 3 gradi di liberta' (2 per le molecole lineari) per descrivere la rotazione rigida. Una rotazione rigida infinitesima trasforma le ccodinate ri dell'atomo i-esimo secondo la legge dri = d ∧ri e puo' essere risolta in rotazioni Rx, Ry e Rz attorno agli assi. Queste si trasformano solo fra loro sotto operazioni di simmetria, e sono base di una rappresentazione Γrot . Poiche' i dri sono vettori assiali, Γrot e' la rappresentazione dei vettori assiali, in genere riducibile. La rotazione rispetto all'asse x si trasforma come il generatore R x, cioe' come yz, etc.; le tabelle dei caratteri riportano la classificazione delle rotazioni. Nei Gruppi commutativi, ci sono solo irrep unidimensionali con caratteri ±1; la rotazione e' pari o dispari sotto R a seconda che il senso di rotazione rimanga immutato o cambi.Per la molecola d'acqua si ha: C2v E C2 σv (xz) σ' v (yz) _________________________________________ A1 1 1 1 1 z A2 1 1 -1 -1 Rz B1 1 -1 1 -1 x,Ry B2 1 -1 -1 1 y,R x __________________________________________ e si puo' concludere che la rappresentazione Γrot delle rotazioni ha i caratteri 3,-1,-1,-1. Possiamo procedere a separare le vibrazioni come segue: E C2 σv σ' v Γ 9 -1 3 1 Γtrasl 3 -1 1 1 Γrot 3 -1 -1 -1 __________________________ Γvibr 3 1 3 1 ; la riduzione della rappresentazione Γvibr fornisce finalmente Γvibr =2A1+B1. La molecola di acqua ha due vibrazioni totalsimmetriche ed una di simmetria B1. Esercizio: vibrazioni di NH3. Ecco la tabella completa dei caratteri del Gruppo. C3v E 2C3 3σv A1 A2 1 1 1 1 1 -1 =259= z,z 2,x 2+y2 Rz Prof. M. Cini -Corso di Fisica Atomica e Molecolare E 2 -1 0 (x,y) (Rx,Ry ),(xz,yz),(x2y2,xy). Gli spostamenti cartesiani di N si trasformano come le coordinate. Troviamo i caratteri di Γ. χ(E)=12 (tutte le frecce ferme) χ(C3)=0 (tutti gli H sono mossi: carattere 0 lo spostamento z di N appartiene ad A1: carattere +1; gli spostamenti x e y appartengono a E : carattere -1) χ(σv )=2 (due H riflessi uno nell'altro: carattere 0; per l'altro H, due frecce nel piano di riflessione ed una ortogonale: carattere 1; per N la somma dei caratteri di A1 ed E da' 1) Quindi: E 2C3 3σv Γ 12 0 2 Γtrasl 3 0 1 Γrot 3 0 -1 __________________________ Γvibr 6 0 2 ; Γvibr =2A1+2E. Esercizio: vibrazioni del benzene (C6H 6). Ci sono 12 atomi e 36 coordinate, quindi χ(E)=36. Le rotazioni C2,C3 e C6 attorno all'asse verticale spostano tutti gli atomi ed hanno carattere 0. La rotazione C'2 intorno ad una diagonale dell'esagono lascia al loro posto 4 atomi, per ciascuno dei quali una freccetta e' invariante e le altre due cambiano segno. Quindi, χ(C' 2)=-4. La rotazione C''2 attorno ad un asse ortogonale a lati opposti sposta tutti gli atomi ed ha carattere 0, cosi' come l'inversione e le rotazioni improprie S 3 ed S6. La riflessione σh lascia invarianti due freccette per ogni atomo e cambia segno alla terza, quindi χ(σh )=12. La riflessione σv per un piano contenente l'asse di C'' 2 ha carattere 0. La riflessione σ' v , (detta anche σd) per un piano contenente l'asse di C'2 lascia fermi 4 atomi, con due freccette cambiate di segno ed una invariante per ogni atomo; quindi χ(σ' v )=4. I caratteri di Γtrasl si ottengono sommando quelli di A2u e di E1u; quelli di Γrot sommando A2g ed E1g. D6h A1g A2g B1g E 2C6 2C3 1 1 1 1 1 1 1 -1 1 C2 3C'2 3C"2 i 1 1 1 1 1 -1 -1 1 -1 1 -1 1 =260= 2S3 1 1 -1 2S6 σh 3σd 3σv 1 1 1 1 1 1 -1 -1 Rz 1 -1 1 -1 Prof. M. Cini -Corso di Fisica Atomica e Molecolare B2g E1g (R x, R y) E2g y 2,xy) A1u A2u B1u B2u E1u E2u -1 1 -1 -1 1 1 -1 1 -1 -1 2 1 (xz,yz) 2 -1 1 -1 -2 0 0 2 1 -1 -2 0 -1 2 0 -1 -1 2 1 1 1 1 1 1 -1 -1 1 1 1 1 1 1 -1 -1 1 -1 1 -1 2 2 1 -1 -1 -1 -2 2 0 0 0 1 -1 -1 1 0 0 2 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 -1 1 -1 1 -1 1 -2 -1 1 2 -2 1 1 -2 0 1 0 0 (x 2- -1 -1 1 1 z -1 1 1 -1 0 0 0 0 (x,y) ___________________________________________________________________ Γ 36 0 0 0 -4 0 0 0 0 12 4 0 Γtrasl 3 2 0 -1 -1 -1 -3 -2 0 1 1 1 Γrot 3 2 0 -1 -1 -1 3 2 0 -1 -1 -1 ______________________________________________________ ____ Γvibr 30 -4 0 2 -2 2 0 0 0 12 4 0 il Gruppo ha 24 elementi, e si trova che Γvibr =2A1g +A2g +A2u +2B1u+2B2g+2B2u+E1g+3E1u+4E2g+2E2u. Capitolo 11-Tensori irriducibili: teorema di Wigner-Eckart Ulteriori importanti sviluppi della teoria della simmetria sono necessari per lo studio di sistemi composti da piu' parti. Le parti sono gradi di liberta' diversi, come due elettroni, lo spin e l'orbita di un dato elettrone, un elettrone ed una vibrazione, etc. La base puo' sempre essere scelta come se le parti fossero indipendenti. 11-1 Operatori non invarianti In questo capitolo seguiamo la convenzione comune nei testi di teoria dei Gruppi, per cui la rotazione di una funzione scalare e' descritta da1 f(x) →f'(x) = Rf(x) = f(R-1 x) . (1) Il senso positivo di rotazione per le funzioni e' quello orario. Dobbiamo ora occuparci delle trasformazioni degli operatori. Supponiamo di avere una relazione del tipo Φ=TΨ (2) 1 B.L.Silver,"Irreducible tensor Methods",Academic Press 1976 definisce Ψ '(r ')=Rα Ψ (r '); M.Tinkam, "Group theory and quantum Mechanics", McGraw-Hill New york(1964). =261= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove T e' l'operatore. Una rotazione mandera' Φ in RΦ e Ψ in RΨ. Per vedere che cosa accade a T, applichiamo R alla relazione: RΦ = RTΨ = (RTR-1 )RΨ. (3) Quindi, la regola e' T → T' = RTR-1 . (4) Finora abbiamo considerato solo operatori T invarianti, tali che [T,R]- =0 , ovvero RTR-1 =T ∀ R∈G. (5) Se un operatore T non e' invariante, allora ∃ R∈ G tale che RTR-1 ≠ T. (6) Questo accade ad esempio con gli operatori vettoriali. La terza componente s z dello spin sotto rotazioni da' in genere sz R → sz' = RszR-1 = a sx +b sy + c s z, (7) con a,b,c tutti non nulli, e quindi non e' invariante. Pero' e' membro di un set di operatori (s x,s y ,s z) che vengono trasformati linearmente fra loro dalle operazioni del Gruppo. L'insieme di tutte le combinazioni lineari di sx,s y ,s z e' uno spazio vettoriale. Inoltre, la legge si → R si R-1 soddisfa le regole di composizione del gruppo. Scriviamolo per un generico set T i : R2 R1 -1 -1 -1 -1 (8) → R2Ti R2 → R1R2Ti R2 R1 = R3Ti R3 , R3 = R1R2. Sullo spazio vettoriale delle combinazioni lineari delle "componenti" Ti possiamo rappresentare ogni R con una matrice D(R) nel modo seguente: Ti Ti R2 → ∑ j T j Dji (R2) , Tj R1 → ∑ k T k Dkj (R1) ⇒ R1R2 ∑ T k ∑ D kj (R1) D ji (R2) = ∑ T k Dki (R1R2) . (9) → k j k In altri termini, le D si moltiplicano come le R e sono proprio le rappresentazioni del Gruppo, le stesse che avevamo introdotto per trasformare gli stati. In un Gruppo di rotazioni proprie, ad esempio, le componenti di s si trasformano come (x,y,z) e danno luogo alla rappresentazione tridimensionale dei vettori (che in certi Gruppi e' riducibile e in altri no). Questa puo' essere presa come una definizione di operatore vettoriale. Ti 11-2 ITO (Irreducible tensor operators) Cosi' in generale un operatore non invariante e' membro di un set di operatori (tensore) che, presi insieme, costituiscono una base per una rappresentazione del Gruppo secondo la regola =262= Prof. M. Cini -Corso di Fisica Atomica e Molecolare R -1 → RTi R = Ti ∑ T j Dji (R) ; (1) j se la rappresentazione e' riducibile, lo spazio vettoriale si puo' separare in sottospazi che non vengono mescolati fra loro da alcuna operazione del Gruppo; cio' si puo' fare prendendo opportune combinazioni lineari delle componenti del tensore. Se invece T e' base di una IRREP α, potremo etichettarlo con α e dire che Ti (α) e' un tensore irriducibile. Ruotare un vettore e' un problema elementare, ma avremo bisogno di considerare tensori piu' generali, le cui componenti sono prodotti delle componenti cartesiane x,y,z che si riferiscono a gradi di liberta' diversi. Vale la pena, allora, di passare dalla descrizione cartesiana a quella polare, che e' equivalente, ma si esprime direttamente in termini di autofunzioni del momento angolare. Le componenti polari del tensore sono combinazioni lineari di quelle cartesiane. Per un vettore queste si scrivono x m, m=0,±1, x+1= - x+iy x-iy , x 0=z, x-1=, 2 2 (2) e si trasformano secondo la legge RxmR-1 = ∑ xm' Dm'm(1) (R), m' (3) dove D(1) m'm(R) sono i rappresentativi di R sulla base delle armoniche sferiche con l=1. E' naturale scrivere in forma polare anche i vettori di base. Avremo e1+ie2 e1-ie2 , e0=e3, e- 1=, 2 2 ed in luogo di e+1= - V = V1e1+V2e2+V3e3 avremo, com'e' immediato vedere, V = 1 ∑(-1)m V-m em. (4) (5) (6) m=-1 Il prodotto scalare di due vettori reali V e W e' dato da =263= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 V⋅W = ∑(-1)m V-m Wm. (7) m=-1 Il vantaggio della rappresentazione polare e' che e' facile adesso generalizzare ad un ITO di rango arbitrario. Si pone come definizione di un tensore di rango γ RTp(γ ) R-1 =∑ T q(γ ) Dqp (γ ) (R) , q (8) Per esempio, se γ denota la rappresentazione con j=0, q e' 0 e T e' uno scalare; se γ denota la rappresentazione con j=1, q corrisponde a 0, ±1, e Tq e' un vettore nella rappresentazione polare, che si trasforma come x+iy x-iy T11= , T01=z, T-11= . (9) 2 2 In generale, Tq( l) si trasforma come Yl m. 11-3 Prodotto diretto di rappresentazioni Finora abbiamo studiato come analizzare con la teoria dei Gruppi lo stato di un elettrone o di una vibrazione in una molecola appartenente ad un Gruppo di simmetria G. Ma queste sono solo idealizzazioni: esiste solo la molecola, il cui stato quantico potra' dipendere in modo complicato dalle cordinate degli elettroni e dei nuclei, ma si trasforma in modo semplice sotto le operazioni del Gruppo G. Il nostro problema e': che relazione c'e' fra la simmetria della molecola come un tutto e quella degli stati dei singoli elettroni, o dei singoli modi vibrazionali, che possiamo usare per descrivere lo stato della molecola? Consideriamo un sistema composto da due parti 1 e 2. Per esempio, potrebbero essere due elettroni, un elettrone ed una vibrazione, etc. Un generico stato del sistema e' una combinazione lineare di prodotti del tipo f(1)g(2); possiamo scegliere la base in modo che le funzioni f e g appartengano a IRREP di G, poniamo f a Γα e g a Γβ. Le funzioni di base di Γα e Γβ si trasformano secondo le note regole, e ∀R∈G R fi (α) (1) = m ∑ k f k (α) (1) Dki (α) (R) =264= (1) Prof. M. Cini -Corso di Fisica Atomica e Molecolare n ∑ R gj(β) (2) = g p(β) (2) Dpj(β) (R). (2) p Naturalmente, R agisce sulle coordinate 1 nel primo caso, su quelle 2 nel secondo, ed agira' su tutte e due quando si trattera' di ruotare la molecola. Lo stato si espande nelle funzioni di base |αiβj> ≡ fi (α) (1)gj(β) (2) (3) che si trasformano nel modo seguente: m n k p ∑ ∑ R |αiβj> = m n k p ∑ ∑ ≡ | αkβp> Dki (α) (R) Dpj(β) (R) ≡ | αkβp> Dkp,ij(αβ) (R) . (4) Si dice che D kp,ij(αβ) (R) = Dki (α) Dpj (β) e' il rappresentativo di R nella rappresentazione del prodotto diretto. Si noti che esso esprime l'effetto della rotazione del sistema come un tutto in termini delle rotazioni delle sue parti. Cosi', Dki (α) Dpj (β) e' il prodotto diretto dei rappresentativi delle IRREP α e β, e genera una rappresentazione di dimensione mn. Il carattere e' la somma degli elementi diagonali dei rappresentativi. Si ha χ (αβ) (R) = ∑ kp D kp;kp (αβ) (R) = ∑ kp D kk (α) Dpp(β) = χ (α) (R) χ (β) (R) ; (5) in altri termini, il carattere della rappresentazione prodotto diretto e' semplicemente il prodotto dei caratteri delle rappresentazioni componenti. Di solito, la rappresentazione prodotto diretto e' riducibile; la decomposizione si ottiene con la regola usuale ni = 1 g ∑ χ i (R)χ (αβ)(R). R Prendiamo come esempio il Gruppo C3v. C3v A1 I 1 2C3 1 A2 1 1 3σv 1 -1 =265= (6) Prof. M. Cini -Corso di Fisica Atomica e Molecolare E A1A1 2 1 -1 1 0 1 = A1 A2A2 1 1 1 =A1 A2E 2 -1 0 =E EE 4 1 0 = E + A1 + A2 Si puo' costruire cosi' una tabella di moltiplicazione dei prodotti diretti del Gruppo C3v A1 A2 E A1 A2 E A1 A2 E A2 A1 E E E E+A1 +A2 e si vede che la rappresentazione totalsimmetrica compare solo lungo la diagonale. E' facile sincerarsi che deve essere sempre cosi', perche' nA1 = 1 g ∑ R 1 ⋅χ (αβ)(R) = 1 g ∑ R χ (α) (R)χ (β)(R) =δαβ. (7) Questo risultato e' della massima importanza perche' permette di stabilire regole di selezione. Il punto e' che un integrale I = ∫ F ( r) d3r (8) e' un numero e quindi deve trasformarsi secondo la rappresentazione totalsimmetrica. Di conseguenza, I=0 se F non contiene una parte totalsimmetrica. Se ora φa e φb sono funzioni d'onda, si trova che ∫ φa φb d3r =0 (9) se φa e φb appartengono a R.I. Γ(φa) e Γ(φb) diverse. Piu' in generale, se A e' un operatore, si ha ∫ φa A φb d3r =0 (10) se la rappresentazione prodotto diretto Γ(φa A φb) = Γ(φa)Γ( A )Γ(φb) non contiene A1. Per questo e' necessario che Γ(φa)Γ(φb) contenga qualcuna delle IRREP presenti in Γ( A ). Per esempio, se in una molecola con simmetria C3v introduciamo una perturbazione A che si =266= Prof. M. Cini -Corso di Fisica Atomica e Molecolare trasforma come A2, gli elementi di matrice non identicamente nulli sono quelli del tipo (φA1|A|φA2) e (φE|A|φE) . Le transizioni elettroniche che si osservano negli spettri di assorbimento ottico delle molecole sono indotte dall'operatore dipolo, che si trasforma come r. L'elemento di matrice ∫ φa r φb d3r e' nullo se Γ(φa)⊗Γ(φb) non contiene Γ(r). Consideriamo le transizioni dallo stato fondamentale φg ad uno stato eccitato φex . Nell'approssimazione di Hartree-Fock, gli stati φ si esprimono come determinanti, che sono combinazioni lineari di prodotti di orbitali ψ a particella singola. Ad ogni stato corrisponde una configurazione, come ad esempio ψ12ψ22ψ3ψ4, che ha due orbitali doppiamente riempiti e due elettroni in due altri orbitali. E' evidente che Γ(ψ1ψ2) = Γ(ψ1)⊗Γ(ψ2), e, nel caso in cui ψ1 appartenga ad una IRREP non degenere, i cui caratteri sono ±1, il prodotto diretto ha i caratteri tutti uguali a 1, e Γ(ψ12) =A 1. Una molecola che ha solo orbitali non degeneri doppiamente occupati si trasforma quindi secondo A 1, ed e' totalsimmetrica. Consideriamo allora una molecola con orbitali degeneri, come il CH4, che ha la configurazione di stato fondamentale a12t26. I 3 orbitali t2 che si trasformano come x,y e z e sono doppiamente occupati costituiscono una base di t2. Una operazione del Gruppo Td ha per effetto una trasformazione unitaria della base. Ma una trasformazione unitaria non cambia il determinante di Slater, e quindi la molecola e' totalsimmmetrica. Cosi', lo stato fondamentale φg di tutte le molecole 'a gusci chiusi', cioe' della maggior parte delle molecole, si trasforma secondo A1, e, per gli stati eccitati, si possono ignorare i gusci chiusi, studiando le sole proprieta' di simmetria dei gusci aperti. Analogamente, in una transizione ψ12ψ22ψ32 →ψ12ψ22ψ3ψ4, la regola di selezione richiede che Γ(r) sia contenuta in Γ(ψ3ψ4). Prendiamo di nuovo come esempio la molecola di H2O, con lo schema di livelli LCAO, qui illustrati con i loro "caratteri" O(3s) Livelli σ antileganti Lone pair O(2p) Livelli σ leganti Lone pair O(2s) ↓↑ ↓↑ ↓↑ ↓↑ a1 b1 a1 b2 b1 a1 a1 e la tabella dei caratteri del Gruppo di simmetria C2v E C2 σv (xz) σ' v (yz) _________________________________________ =267= Prof. M. Cini -Corso di Fisica Atomica e Molecolare A1 1 1 1 1 z A2 1 1 -1 -1 B1 1 -1 1 -1 x B2 1 -1 -1 1 y __________________________________________ Una transizione dal "lone pair" b2 al b1 soprastante risulta proibita, perche' B 1⊗B2 = A2, e nessuna componente di r si trasforma in tal modo. Invece, una transizione al livello a1 e' permessa dalla componente y del dipolo, ed infatti corrisponde ad un forte assorbimento ultravioletto. Una simile analisi si puo' fare per le transizioni infrarosse fra stati vibrazionali che appartengono a un dato livello elettronico. Vedemmo a suo tempo che gli spostamenti dei nuclei si ottengono dall'equazione ∑ W ij Q j = ω2Q i . j La soluzione fornisce i modi normali , cioe' i i vettori Qα , e le loro frequenze proprie ωα . Le dipendenze temporali sono armoniche, Qα (t) =Qα eiω α t, e la soluzione generale delle equazioni del moto e', espressa in componenti, s Q i (t) = ∑qα (t)Q α i , (11) α=1 dove s=3N-6 (oppure 3N-5 per molecole lineari), escludendo rotazioni e traslazioni; qα (t) = qα eiω t sono le coordinate normali. Se in una operazione di simmetria le Qi (t) cambiano segno, questo equivale ad un cambiamento di segno delle ampiezze qα ; in generale, le qα si trasformano secondo la IRREP del Gruppo che corrisponde alla frequenza α. In termini di coordinate normali, le equazioni del moto sono " semplicemente q α =-ωα 2qα . Dopo la trasformazione canonica, l'Hamiltoniana vibrazionale e' della forma s 1 pα 2 H= ∑ [ + mα ωα 2qα2] , (12) α 2 mα dove mα sono opportune costanti; le vibrazioni sono cioe' una collezione di oscillatori armonici indipendenti. Quantisticamente, lo s stato fondamentale ha l'energia E=∑ (nα +1/2)h / ωα ; la funzione d'onda α vibrazionale e' il prodotto degli stati fondamentali Ψ g ∝ exp[ ∑ α - qα2 ]. 2 (13) =268= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per ogni frequenza propria, la combinazione che appare all'esponente e' la stessa che figura in H, ed evidentemente Ψ g ha la stessa simmetria di H, cioe' appartiene ad A 1. Se portiamo la molecola sul primo stato eccitato del generico modo α, Ψ sara' proporzionale a qα e si trasformera' secondo la IRREP corrispondente. Perche' questo possa avvenire in una transizione infrarossa, occorre quindi che almeno una delle componenti del dipolo appartenga alla stessa IRREP D'altra parte, le vibrazioni molecolari possono essere studiate anche con altre spettroscopie, che hanno regole di selezione diverse. Come vedremo, l'effetto Raman e' un processo in cui il sistema transisce da uno stato iniziale |i> ad uno finale |f> assorbendo un fotone ed emettendone un altro di frequenza diversa. Emissione ed assorbimento sono coerenti, cioe' fanno parte di un unico processo quantico. Studieremo piu' avanti la dinamica di questo processo; dal punto di vista della teoria della simmetria, tutto cio' che ci occorre sapere e' che si tratta appunto di un processo a due fotoni. Nel caso di una transizione ad un fotone solo, l'operatore che la causa e' il prodotto scalare ⋅d del vettore di polarizzazione del fotone con il dipolo d, le cui componenti si trasformano come le componenti xi di r; nel caso Raman, dovremo considerare un operatore del tipo ∑ Rpq ( ε2) p( ε1) q , dove le componenti del tensore Raman Rpq si pq trasformano come xpxq. Questo determina le regole di selezione, che possono essere molto diverse dalle precedenti se il sistema e' altamente simmetrico. In particolare, se la molecola e' dotata della simmetria di inversione, i modi normali devono essere pari o dispari (gerade o ungerade); solo quelli dispari sono attivi in infrarosso, e solo quelli pari sono "Raman-attivi". Cosi', gli spettri Raman e infrarossi non hanno frequenze fondamentali in comune in tali casi. Ad esempio, nel Benzene le componenti del dipolo sono assegnate dalle tabella dei caratteri del Gruppo D6h come segue: A1u z E1u (x,y) mentre quelle del tensore Raman sono assegnate da A1g z 2, x 2+y2 E1g xz, yz E2g x2-y2, xy. L'analisi delle vibrazioni da' una frequenza A2u e tre E1u, e ci aspettiamo 4 frequenze IR; nel Raman ci si aspettano 7 frequenze ( due del tipo A1g, una E1g, quattro E2g). L'esperimento conferma queste predizioni, e quindi la struttura planare del Benzene. 11-4 Effetto Jahn-Teller Che cos'e' che conferisce alle molecole simmetriche la loro simmetria? Perche' ad esempio il Metano e' tetraedrico? Evidentemente, il fatto che un moto dei nuclei tendente a distorcere =269= Prof. M. Cini -Corso di Fisica Atomica e Molecolare la simmetria causa un aumento dell'energia potenziale, e cosi' nasce una forza che vi si oppone. Poiche' questa forza e' dovuta agli elettroni, si potrebbe sospettare che essi, per qualche motivo, 'prediligano' la massima simmetria compatibile con la formula di struttura di una data molecola. Ma e' vero se mai il contrario: la funzione d'onda di un elettrone in uno stato degenere puo' essere meno simmetrica del potenziale in cui l'elettrone si muove. Di conseguenza, se la geometria dei nuclei e' altamente simmetrica, e vi sono livelli elettronici degeneri, la nuvola elettronica rompe la simmetria, e la molecola guadagna energia da una distorsione. Vedremo che, eccezion fatta per le molecole lineari, una tale deformazione energeticamente favorita esiste sempre: ad esempio, lo ione CH4+ ottenuto togliendo un elettrone t 2 ha la simmetria ridotta di un tetraedro distorto. Insomma, CH 4 e' cosi' simmetrico perche' il suo stato fondamentale elettronico e' non degenere, e gli elettroni non hanno gradi di liberta' che possano abbassare la simmetria. Discuteremo il problema nell'approssimazione di BornOppenheimer (BO). Vale a dire, 1) il moto degli elettroni e' governato da un potenziale che dipende dalle posizioni ri dei nuclei solo parametricamente1; la configurazione di equilibrio corrisponde al minimo dell'energia totale U({ri }) = <Ψ g {ri }|H{ri }|Ψ g {ri }> e si ottiene ∂U imponendo =0, i=1,...3N. 2) gli stati elettronici si intendono ∂δri calcolati per quella configurazione dei nuclei, che corrisponde esattamente al minimo di U. Vogliamo esaminare una data configurazione {r0i } dei nuclei e discutere se puo' essere di equilibrio. Facciamo una espansione in serie negli spostamenti δri . Invece degli spostamenti dei singoli nuclei, conviene considerare i modi normali Qα calcolati rispetto alla configurazione di riferimento {r0i }. Questi sono etichettati dall'indice α della frequenza; la degenerazione e' quella mα della irrep a cui appartiene la frequenza; per irrep degeneri l'indice i =1,..mα percorre le componenti della IRREP. L'ampiezza del moto secondo il modo normale e' descritta dalla coordinata normale qα , e le coordinate normali compaiono nell'energia di vibrazione (che pero' non e' inclusa nel calcolo di U nella approssimazione di BO). Ci serve una espansione di U in serie di potenze degli spostamenti qα i delle coordinate normali. Pero' non disponiamo di una espressione analitica di U da espandere in serie. Quindi, espanderemo H e poi useremo le formule della teoria delle perturbazioni per trovare la correzione ad U. Scriviamo l'Hamiltoniano della molecola nell'approssimazione quadratica, 1cioe', gli r non sono considerati operatori, e non hanno momenti i coniugati. =270= Prof. M. Cini -Corso di Fisica Atomica e Molecolare V αi qα i + ∑ ∑ W αi,βk qα i qβk , (1) αβ αi ik dove H0 si riferisce alla configurazione data. I termini correttivi possono essere interpretati come termini di accoppiamento "vibronico", con i quali si possono cioe' studiare gli effetti dell'accoppiamento fra elettroni e vibrazioni. Nell'approssimazione di BO, V αi ha il senso di un potenziale con cui la componente i della vibrazione α agisce sugli elettroni; infatti, l'approssimazione di BO consiste nel considerare H come funzione dei parametri {r0i } e qα i , ma come operatore solo sui gradi di liberta' elettronici; la vera H dipende quadraticamente dai momenti pα i coniugati alle qα . Se tenessimo conto di questo andremmo oltre l'approssimazione di BO (effetto Jahn-Teller dinamico). Bisogna che Vαi e qα i si trasformino allo stesso modo, perche H deve essere uno scalare e nella tabella dei prodotti diretti A1 compare solo sulla diagonale. Non ci interessano qui i V∈A1 : essi non distorcono la simmetria (possono semmai accrescerla: con una vibrazione ∈A1 si potrebbe "raddrizzare" la molecola d'acqua che cosi' apparterrebbe a D∞h ). La condizione di equilibrio e' che non vi siano correzioni all'energia U di primo ordine nei q α i ; quindi H=H 0 + <H'>= ∑ ∑ < V αi >qα i =0. αi Certo, i V αi sono diversi da zero, perche' non si puo' pretendere che uno spostamento dei nuclei non crei un cambiamento del potenziale. Pero', la condizione di equilibrio e' <Ψ g |Vαi |Ψ g >=0. Se Ψ g e' uno stato elettronico non degenere, Γ(Ψ g Ψ g )=A 1 comporta <Ψ g |Vαi |Ψ g >=0 per tutti i modi tranne quelli di A1: i nuclei si muoveranno rispettando la simmetria finche' <Ψ g |VA1|Ψ g >=0. Nel caso degenere H 0Ψ 0 =E0Ψ 0 e' risolta da un certo numero di Ψ 0ν . La condizione di equilibrio e' ancora che la correzione di primo ordine agli autovalori sia nulla. Per trovarla, applicheremo la teoria delle perturbazioni di un livello degenere, diagonalizzando la matrice H' ρσ = <Ψ 0ρ|H'|Ψ 0σ>. L'unica matrice che ha autovalori tutti nulli e' quella nulla. Cosi', <Ψ ρ| ∑ V αi qα i |Ψ σ>=0. αi Ma, essendo i q α i indipendenti, questo richiede che ∫ Ψ 0ρVαi Ψ 0σ dq =0 , ∀ α,i,ρ,σ (2) dove dq comporta l'integrazione su tutte le coordinate elettroniche. Questa e' una condizione molto forte. Se gli elementi di matrice del primo ordine non si annullassero tutti identicamente, cio' porterebbe =271= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ad una scissione del livello lineare nei qαi , e quindi ad un abbassamento della simmetria ed a una distorsione della molecola. Ora dobbiamo esaminare ciascuno dei modi normali α consentiti dalla geometria ipotizzata per vedere se puo' generare elementi di matrice non nulli che distruggerebbero la simmetria. L'effetto Jahn-Teller si manifesta quando la IRREP Γα del modo normale e' ≠A1 e la IRREP Γel che ha per base le Ψ ν e' degenere; infatti, se Γel ⊗ Γel contiene Γα , non c'e' motivo perche' gli elementi di matrice si annullino identicamente, e la configurazione molecolare e' instabile. Consideriamo per esempio una molecola tetraedrica. Le IRREP degeneri del Gruppo Td sono E, T1 e T2, e si trova: E⊗E =A1 ⊕ E, T1⊗T1 =A1 ⊕ E ⊕ Τ2 , T2⊗T2 =A1 ⊕ E ⊕ Τ2. Le IRREP delle vibrazioni sono A1, E, T2 , quindi ce ne e' almeno una 'Jahn-Teller attiva', cioe' capace di distorcere la molecola. La considerevole larghezza del livello t 2 del CH4 visto in fotoemissione e' dovuta proprio al fatto che la ionizzazione eccita le vibrazioni della molecola obbligando i nuclei a cercare una nuova posizione di equilibrio. Nel 1937, Jahn e Teller hanno dimostrato che data una molecola non lineare con Γel degenere esiste sempre una vibrazione tale che Γα ≠A1 e' contenuta in Γel ⊗ Γel ; questo implica che i termini elettronici fondamentali delle molecole non lineari sono non degeneri. La dimostrazione non e' particolarmente elegante, e si ottiene ripetendo per tutti i Gruppi possibili l'analisi che abbiamo svolta nel caso di Td. Si noti pero' che questa analisi non detemina univocamente il tipo di distorsione. La base di una IRREP di un Gruppo G e' base di una rappresentazione di ogni sottogruppo di G, ma di solito tale rappresentazione puo' essere risolta, applicando il LOT. Ad esempio, la IRREP E di Td si risolve in A1g ⊕ B1g in D4h ed in A1 ⊕ B1 in D2d; ambedue le distorsioni conducono ad IRREP non degeneri e possono dar luogo ad una geometria di equilibrio. Per le molecole lineari il teorema non vale. Nelle molecole con |Λ|≥1, gli stati con Λ e -Λ sono degeneri. Per risolvere la degenerazione bisognerebbe piegare la molecola. Uno spostamento di un nucleo fuori dell'asse e' un vettore (cosφ,sinφ); gli elementi di matrice sono soggetti alla regola di selezione ∆Λ = ±1. Quindi tutti gli elementi di matrice si annullano e la degenerazione rimane. 11-5 Riduzione della base e dei rappresentativi di un prodotto diretto Abbiamo visto come si riduce una rappresentazione del prodotto diretto; ma rimane da vedere come si decompone la base. E' chiaro che si deve poter passare, con una trasformazione unitaria, =272= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dalla base {|αiβj>} del prodotto diretto di Γα e Γβ ad una base {|γ,r>} di funzioni che si trasformino secondo una IRREP Γγ del Gruppo della molecola. Se mγ e' la degenerazione di Γγ , |αiβj> = ∑γ mγ ∑ | γr><γr|αiβj>. (1) r I coefficienti <γr|αiβj> sono i coefficienti di Clebsh-Gordan del Gruppo; nel caso del Gruppo continuo O +(3) delle rotazioni di un angolo qualsiasi sono da identificare con i ben noti <LM|L1M1L2M2>. Il Gruppo O(n) e' definito in generale come quello delle trasformazioni lineari R di uno spazio vettoriale a n dimensioni tali che i coefficienti della trasformazione sono reali, R-1 = RT e |Det(R)| =1; in 3 dimensioni cio' corrisponde alle rotazioni, proprie e improprie, nello spazio reale di un angolo qualsiasi. Se ci limitiamo alle rotazioni proprie con Det(R)=+1, si ha il sottogruppo O+(3). Il set delle armoniche sferiche YL M ,∀L, e' base di una IRREP di O+(3). Per un gruppo puntuale, i coefficienti di C.G. sono in realta' piu' facili da trovare che per O +(3). Una volta scelti i set di base di Γα e Γβ si costruisce una tabella degli effetti di ogni R su ogni funzione. Allora sara' possibile determinare gli effetti degli R sulla base del prodotto diretto, e quindi mettere in atto la tecnica degli operatori di proiezione. Esercizio. Due elettroni si trovano in stati di simmetria E in una molecola appartenente al Gruppo C3v. Determinare la parte spaziale della funzione di simmetria A1 del singoletto, ed i coefficienti di Clebsh-Gordan. Risoluzione: la base a un elettrone e' (x,y), e si tratta di trovare la funzione di simmetria A1 che si ottiene dal prodotto diretto E⊗E, la cui base e' {x1x2, x1y 2, y 1x2, y 1y 2}. Useremo l'operatore di proiezione PA 1=∑ R , R dove R sono gli operatori del Gruppo. Studiando gli effetti degli operatori sulle funzioni di base, si trova che R Rx R y _______________________________ E x y x+ 3y -y+ 3x C3 -( ) ( ) 2 2 -x+ 3y y+ 3x C23 ( ) -( ) 2 2 σv(1) x -y -x+ 3y y+ 3x ( ) ( ) 2 2 x+ 3y y- 3x σv(3) -( ) ( ) 2 2 ________________________________ σv(2) =273= Prof. M. Cini -Corso di Fisica Atomica e Molecolare x1+ 3y1 x2+ 3y2 Cosi' PA1 x1x2 = x1x2 + ( )( ) + ...=3(x1x2+y1y 2). Questa e' la 2 2 funzione d'onda spaziale cercata, da normalizzare. I suoi prodotti scalari con le componenti {x1x2, x1y 2, y 1x2, y 1y 2} della base del prodotto diretto sono i coefficienti di Clebsh-Gordan. Sappiamo come trovare i coefficienti di C.G.; inoltre essi sono tabulati in letteratura per i gruppi di intereresse chimico. Tuttavia noi non avremo bisogno dei loro valori numerici. Per decomporre i rappresentativi, bastera' operare formalmente con una R: mγ R |αiβj> = ∑ ∑ R | γr><γr|αiβj>= γ r = ∑γ mγ mγ ∑ ∑ | γs>D sr (γ ) <γr|αiβj>, (2) r s ed esprimere il risultato nella base del prodotto diretto introducendo un set completo: R |αiβj> = m n k p γ ∑ ∑ ∑ mγ mγ r s ∑ ∑ | αkβp><αkβp|γs>D sr (γ ) <γr|αiβj>. (3) Confrontando con l'espressione (3.4) m n R |αiβj> = ∑ ∑ | αkβp> Dkp,ij(αβ) (R) , k p troviamo Dkp,ij(αβ) (R) =Dki (α) Dpj (β) = ∑ ∑ < αkβp|γs>D sr (γ ) <γr|αiβj>. (4) γr s Gli elementi di matrice della trasformazione unitaria che riduce la rappresentazione del prodotto diretto sono i coefficienti di C.G., fatto questo che ci e' familiare dalla teoria del momento angolare. Lo stesso problema che abbiamo risolto per gli stati si presenta anche per gli operatori. Un operatore che descrive l'interazione fra gradi di liberta' diversi, come un elettrone ed una vibrazione, puo' essere analizzato in tensori irriducibili che hanno proprieta' di trasformazione ben definite per trasformazioni globali della molecola. Abbiamo visto che un tensore irriducibile Tq( l) e' un operatore che si trasforma come Yl m. Questa osservazione ha conseguenze molto importanti. Per le armoniche sferiche vale il teorema di somma dei momenti angolari =274= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |L1L2LM > = ∑ |L 1M1L2M2 ><L1M1L2M2 |L1L2LM > , M1M2 (5) che dice come dal prodotto diretto di due armoniche sferiche possiamo costruire un autostato di L e M. Consideriamo allora due k k ITO, Tn 1(1) e T n 2(2) , che supponiamo operare su variabili 1 e 2 1 2 fra loro diverse e commutanti. Niente vieta di considerare l'operatore k k prodotto diretto T n 1(1) T n 2(2) , che avra' (2k1+1)(2k2+1) 1 2 componenti, e di estrarne tensori composti di rango definito con k k k { T 1(1) ⊗T 2(2)} q = = ∑ n1n2 k k <k 1n1k 2n2|k 1k 2kq> Tn 1(1) T n 2(2) . 1 2 (6) Ad esempio, partendo dai due vettori L e S, si ottiene per k=0 lo scalare L⋅S , per k=1 un tensore di primo rango proporzionale al prodotto vettore di L e S, e per k=2 un tensore piu' complesso; e' ovvio che lo scalare, essendo del tipo di una interazione spin-orbita, e' di interesse fisico particolarmente immediato. 11-6 Gruppi doppi Finora abbiamo considerato solo il Gruppo di trasformazioni degli orbitali spaziali. Ma la funzione d'onda ha anche la parte di spin. La giustificazione e' che, se possiamo trascurare l'interazione spinorbita, tutte le considerazioni svolte rimangono valide, e ciascun livello acquista una degenerazione 2 dovuta allo spin. In tal caso, tutte le direzioni dello spin sono equivalenti. L'interazione spinorbita, pero', condiziona lo studio della simmetria perche' rende il problema meno simmetrico: per esempio, un livello idrogenoide di momento angolare l≠0, degenere 2(2l +1) volte, si separa in due livelli j± =l± 1/2, degeneri 2j± +1 volte. Dunque, l'interazione spin-orbita abbassa la simmetria, e noi dobbiamo studiarne le implicazioni dal punto di vista della teoria dei Gruppi. Lo spin, da solo, o in un orbitale A1, da' luogo ad una sua rappresentazione degli operatori. Abbiamo visto nel Capitolo 4 che l'operatore che ruota uno spin intorno all'asse z di un angolo ω e' e-iω /2 0 Rω = I cos (ω/2) -i σz sin(ω/2) = 0 e iω /2 ; (1) =275= Prof. M. Cini -Corso di Fisica Atomica e Molecolare allora sorvolammo sul fatto evidente, e sorprendente, che, se ω = 2π, Rω =-1. Ruotando intorno ad un asse di versore n, poiche' (σ⋅n) 2=1, si trova R =I cos (ω/2) -i (σ⋅n) sin(ω/2) e per ω=2π si ha sempre R=-I. Dunque, una rotazione completa di 2π non lascia le cose come stavano, ma cambia di segno uno spinore. _ Seguendo Teller (1929) indichiamo con E la rotazione di 2π intorno ad un asse arbitrario. Essa vale E su una funzione senza spin e _ -E per uno spinore: in ambedue i casi, E commuta con tutte le R∈G. Il Gruppo di simmetria adatto a descrivere sia spinori che funzioni senza spin consta delle operazioni di simmetria usuali, con l'aggiunta _ _ di E e di tutte le operazioni che si ottengono moltiplicando E per ciascuna delle precedenti. Il Gruppo piu' grande G' cosi' ottenuto si chiama Gruppo doppio, perche' ha il doppio degli elementi del Gruppo originario G. Commutando con tutti gli elementi del Gruppo _ _ doppio, E costituisce classe a se'. Dal momento che E 2=E, gli _ _ autovalori possibili di E sono ±1. Il rappresentativo di E in ogni IRREP _ e' ±I (lemma di Schur) ed i caratteri di E sono ±χ(E). Vi sono dunque _ IRREP del Gruppo doppio che, avendo χ(E ) = χ(E), non dicono nulla di nuovo rispetto a quelle usuali, e attribuiscono lo stesso carattere a R _ e a RE ; le altre, a causa del segno -, gli attribuiscono caratteri opposti. Una delle IRREP di G' la conosciamo: e' la rappresentazione _ spinoriale che ha carattere -2 per E . Rappresentativi delle rotazioni -iω sono le matrici R = exp( (σ⋅n)). I caratteri sono invarianti per 2 trasformazioni unitarie, e per calcolarli conviene prendere n lungo exp(-iω/2) 0 l'asse z: cosi' R = 0 exp(iω/2) ed il carattere e' 2cos(ω/2). L'inversione i lascia invarianti i momenti angolari, come r∧p, e anche 1 0 lo spin. Pertanto, il suo rappresentativo e' 0 1 ed ha carattere 2. Le riflessioni e tutte le rotazioni improprie possono essere scritte come prodotti (i ⋅Rω ). Esempio: riflessione sul piano xy: x y z → x y -z. Una R di π intorno a z : x y z → -x -y z seguita da i da' lo stesso risultato. In tal modo, possiamo completare i caratteri della rappresentazione spinoriale. Questa descrive un elettrone con un orbitale A 1. =276= Prof. M. Cini -Corso di Fisica Atomica e Molecolare In un problema fisico, potremo cominciare con l'analisi gruppale delle proprieta' di simmetria degli orbitali spaziali, come abbiamo fatto nei paragrafi precedenti; le r.i. senza spin _ corrispondono in G' a r.i. con χ(E ) = χ(E); poi potremo moltiplicare i nostri orbitali per le funzioni di spin, ottenendo cosi' rappresentazioni del prodotto diretto fra quelle spaziali e quella di spin. In generale, le rappresentazioni prodotto diretto saranno riducibili nel Gruppo doppio applicando le regole generali. Potremo cosi' stabilire come l'interazione spin-orbita riduce la degenerazione degli stati nel problema in questione. Esempio Il Gruppo puntuale D4 ha le 8 operazioni E, C4, C43, C2, 2C'2 , 2C"2. C' C" Si ricava facilmente la tabella dei caratteri: ci sono 8 operazioni, 5 classi e 5 irrep; la somma dei quadrati delle dimensioni fa' 8. D4 E C4,C43 C2 2C'2 2C"2 A1 1 1 1 1 1 A2 1 1 1 -1 -1 B1 1 -1 1 1 -1 B2 1 -1 1 -1 1 E 2 0 -2 0 0 Per trovare come lo spin risolve la degenerazione in questa simmetria, dobbiamo considerare il Gruppo doppio D' 4 che ha 16 operazioni e la seguente tabella di caratteri: D'4 E A'1 A'2 B' 1 B' 2 E'1 E'2 E'3 1 1 1 1 2 2 2 _ E 1 1 1 1 2 -2 -2 C4 _ C43E 1 1 -1 -1 0 2 - 2 C43 _ C4E 1 1 -1 -1 0 - 2 2 =277= C2 2C'2 2C"2 1 1 1 1 -2 0 0 1 -1 1 -1 0 0 0 1 -1 -1 1 0 0 0 _ C2E _ 2C2'E _ 2C2"E Prof. M. Cini -Corso di Fisica Atomica e Molecolare Qui ci sono 7 classi, 7 irrep, e la somma dei quadrati fa' 16, quante sono le operazioni, quindi la tabella e' completa. Sapremmo dedurre la tabella dei caratteri! Ogni operazione fa' classe con la sua inversa in _ D' 4;infatti, E =C44=C22 mentre E=C48=C24. Esiste sempre qualche operazione che coniuga X con X-1 . Da A 1ad E'1 troviamo le irrep senza spin. Quelle nuove sono E'2 ed E'3. La rappresentazione spinoriale coincide con E'2 ed e' irriducibile: il carattere di una _ π π rotazione di e' ±2cos( ) =± 2. Un orbitale non cambia sotto E ; se 2 4 appartenente ad una R.I. di D4, appartiene anche a quella corrispondente di D' 4. Consideriamo un orbitale di B'2. Introducendo lo spin, si ha B' 2⊗E'2 = E'3. Questa e' una IRREP e la classificazione e' finita. Se l'orbitale appartiene invece ad E, va classificato in E'1. Il prodotto diretto con lo E'2 da' D'4 E _ E C4 _ C43E C43 C2 _ C4E _ C2E 2C'2 _ 2C2'E 2C"2 _ 2C2"E E'1 2 2 0 0 -2 0 0 E'2 2 -2 0 0 0 2 - 2 E'1⊗E'2 4 -4 0 0 0 0 0 E'1⊗E'2 = E'2+E'3, e la degenerazione 4 si risolve in due doppietti. Consideriamo uno ione Cu++, con una configurazione 3d 9 . L'interazione spin-orbita da' luogo a due livelli che corrispondono a J = 3/2 , 5/2. Le corrispondenti IRREP Γ3/2 e Γ5/2 del Gruppo delle rotazioni hanno dimensione 4 e 6 rispettivamente. Nel CuO e nei superconduttori ceramici ad alta temperatura, lo ione si trova circondato da 4 anioni O - - in una struttura planare, il cui Gruppo puntuale D4 ha le 8 operazioni E, C4, C43, C2, 2C'2 , 2C"2. I caratteri delle rappresentazioni riducibili si ottengono dalla nota _ sin[(J+1/2)α] formula χ(α) = , tenendo conto che χ(E )=-χ(E) per J sin(α/2) semi-intero. Si trova che Γ3/2 = E'2 + E'3, Γ5/2 = E'2 + 2E'3. 11-7 Fractional Parentage I calcoli delle funzioni d'onda degli atomi con n elettroni in gusci aperti sono onerosi, per n≥2. Per n=2, abbiamo visto in dettaglio come costruire i termini dello schema LS con un procedimento che comporta (i) l'uso dei coefficienti di CG per combinare i momenti angolari orbitali e di spin, tenendo conto del principio di Pauli per =278= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elettroni equivalenti (ii) sempre per elettroni equivalenti, il ricalcolo della normalizzazione. Abbiamo notato che tale procedimento assicura il successo in tutti i casi. Tuttavia, dobbiamo fare delle osservazioni sul caso generale n>2, che sono rilevanti allo studio della simmetria degli stati di multipletto ed utili in pratica. 1) Il procedimento studiato si basa sulla somma dei momenti angolari di due elettroni, sulla somma dei momenti L,S risultanti con quello di un terzo elettrone, e cosi' via. L'ordine con cui i singoli elettroni entrano nel calcolo e' arbitrario, ed e' ovvio che si devono ottenere gli stessi termini atomici comunque si proceda. 2) Supponiamo di avere una configurazione p2, con i suoi termini 1S, 3P,1D, e di procedere ad aggiungere un terzo elettrone p equivalente. Partendo da p2 1D, possiamo formare p3 2P, o p3 2D. Non esiste p 3 2F, perche' il principio di Pauli proibisce piu' di due elettroni con M L =1. Ma i termini permessi, p 3 2P e p3 2D, sono ottenibili anche partendo da p2 3P. Si dice allora che ciascuno di questi termini p3 ha due genitori (parents) , e precisamente p2 3P e p2 1D. Nel caso dei termini atomici, i genitori possono essere uno, due o anche tre o piu'. 3) Con due soli elettroni, ogni termine che figura in una configurazione vi appare solo una volta: abbiamo visto in particolare che d2 si risolve nei termini 1S, 3P,1D, 3 F,1G. Ma se si analizza la configurazione d3, si trovano i termini 2P,4P,2D (due volte) 2F, 4F,2G e 2H. Il fatto nuovo e' che un dato termine LS compare piu' di una volta. Rifacendoci al primo postulato della meccanica quantistica (il set dei buoni numeri quantici individua lo stato) dobbiamo aspettarci che qualche numero quantico diverso da L e da S distingua fra loro i due 2D. Nel caso di una configurazione dn , e' possibile distinguere tutti i termini fra loro con un solo1 numero quantico v ( seniority number), definito dal piu' basso valore di n per cui appare il termine in questione. Per n=0, si ha solo 1S; per d2 1S, si ha quindi v=0. Tutti gli altri termini di d2 hanno v=2; dei due stati p3 2D, l'uno ha v=1 (perche' per n=1 si ha uno stato d con gli stessi L,S), mentre l'altro ha v=3. I valori di v che etichettano lo stato trovano posto nel simbolo in basso a sinistra, cosicche' il simbolo completo e' (2S+1)v L. Parleremo cosi' di p3 21D e p3 23D. 4) Uno stato di due elettroni con L e S definiti e' il prodotto di una funzione di spin (simmetrica per il tripletto, antisimmetrica per il singoletto) per una funzione orbitale rispettivamente antisimmetrica o simmetrica. Con n>2 questa comoda fattorizzazione e' generalmente impossibile, e la funzione d'onda Ψ non si trasforma piu' in modo cosi' semplice per scambi di sole coordinate spaziali o di soli spin. Per esempio, con 3 spin elettronici, esistono due diversi doppietti di spin (S=1/2): 1in generale ne occorre un certo numero. =279= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e [ααβ-βαα] 2 [αββ-ββα] 2 [αβα-βαα] 2 [αββ-βαβ] 2 M S=1/2 (1) M S=-1/2 M S=1/2 ; (2) M S=-1/2 inoltre, nessuno di loro e' totalmente simmetrico o antisimmetrico nello scambio di due degli spin. In generale, una funzione d'onda totalmente antisimmetrica e' una combinazione lineare di prodotti di funzioni di spin con funzioni orbitali che hanno proprieta' di permutazione complementari ad esse. Una caratterizzazione completa della simmetria degli stati LS deve tener conto anche delle proprieta' di simmetria di permutazione dei fattori spaziali e di spin, e comporta lo studio di gruppi piu' generali di O+(3). Una siffatta analisi1 consente di distinguere i due stati 2D e di pervenire in modo formale al numero quantico v che qui e' stato introdotto in modo fenomenologico. Veniamo ai calcoli delle funzioni d'onda e degli elementi di matrice, che sono molto pesanti quando gli elettroni sono piu' di 2; conviene tabulare tutte quelle grandezze che, essendo legate alla simmetria e non alla dinamica, si presentano tal quali in parecchi sistemi. In questo modo i calcoli diventano piu' spediti, a patto che qualcuno in precedenza abbia pubblicata la tabulazione. Beninteso, per svolgere tale compito la prima volta occorre fare tutti i passaggi standard senza scorciatoie. Supponiamo di avere un sistema di n-1 elettroni in uno stato Φ(1,2,..n-1) e di voler formare uno stato ad n elettroni "aggiungendone un altro" in uno stato φ. Qui non ci preoccupiamo del fatto che Φ o il nuovo stato ad n elettroni siano autostati di qualche Hamiltoniano: ci poniamo il problema puramente matematico di come si possa utilizzare l'informazione contenuta in Φ ed in φ per costruire possibili stati per n elettroni. Ora e' evidente che una funzione d'onda della forma Ψ(1,2,...n)=Φ(1,2,..n-1)φ(n) (3) 1Vedere ad esempio Mitchel Weissbluth, "Atoms and Molecules", Academic Press, San Diego (1978) paragrafo 20.4. =280= Prof. M. Cini -Corso di Fisica Atomica e Molecolare avrebbe il significato fisico di un'ampiezza di probabilita' di avere n-1 elettroni in Φ ed uno in φ, ma sarebbe inaccettabile come stato di n elettroni perche' tratterebbe l'ultimo come distinguibile. Supponendo Φ totalmente antisimmetrica, resta del lavoro da fare per antisimmetrizzare totalmente Ψ. Uno puo' espandere Φ in determinanti di Slater, aggiungere lo stato φ a ciascuno di essi, usando un operatore di creazione, e risommare. In generale, anzi, non c'e' di meglio da fare. Ma supponiamo che Φ rappresenti uno stato della configurazione a n-1 , che φ appartenga allo stesso guscio atomico a, e che quindi si voglia formare uno stato della configurazione an . In generale, non e' univocamente assegnato lo stato φ , ma il set di stati |lml ms> del guscio cui appartiene; lo stato Ψ deve essere etichettato con i numeri quantici appropriati agli stati atomici. Mettiamoci nello schema LS ed assegnamo LSML MS. Lo sviluppo completo di Ψ(LSML MS;1,2,..n) totalmente antisimmetrizzata sara' una combinazione lineare, con opportuni coefficienti, delle φ(lm l ms;n) a un elettrone moltiplicate per funzioni a n-1 elettroni della forma Φ(L'S'M L 'M S';1,2,..n-1). Qui entra in gioco la simmetria, perche' i prodotti φ(n,lm l ms)Φ(1,2,..n-1, L'S'ML 'M S') (4) devono combinarsi fra loro in modo da formare autofunzioni di LSML MS con gli autovalori assegnati. Comunceremo allora col definire funzioni d'onda parziali, della forma |an-1 (L'S') ⋅ a(l,1/2) LSM L MS > ≡ ∑ ⋅ ∑ ML 'M S' ml ms <S'M s'S''MS"|S'S''SMS> <L'ML 'L''M L "|L'L''LML > ⋅ |an-1 L'S'ML 'M S'>|a L''=l S''=1/2 ML "=ml MS"=ms > . (5) Queste funzioni d'onda non antisimmetriche, che pero' tengono conto della somma dei momenti angolari, si chiamano 'dot product wave functions'. Avendo preso cura della simmetria centrale del problema, potremo scrivere la funzione d'onda Ψ totalmente antisimmetrica come combinazione lineare di queste, sommando sugli indici L' S' rimasti liberi: Ψ(LSML MS,1,2,..n) ≡ |an LSML MS> = = ∑ <an-1 (L'S'),a|} an LS> • |an-1 (L'S') ⋅ a(l,1/2) LSM L MS > . (6) L'S' =281= Prof. M. Cini -Corso di Fisica Atomica e Molecolare I "coefficienti di fractional parentage" <a n-1 (L'S'),a|} an LS> possono essere calcolati una volta per tutte. Infatti, essi sono stati tabulati1. Disponendo di tali tabulazioni, la costruzione degli stati an da quelli an-1 diventa agevole. Per esempio, prendiamo dal libro di Weissbluth alcuni dati: d3 N 10S ............. 1 21D 4 60 1 23D 0 140 ................. 32P d2 12D 32F 12G -3 - 5 - 21 -3 -7 45 21 -5 Volendo costruire l'autofunzione 2D di d3 con seniority number v=3, dovremo usare il secondo rigo, dopo aver ottenuto i genitori d2 (tutti i termini tranne 1S). N e' un coefficiente di normalizzazione, e 1 |d3 23D> = { -7|d2 3P ⋅ d>+ 45 |d2 12D ⋅ d> + 21|d2 32F ⋅ d> 140 -5 |d2 12G⋅ d> }; (7) le funzioni dot product necessarie si ottengono combinando i vari termini del multipletto d2 con d (m s=1/2) usando i coefficienti di Clebsh-Gordan. E' ovvio che 21D e' diverso, ed ha anche un genitore in piu'. Con questo metodo possiamo ottenere tutti i dn . Nel caso atomico, il problema e' invariante per tutte le rotazioni (Gruppo R3≡O(3)) e gli autostati del momento angolare appartenenti a un dato l sono la base di una IRREP del Gruppo. L'argomento puo' essere esteso immediatamente alle IRREP dei Gruppi puntuali. Infatti, se a denota gli orbitali appartenenti ad una IRREP h, l'indice h che corre su tutte le IRREP occupa il ruolo prima svolto da l; le componenti saranno individuate, in luogo di ml , da qualche indice θ; le funzioni dot product saranno definite da |an-1 (h'S') ⋅ a(h''S'') hSθMS > ≡ ∑ ⋅ ∑ θ'M S' θ''m s <S'M s'S''ms|S'S''SMS> <h'θ'h''θ''|h'h''hθ> ⋅ |an-1 h'S'θ'M S' > |ah''S'' θ'' m s > , (8) 1C.W. Nielson and G.F.Coster, "Spectroscopic coefficients for p+n,dn configurations", MIT press, Cambridge, Massachussets (1963) =282= and fn Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove <h'θ'h''θ''|h'h''hθ> sono i coefficienti di Clebsh-Gordan del Gruppo. Infine, Ψ(hSθMS,1,2,..n) ≡ |an hSθMS> = = ∑ <an-1 (h'S'),a|} an hS> • |an-1 (L'S') ⋅ a hSθMS > . h'S' (9) Anche per alcuni Gruppi puntuali i coefficienti di fractional parentage sono stati tabulati. Ma spesso si puo' fare a meno anche di |an SθMS> . Si possono calcolare direttamente gli elementi di matrice fra stati a n particelle in termini di quelli a particella singola. Consideriamo un n operatore a un corpo, f=∑ f(i), dove la somma e' sugli elettroni. i L'elemento di matrice fra due stati totalmente antisimmetrici di n elettroni e' <Ψ|f|Ψ'> = n<Ψ|f(i)|Ψ'> , (10) comunque si scelga i. Prendendo i=n e le funzioni d'onda espanse in termini di dot product functions, con l'orbitale φ(n) in evidenza, ci si riduce al calcolo di <n|f(n)|n> ed a quello degli overlap fra gli stati ad n-1 elettroni, i "parents" ortonormali. Per calcolare gli elementi di matrice di operatori a due corpi, si puo' procedere analogamente introducendo funzioni dot product, del tipo |an-2 (L'S') ⋅ a2(L''S'') LSML MS > (11) e "fractional parentage coefficients" a 2 elettroni. In letteratura1, sono disponibili tavole di tali coefficienti per il Gruppo O(3). 11-8 Teorema di Wigner-Eckart Siano |αi> e |βj> le componenti delle basi delle IRREP Γα e Γβ (eventualmente coincidenti) e sia T p(γ ) la componente p di un tensore irriducibile, tale che RTp(γ ) R-1 =∑ T q(γ ) Dqp (γ ) (R). (1) q Consideriamo allora l'elemento di matrice <αi|Tp(γ ) |βk>. Al variare delle componenti i,p e k vi puo' essere un buon numero di siffatti 1V.L.Donlan, J.Chem.Phys.52, 3431 (1970) =283= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elementi di matrice, tutti mescolati fra loro dalla simmetria. Invece di ottenerli da calcoli separati, si potranno ottenere tutti da un calcolo comune. Infatti, ∀R∈G, R† =R-1 e quindi <αi|Tp(γ ) |βk> = <αi|R† RTp(γ ) R† R|βk> = <αi|R† ∑ T q(γ ) Dqp (γ ) (R)R|βk> = q =∑ q ∑ ∑ j r < αj|Tq(γ ) |βr>Dji (α) * (R)Dqp (γ ) (R)Drk (β) (R). (2) Ora, per poter usare il GOT, esprimiamo il prodotto di due D in termini di una sola D. In effetti, D qp (γ ) (R)Drk (β) (R) e' il prodotto diretto di due IRREP, Dqp (γ ) Drk (β) =∑ ∑ < γqβr|δs>D st(δ) <δt|γpβk>. δ st Sostituendo, <αi|Tp(γ ) |βk> = =∑ q (3) ∑ ∑ < αj|Tq(γ ) |βr>D ji (α) * (R) ∑ ∑ < γqβr|δs>D st(δ) <δt|γpβk>. δ st r j Qui R e' arbitrario. Sommando su R, a primo membro abbiamo un fattore g (=ordine del Gruppo); a secondo membro il GOT da' ∑ R D ji (α) * (R)Dst(δ) (R) = g δ δ δ , mα αδ js it ed alfine otteniamo g<αi|Tp(γ ) |βk> = g =∑ ∑ ∑ < αj|Tq(γ ) |βr>∑ ∑ < γqβr|δs><δt|γpβk> δ δ δ , mα αδ js it δ st q j r ovvero, <αi|Tp(γ ) |βk> = =284= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∑ ∑ ∑ q j r = < αj|Tq(γ ) |βr><γqβr|αj> mα <αi|γpβk> . (4) Apparentemente non abbiamo fatto un grande progresso; ma in realta' questo risultato e' molto importante, perche' la parentesi tonda e' del tutto indipendente dagli indici i,p,k delle componenti. Possiamo pertanto scrivere <αi|Tp(γ ) |βk > = < α||T(γ ) ||β> < αi|γpβk > . (5) Questo e' il teorema di Wigner-Eckart: l'elemento di matrice consta di un fattore <α||T(γ ) ||β> , che prende il nome di elemento di matrice ridotto e dipende solo dalle IRREP, e di un fattore puramente geometrico, il coefficiente di C.G. <αi|γpβk> , che contiene tutta la dipendenza "geometrica" dalle componenti. Per sistemi sfericosimmetrici possiamo scriverlo equivalentemente in termini dei simboli 3j di Wigner: j -m jα <jα mα |Tmγ ( jγ ) |jβmβ> = (-) α α -m jγ jβ <jα ||T(j γ ) ||jβ>. α mγ mβ (6) Il problema dinamico si riduce al calcolo di <α||T(γ ) ||β>, che si puo' ottenere da una sola componente particolarmente agevole da calcolare. Tutte le altre componenti si calcolano poi con l'ausilio di una tavola di coefficienti di C.G. Ad esempio, l'elemento di matrice ridotto <L'||L||L> che corrisponde al tensore irriducibile L si puo' ottenere calcolando <L'M'|Lz|LM> = MδMM'δLL' . Occorre riconoscere che L z = L0 e' la componente con q=0 del tensore L+ Lirriducibile L scritto in forma polare, L = (L0, L +1= ,L- 1= ), dove 2 2 L +=Lx +iL y ,L-=Lx -iL y , il quale appartiene alla IRREP γ individuata da J=1, cosicche' il teorema di W-E si scrive L'-M' L' 1 L <L'M'|L q(1)|LM> = (-) <L'||L (1)||L>, -M' q M ( ) e il fattore δLL' ottenuto sopra appartiene a <L'||L(1)||L>. Calcolando l'elemento con M=L con il teorema di W-E si ottiene <LL|L 0|LL>= (-) ( -LL 0 1 L 0 L ) <L||L||L> = L. Poiche' le tavole dei coefficienti 3j danno =285= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ( -LL 1 L 0 L ) = L [(2L+1)(L+1)L] -1/2 , si trova <L'||L||L> = δLL' [(2L+1)(L+1)L]1/2. In particolare, per uno spin 1/2, si ha <1/2||S||1/2> = 3 . 2 Ma il teorema non avrebbe la fondamentale importanza che ha se consentisse solamente di ridurre il calcolo di in tensore a quello di una sua componente. C'e' molto di piu'. Il teorema implica che, prefissate le IRREP del bra e del ket, tutti gli operatori che si trasformano nello stesso modo hanno gli stessi elementi di matrice, a meno di una costante moltiplicativa. Possiamo scegliere l'operatore con cui fare i calcoli come ci pare comodo (purche' non abbia l'elemento di matrice ridotto nullo). Per esempio, sappiamo che se jγ =1, T(1) q e' una delle tre componenti polari (q=0, ±1) di un vettore T. Quindi, i suoi elementi di matrice sono proporzionali a quelli del vettore J, che sono facilmente calcolabili in questa base: <jm|T|j'm'> = C <jm|J|j'm'>. (7) Per determinare la costante C, basta calcolare esplicitamente un elemento diagonale <jm|T|jm>. Spesso pero' e' piu' semplice trovare gli elementi di matrice dello scalare T⋅J. Anche questo basta, perche' <jm|T⋅J|jm>= ∑ <jm|T|jm'><jm'|J|jm>=C ∑ <jm|J|jm'><jm'|J|jm>= m' m' =CJ(J+1). (8) 11-9 Alcune applicazioni fisiche del Teorema di WignerEckart Vedremo a suo tempo che l'elemento di matrice Raman e' M = ∑ pq Rpq ( ε2) p( ε1) q , ed e' determinato dal tensore Rpq = ∑[ n <f|dp|n><n|dq|i> <f|dq|n><n|dp|i> + [ω ni - ω 1] [ω n f +ω 1] ]. (1) Qui ω1 e' la frequenza del fotone assorbito. Ciascuno dei due termini di cui consta Rpq e' l'elemento di matrice fra |i> ed |f> di un operatore che si trasforma come un prodotto di coordinate cartesiane; gli stati finali accessibili per simmetria sono gli stessi, e quindi le regole di selezione dell'effetto Raman si possono ottenere semplicemente considerando quelle di xi xk , con i e k compresi fra 1 e 3. Uno sguardo alla tabella dei caratteri del Gruppo della molecola e' sufficiente. Abbiamo incontrato altri esempi significativi parlando delle interazioni iperfini. L'hamiltoniano (6.2.4) descrive l'interazione H' =286= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dell'elettrone col momento magnetico del nucleo; per gli stati con L≠0, il calcolo dei valori di aspettazione sugli stati imperturbati |LSJFMF> in funzione di F puo' essere gravoso. Tuttavia, H' e' della forma V⋅m, dove V e' un opportuno vettore che dipende dai gradi di liberta' elettronici, e m il momento magnetico del nucleo, proporzionale allo spin I. I valori medi possono essere tutti calcolati, a meno di una costante moltiplicativa, usando J⋅I=(F2-I2-J2)/2 in luogo di V⋅m. Abbiamo studiato anche l'interazione con il momento di quadrupolo elettrico del nucleo. Esso e' definito dal tensore Q ik = ∑ {3 xpi xpk -δik rp2} , p (2) dove xpi e' una componente cartesiana del raggio vettore rp del generico protone del nucleo. In effetti si tratta di un tensore simmetrico a traccia nulla e , come abbiamo anticipato, possiamo sostituirlo nei calcoli con il tensore 3Q 2 {Ii Ik + Ik Ii - δik I2}, (3) 2I(2I-1) 3 costruito con le componenti dello spin nucleare. In modo analogo, possiamo studiare il momento di quadrupolo degli atomi considerando il tensore Q ik = Q ik = 3Q 2 {Ji J k + J k J i - δik J 2}, 2J(2J-1) 3 (4) di cui e' agevole calcolare la matrice in una base con J,Jz assegnati (per esempio, sul termine fondamentale dell'atomo). Nello stato con J z=J si trova subito Qzz=Q; questo parametro si chiama semplicemente momento di quadrupolo dell'atomo. E' ovvio che le componenti Q ik sono tutte nulle in uno stato con J=0; su stati con J=1/2 possiamo sostituire Ji con (1/2) i , e tenendo conto del fatto 2 che [σi ,σk ]+=2δik , e 2=3, si ha J i J k + J k J i - δik J 2 =0. Solo gli stati con 3 J≥1 possono avere momento di quadrupolo 1. Fra le altre applicazioni del Teorema di Wigner-Eckart ricordiamo la regola di Lande' per atomi plurielettronici. Nella teoria elementare dei Multipletti atomici, l'interazione spin-orbita H'SO viene introdotta come perturbazione del primo ordine degli stati LS. Per studiare come si scinde il termine fondamentale di un atomo, si possono ignorare i gusci chiusi concentrando l'attenzione sugli N v 1Il valore di aspettazione del momento di dipolo e' nullo su ogni stato perche' l'operatore e' dispari. =287= Prof. M. Cini -Corso di Fisica Atomica e Molecolare elettroni di valenza. Gli stati |LML ,SM S> si trasformano per rotazioni spaziali come componenti (etichettate da ML ) della IRREP etichettata con L; per rotazioni di spin la IRREP e' quella etichettata da S. Si ha H' SO = Nv ∑ ζ l(i)⋅s(i), (5) i dove l(i) e' l'operatore del momento angolare orbitale dell'elettrone e dV i-esimo, s(i) e' il suo spin, ζ= < > mediato sulle funzioni 2m2c 2r dr radiali identiche per tutti gli Nv elettroni equivalenti. Si intende che stiamo adottando una approssimazione del Campo Centrale (in cui il potenziale V sara' non Coulombiano ma schermato per tenere conto dei gusci pieni). Poiche' l(i) e' un vettore dello spazio ordinario come L , e s(i) e' un vettore dello spazio degli spin come S, il teorema di WignerEckart permette di scrivere 1 <LML SM S|H' SO |LML SM S> = A <LML SM S|L⋅S|LML SM S> , (6) J2-L2-S2 , la 2 matrice di H' SO si diagonalizza immediatamente in questo sottospazio passando alla base |LSJMJ >. Nella teoria dell'effetto Zeeman "anomalo", si deve calcolare il µB B valore di aspettazione ∆E della perturbazione H'= (Lz+geSz) / h µ B ≈ B (J z+Sz), su stati |LSJM>. In tale sottospazio, S =c J, dove c e' una / h costante. Per determinare c, usiamo l'uguaglianza S⋅J =c J2. Poiche' J2 - S2-L2 J2 + S2-L2 S⋅J =S2+ S⋅L= S2+ = , e' facile ottenere c e <Sz>. 2 2 Quindi, si trova ∆E =g µB BM, dove g e' il fattore di Lande' J(J+1)+S(S+1)-L(L+1) g=1+ . Anche se questi risultati sono noti da altri 2J(J+1) metodi, e' utile rendersi conto che sono conseguenze immediate del teorema di Wigner-Eckart, e cioe' della simmetria. Fra le altre applicazioni notevoli, occorre menzionare la derivazione delle regole di selezione per le transizioni elettromagnetiche e l'effetto Stark negli atomi plurielettronici. Questi risultati sono noti dal Corso di dove A e' una costante indeterminata. Poiche' L⋅S = 1In molti libri si tenta di arrivare al risultato senza usare il teorema di Wigner-Eckart. Ma allora il problema e' difficile e le spiegazioni semplici non fanno capire molto. =288= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Struttura della Materia, dove erano stati presentati in modo fenomenologico: ora lo Studente puo' ricavarseli per esercizio. Capitolo 12-Risonanze Anche quegli stati eccitati di un sistema, che in approssimazione zero possono essere descritti come discreti, si rivelano sempre come parte di un continuo quando si tiene conto di tutti i gradi di liberta'. Una descrizione appropriata richiede tecniche nuove. 12-1 Risonanze: qualche esempio Nel 1952, Fermi scopri’ un picco nella sezione d’urto elastica πp (energia cinetica c.m. fra 1.2 e 1.4 GeV larghezza a mezza altezza 100 MeV, τ=10-23 s. Si tratta della risonanza ∆++ . Nel 1957, Silverman e Lassettre, in un famoso esperimento, bombardarono atomi di He con elettroni di energia Ein = 504 eV e misurarono lo spettro di perdita di energia; in altri termini, misurarono la corrente degli elettroni diffusi in avanti dopo avere perduto energia E nella collisione. 504 eV He Rivelatore IP=24.6 eV Oggi tali esperimenti sono ben noti col nome di EELS (Electron Energy Loss Spectroscopy). Un atomo di He ha una energia di ionizzazione I≈24.6 eV, quindi l'energia cinetica Ein dei proiettili e' molto piu' grande, e molti fenomeni possono accadere nell'urto. L'esperimento citato rivelo' un picco di forma asimmetrica fra ≈59 e ≈60.5 eV, con un massimo a E≈ 60.2 eV, sovrapposto ad un fondo continuo. =289= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 2s2p P J(E) 59 60 Energy loss E Il fondo non desta sorpresa, perche' gli elettroni incidenti possono perdere energia con continuita', ma il picco quasi discreto, largo ≈ 1eV, fa' pensare alla esistenza di uno stato doppiamente eccitato dell'atomo che si trova nel continuo. In effetti, sono stati poi scoperti fra 57 e 64 eV parecchi altri stati del genere. Li possiamo etichettare nello schema L-S come 1S e 3S, 1P e 3P , appartenenti a varie configurazioni due volte eccitate1, come 2s2, 2sns, 2snp, e quello scoperto da Silverman e Lassettre e' classificato come 2s2p1P. Se non che, tali stati cadono ampiamente nel continuo di ionizzazione, e non possono essere veramente legati; per questo prendono il nome di risonanze. La larghezza della riga osservata e' in parte dovuta alla risoluzione sperimentale; il valore oggi accreditato (4.4 10-2 eV) puo' essere interpretato in termini del tempo di vita finito della risonanza, che deve decadere , radiativamente o in modo autoinizzante, in un elettrone ed uno ione He+. Quest'ultimo canale di decadimento e' analogo all'effetto Auger ed e' nettamente prevalente per atomi leggeri. La riga 2s2p1P dell'He ha inoltre una forma asimmetrica. Una forma non lorentziana e' una delle caratteristiche comuni delle risonanze. Negli spettri di assorbimento ottico, gli stessi stati autoionizzanti si rivelano come picchi nel continuo, con la stessa posizione energetica, simile larghezza e simile caratteristica forma asimmetrica. Le risonanze sono in realta' un fenomeno generale, che si manifesta ogni qual volta un livello discreto e' degenere con un continuo e si allarga interagendo con esso. Per esempio, se ne osservano anche in esperimenti di diffusione elastica su He di elettroni incidenti di energia cinetica Ein <I; anche in questo caso lo spettro e' continuo, cioe' il sistema atomo+elettrone non e' legato e puo' avere qualsiasi energia; pero' la sezione d'urto presenta massimi 1Altri dati sperimentali sono riportati sul libro di B.H.Bransden e C.J.Joachain, "Physics of Atoms and Molecules", Longman, London and New York (1986) Capitolo 12. =290= Prof. M. Cini -Corso di Fisica Atomica e Molecolare stretti ed asimmetrici in corrispondenza di energie caratteristiche. Le risonanze in questo caso sono ioni He- temporanei, che dopo un certo tempo si dissociano in vari stati eccitati di He neutro + un elettrone. Le caratteristiche essenziali delle risonanze dipendono dal sistema in esame, piuttosto che dalla spettroscopia usata per studiarlo. In generale, uno spettro puo' essere descritto in termini di una probabilita' di transizione, che a sua volta, per la regola d'oro di Fermi, e' proporzionale al modulo quadrato dell'elemento di matrice <i|T|f> di un qualche operatore, dove i e f denotano gli stati iniziale e finale; e T e' diverso nelle diverse spettroscopie. Cosi', T ∝A⋅p nell'assorbimento ottico; in EELS, considerando l'elettrone proiettile in r come distinguibile dagli altri, l'elemento di matrice e' , nel caso di un atomo di He, 2 1 <i|T|f>=<Ψ i exp(iki r)| ∑ |Ψ exp(ikf r)> = |rj -r| f j=1 = ∫ d 3r1d3r2d3r Ψ i * (r1,r2)| 2 1 |Ψ (r ,r )exp[iqr] , (1) |rj -r| f 1 2 ∑ j=1 introducendo q = kf -ki , che e' il 'momento trasferito' dall'elettrone al sistema. Poiche' ∫d3r 4πe2 exp[iqr] = exp[iqrj ], |rj -r| q2 4πe2 e-iqr j . Poiche' q2 ∑ j esistono alcuni tratti essenziali del problema che dipendono poco dalla forma esplicita di T, noi li studieremo in un modello idealizzato, considerando un operatore T generico. l'operatore che descrive lo scattering e' T= 12-2 Risonanze di Fano1 Consideriamo l'interazione fra uno stato localizzato |0σ> di energia ε0 ed un continuo non degenere di stati delocalizzati |kσ> di energia εkσ. Tipicamente, |0σ> e' uno stato atomico da cui l'elettrone puo' saltare nel continuo degli stati di particella libera o in quello degli stati di Bloch di una banda di un solido. Il processo di salto e' descritto dagli "integrali di hopping" Vk0. L'hamiltoniano e' 1U.Fano, Phys. Rev. 124 (1961) 1066; P.W. Anderson, Phys. Rev. 124 (1961) 41 =291= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H= ∑ kσ εkσnkσ + ∑ ε0 n0σ + σ ∑ {V k0akσ‡a0σ + h.c.} kσ (1) dove h.c. sta per il coniugato hermitiano di quanto precede. Diagonalizzare questo Hamiltoniano vuol dire metterlo nella forma ~ H= ∑ λ ελnλ , (2) dove λ denota gli autostati esatti perturbati, ed ελ gli autovalori esatti; il cambiamento di base aλ = <λ|0>a0 + ∑ k < λ|k>ak , (3) ha l' inverso ak = a0 = ∑ λ < k|λ>aλ (4) <0|λ>aλ ∑ λ Troviamo gli stati |λ> col metodo delle equazioni del moto. Notiamo che [aλ ,nλ']- = δ(λ,λ') a λ , dove la δ(λ,λ') e' di Kroneker se pensiamo gli stati quantizzati in una grande scatola, o di Dirac se li normalizziamo sul continuo (si pensi alle onde piane, per le quali ambedue i metodi sono ben noti): le due descrizioni sono fisicamente equivalenti. ~ Pertanto, deve essere [aλ ,H ]- =ελ aλ . Tale equazione del moto deve essere vera anche se espressa nella base originaria: [(<λ|0>a0 + ∑ k < λ|k>ak ),H] - = - ελ (<λ|0>a0 + ∑ k < λ|k>ak ). (5) I commutatori occorrenti si ottengono immediatamente con le regole note,e sono [a0,H] - = ε0a0 + ∑ V k0ak (6) k [ak ,H] - = εk ak + V0k a0 . (7) Inoltre, l'uguaglianza deve valere separatamente per i coefficienti di a0 e di ak , che sono linearmente indipendenti, e questo da' due condizioni che determinano i |λ>, =292= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ( ελ-ε0)<λ| 0 > ( ε -ε )<λ|k> λ k - ∑ <λ|k>V0k = 0 . k - < λ|0>Vk0 = 0 (8) 1)Soluzione nel discreto. Se si pensa il sistema chiuso in una grande scatola, in modo che lo spettro continuo εk sia in effetti discretizzato, allora si puo' sempre supporre ελ ≠ εk , ed ottenere dalla seconda Vk0 (9) εk - ελ <λ|0>; sostituendo nella prima si trova un'equazione algebrica per gli autovalori discreti, dove compaiono solo quantita' reali: <λ|k> = - ε0 - ελ - ∑ |Vk0|2 εk - ελ =0. (10) k Nella figura viene mostrata una soluzione grafica, con ε in ascisse e |Vk0|2 y=∑ ε - ε in ordinate ; gli εk hanno valori positivi equidistanti, ed k k i |Vk0|2 sono tutti uguali. La somma varia fra -∞ e + ∞ fra un εk e il successivo. Le radici ελ sono date dai punti di incrocio con la retta y=ε0 - ε. 10 5 -2 -1 1 2 -5 -10 Si vede cosi' che c'e' sempre una radice reale ελ fra due autovalori εk imperturbati, ed inoltre c'e' una radice isolata sotto il "continuo" discretizzato. Trovate le radici, e' banale normalizzare le funzioni d'onda, e il problema e' interamete risolto. Questa soluzione pero' e' poco utile. Infittendo i k, il grado dell'equazione algebrica cresce; un errore sempre piu' piccolo distingue uno 0 da un ∞ della somma, e diventa necessario un numero maggiore di cifre significative per approssimare le radici. Piu' che il sistema in esame, tutta questa informazione descrive la sua interazione con la scatola fittizia in cui l'abbiamo messo; non e' =293= Prof. M. Cini -Corso di Fisica Atomica e Molecolare questa la via per passare al limite del continuo. Un approccio diretto "brute force" e' quindi destinato a fallire, dopo averci portato ad affrontare complicazioni del tutto irrilevanti al problema fisico. 2)Soluzione nel continuo A questo stadio, i due metodi di quantizzazione (sul continuo o sul discreto) si differenziano, e quello discreto si dimostra poco adatto. Affrontiamo allora direttamente il caso del continuo, quando le somme su k e su λ vanno interpretate come integrali ; allora pero' coincidenze ελ = εk fra autovalori perturbati e imperturbati devono necessariamente aver luogo. Avremo bisogno di altri strumenti matematici e di alcune definizioni. 1) La densita' di stati del sistema, ρ(ω) = ∑ λ δ(ω- ελ) . (11) E2 Dalla definizione consegue che ∫dωρ(ω) e' il numero di autostati fra E1 E1 ed E2 ; beninteso, esso puo' divergere nel limite del continuo, quando il numero totale degli stati e' N→∞ . Ma allora possiamo convertire la somma in integrale, con una "misura" idonea, come ad esempio ∑ → Ω ∫ d 3k, dove Ω e' il volume del sistema. (2π) 3 k Se definiamo la densita' di stati imperturbata (V0k =0) ∑ δ(ω- εk ) (12) k abbiamo l'uguaglianza ρ=ρ (0) a meno di quantita' O(1/N)→0, perche' dopo tutto abbiamo aggiunto appena uno stato ad un continuo dove gia' ce ne erano N>>1. 2) La densita' di stati locale del sito 0, che misura il grado di mescolamento degli autostati ad energia ω con l'orbitale 0, ρ (0)(ω) = ρ 0(ω) = ∑ λ δ(ω- ελ)|<0|λ>|2. (13) La quantita' imperturbata e' ρ 0(0) (ω)=δ(ω- ε0). Per la completezza dei λ, risulta che ∞ ∫ -∞ d ω ρ 0(ω)=1. 3) L'operatore risolvente, o operatore di Green G(ω) = (ω-H+iδ) -1 , (14) dove δ sta per un infinitesimo positivo, δ=+0 . L'elemento di matrice locale e' =294= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |<0|λ>|2 G00(ω)=<0|G(ω)|0>= ∑ , (15) λ ω-ελ +iδ 1 e quindi ρ 0(ω) = - π Im G00(ω). Possiamo ricavare ρ 0 e tutti gli elementi di matrice di G dall'identita' (ω-H+iδ) G=1. Includendo iδ nella definizione di ω, e tenendo conto che Hkk' =0, si trova <0|(ω-H)|0>G00 + ∑ <0|(ω-H)|k>Gk0 = 1 k <k|(ω-H)|k>Gk0 + <k|(ω-H)|0>G00 = 0 cioe' (16) (17) <0|(ω-H)|0>G0k + ∑ <0|(ω-H)|k'>Gk'k = 0 k' <k|(ω-H)|0>G0k' + <k|(ω-H)|k>Gkk' = δ(k,k'), (ω- ε0)G00 - ∑ V0k Gk0 = 1 k (ω- εk )Gk0 - V k0G00 = 0 (18) (19) (20) (21) (ω- ε0)G0k - ∑ V0k' Gk'k = 0 (22) k' -Vk0G0k' +(ω- εk )Gkk' = δ(k,k'). (23) Ora, grazie all'immaginario infinitesimo δ, non ci sono divergenze, Vk0 Gk0 = G ; (24) (ω- εk ) 00 e sostituendo nella prima, si ottiene la funzione di Green locale 1 G00 = , (25) ω- ε0 - Σ(ω) dove |Vk0|2 Σ(ω) = ∑ (26) ω - εk + i δ k e' la "self-energy". A differenza della quantita' che compare nella equazione (10) agli autovalori discreti, cui somiglia, questa e' una funzione liscia di ω, con ∑ k che rappresenta un integrale; inoltre, essa e' complessa, con |Vk0|2 ReΣ(ω) ≡ Σ1(ω) = P ∑ ω - ε0 k dove P e' la parte principale, e =295= (27) Prof. M. Cini -Corso di Fisica Atomica e Molecolare ImΣ(ω) ≡ Σ2(ω) = −π ∑ |Vk0|2δ(ω - εk ) . (28) k I poli di G sul piano complesso z sono soluzioni di z- ε0 - Σ(z)=0; (29) se esistono soluzioni reali, esse corrispondono a Σ2 =0, ed a un autovalore ελ discreto. In generale, Σ2 ≠0, z e' complesso e il polo indica uno stato risonante, con un tempo di vita finito. Se Σ1 e Σ2 fossero indipendenti da ω, G00 darebbe una ρ 0 lorentziana. Questo di solito e' lontano dal vero, ma serve per capire che, qualitativamente, Σ1 e' uno spostamento del livello, mentre Σ2 ha a che fare con la sua semilarghezza e col tempo di vita dello stato risonante. A questo punto, noi conosciamo la funzione di Green locale, che gia' ci consentirebbe di discutere qualitativamente una vasta fenomenologia, come vedremo. Inoltre, risolvendo il sistema che lega fra loro le componenti di G, potremmo facilmente calcolarle tutte. Ma una soluzione completa del problema richiede il calcolo delle funzioni d'onda, ed a tal fine e' conveniente l'ipotesi semplificativa che il continuo non sia degenere; in tal caso, esiste una corrispondenza biunivoca fra εk e k, e fra ελ e λ; si puo' sommare indifferentemente sugli autostati o sugli autovalori, ∑ λ ↔ ∫ d ελ ρ(ελ ) . (30) Questa ipotesi puo' successivamente essere rimossa senza che cambi niente di fondamentale1. Il vantaggio della (30) e' che consente di esprimere <0|λ> in termini della funzione di Green, con un cambiamento di variabili. Infatti, |<0|λ>|2 G00(ω) = ∑ = λ ω-ελ +iδ |<0|λ>|2 ∫dελρ(ε λ) ω-ελ+iδ , (31) e cosi' Im G00(ω) = -π ∫dελρ(ε λ) |<0|λ>|2δ(ω-ελ) = -π ρ (ω ) |<0|λ ω >|2 , (32) dove |λ ω > e' l'autostato di energia ω. Quindi, ρ 0(ω) -1 |<λ ω |0>|2 = ImG00(ω) = , (33) πρ(ω) ρ(ω) e l'ipotesi semplificativa ci ha consentito di esprimere la funzione d'onda sul sito 0 (a meno di un fattore di fase arbitrario) direttamente in termini della funzione di Green. Se l'autovalore ελ e' nel continuo, la (33) comporta che <λ ω |0> e' infinitesima quasi 1L.C.Davis e L.A.Feldkamp, Phys. Rev. B15, 2961 (1977) =296= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dappertutto. Infatti, mentre ρ 0 e' normalizzata a 1, ρ lo e' al numero N→∞ di stati. Ma se l'autovalore ελ discreto (polo di G00 ), ρ 0=-1 π Im ρ 0(ω) ∞ G00(ω) = <0|λ ω >|2δ(ω-ελ ) , e ≈ risulta indeterminato. In effetti, ρ(ω) ∞ <0|λ ω >|2 va calcolato come residuo di G00(ω). Il continuo si puo' pensare come una successione di infiniti poli dal residuo infinitesimo. Analogamente, possiamo esprimere Σ in termini degli "integrali di hopping" Vk0, che con la (30) divengono una funzione univoca di ω. Usando una notazione di Fano, potremo scriverli V ω ≡V(ω). Σ2(ω) = Im Σ= -π ∫dεk ρ 0(εk )|V k0|2δ(ω-εk ) = -πρ 0(ω)V ω 2. (34) Per conoscere tutta la funzione d'onda, occorre determinare anche le ampiezze <λ ω |k>, e possiamo farlo risolvendo ( ελ - εk )<λ|k> - <λ|0>Vk0 =0. (35) Abbiamo gia' notato il punto difficile: il fattore (ελ - εk ) e' reale, e si annulla per un certo k; non possiamo quindi dividere spensieratamente. La soluzione valida nel continuo va cercata nel senso delle distribuzioni. E' noto dalla teoria di tali "funzioni" speciali che la 1 soluzione dell'equazione xf(x) =1 nel campo reale e' f(x) = P + Aδ(x), x dove P denota la parte principale, mentre A e' una costante arbitraria. Infatti, xδ(x)=0 ed abbiamo cosi' una intera famiglia di soluzioni. Cosi' Vk0<λ ω |0> <λ|k> = P +Z(ελ )<λ ω |0>Vk0δ(εk -ελ ), (36) ( ελ - εk ) dove Z e' una nuova incognita (il fattore <λ|0>Vk0 e' ovviamente inessenziale, ma tornera' comodo nei calcoli). Per determinare Z, sostituiamo la (36) nella equazione (ελ - ε0)<λ|0> - ∑ <λ|k>V0k =0, e k otteniamo ω-ε0-Σ1(ω) Z(ω) = - π . (37) Σ2(ω) Cosi', gli autostati sono finalmente determinati: riassumendo, | < λ ω |0>| = -1 ImG 00(ω) πρ(ω) (38) P < λ|k> = V k0<λ ω |0>{ +Z(ελ )δ(εk -ελ )} . ( ελ - εk ) =297= (39) Prof. M. Cini -Corso di Fisica Atomica e Molecolare 3)fase di G 00 Ora che il problema e' risolto, vogliamo studiare il comportamento della funzione d'onda in prossimita' di una risonanza. Introduciamo la fase ∆(ω) della funzione di Green [ω-ε0-Σ1(ω)]+iΣ2(ω) G00(ω) = [ω-ε0-Σ1(ω)] 2+Σ2(ω) 2 ei∆ = (40) [ω-ε0-Σ1(ω)] 2+Σ2(ω) 2 dove Σ2 tan(∆) = . (41) ω-ε0-Σ1 In corrispondenza con la risonanza, tan(∆) diverge. Per grandi |ω|, Σ→0, G00 ≈ ω-1 e la funzione di Green, passando da -0 a +0 subisce un cambiamento di segno. Cosi', mentre ω percorre l'asse reale, attraversando la regione della risonanza, ∆ cambia di π. E' utile esprimere i risultati precedenti in termini di ∆, con ω≡ελ . Si ha Z(ω) = -πcotg(∆(ω)); (42) |Σ2| inoltre, poiche' |sin(∆)| = , si ha [ω-ε0-Σ1(ω)] 2+Σ2(ω) 2 |<λ ω |0>| = -1 ImG 00(ω) = πρ(ω) Σ2 |sin(∆)| -1 ⋅ = . (43) πρ(ω) [ω-ε0-Σ1(ω)] 2+Σ2(ω) 2 -πρΣ 2 Il denominatore e' -πρΣ 2 = +π 2ρρ 0Vω 2 , ma ρ≈ρ 0, e quindi |sin(∆)| -πρΣ 2 = πρVω ≡ πρV(ελ ), e |<λ ω |0>| = . πρV(ελ ) Inoltre, sostituendo nella espressione di <λ ω |k> si trova sin(∆) Vk0 <λ|k> = [ - πcotg(∆)V k0δ(εk -ελ )], -πρΣ 2 ( ελ - εk ) e possiamo sostituire V(εk ) Vk0 → . (44) πρV(ελ ) -πρΣ 2(ω) Nel secondo termine, la δ impone εk =ελ , e resta -cos(∆) δ(εk -ελ ). ρ Il risultato finale e'1, sempre con ω≡ελ , = 1Queste formule sono equivalenti a quelle di Fano, anche se ne differiscono per la presenza dei fattori 1/ρ, Nel suo lavoro, infatti, le funzioni d'onda sono normalizzate sulla δ dell'energia, mentre le nostre hanno integrali di sovrapposizione adimensionali. La derivazione di Anderson e' semplice come quella proposta qui, ma contiene approssimazioni e non porta al risultato esatto. =298= Prof. M. Cini -Corso di Fisica Atomica e Molecolare <0|λ > ω <k|λω > sin(∆) πρVω 1 V(εk )sin(∆(ε )) = ρ{ -cos(∆)δ(ελ -εk )}. πV(ελ )(ελ -εk ) = (45) 4)Forme di riga La situazione fisica descritta da questo modello, in cui un livello discreto si allarga interagendo con un continuo, conduce in molte spettroscopie a caratteristiche forme di riga 'alla Fano'. Puo' trattarsi ad esempio di esperimenti EELS o di assorbimento ottico, come nel caso della risonanza 2s2p 1P dell'He, o di esperimenti di fotoemissione. Restiamo generali. Se T e' l'operatore che produce la transizione, il suo elemento di matrice fra lo stato iniziale |i> e l'autostato esatto |λ ω > e' dato da <i|T|λ ω > = <i|T|0><0|λ ω > + ∑ <i|T|k><k|λ ω >. (46) k 1 Il fattore del termine in -cos(∆) e' ρ ∑ <i|T|k>δ(ω- ελ)=<i|T|kω >, e cosi' k sin(∆(ω)) ~>, <i|T|λ ω > = - cos(∆(ω))<i|T|kω > + <i|T|0 (47) πρVω dove si e' usato ρ 0 = ρ e si e' posto ~> = |0> +P |0 ∑ V(εk ) |k> , ω-εk (48) k che puo' essere pensato come uno stato discreto con un "alone" di stati del continuo. Quando ω passa per la risonanza, ∆ va da 0 a π, quindi tan(∆) diverge, sin(∆) e' pari, e cos(∆) e' dispari. Ne segue che i contributi ~> interferiscono con fasi opposte ai due lati della <i|T|k > e <i|T|0 ω risonanza, e le forme di riga risultanti sono asimmetriche. Per discutere le forme di riga in modo semplice, senza perdere le caratteristiche essenziali, ρ , Vω e gli elementi di matrice di T possono essere considerate costanti nell'intervallo di ω intorno alla risonanza; Fano propose di considerare ~> <i|T|0 q= (49) πρVω <i|T|kω > come una costante (nell'intervallo di energia che interessa) da ottenere per confronto con l'esperimento. Gli aspetti qualitativi della risonanza sono fissati da q, e la forma di riga viene calcolata in ω- ε0-Σ1 funzione della "energia ridotta" E = -cotg(∆)= 0 2 , proporzionale, πρ Vω =299= Prof. M. Cini -Corso di Fisica Atomica e Molecolare come si ricordera', alla vecchia incognita Z. La "forma di riga" ridotta viene definita come |<i|T|λ ω >|2 f= ; (50) |<i|T|kω >|2 il denominatore, a grandi distanze dalla risonanza, coincide con lo spettro osservato e puo' essere ottenuto per ogni ω interpolando il fondo. Allora ~> sin(∆(ω))<i|T|0 f = |-cos(∆(ω)) + |2 = πρVω <i|T|kω > |-cotg(∆)+q| 2 2 2 = sin (∆) |-cotg(∆)+q| = . (51) [1+cotg 2(∆)] In termini di E = -cotg(∆), si ottiene la forma di riga di Fano (q+E)2 (52) 1+E2 che per q=0 mostra un'"antirisonanza", per q=1 una forma a gradino, e per q=3 una risonanza caratterizzata dalla tipica asimmetria. Per E=-q, la transizione risulta proibita. Per grandi q, la riga presso la risonanza diventa simmetrica. f(E) = Forme di riga di Fano 12 10 Q=3 Q=0 Q=1 8 6 4 2 0 -5 0 E 5 10 12-3 Impatto di elettroni su molecole ; Negli esperimenti di EELS da molecole, si assiste ad una fenomenologia piu' ricca e piu' complicata da analizzare che nel caso degli atomi, sia per la ridotta simmetria che per la presenza dei gradi =300= Prof. M. Cini -Corso di Fisica Atomica e Molecolare di liberta' vibrazionali. Una prima schematizzazione si puo' fare in base all'energia Ein del proettile. 1)"Alte energie". Se Ein > 1 KeV, la lunghezza d'onda del proiettile e' minore di ≈0.3 Å, e consente di studiare in un certo dettaglio la geometria dei nuclei. Certo, tale informazione risulta mediata sulle orientazioni casuali delle molecole, a meno che non ci sia una superficie ad orientarle. Possiamo schematizzare l'urto considerando i nuclei fermi e gli elettroni di valenza come pacchetti di onde piane quasi libere, poiche' l'energia di legame e' piccola rispetto ad E in . Un tale schema prende il nome di Impulse Approximation. L'elettrone incidente e' in pratica distinguibile dagli altri e si comporta quasi come un fotone, ma i momenti trasferiti q non sono piccoli, e agli elementi di matrice <Ψ iniziale |exp(iqx)|Ψ finale > contribuiscono tutti i multipoli. 2)"Basse energie". Se E<10 eV, gli elettroni della molecola "hanno il tempo" di rilassare adiabaticamente, e la molecola si polarizza nella direzione dell'elettrone che arriva. Ne risultano complicati effetti di correlazione, che sono a tutt'oggi compresi solo in parte. Per esempio, l'elettrone incidente puo' essere catturato per un breve tempo τ, e poi riemesso. Si forma allora uno ione negativo temporaneo, che si trova in uno stato quasi discreto; cio' puo' avvenire solo per opportuni valori di Ein , ed in corrispondenza di tali valori la sezione d'urto ha un comportamento risonante (risonanze di Feshbach). In tal caso, occorre vedere se τ e' grande o piccolo rispetto a ω0-1 , dove ω0 e' la frequenza caratteristica delle vibrazioni. Se ωoτ>>1, l'approssimazione di Born-Oppenheimer e' improponibile, i nuclei "hanno tempo" di muoversi e le coordinate vibrazionali entrano in gioco. Ma la storia puo' anche essere molto diversa: l'elettrone puo' restare legato mentre la molecola si dissocia. 3)"Energie intermedie". Questo e' il caso piu' complesso, perche' non valgono ne' l'approssimazione adiabatica ne' la Impulse Approximation. Si possono avere risonanze di Feshbach in cui lo ione negativo temporaneo si trova in uno stato elettronicamente eccitato quasi discreto. Nella figura, viene schematizzato un caso frequente ed interessante in una visione a particelle indipendenti. Nello stato iniziale A la molecola e' nello stato fondamentale con certi livelli a,b,c,.. occupati ed altri d,e,.. vuoti, mentre sta arrivando un elettrone libero. La formazione dello ione negativo temporaneo B e' accompagnata da una eccitazione che coinvolge un livello piu' o meno profondo. =301= Prof. M. Cini -Corso di Fisica Atomica e Molecolare A B e d c b a C Se questo decade per effetto Auger, la molecola viene lasciata in genere in uno stato eccitato (caso C) ; si osservera' un elettrone che ha subito una perdita di energia caratteristica. La sezione d'urto si esalta quando Ein e' in risonanza, cioe' e' l'energia necessaria per formare lo stato B. Un esperimento di Rohr e Linder1 mise in luce i fenomeni che si osservano in EELS nella regione delle basse energie. Un fascio di elettroni con Ein =3eV fu usato su molecole di HF, HCl e HBr in fase gassosa. Gli spettri mostrano chiaramente le eccitazioni vibrazionali delle molecole fino a numeri quantici vibrazionali v=2 per HF e v=3 per HCl e HBr. L'energia di un quanto e' ω0 ≈ 0.5 eV nel primo caso e ≈0.4 eV negli altri. Come sappiamo, in EELS si tiene costante Ein e si misura la corrente degli elettroni diffusi in funzione della perdita di energia E. Rohr e Linder riportarono anche esperimenti in cui si variava in E , tenendo E costante . Un grafico della corrente di elettroni diffusi in funzione di Ein con E=nω0 , dove n e' un intero, si chiama funzione di eccitazione. Esso e' chiaramente legato alla probabilita' P(Ein ) che un elettrone ecciti n quanti vibrazionali durante l'impatto. Ad esempio, per HF, fissando n=1, si osserva una funzione di eccitazione nulla fino alla soglia Ein = ω0≈ 0.5eV, seguita da uno stretto picco risonante in corrispondenza della soglia. La larghezza del picco e' ≈ 30 meV. Al crescere di Ein , la funzione non torna a 0, ma ha un andamento continuo con un gradino per Ein ≈ 2ω0. 1Rohr e Linder, J. Phys. B9, 2521 (1976) =302= Prof. M. Cini -Corso di Fisica Atomica e Molecolare excitation function ∆E=costante collision energy Il valore sperimentale delle sezioni d'urto σ e' di circa 10-16 cm 2 in corrispondenza della struttura larga, mentre σ≈ 10-15 cm 2 al massimo del picco risonante. Osservazioni simili si hanno per altri n e per le altre molecole. Questi semplici fatti qualitativi si spiegano solo con la formazione di uno ione negativo temporaneo. Infatti, la larghezza <<ω0 del picco di soglia indica un tempo di interazione lungo, rispetto ai periodi delle vibrazioni. Inoltre, le sezioni d'urto sono piu' grandi di uno o due ordini di grandezza di quelle che si possono calcolare per urti elastici con un ragionevole potenziale dipolare. Ulteriore evidenza emerge dall'analisi delle distribuzioni angolari. Queste sono isotrope per E in basse (fino a 4 eV per HCl, fino a 2 eV per HF). Gli elettroni perdono memoria della loro direzione originaria. Al crescere di Ein comincia a prevalere la diffusione in avanti, il che indica che il meccanismo risonante coesiste con altri non risonanti. Dunque, l'elettrone dimora per un tempo relativamente lungo con la molecola, e gli oscillatori armonici che corrispondono ai gradi di liberta' vibrazionali si eccitano: con l'elettrone in piu', la distanza di legame deve allungarsi. Ma, dal momento che l'approssimazione di Born-Oppenheimer e' inapplicabile, lo studio di questi ioni negativi e' difficile. Un campo dipolare, al di la' di un certo dipolo critico (pari, come si potrebbe dimostrare, a d=0,64 e aBohr ) ha infiniti stati legati. Cosi', gli ioni negativi vengono talvolta descritti come "risonanze di potenziale", cioe' come stati quasi-legati dovuti al dipolo molecolare. Si suppone che uno di questi stati legati del dipolo idealizzato sia perturbato e si sposti in energia fino ad immergersi nel continuo. Questa descrizione e' rozza, perche' l'approssimazione di un campo dipolare e' adatta solo a grandi distanze, e poi si deve tener presente che il dipolo molecolare e' rotante e vibrante. Inoltre, anche molecole non dipolari come SF6 mostrano simili risonanze alla soglia. Non =303= Prof. M. Cini -Corso di Fisica Atomica e Molecolare possediamo ancora una descrizione veramente adeguata di questi stati. E' possibile pero' capire le funzioni di eccitazione in modo semiquantitativo con una estensione del modello di Fano-Anderson. Poniamo H = H F +H v +H ev , (1) dove H0 e' l'Hamiltoniano di Fano senza spin H F= εr nr +∑ εk nk k Hh = + H h, (2) ∑ {V kr ck ‡cr + h.c.}, (3) k i k rappresentano gli stati di elettrone libero, r e' lo stato elettronico risonante nello ione negativo, e lo spin viene omesso perche' inessenziale; i termini nuovi, che servono per includere i gradi di liberta' vibrazionali, sono Hv = ∑ ωqdq† dq , H ev = ∑ g q(dq + dq† )nr . q q Qui, l'indice q etichetta le vibrazioni, ωq sono le loro frequenze e dq† l'operatore di creazione dei quanti corrispondenti; gq e' l'energia di interazione fra il modo q e l'orbitale risonante. Poiche' dq† dq e' il numero di modi q eccitati, H1 rappresenta l'energia vibrazionale. L'energia di punto 0 darebbe luogo ad una costante inessenziale, ed e' stata rimossa. Invece, Hev , proporzionale al numero di occupazione nr dello stato risonante, rappresenta la sua energia di interazione con i modi; essa e' lineare nello spostamento xq ∝ (dq + dq† ) di ciascun oscillatore armonico. Tuttavia, per una molecola biatomica non ci sono molte frequenze bosoniche ωq, ma un solo ω0. Scriveremo quindi H v = ω0d† d , H ev = g(d + d† )nr . (4) Supponiamo ora provvisoriamente che lo ione negativo duri esattamente dal tempo 0 al tempo τ. Per esempio, ammettiamo che l'elettrone nell'istante t=0 salti da uno stato ki nell'orbitale r, e trovi la molecola nello stato fondamentale vibrazionale |v=0>; allora potra' cominciare a saltare dallo stato r a qualche k e viceversa. Quando si trova in |r> perturba la vibrazione. Vogliamo calcolare l'ampiezza di probabilita' che allo scadere del tempo τ dell'ultimo salto il sistema sia in uno stato finale con la molecola in uno stato vibrazionale eccitato v. Si noti che dopo il tempo τ lo stato vibrazionale non puo' piu' cambiare, e che durante il tempo τ l'elettrone puo' liberarsi virtualmente ed essere ricatturato un numero qualsiasi di volte. Fuori dell'intervallo (o,τ) , l'elettrone non fa' salti, e Hev non agisce. Suddividiamo diversamente l'Hamiltoniano, scrivendo H=H0+H h , dove =304= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Hh = ∑ {V kr ck ‡cr + h.c.} k agisce solo fra 0 e τ. Lo stato iniziale |i>=|v=0,ki > ha numero quantico vibrazionale v=0 e l'elettrone in ki ; |i> e' autostato di H0. Ponendo uguale a 0 l'energia dello stato fondamentale della molecola, l'autovalore e' Ei =εki . Lo stato finale |f>=|v,kf > e' anch'esso autostato di H0 con autovalore Ef =vω0+εkf . Al tempo τ , |i(τ)>= e -iHτ |i>=e-iHτ |v=0,ki >, e l'ampiezza di transizione e' l'overlap con l'evoluto dello stato imperturbato |f(τ)>=e -iE f τ |v,kf > cioe' Aif (Ef ,τ) = <f(τ)|i(τ)>= e iE f τ <v,kf |e-iHτ |v=0,ki >. (5) Pero', l' esperimento assegna solo l'energia Ei , e non la durata τ dello ione negativo. L'ampiezza Aif (Ef ) di andare dallo stato iniziale a quello finale e' la somma di tutte le Aif (Ef ,τ). Introduciamo l'inverso δ del tempo di vita dello ione negativo. L'ampiezza totale di transire da i a f nel tempo 1/δ si ottiene integrando in d(δτ). Poiche' ∞ ∫d(δτ) e-iατ−δτ 0 si trova Aif (Ef ) = ∞ ∫ 0 = -iδ α+iδ , δ = 0+, d ( δτ) <v,kf |e-i(H-E f )τ−δτ |v=0,ki > δ |v=0,ki >, (6) Ef - H+iδ cioe' un elemento di matrice del risolvente. Calcoliamo ora Aif (E) , dove la variabile E e' a priori distinta da Ef . Valgono le identita' operatoriali 1 1 1 1 = + Hh (7) E - H+iδ E - H 0+iδ E - H 0+iδ E - H+iδ 1 1 1 1 = + Hh (8) E- H+iδ E - H 0+iδ E - H+iδ E - H 0+iδ da cui segue 1 1 1 1 = + Hh + E - H+iδ E - H 0+iδ E - H 0+iδ E - H 0+iδ 1 1 1 + Hh Hh . (9) E - H 0+iδ E - H+iδ E - H 0+iδ Prendendo gli elementi di matrice fra |i> ed |f> viene =-i<v,kf | =305= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 |v=0,ki > E - H+iδ 1 1 1 = <v,kf | Hh Hh |v=0,ki > E - H 0+iδ E - H+iδ E - H 0+iδ 1 1 1 = <v,kf | Hh Hh |v=0,ki >. E - E f +iδ E - H+iδ E - E i +iδ Pertanto, δ 1 1 iAif (E) = <v,kf | H h H h |v=0,ki > E - εkf -vω0+iδ E - H+iδ E - εki +iδ Vr kf δ 1 Vr ki <v| cr c r † |0> . (10) E - εkf -vω0+iδ E - H+iδ E - εki +iδ <v,kf | Nella probabilita' |Aif (E)|2 compaiono i fattori | Vr kf |2 e E - εkf -vω0+iδ Vr ki |2 che vincolano l'energia finale E ad essere (per δ→0) E - εki +iδ uguale a quella iniziale ed agli autovalori Ei ed Ef di H0. Infatti, δ 1 2 π | | =δ . 2 x+iδ π[x +δ2] La probabilita' di transizione e' proporzionale al prodotto dei moduli quadrati degli integrali di salto coinvolti. Per il resto, il processo e' governato dall'ampiezza 1 Av (E)= <v| cr c † |0> (11) E - H+iδ r di creare v vibrazioni durante l'interazione elettrone molecola. L'elettrone viene creato sullo stato risonante, dove puo' fare salti virtuali nel continuo ed interagire con la vibrazione. Il metodo1 delle ampiezze di eccitazione (vedi Capitolo 17) consente di calcolare esattamente le (11). Usando questo metodo, e' stata calcolata2 la probabilita' di transizione |Av (E)| 2, che risulta in buon accordo con le funzioni di eccitazione sperimentali. Non e' cosi' necessario supporre, come avevano fatto Rohr e Linder nel lavoro citato, che le strutture osservate appartengano a diversi stati elettronici, e si ha una buona comprensione dell'esperimento in termini di un solo parametro g0, anche senza poter calcolare le funzioni d'onda dello ione negativo temporaneo. Le risonanze di Feshbach di molecole come N2, NO, CO sono state studiate accuratamente e mostrano ricche strutture vibrazionali. | 1M. Cini, Phys. Rev. B17, 2486 (1978) 2Domke, Cederbaum e Kaspar, J. Phys. B 12 (1979) L359 . Questo lavoro presenta un calcolo rigoroso della probabilita' totale, inclusi i fattori che qui si sono omessi per semplicita'. =306= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 12-4 Chemisorbimento:modello di Newns1 A partire dagli anni intorno al 1970, il legame chimico fra un atomo e una superficie (chemisorbimento) e' stato studiato con modelli derivati da quello di Fano-Anderson. Essi hanno un carattere semiempirico e per quanto riguarda le proprieta' di stato fondamentale, come la densita' di carica, la lunghezza di equilibrio e l'energia dei legami, sono oggi superati in accuratezza dai metodi ab initio basati sul metodo del funzionale densita'. Tuttavia, essi mantengono una notevole importanza come strumenti concettuali ed anche nello studio degli stati eccitati. Nel 1969, D.M. Newns dette un contributo molto importante al metodo in uno studio del chemisorbimento di H su metalli di transizione, come Cu e Ni. Nella sua schematizzazione, il legame coinvolge uno stato atomico |a>, che e' lo stato 1s di H con energia ε0a, e il continuo degli stati della banda d del metallo. Questi ultimi sono denotati con |k>, hanno energia εk e le loro funzioni d'onda <x|k > hanno un andamento oscillatorio dentro il metallo, ma decadono esponenzialmente fuori. Descrivendo il legame covalente con integrali di hopping Vak abbiamo un modello di Fano. Nel suo fondamentale lavoro, che trattava di impurezze magnetiche in metalli di transizione2, Anderson trovo' che gli bastava approssimare la self-energy Σa(ω) = Λ-i∆ con una costante complessa3. In questa approssimazione, ρ a e' una lorentziana, e l'effetto dell'ibridizzazione e' quello di produrre uno spostamento del livello di Λ ed un allargamento di ∆. Cosi', ∆-1 e' proporzionale al tempo di vita della risonanza. Tuttavia, negli studi sul chemisorbimento e' molto importante tener conto della dipendenza di Σ dall'energia; questo fatto e' stato messo in risalto da Newns. In particolare, con Λ=Λ(ω ), ∆=∆(ω), vi possono essere poli di G sull'asse reale, e quindi stati localizzati che corrispondono ad autovalori interagenti; la condizione e' che sia ω - ε a - Λ(ω) =0 con ∆=0. Quest'ultima condizione stabilisce che il polo rappresenta uno stato discreto se e' fuori della banda d. Se H e’ il modello di Fano, l’unica novita’ rispetto alla trattazione precedente e’ la presenza del livello di Fermi. In luogo dell’elemento di matrice locale del risolvente, abbiamo funzioni di Green. Gli stati occupati sono descritti da una funzione di Green "a una buca" Gaa(ω) = <g|c a†(ω-H) -1 c a|g>, (1) dove |g> e' lo stato fondamentale, che supponiamo essere un determinante di Slater tale che H|g>=E0|g>. Espandiamo in autostati a 1D.M.Newns, Phys. Rev. 179, 1123 (1969) 2 P.W.Anderson, Phys. Rev. 124 (1961) 41 la notazione e' quella usata tradizionalmente nei problemi di chemisorbimento. 3 =307= Prof. M. Cini -Corso di Fisica Atomica e Molecolare particella singola |µ> di H, di autovalori ηµ. Da ca† =∑ <a|λ>c λ † λ consegue Gaa(ω) = <a|λ><µ|a><g|cλ † (ω-H=iδ) -1 c µ|g>. ∑ λ Poiche' cµ|g> e' autostato di H di autovalore εµ=E0-ηµ, viene Gaa(ω) = ∑ λ fλ |<a|λ>|2 ω-ελ +iδ (2) dove fλ =1 per stati occupati e 0 per stati vuoti. Il livello atomico, cui e' associata la funzione di Green locale Gaa, si allarga in un 'livello virtuale' caratterizzato da una densita' locale degli stati occupati -1 ρ a(ω) = π ImGaa(ω); (3) la densita' di stati del livello virtuale puo' essere espressa in termini della self-energy Σa(ω) ≡Λ(ω) -i∆(ω). Infatti, poiche' 1 Gaa(ω) = , (4) ω-εa - Λ(ω) + i ∆(ω) si ottiene ∆(ω) 1 ρ a(ω) = π . (5) [ω - εa - Λ(ω)] 2 + ∆(ω) 2 E' possibile calcolare dalla soluzione di Fano varie quantita' interessanti. Supponiamo che ci sia un polo reale per ε=εµ, sotto il livello di Fermi. Possiamo ricavare per ciascuno spin il residuo <naσ>µ≡|<a|µ>|2 = Res Gaa(ω) |ω=εµ (6) che ci informa sul carattere atomico dell'autostato µ; se e’ finita vuol dire che lo stato e’ localizzato. Anch'essa si ottiene direttamente da Λ. In effetti, espandendo G intorno al polo, e ricordando che ∆(εµ) ≡ 0, εµ-εa - Λ(εµ) =0, si ha: Gaa( ω ) ≈ = ( ω-εa - Λ)| 1 ∂ + ( ω - εµ)∂ω(ω-εa - Λ)| εµ εµ 1 ( ω - εµ)(1 - Λ')| εµ da cui segue che <naσ>µ = Si noti che1 1 1 - Λ'(εµ) . (7) 1Qui non occorre prendere la parte principale, perche' ω e' fuori della banda. =308= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∆(ω') -1 ∞ Λ'(ω) = π ∫dω' <0, (ω-ω') 2 -∞ quindi <naσ>µ e' compreso fra 0 e 1, come deve. In generale, <naσ>µ non e' nullo. Ma perche' la funzione d'onda abbia ampiezza finita sull'atomo, occorre che lo stato discreto sia localizzato spazialmente. Quindi i poli discreti corrispondono agli orbitali molecolari di una "molecola superficiale". La forma del livello virtuale e l'esistenza o meno di stati localizzati dipendono da ∆(ω), che e' stata chiamata 'funzione di chemisorbimento' proprio per sottolineare il fatto che contiene tutta l'informazione non banale sul problema. Per esempio, la carica elettronica sul livello atomico e' data da EF <na> = 2 ∫dωρa(ω), (8) -∞ dove il fattore 2 e' dovuto allo spin. Quindi il modello di Fano e’ utile per descrivere l’interazione atomo-superficie. Vi sono pero' delle complicazioni. Innanzitutto, |a> e |k> non costituiscono un set ortonormale. Per ottenere un tale set, dovremmo prima trovare gli autostati ad un elettrone del metallo semiinfinito e poi ortogonalizzarli tutti fra loro e con lo stato |a>. In pratica, questo procedimento sara' laborioso; ma questo comporta solo una difficolta' tecnica, e noi potremo sempre supporre di avere gia' determinato gli stati |k> in questo modo. Ma cosi' essi non sono piu' proprieta' intrinseche della superficie, ma contengono anche informazione sullo stato |a> al quale sono stati ortogonalizzati. C'e' poi il problema di come determinare in pratica gli integrali di hopping. In una teoria a particelle indipendenti, il potenziale in cui si muovono gli elettroni e' noto a priori, e si ha semplicemente che Vak = <a|H|k>. Ma se vogliamo usare un potenziale autoconsistente a livello Hartree-Fock, i Vak dipendono dalla soluzione e noi dovremmo usare uno schema alla Roothaan per una molecola infinitamente grande. Un calcolo da principi primi di questi coefficienti e' difficile almeno come il problema di chemisorbimento che vogliamo risolvere. Ed inoltre, dovremmo avere anche elementi <k|H|k'> fra stati diversi del continuo, che invece vogliamo trascurare. Noi considereremo i Vak come quantita' semimpiriche, che si possono stimare dagli overlap come nel metodo di Huckel esteso. Vedremo dopo un esempio. L'interazione fra gli elettroni entra nella formulazione del modello anche nell'approssimazione piu' semplice, perche' un atomo e' caratterizzato da un potenziale di ionizzazione I e da una affinita' elettronica A. Queste due quantita' sono molto diverse, e per un =309= Prof. M. Cini -Corso di Fisica Atomica e Molecolare atomo di H, I=13.6 eV mentre A=0.7 eV. Lo schema imperturbato dei livelli e' il seguente: Livello di vuoto -A φ livello di Banda d Fermi -I Qui, φ e' il lavoro di estrazione (4.5 eV per il Ni e 4.46 eV per il Cu) e il livello di vuoto e' l'energia di un elettrone fermo a distanza infinita dal metallo. Non si puo' evidentemente lavorare con un solo parametro ε0a. La differenza fra I ed A nasce essenzialmente dalla 1 repulsione U fra due elettroni sul medesimo atomo, U ≈ <aa| |aa>. r12 Certo, per un calcolo quantitativo, ci dovremmo preoccupare del fatto che gli orbitali di H sono diversi da quelli di H- , e che anche I ed A sono modificati dal potenziale immagine quando l'atomo e' a distanze ≈1 Å dalla superficie. Ma atteniamoci allo schema piu' semplice, nel quale εa e U possono essere scelti in modo da dare i valori di I ed A appropriati per un atomo chemisorbito. Sia U che εa sono modificati dal potenziale immagine del metallo. L'Hamiltoniano che ne risulta, H= + ∑ kσ εkσnkσ + ∑ ε0a naσ + σ ∑ {V kσckσ‡caσ + h.c.} +U n a+na- (9) kσ e' un modello di Anderson con interazione. Esso parte, come si e' visto, da schematizzazioni ed approssimazioni molto opportune, che lo rendono estremamente istruttivo. Benche' l'interazione compaia ormai solo attraverso U, la soluzione e' tutt'altro che banale1. Ci occorre una approssimazione semplice, per orientarci. Approssimazione di Hartree-Fock. Un elettrone di spin σ sente il campo diretto di tutti gli altri elettroni, e quello di scambio degli elettroni del suo stesso spin. 1Soluzioni esatte sono state ottenute a partire dal 1980 col metodo del Bethe Ansatz; ma esse sono complicate ed inoltre si e' ancora lontani da una soluzione completa, che consenta ad esempio il calcolo esatto delle funzioni di Green. =310= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Prendiamo σ=+. Con l'interazione semplificata Una+na- , non esiste termine di scambio, e quello diretto e' U<na- >. Pertanto, l'Hamiltoniano a una particella che descrive il moto degli elettroni di spin σ, detto anche Hamiltoniano di Fock, e', nello schema 'unrestricted', H σ= εaσ naσ + ∑ εk nkσ +∑ {V kσc kσ‡ c aσ + h.c.} kσ k dove εaσ= ε0a +U<na,-σ>. (10) σ Possiamo risolvere il problema con H tenendo <na,-σ> come parametro. Per i due spin abbiamo cosi' equazioni accoppiate. Poiche' non c'e' nessuna direzione privilegiata, non c'e' ragione per popolazioni diverse per i due spin e la simmetria del problema suggerisce di porre <na,σ> = <na,-σ>, cioe' di usare il metodo "Restricted Hartree-Fock". E' molto notevole il fatto che qui un tale ragionamento basato sulla simmetria puo' indurre in errore, perche' la simmetria puo' "rompersi spontaneamente". Quello che conta infatti e' minimizzare <H>. Ora, se U e' abbastanza grande, il minimo di <H> non corrisponde alla soluzione 'non magnetica' <n a,σ> = <na,σ>; c'e molto da guadagnare prendendo <na,σ> >> <na,-σ>, o la soluzione coi ruoli di σ e di -σ scambiati. Tali soluzioni "magnetiche" vengono evidentemente a coppie, quando l'energia potenziale dovuta ad U domina. La simmetria complessiva del problema esiste ancora, ma non e' rispettata dai singoli stati di piu' bassa energia che il sistema ammette. L'atomo chemisorbito ha allora un momento magnetico complessivo. E E U grandi U piccoli <n -n > a+ a- <n -n > a+ a- Limitiamoci qui, tuttavia, a considerare le soluzioni non magnetiche, che, a conti fatti, risultano quelle di piu' bassa energia nel caso di H chemisorbito su Cu e Ni. Poniamo allora 1 <na,σ> = <na,-σ> = <na> , (11) 2 dove <na> e' la popolazione totale del livello atomico. Allora =311= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 εa =ε0a + U<na> (12) 2 e' indipendente da σ e dipende linearmente da <na>; sara' εa=-I per <na>→0 e εa=-A per <na>→2. D'altra parte, possiamo applicare all'operatore di Fock il formalismo di Fano-Anderson che vale per gli hamiltoniani non interagenti. Poiche' , come si e' visto, EF <na> = 2 ∫dωρa(ω), si ha una dipendenza funzionale -∞ <na> = na(εa); (13) evidentemente, per εa→∞ , na→0, mentre per εa→- ∞, na→2 . Facendo sistema fra le due equazioni che legano na con εa, si ottiene l'autoconsistenza. εa 2 <n > -A a -I Newns ottenne <na> >1 per H sui metalli di transizione (ad esempio, <na>=1.06 per il Cu, =1.16 per il Ni). Il fatto che l'Idrogeno abbia una piccola carica negativa comporta la creazione di un momento di dipolo alla superficie, tale da provocare un aumento del lavoro di estrazione. Questo dipolo infatti rafforza quello gia' presente sulla superficie intrinseca per il fatto che gli elettroni si estendono verso il vuoto un po' oltre le cariche positive. La predizione e' in accordo con l'esperimento. E' istruttivo vedere come ∆ possa essere stimata in modo semplice usando un modello LCAO. Espandendo gli stati del continuo sulla base localizzata degli orbitali |i> dei singoli atomi, |k> = ∑ |i><i|k>, (14) i si possono espandere anche gli integrali di hopping sulla base degli orbitali atomici: Vak = ∑ Vai <i|k> . (15) i I piu' importanti V ai sono quelli con gli atomi primi vicini. Sono state studiate varie geometrie di chemisorbimento. La piu' semplice e' quella di un sito A (cioe' Atop), in cui l'atomo di Idrogeno sta direttamente "sopra" un atomo del metallo; in un sito B (cioe' Bridge) l'atomo sta sopra il centro di un legame fra due atomi della =312= Prof. M. Cini -Corso di Fisica Atomica e Molecolare superficie; in un sito C (cioe' Center) sta sopra il centro di un triangolo equilatero che ha per vertici atomi del metallo. A C B I risultati dipendono in modo qualitativo dal numero dei primi vicini. Qui considereremo solo il sito A, per il quale, denotando con 0 l'atomo a cui l'Idrogeno e' legato direttamente, si trova Vak ≈ Va0 <0|k> , (16) e quindi Σa(ω) ≈ |Va0|2Gs(ω) . (17) Qui, Gs(ω) e' la funzione di Green locale dell'atomo della superficie. Evidentemente, Gs(ω) e' una proprieta' del solido imperturbato1, e V a0 puo' essere stimato come nel metodo Extended Huckel o un altro metodo semiempirico. Il modello puo' poi essere raffinato includendo per esempio i secondi vicini. Per fissare le idee, possiamo usare un calcolo semplificato in cui la banda d del metallo e' rappresentata da una catena 'tight binding' di N+1 atomi. Gli stati della catena sono ottenuti, come nel metodo di Huckel, supponendo <i|j> =δij , H ii = 0 H ij = β se i e j sono primi vicini. Qui, i siti della catena sono i= 0,1,2,...N ed il chemisorbimento avviene "sopra" il sito 0; β e' l'integrale di risonanza. In questo caso, Gs(ω) ≡G00(ω). Poniamo z=ω±iδ; abbiamo come sopra Σ00(z)=β 2G00(z). Quindi, 1 G00(z)= . 2 z - β G00(z) z± z 2-4β 2 Troviamo le due soluzioni G00(z)= . Prendiamo il branch cut 2β 2 di z lungo l'asse reale positivo (arg(z)∈(0,2π)); per z 2-4β 2 si ha un cut fra -2β e 2β lungo l'asse reale, che corrisponde alla banda. Subito sopra il taglio, z 2-4β 2 =i |ω2-4β 2|, e subito sotto z 2-4β 2 =-i |ω2-4β 2| . Per soddisfare la proprieta' di Herglotz, cioe' che la densita' di stati sia positiva, dobbiamo scegliere 1a meno dei problemi gia' ricordati a proposito dell'ortogonalizzazione. =313= Prof. M. Cini -Corso di Fisica Atomica e Molecolare z- z 2-4β 2 G00(z)= . 2β 2 Cosi' si ottiene la densita' di stati semiellittica (18) 4β 2-ω2 θ(4β 2-ω2) . (19) 2β 2 Re[G00] e' la trasformata di Hilbert di n(ω) ed e' dispari; essa vale ω- ω2-4β 2 per ω>2β, ed e' lineare nella banda. 2β 2 Il chemisorbimento e' caratterizzato dal solo parametro |Va0| ; se |V a0| e' grande rispetto all'integrale di risonanza β, il chemisorbimento e' forte, se |Va0| <<|β| e' debole. Gli stati risonanti si trovano risolvendo ω−εa -Λ(ω) =0. Nel caso di un chemisorbimento debole, ∆ e Λ sono piccoli rispetto alla larghezza della banda, ed in prima approssimazione ω ≈ εa + Λ(εa). Se εa e' ben fuori della banda, anche ω e' fuori, ∆ e' nullo e si trova uno stato discreto; se εa e' ben dentro, si trova una risonanza di larghezza ≈∆(εa). Se εa e' nel continuo, puo' accadere che lo stato sia localizzato solo se εa e' molto vicino a un bordo di banda. Nel caso di un chemisorbimento forte, si ha una situazione del tutto diversa. Tipicamente, si trovano due radici reali a cavallo della banda. Infatti, in tale limite si puo' pensare che la banda e' stretta e le possibili radici ω sono ben al di fuori del continuo. Allora, n(ω) = ∞ ∆(ω') 1 ∞ 1 0=ω - εa - π ∫dω' ≈ ω - εa ∫dω'∆(ω') , (20) (ω- ω' ) π(ω- ω c ) - ∞ -∞ dove ωc e' il centro della banda. Sostituendo l'espressione di ∆(ω), si ottiene (ω-ωc )(ω-εa) - ∑ | V ak |2 =0. (21) k Le soluzioni ω± corrispondono allora ai livelli legante ed antilegante di una "molecola superficiale", con orbitali molecolari localizzati su |a> e sugli atomi del substrato primi vicini. Questa e' la situazione che prevale per il chemisorbimento di H sui metalli di transizione; il livello legante e' occupato, mentre quello antilegante e' vuoto. Riscontri sperimentali si ottengono dagli spettri di fotoemissione e dal lavoro di estrazione. Capitolo 13- Spettroscopie elettroniche ed effetti a molti corpi =314= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Lo studio delle spettroscopie ci pone di fronte ad una ricca fenomenologia ed all'arduo problema di descrivere gli stati eccitati di sistemi interagenti: non e' possibile osservare un sistema lasciandolo nello stato fondamentale. Cominceremo con le spettroscopie elettroniche. Gli spettri si esprimono in termini di funzioni di Green, e di valori di aspettazione piu' generali, con il formalismo della risposta quadratica. 13-1 ESCA Si indica con ESCA (Electron Spectroscopy for Chemical Analysis) l'insieme delle spettroscopie di Fotoemissione ed Auger, che stanno dando un contributo di primaria importanza allo studio di molecole e solidi. ESCA consente, anche con quantita' piccolissime di campione, di ottenere non solo una analisi chimica elementale, cioe' il riconoscimento degli atomi, ma anche una serie di dettagliate informazioni di struttura elettronica. In un apparato ESCA, il campione viene eccitato con radiazione elettromagnetica monocromatica (nel caso di raggi X si parla di XPS =X-Ray Photoemission spectroscopy, nel caso di ultravioletti di UPS=Ultraviolet Photoemission Spectroscopy) e gli elettroni fotoemessi vengono analizzati in energia con un analizzatore sferico o cilindrico 1. Uno spettro di fotoemissione e' un grafico della corrente fotoemessa in funzione dell'energia dei fotoelettroni, ottenuto tenendo costante __ l'energia h ωq dei fotoni. In un famoso libro di Siegbahn e collaboratori2 sono riportati e discussi gli spettri degli atomi di gas nobile e di molte molecole biatomiche e poliatomiche. In questi spettri sono evidenti i livelli di core, con la separazione spin-orbita ben risolta, ed i livelli di valenza molecolari. Sono inoltre visibili altre strutture da cui molta informazione puo' essere estratta.Per esempio, il livello 1s dell'O della molecola paramagnetica O 2 mostra la separazione dovuta all'interazione di scambio fra gli stati finali di spin 1/2 e 3/2. Molti altri livelli, anche di core, mostrano una struttura complessa dovuta ad effetti di shake-up e shake-off, cioe' ad eccitazioni nel discreto e nel continuo. Nel seguito, daremo una breve esposizione degli effetti fisici piu' importanti. L'interazione del campione con la radiazione e' descritta da N H' = ∑ H 'j (1) j 1La spettroscopia Auger si puo' eseguire anche con un diverso apparato, usando come sorgente un fascio di elettroni, come sappiamo. 2 Questa breve esposizione e' in parte basata sul libro di K.Siegbahn et al. "ESCA APPLIED TO FREE MOLECULES", North-Holland Publishing Company, Amsterdam-London (1969). =315= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove N e' il numero di elettroni e1 H' j = -e [A(xj ).pj + pj A(xj )] . 2mc (2) Viene spesso usata anche la seguente formulazione alternativa: ∫ -1 3 d x A(x)⋅J op(x) , c che deriva direttamente dalla teoria relativistica. Qui, J op e' l'operatore corrente, quello cioe' che ha valore di aspettazione su una Ψ a particella singola H' = __ e h <Ψ |J op|Ψ > = J(x) = [ Ψ *gradΨ −Ψgrad Ψ *]. 2mi Per la densita', l'operatore e' ρop(x) = eδ(x- x'), dove x e' il punto dove la densita' viene calcolata ed x' e' la variabile di integrazione, tale che ∫ ρ(x) = <ρop> = Ψ *(x')ρopΨ (x') dx' = |Ψ (x)| 2. Per la corrente, l'operatore adatto e' e J op= [p δ(x- x') + δ(x- x')px , ] . 2m x' Infatti, e <J op> = d3x' Ψ *(x')[px' δ(x- x') + δ(x- x')px' ] Ψ (x') , 2m ma per l'hermiticita' di p il primo termine dell'integrando puo' essere riscritto ∫ (px' Ψ (x')) *δ(x- x')Ψ (x') = i __ h ∇ x 'Ψ *(x')δ(x- x')Ψ (x'), con il risultato che il valore di aspettazione e' proprio la corrente. L'interazione radiazione-elettrone viene allora -1 3 H' = d x A(x) J op(x) = c -e = d3x [A(x)px' δ(x- x') + A(x)δ(x- x')px' ] , 2mc dove A(x) e px' sono operatori commutanti. Prendiamo l'elemento di matrice H'mn. Il primo termine da' il contributo -e d3x' Ψ m*(x') d3x p x' A(x)δ(x- x') Ψ n(x'). 2mc ∫ ∫ ∫ ∫ ∫ La regola e' d3r'δ(r - r ') φ(r')=φ(r ), dove φ puo' anche contenere operatori, ma la δ deve trovarsi all'estrema sinistra. Integrare su x' non si puo' (direttamente), mentre integrando su x si ha -e d3x' Ψ m*(x')px' A(x') Ψ n(x'), 2mc .Nel secondo contributo, -e d3x' Ψ m*(x') d3x A (x)δ(x- x')px' Ψ n(x') 2mc possiamo integrare come vogliamo, ottenendo ∫ ∫ ∫ 1 Com'e' ben noto, poi, per onde trasverse (divA=0) possiamo far commutare -e p ed A ottenendo H' j= A(xj).pj . mc =316= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∫ -e d3x Ψ m*(x)A(x)px Ψ n(x). 2mc A conti fatti, abbiamo trovato l'elemento di matrice di H' = Pertanto le due formulazioni sono equivalenti. -e (p.A + A.p). 2mc Per mettere H' in seconda quantizzazione, si deve scegliere un set completo e ortonormale di stati a particella singola con cui calcolare gli elementi di matrice Mmn = <m|H'|n>. (3) Benche' il set sia arbitrario, e' evidente che la convergenza e' migliore se prendiamo un set adatto alla molecola, come ad esempio gli orbitali di Hartree-Fock. Sulla base prescelta potremo scrivere H' = ∑a+man Mmn. (4) mn La sezione d'urto di assorbimento fornita dalla regola d'oro di Fermi e' (a parte un fattore che ignoriamo perche' dipende dal fotone ma non dal sistema) σ ∝ ∑ |<f|H'|i>| 2δ(Ei -Ef + ωq), (5) f dove |i> e' lo stato iniziale (a N elettroni) della molecola, di energia E i, |f> rappresenta gli stati finali di energia Ef in cui il fotone e' stato __ assorbito e h ωq e' l'energia del fotone. Se il fotoelettrone e' veloce, possiamo scrivere Ef =εk + Ef ', cioe' la sua energia εk si aggiunge a quella finale della molecola ionizzata. Inoltre, possiamo approssimarlo con un'onda piana di vettore d'onda k, e scrivere |f>≈a+k |f'> dove |f'> e' lo stato finale (a N-1 elettroni) della molecola. Allora la sezione d'urto e' σ ∝ρ(εk ) ∑ | ∑Mkm <f'|a m|i>|2δ(Ei -Ef' - εk + ωq) ; (6) f' m qui ρ(εk ) e' la densita' degli stati finali (proporzionale a εk ) che deriva dalla somma sui k accettati dal rivelatore. Conviene ora introdurre l'Hamiltoniano H della molecola ionizzata: H|f'> = E(f')|f'>. (7) Sviluppando l'espressione precedente, si trova σ∝ ρ(εk ) ∑ ∑ ∑Mkm Mkn * <i|a+n |f'><f'|am|i> δ(Ei -Ef' - εk +ωq) (8) f' n m e, ponendo per brevita' ω=Ei +ωq- εk , σ= ρ(εk ) ∑ ∑ ∑Mkm Mkn * <i|a+n δ(ω-H)|f'><f'|am|i> f' n m =317= = Prof. M. Cini -Corso di Fisica Atomica e Molecolare =ρ(εk ) ∑ ∑Mkm Mkn * <i|a+n δ(ω-H)am|i> . (9) n m Introduciamo la funzione di Green a una buca, 1 a |i>, (10) ω-H+i0 m e prendiamo stati a particella singola reali; anche la funzione d'onda iniziale puo' sempre essere presa reale; cosi' otteniamo Gnm (ω ) = <i|a +n σ = ρ(εk ) ∑ mn -1 Mkm Mkn * [ π Im{G nm (ω)}] . (11) La quantita' in parentesi quadra e' la matrice densita' di stati della molecola. In un modello a particella indipendente la funzione di Green ha poli semplici in corrispondenza ai livelli molecolari, con residui che si ottengono dagli orbitali molecolari. 13-2 Chemical shifts Le posizioni dei livelli di core dipendono dall'intorno chimico, e possono essere correlate con la carica sull'atomo. Per esempio, i livelli di core di F e Xe si spostano di alcuni eV lungo la serie dei fluoruri di Xenon XeF2, XeF4 e XeF6 (solidi incolori, che fondono rispettivamente a 140, 114 e 46 0C). Rispetto alla sua posizione in F2, il picco 1s del F e' meno legato in XeF2 di ben 5.48 eV; questa differenza si riduce a 4.6 eV in XeF4 e a 3.38 eV, in XeF6, mentre la carica negativa sul Fluoro si riduce. I livelli dello Xe si spostano in senso opposto, in modo ancora piu' evidente. Esiste inoltre una chiara correlazione lineare fra le energie di legame dei livelli e le cariche totali degli atomi, determinate da calcoli autoconsistenti. Un altro esempio analogo1 e' quello dei livelli 1s del C in CH4 e nei bromometani. L'energia di legame cresce con la carica positiva sull'atomo. In molecole organiche che contengono atomi di C non equivalenti si possono risolvere i loro picchi di core. Gli spostamenti chimici sono dovuti al concorso di effetti di stato iniziale ed effetti di stato finale. Abbiamo gia' parlato dei primi, che sono dovuti al potenziale elettrostatico medio che regna sull'atomo; a seconda dell'intorno chimico, un livello di core puo' essere piu' o meno legato che nell'atomo libero. Gli effetti di stato finale sono dovuti alla polarizzazione del sistema attorno al buco di core e sono in genere dello stesso ordine di grandezza. Essi pero' tendono sempre a ridurre l'energia di legame. 1vedi la Figura a pag. 109 del libro citato di K. Siegbahn et al. =318= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Dall'esame degli spostamenti chimici e' possibile dedurre la valenza di un dato atomo in un dato composto. 13-3 Sdoppiamento dei livelli di core nelle molecole paramegnetiche La configurazione elettronica di NO, che ha un numero dispari di elettroni, e' O1s2N1s21σ22σ2 1π 4 3σ22π 1; quindi, la molecola e' un doppietto di spin, e NO+ puo' essere un singoletto o un tripletto. Pur avendo un numero pari di elettroni, la molecola di O2 ha uno stato fondamentale 3Σg , con la configurazione 1s2σg (2s)2σu(2s)2σg (2p)2π u(2p)4[π g (2p)1]2, che presenta due orbitali π g parzialmente occupati 1. In ambedue i casi, questo provoca uno sdoppiamento dei picchi di core in fotoemissione. N2 σu2p π g 2p σg 2p π u2p ___O___ __OO___ __↑↓___ _↑↓_↑↓_ σu2s __↑↓___ σg 2s __↑↓___ N1s __↑↓___ NO O2 4σ ___O___ σu2p 2π __O↑___ π g 2p 3σ __↑↓___ π u2p 1π _↑↓_↑↓_ 2σ __↑↓___ σg 2p 1σ __↑↓___ N1s __↑↓___ O1s __↑↓___ σu2s σg 2s O1s ___O___ _↑___↑_ _↑↓_↑↓_ __↑↓___ __↑↓___ __↑↓___ __↑↓___ 1Un orbitale π ha Λ=|L | =1 ed e' degenere con componenti L =±1. z z =319= Prof. M. Cini -Corso di Fisica Atomica e Molecolare O 1s N 1s NO N 1.2 O 2 0.9 2 NO 0.9 0.9 B.E. 545 540 B.E. 410 405 Come si vede in questo schizzo approssimativo, il livello 1s dell'Azoto nella molecola diamagnetica di N2 ha una energia di legame di circa 410 eV ed una larghezza a mezza altezza di ≈0.9 eV; lo stesso livello atomico nella molecola paramagnetica NO appare sdoppiato. Il massimo ha una energia di legame piu' bassa che in N2 solo di una frazione di eV ed ha la stessa larghezza, ma vi e' una seconda componente, piu' legata di ≈1.5 eV; il rapporto di intensita' e' 3:1. Il livello 1s dell'O non si vede risolto, ma allargato di ≈0.3 eV rispetto allo stesso livello nell'O2; con una maggiore risoluzione anch'esso risulterebbe sdoppiato. Per semplificare la notazione indichiamo lo stato fondamentale con Ψ(NO) = |πα sα sβ|, ovvero |πβ sα sβ|, (1) dove si sono omessi i gusci che restano tutti vuoti o tutti pieni sia nello stato iniziale che in quello finale. Lo stato s rappresenta l'elettrone 1s dell'Ossigeno o dell'Azoto, a seconda del processo che si vuol descrivere. Per NO+ dobbiamo allora considerare i 4 stati |πα sα| |πα sβ| |πβ sα| |πβ sβ|. (2) Questi stati hanno tutti Λ≡|Lz| =1, dove z e' l'asse internucleare, ma non sono tutti autostati dello spin. Per il singoletto si ha 1 ψ( 1Π) = [ |πα sβ| - |πβ sα| ] (3) 2 e per il tripletto si ha ψ1( 3Π) = |πα sα| sz = 1 1 ψ0( 3Π) = [ |πα sβ| + |πβ sα| ] sz = 0 2 ψ−1 ( 3Π) = |πβ sβ| sz = -1. =320= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Scriviamo l'energia totale dei due stati con s z=0; poiche' 1 H = ∑ hi + (4) rij i i<j ∑ e' indipendente dagli spin e <αβ|H|αβ> = <βα|H|βα>, si trova E(1Π) = <|πα sβ| |H| |πα sβ|> - <|πα sβ| |H| |πβ sα|> E(3Π) = <|πα sβ| |H| |πα sβ|> + <|πα sβ| |H| |πβ sα|> . Nel calcolo di <|πα sβ| |H| |πβ sα|> , poiche' i due determinanti differiscono di due spin-orbitali, non c'e' contributo dai termini a un corpo h i ; rimane <|πα sβ| |H| |πβ sα|> =-J, dove 1 J= (π(1)s(2)| |π(2)s(1)) (5) r12 e' l'integrale di scambio. Il termine piu' basso e' il tripletto e la separazione e' ∆E = 2J. Orbitali molecolari di NO ottenuti con calcoli autoconsistenti, inseriti in questo integrale, hanno dato ∆EN=0.88eV e ∆EO= 0.68 eV. L'ordine di grandezza e' giusto e correttamente ∆EN >∆EO. Per migliorare l'accordo con l'esperimento occorrerebbe usare funzioni d'onda appropriate a NO+. Il rapporto 3:1 delle intensita' e' spiegato. Analogamente, lo spettro O1s della molecola di O2 (ad una energia di legame di ≈547eV) mostra due componenti separate di 1.1eV, con un rapporto di intensita' 2:1. Con uno stato fondamentale 3Σg , le due componenti dello spettro 1s corrispondono1 ai due stati finali 4Σ e 2Σ , e cio' spiega il rapporto delle intensita'. Indichiamo gli orbitali con Lz=± 1 con π ± e lo stato iniziale con ψ( 3Σ) = |π + α π - α| 1 ψ( 3Σ) = [ |π + α π - β| + |π + β π - α| ] 2 ψ( 3Σ) = |π + β π - β| sz = 1 sz = 0 s z = -1. Per descrivere lo stato finale, aggiungiamo uno spinorbitale 1s spaiato (che nello stato iniziale era stato sottaciuto con gli altri stati dei gusci chiusi). Si ottengono cosi' 6 stati. Uno e' la componente di 4Σ con sz=3/2, cioe' Ψ(3/2,sz=3/2) = |π + α π - α sα| ; 1 La buca 1s non va pensata su un orbitale pari o dispari σ o σ , ma g u piuttosto in uno stato localizzato su uno dei due atomi, con una bassa frequenza di salto sull'altro atomo; quindi la simmetria di inversione e' in sostanza violata nello stato finale, a causa degli effetti di correlazione. =321= Prof. M. Cini -Corso di Fisica Atomica e Molecolare la componente di 4Σ con s=3/2 s z=1/2 si ottiene da questa applicando l'operatore di shift S - =S- (1) +S- (2) +S- (3) e risulta 1 { |π + α π - α sβ| +|π + α π - β sα|+|π + β π - α sα|} ; 3 oltre a questa, vi e' un'altra combinazione dei 6 stati disponibili con sz=1/2, e cioe' 1 Ψ(1/2,sz=1/2) = { 2|π + α π - α sβ| -|π + α π - β sα|-|π + β π - α sα|} 6 Ψ(3/2,sz=1/2) = scelta in modo da essere ortogonale alla precedente. Cosi', come nel caso di NO, si puo' calcolare ∆E, dovuto anche in questo caso ad una interazione di scambio. 13-4 Shake-up, shake-off, rilassamento Nello stato finale della fotoemissione da un livello di core, esiste una lacuna localizzata, che provoca un campo ed una polarizzazione del sistema. I fenomeni di polarizzazione non sono previsti in una teoria a particelle indipendenti. Tuttavia, essi si osservano comunemente: provocano spostamenti dei livelli verso energie di legame piu' basse. Gli "effetti di stato finale " si manifestano nello spettro anche con la presenza di picchi satelliti. Per vederlo, consideriamo il contributo importante che danno gli elettroni allo "shift di rilassamento". La sua presenza significa che gli elettroni "spettatori" sono in realta' coinvolti in qualche misura nel processo di fotoemissione; esiste allora una probabilita' finita che lo ione sia lasciato, nello stato finale, eccitato. In tal caso, poiche' l'energia totale si conserva, il fotoelettrone avra' energia cinetica minore che nella transizione fra stati fondamentali, e cio' apparira' nello spettro come un picco satellite a piu' alta energia di legame. Si noti che questo accade senza che il fotoelettrone interagisca col sistema dopo essere stato emesso. Una tale interazione 'postcollisionale' non gioca nessun ruolo importante nel caso di fotoelettroni veloci, ma il fotoelettrone "sa" l'energia dello stato finale dello ione che si lascia dietro, solo in virtu' della conservazione dell'energia totale. Possiamo adattare la teoria a particelle indipendenti in modo da includere alcuni effetti di correlazione, se siamo disposti a usare orbitali diversi per lo stato iniziale e per quello finale. Supponiamo di avere ionizzato un livello profondo c, ad esempio un livello 1s (guscio K). Trascurando la dipendenza dall'energia di ρ(εk ) e degli elementi di matrice, la forma dello spettro sara' data da -1 σ(ω) = π Im{Gc (ω)} = <i|a+c δ(ω-H) ac |i >=<i;c|δ(ω-H)|i;c>, (1) =322= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove |i;c> = a c |i> e' lo stato a N-1 elettroni che si ottiene dallo stato iniziale |i> creando il buco di core ma tenendo gli orbitali "congelati". Calcoliamo |i> nella approssimazione di Hartree-Fock per la molecola neutra; sotto le note condizioni |i;c> puo' essere un unico determinante di Slater. Introducendo gli autostati |ν > e gli autovalori εν di H con N-1 elettroni, si ha σ(ω) = |<i;c|ν>|2δ(ω ∑ ν - εν ). (2) I |ν > vanno pero' calcolati in presenza del buco di core, cioe' come determinanti formati con spin-orbitali "rilassati". Possiamo ottenerli anch'essi nell'approssimazione di Hartree-Fock: il generico stato finale |ν > della molecola sara' rappresentato da un determinante di Slater, corrispondente ad una configurazione eccitata, in cui manca un elettrone profondo 1. Poiche' l'overlap dei determinanti e' uguale al determinante degli overlap a particella singola, e gli orbitali rilassati non sono in generale ne' identici ne' ortogonali a quelli iniziali, tutti gli stati eccitati |ν> a molti elettroni contribuiscono alla somma. Ciascuno dara' un contributo col suo εν . Mentre quelli discreti danno satelliti di shake-up stretti, gli stati del continuo producono strutture larghe di shake-off. E' facile verificare che per l'intensita' totale dello spettro vale la regola di somma ∞ ∫ d ω∑ |<i:c|ν>|2δ(ω - εν )=1, (3) ν -∞ mentre il primo momento rimane quello non rilassato, cioe' ∞ ∫ d ωω∑ |<i:c|ν>|2δ(ω - εν )= <i:c|H|i:c> . ν -∞ (4) La eccitazione dei satelliti compensa esattamente lo shift di rilassamento. Lo spettro 1s del Ne e' mostrato a pag.25 del libro di Siegbahn, ed e' ricco di satelliti. Si osservano gli stati finali delle configurazioni eccitate 2p5np1 con n=3,4,5. Questi sono tutti stati 2S, come |i:c>, e quindi hanno overlap non nullo con esso e contribuiscono alla somma. Si osserva invero anche un debole picco attribuibile su base energetica ad uno stato finale 3P dello ione; quest'ultimo e' attribuito ad una interazione "post-collisionale" col fotoelettrone. 1Abbiamo gia' discusso il difetto principale di questo schema: lo stato eccitato a N elettroni non e' rigorosamente ortogonale allo stato fondamentale. Ma l'overlap e' piccolo, e qui siamo interessati principalmente agli overlap fra stati a N-1 elettroni. =323= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Oltre alle eccitazioni a particella singola, sono importanti in questo contesto anche tutte le eccitazioni del sistema che possono essere schematizzate come oscillatori armonici e descritte come bosoni. Vi e' una vasta classe di tali eccitazioni, che contribuiscono sia all'energia di rilassamento che allo spettro di shake-up 1. Nella fisica molecolare sono particolarmente evidenti le strutture vibrazionali dei picchi di fotoemissione; in fisica dei solidi occorre considerare anche i satelliti di plasma. Il tempo caratteristico delle vibrazioni molecolari e' ≈10-13 s. Quanto dura il processo di fotoemissione? Il fotone e' assorbito in un certo punto del cronotopo, e l'informazione relativa all'evento viaggia alla velocita' della luce. Se la molecola non e' enorme, la transizione e' breve rispetto alla durata delle vibrazioni ed in pratica "i nuclei non si muovono durante la ionizzazione" (principio di FranckCondon). Ma la geometria di equilibrio dello ione e' diversa da quella della molecola neutra, e quindi lo ione rimane, in generale, in uno stato vibrazionale eccitato. Questo si visualizza facilmente nel caso di una molecola biatomica disegnando le curve di energia potenziale della molecola neutra e degli stati elettronici possibili dello ione in funzione della distanza internucleare. Quando le distanze di equilibrio differiscono di poco, rispetto alla larghezza delle loro funzioni d'onda gaussiane, vi e' una probabilita' elevata di transire allo stato fondamentale del livello elettronico eccitato; l'energia della transizione fra i due stati fondamentali vibrazionali si chiama energia di ionizzazione adiabatica. Nello spettro di fotoemissione vi corrisponde il picco piu' intenso, che e' accompagnato da satelliti di intensita' rapidamente decrescente. I satelliti si trovano dalla parte delle energie cinetiche decrescenti e sono distanziati dell'energia / hω1 del modo vibrazionale dello ione2. | | | | Se il cambiamento della distanza di equilibrio e' grande, la probabilita' della transizione adiabatica e' piccola. Lo spettro ha molte righe, ed e' quasi continuo, ma il massimo delle intensita' corrisponde alla "energia di ionizzazione verticale". 1Anche le eccitazioni a particella singola vengono spesso utilmente trattate come bosoni. Infatti, coinvolgendo in realta' un elettrone ed una buca, si comportano come quasiparticelle di spin intero purche' la loro densita' non sia cosi' alta da rendere importanti le restrizioni dovute al principio di Pauli. Le eccitazioni elettrone-buca approssimativamente bosonizzate si chiamano tomonagoni dal loro inventore Tomonaga. 2Questa in genere differisce dalla corrispondente energia vibrazionale __ h ω 0 dello stato elettronico fondamentale. =324= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ... | | | | | | || || | ||| | | ... Di regola, i livelli profondi e quelli non leganti hanno poca struttura vibrazionale, mentre quelli leganti possono averla molto ricca. Questa osservazione spesso basta ad "assegnare" i picchi dello spettro agli orbitali molecolari. Consideriamo per semplicita' un solo modo bosonico di frequenza ω0, trascurando anche la possibilita' che la vibrazione nello stato finale ionizzato abbia ω1 significativamente diverso. Immediatamente dopo l'evento di fotoemissione, il potenziale armonico della vibrazione ha un minimo spostato rispetto alla posizione di equilibrio della molecola neutra. Ma per un potenziale armonico, la trasformazione x→x+∆x equivale ad aggiungere al potenziale un nuovo termine lineare in x ed una costante. La costante puo' essere conglobata nella definizione delle energie dei livelli elettronici, e quindi la ignoriamo nel seguito. Descriviamo il modello in seconda quantizzazione. Lo stato iniziale vibrazionale |i> della molecola e' lo stato fondamentale di H 0 = ω0d† d, (5) dove d e d+ sono gli operatori di distruzione e creazione del modo, che obbediscono alle regole di commutazione [d,d† ]- =1. In altri termini, |i> e' il vuoto dei d. Improvvisamente, il processo di fotoemissione accende un nuovo termine di interazione H1 nell'Hamiltoniano, e poiche' in seconda quantizzazione x e' proporzionale a d+d† , H 1= g(d+d† ). (6) Successivamente, il sistema si evolve secondo l'Hamiltoniano totale H= ω0d+d+g(d+d+). Questo puo' essere immediatamente diagonalizzato con la trasformazione d = b +γ d† =b† +γ* . (7) (8) Questa trasformazione e' canonica perche' anche i nuovi operatori obbediscono alle regole di commutazione [b,b† ]- =1. Sostituendo, H 0 → H 0' = ω0[b† b + γb† + γ* b + |γ|2], (9) † * H 1 → H 1' = g[b + γ + b + γ ]. (10) =325= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Si puo' imporre che nell'Hamiltoniano trasformato H'=H0'+H 1' i coefficienti di b e b† siano nulli, scegliendo γ in modo che ω0γ +g =0. In tal modo, H' assume la forma diagonale H' = ω0b† b + ∆E, (11) -g2 con ∆E= ω0 . L'energia dello stato fondamentale si abbassa1, per effetto dell'interazione, della "energia di rilassamento" ∆E. Si puo' notare che trattando H' come perturbazione al secondo ordine, avremmo ottenuto in questo caso il risultato esatto per ∆E. Si osservi anche che lo stato fondamentale |0> di H' e' il vuoto dei b, ma non dei d (cioe', l'operatore d non da' 0 agendo su di esso2). Il vuoto dei d e' lo stato iniziale |i>. Gli stati eccitati di H' si ottengono creando bosoni di stato finale sul vuoto: essi sono 1 (b +) N|0>, (12) N! con N intero positivo qualsiasi; si controlla facilmente con le regole di 1 commutazione che il fattore e' necessario perche' lo stato sia N! correttamente normalizzato. |N> = Lo spettro di fotoemissione di un livello di core, in termini degli autostati ed autovalori di H', e' proporzionale a <i|δ(ω-H')|i> = ∞ |<i|Ν>|2δ(ω ∑ Ν - E N). I fattori |<i|N>| 2 si chiamano fattori di Franck- Condon. Per calcolarli, poniamo provvisoriamente <i|0>=C. Allora, g g <i|1>=<i|b† |0>=<i|(d† +ω0 )|0>= ω0C, poiche' |i> e' il vuoto dei d, e il g termine in d† e' nullo. In generale, <i|N> N!=<i|b† n |0>= ω0 NC, quindi 1 g N C. <i|N>= (13) N! ω0 Poiche' pero' deve essere ∑|<i|N>|2 =1, si ottiene C=e-a/2 , dove N 1E' ben vero che noi abbiamo deciso di non occuparci degli spostamenti costanti, ma vedremo presto che ∆E puo' essere dedotto dalla forma dello spettro. 2La creazione dell'universo viene descritta dalla teoria inflazionaria come una transizione fra due "vuoti" diversi. Vera o falsa che sia questa congettura, la fisica e' piena di queste connesioni sorprendenti fra problemi apparentemente diversissimi. =326= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |∆E| g2 = ω0 2 ω0 e' un numero puro. Pertanto, lo spettro viene proporzionale alla funzione ∞ an L(ω)= e -a δ(ω+∆E-nω0) . (14) (n!) n=0 a= ∑ an -a La probabilita' di avere n bosoni eccitati e' Pn = e , e segue la (n!) statistica di Poisson; questo fatto riflette l'indipendenza statistica dei bosoni. Il numero medio di bosoni eccitati e' ∑nPn =a. Ovviamente, n L(ω ) e' normalizzata a 1 ed il suo primo momento obbedisce alla regola di somma ∑ ∞ ∞ an (nω0-aω0) = ∫dωωL(ω) = e-a (n!) -∞ n=0 ∑ ∞ e-a {ω0a 1 ∑ ∞ an-1 - aω0 [(n-1)!] 0 an } =0. [n!] (15) Cosi' il baricentro della riga rimane dove lo troveremmo in assenza dei bosoni. Rispetto al baricentro, la soglia si trova ω=-∆E =-aω0. La trasformata di Fourier di L(ω) e' L(t) = <i| e iHt |i> = ∞ n a inω t-i∆Et =e-a e = exp{-a-iaω0t+aeiω 0t}. 0 n! n=0 ∑ (16) Nel caso a>>1, lo spettro mostrera' moltissime righe e se ω0 e' piu' piccolo del nostro potere risolutivo si osservera' uno spettro continuo. Per trovarlo, eseguiamo in L(t) il limite ω0→0, con g 2=aω02 finito; ∆E=aω0→∞ , perche' la distanza fra la soglia e il massimo cresce senza limite. L'esponente potra' approssimarsi con -a-iaω0t+a(1+iω0t-ω02t2/2) = -aω02t2/2=-g2t2/2. Allora, L(ω)= ∞ ∫dt exp{iωt-g2t2/2}= -∞ 2π ω2 exp{- 2}. g g =327= (17) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Di conseguenza la riga di fotoemissione non subisce uno spostamento, ma un allargamento Gaussiano. N.B. Abbiamo appena dimostrato il teorema lim a>>1; aω 02 finito {e-a ∑ ∞ n=0 an δ(ζ-nω0) }= (n!) 2π (ζ-aω0) 2 exp{} aω02 2aω02 e questo risultato sara' utile nel seguito. = (18) 13-5 Formalismo della risposta quadratica. Effetti di coerenza fra fotoemissione ed effetto Auger La ben nota descrizione elementare del processo di fotoemissione, basata sulla teoria della risposta lineare, e' poco elegante dal punto di vista matematico. Lo studente ricordera' che la teoria delle perturbazioni al primo ordine ci da' una probabilita' di sin2(ωmn -ω)t transizione m→n nel tempo t proporzionale a , che solo ( ωmn -ω) 2 dopo una opportuna reinterpretazione consente di arrivare al fattore δ(ωmn -ω) che esprime la conservazione dell'energia, nel limite t →∞ . La descrizione elementare del processo Auger, che abbiamo incontrato nei capitoli precedenti, e' addirittura poco soddisfacente dal punto di vista logico; abbiamo dovuto supporre il buco di core metastabile per poi calcolarne il decadimento in un modello a due stadi; ma l'interazione coulombiana HC che trattiamo come una perturbazione responsabile del decadimento e' presente anche nel calcolo degli stati iniziale e finale. Come sempre, la difficolta' logica segnala che stiamo trascurando in realta' effetti fisici. Daro' nel seguito una esposizione semplificata del metodo che ci permette di liberarci di tutti questi problemi. Consideriamo un sistema di Hamiltoniano HS soggetto ad una perturbazione periodica V. Scriveremo V(t)=fV exp(-iωt +ηt) con η =+0, dando alla perturbazione una crescita esponenziale infinitesima e garantendo cosi' che per t=-∞ il sistema e' imperturbato. Qui f e' un parametro che misura l'intensita' della perturbazione, e V e' un operatore indipendente dal tempo. Si cerca lo stato Ψ(t) che si riduce allo stato fondamentale e -iEt |g> di HS per t=- ∞ . Passando alla pittura di interazione con Φ(t) = exp(iHSt)Ψ(t) si trova, com'e' noto, che Φ obbedisce all'equazione ∂ i Φ = VI (t) Φ(t), (1) ∂t =328= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove VI (t) = exp(iHSt)V(t)exp(-iHSt) e' la perturbazione (nella pittura di interazione, appunto). Per t → - ∞ , deve essere Φ=|g>. Se la perturbazione e' piccola, otteniamo una prima approssimazione sostituendo tale risultato a secondo membro dell'equazione; poiche' H S|g>=E|g>, si ha ∂ i Φ = f exp{i[HS-E-ω-iη]t}V|g>. (2) ∂t Indichiamo con z la quantita' complessa E+ω+iη. La soluzione che obbedisce alle condizioni iniziali date e' 1 Φ(t) = |g> + f exp{i[HS-z]t} V|g>; z-H S (3) 1 che vi figura e' il risolvente. Tornando alla z-H S rappresentazione di Schro"dinger si ha l'operatore inverso Ψ(t) = e-iEt |g> + f exp{-izt} Fotoemissione 1 V|g>. z-H S Identifichiamo ora con V l'operatore (4) ∑A(xi ).pi che causa la i fotoemissione. Supponiamo che non ci sia in HS alcuna interazione con i fotoelettroni; ci sara' solo la loro energia cinetica Tpe =∑ εpnp. La p corrente di fotoelettroni di momento p e' data da d J p= <Ψ(t)|np|Ψ(t)>. (5) dt Calcoliamo |Ψ(t)> in approssimazione lineare, e Jp risultera' una funzione quadratica della perturbazione V. Poiche' np|g> =0, viene 1 1 <np> = f2 e2ηt<g|V * np V|g>. z -H S z-H S Pertanto, 1 1 J p= 2η f2 e2ηt<g|V * np V|g>. z -H S z-H S (6) (7) Prendiamo ora il limite η→ 0 tenendo conto che [n p,H S]=0. Scriviamo V in seconda quantizzazione V= ∑τ(p',c)a+p'ac +h.c. p';c =329= (8) Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove τ e' l'elemento di matrice, e c sono gli stati in cui vengono create le buche; e' ovvio che sopravvivono solo i termini delle somme dove vengono creati e distrutti i fotoelettroni p. In presenza di un tale fotoelettrone, Tpe aggiunge una costante εp all'autovalore del resto di H S, che indicheremo ancora con HS. Jp= 2η f2 e2ηt ∑ cc' ∑ → 2f2 1 1 τ* (p,c')τ(p,c)<g|a+c' * a |g> z -εp-H S z-εp-H S c τ* (p,c')τ(p,c)<g|a+c' cc' η a |g> |z-εp-H S|2 c (9) ed utilizzando una nota rappresentazione della δ, → 2πf2 ∑τ* (p,c')τ(p,c)<g|a+c' δ(E+ω-εp-H S)a c |g>. (10) cc' Il risultato e' espresso in funzione della densita' di stati a una buca del sistema, che in generale e' una matrice con c'≠c; l'operatore δ(z - H) e' proporzionale alla parte immaginaria del risolvente. L'elemento di matrice 1 Gcc' (z) = <g|a+c' a |g> (11) (z-H S) c e' una funzione di Green ritardata del sistema. Questo formalismo generalizza la teoria elementare della fotoemissione. Se HS e' un hamiltoniano non interagente, si ritrovano i noti risultati della teoria a particelle indipendenti; pero' la formulazione in termini di funzioni di Green resta valida anche quando la dinamica e' complicata. Nell'approssimazione di Hartree Fock i livelli energetici sono dati dagli autovalori di Koopmans; in presenza degli effetti di correlazione, essi sono dati dai poli di G, e questo comporta non solo uno spostamento in energia ma anche una redistribuzione dell'intensita' spettrale su un intervallo di larghezza finita. Formalismo della risposta quadratica per la corrente Auger1 In fotoemissione, lo spettro riflette la dinamica della buca finale, ed e' descritto dalla funzione di Green a una buca; per analogia, possiamo attenderci che lo spettro Auger dipenda dalla densita' di stati delle due lacune finali, e si ottenga da una opportuna funzione di Green a due buche. Questa idea e' molto proficua, e si realizza nel modello a due stadi: il sistema con la buca profonda 1Gunnarsson e Schonhammer, Phys. Rev. B22, 3710 (1980). =330= Prof. M. Cini -Corso di Fisica Atomica e Molecolare rilassa verso uno "stato fondamentale" |g'> metastabile; il decadimento Auger avviene successivamente, in uno stato cosi' preparato. In questo schema, lo spettro Auger e' proporzionale a 1 <g'|W W|g'> , (z-H S) dove W= ∑ W mnv v a†ma†n av av + h.c. 1 2 2 1 (12) e' l'operatore a due corpi che causa il decadimento. L'insieme (m,n) contiene uno stato di core ed uno di elettrone libero, mentre v1 e v2 sono gli stati di buca finale (di valenza o di core) del processo. Lo stato iniziale con la lacuna primaria e' |g'>=a c |g"> , dove ac distrugge l'elettrone profondo e |g"> rappresenta lo stato fondamentale per l'hamiltoniano degli elettroni dei gusci soprastanti, calcolato in presenza del potenziale del buco di core1. In ultima analisi, abbiamo ragione di aspettarci che lo spettro dipenda da una funzione di Green a due buche Gv1v2v'1v'2 (z) = <g"|a+v'1a+v'2 1 a a |g">, z=E+iη. (z-H S) v1 v2 (13) Finora, questa approssimazione e' stata un punto di partenza obbligato delle analisi della forma di riga Auger di atomi, molecole e solidi, e ha dimostrato di essere adeguata; ma vale solo quando vale il modello a due stadi. Come si generalizza? Indichiamo ora con k gli stati finali degli elettroni Auger. Per la corrente, avremo, come prima, d <Ψ(t)|nk |Ψ(t)> = dt 1 1 =2η f2 e2ηt<g|V * nk V|g>. z -H S z-H S Jk = (14) Esplicitiamo ora in HS quella parte W che provoca i decadimenti Auger (in particolare, di una data buca di core |c>) scrivendo H S=H+W+T, (15) dove T=Tpe +TA e' l'operatore dell'energia cinetica degli elettroni liberi. La separazione di W dal resto di HS e' netta se la buca di core e' 1in un approccio a particelle indipendenti, a † |g' > si identificherebbe con c lo stato fondamentale |g> del sistema imperturbato. Ma in generale non e' vero, perche' il sistema si polarizza intorno al buco. =331= Prof. M. Cini -Corso di Fisica Atomica e Molecolare profonda, e l'elettrone Auger energetico; in tal caso, gli elementi di matrice Wmnv v , pur essendo quelli dell'interazione coulombiana, 1 2 sono distinti nettamente dagli altri che entrano nella descrizione degli stati legati. Quindi, H denota l'Hamiltoniano del solo sistema degli elettroni legati, privato di ogni operatore che si riferisca ad elettroni non legati. Supporremo che gli elettroni Auger siano in stati di energia εk ben distinta dall'energia εp dei fotoelettroni e che i due tipi di elettroni liberi siano dinamicamente disaccoppiati dal sistema. Per semplicita' ci occuperemo nel seguito della creazione e del decadimento di un particolare stato di lacuna profonda |c>; pertanto conserveremo in V ed in W solo i termini che contengono a c ed ac +, ignorando gli altri stati possibili di buca primaria. Si verificano immediatamente le identita' operatoriali 1 1 1 1 = + W z-H-W-T z-H-T z-H-T z-H-W-T (16) 1 1 1 1 = + W . z-H-W-T z-H-T z-H-W-T z-H-T (17) Poiche' ovviamente 1 nk V|g> =0, z-H-T (18) si ha Jk = 1 1 1 1 =2ηf2e2ηt<g|V * W * nk W V|g>. z -H-W-T z -H-T z-H-T z-H-W-T (19) Ma nk =nk 2 commuta con H e con T, quindi 1 1 1 1 η * nk =nk * η → z -H-T z-H-T z -H-T z-H-T → πnk δ(E+ω-H-T)nk per η→ 0 . Il secondo fattore nk e' inessenziale, ma rende piu' simmetrica la formula. Cosi' la corrente viene 1 1 J k =2πf2<g|V * Wnk δ(E+ω-H-T)nk W V|g>. z -H-W-T z-H-W-T (20) Questa e' l'espressione generale della corrente nel modello "one-step" che tratta fotoemissione ed effetto Auger come un evento quantico =332= Prof. M. Cini -Corso di Fisica Atomica e Molecolare coerente. Ciascun operatore W si puo' pensare applicato a un set completo ∑ |φ'><φ'| di stati con una buca di core; selezionando lo stato fondamentale |φ'> = |g'> sia a sinistra che a destra si ha l'approssimazione che corrisponde al modello a due stadi. Esplicitando V, si ottiene per l'elemento diagonale in c e c' 1 J k =2πf2 ∑|τ(p;c)| 2<g|a+c * Wnk • z -εp-H-W-T A c;p 1 •δ(E+ω-H-εp-TA )nk W a |g>, z-H-εp-W-TA c (21) dove si e' sostituito ad ogni Tpe l'autovalore εp sullo stato ad un fotoelettrone. I W nei denominatori descrivono transizioni Auger virtuali che comportano un accoppiamento fra canali Auger diversi. Se il tempo di vita della buca di core e' lungo, basta fermarsi al secondo ordine in W trascurando questi effetti. Limitiamoci allora a quei termini di W che creano elettroni in dati c e k, mentre sono in generale ancora possibili molti stati finali per le buche. Introduciamo l'identita' ∞ 1 = +- i ∫dt exp{ +-i[α-H +-iη]t}, + α-H - iη 0 (22) che permette di scrivere ∞ ∞ Jk =2πf2∑|τ(pc)| 2 ∫ ∫ dtdt'<g|a +c exp{-i[ω-H-εp+iη]t'}Wnk • 0 0 p • δ(ω-H-εp-εk )W exp{i[ω-H-εp+iη]t}ac |g>. (23) Eseguiamo prima approssimativamente la somma su p, introducendo la densita' di stati ρ(p) dei fotoelettroni, con ∑|τ(p;c)|2 exp{iεp(t'-t p )}δ(ω-H-εp-εk ) → →∫dεpρ(εp)|τc (εp)| 2exp{iεp(t'-t )}δ(ω-H-εp-εk ) ≈ <ρ>|τ|2 exp{i(ω-H-εk )(t'-t)}; =333= (24) Prof. M. Cini -Corso di Fisica Atomica e Molecolare abbiamo evidentemente introdotto l' ipotesi semplificativa che la densita' di stati e gli elementi di matrice sono relativamente indipendenti dall'energia. La corrente Auger si riduce a ∞ ∞ Jk =2πf2<ρ>|τ|2 ∫ ∫ dtdt'f(t,t') (25) 0 0 dove f(t,t') = <g|a+c exp{iHt'}Wnk exp{i(H+εk )(t-t')}W exp{-iHt}ac |g>. Cosi' otteniamo alla fine del calcolo una formula di cui possiamo "leggere" il significato fisico. Inizialmente il sistema si trova nello stato ac|g>; lo stato |t> in cui il decadimento Auger avviene dopo un tempo t esattamente definito si ottiene applicandovi l'operatore del decadimento, cioe' W(t), nella pittura di interazione. Il fattore e-iHt a destra contiene l'evoluzione del sistema con la lacuna profonda. Il fattore eiHt a sinistra deve essere scritto in realta' ei(H + ε k )t perche' l'energia degli elettroni liberi non e' contenuta in H. Con il fattore nk prendiamo in considerazione solo elettroni liberi con un dato k. Evidentemente, f(t,t') = <t'|n k |t>. L'esperimento non assegna i tempi t e t', e le transizioni che avvengono a tempi diversi interferiscono, donde le integrazioni. Certo, l'elemento di matrice e' piu' complicato che una funzione di Green a due corpi. La (13) si ritrova solo se exp{-iHt}ac |g> ∝ ac |g">, e questo richiede t sia cosi' lungo che tutti gli stati eccitati presenti in exp{-iHt}ac |g> siano decaduti allo stato fondamentale calcolato in presenza del potenziale della lacuna di core. Benche' soggetto a certe ipotesi e limitato al secondo ordine negli elementi di matrice Auger, questo risultato e' libero dal quel tanto di ambiguo e contraddittorio che e' insito nel modello a due stadi. Nella teoria "one step" e' possibile calcolare certe transizioni "non diagrammatiche" che vengono osservate nei solidi e che possono essere intese come effetti di rilassamento incompleto; con tale espressione si intende che il sistema "non ha fatto in tempo" ad evolvere verso lo stato fondamentale in presenza della buca di core prima che questa decadesse per effetto Auger. Inoltre si ha una redistribuzione di intensita' anche fra le transizioni diagrammatiche ed un allargamento di tutti i picchi dello spettro. Capitolo 14- Spettroscopie ottiche: effetti anelastici ed a piu' fotoni =334= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per campi elettromagnetici intensi, come quelli che possono essere generati dai laser, l'approssimazione della risposta lineare cessa di valere. Diventano importanti i processi anelastici, in cui la luce cambia di colore; questi fenomeni sono di grande interesse sia fondamentale che applicativo. Studieremo l'effetto Raman, la generazione di Seconda Armonica, la diffusione di luce coerente e l'effetto Stark dinamico. 14-1 Diffusione della radiazione in approssimazione di dipolo Si chiamano diffusione (o scattering) della radiazione i processi a 2 fotoni in cui uno entra e l'altro esce. La diffusione elastica (o di Rayleigh) conserva la frequenza del fotone, ed e' la piu' intensa; quella inelastica (o di Raman) e' la piu' interessante per lo studio delle molecole e della materia condensata. Il formalismo della risposta quadratica, che abbiamo appena discusso, e' adatto a descrivere in modo trasparente i processi a due fotoni, e non solo quelli di diffusione, ma anche, ad esempio, il decadimento del livello 2s dell'atomo di H. Classicamente, la diffusione elastica e' causata dalle correnti indotte. Quella inelastica avviene col seguente meccanismo. Un dipolo oscillante di pulsazione ω 0 irraggia una potenza 2 ω 04 I= <d2>. (1) 3 c3 Consideriamo un'onda elettromagnetica di pulsazione ω , che induce nella molecola un dipolo della sua stessa frequenza ↔ d= E cos( ω t); (2) ↔ qui, e' un tensore del 20 ordine (il tensore polarizzabilita'). Se la molecola vibra con una pulsazione caratteristica ω m, si avra' ↔ = ↔ 0 + ↔ 1 cos(ω mt + β) (3) dove β e' una fase arbitraria, ed evidentemente sara' irraggiata luce alle pulsazioni ω , ω +ω m , ω - ω m. Quella di frequenza ω e' la diffusione elastica di Rayleigh, ed il fattore ω 4 spiega il colore azzurro del cielo1. La radiazione a ω - ω m, detta di di Stokes, e quella a ω +ω m , di AntiStokes, dovrebbero allora essere ugualmente intense. In realta' la radiazione di Stokes e' piu' intensa, ma per capirlo occorre la teoria 1L'atmosfera diffonde in modo preferenziale le corte lunghezze d'onda. =335= Prof. M. Cini -Corso di Fisica Atomica e Molecolare quantistica. Per prima cosa, normalizziamo il potenziale vettore A e scegliamo la gauge. Normalizzazione di un fotone: nella gauge trasversa, il potenziale φ e' nullo, e A = N eikr-iω t (4) si normalizza imponendo che in un volume V unitario, ci sia l'energia di un fotone, cioe' 1 4π ∫ [ E E* + B B* ] d3r = h / ω. ∂A 2N2 2 , B = rot A viene EE* = N2ω 2 = BB* e quindi ω ∂t 4π Con /h=1, E = = ω ; pertanto, A= 2π ω (5) eikr-iω t. (6) Interazione radiazione-materia in approssimazione di dipolo. Per k→0, H' = A≈ 2π ω e-iω t, e il termine di interazione e' -e -e dr -e d(A⋅r) dA A⋅p = A⋅ = [ ⋅r] ; mc c dt c dt dt ma una derivata totale nell'Hamiltoniana ∑ pi dqi -L dt , come in L, dA ∂A = , perche' A non ha derivate spaziali e dt ∂t 1 ∂A non c'e' forza di Lorentz. Con = E, er = d, resta c ∂t H'(t) = -Ed. (7) puo' essere ignorata; Nella teoria semiclassica, d e' un operatore che non dipende esplicitamente da t, mentre E(t) e' trattato come un campo classico esterno. In particolare, -i 2π ω d e-iω t e' la parte che descrive l'assorbimento, come risulta dalla teoria elementare al primo ordine. Poiche' H' e' hermitiano, prendendo reale, scriviamo H' = V A e-iω t + VE eiω t , (8) =336= Prof. M. Cini -Corso di Fisica Atomica e Molecolare con V A = -i 2π ω d, VE = i 2π ω d = VA † . Processi di secondo ordine Siano |i> ed |f> due stati stazionari della molecola imperturbata. Un fotone incidente di frequenza ω1 puo' indurre la transizione i→f convertendosi in un fotone di frequenza ω2 con il vettore d'onda contenuto nell'angolo solido dΩ2 , che corrisponde al rivelatore. Noi calcoleremo la sezione d'urto differenziale dσif di questo processo a due fotoni. Conviene pero' procedere per gradi. Dapprima possiamo chiederci l'ampiezza Aif (t) che la molecola transisca sotto l'azione di due fotoni appartenenti ambedue a modi ben determinati, supponendo che il fotone ω 1 sia assorbito al tempo t1 ed il fotone ω 2 sia emesso al tempo t2. |f> ∞ ω2 t2 t1 ω1 |i> −∞ Facciamo evolvere il sistema: otteniamo (con h / =1) |t> = [-i V E( ω 2,t 2)] I exp(i ω 2t2) [-i V A ( ω 1,t 1)] I exp(-iω 1t1)|i>, (9) dove si sono messe in evidenza le dipendenze temporali esplicite di VA,E e quelle che provengono da []I . La (9) sarebbe corretta se t1 e t2 fossero assegnati dall'esperimento; poiche' non lo sono, e i diversi valori di t1 e t2 interferiscono, dobbiamo integrare sui tempi intermedi. Una parte ∆Aif dell'ampiezza A if di arrivare allo stato |f> deriva da eventi in cui t2>t1; =337= Prof. M. Cini -Corso di Fisica Atomica e Molecolare |t> = - t t2 dt ∫ 2 ∫dt1 [VE( ω2,t2]I [VA( ω1,t1)] I exp(i ω2t2-iω1t1)|i>. (10) -∞ -∞ Il contributo all'ampiezza del processo e' <f|t>, cioe' ∆Aif (t) = t t2 = - ∫dt2 ∫dt1<f| [VE( ω 2,t 2)] I [VA ( ω 1,t 1)] I |i> exp(i ω 2t2-i ω 1t1); (11) -∞ -∞ il fattore 1/2 che compare nella formula del 20 ordine qui non figura, perche' gli estremi di integrazione sono diversi. Sviluppando i calcoli, si ha t t2 ∆Aif (t)= - ∫dt2 ∫dt1<f| e iHt 2VE( ω 2)e -i(H-ω 2)t 2 • -∞ -∞ •eiHt 1VA ( ω 1) -i(H+ω 1)t 1 |i> = t t2 = - ∫dt2 ∫dt1<f| VE( ω 2)e -i(H-E f - ω 2)t 2 • -∞ -∞ •ei(H-E i - ω 1)t 1 VA ( ω 1)|i> . (12) Eseguiamo l'integrale in t1, dando una crescita infinitesima all'integrando: t2 exp[ixt2 ] . ∫dt1 exp[ ixt1] = ix -∞ (13) Cosi' ∆Aif (t)= - t ∫dt2 <f| VE( ω2)e -i(H-E f - ω 2)t2 • -∞ -i •ei(H-E i - ω 1)t 2 V ( ω )|i> [H-Ei - ω 1-i0] A 1 =- t ∫dt2 e-i(- Ef - ω 2)t2 +i(- E i - ω 1)t2 -∞ •<f| VE( ω 2) -i V ( ω )|i> = [H-Ei - ω 1-i0] A 1 =338= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = - e i(Ef +ω 2-E i - ω 1)t -i [Ef -Ei +ω 2- ω 1-i0] -i •<f| VE( ω 2) V ( ω )|i> . [H-Ei - ω 1-i0] A 1 (14) Ma nello stato intermedio fra |i> ed |f> il sistema non ha energia definita. Cosi', per quanto sia contrario alla intuizione classica, dobbiamo considerare anche il seguente processo, che conduce allo stesso stato finale: |f> ∞ t1 ω1 ω2 t2 |i> −∞ il contributo e', analogamente, t t1 - ∫dt1 ∫dt2<f| e iHt 1VA ( ω 1)e -i(H-ω 1)t 1 eiHt 2VE( ω 2) -i(H-ω 2)t 2 |i> = -∞ -∞ t -i - ∫dt1 ei(Ef - ω 1)t 1 +i(-Ei +ω 2)t 1<f| VA ( ω 1) VE( ω 2)|i> = [H-E + ω -i0] i 2 -∞ =- e i(Ef +ω 2-E i - ω 1)t -i [Ef -Ei +ω 2- ω 1-i0] •<f| VA ( ω 1) -i V ( ω )|i> . [H-Ei +ω 2-i0] E 2 (15) Si noti che il fattore di fase ed il denominatore della frazione fuori dell'elemento di matrice sono tornate come prima. Cosi' le due ampiezze parziali si sommano, dando l'ampiezza totale =339= Prof. M. Cini -Corso di Fisica Atomica e Molecolare -i Aif (t) = - ei(Ef +ω 2-E i - ω 1)t • [Ef -Ei +ω 2- ω 1-i0] -i { <f| VE( ω 2) V ( ω )|i> + [H-Ei - ω 1-i0] A 1 -i +<f| VA ( ω 1) V ( ω )|i>} . [H-Ei +ω 2-i0] E 2 (16) Lo stesso risultato si ottiene dalla espansione formale del Capitolo 2. Nella rappresentazione di interazione, l'operatore di evoluzione temporale e' t -i U(t,t0) = P exp[ dt1 H'I (t 1)] , / h t0 ∫ con H' I (t 1)= eiHt 1 H'(t1)e -iHt 1. La correzione di secondo ordine alla funzione d'onda ψ del sistema materiale e' ψ(2)(t) = 1 -i 2 ( ) 2! h / t dt1 ∫ t0 t dt2 P[H' I (t 1) H'I (t 2)] ψ(t 0), ∫ t0 dove P ordina i tempi precedenti a destra, t0 → - ∞ e ψ(t 0) = |i>. Usando queste formule avremmo potuto ottenere i risultati in modo piu' automatico, ma abbiamo preferito rendere piu' intuitivo il significato fisico delle integrazioni e degli ordinamenti temporali. Il fotone ω 1 e' acceso adiabaticamente, e quindi Aif ha una crescita esponenziale infinitesima nel tempo. Sia x = Ef - Ei +ω 2 - ω 1 ; eηt e2ηt Aif ∝ ⇒ Pif = |Aif |2 ∝ 2 , η→ +0. (17) x - iη x + η2 Pif e' la frazione del numero totale di sistemi che ha transito al tempo t. La probabilita' di transizione per unita' di tempo e' quindi 2η e 2ηt dPif ∝ 2 dt x + η2 → 2πδ(x) , per η→ +0. (18) Ovviamente, δ( Ef - Ei +ω 2 - ω 1) esprime la conservazione dell'energia; nel formalismo della risposta quadratica tale fattore emerge in modo naturale ed elegante, e non deve esservi messo quasi a forza come nel formalismo elementare. Densita' di stati finali per il fotone ω 2. L'esperimento misura l'energia ω 2 del fotone emesso ed inoltre determina la sua direzione entro un dato dΩ2 ( l' apertura dell'ottica dello strumento). Invece, Pif si riferisce ad un fotone con (k, ω ) =340= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dPif su tutti i fotoni con ω 2 = Ei dt + ω 1 - Ef , e con k entro dΩ2. La somma e' la densita' di stati determinato. Si deve percio' sommare VdΩ2 δ( ω 2-|k 2|) = k 2dk2δ( ω 2-k 2) = (2π) 3∫ 2 k i n d Ω2 ∑ dρ( ω 2) ≡ VdΩ2 ω 2. (19) (2π) 3 2 Il campo ω 1 e' normalizzato a 1 fotone nel volume V, che noi poi prenderemo come volume unitario. La probabilita' per unita' di tempo di osservare il fotone ω 2 in dΩ2 e' la sezione d'urto differenziale = dσif= 2π|<f| VE ( ω2) [H-E --iω -i0] V A ( ω1)|i> + i 1 + <f| VA ( ω1) -i V ( ω )|i>|2dρ(ω2). [H-Ei +ω2-i0] E 2 Ricordando che VA = -i scrivere ω1ω23 d Ω2 dσif =|M| 2 h2c 4 / 2π ω 1 1d, VE = i 2π ω 2 , (20) 2d, possiamo (21) avendo rimesso a posto i fattori h / e c; l'elemento di matrice -i M = <f| ( 2d) [H-E - ω -i0] ( i 1 1d) |i> + -i + <f|( 1d) ( d) |i> [H-Ei +ω2-i0] 2 , (22) riflette l'evoluzione del sistema nello stato intermedio virtuale. Nel secondo denominatore possiamo eliminare ω 2 in favore di ω 1 giacche' ω2 - Ei = ω1 -Ef . Allora, introducendo un set completo di autostati esatti |n> della molecola, otteniamo M= ∑[ n ( 2df n ) ( 1dni ) [ωni - ω1] + ( 1df n ) ( 2dni ) [ωnf+ω1] ] a condizione che ω1 sia diverso da tutte le frequenze proprie ωni della molecola imperturbata. Il caso risonante merita una trattazione a parte (Capitolo 17). Esplicitiamo le componenti cartesiane e scriviamo =341= Prof. M. Cini -Corso di Fisica Atomica e Molecolare M≡ ∑ pq R pq ( ε2) p( ε1) q , (23) dove compaiono le componenti del tensore Raman, Rp q = ∑[ n <f|dp|n><n|dq|i> <f|dq|n><n|dp|i> + [ω ni - ω 1] [ω n f +ω 1] ] . (24) Questi risultati sono dovuti a Kramers e Heisenberg. Nel caso f≡i, il tensore descrive lo scattering di Rayleigh, mentre il nome di Raman e' tradizionalmente associato alla diffusione anelastica. Quando ω 1 > ω 2, allora Ef >Ei e la transizione Raman si dice di Stokes, nel caso contrario il sistema ha ceduto energia e la transizione e' di Anti-Stokes. Perche' R non si annulli identicamente in sistemi di parita' definita occorre che |i> ed |f> siano della stessa parita'. Vediamo brevemente altre conseguenze fisiche della (24): SPETTROSCOPIA VIBRAZIONALE- Come sappiamo, nelle molecole centrosimmetriche i modi Raman-attivi sono inattivi in infrarosso, e viceversa. ↔ SCATTERING A BASSE FREQUENZE- Per ω 1→0, R ha un limite finito. Pertanto, la sezione d'urto va con ω 1ω 23 e lo scattering elastico va con la quarta potenza di ω . Abbiamo gia' accennato nel Capitolo 6 alla importanza astronomica delle onde radio, che ci permettono di osservare regioni otticamente invisibili. SCATTERING AD ALTE FREQUENZE ( o di Thomson)- Supponiamo ω 1 ↔ grande rispetto a tutte le frequenze importanti per R . Allora, inserendo nella (26) l'espansione 1 1 ω ni 1 1 ω nf ≈-ω + ⋅⋅ , cioe' ≈+ω + ⋅⋅, 2 ωni - ω1 1 ω1 ωnf+ω1 1 ω 12 si trova ∑ [-<f|d p|n><n|dq|i> + <f|d q|n><n|dp|i>] n Rpq ≈ ω 1 - ∑ ω ni <f|dp|n><n|dq| i > + ω n f <f|dq|n><n|dp|i>] n ω12 + ... (25) Ma nel primo termine eseguiamo la somma su n e troviamo 0. Nel secondo, consideriamo che d ωni <n|dq|i> = <n| [H,dq]- |i> = -i <n| dt dq|i>, =342= Prof. M. Cini -Corso di Fisica Atomica e Molecolare d ωn f <f|dq|n> = - ωf n <f|dq|n> = i <f| dt dq|n>, e concludiamo con Rpq = = i i d d ∑ [<f | dp|n><n| dt dq|i> - <f| dt dq|n><n|dp|i>] = ω12 n ω12[<f d d | dp dq - ( d )d |i>] . dt dt q p Ora, per un singolo elettrone, [d p, elettroni , d = (26) d e2i dq ]- = δ . Qui abbiamo N dt m pq N ∑eri ; poiche' le coordinate di ciascun elettrone 1 commutano con quelle di tutti gli altri, si ottiene N volte lo stesso risultato; quindi d Nie2 [dp, dq ]- = δ . (27) dt m pq In definitiva, viene -Ne2 Rpq = <f|i> δpq , mω 12 ω1→∞ . (28) Non c'e' scattering Raman. Per quello elastico, si ottiene dσ = | ω 4dΩ2 Ne2 2 1 δ ( ε ) ( ε ) | = pq 2 p 1 q mω 12 c4 e2 2 = N2 [ ] | 2⋅ 1|2dΩ2. mc 2 (29) e2 Usando il raggio classico dell'elettrone, re = [ ] , scriviamo mc 2 dσ = N2 re2 | 2⋅ 1|2dΩ2. Sia ora θ l'angolo fra le direzioni di k2 e di 1. Il fotone 2 puo' essere preso polarizzato con 2 nel piano individuato da 1 e k2 o polarizzato con 2 normale a questo piano. Ma in quest'ultimo caso, 2⋅ 1=0 . Cosi', sommando sulle polarizzazioni del fotone finale, rimane il contributo di 2 nel piano. =343= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Piano ε1 α ε1k 2 ε2 θ k1 k2 Allora, θ = α + π/2, dove α e' l'angolo fra i due vettori di polarizzazione; | 2⋅ 1|2 = cos2α = sin2θ. Si ottiene cosi' in questo limite la classica formula di Thomson dσ = N2 re2 sin2θ dΩ2. 14-2 Generazione di seconda armonica Abbiamo gia' accennato all'ottica non lineare parlando dei metodi per misurare il Lamb shift, ed altri piccoli effetti di QED; adesso vogliamo entrare nel merito dei meccanismi che producono gli effetti non lineari. Se i campi della radiazione sono deboli rispetto a quelli che si trovano nello stato fondamentale di un sistema, l'emissione di radiazione di frequenza diversa da quella incidente e' molto debole, e puo' essere descritta perturbativamente. Con lo stesso metodo che abbiamo usato per l'effetto Raman, possiamo calcolare l'ampiezza di probabilita' di assorbire due fotoni di frequenza ω 1 e ω 2 ed emettere un fotone di frequenza ω 3. All'ordine piu' basso contribuiscono 3! ordinamenti temporali e quindi 6 diagrammi. Ecco il primo: =344= Prof. M. Cini -Corso di Fisica Atomica e Molecolare t |f> ω 3 t3 t2 ω 2 ω 1 t1 -∞ |i> Sviluppando i calcoli, si trova l'ampiezza B =X(ω1,ω2) + X(ω2,ω1) , (1) dove, in notazione ovvia, con f(n) distribuzione di Fermi , autovalori a particella singola εn , e ωrs =ε(r)-ε(s), X(ω1,ω2) = [VE(ω3)] sn [VA (ω2)] n r [VA (ω1)] rs + ∑ f(s) ∑ [1-f(n)]∑ [1-f(r)]{ (ωrs -ω1-i0)(ωns -ω1-ω2-i0) s n r [VA (ω2)] sn [VE(ω3)] n r [VA (ω1)] rs [VA (ω2)] sn [VA (ω1)] n r [VE(ω3)] rs + }(ωrs -ω1-i0)(ω3-ω1+ωns -i0) (ω3+ωrs -i0)(ω3-ω1+ωns -i0) [VE(ω3)] mn [VA (ω2)] sm[VA (ω1)] ns + ∑ f(s) ∑ [1-f(n)] ∑ f(m){ (ωns -ω1-i0)(ωnm -ω1-ω2-i0) s n m [VA (ω2)] mn [VE(ω3)] sm[VA (ω1)] ns [VA (ω2)] mn [VA (ω1)] sm[VE(ω3)] ns + }. (ωns -ω1-i0)(ω3-ω1-ωmn -i0) (ω3+ωns -i0)(ω3-ω1-ωmn -i0) (2) La probabilita' di transizione e' proporzionale a σ = δ(ω3-ω1-ω2)|B{V E;VA }|2. =345= (3) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Questa espressione per l'ampiezza B e' il punto di partenza di recenti calcoli di spettri di seconda armonica da interfacce di semiconduttori 1. In tali sistemi, la risposta in seconda armonica puo' facilmente essere piu' piccola del flusso di energia incidente di 15 ordini di grandezza o piu'; questo non ne impedisce tuttavia l'osservazione. Nei problemi atomici e molecolari, dove i fotoni non vengono schermati da alcun mezzo, la formulazione descritta e' equivalente ad una piu' tradizionale2 basata sul calcolo della suscettivita' di second'ordine χ (2). In effetti, per i problemi che riguardano la materia condensata, ci si deve preoccupare anche di descrivere la propagazione dei fotoni entranti ed uscenti, il che e' stato fatto ma esula da questo lavoro. Con un formalismo analogo a quello di questo paragrafo e' possibile studiare altri effetti non lineari, come il decadimento a due fotoni dello stato 2s dell'atomo di H. Nel seguito, ci occuperemo degli effetti a molti fotoni che hanno luogo quando i campi incidenti sono cosi' intensi da non poter essere inclusi considerando diagrammi di ordine basso. 14-3 Modo efficace Quando la luce incidente sul campione e' monocromatica, come nel caso di un fascio laser, possiamo schematizzare il problema come se fosse composta di fotoni tutti identici. Consideriamo infatti un sistema elettronico che interagisce con un campo di radiazione. In generale, possiamo considerare parecchi elettroni interagenti fra loro e descritti da un hamiltoniano He; sia N→∞ la dimensionalita' dello spazio di Hilbert, e |i> un set di base, i=1,..N. Supponiamo di avere M modi di frequenza ω e polarizzazione nel fascio laser. Per ogni modo, c'e' nell'hamiltoniano un termine di accoppiamento con la materia , H' k = ∑ ∑ σ M (k) mn a† mσan σ(b k +b† k ), m≠n dove nell'approssimazione di dipolo (1) 1M. Cini, Phys. Rev. B43, 4792 (1991); M.Cini , R. Del Sole , Jang Guo Ping and L. Reining, "CALCULATION OF THE LINEAR AND NONLINEAR OPTICAL PROPERTIES OF Si(111)1x1-As", Proceedings of the Epioptic meeting, Berlin , June 1991. 2Y.R.Shen,"The principles of Nonlinear Optics", John Wiley & Sons, New York (1984) =346= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e e (k) M(k) mn = <m|A(k) P|n>= A <m| P|n>; (2) mc mc quindi, H'k si fattorizza nella forma H' k =A(k) L(bk +b† k ), (3) dove L opera sugli elettroni ma non sui fotoni. La parte di hamiltoniana che descrive il campo e la sua interazione e' M H= ∑ { ω bk † bk + A(k) L(bk +b† k )}. (4) k Con una rotazione reale α mk nello spazio vettoriale dei modi, tale che α mk α nk =δmn, possiamo passare a nuovi operatori d: ∑ k ∑ A (k) ∑ α mk dm; k m A (k) bk = il vettore ruotato ∑ k (5) A (k) α mk ha la stessa "lunghezza" di quello ∑ A(k)2. k Prendiamolo lungo il primo asse coordinato; allora originale, ||A||= ∑ A (k) α mk = ||A|| δm1, (6) k e H diventa H= h / ω ∑ dm† dm + ||A|| L(d1+d1† ). (7) m Possiamo sempre sostituire M modi con accoppiamenti A(k) con un modo efficace con accoppiamento ||A||. Per un singolo modo nel volume di normalizzazione (arbitrario) V , 2πh / A= c eikr-iω t, (8) Vω quindi 2πh / A(k) =c , Vω 2πh /c2 2πh /c2 V = ∆(3) k, ∑ Vω Vω (2π) 3 k ||A||2 = dove ∆(3) k e' la larghezza del fascio laser nello spazio k. Di fatto, =347= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∆(3) k e' l'inverso del volume su cui il fascio laser e' coerente. In altri (2π) 3 termini, possiamo lavorare con un unico modo efficace purche' prendiamo V uguale al volume di coerenza. 14-4 Diffusione di luce coerente Nei processi di diffusione possiamo supporre che il campo libero ha 2 modi, di pulsazioni ω0 e ω0', ed e' descritto dall'hamiltoniana H ph =ω0b† b+ω0'b' † b' ; (1) qui b distrugge fotoni ω0 del laser mentre b' distrugge fotoni diffusi. I termini di interazione sono H I =M(b+b † ) H I '= M'(b'+b'† ), (2) (3) dove M e M' sono operatori sui gradi di liberta' elettronici. Cosi' H=H e+H ph +H I +H I ', (4) I fotoni del laser appartengono a un solo modo e sono in uno stato coerente tale che b|c>=β|c> (5) cioe' d|c>=0 con d=b-β. Abbiamo incontrato uno stato simile nel Capitolo 13.4, dove volevamo descrivere le vibrazioni molecolari nello stato finale della fotoemissione. Nel caso della luce laser, il valore di β e' estremamente variabile: puo' essere ≈104 per laser in continua, ma anche ≈108 o molto di piu' per laser pulsati (con impulsi dell'ordine di qualche decina di nanosecondi). Nella rappresentazione d, ~ ~ ~ ~ H = H e+ H ph +H I + H' I , (6) dove, prendendo per semplicita' β reale, ~ H e = H e + ω0β 2 +2βM ~ ~ H I = [ω0β + M](d+d † )=M (d+d† ). (7) (8) Inizialmente il sistema e' nello stato |1;0>=|1>|0>, dove |1> denota lo stato iniziale elettronico (di solito lo stato fondamentale).e |0> e' il vuoto per i fotoni d e b'. =348= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Lo spettro della luce diffusa S(ω0') e' proporzionale alla rate di emissione dei fotoni b'. Invece di derivare una espressione formale della rate1, vedremo un caso speciale e lo discuteremo con un approccio semplice, ma ben motivato fisicamente. 14-5 Fenomeni a molti fotoni: Effetto Stark dinamico Se un campo coerente e' in risonanza con un sistema a due livelli, la radiazione diffusa si scinde in tre componenti, donde il nome "Effetto Stark dinamico". Sperimentalmente, l'effetto fu messo in chiara evidenza da Shuda et al.2, usando un dye laser e un fascio di atomi di Na. Gli stati iperfini che derivano dal livello fondamentale 32S1/2 sono separati da 1772 MHz, e quelli che derivano dal livello eccitato 2P3/2 da 60MHz. Le transizioni che partono dal livello iperfine F=2 del livello fondamentale definiscono un sistema modello a 2 livelli ed uno a 3 livelli. F=3 F=2 2 3 P 3/2 F=2 2 3 S 1/2 F=1 sistema a 2 livelli sistema a 3 livelli Il laser fu accordato alla transizione a 5890 Å dalla componente iperfine F=2 del livello fondamentale 32S1/2 alla componente F=3 del 32P3/2 ; il laser era cosi' monocromatico che non c'era contaminazione dalla componente F=2 del 32P3/2 , e per le regole di selezione non ci poteva essere mescolamento con altri stati. Per un siffatto sistema a 2 livelli, H e=ε1n1 +ε2n2 , (1) H I =(a 1† a2+ a2† a1)g(b+b † ) (2) H I '= (a 1† a2+ a2† a1)g'(b'+b'† ); (3) 1M. Cini , A. D'Andrea and C. Verdozzi, International Journal of Modern Physics 9 No.10 p.1185 (1995) 2F. Shuda, C.R. Stroud and M. Hercher, J. Phys. B: Atom. Molec, Phys. 7, L198 (1974) =349= Prof. M. Cini -Corso di Fisica Atomica e Molecolare qui εm sono i livelli a elettroni indipendenti e nm gli operatori numero, e g e' l'elemento di matrice dell'interazione fotone-elettrone; in pratica g'=g. Passando alla rappresentazione dei d con b→d+β, H e=ε1n1 +ε2n2 →H e, (4) H I =(a 1† a2+ a2† a1)g(b+b † ) → (a 1† a2+ a2† a1)g(d+d † )+ 2gβ(a 1† a2+ a2† a1) (5) H ph = ω0b† b → ω0d† d + βω0(d+d† ) + ω0β 2. (6) ~ ~ ~ Conviene riarrangiare un po' i termini e scrivere H =H e +H I + ω0d† d, con ~ H e = ε1n1 +ε2n2 + ω0β 2 +2gβ(a 1† a2+ a2† a1) (7) ~ ~ H I = [ω0β + g(a1† a2+ a2† a1)](d+d † )=M (d+d† ). (8) Inizialmente il sistema e' nello stato a 1† |0>, dove |0> e' il vuoto per ambedue i modi d e b'. Se non ci fosse il termine in g nella (8), non ci sarebbe l'effetto Stark dinamico: i livelli 1 e 2 sarebbero interagirebbero solo per mezzo del termine in βg nella (7), ma tale interazione verrebbe solo al secondo ordine, e sarebbe proporzionale a (βg) 2. Ora, βg e' un'energia tanto piccola che potremmo in pratica trascurare la correzione: l'ordine di grandezza della separazione dei livelli nell'effetto Stark dinamico e' proprio βg. Infatti, possiamo stimare l'ordine di grandezza dell'elemento di matrice g fra i livelli atomici supponendo V≈ 1 cm 3 , n≈108. L'interazione e' 2πh /ω d (9) V dove d e' il momento di dipolo. Pertanto, in un sistema atomico, E⋅d = 2πh /ω e a0. (10) V Se caratterizziamo il laser con la densita' di energia nh /ω ρ= , V e ricordiamo che β= n, viene βg= 2πρ ea0 (11) independentemente da V. Inoltre, βg / ω e2a02 h e2 1 a03 = 2πn = 2πn( ) . h /ω V (h / ω) 2 a0 h /ω V βg e2 A frequenze ottiche, ≈h / ω e si trova ≈10 -8 . Anzi, possiamo a0 h /ω dare un limite superiore all'ordine di grandezza di g per i sistemi g≈ =350= Prof. M. Cini -Corso di Fisica Atomica e Molecolare "atomici" (inclusi atomi di Rydberg ed eccitoni 1) prendendo V= λ 3, 2πc λ= ω . Si trova gmax = /ω h 2πe2 a = / ωλ3 0 h 2πe2 a0 ( )= / ωλ λ h 2πe2ω a0 a0 ( λ )= α λ , / ω2πc h 1 e2 e' la costante di struttura fine. Poiche' h / ω≈ , 137 2a0 / α a0 a0ωh = ≈ , e in generale λ 2πch / 2π gmax α 3/2 < ≈ 5 10-5 . (12) /ω h 4π ~ In H I vi e' un termine in g ed uno in ω0β. Poiche' β >>1, g<< h / ω0β e si puo' sviluppare un modello basato sul caso limite g→0, β→ ∞ , con gβ→costante. Il limite β→ ∞ corrisponde a campi classici. Trattiamo dunque il termine in g nella (8) come una ~ perturbazione. Per g=0, diagonalizziamo H e ottenendo nuovi ~ ~ autovalori ε 1+ ω0β 2 e ε 2 +ω0β 2 ; l'hamiltoniano imperturbato (g=0) e' ~ ~ ~ ~ ~ H 0 = ε 1 n 1 + ε 2 n 2 +ω0β 2+ ω0β(d+d† ) + ω0d† d ; (13) ~ ~ poiche' n 1 e n 2 sono costanti del moto, alcuni autostati si ottengono ~ ~ ~ ~ ponendo n1 =1, n 2 =0 e gli altri con n 1 =0, n 2 =1; nei due casi, tornando agli operatori b=d+β, si ottiene l'hamiltoniano imperturbato ~ ~ h0i= ε i n i + ω0b† b. Facendo la trasformazione dai b ai d e di nuovo ai b, non abbiamo semplicemente preso il limite g →0 nell'Hamiltoniano di partenza, perche' abbiamo conservato gli effetti di ordine gβ che comportano una rinormalizzazione dei livelli. ~ ~ Gli autostati sono | i , n> ed hanno autovalori ε i +nω0. Nel caso ~ ~ risonante, |1 , n+1> e' quasi degenere con |2 , n>. dove α≈ ~ |1 , ~ |1 , ~ |1 , ~ |1 , 3> ---------2> ---------1> ---------- ~ ----------- |2 , 2> ~ ----------- |2 , 1> ~ ----------- |2 , 0> 0> ---------- 1stati eccitati dei semiconduttori in cui un elettrone e' legato ad uno ione da -e 2 , dove ε e' la costante εr dielettrica. Il loro spettro e' di tipo idrogenoide. una interazione coulombiana schermata =351= Prof. M. Cini -Corso di Fisica Atomica e Molecolare La perturbazione e' il termine che avevamo trascurato, g(a1† a2+ a2† a1)(d+d † )=g(a 1† a2+ a2† a1)(b+b† -2β). L'elemento di matrice che collega gli stati quasi degeneri e' ~ ~ <1 , n+1|g(a 1† a2+ a2† a1)(b+b† -2β)|2 , n>= = g<n+1|b† |n>= g n+1 . (14) 2 Si noti che i valori di n piu' importanti sono ≈β , ed in questo senso un alto grado di coerenza comporta un aumento dell'accoppiamento efficace fra radiazione e materia. Lo spettro perturbato al primo ~ ordine consiste dello stato fondamentale |1 , 0> e di infiniti doppietti; ~ ~ quello che origina da |1 , n+1> e da |2 , n> ha una separazione 2g n+1 ~ ~ |1 n+1>±|2 n > e consta degli stati . 2 Calcoliamo lo spettro di emissione spontanea fra gli autostati perturbati. La probabilita' dell'emissione spontanea e' data dal coefficiente A di Einstein, 4ω3mn Am→n = (d) mn 2 , (15) 3h /c3 ~ dove d e' il momento di dipolo. E' chiaro che d connette gli stati |2 , ~ n> con |1 , n> , con lo stesso numero di fotoni b, e quindi ci sono solo emissioni fra doppietti consecutivi, con ω ≈ω0; precisamente, le frequenze sono: ( n+1+ n ) g ( n+1- n ) g ω0 + ( - n+1+ n ) g (- n+1- n ) g ~ ~ ~ ~ |1 n+1>+|2 n> |1 n+1>-|2 n> [ → ] 2 2 ~ ~ ~ ~ |1 n+1>+|2 n> |1 n+1>-|2 n> [ → ] 2 2 ~ ~ ~ ~ |1 n+1>−|2 n> |1 n+1>+|2 n> [ → ] 2 2 ~ ~ ~ ~ |1 n+1>-|2 n> |1 n+1>+|2 n> [ → ] 2 2 . (16) Gli elementi di matrice hanno tutti lo stesso modulo, e le 4 transizioni hanno la stessa intensita', dato che sono cosi' vicine da rendere trascurabile la variazione del fattore ω3. Il sistema viene preparato in uno stato che per g→0 e' |1,c(β)>, dove c(β) e' lo stato coerente dei =352= Prof. M. Cini -Corso di Fisica Atomica e Molecolare fotoni b; ciascuno dei due sottolivelli che corrispondono a |1,n> e' 1 an occupato con probabilita' e-a ( ), dove a=β 2. I contributi 2 n! importanti vengono da n≈ β e lo spettro avra' quindi un massimo attorno a ω0, dovuto alle due transizioni centrali non risolte, ed altri due a ω≈ω0±2gβ. Il picco centrale puo' essere approssimato con una lorentziana normalizzata a 1/2 dell'intensita' totale, la cui semilarghezza ∆ potra' dipendere dal tempo di vita dello stato eccitato e dal potere risolutivo degli strumenti. La forma dei picchi ω-ω0 laterali si puo' ottenere ponendo x= , e calcolando 2g e-a ∞ an |x| -a ∞ an {δ(x- n)+δ(x+ n)} ≈ e ∑ δ(x 2-n); ∑ 4 n! 2 n! n=0 n=0 per g piccolo, usando il teorema del Capitolo 13.4 lim a>>1; aω 02 finito { e-a ∑ ∞ n=0 an δ(ζ-nω0) }= (n!) (17) 2π (ζ-aω0) 2 exp{} aω02 2aω02 possiamo approssimare la forma dello spettro con ∆ 2π 2π |x| -(x 2-a)2 S(x) ≈ exp{ }+ 2 . (18) 2 a 2a ∆ +(2gβx) 2 Aumentando a, i massimi laterali diventano sempre piu' stretti e i loro massimi si avvicinano a x= ±β. Per comodita' grafica prenderemo a=30, ∆ =g/2 : si ottiene il grafico seguente dell'intensita' in funzione di x/β: =353= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Nell'esperimento di Shuda et al. , la separazione fra il picco centrale e quelli laterali e' ≈2gβ ≈ 100 Mhz e la transizione ha λ=5890Å, che gβ corrisponde a ≈ 5 1014 Hz, e si ha ω0 ≈10-8 . Cio' corrisponde a β= 104 e g=10-12ω0. Capitolo 15- Correzioni relativistiche per sistemi a molti elettroni Per comprendere in una descrizione coerente gli effetti a molti corpi e quelli relativistici, dovremo sviluppare metodi piu' potenti. La Relativita' ci spinge a riconsiderare la stessa interazione coulombiana. 15-1 Propagatori1 Definiamo i propagatori delle particelle, che useremo nelle espansioni perturbative nelle teorie sia relativistiche che non. 1-Elettroni di Pauli Supponiamo di avere un sistema di elettroni non interagenti di Hamiltoniano H 0. Usiamo la seconda quantizzazione, con ca† che crea un elettrone in uno stato a particella singola a, e la rappresentazione di Heisenberg, c a(t) = exp(iH0t)c aexp(-iH0t). (1) Come sappiamo s T[ca(t)c b† (0)] = [ca(t)c b† (0)]θ(t)-[c b† (0)c a(t)]θ(-t). Il propagatore e' definito da G0(a,b,t)= -i<T[ca(t)c b† (0)]>, (2) dove la media e' presa rispetto allo stato fondamentale. Per un sistema vuoto, rimane solo la parte in θ(t), e il propagatore si riduce alla funzione di Green ritardata, che abbiamo gia' incontrato. Piu' in generale, gli stati saranno occupati fino al livello di Fermi, e si potranno propagare sia elettroni che lacune. Per t>0, un elettrone e' aggiunto al sistema nello stato b al tempo 0 e annichilato nello stato a al tempo t; per t<0 una buca e' introdotta nel sistema e poi annichilata al tempo 0; in ambedue i casi, G0 descrive l'ampiezza di propagarsi dallo stato b allo stato a nel tempo t. Supponiamo di aver diagonalizzato H0 , ottenendo autostati a particella singola |k> ed autovalori εk . Lo stato fondamentale e' un 1Vedere anche il Sakurai,"Advanced Quantum Mechanics", Cap.4; Berestetskii et al. "Relativistic Quantum Mechanics" Vol.4 Cap.8 =354= Prof. M. Cini -Corso di Fisica Atomica e Molecolare determinante singolo costruito con questi spin-orbitali, H0=∑ εi ni e i d dall'equazione del moto i A = [A,H], si ha ck (t)=c k e-iε k t. Dalla dt 0 definizione segue che G e' diagonale sulla base degli autostati, e G0(k,k',t) = =δ(k,k'){-i[1-nk ] exp(-iεk t)θ(t)+i n k exp(-iεk t)θ(-t)}, (3) dove nk =1 per stati occupati, n k =0 per stati vuoti. Cosi' iG0 si evolve con il fattore di fase exp(-iεk t) come gli autostati, ma ha una discontinuita' unitaria per t=0; pertanto, soddisfa ∂ i G0(k,k',t) = εk G0(k,k',t) + δkk' δ(t) (4) ∂t ed e' la funzione di Green dell'equazione di Schro"dinger. Questo risultato utile e' dovuto alla definizione di T . La componente di Fourier a frequenza ω e' data da G0(k,k',ω) = ∞ ∫dtG0(k,k',t)eiω t= -∞ δkk' ≡ δ kk' G0(k,ω) , (5) ω-εk + i ηk con ηk =+0 per stati vuoti, ηk =-0 per stati pieni. Infatti, con δ=+0, = ∞ =- i ∫dtei(ω−ε k )t-δt = ω-εk +iδ iG0(k,ω)= 0 0 ∫dtei(ω−ε k )t+δt = -∞ i ω-εk -iδ , nk =0 , nk =1. (6) Cosi' per ηa>0 si ha un elettrone, e per ηa<0 si ha una buca. 2-Il Fotone Consideriamo ora un campo bosonico φk (t) che obbedisce all'equazione d'onda ∂2 φ (t) =-εk 2φk (t) . (7) ∂t2 k Ad esempio, se εk =ck questa e' proprio l'equazione delle onde ∂2 ∂2 2 2 [ 2 +c k ] φk (t) = [ 2 -c 2∇ 2] φk (t)=0. ∂t ∂t In seconda quantizzazione si ha l'operatore di campo 1 φk (t) = {ak exp[-iεk t] + ak † exp[iεk t]}. (8) 2εk I coefficienti di normalizzazione sono scelti in modo tale che l'Hamiltoniano del campo assuma la forma =355= Prof. M. Cini -Corso di Fisica Atomica e Molecolare H= ∑ h /ωk (a k † ak +1/2); (9) k il procedimento necessario e' un po' laborioso, ma standard, e noi lo abbiamo gia' usato per quantizzare il campo dei mesoni carichi (cfr. Cap. 3). Per un bosone il propagatore e' definito da Dk (t)=<P[ φk (t) φk (0)]> dove P e' l'operatore di ordinamento temporale e la media e' sul vuoto. Una definizione leggermente piu' generale e' Dk (t-t')=<P[ φk (t) φk (t')]>. (10) Dalla definizione si ha: θ(t) θ(-t) Dk (t)= <ak exp[-iεk t] ak † > + <ak ak † exp[iεk t] >= 2εk 2εk 1 = {θ(t)exp[-iεk t] +θ(-t)exp[iεk t]}. 2εk Questo e' continuo nello 0; pero': ∂Dk (t) 1 = {-iεk θ(t)exp[-iεk t] +iεk θ(-t)exp[iεk t]} ∂t 2εk e' discontinuo, e ∂2Dk (t) =-εk 2 Dk (t) -i δ(t). (11) ∂t2 Quindi, di nuovo, il propagatore e' la funzione di Green dell'equazione d'onda a cui obbedisce il campo φ. La trasformata di Fourier e' [-ω2 + εk 2] D k (ω) = -i, e -i Dk (ω) = 2 , (12) -ω + εk 2-iδ dove l'infinitesimo e' necessario affinche' questa sia la trasformata di Dk (t); potremmo verificarlo col metodo dei residui. Per una particella scalare con la legge di dispersione εk =ck quindi avremo -i Dk (ω) = 2 . -ω + c 2k 2-iδ Introducendo una notazione quadridimensionale con p=(ck,iω), -i D(p) = 2 . p -iδ Il fotone e' descritto dal quadrivettore Aµ(x), ed il propagatore e' definito da Dµν (x,x')=<0|P[Aµ(x)Aν (x')]|0> . (12) Si ottiene Dµν (x,x') = -iδµν ∫ d4p e ip(x-x') . (2π) 4 (p 2-i0) =356= (13) Prof. M. Cini -Corso di Fisica Atomica e Molecolare dov p2≡ pµpµ , p(x-x')≡pµ(x µ-x µ')≡ k.(x-x')-p 0(x 0-x' 0). Cosi' abbiamo trovato il D appropriato al caso in cui il potenziale obbedisce all'equazione delle onde: ma a quale equazione obbedisce A dipende dalla gauge. Che accade se noi, dopo aver quantizzato il campo, decidiamo di fare una trasformazione di gauge Aµ→Aµ+∂µχ, dove χ(x) e' una funzione c-number? Dµν (x-x')=<0|P[Aµ(x)Aν (x')]|0> → <0|P[Aµ(x)Aν (x')]|0> + ∂µ<0|P[χ(x)Aν (x')]|0> +∂µ<0|P[Aµ(x)χ(x')]|0> + + ∂µ∂ν <0|P[χ(x)χ(x')]|0> = =Dµν (x-x') + ∂µ∂ν P[χ(x)χ(x')], dove si e' tenuto conto che mediando un solo operatore di creazione o annichilazione si trova 0. Il risultato e' che una trasformazione di gauge cambia il propagatore, e che la sua forma piu' generale e' d4p e ip(x-x') Dµν (x,x') = -iδµν ∫ + ∂µ∂ν f(x-x'), (14) (2π) 4 (p 2-i0) dove f e' una funzione arbitraria. In termini di trasformate, δµν Dµν (p) = -i 2 + pµpν f(p). (p -i0) i Ad esempio, scegliendo f(p)= 4 si trova p 1 pµpν Dµν (p) = -i 2 [ δµν ]. (15) (p -i0) p2 Questo tensore e' il propagatore nella gauge di Landau e gode della proprieta' che 1 pµpν pµDµν (p) =-i 2 [ pν -pµ 2 ]=0. (p -i0) p Cio' e' appropriato se A µ e' nella gauge di Lorentz pµAµ=0. 3- Funzione di Green per l'equazione di Dirac Possiamo convertire l'equazione di Dirac per una particella in un campo elettromagnetico ( γµ∂µ +m)Ψ(x) =ieγµAµ(x)Ψ(x) in una equazione integrale con la nota tecnica delle funzioni di Green. Data la soluzione G(x,x') del problema ( γµ∂µ +m)G(x,x') =-iδ(4) (x-x') possiamo scrivere Ψ(x)= Ψ 0(x) - ∫ G(x,x')e γµAµ(x')Ψ(x')d(4) x', (16) dove Ψ 0(x) e' una soluzione dell'equazione di Dirac senza campi, e contiene l'informazione sulle condizioni al contorno, e G e' una matrice 4X4. L'equazione integrale e' una soluzione solo formale, ma ha il duplice vantaggio di contenere le condizioni al contorno e di prestarsi ad una soluzione iterativa (serie di Von Neumann). Per trovare G, introduciamo le trasformate di Fourier quadridimensionali: =357= Prof. M. Cini -Corso di Fisica Atomica e Molecolare G(x,x')= ∫ G(p) e ip(x-x') d4p , (2π) 4 e cioe' Gαβ(x,x')= ∫ G αβ(p) eip(x-x') d4p ; (2π) 4 si trova che G(p) deve soddisfare (i γ.p +m) G(p) =-i. Pertanto, in termini di una inversione di matrice 4x4, G(p) = -i . ( i γ. p + m ) Questa si puo' "razionalizzare": infatti (γ.p)(γ.p)= γµpµγν pν = 1 = [γµ, γν ]+pµpν = p2 , 2 e cosi' -iγ.p +m -i γ.p +m = -i . (17) (-iγ.p +m)(i γ. p + m ) m 2+p2 Al denominatore c'e' p 2+m2 = p2 +m2-p02. Quindi, l'integrale per G(x,x') ha poli per p0=±E, dove E= p2+m2 ed il risultato per G(x,x') e' ambiguo finche' non specifichiamo il percorso di integrazione nel piano complesso. Il fatto che la funzione di Green non sia unica non e' una novita'. Quando in fisica classica o nei problemi di scattering in meccanica quantistica non relativistica si considera la funzione di Green G(r) dell'equazione delle onde, che soddisfa ∇ 2G + k2 G = δ(r), la si deve scegliere in base alle condizioni al contorno. Nei problemi di diffusione di una particella da un centro, si prende 1 eikr G= , che rappresenta onde uscenti. Il complesso 4π r coniugato sarebbe anch'esso una funzione di Green, ma rappresenterebbe onde entranti. L'interazione col campo elettromagnetico e' data da G(p)= -i _ Hint = -ie Ψ γµ ΨΑ µ , e nell'espansione perturbativa compare il propagatore di Feynman G(x,x') definito dal bispinore _ Gαβ(x,x')= <0|T[Ψ α (x)Ψ β (x')]|0>= _ _ =<0|Ψ α (x)Ψ β (x')|0>Θ(t-t') - <0|Ψ β (x')Ψ α (x)|0>Θ(t'-t ) (18) dove |0> e' il vuoto. =358= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per vedere che G e' una funzione di Green, espandiamo Ψ sulla base delle autosoluzioni dell'equazione di Dirac, 4 Ψ(r,t) = ∑ ∑ c s(k)u s(k)exp[-iωs(k)t] e ik ⋅r . k s=1 E' utile notare che l'anticommutatore a tempi uguali e' [Ψ † (r,t),Ψ(r',t)]+= = ∑ ∑ [ c s'† (k'),c s(k)] +us'† (k')u s(k)e ik ⋅r -ik'r' exp[-i(ωs(k)- ks k's' ωs'(k'))t] = ∑ ∑ ks k's' = ∑ δss'δkk' us'† (k')u s(k)e ik ⋅r -ik'r' exp[-i(ωs(k)-ωs'(k'))t] = u s† (k)u s(k)e ik ⋅r -ikr' = ∑ e ik ⋅r -ikr' =δ(3) (r-r'); ks k inoltre, [Ψ s† (r,t),Ψ s'(r',t)]+= δss' δ(3)(r-r'). Verifichiamo dunque che G e' una funzione di Green. ∂ ∑ [( γµ) αβ ∂x + m δαβ] Gβγ (x,x') = µ β ∂ = ∑ [( ) αβ ⋅∇ +( γ4) αβ + m δαβ] Gβγ (x,x') = ∂x4 β ∂ _ 1 = ∑ [( ) αβ ⋅∇ + ( γ4) αβ + m δαβ] [<0|Ψ β(x)Ψ γ (x')|0>Θ(t-t') ic ∂t β _ -<0|Ψ γ (x')Ψ β(x)|0>Θ(t'-t )]. Si ha un contributo nullo dai singoli pezzi analitici (Ψ soddisfa l'equazione di Dirac); derivando le θ si ha (c=1) _ _ =-i ∑ ( γ4) αβ δ(t-t') {<0|Ψ β(r,t)Ψ γ (r',t)|0>+<0|Ψ γ β (r',t)Ψ β(r,t)|0>}. _ Ora, Ψ γ =Ψ † γ ( γ4) γ γ , , mentre ∑ ( γ4) αβ Ψ β = ( γ4) αα Ψ α ; cosi' rimane β -i ( γ4) αα ( γ4) γ γ δ(t-t') {<0|Ψ α (r,t)Ψ γ † (r',t)|0>+<0|Ψ γ † (r',t)Ψ β(r,t)|0>}= =-i (γ4) αα ( γ4) γ γ δ(t-t') δα γ δ(3) (r-r')= -iδα γ δ(4) (x-x'). Vediamo a quali condizioni al contorno obbedisce _ Gαβ(x,x')= <0|T[Ψ α (x)Ψ β (x')]|0>= _ _ =<0|Ψ α (x)Ψ β (x')|0>Θ(t-t') - <0|Ψ β (x')Ψ α (x)|0>Θ(t'-t ). =359= Prof. M. Cini -Corso di Fisica Atomica e Molecolare _ Il primo termine descrive uno stato a un elettrone Ψ β (x')|0> creato nel vuoto: e' quindi un elettrone di energia positiva, che si propaga da t' al tempo successivo t. Il secondo rappresenta un elettrone di energia negativa (altrimenti Ψ α (x)|0>=0) che pero' si _ propaga indietro nel tempo, essendo creato da Ψ β (x') dopo la sua annichilazione. Il propagatore di Feynman corrisponde alla scelta seguente: -iγ.p +m G(p)= , ε→+0. (19) i[m 2+p2-iε] Consideriamo un elettrone di energia ω =E positiva: il suo fattore di fase temporale e' e-iEt . Se vogliamo descrivere la sua propagazione da t=0 a t=∞ dobbiamo scriverlo e- i E t - δt =e- i ( E - i δ) t , dove δ=+0 e' un fattore di convergenza per tempi grandi positivi. Il polo deve essere in realta' per p 0= E-iδ, e trovarsi sotto l'asse reale. Per un elettrone di energia negativa -E, il fattore di fase e' eiEt . Volendolo propagare fino a tempi grandi e negativi, dobbiamo interpretarlo eiEt+δt = ei(E-iδ)t; questo corrisponde a un polo a p0 = -E+i δ , cioe' sopra l'asse reale. Allora (p0-E+iδ) (p 0+E-iδ)≈p02-E 2 +2iδE = p02- p2-m 2 +2iδE =-(p2+m2-iε ), e si vede che il propagatore di Feynman fa' proprio questo. 15-2 Il "Mo /ller scattering" e l'interazione di Breit fra gli elettroni Due elettroni non relativistici, nella teoria di Schro"dinger-Pauli, interagiscono Coulombianamente con l'Hamiltoniano e2 VC= . (1) r12 Noi non possiamo osservare direttamente V C, ma possiamo determinarlo con esperimenti di diffusione, preparando gli elettroni in stati di impulso ben definito. Se lo stato iniziale |i> dei due elettroni al tempo t ⇒ - ∞ e' un determinante di Slater di onde piane di impulsi PA e PB , al tempo t ⇒ +∞ il loro stato |f> sara' un determinante di Slater di onde piane di impulsi PC e PD. La funzione d'onda |i(t)> che per t ⇒ - ∞ coincide con |i> contiene |f> con l'ampiezza c(f,t) =<f|i(t)>. La ben nota teoria delle perturbazioni dipendenti dal tempo fornisce una espansione di c(f,t) in potenze di H C. L'ampiezza di diffusione e' il limite per t ⇒ +∞ di c(f,t). Essa si ottiene al primo ordine nella "Schro"dinger picture" risolvendo __dc(f,t) i h = <f| VC|i> exp(iωif t). dt Poiche' la perturbazione in realta' non dipende dal tempo, l'ampiezza di diffusione risulta proporzionale a δ(ωif ). La dipendenza dagli impulsi e' data, con notazione ovvia, dal fattore =360= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e2 e2 |CD> - <AB| |DC>. (2) r12 r12 La distribuzione angolare degli elettroni diffusi e' in accordo con la legge di Coulomb (1) solo per energie cosi' basse da rendere trascurabili tutti gli effetti relativistici, compresi quelli magnetici: a rigore, l'elettrostatica descrive adeguatamente solo l'interazione fra cariche ferme. In una descrizione quantistica e relativistica, gli elettroni non interagiscono attraverso un potenziale istantaneo, ma si scambiano fotoni virtuali. Di conseguenza, nella teoria piu' completa, non vi e' interazione al primo ordine: lo scambio di un solo fotone, che corrisponde all'ordine piu' basso, appartiene al secondo. Ancora una volta, saremo costretti a rivedere l'impianto concettuale della teoria. E' opportuno anticipare come si esce da questo problema. Una volta calcolata l'ampiezza di diffusione con una teoria relativistica, risultera' possibile interpretarla approssimativamente come se fosse dovuta ad un potenziale efficace fra gli elettroni. L'approssimazione consiste in una descrizione semi-classica del campo; il potenziale efficace ritardato che ne risulta generalizza l'interazione Coulombiana. Nella teoria relativistica consideriamo uno stato iniziale |i> con due elettroni di Dirac ma senza fotoni ed uno stato finale |f> che puo' differire da |i> per i quadrimomenti degli elettroni. Calcoliamo l'ampiezza di diffusione come elemento <f|S|i> della matrice S definita da <f| VC|i> = <AB| S = U(-∞ , ∞ ). (3) Qui U(t,t0) e' l'operatore di evoluzione temporale fra t0 e t -i t U(t,t o)= P exp[ __ ∫dt'VI (t') ] h t (4) 0 con P = operatore cronologico che ordina tempi precedenti a destra e VI (t)= exp(iH0t)V(t) exp(-iH0t) (5) e' la perturbazione scritta nella interaction picture. In questo problema V e' l'accoppiamento elettrone-campo, che scriveremo nella forma V(t) = - ∫J µ(x)Aµ(x) d 3r (6) _ _ dove al solito x ≡(r, ict) ; la corrente e' Jµ = c Ψ γµ Ψ, dove Ψ =Ψ +γ4. Gli spinori Ψ sono da interpretare, in realta' come operatori di =361= Prof. M. Cini -Corso di Fisica Atomica e Molecolare campo; per evitare di confonderli con gli stati a particella singola li scriveremo Ψ op. Espandendoli in autostati Ψ k a particella singola dell'equazione di Dirac con Ψ op(x) = ∑ak Ψk (x), Ψ op+ (x) = (7) k ∑ak +Ψk +(x), (8) k esprimeremo le correnti come funzioni bilineari degli operatori a e a† . Questa e' la "Schro"dinger picture". Passando alla "interaction picture", si ha ak → ak (t) = eiHt ak e-iHt =ak e-iε k t, come e' facile vedere1. Gli operatori dei fermioni anticommutano, ma le componenti delle densita' di corrente Jµ(x) e Jν (y) commutano: esse sono bilineari nelle componenti degli spinori di Dirac, e le combinazioni bilineari di operatori anticommutanti commutano, come e' facile verificare2. Al secondo ordine avremo -1 S= 2 -1 = 2 ∞ ∞ ⌠ dt 1 ∫ d t 2 P[V I (t 1)V I (t 2)] = -∞ ⌡ -∞ ∞ ⌠ d 4x ∞ d 4y P[J (x)A (x)J (y)A (y)] . ∫ µ µ ν ν ∞ ⌡ -∞ (9) Conviene per brevita' scrivere θ(x-y) per indicare θ(t 1-t 2), dove ict 1 e ict 2 sono le quarte componenti di x e y. Si noti che P[Jµ(x)Aµ(x)J ν (y)A ν (y)] = P[Jµ(x)J ν (y)] P[Aµ(x)Aν (y)] , in quanto i termini in croce nel prodotto sono nulli (prodotti del tipo θ(xy)θ(y-x)). Poiche' sia |i> che |f> sono il vuoto dei fotoni, dobbiamo calcolare Dµν (x,x')=<0|P[Aµ(x)Aν (x')]|0> = δµν D(x-x'), 1La dimostrazione e' lasciata come esercizio. 2L' anticommutatore fra a e a† non e' nullo se gli operatori distruggono e creano il medesimo stato, ma noi omettiamo i termini extra che ne deriverebbero perche' non contribuiscono al processo di diffusione fra due elettroni che stiamo considerando. Consideriamo solo processi di diffusione, in cui i 4 stati A,B,C,D sono tutti diversi. =362= (10) Prof. M. Cini -Corso di Fisica Atomica e Molecolare che, come abbiamo visto, e' il propagatore. Pertanto, a meno di una costante di proporzionalita', il risultato della media sul vuoto dei fotoni e' ∫{θ(x-y)Jµ(x)Jν ( y ) + θ(y-x)Jν (y)Jµ(x)}δµν D(x-y)d4xd4y. (11) Le θ sembrano difficili da trattare, ma per fortuna le componenti delle densita' di corrente J µ(x) e Jν (y) commutano. Tenuto conto del fattore δµν , risulta S∝ ∑ ∫Jµ(x)D(x-y)Jµ(y)d4xd4y. µ (12) Dobbiamo calcolare <f|S|i>, con |i>= a+Aa+B|v>, |f>= a+Ca+D|v>, (13) dove |v> e' il vuoto.Nel calcolo di <f|S|i>, sopravvivono solo i termini di S in cui gli operatori di distruzione distruggono A e B e quelli di creazione creano C e D. Pero' aA puo' venire da Ψ(x) e aB da Ψ(y) o viceversa; a +C puo' venire da Ψ +(x) e a+D da Ψ +(y) o vicecersa. Quindi nello sviluppo di S occorre considerare i 4 termini _ _ Ψ C(x) γµΨ A(x)] [_ Ψ D(y) γµΨ B(y)] + a+C aAa+DaB [_ + a+DaBa+CaA [Ψ _C(y) γµΨA(y)] [ Ψ _ D(x)γµΨB(x)] + + a+CaBa+DaA [Ψ _C(x)γµΨB(x)] [Ψ_D(y) γµΨA(y)] + + a+DaAa+CaB [Ψ C(y) γµΨ B(y)] [ Ψ D(x) γµΨ A(x)] . (14) I primi due termini rappresentano il processo A⇒C B⇒D, rappresentato nel primo diagramma, perche' A e C hanno la stessa coordinata; gli altri rappresentano il termine di scambio, ed in virtu' delle regole di anticommutazione hanno un fattore -1. D C C D A B A =363= B Prof. M. Cini -Corso di Fisica Atomica e Molecolare Pertanto Si ⇒f = SAB ⇒CD - S AB ⇒DC , dove _ ∫Ψ (y) γµΨ (y)D(y-x)Ψ (x)γµΨ (x)d4xd4y , _ _ Ψ Ψ = ∫ (y) γµΨ (y)D(y-x) (x) γµΨ (x)d4xd4y . SAB ⇒CD = SAB ⇒DC _ D C B B C (15) A D (16) A Esplicitamente, -i ⌠ d4p exp{ip(r1-r2)-iω(t 1-t 2)} D(x-y) = , (17) (2π) 4 (p2-ω2- i0) ⌡ con p4=iω. Consideriamo prima gli integrali in dt1 (implicito in d4x) e dt2 (implicito in d4y) indicando con ωi l'energia dello stato iesimo in unita' atomiche. Poiche' Ψ Α (x) =Ψ Α (r) exp[-iωA t1], etc., abbiamo ad esempio in SAB ⇒CD ∫exp[i( ωD - ω B + ω )t2]dt2 = 2πδ( ω D - ω B + ω ), dove ω =ω B - ω D = -(ω C - ω A ) e' la frequenza del fotone virtuale scambiato. Il successivo integrale in dp 0, cioe' in dω, comporta quindi un fattore δ( ω D - ω B + ω C - ω A ), che impone la conservazione dell'energia. Scriviamo allora SAB ⇒CD = δ( ω D - ω B + ω C - ω A )U AB ⇒CD . (18) Per esplicitare UAB ⇒CD , occorre integrare in d3p; passiamo a coordinate sferiche e troviamo un integrale tabulato ⌠ 4π exp{ip(r1-r2)} 3 d p = (p2-ω2) |r1-r2| ⌡ = ∞ ⌠ sin[p |r1-r2|] pdp= p2-ω2 ⌡ 0 4π π iω |r1-r2| exp( ). |r1-r2| 2 c (19) Quindi, con r12= |r1-r2|, si ha U AB ⇒CD = iω ACr12 exp( ) _ _ c Ψ Ψ =∫ [ D(r2) γµ(2)Ψ B(r2)][ C(r1) γµ(1)Ψ A(r1)]d 3r1d3r2. r12 (20) =364= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Le matrici γµ che agiscono sui gradi di liberta' _ interni dell'elettrone i sono state indicate con γµ(i). Ricordando che Ψ =Ψ +γ4 , che Ψ e Ψ + sono c-numbers e che α k = i γ4γk possiamo riscrivere il risultato nella forma U AB ⇒CD = ∫ Ψ +D(r2)Ψ +C(r1)WB (1,2)Ψ B(r2)Ψ A(r1)d3r1d3r2 (21) dove WB (1,2) = e 2 [1- (1) (2)] exp[ikr 12] r12 k = ωAC c (22) e' il potenziale di Breit, e k e' il vettore d'onda del fotone virtuale. 15-3 Significato fisico dell'interazione di Breit WB e' un potenziale efficace che agisce fra gli spinori e i loro coniugati Hermitiani, in analogia con la teoria non relativistica1; si tratta di una generalizzazione dell'interazione coulombiana. Nel limite non relativistico, contano solo le componenti grandi, 0 ed i termini in = 0 possono essere trascurati in quanto coinvolgono quelle piccole; inoltre k→0 e si ottiene l'interazione Coulombiana non ritardata, mentre il secondo diagramma conduce al termine di scambio. D'altra parte la stessa interazione di Breit non e' che il primo termine di uno sviluppo. Cio' non e' sorprendente, visto che anche in fisica classica2 la lagrangiana di un sistema di cariche di velocita' ≈v puo' essere ottenuta solo come serie di potenze in v/c, e per particelle lente ci si ferma di solito all'ordine (v/c)2. Calcoliamo l'ampiezza di diffusione nel caso semplice dell'urto fra elettroni liberi ("Mo/ller scattering") , sostituendo nell'espressione di U le dipendenze spaziali degli spinori di Dirac, Ψ A(r1) = exp[-ipA r1] υA (pA ), etc., dove υA (pA ) non dipende dalle coordinate. Conviene sostituire r1+r2 l'integrazione in d3r1d3r2 con una in d3R d3 , dove R= e =r12 r2 ; poiche' r1=R+ /2, r2=R- /2, l'integrale in d3R puo' essere eseguito immediatamente, e fornisce un fattore 1tranne il fatto che Ψ ha 4 componenti, ovviamente. 2Cfr. il II 0 Volume "Teoria dei Campi" del Corso di .Landau e Lifshitz =365= Prof. M. Cini -Corso di Fisica Atomica e Molecolare (2π) 3δ(PC+PD-PA -PB ), che esprime la conservazione dell'impulso. Quindi, U AB ⇒CD = (2π) 3δ(PC+PD-PA -PB )V AB ⇒CD , e rimane da calcolare VAB ⇒CD = υ† D(2)υ† C(1)[1- (1)⋅ (2)] υB(2)υA (1) ∫ d3 (2) (1) e-iq⋅ +ikρ , ρ ω . Ma a parita' di c energia, un elettrone ha un momento molto maggiore di quello di un fotone, e possiamo ritenere kρ<<q⋅ . Il calcolo e' completato, 4π perche' la trasformata di 1/ρ e' 2 . q † † VAB ⇒CD ha il fattore υ D(2)υ C(1)[1- (1)⋅ (2)] υB(2)υA (1) , che dipende dai gradi di liberta' di spin. Ricordiamo che gli autospinori (colonna) di Dirac con p = h / definito sono, esplicitando le componenti, c ⋅p υ = (u, u) , E+mc2 dove u e' uno spinore di Pauli, e, per basse energie (E≈mc 2), υ ≈ (u, ⋅p u) . Nel limite non relativistico, quando il termine in (1)⋅ (2) e' 2mc trascurabile, V AB dipende dagli spin attraverso il fattore (u D† (2)uB (2))(u C† (1)uA (1)) come l'elemento di matrice di una interazione indipendente dallo spin; si ha semplicemente la conservazione dello spin nelle interazioni Coulombiane. Calcoliamo approssimativamente il prodotto scalare dei due tri-vettori (υc † (1)| (1)|υA (1)) e (υD† ((2)| (2)|υB (2)), per esprimerlo in termini degli u e darne una interpretazione fisica. Si trova 0 ⋅pC ⋅pA <υC| (1)|υA > = <(u C, uC)| 0 |(u A , u )> = 2mc 2mc A ⋅pC ⋅pA ⋅pA ⋅pC =<(u C, uC)|( uA , uA )> = u C† uA + [ u ]† uA = 2mc 2mc 2mc 2mc C 1 = u † [ ( pA )+( pC) ]uA , (3) 2mc c dove si e' usata l'hermicita' di pC. Sviluppando ad esempio la componente x del vettore ( pA )+( pC) si ottiene σx(σxpAx +σy pAy +σzpAz )+ (σxpCx+σy pCy+σzpCz )σx e tenendo conto che σx2=I, σxσy =iσz, etc., si arriva ben presto alla conclusione che 1 (υC| (1)|υA ) = u † [pA +pC +i ∧(pC-pA )]u A . (4) 2mc c Il termine in pA +pC prende il nome di "corrente", e quello in i ∧(pCpA ) di "dipolo". Cosi' l'elemento di matrice di (1)⋅ (2) e' dove q=PD-PB = PA -PC e' il momento trasferito e k = =366= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1 {u † [pA +pC +i (1) ∧(pC-pA )]u A }⋅ (2mc)2 c ⋅{(uD† [pB +pD +i (2) ∧(pD-pB )]u B }. (5) e rappresenta interazioni corrente-corrente, corrente-dipolo e dipolo-dipolo. Le correzioni possono infatti essere interpretate fisicamente in termini di interazioni magnetiche spin-spin, orbitaorbita e spin-altra orbita. Usando pD-pB = q, pC-pA =-q, il termine dipolo-dipolo diventa 4πe2 ( (1) ∧q)⋅( (2) ∧q) . (6) (2mc)2 q2 L'ampiezza di diffusione dipende da q , la cui variabile coniugata e' la coordinata relativa ; la sua trasformata di Fourier e' il potenziale efficace che agisce sugli elettroni. Trasformando, q→ -i , e si trova il potenziale e2 1 ( (1) ∧ )⋅[ (2) ∧ ] ρ . 2 (2mc) L'operatore e' della forma ( (1) ∧ ) k [ ]k = εkij σ(1) i ∂j [ ]k. Poiche' pero' εkij =εijk , possiamo riscriverlo nella forma σ(1)i εijk ∂j [ ]k = (1) ⋅ ∧[ ]. In altri termini, il potenziale dipolo-dipolo e' e2 1 (1) ⋅ ∧[ (2) ∧ ] ρ . 2 (2mc) - (7) (8) L'interpretazione fisica e' finalmente trasparente. Infatti, al momento e (2) (2) magnetico = del secondo elettrone e' associato un 2m potenziale vettore 1 A(2) = [ (2) ∧ ] ρ , che abbiamo gia' incontrato nel capitolo sulle interazioni iperfini. 1 Quindi ∧[ (2) ∧ ] ρ = B(2) non e' altro che il campo magnetico dell'elettrone 2, e il potenziale dipolo-dipolo e' H dd=- (1) ⋅B(2) . (9) Il termine di interazione fra il dipolo 1 e la corrente 2 e' 4πe2 i † (1) † {u ∧(pC-pA )u A }⋅{(uD [pB +pD ]uB } .= (2mc)2 c q2 4πe2 -i † (1) † = {u ∧quA }⋅{(uD [2pB +q ]uB } 2 . (10) (2mc)2 c q Dal momento che q∧q=0, questo e' l'elemento di matrice di =367= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 4πe2 4πe2 -2i (1) ⋅q∧pB = ; (11) q2 (2mc)2 q2 4π 1 i trasformando di nuovo con q→ -i , q 2 → -i ρ =ρ 3 , si vede che e' q della forma di un'interazione spin-altra orbita. Per ottenere una formula dell'interazione efficace Ueff corretta fino ad includere tutti i termini del secondo ordine in v/c, occorrerebbe partire dall'espressione dello spinore |υ> di pari accuratezza e fare una espansione sistematica piuttosto lunga. Oltre ai termini che abbiamo trovato, si avrebbe l'interazione spin-orbita di Thomas per ciascun elettrone ed ulteriori correzioni all'interazione fra gli elettroni che non dipendono dagli spin. Diamo solo il risultato, rimandando alla letteratura1 per la derivazione completa: ⋅( ⋅pA )pB e2 eh / e2 U eff = -π( )δ( ) (pA ⋅pB + ) 2 2 r mc 2m c ρ ρ2 e2h / + [ -( 1 +2 2)⋅L1 +( 2 +2 1)⋅L2 ] + H dd, (12) 2 4m c 2ρ 3 dove L = ∧p. A questo ordine, Ueff puo' essere usato nell'equazione p4 di Schro"dinger, insieme con la correzione . 8m3c 2 G.Breit ricavo' le varie correzioni magnetiche a partire da considerazioni semiclassiche e le applico' all'atomo di He, ancora prima del lavoro di Mo /ller e dello sviluppo della elettrodinamica quantistica. Queste correzioni sono importanti per una descrizione quantitativa degli stati atomici e delle probabilita' di transizione, con particolare riguardo ai livelli piu' interni di atomi pesanti. Per esempio, il calcolo degli elementi di matrice Auger per atomi mediopesanti richiede l'interazione di Breit, ed anzi per gli elementi piu' pesanti questa prima approssimazione non e' piu' del tutto soddisfacente. -2i (2mc)2 (1) ∧q⋅pB 15-4 L'atomo relativistico e il metodo di Dirac-Fock Per descrivere correttamente un sistema di N elettroni bisogna tener conto degli effetti relativistici sia sugli elettroni che sulla loro interazione. E' naturale pensare a una teoria basata sull'Hamiltoniano N 1 H = ∑ h D(i) + ∑ W B (i,j) (1) 2 ≠ i=1 i j dove hD(i) e' l' Hamiltoniano di Dirac dell'elettrone i-esimo, e W e' l'interazione di Breit. Va da se' che un tale schema e' molto piu' complicato di quello non relativistico, ed il problema dei molti corpi 1 V.B. Berestetskii, E.M. Lifshitz, L.P. Pitaevskii, "Relativistic Quantum Theory", Cap.9 =368= Prof. M. Cini -Corso di Fisica Atomica e Molecolare deve essere affrontato ex novo in condizioni piu' difficili che nel caso di Schro"dinger. E' naturale partire da una prima approssimazione (metodo di Dirac-Fock ovvero Hartree-Fock relativistico1) che si basa sull'idea di attribuire ad ogni elettrone uno spin-orbitale di Dirac a 4 componenti, da determinarsi insieme al potenziale autoconsistente (SCF) diretto e di scambio dovuto agli altri elettroni. Come nel caso non relativistico, la condizione di stazionarieta' dell'energia porta alle equazioni SCF. Sono disponibili programmi numerici. Il GRASP (General-purpose Relativistic Atomic Structure Program 2) realizza questo calcolo e molto di piu'. Determinate le funzioni radiali nel campo SCF, vengono prese combinazioni lineari normalizzate di determinanti di Slater per formare autovettori di J2, jz,Π e seniority number; di tali stati vengono prese combinazioni lineari, i cui coefficienti vengono ottimizzati variazionalmente. Si ottiene cosi' una parziale interazione di configurazioni. Inoltre, si tiene conto approssimativamente delle dimensioni del nucleo e degli effetti principali di QED3. Calcoli di Dirac-Fock sono stati fatti su tutti gli atomi e su molti ioni. Per atomi non troppo pesanti spesso si usa l'interazione Coulombiana, introducendo poi le correzioni di Breit perturbativamente al primo ordine; anche questo maquillage e' piu' difficile del solito, essendoci un discreto e due continui in questo formalismo. Rispetto ai calcoli Hartree-Fock, gli orbitali s si contraggono sempre verso il nucleo, a volte quelli di valenza piu' ancora di quelli di core. Gli orbitali f si espandono. Gli orbitali p e d si comportano in modo intermedio (a volte si contraggono e a volte si espandono.) L'importanza degli effetti relativistici cresce con Z, ma per orbitali profondi essi sono di importanza confrontabile con quelli di correlazione gia' per il Ne (Z=10). Gli elettroni di valenza non sono mai relativistici, e si potrebbe supporre che le proprieta' chimiche degli atomi fossero ottenibili da calcoli HF per qualsiasi Z. Questo pero' e' falso, perche' gli orbitali di valenza HF sono ortogonali a quelli di core, e se c'e' un errore questo si propaga in modo sensibile. A maggior ragione, vi sono effetti relativistici imporanti sui livelli di core poco profondi. Per Hg (Z=80) il metodo di Dirac-Fock predice correttamente che il 5s e' piu' legato del 4f (sperimentalmente le energie di legame sono EB (4f 5/2)=111.1 eV, EB (4f 7/2)=107.1 eV, 1I.P. Grant, Proc.Roy.Soc. (London) A262, 555 (1961); Proc.Roy.Soc. (London) 86, 523 (1965) 2K.G. Dyall et al., Computer Physics Communications 55 (1989) 425. 3Poiche' queste correzioni sono generalmente piccole, considerati gli errori che si commettono su altre quantita', anche una stima grossolana e' accettabile. Non possediamo, tuttavia, un metodo veramente soddisfacente per introdurre questi effetti in modo rigoroso. =369= Prof. M. Cini -Corso di Fisica Atomica e Molecolare EB (5s)=134 eV) mentre i calcoli non relativistici predicono l'ordine sbagliato. Pero', la generalizzazione del metodo di HF non e' affatto ovvia, nemmeno in linea di principio. Cercando i determinanti di Slater ottimali nel senso usuale si va incontro al collasso variazionale. Questo termine indica il fenomeno per cui la ricerca del minimo dell'energia, compiuta senza altri accorgimenti, ci spinge solo a precipitare senza fine nel continuo di energia negativa. L'equazione di Dirac non ammette il semplice principio variazionale che vale nel caso non relativistico, a meno che non si proiettino fuori dalla funzione d'onda gli stati di energia negativa. Il minimo di cui sopra e' solo relativo. Nel caso plurielettronico si osserva anche un altro fenomeno, ugualmente disastroso, che e' noto come continuum dissolution. Questo consiste nel fatto che una data configurazione degli elettroni, in cui tutti si trovano in stati di energia positiva, e' degenere con infinite altre in cui alcuni elettroni hanno energia positiva ed altri energia negativa. Poiche' ovviamente questi stati rappresentano un continuo, ne consegue che non si hanno piu' autovalori discreti (vale a dire, gli autovalori possono assumere qualsiasi valore). Quindi i codici Dirac-Fock (che di solito funzionano bene) sono esposti ad insidie non banali e talora non convergono al risultato desiderato. Sono stati introdotti vari metodi per ovviare a tali problemi. La loro discussione e' troppo tecnica per essere svolta qui1 . Uno utilizza l'idea gia' menzionata degli operatori di proiezione; una difficolta' ovvia e' che l'operatore che proietta su stati di energia positiva e' noto solo quando e' noto il potenziale, e quindi deve essere determinato anch'esso dal calcolo autoconsistente. Un altro approccio e' noto come metodo minimax, e consiste nel cercare il massimo dell'energia rispetto alle componenti piccole e poi il minimo rispetto alle grandi. Altri metodi usano set di base "bilanciati" in cui le componenti piccole soddisfano opportune condizioni che le legano alle grandi. Queste condizioni sono quelle soddisfatte in problemi risolubili prossimi a quello considerato. 2 15-5 Teoria relativistica dell'interazione di Van Der Waals Consideriamo l'interazione fra due atomi a distanze r>>aB . Per semplicita', li supporremo identici, con uno stato fondamentale di tipo S. In linea di principio, l'interazione si puo' misurare con un esperimento di diffusione a basse energie e grande parametro d'urto; pertanto, quella che calcoleremo e' una ampiezza di diffusione. Il primo problema e' quello di stabilire che relazione c'e' fra l'ampiezza di diffusione ed il potenziale. Gli atomi hanno 1per una discussione recente vedere ad esempio G.W.Drake e S.P.Goldman, Advances in Atomic and Molecular Physics 25 (1988) pag.393 2V.B.Berestetskii, E.M. Lifshitz, L.P. Pitaevskii, Relativistic Quantum Theory, (Pergamon) §85. =370= Prof. M. Cini -Corso di Fisica Atomica e Molecolare gradi di liberta' elettronici e nucleari (moto del baricentro). Per fortuna, gli atomi possono essere trattati come oggetti infinitamente pesanti, nel senso che gli effetti sul potenziale dovuti alla massa finita sono trascurabili; questo ci permette di ignorare i gradi di liberta' nucleari. Nasce tuttavia una complicazione formale, perche' fa' venire una matrice S = UI (∞ ,∞ ) formalmente singolare. Infatti, atomi infinitmente pesanti non si muovono mai e l'ampiezza di diffusione viene proporzionale alla durata T→∞ della collisione. Nella teoria non relativistica, l'interazione fra due atomi identici nello stato fondamentale S a distanze r>>aB e' descritta dal potenziale di Van der Waals W(r) che va come r-6 . Cominciamo con il calcolo dell'ampiezza di diffusione nella teoria non relativistica, includendo W(r) come perturbazione nell'Hamiltoniano del sistema. L'Hamiltoniano imperturbato H 0 si riduce all'energia cinetica, perche' la collisione e' di cosi' bassa energia che non si produce alcuna eccitazione. L' interazione puo' essere trattata nel limite in cui la massa degli atomi e' infinita, l'energia cinetica e' nulla e quindi H0→0. L'operatore di evoluzione temporale nella pittura di interazione e' t t U I (t,τ) = T exp[-i ∫dt'WI (t') ]=-i ∫dt'WI (t') +... (1) τ τ -T T dove τ= , t= , ed alla fine T→∞ ; se lo calcoliamo con H0→0, 2 2 all'ordine piu' basso, troviamo S = -i T W(r). (2) La cosa sta in piedi solo se interpretiamo T come la durata della collisione. Questa divergenza formale e' il prezzo da pagare se vogliamo prendere il limite H0→0 all'inizio, e non alla fine del calcolo; la (2) e' la relazione cercata fra l'ampiezza di diffusione e il potenziale. Nella teoria relativistica, si procede in analogia col potenziale di Breit: si calcola l'ampiezza di diffusione dovuta allo scambio di fotoni virtuali, e poi la si interpreta semiclassicamente come dovuta ad un potenziale efficace. Il punto e' che, in una teoria microscopica, non c'e' nessun W(r) da includere nell' Hamiltoniano del sistema, dove trovano posto solo le interazioni fondamentali. La vera interazione e' quella fra i dipoli e il campo V= -E(r1)⋅d1-E(r2)⋅d2 , (3) ed al quart'ordine, da' un risultato non nullo ed interpretabile come una interazione fra gli atomi. Esso verra' della forma S = -i T W(r), e W sara' il nostro risultato, cioe' l'interazione effettiva cercata. =371= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∂A , ovvero ∂t E(ω)=iωA(ω). Poiche' <d>=0, l'interazione nella teoria relativistica richiede lo scambio di due fotoni virtuali e l'ampiezza di diffusione va calcolata al quarto ordine Mettiamoci nella gauge Φ=0, cosicche' E(t)=- (-i) 4 4 dt T[V(t1)V(t2)V(t3)V(t4)] (4) 4! ∏∫ i i mediata sul vuoto dei fotoni con i due atomi nello stato T T fondamentale; gli integrali si estendono fra - e . 2 2 E' cruciale il modo in cui prendiamo la media sugli stati atomici. In linea di principio, dovremmo mediare sia sullo stato di ciascun elettrone atomico [che e' quello fondamentale sia alla fine che all'inizio della collisione] che sugli impulsi, che fanno entrare in gioco i gradi di liberta' dei nuclei. Per i nostri scopi, e' sufficiente considerare l'interazione a nuclei fermi: come ho gia' detto, questo corrisponde al limite di masse atomiche infinite, ed energie cinetiche nulle. La media sugli stati atomici <g|...|g> si riduce alla media sullo stato fondamentale di ciascun atomo. Ora, T[V(t 1)V(t2)V(t3)V(t4)] puo' essere espanso come somma di prodotti di fattori del tipo E.d, dove E sta per una componente cartesiana di E(r1) o di E(r2) mentre d sta per la stessa componente di d1 o di d2. La media di ciascun prodotto e' del tipo <T[E(t1).d(t1)E(t2).d(t2)E(t3).d(t3)E(t4).d(t4)]> = = <0|T[E(t1).E(t 2).E(t 3).E(t 4)]|0> <g|T[d(t 1)d(t2)d(t3)d(t4)]|g> , dove |0> e' il vuoto dei fotoni, |g> il prodotto degli stati fondamentali dei due atomi; la fattorizzazione e' possibile perche' tutti gli operatori commutano ed i termini dei due fattori che si riferiscono ad ordinamenti temporali diversi si cancellano automaticamente. S(4) = Un teorema dovuto a Wick consente di calcolare il valore di aspettazione sul vuoto di un prodotto T-ordinato di operatori bosonici. Si definisce contrazione di due operatori la media sul vuoto del loro prodotto. Si spezza il prodotto da calcolare in contrazioni in tutti i modi possibili e si sommano i risultati. Questo teorema e' discusso nel Capitolo 19 per il caso dei fermioni. Applicando il teorema di Wick, possiamo contrarre gli operatori nei seguenti modi: E E E E E E E E E E E E tuttavia, dato che tutti gli operatori commutano e le integrazioni sono simmetriche, i tre contributi all'espressione finale sono identici. Possiamo scrivere <T[E(t1).d(t1)E(t2).d(t2)E(t3).d(t3)E(t4).d(t4)]> = =372= Prof. M. Cini -Corso di Fisica Atomica e Molecolare =3 <0|T[E(t1)E(t2)]|0><0|T[E(t3)E(t4)]|0> <g|T[d(t1)d(t2)d(t3)d(t4)]|g> . Dei quattro d, due devono essere componenti di d1 e due di d2, affinche' si possa trattare di una interazione; i termini lineari nelle componenti di uno dei dipoli sono nulli perche' <d>=0. Ci sono termini in cui ogni campo elettrico si propaga da un dipolo a se' stesso, come in 3 <0|T[E(r1t1)E(r1t2)]|0><0|T[E(r2t3)E(r2t4)]|0> <g|T[d1(t 1)d1(t 2)d2(t 3)d2(t 4)]|g> = 3 <0|T[E(r1t1)E(r1t2)]|0><0|T[E(r2t3)E(r2t4)]|0> <g|T[d1(t 1)d1(t 2)|g> <g|T[d2(t 3)d2(t 4)]|g>. Questi si fattorizzano nel prodotto di funzioni di r1 e r2; noi li tralasciamo perche' cerchiamo una interazione funzione della distanza. Restano i termini in cui ogni campo elettrico si propaga da un dipolo all'altro, secondo il diagramma. 1 2 Esistono 4 termini equivalenti di questo tipo, e possiamo scriverne uno solo moltiplicando per 4. Cosi' <T[E(t1).d(t1)E(t2).d(t2)E(t3).d(t3)E(t4).d(t4)]> = 12 <0|T[E(r1t1)E(r2t2)]|0><0|T[E(r2t3)E(r1t4)]|0> <g|T[d1(t 1)d2(t 2)d2(t 3)d1(t 4)]|g>= = 12 <0|T[E(r1t1)E(r2t2)]|0><0|T[E(r2t3)E(r1t4)]|0> <g|T[d1(t 1)d1(t 4)|g> <g|d2(t 2)d2(t 3)]|g>. Ricordando che ogni campo elettrico e' moltiplicato scalarmente per il dipolo corrispondente, introduciamo le componenti cartesiane, con la somma sugli indici ripetuti. Cosi' <T[V(t1)V(t2)V(t3)V(t4)]> =12<0|T[Ei (r1t1)Ej (r2t2)]|0><0|T[Em(r2t3)En (r1t4)]|0> <g|T[d1i (t 1)d1n (t 4)|g> <g|T[d2j (t 2)d2m(t 3)]|g>. L'ampiezza di diffusione e' quindi, semplificando la notazione, <S(r)>= (5) 1 4 dt <T[Ei (r1t1)Ej (r2t2)]><T[Em(r2t3)En (r1t4)]>α in (t 1,t 4)α jm (t 2,t 3), 2 ∏∫ i i dove compaiono i propagatori dei dipoli 1 e 2, della forma =373= Prof. M. Cini -Corso di Fisica Atomica e Molecolare α ij (t) = i<T[d i (t)dj (0)>= θ(t) ∑ ( d i ) 0n(dj ) no exp[-iωn0t] n +θ(-t) ∑ ( d j ) 0n (di ) no exp[iωn0t]; n la loro trasformata di Fourier e' α ij (ω) = ∑ n [ (di ) 0n (dj ) no (dj ) 0n(di ) no + ]. ωn0 -ω+i0 ωn0+ω+i0 (6) Per uno stato S (e per ogni stato mediando sulle orientazioni) α ij (ω)=α ij (-ω)=δij α(ω). (7) Il propagatore del campo e' connesso a quello del fotone da ∂2 E D (x 1-x 2) = <T[Ei (x 1)Ek (x 2)]>= <T[Ai (x 1)A k (x 2)]>= ij ∂t1∂t2 ∂2 = D (x -x ). ∂t1∂t2 ik 1 2 Poiche' Dik (x 1-x 2) dipende dalla differenza dei tempi, ∂ ∂ Dik (x 1-x 2)=- Dik (x 1-x 2) ∂t2 ∂t1 e possiamo scrivere D ∂2 E (x 1-x 2) = - 2 Dik (x 1-x 2)= ik ∂t1 ⌠ d4p 2 4 ω Dik (p)exp[ip(x1-x 2)]. ⌡(2π) Ci siamo messi nella gauge Φ=0 ed useremo l'espressione con le componenti D 44=Di4=0, (-i) pi pj Dij (p) =(4π) 2 [δij - 2 ], (8) p ω dove il fattore 4π viene dalla normalizzazione del fotone nella gauge trasversa. Sostituendo nell'ampiezza di diffusione ⌠ d4p 2 <T[Ei (r1t1)Ej (r2t2)]>= - 4 ω Dik (p)exp[ip(r1-r2)- iω(t 1-t 2)]. ⌡(2π) ⌠ d4p 2 <T[Em(r2t3)En (r1t4)]> =- 4 ω Dmn (p)exp[ip(r2-r1)- iω(t 3-t 4)]. ⌡(2π) ∞ ∫dΩ α(Ω)exp[-iΩ(t 1-t 4)] -∞ abbiamo il seguente integrale temporale: α in (t 1,t 4) = δin =374= (9) Prof. M. Cini -Corso di Fisica Atomica e Molecolare 4 ∏∫dti exp[- iω1(t 1-t 2)- iω2(t 3-t 4)-iΩ1(t 1-t 4)-iΩ2(t 2-t 3)]= i 4 ∏∫dti exp[- i{(ω1+Ω1)t 1-(ω1-Ω2)t 2+(ω2-Ω2)t 3-(ω2+Ω1)t 4] . i Integrando su t1, t 2 e t3 otteniamo (2π) 3δ(ω1+Ω1)δ(ω1-Ω2)δ(ω2-Ω2) ∫dt4exp[i(ω2+Ω1)t 4]= =(2π) 3δ(ω1+Ω1)δ(ω1-Ω2)δ(ω2-ω1) ∫dt4exp[i0t4] = =(2π) 3δ(ω1+Ω1)δ(ω1-Ω2)δ(ω2-ω1) T dove il tempo T formalmente divergente ha il senso fisico della durata della collisione. Resta dΩ1 dΩ2 d4p1 d4p2 1 (2π) 3T ∫ exp[i(p1-p2)(r1-r2)] 2 2π 2π (2π) 4 (2π) 4 ω12Dik (p 1)ω22Dik (p 2)α 1(Ω1)α 2(Ω2)δ(ω1+Ω1)δ(ω1-Ω2)δ(ω2-ω1)= = -i T W(r). Cosi' <S(r)>= 1 i d 4p1d4p2 exp[i(p1-p2)(r1-r2)] 2 (2π) 7 ∫ ω12Dik (p 1)ω22Dik (p 2)α 1(−ω1)α 2(ω1)δ(ω2-ω1). Usiamo α(ω)=α(-ω), ponendo r1-r2 =r; W(r)= 1 i d 3p1d3p2 dω1dω2 ei(p1- p2)⋅r 2 (2π) 7 ∫ ω12Dik (p1,ω1)ω22Dik (p2,ω2)α 1(ω1)α 2(ω1)δ(ω2-ω1) = W(r)= i d 3p1d3p2 dω ei(p1- p2)⋅r ω4Dik (p1,ω)D ik (p2,ω)α 1(ω)α 2(ω). 2(2π) 7 ∫ 16π 2i i Ora, = ,e 7 2(2π) 16π 5 p1ip1k p2ip2k 3 ω4 ∑ [δik ] [δik ]= 2 ω ω2 ik=1 p1ip1k p2ip2k p1ip1kp2ip2k 3 =ω4 ∑ [δik - δik δ + ]= ik ω2 ω2 ω4 ik=1 = ∑ p1ip2i∑ p1kp2k 2 2 p p i k 3 1i 2i = ω4 { ∑ [1- 2 - 2 ] + }= ω ω ω4 i=1 =375= Prof. M. Cini -Corso di Fisica Atomica e Molecolare (p1⋅p2) 2 p1i2 p2i2 =ω4 { 3- ∑ [ 2 + 2 ] + }= 3 ω4 - ω2(p12+p12) + ω ω ω4 i (p1⋅p2) 2. Alfine, per atomi uguali poniamo α 1=α 2=α , e W(r)= i 16π 5 ∫ d 3p1d3p2 dω 3 ω4 - ω2(p12+p12) + ( p1⋅p2) 2 . (10) [ω2-p12+i0][ω2-p22+i0] Questa e' la formula che da' l'energia di interazione fra due atomi a distanze r grandi rispetto al raggio di Bohr. L'integrale su ω ha poli per i valori che annullano i denominatori ed alle frequenze caratteristiche degli atomi, la piu' bassa delle quali e' quella fondamentale ω0. La formula non relativistica consegue se r<<λ 0, dove λ 0 e' la lunghezza d'onda associata alla transizione fondamentale degli atomi. Per r>>λ 0, invece, conta l'andamento asintotico dell'integrale. Dopo calcoli faticosi si trova1 23e2 α(0) 2 U(r) ≈ , r→∞ . (11) 4π r7 d2 Come ordine di grandezza, α(0)≈ ω0 , e poiche' d≈ea0, dove a0 e' i e2 a06 raggio atomico, ω0≈ , α(0) ≈ a03 , U(r) ≈ e2 7 . a0 r α(ω) 2ei(p1- p2)⋅r L'andamento si puo' capire semplicemente tenendo conto che a grandi distanze contano i |p|<<ω0 e quindi e' importante solo la polarizzabilita' statica; pertanto, i α(0) 2∫ d 3p1d3p2 dω 16π 5 3 ω4 - ω2(p12+p12) + ( p1⋅p2) 2 ei(p1- p2)⋅r . [ω2-p12+i0][ω2-p22+i0] W(r)= (12) Ora, ogni componente di p e' l'inverso di una lunghezza; anche ω lo ω e', perche' nella notazione usata essa e' in realta' ; conviene c misurare queste lunghezze inverse in unita' \f(1,r) ponendo π 1i π 1j ω σ p1i= ,p1j= , = . r r c r Si trova 1V.B.Berestetskii, E.M. Lifshitz, L.P. Pitaevskii, Relativistic Quantum Theory, (Pergamon) §85. =376= Prof. M. Cini -Corso di Fisica Atomica e Molecolare W(r)=N α(0) 2 , r7 (13) con 3 σ4 - σ2( 12+ 12) + ( 1⋅ 2) 2 r ei( 1- 2)⋅ r . 2 2 2 2 [σ - 1 +i0][σ - 2 +i0] Cosi' l'integrale e' adimensionale e indipendente da r, e l'andamento asintotico e' stabilito. i N=16π 5∫ d 3 1d3 2 dσ Vediamo come la formula non relativistica consegue se r<<λ 0. ω0 In tal caso, i valori di p dominanti sono molto maggiori di , mentre c gli ω importanti sono quelli ≈ω0 , perche' a frequenze superiori α diventa molto piccolo. Trascurando gli ω rispetto ai p possiamo approssimare W come segue: ∞ ( p1⋅p2) 2 i 2∫ d 3p1d3p2 W(r) ≈ d ωα(ω) ei(p1- p2)⋅r . ∫ 16π 5 - ∞ p12p2 L'integrale in dω e' immaginario puro, essendo reali i residui di α(ω) 2, e non dipende da r. ∞ d4 e4a04 2 5 d ωα(ω) 2 ≈ ω0 ≈ 2 = e a0 . e -∞ a0 L'andamento in r-6 ora si trova ponendo in forma adimensionale il secondo integrale, analogamente al caso r→∞ . ∫ Capitolo 16 Metodo ricorsivo di Haydock1 Qualunque problema stazionario di meccanica quantistica, con qualsiasi numero di gradi di liberta', puo' essere rappresentato con una catena lineare esattamente risolubile. 16-1 Catena lineare e sua funzione di Green locale Consideriamo una catena lineare "tight binding" semiinfinita di "atomi"; siano u n gli orbitali atomici (n=0,1,2,...) con livelli energetici an . L' Hamiltoniano e' definito dalla sua azione sugli stati Hun =an un +bn+1un+1 + bn un-1 (1) 1C.Lanczos, J.Res.Natl.Bur.Stand.45, 255 (1950); R. Haydock, V.Heine and M.J.Kelly, J.Phys.C 5 (1972) 2845; R. Haydock, Solid State Phys. Vol.35 ed. Ehrenreich, F.Seitz and D. Turnbull (London, Academic Press, 1980) ; R. Haydock and C.M.M. Nex, J.Phys.C 18 (1985) 2235. =377= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove i b sono integrali di salto. Sulla base degli un , H e' una matrice tri-diagonale a0 b1 H = 0 . b1 0 0 ... a1 b2 0 ... (2) b2 a2 b 3 ... . . . ... Per questo modello vogliamo calcolare la funzione di Green locale 1 G0(E) = <u0| |u >, (3) z-H 0 1 dove z=E +iδ, δ→0, e' una energia complessa. Poiche' i e' la z-H trasformata di Fourier di e-iHt θ(t) , G0(z) e' causale; inoltre gode di comode proprieta' analitiche, fra cui : 1 1) G0 ≈ per z →∞ in ogni direzione; (4) z 2) G0(z) * = G0(z*) (5) 3) la proprieta' di Herglotz: per z =E+iε, -1 (6) π Im(G0(z)) = ∑ |<u|λ>|2δ(E-ελ ) = n(E) λ e' una densita' di stati non negativa. Si puo' cominciare ad apprezzare che il nostro scopo non e' poi cosi' speciale come sembra, considerando che il calcolo di funzioni di 1 Green fuori diagonale Gmn (E) = <um| |u > si riduce al caso E-H n diagonale. Basta prendere le combinazioni lineari indipendenti u= um+un , v= um-un , w= um+iun , z= u m-iun (7) per esprimere Gmn (E) nella forma 1 Gmn (E) = {Guu-Gvv -i[Gww -Gzz]}; (8) 4 una tecnica che consente di trovare gli elementi diagonali si applica poi a tutti. Dobbiamo trovare l'elemento 00 della matrice E-a0 -b1 0 -b 1 E-a1 -b2 0 - b 2 E-a2 . . . . e troviamo subito D1(E) G0(E)= , D0(E) 0 . . . -1 0 ... ; -b3 ... . .. (9) (10) dove =378= Prof. M. Cini -Corso di Fisica Atomica e Molecolare D0 = det E-a0 -b 1 0 . -b1 0 E-a1 -b2 - b 2 E-a2 . . . mentre D1 = det E-a1 -b 2 0 . -b2 0 E-a2 -b3 - b 3 E-a3 . . . 0 ... 0 ... , -b3 ... . .. 0 ... 0 ... -b4 ... . .. (11) (12) si ottiene dalla precedente eliminando la prima riga e la prima colonna. Analogamente definiremo D n eliminando le prime n righe e colonne. Espandendo D0, si trova -b1 0 D0 = (E-a0)D 1 -(-b 1) det 0 . -b2 0 E-a2 -b3 - b 3 E-a3 . . . 0 ... 0 ... ; -b4 ... . .. sviluppando lungo la prima riga, il -b2 non contribuisce, e si ottiene semplicemente D0(E)=(E-a0)D 1(E) - b 12D2(E) ; (13) pertanto D1(E) 1 G0(E) = = . 2 (E-a 0)D 1(E) - b 1 D2(E) D2(E) 2 (E-a 0) - b 1 D1(E) Ma ora possiamo definire D2(E) G1(E)= D1(E) e iterare l'argomento, producendo la frazione continua infinita 1 G0(E)= . (14) b12 E-a0b22 E-a1b32 E-a2E-a3-... Ad esempio, per una catena semiinfinita uniforme, con an ≡ a=0, bn ≡b, si ha evidentemente 1 G0(E)= . (15) 2 E - b G0(E) Abbiamo gia' incontrato G0(E) nel paragrafo sul modello di Newns: indicando con E=z l'energia complessa, si ottiene la densita' di stati semiellittica =379= Prof. M. Cini -Corso di Fisica Atomica e Molecolare n(E) = 4b2-E2 θ(4b 2-E2) . 2b2 (16) 16-2 Funzione di Green di un sistema qualsiasi Tutto cio' sarebbe una mera curiosita' matematica se non fosse che ogni problema descritto da una equazione di Schro"dinger indipendente dal tempo puo' essere riformulato in termini della catena lineare. Per vederlo, consideriamo l'azione di un Hamiltoniano H arbitrario su un qualsiasi stato normalizzato u0. Hu0=a0u0 + b1u1, con (u0,u1)=0. (1) Questa affermazione dice solo che Hu0 avra' una parte proporzionale ed una parte ortogonale a u0 . Ovviamente, a0=<u0|H|u0> , mentre b1u1 = (H-a0)u 0 . Normalizzando u1 a 1, abbiamo che |b 1|2 = <(Ha0)u 0|(H-a0)u 0>, e nulla vieta di prendere b1 = <(H-a0)u 0|(H-a0)u 0> . (2) Questo risultato lo sappiamo calcolare dai dati del problema, H0 e u0; ovviamente e' anche vero che b1=<u1|H|u0>. (H-a0)u 0 A questo punto pero' conosciamo anche u1 = , e possiamo b1 proseguire studiando l'azione di H su u1. Avremo Hu1=a1u1 + b1u0 +b2u2 , con (u0,u2)=0, (u1,u2)=0. (3) Qui b1 e' lo stesso di prima perche' H e' hermitiana. Si trova che a1=<u1|H|u1>, mentre b 2u2 = (H-a1)u 1 - b 1u0. Normalizzando u2 , si ottiene b2 = <(H-a1)u 1 - b 1u0|(H-a1)u 1 - b 1u0.> , (4) che di nuovo possiamo calcolare. Infine, (H-a1)u 1 - b 1u0. u2 = . (5) b2 Qui viene il punto. Quando calcoliamo Hu2, non otteniamo affatto un termine del tipo c u0. Infatti, dovrebbe essere c= <u0|H|u2>, ma Hu0=a0u0 + b1u1 ha overlap nullo con u2; pertanto si ha una relazione di ricorrenza con tre soli termini, Hu2 = a2u2 + b2u1+b3u3 . (6) Per giunta, u3 e' ortogonale a tutti i precedenti, compreso u0, che, come si e' appena visto, non e' contenuto in Hu2. In generale si ha la catena lineare Hun = an un + bn un-1 +bn+1un+1, con gli un ortonormali, determinati da =380= (7) Prof. M. Cini -Corso di Fisica Atomica e Molecolare an = <un |H|un >, (8) bn+1 = <(H-an )u n - b n un-1 .|(H-an )u n - b n un-1 .> ), (9) (H-an )u n - b n un-1 . (10) bn+1. Abbiamo quindi un algoritmo generale per trovare la funzione di Green locale di qualsiasi stato u0 , trattandolo come il sito 0 di una catena semiinfinita di cui possiamo generare passo passo gli altri siti, coi loro livelli ed i loro integrali di salto. Dal punto di vista matematico astratto, il metodo di ridurre una matrice simmetrica in forma tridiagonale per poi diagonalizzarla e' noto fin dal 1950 ed e' dovuto a Lanczos. Se il nostro problema e' quello di trovare la funzione di Green per un sistema che ha un numero finito di stati, lo schema di Lanczos e' adeguato, e fornisce un algoritmo molto conveniente. Un numero finito di stati si ha, per esempio, nello studio degli orbitali molecolari nello schema LCAO; allora, ciascuno degli un corrisponde ad una determinata combinazione lineare di orbitali atomici, che dipende dal particolare orbitale che avremo scelto come u0. Invece, un solido nello schema LCAO ha un numero infinito di stati, ed e' necassario usare il metodo generalizzato di Haydock. Beninteso, tutti i sistemi non banali hanno infiniti stati possibili, incluse le molecole finite, ed il metodo di Haydock si applica in generale; tuttavia, il semplice schema LCAO e' adatto per fissare le idee. In generale, saremo in grado di calcolare esattamente un numero finito di coefficienti a e b; ad esempio, se tentiamo di calcolare la densita' locale degli stati di un atomo in un solido, il numero N dei siti che si possono determinare e' tipicamente dell'ordine delle decine. Avremo una approssimazione del tipo un+1 = G(N)0(E)= E-a0- 1 b12 b22 E-a1b32 E-a2E-a3-.. .... (11) . -b N-1 2 E-aN-1 -.. Se tronchiamo la catena e la frazione continua a questo punto, che accade? Stiamo sostituendo il solido con una grossa molecola . La densita' di stati di una molecola e' una sequela di δ, e non converge ad una n(E) continua in un modo ovvio. Rimediare puo' essere piu' o meno facile, a seconda del tipo di informazione che vogliamo. Se vogliamo ottenere l'aspetto complessivo di n(E), ad esempio per discutere esperimenti di fotoemissione, puo' essere sufficiente =381= Prof. M. Cini -Corso di Fisica Atomica e Molecolare allargare le δ in lorentziane, spostando i poli un po' sotto l'asse reale, cioe' dando a E una parte immaginaria δ. Con N≈qualche decina, si ottiene per n(E) una approssimazione complessivamente buona. Per esempio, il livello rettangolare Θ(ω2-W2) n(ω) = 2W si ottiene dalla funzione di Green 1 z+W ln[ ], 2W z-W che ammette anch'essa la rappresentazione (11); vedremo piu' avanti come si possono trovare gli a e i b. Prendiamo W=0.5, in modo che il continuo coincida con l'intervallo E∈(-0.5,0.5). Se calcoliamo i coefficienti della frazione continua fino a N=10 e poniamo δ=0.05 otteniamo la seguente approssimazione, dove la curva regolare e' il risultato esatto calcolato con lo stesso δ: G(z)= Tuttavia, questo modo di rendere continua la n(E) e' rozzo e artificioso, e rende divergenti i momenti µn =<u0|H n |u0> =∫ dEEn n(E) della densita' degli stati. Se fossimo interessati all'evoluzione temporale del sistema ed al calcolo di <u 0|e-iHt |u0>θ(t), dovremmo cercare qualcosa di meglio. C'e' una alternativa migliore. La densita' locale integrata E N(E)= ∫ dEn(E), (12) -∞ calcolata con N≈qualche decina, ha una forma ad istogramma, ma prossima a quella esatta, alla quale converge nel senso usuale. Si puo' calcolare N(E), "smussarla", cioe' interpolarla con qualche funzione analitica, e poi differenziarla per trovare una approssimazione a n(E). Le cose vanno molto bene quasi dappertutto, ma ci sono valori di E speciali, dove l'approssimazione analitica fallisce. Infatti, la vera n(E) =382= Prof. M. Cini -Corso di Fisica Atomica e Molecolare e' una funzione "cattiva". Vi sono singolarita' ai bordi di banda; dn dE ha delle discontinuita' per certi valori di E nel continuo. A seconda degli scopi che ci si prefiggono, queste mancanze possono essere lievi o gravi. L'andamento attorno alle singolarita' determina, ad esempio, il comportamento asintotico di <u0|e-iHt |u0>θ(t) per t grandi. Per ottenere l'andamento corretto, occorre il metodo del prossimo paragrafo. inoltre, i solidi regolari hanno "singolarita' di Van Hove" , cioe' 16-3 Terminatore Per fare meglio di cosi', si dovrebbe conoscere il comportamento asintotico per grandi n dei coefficienti. Dal momento che sono questi che determinano i dettagli mancanti, si potrebbero prendere gli an e bn per n>N-1 da modelli risolubili che abbiano gli andamenti giusti; cio' sara' molto meglio che prendere i bn nulli, anche perche' lo spettro sara' continuo (nelle bande, dove deve esserlo 1) e potra' convergere a quello esatto nel modo usuale. Supponiamo allora di poter formulare un modello risolubile con il comportamento asintotico corretto. Non e' importante che sia realistico, ma solo che abbia le singolarita' giuste al posto giusto. Tale modello si chiama terminatore, ed ha una funzione di Green locale per cui tutti i coefficienti sono noti, e per cui riserviano lettere greche: Γ0(E)= E-α 0- 1 β 12 β 22 E-α 1β 32 E-α 2E-α 3-.. .... Riscriviamolo nella forma = (1) . - β N-1 2 . - β N2 E-α N-1 .. E-α N-.. 1stiamo continuando ad usare il modello LCAO per una molecola infinita (in altri termini, il modello tight-binding di un solido) perche' e' adatto per dimostrare semplicemente l'applicabilita' del metodo a sistemi che hanno infiniti stati. Ma occorre ribadire che il terminatore e' necessario anche allo studio dei sistemi finiti, quando non si pongano limiti alle dimensioni della base. =383= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Γ0(E)= E-α 0- 1 β 12 β 22 E-α 1β 32 E-α 2E-α 3-.. .... , . - β N-1 2 E-α N-1 -β N2t(E) dove compare t(E), la "coda" della frazione continua, che in linea di principio e' anch'essa nota. L'idea e' allora quella di "staccare la coda" da Γ per "attaccarla" a G. Questo e' facile per la banda semiellittica, che ha tutti gli a e i b uguali, ma in generale farlo con un procedimento brute force non e' una buona idea. E' molto meglio approfondire la matematica del problema e sviluppare una approssimazione di Pade' alla frazione continua, che presto definiremo. E' evidente a priori che la frazione troncata ad un certo livello N equivale al rapporto di due polinomi; per determinarli, consideriamo gli autostati |α> = ∞ ∑f(α)n un (2) n=0 della catena lineare, che soddisfano l'equazione di Schro"dinger ∞ ∞ ∑f(α)n [an un +bn+1un+1+bn un-1] = E (α) ∑f(α)n un , n=0 n=0 dove si intende che u-1 ≡0. Riarrangiando la somma, si ha ∞ ∑[(a n -E)f(α)n +bn+1f(α)n+1+bn f(α)n-1] (3) u n =0. n=0 Poiche' il set degli u e' ortonormale, il coefficiente di un deve annullarsi. Ne conseguono le r.r. (relazioni di ricorrenza) (a n -E)f(α) n +bn+1f(α) n+1+bn f(α) n-1 =0. (4) Poiche' le relazioni sono omogenee, e f-1 ≡0, e' naturale porre f(α) n = f(α) 0Pn (E) ≡ <0|α>Pn (E) (5) dove i Pn sono funzioni di E che hanno le stesse r.r. (a n -E)P(E)+bn+1P(E)n+1+bn P(E)n-1 =0. =384= (6) Prof. M. Cini -Corso di Fisica Atomica e Molecolare con P-1 =0, P0=1. Tutti gli altri Pn sono determinati da tali equazioni, e dipendono solo dagli a e b dei 'siti' precedenti della catena. E' evidente che Pn (E) e' un polinomio in E. Supponiamo di normalizzare gli stati su N siti, per poi prendere il limite N→∞ . Per le f(α) n = <un |α> valgono le relazioni di ortonormalita' N (7) ∑ f (α)n * f(β)n =δαβ, n=0 N ∑ α f (α) m* f(α) n =δmn ; (8) quest'ultima sommatoria puo' essere convertita in integrale su E δmn = ∑ α f (α) m* f(α) n ∞ = ∞ = ∑ ∫dE δ(E-Eα )f (α) m* f(α) n = α -∞ <0|α><α|0>δ(E-Eα ) P(E)m* P(E)n ; ∫dE ∑ α -∞ questo dimostra che i Pn sono polinomi ortogonali, nel senso che soddisfano le relazioni ∞ ∫dE Pn (E) ) Pm(E) n(E) = δmn , (9) -∞ dove n(E) e' la densita' locale degli stati. Consideriamo ora una catena finita di N siti; il suo determinante secolare ∆N(E) sara' costituito dalle prime N righe e colonne di D 0, cioe' 0 ... E-a0 - b 1 0 -b1 E - a 1 - b 2 0 . . . ∆N(E) = det 0 ; - b 2 E-a2 -b3 ... NxN . . . . . .. consideriamo allora la successione dei determinanti ∆n (E) ed espandiamo ∆n+1(E) negli elementi dell'ultima riga: ∆n+1(E) = ... det . . . . . . . = (E-an )∆n (E) +bn det . . . . . . . . . . . .. - b n - 2 E-an-2 - b n-1 0 = 0 - b n-1 E - a n-1 - b n 0 0 -bn E-an . . . - b n - 2 E-an-2 0 - b n-1 =385= . . . 0 ; - b n Prof. M. Cini -Corso di Fisica Atomica e Molecolare il contributo in bn-1 e' nullo e resta ∆n+1(E) = (E-an )∆n (E) - b n 2 ∆n-1 (E). (10) Queste ulteriori relazioni ricorrenti suggeriscono una parentela con i polinomi, ed infatti ∆n (E) = b1b2...bn Pn , come e' immediato vedere moltiplicando la relazione di ricorrenza fra i Pn per b1b2...bn . Tornando alla catena di N siti, abbiamo trovato che D0 = ∆N = b1b2...bNPN(E). Per trovare una nuova espressione di G0 manca solo D1; ma D 1 e' l'analogo di D 0 in una catena privata del sito 0. I polinomi associati a tale catena soddisfano a relazioni di ricorrenza identiche a quelle dei Pn , tranne che si annullano sul sito 0. Potremo definirli come segue: Q 0=0 , Q 1(E)=1, (a n -E)Qn +bn+1Q n+1+bn Q n-1 =0. (11) I Pn ed i Qn sono le soluzioni indipendenti per la catena lineare di N siti che corrispondono a "condizioni iniziali" diverse. Di conseguenza, D1(E)=b2b3...bNQ N(E), ed infine otteniamo per la catena finita Q N(E) G(N)0(E) = . (12) b1PN(E) Una rappresentazione di una funzione G0 come rapporto fra polinomi si chiama approssimante di Pade'. Il terminatore, troncato a N siti, sara', prendendo Θ come "controfigura" di Q, ΘN(Ε) Γ(Ν) 0(E) = β 1ΠN(Ε) , (13) dove i polinomi Πn e Θn soddisfano alle r.r. (α n -E)Πn +β n+1Πn+1+β n Πn-1 =0 , (α n -E)Θn +β n+1Θn+1+β n Θn-1 =0 ; il terminatore completo si ottiene con α N-1 → α N-1 + β N2t(E), dove t e' la funzione terminatrice. Ricavando Θn+1 e Πn+1 dalle r.r. , ponendo n+1=N, 1 ΘN=β N[(E-α N-1 )ΘN-1-β N-1 ΘN-2 ], etc., e sostituendo, facciamo comparire α N-1 . Si ha (Ε−α N-1 )ΘN-1 (Ε)−β N-1 ΘN-2 (Ε) Γ(Ν) 0(E) = . (14) β 1[(Ε−α N-1 )ΠN-1 (Ε)−β N-1 ΠN-2 (Ε)] Operiamo la sostituzione α N-1 → α N-1 + β N2t(E), (Ε−α N-1 )ΘN-1 (Ε)−β N-1 ΘN-2 (Ε)-β N2t(E)ΘN-1 (Ε) Γ0(E) = , β 1[(E-α N-1 )ΠN-1 (E)-β N-1 ΠN-2 (E)-β N2t(E)ΠN-1 (E)] e semplifichiamo di nuovo con le r.r.; =386= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ΘN-β Nt(E)ΘN-1 (Ε) . β 1[ΠN-β Nt(E)ΠN-1 (E)] Da qui si ricava esplicitamente la funzione terminatrice ΠNβ 1Γ0-ΘN t(E)= . (15) β N[β 1ΠN-1 Γ0-ΘN-1 ] Ora, tornando all'ultima espressione di Γ0(E) e passando dalle lettere greche a quelle latine, otteniamo G0 cui e' stata "attaccata la coda" t(E) con a N-1 → aN-1 + bN2t(E). Si ha .Γ0(E) = G0(E) ≈ 1 Q N-b Nt(E)Q N-1 . b1 PN-b Nt(E)PN-1 (16) E' ovvio che giova fare N piu' grande che si puo'; tuttavia il terminatore puo' dare risultati eccellenti con N relativamente piccoli se ha le corrette singolarita' di Van Hove ed ai bordi della banda. La proprieta' piu' importante di un buon terminatore e' quella di avere i bordi banda alle energie corrette. Per una banda estesa da -2b a 2b e singolarita' a radice quadrata ai z- z 2-4b 2 bordi banda, come sappiamo, Γ0(z)= . Allora se si hanno 2b2 parecchi continui dello stesso tipo, con il k-esimo fra xk e yk , 8γk xk +yk Γ0(z)= ∑ [z - (z-x k )(z-yk ) ]. 2 (yk -x k ) 2 k L'approssimante di Pade' Γ(N)0(z) si ottiene combinando linearmente quelli dei singoli contributi con pesi γk , e cosi' possiamo trovare t(E) e "terminare" correttamente un calcolo realistico. 16-4 Momenti 1 L'approccio puo' essere considerato una versione ottimizzata del metodo dei momenti, che merita di per se' di essere discusso. Sia |0> uno stato arbitrario di un sistema, e si debba calcolare una densita' degli stati "locale" n(ω) =<0|δ(ω-H)|0> . (1) Anche se l' hamiltoniano H e' molto complicato, noi possiamo ottenere risultati utili calcolando i momenti µn =<0|H n |0> = ∞ ∫dω ωn n(ω) ; (2) -∞ 1F. Cyrot-Lackmann J.Phys.C:Solid State Phys.5,300 (1972); F. Cyrot- Lackmann, M.C.Desjonqueres and J.P. Gaspard, J.Phys.C:Solid State Phys.7,925 (1974) =387= Prof. M. Cini -Corso di Fisica Atomica e Molecolare anzi, se potessimo calcolarli tutti, e sommare la serie dell'esponenzale, otterremmo la (1) a meno di una trasformata di Fourier. Ora, µ0=1, µ1 e' il baricentro del livello virtuale, µ2 ci da' una informazione globale sulla sua larghezza, µ3 fornisce una misura del suo grado di asimmetria, ed al crescere di n si ottengono informazioni via via piu' dettagliate. Espandendo la funzione di Green per ω→∞ , si ha ∞ µk 1 G0(ω) = <u 0| |u0> = ∑ k+1 . (3) z-H z k=0 I primi momenti sono connessi col comportamento di n(t) per tempi brevi, mentre quelli con n grande determinano il comportamento asintotico per tempi lunghi. Se in pratica siamo in grado di calcolare i primi N momenti, nasce il problema di ricostruire da essi la migliore approssimazione possibile a n(ω). Una possibilita' ovvia e' quella di scegliere una forma funzionale dipendente da N parametri ed imporre N condizioni della forma (2). Per esempio, se sono noti gli estremi del continuo, uno puo' scegliere come forma funzionale un polinomio, o un'espansione in polinomi di Tchebychev; tuttavia, la presenza delle singolarita' di Van Hove implica una convergenza non uniforme del procedimento. Esiste pero' un metodo piu' potente, che utilizza l'espansione (2.16) della funzione di Green in frazione continua. Per semplicita', consideriamo il caso di un livello virtuale di forma simmetrica, per il quale tutti gli an sono nulli: 1 G0(E)= b12 Eb22 Eb32 EE-⋅⋅ Espandendo in potenze inverse di E, si ottiene (4) G0(E)≈ 1 b12 b12(b 12+b22) b12[b14+2b12b22+b24+b22b32] + + + + Ο(E-9 ). E E3 E5 E7 Identificando questa serie asintotica con la (3), e' chiaramente possibile esprimere i coefficienti bi 2 in termini dei momenti. Nel caso del livello simmetrico che stiamo considerando, tutti i momenti dispari sono nulli. E' facile vedere che µ4- µ22 µ2µ6- µ42 b12=µ2 , b22= µ , b32= 2 µ2µ4- µ23 , ... =388= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Esiste anche una formula generale. Nella teoria degli approssimanti di Pade' si dimostra1 che ∆i ∆i-2 bi 2= , (5) ∆i-1 2 dove ∆n e' il determinante µ0 µ1⋅⋅⋅µn µ1 µ2⋅⋅⋅µn+1 ∆n = Det . ⋅⋅⋅⋅⋅⋅ µn µn+1⋅⋅⋅µ2n (6) Questo risultato risolve anche l'inverso del problema di Haydock: data una densita' di stati n(ω), determinare i b i 2, cioe' l'hamiltoniano di una catena lineare "tight binding" semiinfinita di cui n(ω) e' la LDOS. Da n(ω) potremo calcolare un gran numero di momenti, ed una G(N)0(E), che potremo eventualmente continuare con un terminatore. Per esempio, il livello rettangolare Θ(ω2-W2) n(ω) = 2W consente un agevole calcolo dei momenti, da cui si deduce che n2 bn 2= W2 2 ; (7) 4n -1 e' in questo modo che e' stato eseguito il confronto fra la catena troncata e quella infinita nel paragrafo 2. Per la banda ellittica si ha W2 semplicemente bn 2= . (8) 4 La rappresentazione a frazione continua e' vantaggiosa se vogliamo ricostruire la funzione di Green a partire da una approssimazione per la densita' degli stati: non c'e' bisogno di calcolare la trasformata di Hilbert di n(ω) , ed i branch cuts vengono automaticamente corretti. Quello di Haydock e' un metodo generale per risolvere problemi quantistici, ed ha le caratteristiche tipiche dei metodi generali: e' esatto in linea di principio, ma spesso occorre molta ingegnosita' per ottenere una approssimazione soddisfacente ad un problema complicato. Il metodo e' stato fin qui applicato con grande successo ai problemi ad un elettrone, come quello di trovare la LDOS di modelli tight-binding. Dal punto di vista computazionale, dimostra proprieta' di stabilita' e convergenza che lo rendono molto conveniente. Non c'e' dubbio che dovra' rivelarsi molto utile anche in presenza di interazioni, anche se attualmente la sua applicazione ai problemi a molti corpi e' solo agli inizi. 1G.A.Baker Jr and P. Graves-Morris, "Pade' Approximants", Encyclopaedia of Mathematics and its Applications 14, Reading, MA, Addison-Wesley 1981 =389= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Capitolo 17- Metodo delle ampiezze di eccitazione 1 Questa tecnica si applica a sistemi di fermioni e bosoni in interazione e produce relazioni di ricorrenza che determinano le funzioni di Green. Per molti sistemi modello si ottengono soluzioni analitiche in forma chiusa. 17-1 Formulazione Consideriamo un sistema di elettroni e bosoni. I gradi di liberta' elettronici sono descritti da un hamiltoniano H F con cui supponiamo di saper calcolare esattamente le funzioni di Green. I bosoni liberi (fotoni, plasmoni, fononi, etc.) sono descritti da H B =∑ ωi bi † bi , (1) i dove l'indice i distingue le varie branche. L'interazione fermionebosone e' di solito presa lineare2, cioe' HI = ∑ γi Li (b i † +bi ), (2) i dove i γ sono costanti di accoppiamento e gli L i sono operatori che agiscono solo sui gradi di liberta' elettronici. Potremo sempre espanderli nella forma (3) ∑ P αβ λ(i,α,β), αβ dove α e β sono stati elettronici e P αβ = |α><β|. L'hamiltoniano totale e' H=H F+H B +H I . Vogliamo calcolare gli elementi di matrice della funzione di Green interagente3 Gµν = <Pµ(ω-H) -1 Pν >, (4) dove Pµ≡Pµµ , in termini delle "note" controparti non interagenti G0µν . Ovviamente, ω ha una piccola parte immaginaria positiva. A tal fine, definiamo le ampiezze di eccitazione Li = Ψ µν ({mi },{nj },ω) = <Pµ∏ b i mi(ω-H) -1 ∏ ( b j † ) njPν >, i j (5) 1M.Cini, Phys.Rev.B17,2486 (1978) 2in realta' questa restrizione non e' essenziale, ma qui ci limitiamo al caso piu' semplice, che e' adeguato per la maggior parte delle applicazioni. 3Il metodo consente di calcolare funzioni di Green piu' generali, medie termiche o su stati coerenti, etc., ma qui e' meglio fissare le idee sul caso piu' semplice. =390= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove la media e' sul vuoto dei bosoni. Sono ampiezze di probabilita' (non normalizzate) di andare da una configurazione di bosoni coi numeri di occupazione {nj } ed elettroni nello stato ν ad un'altra. Per calcolarle, usiamo l'identita' operatoriale (ω-H) -1 = (ω-H 0) -1 + (ω-H 0) -1 H I (ω-H) -1 , (6) dove H0=H-HI . Dal momento che bj mH 0n = (H0+mωj ) n bj m , (7) possiamo far comparire l'operatore risolvente imperturbato "spostato" R({mj }) = (ω-H 0- ∑ m j ωj ) -1 ; j l'identita' operatoriale diventa (8) Pµ∏ b i mi(ω-H) -1 ∏ ( b j † ) njPν = Pµ∏ R(m i )b i mi(b j † ) njPν + i j ij λ(k,α,β)γk Pµ∏ R(m i )b i mi(b k +bk † )Pαβ(ω-H) -1 ∏ ( b j † ) njPν . αβk i j (9) Prendendo il valore di aspettazione sul vuoto si trovano le seguenti equazioni ricorrenti per le ampiezze di eccitazione: + ∑ Ψ µν ({mi },{ni },ω) = G 0µν (ω- ∑ j m j ωj ) ∏ δ(m j ,nj )m j ! + j + ∑ λ(k,α,β)γk G0µα (ω- ∑ m j ωj )ζβνk ({mi },{ni },ω), αβk j (10) dove ζβνk ({mi },{ni },ω)= = Ψ βν(m 1,m 2,..mk+1,..,{n j },ω) +kΨ βν(m 1,m 2,..mk-1 ,..,{n j },ω). (11) Le ampiezze sono nulle per m e n negativi e vanno a 0 al crescere dei numeri di occupazione, e questo sistema infinito puo' essere risolto con un processo al limite. Le funzioni di Green cercate sono particolari Ψ, o possono, piu' in generale, essere espresse per mezzo di esse. Il metodo e' stato applicato per ottenere soluzioni esatte in forma chiusa di hamiltoniani modello, soprattutto nel campo =391= Prof. M. Cini -Corso di Fisica Atomica e Molecolare delle spettroscopie ottiche ed elettroniche. Mi limito qui ad alcuni esempi illustrativi1. 17-2 Polarone Locale Questo modello descrive un elettrone che si muove in una banda (discreta o continua) ed interagisce con un campo di bosoni quando si trova su un particolare "sito", il sito 0. Esso e' stato impiegato, ad esempio, nella teoria degli spettri di fotoemissione da stati di valenza. Ad esempio, i bosoni potrebbero essere le vibrazioni localizzate intorno ad una impurezza in un solido, o quelle di un atomo legato chimicamente ad una superficie. In notazione usuale, l'hamiltoniano e' H=H 0+H I , (1) dove H0 descrive l'elettrone ed i bosoni liberi, H 0=ε0c 0† c 0+∑ εk c k † c k +∑ V 0k[c 0† c k + h.c.] + ∑ ωqb† qbq, k k q (2) mentre il termine di interazione e' H I = n0∑ γq(b q† + bq) (3) q dove n0 = c 0† c 0. La banda e' caratterizzata da una densita' di stati locale ρ 0(ω), la cui trasformata di Fourier e' la funzione di correlazione ρ 0(t)=<n0.e -iH 0tn0>. Il metodo genera equazioni ricorrenti per le ampiezze di eccitazione Si ha Φ(q 1,q 2,....qk , ...,t) = <n0bq bq ... bq ...e-iHt n0>. 1 2 k ρ(t) = ρ 0(t) t -i ∫dt' ρ 0(t-t') ∑ γqΦ(q,t'), 0 q (4) t Φ(q 1,q 2,....qk ,t) = -i ∫dt' exp[-i(ωq +...+ωq )t]ρ 0(t-t') 1 k 0 1 altri modelli sono risolti in un recente articolo di rassegna: M.Cini and A.D'Andrea, J. Phys.C: Solid State Phys.21, 193 (1988). =392= Prof. M. Cini -Corso di Fisica Atomica e Molecolare {γ q Φ(q 2,....qk , t) +... + γ q Φ(q 2,....qk-1 ,t) 1 k +∑ γq'Φ(q 1,q 2,....qk ,q k+1,t)}. q' (5) Nel limite di un livello "di core", ρ 0(t) e' un fattore di fase che con opportuna scelta dell'origine delle energie puo' essere preso uguale a 1. In tale limite, le equazioni ricorrenti sono risolte dall'Ansatz Φ(q 1,q 2,....qk , ...,t) = f(q1,t)f(q2,t) ... f(qk ,t) ...ρ(t) (6) dove ρ(t)=<n0.e -iHt n0> e' la funzione di correlazione interagente, e γq f(q,t) = ωq (e -iω qt-1). (7) Sostituendo l'ansatz nelle equazioni ricorrenti si trova la soluzione esatta γq 2 ρ(t)=exp(∑ [e-iω qt +iωqt-1]). (8) ωq2 q Le equazioni ricorrenti valgono per qualsiasi forma di ρ 0(ω), ma il problema non e' stato risolto nel caso generale. Con una ρ 0(ω) arbitraria, la soluzione si ottiene in forma chiusa se non c'e' dispersione dei bosoni in energia, cioe' se ωq ≡ ω0. Allora tutto dipende dal parametro β= ∑ q γq2. Ponendo . . . ∑ γq γq ... γq ...Φ(q 1,q2,....qk ,ω) (9) 1 2 k q1 qk le relazioni di ricorrenza si riducono a Φ0(ω) = G 0(ω)[1+Φ1(ω)], (10) 0 Φk (ω) = G (ω-kω0)[Φk+1(ω) +kΦk-1 (ω) ], (11) 0 dove G e' la funzione di Green locale non interagente, G0(t)=-iρ 0(t)Θ(t). Quella interagente e' allora G= Φ0, e risulta Φk (ω) = G(ω)= ∑ G0(ω) βG0(ω)G 0(ω−ω0) 1βG0(ω−ω0)G 0(ω−2ω0) 1-2 βG0(ω−2ω0)G 0(ω−3ω0) 1-3 1-... =393= . (12) Prof. M. Cini -Corso di Fisica Atomica e Molecolare La soluzione esatta assume la forma di una frazione continua. Occorre notare pero' che, a parte una analogia superficiale, questo metodo ricorsivo e' del tutto diverso da quello di Haydock. Qui figura direttamente G0, che gia' contiene tutta l'informazione sui gradi di liberta' elettronici. Quando e' applicabile, questo metodo e molto piu' potente. Per esempio, possiamo scegliere G0 in modo che la densita' locale degli stati abbia una forma triangolare. Prendendo il continuo fra ω=-1 e ω=1, e assumendo un allargamento lorentziano δ=0.05, ρ (0) (ω) ha la forma di un triangolo isoscele un po' arrotondato. 0.8 0.6 0.4 0.2 -2 -1.5 -1 -0.5 0.5 1 1.5 La densita' degli stati che si ottiene da G e' la seguente: 3 2.5 2 1.5 1 0.5 -2 -1 1 2 3 Lo "shift di rilassamento" e l'esistenza dei satelliti ci erano gia' noti dal Capitolo 13; la soluzione esatta mostra anche una deformazione caratteristica della forma del livello virtuale. 17-3 Effetto Raman risonante Come sappiamo (Capitolo 14), l'effetto Raman puo' essere pensato come una successione di due transizioni virtuali, che formano un unico evento quantico coerente; nessuna delle due, da sola, conserva l'energia. Quando pero' la frequenza ω1 del fotone incidente coincide con una delle transizioni elettroniche reali della molecola, si ha l'effetto Raman risonante, e la formula del tensore Raman Rpq = ∑[ n <f|dp|n><n|dq|i> <f|dq|n><n|dp|i> + [ω ni - ω 1] [ω n f +ω 1] =394= ]. (1) Prof. M. Cini -Corso di Fisica Atomica e Molecolare diverge (ω ni - ω 1=0). Si puo' prevenire questa singolarita' sostituendo il denominatore con ω ni - ω 1-iΓ, dove Γ tiene conto fenomenologicamente della larghezza finita dei livelli1. Non c'e' quindi una vera divergenza; piuttosto, un unico stato eccitato domina la risposta di tutti gli altri, e l'intensita' dello spettro puo' venire esaltata di alcuni ordini di grandezza. In effetti, la descrizione si semplifica, perche' basta considerare un solo stato elettronico eccitato, e il contributo dominante e' dato dal primo dei diagrammi del Capitolo 14. Un semplice modello di molecola vibrante puo' illustrare gli aspetti fisici essenziali. Consideriamo la molecola nello stato fondamentale, descritta da H 1 = ε1c 1† c 1 + Ωb† b, (2) † dove c1 crea l'elettrone ottico nello stato fondamentale di energia ε1 e b† crea una vibrazione di frequenza Ω. Nello stato eccitato, H 2= ε2c 2† c 2 + Ωb† b +g(b† + b)n2, (3) ed esiste un accoppiamento g fra l'elettrone e la vibrazione. Il suo significato fisico e' che lo stato elettronico eccitato ha lunghezze di legame di equilibrio modificate, e cio' corrisponde ad uno spostamento dell'oscillatore armonico. Dobbiamo poi includere il campo della radiazione, con H 3 =∑ ωα dα † dα , (4) α dove α sta per l'insieme dei numeri quantici dei fotoni, che sono creati dagli operatori dα † . Infine, l'accoppiamento radiazione-materia e' descritto da HI = ∑ α [ M α * c 2† c 1 + h.c.](dα +dα † ), (5) dove Mα e' l'elemento di matrice di dipolo della transizione elettronica. Spesso questo tipo di problemi viene trattato nella "Rotating Wave Approximation" (RWA), che consiste nell'omissione dei termini come c2† c 1dα † , che descrivono processi che non conservano l'energia (un elettrone viene promosso ed un fotone emesso): allora si ha H I (RWA) = ∑ α [ M α * c 2† c 1dα + h.c.]. (6) Questa semplificazione del modello e' ragionevole in condizioni di risonanza; comunque, con il nostro metodo possiamo risolvere il problema esattamente sia con che senza la RWA 2. 1Piu' rigorosamente, Γ dovrebbe essere sostituita dalla self-energy dovuta all'interazione radiazione-materia, che descrive gli effetti di decadimento radiativo ed il tempo di vita finito degli stati eccitati. 2A.D’Andrea, Phys.Rev. A39, 5143 (1989) =395= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Dopo l'assorbimento del fotone ω1, il sistema si trova nello stato elettronico eccitato e si evolve con H2. A causa dell'accoppiamento vibronico, puo' aver luogo la creazione di un numero n qualsiasi di quanti di vibrazione. Quando il sistema decade, l'eccitazione vibrazionale rimane, e di hanno le righe Raman con ω2 = ω1 -n Ω. L'ampiezza di probabilita' del processo con n quanti e' proporzionale alla ampiezza di eccitazione φ(n) (ω1) = <g|c 1† c 2bn (ω1 - H 2) -1 c 2† c 1|g> . (7) Nella RWA, φ(n) e' stata ottenuta esattamente per la prima volta da Hong1, e la soluzione mostra che lo spettro Raman risonante puo' dar luogo ad una serie di picchi vibronici; la distribuzione dell' intensita' e' governata dal rapporto g/Ω. Per g maggiore di Ω, siamo nel regime polaronico, e le righe con n≈ g/Ω hanno la massima intensita'. Il metodo delle ampiezze di eccitazione, essendo piu' potente di quello di Hong, consente di risolvere esattamente modelli ben piu' realistici e complicati. E' stato cosi' possibile considerare l'effetto Frank-Condon (un valore modificato di Ω nello stato eccitato), la presenza di piu' modi vibrazionali, deviazioni delle vibrazioni dalla armonicita', ed anche parecchi livelli elettronici. E' stato proposto anche un modello esattamente risolubile per lo spettro Raman risonante di molecole adsorbite2. 17-4 Complessi accettore-donore Talvolta due molecole si uniscono per formarne una sola, senza stabilire fra loro ne' legami covalenti ne' legami ionici. Un piccolo scambio di carica di solito avviene, e si parla di "complessi accettoredonore"; fra gli esempi piu' noti c'e' l'unione di una molecola di idrochinone ed una di chinone per formare il chinidrone, e il caso di BF3 e NH3 che formano BF3←NH3. Si tratta di legami chimici piuttosto deboli, ma perfettamente stabili, che sono anomali solo nel senso che non si lasciano inquadrare negli schemi piu' comuni. I chimici organici hanno grande familiarita' con i complessi. Noi cercheremo di capirne la natura, ma a questo scopo sceglieremo un esempio semplice. Lo Xe e' un gas inerte, ma sulla superficie dei metalli di transizione come il Pt da' luogo a un chemisorbimento, anche se di tipo anomalo. L' energia di legame ≈0.3 eV e' troppo elevata perche' si possa parlare di fisisorbimento3, e le misure di lavoro di estrazione 1H.K. Hong, J. Chem.Phys. 67, 801 (1977) 2A.D'Andrea, Solid State Commun. 57, 763 (1986) 3cioe' dell'effetto delle sole forze di Van der Waals. =396= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dimostrano che c'e' un trasferimento di carica elettronica dallo Xe al metallo. Il metallo e' caratterizzato da una stretta banda d quasi totalmente occupata. La densita' degli stati al livello di Fermi e' essenzialmente di tipo d, mentre la banda s e' la principale responsabile della polarizzabilita' del metallo. Grazie agli stati d vuoti, il metallo puo' fungere da accettore; ma in questo caso non puo' esserci un legame ionico, perche' il livello di valenza εa dello Xe e' molto piu' legato del livello di Fermi EF. D'altra parte, un legame covalente e' escluso, poiche' lo Xe e' un gas nobile. banda s E F Xe banda d εa Si tratta di un "complesso" superficiale, di un tipo che e' stato spiegato molto tempo fa da Mulliken 1 in termini semiclassici col suo modello Charge Trasfer - No Bond (CTNB). Chiamiamo |CT> lo stato ionico Xe+Me - , dove Me sta per il metallo, e |NB> lo stato neutro XeMe. In assenza degli effetti di polarizzazione, εCT>εNB, quindi ci aspettiamo che non si formi nessun legame: |NB> e' lo stato fondamentale. Ma c'e' il potenziale immagine, che mescola gli stati: la ε -e 2 CT 4d matrice hamiltoniana e' -e 2 , dove d e' la distanza dello Xe εNB 4d dalla superficie; e adesso lo stato fondamentale non e' piu' |NB>, ma un autovettore che contiene una componente ionica ed ha energia piu' bassa. Qualitativamente, il modello di Mulliken e' soddisfacente. Pero', il potenziale immagine classico e' una approssimazione molto cruda alla realta': per descrivere gli effetti di polarizzazione da un punto di vista microscopico occorre introdurre le eccitazioni elementari del solido, ed in primo luogo i plasmoni di superficie. Cominceremo quindi con un modello semplice dei plasmoni. Quelli di volume sono modi normali (esatti, a dire il vero, solo per vettori d'onda q→0) di un liquido di Fermi omogeneo. Consideriamo una barra metallica e supponiamo di spostare 1R.S. Mulliken, J. Amer. Chem. Soc. 74, 811 (1952) =397= Prof. M. Cini -Corso di Fisica Atomica e Molecolare rigidamente di una piccola distanza η il liquido di Fermi rispetto al fondo delle cariche positive. η Ne risulteranno densita' di carica ±ηne sulle due facce opposte, che produrranno un campo elettrico E=4πηne, dove n e' la densita' del d2η liquido di Fermi. L'equazione del moto e' mn 2 =-neE=-4πn2e2η, e la dt coordinata collettiva η esegue un moto armonico di pulsazione ωp= 4πne2 . m Quindi, i plasmoni sono bosoni, e per piccoli vettori d'onda q hanno ω≈ωp. Se introduciamo una carica "esterna" nel punto r, questa "sente" il potenziale φ(q,r) associato a ogni plasmone; l'energia di rilassamento |φ(q,r) | 2 (vedi Capitolo 13.4) e' un contributo importante ωp ∆E=∑ q all'energia di polarizzazione del metallo. Ma il campo e' nullo fuori dalla barra: i plasmoni di volume non si accoppiano con cariche poste fuori del metallo, e non spiegano il potenziale immagine. Un metallo semi-infinito ha anche plasmoni di superficie, che sono oscillazioni collettive del liquido di Fermi, la cui densita' di carica e' apprezzabile solo nelle immediate vicinanze della superficie. Ad uno spostamento η ora corrisponde una densita' di carica ηne su una sola faccia; la forza di richiamo sull'oscillatore e' ridotta alla ωp meta', e la pulsazione e' ωs= . I plasmoni di superficie sono 2 anch'essi bosoni, ma hanno un q bidimensionale, ed un potenziale φ(q,r) ∝ exp[iq ], dove =(x,y). Poiche' fuori dalla superficie (z>0) non ci sono cariche, l'andamento lungo z e' presto determinato: dev'essere ∂2 [ 2 -q 2] φ(q,r)=0 , z>0 (1) ∂z e quindi φ(q,r) = Nq exp[-|q|z +iq⋅ ]. Il fattore di normalizzazione Nq puo' essere fissato imponendo che l'energia di rilassamento per una carica a distanza z dalla superficie sia uguale al potenziale immagine =398= Prof. M. Cini -Corso di Fisica Atomica e Molecolare A classico. Sia A l'area della superficie: ∑ → d 2q. Si constata che (2π) 2∫ q πωse2 . qA Per quanto semplificata, questa descrizione (nota come "modello idrodinamico") e' superiore a quella classica, e tiene conto del fatto che le cariche di polarizzazione non possono rispondere istantaneamente alle sollecitazioni. il potenziale immagine corrisponde alla scelta Nq=i Vogliamo costruire una controparte quantistica1 del CTNB, e cominciamo col separare gli effetti di polarizzazione dal resto, scrivendo H=H 0+H 1 . (2) Qui, H 0 schematizza i livelli elettronici nella figura, H 0=εac a† c a + εk c k † c k +V0[c a† c k +c k † c a ] +ωsb† b, (3) con un livello k che rappesenta gli stati occupabili della banda d, mentre ωsb† b rappresenta il campo libero dei plasmoni di superficie. Il termine in V0 rappresenta un legame covalente, di cui abbiamo escluso l'esistenza nel sistema in studio; la sua inclusione nella (3) pero' e' necessaria, e sara' giustificata fra breve. Gli effetti di polarizzazione sono contenuti in H 1=[P0c a† c a +γ0(c a† c k +c k † c a)](b+b† ), (4) † che e' lineare nella coordinata (b+b ) del plasmone, e consta di due termini. Infatti, il potenziale elettrostatico φ dei plasmoni ha un elemento di matrice diagonale P0=<a|φ|a>, per il quale i plasmoni si polarizzano se c'e' un elettrone nell'orbitale dello Xe, ed un elemento di matrice fuori diagonale γ0=<a|φ|k>. Questo modello non e' ancora quello che vogliamo: fisicamente, ci aspettiamo che i plasmoni si polarizzino intorno ad uno Xe+, cioe' nello stato "charge transfer". Ma cio' si ottiene facilmente con una trasformazione canonica a variabili di buche a† =c ed a nuovi operatori bosonici d† tali che P0 d† = b† - ωs . (5) Il nuovo hamiltoniano e' H'=∆E+ Eaaa† aa + Ek ak † ak +V[aa† ak +ak † aa ] +ωsd† d+ +[Paa† aa +γ(a a† ak +ak † aa)](d+d † ), (6) dove ∆E sposta tutti i livelli allo stesso modo, e semplicemente ridefinisce lo zero delle energie, ma 2γ0P0 2P02 Ea= ωs - εa, Ek =- εk , V= ωs -V 0, P=-P0, γ=-γ0. (7) 1M.Cini, Surface Sci. 79, 589 (1979) =399= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Cosi', vediamo che il prodotto γ0P0 produce qualcosa di analogo ad un legame covalente, se ambedue i meccanismi sono presenti. Nel problema in esame, V=0, quindi nella (3) dovevamo includere un V0≠0. Il problema definito da H' e' fra quelli che possono essere risolti esattamente con il metodo delle ampiezze di eccitazione. Definiamo le loro trasformate di Laplace 1 Φµν (m,s) = <aµdm a † >, (8) s+iH ν dove gli indici greci assumono i valori a e k; useremo la notazione Dµν (s)=Φµν (m=0,s) (9) 0 per la trasformata della funzione di Green e D µν (s) per il suo limite non interagente. Le equazioni ricorrenti sono: Φµν (m,s) = δm0D0µν (s)-iγD0µa(s+miωp)[m Φkν (m-1,s) + Φkν (m+1,s)] + -i[PD0µa(s+miωp)+γD0µk (s+miωp)][m Φaν (m-1,s) + Φaν (m+1,s)] . (10) Risolvendo questo sistema si ottiene la D µν (s) con i suoi infiniti poli. Nello studio del legame dei complessi ci interessano essenzialmente i due poli di energia piu' bassa, mentre gli altri si possono considerare satelliti di plasma. Per V=0, si ha un abbassamento dello stato fondamentale, e cioe' la formazione di un legame, purche' sia Pγ≠0. Si puo' dimostrare che il modello CTNB di Mulliken corrisponde al limite ωp→∞ della teoria quantistica. I parametri P0 e γ0 possono essere stimati, per esempio, a partire dal modello idrodinamico dei plasmoni, ed i risultati sono compatibili con i dati sperimentali. Capitolo 18- Diagrammi di Feynman con applicazioni Il metodo perturbativo e' molto utile per capire gli effetti di correlazione, e lo illustreremo studiando l'espansione diagrammatica delle funzioni di Green a un corpo. Cominceremo con un approccio intuitivo; i fondamenti della teoria rigorosa saranno esposti nel capitolo seguente. 18-1 Regole diagrammatiche ed equazione di Dyson Supponiamo di avere un sistema di elettroni non interagenti di Hamiltoniano H 0. Usiamo la seconda quantizzazione, con ca† che crea un elettrone in uno stato a particella singola a, e la rappresentazione di Heisenberg, =400= Prof. M. Cini -Corso di Fisica Atomica e Molecolare c a(t) = exp(iH0t)c aexp(-iH0t). (1) Il propagatore (Capitolo 15) e' definito da G0(a,b,t)= -i<0|T[ca(t)c b† (0)]|0>, (2) dove la media e' presa rispetto allo stato fondamentale. Sappiamo che G0 e' diagonale sulla base degli autostati |k>, ed e' la funzione di Green dell'equazione di Schro"dinger; inoltre, δkk' G0(k,k',ω) = ≡ δ kk' G0(k,ω) , ω-εk + i ηk con ηk =+0 per stati vuoti, ηk =-0 per stati pieni. Con H=H0+V ,dove V e' l'interazione coulombiana, definiamo G(a,b,t)= -i<T[ca(t)c b† (0)]>, (3) dove la media e' presa rispetto allo stato fondamentale interagente e l'evoluzione avviene con H. Espandiamo G(a,b,ω) in potenze di V. All'ordine n si ha l'ampiezza di evolversi dallo stato b allo stato a dopo esattamente n interazioni. Il contributo di ordine n e' la somma di ampiezze parziali rappresentabili con diagrammi. Le "regole diagrammatiche" sono le seguenti. 1) Tracciare due punti "esterni" ed n linee di interazione che terminano in "vertici di interazione" •--------• 2)Unire i punti esterni e tutti i vertici con linee "elettroniche" in modo che una linea termini in ciascuno dei punti esterni ed una linea passi per ciascun vertice. Tralasciare i diagrammi che sono formati da parti disconnesse. Alla fine, avremo una linea elettronica che unisce i punti esterni passando per alcuni vertici ed eventualmente un certo numero di percorsi chiusi, attaccati al resto del diagramma da linee di interazione. Orientare con frecce sia la linea che i percorsi chiusi. 3) Tutto cio' puo' essere fatto, in generale, in molti modi diversi per un dato n. Ma due diagrammi sono equivalenti (e vanno considerati come lo stesso diagramma) se sono topologicamente equivalenti, cioe' se possono essere deformati con continuita' l'uno nell'altro. Consideriamo il seguente diagramma, ed immaginiamo che le sue linee continue e tratteggiate rappresentino fili di caucciu'. a b Tirando per gli estremi a e b e ruotando il circuito chiuso, possiamo trasformarlo in un diagramma topologicamente equivalente: =401= Prof. M. Cini -Corso di Fisica Atomica e Molecolare a b L'orientazione delle frecce non ha a che fare con la propagazione per tempi positivi o negativi ed ogni singolo propagatore puo' riferirsi sia ad elettroni che a buche. quindi il fatto che una freccia 'torna indietro' nel primo diagramma e non nel secondo non e' rilevante. 4) Etichettare ciascuna linea orientata col simbolo di uno spinorbitale; la linea entrante (dall'esterno) in uno dei due punti esterni si chiamera' b, e quella uscente dall'altro punto esterno a. 5)Etichettare sia le linee orientate che quelle di interazione con frequenze tali che alle linee esterne compete la frequenza ω ed a ogni vertice si conserva la frequenza (la somma di quelle delle linee entranti e' uguale alla somma di quelle uscenti). L'espressione corrispondente a ciascun diagramma si ottiene come segue. a) Per ogni linea elettronica scrivere un fattore iG0(k,ω). b)Per ogni linea di interazione, con le etichette disposte come segue k p α m n includere un fattore1 -iVkpmn = -i ∫dr ∫dr' φk † (r)φp† (r')φm(r)φn (r') = -iVpknm . (4) |r-r'| 1Bisogna adattarsi all'uso prevalente nella letteratura; nel Cap.5, quando parlavamo delle equazioni di Roothaan, lo stesso ideogramma aveva un nome diverso, e gli indici disposti in altro modo. =402= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Nel diagramma qui sopra, gli indici si leggono nello stesso ordine che nell'espressione corrispondente -iVkpmn . Attenzione pero' che cio' che conta e' l'identita' delle linee uscenti ed entranti, e la stessa espressione matematica si trova anche per il diagramma k m α p n c)Includere un fattore (-1) per ogni percorso chiuso, come ad esempio . d) Sommare su tutti gli spin-orbitali intermedi. e)Integrare su tutte le frequenze intermedie α,β,... con ∞ ⌠ dα ⌡2π ∞ ⌠ dβ .... ⌡2π (5) -∞ -∞ C'e' un caso in cui questa ultima prescrizione e' ambigua, e va meglio specificata. E' il caso in cui compaiono linee elettroniche non k,ω propaganti, come in vertice) e' . Il contributo (escluso il ∞ ∑ k ⌠ dω 0 iG (k,ω) = i ∑ G 0(k,t=0). 2π ⌡ k (6) -∞ Ma, per t=0, G 0 e' discontinuo, donde nasce l'ambiguita'. La prescrizione precisa e' quella di prendere t=0- . Cio' equivale a ∞dω -iω t 0 G0(k,t)= ∫ e G (k,ω)exp(iω0+). Poiche' iG0(k,t=0- ) = -n 0k , dove 2π -∞ n0k =1 per stati pieni e 0 per stati vuoti, il risultato e' - ∑ n 0k. k Poi si deve cambiar segno per il percorso chiuso, e in definitiva = ∑ k n 0k .... , (7) =403= Prof. M. Cini -Corso di Fisica Atomica e Molecolare somma nella quale bisognera' poi considerare la dipendenza da k del vertice di interazione. Vediamo il diagramma del primo ordine ω,a k,α ω,b ; il contributo analitico e' iG0(a,ω)iG0(b,ω)[(-i) ∑ V akbk n0k ] . (8) k Al primo ordine c'e' un termine "di scambio" che si ottiene da questo scambiando le linee uscenti dalla interazione. a k b k a b k k ⇒ Ma le due linee k vanno unite, perche' sono l'inizio e la fine della stessa linea; il diagramma di scambio e' a k a b b k ovvero k . Finendo di etichettarlo, ci si accorge che anche qui c'e' una linea non propagante: a,ω = b,ω k,α =404= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∞ = iG0(a,ω)iG0(b,ω) ∑ k ⌠ dα 0 iG (k,α)exp(iα0+)(-i)Vkabk = ⌡2π -∞ =iG0(a,ω)iG0(b,ω)[-(-i) ∑ V kabk n0k ] . k (9) Consideriamo ora l'intera serie per G. Indicando la funzione di Green interagente con una linea spessa, si ottiene una somma di diagrammi il cui numero e la cui complessita' crescono con l'ordine n in modo disastroso. E' evidente che questo metodo non consente di calcolare G esattamente; consente pero' di arrivare ad affermazioni esatte sul conto di G, basate su considerazioni topologiche. = + + + + + + + + +... Tutti i termini eccetto il primo hanno un fattore iG0(a,ω)iG0(b,ω), cioe' una linea entrante ed una uscente, fra cui e' inserita una selfenergy part. Una self-energy part e' lo stesso diagramma privato delle due linee esterne (anche se viene di solito disegnata con due =405= Prof. M. Cini -Corso di Fisica Atomica e Molecolare monconi delle stesse, per mostrare dove vanno inserite). Una selfenergy part e' definita propria, o irriducibile, se e' tale da non potersi tagliare in due diagrammi separati tagliando un propagatore. Cosi' il diagramma a sinistra e' riducibile, e quello a destra no: La Irreducible Self-Energy Σ e' la somma di tutte le "self-energy parts" irriducibili: Σ = + + +... +...... L'espressione matematica corrispondente si ottiene da quella dell'intero diagramma togliendo i fattori iG0 associati alle linee entranti ed uscenti. Per il primo ordine abbiamo ad esempio (-i) ∑ V akbk n0k -(-i) ∑ V kabk n0k . (10) k k Come ogni singola linea elettronica corrisponde a iG0, cosi' a Σ corrisponde l'espressione analitica -iΣ(ω), dove Σ si chiama anche lei 'self-energy'. Consideriamo allora l'equazione di Dyson = + Σ cioe' iG = iG0 + iG0 (-iΣ) iG; (11) risolvendola per iterazione, e sostituendovi lo sviluppo di Σ , si ottengono tutti i diagrammi, e ciascuno una volta sola. Ogni =406= Prof. M. Cini -Corso di Fisica Atomica e Molecolare approssimazione a Σ equivale ad una somma parziale della serie fino ad ordine infinito. La prima approssimazione Σ= ∑ V akbk n0k k permette di includere in G, fino ad ordine infinito, gli scattering ripetuti del tipo piu' semplice. In generale, Gab e Σab sono matrici e quella di Dyson e' una equazione matriciale. Dopo aver trovato una approssimazione a Σ, ci sara' da invertire una matrice, e nel caso di uno spettro continuo si dovra' risolvere una equazione integrale. Si ha un caso particolarmente semplice quando G e' diagonale sulla stessa base che diagonalizza G0. Tanta semplicita' puo' esistere solo per effetto di una elevata simmetria. Il Jellium e' un sistema infinito e uniforme di elettroni che si muovono su un fondo di carica positiva, anch'esso uniforme, che rende neutro il tutto. E' stato molto studiato come modello idealizzato degli elettroni di conduzione di un metallo. Allora, G0 e' diagonale su una base di onde piane, ma lo e' anche G , a dispetto di tutte le interazioni; le onde piane sono autofunzioni dell'operatore TR di traslazione con autovalore ei kR , e [H,TR]=0 ∀R per la simmetria traslazionale del problema. L'equazione di Dyson, scritta nella rappresentazione delle coordinate, comporta solo convoluzioni; trasformando di Fourier la mettiamo in forma scalare, G(k,ω ) =G0(k,ω ) + G0(k,ω )Σ(k,ω )G(k,ω ) e si ha 1 G(k,ω ) = ; 0 ω - ε ( k ) - Σ(k,ω) cosi', Σ si puo' interpretare come una correzione complessa all'autovalore imperturbato ε 0(k). 18-2 Fermioni non interagenti in un potenziale esterno Le regole diagrammatiche sono del tutto analoghe, ma il problema e' molto piu' semplice. I soli diagrammi sono: = + x + x x +... dove la barra spessa rappresenta iG(a,b,ω), quella sottile iG 0(a,b,ω) i = δ , mentre x sta per -iV ab . ω - εa+iηa ab Prendiamo come esempio il modello di Fano-Anderson non interagente (Cfr. Cap.2 e Cap. 12). Allora V ha solo gli elementi di matrice V 0k , dove 0 denota lo stato atomico localizzato e k percorre il continuo; oviamente c'e anche V k0 = V0k* . Per calcolare G00(ω) = G(0,0,ω) possiamo usare due metodi equivalenti. =407= Prof. M. Cini -Corso di Fisica Atomica e Molecolare 1) Possiamo cercare una equazione di Dyson per G00. La self-energy propria e' Σ = x______x |V0k|2 -iΣ(ω) = ∑ (-iV 0k)iG0k (-iV k0) = (-i) ∑ ω-εk +iηk . k k Quindi, ritroviamo la self-energy del capitolo 12, ma con Im(Σ) che cambia segno al livello di Fermi, e G0 1 G= = . (1) 0 1-ΣG ω - ε0-Σ(ω) 2) Possiamo cercare una equazione di Dyson matriciale per G in termini di una self-energy matriciale . Allora non chiediamo piu' che dalla self-energy propria escano due linee etichettate G000, ma semplicemente che escano due linee. Σ =x cioe' -i = -iV, e dobbiamo risolvere G = G0 + G0 G . (2) Piuttosto che invertire matrici, conviene scrivere le componenti G00 = G000 + G000 ∑ V0k Gk0(ω), (3) k Vk0 Gk0 = G0kk Vk0G00 = G (ω) (4) ω-εk +iηk 00 ............ da cui per sostituzione si ritrova subito il risultato. Si noti che, con ambedue i metodi, l'effetto del potenziale esterno e' incluso esattamente calcolando la self-energy di ordine piu' basso (vale a dire, non esistono contributi di ordine superiore a Σ). 18-3 Elettroni interagenti:Self-Energy del primo ordine Supponiamo di aver determinato il set di spin-orbitali {a,b,⋅⋅⋅} che diagonalizzano l'hamiltoniano H0 in assenza di interazioni fra gli elettroni, e di voler correggere la funzione di Green con il termine diretto di primo ordine Σab (ω) = ∑ V akbk n0k , (1) k che e' l'elemento ab della self-energy matriciale Σab (ω) = ∑ k V akbk n0k = occ ∑ ∫d3r ∫d3r' k =408= . Viene a* (r)k * (r')b(r)k(r') |r-r'| Prof. M. Cini -Corso di Fisica Atomica e Molecolare = W0ab , (2) cioe' l'elemento di matrice del potenziale efficace occ ∑ | k ( r')|2 k W0(r) = ∫ d 3r' (3) |r-r'| che coincide col potenziale elettrostatico generato dalla densita' di carica . Avremmo ottenuto lo stesso Σab se avessimo considerato elettroni non interagenti in un potenziale esterno efficace W0(r). La self-energy del primo ordine include esattamente gli effetti di W0(r); e' come se avessimo rideterminato gli orbitali con W0 incluso nel potenziale e poi avessimo espresso G di nuovo nella vecchia base {a,b,⋅⋅⋅}. Tutto cio' corrisponde al primo passo di un procedimento autoconsistente. I nuovi orbitali, ottenuti in presenza di W0, non coincidono piu' con quelli con i quali W0 era stato calcolato. Il secondo passo del procedimento autoconsistente richiede che la densita' di carica sia ottenuta con la funzione di Green del primo passo. Allora, la self-energy e' + + + .. e possiamo interpretarla come se gli elettroni non interagissero, ma si muovessero in un nuovo potenziale efficace W 1(r); beninteso, gli elementi di matrice di G sono poi sempre presi sulla vecchia base. Iterando l'argomento, si giunge all'autoconsistenza: Σ= dove la linea spessa rappresenta la funzione di Green "vestita". Questa e' l'approssimazione di Hartree; introducendo anche il termine di scambio si trova l'approssimazione di Hartree-Fock Σ= + . =409= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Noi siamo partiti con un hamiltoniano imperturbato H0 non interagente, e con la base imperturbata {a,b,⋅⋅⋅} ; cosi', abbiamo trovato il potenziale di Hartree-Fock come una correzione di selfenergy di primo ordine. Equivalentemente, possiamo includere tutto il potenziale di Hartree-Fock nella parte a un corpo dell'Hamiltoniano, e in tal caso le correzioni di primo ordine vanno omesse. Quindi, se invece di partire da spin-orbitali non interagenti partiamo direttamente dalle soluzioni di Hartree-Fock, la serie per Σ comincia col 20 ordine. 18-4 Elettroni interagenti:Self-Energy del secondo ordine Dobbiamo considerare un termine diretto ed uno di scambio. Quello diretto e' -iΣ(ω) = Σ ≈ ω α m k n β β+α ω−α ω = (-) ∑ kmn ⌠ dα ⌡2π α ⌠ dβ 0 iG (k,ω-α)iG0(m,β)iG0(n,β+α)(-iVknbm )(-iVamkn ) ⌡2π (1) dove il primo fattore (-1) e' dovuto al percorso chiuso. Cominciamo col calcolo dell'integrale su β ∞ ⌠ dβ 0 G (m,β)G0(n,β+α) = ⌡2π -∞ ∞ ⌠ 1 1 dβ . (2) ⌡2π β-εm+iηm β+α-εn +iηn -∞ =410= Prof. M. Cini -Corso di Fisica Atomica e Molecolare con il metodo dei residui. Se i poli dell'integrando sono ambedue dalla stessa parte dell'asse reale (ηm e ηn dello stesso segno) si chiude il cammino di integrazione dall'altra parte e si trova immediatamente 0. Restano due casi: a) n occupato ed m vuoto, cioe' ηn <0 e ηm>0. Chiudiamo il cammino nel semipiano superiore, e troviamo, indicando l'integrando con @, ⌠ 1 dβ @ = 2πi∑ Res[@] = 2π ⌡2π lim -i = i β→−α+ε -iη [ β−(−α+εn -iηn ) @] = . α-εn +εm-i0 n n (3) b) m occupato ed n vuoto, cioe' ηm<0 e ηn >0 Chiudiamo il cammino di nuovo nel semipiano superiore. ⌠ 1 dβ @= 2πi∑ Res[@] = 2π ⌡2π lim 1 = i β→ε +i0[ {β−(ε m+i0)} ]= (β-εm-i0)(εm+α-εn +i0) m i = . α+εm-εn +i0 (4) Esaminiamo separatamente i due contributi a Σ. Caso a). Rimane da calcolare (con ni numeri di occupazione) -i ⌠ 1 -i dα n n [1-nm] Vknbm Vamkn . (5) 2π ω-α-εk +iηk α-εn +εm-i0 ⌡ kmn ∑ Di nuovo, perche' non venga 0 i poli, per α=ω-εk +iηk e per α = εn -εm +i0, devono essere da parti opposte rispetto all'asse reale, e cio' richiede ηk =-0, cioe' k occupato. L'integrale in dα si ottiene calcolando il residuo al polo nel semipiano superiore, che viene dal secondo fattore, e viene i ; ω-εn +εm-εk -i0 quindi il contributo e' -i ∑ kmn n k nn [1-nm] Vknbm Vamkn . ω-εn +εm-εk -iηm =411= (6) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Caso b). Cambia solo che ora m e' occupato, k e n vuoti (ed ηm<0). Sommando i contributi, si ottiene1 vuoto o c c o c c vuoti Vknbm Vamkn Σab (ω) = [ ∑ (7) ∑ + ∑ ∑ ] ω-εn +εm-εk -iηm . m k;n m k;n Veniamo al termine di scambio. Per ottenerlo, nel diagramma del secondo ordine tagliamo le linee che escono dai vertici in basso ed entrano in quelli in alto, ω α m k n β β+α ω−α ω α e congiungiamo i vertici nell'altro modo possibile. Mettiamo le etichette k e n in modo che lo scambio risulti nella interazione in alto, V amkn →Vamnk . ω α n m β+α β k ω−α ω α Il valore del diagramma si ottiene da quello diretto operando questo scambio di etichette e cambiando segno (non c'e' piu' il percorso 1Invece di -iη m si potrebbe scrivere equivalentemente +iηk , perche' m e' vuoto se k e' pieno e viceversa. =412= Prof. M. Cini -Corso di Fisica Atomica e Molecolare chiuso). Cosi' possiamo scrivere la self-energy totale del secondo ordine, comprensiva dei termini diretto e di scambio: Σab (ω) = =[ vuoto o c c ∑ m ∑ k;n + occ ∑ m vuoti Vknbm [Vamkn -Vamnk ] ∑ ] ω-εn +εm-εk -iηm k;n . (8) A differenza di quella del primo ordine, questa correzione e' estranea all'approssimazione di Hartree-Fock, ed e' complessa e dipendente da ω. Risolvendo l'equazione di Dyson, possiamo trovare G; se conoscessimo gli elementi di matrice potremmo calcolare lo spettro di fotoemissione. Anche senza arrivare a tanto, possiamo calcolare i poli, che corrispondono ai potenziali di ionizzazione ed alle affinita' elettroniche. Cosi' si hanno accurate correzioni ai calcoli Hatree-Fock utilizzando gli autovalori di Koopmans e gli spin-orbitali, senza dover ricorrere a molto piu' onerosi calcoli di interazione delle configurazioni. Ad esempio, un recente calcolo1 di potenziali di ionizzazione della Formaldeide CH2O ha mostrato che i valori di Hartree-Fock sono troppo alti, e che i valori corretti sono in buon accordo con l'esperimento. Le correzioni sono importanti (dell'ordine dell'eV). Questo approccio consente anche una stima dei tempi di vita degli stati profondi. 18-5 Regole di Feynman per la QED L'elemento di matrice di S=U(- ∞ , ∞ ) fra lo stato finale e quello iniziale che corrisponde ad un dato diagramma con il tempo che cresce verso l'alto si calcola come segue. Per ogni fermione esterno (entrante o uscente) di massa m ed energia E m 1 poniamo n= , e per ogni bosone esterno di energia E, n = . E 2E Allora, ext n S fi=δfi +(2π) 4δ(4)(P(tot) f -P(tot) i ) ∏ [ Vj ] (-iMfi ). (1) j Per calcolare -iM fi orientare tutte le linee fermioniche in modo che nelle linee entranti o uscenti gli elettroni abbiano la freccia in alto e i positroni in basso. Etichettare tutte le linee in modo che ad ogni vertice si conservi il quadrimomento. Assegnare una polarizzazione α ad ogni fotone. Scrivendo da sinistra a destra, includere, seguendo ogni linea elettronica in senso inverso, i fattori: 1eseguito da G.Hohleichner, F. Ecker e L. Cederbaum =413= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Vertice q ≡ |e|γµ (α) Fotone assorbito εµ Fotone emesso εµ (α) D (q) Propagazione di un Fotone q dove Dµν (q) = -eγµ δµν i(q 2-iε) µν Propagazione di un Fermione - i γ.q +m , G(q) = . i(q 2+m2-iε) (s) p,s Elettrone assorbito u (p) _ (s) p,s Positrone assorbito v (p) p,s p,s Elettrone emesso _ (s) Positrone emesso v (p) Esempio: nel diagramma della annichilazione a 2 fotoni, =414= G(q) u (p) (s) Prof. M. Cini -Corso di Fisica Atomica e Molecolare tempo p il positrone p e' assorbito, anche se esce dal vertice, perche' quella che conta e' la freccia del tempo. Altra regola: X Potenziale esterno -eA (q=p -p ) µ in out Esempio: Mott Scattering p' q X p _ -iM fi = -e u (s')(p')γµu(s) (p)A µ(q) d4q . Per (2π) 4 ogni circuito chiuso di linee elettroniche, includere un fattore -1 e la traccia sugli indici di Dirac. Due diagrammi che differiscono per uno scambio di linee fermioniche hanno segno opposto. Per ogni quadrimomento q non fissato in tal modo, ∫ Alcuni processi del secondo ordine Innanzitutto, ritroviamo i risultati noti per il Mo /ller scattering (collisione fra due elettroni) =415= Prof. M. Cini -Corso di Fisica Atomica e Molecolare p' 2 p'1 p 1 p' -p 1 1 p' 2 p'1 p 2 p' -p 1 2 p 1 exchange direct p 2 _ _ [u (s'1) (p '1) γµu(s1) (p 1)][u (s'2) (p' 2) γµu(s2) (p 2)] -iM fi= (-e) 2 i[(p 1-p' 1) 2-i ε] _ _ [u (s'1) (p '1) γµu(s2) (p 2)][u (s'2) (p' 2) γµu(s1) (p 1)] -(-e) 2 . i[(p 2-p' 1) 2-i ε] L'urto elettrone-positrone (Bhabha scattering) e' analogo: p' p' p' p'+ + p + p' -p + + direct p - p + p +p + p - annihilation _ _ [v (s+) (p +) γµv(s'+) (p' +)][u (s'-) (p' - ) γµu(s-) (p - )] -iM fi= (-e) 2(-) + i[(p +-p' +) 2-i ε] _ _ [v (s+) (p +) γµu(s-) (p - )][u (s'-) (p' - ) γµv(s'+) (p' +)] +(-e)2 . i[(p ++p- ) 2-i ε] Elettrone e positrone possono annichilarsi in 2 fotoni: =416= Prof. M. Cini -Corso di Fisica Atomica e Molecolare k2 k2 α2 k1 α2 α1 α1 p p + - s- p p s- s+ + - s+ k1 m m 1 1 )( )( )( ) (-iMfi ). E- V E+V 2ω1V 2ω2V _ -i γ.(p - -k 2)+m -iM fi = (-e2)v (s+) (p +)[ γ. ε(α1) γ.ε(α2)+ i[(p - -k 2) 2+m2-iε] -iγ.(p - -k 1)+m + γ. ε(α2) γ.ε(α1)]u(s-) (p- ). i[(p - -k 1) 2+m2-iε] Consideriamo infine la diffusione di Compton: Sfi = (2π) 4δ(4) (k 1+k 2-p- -p+) ( k 'α' k 'α' p' s' p-k' ps p' s' p+k kα ps kα _ -i γ.(p-k')+m -iM fi = (-e2)u (s')(p')[γ. ε(α) γ.ε(α') + i[(p-k')2+m2-iε] -iγ.(p+k)+m + γ. ε(α') γ.ε(α) ]u(s)(p). i[(p+k)2+m2-iε] Tutte queste formule possono essere calcolate analiticamente con metodi simili a quelli studiati per il Mo /ller scattering. Ci sono artifici utili per abbreviare i calcoli (vedere ad esempio il Sakurai). 18-6 Divergenze e rinormalizzazione. Polarizzazione del vuoto Nell'espansione della matrice S ci sono diagrammi che ridefiniscono i propagatori dell'elettrone e del fotone. Tali processi sono fondamentalmente diversi dagli altri, perche' tutto quello che si puo' fare sperimentalmente e' modificare le =417= Prof. M. Cini -Corso di Fisica Atomica e Molecolare condizioni in cui avvengono. Non potendo essere spenti in alcun modo, sono impliciti nella definizione di elettrone e fotone. Ecco il diagramma della Electron self-energy. k p' p p-k S fi = -i (2π) 4δ(4)(p-p') [ m m _(s') ][ ]u (p')Σ(p)u (s) (p), EV E'V (1) dove -Σ(p) = (-e)2∫ -iγ.(p-k)+m d4k 1 γ γ . µ (2π) 4 i(k2-iε) i[(p-k)2+m2-iε] µ (2) La self-energy Σ(p) e' una matrice 4x4, che non e' ne' uno scalare ne' un tensore. Nell'integrando figurano solo γ.p e γ.k , dato che (γ.p) 2=p2=m2 , (p-k) 2 = (γ.p-γ.k) 2. Poiche' k e' muto, Σ(p) e' una funzione di γ.p [o, se vogliamo, di γ.p e p2]. E' usuale rappresentarla, come matrice nello spazio spinoriale, nella forma Σ(p) = A + (iγ.p+m)B + (iγ.p+m) 2 Σf (p), (3) dove le sole matrici γ sono quelle esplicite. Ora, in _ u (s')(p')Σ(p)u (s) (p) soravvive solo il termine A, perche' gli spinori soddisfano all'equazione di Dirac. Una self-energy scalare puo' essere interpretata come una correzione alla massa dell'elettrone dovuta al fatto che e' carico; ma la massa "nuda" non e' fisica. I coefficienti A e B divergono, ma cio' non invalida la teoria perche' non sono osservabili. Pero' se poniamo l'elettrone in un campo esterno e calcoliamo le variazioni di Σ indotte dal campo, troviamo un accuratissimo accordo con l'esperimento. Un esempio e' il Lamb Shift. Difficolta' simili si hanno con la Photon self-energy =418= Prof. M. Cini -Corso di Fisica Atomica e Molecolare q p µ q ν p-q Questo diagramma modifica il propagatore del fotone D(q)δµν , che e' un tensore negli indici cronotopici µ,ν dei potenziali, nel propagatore interagente al second'ordine D (2) (q) dato da D(2) (q)δµν = D(q)δµν + D(q)δµλ [-iΠλσ (q)] D(q)δσν , (4) dove entra il tensore di polarizzazione -iΠµν (q)=-(-e0) 2∫ -iγ.(-q+p)+m -iγ.p+m d4p Tr{ γ γ }, µ 4 2 2 (2π) i[(-q+p) +m -iε] i[p2+m2-iε] ν (5) dove ho scritto e0 invece di e per ricordare che si tratta della carica "nuda". Questa espressione e' quadraticamente divergente ad alti p (catastrofe ultravioletta) come mostra un semplice conto delle potenze. D'altra parte, essa descrive le proprieta' di un fotone fisico in termini di quelle di un inesistente "fotone nudo" che non fa' coppie virtuali. Con il quadrivettore q, si puo' costruire il tensore qµqν ; quindi possiamo scrivere Πµν (q) = [D +q2Π(1) (q)]δµν + qµqν Π(2) (q) dove D e' una costante che da' il limite per q=0, mentre Π(1) e Π(2) dipendono da q2. Se ci fosse solo D, troveremmo δµν D(2) (q)δµν = i(q 2+D) e questa e' la funzione di Green dell'equazione di Klein-Gordon per una particella di massa D. La massa del fotone e' nulla, mentre D diverge. Questa e' una teoria che descrive l'interazione fra cariche "nude" e0 inosservabili attraverso lo scambio di fotoni "nudi" inesistenti di massa infinita. A questo punto, le divergenze possono sembrare una "cattiveria" immeritata. Dopo tutto, noi stiamo sviluppando una teoria 1 perturbativa in potenze di α. Ora, α≈ e' veramente piccolo, e 137 noi potremmo ritenere di avere ragione a considerare perturbativo il problema ed a trattare questi fotoni "nudi" inesistenti con le regole adatte ai fotoni fisici; come accade che alla fine fotoni "nudi" di quadrimomento enorme intervengono =419= Prof. M. Cini -Corso di Fisica Atomica e Molecolare nel problema e procurano le divergenze? Non c'e' dubbio che ad alte energie e piccole distanze la teoria debba essere modificata. Inoltre, un'espansione in potenze di α presuppone che tutte le grandezze siano analitiche per α=0, cioe' per e02=0. Ma una teoria con e02<0, per quanto piccolo in modulo, descriverebbe un mondo in cui cariche uguali si attirano, e cariche opposte si respingono. In un mondo cosi', il vuoto sarebbe instabile. Si ritiene pertanto che la serie della QED non sia convergente, ma semi-convergente: dopo un certo numero di termini, invece di convergere la serie perde significato. E' possibile pero' eliminare dalla teoria ogni riferimento alle entita' inesistenti e ridurla ad una teoria della interazione tra particelle fisiche: questo processo e' noto come rinormalizzazione. Poiche' non possiamo manipolare quantita' divergenti, facciamo prima di tutto un modello in cui il massimo q e' finito, e chiamiamolo Λ; i risultati fisici saranno poi indipendenti da Λ, purche' sia grande rispetto a tutte le energie in gioco. Consideriamo l'interazione di un elettrone con un nucleo di carica nuda Ze0. p' p A(q) p' X D(q) + A(q) X p _ -iM fi = -e 0 u (s')(p')γµu(s) (p)A µ(q)+ _ δµν - e 0 u (s')(p')γµu(s) (p) [-iΠνρ(q)]Aρ(q)= i(q 2-iε) _ =-e 0 u (s')(p')γµu(s) (p)A µ(q)+ _ 1 -e 0 u (s')(p')γµu(s) (p) 2 [-iΠµν (q)]Aν (q). iq (6) 1 Si vede che, nel termine correttivo, (-i)Πµν Aν (q) gioca il i(q 2-iε) ruolo di Aµ(q) nel primo, ed e' una correzione al potenziale 1 esterno; poiche' e' la funzione di Green dell'equazione i(q 2-iε) delle onde, J polµ =(-i)Πµν Aν (q) deve essere la trasformata della quadricorrente correttiva. Quest'ultima e' la quadricorrente dovuta alla polarizzazione del vuoto, indotta dal quadripotenziale nudo Aν (q). Si vede che Πµν merita il nome di tensore di =420= Prof. M. Cini -Corso di Fisica Atomica e Molecolare polarizzazione. Deve valere allora l'equazione di continuita' qµJ polµ =0, e questo per qualsiasi campo. Quindi, qµΠµν =0. (7) Se ne deduce che qµΠµν (q) = qµ[D +q2Π(1) (q)]δµν + qµqµqν Π(2) (q)=0, cioe' qν [D +q2Π(1) (q)]+qν q2Π(2) (q)=0, da cui si ricava D +q2Π(1) (q)=-q2Π(2) (q). Sostituendo in Πµν (q) = [D +q2Π(1) (q)]δµν + qµqν Π(2) (q), si ha: Πµν (q) = -q2Π(2) (q)δµν + qµqν Π(2) (q) Πµν (q) = [q2δµν - q µqν ]Π(q) (8) (2) dove Π(q)≡-Π (q). Questo e' un bel risultato, perche' ci consente di avere a che fare con uno scalare Π(q). Il termine diagonale e' (senza somma su µ) Πµµ (q) = [q2- q µqµ]Π(q) Sommando su µ troviamo 4 4 ∑ µ=1 ∑ Πµµ (q) = [4q2- q 2]Π(q) ⇒ Π(q) = µ=1 Πµµ ( q ) 3q2 . (9) Torniamo al problema dell'interpretazione fisica. Sperimentalmente, noi possiamo allontanare il nucleo dall'elettrone; in questo modo, q→0. Se chiediamo alla teoria come cambia l'ampiezza di diffusione elettrone-nucleo con la distanza, questa e' una domanda sensata, per la quale ci possiamo aspettare una risposta sensata [tranne che per il fatto che le nostre cariche sono tuttora nude, ma a questo provvederemo dopo]. Questo suggerisce di sostituire dappertutto Πµν (q) con Πµν (q) - Πµν (0) , e di calcolare, invece della (9), 4 ∑ Π(q) = µ=1 [ Πµµ (q)-Πµµ (0)] . (10) 3q2 Si trova allora dopo molti calcoli che Π(q) = C + q 2 Πf (q), (11) dove C e' una costante ancora divergente, ma solo logaritmicamente, 2α Λ C= ln[ ], 3π m f mentre Π (q) e' finito e per q piccoli vale =421= Prof. M. Cini -Corso di Fisica Atomica e Molecolare α 1 1 q2 [ + ⋅⋅⋅]. πm2 15 40 m2 Ze0δµ4 Per un nucleo fermo, Aµ(q) = ; inoltre, essendo il problema q2 statico, q4=0 e q2=q2. Pertanto, l'elemento di matrice _ _ 1 -iM fi =-e 0 (u 'γµu)Aµ(q)-e0(u ' γµu) 2 [-iΠµν ]Aν (q) iq diventa Ze0 Ze0 _ _ 1 -iM fi =-e 0 (u 'γ4u) 2 -e 0 (u ' γµu) 2 [-iΠµ4] 2 = q iq q 2 2 Ze0 _ Ze _ 1 'γ4u) - 0 (u ' γµu) =(u (-i)(C + q2 Πf (q))[q2δµ4 - q µq4] . 2 2 q q iq2 Poiche' q4=0, Ze02 _ Ze 2 _ 1 'γ4u) - 0 (u ' γµu) -iM fi =(u (-)(C + q2 Πf (q))q2δµ4 = 2 2 q q q2 Ze02 _ Ze02 _ ' =(u γ4u) - 2 (u ' γ4u) (-)(C + q2 Πf (q))= q2 q Ze02 _ _ =(u 'γ4u)(1-C) +Ze02(u ' γ4u) Πf (q) . 2 q Πf (q) = - La carica e0 che compare in questa espressione e' quella "nuda" e inosservabile. Il primo termine rappresenta una interazione coulombiana con una costante rinormalizzata e2 = e02(1-C). (12) La carica osservata e dell'elettrone e' ridotta di un fattore 1-C rispetto a e 0; si tratta in effetti di una carica schermata. Sia C che Πf sono di ordine α; cosi' nel secondo termine la differenza fra cariche nude e rinormalizzate e' del secondo ordine, e noi possiamo scrivere il risultato _ Ze2 _ -iM fi =- 2 (u 'γ4u)+Ze2(u ' γ4u) Πf (q) (13) q in cui compaiono solo grandezze osservabili. La teoria aveva un parametro e 0 e una costante C divergente: rinormalizzando, ce ne siamo liberati ottenendo un risultato finito. Si dira' che questa e' fanta-matematica, perche' abbiamo trattato C come se fosse piccolo mentre invece addirittura diverge. Questo aspetto della teoria non ha mai entusiasmato nessuno. Ci si puo' chiedere, Λ 3π pero', qual'e' il valore di Λ per cui C=1. La risposta e' = exp[ ] m 2α 645,59 280 =e = 2,4 10 . La massa dell'Universo osservato e' 80 dell'ordine di 10 m, e, come cutoff, dovrebbe bastare. Allora, C e' davvero O(α) e piccolo rispetto a 1. Pragmaticamente, =422= Prof. M. Cini -Corso di Fisica Atomica e Molecolare accettiamo il risultato con riserva e vediamo se ci sono conseguenze osservabili. Per q<<m, α _ Ze2 _ 1 -iM fi =- 2 (u 'γ4u)-Ze 2 (u ' γ4u) [ + ⋅⋅⋅]. (14) 2 q πm 15 La trasformata di Fourier da' il potenziale coulombiano corretto per gli effetti della polarizzazione del vuoto al primo ordine in α Ze2α Ze2 V(r) =δ(3) (r) . (15) 4πr 15πm2 Per effetto della polarizzazione del vuoto, gli stati ns diventano piu' legati (Uehling, 1935). Questo e' uno dei contributi al Lamb Shift; nel caso dell'Idrogeno, il contributo e' di -27 MHz, mentre il Lamb Shift totale e' di 1058 MHz. L'esistenza della polarizzazione del vuoto e' stata confermata dall'esperimento con grande accuratezza. L'intero Lamb Shift puo' essere calcolato, ed i risultati sono in accordo con l'esperimento. La QED e' in grado di descrivere una grande varieta' di fenomeni e di predire i risultati sperimentali con una precisione veramente spettacolare. Capitolo 19: Interazione dinamica atomo-solido. Formalismo di Kadanoff-Baym e di Keldysh Questo capitolo e' dedicato ai fenomeni, come il desorbimento e lo sputtering, in cui un atomo si muove mentre interagisce con una superficie 1. Un metodo perturbativo molto potente e generale consente di trattare hamiltoniani che dipendono dal tempo e processi lontani dall'equilibrio. L'espansione diagrammatica del Capitolo 18, valida per lo stato fondamentale, e' un caso particolare. Ci si puo' aspettare facilmente che lo studio degli stati eccitati e dei sistemi lontani dall'equilibrio termico comporti speciali difficolta': la sorpresa e', se mai, che ne risulti un quadro teorico cosi' generale da essere 1Si parla di desorbimento quando un atomo o una molecola si liberano da una superficie solida cui erano legati chimicamente; il desorbimento puo' essere causato da un aumento della temperatura, o da radiazione ionizzante. Spesso le specie desorbite sono ioni. Nel processo di sputtering, la superficie viene bombardata con dosi massicce di ioni accelerati ad energie dell'ordine dei KeV, e puo' disintegrarsi al ritmo di alcuni strati atomici al secondo. Il processo di sputtering e' importante nelle applicazioni industriali, ed e' un metodo usato per generare sotto vuoto una superficie incontaminata. =423= Prof. M. Cini -Corso di Fisica Atomica e Molecolare straordinariamente utile anche per ottenere la risposta nonlineare di un sistema in equilibrio termico ad una forte perturbazione. 19-1 Osservazioni sui problemi dinamici e sui sistemi lontani dall'equilibrio termodinamico ; Abbiamo studiato nel Capitolo 12 come si risolve un problema come quello di Fano-Anderson, con un Hamiltoniano che mescola stati legati e stati delocalizzati. Ma cosa accade se i parametri ε e V del modello dipendono dal tempo? Un tale problema si pone naturalmente nello studio delle transizioni elettroniche nei processi di urto molecola-superficie, chemisorbimento, o desorbimento, in cui l'Hamiltoniano degli elettroni dipende dalla posizione dei nuclei, e, attraverso questa, dal tempo. Beninteso, in una teoria veramente completa, l'Hamiltoniano sarebbe indipendente dal tempo e non vi sarebbero campi "esterni", pero' si dovrebbero trattare simultaneamente tutti i gradi di liberta'. Gia' nel caso statico questo risulta difficile e si cerca di applicare, quando e' possibile, l'approssimazione di Born-Oppenheimer. La generalizzazione piu' ovvia di tale approssimazione al caso dinamico consiste nel trattare i nuclei come particelle classiche, dotate di una traiettoria ben definita: gli elettroni allora sono soggetti ad un potenziale che dipende dal tempo. A tale proposito svilupperemo il formalismo introdotto molti anni fa da L.P.Kadanoff e G.Baym1, soprattutto nella versione elaborata poco dopo da L.V.Keldysh2. Si tratta di una tecnica -generale ed in linea di principio esatta- per calcolare la risposta di un sistema quantistico ad una perturbazione esterna senza bisogno di supporre piccola la perturbazione o la deviazione dall'equilibrio, e senza fare alcuna ipotesi che il sistema si evolva in modo reversibile. E' un formalismo particolarmente adatto per lo studio dei fenomeni di risposta non lineare. In letteratura, pero', l'applicazione di questo metodo non e' molto frequente; direi che e' stata fin qui molto scarsa in rapporto alla sua grande importanza; certo, la relativa penuria di esempi costituisce un ostacolo alla sua diffusione non meno di una certa innegabile complessita'. La tecnica generalizza lo sviluppo diagrammatico delle funzioni di Green a sistemi dipendenti dal tempo e lontani dall'equilibrio termodinamico. Di funzioni di Green diverse anzi occorre introdurne un certo numero, ciascuna con un suo posto nella teoria; poiche' poi 1L.P.Kadanoff and G.Baym, Quantum Statistical Mechanics, W.A.Benjamin, Inc., New York (1962) 2L.V. Keldysh, J.Exptl. Theoret. Phys. (U.S.S.R.) 47, 1515 (1964) [English translation Soviet Phys. JETP 20, 1018 (1965)] =424= Prof. M. Cini -Corso di Fisica Atomica e Molecolare esistono vari modi di scegliere quali funzioni definire e tutti i modi sono stati esperiti, il lettore degli articoli originali se ne trova davanti un vero giardino zoologico. Anch'io intendo presentare tutte le specie piu' diffuse, ma avendo cura di specificare in che relazione stanno fra loro; e' mia ferma intenzione evitare le incongruenze ed i pasticci notazionali che frequentemente trasformano quelle bestie esotiche in veri mostri. Nella elaborazione di questo capitolo ho fatto largo uso dei lavori di C.Caroli et al.1 e di Feuchtwang2 e soprattutto di D.C. Langreth3 e di A.Blandin, A.Nourtier and D.W.Hone4; ciascuno di questi lavori mette in risalto versioni diverse del formalismo e aspetti diversi del problema. Un approccio alternativo e' quello del LandauLifshitz5. Anch'io in passato ho trovato utile il metodo in varie occasioni, ad esempio in problemi di trasporto6 e di interazione dinamica atomo-superficie7, anche se negli articoli ho presentato derivazioni basate su tecniche alternative. Non vi e' alcuna pretesa di completezza in questa introduzione, ma c'e il tentativo di chiarire alcuni punti oscuri, unificare i punti di vista proposti da vari autori e presentare le cose in forma piu' accessibile. 19-2 Evoluzione sul contorno : elettroni ; Ogni esperimento misura una probabilita' di transizione. Ci proponiamo di trovare un quadro teorico che ci consenta di calcolare tali probabilita' senza supporre che il sistema in esame sia nello stato fondamentale, o in equilibrio termico. Consideriamo un sistema dipendente dal tempo e separiamo l'hamiltoniano (come nel Capitolo 2-5) H(t) = H0 + V(t). Supponiamo che V(t) rappresenti una 'perturbazione' di un sistema H0 statico e facile da trattare; non e' necessario che V(t) sia piccolo e nemmeno che dipenda effettivamente dal tempo. Abbiamo visto che la rappresentazione di interazione e' adatta ad una espansione in potenze di VI, e gli 1C.Caroli,R.Combescot, P.Nozieres e D.Saint-James, J.Phys.C 5, 21 (1972); C.Caroli, D.Lederer and D.Saint-James, Surface Sci. 33, 228 (1972) e riferimenti in esso contenuti. 2T.E.Feuchtwang, Phys. Rev. B12, 3979 (1975) 3D.C. Langreth and J.W.Wilkins, Phys.Rev.B6, 3189 (1972); D.C. Langreth, 1975 N.A.T.O. Advanced Study Institute, Antwerp, Belgium, on "Linear and Nonlinear Electron Transport in Solids"; Jhy-Jiun Chang and D.C. Langreth, Phys. Rev. B8, 4638 (1973) 4A.Blandin, A.Nourtier and D.W.Hone, Le Journal de Physique 37, 369 (1976) 5L.D.Landau e E.M.Lifshitz, "Fisica Cinetica", Editori Riuniti, Roma (1984) 6M.Cini, Phys. Rev. B22, 5887 (1980) 7M.Cini, Phys. Rev. B32, 1945 (1985; Il Nuovo Cimento 8D, 333 (1986) ; Il Nuovo Cimento 9D, 1515 (1987) =425= Prof. M. Cini -Corso di Fisica Atomica e Molecolare operatori si evolvono come in assenza di V(t); il problema e' che il sistema si evolve con H completa, e gli operatori di creazione e distruzione che figurano nelle funzioni di Green sono nella rappresentazione di Heisenberg. L'espansione di AH(t) secondo l'equazione AH(t) = U†I (t,t0)A I (t)U I (t,t0). si presenta molto complicata, a causa della presenza dei fattori t U I (t,t0) = T exp[-i ∫dt'VI (t') ] (1) t0 e t0 † U I (t,t0) = T exp[-i ∫dt'VI (t') ] = UI (t 0,t) (2) t da espandere in serie. Nel calcolo di funzioni di Green, come g<(t,t') = <Ψ H†(t')Ψ H(t)>=<U†I (t',t0)Ψ I (t')U I (t',t0)U †I (t,t0)Ψ I (t)U I (t,t0)>, le serie sono quattro. Per prima cosa, possiamo ridurle a tre perche' U I (t',t0)U †I (t,t0) = UI (t',t0)U I (t 0,t) (per l'unitarieta' di U, appena notata) e UI (t',t0)U I (t 0,t)=UI (t',t) (questa e' detta talvolta "proprieta' gruppale") . Quindi, scriveremo g<(t,t') = <UI (t 0,t')Ψ † I (t')U I (t',t)Ψ I (t)U I (t,t0)> . (3) Ma sarebbe ancora complicato espandere indipendentemente i tre UI rimasti. Invece, ci si puo' ridurre al calcolo di una serie unica col seguente artificio. Per ogni operatore A, le due serie si unificano se pensiamo che i fattori UI descrivano l'evoluzione sul piano complesso dei tempi: l'idea e' che un percorso arbitrario puo' essere orientato e noi possiamo generalizzare l'operatore T. Infatti, AH(t) = U†I (t,t0)A I (t)U I (t,t0) = t0 t =[T exp(-i ∫dt'VI (t') )]AI (t)[T exp(-i ∫dt'VI (t') )] = t t0 = TC exp[-i ∫dt'VI (t') AI (t) ], (4) C dove C e' un qualsiasi contorno orientato (sul piano t complesso) che passi per t0→− ∞ e per t, e Tc e' l'operatore di ordinamento temporale su tale contorno. Il fattore AI (t) e' sotto l'azione di TC e viene automaticamente collocato al posto giusto. =426= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Im(tempo) t t → −∞ 0 Re(tempo) C Fig.2 Analogamente, g<(t,t')=<UI (t 0,t')Ψ † I (t')U I (t',t)Ψ I (t)U I (t,t0)> si puo' leggere da sinistra a destra come un'unica "storia": il sistema da t 0→∞ evolve fino a t, subisce l'azione di Ψ, poi evolve fino a subire Ψ † al tempo t' (che puo' essere successivo o precedente); infine evolve all'indietro nel tempo fino a t0. Il fatto che g <(t,t') = <Ψ H†(t')Ψ H(t)> con Ψ H†(t') a sinistra di Ψ H(t) comporta che anche Ψ I †(t') figura a sinistra di Ψ I (t), e si incontra "dopo" in questa "storia". Cio' si ottiene se ci inventiamo un unico contorno C =C1UC2 (nel piano complesso dei tempi ) lungo il quale t viene prima di t' cioe' t<Ct', a prescindere dall'ordine di t e t' sull'asse reale (Fig.3). Im(tempo) t0 C2 tempo (reale) t t' C1 Fig.3 Cosi', la funzione di Green ammette l'espansione semplice g<(t,t') = = <[TC exp{-i ∫dτ V I (τ)}Ψ I †(t')][TC exp{-i ∫dτ'VI (τ')}Ψ I (t)]> = 1 2 C1 C2 =427= Prof. M. Cini -Corso di Fisica Atomica e Molecolare =<TC exp{-i ∫dτVI (τ)}Ψ I †(t')Ψ I (t)>, t<Ct' (5) C Per la proprieta' gruppale, non importa assolutamente se il contorno nel tratto fra t e t' ripassa o meno per t0 o fa' altri giri. L'operatore TC provvede automaticamente ad ordinare i fattori nei termini ottenuti dallo sviluppo in serie degli operatori in modo che i tempi "precedenti" sul contorno C stiano a destra. Mentre nella rappresentazione di Heisenberg g< e g> sono distinti dall'ordine di Ψ H e Ψ H† nell'elemento di matrice, adesso a distinguerli e' la posizione di t e t' sul contorno; anzi, fissato questo, noi siamo liberi di cambiare l' ordine di Ψ I †(t') e Ψ I (t), perche' TC provvede a mettere le cose a posto. Come si e' constatato nel Capitolo 18, e' opportuno, nel caso dei fermioni, includere nella definizione di TC un cambiamento di segno associato ad ogni scambio di operatori di campo; in altri termini , si pone g<(t,t') =<TC exp{-i ∫dτVI (τ)}Ψ I †(t')Ψ I (t)> = C = - <TC exp{-i ∫dτVI (τ)}Ψ I (t)Ψ I †(t')> , C Analogamente, g>(t,t') = C tale che t<Ct'. (6) <TC exp{-i ∫dτVI (τ)}Ψ I (t)Ψ I †(t')> = C = - <TC exp{-i ∫dτVI (τ)}Ψ I †(t')Ψ I (t)> , C tale che t>Ct'. (7) C A meno di un segno, la stessa espressione formale fornisce g< o g> a seconda di come disponiamo t e t' sul contorno. Come vedremo, possiamo anche usare lo stesso C nei due casi, variando solo la disposizione di t e t'. E' opportuno formulare insieme i due problemi definendo la funzione di Green 'time ordered' il cui valore dipende da come si pensano ordinati i tempi t e t' sul contorno: iG(t,t') = <TCΨ H(t)Ψ H†(t')> = g>(t,t') θC(t-t') - g<(t,t') θC(t'-t), (8) con θC(t-t') uguale a 1, per t>Ct', e nulla altrimenti. Il contorno C parte da t0, passa per t' e t (primo contributo) o per t e t', e infine torna a t0. Se fa' dei giri in piu', questi si cancellano per la proprieta' gruppale di U, come si e' visto. Sia g<che g> sono funzioni analitiche che comprendono ambedue gli ordinamenti relativi di t e t' sull'asse reale. A seconda degli ordinamenti si hanno pero' situazioni fisiche diverse. Abbiamo visto nel Capitolo 2 che la conoscenza di g < e g> equivale a quella delle funzioni avanzate e ritardate, che non sono analitiche, ma separano i contributi a seconda degli ordinamenti sull'asse reale: =428= Prof. M. Cini -Corso di Fisica Atomica e Molecolare igr (t,t') = (g<(t,t')+g>(t,t'))θ(t-t') =<[Ψ † (t'),Ψ(t)] +>θ(t-t') -iga(t,t') = (g<(t,t')+g>(t,t'))θ(t'-t). (9) (10) 19-3 Tecnica per calcolare combinazioni di funzioni di Green che evolvono sul Contorno Date due funzioni di Green A e B "time ordered", A(t,t') = -ia>θC(t-t')+ia<θC(t'-t), (1) > < B(t,t') = -ib θC(t-t')+ib θC(t'-t), (2) dobbiamo innanzitutto definire ed imparare a calcolare le loro combinazioni 'in serie' e 'in parallelo' che sono necessarie per il calcolo dei diagrammi e per lo sviluppo dell'equazione di Dyson in questa teoria. La combinazione 'in serie' D=AB e' definita da D(t,t') = ∫dτA(t,τ)B(τ,t') , (3) C e va espressa in termini di integrali sull'asse reale. La notazione usata AB per un integrale lungo il contorno ci sara' utile nel seguito. Anche per D adotteremo una decomposizione basata sulla posizione dei tempi sul contorno, definendo d> e d< con iD(t,t') = d>(t,t') θC(t-t') - d<(t,t') θC(t'-t) . Per il calcolo di d<(t,t') = - i D(t,t') per t<Ct' usiamo un contorno C tale che appunto t<Ct' ; un tale contorno e' C =C 1UC2, (Fig.3) dove C1 parte da t0, arriva fino a t e torna a t0, e C2 riparte da t0, arriva a t' e torna a t0. Lungo C1 la variabile di integrazione τ<C t' e quindi B=ib<, mentre lungo C2 τ>Ct, e A=ia<; quindi possiamo scrivere d<(t,t') = -iD=-i{ ∫dτA(t,τ) ib <(τ,t') + ∫dτ ia<(t,τ)B(τ,t')} . (4) C1 C2 Possiamo spezzare il primo integrale nella sua parte ascendente ed in quella discendente, su ognuna delle quali l'ordinamento sul contorno e' prefissato e quindi possiamo sostituire A con i suoi pezzi analitici: t -∞ < ∫ = ∫dτθC(t-τ)A(t,τ)b (τ,t') + ∫dτθC(τ-t)A(t,τ)b <(τ,t') t C1 - ∞ = t ∫dτ[-ia>(t,τ)]b <(τ,t') - -∞ t ∫dτ[ia<(t,τ)]b <(τ,t') . -∞ =429= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Formalmente possiamo scrivere gli integrali come fatti su tutto l'asse reale, introducendo una θ, cioe' ∞ ∫ = ∫dτ{-i[a>(t,τ) + a <(t,τ)]θ(t-τ)}b<(τ,t') ; C1 - ∞ ma questo significa semplicemente ∞ ∫ = ∫dτ a r (t,τ)b <(τ,t') = ar b<, C1 - ∞ dove si e' introdotta una conveniente notazione abbreviata (prodotto di lettere minuscole) per integrali sull'asse reale. Analogamente, si ottiene ∞ ∫ = ∫dτ a <(t,τ)b a(τ,t') = a<ba , C2 - ∞ ed il risultato finale e' d< = ar b< + a<ba. (5) Similmente, d> = ar b> + a>ba. (6) Conoscendo d<e d> possiamo facilmente ottenere dr e da . Ad esempio, . dr = -i[d>+d<]θ(t-t') = -i[ar b< + a<ba + ar b> + a>ba ]θ(t-t') Raccogliendo i termini ed esplicitando la notazione, dr (t,t') =-iθ(t-t') ∞ ∫dτ {a r (t,τ)[b >(τ,t')+b<(τ,t')]+[a>(t,τ)+a <(t,τ)]b a(τ,t')} -∞ Questa espressione puo' scriversi dr =ar br . (7) Infatti,nel secondo termine, bisogna prendere t'>τ per la presenza di ba; la θ davanti a tutto impone t>t', pertanto deve essere t>τ ed il secondo termine equivale a ∞ - θ(t-t') ∫ dτ a r (t,τ)b a(τ,t') ; -∞ =430= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ma con lo stesso ordinamento t>t'>τ il primo termine da' un contributo opposto. Rimane il contributo del primo termine per t>τ>t' , che vale ∞ dr (t,t') =-θ(t-t') ∫ dτ { a r (t,τ)b r (τ,t')} = ar b r . -∞ Analogamente, da = aaba . (8) La combinazione in serie E=ABC si ottiene immediatamente: e>= (AB)r c >+(AB)>c a = ar br c > + (a r b>+a>ba)c a (9) < < < < < < e = (AB)r c +(AB) c a = ar br c + (a r b +a ba)c a, (10) etc. Occorre anche la combinazione "in parallelo" del tipo F(t,t') = A(t,t') B(t',t), (11) dove non si sottintende alcuna integrazione. Per calcolarla, basta ricordare che A(t,t') = -i a>(t,t') θC(t-t') + i a<(t,t') θC(t'-t), B(t,t') = -i b>(t,t') θC(t-t') +i b<(t,t') θC(t'-t), ed esprimendo nel medesimo modo anche F si ha -if >(t,t') = a>(t,t')b<(t',t) if<(t,t') = a<(t,t')b>(t',t) ; (12) (13) anche qui, ovviamente, non e' sottointesa alcuna integrazione. Conoscendo f > ed f<, si puo' costruire fr = -i(f>+f<)θ(t-t') = [a>b<-a <b>]θ(t-t') . In presenza della θ, a>=iar -a <, e sostituendo si ha l'espressione equivalente fr =i[ar b<- a <br ]θ(t-t'). Se invece eliminiamo b< = ibr -b > , otteniamo f r = i[a>b r - a r b >]θ(t-t'). In modo analogo si costruisce fa. 19-4 Equazione di Dyson Vogliamo mostrare che la funzione di Green "time ordered" iG(t,t') = <TCΨ H(t)Ψ H†(t')> = =431= Prof. M. Cini -Corso di Fisica Atomica e Molecolare = <TC [exp{-i ∫dτVI (τ)}Ψ I (t)Ψ I †(t')]> C (1) ammette una espansione diagrammatica che generalizza quella del Capitolo 18. Nella teoria generale, le integrazioni intermedie vanno fatte su C anziche' da - ∞ a ∞ . Lo sviluppo perturbativo si ottiene da1 ∞ (-i)n exp{-i ∫dτV(τ)} = ∑ dτ ⋅⋅ dτ V(τ1)⋅⋅V(τn ). (2) n! C∫ 1 C∫ 1 C n=0 Per ciascun ordine n, occorre calcolare un valore di aspettazione su |Ψ H> di prodotti 'time ordered' di operatori Ψ e Ψ † presi ai tempi τ1,⋅⋅τn , t e t'. Conviene esemplificare il procedimento in un caso semplice. Nei problemi a particelle indipendenti, V(t) e' un potenziale a un corpo. Scriviamo V(t) = v(t)ψ†ψ, (3) dove si sottintende una moltiplicazione matriciale negli indici di stato, del tipo ∑v(t)kk' ψ†k ψk' . L'espansione al primo ordine da' k' δG = (-i)2 ∫dτv(τ)<TC[ψ†(τ)ψ(τ)ψ(t)ψ†(t')]>. C Consideriamo dunque il valore di aspettazione <TC[ψk †(τ)ψk (τ)ψk (t)ψk †(t')]>, 1 2 3 4 che e' il propagatore di una particella e una buca non interagenti. Dobbiamo imparare a esprimere tali propagatori in termini di G0. Questo e' fattibile perche' le dipendenze temporali nella rappresentazione di interazione sono date da semplici fattori di fase. Infatti, d i {exp(iH 0t)ψk exp(-iH0t)} = exp(iH0t)[ψk ,H 0]- exp(-iH0t) dt 1 1 e per un semplice Hamiltoniano a un corpo H 0=∑ εk ψk †ψk , si ottiene, k calcolando il commutatore, i d ψ (t) = εk ψk (t) dt k 1 1 1 cioe' ψk (t) =ψk (0)exp(-iεk t) . 1 1 1 1D'ora in poi, tutti gli operatori che compaiono nello sviluppo sono nella rappresentazione di interazione, e noi possiamo omettere l'indice I. =432= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per ogni ordinamento dei tempi, occorre quindi calcolare il valore di aspettazione di prodotti di operatori di creazione e distruzione su uno stato determinantale. Ad esempio, se t >Cτ>Ct', <TC[ψk †(τ)ψk (τ)ψk (t)ψk †(t')]>=<ψk (t)ψk †(τ)ψk (τ)ψk †(t')> . 1 2 3 4 3 1 2 4 L'elemento di matrice e' <ψk ψk †ψk ψk †>exp[i(εk −εk )τ+iεk t'-iεk t]. 3 1 2 4 1 2 4 3 Questo e' nullo se i k creati non corrispondono a quelli distrutti. I k possono essere tutti uguali, o essere uguali a coppie. Se sono tutti uguali, diciamo, a k 1, si trova (1-nk ) per il fattore di fase temporale; 1 se sono uguali a coppie, vi e' un contributo per k = k , k = k ed 1 2 3 4 un altro per k = k , k = k , e quindi si ha 1 3 2 4 <ψk ψk †ψk ψk †>= δ12δ34nk (1-n k )+δ13δ24(1-n k )(1-nk ). 3 1 2 4 1 3 1 2 Questo genere di calcolo non presenta difficolta' concettuali, ma diventa rapidamente gravoso al crescere di n. C'e' pero' un metodo efficiente di farlo, scoperto da Wick nel 1950. Nel nostro esempio, esplicitando pazientemente i calcoli per gli ordinamenti possibili ed includendo i fattori di fase, si puo' controllare che <TCψ†(τ)ψ(τ)ψ(t)ψ†(t')>= { <T Cψ†(τ)ψ(τ)><TCψ(t)ψ†(t')> +<TCψ(t)ψ†(τ)><TCψ(τ)ψ†(t')>} , (4) purche' si convenga che per tempi uguali <TCψ†(τ)ψ(τ)>=<ψ†(τ+)ψ(τ- )>, (5) dove τ+ e' successivo a τ- , ma ambedue coincidono con τ a meno di infinitesimi. Con questa nuova regola, l'uguaglianza si verifica anche per gli altri ordinamenti temporali. Questo e' un esempio del teorema di Wick. In generale, il teorema prescrive il metodo per calcolare il valore di aspettazione. Si considerano tutte le coppie che si possono formare con un operatore di creazione ed uno di distruzione e con esse si calcolano le "contrazioni" della forma <TCψ(t)ψ†(t')>. Queste sono funzioni di Green imperturbate moltiplicate per i. Spezzando il valore di aspettazione in un prodotto di contrazioni, si ha una permutazione P degli operatori. Il valore di aspettazione e' la somma di tali prodotti presi con il segno (-)P . Quindi, la correzione del primo ordine e' δG = (-i)2 ∫dτv(τ){-iG0(τ,τ)iG0(t,t')+iG0(t,τ)iG0(τ,t')} = C =433= (6) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Fig.4 Il primo contributo in Fig.4 e' un diagramma disconnesso, formato da due parti separate. La sua espressione matematica contiene un fattore del tipo ∫dτξ(τ), dove ξ(τ) e' indipendente da t e t'. Poiche' il C contorno C e' arbitrario, possiamo pensare di integrare da -∞ a ∞ sull'asse reale, e poi da ∞ a - ∞ . Comunque siano disposti t e t' su tale contorno, l'integrale e' nullo. Considerazioni simili si applicano a tutti i diagrammi disconnessi di ordine arbitrario. Ne consegue che possiamo limitarci a considerare i soli diagrammi connessi. Questa osservazione utilissima per semplificare l'analisi si chiama "linked cluster theorem". Procedendo in questo modo, si ottiene la nota espansione diagrammatica; la differenza rispetto al capitolo precedente e' che gli integrali temporali sono su C invece che sull'asse reale. Tuttavia, gli sviluppi della teoria usuale si estendono in modo naturale compresa l'equazione di Dyson, G=G0+G0ΣG (7) sempre con gli integrali temporali su C. La self-energy Σ, come la funzione di Green, dipende da due "tempi" definiti sul contorno C; possiamo scrivere iΣ(t,t') = σ>(t,t')θC (t-t') - σ<(t,t')θC (t'-t) (8) e definire anche σa,r al solito modo, iσr (t,t') = [σ>(t,t')+σ<(t,t')]θ(t-t') , -i σa(t,t') = [σ>(t,t')+σ<(t,t')]θ(t'-t). L'equazione di Dyson ha G0, Σ e G in una combinazione in serie, che possiamo ridurre ad integrali sull'asse reale con la tecnica vista sopra; quindi, gr = g0r + g0r σr gr ga = g0a + g0aσaga g>=g0> + g0r σr g>+ g0r σ>ga+ g0> σaga g<=g0< + g0r σr g<+ g0r σ<ga+ g0< σaga =434= (9) (10) (11) (12) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Queste 4 equazioni sono un po' ridondanti: tutta l'informazione e' contenuta nelle due funzioni g< e g>. In effetti, le equazioni per g r e ga sono equivalenti. Dopo che si sono trovati gr e ga, si conosce la somma g<+ g>. Per sapere tutto basta determinare la differenza. E' naturale allora definire f=g>-g< (13) > < Ω=σ - σ . (14) Infatti basta prendere la differenza delle equazioni per g> e g< per ottenere f=f 0 +g0r σr f+g0r Ωga+f0σaga. (15) Possiamo anche dare una soluzione chiusa per f in termini della selfenergy. L'equazione precedente puo' essere pensata come una equazione matriciale negli indici t,t' con la soluzione formale f=[1-g 0r σr ]-1 {f0[1 +σaga ] +g0r Ωga}. L'inversione di matrice e' presto fatta: [1-g0r σr ]-1 =1+g0r σr +g0r σr g0r σr +...= 1+(g0r +g0r σr g0r +..)σr =1+gr σr ; inoltre, [1-g0r σr ]-1 g0r = g0r +g0r σr g0r +.. =gr . Cosi', f = [1+gr σr ]f0[1+σaga] + gr Ωga. (16) Nei problemi a particelle indipendenti, tutta la self-energy viene dal diagramma connesso del primo ordine che abbiamo visto, δG = ∫dτv(τ)G0(t,τ)G 0(τ,t') C e questo dice che Σ(τ,τ') = Σ(τ−τ') = v(τ)δC(τ-τ'). (17) Poiche' non ci sono contributi ne' per τ<Cτ' ne' per τ>Cτ' si conclude che σ>=σ<=0, e quindi σa=σr =0; ma tutto cio' vale solo se t≠t'. L'effetto dell'interazione, che deve pur esistere, deve essere proporzionale a δ(t-t'). Possiamo trovarlo confrontando lo sviluppo al primo ordine con l'equazione di Dyson espansa anch'essa al primo ordine, G ≈ G0+G0ΣG0. Nei due casi prendiamo le parti <, >, a, r . Da δG≈G0vG0, che rappresenta lo sviluppo al primo ordine in notazione ovvia, si ha δg = g 0 vg0 r r r < 0 0< δg =g vg + g 0<vg0a r =435= Prof. M. Cini -Corso di Fisica Atomica e Molecolare dove g0r vg0r = ∫ d τg0r (t,τ)v(τ)g 0r (τ,t'), mentre l'equazione di Dyson da' δg = g 0 σ g0 r r r r . < 0 δg = g r σr g0<+ g 0r σ<g0a+ g 0< σag0a Questo conferma che σ>=σ<=0, da cui segue che nei problemi a particelle indipendenti, Ω=0; inoltre dice che σr (t,t') =σa(t,t') = δ(t-t')v(t) (18) Le equazioni ritardata e avanzata sono semplici equazioni "ad un corpo", indipendenti dalla occupazione degli stati, mentre tutte le complicazioni a molti corpi sono contenute in g<e g>, ovvero in f. Riassumendo, una volta calcolata Σ, la funzione di Green G si ricava come segue. Le componenti avanzate e ritardate obbediscono ad equazioni di Dyson a particella singola, che coinvolgono solo σa e σr , rispettivamente. Questi risultati, insieme ad Ω, vengono inseriti nell'equazione di Dyson per f, che contiene una dipendenza esplicita dal livello di Fermi. Infine da ga,r e da f si ottengono immediatamente anche g< e g>. Nel caso speciale di problemi a particelle indipendenti, ancorche' dipendenti dal tempo, questo metodo conduce direttamente a soluzioni esatte. In tal caso Σ e' data e per giunta l'equazione di Dyson per F e' priva del termine in Ω. Nel caso generale la difficolta' principale risiede nel calcolo di Σ, ed e' chiaro che anche σa e σr dipendono implicitamente dagli effetti a molti corpi. Uno dispone pero' di una espansione diagrammatica adatta anche per trattare sistematicamente processi dinamici e lontani dall'equilibrio. 19-5 Contorno di Keldysh1 Come ho piu' volte sottolineato, la scelta del contorno chiuso C che passa per t e t' ha molto di arbitrario; per calcolare le combinazioni in serie di funzioni di Green ne abbiamo introdotto uno ad hoc. Ma le combinazioni del paragrafo 4, che sono sufficienti per scrivere l'equazione di Dyson, sono solo le piu' semplici: nel calcolo di diagrammi complicati se ne incontrano sempre di nuove. Sarebbe scomodo, pero', doversi inventare un contorno ogni volta che si trova una combinazione di tipo nuovo da calcolare; per lavorare in modo sistematico occorre ad un certo punto standardizzare il calcolo. Per problemi dipendenti dal tempo il contorno piu' usato e' quello di Keldysh, che parte da t0 =- ∞ , arriva a tempi infiniti e poi torna a t0. 1Questo paragrafo ed il successivo possono essere omessi dal lettore interessato solo ai modelli di fermioni non interagenti che sudieremo in dettaglio nel seguito. =436= Prof. M. Cini -Corso di Fisica Atomica e Molecolare -∞ t t' x x ∞ -∞ Fig.5 Vi sono quindi due branche, una ascendente o "positiva" ed una discendente o "negativa" ed tempi t e t' che sono argomenti di G(t,t') =-i<TCΨ H(t)Ψ H†(t')> si possono trovare sull'una o sull'altra. Per eliminare ogni ambiguita' indicheremo con t+ i tempi presi sulla branca positiva e con t _ quelli presi sulla branca negativa. Vi sono 4 possibilita' che danno luogo a 4 diverse funzioni di Green definite sull'asse reale (e che come al solito noi denoteremo con lettere minuscole). Se i tempi sono ambedue sulla branca positiva si ottiene gc (t,t')= -i<TCΨ H(t +)Ψ H†(t' +)>; (1) questa non e' altro che la funzione di Green "time ordered" della teoria usuale, cioe' gc (t,t')= -i<TΨ H(t)Ψ H†(t')> , (2) dove i tempi ora sono sull'asse reale e sono ordinati dal solito T. L'espansione diagrammatica che si studia tradizionalmente, valida per V costante, si ottiene da quella generale come caso limite. La sequenza temporale di fig. 5 da', nella pittura di interazione, il contributo -i<U(-∞ ,∞ )U( ∞ ,t')Ψ I†(t')U(t',t)Ψ Ι(t)U(t,- ∞ )>; considerando anche l'altro ordine di t e t', si ha g c(t,t')= -i<U(-∞ ,∞ )T[Ψ I(t)Ψ I†(t')U(∞ ,- ∞ )] > . Sia S= U(∞ ,- ∞ ). Indichiamo con |- ∞ > lo stato su cui e' preso il valore di aspettazione. Se V e' statico, si puo' pensarlo adiabaticamente acceso a - ∞ e spento a +∞ ; allora si dimostra che <-∞| U(- ∞ ,∞ ) = ei α <-∞| , con α reale (teorema adiabatico). Quindi, <-∞ |T[Ψ I(t)Ψ I†(t')S] |- ∞ > g c(t,t')= -i . <-∞ |S |- ∞ > Questa formula e' il punto di partenza dell'espansione diagrammatica usuale. Se V =V(t), il teorema adiabatico non si applica, ed il formalismo generale e' indispensabile; ma anche se V e' costante, non c'e' piu' alcun bisogno del teorema adiabatico nel nuovo formalismo. Insomma, lo schema piu' generale e' anche il piu' semplice dal punto di vista concettuale. Se prendiamo ambedue i tempi sulla branca negativa otteniamo ~c (t,t')= -i<TCΨH(t - )ΨH†(t'- )> = -i<T~ΨH(t)ΨH†(t')>, (3) g ~ in modo che ordini i tempi da +∞ a -∞ , cioe' al purche' si definisca T contrario di quello che fa' T. In altri termini, accanto a gc (t,t')= -i{<Ψ H(t)Ψ H†(t')>θ(t-t')-<Ψ H†(t')Ψ H(t)>θ(t'-t)}= -i{g>(t,t')θ(t-t')-g<(t,t')θ(t'-t)}, (4) avremo anche ~c (t,t')=-i{<ΨH(t)ΨH†(t')>θ(t'-t)-<ΨH†(t')ΨH(t)>θ(t-t')}= g -i{g>(t,t')θ(t'-t)-g<(t,t')θ(t-t')}. (5) =437= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Poi, g+(t,t') = -i<TCΨ H(t +)Ψ H†(t' _)>. (6) In questo caso e' certo che t' e' "successivo" a t, pertanto g+(t,t') = +i<Ψ H†(t')Ψ H(t)> = ig<(t,t'). Analogamente, g- (t,t') = -i<TCΨ H(t - )Ψ H†(t' +)> = -i<Ψ H(t)Ψ H†(t')> = -ig>(t,t'). (7) Le 4 funzioni di Green non sono indipendenti. Si noti che g +(t,t')+g- (t,t')=i[ <Ψ H †(t')Ψ H (t)>-<Ψ H (t)Ψ H †(t')>] ~ c(t,t'); =gc(t,t')+g (8) inoltre, g c(t,t')-g +(t,t')=-i{g>(t,t')θ(t-t')-g <(t,t')θ(t'-t)}-ig <(t,t'){θ(t-t')+θ(t'-t)}= =-i{g>(t,t')+g<(t,t')}θ(t-t')=gr (t,t') (9) e, analogamente1 , gc(t,t')-g - (t,t')=ga(t,t'). (10) L'integrazione su C comporta l'integrazione sull'asse reale e la somma sugli indici + e -; cio' suggerisce che si possa sostituire l'integrazione su C con una sull'asse reale pur di adottare una notazione matriciale, con gli argomenti temporali disposti secondo lo schema + + -+ +- - - ; pertanto introduciamo la matrice 2 gc g + G(t,t') = - ~c . g g (11) C'e' pero' la complicazione che le integrazioni su t- vanno eseguite da +∞ a - ∞ , e volendole eseguire da - ∞ a +∞ dobbiamo introdurre un segno -. La regola per fare questo correttamente e' 1Queste sono le equazioni corrette, anche se in letteratura g e g sono a r spesso confuse. 2Spesso in letteratura la si trova trasposta. A parte questo, alcuni autori g ++ g +- . usano una notazione del tipo G(t,t') = -+ g g -- =438= Prof. M. Cini -Corso di Fisica Atomica e Molecolare ∞ (12) ∫dτG(t,τ)G(τ,t') → ∫dτG(t,τ) zG(τ,t') , C -∞ 1 0 dove ovviamente z= 0 -1 . Ad esempio, il diagramma 'linked' di primo ordine che consegue da una perturbazione 'a un corpo' v(t) e' dato, come si e' visto, da δG = ∫dτv(τ)G0(t,τ)G0(τ,t') . (13) C Con la regola (12) appena introdotta calcoliamo G0(t,τ) zG0(τ,t') gc (t,τ) - g +(t,τ) gc (τ, t ' ) g +(τ,t') .= = ~ c ~ c g (t,τ) - g (t,τ) g (τ, t ' ) g (τ,t') gc (t,τ)g c (τ,t')-g+(t,τ)g - (τ, t ' ) g c (t,τ)g +(τ,t')-g+(t,τ)g ~c (τ,t') = ~c (t,τ)g- (τ, t ' ) g - (t,τ)g+(τ,t')-g~c (t,τ)g~c (τ,t'). g- (t,τ)g c (τ,t')-g (14) Cosi' ad esempio l'elemento in basso a sinistra, che e' [G0 zG0]- = -i[G0 zG0]>risulta essere dato da ~c (t,τ)g- (τ,t') = -i[g>(t,τ)gc (τ,t')-g~c (t,τ)g>(τ,t')]. g- (t,τ)g c (τ,t')-g Poiche' ~c =g++g- -gc =g- -gr = -ig>-gr , gc =g- +ga = -ig>+ga, g si ottiene -i[g >ga + gr g>] , in accordo con quanto sappiamo gia' (equazione (4.6)). Potremmo controllare l'accordo anche per gli altri elementi, e convincerci cosi' dell'utilita' del formalismo. Abbiamo visto che l'equazione di Dyson si scrive G=G 0+G0ΣG nella notazione semplificata in cui AB rappresenta un integrale sul contorno C; nel formalismo di Keldysh essa diventa G(t,t') = G0(t,t') con σc (t,t') = σ + ∞ ∞ -∞ -∞ ∫dτ1 ∫dτ2G0(t,τ1) σ+ . ~ σ c z ( τ1, τ2) zG( τ2,t') , (15) (16) Possiamo ora esprimerla in termini di quantita' avanzate e ritardate introducendo la trasformazione unitaria 1 -1 1-i y 2 2 U = = 1 (17) 1 , 2 con l'inversa 2 2 =439= Prof. M. Cini -Corso di Fisica Atomica e Molecolare U -1 1 1+i y 2 = = -1 2 2 2 1 . 2 1 (18) ~c =g++g- ,gc -g+=gr , gc -g- =ga, etc., si verifica Usando gc +g immediatamente che (g c -g- -g++g ~c ) / 2 ( g c -g- + g +-g~c )/2 0 g a -1 = UGU = gr f ' c + ~ c c + ~ c (g +g -g -g ) / 2 ( g +g +g +g )/2 e, analogamente, 0 σa , U U -1 = σ r Ω' dove f'=g++g- =-if e Ω'=σ++σ- =-iΩ. Per trasformare l'equazione di Dyson abbiamo bisogno anche di 0 1 U zU -1 = 1 0 ; la self-energy compare sempre nella combinazione 0 1 0 σa 0 1 Ω' σr = , U z zU -1 = 1 0 σ (19) r Ω' 1 0 σa 0 ed in letteratura viene spesso definita con quest'ultima matrice, omettendo allora il problema che porta all'introduzione dei fattori z. Tornando alla notazione semplificata per cui un prodotto di lettere minuscole comporta una integrazione sull'asse reale, l'equazione di Dyson diviene (poiche' i fattori -i di f' e Ω' a conti fatti si elidono) 0 g a 0 g 0a 0 g 0a Ω σr 0 g a = + (20) gr f g0r f 0 g0r f 0 σa 0 gr f , e questa, sviluppata componente per componente, coincide1 col risultato trovato in precedenza nel paragrafo 5. 2 19-6 Evoluzione sul contorno: Bosoni ; Fin qui ci siamo concentrati sui fermioni. Nel caso dei bosoni, l'operatore T C non comporta alcun cambiamento di segno quando si devono scambiare di posto due operatori di creazione o distruzione. Le funzioni di Green sono espresse in termini di operatori di campo φ. 1 In letteratura si trova pero' una fastidiosa mistura di g e g , U e U-1 , r a matrici greeniane e loro trasposte, con frequenti inconsistenze di notazione in uno stesso lavoro. 2vedi ad esempio C.Caroli,R.Combescot, P.Nozieres e D.Saint-James, J.Phys.C 5, 21 (1972) =440= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Per esempio, per una collezione di fononi con operatori di creazione d†i ed operatori di campo φi = di + d†i , si definiscono le funzioni di Green Dij (t,t') = -i <TCφi (t)φj (t')> (1) con D ij >(t,t')= <φi (t)φj (t')>, etc., di modo che iDij (t,t') = Dij >(t,t')θC(t-t')+Dij <(t,t')θC(t'-t). (2) Inoltre sul contorno di Keldysh D+=-iD <, D - =-iD >, senza cioe' il cambiamento di segno che si ha nel caso dei fermioni; cosi' D+ij (t,t') = -i <φj (t')φi (t)> = D- ji (t',t) (3) Altre differenze di segno si hanno nelle definizioni delle funzioni ritardate e avanzate: Dij r (t,t') = -i θ(t-t')<[φi (t),φj (t') ]- > , Dij a(t,t') = -i θ(t'-t)<[φi (t),φj (t') ]- > , (4) (5) dove compaiono commmutatori e non anticommutatori come nel caso fermionico. Con queste modifiche, il formalismo matriciale di Keldysh si estende in modo ovvio. 19-7 Modello di Anderson non interagente per l'interazione dinamica atomo-superficie ; Come esempio della capacita' del metodo di produrre soluzioni esatte in problemi non interagenti, consideriamo un atomo con un livello energetico di valenza εd in interazione con un solido le cui energie di Bloch sono εk . Trascuriamo la degenerazione del guscio di valenza dello ione. Sopprimiamo gli indici di spin, che non servono in questo problema. Se l'atomo si muove, come in un processo di collisione con una superficie, desorbimento o 'sputtering', gli integrali di hopping Vdk dipendono dal tempo. Per un atomo che viene emesso dalla superficie, supponiamo che Vdk(t) →0 per t→∞ ; immaginiamo di voler calcolare la probabilita' che venga rivelato come neutro o ione, e cioe', in sostanza, il limite per tempi lunghi del numero di occupazione n d(t) = <cd†(t)c d(t)>. Il ben noto Hamiltoniano del modello si divide in una parte "imperturbata" ed in una "perturbazione", H=H 0 + H 1(t) ; (1) =441= Prof. M. Cini -Corso di Fisica Atomica e Molecolare non e' essenziale che H1(t) sia "piccolo" rispetto ad H0. Prenderemo H 0=∑εk c k †c k +εdc d†c d ≡ ∑ελ c λ †c λ ; (2) λ k denoteremo d'ora in poi con indici greci λ,µ,... il generico stato (vale a dire, λ puo' essere d o uno dei k). Il problema imperturbato e' definito anche dalle condizioni iniziali, che specificano se si tratti di urto ione-superficie, di desorbimento o di altro. In ogni caso, ammettiamo che fino a un tempo t il sistema era in un autostato di H 0, specificato dai numeri d'occupazione n0λ ; poiche' t e' il tempo piu' remoto nel problema, potremo identificarlo col tempo t0 in cui si definisce la rappresentazione di Heisenberg e spesso potremo mandarlo a -∞. Non e' necessario che gli n 0λ corrispondano allo stato fondamentale di H0, anzi, in generale non e' cosi'. Le funzioni di Green imperturbate sono facili da calcolare. Poiche' si media su un autostato di H0, si ottiene immediatamente g0<λµ (t,t') = <c†λ (t')c µ(t)> = δλµ n0λ exp[-i ελ (t-t')], (3) 0> † 0 g λµ (t,t') = <cµ(t)c λ (t')> =δλµ (1-n λ )exp[-iελ (t-t')]. (4) Pertanto, applicando le definizioni, g0r,λµ (t,t') = -iδλµ exp[-i ελ (t-t')] θ(t-t'), g0a,λµ t,t') = iδλµ exp[-i ελ (t-t')] θ(t'-t), (5) (6) risultano indipendenti dai numeri di occupazione. La perturbazione e' H 1(t) = ∑Vdk(t)c d†c k + h.c. k (7) Vogliamo trovare nd(t) = <cd†(t)c d(t)> = g<dd(t,t) = -i gc dd(t,t+0), t→∞ (8) dove t+0 e' infinitesimamente maggiore di t. Per quanto riguarda la self-energy, abbiamo gia' notato che σr (t,t') =σa(t,t') = δ(t-t')V(t), (9) (10) Ω=0. Ovviamente σ e V vanno considerate come matrici negli indici di stato, e l'equazione di Dyson per la funzione ritardata puo' essere scritta, tenuto conto del carattere istantaneo della self-energy, gr,λµ (t,t')=g0r,λµ (t,t')+ ∑ ∞ ∫dτ gr,λν (t,τ)V νρ(τ)g 0r,ρµ(τ,t') . νρ - ∞ =442= (11) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Poiche' poi g0r e' diagonale, possiamo semplificarla nella forma1 gr,λµ (t,t')=δλµ g0r,λµ (t,t')+ ∑ ∞ ∫dτ gr,λν (t,τ)V νµ (τ)g 0r,µµ (τ,t') . (12) ν -∞ La componente "locale" gdd ha una sua equazione di Dyson chiusa. Infatti, combinando (in notazione matriciale) gr , dd = g0r,dd +g0r,dd ∑ Vdkgr,kd (13) k con gr,kd = g0r,kk Vkdgr,dd (14) si ottiene 2 (d) gr , dd = g0r,dd +g0r,dd Σ r gr,dd , (15) con la "self-energy dinamica" (da non confondersi con le svariate altre) (d) (t,t') = ∑ Vdk(t)g0r,kk (t,t')Vkd(t'). (16) k Queste equazioni risovono il problema di un elettrone in un sistema vuoto (o quello coniugato di una buca in un sistema pieno). Σ r Funzione ritardata, struttura elettronica e traiettoria. Il calcolo della funzione di Green ritardata e' in ogni caso, il primo passo della soluzione; qualche volta il problema e' effettivamente a un corpo e non c'e' bisogno di fare altro: infatti, gr,dd(t,t') e' l'ampiezza su d della funzione d'onda al tempo t, con la condizione iniziale che l'elettrone sia in d al tempo t'. Un esempio si ha nello studio del desorbimento di un atomo da un cristallo ionico, per esempio un F da un fluoruro alcalino. Normalmente, il Fluoro e' presente come F- , ma al tempo t=0, viene prodotto un F neutro per 1Analogamente, quella per la funzione avanzata puo' essere scritta g a,λµ(t,t')=g0a,λµ(t,t')+ ∑ ∞ ∫dτ g 0a,λν (t,τ)V νµ(τ)g a,µµ(τ,t') . ν -∞ 2In notazione usuale l'equazione per g r,dd si scrive g r ,dd(t,t') = g0r,dd (t,t') + (d) ∞dτ ∞dτ g 0 ∫ 1 ∫ 2 r,dd (t,τ 1 ) Σ r (τ 1 ,τ 2 ) g r,dd (τ 2 ,t') . -∞ -∞ =443= Prof. M. Cini -Corso di Fisica Atomica e Molecolare fotoionizzazione o per urto. Se stesse fermo, il Fluoro sarebbe prima o poi destinato a riprendersi l'elettrone. Poiche' pero' viene meno la forza di Madelung, l'atomo e' libero di desorbire, e potra' essere rivelato come atomo neutro per t→∞ . Converra' allora passare alla rappresentazione delle buche e prendere n0d=1, n0k =0; il problema si riduce al calcolo della funzione di Green ritardata della buca. Per amore di semplicita' si introduce di solito l'ipotesi che Vdk(t) si possa fattorizzare in modo che tutti gli elementi abbiano una dipendenza temporale comune Vdk(t) = u(t)Vdk (17) dove u(t) e' una qualche funzione del tempo. Una tale ipotesi, benche' un po' arbitraria, semplifica l'analisi senza introdurre inconsistenze e conduce a (d) Σ r (t,t') = -iθ(t-t')u* (t)u(t')∑ |Vdk|2 exp[-i εk (t-t')] . k Come si ricordera', il livello virtuale in condizioni statiche (H indipendente dal tempo) e' caratterizzato da una self-energy Σ(ω), che qui, per evitare confusioni, denoteremo Σs. La sua espressione e' Σs(ω) = ∑ |Vdk|2 , ω-εk +iδ k con δ =+0. La sua trasformata di Fourier e' Σs(t) = -iθ(t) ∑ | V dk|2 exp(-iεk t), k e permette di scrivere (d) (18) Σ r (t,t') = u* (t)u(t')Σs(t-t'), fattorizzando cosi' la dinamica propria del livello virtuale da quella indotta dalla variabilita' dell'Hamiltoniano. L'equazione di Dyson per gr,dd, tenuto conto dell'espressione esplicita di g0r,dd, si puo' scrivere gr,dd (t,t') = -i e-iεt{eiεt'θ(t-t) + τ1 t + ∫dτ1 ∫dτ2eiετ 1 u(τ1)u(τ2)Σs(τ1-τ2)g r,dd(τ2,t') }; - ∞ t' nei limiti di integrazione si e' posto in evidenza l'effetto delle varie θ in gioco. Ora si constata per derivazione che1 1L' equazione integro-differenziale resta valida anche se ε dipende dal tempo (M.Cini, Il Nuovo Cimento 8D, 333 (1986)); in questo lavoro viene data la soluzione esatta per la funzione di Green a due corpi in bande vuote o totalmente occupate, in presenza di interazioni e con V(t) arbitrario. =444= Prof. M. Cini -Corso di Fisica Atomica e Molecolare i t ∂ gr,dd (t,t') = εgr,dd (t,t') +u* (t) ∫dτ u(τ)Σs(t-τ)g r,dd(τ,t'). ∂t t' (19) Per studiare il significato fisico di questa equazione, consideriamo il desorbimento di un atomo da un cristallo ionico; gr,dd (t,t') e' l'ampiezza di probabilita' che la lacuna, creata al tempo t', sia ancora sull'atomo al tempo t. Calcoliamo P= |gr,dd ( ∞ ,0)|2 in un semplice modello u(t) = e- λt ; (20) questo andamento e' ragionevole se gli integrali di salto decrescono in modo esponenziale con la distanza dalla superficie e l'atomo si muove con velocita' costante. Se v e' la componente normale della velocita' e d e' la distanza di legame, la frequenza associata alla v rottura del legame e' λ ≈ . Per un atomo che desorbe con energia d cinetica di qualche eV, e d ≈ 1Å, si trova che h / λ <<1 eV e' molto minore della larghezza tipica delle bande di valenza. E' interessante il caso limite di un livello virtuale lorentziano, quando Σs(ω) puo' essere considerata una costante complessa, Σs(ω)≈Λ-2i∆. La parte reale Λ da' solo uno spostamento del livello, che possiamo riassorbire nella definizione di εd. Allora, possiamo prendere1 Σs(t) = -2i∆θ(t)δ(t), (21) dove ∆ e' la larghezza del livello, legata al suo tempo di vita. Grazie alla δ la (8,19) diventa un'equazione differenziale, ∂ i gr,dd= [ε-2i∆e-2λt]gr,dd, ∂t e la soluzione e' immediata: ∆ gr,dd(t,0)=-iθ(t) exp{-iεt - λ (1-e-2λt)}. Quindi, la probabilita' P che un rivelatore a distanza infinita veda un F neutro e' -2∆ P= exp[ λ ]. (22) Questo modello predice una dipendenza dalla velocita' del tipo -v0 P(v)∝exp[ ], dove v0 e' una costante; per v<<v0 , P e' praticamente v 0. Ma P(v) non e' analitica per v→0 e, sebbene λ possa essere piccolo 1Il prodotto θ(t)δ(t) e' ambiguo; qui va interpretato con θ(0)=1, in modo che la trasformata di Fourier sia -2i∆. =445= Prof. M. Cini -Corso di Fisica Atomica e Molecolare rispetto a ∆, ogni sviluppo perturbativo in potenze di λ e' destinato a fallire. Ci sono pero' buoni motivi per ritenere che l'ipotesi lorentziana Σ = costante non sia giustificata in generale; infatti, P deve dipendere dalla posizione del livello atomico rispetto al continuo della banda. Consideriamo ad esempio un livello virtuale di forma rettangolare e di semilarghezza a. Se aggiungiamo all'Hamiltoniano modello un termine εnd, che produce un disallineamento ε fra il livello atomico e il centro del continuo, la densita' di stati del livello virtuale ne risultera' distorta. L'equazione integro-differenziale puo' essere risolta analiticamente1 e permette di calcolare P in funzione di λ e di ε, espresse ambedue in unita' di a. 1 P 0.8 ε =0.9a 0.6 0.4 ε =0 0.2 0 λ -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 Fig.6 La probabilita' P che lo ione desorba senza essere rineutralizzato risulta sempre una funzione monotona crescente del parametro λ; per energie cinetiche dello ione dell'ordine di alcuni eV, P<<1. Tuttavia, P per piccole velocita' puo' essere esaltato di ordini di grandezza, se il livello e' vicino al bordo del continuo. Questo effetto non e' presente nel modello lorentziano, perche' in tal caso i bordi di banda semplicemente non esistono. Inclusione di un livello di Fermi. 1M.Cini, Il Nuovo Cimento 9D, 1515 (1987)) =446= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Il formalismo generale e' necessario quando la banda e' parzialmente occupata. La quantita' che dipende dai numeri di occupazione e' f; l'equazione di Dyson per Ω=0, come si e' visto, e' risolta da f=[1+gr σr ]f0[1+σaga] (23) dove f0µν (t,t') = g0>µν (t,t')-g0<µν (t,t') = = δµν (1-2n 0µ)exp[-iεµ(t-t')] (24) L'equazione per f va intesa come una relazione fra matrici sia negli 'indici' temporali (t,t' e tempi intermedi) che in quelli di stato (d, k e stati intermedi). Esplicitando tale dipendenza con la notazione [.] λρ(t,t') si puo' scrivere ∞ ∞ fλρ(t,t') = ∑ ∫dτ1 [1+gr σr ]λµ (t,τ1) ∫dτ2f0µν (τ1,τ2)[1+σaga]νρ(τ2,t') . µν - ∞ -∞ Troveremo molto utile il seguente artificio. Sia t →- ∞ . Allora, f0λµ (t,t') = δλµ (1-2n 0λ )(-i)exp[-iελ (t- t)]θ(t- t)(+i)exp[-iελ ( t-t')] θ(t'- t) = δλµ (1-2n 0λ )g 0r,λλ (t, t) g 0a,λλ ( t,t') , (25) e sostituendo otteniamo ∞ fλρ(t,t') = ∑ (1-2n 0λ ) ∫dτ1 [1+gr σr ]λν (t,τ1)g 0r,νν (τ1, t) ν -∞ ∞ x ∫dτ2g0a,νν ( t,τ2)[1+σaga]νρ(τ2,t') . -∞ Usando l' equazione di Dyson [1+gr σr ]g0r =gr , e l'analoga per ga, fλρ(t,t') = ∑ (1-2n 0ν ) g r,λν (t, t)g a,νρ( t,t') , t→- ∞ . (26) ν Questo risultato compatto completa la soluzione generale del problema di molti elettroni non interagenti con integrali di hopping dipendenti dal tempo. Il calcolo delle funzioni avanzate e ritardate e' un problema a particella singola, mentre l'equazione per f tiene conto degli effetti a molti corpi. La conoscenza di gr ,ga e f ci consente ora di trovare nd(t) = < g dd(t): infatti, 2g<= g<+ g>+g<- g>= i(gr -ga) -f. =447= (27) Prof. M. Cini -Corso di Fisica Atomica e Molecolare Possiamo mettere g< in una forma particolarmente simmetrica come segue. Applichiamo la (27) ad uno stato vuoto, che ha g<≡0: avremo i(gr -ga) = f | = ∑ gr,λν (t, t)g a,νρ( t,t'). ν n0λ =0 Lo stesso risultato si trova considerando un sistema totalmente occupato: in tal caso, scriveremo 2g> = g<+ g>-g<+ g>= i(gr -ga) +f, e poiche' ora g >≡0, i(gr -ga) = -f| = ∑ gr,λν (t, t)g a,νρ( t,t'). ν n0λ =1 Il punto e' che per un sistema non interagente gr e ga sono indipendenti dai numeri di occupazione , e l'espressione trovata deve valere dovunque si trovi il livello di Fermi. In conclusione, sostituendo i(gr,λρ(t,t') -ga,λρ(t,t')) = ∑ gr,λν (t, t)g a,νρ( t,t') . ν 1 nella (27) si trova 2g<λρ = ∑ gr,λν (t, t)g a,νρ( t,t') - fλρ ν cioe' (28) , g<λρ(t,t') = ∑ n0ν gr,λν (t, t)g a,νρ( t,t') . ν Per il nostro problema porremo λ=ρ=d; (29) nd(t) = ∑ n0ν gr,dν (t, t)g a,νd( t,t') = ∑ n0ν |gr,dν (t, t)| 2. (30) ν ν Questa e' la formula simmetrica che volevamo trovare. La somma su ν coinvolge d e tutti gli stati delocalizzati. Gli n0ν dipendono dal problema fisico concreto; per bande piene o vuote il problema e' ad un solo corpo e ritroviamo i risultati noti. Se un atomo con il livello d occupato urta una superficie e gli stati k con cui interagisce in modo importante sono tutti vuoti, prenderemo n0d=1, n0k =0. Allora nd(t) = |gr,dd(t, t)| 2, come gia' sappiamo. Un altro esempio simile e' quello gia' citato del desorbimento di un atomo da un cristallo ionico, per esempio un F da un fluoruro alcalino. Nella rappresentazione delle buche, n0d=1 e n0k =0; il problema si riduce al calcolo della funzione di Green ritardata della buca. Se essa e' creata al tempo t=0, e' questo il tempo a cui si riferiscono le condizioni iniziali, cioe' t=0. 1Analogamente uno puo' ricavare anche g >λρ(t,t') = ∑ (1-n0ν)g r,λν (t, t)g a,νρ ( t,t') , ν e formare g c in accordo con la letteratura (a meno delle ormai consuete confusioni notazionali). Il problema e' completamente risolto. =448= Prof. M. Cini -Corso di Fisica Atomica e Molecolare Le complicazioni a molti corpi compaiono ad esempio nel calcolo della probabilita' di neutralizzazione di uno ione positivo che urta una superficie metallica. In questo caso, n0d=0, e (31) ∑ n0k |gr,dk (t, t)| 2. k mentre n0k e' l'occupazione degli stati del metallo secondo la distribuzione di Fermi. La componente appropriata dell'equazione di Dyson, gr,dk (t, t)= ∞ ∫dτ gr,dd(t,τ)V dk(τ)g 0r,kk (τ, t) = -∞ = .-i exp(iεk t) ∞ ∫dτ gr,dd(t,τ)V dk(τ)exp(-iεk τ) , nd(t) = t permette di esprimere nd in termini della sola componente "locale" gr,dd, che ha, come si e' visto, una equazione 'chiusa' in termini della (d) self-energy Σ r . Blandin e colleghi hanno sviluppato i calcoli per un atomo inizialmente in equilibrio con una superficie metallica che viene emesso in un processo di sputtering, assumendo un livello virtuale lorentziano. Il risultato adiabatico, cioe' quello che corrisponde a v →0, e' ovviamente nd( ∞ )=1 se ε<EF e nd( ∞ )=0 se ε>Ef, dove EF e' l'energia di Fermi. Per piccole velocita', la deviazione rispetto al -v0 limite adiabatico e' ancora della forma exp[ ], come nel problema v di un elettrone in una banda vuota. Sarebbe interessante studiare l'andamento di nd(t) in presenza del livello di Fermi tenendo conto anche della forma corretta del livello virtuale; questo non e' stato ancora fatto. Inoltre, il formalismo permetterebbe di includere approssimativamente l'interazione degli elettroni, con particolare riguardo a quella fra stati localizzati. Bibliografia essenziale Oltre ai vari articoli citati nel testo, ho usato i seguenti libri: J.J. Sakurai, "Advanced Quantum Mechanics", Addison-Wesley (1967) A.C.Carrington, F.R.S and A.D. McLachlan, "Introduction to Magnetic Resonance", Chapman and Hall, John Wiley & Sons, Inc. New York (1978). =449= Prof. M. Cini -Corso di Fisica Atomica e Molecolare D. Chattarji, "Theory of Auger Transitions", Academic Press (1976). K.Siegbahn , C. Nordling, G. Johansson, J. Hedman, P.F. Heden, K. Hamrin, U. Gelius, T. Bergmark, L.O. Werme, R. Manne and Y. Baer, "ESCA APPLIED TO FREE MOLECULES", North-Holland Publishing Company, Amsterdam-London (1969). P.W.Atkins, "Molecular Quantum Mechanics", Oxford University Press, Oxford (1983) J.N.Murrel,S.F.A.Kettle and J.M.Tedder, "Valence Theory", John Wiley & Sons LTD London (1969) W. Greiner, "Relativistic Quantum Mechanics", Springer Verlag Berlin (1990) R.Becker,"Electromagnetic Fields and Interactions", Vol.II, Blackie,London and Glasgow (1964) E. G. Harris, "Introduction to Modern Theoretical Physics", John Wiley & Sons, New York (1975) F.Albert Cotton, "La Teoria dei Gruppi in Chimica", Tamburini Editore S.P.A. Milano (1975) M. Cini, "Lezioni di Fisica Molecolare", Dipartimento di Fisica, Universita' del'Aquila, (Ottobre 1983) Bernd Thaller, "The Dirac Equation", Springer Verlag (1992) =450=