Università di Torino Corso di Studi in Scienza dei Materiali Laurea Magistrale in Scienza dei Materiali A. A. 2013-2014 TEORIA DEL FUNZIONALE DELLA DENSITÀ Appunti del corso Bartolomeo Civalleri [appunti aggiornati al September 16, 2014] 1 Premessa Queste note richiamano gli argomenti svolti nel modulo di Teoria del Funzionale della Densitá del corso opzionale di Complementi di Scienza dei Materiali Computazionale per la Laurea Magistrale in Scienza dei Materiali presso l’Università di Torino. NOTA: Gli appunti sono in continuo aggiornamento e quindi alcuni capitoli possono non essere completi o in fase di revisione. Le figure sono state rimosse per evitare problemi di copyright (contattare il docente) Testo di riferimento: Koch, W., Holthausen, M.C.; A Chemist’s Guide to Density Functional Theory, Wiley-VCH, Weinheim, 2000 Altri testi consultabili per approfondimenti sono: • Parr, R.G; Yang, W. Density Functional Theory of Atoms and Molecules, Oxford University Press, NY, 1989 • Dreizler, R.M.; Gross, E.K.U. Density Functional Theory: An Approach to the ManyBody Problem; Springer-Verlag, Berlin, 1990 • Gill, P.W.M.; Density Functional Theory (DFT), Hartree-Fock (HF), and the Selfconsistent Field, in Encyclopedia of Computational Chemistry, Schleyer, P.v.R.; Allinger, N.L.; Clark, T.; Gasteiger, J.; Kollman, P.A.; Schaefer III, H.F.; Schreiner, P.R. (eds.); Wiley, Chichester, 1998, vol. A, pp. 678-689 2 Contents 1 Introduzione 1.1 Dalla funzione d’onda alla densità elettronica . . . . . . . . . . . . . . . . . . 1.2 Un esempio semplice: il modello di Thomas-Fermi . . . . . . . . . . . . . . . 5 5 8 2 Teoremi di Hohenberg-Kohn 2.1 Teorema I: la densità come variabile base . . . . . . . . . 2.2 Teorema II: principio variazionale . . . . . . . . . . . . . 2.3 Il problema della v- e N-rappresentabilità . . . . . . . . . 2.4 Riformulazione di Levy-Lieb: la ricerca-vincolata . . . . . 2.5 Estensioni . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Sistemi con polarizzazione di spin . . . . . . . . . 2.5.2 Dipendenza dalla temperatura e ensemble statistici 2.5.3 Dipendenza dalla densità di corrente . . . . . . . 2.5.4 Dipendenza dal tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 14 16 16 18 18 18 19 19 3 Matrici densità e buca di scambio e correlazione 3.1 Matrici densità e operatore densità . . . . . . . 3.2 Matrici densità ridotte . . . . . . . . . . . . . . 3.3 Matrici densità spinless . . . . . . . . . . . . . 3.4 Densità di paia . . . . . . . . . . . . . . . . . . 3.5 Buca di scambio-correlazione . . . . . . . . . . 3.5.1 La buca di Fermi . . . . . . . . . . . . . 3.5.2 La buca di Coulomb . . . . . . . . . . . 3.5.3 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 20 21 24 25 26 28 29 29 . . . . . . . . . 32 32 34 37 37 38 38 39 40 42 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Approccio di Kohn-Sham 4.1 Sistema di elettroni non interagenti . . . . . . . . . . . . . . . . . . 4.2 Funzionale di scambio e correlazione ed equazioni di Kohn-Sham . . 4.3 Discussione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Significato delle autofunzioni di Kohn-Sham . . . . . . . . . 4.3.2 Significato degli autovalori di Kohn-Sham . . . . . . . . . . . 4.3.3 Significato del potenziale di XC . . . . . . . . . . . . . . . . 4.3.4 Nota su scambio esatto e funzionale di scambio e correlazione 4.4 Connessione adiabatica . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Funzionali di scambio e correlazione 5.1 La scala di Giacobbe (Jacob’s Ladder) . . . . . . . . . . . . . 5.2 Funzionali di scambio e correlazione ibridi . . . . . . . . . . . . 5.2.1 Funzionali ibridi globali . . . . . . . . . . . . . . . . . 5.2.2 Funzionali ibridi di tipo Range-Separated (RSH) . . . . 5.3 Metodi doppio-ibridi (Double-Hybrids) . . . . . . . . . . . . . 5.3.1 Metodo B2-PLYP (S. Grimme JCP 124 (2006)034108) 5.4 Alcune note schematiche sulla costruzione di un funzionale . . . 5.4.1 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Funzionali locali e correzioni per il gradiente da GEA (GGA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 44 48 48 49 50 50 51 52 53 6 Implementazione dei metodi DFT 55 6.0.1 Implementazione dei metodi DFT . . . . . . . . . . . . . . . . . . . . 55 7 Valutazione dei metodi DFT A Sul A.1 A.2 A.3 concetto di funzionale e derivata Funzionale e derivata funzionale . . Formula di Eulero . . . . . . . . . Minimo di un funzionale . . . . . . 60 di un funzionale 62 . . . . . . . . . . . . . . . . . . . . . . . 62 . . . . . . . . . . . . . . . . . . . . . . . 65 . . . . . . . . . . . . . . . . . . . . . . . 67 B PBE’s type exchange functionals and functional derivatives 69 C B97-like exchange-correlation functional and functional derivatives 73 4 Chapter 1 Introduzione 1.1 Dalla funzione d’onda alla densità elettronica Consideriamo l’approccio tradizionale (o standard) ai metodi della meccanica quantistica incentrato sull’uso come variabile base della funziona d’onda. b = EΨ, Per una molecola con N elettroni si deve risolvere l’equazione di Schrödinger HΨ dove l’operatore Hamiltoniano elettronico ha l’espressione b elec = −1/2 H N X ∇2i − i N X M X ZA i A ria N X M X N M X X 1 ZA ZB + + r RAB i j>i ij A B>A (1.1) dove ria = |ri − RA |, rij = |ri − rj | e RAB = |RA − RB |. b elec può essere riscritto evidenziando la dipendenza da un potenziale esterno, Vext , rappreH P ZA sentato dall’interazione con i nuclei atomici, v(ri ) = M A ria , quindi b elec = −1/2 H N X ∇2i − N X i i N X N X 1 v(ri ) + r i j>i ij (1.2) b elec è completamente definito quando sono noti: Dalle relazioni (1.1) e (1.2) risulta che H 1. il numero di elettroni, N 2. il potenziale esterno, Vext , che a sua volta è definito da • carica nucleare, ZA • posizione dei nuclei, RA b (tralasciamo l’indicazione elec) è possibile risolvere l’equazione di Schrödinger Dato l’operatore H e ottenere la funzione d’onda e l’energia. Per fare questo siamo aiutati da un importante strumento: il principio variazionale, che stabilisce che b tr i = Etr ≥ E0 = hΨ0 |H|Ψ b 0i hΨtr |H|Ψ esiste quindi una relazione funzionale tra E e Ψ E = E[Ψ] 5 (1.3) L’energia è un funzionale della funzione d’onda. Possiamo esprimere il principio variazionale anche come b c E = min E[Ψ] = min hΨ|H|Ψi = min hΨ|Tbe + Vd ext + Vee |Ψi Ψ→N Ψ→N Ψ→N dove Ψ → N significa che si ricerca la Ψ tra tutte le funzioni d’onda N -elettroniche fisicamente accettabili (continue, con derivate continue e di quadrato integrabile - vedere primo postulato della QM) Ad esempio per il metodo Hartree-Fock si ha b E = min hΦ|H|Φi = min E[Φ] Φ→N Φ→N dove il minimo si ottiene ricercando il miglior set di spinorbitali che definiscono il determinante di Slater, Φ. Quindi, mettendo insieme tutte queste osservazioni possiamo dire che dati {N, ZA , RA } questi definiscono l’operatore hamiltoniano che attraverso la soluzione dell’equazione di Schrödinger determinano Ψ e l’energia, E. Possiamo indicare questo con b =⇒ Ψ =⇒ E {N, ZA , RA } =⇒ H Otteniamo, allora, che E = E[N, Vext ] dove si evidenzia che l’energia dipende dal numero di elettroni e dal potenziale esterno. La relazione funzionale scritta sopra non vale solo per l’energia, ma per qualsiasi altra osservb abile. Il valore di aspettazione per un’osservabile è dato infatti da O = hΨ|O|Ψi. Anche la densità elettronica, ρ(r), si può ottenere da Ψ come Z Z ρ(r1 ) = N · · · |Ψ(x1 , x2 , ..., xN )|2 ds1 dx2 · · · dxN questa è la probabilità di trovare uno qualsiasi degli N elettroni nell’elemento di volume dr1 con spin arbitrario (gli altri N − 1 elettroni hanno posizione e spin arbitrari). ρ(r) è più propriamente una densità di probabilità. La densità elettronica, ρ(r), ha una serie di importanti proprietà • ρ(r) è positiva • ρ(r) dipende dalle sole variabili spaziali: ρ(x, y, z) • ρ(r) svanisce all’infinito: ρ(r → ∞) = 0 • integrata dà il numero di elettroni totale: R ρ(r1 )dr1 = N Inoltre, ρ(r) • è un osservabile fisica, ottenibile da esperimenti di diffrazione di raggi X • presenta dei massimi solo in corrispondenza della posizione dei nuclei, RA 6 A • sui nuclei è presente una cuspide, conseguenza della singolarità nel termine − rZiA dell’hamiltoniano per riA → 0. Questa cuspide dipende dalla carica nucleare attraverso la relazione ∂ + 2ZA ρ̄(r) = 0 lim riA →0 ∂r dove ρ̄(r) è la media sferica di ρ(r) 1 ρ̄(r) = 4π Z π Z 2π ρ(r) sin θdθdφ 0 0 La condizione di cuspide può ugualmente essere espressa come −2ZA = ∂ ln ρ̄(r) |ri =RA ∂riA La relazione sopra è facilmente verificabile nel caso di un atomo (ad esempio, si provi 1 Z 3/2 −Z ar ). come esercizio a verificarlo per l’atomo di idrogeno per il quale Ψ1s = π1/2 e a Nel caso molecolare la densità elettronica è mediata sfericamente nell’intorno della posizione dei nuclei, RA . • decade con un andamento esponenziale asintotico per grandi distanze dai nuclei come √ ρ(r) ∝ exp[−2 2I|r|] dove I è il potenziale di ionizzazione Quindi ρ(r), come Ψ, contiene tutti gli ingredienti necessari per definire l’operatore hamiltoniano: N, ZA , RA ; e di conseguenza tutte le proprietà molecolari. Si può scrivere b =⇒ Ψ =⇒ E ρ(r) =⇒ {N, ZA , RA } =⇒ H Possiamo allora affermare che l’energia è un funzionale della densità elettronica E = E[ρ(r)] e vale il seguente principio variazionale E= min E[ρ] ρ→N,Vext dove ρ → N, Vext indica che la ricerca va fatta su tutte le ρ accettabili dal punto di vista fisico e cioè che integrate diano il numero totale di elettroni, N , e che definiscano univocamente il potenziale esterno, Vext . Questi due risultati corrispondono ai due teoremi di Hohenberg-Kohn. Il primo stabilisce l’esistenza del funzionale, E[ρ], e il secondo definisce un principio variazionale. 7 1.2 Un esempio semplice: il modello di Thomas-Fermi I primi tentativi di usare la densità elettronica come variabile base risalgono in realtà alle origini della meccanica quantistica. Infatti, nel 1927, Thomas e Fermi in modo indipendente, proposero un semplice modello meccanico-statistico della struttura elettronica degli atomi. In pratica il modello di Thomas-Fermi ha un interesse prevalemtemente storico con scarsa utilità concreta, ma è da considerarsi il primo esempio di quella che diventerà la teoria del funzionale della densità. Thomas e Fermi considerano un sistema ideale di elettroni non interagenti, cioè un gas uniforme di elettroni non interagenti. L’energia del sistema in esame dipenderà quindi esclusivamente dall’energia cinetica degli elettroni. Anche se l’assunzioni fatte sono molto drastiche è possibile dimostrare che per tale sistema l’energia dipende solamente dalla densità elettronica ρ(r). Dividiamo lo spazio in piccoli cubetti (celle) ognuno di lato l e volume ∆V = l3 , ognuno contenente un numero fissato di elettroni ∆N (che può essere diverso da cella a cella). Assumiano quindi che gli elettroni in ogni cella si comportino come particelle fermioniche indipendenti a T = 0K e che le celle siano tra loro indipendenti. I livelli energetici delle particelle in una buca di potenziale tridimensionale infinita sono dati da h2 2 h2 2 2 2 (nx , ny , nz ) = (n + ny + nz ) = R 8ml2 x 8ml2 dove nx , ny , nz = 1, 2, 3, .... Per numeri quantici elevati, cioè per grandi valori di R, il numero di livelli energetici con energia minore di può essere approssimato dal volume di un ottante di una sfera di raggio R nello spazio (nx , ny , nz ). Questo numero è 1 Φ() = 8 4πR3 3 π = 6 8ml2 h2 3/2 (1.4) Il numero di livelli energetici tra e + δ è quindi π g()∆ = Φ( + δ) − Φ() = 4 8ml2 h2 3/2 1/2 δ + O((δ)2 ) (1.5) dove la funzione g() è la densità degli stati con energia . Per calcolare l’energia totale di una cella con ∆N elettroni, occorre conoscere la probabilità di occupazione dello stato con energia che indichiamo con f (). Questa è data dalla distribuzione di Fermi-Dirac 1 (1.6) f () = 1 + eβ(−µ) dove β = gradino 1 kB T e kB è la costante di Boltzmann. A T = 0K la ?? si riduce alla funzione f () = 1, < F f () = 0, > F (1.7) (1.8) con β → ∞, dove F è l’energia di Fermi. Tutti gli stati con energia minore di F sono occupati mentre quelli con energia maggiore sono non-occupati. 8 Sommando i contributi dovuti ai diversi stati energetici, si ricava l’energia totale degli elettroni nella cella R ∆E = 2 f ()g()d = 4π = 8π 5 2m 3/2 3 l h2 R F 0 3/2 d (1.9) 2m 3/2 3 5/2 l F h2 dove il fattore 2 indica che ogni livello è doppiamente occupato da un elettrone con spin α e un altro con spin β. L’energia di Fermi è legata al numero di elettroni ∆N nella cella attraverso la formula 3/2 Z 8π 2m 3/2 l3 F (1.10) ∆N = 2 f ()g()d = 2 3 h Eliminando F dalla 1.9 usando la 1.10 si ricava 3h2 3π ∆N F = ∆E = 5 10m 3 8π 2/3 l 3 ∆N l3 5/3 (1.11) L’equazione 1.11 è la relazione tra l’energia cinetica totale e la densità elettronica ρ = ∆N/l3 = ∆N/V per ogni cella nello spazio. (Notare che celle diverse possono avere valori diversi di ρ.) Sommando i contributi da tutte le celle si ottiene l’energia cinetica totale che in unità atomiche diventa Z TT F [ρ] = CF ρ5/3 (r)dr (1.12) dove 3 (3π 2 )2/3 = 2.871 (1.13) 10 ed è stato considerato il limite per ∆V → 0 con ρ = ∆N/∆V = ρ(r) con valore finito per passare da una somma ad un integrale. Questo è il famoso funzionale energia cinetica di Thomas-Fermi che fu applicato allo studio degli elettroni negli atomi. CF = Nota: in questa approssimazione è stato assunto che le proprietà elettroniche siano determinate da funzionali della densità elettronica che localmente si rifanno ad un sistema elettronico omogeneo. Questa assunzione è alla base di quella che vedremo essere l’approssimazione locale dei funzionali della densità (local density approximation, LDA). Se al contributo cinetico dato dalla 1.12 si sommano le energie elettrostatiche classiche di attrazione elettrone-nucleo e repulsiva elettrone-elettrone (trascurando i contributi di scambio e correlazione) si ottiene per un atomo l’energia espressa solo in termini della densità elettronica Z Z Z Z Z 1 ρ(r1 )ρ(r2 ) 5/3 ET F [ρ(r)] = CF ρ (r)dr − ρ(r)dr + dr1 dr2 (1.14) r 2 |r1 − r2 | Questo è il funzionale energia totale nella teoria atomica di Thomas-Fermi. Per le molecole l’espressione sopra può essere opportunamente modificata. 9 Si può assumere allora che per lo stato fondamentale di un atomo la densità elettronica minimizza il funzionale ET F [ρ(r)] soggetto al vincolo Z N = N [ρ(r)] = ρ(r)dr (1.15) dove N è il numero totale di elettroni nell’atomo. Usando il metodo dei moltiplicatori di Lagrange, la densità elettronica dello stato fondamentale deve soddisfare il principio variazionale Z δ ET F [ρ] − µT F ρ(r)dr − N =0 (1.16) che porta all’equazione di Eulero-Lagrange µT F = 5 δET F [ρ] = CF ρ2/3 (r) − φ(r) δρ(r) 3 (1.17) dove φ(r) è il potenziale elettrostatico nel punto r generato dal nucleo e dall’intera distribuzione elettronica Z ρ(r2 ) Z dr2 (1.18) φ(r) = − r |r − r2 | L’equazione di Eulero-Lagrange può essere risolta insieme al vincolo per ricavare la densità elettronica che inserita nella 1.14 permette di ottenere l’energia dello stato fondamentale. Il modello di Thomas-Fermi può essere esteso ad un gas di elettroni integragenti includendo i contributi di scambio (Dirac-Slater, TFD)[3, 4] e correlazione (Wigner, TFDW)[5] o per tenere conto di effetti di non omogeneità del gas di elettroni (Weizsacker, Kirzhnitz, TFW)[6, ?]. La crudezza delle approssimazioni del modello lo rendono inaccurato per la descrizione di atomi e molecole ed è stato dimostrato non essere in grado nè di riprodurre la struttura a guscio degli atomi nè di dare alcuna legame tra gli atomi in una molecola [7]. 10 Chapter 2 Teoremi di Hohenberg-Kohn La formulazione moderna della teorià del funzionale della densità ha avuto origine con il famoso articolo di P. Hohenbger e W. Kohn (HK) del 1964[8]. Gli autori dimostrarono che un ruolo chiave può essere assegnato alla densità di particelle per lo stato fondamentale di un sistema multi-corpi. La densità diventa quindi la variabile base per la descrizione del sistema in quanto tutte le proprietà osservabili possono essere considerate funzionali unici della densità dello stato fondamentale. A differenza da quanto visto per il modello di Thomas-Fermi, l’approccio di Hohenberg e Kohn è di formulare la teoria del funzionale della densità come una teoria esatta per un sistema multicorpi. A fini del corso, noi consideriamo un sistema di multielettronico a nuclei fissi descritto dall’hamiltoniano N N N X N X X X 1 b elec = −1/2 (2.1) H ∇2i − v(ri ) + r ij i i i j>i ma la teoria è del tutto generale e si applica ad un sistema di particelle (fermioni o bosoni) soggette all’azione di un potenziale esterno Vext (r). La formulazione di basa su due teoremi fondamentali. 2.1 Teorema I: la densità come variabile base Teorema I: Per qualsiasi sistema di particelle interagenti soggetto all’azione di un potenziale esterno Vext (r), il potenziale Vext (r) è determinato unicamente, a meno di una costante, dalla densità di particelle nello stato fondamentale, ρ0 (r). Corollario Dato che l’hamiltoniano è completamente definito, eccetto che per uno shift di energia, ne consegue che sono anche definite le funzioni d’onda multi-particelle per tutti gli stati (fondamentale ed eccitati). Perciò tutte le proprietà del sistema sono completamente determinate data la sola densità dello stato fondamentale ρ0 (r). Dimostrazione: 11 Consideriamo un sistema di multielettronico il cui la funzione d’onda Ψ0 dello stato fondamentale sia non degenere. (Nota: l’estensione al caso degenere è facile, ma vedremo più avanti che è possibile generalizzare i teoremi di HK in una formulazione che vale per stati degeneri e non degeneri). L’hamiltoniano 2.1 può essere scritto in modo conciso come b = Tb + Vbext + Vbee H La dimostrazione ”intuitiva” vista in precedenza che l’energia è un funzionale della densità elettronica può essere formalizzata in tre passaggi: A. Esiste una corrispondenza biunivoca tra il potenziale esterno Vext (r) e la funzione d’onda b e quindi la funzione Ψ0 . Come già sottolineato, definire Vext (r) corrisponde a definire H b 0 i, con E0 energia dello stato fondamentale. d’onda Ψ che soddisfa hΨ0 |H|Ψ Dato Vext (r), la funzione d’onda Ψ0 è univocamente definita. Se cosı̀ non fosse, sarebbe 0 possibile avere due potenziali diversi Vext (r) e Vext (r), che differendo tra loro per più di una costante 0 Vext (r) − Vext (r) 6= cost (2.2) 0 (r) + cost sono considerati equivalenti) danno origine alla (potenziali del tipo Vext (r) = Vext stessa funzione d’onda Ψ. Per dimostrare che questo non è vero, partiamo dalle corrispondenti equazioni di Schrödinger si ha b hΨ|H|Ψi = hΨ|Tb + Vbext + Vbee |Ψi = E0 e 0 b 0 |Ψ0 i = hΨ0 |Tb + Vbext hΨ0 |H + Vbee |Ψ0 i = E00 se fosse Ψ = Ψ0 per sottrazione si avrebbe 0 (Vbext − Vbext )|Ψi = (E0 − E00 )|Ψi (2.3) 0 0 = E0 −E00 = sono potenziali moltiplicativi, la 2.3 porterebbe a Vbext − Vbext Dato che Vbext e Vbext ∆E(cost) in contraddizione con la 2.2. Questo dimostra quindi b ⇐⇒ Ψ Vbext ⇐⇒ H B. Esiste una corrispondenza univoca tra Ψ0 e ρ(r). Questa relazione è implicita nella definizione di ρ Z Z ρ(r) = N · · · |Ψ(x1 , x2 , ..., xN )|2 ds1 dx2 · · · dxN e quindi possiamo scrivere Ψ =⇒ ρ(r) C. Alla densità elettronica ρ(r), che corrisponde a uno stato fondamentale non degenere, corrisponde univocamente un potenziale esterno Vext (r). Lo si dimostra per assurdo. 0 0 Siano Vext (r) e Vext (r) due potenziali diversi, tali che Vext (r) 6= Vext (r) + cost, cui corrispon0 b b dono le hamiltoniane H e H e quindi le due autofunzioni per lo stato fondamentale Ψ0 e Ψ00 12 che per quanto dimostrato prima (A) sono diverse. Supponiamo però che Ψ0 e Ψ00 definiscano la stessa densità di carica ρ(r). Per il teorema variazionale, dato che Ψ0 6= Ψ00 , ed essendo lo stato fondamentale non degenere, vale b 0 i < hΨ0 |H|Ψ b 0i E0 = hΨ0 |H|Ψ 0 0 ma anche b 0 |Ψ0 i b 0 |Ψ00 i < hΨ0 |H E00 = hΨ00 |H da cui b −H b 0 |Ψ0 i < hΨ00 |H b −H b 0 |Ψ00 i hΨ0 |H dato che le hamiltoniane differiscono solo per il potenziale esterno si ottiene 0 0 hΨ0 |Vbext − Vbext |Ψ0 i < hΨ00 |Vbext − Vbext |Ψ00 i che si può scrivere come Z Z 0 0 ρ(r)[vext (r) − vext (r)]dr < ρ0 (r)[vext (r) − vext (r)]dr da cui ρ(r) < ρ0 (r), ma essendo per ipotesi ρ(r) ≡ ρ0 (r), si arriva ad un assurdo. Non possono quindi esistere due potenziali esterni diversi che generano la stessa densità elettronica. Ne consegue che ρ(r) =⇒ vext (r) Riassumendo i risultati ottenuti si ricava vext (r) ⇐ ρ(r) m ⇑ b H ⇔ Ψ0 (2.4) da cui risulta che non solo esiste una relazione diretta tra Ψ0 e ρ(r), ma anche una relazione inversa, perciò la funzione d’onda è un funzionale della densità Ψ0 [ρ] e di conseguenza tutte le proprietà (osservabili) del sistema b hΨ[ρ]|O|Ψ[ρ]i = O[ρ] sono funzionali della densità. Con particolare riferimento all’energia, il primo teorema di HK stabilisce quindi l’esistenza del funzionale Ev [ρ] = Vext [ρ] + T [ρ] + Vee [ρ] in cui si è evidenziata la dipendenza esplicita da vext (r) e che i singoli contributi all’energia totale sono essi stessi dei funzionali della densità, come appena dimostrato. È possibile, a questo punto, esplicitare nell’espressione dell’energia, i contributi che dipendono dal sistema stesso: il potenziale esterno dovuto all’interazione attrattiva elettrone-nucleo e quelle che sono universali perchè la loro espressione non dipende da N, RA e ZA Z Ev [ρ] = ρ(r)vext (r)dr + T [ρ] + Vee [ρ] 13 Raccogliendo i termini che sono indipendenti dal sistema Z Ev [ρ] = ρ(r)vext (r)dr + FHK [ρ] si può definire il funzionale universale di HK FHK [ρ] = T [ρ] + Vee [ρ] = hΨ[ρ]|Tb + Vbee |Ψ[ρ]i FHK [ρ] è universale nel senso che è lo stesso funzionale per atomi, molecole e solidi indipendentemente dal fatto che l’interazione degli elettroni sia con un nucleo, alcuni nuclei o un reticolo cristallino. 2.2 Teorema II: principio variazionale Teorema II: È possibile definire un funzionale universale per l’energia, E[ρ], in termini della densità ρ(r), valido per qualsiasi potenziale esterno vext (r). Dato un qualunque potenziale esterno vext (r), l’energia esatta dello stato fondamentale del sistema è il minimo globale di questo funzionale e la densità ρ(r) che minimizza il funzionale è la densità esatta dello stato fondamentale. Corollario La conoscenza del funzionale E[ρ] è sufficiente, da sola, a determinare esattamente l’energia e la densità dello stato fondamentale. In generale, stati elettronici eccitati devono essere determinati in altri modi. Anche proprietà all’equilibrio termico (con T 6= 0 K) come ad esempio la capacità termica sono determinate direttamente come funzionale della densità passando attraverso la definizione dell’energia libera come funzionale della densità. Dimostrazione: Il secondo teorema di HK può anche essere Rriformulato come: data una densità di prova ρ̃(r), tale che soddisfi le condizioni ρ̃(r) ≥ 0, ρ̃(r)dr = N e che sia associata a un qualche potenziale esterno ṽext (r), E0 ≤ Ev [ρ̃] (2.5) Per dimostrare il teorema, notiamo che il primo teorema di HK stabilisce che ρ̃ determina ˜b ṽ, l’hamiltoniana H e la funzione d’onda Ψ̃. Per quest’ultima vale il principio variazionale definito dalla relazione 1.3 e quindi può essere utilizzata come funzione d’onda di prova per l’hamiltoniana generata dal potenziale esterno vero vext (r), cioè b Ψ̃i ≥ hΨ0 |H|Ψ b 0 i = E0 [ρ0 ] hΨ̃|H| quindi per il primo teorema di HK vale Z T [ρ̃] + Vee [ρ̃] + ρ̃(r)vext dr = Ev [ρ̃] ≥ E0 [ρ0 ] 14 che è il risultato cercato. Assumendo che Ev [ρ] sia differenziabile, il principio variazionale stabilito sopra fornisce uno strumento molto utile per ricavare l’energia dello stato fondamentale imponendo che Z δ Ev [ρ] − µ ρ(r)dr − N =0 (2.6) che si riduce alla risoluzione dell’equazione di Eulero-Lagrange µ= δFHK [ρ] δEv [ρ] = vext (r) + δρ(r) δρ(r) Se si conoscesse la forma esatta del funzionale FHK [ρ] da inserire nella 2.6 si sarebbe risolto il problema di trattare un sistema multielettronico in modo esatto. Per farlo occorre dare una forma esplicita ai funzionali energia cinetica e repulsione elettrone-elettrone. Purtroppo, la loro forma funzionale non è nota. Per il momento limitiamoci però ad estrarre da Vee [ρ] almeno il contributo coulombiano classico, J[ρ], che è noto Z Z ρ(r1 )ρ(r2 ) 1 dr1 dr2 + Encl [ρ] = J[ρ] + Encl [ρ] Vee [ρ] = 2 r12 dove Encl [ρ] è un termine non classico di interazione elettrone-elettrone che contiene tutti gli effetti di correlazione elettronica e di auto-interazione. Il secondo teorema di HK limita, di fatto, l’applicabilità del principio variazionale, definito dalla 2.5, allo stato fondamentale del sistema poichè è valido solo per E0 , a differenza del primo teorema che è valido per tutti gli stati elettonici del sistema. In questo caso non viene fornita alcuna indicazione per gli stati eccitati. In sintesi: • tutte le proprietà di un sistema definito dal potenziale esterno vext (r) sono determinate dalla densità dello stato fondamentale; • l’energia dello stato fondamentale associata ad una densità ρ(r) è ottenibile attraverso R la relazione funzionale ρ(r)vext (r)dr + FHK [ρ]; • questo funzionale raggiunge il suo valore minimo, rispetto a tutte le densità permesse, se e solo se la densità usata è la vera densità elettronica dello stato fondamentale (cioè, ρ̃(r) = ρ0 (r)) questi tre punti che implicano: Ψ[ρ], universalità e teorema variazionale, costituiscono la formulazione classica dei teoremi di HK. 15 2.3 Il problema della v- e N-rappresentabilità Quanto detto finora nasconde un problema teorico di carattere più formale: esistono delle restrizioni allo spazio delle densità nella definizione di funzionale data da HK? In realtà, la dimostrazione originale di HK è ristretta alle densità ρ(r) che sono le densità dello stato fondamentale dell’hamiltoniana elettronica associate ad un qualche potenziale esterno vext (r). Queste densità vengono chiamate v-rappresentabili. Esiste quindi uno spazio, che raccoglie tutte le possibili densità, all’interno del quale si possono definire e costruire i funzionali della densità. In altre parole, non tutte le densità possibili sono valide nel contesto del primo teorema di HK. Dovrebbero essere considerate solo quelle che sono associate con una funzione d’onda antisimmetrica e un operatore hamiltoniano che contiene un qualche potenziale esterno. Un altro problema che si origina da questo aspetto è quello di stabilire quando la ρ è accettabile (v-rappresentabile). Al momento non sono note le condizioni matematiche che devono essere soddisfatte dalla ρ per essere v-rappresentabile. Si può dimostrare, come vedremo meglio nella prossima sezione, che il problema della vrappresentabilità non è essenziale e che la teoria DFT può essere riformulata in modo tale da richiedere che per il funzionale e per il principio variazionale, la densità debba soddisfare una condizione meno restrittiva, la cosiddetta N-rappresentabilità. Una densità è N-rappresentabile se può essere ottenuta da una qualche funzione d’onda antisimmetrica N-elettronica. In questo caso le condizioni matematiche perchè una densità sia N-rappresentabile sono note ρ(r) ≥ 0, R ρ(r)dr = N , e R |∇ρ1/2 |2 dr < ∞ (cioè condizioni di: non negatività, normalizzazione e continuità) e sono soddisfatte da praticamente qualsiasi densità. Le funzioni v-rappresentabili sono ovviamente un sottoinsieme di quelle N-rappresentabili. 2.4 Riformulazione di Levy-Lieb: la ricerca-vincolata Una definizione alternativa di funzionale della densità è stata proposta da Levy e Lieb. Essa ha alcuni vantaggi rispetto alla definizione data nei teoremi di HK: • estende la definizione di funzionale della densità rendendola più trattabile formalmente e chiarisce il suo significato fisico; • fornisce una via per arrivare al funzionale esatto; • porta alla stessa densità e energia di minimo come nell’analisi di HK e si applica anche al caso di stati fondamentali degeneri. L’idea di Levy e Lieb (LL) è di definire una procedura di minimizzazione in due passi. Partendo dall’espressione dell’energia in termini della funzione d’onda Z b d c b b E = hΨ|Te + Vext + Vee |Ψi = hΨ|T |Ψi + hΨ|Vee |Ψi + ρ(r)vext (r)dr 16 L’energia dello stato fondamentale può essere ricavata minimizzando l’espressione sopra rispetto a tutte le Ψ antisimmetriche N-elettroniche. c E0 = min hΨ|Tbe + Vd ext + Vee |Ψi Ψ→N Quella che determina l’autovalore più basso è la funzione d’onda dello stato fondamentale Ψ0 . Per collegare il principio variazionale sopra alla teoria DFT, si considera solo l’insieme di funzioni Ψ che danno la stessa densità ρ(r) e si cerca la Ψ che minimizza l’energia h i Z b c E = min hΨ|T + Vee |Ψi + ρ(r)vext (r)dr Ψ→ρ(r) a questo punto si minimizza l’energia per quella data densità ρ(r) h i Z b c E0 = min min hΨ|T + Vee Ψi + ρ(r)vext (r)dr ρ(r)→N Ψ→ρ(r) Dalle espressioni sopra si può definire il funzionale universale di Levy-Lieb FLL [ρ] come FLL [ρ] = min hΨ|Tb + Vc ee Ψi Ψ→ρ(r) quindi E0 = min ρ(r)→N Z FLL [ρ] + ρ(r)vext (r)dr Bisogna notare che • Il significato di E0 è quindi il minimo della somma di energia cinetica e repulsione elettronica cercato tra tutte le possibili Ψ che danno la stessa densità ρ0 ; • la ricerca è vincolata (constrained-search) perchè si considera solo l’insieme delle funzioni d’onda che danno la densità ρ0 (r) a differenza del caso tradizionale b E0 = min hΨ|H|Ψi Ψ→N dove la ricerca considera l’intero spazio delle funzioni d’onda antisimmetriche N-elettroniche; • il funzionale di LL è definito per qualsiasi densità che sia N-rappresentabile; • FLL [ρ0 ] = FHK [ρ0 ] quando ρ0 è v-rappresentabile; • la definizione di FLL elimina la restrizione della dimostrazione originale di HK di avere uno stato fondamentale non degenere; • anche se questa formulazione è più generale non fornisce alcuna via pratica per poter sfruttare le enormi potenzialità offerte dalla teoria DFT. • Nel passare dalla complessità della Ψ, funzione a 4N -variabili, alla densità elettronica, ρ(r), funzione di tre sole variabli, tutta la complessità si trasferisce nel funzionale F [ρ] che non è noto. 17 2.5 Estensioni I teoremi di HK possono essere generalizzati al caso di particelle di diverso tipo o per condizioni diverse. Di seguito sono elencate alcune delle estensioni della teoria del funzionale della densità con alcuni commenti e non verranno discusse ulteriormente. Per dettagli vedere i riferimenti citati. • sistemi con polarizzazione di spin • sistemi non elettronici e multicomponenti • stati eccitati • dipendenza dalla temperatura e ensemble statistici • dipendenza dal tempo (TD-DFT - Time Dependent-DFT) • dipendenza dalla densità di corrente (Current-DFT) 2.5.1 Sistemi con polarizzazione di spin In questo caso, oltre al potenziale esterno esiste un potenziale locale magnetico di interazione elettronica spin-spin (tipo Zeeman). Cioè il potenziale agisce solo sugli spin e non sul moto orbitale degli elettroni. All’interno di questo modello, i teoremi visti possono essere generalizzati per includere due tipi di densità: la densità elettronica totale, ρ(r) = ρα (r) + ρβ (r), e la densità di spin, s(r) = ρα (r) − ρβ (r). Questo porta al funzionale dell’energia E = EHK [ρ(r), s(r)] ≡ E[ρ(x)] dove x = {r, σ}. Questa generalizzazione costituisce la Spin-DFT che è la base per poter trattare sistemi multielettronici con molteplicità di spin non nulla. È quindi essenziale per la descrizione di solidi con ordine magnetico, come ad esempio nel caso della stabilità relativa di fasi antiferro- e ferro-magnetiche. In assenza di un campo magnetico tipo Zeeman, la soluzione a più bassa energia può avere una polarizzazione di spin ρα (r) 6= ρβ (r). Questo è un caso analogo alla soluzione unrestricted con rottura di simmetria che si ritrova nella teoria di Hartree-Fock. Aggiungere note su SDFT e teoremi di HK 2.5.2 Dipendenza dalla temperatura e ensemble statistici I teoremi di HK validi a T = 0 K si possono estendere a sistemi multi-particelle all’equilibrio termico per diversi ensemble statistici. Questo fu dimostrato da Mermin subito la pubblicazione dell’articolo di Hohenberg-Kohn. L’estensione porta a conclusioni ancora più generali perchè non solo l’energia interna, ma anche l’entropia, la capacità termica, l’energia libera, ... sono funzionali della densità elettronica. Inoltre, i teoremi possono anche essere estesi al caso in cui si abbia un sistema all’equilibrio termico con potenziale chimico costante, ma con fluttazioni del numero di elettroni. 18 2.5.3 Dipendenza dalla densità di corrente Nel caso in cui l’effetto di un campo magnetico esterno coinvolge non solo i termini elettronici spin-spin, la densità elettronica da sola non è più sufficiente, ma occorre includere anche la densità di corrente j = −p. È possibile dimostrare che anche in questo caso i teoremi di HK sono validi e quindi tutte le proprietà del sistema sono funzionali di ρ e j. Questa teoria rappresenta una delle attuali frontiere di sviluppo della teoria DFT. 2.5.4 Dipendenza dal tempo La dipendenza dal tempo tiene conto dell’evoluzione temporale di uno stato quantistico. È stato dimostrato che, data una funzione d’onda iniziale al tempo t, l’evoluzione della Ψ(r, t) a qualsiasi altro tempo t0 è un funzionale unico della densità dipendente dal tempo ρ(r, t). La dimostrazione che esiste questa relazione funzionale e un principio variazionale corrispondente é stata data nel 1985 da Runge e Gross. Su questa formulazione si basa anche l’estensione della teoria DFT agli stati eccitati. Aggiungere note su TDDFT e teoremi di HK, riferimenti a RG e review Dreuw/HeadGordon 19 Chapter 3 Matrici densità e buca di scambio e correlazione 3.1 Matrici densità e operatore densità Il concetto di matrice densità è molto generale ed è stato introdotto nella meccanica statistica quantistica per descrivere un sistema il cui stato quantistico non è completamente specificato. In questi casi esistono diverse funzioni d’onda compatibili con l’informazione data e occorre una qualche media statistica oltre alla media quantistica, che definisce il valore atteso, data da una delle funzioni d’onda. Qui non discuteremo gli aspetti formali, ma ne introduciamo solo la definizione e poi ne discuteremo velocemente alcune proprietà per arrivare a definire la densità di paia e la buca di scambio e correlazione. Sappiamo che il significato fisico di Ψ(rN , sN ), funzione d’onda di un sistema N -elettronico, è legato al suo modulo quadro |Ψ|2 che rappresenta una funzione distribuzione di probabilità |Ψ(rN , sN )|2 drN dove drN = dr1 , dr2 , ..., drN ; rN = r1 , r2 , ..., rN e sN è l’insieme s1 , s2 , ..., sN . |Ψ|2 dà cioè la probabilità di trovare il sistema N -elettronico con coordinate spaziali tra rN e rN + drN e coordinate di spin uguali a sN . Usando x ≡ {r, s}, la quantità sopra diventa ΨN (x1 x2 · · · xN )Ψ∗N (x1 x2 · · · xN ) (3.1) È possibile generalizzare questa espressione per definire un oggetto del tipo γN (x01 x02 · · · x0N , x1 x2 · · · xN ) ≡ ΨN (x01 x02 · · · x0N )Ψ∗N (x1 x2 · · · xN ) (3.2) Si considerano quindi due set di variabili indipendenti {x0N } e {xN } che possono essere pensati come due insiemi di indici che attraverso la 3.2 restituiscono un valore numerico che si può considerare come un elemento di una matrice che viene chiamata matrice densità. Nel caso in cui xi = x0i per tutti i valori di i, si ottiene un elemento diagonale della matrice che corrisponde alla 3.1. 20 La 3.2 può anche essere vista come la rappresentazione nello spazio continuo delle coordinate {x} con base |x1 x2 · · · xN ) dell’operatore densità |ΨN ihΨN | = γ bN (3.3) γN |x1 x2 · · · xN i = (x01 x02 · · · x0N |ΨN ihΨN |x1 x2 · · · xN ) hx01 x02 · · · x0N |b = ΨN (x01 x02 · · · x0N )Ψ∗N (x1 x2 · · · xN ) (3.4) dato che La matrice densità è quindi la rappresentazione dell’operatore densità nello spazio delle coordinate. L’operatore γ bN è un operatore proiezione, è Hermitiano, e, se ΨN è normalizzata, la traccia dell’operatore è Z tr(b γN ) = ΨN (xN )Ψ∗N (xN )dxN = 1 dove, in una base continua, la sommatoria sugli elementi diagonali diventa un integrale. Una proprietà importante nel formalismo della matrice densità è che l’espressione del valor b diventa medio di un’osservabile che corrisponde all’operatore O b = tr(b b = tr(Ob bγN ) hOi γN O) (3.5) che si può verificare tenendo conto che R bγN ) = b tr(Ob hx |O|Ψ ihΨ |x idx R N RN 0 N 0 N 0 N b |x ihx |dx |ΨN ihΨN |xN idxN = hx |O N N N RRN b 0 ihx0 |ΨN ihΨN |xN idxN dx0 (3.6) = R R hxN |O|x N N N 0 0 0 = R R O(x , x)b γN (x , x)dxN dxN ∗ = ΨN (xN )O(x0 , x)ΨN (x0N )dxN dx0N R dove si è usata la relazione di completezza |xN ihxN |dxN = 1 e che O(x0 , x) è la rappresenb nella base continua dello spazio delle coordinate. Per un operatore tazione dell’operatore O locale O(x0 , x) = O(x)δ(x0 − x), la 3.5 si riduce alla forma classica Z b Ni Ψ∗N (xN )O(x)ΨN (xN )dxN = hΨN |O|Ψ La relazione 3.5 rappresenta un risultato importante perchè evidenzia che l’operatore densità contiene le stesse informazioni della funzione d’onda N -elettronica. 3.2 Matrici densità ridotte La matrice densità definita in precedenza viene anche detta matrice densità di ordine N. Dato b dipende solo da operatori mono- e bi-elettronici e non dipende in modo però che l’operatore H esplicito dallo spin (cosı̀ come gli operatori corrispondenti ad altre osservabili), l’espressione 3.2 può essere quindi semplificata integrando su N − 2 variabili. Per elettroni (fermioni), la ΨN deve essere antisimmetrica. Questa integrazione consente di definire delle matrici densità 21 ridotte. In generale, si definisce la matrice densità ridotta di ordine p l’espressione γp (x01 x02 · · · x0p , x1 x2 · · · xp ) = Z Z N = · · · γN (x01 x02 · · · x0p xp+1 · · · xN , x1 x2 · · · xp · · · xN )dxp+1 · · · dxN p Di particolare interesse sono quindi la matrice densità del secondo ordine Z Z N (N − 1) 0 0 · · · Ψ(x01 x02 x3 · · · xN )Ψ∗ (x1 x2 x3 · · · xN )dx3 , ..., dxN γ2 (x1 x2 , x1 x2 ) = 2 (3.7) e del primo ordine Z Z 0 γ1 (x1 , x1 ) = N · · · Ψ(x01 x2 · · · xN )Ψ∗ (x1 x2 · · · xN )dx2 , ..., dxN (3.8) Le due matrici sono rispettivamente normalizzate al numero di coppie N (N2−1) e al numero di elettroni N . La matrice densità del primo ordine può essere ottenuta da γ2 per integrazione Z 2 0 γ2 (x01 x2 , x1 x2 )dx2 (3.9) γ1 (x1 , x1 ) = N −1 in questo caso non è necessaria la matrice densità ridotta γ2 (x01 x02 , x1 x2 ) completa, ma è sufficiente quella a tre variabili γ2 (x01 x2 , x1 x2 ). Ovviamente alle due matrici densità introdotte sopra corrispondono due operatori densità γ b2 eγ b1 che sono Hermitiani e le cui corrispondenti matrici densità sono le loro rappresentazioni nello spazio delle coordinate. Inoltre, devono essere antisimmetriche rispetto allo scambio di due particelle, come implicito nella definizione di γN . In particolare, per la matrice densità di ordine 2 si ha γ2 (x01 x02 , x1 x2 ) = −γ2 (x02 x01 , x1 x2 ) = −γ2 (x01 x02 , x2 x1 ) = γ2 (x02 x01 , x2 x1 ) (3.10) Un importante risultato, legato alle matrici densità ridotte, riguarda il valor medio di un osservabile. Per un operatore monoelettronico b1 = O N X O1 (xi , x0i ) i=1 si ottiene Z b1 i = tr(b b1 ) = hO γN O O1 (x1 , x01 )γ1 (x01 , x1 )dx1 dx01 (3.11) se l’operatore è locale, come ad esempio la parte monoelettronica dell’operatore Hamiltoniano, si ha N N X X b1 = O O1 (xi , x0i )δ(x0i − xi ) = O1 (xi ) i=1 i=1 22 e il corrispondente valor medio diventa Z b hO1 i = [O1 (x1 )γ1 (x01 , x1 )]x0 =x1 dx1 (3.12) 1 b1 agisce solo su x e che x0 viene trasformato in x dopo dove la notazione adottata indica che O b l’applicazione di O1 e prima dell’integrazione La 3.12 si può verificare facilmente usando la 3.8 hP i R ∗ N b1 i = hO Ψ (x1 x2 · · · xN ) O (x ) Ψ∗ (x1 x2 · · · xN )dx1 dx2 · · · dxN 1 i i=1 PN R ∗ Ψ (x1 x2 · · · xN )O1 (xi )Ψ(x1 x2 · · · xN )dx1 dx2 · · · dxN = Pi=1 N R = [O (x )Ψ(x x · · · xN )Ψ∗ (x01 x02 · · · x0N )]x0 =xi dx1 dx2 · · · dxN i R i=1 1 i R 1 2 = xi dxi O1 (xi ) Ψ(x1 x2 · · · xN )Ψ∗ (x01 x02 · · · x0N )dx1 · · · dxj6=i · · · dxN x0 =xi i PN 1 R 0 [O (x )γ (x , x )] dx = 0 1 i 1 i x =xi i i i=1 N i (3.13) da cui, per l’indistiguibilità degli elettroni, si arriva alla 3.12. Anche per gli operatori bielettronici si arriva ad un risultato analogo. Dato che per il problema che ci interessa gli operatori sono locali, si considera solo la parte diagonale b2 = O N X N X O2 (xi xj , x0i x0j )δ(x0i − xi )δ(x0j − xj ) = i=1 j>i N X N X O2 (xi , xj ) i=1 j>i si ottiene il corrispondente valor medio in termini della matrice densità di ordine 2 Z Z b b hO2 i = tr(b γN O2 ) = [O2 (x1 , x2 )γ2 (x01 x02 , x1 , x2 )]x0 =x1 ,x0 =x2 dx1 dx2 1 2 (3.14) Considerando l’operatore Hamiltoniano e utilizzando le relazioni precedenti, si arriva all’importante risultato b = E[γ1 , γ2 ] = E[γ2 ] E = tr(b γN H) = R i RRh 1 0 0 − 21 ∇21 + v(r1 ) γ1 (x01 , x1 ) x0 =x1 dx1 + γ (x x , x , x ) 1 2 1 2 r12 2 1 x01 =x1 ,x02 =x2 dx1 dx2 (3.15) che l’energia è esprimibile in termini delle matrici densità di ordine 1 e 2, ma per la 3.9 la sola matrice densità di ordine 2 è necessaria. È allora evidente che la funzione d’onda multielettronica contiene più informazione di quanta ne è necessaria per determinare il valor medio delle osservabili. La ridondanza di informazione contenuta nella funzione d’onda si spiega considerando il carattere statistico (valor medio) dell’informazione che si è in grado di estrarre circa le osservabili fisiche. Si potrebbe quindi pensare di usare la γ2 come variabile base e ottenere l’energia per minimizzazione dell’espressione sopra rispetto alla γ2 , ma c’è una grossa difficoltà nel realizzare questo a causa del problema della N -rappresentabilità della matrice densità di ordine 2. Recenti sviluppi hanno però in parte superato questo problema ed è stato proposto un metodo per implementare questa idea [10]. 23 3.3 Matrici densità spinless Facciamo un ulteriore passo avanti integrando (o meglio sommando) le matrici densità dei vari ordini rispetto alle variabili di spin. Si ottengono in questo modo le cosiddette matrici densità spinless i cui elementi diagonali corrispondono a delle densità elettroniche. Possiamo quindi definire la matrici densità spinless di ordine 1 e 2 come R γ1 (r01 s1 , r1 s1 )ds1 ρ1 (r01 , r1 ) = (3.16) R R 0 ∗ = N · · · Ψ(r1 s1 x2 · · · xN )Ψ (r1 s1 x2 · · · xN )ds1 dx2 · · · dxN e R ρ2 (r01 r02 , r1 r2 ) = γ2 (r01 s1 r02 s2 , r1 s1 , r2 s2 )ds1 ds2 N (N −1) 2 Ψ(r01 s1 r02 s2 x3 · · · xN )Ψ∗ (r1 s1 r2 s2 x3 · · · xN )ds1 ds2 dx3 · · · dxN (3.17) Da cui si possono estrarre gli elementi diagonali che sono rispettivamente = R ··· R ρ(r1 ) = ρ1 (r1 , r1 ) (3.18) = N R ··· R 2 |Ψ| ds1 dx2 · · · dxN la densità elettronica (densità di probabilità di avere un elettrone in r1 , indipendentemente dal suo stato di spin) e ρ2 (r1 , r2 ) = ρ2 (r1 r2 , r1 r2 ) (3.19) = N (N −1) 2 R ··· R 2 |Ψ| ds1 ds2 dx3 · · · dxN la densità elettronica di paia (densità di probabilità di avere un elettrone in r1 e un altro in r2 , indipendentemente dal loro stato di spin). Le due matrici densità, ρ1 e ρ2 sono ovviamente legate Z 2 0 ρ2 (r01 r2 , r1 r2 )dr2 ρ1 (r1 , r1 ) = N −1 da cui Z 2 ρ(r1 ) = ρ2 (r1 , r2 )dr2 (3.20) N −1 Quando gli operatori mono e bielettronici non dipendono in modo esplicito dalle variabili di spin si possono ottenere, in analogia alle 3.12 e 3.14, le espressioni dei valori medi in termini delle matrici densità spinless di ordine 1 e 2. b non contiene termini di spin, l’espressione dell’energia 3.15 In particolare, se l’operatore H diventa E = E[ρ1 (r01 , r1 ), ρ2 (r1 r2 )] = E[ρ2 (r01 r02 , r1 r2 )] (3.21) R 1 2 R RR 1 0 = − 2 ∇r ρ1 (r , r) r0 =r dr + v(r)ρ(r)dr + ρ (r , r )dr1 dr2 r12 2 1 2 dove, dato che l’operatore cinetico non è un operatore moltiplicativo (∇2r = ∇r · ∇r0 ) dipende dalla matrice densità di ordine 1 completa, ρ1 (r01 , r1 ), mentre gli altri operatori sono locali e agiscono solo sulla parte diagonale di ρ1 e ρ2 . In questo caso l’energia dipende solo più da funzioni di tre o al massimo sei variabili. 24 3.4 Densità di paia Come si vede dalla 3.21 la densità di paia spinless, ρ2 (r1 , r2 ), e la corrispondente densità di paia Z Z N (N − 1) · · · |Ψ(x1 x2 x3 · · · xN )|2 dx3 , ..., dxN (3.22) γ2 (x1 , x2 ) = 2 (e conseguentemente le matrici densità che le generano) giocano un ruolo determinante nella descrizione della repulsione elettrone-elettrone e quindi della correlazione dei moti elettronici. La 3.22 definisce la densità di probabilità di trovare una coppia di elettroni con spin s1 e s2 in r1 e r2 simultaneamente, indipendentemente dalla posizione e dallo stato di spin degli altri N − 2 elettroni. Per elettroni non interagenti, la densità di paia si riduce al semplice prodotto delle probabilità individuali N −1 γ1 (x1 )γ1 (x2 ) (3.23) γ2 (x1 , x2 ) = N il fattore NN−1 tiene conto che del fatto che se uno degli N elettroni è in x1 , la probabilità di trovare un altro elettrone simultaneamente in x2 si riduce di quel fattore perchè l’elettrone in x1 non può anche trovarsi allo stesso tempo in x2 . In realtà gli elettroni: (i) sono carichi e soggetti al potenziale repulsivo Coulombiano e (ii) sono dei fermioni e quindi devono soddisfare il principio di antisimmetria. Vediamo come queste proprietà influenzano la densità di paia. Se si considera il principio di antisimmetria, ne deriva dalla 3.10 che anche la densità di paia deve cambiare di segno allo scambio di due particelle γ2 (x1 , x2 ) = −γ2 (x2 , x1 ) Nel caso in cui gli elettroni hanno lo stesso spin e stessa posizione x1 = x2 si trova che γ2 (x1 , x1 ) = −γ2 (x1 , x1 ) questo può essere vero solo se γ2 (x1 , x2 ) = 0, cioè, la probabilità di trovare due elettroni con lo stesso spin nella stessa posizione è nulla. Questo indica che gli elettroni con stesso spin non si muovono in modo indipendente, ma si escludono a vicenda. È una diretta conseguenza del principio di antisimmetria (principio di esclusione si Pauli) e vale anche per particelle fermioniche non cariche. Questo effetto si chiama anche correlazione di scambio o di Fermi e non si manifesta per elettroni con spin opposto. La correlazione di scambio è inclusa nel metodo Hartree-Fock. Se si considera l’effetto della carica sull’interazione elettronica, questo dipenderà dal termine 1 nell’Hamiltoniano. L’effetto è indipendente dallo spin. Se da questo contributo si esclude r12 la parte di repulsione classica, quello che rimane è un termine elettrostatico ”quantistico” che viene indicato come correlazione Coulombiana o di Coulomb. Questo contributo è assente nel metodo Hartree-Fock. Sulla base di quanto detto, è conveniente esprimere l’influenza della correlazione di Fermi e di Coulomb sulla densità di paia separandola in due parti: (i) il prodotto delle densità indipendenti e (ii) il resto che contiene gli effetti di correlazione e include il termine di normalizzazione γ2 (x1 , x2 ) = γ(x1 )γ(x2 ) [1 + f (x1 , x2 )] 25 (3.24) dove f (x1 , x2 ) contiene le informazioni sulla correlazione ed è chiamato fattore o funzione di correlazione di paia. Se gli elettroni non sono correlati, allora f (x1 , x2 ) = 0 e la densità di paia assume la forma 3.23. In questo caso però la γ2 (x1 , x2 ) non normalizza al numero corretto di coppie (N ” invece di N (N − 1)), ma include il contributo spurio di auto-interazione. È possibile definire un’altra quantità interessante, la probabilità condizionata g(x2 , x1 ) = γ2 (x1 , x2 ) γ1 (x1 ) (3.25) questa rappresenta la probabilità di trovare un elettrone in posizione x2 quando ce n’è già uno in posizione x1 . L’integrale di g(x2 , x1 ) vale Z g(x2 , x1 )dx2 = N − 1 (3.26) dato che contiene informazioni su tutti gli elettroni eccetto quello di riferimento in x1 . Si può scrivere anche in termini di matrici densità spinless: g(x2 , x1 ) = 3.5 ρ2 (r1 , r2 ) ρ1 (r1 ) (3.27) Buca di scambio-correlazione La differenza tra la probabilità condizionata g(x2 , x1 ) e quella non condizionata, γ(x2 ), di trovare un elettrone in x2 hXC (x1 , x2 ) = γ2 (x1 , x2 ) − γ1 (x2 ) = γ1 (x2 )f (x1 , x2 ) γ1 (x1 ) (3.28) descrive la deviazione della g(x2 , x1 ) da γ1 (x2 ) e include gli effetti di correlazione, di scambio e di Coulomb, e la correzione di auto-interazione. Questa grandezza è la cosiddetta buca di scambio e correlazione, che gode di alcune interessanti proprietà • solitamente ha segno negativo, specialmente nelle vicinanze dell’elettrone di riferimento; • integrando l’equazione 3.28 si ottiene Z hXC (x1 , x2 )dx2 = −1 cioè, la buca di scambio e correlazione contiene esattamente la carica di un elettrone. Questo deriva dal fatto che g(x2 , x1 ) integrata dà N − 1 e che l’integrale della densità elettronica è N . 26 • l’interpretazione permette di capire come gli effetti di scambio e correlazione influenzano la distribuzione elettronica. Cioè, si può immaginare che l’elettrone possieda una buca di potenziale attorno a se stesso, tale che la probabilità di trovare un altro elettrone nelle sue vicinanze diminuisce. Dato che la buca è solitamente negativa mentre la densità elettronica è positiva, ne consegue che, ad una certa distanza dall’elettrone, l’interazione elettrostatica tra le due sia attrattiva e quindi fornisca un contributo stabilizzante. Consideriamo nuovamente il contributo di repulsione elettronica espresso in termini di densità di paia (tralasciando la dipendenza dallo spin) Z Z N X N X 1 ρ2 (r1 , r2 ) 1 hVbee i = hΨ| |Ψi = dr1 dr2 r 2 r 12 12 i=1 j>i questo implica che l’interazione tra due elettroni dipende inversamente dalla loro distanza pesata per la probabilità che i due elettroni si trovino a quella distanza. Esprimendo la ρ2 (r1 , r2 ) come ρ2 (r1 , r2 ) = ρ(r1 )ρ(r2 ) + ρ(r1 )hXC (r1 , r2 ) possiamo dividere il contributo di repulsione elettronica in due parti dal chiaro significato fisico Z Z Z Z 1 ρ(r )ρ(r ) 1 ρ(r1 )hXC (r1 , r2 ) 1 2 hVbee i = dr1 dr2 + dr1 dr2 (3.29) 2 r12 2 r12 • Il primo termine è J[ρ] l’energia di interazione classica tra due distribuzioni di carica inclusa se stessa, cioè include anche il contributo spurio di auto-interazione. Si noti che nel caso di un sistema con un solo elettrone, questo significa che J[ρ] 6= 0, quando invece non esiste nessuna interazione elettrone-elettrone. • il secondo termine è l’interazione tra la densità elettronica e la densità di carica della buca di XC. Questo termine include quindi la correzione dell’auto-interazione oltre ai contributi quantistici di correlazione Data la 3.15 e nota la matrice densità di ordine 1, se si conoscesse in modo esatto la forma della buca di scambio e correlazione sarebbe possibile calcolare l’energia esatta di un sistema multielettronico. È quindi interessante capire meglio quali sono le caratteristiche di hXC (x1 , x2 ). La buca di XC può essere formalmente separata in hXC (r1 , r2 ) = hsX1 =s2 (r1 , r2 ) + hsC1 ,s2 (r1 , r2 ) (3.30) • hsX1 =s2 (x1 , x2 ) rappresenta la buca di Fermi che definisce la densità di probabilità di esclusione di due elettroni per effetto del principio di Pauli (antisimmetria, scambio) e si applica ad elettroni con lo stesso spin. • hsC1 ,s2 (x1 , x2 ) è la buca di Coulomb per elettroni di spin opposto e deriva da effetti elettrostatici (solitamente indicati con il termine correlazione). Solo la buca di XC completa ha significato fisico. 27 Quindi, la 3.29 diventa Z Z Z Z Z Z ρ(r )ρ(r ) 1 ρ(r )h (r , r ) 1 ρ(r1 )hC (r1 , r2 ) 1 1 2 1 X 1 2 dr1 dr2 + dr1 dr2 + dr1 dr2 hVbee i = 2 r12 2 r12 2 r12 (3.31) 3.5.1 La buca di Fermi • La buca di Fermi è quella che dà il contributo maggiore alla hXC (x1 , x2 ); • L’integrale della buca di Fermi su tutto lo spazio delle coordinate è pari a -1 Z hsX1 =s2 (r1 , r2 )dr2 = −1 come nel caso della buca completa hXC . Questo deriva dal fatto che la probabilità condizionata per elettroni di spin s integrata dà Ns − 1 invece di Ns perchè c’è già un elettrone con lo stesso spin s in r1 . • Questo implica che la buca di Fermi si comporta come se stesse rimuovendo una carica intera e, in questo modo, elimina il problema dell’auto-interazione. • Per il principio di eclusione di Pauli sappiamo che due elettroni con lo stesso spin s non possono occupare la stessa posizione nello spazio, questo fa sı̀ che la buca di Fermi soddisfi la relazione lim hsX1 =s2 (r1 , r2 ) = −ρ(r1 ) r2 →r1 che garantisce la cancellazione del contributo spurio di auto-interazione: Z Z Z Z ρ(r1 )hX (r1 , r2 ) ρ(r1 )ρ(r2 ) dr1 dr2 + dr1 dr2 = 0 lim r2 →r1 r12 r12 Questa relazione definisce anche la profondità della buca, che ovviamente è nulla quando gli elettroni hanno spin opposto hsX1 6=s2 (r1 , r2 ) = 0 • La buca di Fermi è sempre negativa hsX1 =s2 (r1 , r2 ) < 0 • Modificando la 3.24 per il caso della buca di Fermi, si ha hsX1 =s2 (r1 , r2 ) = ρ(r2 )fX (r1 , r2 ) la forma della buca dipende quindi da fX (r1 , r2 ) (fattore di correlazione di Fermi), ma anche dalla densità elettronica in r2 . Ne consegue che la buca non ha simmetria sferica, ma tende ad essere solitamente più larga attorno all’elettrone sonda. 28 3.5.2 La buca di Coulomb • La buca di Coulomb é immediatamente definibile come differenza tra la buca di XC totale e quella di Fermi 1 6=s2 hsC1 6=s2 (r1 , r2 ) = hsXC (r1 , r2 ) − hsX1 =s2 (r1 , r2 ) • Dalle relazioni di normalizzazione di hXC e di hX consegue che la buca di Coulomb integrata su tutto lo spazio è nulla Z hsC1 6=s2 (r1 , r2 )dr2 = 0 • La buca di Coulomb sarà negativa e più profonda intorno alla posizione dell’elettrone di riferimento dato che si origina dall’interazione repulsiva elettrostatica r112 . Dato che il suo valore integrato è nullo deve essere anche positiva da qualche parte (lontano dall’elettrone di riferimento). • Dato che non ci sono restrizioni sulla posizione di elettroni con spin opposto quando r2 → r1 , la hsC1 6=s2 (r1 , r1 ) non assume valori ben definiti, ma esistono delle condizioni di cuspide simili a quelle viste per la densità elettronica. Queste condizioni non sussistono quando gli elettroni hanno spin parallelo dato che questi non possono trovarsi nella stessa posizione 3.5.3 Esempi Per capire meglio il significato fisico e la forma della buca di scambio-correlazione e delle singole buche, vediamo due esempi: il primo riguarda un sistema molto semplice, la molecola di idrogeno H2 , il secondo é relativo al silicio cristallino. Figure 3.1: Buca di Fermi e di Coulomb e buca totale di XC per la molecola di H2 a diverse distanze H-H. [11] In tutti i grafici l’elettrone di riferimento è posto alla sinistra del nucleo di destra. Le posizioni dei nuclei sono indicati sugli assi con dei cerchi neri. Molecola di idrogeno Le buche di Fermi e di Coulomb e quella totale della molecola di idrogeno, nel suo stato fondamentale, sono rappresentate nella figura 3.1 [11]. Consideriamo prima la buca di Fermi. Lo stato fondamentale di H2 è caratterizzato da una configurazione a spin appiati (↑↓) e il ruolo della buca di scambio è solo quello di cancellare il termine di auto-interazione. Per cui per l’elettrone α (o quello β), la buca corrispondente è uguale alla densità ρα = 21 ρ, cioè a metà del modulo quadro dell’orbitale molecolare σg . È quindi: • delocalizzata sull’intera molecola • nelle vicinanze dei nuclei rappresenta una rimozione di carica pari a mezzo elettrone 29 • in questo caso, è indipendente dalla posizione dell’elettrone di riferimento Anche nel caso rHH → ∞ la buca continua a escludere solo mezzo elettrone quando invece dovrebbe rimuoverne uno, come succede nel caso della buca XC completa (si veda figura 3.1 in basso a destra). L’interazione dell’elettrone di riferimento con il nucleo è quindi in parte schermata e la sua densità tenderà ad essere più diffusa. Questo è quello che succede con il metodo HF dove esiste solo la buca di scambio. L’effetto di avere una densità troppo diffusa causa una sottostima dell’interazione elettrone-nucleo, valori troppo bassi dell’energia cinetica e della repulsione elettronica, determinando in questo modo una curva di dissociazione non corretta. Nel caso della buca di Coulomb, si osserva la creazione di una buca attorno all’elettrone di riferimento mentre si ha un addensamento di densità dalla parte opposta. La buca è delocalizzata. All’aumentare della distanza H-H, la buca non rimane invariata, ma l’effetto appena descritto diventa più pronunciato. Al limite, viene rimosso mezzo elettrone nelle vicinanze dell’elettrone di riferimento e creata una densità di carica di metà elettrone sull’altro nucleo. In questo caso la buca di Coulomb dipende dalla posizione dell’elettrone di riferimento a differenza della buca di Fermi che è delocalizzata. In particolare, la buca deve invertirsi quando l’elettrone si sposta da destra a sinistra e si trova appena dopo il centro del legame. La buca di XC totale è invece localizzata nelle vicinanze dell’elettrone di riferimento. A grandi distanze, si ha una parziale cancellazione della buca di Fermi e di quella di Coulomb attorno al nucleo di sinistra, con l’effetto netto di localizzare l’intera buca attorno all’elettrone di riferimento e rimuovere esattamente un elettrone, come dovrebbe essere per avere il limite di dissociazione corretto. La buca completa ovviamente dipende dalla posizione dell’elettrone di riferimento. È importante notare che solo la combinazione della buca di Fermi con quella di Coulomb fa emergere la forma corretta della buca di scambio e correlazione. Cristallo di silicio Nelle figure 3.2 e 3.3 [12] sono riportati per il cristallo di silicio, invece della buca di scambio e quella di correlazione, i corrispondenti fattori di correlazione di scambio e di Coulomb valutati rispettivamente nell’intorno di un elettrone di riferimento posto al centro del legame Si-Si (leg) e nel sito tetraedrico interstiziale (sti). Dall’analisi di questi punti si può notare che fX tende ad essere più anisotropo rispetto al Figure 3.2: Cristallo di silicio: (a) fattore di correlazione di scambio e (b) fattore di correlazione di Coulomb nel piano (110) che passa attraverso gli atomi con l’elettrone di riferimento posto al centro del legame. Gli atomi e i legami nel piano (110) sono rappresentati in modo schematico. Figure 3.3: Cristallo di silicio: (a) fattore di correlazione di scambio e (b) fattore di correlazione di Coulomb nel piano (110) che passa attraverso gli atomi con l’elettrone di riferimento posto nel sito tetraedrico interstiziale. Gli atomi e i legami nel piano (110) sono rappresentati in modo schematico. 30 fattore di correlazione di Coulomb. Dal confronto delle figure si osserva che nel sito interstiziale la forma di fC è più allargata e profonda rispetto al centro del legame. Questo è un aspetto generale per cui fC tende ad essere più allargato e profondo dove la densità elettronica è minore (ρleg > 30 · ρsti ). L’idea di buca di scambio e correlazione oltre a chiarire gli effetti di repulsione elettroneelettrone e il concetto di correlazione elettronica riveste un ruolo molto importante nella teoria del funzionale della densità sia per definire il significato fisico del funzionale di scambio e correlazione (che definiremo nel prossimo capitolo) che come modello per la sua costruzione. 31 Chapter 4 Approccio di Kohn-Sham Il teorema fondamentale di HK stabilisce che è possibile calcolare le proprietà dello stato fondamentale conoscendo ρ0 , senza la necessità di conoscere la funzione d’onda, ma non fornisce alcuna indicazione su come questo si possa realizzare. La via per determinare ρ0 , e quindi E[ρ0 ] è stata trovata da Kohn e Sham (KS) nel 1965 [13]. Tutti i metodi DFT attualmente in uso si basano sull’approccio KS. 4.1 Sistema di elettroni non interagenti KS considerano un sistema di riferimento ausiliario, indicato con il suffisso s, costituito da N elettroni (fermioni) non interagenti. In questo caso, l’hamiltoniano ha la forma b s = Tbs + Vbs = H X i 1 [− ∇2i + vs (ri )] 2 In accordo con i teoremi di HK, esiste quindi un funzionale Z Es [ρ] = Ts [ρ] + vs [ρ, r]ρ(r)dr per il quale l’equazione di Eulero-Lagrange δE[ρ] = 0 permette di ottenere la densità eletb s . In questo caso, Tbs denota tronica esatta dello stato fondamentale ρs (r) corrispondente a H il funzionale universale dell’energia cinetica per un sistema di elettroni non interagenti. Lo stesso sistema di elettroni non interagenti, nella meccanica quantistica tradizionale corrisponde al cosiddetto metodo di Hartree per il quale l’autofunzione dell’Hamiltoniano sopra è il semplice prodotto degli spin-orbitali monoelettronici ϑi (xi ) = θi (ri )σ(si ) detto prodotto di Hartree HP Ψ = N Y ϑi (x) i In realtà, il principio di antisimmetria impone che la funzione d’onda corrispondente sia il determinante di Slater. 32 Ciò significa che la funzione d’onda Ψs,0 per lo stato fondamentale del sistema di riferimento è il prodotto antisimmetrizzato degli spin-orbitali monoelettronici a più bassa energia ϑi , b Φ=A N Y ϑi (xi ) i b è l’operatore di antisimmetrizzazione dove A " # N! X X X 1 1 b= √ (−1)p Pb = √ Ib − Pbij + A Pbijk − ... N ! p=0 N! ij ijk L’operatore Ib è l’identità, mentre Pbij genera tutte le possibili permutazioni delle coordinate di due elettroni, Pbijk tutte le permutazioni delle coordinate di tre elettroni, ecc. Gli spin-orbitali sono quindi ottenuti dalla risoluzione di un set di equazioni monoelettroniche del tipo 1 2 − ∇i + vs (ri ) ϑi (x) = εi ϑi (x) 2 b hi ϑi = i ϑi dove i sono le energie degli spin-orbitali. In questo caso, se lo stato fondamentale non è degenere, la densità elettronica ρs (r) corrispondente è N X X |ϑi (r, σ)|2 (4.1) ρs (r) = i=1 σ Si noti che quando lo stato fondamentale è closed shell, due elettroni a spin opposto sono descritti dalla stessa funzione spaziale, come nel metodo Restricted-HF, e la sommatoria sopra si riduce a N/2. I due approcci appena descritti sono del tutto equivalenti e devono portare allo stesso risultato. Inoltre, mostrano che, come ci si aspetta dalla discussione del capitolo precedente, esiste una connessione tra le due metodologie stabilita dalla 4.1. All’interno di questo quadro, Kohn-Sham assumono che il sistema di N elettroni non interagenti, sottoposto al potenziale esterno vs (x) sia tale da generare la densità elettronica del sistema di elettroni interagenti ρs (r) = ρ0 (r) Schematicamente questa assunzione si può rappresentare come: Vext (r) ⇐HK ⇐ ρ0 (r) ⇐KS ⇒ ρs (r) = ρ0 (r) ⇒HKs ⇒ Vs (r) ⇓ ⇑ ⇑ ⇓ Ψi =⇒ Ψ0 ϑi=1,N (x) ⇐= ϑi (x) (4.2) dove la notazione HKs indica che il teorema di HK si applica al sistema di particelle non intergenti e la freccia con KS rappresenta la connessione tra il sistema multielettronico e quello di elettroni indipendenti. 33 Assumendo che esista un potenziale vs (r) che genera la densità ρ0 (r), dal primo teorema di HK ne consegue che anche il potenziale esterno vs (r) è univocamente determinato. Formalmente, l’univocità del potenziale rimane una questione di v-rappresentabilità che in questo caso viene indicata come v-non interagente-rappresentabilità. Anche se non esiste una dimostrazione rigorosa, si assume che ρ0 (r) sia v-non interagente-rappresentabile. La conseguenza della 4.2 è che ϑi (r) = ϑi [ρ; r] (4.3) cioè gli orbitali sono funzionali della densità elettronica ρ(r), e che il funzionale dell’energia cinetica di un sistema di elettroni non interagenti si può scrivere come N N 1 XX 1 XX hϑi (x)|∇2 |ϑi (x)i = Ts [ρ(r)] = − 2 i s 2 i s Z |∇ϑi (x)|2 dr (4.4) che non è più un funzionale esplicito della densità elettronica, come quello visto nel modello di Thomas-Fermi, ma è un funzionale implicito di ρ(r) attraverso gli spin-orbitali. 4.2 Funzionale di scambio e correlazione ed equazioni di Kohn-Sham Il passaggio successivo fatto da KS è che l’equazione originale di Hohenberg-Kohn: Z E0 = Ev [ρ0 ] = ρ0 (r)v(r)dr + T [ρ0 ] + Vee [ρ0 ] (4.5) può essere riformulata come segue (per semplicità si omette l’indice 0, ρ0 ≡ ρ). Sulla base di quanto visto sopra, il contributo cinetico si può scrivere come T [ρ] ≡ ∆T [ρ] − Ts [ρ] dove ∆T è la differenza fra l’energia cinetica media dello stato fondamentale del sistema reale e del sistema di riferimento costituito da elettroni non interagenti (che generano la stessa densità elettronica del sistema reale). Come abbiamo visto, nel termine di interazione elettrone-elettrone è possibile esplicitare il contributo di energia di repulsione elettrostatica classica fra due elettroni descritti dalla distribuzione di carica ρ: Z Z 1 ρ(r1 )ρ(r2 ) dr1 dr2 + Encl [ρ] Vee [ρ] = 2 r12 dove il funzionale Encl [ρ] contiene, a questo punto, tutti i contributi non classici legati alla correlazione elettronica di Fermi e di Coulomb. L’equazione 4.5 diventa: Z Z Z 1 ρ(r1 )ρ(r2 ) Ev [ρ] = ρ(r)v(r)dr + Ts [ρ] + dr1 dr2 + ∆T [ρ] + ∆Encl [ρ] (4.6) 2 r12 34 I funzionali ∆T [ρ] e ∆Encl [ρ] sono incogniti. Dato che, nota la densità elettronica, i primi tre addendi si calcolano facilmente. Kohn e Sham raggruppano quindi tutto ciò che non è noto esplicitamente e definiscono il cosiddetto funzionale di correlazione e scambio, Exc [ρ]: Exc [ρ] ≡ ∆T [ρ] + ∆Encl [ρ] (4.7) L’energia di scambio e correlazione Exc raggruppa di conseguenza tutti i contributi non classici si interazione elettrone-elettrone più quelli cinetici. Cioè contiene quattro componenti: • Energia di correlazione cinetica ∆T • Energia di scambio (originata dal principio di antisimmetria) • Energia di correlazione coulombiana • Correzione di auto-interazione (SIC, Self Interaction Correction) La SIC deriva dal fatto che nell’espressione che fornisce la repulsione coulombiana, ogni elettrone contribuisce alla densità elettronica con cui interagisce. Nella espressione Hartree-Fock questo termine viene esattamente compensato da un termine spurio di scambio. Nel funzionale di XC esatto, questo effetto è perfettamente compensato. Come vedremo meglio nel seguito, quando invece il contributo di scambio è descritto con un funzionale della densità approssimato, questo non avviene. In questo modo, l’energia totale del sistema N-elettronico può essere espressa come Z Z Z ρ(r1 )ρ(r2 ) 1 dr1 dr2 + Exc [ρ] (4.8) E0 = Ev [ρ] = ρ(r)v(r)dr + Ts [ρ] + 2 r12 I primi tre addendi si calcolano facilmente, nota la densità elettronica, e danno il contributo principale all’energia. Il quarto addendo, Exc [ρ] fornisce un contributo relativamente piccolo, che però deve essere valutato accuratamente e gioca un ruolo fondamentale nell’approccio di KS. Tutta la complessità del trattare il sistema multi-corpi viene quindi trasferita nel funzionale di XC che rimane incognito. Occorre comunque notare che l’approccio di Kohn-Sham è formalmente esatto e che se la forma del funzionale Exc [ρ] fosse nota si potrebbe ottenere l’energia dello stato fondamentale attraverso la ρ(r). La determinazione del miglior funzionale di XC rappresenta uno degli aspetti centrali della teoria del funzionale della densità nella formulazione di KS. I diversi metodi DFT di uso comune nei calcoli quantistici di molecole e solidi sono caratterizzati appunto dall’uso di funzionali approssimati. Lo stato dell’arte nella ricerca del funzionale di XC esatto e le diverse proposte che si trovano in letteratura verranno discusse più in dettaglio nel prossimo capitolo. Prima, occorre trovare una via per conoscere la densità elettronica dello stato fondamentale. Ricordiamo che il sistema di riferimento di particelle non interagenti ha la stessa densità elettronica della molecola nello stato fondamentale: ρs = ρ0 . La densità di probabilità elettronica, quando la funzione d’onda sia un determinante di Slater costruito a partire dagli orbitali a più bassa energia, è data da: nocc X 2 ρ = ρs = |ϑKS (4.9) i | i=1 35 Nota ρ, è possibile calcolare il valore dei primi tre contributi ad E0 . R PM P 2 KS < ϑKS Ev [ρ] = − 21 nocc i (ri )|∇i |ϑi (ri ) > − A ZA i R R ρ(ri )ρ(rj ) dri drj + Exc [ρ] + 12 rij ρ(ri ) dri riA All’energia elettronica viene poi aggiunto il termine della repulsione nucleare (costante nella approssimazione di Born-Oppenheimer). Sulla base di quando visto, a parte Exc [ρ], tutti i KS termini sono funzionali impliciti di ρ perchè ϑKS i (r) = ϑi [ρ; r]. Ev [ρ] = − 21 PM Pnocc R |ϑKS (ri )|2 2 KS i < ϑKS dri i (ri )|∇i |ϑi (ri ) > − A ZA i riA KS 2 KS 2 R R P P |ϑi (ri )| |ϑj (rj )| nocc + 21 nocc dri drj + Exc [ρ] i j rij Pnocc i La densità elettronica dello stato fondamentale si ottiene basandosi sul teorema variazionale di Hohenberg-Kohn: data una densità elettronica approssimata ρ0 , il cui integrale su tutto lo spazio configurazionale sia pari al numero di elettroni Z ρ0 (r)dr = N l’energia ottenuta applicando il funzionale esatto alla densità approssimata è un limite superiore rispetto all‘energia fornita dalla densità esatta: E0 [ρ0 ] ≥ E0 [ρ0 ] In questo caso però, nell’equazione di Eulero-Lagrange, invece di variare ρ, si variano gli orbitali ϑKS i : δE KS [ρ] δϑKS i [ρ; r] KS δρ δϑi [ρ; r] δE KS [ρ] =0 → δρ KS mantenendo il vincolo di ortonormalità degli spin-orbitali (< ϑKS >= δij ). La ρ(r) si i |ϑj ottiene infine dalla relazione 4.9. In questo modo, passando attraverso agli orbitali di KS, la densità elettronica che corrisponde al minimo della energia del sistema N-elettronico si ricava risolvendo equazioni formalmente simili alle equazioni di Hartree-Fock: 1 KS KS [− ∇2i + vef f (ri ))]ϑKS i (ri ) = i ϑi (ri ) 2 (4.10) KS KS b hKS = KS i ϑi i ϑi (4.11) dove b hKS è un’operatore monoelettronico che definisce l’Hamiltoniano efficace di KS i H KS = N X b hKS i i e il potenziale efficace è dato da: vef f (ri ) = − X ZA A riA Z + 36 ρ(rj ) drj + vxc [ρ, ri ) rij (4.12) dove vxc [ρ, r)] è il potenziale di scambio e correlazione che si ricava dalla derivata funzionale dell’energia di scambio e correlazione Exc [ρ] vxc (r) ≡ δExc [ρ(r)] δρ(r) (4.13) La procedura per ottenere una derivata funzionale è descritta nell’Appendice 1.6. In definitiva, KS facendo riferimento al sistema di elettroni non-interagenti per definire Ts reintroducono gli orbitali e trasformano la singola equazione di Eulero-Lagrange in un set di N equazioni monoparticellari. Le equazioni di KS, come quelle di Hartree-Fock, devono essere risolte in modo iterativo attraverso una procedura di auto-consistenza delle soluzioni (SCF). Occorre però notare che a differenza delle equazioni di HF quelle di KS includono in modo esplicito la correlazione elettronica ad un costo di calcolo analogo se non minore dato che il potenziale di XC è locale. Se il funzionale di scambio e correlazione fosse noto in modo esatto, e di conseguenza il potenziale, l’energia ottenuta dalla risoluzione delle equazioni di KS sarebbe esatta. Come per il metodo HF, l’energia totale del sistema non è la somma degli autovalori, ma è E KS = nocc X i 4.3 εKS i 1 − 2 Z Z ρ(ri )ρ(rj ) dri drj + Exc [ρ(r)] − rij Z ρ(r)vXC (r)dr (4.14) Discussione Di seguito verrà discusso più in dettaglio il significato fisico degli ingredienti che entrano in gioco nelle equazioni di Kohn-Sham. È importante notare che la discussione che segue vale nel caso esatto, cioè quando il funzionale di XC è quello esatto. Per funzionali approssimati non tutte le proprietà analizzate sono rispettate. 4.3.1 Significato delle autofunzioni di Kohn-Sham • Gli orbitali Kohn-Sham ϑKS i (1) sono orbitali del sistema fittizio di riferimento, non hanno altro significato che quello di fornire la densità elettronica dello stato fondamentale del sistema reale attraverso la 4.9. • In pratica si è osservato che gli orbitali occupati di Kohn-Sham sono molto simili agli orbitali Hartree-Fock, e possono essere usati per gli stessi tipi di analisi delle proprietà molecolari. Ci si basa sul fatto che sono definiti attraverso un potenziale che è esatto in principio e che generano la densità elettronica esatta dello stato fondamentale (anche se non sono legati ad una vera funzione d’onda, ma solo all’espressione del determinante di Slater). • Recentemente, sono stati anche impiegati in metodi di calcolo di tipo perturbativo (ad esempio come nei metodi ”doppi ibridi” discussi nel prossimo capitolo) e multiconfigurazionale. 37 4.3.2 Significato degli autovalori di Kohn-Sham • A differenza degli autovalori ottenuti dalle equazioni di HF, in questo caso non è valido il teorema di Koopman Quindi, nessun significato fisico preciso può essere attribuito agli autovalori di KS. • L’unico risultato esatto è che il più alto orbitale occupato (il suo autovalore) corrisponde al potenziale di prima ionizzazione (esatto) della molecola, cambiato di segno. max = −I Questo risultato è legato alla proprietà di decadimento della densità elettronica a lungo raggio. Infatti √ lim = exp[−2 2I|r|] r→∞ Ad esempio, nel caso dell’atomo di H il potenziale di ionizzazione esatto è di 0.5 au mentre i metodi DFT approssimati danno solitamente valori tra 0.23 e 0.28 au. • Esiste una relazione esatta nota come Teorema di Janak (o Slater-Janak) che ha come risultato che dE[ρ] = dni dove ni è il numero di occupazione del corrispondente autovettore (0 ≤ ni ≤ 1) espressi attraverso gli orbitali naturali. ρ(r) = N XX σ ni |ψi (r, σ)|2 i=1 N= N X ni i=1 Questo deriva dal fatto che E[ρ] δE[ρ] = δρ δN e che il formalismo di KS visto finora può essere generalizzato a numeri di occupazione frazionari. Nota: nel caso di una funzione monodeterminantale, ni = 1 per gli orbitali occupati e ni = 0 per gli orbitali virtuali. 4.3.3 Significato del potenziale di XC • Il potenziale di XC è definito come: vXC = ed è un potenziale locale. 38 δEXC [ρ] δρ • Dato che lim vef f (r) = 0 |r|→∞ e che vne → 0 e vCoul = R ρ(r) dri rij → 1 r deve valere lim vXC (r) = − |r|→∞ 1 r questo definisce il comportamento asintotico esatto del potenziale di XC. In realtà, nel caso di funzionali approssimati: (i) si può verificare che il potenziale di XC corrispondente non decade come −1/r, ma in modo esponenziale (quindi più veloce e con un carattere meno attrattivo) (ii) si può dimostrare che 1 lim vXC (r) = − + I + max |r|→∞ r Quindi se il funzionale è esatto la relazione sopra è corretta, se no c’è uno shift costante legato a I + max . • Discontinuità della derivata Esiste una discontinuità nel potenziale vXC quando il numero di elettroni del sistema passa attraverso un numero intero. I funzionali approssimati hanno un andamento continuo e quindi manifestano un comportamento non corretto. • Il corretto andamento del potenziale a lungo raggio e il problema della discontinuità della derivata hanno conseguenze dirette sull’eliminazione dell’auto-interazione tra gli elettroni • Le deficienze dei metodi DFT approssimati contenute nel potenziale di XC hanno conseguenze rilevanti per la descrizione di stati eccitati, nel calcolo di proprietà come la polarizzabilità e l’iperpolarizzabilità, delle energie di eccitazione e nella predizione del band gap nei solidi. • Occorre ricordare che il potenziale dovuto allo scambio esatto HF possiede il corretto andamento asintotico: -1/r. Questo è rilevante nei metodi ibridi (discussi nel prossimo capitolo) perchè permette di recuperare una frazione del corretto andamento -1/r e compensare in parte le deficienze elencate in precedenza. 4.3.4 Nota su scambio esatto e funzionale di scambio e correlazione Kohn-Sham, già nel loro articolo originale del 1965, hanno proposto un’espressione dell’energia che fa uso dello scambio esatto HF. Ev [ρ] = Ts [ρ] + Vext [ρ] + J[ρ] + VXHF [ρ] + EC [ρ] dove il contributo di repulsione elettronica è stato scritto come Vee [ρ] = J[ρ] + VXHF [ρ] + ∆Vee [ρ] 39 e si definisce il funzionale di correlazione EC [ρ] = ∆T [ρ] + ∆Vee [ρ] che contiene la correlazione di Coulomb e gli effetti di correlazione cinetica per il sistema di elettroni interagenti. In questo modo gli effetti della correlazione di scambio sono inclusi in modo esatto, ma l’espressione dell’energia diventa più complicata perchè VXHF è un termine non locale. I primi tentativi di usare lo scambio esatto non hanno dato però i risultati sperati e solo più tardi l’uso dello scambio HF è stato riproposto attraverso i metodi cosiddetti ”ibridi” che discuteremo nel prossimo capitolo. 4.4 Connessione adiabatica L’hamiltoniano del sistema di riferimento può essere messo in relazione con l’hamiltoniano reale dalla relazione: X b λ = Tb + H vλ (ri ) + λVbee i Il valore del parametro λ varia da 0 (elettroni non interagenti, sistema di riferimento) a 1 (elettroni interagenti); vλ è il potenziale esterno che rende la densità elettronica del sistema b λ uguale a quella dello stato fondamentale del sistema reale. λ è un con hamiltoniano H parametro di accoppiamento ( coupling strength parameter) che accende progressivamente l’interazione elettrone-elettrone e ne modula la forza. Si pu dire che λ crea una connessione tra il sistema di elettroni non-interagenti e quello formato da elettroni interagenti. Questa connessione adiabatica (adiabatic connection) perchè per qualsiasi 0 ≤ λ ≤ 1 il potenzial λ esterno vext (r) si adatta in modo tale da mantenere la densità elettronica uguale a quella del sistema di elettroni interagenti. Quindi i due casi estremi, che corrispondono rispettivamente a: λ=0 • λ = 0: vef f = vs λ=1 • λ = 1: vef f = vJ + vXC + vext sono connessi tra loro in modo continuo da sistemi parzialmente interagenti. Possiamo allora scrivere Z 1 Eλ=1 − Eλ=0 = dEλ (4.15) 0 Z Eλ=1 = 1 dEλ + Eλ=0 0 Per sfruttare questa relazione dobbiamo conoscere la variazione di E per una variazione infinitesimale di λ che corrisponde al valore di aspettazione di una variazione infinitesima dell’hamiltoniano dHλ : λ b λ = dVbext dH + dλVbee Usando la formulazione delle buche si ottiene Z Z Z Z Z ρ(r1 )ρ(r2 ) 1 ρ(r1 )hλXC (r1 , r2 ) 1 λ dr1 dr2 + dλ dr1 dr2 dEλ = ρ(r)dVext (r)dr + dλ 2 r12 2 r12 40 integrando questa espressione e inserendola nell’eq. 4.15 si arriva a Z 1 λ=1 λ=0 ρ(r)[Vext (r)−Vext (r)]dr+ Eλ=1 −Eλ=0 = Z Z 2 ρ(r1 )ρ(r2 ) 1 dr1 dr2 + r12 2 1 Z Z Z 0 ρ(r1 )hλXC (r1 , r2 ) dr1 dr2 dλ r12 (4.16) Tenendo conto che Z Eλ=0 =< Ts > + λ=0 ρ(r)Vext (r)]dr si ottiene che l’energia di un sistema di elettroni interagenti si può scrivere come: Z Eλ=1 =< Ts > + λ=1 λ=0 ρ(r)[Vext (r)−Vext (r)]dr+ 1 2 Z Z ρ(r1 )ρ(r2 ) 1 dr1 dr2 + r12 2 Z Z ρ(r1 )h̄XC (r1 , r2 ) dr1 dr2 r12 (4.17) in cui è stata definita la buca di scambio e correlazione media Z 1 h̄XC = hλXC (r1 , r2 )r12 dλ 0 dove con media si intende l’integrazione rispetto al parametro di accoppiamento dell’interazione (coupling strength integrated). Confrontando il risultato sopra con l’eq. 4.8 ne consegue che all’interno della connessione adiabatica è possibile: (i) giustificare in modo rigoroso l’assunzione di Kohn e Sham e (ii) definire in modo esatto il funzionale di scambio e correlazione come Z Z ρ(r1 )h̄XC (r1 , r2 ) 1 dr1 dr2 (4.18) EXC [ρ] = 2 r12 Dal confronto dell’espressione per l’energia (eq. 4.17) con quella ottenuta dal formalismo delle matrici densità spinless Z E= Z Z Z 1 1 2 0 dr + v(r)ρ(r)dr + − ∇r ρ1 (r , r) ρ2 (r1 , r2 )dr1 dr2 2 r 12 r0 =r (4.19) si vede chiaramente che nella 4.17 l’integrazione su λ trasferisce la ∆T = T − Ts nella buca di scambio e correlazione media h̄XC (r1 , r2 ). Cioè nel passaggio da T a Ts si ha un aumento della complessità in hXC (r1 , r2 ) che deve essere integrata su λ (h̄XC → hXC . Occorre notare che le proprietà di h̄XC rimangono le stesse di hXC viste nel capitolo precedente. Ne consegue che l’energia di scambio e correlazione definita attraverso la connessione adiabatica corrisponde all’interazione attrattiva tra la densità elettronica ρ(r) e la carica negativa racchiusa in h̄XC . La connessione adiabatica offre una visione alternativa dell’assunzione di Kohn e Sham e consente di stabilire un legame diretto tra il funzionale di scambio e correlazione e la buca di scambio e correlazione media. Si può fare un ulteriore passo avanti, esprimendo EXC come funzione della media sferica di h̄XC Z Z ∞ 1 ρ(r)dr 4πσdσhSA (4.20) EXC [ρ] = XC (r, σ) 2 0 dove si è operato un cambio di variabili: r=r1 eu=—r2 − r1 | e hSA XC è Z 2π Z π 1 hSA dφu h̄XC (r, r + u)sinθu dθu XC (r, u) = 4π 0 0 41 (4.21) In conclusione, si ottiene che l’energia di scambio e correlazione dipende solo da una media sferica della buca di XC integrata su λ. 4.4.1 Esempi Come esempio della dipendenza della buca di scambio e correlazione dal valore del parametro λ, nella figura 4.1 è riportata la forma della buca di scambio e correlazione (media sferica) del cristallo di silicio. In questo caso si considera che λ = 0 corrisponda alla buca di scambio, mentre per valori crescenti di λ viene incluso il contributo di correlazione di Coulomb. Come si vede, la correlazione tende ad allargare la buca e a renderla più profonda. Questo Figure 4.1: Media sferica della buca di scambio e correlazione del cristallo di silicio nel centro del legame (a) e nella zona interstiziale (b). perchè diminuisce la probabilità che i due elettroni si avvicinino. L’effetto è simile sia quando l’elettrone di riferimento si trova nel centro del legame (Fig. 4.1 (a)) che quando è al di fuori della linea che connette gli atomi di Si (Fig. 4.1 (b)). In quest’ultimo caso, dato che hXC = ρ(r2 )fXC (r2 , r2 ), il minimo è leggermente spostato nella direzione di maggiore variazione della densità elettronica. 42 Chapter 5 Funzionali di scambio e correlazione Nel capitolo precedente abbiamo visto che il formalismo di KS permette di trattare in modo esatto i diversi contributi che costituiscono l’energia di un sistema N-elettronico. Di quasi tutti è nota la forma esplicita, o implicita, in termini di funzionale della densità ρ(r). Tutto quello che non è esprimibile come funzionale di ρ è stato inglobato nel funzionale di scambio e correlazione, EXC [ρ] di cui però non è nota la forma matematica. Questo fa sı̀ che l’intera formulazione di KS e i diversi metodi di calcolo ad essa collegati, si basino sull’espressione approssimata di EXC [ρ] da cui dipenderà anche la qualità e l’accuratezza del calcolo. Quindi, a parte i fondamenti della teoria, la maggior parte dell’attività di ricerca sulla DFT riguarda lo sviluppo di nuovi e più accurati funzionali. È naturale quindi chiedersi: (i) quale forma abbia il funzionale di XC e (ii) se esiste un modo sistematico per costruirlo e soprattutto per migliorarne l’accuratezza. A differenza dai metodi tradizionali che si basano sulla funzione d’onda, dove il principio variazionale definisce un criterio molto forte per stabilire la qualità dell’approssimazione, nel DFT non c’è formalmente una strategia sistematica di sviluppo. La strategia di più comune di creazione dei funzionali, fa ricorso, per definirne la forma matematica, all’insieme di conoscenze sulle proprietà che caratterizzano il funzionale stesso, il potenziale e la buca di XC. Tra queste ci sono: • il comportamento asintotico del potenziale di XC; • le regole di integrazione delle buche e le loro condizioni di cuspide e limite; • in sistemi monoelettronici, l’eliminazione dell’autointerazione per il contributo di scambio e l’annullamento del contributo di correlazione; • regole di trasformazione delle coordinate, come uno scalamento uniforme: ργ (r) = γ 3 ρ(γr). Sulla base di questo, esistono poi due grosse classi di funzionali: • non-empirici, che vengono definiti sulla base delle sole condizioni citate sopra e i cui parametri, ridotti ad un numero minimo, non derivano da procedure empiriche. • semi-empirici, che data una forma funzionale fisicamente sensata che contiene un numero elevato di parametri (anche oltre 30) cerca il miglior EXC [ρ] fittando dati sperimentali o dati calcolati di riferimento (es. CCSD(T)). 43 In generale, i funzionali di XC hanno la forma Z Z EXC [ρ] = eXC [ρ(r)]dr = ρ(r)XC [ρ(r)]dr (5.1) dove • eXC è la densità di energia di XC • XC è l’energia di XC per particella: XC 1 = 2 Z Z h̄XC (r1 , r2 ) dr1 dr2 r12 Nel trattare il funzionale di XC si assume di solito la separabilità tra scambio (X) e correlazione (C) EXC [ρ] = EX [ρ] + EC [ρ] è importante sottolineare che come discusso in precedenza solo la somma dei due contributi descrive correttamente la buca di XC completa. I diversi funzionali di XC proposti in letteratura vengono etichettati e denominati solitamente sulla base delle iniziali degli scienziati che li hanno proposti e se necessario si indica l’anno di pubblicazione dell’articolo in cui sono stati presentati per la prima volta. Ad esempio, il funzionale di scambio proposto da A.D. Becke nel 1988 viene denominato B88 per differenziarlo da altri funzionali di scambio proposti dallo stesso autore in anni precedenti o successivi, come il B86 o il B97. Un altro esempio è il funzionale di correlazione sviluppato da Lee, W. Yang e R.G. Parr nel 1988 il cui acronimo è quindi LYP. La combinazione dei due funzionali, che definisce il funzionale di XC completo, diventa B88-LYP o B-LYP o semplicemente BLYP. Esistono anche funzionali di X e C sviluppati per essere usati insieme (costruzione omogenea) proposti dalle stesse persone, come ad es. il funzionale di XC costruito da J.P. Perdew, K. Burke e M. Ernzerhof. In questo caso bisognerebbe usare la sigla PBE-PBE, ma solitamente si indica semplicemente PBE, assumendo che i funzionali di scambio e correlazione PBE vengono usati insieme. 5.1 La scala di Giacobbe (Jacob’s Ladder) John P. Perdew, uno dei maggiori esperti di DFT, ha cercato di identificare dei criteri che definiscono sia una scala gerarchica dei funzionali di XC che una loro classificazione (PerdewSchmidt 2011, Perdew et al. 2005). La proposta è di classificare i funzionali sulla base degli ingredienti che li definiscono e di costruire una scala, detta scala di Giacobbe (Jacob’s Ladder) i cui gradini corrispondono a diverse approssimazioni del funzionale di XC e definiscono anche un dato livello di accuratezza e di complessitá/costo di calcolo. Il nome scala di Giacobbe deriva dal passo della Bibbia in cui si narra che Giacobbe sognò una scala che collegava la Terra con il Paradiso e che gli angeli di Dio salivano e scendevano. In questo paragone, la scala che classifica i funzionali XC permette di passare dall’approssimazione di Hartree (elettroni indipendenti, la Terra) alla soluzione esatta (Paradiso) attraverso i diversi gradini. L’utente può quindi scegliere il livello di accuratezza/complessitá a piacimento, conscio delle approssimazioni implicite in quel gradino, e salire e scendere tra i due estremi della scala. 44 1o gradino - LDA Il primo gradino della scala di Giacobbe è rappresentato dall’approssimazione LDA (Local Density Approximation). Considerando l’eq. 5.1, la forma del funzionale è di tipo: Z EG EXC [ρα , ρβ ] = ρ(r)UXC [ρα , ρβ ]dr (5.2) • è il tipo di funzionali di XC più semplice. Contiene ingredienti solo locali, che cioè dipendono solo da (r) e non da (r,r’) • fa riferimento al sistema modello di un gas di elettroni uniforme (Uniform Electron Gas, UEG) • è esatto nel limite di un gas di elettroni uniforme. La condizione per un funzionale di XC di tendere al limite UEG viene imposta anche per funzionali oltre il primo gradino (es. GGA) EG • UXC si ottiene da calcoli accurati con metodi QMC Esempi di funzionali LDA sono: • il funzionale per l’energia cinetica di Thomas-Fermi (TF28) • il funzionale per la parte di scambio di Dirac-Slater (D30,S51) • il funzionale di correlazione di Vosko-Wilk-Nusair (VWN80) Rientrano in questa approssimazione i primi funzionali di XC usati in calcoli ab-initio. Sono stati applicati con buon successo in problemi di fisica dello stato solido, in particolare allo studio di metalli. I risultati peggiorano nel caso di atomi e molecole dove la densità elettronica è più localizzata e varia più velocemente, discostandosi maggiormente dal UEG. La spiegazione del buon comportamento dei metodi LDA è rintracciabile nella somiglianza tra la buca di XC LDA mediata sfericamente e la buca esatta. 2o gradino - GGA Il secondo gradino corrisponde all’approssimazione GGA (Generalized Gradient Approximation). I funzionali che rientrano in questa famiglia sono della forma: Z EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ; ∇ρα , ∇ρβ ]dr (5.3) cioè includono nella forma funzionale un ingrediente aggiuntivo che è il gradiente della densità elettronica e per questo vengono anche denominati funzionali corretti per il gradiente (gradient corrected). • estendono l’approssimazione LDA includendo l’informazione sulla non-uniformità della densità elettronica attraverso dei termini che dipendono dal gradiente della densità ∇ρ • i funzionali GGA sono considerati funzionali semi-locali perchè nonostante l’inclusione della derivata prima di ρ(r) descrivono come sta variando la densità nell’intorno di r 45 • l’espressione dei funzionali GGA deriva dall’espansione del gradiente (GEA, Generalized Gradient Expansion) troncata al second’ordine Z X σ,σ0 ∇ρσ · ∇ρσ0 EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ] + CXC (ρα , ρβ ) 2/3 2/3 + · · · ρσ ρσ0 σ,σ 0 l’uso di questa espressione è stato proposto già da Hohenberg e Kohn nel loro lavoro fondamentale del 1964. Il problema è che l’espansione tende a divergere e la troncatura dello sviluppo non consente una descrizione accurata della buca di XC. • l’ingrediente principale dei funzionali corretti per il gradiente è il gradiente della densità ridotto (reduced density gradient) x= o s= |∇ρ| ρ3/4 x 2(3π 2 )1/3 −4 È adimensionale ( [L[L] −3 ]4/3 ). È un indicatore che misura come varia ρ(r) in r, cioè la sua disomogeneità. |∇ρ| 3 ρ4 |∇ρ| 3 ρ4 1 vicino ai nuclei e lontano dai nuclei ρ ⇐⇒ 0 (5.4) 1 (5.5) |∇ρ— piccolo (densità varia lentamente) • La GEA comincia con Z LDA EX [ρ] = ρEX [ρ][1+µx s2 +...] → fattore di accrescimento (enhancement factor) (5.6) Z Ec [ρ] = ρ EcLDA [ρ] + βc t2 + .... dν dove t2 = cc |∇l | ρ1/6 (5.7) (5.8) • Migliora decisamente rispetto a LDA per molecole e atomi, non cosı̀ marcato per i solidi. 3o gradino - meta-GGA (mGGA o MGGA) I funzionali che rientrano in questa famiglia sono della forma: Z EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ; ∇ρα , ∇ρβ ; ∇2 ρα , ∇2 ρβ ; τα , τβ ]dr 46 (5.9) È un ulteriore generalizzazione che include o ∇2 ρ(r), il Laplaciano della denistá elettronica, che compare nell’espressione troncata al 4o ordine della GEA, oppure la densità di energia cinetica τ0 N 1X |∇ϑi (r)|2 (5.10) τ0 (r) = 2 i=1 • L’uso della densitá di energia cinetica deriva dall’espansione di T aylor della buca XC nell’intorno di |r−r0 | = 0). Contiene informazioni simili a ∇2 ρ ma permette di soddisfare più vincoli nella forma matematica del funzionale, rendendo questa famiglia di funzionali piú versatili. • I funzionali mGGA sono ancora semilocali perch includono solo ingredienti che dipendono da informazioni in r. I risultati migliorano leggermente rispetto ai funzionali GGA. • Sono i funzionali di più recente formalizzazione. Perdew considera che i funzionali non-empirici corrispondenti ai primi tre gradini della scala di Giacobbe siano stati formalizzati rispettivamente in: Slater+PW1992 (LDA); PBE-PBE (GGA); TPSS-TPSS (mGGA). Alcuni dei funzionali proposti d D. Truhlar e noti come Minnesota appartengono a questa famiglia. In particolare quelli denominati con la sigla L, ad esempio: M06-L e M11-L 4o gradino - hyper-GGA In questo caso la forma del funzionale é: HGGA EXC [ρα , ρβ ] Z = ρ(r)HGGA (ρ, ∇ρ, τ, x ) XC (5.11) • Includono contributi non locali (x,σ ) che sono funzione degli orbitali occupati θi • Il contributo non locale è formalmente analogo allo scambio esatto Hartree-Fock (x,σ ): x,σ 1 = 2 Z ρ(r1 )hXC σ (r1 , r2 ) dr2 r12 (5.12) • i cosiddetti metodi ibridi HF/DFT tradizionali, che verranno trattati più in dettaglio nel seguito, sono considerati dei funzionali hyper-GGA semi-empirici in quanto soddisfano pochissimi vincoli. • non c’è ancora nessun funzionale considerato pienamente HGGA 5o gradino • In questo gradino, vengono usati come ingredienti dei funzionali sia gli orbitali occupati θiocc che quelli non occupati θivirt • I funzionali non hanno una denominazione specifica, va vengono definiti come appartenenti al 5o gradino della Scala di Giacobbe. 47 • I metodi che appartengono a questa famiglia molto costosi e hanno una complessità analoga ai metodi tradizionali basati sulla funzione d’onda. • Recentemente sono stati proposti i metodi cosiddetti doppi ibridi che includono oltre al contributo di scambio esatto HF che dipende dagli orbitali occupati, anche un termine formalmente analogo all’energia di correlazione MP2 che dipende anche dagli orbitali virtuali. Questi metodi verranno discussi più nel dettaglio in seguito. • Appartengono a questo gradino i metodi derivati dalla Random Phase Approximation (RPA) che includono la non solo la dipendenza dalla densità elettronica ma anche dalla risposta della densitè ad una perturbazione che è un termine non-locale • include i contributi di correlazione elettronica responsabili degli effetti dispersivi Queste cinque tipologie di funzionali definiscono la Scala di Giacobbe (Jacob’s Ladder). È evidente che la complessità aumenta salendo i diversi gradini della scala, ma ci si aspetta che corrispondentemente anche l’accuratezza migliori. Questo però non è scontato e deve essere dimostrato in una fase di validazione del funzionale (vedere il capitolo sulla “Valutazione dei metodi DFT”). All’interno di questa scala gerarchica Perdew ha costruito vari funzionali LDA,GGA e mGGA che sono considerati non empirici sia per X che per C (costruzione omogenea). LDA → S − P W 92(LDA) GGA → P W 91 superato da P BE mGGA → P KZB superato da T P SS Il miglioramento riguarda la proprietà del funzionale di soddisfare il maggior numero di vincoli per EXC , vXC , hXC e proprietà di scala ργ(ν) = γ 3 ρ(γ ν ). Inoltre, si riducono tutti al limite LDA per un gas di elettroni uniformi e sono sviluppati tipo scatole cinesi. L’accuratezza è ovviamente P W LDA < P BE < T P SS NB: La parte di appunti che segue è in revisione 5.2 5.2.1 Funzionali di scambio e correlazione ibridi Funzionali ibridi globali Questa tipologia di funzionali include un di scambio esatto HF e si basa formalmente R 1contributo 1 sulla connessione adiabatica: EXC = 0 EXC dλ L’uso dello scambio HF era già stato proposto da HK nel loro lavoro fondamentale, ma non aveva avuto molto risalto a causa di risultati non molto accurati. I funzionali ibridi sono stati riportati in auge da A.D. Becke all’inizio degli anni ‘90. λ=0 exact λ=1 ∼ LDA • |α|α) EXC = EXC ; EXC = EX HH exact LDA + EX ) • Half-Half: EXC = 21 (EXC 48 λ → andamento lineare • ββ ) exact GGA EXC = a0 EX + (1 − a0 )E LDA + ax ∆EX + ECLDA + ac ∆c ECGGA ∆EX(C) → correzione gradiente (5.15) a0 , ax , ac → (5.17) B3PW91 → (5.13) parametri xGGA = B88 ; C LDA = P W 92 ; C GGA = P W 91 (5.19) • B3LYP → ex B88 a0 EX + (1 − a0 ))E LDA ax ∆EX + (1 − ac )ECV W N S + ac ECLY P (5.20) + ∆GGA dove LY P non ha la forma LDA C C • ACM1 exact DF T EXC = a0 EX + (1 − a0 )EX + ECDF T (5.21) • ACM∅ → a0 = 0.25(P erdew)→PBE∅ ≡ P BEH ≡ P BE1P BE facilmente ottimizzabile fittando il parametro ax a dati sperimentali. 5.2.2 Funzionali ibridi di tipo Range-Separated (RSH) Detti anche Screned Coulomb (SC), Coulomb Attenuated Methods (CAM), Long-range Corrected functionals (LC) Sono basati su un’idea di A. Savin (1996) di partizionare l’operatore di Coulomb in diverse regioni sulla base della distanza interlelettronica attraverso un’opportuna funzione. Per due regioni si ha: f (r12 ) 1 − f (r12 ) 1 = + (5.22) r12 r12 r12 dove r12 (decade lentamente). Per la separazione nelle diverse regioni, la funzione piú comunemente utilizzata é la error function 1 1 − erf (ωr12 ) erf (ωr12 ) 1 = + → (5.23) r12 r12 r12 r12 Short range → decade velocemente ; Long range → decade piú lentamente SR LR ⇒ EXC = EXC (ω) + EXC (ω) 49 (5.24) exact,SR exact,LR ωDF T h DF T PBEh e HSE ⇒ EXC = a[EX (ω) + EX (ω)] + (1 − a)EX + ECDF T È la base anche per un trattamento diversificato dei contributi SR e LR HF,SR P BE,SR P BE,LR HSE EXC = aEX (ω) + (1 − a)EX (ω) + EX (ω) + ECP BE HSE03 HSE06 P BEh(P BE0) P BE(GGA) → → → → √ ωHF = (0.15/ 2); ωP BE = 0.15 · 21/3 ωHF = ωP BE → ω = 0.11bohr − 1 ω=0 ω=∞ (5.25) (5.26) (5.27) (5.28) (5.29) I diversi metodi RSH si differenziano per come viene trattata la parte di scambio esatto. Nei metodi detti Screened Coulomb (SC) il contributo di scambio HF è incluso solo a corto raggio, mentre nei funzionali denominati Long-range Corrected (LC) si include solo il contributo a lungo raggio. Questo tipo di partizione è stato anche usato per la parte di correlazione per combinare DFT e WFT. Il contributo di correlazione DFT viene mantenuto a corto-raggio mentre la correlazione WFT viene introdotta a lungo-raggio. Questo stato proposto per combinazioni tipo: DFT+PT2; DFT+CI; DFT+MCSCF; DFT+CCSD. 5.3 5.3.1 Metodi doppio-ibridi (Double-Hybrids) Metodo B2-PLYP (S. Grimme JCP 124 (2006)034108) HF B88 e ECLY P (GGA) con una correzione perturbativa al 2◦ ordine (GGA) con EX Miscela di EX per la correlazione (PT2): HF GGA 1) Miscela scambio: EX e EX (aX ) → aX = 0.54 2) Miscela correlazione PT2 e GGA (aC ) → aC = 0.27 Il funzionale di scambio e correlazione cosı̀ definito è stato denominato: B2-PLYP perchè contiene due parametri e include una correzione perturbativa (P) per la parte di correlazione. L’espressione generale per questo tipo di funzionali è: GGA HF EXC = (1 − aX )EX + aX EX + (1 − aC )ECGGA + aC ECP T 2 dove ECP T 2 = 1 X X [(ia|jb) − (ib|ja)]2 → post-SCF (GGA) 4 ia jb i + j − a − b (5.30) (5.31) i, a e j, b → singoli occ − virt − replacements (ia|jb); (ib|ja) integrali bielettronici calcolati rispetto agli spin-orbitali ΘKS i Il calcolo dell’energia viene fatto come per il metodo MP2: SCF(HF) + correzione perturbativa. In questo caso però gli spin-orbitali e autovalori vengono ottenuti da un calcolo SCF in cui si usa solo la parte DFT dell’espressione dell’energia. 50 ⇒ B2-PLYP ≡ BLYP se aX =0 e aC =0 ⇒ B2-PLYP ≡ MP2 se aX =1 e aC =1 Nel suo lavoro, Grimme ha provato a combinare diversi funzionali: B88, OPTX e PBE per lo scambio e PBE e LYP per la correlazione, ma i risultati migliori sono stati ottenuti combinando B88 con LYP. Nota 1:(Schawbe-Grimme PCCP 8(2006) 4398-4401)→ mPW2LYP Sostituisce il funzionale di scambio B88 con mPW (b=0.00426, d=3.72) rideterminano i parametri ax = 0.55; aC =0.75) ottenendo un miglioramento dei risultati rispetto a B2-PLYP. Nota 2:(Schawbe-Grimme PCCP 9(2007)3397-3406) Per migliorare la descrizione dei metodi doppio-ibridi nel calcolo delle proprietà diP sistemi debolC6,ij at mente legati, viene proposto di includere una correzione empirica di tipo: ED =s6 N 6 ij f (Rij ) Rij dove il fattore di scala per i due funzionali proposti é: B2 − LY P − D → s6 = 0.55 mP W 2 − LY P − D → s6 = 0.40 5.4 Alcune note schematiche sulla costruzione di un funzionale Strategie per costruire EXC [ρ] (Scuseria 2006) 1. UEG → LDA R 0 DGE [eXC (ρ)+e1XC (ρ)∇ρ+e2XC (ρ)∇2 ρ+...]dν 2. GEA → (GGA,mGGA) se troncata → EXC 3. vincoli per EXC , vXC , hXC → più diffusi 4. modelli di base (non empirici o semi-empirici) 5. fit empirico → data una forma di EXC → riflettono dati sperimentali per ottenere parametri 6. metodi ibridi (EXX+EX [ρ]) Hybrid EXC [ρ] Z = T T ρ(r)[aexact (r) + bDF + cDF ]dr X r r (5.32) Vincoli: → comportamento asintotico → proprietà buca XC (somma, limiti) → trasformazione delle coordinate → uniform xeding ργ (r) = γ 3 ρ(γ, r) lim EC [ργ ] > −∞ γ→∞ 51 (5.33) Proprietà di un sistema con un solo elettrone: SIC) EX [ρ1 , 0] + I[ρ1 ] = 0 self − interation correction . SCC) EC [ρ1 ] = 0 self − correlation correction 5.4.1 Esempi B95 ECB95 = ECαα + ECββ + ECαβ • limite UEG E αα(ββ) • separazione EC in EC σσ Z = (5.34) EG (ρσ ) τσ − τσW eUc,σσ dr unif (1 + cσσ χ2σ τσ (5.35) EG eUc,αβ (ρα , ρβ ) dr 1 + cαβ (x2α + x2β ) (5.36) + ECα,β E αβ Z = • self-correlation correction: EC [ρ1 ] = 0 τσunif = 3 (6π 2 )2/3 ρσ5/3 10 (5.37) • fitta le energie di correlazione atomiche → Cπ = 0.038 ; Cα,β = 0.0031 τσunif = τσW 3 (6π 2 )2/3 ρσ5/3 10 (5.38) 1 |∇ρ|2 = 8 ρσ (5.39) PKZB vs PBE (costruzione a scatole cinesi) FχP KZB = 1 + χ 1+ χ k ;FxP BE = 1 + µs2 1 + µs2 (5.40) dove χ = χ(ρ, ∇ρ, τ ) SK71 EX = D30 EX s = s(ρ, ∇ρ) 5 − (36π)5/3 52 Z ρα4/3 x2α (5.41) (5.42) B88-X βC2 (C1 S)2 1 + 6β(C1 S)Sinh−1 (C1 S) FXB88 = 1 + (5.43) dove 1 C1 = 2(6π 2 ) 3 C2 = (21/3 CX )−1 3 3 1/3 CX = ( ) 4 π 5.5 (5.44) (5.45) (5.46) Funzionali locali e correzioni per il gradiente da GEA (GGA) (P.M.W. Gill: Encyclopedia) • LDA Z 3 2 2/3 ρσ5/3 (r)dr = (6π ) 10 1/3 Z 3 3 =− ρ4/3 (r)dr 2 4π ETT F 27 D30 EX (5.47) (5.48) HF ). dove D30 ∼ 10% meno F 30(EX ECW 38 Z = −4a ρα (r)ρβ (r) ρ(r) 1 1 + dρ1/3 (r) d(r) (5.49) TFDW → D30 E = ETT F 27 + Eγ + Ej + EX + ECW 38 (5.50) dove (W = W IGN ER) con a=0.04918 ; d=0.349 • GGA E dove x(r) = |∇ρ(r)| ρ3/4 (r) W 35 = ETT F 27 1 + 8 Z ρ5/3 (r)x2σ dr (5.51) dove W=W eizsacher con (.... + x4 + x6 + ...) →tende a divergere [(ρ → 0)?] SK71 EX = D30 EX 5 − (36π)5/3 Z ρσ4/3 (r)x2σ dr → (5.52) (...+x4 + x6 + ...) → tende a divergere e non cambia B88 EX = D30 EX Z −b ρ 4/3 x2σ (r) dr 1 + 6βxσ sinh−1 xσ (5.53) con b=0.0042 fittato dalle energie di scambio HF per gli atomi dei gas nobili (He → Rn) 53 B88 → smorza x2 per valori grandi di x e impone che X tenda al valore corretto per x grandi Classificazione in base all’uso di Θi e ρ(r) per Eρ e EX C F amiglia T ipo ET EX C 1 HF (post − HF ) Θi (r, σ) Θi (r, σ) 2 (ibridi) Θi (rσ) ρ(r)(Θi (r, σ)) 3 KS Θi (r, σ) ρ(r) 4 DF T (HK) ρ(r) ρ(r) 54 Chapter 6 Implementazione dei metodi DFT Il calcolo della densità elettronica risolvendo le equazioni KS segue lo stesso schema di un calcolo HF: 1. definizione di una ρ iniziale, normalmente come sovrapposizione di densità atomiche; 2. calcolo del potenziale di correlazione e scambio vxc ; 3. soluzione delle equazioni di KS per ricavare gli orbitali di KS; 4. calcolo della densità elettronica 5. calcolo dell’energia del sistema, e controllo della convergenza; 6. ripetizione della procedura dal punto 2 La soluzione delle equazioni KS può essere numerica,P ma il metodo più diffuso è l’espansione KS degli orbitali in una base di altre funzioni: ϑi = µ cµi χµ . Le equazioni risultanti sono analoghe alle equazioni di Roothaan-Hall. Le basi più comuni sono gaussiane contratte, in generale si usano le stesse funzioni base messe a punto per HF. Uno dei problemi del DFT è la complessità dei funzionali vxc , che rende necessaria la valutazione numerica degli integrali < χµ |vxc |χν >. Una tecnica alternativa è l’espansione del potenziale vxc in termini di un set di funzioni ausiliarie: i coefficienti della combinazione lineare sono determinati con un best fitting su un insieme di punti di una griglia appropriatamente scelta. 6.0.1 Implementazione dei metodi DFT Come per i metodi di calcolo basati sulla funzione d’onda, nell’implementazione delle equazioni di KS → si usa l’approssimazione LCAO. Cioé, gli spin orbitali di KS, Θi (r), vengono espressi in termini di funzioni che riproducono gli orbitali atomici. 1 2 − ∇i + vef f (ri ) Θi (r) = i Θi (r) (6.1) 2 vef f = vext (ri ) + vH (r) + vXC (ρ, r) 55 (6.2) vext (r) = − M X ZA λ=1 ria (6.3) Z ρ(rj ) drj rij δEXC [ρ] vXC [ρ, r] = δρ fbKS Θi (r) = i Θi (r) vH = (6.4) (6.5) (6.6) Se si introduce l’approssimazione LCAO, si ha: L X Θi (r) = cµ,i χµ (6.7) µ=1 fbKS L X cν,i χν = i ν=1 L X cν,i χν (6.8) ν=1 moltiplicando a dx per χµ ed integrando con r si ottiene L X cν,i < χµ |fbKS |χν >= i L X cν,i < χµ |χν > (6.9) ν=1 ν=1 L X KS cν,i Fµ,ν = i L X cν,i Sµ,ν (6.10) ν=1 ν=1 • Sµ,ν = elemento µ, ν matrice di overlap KS • Fµ,ν = elemento µ, ν matrice di KS in forma matriciale diventa: F KS C = SCE (6.11) Per capire l’implementazione dell’equazione di KS e le differenze in seguito alle equazioni HF KS vediamo quali sono i contributi che definiscono Fµ,ν . " 1 KS Fµ,ν =< χµ | − ∇2i − 2 M X ZA ria i=1 Z + # ρ(rj ) drj + vXC (ri ) |χν > rij i primi due termini sono analoghi all’HF e costituiscono la parte mono-elettronica " # M 1 2 X ZA hµ,ν =< χµ | − ∇i − |χν > 2 r i=1 ia (6.12) (6.13) in termini di set base {χν } il contributo coulombiano classico (Hartree) diventa: ρ(r) = N X i=1 2 |Θi (r)| = N X L X L X i=1 µ=1 ν=1 56 cµ,i cν,i χµ χν (6.14) dove si può definire in modo analogo ad HF la matrice densità Pµ,ν = N X cν,i cµ,i (6.15) i=1 quindi il contributo coulombiano diventa: Jµ,ν = L X L X Pλσ < χµ χν | λ=1 σ=1 1 |χλ χσ > rij (6.16) che è analogo a contributo coulombiano nel caso HF . La differenza tra HF e KS si determina solo per la parte di XC che in KS è rappresentata dall’integrale XC (6.17) Vµν =< χµ |vXC (ri )|χν > che dipenderà dalla forma esplicita di vXC (LDA, GGA, mGGA, ...) e si usa la formula Eulero per definire vXC = σEσρXC mentre in HF è dato dall’integrale di scambio (più costoso) Kµν = L L X X Pλσ < χµ χλ | λ=1 σ=1 1 |χν χσ > rij (6.18) Il tipo di set base usato per i calcoli rientra nelle grandi classi già viste per l’HF e cioè: • set base numerici • set base analitici → localizzati(GT F, ST O, ..) → delocalizzati(P W ) Pochi esempi di set base ottimizzati per calcoli DFT Nello stato solido i più diffusi sono i codici che usano onde piane come funzioni base, meno comune è la scelta di set base localizzati tipo funzioni Gaussiane (GTF) che invece sono i più usati nel campo molecolare. INTEGRALE COULOMBIANO → In alcuni casi programmi DFT il calcolo di Jµν viene fatto non in modo tradizionale, ma tenendo conto del fatto che , a differenza di HF, Jµν XC è completamente disaccoppiato da Vµν . Si Scrive Jµν =< χµ | ρ(rj ) > rij (6.19) ma poi si espande ρ(r) in termini di funzioni localizzate negli atomi {ωk } ρ(r) =∼ = ρe(r) − K X ck ωk (r) (6.20) k=1 quindi ripasso a Jeµν = K X k=1 Z ck χµ χν ωk dri drj rij 57 (6.21) dove i coefficienti ck vengono ottenuti minimizzando una funzione tipo Z Z [ρ(ri ) − ρe(ri )] ρ(rj ) − ρe(rj ) 0 F = dri drj textrmxbasigaussiane rij (6.22) Repulsione coulombiana tra le densità residue F 0 →∅ ⇒Jeµν → Jµν (6.23) limF 0 →0 Jeµν = Jµν (6.24) R nel vincolo ρe(r)dr = N . Questo tipo di tecnica si chiama RJ − J o density f itting. INTEGRALE XC Data la complessità delle equazioni esplorate di vxc in termini di ρ∇ anche per LDA, XC non viene calcolato in modo analitico, ma procede ad un’integrazione numerica. Quindi occorre definire un’opportuna griglia di punti nei quali si calcola ρ∇ (LDA) o ∇ρσ e ∇2 ρσ (GGA). P X XC (6.25) Vµν ≈ χµ (rp )VXC (rp )χν (rp )Wp p=1 l’integrale è approssimato da una somma dei prodotti χµ , VXC , χν pesata dal fattore Wp . Nel DFT si usa la tecnica proposta da Becke di separare l’integrazione in somma di contributi atomici (che si sovrappongono). Cioè se Z (6.26) I = F (r)dr si pone I= M X IA (6.27) A=1 dove Z IA = FA (r)dr tale che F (r) = M X FA (r) (6.28) A=1 dove FA (r) si ottiene attraverso l’introduzione di funzioni peso (pesi atomici di Becke)tali che: FA (r) = WA (r)F (r) N X WA (r) = 1 (6.29) A=1 WA ∼ 1 vicino a A e ∼ 0 vicino agli altri nuclei. Definiti i pesi WA e i contributi FA si ricava IA come integrazione numerica una griglia di punti definiti da sfere concentriche intorno agli atomi (bacini atomici) 58 Z ∞ Z ~ Z IA = 0 0 2~ FA (r, θ, ρ)r2 sin θd(r)dθdρ ∼ = 0 P X WpRAD p=1 Q X WqAN G FA (rp , θq , ρq ) (6.30) q=1 Ci sono quindi P punti radiali e Q punti angolari con i corrispondenti pesi W RAD , W AN G . N◦ totali di punti P · Q • integrazione radiale → Euler-McLaurin; Gauss-Chebyshev • integrazioni angolari → Lebedev (griglie che sommano esattamente tutte le armoniche sferiche fino al grado l =) Per ridurre il n◦ di punti di solito si usa una ”potatura della griglia” (dall’inglese: pruning). L’idea di fondo è che andando verso il nucleo la ρ(r) è via via più sferica e quindi sono sufficienti griglie angolari meno fitte per una corretta integrazione. Lo stesso vale per valori di r grandi. Nel potare si usano queste considerazioni definendo lo spazio di regioni con n◦ di punti angolari. Problema di accuratezza numerica • invarianza rotazionale (molecole) • zeri nel calcolo frequenze e modi a bassa frequenza Complicazioni: i gradienti di EXC , rispetto alle posizioni dei nuclei, richiedono le derivate dei pesi T X e W t ft (6.31) EXC = t T X d dft d e EXC = ft Wt + Wt dx dx dx t=1 dove (6.32) dWt →0 (6.33) dx per griglie infinite, ma in generale non si possono trascurare → problemi di accuratezza 59 Chapter 7 Valutazione dei metodi DFT Dopo aver introdotto i funzionali di XC e i metodi che ne derivano, è importante valutarne l’accuratezza nel calcolo di proprietà di interesse chimico-fisico. Nel seguito viene quindi presentato un confronto tra i diversi funzionali di XC sulla base di risultati su atomi, molecole e solidi recentemente presentati in letteratura. Come evidenziato nei precedenti capitoli e a differenza delle metodologie WFT, per i metodi DFT non esiste una vera e propria procedura variazionale che consenta di migliorare in modo sistematico l’accuratezza nella descrizione della repulsione elettronica di un sistema multielettronico. In questo senso, la scala di Giacobbe proposta da Perdew rappresenta comunque un’utile strumento per classificare e raggruppare i funzionali di XC in classi di complessità e accuratezza crescente. Tuttavia, ogni nuovo funzionale deve essere calibrato e tarato confrontando i risultati ottenuti con quelli disponibili in letteratura relativi a calcoli di benchmark, solitamente ricavati usando metodi WFT di alto livello e elevata accuratezza (es. CCSD(T) con basi estese come aug-cc-pVXZ, X=T,Q,...), e soprattutto dati sperimentali. A questo scopo, i metodi DFT attualmente disponibili in calcoli di routine sono raggruppabili in diverse famiglie che si rifanno ai gradini della Jacob’s Ladder: 1. LDA (Local Density Approximation) 2. GGA (Generalized Gradient Approximation) 3. MGGA (Meta-GGA) 4. Ibridi-GGA; Ibridi-MGGA 5. Doppi-ibridi La valutazione dei metodi DFT si basa poi sul confronto con dati di riferimento raccolti in una serie di database opportunamente predisposti per varie proprietà chimico-fisiche. Nella tabella 7 sono riportate alcune delle tipologie di dati usati come riferimento. Avere a disposizione un insieme di dati cosı̀ esteso ha in pratica una duplice valenza: (i) viene usato per stabilire una classifica dei diversi funzionali di XC e (ii) può essere usato per l’ottimizzazione di funzionali di XC semi-empirici. In effetti, molti dei database messi a punto sono stati usati per ottimizzare i parametri presenti in funzionali di XC. Esempi di questo tipo risalgono al metodo B3LYP di Becke (1993), all’HCTH (1996) di Handy e collaboratori, fino ai più recenti M05, M06, M08 e M11 di Truhlar (che contengono fino a 30-40 parametri). Nei metodi DFT ibridi, questo tipo di strategia di sviluppo è solitamente usata per ottimizzare anche la percentuale di scambio esatto. 60 Table 7.1: Informazioni contenute nei principali database sviluppati per la calibrazione dei metodi DFT Atomi Molecole Solidi Energie totali Geometrie e frequenze vibrazionali Energie di coesione Energie di scambio e correlazione Energie di atomizzazione Geometrie (parametri reticolari e coord. interne) 61 Appendix A Sul concetto di funzionale e derivata di un funzionale A.1 Funzionale e derivata funzionale Si definisce funzione una relazione matematica che lega un numero ad un altro numero. y(x) x −→ z Si definisce funzionale una relazione matematica che lega una funzione ad un numero. F [y(x)] y(x) −→ z In questo caso, si dice anche che un funzionale definisce una mappatura tra una funzione e un numero. In altre parole, un funzionale è una funzione nella quale la variabile è una funzione Un esempio di funzionale in chimica quantistica è il valor medio di un’osservabile. b >, cioè data una Ψ normalizzata, si ottiene Per l’energia si ha E =< Ψ|H|Ψ un numero, l’energia, come funzionale della funzione d’onda. Prima di definire la derivata di un funzionale, si consideri il caso di una generica funzione derivabile F (y). La sua derivata sarà data da F 0 (y) = dF dy . Nel 0 punto y , spostandosi di una distanza dy, la funzione F quindi varierà come dF = F (y 0 + dy) − F (y 0 ) = F 0 (y)|y0 dy. Se la funzione F dipende da più variabli, cioé F (y1 , y2 , ...), la derivata totale ∂F ∂F della funzione dipenderà dalle derivate parziali ∂y , , ..., cosı̀ che partendo 1 ∂y2 62 dal punto y10 , y20 , ... e variando la funzione di dy1 , dy2 , ..., la sua variazione sarà dF = ∂F ∂F |y10 dy1 + | 0 dy2 + · · · ∂y1 ∂y2 y2 (A.1) Estendiamo ora il concetto di derivata al caso di un funzionale. Si consideri una funzione y(x) che dipende dalla variabile x e che assuma valori reali nell’intervallo [a, b]. Dati N punti nell’intervallo [a, b] distanti tra loro di un valore ε, dove N ε = a − b. L’n-esimo punto corrisponde a xn = a + nε. Quindi la funzione yn = y(xn ) tenderà a y(x) per N → ∞, ε → 0. Definiamo ora una funzione dell’insieme delle funzioni {yn }, cioè F ({yn }). Al limite per N → ∞, la funzione F diventa una funzione di y(x). Dato che F è una funzione di tutti i valori di y(x) nell’intervallo [a, b], F viene chiamata funzionale di y(x), F [y]. Quindi un funzionale usa come variabile una funzione y(x) in un dominio, dipendendo da tutti i valori di y per tutti i valori di x nel dominio, e restituisce un numero. Ad esempio, se: 1 Z y(x)2 dx F [y] = 0 si avrà: F [y = x] = 1/3 F [y = sin πx] = 1/2 F dipende dall’intera forma funzionale di y(x) nell’intervallo [0, 1]. Se si cambiano i valori di {yn }, la funzione F ({yn }) varierà secondo la A.1 come N X ∂F dF = |y0 dyn ∂y n n=1 Nel limite N → ∞ (per passare al caso di una variabile continua), l’espressione sopra può essere trasformata usando la definizione di integrale Z b dxf (x) = lim a ε→0 63 N X n=1 εf (xn ) come N X 1 ∂F ε |y0 dyn ε ∂y n n=1 Prendendo il limite per ε → 0, con x = a + nε e introducendo la notazione dyn = δy(x), si arriva a Z b 1 ∂F |y0 (x) δy(x) (A.2) dF = dx ε ∂y a Qui y 0 (x) è la particolare funzione y(x) che è il punto di partenza della variazione infinitesima arbitraria δy(x). Il termine 1/ε è stato assorbito in ∂F ∂y che può essere considerata la definizione di derivata funzionale. Il significato della A.2 è analogo alla A.1. Il cambiamento di F è la somma di termini proporzionali alle variazioni infinitesime δy(x), con costante di proporzionalità che è proprio la derivata funzionale ∂F ∂y . Cioè, la derivata funzionale dà la risposta del funzionale F a una piccola variazione di y con il cambiamento localizzato in x. In alternativa, la derivata funzionale si può anche scrivere come rapporto incrementale del funzionale dovuto ad un incremento δy(x) del funzionale F (cioè F [y(x) + δy(x)] − F [y(x)]) in x0 al limite di un incremento ε infinitesimo ∂F F [y(x) + εδ(x − x0 )] − F [y(x)] ∂F [y(x) + εδ(x − x0 )] |ε=0 = lim = ∂y(x0 ) ε→0 ε ∂ε dove con δy(x) = εδ(x − x0 ) si è specificato che l’incremento è localizzato in x0 . Per rendere la definizione più operativa consideriamo un semplice esempio. Sia Z 1 F [y] = y(x)2 dx 0 per calcolare la derivata funzionale si può calcolare il cambiamento dF dovuto a una variazione infinitesimale δy(x): Z 1 Z 1 2 F [y + δy] = [y(x) + δy(x)] dx = [y(x)2 + 2y(x)δy(x) + δy(x)2 ]dx 0 0 tralasciando il termine (δy)2 , nel limite δy → 0, al prim’ordine in δy, quindi si ha: Z 1 Z 1 F [y + δy] = [y(x) + δy(x)]2 dx = [y(x)2 + 2y(x)δy(x)]dx 0 0 64 1 Z F [y + δy] = F [y] + 2y(x)δy(x)dx 0 il cambiamemto infinitesimo dF è perciò 1 Z dF = F [y + δy] − F [y] + 2y(x)δy(x)dx 0 Se si confronta la relazione sopra con la A.2 si ottiene ∂F = 2y(x) ∂y Questo esempio è il prototipo di calcolo di una derivata funzionale. La derivata funzionale ha proprietà simili a quelle della derivata di una funzione (ad es. si comporta come un operatore lineare, vale la regola della catena, ...). La definizione data è generalizzabile (i) al caso di un funzionale che dipende da più funzioni (ci si comporta come nel caso delle derivate parziali) o (ii) quando F dipende da una funzione a più variabili (in questo caso si ha un dominio nello spazio). Ovviamente, è possibile definire derivate di ordine superiore al primo. A.2 Formula di Eulero Nel caso in cui il funzionale sia un semplice integrale, la formula di Eulero offre uno strumento potente per il calcolo della derivata funzionale. Cominciamo considerando il caso di un integrale il cui integrando è funzione di x e y(x) Z F [y] = L(x, y(x))dx (A.3) Per una variazione di y(x) troncando al primo ordine si ha Z Z ∂L(x, y) F [y + δy] = L(x, y + δy)dx = L(x, y) + δy dx ∂y Confrontando il risultato con la A.2 si trova ∂F ∂L(x, y) = ∂y ∂y che vale per tutti i funzionali del tipo A.3. Consideriamo adesso il caso particolare in cui l’integrando L è funzione sia di 65 y(x) che delle sue derivate y 0 = dy/dx, y 00 = d2 y/dx2 ,... Nel caso della derivata prima si ha Z F [y] = L(x, y, y 0 )dx (A.4) Per una variazione δy si può scrivere Z F [y + δy] = L(x, y + δy, y 0 + δy 0 )dx dove δy 0 = d(δy)/dx è la derivata della variazione δy. Espandendo al primo ordine in δy e nella sua derivata Z 0 0 ∂L(x, y, y ) ∂L(x, y, y ) L(x, y, y 0 ) + δy 0 dx (A.5) F [y + δy] ' δy + 0 ∂y ∂y Si noti come nel derivare si considerino y e y 0 come indipendenti. L’eq.A.5 non è ancora confrontabile con la A.2 e quindi non è possibile estrarre la derivata funzionale. Per fare questo occorre convertire δy 0 inR δy nell’ultimo termine. Usando un’integrazione per parti (ricordiamo che: f dg = f g − R 0 ) gdf con dg = dy 0 ef = ∂L(x,y,y δy 0 0 ∂y b Z b Z b ∂L(x, y, y 0 ) 0 d ∂L(x, y, y 0 ) ∂L(x, y, y 0 ) δy dx = δy(x) − δy(x)dx ∂y 0 ∂y 0 ∂y 0 a a dx a (A.6) il primo termine sulla destra è un termine di bordo, che dipende dagli estremi di integrazione. È proporzionale quindi al valore di δy agli estremi dell’intervallo [a, b]. Usando la A.6 nella A.5 si ottiene Z d ∂L(x, y, y 0 ) ∂L(x, y, y 0 ) δy(x)dx + [termini di bordo] dF = − ∂y dx ∂y 0 che confrontata con la A.2 permette di ricavare che ∂F ∂L d ∂L = − ∂y ∂y dx ∂y 0 (A.7) se x non si trova agli estremi dell’intervallo. Se invece x si trova agli estremi dell’intervallo, esiste un termine aggiuntivo da includere nella R ∞ A.7. Notare che nel caso in cui y è proprio ρ(r), dato che l’integrale è −∞ e ρ(r) → 0 per r → ∞ i termini agli estremi si annullano. Questa è la formula di Eulero che fornisce un’utile scorciatoia per ricavare la derivata funzionale nel caso di un funzionale della forma A.4. La formula di Eulero può essere generalizzata al caso in cui: 66 • la funzione integranda L contiene derivate di y(x) di ordine superiore Z F [y] = L(x, y, y 0 , y 00 )dx ∂L d ∂L d2 ∂L ∂F = − + ∂y ∂y dx ∂y 0 dx2 ∂y 00 in questo caso occorre integrare per parti due volte per eliminare δy 00 . • l’argomento del funzionale è una funzione di più variabili Z F [y] = L(x, y, z, f, fx , fy , fz )dx d ∂L d ∂L ∂L d ∂L ∂F − − = − ∂f (x, y, z) ∂f dx ∂fx dy ∂fy dz ∂fz A.3 Minimo di un funzionale Consideriamo il problema di trovare il minimo di un funzionale F [y] rispetto alle funzioni y(x) che si annullano ai bordi del dominio. La condizione necessaria è Z b ∂F dF = δy(x)dx = 0 a ∂y(x) per una variazione arbitraria di δy(x). Questo equivale a richiedere che la soluzione sia una funzione y(x) che soddisfa ∂F =0 ∂y(x) (A.8) L’equazione A.8 è l’equazione di Eulero-Lagrange e rappresenta la condizione necessaria per l’esistenza di un estremale. Se la minimizzazione di F [y] è soggetta ad un vincolo, ad esempio G[y(x)] = 0, si ricorre al metodo dei moltiplicatori di Lagrange, risolvendo l’equazione di Eulero-Lagrange per il funzionale Ω[y] = F [y] + λG[y], cioè ∂Ω ∂F ∂G = −λ =0 ∂y(x) ∂y(x) ∂y(x) la soluzione dell’equazione sopra contiene i moltiplicatori λ che devono essere determinati imponendo il vincolo durante la risoluzione dell’equazione di Eulero-Lagrange. 67 Come nell’analisi di funzioni, perchè un estremale sia un minimo è necessario che la derivata seconda di F sia positiva d2 F = 0. Spesso, data la natura del problema, si assume che la soluzione trovata sia un minimo senza una reale verifica. La minimizzazione di un funzionale è alla base del metodo variazionale che viene ampiamente utilizzato in chimica quantistica. 68 Appendix B PBE’s type exchange functionals and functional derivatives Let us consider an exchange functional of the form: XZ ρσ X,σ F (sσ )dr EX = (B.1) σ where 1/3 3 3π 2 ρσ 4π and the basic variables are: the spin density, ρσ and the reduced spin density, sσ : |∇ρσ | 1 sσ = 4/3 2 1/3 ρσ 2(3π ) X,σ = − F (sσ ) is the enhancement factor (exchange energy density). Functionals of this type are PBE[14], revPBE[15], RPBE[16], mPBE[17], WC[18], PBEα[19], PBEsol[20], SOGGA[21] and RGE2[22]. For instance: • PBE exchange functional is given by κ2 F (sσ ) = 1 + κ − κ + xσ where xσ = µs2σ and κ = 0.804 and µ = 0.21951. • revPBE exchange functional has the same expression of PBE but κ = 1.245. 69 • RPBE exchange functional is given by F (sσ ) = 1 + κ − κ exp(−µs2σ /κ) • mPBE exchange functional is given by s2σ + C2 F (sσ ) = 1 + C1 1 + as2σ s2σ 1 + as2σ 2 where C1 = µ, C2 = −0.015 and a = 0.157. • WC exchange functional is given by κ2 F (sσ ) = 1 + κ − κ + xσ where 10 2 10 2 sσ exp(−s2σ ) + ln(1 + cs4σ ) x σ = sσ + µ − 81 81 and κ = 0.804, µ = 0.21951 and c = 0.0079325. • PBEα exchange functional takes the form: F (sσ ) = 1 + κ − κ xσ α ) (1 + κα where xσ = µs2σ and κ = 0.804 and µ = 0.21951. In ref.[19], its is proposed to use α = 0.52. The functional form has three limiting cases: (i) α = 0.0 then F (sσ ) = 1 (i.e. LDA); (ii) α = 1.0 corresponds to PBE and (iii) α = ∞ gives the RPBE functional. Note that when α = 2.0, PBEα takes a functional form similar to the RGE2 one (see below). • PBEsol exchange functional is a reparametrization of the original PBE ex10 change functional in which µ = 81 . It is combined with the corresponding PBE correlation functional with the value of β redefined to be β = 0.046. • SOGGA exchange functional enhancement factor reads F (sσ ) = 1 + κ − 1 κ2 1 − κ exp(−xσ /κ) 2 κ + xσ 2 70 where xσ = µs2σ 10 and κ = 0.552 and µ = 81 . It is a ”half-and-half” combination of PBE and RPBE. It is combined with the original PBE correlation functional. • RGE2 means Regularized Gradient Expansion approximation at secondorder. It is built from the PBEsol exchange functional by adding a higherorder term to the denominator of the corresponding enhancement factor. In this respect, PBEsol can be considered as a first-order RGE approximation. The RGE2 enhancement factor is then F (sσ ) = 1 + κ − κ3 κ2 + κxσ + x2σ where xσ = µs2σ 10 . and κ = 0.552 and µ = 81 It is combined with the original PBE correlation functional in which the value of β has been redefined to be β = 0.053. This derives from a fitting to m-GGA TPSS quality surface energies for jellium. From the general form of the exchange functional of eq.(B.1), the functional derivatives to be implemented are: 1/3 3 ∂EX ∂F (s ) σ =− ρ1/3 F (sσ ) − sσ ∂ρσ π ∂sσ 1 3 ∂EX ∂EX 1 ∂F (sσ ) = = − ∂|∇ρσ |2 2|∇ρσ | ∂|∇ρσ | 16π |∇ρσ | ∂sσ For PBE, revPBE, PBEsol and WC we have ∂F (sσ ) κ2 ∂xσ = ∂sσ (κ + xσ )2 ∂sσ where • PBE, revPBE and PBEsol: ∂xσ = 2µsσ ∂sσ 71 • WC: 2 10 2cs ∂xσ 10 σ = 2sσ + µ− (1 − s2σ ) exp(−s2σ ) + ∂sσ 81 81 (1 + cs4σ ) For RPBE is: ∂F (sσ ) ∂xσ = exp(−xσ /κ) ∂sσ ∂sσ where ∂xσ = 2µsσ ∂sσ For PBEα is: ∂F (sσ ) = ∂sσ where κα κα + xσ α+1 ∂xσ ∂sσ ∂xσ = 2µsσ ∂sσ For SOGGA is: ∂F (sσ ) 1 = ∂sσ 2 κ2 ∂xσ + exp(−x /κ) σ (κ + xσ )2 ∂sσ where ∂xσ = 2µsσ ∂sσ For RGE2 we have ∂F (sσ ) = κ3 ∂sσ where κ + 2xσ (κ2 + κxσ + x2σ )2 ∂xσ = 2µsσ ∂sσ 72 ∂xσ ∂sσ Appendix C B97-like exchange-correlation functional and functional derivatives Let us consider an exchange-correlation functional of the form[23]: X EXC = EX + ECαβ + ECσσ σ where EX = XZ Xσ (ρσ )gXσ (s2σ )dr σ Z ECαβ = and Cαβ (ρα , ρβ )gCαβ (s2av )dr Z ECσσ = Cσσ (ρσσ )gCσσ (s2σ )dr ’s are the local energy densities of a uniform electron gas: 1/3 3 3 ρ4/3 Xσ = − σ 2 4π and Cσ is the UEG correlation functional derived by Perdew and Wang[24] where the opposite-spin and the parallel-spin local correlation energy densities per unit volume are extracted from the total LSDA correlation energy density by the trick of Stoll et al.[25]: Cαβ = C (ρα , ρβ ) − C (ρα , 0) − C (0, ρβ ) Cσσ = C (ρσ , 0) The basic variables are: the spin density, ρσ and the reduced spin density, sσ : sσ = |∇ρσ | 4/3 ρσ 73 where s2avg = 1/2(s2α + s2β ) and s2σ = |∇ρσ |2 8/3 ρσ g denotes the gradient correction factor. The correction factors are expanded in a power series in the remapped variable u(s2 )(spin-subscripts omitted): 2 g(s ) = k X cj uj (s2 ) (C.1) j=1 and uXσ with γXσ = 0.004 uCαβ γXσ s2σ = 1 + γXσ s2σ (C.2) γCαβ s2avg = 1 + γCαβ s2avg with γαβ = 0.006 uCσσ γCσσ s2σ = 1 + γCσσ s2σ with γσσ = 0.2. Functionals of this type are B97[23, 26], HCTH[27], B97-3[28] and BMK[29], that differ in the number of terms included in the expansion above and in the strategy adopted in the parametrization. For instance: • The B97 exchange functional is given by (k=2) • HCTH exchange functional has the following expression (k=4): • B97-3 exchange functional is given by (k=4) • MBK exchange functional is given by (k=4) Functional derivatives From the general form of the B97-like functional, the functional derivatives to be implemented are: 74 a) X ∂σ ∂EXC X ∂ ∂gσ = [σ gσ ] = gσ + σ ∂ρσ ∂ρ ∂ρ ∂ρσ σ σ σ σ where ∂g[uσ (s2σ )] ∂g[uσ (s2σ )] ∂uσ (s2σ ) ∂s2σ = · · ∂ρσ ∂uσ ∂s2σ ∂ρσ according to equations C.1 and C.2 we have k ∂g[uσ (s2σ )] X γ 8 1 = j · cj · uj−1 · − · − s2σ 2 )2 ∂ρσ (1 + γs 3 ρ σ σ j=1 k X 1 ∂g[uσ (s2σ )] 8 1 · j · cj · uj = · 2 ∂ρσ 3 ρσ (1 + γsσ ) j=1 b) ∂EXC 1 ∂E = ∂|∇ρσ |2 2|∇ρσ | ∂|∇ρσ | X ∂ X ∂E ∂gσ = [σ gσ ] = σ · ∂|∇ρσ | ∂|∇ρ | ∂|∇ρσ | σ σ σ where ∂g[uσ (s2σ )] ∂g[uσ (s2σ )] ∂uσ (s2σ ) ∂s2σ = · · ∂|∇ρσ | ∂uσ ∂s2σ ∂|∇ρσ | according to equations C.1 and C.2 we have h k i γ ∂g[uσ (s2σ )] X j−1 −4/3 = j · cj · u · − · 2 s σ ρσ 2 )2 ∂|∇ρσ | (1 + γs σ j=1 k X ∂g[uσ (s2σ )] 2 1 =− · · j · cj · uj 2 ∂|∇ρσ | |∇ρσ | (1 + γsσ ) j=1 and from equation C.3 ∂g[uσ (s2σ )] 3 1 ∂g[uσ (s2σ )] = − ρσ · · ∂|∇ρσ | 4 |∇ρσ | ∂ρσ 75 (C.3) B97-X functional From the equations above, for the B97 exchange functional (k=2) we obtain: 1/3 ∂EX X 3 2uXσ 1/3 = −2 ρσ gXσ + (C1 + 2C2 uXσ ) 2 ∂ρσ 4π 1 + γ s X σ σ σ and X3 ∂EX = ∂|∇ρσ |2 2 σ 3 4π 1/3 ρ4/3 σ uXσ 1 · (C1 + 2C2 uXσ ) |∇ρσ |2 1 + γXσ s2σ B97-C functional From the equations above, for the B97 correlation functional (k=2) we obtain (α-spin): a) ∂ECαβ ∂ECαα ∂EC = + (C.4) ∂ρα ∂ρα ∂ρα The former right-hand term of equation C.4 is ∂gCαβ (s2avg ) ∂ECαβ ∂C (ρα , ρβ ) ∂C (ρα , 0) 2 = − · gCαβ (savg ) + Cαβ · ∂ρα ∂ρα ∂ρα ∂ρα where ∂gCαβ (s2avg ) 4 1 γCαβ s2α = · · C + 2C u 1 2 Cαβ ∂ρα 3 ρα (1 + γCαβ s2avg )2 The latter right-hand term of equation C.4 is ∂ECαα ∂C (ρα , 0) ∂gCαα (s2α ) 2 = · gCαα (sα ) + C (ρα , 0) · ∂ρα ∂ρα ∂ρα where ∂gCαα (s2α ) 8 1 γCαα s2α = · · (C1 + 2C2 uCαα ) ∂ρα 3 ρα (1 + γCαα s2α )2 b) ∂EC 1 = ∂|∇ρα |2 2|∇ρα | 76 ∂ECαβ ∂ECαα + ∂|∇ρα | ∂|∇ρα | (C.5) The first term in brakets in the right-hand member of equation C.5 is ∂gCαβ (s2avg ) ∂ECαβ = Cαβ · ∂|∇ρα | ∂|∇ρα | where ∂gCαβ (s2avg ) γCαβ sα 1 = − 4/3 · · C + 2C u 1 2 Cαβ ∂|∇ρα | (1 + γCαβ s2avg )2 ρα or " # ∂gCαβ (s2avg ) ∂gCαβ (s2avg ) 3 1 1 = − 1/3 · · ∂|∇ρα | 4 ρα sα ∂ρα The second term in brakets in the right-hand member of equation C.5 is ∂ECαα ∂gCαα (s2α ) = C (ρα , 0) · ∂|∇ρα | ∂|∇ρα | where ∂gCαα (s2α ) 1 γCαα sα · (C1 + 2C2 uCαα ) = −2 4/3 · 2 )2 ∂|∇ρα | (1 + γ s C ρα αα α or ∂gCαα (s2α ) 3 1 1 ∂gCαα (s2α ) = − 1/3 · · ∂|∇ρα | 4 ρα sα ∂ρα 77 Bibliografia [1] L. H. Thomas, ”The calculation of atomic fields”, Proc. Cambridge Phil. Roy. Soc. 23 (1927) 542 [2] E. Fermi, ”Un metodo statistico per la determinazione di alcune proprietà dell’atomo” Rend. Accad. Naz. Lincei 6 (1927) 602 [3] P. A. M. Dirac, ”Note on exchange phenomena in the Thomas-Fermi atom” Proc. Cambridge Phil. Roy. Soc. 26 (1930) 376 [4] J. C. Slater, ” ” Phys. Rev. (1951) [5] Wigner, ” ”, Phys. Rev. 46 (1934) 1002 [6] C. F. von Weizsacker, ”Zur theorie der kernmassen” Z. Phys. 96 (1935) 431 [7] E. Teller, ”On the stability of molecules in the Thomas-Fermi theory” Rev. Mod. Phys. 34 (1962) 627 [8] P. Hohenberg and W. Kohn, Phys. Rev. ”Inhomogeneous electron gas” 136 (1964) 864 [9] M. Levy, ”Universal variational functionals of electron densities, firstorder density matrices and natural spin orbitals and solution of the nrepresentability problem” Proc. Nat. Acad. Sci. USA 76 (1979) 6062 [10] D. A. Mazziotti, ”Quantum chemistry without wave functions: Twoelectron reduced density matrices” Acc. Chem. Res. 39 (2006) 207 [11] E. J. Baerends and O. V. Gritsenko, ”A quantum chemical view of density functional theory” J. Phys. Chem. A 101 (1997) 5383 [12] R. Q. Hood, M. Y. Chou, A. J. Williamson, G. Rajagopal, R. J. Needs, ”Exchange and correlation in silicon” Phys. Rev. B 57 (1998) 8972 78 [13] W. Kohn and L. J. Sham, ”Self-consistent equations including exchange and correlation effects” Phys. Rev. A 140 (1965) 1133 [14] J. P. Perdew, K. Burke and M. Ernzerhof, Phys. Rev. Lett. 77 (1996) 3865 [15] Y. Zhang and W. Yang, Phys. Rev. Lett. 80 (1998) 890 [16] B. Hammer, L. B. Hansen and J. K. Nrskov, Phys. Rev. B 59 (1999) 7413 [17] C. Adamo and V. Barone, J. Chem. Phys. 116 (2002) 5933 [18] Z. Wu and R.E. Cohen, Phys. Rev. B 73 (2006) 235116 [19] G. H. K. Madsen, Phys. Rev. B 75 (2007) 195108 [20] J. P. Perdew, A. Ruzsinszky, G. I. Csonka, O. A. Vydrov, G. E. Scuseria, L. A. Constantin, X. Zhou and K. Burke, Phys. Rev. Lett. 100 (2008) 136406. [21] Y. Zhang and D. G. Truhlar, J. Chem. Phys. 128 (2008) 184109 [22] A. Ruszinszky, G. I. Csonka and G. E. Scuseria, J. Chem. Theory Comput. 5 (2009) 763 [23] A.D. Becke, J. Chem. Phys. 107 (1997) 8554. [24] J. P. Perdew and Y. Wang, Phys. Rev. B 45 (1992) 13244 [25] H. Stoll, C. M. E. Pavlidou and H. Preuss, Theor. Chim. Acta 49 (1978) 143; H. Stoll, E. Golka and H. Preuss, Theor. Chim. Acta 55 (1980) 29 [26] S. Grimme, J. Comput. Chem. 27 (2006) 1787 [27] A.D. Boese, N.L. Doltsinis, N.C. Handy and M. Sprik, J. Chem. Phys. 112 (2000) 1670. [28] T.W. Keal and D.J. Tozer, J. Chem. Phys. 123 (2005) 121103. [29] A.D. Boese and J.M.L. Martin, J. Chem. Phys. 121 (2004) 3405. 79