Note su "Teoria del Funzionale della Densitunhbox voidb@x group

Università di Torino
Corso di Studi in Scienza dei Materiali
Laurea Magistrale in Scienza dei Materiali
A. A. 2013-2014
TEORIA DEL FUNZIONALE
DELLA DENSITÀ
Appunti del corso
Bartolomeo Civalleri
[appunti aggiornati al September 16, 2014]
1
Premessa
Queste note richiamano gli argomenti svolti nel modulo di Teoria del Funzionale della Densitá
del corso opzionale di Complementi di Scienza dei Materiali Computazionale per la Laurea
Magistrale in Scienza dei Materiali presso l’Università di Torino.
NOTA: Gli appunti sono in continuo aggiornamento e quindi alcuni capitoli possono non essere
completi o in fase di revisione. Le figure sono state rimosse per evitare problemi di copyright
(contattare il docente)
Testo di riferimento:
Koch, W., Holthausen, M.C.; A Chemist’s Guide to Density Functional Theory, Wiley-VCH,
Weinheim, 2000
Altri testi consultabili per approfondimenti sono:
• Parr, R.G; Yang, W. Density Functional Theory of Atoms and Molecules, Oxford
University Press, NY, 1989
• Dreizler, R.M.; Gross, E.K.U. Density Functional Theory: An Approach to the ManyBody Problem; Springer-Verlag, Berlin, 1990
• Gill, P.W.M.; Density Functional Theory (DFT), Hartree-Fock (HF), and the Selfconsistent Field, in Encyclopedia of Computational Chemistry, Schleyer, P.v.R.; Allinger,
N.L.; Clark, T.; Gasteiger, J.; Kollman, P.A.; Schaefer III, H.F.; Schreiner, P.R. (eds.);
Wiley, Chichester, 1998, vol. A, pp. 678-689
2
Contents
1 Introduzione
1.1 Dalla funzione d’onda alla densità elettronica . . . . . . . . . . . . . . . . . .
1.2 Un esempio semplice: il modello di Thomas-Fermi . . . . . . . . . . . . . . .
5
5
8
2 Teoremi di Hohenberg-Kohn
2.1 Teorema I: la densità come variabile base . . . . . . . . .
2.2 Teorema II: principio variazionale . . . . . . . . . . . . .
2.3 Il problema della v- e N-rappresentabilità . . . . . . . . .
2.4 Riformulazione di Levy-Lieb: la ricerca-vincolata . . . . .
2.5 Estensioni . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Sistemi con polarizzazione di spin . . . . . . . . .
2.5.2 Dipendenza dalla temperatura e ensemble statistici
2.5.3 Dipendenza dalla densità di corrente . . . . . . .
2.5.4 Dipendenza dal tempo . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
14
16
16
18
18
18
19
19
3 Matrici densità e buca di scambio e correlazione
3.1 Matrici densità e operatore densità . . . . . . .
3.2 Matrici densità ridotte . . . . . . . . . . . . . .
3.3 Matrici densità spinless . . . . . . . . . . . . .
3.4 Densità di paia . . . . . . . . . . . . . . . . . .
3.5 Buca di scambio-correlazione . . . . . . . . . .
3.5.1 La buca di Fermi . . . . . . . . . . . . .
3.5.2 La buca di Coulomb . . . . . . . . . . .
3.5.3 Esempi . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
24
25
26
28
29
29
.
.
.
.
.
.
.
.
.
32
32
34
37
37
38
38
39
40
42
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Approccio di Kohn-Sham
4.1 Sistema di elettroni non interagenti . . . . . . . . . . . . . . . . . .
4.2 Funzionale di scambio e correlazione ed equazioni di Kohn-Sham . .
4.3 Discussione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Significato delle autofunzioni di Kohn-Sham . . . . . . . . .
4.3.2 Significato degli autovalori di Kohn-Sham . . . . . . . . . . .
4.3.3 Significato del potenziale di XC . . . . . . . . . . . . . . . .
4.3.4 Nota su scambio esatto e funzionale di scambio e correlazione
4.4 Connessione adiabatica . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Funzionali di scambio e correlazione
5.1 La scala di Giacobbe (Jacob’s Ladder) . . . . . . . . . . . . .
5.2 Funzionali di scambio e correlazione ibridi . . . . . . . . . . . .
5.2.1 Funzionali ibridi globali . . . . . . . . . . . . . . . . .
5.2.2 Funzionali ibridi di tipo Range-Separated (RSH) . . . .
5.3 Metodi doppio-ibridi (Double-Hybrids) . . . . . . . . . . . . .
5.3.1 Metodo B2-PLYP (S. Grimme JCP 124 (2006)034108)
5.4 Alcune note schematiche sulla costruzione di un funzionale . . .
5.4.1 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5 Funzionali locali e correzioni per il gradiente da GEA (GGA) .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
44
48
48
49
50
50
51
52
53
6 Implementazione dei metodi DFT
55
6.0.1 Implementazione dei metodi DFT . . . . . . . . . . . . . . . . . . . . 55
7 Valutazione dei metodi DFT
A Sul
A.1
A.2
A.3
concetto di funzionale e derivata
Funzionale e derivata funzionale . .
Formula di Eulero . . . . . . . . .
Minimo di un funzionale . . . . . .
60
di un funzionale
62
. . . . . . . . . . . . . . . . . . . . . . . 62
. . . . . . . . . . . . . . . . . . . . . . . 65
. . . . . . . . . . . . . . . . . . . . . . . 67
B PBE’s type exchange functionals and functional derivatives
69
C B97-like exchange-correlation functional and functional derivatives
73
4
Chapter 1
Introduzione
1.1
Dalla funzione d’onda alla densità elettronica
Consideriamo l’approccio tradizionale (o standard) ai metodi della meccanica quantistica incentrato sull’uso come variabile base della funziona d’onda.
b = EΨ,
Per una molecola con N elettroni si deve risolvere l’equazione di Schrödinger HΨ
dove l’operatore Hamiltoniano elettronico ha l’espressione
b elec = −1/2
H
N
X
∇2i
−
i
N X
M
X
ZA
i
A
ria
N X
M X
N
M
X
X
1
ZA ZB
+
+
r
RAB
i j>i ij
A B>A
(1.1)
dove ria = |ri − RA |, rij = |ri − rj | e RAB = |RA − RB |.
b elec può essere riscritto evidenziando la dipendenza da un potenziale esterno, Vext , rappreH
P ZA
sentato dall’interazione con i nuclei atomici, v(ri ) = M
A ria , quindi
b elec = −1/2
H
N
X
∇2i
−
N
X
i
i
N X
N
X
1
v(ri ) +
r
i j>i ij
(1.2)
b elec è completamente definito quando sono noti:
Dalle relazioni (1.1) e (1.2) risulta che H
1. il numero di elettroni, N
2. il potenziale esterno, Vext , che a sua volta è definito da
• carica nucleare, ZA
• posizione dei nuclei, RA
b (tralasciamo l’indicazione elec) è possibile risolvere l’equazione di Schrödinger
Dato l’operatore H
e ottenere la funzione d’onda e l’energia. Per fare questo siamo aiutati da un importante strumento: il principio variazionale, che stabilisce che
b tr i = Etr ≥ E0 = hΨ0 |H|Ψ
b 0i
hΨtr |H|Ψ
esiste quindi una relazione funzionale tra E e Ψ
E = E[Ψ]
5
(1.3)
L’energia è un funzionale della funzione d’onda.
Possiamo esprimere il principio variazionale anche come
b
c
E = min E[Ψ] = min hΨ|H|Ψi
= min hΨ|Tbe + Vd
ext + Vee |Ψi
Ψ→N
Ψ→N
Ψ→N
dove Ψ → N significa che si ricerca la Ψ tra tutte le funzioni d’onda N -elettroniche fisicamente
accettabili (continue, con derivate continue e di quadrato integrabile - vedere primo postulato
della QM)
Ad esempio per il metodo Hartree-Fock si ha
b
E = min hΦ|H|Φi
= min E[Φ]
Φ→N
Φ→N
dove il minimo si ottiene ricercando il miglior set di spinorbitali che definiscono il determinante
di Slater, Φ.
Quindi, mettendo insieme tutte queste osservazioni possiamo dire che dati {N, ZA , RA } questi
definiscono l’operatore hamiltoniano che attraverso la soluzione dell’equazione di Schrödinger
determinano Ψ e l’energia, E. Possiamo indicare questo con
b =⇒ Ψ =⇒ E
{N, ZA , RA } =⇒ H
Otteniamo, allora, che
E = E[N, Vext ]
dove si evidenzia che l’energia dipende dal numero di elettroni e dal potenziale esterno.
La relazione funzionale scritta sopra non vale solo per l’energia, ma per qualsiasi altra osservb
abile. Il valore di aspettazione per un’osservabile è dato infatti da O = hΨ|O|Ψi.
Anche la densità elettronica, ρ(r), si può ottenere da Ψ come
Z
Z
ρ(r1 ) = N · · · |Ψ(x1 , x2 , ..., xN )|2 ds1 dx2 · · · dxN
questa è la probabilità di trovare uno qualsiasi degli N elettroni nell’elemento di volume dr1
con spin arbitrario (gli altri N − 1 elettroni hanno posizione e spin arbitrari). ρ(r) è più
propriamente una densità di probabilità.
La densità elettronica, ρ(r), ha una serie di importanti proprietà
• ρ(r) è positiva
• ρ(r) dipende dalle sole variabili spaziali: ρ(x, y, z)
• ρ(r) svanisce all’infinito: ρ(r → ∞) = 0
• integrata dà il numero di elettroni totale:
R
ρ(r1 )dr1 = N
Inoltre, ρ(r)
• è un osservabile fisica, ottenibile da esperimenti di diffrazione di raggi X
• presenta dei massimi solo in corrispondenza della posizione dei nuclei, RA
6
A
• sui nuclei è presente una cuspide, conseguenza della singolarità nel termine − rZiA
dell’hamiltoniano
per riA → 0. Questa cuspide dipende dalla carica nucleare attraverso la relazione
∂
+ 2ZA ρ̄(r) = 0
lim
riA →0 ∂r
dove ρ̄(r) è la media sferica di ρ(r)
1
ρ̄(r) =
4π
Z
π
Z
2π
ρ(r) sin θdθdφ
0
0
La condizione di cuspide può ugualmente essere espressa come
−2ZA =
∂ ln ρ̄(r)
|ri =RA
∂riA
La relazione sopra è facilmente verificabile nel caso di un atomo (ad esempio, si provi
1
Z 3/2 −Z ar
).
come esercizio a verificarlo per l’atomo di idrogeno per il quale Ψ1s = π1/2
e
a
Nel caso molecolare la densità elettronica è mediata sfericamente nell’intorno della posizione dei nuclei, RA .
• decade con un andamento esponenziale asintotico per grandi distanze dai nuclei come
√
ρ(r) ∝ exp[−2 2I|r|]
dove I è il potenziale di ionizzazione
Quindi ρ(r), come Ψ, contiene tutti gli ingredienti necessari per definire l’operatore hamiltoniano: N, ZA , RA ; e di conseguenza tutte le proprietà molecolari. Si può scrivere
b =⇒ Ψ =⇒ E
ρ(r) =⇒ {N, ZA , RA } =⇒ H
Possiamo allora affermare che l’energia è un funzionale della densità elettronica
E = E[ρ(r)]
e vale il seguente principio variazionale
E=
min E[ρ]
ρ→N,Vext
dove ρ → N, Vext indica che la ricerca va fatta su tutte le ρ accettabili dal punto di vista fisico
e cioè che integrate diano il numero totale di elettroni, N , e che definiscano univocamente il
potenziale esterno, Vext .
Questi due risultati corrispondono ai due teoremi di Hohenberg-Kohn. Il primo stabilisce
l’esistenza del funzionale, E[ρ], e il secondo definisce un principio variazionale.
7
1.2
Un esempio semplice: il modello di Thomas-Fermi
I primi tentativi di usare la densità elettronica come variabile base risalgono in realtà alle
origini della meccanica quantistica. Infatti, nel 1927, Thomas e Fermi in modo indipendente,
proposero un semplice modello meccanico-statistico della struttura elettronica degli atomi. In
pratica il modello di Thomas-Fermi ha un interesse prevalemtemente storico con scarsa utilità
concreta, ma è da considerarsi il primo esempio di quella che diventerà la teoria del funzionale
della densità.
Thomas e Fermi considerano un sistema ideale di elettroni non interagenti, cioè un gas uniforme
di elettroni non interagenti. L’energia del sistema in esame dipenderà quindi esclusivamente
dall’energia cinetica degli elettroni. Anche se l’assunzioni fatte sono molto drastiche è possibile dimostrare che per tale sistema l’energia dipende solamente dalla densità elettronica ρ(r).
Dividiamo lo spazio in piccoli cubetti (celle) ognuno di lato l e volume ∆V = l3 , ognuno contenente un numero fissato di elettroni ∆N (che può essere diverso da cella a cella). Assumiano
quindi che gli elettroni in ogni cella si comportino come particelle fermioniche indipendenti a
T = 0K e che le celle siano tra loro indipendenti.
I livelli energetici delle particelle in una buca di potenziale tridimensionale infinita sono dati da
h2 2
h2
2
2
2
(nx , ny , nz ) =
(n + ny + nz ) =
R
8ml2 x
8ml2
dove nx , ny , nz = 1, 2, 3, ....
Per numeri quantici elevati, cioè per grandi valori di R, il numero di livelli energetici con energia
minore di può essere approssimato dal volume di un ottante di una sfera di raggio R nello
spazio (nx , ny , nz ). Questo numero è
1
Φ() =
8
4πR3
3
π
=
6
8ml2 h2
3/2
(1.4)
Il numero di livelli energetici tra e + δ è quindi
π
g()∆ = Φ( + δ) − Φ() =
4
8ml2
h2
3/2
1/2 δ + O((δ)2 )
(1.5)
dove la funzione g() è la densità degli stati con energia .
Per calcolare l’energia totale di una cella con ∆N elettroni, occorre conoscere la probabilità
di occupazione dello stato con energia che indichiamo con f (). Questa è data dalla distribuzione di Fermi-Dirac
1
(1.6)
f () =
1 + eβ(−µ)
dove β =
gradino
1
kB T
e kB è la costante di Boltzmann. A T = 0K la ?? si riduce alla funzione
f () = 1, < F
f () = 0, > F
(1.7)
(1.8)
con β → ∞, dove F è l’energia di Fermi. Tutti gli stati con energia minore di F sono
occupati mentre quelli con energia maggiore sono non-occupati.
8
Sommando i contributi dovuti ai diversi stati energetici, si ricava l’energia totale degli elettroni
nella cella
R
∆E = 2 f ()g()d
= 4π
=
8π
5
2m 3/2 3
l
h2
R F
0
3/2 d
(1.9)
2m 3/2 3 5/2
l F
h2
dove il fattore 2 indica che ogni livello è doppiamente occupato da un elettrone con spin α e un
altro con spin β. L’energia di Fermi è legata al numero di elettroni ∆N nella cella attraverso
la formula
3/2
Z
8π 2m
3/2
l3 F
(1.10)
∆N = 2 f ()g()d =
2
3
h
Eliminando F dalla 1.9 usando la 1.10 si ricava
3h2
3π
∆N F =
∆E =
5
10m
3
8π
2/3
l
3
∆N
l3
5/3
(1.11)
L’equazione 1.11 è la relazione tra l’energia cinetica totale e la densità elettronica ρ =
∆N/l3 = ∆N/V per ogni cella nello spazio. (Notare che celle diverse possono avere valori diversi di ρ.)
Sommando i contributi da tutte le celle si ottiene l’energia cinetica totale che in unità atomiche
diventa
Z
TT F [ρ] = CF ρ5/3 (r)dr
(1.12)
dove
3
(3π 2 )2/3 = 2.871
(1.13)
10
ed è stato considerato il limite per ∆V → 0 con ρ = ∆N/∆V = ρ(r) con valore finito per
passare da una somma ad un integrale.
Questo è il famoso funzionale energia cinetica di Thomas-Fermi che fu applicato allo studio
degli elettroni negli atomi.
CF =
Nota: in questa approssimazione è stato assunto che le proprietà elettroniche siano determinate da funzionali della densità elettronica che localmente si rifanno ad un sistema elettronico
omogeneo. Questa assunzione è alla base di quella che vedremo essere l’approssimazione locale dei funzionali della densità (local density approximation, LDA).
Se al contributo cinetico dato dalla 1.12 si sommano le energie elettrostatiche classiche di
attrazione elettrone-nucleo e repulsiva elettrone-elettrone (trascurando i contributi di scambio
e correlazione) si ottiene per un atomo l’energia espressa solo in termini della densità elettronica
Z Z
Z
Z
Z
1
ρ(r1 )ρ(r2 )
5/3
ET F [ρ(r)] = CF ρ (r)dr −
ρ(r)dr +
dr1 dr2
(1.14)
r
2
|r1 − r2 |
Questo è il funzionale energia totale nella teoria atomica di Thomas-Fermi. Per le molecole
l’espressione sopra può essere opportunamente modificata.
9
Si può assumere allora che per lo stato fondamentale di un atomo la densità elettronica
minimizza il funzionale ET F [ρ(r)] soggetto al vincolo
Z
N = N [ρ(r)] = ρ(r)dr
(1.15)
dove N è il numero totale di elettroni nell’atomo. Usando il metodo dei moltiplicatori di Lagrange, la densità elettronica dello stato fondamentale deve soddisfare il principio variazionale
Z
δ ET F [ρ] − µT F
ρ(r)dr − N
=0
(1.16)
che porta all’equazione di Eulero-Lagrange
µT F =
5
δET F [ρ]
= CF ρ2/3 (r) − φ(r)
δρ(r)
3
(1.17)
dove φ(r) è il potenziale elettrostatico nel punto r generato dal nucleo e dall’intera distribuzione
elettronica
Z
ρ(r2 )
Z
dr2
(1.18)
φ(r) = −
r
|r − r2 |
L’equazione di Eulero-Lagrange può essere risolta insieme al vincolo per ricavare la densità
elettronica che inserita nella 1.14 permette di ottenere l’energia dello stato fondamentale.
Il modello di Thomas-Fermi può essere esteso ad un gas di elettroni integragenti includendo i
contributi di scambio (Dirac-Slater, TFD)[3, 4] e correlazione (Wigner, TFDW)[5] o per tenere
conto di effetti di non omogeneità del gas di elettroni (Weizsacker, Kirzhnitz, TFW)[6, ?]. La
crudezza delle approssimazioni del modello lo rendono inaccurato per la descrizione di atomi e
molecole ed è stato dimostrato non essere in grado nè di riprodurre la struttura a guscio degli
atomi nè di dare alcuna legame tra gli atomi in una molecola [7].
10
Chapter 2
Teoremi di Hohenberg-Kohn
La formulazione moderna della teorià del funzionale della densità ha avuto origine con il famoso
articolo di P. Hohenbger e W. Kohn (HK) del 1964[8]. Gli autori dimostrarono che un ruolo
chiave può essere assegnato alla densità di particelle per lo stato fondamentale di un sistema
multi-corpi. La densità diventa quindi la variabile base per la descrizione del sistema in quanto
tutte le proprietà osservabili possono essere considerate funzionali unici della densità dello
stato fondamentale.
A differenza da quanto visto per il modello di Thomas-Fermi, l’approccio di Hohenberg e Kohn
è di formulare la teoria del funzionale della densità come una teoria esatta per un sistema multicorpi. A fini del corso, noi consideriamo un sistema di multielettronico a nuclei fissi descritto
dall’hamiltoniano
N
N
N X
N
X
X
X
1
b elec = −1/2
(2.1)
H
∇2i −
v(ri ) +
r
ij
i
i
i j>i
ma la teoria è del tutto generale e si applica ad un sistema di particelle (fermioni o bosoni)
soggette all’azione di un potenziale esterno Vext (r).
La formulazione di basa su due teoremi fondamentali.
2.1
Teorema I: la densità come variabile base
Teorema I:
Per qualsiasi sistema di particelle interagenti soggetto all’azione di un potenziale esterno
Vext (r), il potenziale Vext (r) è determinato unicamente, a meno di una costante, dalla densità
di particelle nello stato fondamentale, ρ0 (r).
Corollario
Dato che l’hamiltoniano è completamente definito, eccetto che per uno shift di energia, ne
consegue che sono anche definite le funzioni d’onda multi-particelle per tutti gli stati (fondamentale ed eccitati). Perciò tutte le proprietà del sistema sono completamente determinate
data la sola densità dello stato fondamentale ρ0 (r).
Dimostrazione:
11
Consideriamo un sistema di multielettronico il cui la funzione d’onda Ψ0 dello stato fondamentale sia non degenere.
(Nota: l’estensione al caso degenere è facile, ma vedremo più avanti che è possibile generalizzare i teoremi di HK in una formulazione che vale per stati degeneri e non degeneri).
L’hamiltoniano 2.1 può essere scritto in modo conciso come
b = Tb + Vbext + Vbee
H
La dimostrazione ”intuitiva” vista in precedenza che l’energia è un funzionale della densità
elettronica può essere formalizzata in tre passaggi:
A. Esiste una corrispondenza biunivoca tra il potenziale esterno Vext (r) e la funzione d’onda
b e quindi la funzione
Ψ0 . Come già sottolineato, definire Vext (r) corrisponde a definire H
b 0 i, con E0 energia dello stato fondamentale.
d’onda Ψ che soddisfa hΨ0 |H|Ψ
Dato Vext (r), la funzione d’onda Ψ0 è univocamente definita. Se cosı̀ non fosse, sarebbe
0
possibile avere due potenziali diversi Vext (r) e Vext
(r), che differendo tra loro per più di una
costante
0
Vext (r) − Vext
(r) 6= cost
(2.2)
0
(r) + cost sono considerati equivalenti) danno origine alla
(potenziali del tipo Vext (r) = Vext
stessa funzione d’onda Ψ.
Per dimostrare che questo non è vero, partiamo dalle corrispondenti equazioni di Schrödinger
si ha
b
hΨ|H|Ψi
= hΨ|Tb + Vbext + Vbee |Ψi = E0
e
0
b 0 |Ψ0 i = hΨ0 |Tb + Vbext
hΨ0 |H
+ Vbee |Ψ0 i = E00
se fosse Ψ = Ψ0 per sottrazione si avrebbe
0
(Vbext − Vbext
)|Ψi = (E0 − E00 )|Ψi
(2.3)
0
0
= E0 −E00 =
sono potenziali moltiplicativi, la 2.3 porterebbe a Vbext − Vbext
Dato che Vbext e Vbext
∆E(cost) in contraddizione con la 2.2.
Questo dimostra quindi
b ⇐⇒ Ψ
Vbext ⇐⇒ H
B. Esiste una corrispondenza univoca tra Ψ0 e ρ(r). Questa relazione è implicita nella
definizione di ρ
Z
Z
ρ(r) = N · · · |Ψ(x1 , x2 , ..., xN )|2 ds1 dx2 · · · dxN
e quindi possiamo scrivere
Ψ =⇒ ρ(r)
C. Alla densità elettronica ρ(r), che corrisponde a uno stato fondamentale non degenere,
corrisponde univocamente un potenziale esterno Vext (r). Lo si dimostra per assurdo.
0
0
Siano Vext (r) e Vext
(r) due potenziali diversi, tali che Vext (r) 6= Vext
(r) + cost, cui corrispon0
b
b
dono le hamiltoniane H e H e quindi le due autofunzioni per lo stato fondamentale Ψ0 e Ψ00
12
che per quanto dimostrato prima (A) sono diverse. Supponiamo però che Ψ0 e Ψ00 definiscano
la stessa densità di carica ρ(r).
Per il teorema variazionale, dato che Ψ0 6= Ψ00 , ed essendo lo stato fondamentale non degenere,
vale
b 0 i < hΨ0 |H|Ψ
b 0i
E0 = hΨ0 |H|Ψ
0
0
ma anche
b 0 |Ψ0 i
b 0 |Ψ00 i < hΨ0 |H
E00 = hΨ00 |H
da cui
b −H
b 0 |Ψ0 i < hΨ00 |H
b −H
b 0 |Ψ00 i
hΨ0 |H
dato che le hamiltoniane differiscono solo per il potenziale esterno si ottiene
0
0
hΨ0 |Vbext − Vbext
|Ψ0 i < hΨ00 |Vbext − Vbext
|Ψ00 i
che si può scrivere come
Z
Z
0
0
ρ(r)[vext (r) − vext (r)]dr < ρ0 (r)[vext (r) − vext
(r)]dr
da cui ρ(r) < ρ0 (r), ma essendo per ipotesi ρ(r) ≡ ρ0 (r), si arriva ad un assurdo.
Non possono quindi esistere due potenziali esterni diversi che generano la stessa densità elettronica. Ne consegue che
ρ(r) =⇒ vext (r)
Riassumendo i risultati ottenuti si ricava
vext (r) ⇐ ρ(r)
m
⇑
b
H
⇔ Ψ0
(2.4)
da cui risulta che non solo esiste una relazione diretta tra Ψ0 e ρ(r), ma anche una relazione
inversa, perciò la funzione d’onda è un funzionale della densità Ψ0 [ρ] e di conseguenza tutte
le proprietà (osservabili) del sistema
b
hΨ[ρ]|O|Ψ[ρ]i
= O[ρ]
sono funzionali della densità.
Con particolare riferimento all’energia, il primo teorema di HK stabilisce quindi l’esistenza del
funzionale
Ev [ρ] = Vext [ρ] + T [ρ] + Vee [ρ]
in cui si è evidenziata la dipendenza esplicita da vext (r) e che i singoli contributi all’energia
totale sono essi stessi dei funzionali della densità, come appena dimostrato.
È possibile, a questo punto, esplicitare nell’espressione dell’energia, i contributi che dipendono
dal sistema stesso: il potenziale esterno dovuto all’interazione attrattiva elettrone-nucleo e
quelle che sono universali perchè la loro espressione non dipende da N, RA e ZA
Z
Ev [ρ] = ρ(r)vext (r)dr + T [ρ] + Vee [ρ]
13
Raccogliendo i termini che sono indipendenti dal sistema
Z
Ev [ρ] = ρ(r)vext (r)dr + FHK [ρ]
si può definire il funzionale universale di HK
FHK [ρ] = T [ρ] + Vee [ρ] = hΨ[ρ]|Tb + Vbee |Ψ[ρ]i
FHK [ρ] è universale nel senso che è lo stesso funzionale per atomi, molecole e solidi indipendentemente dal fatto che l’interazione degli elettroni sia con un nucleo, alcuni nuclei o un
reticolo cristallino.
2.2
Teorema II: principio variazionale
Teorema II:
È possibile definire un funzionale universale per l’energia, E[ρ], in termini della densità ρ(r),
valido per qualsiasi potenziale esterno vext (r). Dato un qualunque potenziale esterno vext (r),
l’energia esatta dello stato fondamentale del sistema è il minimo globale di questo funzionale
e la densità ρ(r) che minimizza il funzionale è la densità esatta dello stato fondamentale.
Corollario
La conoscenza del funzionale E[ρ] è sufficiente, da sola, a determinare esattamente l’energia e
la densità dello stato fondamentale. In generale, stati elettronici eccitati devono essere determinati in altri modi. Anche proprietà all’equilibrio termico (con T 6= 0 K) come ad esempio
la capacità termica sono determinate direttamente come funzionale della densità passando
attraverso la definizione dell’energia libera come funzionale della densità.
Dimostrazione:
Il secondo teorema di HK può anche essere Rriformulato come: data una densità di prova ρ̃(r),
tale che soddisfi le condizioni ρ̃(r) ≥ 0, ρ̃(r)dr = N e che sia associata a un qualche
potenziale esterno ṽext (r),
E0 ≤ Ev [ρ̃]
(2.5)
Per dimostrare il teorema, notiamo che il primo teorema di HK stabilisce che ρ̃ determina
˜b
ṽ, l’hamiltoniana H
e la funzione d’onda Ψ̃. Per quest’ultima vale il principio variazionale
definito dalla relazione 1.3 e quindi può essere utilizzata come funzione d’onda di prova per
l’hamiltoniana generata dal potenziale esterno vero vext (r), cioè
b Ψ̃i ≥ hΨ0 |H|Ψ
b 0 i = E0 [ρ0 ]
hΨ̃|H|
quindi per il primo teorema di HK vale
Z
T [ρ̃] + Vee [ρ̃] +
ρ̃(r)vext dr = Ev [ρ̃] ≥ E0 [ρ0 ]
14
che è il risultato cercato.
Assumendo che Ev [ρ] sia differenziabile, il principio variazionale stabilito sopra fornisce uno
strumento molto utile per ricavare l’energia dello stato fondamentale imponendo che
Z
δ Ev [ρ] − µ
ρ(r)dr − N
=0
(2.6)
che si riduce alla risoluzione dell’equazione di Eulero-Lagrange
µ=
δFHK [ρ]
δEv [ρ]
= vext (r) +
δρ(r)
δρ(r)
Se si conoscesse la forma esatta del funzionale FHK [ρ] da inserire nella 2.6 si sarebbe risolto
il problema di trattare un sistema multielettronico in modo esatto. Per farlo occorre dare
una forma esplicita ai funzionali energia cinetica e repulsione elettrone-elettrone. Purtroppo,
la loro forma funzionale non è nota. Per il momento limitiamoci però ad estrarre da Vee [ρ]
almeno il contributo coulombiano classico, J[ρ], che è noto
Z Z
ρ(r1 )ρ(r2 )
1
dr1 dr2 + Encl [ρ] = J[ρ] + Encl [ρ]
Vee [ρ] =
2
r12
dove Encl [ρ] è un termine non classico di interazione elettrone-elettrone che contiene tutti gli
effetti di correlazione elettronica e di auto-interazione.
Il secondo teorema di HK limita, di fatto, l’applicabilità del principio variazionale, definito dalla
2.5, allo stato fondamentale del sistema poichè è valido solo per E0 , a differenza del primo
teorema che è valido per tutti gli stati elettonici del sistema. In questo caso non viene fornita
alcuna indicazione per gli stati eccitati.
In sintesi:
• tutte le proprietà di un sistema definito dal potenziale esterno vext (r) sono determinate
dalla densità dello stato fondamentale;
• l’energia dello stato fondamentale
associata ad una densità ρ(r) è ottenibile attraverso
R
la relazione funzionale ρ(r)vext (r)dr + FHK [ρ];
• questo funzionale raggiunge il suo valore minimo, rispetto a tutte le densità permesse,
se e solo se la densità usata è la vera densità elettronica dello stato fondamentale (cioè,
ρ̃(r) = ρ0 (r))
questi tre punti che implicano: Ψ[ρ], universalità e teorema variazionale, costituiscono la
formulazione classica dei teoremi di HK.
15
2.3
Il problema della v- e N-rappresentabilità
Quanto detto finora nasconde un problema teorico di carattere più formale: esistono delle
restrizioni allo spazio delle densità nella definizione di funzionale data da HK?
In realtà, la dimostrazione originale di HK è ristretta alle densità ρ(r) che sono le densità dello
stato fondamentale dell’hamiltoniana elettronica associate ad un qualche potenziale esterno
vext (r). Queste densità vengono chiamate v-rappresentabili. Esiste quindi uno spazio, che
raccoglie tutte le possibili densità, all’interno del quale si possono definire e costruire i funzionali della densità.
In altre parole, non tutte le densità possibili sono valide nel contesto del primo teorema di
HK. Dovrebbero essere considerate solo quelle che sono associate con una funzione d’onda
antisimmetrica e un operatore hamiltoniano che contiene un qualche potenziale esterno. Un
altro problema che si origina da questo aspetto è quello di stabilire quando la ρ è accettabile
(v-rappresentabile). Al momento non sono note le condizioni matematiche che devono essere
soddisfatte dalla ρ per essere v-rappresentabile.
Si può dimostrare, come vedremo meglio nella prossima sezione, che il problema della vrappresentabilità non è essenziale e che la teoria DFT può essere riformulata in modo tale da
richiedere che per il funzionale e per il principio variazionale, la densità debba soddisfare una
condizione meno restrittiva, la cosiddetta N-rappresentabilità.
Una densità è N-rappresentabile se può essere ottenuta da una qualche funzione d’onda antisimmetrica N-elettronica. In questo caso le condizioni matematiche perchè una densità sia
N-rappresentabile sono note
ρ(r) ≥ 0,
R
ρ(r)dr = N , e
R
|∇ρ1/2 |2 dr < ∞
(cioè condizioni di: non negatività, normalizzazione e continuità) e sono soddisfatte da praticamente qualsiasi densità.
Le funzioni v-rappresentabili sono ovviamente un sottoinsieme di quelle N-rappresentabili.
2.4
Riformulazione di Levy-Lieb: la ricerca-vincolata
Una definizione alternativa di funzionale della densità è stata proposta da Levy e Lieb. Essa
ha alcuni vantaggi rispetto alla definizione data nei teoremi di HK:
• estende la definizione di funzionale della densità rendendola più trattabile formalmente
e chiarisce il suo significato fisico;
• fornisce una via per arrivare al funzionale esatto;
• porta alla stessa densità e energia di minimo come nell’analisi di HK e si applica anche
al caso di stati fondamentali degeneri.
L’idea di Levy e Lieb (LL) è di definire una procedura di minimizzazione in due passi.
Partendo dall’espressione dell’energia in termini della funzione d’onda
Z
b
d
c
b
b
E = hΨ|Te + Vext + Vee |Ψi = hΨ|T |Ψi + hΨ|Vee |Ψi + ρ(r)vext (r)dr
16
L’energia dello stato fondamentale può essere ricavata minimizzando l’espressione sopra rispetto
a tutte le Ψ antisimmetriche N-elettroniche.
c
E0 = min hΨ|Tbe + Vd
ext + Vee |Ψi
Ψ→N
Quella che determina l’autovalore più basso è la funzione d’onda dello stato fondamentale Ψ0 .
Per collegare il principio variazionale sopra alla teoria DFT, si considera solo l’insieme di
funzioni Ψ che danno la stessa densità ρ(r) e si cerca la Ψ che minimizza l’energia
h
i Z
b
c
E = min hΨ|T + Vee |Ψi + ρ(r)vext (r)dr
Ψ→ρ(r)
a questo punto si minimizza l’energia per quella data densità ρ(r)
h
i Z
b
c
E0 = min
min hΨ|T + Vee Ψi + ρ(r)vext (r)dr
ρ(r)→N
Ψ→ρ(r)
Dalle espressioni sopra si può definire il funzionale universale di Levy-Lieb FLL [ρ] come
FLL [ρ] = min hΨ|Tb + Vc
ee Ψi
Ψ→ρ(r)
quindi
E0 = min
ρ(r)→N
Z
FLL [ρ] +
ρ(r)vext (r)dr
Bisogna notare che
• Il significato di E0 è quindi il minimo della somma di energia cinetica e repulsione
elettronica cercato tra tutte le possibili Ψ che danno la stessa densità ρ0 ;
• la ricerca è vincolata (constrained-search) perchè si considera solo l’insieme delle funzioni
d’onda che danno la densità ρ0 (r) a differenza del caso tradizionale
b
E0 = min hΨ|H|Ψi
Ψ→N
dove la ricerca considera l’intero spazio delle funzioni d’onda antisimmetriche N-elettroniche;
• il funzionale di LL è definito per qualsiasi densità che sia N-rappresentabile;
• FLL [ρ0 ] = FHK [ρ0 ] quando ρ0 è v-rappresentabile;
• la definizione di FLL elimina la restrizione della dimostrazione originale di HK di avere
uno stato fondamentale non degenere;
• anche se questa formulazione è più generale non fornisce alcuna via pratica per poter
sfruttare le enormi potenzialità offerte dalla teoria DFT.
• Nel passare dalla complessità della Ψ, funzione a 4N -variabili, alla densità elettronica,
ρ(r), funzione di tre sole variabli, tutta la complessità si trasferisce nel funzionale F [ρ]
che non è noto.
17
2.5
Estensioni
I teoremi di HK possono essere generalizzati al caso di particelle di diverso tipo o per condizioni
diverse. Di seguito sono elencate alcune delle estensioni della teoria del funzionale della densità
con alcuni commenti e non verranno discusse ulteriormente. Per dettagli vedere i riferimenti
citati.
• sistemi con polarizzazione di spin
• sistemi non elettronici e multicomponenti
• stati eccitati
• dipendenza dalla temperatura e ensemble statistici
• dipendenza dal tempo (TD-DFT - Time Dependent-DFT)
• dipendenza dalla densità di corrente (Current-DFT)
2.5.1
Sistemi con polarizzazione di spin
In questo caso, oltre al potenziale esterno esiste un potenziale locale magnetico di interazione
elettronica spin-spin (tipo Zeeman). Cioè il potenziale agisce solo sugli spin e non sul moto
orbitale degli elettroni.
All’interno di questo modello, i teoremi visti possono essere generalizzati per includere due
tipi di densità: la densità elettronica totale, ρ(r) = ρα (r) + ρβ (r), e la densità di spin,
s(r) = ρα (r) − ρβ (r). Questo porta al funzionale dell’energia
E = EHK [ρ(r), s(r)] ≡ E[ρ(x)]
dove x = {r, σ}.
Questa generalizzazione costituisce la Spin-DFT che è la base per poter trattare sistemi multielettronici con molteplicità di spin non nulla. È quindi essenziale per la descrizione di solidi
con ordine magnetico, come ad esempio nel caso della stabilità relativa di fasi antiferro- e
ferro-magnetiche.
In assenza di un campo magnetico tipo Zeeman, la soluzione a più bassa energia può avere una
polarizzazione di spin ρα (r) 6= ρβ (r). Questo è un caso analogo alla soluzione unrestricted
con rottura di simmetria che si ritrova nella teoria di Hartree-Fock.
Aggiungere note su SDFT e teoremi di HK
2.5.2
Dipendenza dalla temperatura e ensemble statistici
I teoremi di HK validi a T = 0 K si possono estendere a sistemi multi-particelle all’equilibrio
termico per diversi ensemble statistici. Questo fu dimostrato da Mermin subito la pubblicazione
dell’articolo di Hohenberg-Kohn.
L’estensione porta a conclusioni ancora più generali perchè non solo l’energia interna, ma anche
l’entropia, la capacità termica, l’energia libera, ... sono funzionali della densità elettronica.
Inoltre, i teoremi possono anche essere estesi al caso in cui si abbia un sistema all’equilibrio
termico con potenziale chimico costante, ma con fluttazioni del numero di elettroni.
18
2.5.3
Dipendenza dalla densità di corrente
Nel caso in cui l’effetto di un campo magnetico esterno coinvolge non solo i termini elettronici
spin-spin, la densità elettronica da sola non è più sufficiente, ma occorre includere anche la
densità di corrente j = −p. È possibile dimostrare che anche in questo caso i teoremi di HK
sono validi e quindi tutte le proprietà del sistema sono funzionali di ρ e j.
Questa teoria rappresenta una delle attuali frontiere di sviluppo della teoria DFT.
2.5.4
Dipendenza dal tempo
La dipendenza dal tempo tiene conto dell’evoluzione temporale di uno stato quantistico.
È stato dimostrato che, data una funzione d’onda iniziale al tempo t, l’evoluzione della Ψ(r, t)
a qualsiasi altro tempo t0 è un funzionale unico della densità dipendente dal tempo ρ(r, t). La
dimostrazione che esiste questa relazione funzionale e un principio variazionale corrispondente
é stata data nel 1985 da Runge e Gross. Su questa formulazione si basa anche l’estensione
della teoria DFT agli stati eccitati.
Aggiungere note su TDDFT e teoremi di HK, riferimenti a RG e review Dreuw/HeadGordon
19
Chapter 3
Matrici densità e buca di scambio e
correlazione
3.1
Matrici densità e operatore densità
Il concetto di matrice densità è molto generale ed è stato introdotto nella meccanica statistica
quantistica per descrivere un sistema il cui stato quantistico non è completamente specificato.
In questi casi esistono diverse funzioni d’onda compatibili con l’informazione data e occorre
una qualche media statistica oltre alla media quantistica, che definisce il valore atteso, data
da una delle funzioni d’onda.
Qui non discuteremo gli aspetti formali, ma ne introduciamo solo la definizione e poi ne discuteremo velocemente alcune proprietà per arrivare a definire la densità di paia e la buca di
scambio e correlazione.
Sappiamo che il significato fisico di Ψ(rN , sN ), funzione d’onda di un sistema N -elettronico,
è legato al suo modulo quadro |Ψ|2 che rappresenta una funzione distribuzione di probabilità
|Ψ(rN , sN )|2 drN
dove drN = dr1 , dr2 , ..., drN ; rN = r1 , r2 , ..., rN e sN è l’insieme s1 , s2 , ..., sN .
|Ψ|2 dà cioè la probabilità di trovare il sistema N -elettronico con coordinate spaziali tra rN e
rN + drN e coordinate di spin uguali a sN .
Usando x ≡ {r, s}, la quantità sopra diventa
ΨN (x1 x2 · · · xN )Ψ∗N (x1 x2 · · · xN )
(3.1)
È possibile generalizzare questa espressione per definire un oggetto del tipo
γN (x01 x02 · · · x0N , x1 x2 · · · xN ) ≡ ΨN (x01 x02 · · · x0N )Ψ∗N (x1 x2 · · · xN )
(3.2)
Si considerano quindi due set di variabili indipendenti {x0N } e {xN } che possono essere pensati
come due insiemi di indici che attraverso la 3.2 restituiscono un valore numerico che si può
considerare come un elemento di una matrice che viene chiamata matrice densità.
Nel caso in cui xi = x0i per tutti i valori di i, si ottiene un elemento diagonale della matrice
che corrisponde alla 3.1.
20
La 3.2 può anche essere vista come la rappresentazione nello spazio continuo delle coordinate
{x} con base |x1 x2 · · · xN ) dell’operatore densità
|ΨN ihΨN | = γ
bN
(3.3)
γN |x1 x2 · · · xN i = (x01 x02 · · · x0N |ΨN ihΨN |x1 x2 · · · xN )
hx01 x02 · · · x0N |b
= ΨN (x01 x02 · · · x0N )Ψ∗N (x1 x2 · · · xN )
(3.4)
dato che
La matrice densità è quindi la rappresentazione dell’operatore densità nello spazio delle coordinate.
L’operatore γ
bN è un operatore proiezione, è Hermitiano, e, se ΨN è normalizzata, la traccia
dell’operatore è
Z
tr(b
γN ) =
ΨN (xN )Ψ∗N (xN )dxN = 1
dove, in una base continua, la sommatoria sugli elementi diagonali diventa un integrale.
Una proprietà importante nel formalismo della matrice densità è che l’espressione del valor
b diventa
medio di un’osservabile che corrisponde all’operatore O
b = tr(b
b = tr(Ob
bγN )
hOi
γN O)
(3.5)
che si può verificare tenendo conto che
R
bγN ) =
b
tr(Ob
hx |O|Ψ
ihΨ |x idx
R N RN 0 N 0 N 0 N
b |x ihx |dx |ΨN ihΨN |xN idxN
=
hx |O
N
N
N
RRN
b 0 ihx0 |ΨN ihΨN |xN idxN dx0
(3.6)
= R R hxN |O|x
N
N
N
0
0
0
= R R O(x , x)b
γN (x , x)dxN dxN
∗
=
ΨN (xN )O(x0 , x)ΨN (x0N )dxN dx0N
R
dove si è usata la relazione di completezza |xN ihxN |dxN = 1 e che O(x0 , x) è la rappresenb nella base continua dello spazio delle coordinate. Per un operatore
tazione dell’operatore O
locale O(x0 , x) = O(x)δ(x0 − x), la 3.5 si riduce alla forma classica
Z
b Ni
Ψ∗N (xN )O(x)ΨN (xN )dxN = hΨN |O|Ψ
La relazione 3.5 rappresenta un risultato importante perchè evidenzia che l’operatore densità
contiene le stesse informazioni della funzione d’onda N -elettronica.
3.2
Matrici densità ridotte
La matrice densità definita in precedenza viene anche detta matrice densità di ordine N. Dato
b dipende solo da operatori mono- e bi-elettronici e non dipende in modo
però che l’operatore H
esplicito dallo spin (cosı̀ come gli operatori corrispondenti ad altre osservabili), l’espressione
3.2 può essere quindi semplificata integrando su N − 2 variabili. Per elettroni (fermioni), la
ΨN deve essere antisimmetrica. Questa integrazione consente di definire delle matrici densità
21
ridotte.
In generale, si definisce la matrice densità ridotta di ordine p l’espressione
γp (x01 x02 · · · x0p , x1 x2 · · · xp ) =
Z
Z
N
=
· · · γN (x01 x02 · · · x0p xp+1 · · · xN , x1 x2 · · · xp · · · xN )dxp+1 · · · dxN
p
Di particolare interesse sono quindi la matrice densità del secondo ordine
Z
Z
N (N − 1)
0 0
· · · Ψ(x01 x02 x3 · · · xN )Ψ∗ (x1 x2 x3 · · · xN )dx3 , ..., dxN
γ2 (x1 x2 , x1 x2 ) =
2
(3.7)
e del primo ordine
Z
Z
0
γ1 (x1 , x1 ) = N · · · Ψ(x01 x2 · · · xN )Ψ∗ (x1 x2 · · · xN )dx2 , ..., dxN
(3.8)
Le due matrici sono rispettivamente normalizzate al numero di coppie N (N2−1) e al numero di
elettroni N .
La matrice densità del primo ordine può essere ottenuta da γ2 per integrazione
Z
2
0
γ2 (x01 x2 , x1 x2 )dx2
(3.9)
γ1 (x1 , x1 ) =
N −1
in questo caso non è necessaria la matrice densità ridotta γ2 (x01 x02 , x1 x2 ) completa, ma è
sufficiente quella a tre variabili γ2 (x01 x2 , x1 x2 ).
Ovviamente alle due matrici densità introdotte sopra corrispondono due operatori densità γ
b2
eγ
b1 che sono Hermitiani e le cui corrispondenti matrici densità sono le loro rappresentazioni
nello spazio delle coordinate.
Inoltre, devono essere antisimmetriche rispetto allo scambio di due particelle, come implicito
nella definizione di γN . In particolare, per la matrice densità di ordine 2 si ha
γ2 (x01 x02 , x1 x2 ) = −γ2 (x02 x01 , x1 x2 ) = −γ2 (x01 x02 , x2 x1 ) = γ2 (x02 x01 , x2 x1 )
(3.10)
Un importante risultato, legato alle matrici densità ridotte, riguarda il valor medio di un
osservabile.
Per un operatore monoelettronico
b1 =
O
N
X
O1 (xi , x0i )
i=1
si ottiene
Z
b1 i = tr(b
b1 ) =
hO
γN O
O1 (x1 , x01 )γ1 (x01 , x1 )dx1 dx01
(3.11)
se l’operatore è locale, come ad esempio la parte monoelettronica dell’operatore Hamiltoniano,
si ha
N
N
X
X
b1 =
O
O1 (xi , x0i )δ(x0i − xi ) =
O1 (xi )
i=1
i=1
22
e il corrispondente valor medio diventa
Z
b
hO1 i = [O1 (x1 )γ1 (x01 , x1 )]x0 =x1 dx1
(3.12)
1
b1 agisce solo su x e che x0 viene trasformato in x dopo
dove la notazione adottata indica che O
b
l’applicazione di O1 e prima dell’integrazione
La 3.12 si può verificare facilmente usando la 3.8
hP
i
R ∗
N
b1 i =
hO
Ψ (x1 x2 · · · xN )
O
(x
)
Ψ∗ (x1 x2 · · · xN )dx1 dx2 · · · dxN
1
i
i=1
PN R ∗
Ψ (x1 x2 · · · xN )O1 (xi )Ψ(x1 x2 · · · xN )dx1 dx2 · · · dxN
=
Pi=1
N R
=
[O (x )Ψ(x x · · · xN )Ψ∗ (x01 x02 · · · x0N )]x0 =xi dx1 dx2 · · · dxN
i
R i=1 1 i R 1 2
= xi dxi O1 (xi ) Ψ(x1 x2 · · · xN )Ψ∗ (x01 x02 · · · x0N )dx1 · · · dxj6=i · · · dxN x0 =xi
i
PN 1 R
0
[O
(x
)γ
(x
,
x
)]
dx
=
0
1
i 1
i x =xi
i
i
i=1 N
i
(3.13)
da cui, per l’indistiguibilità degli elettroni, si arriva alla 3.12.
Anche per gli operatori bielettronici si arriva ad un risultato analogo. Dato che per il problema
che ci interessa gli operatori sono locali, si considera solo la parte diagonale
b2 =
O
N X
N
X
O2 (xi xj , x0i x0j )δ(x0i − xi )δ(x0j − xj ) =
i=1 j>i
N X
N
X
O2 (xi , xj )
i=1 j>i
si ottiene il corrispondente valor medio in termini della matrice densità di ordine 2
Z Z
b
b
hO2 i = tr(b
γN O2 ) =
[O2 (x1 , x2 )γ2 (x01 x02 , x1 , x2 )]x0 =x1 ,x0 =x2 dx1 dx2
1
2
(3.14)
Considerando l’operatore Hamiltoniano e utilizzando le relazioni precedenti, si arriva all’importante
risultato
b = E[γ1 , γ2 ] = E[γ2 ]
E = tr(b
γN H)
=
R
i
RRh 1
0 0
− 21 ∇21 + v(r1 ) γ1 (x01 , x1 ) x0 =x1 dx1 +
γ
(x
x
,
x
,
x
)
1
2
1 2
r12 2
1
x01 =x1 ,x02 =x2
dx1 dx2
(3.15)
che l’energia è esprimibile in termini delle matrici densità di ordine 1 e 2, ma per la 3.9 la sola
matrice densità di ordine 2 è necessaria.
È allora evidente che la funzione d’onda multielettronica contiene più informazione di quanta
ne è necessaria per determinare il valor medio delle osservabili. La ridondanza di informazione
contenuta nella funzione d’onda si spiega considerando il carattere statistico (valor medio)
dell’informazione che si è in grado di estrarre circa le osservabili fisiche.
Si potrebbe quindi pensare di usare la γ2 come variabile base e ottenere l’energia per minimizzazione dell’espressione sopra rispetto alla γ2 , ma c’è una grossa difficoltà nel realizzare
questo a causa del problema della N -rappresentabilità della matrice densità di ordine 2. Recenti sviluppi hanno però in parte superato questo problema ed è stato proposto un metodo
per implementare questa idea [10].
23
3.3
Matrici densità spinless
Facciamo un ulteriore passo avanti integrando (o meglio sommando) le matrici densità dei vari
ordini rispetto alle variabili di spin. Si ottengono in questo modo le cosiddette matrici densità
spinless i cui elementi diagonali corrispondono a delle densità elettroniche.
Possiamo quindi definire la matrici densità spinless di ordine 1 e 2 come
R
γ1 (r01 s1 , r1 s1 )ds1
ρ1 (r01 , r1 ) =
(3.16)
R
R
0
∗
= N · · · Ψ(r1 s1 x2 · · · xN )Ψ (r1 s1 x2 · · · xN )ds1 dx2 · · · dxN
e
R
ρ2 (r01 r02 , r1 r2 ) =
γ2 (r01 s1 r02 s2 , r1 s1 , r2 s2 )ds1 ds2
N (N −1)
2
Ψ(r01 s1 r02 s2 x3 · · · xN )Ψ∗ (r1 s1 r2 s2 x3 · · · xN )ds1 ds2 dx3 · · · dxN
(3.17)
Da cui si possono estrarre gli elementi diagonali che sono rispettivamente
=
R
···
R
ρ(r1 ) = ρ1 (r1 , r1 )
(3.18)
= N
R
···
R
2
|Ψ| ds1 dx2 · · · dxN
la densità elettronica (densità di probabilità di avere un elettrone in r1 , indipendentemente dal
suo stato di spin) e
ρ2 (r1 , r2 ) = ρ2 (r1 r2 , r1 r2 )
(3.19)
=
N (N −1)
2
R
···
R
2
|Ψ| ds1 ds2 dx3 · · · dxN
la densità elettronica di paia (densità di probabilità di avere un elettrone in r1 e un altro in r2 ,
indipendentemente dal loro stato di spin).
Le due matrici densità, ρ1 e ρ2 sono ovviamente legate
Z
2
0
ρ2 (r01 r2 , r1 r2 )dr2
ρ1 (r1 , r1 ) =
N −1
da cui
Z
2
ρ(r1 ) =
ρ2 (r1 , r2 )dr2
(3.20)
N −1
Quando gli operatori mono e bielettronici non dipendono in modo esplicito dalle variabili di
spin si possono ottenere, in analogia alle 3.12 e 3.14, le espressioni dei valori medi in termini
delle matrici densità spinless di ordine 1 e 2.
b non contiene termini di spin, l’espressione dell’energia 3.15
In particolare, se l’operatore H
diventa
E = E[ρ1 (r01 , r1 ), ρ2 (r1 r2 )] = E[ρ2 (r01 r02 , r1 r2 )]
(3.21)
R 1 2
R
RR 1
0
=
− 2 ∇r ρ1 (r , r) r0 =r dr + v(r)ρ(r)dr +
ρ (r , r )dr1 dr2
r12 2 1 2
dove, dato che l’operatore cinetico non è un operatore moltiplicativo (∇2r = ∇r · ∇r0 ) dipende
dalla matrice densità di ordine 1 completa, ρ1 (r01 , r1 ), mentre gli altri operatori sono locali e
agiscono solo sulla parte diagonale di ρ1 e ρ2 .
In questo caso l’energia dipende solo più da funzioni di tre o al massimo sei variabili.
24
3.4
Densità di paia
Come si vede dalla 3.21 la densità di paia spinless, ρ2 (r1 , r2 ), e la corrispondente densità di
paia
Z
Z
N (N − 1)
· · · |Ψ(x1 x2 x3 · · · xN )|2 dx3 , ..., dxN
(3.22)
γ2 (x1 , x2 ) =
2
(e conseguentemente le matrici densità che le generano) giocano un ruolo determinante nella
descrizione della repulsione elettrone-elettrone e quindi della correlazione dei moti elettronici.
La 3.22 definisce la densità di probabilità di trovare una coppia di elettroni con spin s1 e s2
in r1 e r2 simultaneamente, indipendentemente dalla posizione e dallo stato di spin degli altri
N − 2 elettroni.
Per elettroni non interagenti, la densità di paia si riduce al semplice prodotto delle probabilità
individuali
N −1
γ1 (x1 )γ1 (x2 )
(3.23)
γ2 (x1 , x2 ) =
N
il fattore NN−1 tiene conto che del fatto che se uno degli N elettroni è in x1 , la probabilità di
trovare un altro elettrone simultaneamente in x2 si riduce di quel fattore perchè l’elettrone in
x1 non può anche trovarsi allo stesso tempo in x2 . In realtà gli elettroni: (i) sono carichi e
soggetti al potenziale repulsivo Coulombiano e (ii) sono dei fermioni e quindi devono soddisfare il principio di antisimmetria. Vediamo come queste proprietà influenzano la densità di paia.
Se si considera il principio di antisimmetria, ne deriva dalla 3.10 che anche la densità di paia
deve cambiare di segno allo scambio di due particelle
γ2 (x1 , x2 ) = −γ2 (x2 , x1 )
Nel caso in cui gli elettroni hanno lo stesso spin e stessa posizione x1 = x2 si trova che
γ2 (x1 , x1 ) = −γ2 (x1 , x1 )
questo può essere vero solo se γ2 (x1 , x2 ) = 0, cioè, la probabilità di trovare due elettroni con
lo stesso spin nella stessa posizione è nulla.
Questo indica che gli elettroni con stesso spin non si muovono in modo indipendente, ma
si escludono a vicenda. È una diretta conseguenza del principio di antisimmetria (principio
di esclusione si Pauli) e vale anche per particelle fermioniche non cariche. Questo effetto si
chiama anche correlazione di scambio o di Fermi e non si manifesta per elettroni con spin
opposto.
La correlazione di scambio è inclusa nel metodo Hartree-Fock.
Se si considera l’effetto della carica sull’interazione elettronica, questo dipenderà dal termine
1
nell’Hamiltoniano. L’effetto è indipendente dallo spin. Se da questo contributo si esclude
r12
la parte di repulsione classica, quello che rimane è un termine elettrostatico ”quantistico” che
viene indicato come correlazione Coulombiana o di Coulomb. Questo contributo è assente
nel metodo Hartree-Fock.
Sulla base di quanto detto, è conveniente esprimere l’influenza della correlazione di Fermi e di
Coulomb sulla densità di paia separandola in due parti: (i) il prodotto delle densità indipendenti
e (ii) il resto che contiene gli effetti di correlazione e include il termine di normalizzazione
γ2 (x1 , x2 ) = γ(x1 )γ(x2 ) [1 + f (x1 , x2 )]
25
(3.24)
dove f (x1 , x2 ) contiene le informazioni sulla correlazione ed è chiamato fattore o funzione di
correlazione di paia.
Se gli elettroni non sono correlati, allora f (x1 , x2 ) = 0 e la densità di paia assume la forma
3.23. In questo caso però la γ2 (x1 , x2 ) non normalizza al numero corretto di coppie (N ”
invece di N (N − 1)), ma include il contributo spurio di auto-interazione.
È possibile definire un’altra quantità interessante, la probabilità condizionata
g(x2 , x1 ) =
γ2 (x1 , x2 )
γ1 (x1 )
(3.25)
questa rappresenta la probabilità di trovare un elettrone in posizione x2 quando ce n’è già uno
in posizione x1 . L’integrale di g(x2 , x1 ) vale
Z
g(x2 , x1 )dx2 = N − 1
(3.26)
dato che contiene informazioni su tutti gli elettroni eccetto quello di riferimento in x1 . Si può
scrivere anche in termini di matrici densità spinless:
g(x2 , x1 ) =
3.5
ρ2 (r1 , r2 )
ρ1 (r1 )
(3.27)
Buca di scambio-correlazione
La differenza tra la probabilità condizionata g(x2 , x1 ) e quella non condizionata, γ(x2 ), di
trovare un elettrone in x2
hXC (x1 , x2 ) =
γ2 (x1 , x2 )
− γ1 (x2 ) = γ1 (x2 )f (x1 , x2 )
γ1 (x1 )
(3.28)
descrive la deviazione della g(x2 , x1 ) da γ1 (x2 ) e include gli effetti di correlazione, di scambio
e di Coulomb, e la correzione di auto-interazione.
Questa grandezza è la cosiddetta buca di scambio e correlazione, che gode di alcune interessanti proprietà
• solitamente ha segno negativo, specialmente nelle vicinanze dell’elettrone di riferimento;
• integrando l’equazione 3.28 si ottiene
Z
hXC (x1 , x2 )dx2 = −1
cioè, la buca di scambio e correlazione contiene esattamente la carica di un elettrone.
Questo deriva dal fatto che g(x2 , x1 ) integrata dà N − 1 e che l’integrale della densità
elettronica è N .
26
• l’interpretazione permette di capire come gli effetti di scambio e correlazione influenzano
la distribuzione elettronica. Cioè, si può immaginare che l’elettrone possieda una buca
di potenziale attorno a se stesso, tale che la probabilità di trovare un altro elettrone nelle
sue vicinanze diminuisce.
Dato che la buca è solitamente negativa mentre la densità elettronica è positiva, ne
consegue che, ad una certa distanza dall’elettrone, l’interazione elettrostatica tra le due
sia attrattiva e quindi fornisca un contributo stabilizzante.
Consideriamo nuovamente il contributo di repulsione elettronica espresso in termini di densità
di paia (tralasciando la dipendenza dallo spin)
Z Z
N X
N
X
1
ρ2 (r1 , r2 )
1
hVbee i = hΨ|
|Ψi =
dr1 dr2
r
2
r
12
12
i=1 j>i
questo implica che l’interazione tra due elettroni dipende inversamente dalla loro distanza
pesata per la probabilità che i due elettroni si trovino a quella distanza.
Esprimendo la ρ2 (r1 , r2 ) come
ρ2 (r1 , r2 ) = ρ(r1 )ρ(r2 ) + ρ(r1 )hXC (r1 , r2 )
possiamo dividere il contributo di repulsione elettronica in due parti dal chiaro significato fisico
Z Z
Z Z
1
ρ(r
)ρ(r
)
1
ρ(r1 )hXC (r1 , r2 )
1
2
hVbee i =
dr1 dr2 +
dr1 dr2
(3.29)
2
r12
2
r12
• Il primo termine è J[ρ] l’energia di interazione classica tra due distribuzioni di carica
inclusa se stessa, cioè include anche il contributo spurio di auto-interazione. Si noti che
nel caso di un sistema con un solo elettrone, questo significa che J[ρ] 6= 0, quando
invece non esiste nessuna interazione elettrone-elettrone.
• il secondo termine è l’interazione tra la densità elettronica e la densità di carica della
buca di XC. Questo termine include quindi la correzione dell’auto-interazione oltre ai
contributi quantistici di correlazione
Data la 3.15 e nota la matrice densità di ordine 1, se si conoscesse in modo esatto la forma
della buca di scambio e correlazione sarebbe possibile calcolare l’energia esatta di un sistema
multielettronico.
È quindi interessante capire meglio quali sono le caratteristiche di hXC (x1 , x2 ).
La buca di XC può essere formalmente separata in
hXC (r1 , r2 ) = hsX1 =s2 (r1 , r2 ) + hsC1 ,s2 (r1 , r2 )
(3.30)
• hsX1 =s2 (x1 , x2 ) rappresenta la buca di Fermi che definisce la densità di probabilità di
esclusione di due elettroni per effetto del principio di Pauli (antisimmetria, scambio) e
si applica ad elettroni con lo stesso spin.
• hsC1 ,s2 (x1 , x2 ) è la buca di Coulomb per elettroni di spin opposto e deriva da effetti
elettrostatici (solitamente indicati con il termine correlazione).
Solo la buca di XC completa ha significato fisico.
27
Quindi, la 3.29 diventa
Z Z
Z Z
Z Z
ρ(r
)ρ(r
)
1
ρ(r
)h
(r
,
r
)
1
ρ(r1 )hC (r1 , r2 )
1
1
2
1
X
1
2
dr1 dr2 +
dr1 dr2 +
dr1 dr2
hVbee i =
2
r12
2
r12
2
r12
(3.31)
3.5.1
La buca di Fermi
• La buca di Fermi è quella che dà il contributo maggiore alla hXC (x1 , x2 );
• L’integrale della buca di Fermi su tutto lo spazio delle coordinate è pari a -1
Z
hsX1 =s2 (r1 , r2 )dr2 = −1
come nel caso della buca completa hXC .
Questo deriva dal fatto che la probabilità condizionata per elettroni di spin s integrata
dà Ns − 1 invece di Ns perchè c’è già un elettrone con lo stesso spin s in r1 .
• Questo implica che la buca di Fermi si comporta come se stesse rimuovendo una carica
intera e, in questo modo, elimina il problema dell’auto-interazione.
• Per il principio di eclusione di Pauli sappiamo che due elettroni con lo stesso spin s
non possono occupare la stessa posizione nello spazio, questo fa sı̀ che la buca di Fermi
soddisfi la relazione
lim hsX1 =s2 (r1 , r2 ) = −ρ(r1 )
r2 →r1
che garantisce la cancellazione del contributo spurio di auto-interazione:
Z Z
Z Z
ρ(r1 )hX (r1 , r2 )
ρ(r1 )ρ(r2 )
dr1 dr2 +
dr1 dr2 = 0
lim
r2 →r1
r12
r12
Questa relazione definisce anche la profondità della buca, che ovviamente è nulla quando
gli elettroni hanno spin opposto
hsX1 6=s2 (r1 , r2 ) = 0
• La buca di Fermi è sempre negativa
hsX1 =s2 (r1 , r2 ) < 0
• Modificando la 3.24 per il caso della buca di Fermi, si ha
hsX1 =s2 (r1 , r2 ) = ρ(r2 )fX (r1 , r2 )
la forma della buca dipende quindi da fX (r1 , r2 ) (fattore di correlazione di Fermi), ma
anche dalla densità elettronica in r2 . Ne consegue che la buca non ha simmetria sferica,
ma tende ad essere solitamente più larga attorno all’elettrone sonda.
28
3.5.2
La buca di Coulomb
• La buca di Coulomb é immediatamente definibile come differenza tra la buca di XC
totale e quella di Fermi
1 6=s2
hsC1 6=s2 (r1 , r2 ) = hsXC
(r1 , r2 ) − hsX1 =s2 (r1 , r2 )
• Dalle relazioni di normalizzazione di hXC e di hX consegue che la buca di Coulomb
integrata su tutto lo spazio è nulla
Z
hsC1 6=s2 (r1 , r2 )dr2 = 0
• La buca di Coulomb sarà negativa e più profonda intorno alla posizione dell’elettrone di
riferimento dato che si origina dall’interazione repulsiva elettrostatica r112 .
Dato che il suo valore integrato è nullo deve essere anche positiva da qualche parte
(lontano dall’elettrone di riferimento).
• Dato che non ci sono restrizioni sulla posizione di elettroni con spin opposto quando
r2 → r1 , la hsC1 6=s2 (r1 , r1 ) non assume valori ben definiti, ma esistono delle condizioni di
cuspide simili a quelle viste per la densità elettronica. Queste condizioni non sussistono
quando gli elettroni hanno spin parallelo dato che questi non possono trovarsi nella stessa
posizione
3.5.3
Esempi
Per capire meglio il significato fisico e la forma della buca di scambio-correlazione e delle singole buche, vediamo due esempi: il primo riguarda un sistema molto semplice, la molecola di
idrogeno H2 , il secondo é relativo al silicio cristallino.
Figure 3.1: Buca di Fermi e di Coulomb e buca totale di XC per la molecola di H2 a diverse
distanze H-H. [11] In tutti i grafici l’elettrone di riferimento è posto alla sinistra del nucleo di
destra. Le posizioni dei nuclei sono indicati sugli assi con dei cerchi neri.
Molecola di idrogeno
Le buche di Fermi e di Coulomb e quella totale della molecola di idrogeno, nel suo stato
fondamentale, sono rappresentate nella figura 3.1 [11].
Consideriamo prima la buca di Fermi. Lo stato fondamentale di H2 è caratterizzato da una
configurazione a spin appiati (↑↓) e il ruolo della buca di scambio è solo quello di cancellare il
termine di auto-interazione. Per cui per l’elettrone α (o quello β), la buca corrispondente è
uguale alla densità ρα = 21 ρ, cioè a metà del modulo quadro dell’orbitale molecolare σg .
È quindi:
• delocalizzata sull’intera molecola
• nelle vicinanze dei nuclei rappresenta una rimozione di carica pari a mezzo elettrone
29
• in questo caso, è indipendente dalla posizione dell’elettrone di riferimento
Anche nel caso rHH → ∞ la buca continua a escludere solo mezzo elettrone quando invece
dovrebbe rimuoverne uno, come succede nel caso della buca XC completa (si veda figura 3.1
in basso a destra). L’interazione dell’elettrone di riferimento con il nucleo è quindi in parte
schermata e la sua densità tenderà ad essere più diffusa. Questo è quello che succede con il
metodo HF dove esiste solo la buca di scambio. L’effetto di avere una densità troppo diffusa
causa una sottostima dell’interazione elettrone-nucleo, valori troppo bassi dell’energia cinetica
e della repulsione elettronica, determinando in questo modo una curva di dissociazione non
corretta.
Nel caso della buca di Coulomb, si osserva la creazione di una buca attorno all’elettrone di riferimento mentre si ha un addensamento di densità dalla parte opposta. La buca è delocalizzata.
All’aumentare della distanza H-H, la buca non rimane invariata, ma l’effetto appena descritto
diventa più pronunciato. Al limite, viene rimosso mezzo elettrone nelle vicinanze dell’elettrone
di riferimento e creata una densità di carica di metà elettrone sull’altro nucleo. In questo caso
la buca di Coulomb dipende dalla posizione dell’elettrone di riferimento a differenza della buca
di Fermi che è delocalizzata. In particolare, la buca deve invertirsi quando l’elettrone si sposta
da destra a sinistra e si trova appena dopo il centro del legame.
La buca di XC totale è invece localizzata nelle vicinanze dell’elettrone di riferimento. A grandi
distanze, si ha una parziale cancellazione della buca di Fermi e di quella di Coulomb attorno
al nucleo di sinistra, con l’effetto netto di localizzare l’intera buca attorno all’elettrone di
riferimento e rimuovere esattamente un elettrone, come dovrebbe essere per avere il limite di
dissociazione corretto. La buca completa ovviamente dipende dalla posizione dell’elettrone di
riferimento. È importante notare che solo la combinazione della buca di Fermi con quella di
Coulomb fa emergere la forma corretta della buca di scambio e correlazione.
Cristallo di silicio
Nelle figure 3.2 e 3.3 [12] sono riportati per il cristallo di silicio, invece della buca di scambio e
quella di correlazione, i corrispondenti fattori di correlazione di scambio e di Coulomb valutati
rispettivamente nell’intorno di un elettrone di riferimento posto al centro del legame Si-Si (leg)
e nel sito tetraedrico interstiziale (sti).
Dall’analisi di questi punti si può notare che fX tende ad essere più anisotropo rispetto al
Figure 3.2: Cristallo di silicio: (a) fattore di correlazione di scambio e (b) fattore di correlazione
di Coulomb nel piano (110) che passa attraverso gli atomi con l’elettrone di riferimento posto al
centro del legame. Gli atomi e i legami nel piano (110) sono rappresentati in modo schematico.
Figure 3.3: Cristallo di silicio: (a) fattore di correlazione di scambio e (b) fattore di correlazione
di Coulomb nel piano (110) che passa attraverso gli atomi con l’elettrone di riferimento posto
nel sito tetraedrico interstiziale. Gli atomi e i legami nel piano (110) sono rappresentati in
modo schematico.
30
fattore di correlazione di Coulomb. Dal confronto delle figure si osserva che nel sito interstiziale la forma di fC è più allargata e profonda rispetto al centro del legame. Questo è un
aspetto generale per cui fC tende ad essere più allargato e profondo dove la densità elettronica
è minore (ρleg > 30 · ρsti ).
L’idea di buca di scambio e correlazione oltre a chiarire gli effetti di repulsione elettroneelettrone e il concetto di correlazione elettronica riveste un ruolo molto importante nella teoria
del funzionale della densità sia per definire il significato fisico del funzionale di scambio e correlazione (che definiremo nel prossimo capitolo) che come modello per la sua costruzione.
31
Chapter 4
Approccio di Kohn-Sham
Il teorema fondamentale di HK stabilisce che è possibile calcolare le proprietà dello stato
fondamentale conoscendo ρ0 , senza la necessità di conoscere la funzione d’onda, ma non
fornisce alcuna indicazione su come questo si possa realizzare. La via per determinare ρ0 ,
e quindi E[ρ0 ] è stata trovata da Kohn e Sham (KS) nel 1965 [13]. Tutti i metodi DFT
attualmente in uso si basano sull’approccio KS.
4.1
Sistema di elettroni non interagenti
KS considerano un sistema di riferimento ausiliario, indicato con il suffisso s, costituito da N
elettroni (fermioni) non interagenti. In questo caso, l’hamiltoniano ha la forma
b s = Tbs + Vbs =
H
X
i
1
[− ∇2i + vs (ri )]
2
In accordo con i teoremi di HK, esiste quindi un funzionale
Z
Es [ρ] = Ts [ρ] + vs [ρ, r]ρ(r)dr
per il quale l’equazione di Eulero-Lagrange δE[ρ] = 0 permette di ottenere la densità eletb s . In questo caso, Tbs denota
tronica esatta dello stato fondamentale ρs (r) corrispondente a H
il funzionale universale dell’energia cinetica per un sistema di elettroni non interagenti.
Lo stesso sistema di elettroni non interagenti, nella meccanica quantistica tradizionale corrisponde al cosiddetto metodo di Hartree per il quale l’autofunzione dell’Hamiltoniano sopra
è il semplice prodotto degli spin-orbitali monoelettronici
ϑi (xi ) = θi (ri )σ(si )
detto prodotto di Hartree
HP
Ψ
=
N
Y
ϑi (x)
i
In realtà, il principio di antisimmetria impone che la funzione d’onda corrispondente sia il
determinante di Slater.
32
Ciò significa che la funzione d’onda Ψs,0 per lo stato fondamentale del sistema di riferimento
è il prodotto antisimmetrizzato degli spin-orbitali monoelettronici a più bassa energia ϑi ,
b
Φ=A
N
Y
ϑi (xi )
i
b è l’operatore di antisimmetrizzazione
dove A
"
#
N!
X
X
X
1
1
b= √
(−1)p Pb = √
Ib −
Pbij +
A
Pbijk − ...
N ! p=0
N!
ij
ijk
L’operatore Ib è l’identità, mentre Pbij genera tutte le possibili permutazioni delle coordinate di
due elettroni, Pbijk tutte le permutazioni delle coordinate di tre elettroni, ecc.
Gli spin-orbitali sono quindi ottenuti dalla risoluzione di un set di equazioni monoelettroniche
del tipo
1 2
− ∇i + vs (ri ) ϑi (x) = εi ϑi (x)
2
b
hi ϑi = i ϑi
dove i sono le energie degli spin-orbitali.
In questo caso, se lo stato fondamentale non è degenere, la densità elettronica ρs (r) corrispondente è
N X
X
|ϑi (r, σ)|2
(4.1)
ρs (r) =
i=1
σ
Si noti che quando lo stato fondamentale è closed shell, due elettroni a spin opposto sono
descritti dalla stessa funzione spaziale, come nel metodo Restricted-HF, e la sommatoria sopra
si riduce a N/2.
I due approcci appena descritti sono del tutto equivalenti e devono portare allo stesso risultato.
Inoltre, mostrano che, come ci si aspetta dalla discussione del capitolo precedente, esiste una
connessione tra le due metodologie stabilita dalla 4.1.
All’interno di questo quadro, Kohn-Sham assumono che il sistema di N elettroni non interagenti, sottoposto al potenziale esterno vs (x) sia tale da generare la densità elettronica del
sistema di elettroni interagenti
ρs (r) = ρ0 (r)
Schematicamente questa assunzione si può rappresentare come:
Vext (r) ⇐HK ⇐ ρ0 (r) ⇐KS ⇒ ρs (r) = ρ0 (r) ⇒HKs ⇒ Vs (r)
⇓
⇑
⇑
⇓
Ψi
=⇒
Ψ0
ϑi=1,N (x)
⇐=
ϑi (x)
(4.2)
dove la notazione HKs indica che il teorema di HK si applica al sistema di particelle non intergenti e la freccia con KS rappresenta la connessione tra il sistema multielettronico e quello
di elettroni indipendenti.
33
Assumendo che esista un potenziale vs (r) che genera la densità ρ0 (r), dal primo teorema di HK
ne consegue che anche il potenziale esterno vs (r) è univocamente determinato. Formalmente,
l’univocità del potenziale rimane una questione di v-rappresentabilità che in questo caso viene
indicata come v-non interagente-rappresentabilità. Anche se non esiste una dimostrazione
rigorosa, si assume che ρ0 (r) sia v-non interagente-rappresentabile.
La conseguenza della 4.2 è che
ϑi (r) = ϑi [ρ; r]
(4.3)
cioè gli orbitali sono funzionali della densità elettronica ρ(r), e che il funzionale dell’energia
cinetica di un sistema di elettroni non interagenti si può scrivere come
N
N
1 XX
1 XX
hϑi (x)|∇2 |ϑi (x)i =
Ts [ρ(r)] = −
2 i s
2 i s
Z
|∇ϑi (x)|2 dr
(4.4)
che non è più un funzionale esplicito della densità elettronica, come quello visto nel modello
di Thomas-Fermi, ma è un funzionale implicito di ρ(r) attraverso gli spin-orbitali.
4.2
Funzionale di scambio e correlazione ed equazioni
di Kohn-Sham
Il passaggio successivo fatto da KS è che l’equazione originale di Hohenberg-Kohn:
Z
E0 = Ev [ρ0 ] = ρ0 (r)v(r)dr + T [ρ0 ] + Vee [ρ0 ]
(4.5)
può essere riformulata come segue (per semplicità si omette l’indice 0, ρ0 ≡ ρ). Sulla base di
quanto visto sopra, il contributo cinetico si può scrivere come
T [ρ] ≡ ∆T [ρ] − Ts [ρ]
dove ∆T è la differenza fra l’energia cinetica media dello stato fondamentale del sistema reale
e del sistema di riferimento costituito da elettroni non interagenti (che generano la stessa
densità elettronica del sistema reale).
Come abbiamo visto, nel termine di interazione elettrone-elettrone è possibile esplicitare il
contributo di energia di repulsione elettrostatica classica fra due elettroni descritti dalla distribuzione di carica ρ:
Z Z
1
ρ(r1 )ρ(r2 )
dr1 dr2 + Encl [ρ]
Vee [ρ] =
2
r12
dove il funzionale Encl [ρ] contiene, a questo punto, tutti i contributi non classici legati alla
correlazione elettronica di Fermi e di Coulomb.
L’equazione 4.5 diventa:
Z
Z Z
1
ρ(r1 )ρ(r2 )
Ev [ρ] = ρ(r)v(r)dr + Ts [ρ] +
dr1 dr2 + ∆T [ρ] + ∆Encl [ρ]
(4.6)
2
r12
34
I funzionali ∆T [ρ] e ∆Encl [ρ] sono incogniti. Dato che, nota la densità elettronica, i primi tre
addendi si calcolano facilmente. Kohn e Sham raggruppano quindi tutto ciò che non è noto
esplicitamente e definiscono il cosiddetto funzionale di correlazione e scambio, Exc [ρ]:
Exc [ρ] ≡ ∆T [ρ] + ∆Encl [ρ]
(4.7)
L’energia di scambio e correlazione Exc raggruppa di conseguenza tutti i contributi non classici
si interazione elettrone-elettrone più quelli cinetici. Cioè contiene quattro componenti:
• Energia di correlazione cinetica ∆T
• Energia di scambio (originata dal principio di antisimmetria)
• Energia di correlazione coulombiana
• Correzione di auto-interazione (SIC, Self Interaction Correction)
La SIC deriva dal fatto che nell’espressione che fornisce la repulsione coulombiana, ogni elettrone contribuisce alla densità elettronica con cui interagisce. Nella espressione Hartree-Fock
questo termine viene esattamente compensato da un termine spurio di scambio. Nel funzionale di XC esatto, questo effetto è perfettamente compensato. Come vedremo meglio nel
seguito, quando invece il contributo di scambio è descritto con un funzionale della densità
approssimato, questo non avviene.
In questo modo, l’energia totale del sistema N-elettronico può essere espressa come
Z Z
Z
ρ(r1 )ρ(r2 )
1
dr1 dr2 + Exc [ρ]
(4.8)
E0 = Ev [ρ] = ρ(r)v(r)dr + Ts [ρ] +
2
r12
I primi tre addendi si calcolano facilmente, nota la densità elettronica, e danno il contributo
principale all’energia. Il quarto addendo, Exc [ρ] fornisce un contributo relativamente piccolo,
che però deve essere valutato accuratamente e gioca un ruolo fondamentale nell’approccio di
KS.
Tutta la complessità del trattare il sistema multi-corpi viene quindi trasferita nel funzionale
di XC che rimane incognito. Occorre comunque notare che l’approccio di Kohn-Sham è
formalmente esatto e che se la forma del funzionale Exc [ρ] fosse nota si potrebbe ottenere
l’energia dello stato fondamentale attraverso la ρ(r). La determinazione del miglior funzionale
di XC rappresenta uno degli aspetti centrali della teoria del funzionale della densità nella
formulazione di KS. I diversi metodi DFT di uso comune nei calcoli quantistici di molecole e
solidi sono caratterizzati appunto dall’uso di funzionali approssimati. Lo stato dell’arte nella
ricerca del funzionale di XC esatto e le diverse proposte che si trovano in letteratura verranno
discusse più in dettaglio nel prossimo capitolo.
Prima, occorre trovare una via per conoscere la densità elettronica dello stato fondamentale.
Ricordiamo che il sistema di riferimento di particelle non interagenti ha la stessa densità elettronica della molecola nello stato fondamentale: ρs = ρ0 . La densità di probabilità elettronica,
quando la funzione d’onda sia un determinante di Slater costruito a partire dagli orbitali a più
bassa energia, è data da:
nocc
X
2
ρ = ρs =
|ϑKS
(4.9)
i |
i=1
35
Nota ρ, è possibile calcolare il valore dei primi tre contributi ad E0 .
R
PM
P
2 KS
< ϑKS
Ev [ρ] = − 21 nocc
i (ri )|∇i |ϑi (ri ) > −
A ZA
i
R R ρ(ri )ρ(rj )
dri drj + Exc [ρ]
+ 12
rij
ρ(ri )
dri
riA
All’energia elettronica viene poi aggiunto il termine della repulsione nucleare (costante nella
approssimazione di Born-Oppenheimer). Sulla base di quando visto, a parte Exc [ρ], tutti i
KS
termini sono funzionali impliciti di ρ perchè ϑKS
i (r) = ϑi [ρ; r].
Ev [ρ] = − 21
PM
Pnocc R |ϑKS
(ri )|2
2 KS
i
< ϑKS
dri
i (ri )|∇i |ϑi (ri ) > −
A ZA
i
riA
KS
2
KS
2
R
R
P
P
|ϑi (ri )| |ϑj (rj )|
nocc
+ 21 nocc
dri drj + Exc [ρ]
i
j
rij
Pnocc
i
La densità elettronica dello stato fondamentale si ottiene basandosi sul teorema variazionale
di Hohenberg-Kohn: data una densità elettronica approssimata ρ0 , il cui integrale su tutto lo
spazio configurazionale sia pari al numero di elettroni
Z
ρ0 (r)dr = N
l’energia ottenuta applicando il funzionale esatto alla densità approssimata è un limite superiore
rispetto all‘energia fornita dalla densità esatta:
E0 [ρ0 ] ≥ E0 [ρ0 ]
In questo caso però, nell’equazione di Eulero-Lagrange, invece di variare ρ, si variano gli orbitali
ϑKS
i :
δE KS [ρ] δϑKS
i [ρ; r]
KS
δρ
δϑi [ρ; r]
δE KS [ρ]
=0 →
δρ
KS
mantenendo il vincolo di ortonormalità degli spin-orbitali (< ϑKS
>= δij ). La ρ(r) si
i |ϑj
ottiene infine dalla relazione 4.9. In questo modo, passando attraverso agli orbitali di KS, la
densità elettronica che corrisponde al minimo della energia del sistema N-elettronico si ricava
risolvendo equazioni formalmente simili alle equazioni di Hartree-Fock:
1
KS KS
[− ∇2i + vef f (ri ))]ϑKS
i (ri ) = i ϑi (ri )
2
(4.10)
KS
KS
b
hKS
= KS
i ϑi
i ϑi
(4.11)
dove b
hKS
è un’operatore monoelettronico che definisce l’Hamiltoniano efficace di KS
i
H
KS
=
N
X
b
hKS
i
i
e il potenziale efficace è dato da:
vef f (ri ) = −
X ZA
A
riA
Z
+
36
ρ(rj )
drj + vxc [ρ, ri )
rij
(4.12)
dove vxc [ρ, r)] è il potenziale di scambio e correlazione che si ricava dalla derivata funzionale
dell’energia di scambio e correlazione Exc [ρ]
vxc (r) ≡
δExc [ρ(r)]
δρ(r)
(4.13)
La procedura per ottenere una derivata funzionale è descritta nell’Appendice 1.6.
In definitiva, KS facendo riferimento al sistema di elettroni non-interagenti per definire Ts
reintroducono gli orbitali e trasformano la singola equazione di Eulero-Lagrange in un set di
N equazioni monoparticellari.
Le equazioni di KS, come quelle di Hartree-Fock, devono essere risolte in modo iterativo
attraverso una procedura di auto-consistenza delle soluzioni (SCF). Occorre però notare che
a differenza delle equazioni di HF quelle di KS includono in modo esplicito la correlazione
elettronica ad un costo di calcolo analogo se non minore dato che il potenziale di XC è locale.
Se il funzionale di scambio e correlazione fosse noto in modo esatto, e di conseguenza il
potenziale, l’energia ottenuta dalla risoluzione delle equazioni di KS sarebbe esatta. Come per
il metodo HF, l’energia totale del sistema non è la somma degli autovalori, ma è
E
KS
=
nocc
X
i
4.3
εKS
i
1
−
2
Z Z
ρ(ri )ρ(rj )
dri drj + Exc [ρ(r)] −
rij
Z
ρ(r)vXC (r)dr
(4.14)
Discussione
Di seguito verrà discusso più in dettaglio il significato fisico degli ingredienti che entrano in
gioco nelle equazioni di Kohn-Sham. È importante notare che la discussione che segue vale
nel caso esatto, cioè quando il funzionale di XC è quello esatto. Per funzionali approssimati
non tutte le proprietà analizzate sono rispettate.
4.3.1
Significato delle autofunzioni di Kohn-Sham
• Gli orbitali Kohn-Sham ϑKS
i (1) sono orbitali del sistema fittizio di riferimento, non hanno
altro significato che quello di fornire la densità elettronica dello stato fondamentale del
sistema reale attraverso la 4.9.
• In pratica si è osservato che gli orbitali occupati di Kohn-Sham sono molto simili agli
orbitali Hartree-Fock, e possono essere usati per gli stessi tipi di analisi delle proprietà
molecolari. Ci si basa sul fatto che sono definiti attraverso un potenziale che è esatto in
principio e che generano la densità elettronica esatta dello stato fondamentale (anche se
non sono legati ad una vera funzione d’onda, ma solo all’espressione del determinante
di Slater).
• Recentemente, sono stati anche impiegati in metodi di calcolo di tipo perturbativo (ad
esempio come nei metodi ”doppi ibridi” discussi nel prossimo capitolo) e multiconfigurazionale.
37
4.3.2
Significato degli autovalori di Kohn-Sham
• A differenza degli autovalori ottenuti dalle equazioni di HF, in questo caso non è valido
il teorema di Koopman Quindi, nessun significato fisico preciso può essere attribuito agli
autovalori di KS.
• L’unico risultato esatto è che il più alto orbitale occupato (il suo autovalore) corrisponde
al potenziale di prima ionizzazione (esatto) della molecola, cambiato di segno.
max = −I
Questo risultato è legato alla proprietà di decadimento della densità elettronica a lungo
raggio. Infatti
√
lim = exp[−2 2I|r|]
r→∞
Ad esempio, nel caso dell’atomo di H il potenziale di ionizzazione esatto è di 0.5 au
mentre i metodi DFT approssimati danno solitamente valori tra 0.23 e 0.28 au.
• Esiste una relazione esatta nota come Teorema di Janak (o Slater-Janak) che ha come
risultato che
dE[ρ]
=
dni
dove ni è il numero di occupazione del corrispondente autovettore (0 ≤ ni ≤ 1) espressi
attraverso gli orbitali naturali.
ρ(r) =
N
XX
σ
ni |ψi (r, σ)|2
i=1
N=
N
X
ni
i=1
Questo deriva dal fatto che
E[ρ]
δE[ρ]
=
δρ
δN
e che il formalismo di KS visto finora può essere generalizzato a numeri di occupazione
frazionari.
Nota: nel caso di una funzione monodeterminantale, ni = 1 per gli orbitali occupati e
ni = 0 per gli orbitali virtuali.
4.3.3
Significato del potenziale di XC
• Il potenziale di XC è definito come:
vXC =
ed è un potenziale locale.
38
δEXC [ρ]
δρ
• Dato che
lim vef f (r) = 0
|r|→∞
e che vne → 0 e vCoul =
R
ρ(r)
dri
rij
→
1
r
deve valere
lim vXC (r) = −
|r|→∞
1
r
questo definisce il comportamento asintotico esatto del potenziale di XC. In realtà, nel
caso di funzionali approssimati:
(i) si può verificare che il potenziale di XC corrispondente non decade come −1/r, ma
in modo esponenziale (quindi più veloce e con un carattere meno attrattivo)
(ii) si può dimostrare che
1
lim vXC (r) = − + I + max
|r|→∞
r
Quindi se il funzionale è esatto la relazione sopra è corretta, se no c’è uno shift costante
legato a I + max .
• Discontinuità della derivata
Esiste una discontinuità nel potenziale vXC quando il numero di elettroni del sistema
passa attraverso un numero intero. I funzionali approssimati hanno un andamento continuo e quindi manifestano un comportamento non corretto.
• Il corretto andamento del potenziale a lungo raggio e il problema della discontinuità
della derivata hanno conseguenze dirette sull’eliminazione dell’auto-interazione tra gli
elettroni
• Le deficienze dei metodi DFT approssimati contenute nel potenziale di XC hanno conseguenze rilevanti per la descrizione di stati eccitati, nel calcolo di proprietà come la
polarizzabilità e l’iperpolarizzabilità, delle energie di eccitazione e nella predizione del
band gap nei solidi.
• Occorre ricordare che il potenziale dovuto allo scambio esatto HF possiede il corretto
andamento asintotico: -1/r. Questo è rilevante nei metodi ibridi (discussi nel prossimo
capitolo) perchè permette di recuperare una frazione del corretto andamento -1/r e
compensare in parte le deficienze elencate in precedenza.
4.3.4
Nota su scambio esatto e funzionale di scambio e correlazione
Kohn-Sham, già nel loro articolo originale del 1965, hanno proposto un’espressione dell’energia
che fa uso dello scambio esatto HF.
Ev [ρ] = Ts [ρ] + Vext [ρ] + J[ρ] + VXHF [ρ] + EC [ρ]
dove il contributo di repulsione elettronica è stato scritto come
Vee [ρ] = J[ρ] + VXHF [ρ] + ∆Vee [ρ]
39
e si definisce il funzionale di correlazione
EC [ρ] = ∆T [ρ] + ∆Vee [ρ]
che contiene la correlazione di Coulomb e gli effetti di correlazione cinetica per il sistema di
elettroni interagenti. In questo modo gli effetti della correlazione di scambio sono inclusi in
modo esatto, ma l’espressione dell’energia diventa più complicata perchè VXHF è un termine
non locale.
I primi tentativi di usare lo scambio esatto non hanno dato però i risultati sperati e solo più
tardi l’uso dello scambio HF è stato riproposto attraverso i metodi cosiddetti ”ibridi” che
discuteremo nel prossimo capitolo.
4.4
Connessione adiabatica
L’hamiltoniano del sistema di riferimento può essere messo in relazione con l’hamiltoniano
reale dalla relazione:
X
b λ = Tb +
H
vλ (ri ) + λVbee
i
Il valore del parametro λ varia da 0 (elettroni non interagenti, sistema di riferimento) a 1
(elettroni interagenti); vλ è il potenziale esterno che rende la densità elettronica del sistema
b λ uguale a quella dello stato fondamentale del sistema reale. λ è un
con hamiltoniano H
parametro di accoppiamento ( coupling strength parameter) che accende progressivamente
l’interazione elettrone-elettrone e ne modula la forza. Si pu dire che λ crea una connessione
tra il sistema di elettroni non-interagenti e quello formato da elettroni interagenti. Questa
connessione adiabatica (adiabatic connection) perchè per qualsiasi 0 ≤ λ ≤ 1 il potenzial
λ
esterno vext
(r) si adatta in modo tale da mantenere la densità elettronica uguale a quella del
sistema di elettroni interagenti.
Quindi i due casi estremi, che corrispondono rispettivamente a:
λ=0
• λ = 0: vef
f = vs
λ=1
• λ = 1: vef
f = vJ + vXC + vext
sono connessi tra loro in modo continuo da sistemi parzialmente interagenti.
Possiamo allora scrivere
Z 1
Eλ=1 − Eλ=0 =
dEλ
(4.15)
0
Z
Eλ=1 =
1
dEλ + Eλ=0
0
Per sfruttare questa relazione dobbiamo conoscere la variazione di E per una variazione
infinitesimale di λ che corrisponde al valore di aspettazione di una variazione infinitesima
dell’hamiltoniano dHλ :
λ
b λ = dVbext
dH
+ dλVbee
Usando la formulazione delle buche si ottiene
Z Z
Z Z
Z
ρ(r1 )ρ(r2 )
1
ρ(r1 )hλXC (r1 , r2 )
1
λ
dr1 dr2 + dλ
dr1 dr2
dEλ = ρ(r)dVext (r)dr + dλ
2
r12
2
r12
40
integrando questa espressione e inserendola nell’eq. 4.15 si arriva a
Z
1
λ=1
λ=0
ρ(r)[Vext
(r)−Vext
(r)]dr+
Eλ=1 −Eλ=0 =
Z Z
2
ρ(r1 )ρ(r2 )
1
dr1 dr2 +
r12
2
1
Z Z Z
0
ρ(r1 )hλXC (r1 , r2 )
dr1 dr2 dλ
r12
(4.16)
Tenendo conto che
Z
Eλ=0 =< Ts > +
λ=0
ρ(r)Vext
(r)]dr
si ottiene che l’energia di un sistema di elettroni interagenti si può scrivere come:
Z
Eλ=1 =< Ts > +
λ=1
λ=0
ρ(r)[Vext
(r)−Vext
(r)]dr+
1
2
Z Z
ρ(r1 )ρ(r2 )
1
dr1 dr2 +
r12
2
Z Z
ρ(r1 )h̄XC (r1 , r2 )
dr1 dr2
r12
(4.17)
in cui è stata definita la buca di scambio e correlazione media
Z 1
h̄XC =
hλXC (r1 , r2 )r12 dλ
0
dove con media si intende l’integrazione rispetto al parametro di accoppiamento dell’interazione
(coupling strength integrated).
Confrontando il risultato sopra con l’eq. 4.8 ne consegue che all’interno della connessione
adiabatica è possibile: (i) giustificare in modo rigoroso l’assunzione di Kohn e Sham e (ii)
definire in modo esatto il funzionale di scambio e correlazione come
Z Z
ρ(r1 )h̄XC (r1 , r2 )
1
dr1 dr2
(4.18)
EXC [ρ] =
2
r12
Dal confronto dell’espressione per l’energia (eq. 4.17) con quella ottenuta dal formalismo delle
matrici densità spinless
Z E=
Z
Z Z
1
1 2
0
dr + v(r)ρ(r)dr +
− ∇r ρ1 (r , r)
ρ2 (r1 , r2 )dr1 dr2
2
r
12
r0 =r
(4.19)
si vede chiaramente che nella 4.17 l’integrazione su λ trasferisce la ∆T = T − Ts nella buca
di scambio e correlazione media h̄XC (r1 , r2 ). Cioè nel passaggio da T a Ts si ha un aumento
della complessità in hXC (r1 , r2 ) che deve essere integrata su λ (h̄XC → hXC .
Occorre notare che le proprietà di h̄XC rimangono le stesse di hXC viste nel capitolo precedente.
Ne consegue che l’energia di scambio e correlazione definita attraverso la connessione adiabatica corrisponde all’interazione attrattiva tra la densità elettronica ρ(r) e la carica negativa
racchiusa in h̄XC .
La connessione adiabatica offre una visione alternativa dell’assunzione di Kohn e Sham e
consente di stabilire un legame diretto tra il funzionale di scambio e correlazione e la buca di
scambio e correlazione media.
Si può fare un ulteriore passo avanti, esprimendo EXC come funzione della media sferica di
h̄XC
Z
Z ∞
1
ρ(r)dr
4πσdσhSA
(4.20)
EXC [ρ] =
XC (r, σ)
2
0
dove si è operato un cambio di variabili: r=r1 eu=—r2 − r1 | e hSA
XC è
Z 2π
Z π
1
hSA
dφu
h̄XC (r, r + u)sinθu dθu
XC (r, u) =
4π 0
0
41
(4.21)
In conclusione, si ottiene che l’energia di scambio e correlazione dipende solo da una media
sferica della buca di XC integrata su λ.
4.4.1
Esempi
Come esempio della dipendenza della buca di scambio e correlazione dal valore del parametro
λ, nella figura 4.1 è riportata la forma della buca di scambio e correlazione (media sferica)
del cristallo di silicio. In questo caso si considera che λ = 0 corrisponda alla buca di scambio, mentre per valori crescenti di λ viene incluso il contributo di correlazione di Coulomb.
Come si vede, la correlazione tende ad allargare la buca e a renderla più profonda. Questo
Figure 4.1: Media sferica della buca di scambio e correlazione del cristallo di silicio nel centro
del legame (a) e nella zona interstiziale (b).
perchè diminuisce la probabilità che i due elettroni si avvicinino. L’effetto è simile sia quando
l’elettrone di riferimento si trova nel centro del legame (Fig. 4.1 (a)) che quando è al di
fuori della linea che connette gli atomi di Si (Fig. 4.1 (b)). In quest’ultimo caso, dato
che hXC = ρ(r2 )fXC (r2 , r2 ), il minimo è leggermente spostato nella direzione di maggiore
variazione della densità elettronica.
42
Chapter 5
Funzionali di scambio e correlazione
Nel capitolo precedente abbiamo visto che il formalismo di KS permette di trattare in modo
esatto i diversi contributi che costituiscono l’energia di un sistema N-elettronico. Di quasi
tutti è nota la forma esplicita, o implicita, in termini di funzionale della densità ρ(r). Tutto
quello che non è esprimibile come funzionale di ρ è stato inglobato nel funzionale di scambio
e correlazione, EXC [ρ] di cui però non è nota la forma matematica. Questo fa sı̀ che l’intera
formulazione di KS e i diversi metodi di calcolo ad essa collegati, si basino sull’espressione
approssimata di EXC [ρ] da cui dipenderà anche la qualità e l’accuratezza del calcolo. Quindi,
a parte i fondamenti della teoria, la maggior parte dell’attività di ricerca sulla DFT riguarda lo
sviluppo di nuovi e più accurati funzionali.
È naturale quindi chiedersi: (i) quale forma abbia il funzionale di XC e (ii) se esiste un modo
sistematico per costruirlo e soprattutto per migliorarne l’accuratezza. A differenza dai metodi
tradizionali che si basano sulla funzione d’onda, dove il principio variazionale definisce un criterio molto forte per stabilire la qualità dell’approssimazione, nel DFT non c’è formalmente
una strategia sistematica di sviluppo.
La strategia di più comune di creazione dei funzionali, fa ricorso, per definirne la forma matematica, all’insieme di conoscenze sulle proprietà che caratterizzano il funzionale stesso, il potenziale e la buca di XC. Tra queste ci sono:
• il comportamento asintotico del potenziale di XC;
• le regole di integrazione delle buche e le loro condizioni di cuspide e limite;
• in sistemi monoelettronici, l’eliminazione dell’autointerazione per il contributo di scambio
e l’annullamento del contributo di correlazione;
• regole di trasformazione delle coordinate, come uno scalamento uniforme: ργ (r) =
γ 3 ρ(γr).
Sulla base di questo, esistono poi due grosse classi di funzionali:
• non-empirici, che vengono definiti sulla base delle sole condizioni citate sopra e i cui
parametri, ridotti ad un numero minimo, non derivano da procedure empiriche.
• semi-empirici, che data una forma funzionale fisicamente sensata che contiene un numero elevato di parametri (anche oltre 30) cerca il miglior EXC [ρ] fittando dati sperimentali o dati calcolati di riferimento (es. CCSD(T)).
43
In generale, i funzionali di XC hanno la forma
Z
Z
EXC [ρ] = eXC [ρ(r)]dr = ρ(r)XC [ρ(r)]dr
(5.1)
dove
• eXC è la densità di energia di XC
• XC è l’energia di XC per particella:
XC
1
=
2
Z Z
h̄XC (r1 , r2 )
dr1 dr2
r12
Nel trattare il funzionale di XC si assume di solito la separabilità tra scambio (X) e correlazione
(C)
EXC [ρ] = EX [ρ] + EC [ρ]
è importante sottolineare che come discusso in precedenza solo la somma dei due contributi
descrive correttamente la buca di XC completa.
I diversi funzionali di XC proposti in letteratura vengono etichettati e denominati solitamente
sulla base delle iniziali degli scienziati che li hanno proposti e se necessario si indica l’anno di
pubblicazione dell’articolo in cui sono stati presentati per la prima volta.
Ad esempio, il funzionale di scambio proposto da A.D. Becke nel 1988 viene denominato B88
per differenziarlo da altri funzionali di scambio proposti dallo stesso autore in anni precedenti
o successivi, come il B86 o il B97. Un altro esempio è il funzionale di correlazione sviluppato
da Lee, W. Yang e R.G. Parr nel 1988 il cui acronimo è quindi LYP. La combinazione dei due
funzionali, che definisce il funzionale di XC completo, diventa B88-LYP o B-LYP o semplicemente BLYP.
Esistono anche funzionali di X e C sviluppati per essere usati insieme (costruzione omogenea)
proposti dalle stesse persone, come ad es. il funzionale di XC costruito da J.P. Perdew, K.
Burke e M. Ernzerhof. In questo caso bisognerebbe usare la sigla PBE-PBE, ma solitamente si
indica semplicemente PBE, assumendo che i funzionali di scambio e correlazione PBE vengono
usati insieme.
5.1
La scala di Giacobbe (Jacob’s Ladder)
John P. Perdew, uno dei maggiori esperti di DFT, ha cercato di identificare dei criteri che
definiscono sia una scala gerarchica dei funzionali di XC che una loro classificazione (PerdewSchmidt 2011, Perdew et al. 2005). La proposta è di classificare i funzionali sulla base degli
ingredienti che li definiscono e di costruire una scala, detta scala di Giacobbe (Jacob’s Ladder)
i cui gradini corrispondono a diverse approssimazioni del funzionale di XC e definiscono anche
un dato livello di accuratezza e di complessitá/costo di calcolo. Il nome scala di Giacobbe
deriva dal passo della Bibbia in cui si narra che Giacobbe sognò una scala che collegava la
Terra con il Paradiso e che gli angeli di Dio salivano e scendevano. In questo paragone,
la scala che classifica i funzionali XC permette di passare dall’approssimazione di Hartree
(elettroni indipendenti, la Terra) alla soluzione esatta (Paradiso) attraverso i diversi gradini.
L’utente può quindi scegliere il livello di accuratezza/complessitá a piacimento, conscio delle
approssimazioni implicite in quel gradino, e salire e scendere tra i due estremi della scala.
44
1o gradino - LDA
Il primo gradino della scala di Giacobbe è rappresentato dall’approssimazione LDA (Local
Density Approximation). Considerando l’eq. 5.1, la forma del funzionale è di tipo:
Z
EG
EXC [ρα , ρβ ] = ρ(r)UXC
[ρα , ρβ ]dr
(5.2)
• è il tipo di funzionali di XC più semplice. Contiene ingredienti solo locali, che cioè
dipendono solo da (r) e non da (r,r’)
• fa riferimento al sistema modello di un gas di elettroni uniforme (Uniform Electron
Gas, UEG)
• è esatto nel limite di un gas di elettroni uniforme. La condizione per un funzionale di
XC di tendere al limite UEG viene imposta anche per funzionali oltre il primo gradino
(es. GGA)
EG
• UXC
si ottiene da calcoli accurati con metodi QMC
Esempi di funzionali LDA sono:
• il funzionale per l’energia cinetica di Thomas-Fermi (TF28)
• il funzionale per la parte di scambio di Dirac-Slater (D30,S51)
• il funzionale di correlazione di Vosko-Wilk-Nusair (VWN80)
Rientrano in questa approssimazione i primi funzionali di XC usati in calcoli ab-initio. Sono
stati applicati con buon successo in problemi di fisica dello stato solido, in particolare allo
studio di metalli. I risultati peggiorano nel caso di atomi e molecole dove la densità elettronica
è più localizzata e varia più velocemente, discostandosi maggiormente dal UEG.
La spiegazione del buon comportamento dei metodi LDA è rintracciabile nella somiglianza tra
la buca di XC LDA mediata sfericamente e la buca esatta.
2o gradino - GGA
Il secondo gradino corrisponde all’approssimazione GGA (Generalized Gradient Approximation). I funzionali che rientrano in questa famiglia sono della forma:
Z
EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ; ∇ρα , ∇ρβ ]dr
(5.3)
cioè includono nella forma funzionale un ingrediente aggiuntivo che è il gradiente della densità
elettronica e per questo vengono anche denominati funzionali corretti per il gradiente (gradient
corrected).
• estendono l’approssimazione LDA includendo l’informazione sulla non-uniformità della
densità elettronica attraverso dei termini che dipendono dal gradiente della densità ∇ρ
• i funzionali GGA sono considerati funzionali semi-locali perchè nonostante l’inclusione
della derivata prima di ρ(r) descrivono come sta variando la densità nell’intorno di r
45
• l’espressione dei funzionali GGA deriva dall’espansione del gradiente (GEA, Generalized
Gradient Expansion) troncata al second’ordine
Z
X σ,σ0
∇ρσ · ∇ρσ0
EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ] +
CXC (ρα , ρβ ) 2/3 2/3 + · · ·
ρσ ρσ0
σ,σ 0
l’uso di questa espressione è stato proposto già da Hohenberg e Kohn nel loro lavoro
fondamentale del 1964. Il problema è che l’espansione tende a divergere e la troncatura
dello sviluppo non consente una descrizione accurata della buca di XC.
• l’ingrediente principale dei funzionali corretti per il gradiente è il gradiente della densità
ridotto (reduced density gradient)
x=
o
s=
|∇ρ|
ρ3/4
x
2(3π 2 )1/3
−4
È adimensionale ( [L[L]
−3 ]4/3 ).
È un indicatore che misura come varia ρ(r) in r, cioè la sua disomogeneità.
|∇ρ|
3
ρ4
|∇ρ|
3
ρ4
1 vicino ai nuclei e lontano dai nuclei ρ ⇐⇒ 0
(5.4)
1
(5.5)
|∇ρ— piccolo (densità varia lentamente)
• La GEA comincia con
Z
LDA
EX [ρ] = ρEX
[ρ][1+µx s2 +...] → fattore di accrescimento (enhancement factor)
(5.6)
Z
Ec [ρ] =
ρ EcLDA [ρ] + βc t2 + .... dν
dove
t2 = cc
|∇l |
ρ1/6
(5.7)
(5.8)
• Migliora decisamente rispetto a LDA per molecole e atomi, non cosı̀ marcato per i
solidi.
3o gradino - meta-GGA (mGGA o MGGA)
I funzionali che rientrano in questa famiglia sono della forma:
Z
EXC [ρα , ρβ ] = ρ(r)XC [ρα , ρβ ; ∇ρα , ∇ρβ ; ∇2 ρα , ∇2 ρβ ; τα , τβ ]dr
46
(5.9)
È un ulteriore generalizzazione che include o ∇2 ρ(r), il Laplaciano della denistá elettronica,
che compare nell’espressione troncata al 4o ordine della GEA, oppure la densità di energia
cinetica τ0
N
1X
|∇ϑi (r)|2
(5.10)
τ0 (r) =
2 i=1
• L’uso della densitá di energia cinetica deriva dall’espansione di T aylor della buca XC
nell’intorno di |r−r0 | = 0). Contiene informazioni simili a ∇2 ρ ma permette di soddisfare
più vincoli nella forma matematica del funzionale, rendendo questa famiglia di funzionali
piú versatili.
• I funzionali mGGA sono ancora semilocali perch includono solo ingredienti che dipendono
da informazioni in r. I risultati migliorano leggermente rispetto ai funzionali GGA.
• Sono i funzionali di più recente formalizzazione.
Perdew considera che i funzionali non-empirici corrispondenti ai primi tre gradini della
scala di Giacobbe siano stati formalizzati rispettivamente in: Slater+PW1992 (LDA);
PBE-PBE (GGA); TPSS-TPSS (mGGA).
Alcuni dei funzionali proposti d D. Truhlar e noti come Minnesota appartengono a questa
famiglia. In particolare quelli denominati con la sigla L, ad esempio: M06-L e M11-L
4o gradino - hyper-GGA
In questo caso la forma del funzionale é:
HGGA
EXC
[ρα , ρβ ]
Z
=
ρ(r)HGGA
(ρ, ∇ρ, τ, x )
XC
(5.11)
• Includono contributi non locali (x,σ ) che sono funzione degli orbitali occupati θi
• Il contributo non locale è formalmente analogo allo scambio esatto Hartree-Fock (x,σ ):
x,σ
1
=
2
Z
ρ(r1 )hXC
σ (r1 , r2 )
dr2
r12
(5.12)
• i cosiddetti metodi ibridi HF/DFT tradizionali, che verranno trattati più in dettaglio nel
seguito, sono considerati dei funzionali hyper-GGA semi-empirici in quanto soddisfano
pochissimi vincoli.
• non c’è ancora nessun funzionale considerato pienamente HGGA
5o gradino
• In questo gradino, vengono usati come ingredienti dei funzionali sia gli orbitali occupati
θiocc che quelli non occupati θivirt
• I funzionali non hanno una denominazione specifica, va vengono definiti come appartenenti al 5o gradino della Scala di Giacobbe.
47
• I metodi che appartengono a questa famiglia molto costosi e hanno una complessità
analoga ai metodi tradizionali basati sulla funzione d’onda.
• Recentemente sono stati proposti i metodi cosiddetti doppi ibridi che includono oltre al
contributo di scambio esatto HF che dipende dagli orbitali occupati, anche un termine
formalmente analogo all’energia di correlazione MP2 che dipende anche dagli orbitali
virtuali. Questi metodi verranno discussi più nel dettaglio in seguito.
• Appartengono a questo gradino i metodi derivati dalla Random Phase Approximation
(RPA) che includono la non solo la dipendenza dalla densità elettronica ma anche dalla
risposta della densitè ad una perturbazione che è un termine non-locale
• include i contributi di correlazione elettronica responsabili degli effetti dispersivi
Queste cinque tipologie di funzionali definiscono la Scala di Giacobbe (Jacob’s Ladder). È
evidente che la complessità aumenta salendo i diversi gradini della scala, ma ci si aspetta che
corrispondentemente anche l’accuratezza migliori. Questo però non è scontato e deve essere
dimostrato in una fase di validazione del funzionale (vedere il capitolo sulla “Valutazione dei
metodi DFT”).
All’interno di questa scala gerarchica Perdew ha costruito vari funzionali LDA,GGA e mGGA
che sono considerati non empirici sia per X che per C (costruzione omogenea).
LDA → S − P W 92(LDA)
GGA → P W 91 superato da P BE
mGGA → P KZB superato da T P SS
Il miglioramento riguarda la proprietà del funzionale di soddisfare il maggior numero di vincoli
per EXC , vXC , hXC e proprietà di scala ργ(ν) = γ 3 ρ(γ ν ). Inoltre, si riducono tutti al limite
LDA per un gas di elettroni uniformi e sono sviluppati tipo scatole cinesi.
L’accuratezza è ovviamente P W LDA < P BE < T P SS
NB: La parte di appunti che segue è in revisione
5.2
5.2.1
Funzionali di scambio e correlazione ibridi
Funzionali ibridi globali
Questa tipologia di funzionali include un
di scambio esatto HF e si basa formalmente
R 1contributo
1
sulla connessione adiabatica: EXC = 0 EXC dλ
L’uso dello scambio HF era già stato proposto da HK nel loro lavoro fondamentale, ma non
aveva avuto molto risalto a causa di risultati non molto accurati. I funzionali ibridi sono stati
riportati in auge da A.D. Becke all’inizio degli anni ‘90.
λ=0
exact
λ=1 ∼
LDA
• |α|α) EXC
= EXC
; EXC
= EX
HH
exact
LDA
+ EX
)
• Half-Half: EXC
= 21 (EXC
48
λ → andamento lineare
• ββ )
exact
GGA
EXC = a0 EX
+ (1 − a0 )E LDA + ax ∆EX
+ ECLDA + ac ∆c ECGGA
∆EX(C) →
correzione gradiente
(5.15)
a0 , ax , ac →
(5.17)
B3PW91 →
(5.13)
parametri
xGGA = B88 ; C LDA = P W 92 ; C GGA = P W 91
(5.19)
• B3LYP →
ex
B88
a0 EX
+ (1 − a0 ))E LDA ax ∆EX
+ (1 − ac )ECV W N S + ac ECLY P
(5.20)
+ ∆GGA
dove LY P non ha la forma LDA
C
C
• ACM1
exact
DF T
EXC = a0 EX
+ (1 − a0 )EX
+ ECDF T
(5.21)
• ACM∅ → a0 = 0.25(P erdew)→PBE∅ ≡ P BEH ≡ P BE1P BE
facilmente ottimizzabile fittando il parametro ax a dati sperimentali.
5.2.2
Funzionali ibridi di tipo Range-Separated (RSH)
Detti anche Screned Coulomb (SC), Coulomb Attenuated Methods (CAM), Long-range Corrected functionals (LC)
Sono basati su un’idea di A. Savin (1996) di partizionare l’operatore di Coulomb in diverse
regioni sulla base della distanza interlelettronica attraverso un’opportuna funzione. Per due
regioni si ha:
f (r12 ) 1 − f (r12 )
1
=
+
(5.22)
r12
r12
r12
dove r12 (decade lentamente).
Per la separazione nelle diverse regioni, la funzione piú comunemente utilizzata é la error
function
1
1 − erf (ωr12 ) erf (ωr12 )
1
=
+
→
(5.23)
r12
r12
r12
r12
Short range → decade velocemente ; Long range → decade piú lentamente
SR
LR
⇒ EXC = EXC
(ω) + EXC
(ω)
49
(5.24)
exact,SR
exact,LR
ωDF T h
DF T
PBEh e HSE ⇒ EXC
= a[EX
(ω) + EX
(ω)] + (1 − a)EX
+ ECDF T
È la base anche per un trattamento diversificato dei contributi SR e LR
HF,SR
P BE,SR
P BE,LR
HSE
EXC
= aEX
(ω) + (1 − a)EX
(ω) + EX
(ω) + ECP BE
HSE03
HSE06
P BEh(P BE0)
P BE(GGA)
→
→
→
→
√
ωHF = (0.15/ 2); ωP BE = 0.15 · 21/3
ωHF = ωP BE → ω = 0.11bohr − 1
ω=0
ω=∞
(5.25)
(5.26)
(5.27)
(5.28)
(5.29)
I diversi metodi RSH si differenziano per come viene trattata la parte di scambio esatto. Nei
metodi detti Screened Coulomb (SC) il contributo di scambio HF è incluso solo a corto raggio,
mentre nei funzionali denominati Long-range Corrected (LC) si include solo il contributo a
lungo raggio.
Questo tipo di partizione è stato anche usato per la parte di correlazione per combinare
DFT e WFT. Il contributo di correlazione DFT viene mantenuto a corto-raggio mentre la
correlazione WFT viene introdotta a lungo-raggio. Questo stato proposto per combinazioni
tipo: DFT+PT2; DFT+CI; DFT+MCSCF; DFT+CCSD.
5.3
5.3.1
Metodi doppio-ibridi (Double-Hybrids)
Metodo B2-PLYP (S. Grimme JCP 124 (2006)034108)
HF
B88
e ECLY P (GGA) con una correzione perturbativa al 2◦ ordine
(GGA) con EX
Miscela di EX
per la correlazione (PT2):
HF
GGA
1) Miscela scambio: EX
e EX
(aX ) → aX = 0.54
2) Miscela correlazione PT2 e GGA (aC ) → aC = 0.27
Il funzionale di scambio e correlazione cosı̀ definito è stato denominato: B2-PLYP perchè
contiene due parametri e include una correzione perturbativa (P) per la parte di correlazione.
L’espressione generale per questo tipo di funzionali è:
GGA
HF
EXC = (1 − aX )EX
+ aX EX
+ (1 − aC )ECGGA + aC ECP T 2
dove
ECP T 2 =
1 X X [(ia|jb) − (ib|ja)]2
→ post-SCF (GGA)
4 ia jb i + j − a − b
(5.30)
(5.31)
i, a e j, b → singoli occ − virt − replacements
(ia|jb); (ib|ja) integrali bielettronici calcolati rispetto agli spin-orbitali ΘKS
i
Il calcolo dell’energia viene fatto come per il metodo MP2: SCF(HF) + correzione perturbativa.
In questo caso però gli spin-orbitali e autovalori vengono ottenuti da un calcolo SCF in cui si
usa solo la parte DFT dell’espressione dell’energia.
50
⇒ B2-PLYP ≡ BLYP se aX =0 e aC =0
⇒ B2-PLYP ≡ MP2 se aX =1 e aC =1
Nel suo lavoro, Grimme ha provato a combinare diversi funzionali: B88, OPTX e PBE per lo
scambio e PBE e LYP per la correlazione, ma i risultati migliori sono stati ottenuti combinando
B88 con LYP.
Nota 1:(Schawbe-Grimme PCCP 8(2006) 4398-4401)→ mPW2LYP
Sostituisce il funzionale di scambio B88 con mPW (b=0.00426, d=3.72) rideterminano i
parametri ax = 0.55; aC =0.75) ottenendo un miglioramento dei risultati rispetto a B2-PLYP.
Nota 2:(Schawbe-Grimme PCCP 9(2007)3397-3406)
Per migliorare la descrizione dei metodi doppio-ibridi nel calcolo delle proprietà diP
sistemi debolC6,ij
at
mente legati, viene proposto di includere una correzione empirica di tipo: ED =s6 N
6
ij f (Rij ) Rij
dove il fattore di scala per i due funzionali proposti é:
B2 − LY P − D → s6 = 0.55
mP W 2 − LY P − D → s6 = 0.40
5.4
Alcune note schematiche sulla costruzione di un
funzionale
Strategie per costruire EXC [ρ] (Scuseria 2006)
1. UEG → LDA
R 0
DGE
[eXC (ρ)+e1XC (ρ)∇ρ+e2XC (ρ)∇2 ρ+...]dν
2. GEA → (GGA,mGGA) se troncata → EXC
3. vincoli per EXC , vXC , hXC → più diffusi
4. modelli di base (non empirici o semi-empirici)
5. fit empirico → data una forma di EXC → riflettono dati sperimentali per ottenere
parametri
6. metodi ibridi (EXX+EX [ρ])
Hybrid
EXC
[ρ]
Z
=
T
T
ρ(r)[aexact
(r) + bDF
+ cDF
]dr
X
r
r
(5.32)
Vincoli:
→ comportamento asintotico
→ proprietà buca XC (somma, limiti)
→ trasformazione delle coordinate → uniform xeding ργ (r) = γ 3 ρ(γ, r)
lim EC [ργ ] > −∞
γ→∞
51
(5.33)
Proprietà di un sistema con un solo elettrone:
SIC) EX [ρ1 , 0] + I[ρ1 ] = 0 self − interation correction
.
SCC)
EC [ρ1 ] = 0 self − correlation correction
5.4.1
Esempi
B95
ECB95 = ECαα + ECββ + ECαβ
• limite UEG
E
αα(ββ)
• separazione EC in EC
σσ
Z
=
(5.34)
EG
(ρσ )
τσ − τσW eUc,σσ
dr
unif
(1 + cσσ χ2σ
τσ
(5.35)
EG
eUc,αβ
(ρα , ρβ )
dr
1 + cαβ (x2α + x2β )
(5.36)
+ ECα,β
E
αβ
Z
=
• self-correlation correction: EC [ρ1 ] = 0
τσunif =
3
(6π 2 )2/3 ρσ5/3
10
(5.37)
• fitta le energie di correlazione atomiche → Cπ = 0.038 ; Cα,β = 0.0031
τσunif =
τσW
3
(6π 2 )2/3 ρσ5/3
10
(5.38)
1 |∇ρ|2
=
8 ρσ
(5.39)
PKZB vs PBE (costruzione a scatole cinesi)
FχP KZB = 1 +
χ
1+
χ
k
;FxP BE = 1 +
µs2
1 + µs2
(5.40)
dove
χ = χ(ρ, ∇ρ, τ )
SK71
EX
=
D30
EX
s = s(ρ, ∇ρ)
5
−
(36π)5/3
52
Z
ρα4/3 x2α
(5.41)
(5.42)
B88-X
βC2 (C1 S)2
1 + 6β(C1 S)Sinh−1 (C1 S)
FXB88 = 1 +
(5.43)
dove
1
C1 = 2(6π 2 ) 3
C2 = (21/3 CX )−1
3 3 1/3
CX =
( )
4 π
5.5
(5.44)
(5.45)
(5.46)
Funzionali locali e correzioni per il gradiente da
GEA (GGA)
(P.M.W. Gill: Encyclopedia)
• LDA
Z
3
2 2/3
ρσ5/3 (r)dr
= (6π )
10
1/3 Z
3 3
=−
ρ4/3 (r)dr
2 4π
ETT F 27
D30
EX
(5.47)
(5.48)
HF
).
dove D30 ∼ 10% meno F 30(EX
ECW 38
Z
= −4a
ρα (r)ρβ (r)
ρ(r)
1
1 + dρ1/3 (r)
d(r)
(5.49)
TFDW →
D30
E = ETT F 27 + Eγ + Ej + EX
+ ECW 38
(5.50)
dove (W = W IGN ER) con a=0.04918 ; d=0.349
• GGA
E
dove x(r) =
|∇ρ(r)|
ρ3/4 (r)
W 35
=
ETT F 27
1
+
8
Z
ρ5/3 (r)x2σ dr
(5.51)
dove W=W eizsacher
con (.... + x4 + x6 + ...) →tende a divergere [(ρ → 0)?]
SK71
EX
=
D30
EX
5
−
(36π)5/3
Z
ρσ4/3 (r)x2σ dr →
(5.52)
(...+x4 + x6 + ...) → tende a divergere e non cambia
B88
EX
=
D30
EX
Z
−b
ρ
4/3
x2σ
(r)
dr
1 + 6βxσ sinh−1 xσ
(5.53)
con b=0.0042 fittato dalle energie di scambio HF per gli atomi dei gas nobili (He →
Rn)
53
B88 → smorza x2 per valori grandi di x e impone che X tenda al valore corretto per x
grandi
Classificazione in base all’uso di Θi e ρ(r) per Eρ e EX C
F amiglia T ipo
ET
EX C
1
HF (post − HF ) Θi (r, σ) Θi (r, σ)
2
(ibridi)
Θi (rσ) ρ(r)(Θi (r, σ))
3
KS
Θi (r, σ) ρ(r)
4
DF T (HK)
ρ(r)
ρ(r)
54
Chapter 6
Implementazione dei metodi DFT
Il calcolo della densità elettronica risolvendo le equazioni KS segue lo stesso schema di un
calcolo HF:
1. definizione di una ρ iniziale, normalmente come sovrapposizione di densità atomiche;
2. calcolo del potenziale di correlazione e scambio vxc ;
3. soluzione delle equazioni di KS per ricavare gli orbitali di KS;
4. calcolo della densità elettronica
5. calcolo dell’energia del sistema, e controllo della convergenza;
6. ripetizione della procedura dal punto 2
La soluzione delle equazioni KS può essere numerica,P
ma il metodo più diffuso è l’espansione
KS
degli orbitali in una base di altre funzioni: ϑi = µ cµi χµ . Le equazioni risultanti sono
analoghe alle equazioni di Roothaan-Hall. Le basi più comuni sono gaussiane contratte, in
generale si usano le stesse funzioni base messe a punto per HF.
Uno dei problemi del DFT è la complessità dei funzionali vxc , che rende necessaria la valutazione
numerica degli integrali < χµ |vxc |χν >. Una tecnica alternativa è l’espansione del potenziale
vxc in termini di un set di funzioni ausiliarie: i coefficienti della combinazione lineare sono
determinati con un best fitting su un insieme di punti di una griglia appropriatamente scelta.
6.0.1
Implementazione dei metodi DFT
Come per i metodi di calcolo basati sulla funzione d’onda, nell’implementazione delle equazioni
di KS → si usa l’approssimazione LCAO. Cioé, gli spin orbitali di KS, Θi (r), vengono espressi
in termini di funzioni che riproducono gli orbitali atomici.
1 2
− ∇i + vef f (ri ) Θi (r) = i Θi (r)
(6.1)
2
vef f = vext (ri ) + vH (r) + vXC (ρ, r)
55
(6.2)
vext (r) = −
M
X
ZA
λ=1
ria
(6.3)
Z
ρ(rj )
drj
rij
δEXC [ρ]
vXC [ρ, r] =
δρ
fbKS Θi (r) = i Θi (r)
vH =
(6.4)
(6.5)
(6.6)
Se si introduce l’approssimazione LCAO, si ha:
L
X
Θi (r) =
cµ,i χµ
(6.7)
µ=1
fbKS
L
X
cν,i χν = i
ν=1
L
X
cν,i χν
(6.8)
ν=1
moltiplicando a dx per χµ ed integrando con r si ottiene
L
X
cν,i < χµ |fbKS |χν >= i
L
X
cν,i < χµ |χν >
(6.9)
ν=1
ν=1
L
X
KS
cν,i Fµ,ν
= i
L
X
cν,i Sµ,ν
(6.10)
ν=1
ν=1
• Sµ,ν = elemento µ, ν matrice di overlap
KS
• Fµ,ν
= elemento µ, ν matrice di KS
in forma matriciale diventa:
F KS C = SCE
(6.11)
Per capire l’implementazione dell’equazione di KS e le differenze in seguito alle equazioni HF
KS
vediamo quali sono i contributi che definiscono Fµ,ν
.
"
1
KS
Fµ,ν
=< χµ | − ∇2i −
2
M
X
ZA
ria
i=1
Z
+
#
ρ(rj )
drj + vXC (ri ) |χν >
rij
i primi due termini sono analoghi all’HF e costituiscono la parte mono-elettronica
"
#
M
1 2 X ZA
hµ,ν =< χµ | − ∇i −
|χν >
2
r
i=1 ia
(6.12)
(6.13)
in termini di set base {χν } il contributo coulombiano classico (Hartree) diventa:
ρ(r) =
N
X
i=1
2
|Θi (r)| =
N X
L X
L
X
i=1 µ=1 ν=1
56
cµ,i cν,i χµ χν
(6.14)
dove si può definire in modo analogo ad HF la matrice densità
Pµ,ν =
N
X
cν,i cµ,i
(6.15)
i=1
quindi il contributo coulombiano diventa:
Jµ,ν =
L X
L
X
Pλσ < χµ χν |
λ=1 σ=1
1
|χλ χσ >
rij
(6.16)
che è analogo a contributo coulombiano nel caso HF .
La differenza tra HF e KS si determina solo per la parte di XC che in KS è rappresentata
dall’integrale
XC
(6.17)
Vµν
=< χµ |vXC (ri )|χν >
che dipenderà dalla forma esplicita di vXC (LDA, GGA, mGGA, ...) e si usa la formula Eulero
per definire vXC = σEσρXC mentre in HF è dato dall’integrale di scambio (più costoso)
Kµν =
L
L X
X
Pλσ < χµ χλ |
λ=1 σ=1
1
|χν χσ >
rij
(6.18)
Il tipo di set base usato per i calcoli rientra nelle grandi classi già viste per l’HF e cioè:
• set base numerici
• set base analitici
→ localizzati(GT F, ST O, ..)
→ delocalizzati(P W )
Pochi esempi di set base ottimizzati per calcoli DFT Nello stato solido i più diffusi
sono i codici che usano onde piane come funzioni base, meno comune è la scelta di set base
localizzati tipo funzioni Gaussiane (GTF) che invece sono i più usati nel campo molecolare.
INTEGRALE COULOMBIANO → In alcuni casi programmi DFT il calcolo di Jµν
viene fatto non in modo tradizionale, ma tenendo conto del fatto che , a differenza di HF, Jµν
XC
è completamente disaccoppiato da Vµν
. Si Scrive
Jµν =< χµ |
ρ(rj )
>
rij
(6.19)
ma poi si espande ρ(r) in termini di funzioni localizzate negli atomi {ωk }
ρ(r) =∼
= ρe(r) −
K
X
ck ωk (r)
(6.20)
k=1
quindi ripasso a
Jeµν =
K
X
k=1
Z
ck
χµ χν ωk
dri drj
rij
57
(6.21)
dove i coefficienti ck vengono ottenuti minimizzando una funzione tipo
Z Z
[ρ(ri ) − ρe(ri )] ρ(rj ) − ρe(rj )
0
F =
dri drj textrmxbasigaussiane
rij
(6.22)
Repulsione coulombiana tra le densità residue
F 0 →∅ ⇒Jeµν → Jµν
(6.23)
limF 0 →0 Jeµν = Jµν
(6.24)
R
nel vincolo ρe(r)dr = N .
Questo tipo di tecnica si chiama RJ − J o density f itting.
INTEGRALE XC Data la complessità delle equazioni esplorate di vxc in termini di ρ∇
anche per LDA, XC non viene calcolato in modo analitico, ma procede ad un’integrazione
numerica.
Quindi occorre definire un’opportuna griglia di punti nei quali si calcola ρ∇ (LDA) o ∇ρσ e
∇2 ρσ (GGA).
P
X
XC
(6.25)
Vµν ≈
χµ (rp )VXC (rp )χν (rp )Wp
p=1
l’integrale è approssimato da una somma dei prodotti χµ , VXC , χν pesata dal fattore Wp .
Nel DFT si usa la tecnica proposta da Becke di separare l’integrazione in somma di contributi
atomici (che si sovrappongono).
Cioè se
Z
(6.26)
I = F (r)dr
si pone
I=
M
X
IA
(6.27)
A=1
dove
Z
IA =
FA (r)dr
tale che F (r) =
M
X
FA (r)
(6.28)
A=1
dove FA (r) si ottiene attraverso l’introduzione di funzioni peso (pesi atomici di Becke)tali che:
FA (r) = WA (r)F (r)
N
X
WA (r) = 1
(6.29)
A=1
WA ∼ 1 vicino a A e ∼ 0 vicino agli altri nuclei.
Definiti i pesi WA e i contributi FA si ricava IA come integrazione numerica una griglia di
punti definiti da sfere concentriche intorno agli atomi (bacini atomici)
58
Z
∞
Z
~
Z
IA =
0
0
2~
FA (r, θ, ρ)r2 sin θd(r)dθdρ ∼
=
0
P
X
WpRAD
p=1
Q
X
WqAN G FA (rp , θq , ρq ) (6.30)
q=1
Ci sono quindi P punti radiali e Q punti angolari con i corrispondenti pesi W RAD , W AN G .
N◦ totali di punti P · Q
• integrazione radiale → Euler-McLaurin; Gauss-Chebyshev
• integrazioni angolari → Lebedev (griglie che sommano esattamente tutte le armoniche
sferiche fino al grado l =)
Per ridurre il n◦ di punti di solito si usa una ”potatura della griglia” (dall’inglese: pruning).
L’idea di fondo è che andando verso il nucleo la ρ(r) è via via più sferica e quindi sono
sufficienti griglie angolari meno fitte per una corretta integrazione. Lo stesso vale per valori di
r grandi. Nel potare si usano queste considerazioni definendo lo spazio di regioni con n◦ di
punti angolari.
Problema di accuratezza numerica
• invarianza rotazionale (molecole)
• zeri nel calcolo frequenze e modi a bassa frequenza
Complicazioni: i gradienti di EXC , rispetto alle posizioni dei nuclei, richiedono le derivate dei
pesi
T
X
e
W t ft
(6.31)
EXC =
t
T X
d
dft
d e
EXC =
ft Wt + Wt
dx
dx
dx
t=1
dove
(6.32)
dWt
→0
(6.33)
dx
per griglie infinite, ma in generale non si possono trascurare → problemi di accuratezza
59
Chapter 7
Valutazione dei metodi DFT
Dopo aver introdotto i funzionali di XC e i metodi che ne derivano, è importante valutarne
l’accuratezza nel calcolo di proprietà di interesse chimico-fisico. Nel seguito viene quindi presentato un confronto tra i diversi funzionali di XC sulla base di risultati su atomi, molecole e
solidi recentemente presentati in letteratura.
Come evidenziato nei precedenti capitoli e a differenza delle metodologie WFT, per i metodi
DFT non esiste una vera e propria procedura variazionale che consenta di migliorare in modo
sistematico l’accuratezza nella descrizione della repulsione elettronica di un sistema multielettronico. In questo senso, la scala di Giacobbe proposta da Perdew rappresenta comunque
un’utile strumento per classificare e raggruppare i funzionali di XC in classi di complessità e
accuratezza crescente. Tuttavia, ogni nuovo funzionale deve essere calibrato e tarato confrontando i risultati ottenuti con quelli disponibili in letteratura relativi a calcoli di benchmark,
solitamente ricavati usando metodi WFT di alto livello e elevata accuratezza (es. CCSD(T)
con basi estese come aug-cc-pVXZ, X=T,Q,...), e soprattutto dati sperimentali.
A questo scopo, i metodi DFT attualmente disponibili in calcoli di routine sono raggruppabili
in diverse famiglie che si rifanno ai gradini della Jacob’s Ladder:
1. LDA (Local Density Approximation)
2. GGA (Generalized Gradient Approximation)
3. MGGA (Meta-GGA)
4. Ibridi-GGA; Ibridi-MGGA
5. Doppi-ibridi
La valutazione dei metodi DFT si basa poi sul confronto con dati di riferimento raccolti in una
serie di database opportunamente predisposti per varie proprietà chimico-fisiche. Nella tabella
7 sono riportate alcune delle tipologie di dati usati come riferimento. Avere a disposizione un
insieme di dati cosı̀ esteso ha in pratica una duplice valenza: (i) viene usato per stabilire una
classifica dei diversi funzionali di XC e (ii) può essere usato per l’ottimizzazione di funzionali di
XC semi-empirici. In effetti, molti dei database messi a punto sono stati usati per ottimizzare
i parametri presenti in funzionali di XC. Esempi di questo tipo risalgono al metodo B3LYP di
Becke (1993), all’HCTH (1996) di Handy e collaboratori, fino ai più recenti M05, M06, M08 e
M11 di Truhlar (che contengono fino a 30-40 parametri). Nei metodi DFT ibridi, questo tipo
di strategia di sviluppo è solitamente usata per ottimizzare anche la percentuale di scambio
esatto.
60
Table 7.1: Informazioni contenute nei principali database sviluppati per la calibrazione dei
metodi DFT
Atomi
Molecole
Solidi
Energie totali
Geometrie e frequenze vibrazionali
Energie di coesione
Energie di scambio e correlazione
Energie di atomizzazione
Geometrie (parametri reticolari e coord. interne)
61
Appendix A
Sul concetto di funzionale e derivata
di un funzionale
A.1
Funzionale e derivata funzionale
Si definisce funzione una relazione matematica che lega un numero ad un altro
numero.
y(x)
x −→ z
Si definisce funzionale una relazione matematica che lega una funzione ad un
numero.
F [y(x)]
y(x) −→ z
In questo caso, si dice anche che un funzionale definisce una mappatura tra
una funzione e un numero. In altre parole, un funzionale è una funzione nella
quale la variabile è una funzione
Un esempio di funzionale in chimica quantistica è il valor medio di un’osservabile.
b >, cioè data una Ψ normalizzata, si ottiene
Per l’energia si ha E =< Ψ|H|Ψ
un numero, l’energia, come funzionale della funzione d’onda.
Prima di definire la derivata di un funzionale, si consideri il caso di una generica
funzione derivabile F (y). La sua derivata sarà data da F 0 (y) = dF
dy . Nel
0
punto y , spostandosi di una distanza dy, la funzione F quindi varierà come
dF = F (y 0 + dy) − F (y 0 ) = F 0 (y)|y0 dy.
Se la funzione F dipende da più variabli, cioé F (y1 , y2 , ...), la derivata totale
∂F ∂F
della funzione dipenderà dalle derivate parziali ∂y
, , ..., cosı̀ che partendo
1 ∂y2
62
dal punto y10 , y20 , ... e variando la funzione di dy1 , dy2 , ..., la sua variazione sarà
dF =
∂F
∂F
|y10 dy1 +
| 0 dy2 + · · ·
∂y1
∂y2 y2
(A.1)
Estendiamo ora il concetto di derivata al caso di un funzionale.
Si consideri una funzione y(x) che dipende dalla variabile x e che assuma valori
reali nell’intervallo [a, b]. Dati N punti nell’intervallo [a, b] distanti tra loro di
un valore ε, dove N ε = a − b. L’n-esimo punto corrisponde a xn = a + nε.
Quindi la funzione yn = y(xn ) tenderà a y(x) per N → ∞, ε → 0.
Definiamo ora una funzione dell’insieme delle funzioni {yn }, cioè F ({yn }). Al
limite per N → ∞, la funzione F diventa una funzione di y(x). Dato che F
è una funzione di tutti i valori di y(x) nell’intervallo [a, b], F viene chiamata
funzionale di y(x), F [y]. Quindi un funzionale usa come variabile una funzione
y(x) in un dominio, dipendendo da tutti i valori di y per tutti i valori di x nel
dominio, e restituisce un numero.
Ad esempio, se:
1
Z
y(x)2 dx
F [y] =
0
si avrà:
F [y = x] = 1/3
F [y = sin πx] = 1/2
F dipende dall’intera forma funzionale di y(x) nell’intervallo [0, 1].
Se si cambiano i valori di {yn }, la funzione F ({yn }) varierà secondo la A.1
come
N
X
∂F
dF =
|y0 dyn
∂y
n
n=1
Nel limite N → ∞ (per passare al caso di una variabile continua), l’espressione
sopra può essere trasformata usando la definizione di integrale
Z
b
dxf (x) = lim
a
ε→0
63
N
X
n=1
εf (xn )
come
N
X
1 ∂F
ε
|y0 dyn
ε
∂y
n
n=1
Prendendo il limite per ε → 0, con x = a + nε e introducendo la notazione
dyn = δy(x), si arriva a
Z b
1 ∂F
|y0 (x) δy(x)
(A.2)
dF =
dx
ε ∂y
a
Qui y 0 (x) è la particolare funzione y(x) che è il punto di partenza della variazione infinitesima arbitraria δy(x). Il termine 1/ε è stato assorbito in ∂F
∂y che
può essere considerata la definizione di derivata funzionale.
Il significato della A.2 è analogo alla A.1. Il cambiamento di F è la somma
di termini proporzionali alle variazioni infinitesime δy(x), con costante di proporzionalità che è proprio la derivata funzionale ∂F
∂y . Cioè, la derivata funzionale
dà la risposta del funzionale F a una piccola variazione di y con il cambiamento
localizzato in x.
In alternativa, la derivata funzionale si può anche scrivere come rapporto incrementale del funzionale dovuto ad un incremento δy(x) del funzionale F (cioè
F [y(x) + δy(x)] − F [y(x)]) in x0 al limite di un incremento ε infinitesimo
∂F
F [y(x) + εδ(x − x0 )] − F [y(x)]
∂F [y(x) + εδ(x − x0 )]
|ε=0
= lim
=
∂y(x0 ) ε→0
ε
∂ε
dove con δy(x) = εδ(x − x0 ) si è specificato che l’incremento è localizzato in
x0 .
Per rendere la definizione più operativa consideriamo un semplice esempio.
Sia
Z 1
F [y] =
y(x)2 dx
0
per calcolare la derivata funzionale si può calcolare il cambiamento dF dovuto
a una variazione infinitesimale δy(x):
Z 1
Z 1
2
F [y + δy] =
[y(x) + δy(x)] dx =
[y(x)2 + 2y(x)δy(x) + δy(x)2 ]dx
0
0
tralasciando il termine (δy)2 , nel limite δy → 0, al prim’ordine in δy, quindi si
ha:
Z 1
Z 1
F [y + δy] =
[y(x) + δy(x)]2 dx =
[y(x)2 + 2y(x)δy(x)]dx
0
0
64
1
Z
F [y + δy] = F [y] +
2y(x)δy(x)dx
0
il cambiamemto infinitesimo dF è perciò
1
Z
dF = F [y + δy] − F [y] +
2y(x)δy(x)dx
0
Se si confronta la relazione sopra con la A.2 si ottiene
∂F
= 2y(x)
∂y
Questo esempio è il prototipo di calcolo di una derivata funzionale.
La derivata funzionale ha proprietà simili a quelle della derivata di una funzione
(ad es. si comporta come un operatore lineare, vale la regola della catena, ...).
La definizione data è generalizzabile (i) al caso di un funzionale che dipende da
più funzioni (ci si comporta come nel caso delle derivate parziali) o (ii) quando
F dipende da una funzione a più variabili (in questo caso si ha un dominio
nello spazio).
Ovviamente, è possibile definire derivate di ordine superiore al primo.
A.2
Formula di Eulero
Nel caso in cui il funzionale sia un semplice integrale, la formula di Eulero offre
uno strumento potente per il calcolo della derivata funzionale.
Cominciamo considerando il caso di un integrale il cui integrando è funzione
di x e y(x)
Z
F [y] =
L(x, y(x))dx
(A.3)
Per una variazione di y(x) troncando al primo ordine si ha
Z
Z ∂L(x, y)
F [y + δy] = L(x, y + δy)dx =
L(x, y) +
δy dx
∂y
Confrontando il risultato con la A.2 si trova
∂F
∂L(x, y)
=
∂y
∂y
che vale per tutti i funzionali del tipo A.3.
Consideriamo adesso il caso particolare in cui l’integrando L è funzione sia di
65
y(x) che delle sue derivate y 0 = dy/dx, y 00 = d2 y/dx2 ,...
Nel caso della derivata prima si ha
Z
F [y] = L(x, y, y 0 )dx
(A.4)
Per una variazione δy si può scrivere
Z
F [y + δy] = L(x, y + δy, y 0 + δy 0 )dx
dove δy 0 = d(δy)/dx è la derivata della variazione δy. Espandendo al primo
ordine in δy e nella sua derivata
Z 0
0
∂L(x,
y,
y
)
∂L(x,
y,
y
)
L(x, y, y 0 ) +
δy 0 dx (A.5)
F [y + δy] '
δy +
0
∂y
∂y
Si noti come nel derivare si considerino y e y 0 come indipendenti.
L’eq.A.5 non è ancora confrontabile con la A.2 e quindi non è possibile estrarre
la derivata funzionale. Per fare questo occorre convertire δy 0 inR δy nell’ultimo
termine. Usando un’integrazione per parti (ricordiamo che: f dg = f g −
R
0
)
gdf con dg = dy 0 ef = ∂L(x,y,y
δy 0
0
∂y
b Z b
Z b
∂L(x, y, y 0 ) 0
d ∂L(x, y, y 0 )
∂L(x, y, y 0 )
δy dx =
δy(x) −
δy(x)dx
∂y 0
∂y 0
∂y 0
a
a dx
a
(A.6)
il primo termine sulla destra è un termine di bordo, che dipende dagli estremi di
integrazione. È proporzionale quindi al valore di δy agli estremi dell’intervallo
[a, b]. Usando la A.6 nella A.5 si ottiene
Z d ∂L(x, y, y 0 )
∂L(x, y, y 0 )
δy(x)dx + [termini di bordo]
dF =
−
∂y
dx
∂y 0
che confrontata con la A.2 permette di ricavare che
∂F
∂L
d ∂L
=
−
∂y
∂y
dx ∂y 0
(A.7)
se x non si trova agli estremi dell’intervallo. Se invece x si trova agli estremi
dell’intervallo, esiste un termine aggiuntivo da includere nella
R ∞ A.7. Notare che
nel caso in cui y è proprio ρ(r), dato che l’integrale è −∞ e ρ(r) → 0 per
r → ∞ i termini agli estremi si annullano.
Questa è la formula di Eulero che fornisce un’utile scorciatoia per ricavare la
derivata funzionale nel caso di un funzionale della forma A.4.
La formula di Eulero può essere generalizzata al caso in cui:
66
• la funzione integranda L contiene derivate di y(x) di ordine superiore
Z
F [y] = L(x, y, y 0 , y 00 )dx
∂L
d ∂L
d2 ∂L
∂F
=
−
+
∂y
∂y
dx ∂y 0 dx2 ∂y 00
in questo caso occorre integrare per parti due volte per eliminare δy 00 .
• l’argomento del funzionale è una funzione di più variabili
Z
F [y] = L(x, y, z, f, fx , fy , fz )dx
d ∂L
d ∂L
∂L
d ∂L
∂F
−
−
=
−
∂f (x, y, z)
∂f
dx ∂fx dy ∂fy dz ∂fz
A.3
Minimo di un funzionale
Consideriamo il problema di trovare il minimo di un funzionale F [y] rispetto alle
funzioni y(x) che si annullano ai bordi del dominio. La condizione necessaria è
Z b
∂F
dF =
δy(x)dx = 0
a ∂y(x)
per una variazione arbitraria di δy(x). Questo equivale a richiedere che la
soluzione sia una funzione y(x) che soddisfa
∂F
=0
∂y(x)
(A.8)
L’equazione A.8 è l’equazione di Eulero-Lagrange e rappresenta la condizione
necessaria per l’esistenza di un estremale.
Se la minimizzazione di F [y] è soggetta ad un vincolo, ad esempio G[y(x)] = 0,
si ricorre al metodo dei moltiplicatori di Lagrange, risolvendo l’equazione di
Eulero-Lagrange per il funzionale Ω[y] = F [y] + λG[y], cioè
∂Ω
∂F
∂G
=
−λ
=0
∂y(x) ∂y(x)
∂y(x)
la soluzione dell’equazione sopra contiene i moltiplicatori λ che devono essere determinati imponendo il vincolo durante la risoluzione dell’equazione di
Eulero-Lagrange.
67
Come nell’analisi di funzioni, perchè un estremale sia un minimo è necessario
che la derivata seconda di F sia positiva d2 F = 0. Spesso, data la natura del
problema, si assume che la soluzione trovata sia un minimo senza una reale
verifica.
La minimizzazione di un funzionale è alla base del metodo variazionale che
viene ampiamente utilizzato in chimica quantistica.
68
Appendix B
PBE’s type exchange functionals and
functional derivatives
Let us consider an exchange functional of the form:
XZ
ρσ X,σ F (sσ )dr
EX =
(B.1)
σ
where
1/3
3
3π 2 ρσ
4π
and the basic variables are: the spin density, ρσ and the reduced spin density,
sσ :
|∇ρσ |
1
sσ = 4/3
2 1/3
ρσ 2(3π )
X,σ = −
F (sσ ) is the enhancement factor (exchange energy density).
Functionals of this type are PBE[14], revPBE[15], RPBE[16], mPBE[17], WC[18],
PBEα[19], PBEsol[20], SOGGA[21] and RGE2[22].
For instance:
• PBE exchange functional is given by
κ2
F (sσ ) = 1 + κ −
κ + xσ
where
xσ = µs2σ
and κ = 0.804 and µ = 0.21951.
• revPBE exchange functional has the same expression of PBE but κ =
1.245.
69
• RPBE exchange functional is given by
F (sσ ) = 1 + κ − κ exp(−µs2σ /κ)
• mPBE exchange functional is given by
s2σ
+ C2
F (sσ ) = 1 + C1
1 + as2σ
s2σ
1 + as2σ
2
where C1 = µ, C2 = −0.015 and a = 0.157.
• WC exchange functional is given by
κ2
F (sσ ) = 1 + κ −
κ + xσ
where
10 2
10 2
sσ exp(−s2σ ) + ln(1 + cs4σ )
x σ = sσ + µ −
81
81
and κ = 0.804, µ = 0.21951 and c = 0.0079325.
• PBEα exchange functional takes the form:
F (sσ ) = 1 + κ −
κ
xσ α
)
(1 + κα
where
xσ = µs2σ
and κ = 0.804 and µ = 0.21951. In ref.[19], its is proposed to use
α = 0.52.
The functional form has three limiting cases: (i) α = 0.0 then F (sσ ) = 1
(i.e. LDA); (ii) α = 1.0 corresponds to PBE and (iii) α = ∞ gives the
RPBE functional.
Note that when α = 2.0, PBEα takes a functional form similar to the
RGE2 one (see below).
• PBEsol exchange functional is a reparametrization of the original PBE ex10
change functional in which µ = 81
. It is combined with the corresponding
PBE correlation functional with the value of β redefined to be β = 0.046.
• SOGGA exchange functional enhancement factor reads
F (sσ ) = 1 + κ −
1 κ2
1
− κ exp(−xσ /κ)
2 κ + xσ 2
70
where
xσ = µs2σ
10
and κ = 0.552 and µ = 81
.
It is a ”half-and-half” combination of PBE and RPBE. It is combined with
the original PBE correlation functional.
• RGE2 means Regularized Gradient Expansion approximation at secondorder. It is built from the PBEsol exchange functional by adding a higherorder term to the denominator of the corresponding enhancement factor.
In this respect, PBEsol can be considered as a first-order RGE approximation. The RGE2 enhancement factor is then
F (sσ ) = 1 + κ −
κ3
κ2 + κxσ + x2σ
where
xσ = µs2σ
10
.
and κ = 0.552 and µ = 81
It is combined with the original PBE correlation functional in which the
value of β has been redefined to be β = 0.053. This derives from a fitting
to m-GGA TPSS quality surface energies for jellium.
From the general form of the exchange functional of eq.(B.1), the functional
derivatives to be implemented are:
1/3
3
∂EX
∂F
(s
)
σ
=−
ρ1/3 F (sσ ) − sσ
∂ρσ
π
∂sσ
1
3
∂EX
∂EX
1 ∂F (sσ )
=
=
−
∂|∇ρσ |2
2|∇ρσ | ∂|∇ρσ |
16π |∇ρσ | ∂sσ
For PBE, revPBE, PBEsol and WC we have
∂F (sσ )
κ2
∂xσ
=
∂sσ
(κ + xσ )2 ∂sσ
where
• PBE, revPBE and PBEsol:
∂xσ
= 2µsσ
∂sσ
71
• WC:
2
10
2cs
∂xσ
10
σ
= 2sσ
+ µ−
(1 − s2σ ) exp(−s2σ ) +
∂sσ
81
81
(1 + cs4σ )
For RPBE is:
∂F (sσ )
∂xσ
= exp(−xσ /κ)
∂sσ
∂sσ
where
∂xσ
= 2µsσ
∂sσ
For PBEα is:
∂F (sσ )
=
∂sσ
where
κα
κα + xσ
α+1
∂xσ
∂sσ
∂xσ
= 2µsσ
∂sσ
For SOGGA is:
∂F (sσ ) 1
=
∂sσ
2
κ2
∂xσ
+
exp(−x
/κ)
σ
(κ + xσ )2
∂sσ
where
∂xσ
= 2µsσ
∂sσ
For RGE2 we have
∂F (sσ )
= κ3
∂sσ
where
κ + 2xσ
(κ2 + κxσ + x2σ )2
∂xσ
= 2µsσ
∂sσ
72
∂xσ
∂sσ
Appendix C
B97-like exchange-correlation
functional and functional derivatives
Let us consider an exchange-correlation functional of the form[23]:
X
EXC = EX + ECαβ +
ECσσ
σ
where
EX =
XZ
Xσ (ρσ )gXσ (s2σ )dr
σ
Z
ECαβ =
and
Cαβ (ρα , ρβ )gCαβ (s2av )dr
Z
ECσσ =
Cσσ (ρσσ )gCσσ (s2σ )dr
’s are the local energy densities of a uniform electron gas:
1/3
3 3
ρ4/3
Xσ = −
σ
2 4π
and Cσ is the UEG correlation functional derived by Perdew and Wang[24]
where the opposite-spin and the parallel-spin local correlation energy densities
per unit volume are extracted from the total LSDA correlation energy density
by the trick of Stoll et al.[25]:
Cαβ = C (ρα , ρβ ) − C (ρα , 0) − C (0, ρβ )
Cσσ = C (ρσ , 0)
The basic variables are: the spin density, ρσ and the reduced spin density, sσ :
sσ =
|∇ρσ |
4/3
ρσ
73
where
s2avg = 1/2(s2α + s2β )
and
s2σ
=
|∇ρσ |2
8/3
ρσ
g denotes the gradient correction factor. The correction factors are expanded
in a power series in the remapped variable u(s2 )(spin-subscripts omitted):
2
g(s ) =
k
X
cj uj (s2 )
(C.1)
j=1
and
uXσ
with γXσ = 0.004
uCαβ
γXσ s2σ
=
1 + γXσ s2σ
(C.2)
γCαβ s2avg
=
1 + γCαβ s2avg
with γαβ = 0.006
uCσσ
γCσσ s2σ
=
1 + γCσσ s2σ
with γσσ = 0.2.
Functionals of this type are B97[23, 26], HCTH[27], B97-3[28] and BMK[29],
that differ in the number of terms included in the expansion above and in the
strategy adopted in the parametrization.
For instance:
• The B97 exchange functional is given by (k=2)
• HCTH exchange functional has the following expression (k=4):
• B97-3 exchange functional is given by (k=4)
• MBK exchange functional is given by (k=4)
Functional derivatives
From the general form of the B97-like functional, the functional derivatives to
be implemented are:
74
a)
X ∂σ
∂EXC X ∂
∂gσ
=
[σ gσ ] =
gσ + σ
∂ρσ
∂ρ
∂ρ
∂ρσ
σ
σ
σ
σ
where
∂g[uσ (s2σ )] ∂g[uσ (s2σ )] ∂uσ (s2σ ) ∂s2σ
=
·
·
∂ρσ
∂uσ
∂s2σ
∂ρσ
according to equations C.1 and C.2 we have
k
∂g[uσ (s2σ )] X
γ
8
1
=
j · cj · uj−1 · −
· −
s2σ
2 )2
∂ρσ
(1
+
γs
3
ρ
σ
σ
j=1
k
X
1
∂g[uσ (s2σ )] 8 1
·
j · cj · uj
=
·
2
∂ρσ
3 ρσ (1 + γsσ ) j=1
b)
∂EXC
1
∂E
=
∂|∇ρσ |2
2|∇ρσ | ∂|∇ρσ |
X ∂
X
∂E
∂gσ
=
[σ gσ ] =
σ ·
∂|∇ρσ |
∂|∇ρ
|
∂|∇ρσ |
σ
σ
σ
where
∂g[uσ (s2σ )] ∂g[uσ (s2σ )] ∂uσ (s2σ )
∂s2σ
=
·
·
∂|∇ρσ |
∂uσ
∂s2σ
∂|∇ρσ |
according to equations C.1 and C.2 we have
h
k
i
γ
∂g[uσ (s2σ )] X
j−1
−4/3
=
j · cj · u · −
· 2 s σ ρσ
2 )2
∂|∇ρσ |
(1
+
γs
σ
j=1
k
X
∂g[uσ (s2σ )]
2
1
=−
·
·
j · cj · uj
2
∂|∇ρσ |
|∇ρσ | (1 + γsσ ) j=1
and from equation C.3
∂g[uσ (s2σ )]
3
1
∂g[uσ (s2σ )]
= − ρσ ·
·
∂|∇ρσ |
4
|∇ρσ |
∂ρσ
75
(C.3)
B97-X functional
From the equations above, for the B97 exchange functional (k=2) we obtain:
1/3
∂EX X
3
2uXσ
1/3
=
−2
ρσ gXσ +
(C1 + 2C2 uXσ )
2
∂ρσ
4π
1
+
γ
s
X
σ
σ
σ
and
X3
∂EX
=
∂|∇ρσ |2
2
σ
3
4π
1/3
ρ4/3
σ
uXσ
1
·
(C1 + 2C2 uXσ )
|∇ρσ |2 1 + γXσ s2σ
B97-C functional
From the equations above, for the B97 correlation functional (k=2) we obtain
(α-spin):
a)
∂ECαβ ∂ECαα
∂EC
=
+
(C.4)
∂ρα
∂ρα
∂ρα
The former right-hand term of equation C.4 is
∂gCαβ (s2avg )
∂ECαβ
∂C (ρα , ρβ ) ∂C (ρα , 0)
2
=
−
· gCαβ (savg ) + Cαβ ·
∂ρα
∂ρα
∂ρα
∂ρα
where
∂gCαβ (s2avg ) 4 1
γCαβ s2α
=
·
·
C
+
2C
u
1
2 Cαβ
∂ρα
3 ρα (1 + γCαβ s2avg )2
The latter right-hand term of equation C.4 is
∂ECαα
∂C (ρα , 0)
∂gCαα (s2α )
2
=
· gCαα (sα ) + C (ρα , 0) ·
∂ρα
∂ρα
∂ρα
where
∂gCαα (s2α ) 8 1
γCαα s2α
=
·
· (C1 + 2C2 uCαα )
∂ρα
3 ρα (1 + γCαα s2α )2
b)
∂EC
1
=
∂|∇ρα |2
2|∇ρα |
76
∂ECαβ
∂ECαα
+
∂|∇ρα | ∂|∇ρα |
(C.5)
The first term in brakets in the right-hand member of equation C.5 is
∂gCαβ (s2avg )
∂ECαβ
= Cαβ ·
∂|∇ρα |
∂|∇ρα |
where
∂gCαβ (s2avg )
γCαβ sα
1
= − 4/3 ·
·
C
+
2C
u
1
2 Cαβ
∂|∇ρα |
(1 + γCαβ s2avg )2
ρα
or
"
#
∂gCαβ (s2avg )
∂gCαβ (s2avg )
3 1
1
= − 1/3 ·
·
∂|∇ρα |
4 ρα
sα
∂ρα
The second term in brakets in the right-hand member of equation C.5 is
∂ECαα
∂gCαα (s2α )
= C (ρα , 0) ·
∂|∇ρα |
∂|∇ρα |
where
∂gCαα (s2α )
1
γCαα sα
· (C1 + 2C2 uCαα )
= −2 4/3 ·
2 )2
∂|∇ρα |
(1
+
γ
s
C
ρα
αα α
or
∂gCαα (s2α )
3 1
1
∂gCαα (s2α )
= − 1/3 ·
·
∂|∇ρα |
4 ρα
sα
∂ρα
77
Bibliografia
[1] L. H. Thomas, ”The calculation of atomic fields”, Proc. Cambridge Phil.
Roy. Soc. 23 (1927) 542
[2] E. Fermi, ”Un metodo statistico per la determinazione di alcune proprietà
dell’atomo” Rend. Accad. Naz. Lincei 6 (1927) 602
[3] P. A. M. Dirac, ”Note on exchange phenomena in the Thomas-Fermi
atom” Proc. Cambridge Phil. Roy. Soc. 26 (1930) 376
[4] J. C. Slater, ” ” Phys. Rev. (1951)
[5] Wigner, ” ”, Phys. Rev. 46 (1934) 1002
[6] C. F. von Weizsacker, ”Zur theorie der kernmassen” Z. Phys. 96 (1935)
431
[7] E. Teller, ”On the stability of molecules in the Thomas-Fermi theory”
Rev. Mod. Phys. 34 (1962) 627
[8] P. Hohenberg and W. Kohn, Phys. Rev. ”Inhomogeneous electron gas”
136 (1964) 864
[9] M. Levy, ”Universal variational functionals of electron densities, firstorder density matrices and natural spin orbitals and solution of the nrepresentability problem” Proc. Nat. Acad. Sci. USA 76 (1979) 6062
[10] D. A. Mazziotti, ”Quantum chemistry without wave functions: Twoelectron reduced density matrices” Acc. Chem. Res. 39 (2006) 207
[11] E. J. Baerends and O. V. Gritsenko, ”A quantum chemical view of density
functional theory” J. Phys. Chem. A 101 (1997) 5383
[12] R. Q. Hood, M. Y. Chou, A. J. Williamson, G. Rajagopal, R. J. Needs,
”Exchange and correlation in silicon” Phys. Rev. B 57 (1998) 8972
78
[13] W. Kohn and L. J. Sham, ”Self-consistent equations including exchange
and correlation effects” Phys. Rev. A 140 (1965) 1133
[14] J. P. Perdew, K. Burke and M. Ernzerhof, Phys. Rev. Lett. 77 (1996)
3865
[15] Y. Zhang and W. Yang, Phys. Rev. Lett. 80 (1998) 890
[16] B. Hammer, L. B. Hansen and J. K. Nrskov, Phys. Rev. B 59 (1999) 7413
[17] C. Adamo and V. Barone, J. Chem. Phys. 116 (2002) 5933
[18] Z. Wu and R.E. Cohen, Phys. Rev. B 73 (2006) 235116
[19] G. H. K. Madsen, Phys. Rev. B 75 (2007) 195108
[20] J. P. Perdew, A. Ruzsinszky, G. I. Csonka, O. A. Vydrov, G. E. Scuseria,
L. A. Constantin, X. Zhou and K. Burke, Phys. Rev. Lett. 100 (2008)
136406.
[21] Y. Zhang and D. G. Truhlar, J. Chem. Phys. 128 (2008) 184109
[22] A. Ruszinszky, G. I. Csonka and G. E. Scuseria, J. Chem. Theory Comput.
5 (2009) 763
[23] A.D. Becke, J. Chem. Phys. 107 (1997) 8554.
[24] J. P. Perdew and Y. Wang, Phys. Rev. B 45 (1992) 13244
[25] H. Stoll, C. M. E. Pavlidou and H. Preuss, Theor. Chim. Acta 49 (1978)
143; H. Stoll, E. Golka and H. Preuss, Theor. Chim. Acta 55 (1980) 29
[26] S. Grimme, J. Comput. Chem. 27 (2006) 1787
[27] A.D. Boese, N.L. Doltsinis, N.C. Handy and M. Sprik, J. Chem. Phys.
112 (2000) 1670.
[28] T.W. Keal and D.J. Tozer, J. Chem. Phys. 123 (2005) 121103.
[29] A.D. Boese and J.M.L. Martin, J. Chem. Phys. 121 (2004) 3405.
79