Metodologie di base della Chimica Computazionale Funzionale densità, semiempirici e metodi ibridi Dinamica Molecolare e metodo Monte Carlo Antonino Polimeno Dipartimento di Scienze Chimiche Università degli Studi di Padova Indice generale I Osservabili 9 1 Proprietà dipendenti dal tempo in fasi condensate 1.1 II Teoria dei responsi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.1 Assorbimento ed emissione di energia . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.1.2 Principio del bilancio dettagliato . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.1.3 Funzioni di correlazione temporale . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.1.4 Limite classico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Metodi complementari ed avanzati del calcolo quantomeccanico 2 Cenni a metodi semiempirici e tecniche avanzate 2.1 2.2 11 19 21 Metodi semiempirici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.1.1 Metodo di Hückel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.1.2 Neglect-of-differential-overlap (NDO) . . . . . . . . . . . . . . . . . . . . . . . . . 24 Il metodo del funzionale densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2.1 Equazioni di Kohn-Sham . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.2.2 Funzionali densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 III Trattamenti quantistici e semiclassici di fasi condensate A cura della D.ssa Silvia Carlotto 29 3 Metodologie ed applicazioni dei metodi ibridi QM/MM 31 3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2 I metodi ibridi QM/MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.2.1 I metodi QM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.2.2 I metodi MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.2.3 Trattamento dei termini di accoppiamento di non-legame QM/MM . . . . . . . . . 36 3.2.4 Regione di interazione QM/MM che presenta legami tra gli atomi . . . . . . . . . . 36 3.2.5 Le condizioni al contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1 2 INDICE GENERALE 3.3 3.4 3.5 IV Implementazione dei metodi QM/MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.3.1 Implementazione dei metodi ibridi QM/MM mediante Gaussian98 e Gaussian03 . . . 41 Applicazioni dei metodi QM/MM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.4.1 Applicazioni biochimiche dei metodi ibridi QM/MM . . . . . . . . . . . . . . . . . . 43 3.4.2 Applicazioni allo studio di superfici dei metodi ibridi QM/MM . . . . . . . . . . . . 44 Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Dinamica molecolare 55 4 Dinamica molecolare: metodologie 4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.2 Potenziali di interazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3 Liquidi molecolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.1 Leggi del moto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.2 Sistemi termodinamici e condizioni di simulazione . . . . . . . . . . . . . . . . . . . 61 4.3.3 Osservabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Metodi computazionali di MD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.4.1 Metodi alle differenze finite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Molecole lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 4.4 4.5 5 Dinamica molecolare: un’applicazione 5.1 V 57 69 Studio di un fluido atomico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.1.1 Il sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.1.2 Metodo di calcolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 5.1.3 Codice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Il metodo Monte Carlo 6 Monte Carlo: metodologie 91 93 6.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6.2 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 6.2.1 Catene di Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 6.3.1 Alcuni esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 6.3.2 Altri insiemi termodinamici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 6.3 7 Monte Carlo: un esempio 7.1 101 Studio conformazionale di una catena alchilica . . . . . . . . . . . . . . . . . . . . . . . . . 101 7.1.1 Il sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 INDICE GENERALE 7.1.2 3 Metodo di calcolo e codice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 A Appendici parte I 113 A.1 Alcune proprietà della funzione delta di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 113 A.2 Teoria delle perturbazioni dipendenti dal tempo . . . . . . . . . . . . . . . . . . . . . . . . 113 A.2.1 Probabilità di transizione nell’unità di tempo . . . . . . . . . . . . . . . . . . . . . . 115 A.3 Matrice densità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 4 INDICE GENERALE Indice delle Figure 1.1 Fluido monodimensionale formato da N particelle puntiformi nell’intervallo [0, L]. . . . . . . 12 2.1 Radicale CH3 · . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2 Esempio: 1,3-butadiene. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.1 Rappresentazione schematica della partizione di un sistema in fase condensata. . . . . . . . 32 3.2 Schema delle regioni QM e MM divise da un legame covalente. . . . . . . . . . . . . . . . . 37 3.3 Rappresentazione del metodo link-atoms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.4 Rappresentazione degli orbitali utilizzati nel metodo LSCF. . . . . . . . . . . . . . . . . . . 39 3.5 Rappresentazione schematica della divisione del legame QM/MM e partizione degli orbitali ibridi sull’atomo di contorno. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.6 Rappresentazione del metodo ONIOM utilizzando la triade catalitica della carbossipepdidasi. 42 3.7 Rappresentazione dello stato intermedio del PHBH ottenuto mediante calcoli QM/MM. . . 43 3.8 Centro di reazione fotosintetico del Rh. viridis. . . . . . . . . . . . . . . . . . . . . . . . . 45 3.9 Modello di una superficie di diamante(100). . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.10 Modello di una superficie di diamante(100) utilizzato per le simulazioni. Le sfere grigie rappresentano gli atomi della regione quantistica, le sfere bianche gli atomi della regione descritta empiricamente mentre le sfere nere gli atomi mantenuti fissi durante la simulazione. 47 3.11 Cluster C33 H48 utilizzato per lo sviluppo del potenziale empirico. Le sfere nere rappresentano gli atomi di carbonio centrali, le sfere grigie la prima sfera degli atomi di carbonio mentre le sfere bianche sono la seconda sfera degli atomi di carbonio. . . . . . . . . . . . . . . . . . . 48 3.12 Modello della struttura della superficie di Zn. Gli atomi di ossigeno sono evidenziati in rosso mentre gli atomi di Zn in grigio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.13 Adsorbimento di un dimero di rame in stato di ossidazione 2+:(a) vista dall’alto;(b) vista di lato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.14 Modello di cluster C3 N Si9 H15 trattato con metodi quantistici. Le sfere verdi rappresentano gli atomi di silicio, le sfere bianche gli atomi di idrogeno mentre nella parte in alto della figura compare l’acrilonitrile addizionato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.15 Cluster modello ottenuto componendo il cluster trattato con metodi quantistici (atomi viola) con il cluster trattato con metodi classici (in verde). . . . . . . . . . . . . . . . . . . . . . . 5 52 6 INDICE DELLE FIGURE 3.16 (a) Siti esagonali senza difettualità ,(b) siti esagonali che invece presentano difettualità. Sono evidenziati solo gli atomi di ossigeno. Le sfere nere sono atomi di O trattati con metodi QM mentre le sfere grigie sono atomi di O trattati con metodi MM. . . . . . . . . . . . . . . . 53 4.1 Potenziali: Lennard-Jones (a), hard-sphere (b), square-well (c) . . . . . . . . . . . . . . . . 59 4.2 Due molecole interagenti a 6 siti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3 Condizioni al contorno periodiche e raggio di cut-off . . . . . . . . . . . . . . . . . . . . . . 65 5.1 Un reticolo cristallino fcc (a) ed un sistema di 4 celle elementari fcc (b) . . . . . . . . . . . 70 5.2 Condizioni al contorno periodiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.1 Spazio delle fasi e campione di punti rappresentativo per un sistema a tre coordinate . . . . 94 6.2 Catena di M monomeri definita da N angoli . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.1 Distanza media R tra il primo e l’ultimo atomo in una catena di cinque monomeri, in funzione del numero di elementi della catena di Markov generata in una simulazione Monte Carlo . . 107 Indice delle Tabelle 1.1 Osservabili e funzioni di correlazione temporale . . . . . . . . . . . . . . . . . . . . . . . . 17 2.1 Tabella dei caratteri del gruppo C2h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2 Funzioni φi in C2h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.1 Grandezze riscalate in unità σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.1 Coefficienti LJ per i gas rari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7 8 INDICE DELLE TABELLE Parte I Osservabili 9 Capitolo 1 Proprietà dipendenti dal tempo in fasi condensate 1.1 Teoria dei responsi lineari Consideriamo un insieme di N particelle, ciascuna associata alla coordinata vettoriale ~ri , i = 1, . . . , N . In assenza di interazioni con campi esterni, la funzione d’onda del sistema sarà descritta da un hamiltoniano H0 (vedi II parte). In presenza di interazioni con un campo esterno F (~r, t), possiamo scrivere l’hamiltoniano del sistema come H = H0 + H0 (t) (1.1) dove H0 (t) è l’operatore quantomeccanico corrispondente all’interazione tra il campo esterno F ed il sistema. Nell’ipotesi che l’intensità dell’interazione sia debole (|H0 | ¿ |H0 |, dove con |H0 | si deve intendere come una qualche misura dell’energia media del sistema dovuta ad H0 , per esempio ottenuta calcolando il valore di attesa di H0 rispetto alla funzione d’onda del sistema), l’interazione può essere scritta come un’espressione integrale lineare in F : Z H0 (t) = − d~rB(~r)F (~r, t) (1.2) dove B(~r) è un operatore dinamico dipendente da una proprietà del sistema. Se si definisce l’operatore B come la somma di operatori relativi alle singole particelle, dipendenti dalla posizione delle medesime, si ottiene B(~r) = N 1X [Bi , δ(~r − ~ri )]+ 2 i=1 (1.3) e l’hamiltoniano di interazione assume la forma H0 (t) = − N 1X [B i , F (~ri , t)]+ 2 i=1 (1.4) 11 12 CAPITOLO 1. PROPRIETÀ DIPENDENTI DAL TEMPO IN FASI CONDENSATE L m1 m2 m3 m n m n+1 m x1 x3 x n x n+1 x x2 N N Figura 1.1: Fluido monodimensionale formato da N particelle puntiformi nell’intervallo [0, L]. Esercizio 1. La scrittura precedente è formalmente corretta per una gran numero di interazioni lineari, e può essere facilmente riportata a forme standard nei vari casi specifici. Se per esempio ogni particella è ~ r, t) è, come è noto portatrice di un momento elettrico di dipolo µ ~ i , l’interazione con un campo elettrico E(~ dalla fisica classica H0 (t) = − N X ~ r, t) µ ~ i · E(~ (1.5) i=1 Da un punto di vista macroscopico, possiamo scrivere l’energia di interazione sotto forma integrale Z H0 (t) = − ~ (~r) · E(~ ~ r, t) d~rM (1.6) ~ (~r) è la polarizzazione macroscopica del sistema nel punto ~r che può essere scritta come dove M N X ~ (~r) = 1 M [~ µi , δ(~r − ~ri )]+ 2 i=1 (1.7) Per fissare le idee, possiamo considerare un sistema modello. In Fig. (3.1) è mostrato un disegno schematico del nostro sistema modello, costituito da un ‘fluido’ monodimensionale. Le particelle costituenti sono caratterizzate dalle coordinate xi , definite nell’intervallo [0, L]. Definiamo come responso al tempo t e nel punto ~r la grandezza hB(~r, t)i. Il responso è dipendente dalla storia precedente al tempo t del sistema e della campo applicato F . In generale si potrà scrivere hB(~r, t)i = Z t ∞ Z dt0 d~r0 ΦBB (~r, ~r0 ; t, t0 )F (~r0 , t0 ) (1.8) La funzione ΦBB (~r, ~r0 ; t, t0 ) mette in relazione il comportamento del sistema descritto dall’osservabile B nel punto (~r, t), con la perturbazione dovuta a F nel punto (~r0 , t0 ). La funzione ΦBB (~r, ~r0 ; t, t0 ) è in generale una funzione reale: per un sistema omogeneo in equilibrio termodinamico potremo assumere che i) ΦBB è traslazionalmente invariante, cioè dipende solo da |~r − ~r0 |; ii) ΦBB è stazionaria, cioè dipende solo da t − t0 . 1.1. TEORIA DEI RESPONSI LINEARI 13 Le precedenti definizioni sono immediatamente traducibili nel dominio delle frequenze. Un campo generico può essere visto in generale come un insieme di onde piane F (~r, t) = X = F~kω exp[−i(~k · ~r − ωt)] (1.9) ~k,ω Sostituendo la precedente espressione in (1.8), si ottiene facilmente che il responso hB(~r, t)i è dato da: hB(~r, t)i = χBB (~k, ω) = X χBB (~k, ω)F~kω exp[−i(~k · ~r − ωt)] ~k,ω Z ∞ 0 Z dt d~rΦBB (~r, t) exp[i(~k · ~r − ωt)] (1.10) (1.11) dove χBB (~k, ω) è la suscettibilità complessa associata al responso lineare hB(~r, t)i, definita come la trasformata di Fourier-Laplace della funzione ΦBB . Dalle proprietà fondamentali delle trasformate di FourierLaplace discende che la suscettibilità complessa χBB = χ0BB + iχ00BB gode delle seguenti proprietà χ0BB (−~k, −ω) = χ0BB (~k, ω) (1.12) χ00BB (−~k, −ω) = −χ00BB (~k, ω) (1.13) χBB (−~k, −ω) = χ∗BB (~k, ω) (1.14) 1.1.1 Assorbimento ed emissione di energia Un sistema esposto ad un campo esterno esibisce un responso accompagnato da assorbimento ed emissione di energia. La differenza tra energia assorbita ed emessa è l’energia dissipata. Supponiamo che il sistema sia sottoposto ad una radiazione monocromatica reale, formata cioè da due onde piane: F = o 1n ∗ F~kω exp[−i(~k · ~r − ωt)] + F~kω exp[i(~k · ~r − ωt) 2 (1.15) Sia Q(~k, ω) l’energia dissipata per unità di tempo, ottenibile come la media rispetto ad un periodo di oscillazione del campo della variazione temporale dell’energia del sistema: Q(~k, ω) = ω 2πV Z 0 2π ω Z dt d~rhB(~r, t)i ∂F (~r, t) ∂t (1.16) dove V è il volume del sistema. Sostituendo l’eq. (1.15) otteniamo: ω Q(~k, ω) = χ00BB (~k, ω)|F~kω |2 2 (1.17) La parte immaginaria della suscettibilità complessa è dunque proporzionale all’energia dissipata. 1.1.2 Principio del bilancio dettagliato Nell’ipotesi di una campo monocromatico, eq. (1.15), possiamo riscrivere l’energia di interazione del sistema nella forma ∗ H0 (t) = −B −~k F~kω exp(iωt) − B~k F~kω exp(−iωt) (1.18) 14 CAPITOLO 1. PROPRIETÀ DIPENDENTI DAL TEMPO IN FASI CONDENSATE dove l’operatore B~k è N 1X B~k = [B i , exp(i~k · ~ri )]+ 2 i=1 (1.19) Definiamo ora due stati del sistema di particelle, uno stato iniziale |ii ed uno stato finale |f i. Esercizio 2. Gli stati |ii sono autostati dell’hamiltoniano del sistema isolato H0 . La perturbazione debole H0 (t) in ordine zero lascia invariati gli autostati del sistema Chiamiamo Ei(f ) l’energia del sistema di particelle nello stato iniziale (finale), qi(f ) la probabilità che il sistema sia nello stato iniziale (finale), secondo la distribuzione di Boltzmann qi(f ) = exp(−Ei(f ) /kB T ) Q (1.20) dove Q è la funzione di partizione del sistema di particelle nell’insieme statistico canonico. Dalla teoria delle perturbazioni dipendenti dal tempo la probabilità che il campo esterno induca una transizione da i a f e la probabilità che avvenga il processo opposto, da f ad i, sono (nell’unità di tempo): Wi→f (~k, ω) = Wf →i (−~k, −ω) = 2π 2 2 2 |F~kω | |hi|B~k |f i| δ(ω − ωf i ) 4h̄ 2π |F~ |2 |hf |B −~k |ii|2 δ(ω − ωf i ) 4h̄2 kω (1.21) (1.22) dove ω = (Ef − Ei )/h̄. La probabilità per unità di tempo che il sistema acquisisca un momento h̄~k e un’energia h̄ω, indipendentemente dagli stati iniziale e finale, e la probabilità opposta che il sistema acquisisca un momento −h̄~k e un’energia −h̄ω, indipendentemente dagli stati iniziale e finale, sono: P (~k, ω) = X if P (−~k, −ω) = X if X 2π qi |hi|B~k |f i|2 δ(ω − ωf i ) qi Wi→f (~k, ω) = 2 |F~kω |2 4h̄ if (1.23) X 2π qf Wf →i (~k, ω) = 2 |F~kω |2 qf |hf |B −~k |ii|2 δ(ω − ωf i ) 4h̄ if (1.24) Dalle proprietà della funzione delta di Dirac, e dal fatto che B−~k è l’operatore aggiunto di B~k , si ottiene l’equazione del bilancio dettagliato, che collega le probabilità di transizione a e da uno stato del sistema: P (−~k, −ω) = exp(−h̄ω/kB T )P (~k, ω) (1.25) Segue che |P (−~k, −ω)| < |P (~k, ω)| cioè che il sistema assorbe più energia per unità di tempo di quanta non ne emetta, con una conseguente dissipazione di energia prelevata dal campo esterno. 1.1.3 Funzioni di correlazione temporale La suscettibilità complessa χ00BB può essere messa in relazione diretta con medie dell’osservabile B a tempi diversi, dette funzioni di (auto)correlazione temporali. 1.1. TEORIA DEI RESPONSI LINEARI 15 Definiamo la densità spettrale o fattore dinamico di forma come la funzione SB (~k, ω) = 2π X qi |hi|B~k |f i|2 δ(ω − ωf i ) (1.26) if che è direttamente proporzionale a P (~k, ω). Se si esprime la funzione delta di Dirac in forma integrale 1 δ(ω − ωf i ) = 2π Z +∞ −∞ dt exp[i(ω − ωf i )t] (1.27) la densità spettrale può essere riscritta come trasformata di Fourier di una funzione del vettore d’onda e del tempo: SB (~k, ω) = cBB (~k, t) = Z +∞ dt exp(iωt)cBB (t) (1.28) qi |hi|B~k |f i|2 exp(iωf i t) (1.29) −∞ X if Poichè |ii e |f i sono autostati dell’hamiltoniano del sistema isolato, possiamo scrivere cBB (~k, t) = X qi hi| exp(iH0 t/h̄)B~k exp(−iH0 t/h̄)|f ihf | − B −~k |ii = if X qi hi|B~k (t)|f ihf | − B −~k (0)|ii(1.30) if dove B~k (t) e B −~k (0) sono gli operatori B±~k rispettivamente al tempo t e al tempo 0, nella rappresentazione di Heisenberg Esercizio 3. Ricavate l’eq. (1.30). Si può procedere usando i) la proprietà di B~k e B −~k di essere operatori coniugati, ii) la definizione di ωf i e iii) la definizione di un operatore generico A(t) al tempo t nella rappresentazione di Heisenberg, data la sua forma A(t0 ) al tempo t0 A(t) = exp[iH0 (t − t0 )/h̄)]A(t0 ) exp[−iH0 (t − t0 )/h̄)] (1.31) L’equazione (1.30) permette il calcolo della funzione cBB (~k, t) come una traccia rispetto alla matrice densità di equilibrio del sistema, q̂, i cui elementi di matrice sono hm|q̂|ni = qm δm,n : cBB (~k, t) = Tr[q̂B~k (t)B−~k (0)] ≡ B~k (t)B(−~k)(0) (1.32) Possiamo valutare direttamente l’energia dissipata per unità di tempo e di volume dalle probabilità P (~k, ω) (assorbimento) e P (−~k, −ω) (emissione), come: Q(~k, ω) = h̄ω[P (~k, ω) − P (−~k, −ω)] (1.33) che può anche essere riscritta come la differenza dei fattori dinamici di forma SB (~k, ω) e SB (−~k, −ω). La somma e la differenza dei fattori dinamici possono ora essere scritti in termini di medie temporali degli operatori B ~ e tenendo conto della relazione esistente tra Q(~k, ω) e la parte immaginaria della suscettibilità ±k complessa, eq. (1.17), otteniamo infine le seguenti importanti relazione: µ χ00BB (~k, ω) = CBB (~k, t) = ¶Z +∞ h̄ω 1 tanh exp(iωt)CBB (~k, t) h̄ 2kB T −∞ 1 [B~ (t), B−~k (0)]+ 2 k (1.34) (1.35) 16 CAPITOLO 1. PROPRIETÀ DIPENDENTI DAL TEMPO IN FASI CONDENSATE dove CBB (~k, t) è la funzione di autocorrelazione del processo B al tempo t e numero d’onda ~k. La trasformata di Fourier della funzione di autocorrelazione è direttamente proporzionale alla parte immaginaria della suscettibilità e dunque all’energia dissipata JBB (~k, ω) = Q(~k, ω) = Z 1 +∞ dt exp(iωt)CBB (~k, t) 2π −∞ µ ¶ ωπ h̄ω tanh |F~kω |2 JBB (~k, ω) h̄ 2kB T (1.36) (1.37) L’equazione (1.37) è un esempio di relazione tra dissipazione e fluttuazione poichè collega la risposta di un sistema, o meglio l’energia dissipata dal sistema in seguito ad una risposta lineare ad una perturbazione debole esterna, ai moti molecolari. 1.1.4 Limite classico Fino ad ora si è considerato un sistema quantistico. Tuttavia, tutte le considerazioni sinora esposte possono essere traslate nell’mabito della meccanica classica. Consideriamo un sistema meccanico caratterizzato da M coordinate generalizzate q = (q1 , . . . , qM ) e dagli M momenti coniugati p = (p1 , . . . , pM ). Possiamo per esempio considerare il sistema come una collezione di N punti materiali descritti da 3N = M coordinate cartesiane ~ri , per quanto la descrizione possa essere facilmente generalizzata ad un sistema meccanico generico, formato sia da punti materiali che corpi rigidi (con le corrispondenti coordinate rotazionali e momenti angolari coniugati). Le coordinate cartesiane e i momenti lineari possono anche essere sostituite da altrettante coordinate generalizzate e dai loro momenti coniugati. Lo stato del sistema ad un certo istante t è descritto da un punto Γt dello spazio M -dimensionale, detto spazio delle fasi del sistema. Le equazioni canoniche del moto del sistema sono ~r˙ i = ∂H (1.38) ∂~ pi p~˙ i = − ∂H (1.39) ∂~ri per i = 1, . . . , M . Indichiamo con H = H({~ri }, {~ pi }. Lo stato al tempo t + τ del sistema Γt+τ è univocamente determinato dallo stato al tempo t - le equazioni della meccanica classica sono deterministiche. Per ogni stato Γt possiamo perciò individuare una traiettoria del sisteam come l’insieme dei punti dello spazio delle fasi ottenuti risolvendo le equazioni del moto con la condizione che al tempo t il sistema sia nel punto Γt . Consideriamo ora una proprietà del sistema B~k (Γ) = M X Bm (~rm , p~m ) exp(i~k · ~rm ) (1.40) m=1 La misura della correlazione tra il valore della proprietà B~k al tempo 0 ed al tempo t sarà in generale ottenibile come una media avente la forma 1 T →∞ T hB−~k (0)B~k (t)i = lim Z T 0 dt0 B−~k (Γt0 )B~k (Γt+t0 ) (1.41) 1.1. TEORIA DEI RESPONSI LINEARI 17 Se ora utilizziamo le metodologie della meccanica statistica classica, assumendo che valgano le condizioni per descrivere il sistema, a partire dal tempo t = 0, nell’ambito di un insieme statistico canonico, possiamo sostituire, in forza dell’ipotesi ergodica, alla media temporale dell’equazione precedente una media rispetto alla distribuzione canonica ρ(Γ0 ) del prodotto B−~k (Γ0 )B~k (Γt ). Discende perciò che la funzione di autocorrelazione può essere scritta come cl ~ hB−~k (0)B~k (t)i ≡ CBB (k, t) = Z dΓ0 ρ(Γ0 )B−~k (Γ0 )B~k (Γt ) (1.42) alla meccanica classica elementare è noto che la variazione temporale di una proprietà di un sistema meccanica è data dall’equazione (classica) di Liouville che esprime la derivata totale temporale di una generica proprietà f = f ({~ri }, {~ pi }) 1 df = iLcl f dt (1.43) L’operatore classico di Liouville iLcl è definito in termini delle parentesi di Poisson iLcl f = {f, H} ≡ N X i=1 ∂f ∂~ri · ∂H ∂~ pi − ∂f ∂~ pi · ∂H (1.44) ∂~qi La soluzione formale dell’equazione di Liuoville è scritta immediatamente come f (t) = exp(iLcl t)f (0) (1.45) L’operatore exp(iLcl t) è detto propagatore temporale; è possibile ora esprimere B~k (Γt ) utilizzando il propagatore temporale e riscrivere la funzione di autocorrelazione come cl ~ CBB (k, t) Z = dΓ0 ρ(Γ0 )B−~k (Γ0 ) exp(iLcl t)B~k (Γ0 ) (1.46) Tecnica di misura Osservabile Funzione di correlazione Diffusione traslazionale Velocità del centro di massa di una molecola sonda h~v (0) · ~v (t)i Diffusione rotazionale Velocità angolare una molecola sonda hω(0) · ω(t)i Assorbimento infrarosso Vettore momento di dipolo di transizione hµ(0) · µ(t)i Scattering Raman Vettore momento di dipolo di transizione hP2 [µ(0) · µ(t)]i Forma di riga NMR Componente x della magnetizzazione hMx (0)Mx (t))i Tabella 1.1: Osservabili e funzioni di correlazione temporale 1 Nell’ipotesi che f non dipenda esplicitamente da t ma solo dalle coordinate e dai momenti del sistema 18 CAPITOLO 1. PROPRIETÀ DIPENDENTI DAL TEMPO IN FASI CONDENSATE Parte II Metodi complementari ed avanzati del calcolo quantomeccanico 19 Capitolo 2 Cenni a metodi semiempirici e tecniche avanzate 2.1 Metodi semiempirici Come è stato già accennato nell’introduzione, i vari metodi semiempirici comportano l’introduzione di approssimazioni e semplificazioni nella forma degli hamiltoniani elettronici e nella definizione degli integrali mono e multi-centro che devono essere valutati nel corso di un calcolo esatto. È abbastanza difficile dare delle classificazioni generali dei vari metodi semiempirici. Di conseguenza discuteremo il piú semplice (e forse, malgrado tutto, ancora piú usato) schema semiempirico, l’approssimazione di Hückel, come un esempio particolare degli schemi generali di approssimazione tipici di molti metodi semiempirici. Questa Sezione si concluderà poi con un richiamo alla classe di metodi semiempirici del tipo NDO. 2.1.1 Metodo di Hückel Il metodo di Huc̈kel è applicabile a molecole organiche, nelle quali sia possibile separare una classe di elettroni relativamente localizzati ed inattivi, tipicamente impegnati in legami σ, e un’insieme di elettroni delocalizzati e reattivi, impegnati in legami π. La natura di questa identificazione può non essere affatto chiara, anche se nei casi più comuni (p. es. l’insieme di legami coniugati nei sistemi aromatici) risulta essere abbastanza ovvia. Le classi piú comuni di molecole coinvolte sono: • Polieni lineari: es. 1,3-butadiene; • idrocarburi aromatici: benzene, naftalene; • etero-molecole aromatiche: piridina, furano, acroleina; Il sistema più semplice è il radicale planare CH3 · (1s)2 (Ω )2 (Ω )2 (Ω )2 (2p ) 1 2 3 z 2 Ω = 1s + λsp i H (1s)2 : inner shell (Ωi )2 : elettroni σ (2pz ) : elettrone π 21 22 CAPITOLO 2. CENNI A METODI SEMIEMPIRICI E TECNICHE AVANZATE 2p z H C H H Figura 2.1: Radicale CH3 · Un tentativo di sistematizzazione dell’approssimazione di Hückel è stato dato da Likos e Parr nell’ambito di un formalismo di partenza di tipo Hartree-Fock. Sotto le condizioni di separabilità σ − π si può separare il calcolo della parte della funzione d’onda riferita ai soli orbitali π. Le equazioni di Roothaan per l’hamiltoniano π−HF: Fπ C = ∆C² (2.1) generano il seguente problema agli autovalori per la determinazione dei livelli energetici: |Fπ − ²∆| = 0 (2.2) Come è tipico di quasi tutte le metodologie di calcolo semiempiriche, il passo successivo è dato dalla parametrizzazione degli elementi di matrice: ∆rs = δrs (2.3) Frr = αr (2.4) Frs β r = 0 atomi primi vicini altrimenti (2.5) αr è l’integrale di Coulomb, βr è l’integrale di risonanza. In assenza di eteroatomi: αr = α (2.6) βr = β (2.7) Ponendo x = (α − ²)/β, il calcolo è ricondotto alla diagonalizzazione della matrice topologica A: |A − x1| = 0 (2.8) 2.1. METODI SEMIEMPIRICI 2p 23 2p z z 2p C C 2p z z 2 1 C C 4 3 Figura 2.2: Esempio: 1,3-butadiene. dove Ars è 1 per atomi primi vicini, 0 altrimenti. Consideriamo p. es. il caso dell’1,3-butadiene. La matrice topologica è data da: 0 1 0 0 1 A= 0 0 1 0 (2.9) 1 0 1 0 0 1 0 Il gruppo di simmetria a cui appartiene il trans-1,3-butadiene è il C2h . C2h E C2 i σh Ag 1 1 1 1 Rz , x2 , y 2 , z 2 , xy Au 1 1 -1 -1 z Bg 1 -1 1 -1 Rx , Ry , xz, yz Bu 1 -1 -1 1 x, y Tabella 2.1: Tabella dei caratteri del gruppo C2h R̂ R̂φ1 R̂φ2 R̂φ3 R̂φ4 E φ1 φ2 φ3 φ4 C2 φ4 φ3 φ2 φ1 i −φ4 −φ3 −φ2 −φ1 σh −φ1 −φ2 −φ3 −φ4 Tabella 2.2: Funzioni φi in C2h 24 CAPITOLO 2. CENNI A METODI SEMIEMPIRICI E TECNICHE AVANZATE Possiamo perciò utilizzare la simmetria delle funzioni di base nel gruppo C2h per semplificare il calcolo. La rappresentazione riducibile è 2Au ⊕ 2Bg . I livelli energetici calcolati corrispondono a due funzioni d’onda au e 2 funzioni d’onda bg : ²(2bg ) = α − 1.618β ²(2au ) = α − 0.618β ²(1bg ) = α + 0.618β ²(1au ) = α + 0.618β la configurazione dello stato fondamentale è (1au )2 (1bg )2 =1 Ag Se si fosse partiti dall’isomero cis i risultati finali non sarebbero stati diversi (poichè la matrice topologica dipende solo dalla struttura topologica, cioè dalle connessioni tra atomi, e non dalla loro disposizione nello spazio), anche se si sarebbe dovuto impiegare, per sfruttare proprietà di simmetria, il gruppo C2v . 2.1.2 Neglect-of-differential-overlap (NDO) Concludiamo questa Sezione con un cenno alla classe di metodi semiempirici del tipo NDO. Il differential overlap tra due funzioni atomiche φk e φl è definito come la probabilità di trovare l’elettrone i-esimo in un elemento di volume comune: dkl = φk (i)φl (i) (2.10) L’approssimazione zero-differential-overlap (ZDO) consiste nel porre: dkl = dkk δkl (2.11) L’approssimazione ZDO comporta varie conseguenze nella valutazione dei gli integrali di overlap, di Coulomb etc.: Skl = hφk |φl i ∝ δkl Nn = Zn hφk | r1ni |φl i ∝ δkl overlap (2.12) interazione elettrone-nucleo J, K = hφk (i)φm (j)| r1ij |φl (i)φn (j)i ∝ δkl δmn scambio e repulsione (2.13) (2.14) Lascia però inalterati gli integrali che coinvolgono operatori differenziali: ˆ 2 |φl i Ii = hφk |∇ i energia cinetica (2.15) I vari metodi semiempirici implicano sia regole di eliminazione o semplificazione degli integrali multicentro che di parametrizzazione di alcuni o tutti gli integrali rimanenti. I parametri ottimizzabili del calcolo sono di solito gli integrali a 1 elettrone e parti degli integrali a 2 elettroni (nel caso precedente dell’approssimazione di Hückel i numeri α e β). I vari schemi NDO corrispondono a diverse parametrizzazioni, fatta salva la comune applicazione a diversi livelli di sofisticazione, dell’approssimazione NDO. • Complete NDO; Pople et al.; adotta l’approssimazione ZDO 2.2. IL METODO DEL FUNZIONALE DENSITÀ 25 – CNDO/1 – CNDO/2 • Intermediate NDO; adotta l’approssimazione ZDO solo per gli integrali a 2 centri • Modified NDO; Pople et al.; INDO con una parametrizzazione più complessa – MNDO/1 – MNDO/2 – MNDO/3 • Partial Neglect of Diatomic DO; MNDO solo per orbitali su centri diversi. Il metodo MNDO è stato utilizzato per calcolare calori di formazione, ottimizzare geometrie molecolari, calcolare potenziali di ionizzazione e momenti di dipolo, rivelandosi utile soprattutto per idrocarburi ciclici, ma dimostrando per esempio di non essere in grado di descrivere quantitativamente interazioni dovute a legami idrogeno. Metodi semiempirici più sofisticati sono ormai disponibili da molti anni in letteratura: ricordiamo tra gli altri i metodi PM3 e AM1. 2.2 Il metodo del funzionale densità Il metodo del funzionale densità (density functional, DF) è divenuto, a partire dai primi anni ’80, una delle tecniche computazionali più versatili per il calcolo di strutture elettroniche molecolari. Il metodo DF è al giorno d’oggi applicato con successo al calcolo di dati termochimici, strutture molecolari, frequenze e campi di forza, interpretazione di segnali NMR, ESR ed UV, studio di stati di transizione, calcolo di momenti dipolari etc. La popolarità del metodo DF è basata su • la sua applicabilità a sistemi molecolari relativamente grandi (50-100 atomi): a differenza di altri metodi post-HF) il metodo DF non riscala in modo proibitivo con il numero di elettroni del sistema • l’accordo dimostrato con dati sperimentali di vario tipo, grazie alla descrizione relativamente accurata dell’energia di correlazione del sistema. Consideriamo un sistema di N elettroni. Sia H l’hamiltoniano elettronico, (privo di termini d’interazione con i nuclei) del sistema e sia Ψ la funzione d’onda dello stato fondamentale, che supponiamo non degenere. Sia infine ρ(~r) la densità elettronica nel punto ~r, che è in generale una funzione soggetta al vincolo Z d~rρ(~r) = N (2.16) Alla base del metodo DF è la possibilità, formalmenta dimostrata da Hohenberg e Kohn nel 1964, ed in seguito ulteriormente elaborata da Levy, di scrivere l’energia dello stato fondamentale del sistema come un funzionale della densità elettronica. Si può infatti affermare che 26 CAPITOLO 2. CENNI A METODI SEMIEMPIRICI E TECNICHE AVANZATE 1. esiste un funzionale universale F hΨ|H|Ψi = F [ρ] (2.17) 2. in presenza di un potenziale ’esterno’ V (~r), e nel nostro caso il potenziale esterno sarà sempre identificato con l’interazione con M nuclei fissi M X Zp ~ r| p=1 |Rp − ~ V (~r) = − (2.18) l’energia dello stato fondamentale E del sistema è legata ad F dalla relazione Z E[ρ] = d~rV (~r)ρ(~r) + F [ρ] (2.19) Il funzionale f avrà un minimo in corrispondenza della esatta densità ρ corrispondente alla esatta funzione d’onda Ψ. Nota la forma del funzionale è perciò possibile in linea di principio risolvere il problema variazionale di minimizzare il funzionale E[ρ] rispetto alla funzione ρ, con il vincolo (2.16). Il metodo DF prevede la definizione di una forma approssimata del funzionale F , o di alcune sue parti, in una forma conveniente per il calcolo del minimo di E. 2.2.1 Equazioni di Kohn-Sham L’implementazione usuale del metodo del funzionale densità è basata sulle equazioni di Kohn-Sham, che riconducono il calcolo di una struttura multielettronica alla determinazione di un insieme di orbitali monoelettronici, in analogia con il trattamento tradizionale HF. È dato un sistema di N elettroni interagenti, e sottoposti al potenziale esterno V (~r). Secondo il modello monoelettronico KS, è possibile associare al sistema cosı̀ definito un insieme di orbitali monoatomici φi (~r) (i = 1, . . . , N ) che consentono di scrivere senza alcuna approssimazione l’energia totale del sistema nella forma Z E = T [ρ] + ρ(~r1 )V (~r1 )d~r1 + 1 2 Z ρ(~r1 )ρ(~r2 ) d~r1 d~r2 + Exc |~r1 − ~r2 | (2.20) dove il primo termine T [ρ] è un funzionale che rappresenta l’energia cinetica di un sistema di N elettroni non interagenti T [ρ] = − 1X 2 i Z 2 ˆ φi (~r) φ∗i (~r)∇ (2.21) che abbiano la medesima densità del sistema originario, definita in funzione degli orbitali come ρ(~r) = N X |φi (~r)|2 (2.22) i=1 Il secondo termine tiene conto dell’interazione elettronico-nucleare, mentre il terzo esplicita l’interazione coulombiana tra le due distribuzioni di carica ρ(~r1 ) e ρ(~r2 ). L’equazione (2.20) è determinata a meno 2.2. IL METODO DEL FUNZIONALE DENSITÀ 27 della quantità Exc , detta energia di scambio-correlazione (exchange-correlation), e che riveste un ruolo fondamentale nella metodologia DF. La scelta di una forma funzionale per Exc determina in ultima analisi l’accuratezza del calcolo, e costituisce il nucleo centrale di qualunque applicazione del metodo DF. Gli orbitali elettronici sono determinati mediante le equazioni di Kohn-Sham, che ricordano molto da vicino le corrispondenti equazioni HF ĥKS φi = ²i φi (2.23) dove l’operatore monoelettronico ĥKS è definito come 1 ˆ2 + VKS (~r) ĥKS = − ∇ 2 (2.24) Il potenziale efficace di Kohn-Sham è definito come la somma del potenziale esterno, di un termine che dipende dall’interazione coulombiana e della derivata funzionale dell’energia di scambio-correlazione: Z VKS (~r) = V (~r) + Vxc (~r) = ρ(~r0 ) d~r0 + Vxc (~r) |~r − ~r0 | δExc δρ (2.25) (2.26) Le equazioni KS possono essere risolte con la procedura di Roothaan, vale a dire espandendo gli orbitali φi in funzione delle funzioni di base note, e risolvendo il sistema non lineare nei coefficienti dell’espansione in modo iterativo. 2.2.2 Funzionali densità Evidentemente, poichè la determinazione dell’energia di scambio-correlazione non è possibile in modo esatto, è necessario ricorrere ad approssimazioni. Il modello più semplice per definire in modo approssimato il funzionale Exc è detto modello del gas omogeneo di elettroni, e separa il contributo di scambio dal contributo di correlazione: Exc = Ex + Ec (2.27) il primo termine, l’energia di scambio, si ottiene integrando l’energia di un gas uniforme di elettroni di densità ρ su tutto lo spazio delle fasi. Si ottiene l’espressione 3 Ex = − 2 sµ ¶ Z 3 X ρσ (~r)4/3 d~r 4π σ (2.28) dove l’indice σ è riferito agli stati di spin α e β. Il secondo termine Ec è detto energia di correlazione, ed è descrivibile nei termini dell’energia di correlazione per elettrone, ²c [ρα , ρβ ] in un gas con densità ρα e ρβ Z Ec = ρ(~r)²c [ρα (~r), ρβ (~r)]d~r varie forme funzionali sono state proposte per l’energia specifica di correlazione ²c . (2.29) 28 CAPITOLO 2. CENNI A METODI SEMIEMPIRICI E TECNICHE AVANZATE Parte III Trattamenti quantistici e semiclassici di fasi condensate A cura della D.ssa Silvia Carlotto 29 Capitolo 3 Metodologie ed applicazioni dei metodi ibridi QM/MM 3.1 Introduzione Gli effetti solvente influenzano significativamente la struttura e la reattività delle specie in soluzione ed è per questo che la chimica teorica cerca da decenni di sviluppare metodi computazionali che riescano a descrivere ed a prevedere in maniera quantitativa il comportamento di specie chimiche in soluzione. Questi problemi possono essere trattati a livello molecolare utilizzando metodi di dinamica molecolare e il metodo Monte Carlo nei quali le molecole di soluto sono posizionate in celle unitarie periodiche che contengono anche centinaia o migliaia di molecole di solvente. Le proprietà termodinamiche sono ottenute con un effetto medio sulle configurazioni. La chiave del successo delle simulazioni computazionali di sistemi in fasi condensate è la disponibilità di funzioni che descrivano in modo accurato l’energia potenziale considerando opportunamente le interazione intermolecolari. Teoricamente i metodi quantomeccanici ab-initio (QM) potrebbero essere utilizzati per calcolare sistematicamente le interazioni intermolecolari in soluzione e generare i dati energetici e strutturali necessari. In pratica è impossibile trattare un intero sistema in fase condensata mediante calcoli quantistici perchè il tempo di calcolo necessario, anche con il computer piú veloce attualmente disponibile, sarebbe proibitivo anche per sistemi di piccole dimensioni. Devo quindi essere fatte delle approssimazioni. In genere vengono utilizzate delle funzioni empiriche per il potenziale ma sono difficili da associare al molecular mechanics (MM) force field. La difficoltà è dovuta al fatto che la struttura elettronica non viene esplicitamente rappresentata, i campi di forza MM non sono adeguati e le funzioni empiriche che descrivono il potenziale (e di conseguenza i semplici metodi di dinamica molecolare) non sono in grado di descrivere neppure approssimativamente reazioni chimiche evolvono con rottura o formazione di un legame. I sistemi di interesse chimico in biologia computazionale e nella catalisi, per fare un esempio dei campi di maggiore applicazione, sono sistemi in fasi condensate composti da molte migliaia di atomi gli studi ed è per questo che negli ultimi anni sono aumentati rapidamente gli studi e di conseguenza le pubblicazioni e le reviews [18] sui metodi QM/MM con conseguente sviluppo di adeguati software per la loro implementazione (CHARMM). 31 32 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM L’approccio alternativo dei metodi ibridi QM/MM consiste nel suddividere il sistema in due parti trattando una parte mediante metodi QM e una parte mediante una metodologia classica MM. 3.2 I metodi ibridi QM/MM Lo sviluppo dei metodi ibridi QM/MM che inizia con gli studi pionieristici di Warshel e Levitt [19] e di Singh e Kollman [20] segue come linea generale l’idea che un sistema chimico composto da centinaia o migliaia di atomi possa essere partizionato (3.1) in una regione elettronicamente importante che richiede un trattamento quantomeccanico e la rimanente regione che agisce in modo perturbativo e ammette una descrizione classica. La perturbazione potrebbe essere principalmente meccanica, ad esempio se le forze della regione classica costringono la regione quantistica in una particolare geometria, ma possono includere anche effetti elettronici come l’elettrostatica e la polarizzazione. In questo modo il sistema di reazione (o il sito attivo di un enzima) è trattato esplicitamente mediante una metodologia QM mentre le molecole di solvente che rappresentano l’ambiente di reazione (o gli amminoacidi adiacenti) e costituiscono la parte computazionalmente più pesante nel calcolo delle superfici di potenziale sono trattate mediante MM force field standard. I metodi ibridi hanno Figura 3.1: Rappresentazione schematica della partizione di un sistema in fase condensata. il merito di combinare gli approcci classici e quantistici. La parte quantistica permette il calcolo delle proprietà dello stato fondamentale ed elettronico o dei potenziali di ionizzazione nelle reazioni chimiche e richiede una limitata (semiempirici) o addirittura assente (ab-initio) parametrizzazione mentre il successo del campo di forza classico MM è fortemente dipendente dalla calibrazione di un elevato numero di parametri rispetto ai dati sperimentali. La parte classica porta una notevole efficienza computazionali. Dal momento che la struttura elettronica coinvolta nella reazione e le interazioni soluto-solvente sono determinate mediante calcoli 3.2. I METODI IBRIDI QM/MM 33 quantistici queste procedure si dimostrano di notevole interesse per lo studio di reazioni chimiche. Inoltre gli effetti di polarizzazione del solvente sul soluto sono inclusi nei calcoli QM mediante un modello che descrive il solvente come un dielettrico continuo e calcola l’energia di solvatazione usando il campo di reazione di Onsager. I modelli di questo tipo hanno il vantaggio di essere efficienti per i contributi elettrostatici a lungo raggio nella solvatazione ma non considerano le specifiche interazioni soluto-solvente. In molti casi è invece necessario includere esplicitamente queste interazioni. Conseguentemente è stato sviluppato un modello che tratta il soluto insieme a poche molecole di solvente nei calcoli QM ed incorpora poi esplicitamente modelli classici per il solvente come descritto da Warshel [21] nella teoria del legame empirico di valenza (EVB). Rimane quindi il problema di come includere esplicitamente gli effetti solvente nei calcoli QM, cioè di come trattare la regione tra i sottoinsiemi QM e MM. In teoria la divisione tra le due regioni potrebbe sembrare piuttosto semplice e netta ma raramente è possibile scrivere l’energia totale del sistema in termini di due sottosistemi non interagenti. Molto spesso invece le interazioni tra i due sottosistemi sono piuttosto forti (il caso piú ovvio è quello della presenza di un legame chimico di qualsiasi natura) tanto da rendere necessari dei trattamenti particolari nella zona tra la regione QM e la regione MM. Questi approcci per lo studio delle terminazioni dei metodi QM possono essere grossolanamente divisi in due gruppi principali: 1. approcci basati sui link atoms nei quali vengono aggiunti dei centri addizionali solo nei calcoli QM ma che non sono presenti nell’intero sistema 2. approcci che presentano una boundary region tra la regione QM e MM; i centri che si trovano in tale regione sono soggetti sia a calcoli QM che MM L’ultimo aspetto da considerare per descrivere nella sua interezza il sistema in esame riguarda le condizioni al contorno, cioè l’energia dovuta ai vincoli applicati nella parte più esterna della regione MM e che permette di mantenere la struttura. L’energia totale di un sistema cosı̀ definito può essere espressa in modo semplificato come: E = E(QM ) + E(M M ) + E(QM/M M ) + E(contorno) (3.1) dove E(QM) rappresenta l’energia della regione QM come se fosse isolata, il termine E(MM) fornisce l’energia del sistema MM, E(QM/MM) è l’energia di interazione tra le regioni QM e MM che dipende da come viene definito il sistema in questa delicata regione. Questo termine energetico, che include tutti i termini di accoppiamento tra le due regioni, deve tener conto delle interazioni di van der Waals e delle modificazioni dell’Hamiltoniano QM che possono influenzare la regione MM come ad esempio perturbazioni elettrostatiche (non trascurabili in presenza di link atoms). Infine E(contorno) è il termine energetico dovuto ai vincoli imposti nella parte più esterna della regione MM. Nelle sottosezioni successive si andranno a descrivere le metodologie applicabili in ogni regione nella quale è stato diviso il sistema e si tenterà di riportare alcuni buoni criteri di scelta per riuscire a districarsi tra le varie metodologie particolari che sono state sviluppate. 3.2.1 I metodi QM La scelta del metodo QM da utilizzare nei metodi ibridi QM/MM segue fondamentalmente gli stessi criteri da applicare ai puri calcoli QM e cioè si tratta di accettare un ragionevole compromesso tra l’efficienza 34 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM computazionale e l’accuratezza chimica desiderata. I metodi quantomeccanici per lo studio di molecole possono essere divisi in due categorie: metodi ab-initio e metodi semiempirici. I metodi ab-initio assicurano un’elevata accuratezza ma questa comporta tempi di calcolo proibitivi anche per sistemi di ridotte dimensioni. Tra questi metodi si include l’Hartree-Fock (HF) o teoria dell’orbitale molecolare (MO), la teoria dell’interazione di configurazione (CI), la teoria perturbativa (PT) e la teoria del funzionale densità (DFT). I metodi semiempirici si trovano a metà strada tra un metodo ab-initio e un metodo MM perchè come i secondo utilizzano parametri derivati sperimentalmente per migliorare l’accuratezza ma restano comunque una metodologia di natura quantomeccanica. I metodi semiempirici sono molto più veloci computazionalmente perch eliminano il calcolo di alcuni integrali particolarmente complicati e l’errore introdotto con questa drastica operazione viene compensato attraverso l’uso di parametri: i risultati sono considerati comparabili con calcoli ab-initio che utilizzano uno split valence basis sets 3-21G. Tra queste metodologie possono essere citate l’Austin model 1 (AM1), il PM3, l’EVB, lo ZINDO. La maggior parte delle implementazioni nella regione quantistica sono trattate mediante il metodo empirico del legame di valenza (EVB) di Warshel [21] che include un Hamiltoniano parametrizzato o con metodi semiempirici come AM1 [22] che hanno il vantaggio di essere computazionalmente poco pesanti ma presentano altre notevoli limitazioni. Le maggiori limitazioni sono l’accuratezza e l’affidabilità oltre al fatto che devono essere opportunamente parametrizzate per riprodurre le proprietà delle molecole nello stato fondamentale, parametri che sono disponibili per un limitato range di elementi. Per sopperire a questi limitazioni ultimamente sono stati sviluppati [23] metodi HF [24],[25] e DFT [26],[27],[28] per i calcoli nella regione QM. Entrambi questi metodi assicurano un’elevata accuratezza quantitativa e il DFT è computazionalmente poco costoso pur includendo la correlazione elettronica. Recentemente sono stati implementati programmi basati sul Car-Parrinello DFT [29]. In generale non è quindi possibile determinare i sistemi da studiare con una metodologia rispetto ad un’altra. Fino a poco tempo fa la miglior scelta per problemi inerenti ad applicazioni organiche e biologiche erano sicuramente i metodi semiempirici tanto che la maggior parte dei calcoli riportati in letteratura utilizzano questi metodi; ora però si sono dimostrati competitivi anche i metodi HF e DFT in particolare per lo studio delle reazioni chimiche in sistemi enzimatici e per gli studi sulla complessazione [23]. 3.2.2 I metodi MM La seconda importante componente della metodologia QM/MM è il campo di forza MM, cioè un set di equazioni matematiche che descrivono l’energia in termini di una distorsione dai valori ideali. Anche se lo scopo della trattazione è la scelta del metodo MM può essere utile una breve descrizione su campi di forza empirici che vengono utilizzati nello studio di liquidi e proteine. Il maggior merito delle simulazioni computazionali di sistemi molecolari è la predizione di strutture di equilibrio e la riproduzione della dinamica dei moti molecolari entrambe definite in termini di forze intra e intermolecolari. Per ottenere questi risultati è necessario conoscere l’energia potenziale del sistema in funzione della struttura molecolare o delle coordinate interne. L’intuizione chimica e l’esperienza dimostrano che atomi e legami mostrano una certa regolarità e valori caratteristici che si riflettono sulla geometria di equilibrio, sulle frequenze vibrazionali e sulle energie di dissociazione. La MM assume che l’energia potenziale di una molecola vicino alla configurazione di equilibrio 3.2. I METODI IBRIDI QM/MM 35 sia semplicemente una funzione della distanza atomica, degli angoli di legame, etc P E(M M ) = + P bonds E(bonds) + non−bonds E(non P angles E(angles) − bonds) + P i6=j + P dihed. E(dihed.)+ E(vdW ) + P i6=j E(elect.) (3.2) dove l’energia è funzione rispettivamente dello stretching dei legami, del bending degli angoli, degli angoli torsionali, delle interazioni di non-legame e dei vari termini di accoppiamento. un problema pratico in MM è la scelta delle coordinate interne per specificare e definire l’energia molecolare. Tutti i termini descritti nell’equazione sono ricavati attraverso una parametrizzazione del campo di forza ma la determinazione delle costanti di forza non è un procedimento semplice. Innanzitutto si parte definendo un set di molecole e le si associa a determinate proprietà sperimentali che andranno interpolate mediante opportuni campi di forza. I parametri risultanti saranno utilizzati per predire le proprietà di altre molecole. Le proprietà sperimentali includono la struttura molecolare in fase gas, le frequenza vibrazionali, le barriere torsionali, l’energia dei legami idrogeno, l’energia libera di solvatazione, etc In generale la scelta del modello MM [30] da utilizzare dipende può essere significativamente influenzata dal trattamento utilizzato per descrivere la regione di confine tra QM e MM i cui approcci rispetto alle interazioni di legame e di non-legame possono essere notevolmente diversi. La più importante distinzione si ha tra (a) campi di forza di valenza esemplificati da campi di forza biomolecolari (CHARMM e AMBER) e costruiti da termini energetici come lo stretch di legame, il bend degli angoli, etc (b) campi di forza ionici i cui termini principali sono le forze elettrostatiche e a corto raggio (van der Waals). Per la scelta del modello MM si devono quindi precedentemente stimare due aspetti: (a) la scelta del campo di forza influenza la carica parziale atomica che a sua volta ifluisce sulle interazioni QM/MM a lungo raggio, nell’implementazione si utilizza la stessa carica per le interazioni MMMM e MMQM. Il campo di forza ionico tende a generare una carica più grande di quella generata dall’interpolazione del potenziale elettrostatico. In molti casi si sviluppano cariche ioniche formali. (b) Il trattamento dei legami e i contatti interionici tra le regioni QM e MM seguono generalmente lo stesso approccio utilizzato per le interazioni nella regione MM. Nel caso del campo di forza di valenza si identificano facilmente i termini derivati dallo stretch dei legami e dal bend degli angoli e possono quindi essere eliminati i termini che derivano dall’interazione QM. Nei campi di forza ionici i termini di interazione attrattiva a corto-raggio QMMM derivano dalla presenza di cariche MM nell’Hamiltoniano QM e di conseguenza non possono essere separate dalle interazioni a lungo-raggio. Per queste ragioni è più semplice utilizzare un campo di forza di valenza. La classe di forze di tipo ionico può essere utilizzata nella regione di confine tra QM e MM ma solamente se le cariche riescono a generare un corretto potenziale elettrostatico nella regione QM. I metodi MM quindi considerano gli elettroni in maniera esplicita ma non trattano la polarizzazione o il trasferimento elettronico. Non considerano neppure la rottura o la formazione di legami e non possono di conseguenza essere usati per simulare reazioni chimiche. Sono invece ampiamente utilizzati per simulare sistemi di notevoli dimensioni come ad esempio le proteine transmembrana. 36 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM 3.2.3 Trattamento dei termini di accoppiamento di non-legame QM/MM Nella maggior parte dei modelli classici le interazioni di non-legame comprendono le forze elettrostatiche e le forze a corto-raggio o di van del Waals. Nel contesto delle metodologie QM/MM è applicata la stessa nomenclatura per le interazioni di non-legame tra i centri QM e MM. I termini di interazione a corto raggio o di Lennard-Jones Il trattamento delle interazioni QM/MM a corto-raggio segue generalmente lo stesso modello utilizzato per i calcoli MM. Spesso è necessario un nuovo fitting rispetto ai parametri di non-legame ed in particolare nel caso degli studi sulla solvatazione [31] o dove sono particolarmente importanti i contatti dettagliati di non-legame. I termini di interazione elettrostatica Il trattamento delle interazioni elettrostatiche nella regione di confine QM/MM è descritto mediante tre vie da Bakowies e Thiel [32]. I tre metodi sono etichettati come modello A, modello B e modello C: A. modello meccanico nel quale i calcoli QM sono essenzialmente ottenuti in fase gas senza accoppiamento elettronico con l’ambiente. L’energia QM e MM è calcolata separatamente, viene separato il rilassamento MM. Le interazioni elettrostatiche tra le regioni QM e MM sono omesse o incluse nei calcoli MM utilizzando un modello classico di carica puntuale per la distribuzione di carica QM. Esempi di questo modello sono dati da Morokuma (IMOMM) e Bakowies e Thiel (MNDO/MM) B. modello elettrostatico nel quale la partizione classica appare come una distribuzione di cariche esterna nell’Hamiltoniano QM. La polarizzazione della regione QM da parte della distribuzione di carica della regione MM avviene nei calcoli della struttura elettronica QM. Le cariche parziali utilizzate per descrivere la distribuzione in MM sono le stesse che si ricavano dai campi di forza. Nello schema ab-initio il modello B è implementato aggiungendo il contributo delle cariche puntuali MM nell’Hamiltoniano monoelettronico C. modello di polarizzazione nel quale viene inclusa la polarizzazione della regione MM dovuta alla distribuzione di carica in QM. 3.2.4 Regione di interazione QM/MM che presenta legami tra gli atomi Nel paragrafo precedenti si sono considerati i termini di accoppiamento di non-legame e cioè si sono esplicitate le interazioni che intercorrono tra atomi che non sono legati. Ma che cosa avviene quando esiste un legame ad esempio di tipo covalente tra gli atomi delle regione QM e quelli nella regione MM? La (3.2) presenta schematicamente la situazione in esame. In generale si può anticipare che deve essere mantenuta sia la valenza della regione QM che la geometria del sistema MM. Solitamente si assume che non ci sia trasferimento di carica tra la regione QM e MM, un’ipotesi abbastanza ragionevole per soluzioni diluite nelle quali le molecole di soluto sono trattate mediante la meccanica quantistica mentre il solvente è affrontato classicamente. La regione di confine può essere sistemata in modo che non ci siano legami covalenti tra i due sottosistemi ma è facile immaginare che la maggior parte dei sistemi organici non cadano in questa categoria. Nei 3.2. I METODI IBRIDI QM/MM 37 Figura 3.2: Schema delle regioni QM e MM divise da un legame covalente. casi in cui ci sono legami o forti interazioni ioniche tra i sottosistemi è necessario introdurre particolari terminazioni per i calcoli QM come ad esempio attraverso link atom o approcci per la boundary region. Oltre a queste metodologie più comunemente utilizzate sono stati sviluppati altri metodi come il metodo EVB [33], il metodo EFP [34] e il metodo GHO [35]. La prima descrizione della rappresentazione di un legame covalente che connette atomi della regione QM e delle regione MM venne effettuata da Warshel e Levitt che utilizzarono degli orbitali ibridi sull’atomo MM [36]. Durante quello studio venne sviluppato il metodo semiempirico QCFF/ALL che include tutti gli elettroni di valenza con gli orbitali atomici ibridi. Ma l’approccio più comunemente utilizzato per trattare la terminazione di siti che presentano legami covalenti è il metodo dei link atoms [19] introdotto da Singh e Kollman [20] e schematizzato in (3.3). In questo metodo vengono introdotti degli atomi addizionali che formano un legame covalente con la regione QM che dovrebbe mimare il legame con la regione MM. Questi atomi legati soddisfano la valenza degli atomi QM. Il più semplice ed ancora più utilizzato atomo legato è l’atomo di idrogeno che viene posizionato lungo il legame QM/MM che è stato rotto. Possono essere utilizzati anche altri atomi o gruppi funzionali come gli alogeni o i gruppi metile. Ci sono delle evidenti differenze chimiche tra gli atomi di idrogeno ed i gruppi che vanno a replicare e per questo Antes e Thiel [37]. I link atoms sono trattati in maniera esatta nei calcoli QM ma non è permesso loro di interagire con gli atomi MM (è come se risultassero invisibili agli atomi MM), l’energia e le forze risultano dai termini energetici di legame. I termini elettrostatici e di van der Waals che si considerano di non-legame sono trattati separatamente: (a) le interazioni di van der Waals attraverso la regione QM e MM sono determinati in modo esatto come se l’intero sistema fosse classico mentre (b) l’energia di interazione elettrostatica è ottenuta da calcoli quantomeccanici sugli atomi QM insieme ai link atoms in presenza di tutte le cariche parziali MM escluse quelle prodotte dai link atoms. Chiaramente il 38 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.3: Rappresentazione del metodo link-atoms. metodo non rappresenta un approccio ideale perch dovrebbe essere introdotta una perturbazione del sistema, ma si dimostra particolarmente utile quando i link atoms sono relativamente lontani rispetto agli atomi che partecipano alle reazioni chimiche. Molteplici sono gli autori [38],[39] che in questi anni hanno studiato questo problema proponendo ad esempio nuovi metodi del modello [39] degli atomi legati che soddisfa la valenza del sistema quantico ma la posizione degli atomi legati dipende dalla posizione degli atomi reali agli estremi del legame covalente che è stato troncato; non vengono introdotti nuovi gradi di libertà al sistema dovuti ai link atoms. Un altro tipo di approccio molto utilizzato sviluppa il trattamento dei legami costringendo la soluzione a riflettere l’influenza dei legami che precedentemente sono stati omessi. Un primo metodo è lo schema local self-consistent field (LSCF) sviluppato da Rivail e co. [40] che utilizza dei frozen orbital (o orbitali di legame localizzati) parametrizzati degli orbitali lungo il legame QM/MM che nei modelli precedenti non venivano preliminarmente ottimizzati (3.4). Il metodo LSCF è un modo piuttosto elegante per terminare la distribuzione di carica nella regione QM senza introdurre atomi aggiuntivi nel sistema, ma i calcoli [41] sull’energia dimostrano che questo metodo è meno robusto rispetto a quello degli atomi legati. L’energia con LSCF è più sensibile a fattori come le dimensioni della parte QM, il valore delle cariche MM sull’atomo di frontiera MM e la scelta della popolazione elettronica sugli orbitali di legame localizzati. Nonostante tutto il metodo permette la delocalizzazione elettronica su un numero più piccolo di orbitali molecolari. Se il frammento quantico è piccolo o se la densità di carica sull’atomo di frontiera è alta conviene utilizzare il metodo degli atomi legati, se il legame di frontiera è lontano dal sito che subisce modificazioni chimiche i due metodi sono equivalenti, ma l’LSCF è più semplice perchè non è necessario introdurre vincoli negli orbitali di frontiera per mantenere le proprietà geometriche. Nel metodo generalised hybrid orbital (GHO) sviluppato da Gao e co. [35] gli orbitali ibridi sugli atomi tra le regione QM e la regione MM vengono divisi in orbitali attivi e orbitali ausiliari (3.5). Gli orbitali ibridi attivi sono ottimizzati con calcoli quantomeccanici mentre la densità di carica degli orbitali ausiliari è definita dal potenziale MM. Rispetto al metodo LSCF non è necessario riparametrizzare ogni volta il sistema. Per completezza espositiva si citano altre due metodologie 3.2. I METODI IBRIDI QM/MM 39 Figura 3.4: Rappresentazione degli orbitali utilizzati nel metodo LSCF. per il trattamento della zona di confine tra la regione QM e MM anche se queste metodologie sono meno utilizzate rispetto alle precedenti. Il metodo empirical valence bond (EVB) sviluppato da Warshel [33] tratta ogni punto della superficie di reazione come la combinazione di una o più strutture del legame valenza. La parametrizzazione viene eseguita o dai calcoli quantistici QM o dai dati sperimentali. Può rivelarsi un metodo utile ma deve essere accuratamente impostato con opportuni parametri per ogni sistema. Il metodo effective fragment potential (EFP) proposto da Webb e Gordon [34] e ripreso da Jensen [42] aggiunge dei ”frammenti” al trattamento standard QM che sono totalmente polarizzabile e sono parametrizzati da calcoli ab-initio eseguiti separatamente. Risulta attualmente ancora problematico il trattamento dei legami tra la ”vera” regione QM e i frammenti introdotti. 3.2.5 Le condizioni al contorno In tutte le simulazione computazionali di liquidi o proteine si presenta il problema di come approssimare un sistema virtualmente infinito [30] mediante una costruzione finita. Spesso vengono utilizzate delle condizioni periodiche al contorno che mimano le condizioni del bulk. In questo approccio la cella unitaria centrale è replicata periodicamente mediante traslazioni nello spazio tridimensionale rimuovendo qualsiasi effetto al contorno. Gli atomi nella cella primaria interagiscono con le vicine immagini di atomi nelle celle adiacenti. Tipicamente viene utilizzato un cut-off per troncare le interazioni a lungo-raggio e vengono scelte smoothing-function per permettere all’energia potenziale di annullarsi. Un approccio alternativo è lo sviluppo di condizioni stocastiche al contorno dove si sviluppa nella simulazione un sistema molecolare finito; non viene replicata una singola cella ma vengono applicate delle forze al contorno che interagiscono con gli atomi del sistema [43]. La difficoltà nell’uso di questo metodo è dovuta all’ambiguità associata con la definizione e la 40 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.5: Rappresentazione schematica della divisione del legame QM/MM e partizione degli orbitali ibridi sull’atomo di contorno. parametrizzazione delle forze al contorno. Infine metodi utilizzati nelle simulazione MC o MD potrebbero essere mutuati negli approcci QM/MM [44]. In generale è utile sottolineare che l’utilizzo di un sistema finito per le simulazioni in fasi condensate è sempre una grande approssimazione sia che siano sviluppate condizioni periodiche o forza al contorno. 3.3 Implementazione dei metodi QM/MM Per molti aspetti i software che permettono di implementare i metodi QM/MM sono simili a quelli associati con i singoli metodi QM e MM. La maggior parte dei termini di accoppiamento sono già presenti nei singoli pacchetti MM e QM. Quindi stabilito che il punto di partenza sono i singoli package i vari tipi di implementazione per i metodi QM/MM possono essere divisi in tre gruppi [30]: 1. uno che utilizza un pacchetto di modelling classico nel quale la parte quantistica QM è integrata come un estensione del campo di forza classico 2. uno basato sul pacchetto quantistico QM nel quale l’ambiente classico MM è incorporato come una perturbazione 3. uno schema modulare in cui è presente un programma centrale di controllo che permette la scelta sia di un metodo QM che di un metodo MM La prima implementazione di un potenziale ibrido QM/MM mediante l’utilizzo di un calcolatore venne fatta da Warshel e Levitt [19] utilizzando un Hamiltoniano QCFF/ALL trattando gli elettroni π con il metodo 3.3. IMPLEMENTAZIONE DEI METODI QM/MM 41 PPP. Successivamente Singh e Kollman [20] svilupparono il programma QUEST che combina Gaussian 80 e AMBER. Merz e collaboratori [26] svilupparono un DFT combinato con AMBER. Il metodo semiempirico MNDO/AM1 fu combinato per la prima volta con un campo di forza MM nel programma CHARMM da Field e Karplus [45]. Andiamo ora, dopo la breve digressione storica, a riprendere la divisione in gruppi descritta in precedenza. Oggi l’approccio più utilizzato è sicuramente il primo perchè sono già presenti programmi per il modelling in pacchetto MM/MD che vengono largamente utilizzati per lo studio di grandi e complessi sistemi chimici. Un buon esempio di questo gruppo è il CHARMM [23],[24] package che contiene anche l’implementazione QM. Questo programma funziona tradizionalmente bene per sistemi macromolecolari ma dovrebbe essere potenziato per la ricerca degli stati di transizione. La capacità di CHARMM può essere estesa con l’inclusione del pacchetto GRACE. L’approccio considerato nel secondo gruppo è particolarmente utilizzato quando si ha a che fare con piccole molecole e per la ricerca degli stati di transizione. Prendendo però un ambiente stazionario o completamente rilassato ad ogni step viene perduta la complessità conformazionale e rimane il problema dell’ottimizzazione QM. Morokuma [46] ha sviluppato su questa via l’accoppiamentro tra GAMESS-UK e AMBER mentre Breuer [47] utilizzò il pacchetto MSI Cerius-2 che introduce un modello MM per l’ambiente in un implementazione RI-DFT con ottimizzazione delle coordinate interne per mezzo di TURBOMOLE. Il terzo gruppo deve essere considerato in modo un po’ più dettagliato. I benefici di una costruzione modulare sono molteplici: (i) tale costruzione offre una maggiore flessibilità ed in particolare è in grado di analizzare sistemi chimici che richiedano differenti classi di campi di forza e (ii) i vari pacchetti posso essere opportunamente sostituiti nel momento in cui siano disponibili versioni più aggiornate. Tra gli svantaggi devono essere inclusi: (i) i vari pacchetti devono essere messi in relazione, è quindi necessario realizzare un programma che adempia a questo compito, (ii) deve essere considerata l’efficienza di trasferimento dei dati tra i vari pacchetti che hanno eseguito indipendentemente i calcoli QM e MM. Un esempio di sistema modulare include l’accoppiamento di AMBER con CADPAC e MNDO. Altri esempi sviluppati da vari gruppi prevedono: QCPE con MOPAC, il MCQUB che combina il MOPAC con il programma BOSS, ARGUS e HyperChem che supportano una grande varietà di modelli semiempirici. 3.3.1 Implementazione dei metodi ibridi QM/MM mediante Gaussian98 e Gaussian03 Negli ultimi anni è stato sviluppato un nuovo approccio per implementare i metodi QM/MM mediante il pacchetto Gaussian. In questa metodologia si parte dal problema generale del trattamento teorico di sistemi di grandi dimensioni. Un sistema molecolare si divide quindi in due o tre differenti strati (layers) connessi tra loro ed ogni strato può essere trattato con un livello differente di accuratezza. Queste sono le basi del metodo ONIOM [48],[49],[50] che viene implementato nel pacchetto di Gaussian98 e Gaussian03. La (3.6) può essere utile per esplicitare lo schema utilizzato nel metodo ONIOM. Il sistema che si andrà a studiare deve essere diviso in due o tre strati; la parte in rosso rappresenta il livello più accurato di calcoli quantistici e viene trattata in genere con MP2, CCSD(T) o CISDT, la parte in blu è ad un livello intermedio di complessità e la si può trattare con HF, AM1 o PM3 ed infine la parte in nero è la porzione di sistema affrontato con un approccio classico come MM2 o MMFF. Le applicazioni di ONIOM sono molteplici: (i) calcolo delle energie di legame perch il metodo permette l’inclusione della correlazione elettronica nella 42 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.6: Rappresentazione del metodo ONIOM utilizzando la triade catalitica della carbossipepdidasi. ristretta parte della molecola nella quale avviene la rottura del legame e (ii) ottimizzazione della geometria e calcolo delle frequenze vibrazionali. Può essere utile citare il lavoro di Torrent e co. [51] che si propone come una buona applicazione del metodo ONIOM in quanto studia il complesso di un metallo di transizione in un sistema biologico. Si sviluppano quindi ONIOM2(QM:MM) e ONIOM3(QM:QM:MM) per le prima applicazione su modelli di metalloenzimi nei quali la maggior parte dei residui proteici sono inclusi nei calcoli. La geometria è ottimizzata includendo ai calcoli QM anche atomi MM e le interazioni QM/MM. Il metodo ONIOM implementato in Gaussian permette di trattare le differenti parti del sistema con differenti gradi di accuratezza in base all’arbitraria definizione degli starti. Tutti i metodi disponibili nel pacchetto Gaussian possono quindi essere separatamente modificati ed eventualmente parametrizzati rispetto a dati empirici. 3.4 Applicazioni dei metodi QM/MM Le applicazioni ai metodi ibridi QM/MM sono molteplici: la maggior parte sono concentrate nell’area del modeling proteico [52],[53],[54],[55],[56] come ed esempio la predizione della pKa di piccole molecole [55] o il profilo dell’energia libera per l’associazione di metalli alcalini [56] mentre sono ancora limitati gli impieghi per la catalisi basata sui metalli di transizione. Solo recentemente Morokuma [57] ha dimostrato che queste metodologie possono essere applicate anche alle reazioni metallorganiche come l’addizione ossidativi di idrogeno molecolare ad un complesso di platino e Woo [58] ha esaminato il ruolo dei sostituenti nel bulk nei processi di catalisi che avvengono nella polimerizzazione delle olefine. Ma gli esempi sono molteplici e possono essere estesi a studi di solvatazione [59], a spettroscopia in fase condensata [60], a studi di 3.4. APPLICAZIONI DEI METODI QM/MM 43 flessibilità conformazionale [61], allo studio delle reazioni chimiche in fasi condensate, agli enzimi [62] e al DNA [54]. Attualmente la driving-force per lo sviluppo dei metodi QM/MM è la necessità di studiare la reattività enzimatica. I benefici ottenuti dalla comprensione dei dettagli dei meccanismi delle reazioni enzimatiche giustificano pienamente gli sforzi sempre maggiori indirizzati nello sviluppare opportune metodologie QM/MM. La maggior parte dei lavori pubblicati negli ultimi decenni mostra come questo tipo di approccio si presti bene allo studio di molecole biologiche e di sistemi di dimensioni nanometriche. La maggior parte degli enzimi sono metalloproteine e quindi si studia come lo ione metallico interagisca con il campo elettrostatico e come questo effetto possa essere modellato utilizzando i campi di forza MM o i potenziali semiempirici QM. 3.4.1 Applicazioni biochimiche dei metodi ibridi QM/MM Modellizzazione dello step di idrosilazione nel p-Idrossibenzoato Idrogenasi Attualmente c’è un grande interesse attorno alle reazioni di ossidazione biologica ed in particolare sui meccanismi di reazione di enzimi coinvolti nell’attivazione del”ossigeno. Un’importante famiglia di enzimi ossigenasi è quella delle flavin-dependent monoossigenasi e il p-Idrossibenzoato Idrogenasi (PHBH) è stato lungamente studiato perchè come rappresentante di questa famiglia. Questo enzima catalizza l’idrossilazione del p-idrossibenzoato nella posizione orto rispetto al gruppo idrossile, uno step cruciale nella biodegenerazione di una grande varietà di composti aromatici inclusa la lignina (il maggior componente del legno) che è uno dei biopolimeri più abbondanti in natura. La reazione ciclica del PHBH si evolve legando il substrato, riducendo Figura 3.7: Rappresentazione dello stato intermedio del PHBH ottenuto mediante calcoli QM/MM. il cofattore flavina per mezzo del NADPH e incorporando una molecola di ossigeno per formare la specie 44 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM reattiva C4a-perossiflavina. Il preciso meccanismo di idrossilazione è rimasto incerto per molto tempo. Il meccanismo di idrossilazione aromatica può essere studiato attraverso metodi QM/MM [63]. Nella maggior parte delle applicazioni su enzimi dei metodi QM/MM si utilizza un trattamento semiempirico per la regione QM ma nel caso descritto sono stati necessari calcoli ab-initio HF per investigare lo step descritto ed in particolare l’ipotesi di una sostituzione aromatica elettrofila e l’importanza delle interazioni nel sito attivo. Il modello QM/MM per l’intermedio (3.7) del C4a-idrossiflavina-substato del PHBH è stato inizialmente costruito partendo dalla struttura cristallina. La regione QM include 49 atomi con una carica totale di −2e. La rimanente regione MM è descritta utilizzando campi di forza del programma CHARMM e comprende 4841 atomi che includono tutti i residui amminacidici e 330 molecole di acqua. Durante i calcoli di ottimizzazioni si sono condiderati mobili i 1187 atomi che corrispondono all’intorno di una sfera di raggio 16Å centrata sull’ossigeno distale del residuo perossidico. Tutti gli altri atomi all’esterno della sfera si sono tenuti fissi. Lo step di idrossilazione nel PHBH si presta ad essere studiato con metodi QM/MM grazie alla disponibilità della struttura cristallina ad alta risoluzione dell’enzima legato al substrato che è un ottimo punto di partenza per i calcoli. I profili energetici calcolati confermano che la sostituzione elettrofila aromatica è lo step che limita la velocità di reazione nella reazione ciclica catalizzata dal PHBH. Modellizzazione del centro di reazione fotosintetico del Rhodopseudomonas viridis Gli studi ab-initio su cofattori dei centri di reazione batterici devono necessariamente essere approssimati e le geometrie risultanti ne sono cosı̀ drasticamente influenzate. Questi problemi possono essere risolti utilizzando una metodologia ibrida QM/MM ed in particolare all’ottimizzazione della struttura dei cofattori nei centri di reazione fotosintetici del Rhodopseudomonas viridis (3.8) e del Rhodobacter sphaeroides mentre un modello puramente MM è utilizzato per rifinire la struttura del rimanente ambiente proteico [64]. Il calcolo si divide in due aspetti principali: la generazione di strutture proteiche e l’ottimizzazione delle geometrie del cofattore all’interno di queste strutture proteiche. La geometria di partenza è quella ottenuta dai raggi X che presentano però una bassa risoluzione. All’interno del formalismo PCM (point charge model) il sistema molecolare è diviso in una parte quantistica e in una parte classica che sono completamente separate le une dalle altre. I cofattori sono tratatti interamente con metodi quantistici. L’energia totale del sistema cosı̀ descritto è data dalla somma della parte quantistica, la somma della parte classica e da un termine di interazione. I risultati ottenuti motrano che l’ottimizzazione dei cofattori dei centri di reazione fotosintetici dei due batteri prermettono di ottenere dei gruppi prostetici molto vicini ai dati cristallografici. In più è possibile però il calcolo della distanza dei legami idrogeno tra i vari residui amminoacidici coinvolti nelle reazioni, inoltre le forti deformazioni dei sistemi ad anelli non derivano da interazione inter-batteri ma dalla forte interazione tra il cofattore e la proteina. 3.4.2 Applicazioni allo studio di superfici dei metodi ibridi QM/MM Gli stessi metodi utilizzati per lo studio di sistemi in fasi condensate nell’ultimo decennio sono stati applicati con notevole successo anche allo studio di ricostruzione di superfici di silice [65], diamante [66] o vari 3.4. APPLICAZIONI DEI METODI QM/MM 45 Figura 3.8: Centro di reazione fotosintetico del Rh. viridis. semiconduttori [67], per lo studio di adsorbimento superficiale [68] o per studi di reazioni che avvengono in superficie [69]. L’approccio alternativo dei metodi ibridi QM/MM consiste nel suddividere il sistema in due parti trattando una parte mediante metodi QM e una parte mediante una metodologia classica MM. Ricostruzione di superfici di diamante(100) Dopo aver esposto in maniera generale le caratteristiche dei metodi ibridi QM/MM si vuole ora evidenziare come queste metodologie nate per lo studio di sistemi in soluzione possano essere applicate con ottimi risultati allo studio delle superfici. Le prime applicazioni sono sulla ricostruzione di superfici risalgono solo ad un decennio fa e riguardano la ricostruzione di superfici di diamante(100)[66]. In seguito si sono evolute le varie parti che compongono i metodi ibridi ma l’idea generale non è variata. Per questo si è deciso di trattare in maniera approfondita questo caso che rappresenta un importante pietra miliare nell’esplorazione delle superfici con i metodi QM/MM. La scelta del diamante non è stata casuale dato che questa forma allotropica del carbonio è un materiale interessante per le utili proprietà fisiche che vanno dall’alta conduttività termica all’inerzia chimica, dal basso coefficiente di frizione alla durezza e ad un possibile uso come semiconduttore 46 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.9: Modello di una superficie di diamante(100). ad alte temperature. Quando vennero applicati i metodi QM/MM alle superfici la maggior parte degli studi teorici erano in accordo nel sostenere che le superfici più stabili fossero quelle in cui ogni atomo di carbonio fosse saturato da un singolo atomo di idrogeno e tali superfici furono chiamate monoidrate. Questa modellizzazione era però in disaccordo con gli ordini e le lunghezze di legame e con le energie ricavate sperimentalmente. Si investigò cosı̀ la superficie di diamante(100) (3.9) utilizzando simulazioni di dinamica molecolare combinando metodi quantistici e forze empiriche. La superficie si è modellata partendo da un cluster interno descritto da un potenziale quantistico semiempirico a cui è stato aggiunto un cluster di dimensioni maggiori descritto da un potenziale empirico. La simulazione è stata sviluppata combinando meccanica quantistica QM e funzioni di energia potenziale classica MM. Il modello utilizzato (3.4.2) contiene 360 atomi di carbonio arraggiati secondo una struttura cristallina di 10 strati con 36 atomi ciascuno. I 40 atomi centrali sono decritti mediante un potenziale quantistico QM mentre i rimanenti sono descritti da potenziali empirici. Le condizioni periodiche al contorno sono assicurate utilizzando delle immagini del sistema base riprodotte nelle tre dimensioni. Per mantenere l’ibridizzazione sp3 gli angoli del cluster descritto con metodi quantistici sono stati saturati con degli atomi di idrogeno ”fantasma”. Le forze dovute a questi atomi ”fantasma” non influenzano la dinamica mentre le forze tra gli atomi empirici e gli atomi quantistici sono determinate attraverso un potenziale empirico. Una parte fondamentale del lavoro è quindi stata la scelta di un adeguato potenziale che tenga conto di tutti i legami che intercorrono tra le due regioni nonch delle proprietà energetiche del bulk di diamante e della superficie. L’opportuna parametrizzazione rispetto agli spettri vibrazionali del diamante a 300 K si è effettuata utilizzando un cluster C33 H48 (3.11)che date le dimensioni e la struttura scelta è in grado di mimare le proprietà del diamante. La parametizzazione effettuata su cluster di dimensioni minori non è in grado di riprodurre le frequenze vibrazionali e gli altri dati 3.4. APPLICAZIONI DEI METODI QM/MM 47 Figura 3.10: Modello di una superficie di diamante(100) utilizzato per le simulazioni. Le sfere grigie rappresentano gli atomi della regione quantistica, le sfere bianche gli atomi della regione descritta empiricamente mentre le sfere nere gli atomi mantenuti fissi durante la simulazione. sperimentali disponibili per il diamante. La ricostruzione della superficie deidrogenata ha messo in evidenza la presenza di due principali configurazioni : in una conformazione i dimeri superficiali sono disposti ”a righe” mentre nell’altra sono disposti ”a zig-zag”. Il confronto tra le energie delle due conformazioni con gli spettri vibrazionali indica che la prima conformazione è nettamente più stabile della seconda. Test successivi con l’addizione nei siti dimeri di molecole di CH2 in entrambe le conformazioni permettono importanti considerazioni. In questo modo si è potuta inserire nel modello teorico un’imperfezione, in genere trascurata, che riproduce gli steps a livello atomico solitamente contenuti nei campioni sperimentali. Questi steps creano dei siti open-shell attorno ad essi generando di conseguenza un significativo aumento della reattività chimica sulla superficie del diamante. Le metodologie QM/MM sono state poi applicate anche allo studio di superfici di diamante idrogenate considerando che entrambe le conformazioni possono assumere due differenti tipologie di idrogenazione. La superficie è pienamente idrogenata quando ogni atomo di carbonio dei dimeri superficiali lega due atomi di idrogeno mentre è monoidrogenata quando un atomi di idrogeno si lega ad un atomo di carbonio del dimero. I risultati mettono in luce che una superficie pienamente idrogenata è poco stabile a causa della notevole repulsione che esiste tra gli atomi di idrogeno mentre una superficie monoidrata è più stabile ma non è in grado di riprodurre risultati sperimentali come le lunghezze e gli ordini di legame. Gli studi energetici e vibrazionali hanno infine messo in evidenza che in presenza di idrogeno la condizione energeticamente più favorevole è data da una regolare alternanza tra siti pienamente idrogenati e siti monoidrogenati con rapporto H/C pari a 1.33. 48 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.11: Cluster C33 H48 utilizzato per lo sviluppo del potenziale empirico. Le sfere nere rappresentano gli atomi di carbonio centrali, le sfere grigie la prima sfera degli atomi di carbonio mentre le sfere bianche sono la seconda sfera degli atomi di carbonio. Studio di interazioni di atomi, ioni e cluster di rame su una superficie di ZnO Sherwood et all. [70] nel 2003 realizzarono uno studio dettagliato sull’interazioni degli atomi di rame nei vari stati di ossidazione di importanza catalitica (Cu, Cu+ e Cu2+ ) e di cluster di rame su superfici polari (in particolare ZnO) applicando un metodo ibrido QM/MM. Utilizzando questo metodo vennero studiati i siti superficiali specifici dell’interazione Cu/ZnO mediante metodologie ab-initio di alto livello come il DFT mentre con l’ausilio di metodologie classiche MM si sono mantenuti gli effetti dovuti ai vincoli sterici del bulk, le influenze a lungo raggio del calcolo elettrostatico e la polarizzazione del supporto di ZnO. Il modello è stato applicato in dettaglio a atomi di rame, a ioni e a clusters (Cun , n=1,4) su superfici ZnO zinco terminali. La modellizzazione della superficie di Zn (3.12) è stata effettuata considerando (i) che nel bulk sia gli ioni ossigeno che gli ioni Zn sono coordinati tetraedricamente e (ii) che un recente lavoro sulla diffrazione a raggi X ha dimostrato che la miglior interpolazione con i dati sperimentali si ottiene considerando un’occupanza di 0.74 dello Zn sui siti superficiali. La superficie di Zn è stata stabilizzata dalla rimozione di ioni Zn su di una supercella 5 × 5 in modo da avere un’occupanza di 0.76. I siti di vacanza sono posizionati alla massima distanza gli uni dagli altri. Risultano quindi alla fine due tipi diversi di siti superficiali derivanti dalla ricostruzione: le vacanze e le isole di terminazione del bulk. I siti vacanti presentano un’elevata capacità di intrappolare specie ioniche e atomiche sia a causa della loro morfologia che della bassa coordinazione e per questo sono stati identificati come i siti primari di adsorbimento (3.13) per il rame. Il lavoro esposto è il primo studio dettagliato di interazione di clusters di metalli di transizione con superfici realistiche polari contenenti 3.4. APPLICAZIONI DEI METODI QM/MM 49 Figura 3.12: Modello della struttura della superficie di Zn. Gli atomi di ossigeno sono evidenziati in rosso mentre gli atomi di Zn in grigio. ossigeno. In particolare è stato sviluppato uno schema per un metodo QM/MM che permette la polarizzazione autoconsistente dei clusters e del supporto polare e lo studio di tre differenti stati di ossidazione del rame sull’ZnO. I risultati mostrano che lo stato di ossidazione più alto del rame lega fortemente la superficie e l’energia di legame aumenta con le dimensioni del clusters; si è notata anche la tendenza dello ione Cu2+ ad adsorbire in modo relativamente profondo nel bulk dato il piccolo raggio ionico e questo è in accordo con la solubilità del Cu2+ in un bulk di ZnO. Studi di reazione di cicloaddizione di acrilonitrile su una superficie di Si(100) Le metodologie QM/MM permettono anche lo studio di reazioni di cicloaddizione [69],[71] su superfici di silicio permettendo di evidenziare la variazione di energia potenziale superficiale dei vari meccanismi che possono avvenire in superfici. Lo studio sulle reazioni di cicloaddizione dell’acrilonitrile su una superficie Si(100) prevede la presenza di tre differenti meccanismi di reazioni sulla superficie con diverse energie di attivazione. Il problema è stato affrontato dividendo il sistema in una regione quantistica e in una regione classica. Tutti i calcoli quantistici (HF e DFT) effettuati su un modello di cluster di silicio Si9 H12 rappresentato in (3.14). Se lo studio della parte di superficie sulla quale avviene la reazione di cicloaddizione può essere affrontata con metodi quantistici lo studio dell’intera superficie che tiene conto di effetti classici legati alle forze elettrostatiche, ai vincoli imposti dalla geometria dell’intero sistema (superficie+bulk), alle forze di van der Waals, etc deve essere affrontato con una metodologia ibrida QM/MM. Si accoppia (3.15)quindi il cluster trattato con metodi quantistici con un altro cluster di dimensioni notevolmente maggiori trattato con metodi classici. La parametrizzazione del potenziale applicato al cluster di dimensioni maggiori è stata 50 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.13: Adsorbimento di un dimero di rame in stato di ossidazione 2+:(a) vista dall’alto;(b) vista di lato. effettuata rispetto a dati sperimentali. L’accurata riproduzione della superficie e del sito di reazione superficiale permette una scansione dell’energia superficiale lungo i possibili cammini di reazione fino ai prodotti finali. Le grandi barriere di attivazione trovate permettono anche di concludere che le reazioni superficiali dell’acrilonitrile su Si sono sotto controllo cinetico piuttosto che termodinamico. Studio dell’adsorbimento dell’HCl sui siti diffettuali di una superficie di ghiaccio In questo studio i metodi QM/MM vengono applicati allo studio dell’adsorbimento molecolare e dissociativo dell’HCl sui siti difettuali di una superficie di ghiaccio [72]. La chimica dell’HCl su superfici di ghiaccio gioca un ruolo importante nella riduzione dello strato di ozono e quindi le superfici di ghiaccio puro si candidano ad essere un buon punto di partenza per lo studio della chimica delle superfici di ghiaccio nella stratosfera. Evidenze sperimentali sottolineano come l’HCl esiste nella sua forma dissociata sulle superfici di ghiaccio anche alle temperature presenti nella stratosfera. Lo studio presentato permette di comprendere il ruolo delle difettualità del ghiaccio sulla dissociazioni dell’HCl. Il sistema viene ancora una volta diviso in una 3.4. APPLICAZIONI DEI METODI QM/MM 51 Figura 3.14: Modello di cluster C3 N Si9 H15 trattato con metodi quantistici. Le sfere verdi rappresentano gli atomi di silicio, le sfere bianche gli atomi di idrogeno mentre nella parte in alto della figura compare l’acrilonitrile addizionato. regione quantistica che include la molecola di HCl e 21 molecole di acqua superficiali la cui geometria è ottimizzata secondo calcoli ab-initio e DFT e in una regione MM che comprende una lastra periodica di ghiaccio. Le interazioni tra le molecole nella regione QM e nella regione MM sono ottenute sommando i contributi elettrostatici e di van der Waals. I contributi elettrostatici sorgono dalle interazioni coulombiane e di polarizzazione. Il sistema totale (regione QM+MM) in studio è quindi composto da 768 molecole di acqua disposte in otto doppi strati con condizioni periodiche al contorno per le molecole MM sulla superficie. Le difettualità sono state riprodotte utilizzando una regione QM di 21 atomi e sono evidenziate (3.16). Per studiare l’adsorbimento dissociativo o non dissociativo sulla superficie le molecole di HCl sono state inizializzate in varie posizioni sopra i siti difettuali della superficie di ghiaccio. Durante il processo di simulazione l’HCl e le molecole superficiali si sono mosse liberamente mentre la struttura del bulk è mantenuta fissa. Il trasporto di energia tra la superficie e il bulk è stato modellato applicando una frizione locale. Gli studi QM/MM evidenziano che quando sono presenti sulla superficie due atomi di H ”dangling” sufficientemente vicini questi possono adsorbire l’HCl ed è possibile una dissociazione senza barriera di attivazione. In tutti gli altri casi studiati ( presenza di un solo atomo di idrogeno ”dangling” o due troppo lontani) avviene solo adsorbimento dell’HCl senza dissociazione. I risultati ottenuti dai calcoli QM/MM sono in accordo con altri risultati sperimentali [73] ed entrambi indicano che avviene la dissociazione dell’HCl senza barriere in presenza 52 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Figura 3.15: Cluster modello ottenuto componendo il cluster trattato con metodi quantistici (atomi viola) con il cluster trattato con metodi classici (in verde). di due atomi vicini di H. Sotto le condizioni presenti nella stratosfera l’importanza di questo meccanismo di dissociazione, se confrontata con gli altri possibili meccanismi, è fortemente dipendente dalla struttura della superficie di ghiaccio e dalla densità degli H superficiali. Se la struttura cristallina presenta infatti una bassa densità di atomi di idrogeno ”dangling” allora il lento meccanismo di incapsulamento dell’HCl potrebbe essere il processo dominante mentre ad alte densità il rapido meccanismo di dissociazione senza barriera. Infine si può anche evidenziare che i siti difettali non hanno significativi effetti catalitici nei processi che avvengono sulle superfici dato che l’energia di adsorbimento tra siti con difettualità e siti senza difettualità sono molto simili. 3.5 Conclusioni Il breve riepilogo eseguito sugli approcci QM/MM ha certamente enfatizzato l’enorme varietà di strade mediante le quali i calcoli QM e MM possono essere combinati. Se da una parte risultano abbastanza consolidate le metodologie quantistiche molto lavoro c’è ancora da fare per sviluppare la parte MM. Si sono quindi incrementati gli studi per definire adeguate condizioni al confine tra le regioni QM e MM che tengano conto delle reali interazioni in gioco. Altro problema è la definizione dei campi di forza che potrebbero arrivare a dipendere da dati ab-initio e non più empirici. Sarebbe particolarmente interessante anche l’incorporazione di effetti quantici sul solvente all’interno di simulazioni di fasi condensate. La trattazione della regione al contorno potrebbe fare un forte balzo in avanti si riuscisse a trattare il mezzo come un continum trattando il solvente non più a livello molecolare ma a livello mesoscopico; verrebbero eliminate le condizioni periodiche 3.5. CONCLUSIONI 53 Figura 3.16: (a) Siti esagonali senza difettualità ,(b) siti esagonali che invece presentano difettualità. Sono evidenziati solo gli atomi di ossigeno. Le sfere nere sono atomi di O trattati con metodi QM mentre le sfere grigie sono atomi di O trattati con metodi MM. al contorno che sono una fonte di errore spesso difficilmente stimabile. Quello che emerge chiaramente dagli esempi portati è la grande potenzialità di queste metodologie che possono trovare applicazioni sia nel campo della ricerca di base per la comprensione di intermedi di reazioni e di stati di transizioni sia al livello di ricerca applicata per la comprensione dei meccanismi di reazione e interazione degli enzimi o del DNA. 54 CAPITOLO 3. METODOLOGIE ED APPLICAZIONI DEI METODI IBRIDI QM/MM Parte IV Dinamica molecolare 55 Capitolo 4 Dinamica molecolare: metodologie 4.1 Introduzione Le tecniche di calcolo di dinamica molecolare (molecular dynamics, MD) sono basate sulla soluzione “esatta” delle equazioni del moto di un insieme di N particelle e sul calcolo diretto delle varie osservabili fisiche: simulazione matematica −→ riproduzione di un sistema fisico Da un punto di vista metodologico, possiamo distinguere le seguenti fasi nella messa a punto di una simulazione MD • definizione delle condizioni del sistema (insieme termodinamico di appartenenza) • definizione dei gradi di libertà e delle interazioni tra le componenti del sistema (statica) • scelta della legge del moto (dinamica) • condizioni al contorno e condizioni iniziali • scelta del metodo di risoluzione numerica delle equazioni del moto • calcolo delle osservabili fisiche ed implementazione computazionale: grandezze riscalate, condizioni periodiche al contorno, trattamento di gradi di libertà rotazionali La definizione di un sistema di particelle interagenti, e la simulazione delle proprietà macroscopiche del sistema stesso, può essere effettuata nell’ambito di uno dei vari insiemi termodinamici: l’insieme microcanonico classico: un sistema all’equilibrio di N particelle (oppure N1 , N2 . . . per un sistema a più componenti) interagenti a energia E totale costante e volume V fisso −→ (E, N , V ); l’insieme canonico: temperatura, numero di particelle e volume costanti −→ (T , N , V ); l’insieme isotermo-isobarico: temperatura, numero di particelle e pressione costanti −→ (T , N , P ); l’insieme grandcanonico: potenziale chimico, temperatura e volume costanti −→ (µ, T , V ). Nella maggior parte delle simulazioni MD si utilizza l’insieme microcanonico, si considera cioè un’insieme isolato di particelle interagenti. 57 58 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE Le equazioni del moto delle singole molecole sono, nella maggior parte delle applicazioni in letteratura, le equazioni della meccanica classica, nella loro forma standard di equazioni di Newton. Per un insieme di N particelle classiche puntiformi possiamo definire le coordinate e i momenti lineari in modo immmediato come le posizioni (vettori cartesiani) {~r(t)1 , ~r(t)2 , . . . , ~r(t)N } e i vettori momenti lineari: {~ p(t)1 , p~(t)2 , . . . , p~(t)N }, dove ~vi = mi d~ri (t) = mi~vi (t) dt (4.1) Le proprietà statiche del sistema sono definite se è nota l’energia potenziale: V = V ({~r(t)1 , ~r(t)2 , . . . , ~r(t)N }) (4.2) che contribuisce all’energia totale del sistema H =K +V = N X p~2i i=1 2mi 1 + V (~r) = p~ · m−1 · p~ + V (~r) 2 (4.3) La presenza di eventuali campi esterni (e.g. campi gravitazionali, elettrici magnetici, stress meccanici imposti al sistemi) permette di simulare sistemi fluidi in condizioni di non-equilibrio. Nel seguito faremo riferimento solo a sistemi isolati, aventi energia meccanica costante definita dalla (4.3). 4.2 Potenziali di interazione Nel caso di N particelle (atomi) indistinguibili m1 = m2 = . . . = m, possiamo definire l’energia potenziale come risultante dalla somma di sole interazione tra coppie di particelle, V (~r) = P i<j v(~ri , ~rj ). In generale, l’energia potenziale si può scrivere come la somma di interazioni ad un corpo (interazioni con campi esterni), a due corpi, a tre corpi etc.: V = X i v1 (~ri ) + X X v2 (~ri , ~rj ) + i<j v3 (~ri , ~rj , ~rk ) + . . . (4.4) i<j<k È noto come fino al 10 % dell’energia reticolare di un cristallo di argon possa essere dovuta ai termini di interazione a tre corpi; nel seguito, in analogia alla maggioranza delle applicazioni MD, trascureremo termini di interazione a più di due corpi. I potenziali di coppia utilizzati per la simulazione MD di fluidi non-ionici sono di solito i seguenti • 6-12 o Lennard-Jones (LJ): v LJ (r) = 4² "µ ¶ 12 σ r µ ¶6 # − σ r (4.5) Il potenziale LJ è il più usato per la maggior parte delle applicazioni MD in cui si intendano simulare proprietà statiche e dinamiche di fluidi atomici (o molecolari, vedi oltre), poichè tiene conto in modo qualitativamente corretto sia delle interazioni repulsive che attrattive tra due particelle. 4.2. POTENZIALI DI INTERAZIONE σ 59 2σ 3σ σ 2σ 3σ σ −4ε 2σ 3σ −4ε (a) (b) (c) Figura 4.1: Potenziali: Lennard-Jones (a), hard-sphere (b), square-well (c) • potenziale hard-sphere e square-well: ( v HS (r) = ∞ (r < σ) 0 (σ ≤ r) v SW ∞ (r) = (r < σ1 ) −² (σ1 ≤ r < σ2 ) 0 (4.6) (σ2 ≤ r) I potenziali hard-sphere e square-well sono potenziali semplificati che permettono una soluzione più rapida, dal punto di vista computazionale, delle equazioni del moto, rispetto ai potenziali continui come il potenziale di LJ. • potenziali soft-sphere: v SS µ ¶n (r) = ² σ r (4.7) L’utilizzazione di potenziali soft-sphere è accettabili soprattutto nell’ambito di simulazioni di particelle non-atomiche (e.g. sospensioni di particelle macroscopiche in fasi fluide, colloidi etc.). Per i sistemi ionici si deve considerare l’interazione elettrostatica: v z (rij ) = zi zj 4π²0 rij (4.8) I potenziali elettrostatici, che sono intrinsicamente diversi dai potenziali precedenti in quanto espressione di forze a lungo raggio, sono molto difficili da trattare nell’ambito di simulazioni MD, a causa della limitata dimensione del sistema trattabile nell’ambito delle consuete applicazioni MD. 60 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE 4.3 Liquidi molecolari Nel caso di sistemi formati da molecole non mono-atomiche, la definizione dei gradi di libertà del sistema è notevolmente complicata dalla presenza di coordinate rotazionali, ed eventualmente, per molecole non rigide, di coordinate interne. Da un punto di vista energetico, i sistemi molecolari possono essere agevolmente descritti da siti localizzati, che rappresentano singoli atomi o gruppi di atomi, interagenti mediante potenziali sito-sito del tipo descritto nella sezione precendente: v(~rij , Ωi , Ωj ) = XX a vab (rab ) (4.9) b dove si indica con Ωi il set di angoli di Eulero che specifica l’orientazione della molecola i (vedi oltre), con ~rij = ~ri −~rj la differenza tra i vettori che indicano il centro di massa delle molecole i e j e con rab = |~ria −~rjb | la differenza tra i vettori che indicano il sito a della molecola i e il sito b della molecola j. Applicazioni più 1 6 1 2 2 5 6 3 4 3 5 4 Figura 4.2: Due molecole interagenti a 6 siti sofisticate prevedono anche l’uso di potenziali Lennard-Jones generalizzati: ²(Ωi , Ωj ) = ²[1 − χ2 (ei · ej )2 ]−1/2 ¸ · 1 σ(~rij , Ωi , Ωj ) = σ 1 − χf (~rij · ei , ~rij · ej , ei · ej ) 2 (4.10) (4.11) e si possono poi considerare, soprattutto per sistemi a molti siti termini aggiuntivi di energia interna vibrazionale, torsionale ed interazioni dipolari, quadrupolari etc. Poichè il nostro studio sarà limitato a fluidi formati da molecole lineari biatomiche rigide, non considereremo nel dettaglio questo tipo di interazioni. 4.3.1 Leggi del moto Le equazioni del moto definiscono al tempo t la posizione e la velocità di ciascuna particella. Per un sistema di N molecole interagenti, i gradi di libertà traslazionali ~ri , e le corrispondenti velocità lineari ~vi obbediscono 4.3. LIQUIDI MOLECOLARI 61 alle equazioni del moto mi~v˙ i = F~i (4.12) dove F~i è la forza totale agente sulla i-esima molecola, ottenuta come gradiente rispetto a ~ri del potenziale V ; indichiamo con ȧ la derivata temporale di una quantità a. Nel caso di molecole rigide non-monoatomiche dobbiamo considerare anche i gradi di libertà rotazionali di ciascuna molecola; in generale, nel caso di molecole rigide non lineari possiamo definire l’orientazione di un sistema di riferimento solidale con la molecola rispetto al laboratorio utilizzando come coordinate gli angoli di Eulero Ω = φ, θ, ψ, oppure in termini di quaternioni Q = q0 , q1 , q2 , q3 . Alle coordinate rotazionali, definite in termini di angoli di Eulero o quaternioni, è associato il vettore di velocità angolare ω ~ . La legge del moto rotazionale di una molecola rigida non-lineare i è in generale scritta in termini del momento della coppia ~τi che è l’analogo rotazionale della forza agente sulle coordinate traslazionali del centro di massa F~i . In generale, se le componenti di ~τi e ω ~ i sono riferite ad un sistema di riferimento solidale con la molecola i, le equazioni del moto rotazionale sono µ ω̇i x = ω̇iy = ω̇i z = ¶ Iiyy − Iizz τi x + ωi y ωi z Ii xx Ii xx à ! τi y Ii zz − Ii zz + ωiz ωix Ii yy Ii yy µ ¶ Iixx − Iiyy τi z + ωi x ωi y Ii zz Ii zz (4.13) (4.14) dove Iixx , Iiyy , Iizz sono i valori principali del tensore di inerzia della molecola. Le leggi del moto rotazionale sono completate dalle relazioni geometriche che legano la velocità angolare con le derivate temporali delle coordinate rotazionali prescelte, siano esse gli angoli di Eulero o i quaternioni. Nel caso di molecole lineari, le equazioni del moto sono leggermente modificate, per tener conto della degenerazione del moto attorno all’asse di simmetria molecolare. 4.3.2 Sistemi termodinamici e condizioni di simulazione In assenza di campi esterni, il sistema costituito da N molecole interagenti viene considerato un insieme microcanonico. In pratica, il numero limitato di molecole considerato (N ∼ O(102 )) e il tempo di simulazione anch’esso necessariamente limitato (dell’ordine di decine di picosecondi) implica che la condizione di equilibrio termodinamico conseguita dal sistema sia un’approssimazione. In pratica, il sistema è inizialmente preparato in una qualche condizione facilmente definibile (e.g. uno stato cristallino ordinato), e con una data densità ρ. Alle molecole è assegnata un’energia cinetica iniziale distribuendo in modo casuale, secondo una distribuzione di Maxwell, le velocità lineari ed angolari iniziali. Dopodichè si conducono uno o più lunghi cicli di equilibrazione, che ahnno lo scopo di portare il sistema nelle condizioni il più vicino possibile a quelle di equilibrio termodinamico. Solo a questo punto inizia la vera e propria simulazione, con la memorizzazione delle traiettorie delle particelle ed il calcolo di vari osservabili. 62 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE 4.3.3 Osservabili In generale, una proprietà osservabile Aobs viene calcolata come media temporale della funzione che lega l’osservabile A alle coordinate roto-traslazionali delle molecole costituenti il sistema: Aobs = hAitempo = hA[Γ(t)]i = lim 1 Z tobs t→∞ tobs 0 dtA[Γ(t)] (4.15) Le funzioni termodinamiche sono perciò immediatamente calcolabili dalle loro definizioni microscopicostatistiche: energia totale E = hHi = hKi + hV i (4.16) in un insieme isolato questa quantità deve essere costante, e dunque uguale all’energia assegnata al sistema a t = 0, e può quindi essere utilizzata per controllare l’accuratezza del metodo numerico di risoluzione delle equazioni del moto; temperatura PN 3N kB T = 2hKi = h p ~2i i=1 mi i (4.17) la temperatura è calcolata in termini di energia cinetica media; pressione P V − N kB T = hW i = h− 13 PN ri i=1 ~ ˆ iV i ·∇ (4.18) la pressione è calcolata come media della funzione viriale W . Una funzione di grande utilità è la funzione di correlazione di coppia; per un fluido atomico, la funzione di correlazione è Z N (N − 1) g(~r1 , ~r2 ) = 2 ρ ZN V T · V (~r1 , . . . , ~rN ) d~r3~r4 . . . ~rN exp − kB T ¸ (4.19) In pratica la seguente definizione operativa (con media su tutte le coppie) è utilizzata g(~r) = V P P 1 P P h i j6=i δ(~ri )δ(~rj − ~r)i = 2 h i j6=i δ(~r − ~rij )i 2 ρ N (4.20) e per un sistema isotropo g(~r) = g(r). Ogni media di una funzione di coppie di particelle è esprimibile in funzione di g(r): ha(~ri , ~rj )i = Z 1 V2 d~ri d~rj g(~ri , ~rj )a(~ri , ~rj ) P P hAi = h i j6=i a(rij )i = Z Nρ ∞ 2 0 (4.21) dr4πr2 a(r)g(r) (4.22) Di conseguenza numerose osservabili possono essere calcolate indirettamente una volta che sia nota la funzione g(r) 4.3. LIQUIDI MOLECOLARI 63 energia 3 E = N kB T + 2πN ρ 2 Z ∞ 0 drr2 v(r)g(r); (4.23) pressione 2 P V = N kB T − πN ρ 3 Z ∞ 0 drr2 dv(r) g(r); dr (4.24) potenziale chimico 3 µ = kB T ln(ρΛ ) + 4πρ dove Λ = p Z 1 0 dξ Z ∞ 0 drr2 v(r)g(r; ξ) (4.25) h2 /2πmkB T è la frequenza termica di De Broglie. Funzioni termodinamiche più complesse quali l’energia libera di Gibbs, G, l’energia di Helmholtz, A, ol’entropia, S. sono funzioni riconducibili al calcolo diretto della funzione di partizione Q: µ A exp kB T ¶ = 1 QN V T ³ = hexp V kB T ´ i (4.26) il cui calcolo diretto nell’ambito del sistema microcanonico è difficoltoso. Si può perciò ricorrere a simulazioni MD che utilizzano insiemi termodinamici diversi come l’insieme NVT, ottenibile per esempio mediante una modifica stocastica della velocità di una o più particelle di un sistema NVE per simulare l’interazione con una ipotetica particella del termostato; oppure coime l’insieme NPT, ottenibile con la definizione di una grado di libertà aggiuntivo che rappresenta un ’pistone’ che esercita una pressione esterna P sul sistema. Le proprietà del sistema dipendenti dal tempo sono descrivibili dallo o quadratico mediodi un’osservabile, che misura l’entità delle fluttuazioni del’oservabile dal valore medio σ 2 (A) = hA2 i = h(A − hAi)2 i = hA2 i − hAi2 (4.27) e soprattutto dalle funzioni di correlazione temporale che misurano la correlazione media tra il valore di un osservabile al tempo t e al tempo t = 0: CAB (t) = hδA(t)δB(0)i = hδA[Γ(t)]δB[Γ(0)]i (4.28) Una funzione di correlazione si dice di autocorrelazione se A = B. Le funzioni di correlazioni hanno molte applicazioni: • danno informazioni sul comportamento dinamico dei fluidi; • i loro integrali sono legati a grandezze macroscopiche; • le loro trasformate di Fourier sono legate a osservabili spettroscopiche. 64 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE Un esempio di una classe di osservabile legata al calcolo di funzioni di correlazione è dato dai coefficienti di trasporto. Il coefficiente traslazionale di diffusione di una particella sonda è per esempio definito in funzione della funzione di autocorrelazione della velocità lineare: D= 1 3 Z ∞ 0 dth~v (t)~v (0)i = 1 1 lim h|~ri (t) − ~ri (0)|2 i 6 t→∞ t (4.29) Il calcolo di funzioni di correlazione rotazionali è utile per la comprensione della natura dei moti rototraslazionali nei liquidi molecolari; inoltre opportune funzioni di correlazione rotazionale possono essere messe in relazione a vari osservabili spettroscopici • spettri infrarosso C1mm0 (t) = hY1m [Ω(t)]Y1m0 [Ω(0)]i (4.30) • spettri Raman, NMR ed EPR C2mm0 (t) = hY2m [Ω(t)]Y2m0 [Ω(0)]i (4.31) Lo studio di liquidi rotazionali permette di verificare varie teorie per la descrizione della fase liquida. Un’osservabile importante è la funzione di autocorrelazione della velocità angolare: cωω (t) = hω(t) · ω(0)i/hω 2 i (4.32) che può essere messa in relazione con il coefficiente di diffusione rotazione di una singola molecola. 4.4 Metodi computazionali di MD Come tutte le metodologie di simulazione, anche per la Dinamica Molecolare è necessario, al fine di implementare le potenziali applicazioni di questa tecnica allo studio delle proprietà dei fluidi, utilizzare una serie di accorgimenti pratici. Il primo aspetto che vogliamo sottolineare, anche per la comprensione dei risultati presentati nei Capitoli successivi è l’impiego di grandezze scalate: le varie grandezze fisiche sono di solito ricondotte e presentate in termini di unità di misura convenientemente scelte (vedi Tabella (4.4)). Cosı̀ la funzione hamiltoniana scalata risulta essere: H∗ = 1 X ∗2 X ∗ ∗ v + V (|ri − rj∗ |) 2 i i i<j (4.33) dove il potenziale scalato è: µ ∗ ∗ V (r ) = 4 1 r∗ 12 1 − ∗6 r ¶ (4.34) Un’altro aspetto pratico dell’implementazione dei metodi MD è costituito dall’uso di condizioni periodiche: nello studio dei fluidi, i sistemi trattati dalle simulazioni MD comprendono solitamente 102 , 103 particelle (nel caso per esempio di simulazione massive, altamente parallelizzate, di studio di stress meccanici in solidi atomici sonjo stati effettuati studi con 106 particelle). In presenza di una parete (sistema a volume 4.4. METODI COMPUTAZIONALI DI MD 65 Grandezza Grandezza riscalata Coefficiente di scala (atomi di Ar) Massa m∗ = m/mu mu = mAr Spazio l∗ = l/lu Tempo t∗ = t/tu Energia Forza Temperatura Densità Pressione lu = σ tu = E ∗ = E/Eu F∗ p σ 2 mAr /² Eu = ² = F/Fu Fu = ²/σ T ∗ = T /Tu Tu = ²/kB ρ∗ = ρ/ρu ρu = σ −3 P ∗ = P/Pu Pu = ²/σ 3 Tabella 4.1: Grandezze riscalate in unità σ costante), la maggior parte delle particelle interagirebbe solo con la parete e di conseguenza gli effetti di superficie sarebbero dominanti: a titolo di esempio per un sistema di 1000 particelle in un cristallo cubico (10 × 10 × 10), 488 giacciono sulle pareti. Nella maggior parte delle applicazioni, si preferisce perciò utilizzare condizioni periodiche, in cui il sistema è a contatto con un numero infinito di repliche, tali che se rxi , ryi , rzi è la posizione della particella i-esima, ogni sua replica ha posizione rxi + nx Lx , ryi + ny Ly , rzi + nz Lz , dove nx , ny , nz sono numeri interi. Ogni particella costituente il sistema interagisce con tutte le particelle A A P A A P A P A P A P P A P P Figura 4.3: Condizioni al contorno periodiche e raggio di cut-off delle repliche, Il calcolo del potenziale agente sulla particella può essere effettuato in vari modi: utilizzando il metodo della convenzione dell’immagine minima: si considerano tutte le molecole che giacciono in una pseudoscatola centrata sulla molecola in esame; per un potenziale a coppie si calcolano 12 N (N − 1) termini; oppure usando il raggio di cutoff: si considerano solo le molecole giacenti in una sfera di raggio rc < 12 L (es. rc = 2.5σ). Altre condizioni al contorno sono utilizzabili per studi MD specifici come le condizioni al contorno ipersferiche, in cui le molecole giacciono sulla superficie di un’ipersfera; e soprattutto l’impiego di cluster in cui si considerano veri cluster molecolari, con condizioni al contorno non-periodiche. 66 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE 4.4.1 Metodi alle differenze finite Il metodo principale di soluzione delle equazioni di Newton in MD consiste nella discretizzazione delle traiettorie rispetto al tempo usando uno dei vari schemi in cui le derivate temporali sono approssimate da rapporti incrementali. Qualunque metodologia di calcolo dovrà ottimizzare i seguenti requisiti, imposti dalle limitate risorse computazionali 1. elevata velocità di calcolo; 2. minima richiesta di memoria su disco; 3. accuratezza nel calcolo delle traiettorie; 4. semplicità di implementazione; 5. conservazione dell’energia e della quantità di moto; 6. reversibilità temporale Lo schema di discretizzazione più semplice delle equazioni del moto è basato sull’approssimazione di Eulero. Se indichiamo con ~a, ~v , ~r i vettori collettivi delle accelerazioni, velocità, vettori di posizione di tutte le particelle del sistema ( e consideriamo per semplicità un fluido atomico), l’equazioni di Netwon discretizzate secondo lo schema di Eulero sono: ~a(t + δt) ≈ ~a(t) (4.35) ~v (t + δt) ≈ ~v (t) + ~a(t)δt (4.36) 1 (4.37) ~r(t + δt) ≈ ~r(t) + ~v (t)δt + ~a(t)δt2 2 Il metodo di Eulero è molto semplice, e facilmente implementabile purtroppo, a meno di non usare un passo temporale δt estremamente piccolo non è nè stabile nè reversibile. Metodi di discretizzazione più sofisticati devono perciò essere utilizzati. Nella Sezione successiva dedicata allo studio di molecole lineari, lo schema di discretizzazione utilizzato in questo lavoro sarà descritto in dettaglio. Tra agli schemi di discretizzazione più utilizzati, soprattutto per fluidi atomici, possiamo ricordare il cosiddetto lgoritmo di Verlet che consiste in una ridefinizione dello schema di discretizzazione di Eulero nel modo seguente: 1 ~r(t + δt) = ~r(t) + ~v (t)δt + ~aδt2 2 1 2 ~r(t − δt) = ~r(t) − ~v (t)δt + ~aδt 2 sommando si elimina la velocità: ~r(t + δt) = 2~r(t) − ~r(t − δt) + ~aδt2 (4.38) (4.39) (4.40) Poichè al tempo t sono noti ~a(t), ~r(t) e ~r(t − δt), al tempo t + δt si ricava ~r(t + δt), mentre la velocità la tempo t è: ~r(t + δt) − ~r(t − δt) (4.41) 2δt Il metodo di Verlet è stabile, permette di usare step fino a 0.01 ps, è reversibile e conserva energia e momento. ~v (t) = 4.5. MOLECOLE LINEARI 4.5 67 Molecole lineari Nel caso di una molecola lineare, la definizione dell’orientazione molecolare è specificabile da solo due coordinate, che indichino la direzione e il versore di un versore unitario ~e diretto lungo l’asse molecolare. È dunque possibile utilizzare una descrizione semplificata della geometria e delle equazioni del moto, anche se è possibile utilizzare descrizioni per esempio basate sulla geometria dei quaternioni, al prezzo comunque di una ridondanza nella definizione della geometria molecolare. Il momento di inerzia relativo alla rotazione intorno all’asse di simmetria è nullo, mentre i due rimanenti valori principali di I sono uguali, La velocità angolare e il momento della coppia ~τ sono sempre perpendicolari all’asse molecolare . Di conseguenza, possiamo scrivere ~τ = ~e × ~g (4.42) dove ~g è una funzione delle forze agenti sulla molecola. Per una molecola lineare formata da M siti puntiformi, per la quale cioè ciascun sito sia definito rispetto al centro di massa dall’identità vettoriale d~j = dj ~e j = 1, . . . , M (4.43) il vettore ~g è definito come ~g = j=M X dj f~j (4.44) j=1 dove f~j è la forza agente sul sito j. Il vettore ~g può essere sostituito con la componente perpendicolare all’asse molecolare ~g ⊥ = ~g − (~g · ~e)~e. Le equazioni del moto rotazionale di una molecola lineare si possono scrivere nella seguente forma: ~e˙ = ~u ~g ⊥ ~u˙ = + λ~e I (4.45) (4.46) La prima equazione definisce il momento generalizzato ~u come derivata prima temporale di ~e. La seconda descrive il moto rotazionale della molecola in presenza del momento di coppia generalizzato ~g , con il termine aggiuntivo λ~e che tiene conto del vincolo di lunghezza costante della molecola: λ è dunque un moltiplicatore indeterminato di Lagrange. Nel corso di una simulazione MD, λ viene determinato numericamente nell’ambito dello schema di discretizzazione impiegato. Tra gli schemi più comuni descriviamo nel dettaglio il metodo leap-frog che è anche stato impiegato nel corso delle simulazioni MD presentate in questo lavoro. Al tempo t siano noti i vettori ~e(t), ~u(t − δt/2) e ~g ⊥ (t). Il vettore ~u(t) è calcolato dallo schema discreto al primo ordine " # 1 ~g ⊥ (t) ~u(t) = ~u(t − δt/2) + δt + λ(t)~e(t) 2 I (4.47) se si prende il prodotto scalare con ~e(t) di entrambi i membri, si ottiene λ(t) = −2~u(t − δt/2) · ~e(t)/δt (4.48) 68 CAPITOLO 4. DINAMICA MOLECOLARE: METODOLOGIE tenendo conto del fatto che ~e · ~u = ~e · ~g ⊥ = 0. È ora possibile calcolare in modo diretto il vettore ~u˙ (t) dall’equazione (4.46) definita al tempo t. Noto ~u˙ si può ora valutare u(t + δt/2): ~u(t + δt/2) = ~u(t − δt/2) + δt~u˙ (t) (4.49) Infine il versore di orientazione al tempo t + δt è calcolato dall’equazione (discretizzata) (4.45) ~e(t + δt) = ~e(t) + δt~u(t + δt/2) (4.50) Capitolo 5 Dinamica molecolare: un’applicazione 5.1 Studio di un fluido atomico Il Capitolo (4) aveva un carattere intenzionalmente introduttivo alle tecniche di base della Dinamica Molecolare applicata a fluidi costituiti da atomi o molecole rigide, trattati come corpi interagenti. In questo secondo Capitolo dedicato alla Dinamica Molecolare discuteremo in modo dettagliato un’applicazione. Partiremo dalla definizione del sistema di interesse; definiremo quindi le metodiche utilizzate per il calcolo; illustreremo un programma in linguaggio Fortran dedicato al calcolo stesso; ed infine commenteremo alcuni risultati. Il sistema considerato è un fluido atomico, formato cioè da particelle puntiformi interagenti mediante un potenziale a simmetria sferica. 5.1.1 Il sistema Il primo sistema da noi considerato è costituito da N particelle puntiformi - atomi - interagenti mediante un potenziale a coppie Lennard-Jones. La semplicità di questo sistema è utile per introdurre le metodologie fondamentalie della Dinamica Molecolare: le particelle costituenti sono dotate dei soli gradi di libertà traslazionali, e quindi non è necessaria un’implementazione complicata delle equazioni del moto che hanno la semplice forma descritta nelle prime sezioni del Capitolo (4). Il sistema considerato si può confrontare con un fluido costituito da atomi di gas rari, per esempio l’argon. In effetti, parametri ² e σ di un potenziale di Lennard-Jones per la riproduzione realistica di proprietà termodinamiche di fluidi atomici di Ar ed altri gas rari sono noti Per fissare le idee, considereremo il caso di un insieme di N atomi di Ar, cioè con ²/kB = 119.8 ²/kB (K) σ (nm) He 10.2 0.228 Ne 47.0 0.272 Ar 119.8 0.341 Kr 164.0 0.383 Tabella 5.1: Coefficienti LJ per i gas rari 69 70 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE K e σ = 0.341 nm, contenuti in una scatola cubica, con condizioni al contorno periodiche, a densità e prefissata. Il sistema è isolato, cioè è trattato nell’ambito di una descrizione termodinamica microcanonica (NVE). Come definiamo la configurazione iniziale del sistema? Solitamente si assegna una configurazione ordinata, basata su un qualche reticolo cristallino di facile construzione. Assumeremo perciò nel seguito una configurazione iniziale basta su un reticolo cristallino cubico a facce centrate. (face centered cubic lattice, fcc). Costruiamo cioè il sistema iniziale come un insieme di Nc celle elementari fcc per lato. Una cella elementare fcc contiene 4 unità molecolari ed il numero di celle in un volume cubico è Nc3 , quindi il numero di particelle totali è N = 4Nc3 . In Fig. (5.1) è illustrata una cella elementare fcc (a) ed un sistema formato da 8 celle elementari (Nc = 2) per un totale di 32 atomi. Lo stato iniziale del sis- (a) (b) Figura 5.1: Un reticolo cristallino fcc (a) ed un sistema di 4 celle elementari fcc (b) tema può essere definito in termini di una temperatura iniziale T0 , che vedremo non corrispondere esattamente alla temperatura di equilibrio, e di una densità ρ. La temperatura iniziale è il parametro che definisce l’energia cinetica totale iniziale del sistema. In pratica le velocità iniziali delle particelle del sistema ~vi (i = 1, . . . , N ) sono assegnate secondo una distribuzione gaussiana, secondo la legge di Maxwell, in modo tale che l’energia cinetica cinetica media di un atomo sia data da 3kB T0 /2. Nel corso della successiva evoluzione temporale dallo stato assegnato inizialmente, il sistema si porta in una stato di equilibrio, caratterizzato da una temperatura di equilibrio T . Le condizioni al contorno sono, solitamente, di tipo periodico: ogni particella risente perciò dell’interazione con le particelle entro il volume cubico, e di tutte le “repliche” o immagini negli infiniti volumi cubici circostanti. In pratica, dato che il potenziale di interazione decade rapidamente con la distanza, è sufficiente considerare una distanza massima o raggio di cut-off, rc , che tipicamente è dell’ordine di di 3, 4 volte σ. 5.1. STUDIO DI UN FLUIDO ATOMICO 71 Figura 5.2: Condizioni al contorno periodiche 5.1.2 Metodo di calcolo Adottiamo come metodo di risoluzione numerica uno schema di discretizzazione di tipo leap-frog descritto in precedenza nel Capitolo (4), in una versione semplificata per sole coordinate traslazionali. Ad ogni nuovo passo il vettore delle velocità del sistema è aggiornato secondo lo schema ~v (t + δt/2) = ~v (t − δ/2) + δt~a(t) (5.1) dove il vettore delle accelerazioni è calcolato al tempo t usando la seconda legge di Newton e dunque calcolando le forze agenti sulle particelle. Il vettore delle posizioni è aggiornato al tempo t + δt secondo lo schema ~r(t + δt) = ~r(t) + δt~v (t + δt/2) (5.2) È necessario specificare dunque come ulteriore parametro di input il passo temporale dello schema di discretizzazione, δt. Una sessione di calcolo tipica è di solito completamente determinata specificando anche un lasso temporale teq , che specifichi il tempo assegnato al sistema per raggiungere lo stato di equilibrio termodinamico; ed un tempo di calcolo vero e proprio degli osservabili di interesse tcalc , che segue il tempo teq e che viene effettivamente considerato per il calcolo di funzioni di stato, funzioni di correlazione etc. Ricapitolando, il sistema è definito dai seguenti parametri: Nc , n. celle elementari del reticolo fcc che specifica la configurazione iniziale; ² e σ che definiscono il potenziale di interazione tra gli atomi; T0 , la temperatura iniziale, corrispondente ad uno stato di non equilibrio; ρ, la densità (intesa come numero di particelle su 72 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE volume); rc , raggio di cut-off del potenziale; δt, passo dello schema di discretizzazione delle equazioni di Newton; teq , tempo di equilibrazione e tcalc , tempo di calcolo. In pratica, i codici esistenti implementano le equazioni del moto utilizzando, per motivi di convenienza numerica e per evitare calcoli ridondanti, coordinate riscalate. È sufficiente definire il sistema, se si usano grandezze scalate, con il seguente insieme di coordinate di input: Nc , T0∗ , ρ∗ , rc∗ , δt∗ , t∗eq e t∗calc . Esercizio 7. Si vuole simulare un sistema preparato inizialmente secondo un reticolo fcc, formato da circa 100 atomi di Ar, con una temperatura iniziale di 100 K, una densità (massa su volume) di ρm = 1.5 × 103 Kgm−3 , con un passo di integrazione di 10 fs; fissiamo il tempo di equilibrazione in 30 ps ed il tempo di calcolo in 10 ps. I parametri ² e σ sono rispettivamente 1.653 × 10−21 J e 3.41 × 10−10 m; assumiamo un raggio di cut-off pari a 3.5σ. Il sistema più vicino a quello desiderato corrisponde a Nc = 3, vale a dire 27 celle elementari, ovvero 108 atomi. La temperatura riscalata è T0∗ = kB T0 /² = 0.834. La densità riscalata è ρ∗ = ρσ 3 /mAr = 0.815; il raggio di cutoff è semplicemente 3.5; i parametri temporali sono δ ∗ = 0.0046, t∗eq = 13.8, t∗calc = 4.62. Per esercizio, calcolate la lunghezza riscalata del lato del volume cubico. 5.1.3 Codice Può essere utile commentare un programma per la simulazione di un sistema atomico in modo dettagliato dal testo di Allen e Tildesley [3]. Il programma principale è formato, come al solito da una sezione di dichiarazione delle variabili e di input dei parametri. Segue la definizione della configurazione iniziale (routines fcc e comvel). Il programma opera utilizzando un set di coordinate riferite ad una lunghezza unitaria del lato del volume cubico, quindi opera una conversione a partire dalle coordinate riscalate di input riferite a σ. ************************************************************************ ** LOW-STORAGE MD PROGRAMS USING THE LEAPFROG VERLET ALGORITHM ** ************************************************************************ C ******************************************************************* C ** TWO SEPARATE PARTS: FORTRAN AND BASIC VERSIONS. C ******************************************************************* C ******************************************************************* C ** FICHE F.3 - PART A ** C ** FORTRAN PROGRAM USING THE LEAPFROG ALGORITHM. ** C ******************************************************************* ** PROGRAM FROGGY include ’block.inc’ C ******************************************************************* C ** FORTRAN PROGRAM TO CONDUCT MOLECULAR DYNAMICS OF ATOMS. ** C ** ** C ** A SPECIAL LOW-STORAGE FORM OF THE LEAPFROG VERLET ALGORITHM ** C ** IS USED AND WE TAKE THE LENNARD-JONES POTENTIAL AS AN EXAMPLE.** C ** ** 5.1. STUDIO DI UN FLUIDO ATOMICO 73 C ** REFERENCE: ** C ** ** C ** FINCHAM AND HEYES, CCP5 QUARTERLY, 6, 4, 1982. ** C ** ** C ** ROUTINES REFERENCED: ** C ** ** C ** SUBROUTINE READCN ( CNFILE ) ** C ** ** C ** SUBROUTINE FORCE ( DT, SIGMA, RCUT, NEWV, NEWVC, NEWW ) ** C ** CALCULATES THE ACCELERATIONS AND ADVANCES THE VELOCITIES ** C ** FROM T - DT/2 TO T + DT/2. ALSO CALCULATES POTENTIAL ** C ** ENERGY AND VIRIAL AT TIMESTEP T. C ** SUBROUTINE MOVE ( DT ) ** C ** ** C ** SUBROUTINE KINET ( NEWK ) ** C ** ** C ** SUBROUTINE WRITCN ( CNFILE ) ** C ** ** C ** ** C ** PRINCIPAL VARIABLES: ** C ** C ** INTEGER N NUMBER OF ATOMS ** C ** REAL DT TIMESTEP ** C ** REAL RX(N),RY(N),RZ(N) ATOMIC POSITIONS ** C ** REAL VX(N),VY(N),VZ(N) ATOMIC VELOCITIES ** C ** REAL ACV,ACK ETC. AVERAGE VALUE ACCUMULATORS ** C ** REAL AVV,AVK ETC. AVERAGE VALUES ** C ** REAL ACVSQ, ACKSQ ETC. AVERAGE SQUARED VALUE ACCUMULATORS ** C ** REAL FLV,FLK ETC. ** C ** ** C ** USAGE: ** C ** ** C ** THE LEAPFROG ALGORITHM IS OF THE FORM ** C ** VX(T + DT/2) = VX(T - DT/2) + DT * AX(T) (SIMILARLY FOR Y,Z) ** C ** RX(T + DT) (SIMILARLY FOR Y,Z) ** C ** TO SAVE STORAGE IN THIS PROGRAM WE ACCUMULATE VALUES AX(T) ** C ** DIRECTLY ONTO THE VELOCITIES VX(T - DT/2) IN THE FORCE LOOP. ** C ** THIS MEANS THAT AN APPROXIMATION MUST BE USED FOR THE KINETIC ** C ** ENERGY AT EACH TIME STEP: ** C ** K = ( OLDK + NEWK ) / 2 + ( OLDV - 2 * V + NEWV ) / 8 ** C ** WHERE K ** C ** OLDK = K( T - DT/2 ), OLDV = V( T - DT ) ** C ** NEWK = K( T + DT/2 ), NEWV = V( T + DT ) ** READS IN CONFIGURATION ** ADVANCES POSITIONS FROM T TO T + DT. CALCULATES KINETIC ENERGY. WRITES OUT CONFIGURATION ** FLUCTUATION AVERAGES = RX(T) + DT * VX(T + DT/2) = K( T ), V = V( T ) 74 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE C ** AT THE START OF A STEP THE FOLLOWING VARIABLES ARE STORED: ** C ** R ** C C C ** THIS PROGRAM USES UNIT 10 FOR CONFIGURATION INPUT AND OUTPUT ** C ** ** C ** UNITS: ** C ** ** C ** THE PROGRAM USES LENNARD-JONES REDUCED UNITS FOR USER INPUT ** C ** AND OUTPUT BUT CONDUCTS SIMULATION IN A BOX OF UNIT LENGTH. ** C ** SUMMARY FOR BOX LENGTH L, ATOMIC MASS M, AND LENNARD-JONES ** C ** POTENTIAL PARAMETERS SIGMA AND EPSILON: ** C ** OUR PROGRAM LENNARD-JONES SYSTEM ** C ** LENGTH L SIGMA ** C ** MASS M M ** C ** ENERGY EPSILON EPSILON ** C ** TIME SQRT(M*L**2/EPSILON) SQRT(M*SIGMA**2/EPSILON) ** C ** VELOCITY SQRT(EPSILON/M) SQRT(EPSILON/M) ** C ** PRESSURE EPSILON/L**3 EPSILON/SIGMA**3 ** C ******************************************************************* : R(STEP) V : V(STEP+1/2) ** OLDV : V(STEP-2) V : V(STEP-1) ** OLDK : K(STEP-1/2) NEWK : K(STEP+1/2) NEWV : V(STEP) ** INTEGER STEP, NSTEP, IPRINT REAL DENS, NORM, RCUT, DT, SIGMA, TEMP1 REAL V, K, E, W REAL OLDK, NEWK, OLDV, NEWV, NEWW REAL OLDVC, NEWVC, VC, KC, EC REAL VN, KN, EN, ECN, PRES, TEMP REAL ACV, ACK, ACE, ACEC, ACP, ACT REAL AVV, AVK, AVE, AVEC, AVP, AVT REAL ACVSQ, ACKSQ, ACESQ, ACECSQ, ACPSQ, ACTSQ REAL FLV, FLK, FLE, FLEC, FLP, FLT REAL SR3, SR9, VLRC, WLRC, PI, SIGCUB CHARACTER CNFILE*30, TITLE*80 REAL FREE ** PARAMETER ( FREE = 3.0 ) PARAMETER ( PI = 3.1415927 ) C ******************************************************************* C ** READ IN INITIAL PARAMETERS ** WRITE(*,’(1H1,’’ **** PROGRAM FROGGY **** ’’)’) WRITE(*,’(//, ’’ MOLECULAR DYNAMICS OF LENNARD-JONES ATOMS ’’)’) WRITE(*,’( ’’ LEAPFROG ALGORITHM WITH MINIMAL STORAGE ’’)’) 5.1. STUDIO DI UN FLUIDO ATOMICO 75 WRITE(*,’(’’ ENTER RUN TITLE ’’)’) READ (*,’(A)’) TITLE WRITE(*,’(’’ ENTER NUMBER OF STEPS ’’)’) READ (*,*) NSTEP WRITE(*,’(’’ ENTER NUMBER OF STEPS BETWEEN OUTPUT LINES ’’)’) READ (*,*) IPRINT WRITE(*,’(’’ ENTER CONFIGURATION FILENAME ’’)’) READ (*,’(A)’) CNFILE WRITE(*,’(’’ ENTER THE FOLLOWING IN LENNARD-JONES UNITS ’’)’) WRITE(*,’(’’ ENTER DENSITY ’’)’) READ (*,*) DENS WRITE(*,’(’’ ENTER INIT. TEMPERATURE ’’)’) READ (*,*) TEMP1 WRITE(*,’(’’ ENTER POTENTIAL CUTOFF DISTANCE ’’)’) READ (*,*) RCUT WRITE(*,’(’’ ENTER TIME STEP ’’)’) READ (*,*) DT WRITE(*,’(//1X,A)’) TITLE WRITE(*,’(’’ NUMBER OF ATOMS = ’’,I10 )’) N WRITE(*,’(’’ NUMBER OF STEPS = ’’,I10 )’) NSTEP WRITE(*,’(’’ OUTPUT FREQUENCY = ’’,I10 )’) IPRINT WRITE(*,’(’’ POTENTIAL CUTOFF = ’’,F10.4)’) RCUT C WRITE(*,’(’’ DENSITY = ’’,F10.4)’) DENS WRITE(*,’(’’ TIME STEP = ’’,F10.6)’) DT ** READ CONFIGURATION INTO COMMON / BLOCK1 / VARIABLES ** CALL FCC CALL COMVEL( TEMP1 ) C ** CONVERT INPUT DATA TO PROGRAM UNITS ** SIGMA = ( DENS / REAL ( N ) ) ** ( 1.0 / 3.0 ) RCUT = RCUT * SIGMA DT = DT * SIGMA DENS = DENS / ( SIGMA ** 3 ) C ** CALCULATE LONG-RANGE CORRECTIONS ** C ** NOTE: SPECIFIC TO LENNARD-JONES SR3 = ( SIGMA / RCUT ) ** 3 SR9 = SR3 ** 3 ** SIGCUB = SIGMA ** 3 VLRC = ( 8.0 /9.0 ) * PI * DENS * SIGCUB * REAL ( N ) : * ( SR9 - 3.0 * SR3 ) WLRC = ( 16.0 / 9.0 ) * PI * DENS * SIGCUB * REAL ( N ) 76 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE : * ( 2.0 * SR9 - 3.0 * SR3 ) Segue il calcolo vero e proprio, effettuato come un ciclo su numero di passi temporali totali nstep; per semplicità non sono inclusi in questo codice passi preliminari di equilibrazione. Ad ogni passo del ciclo vengono chiamate nell’ordine le routine move (che aggiorna le posizioni, date le velocità calcolate nel passo precedente), force che calcola le forze e aggiorna le velocità secondo l’algoritmo di leap-frog e kinet che calcola l’osservabile richiesto (in questo caso l’energia cinetica del sistema). C ** ZERO ACCUMULATORS ** ACV = 0.0 ACK = 0.0 ACE = 0.0 ACEC = 0.0 ACP = 0.0 ACT = 0.0 ACVSQ = 0.0 ACKSQ = 0.0 ACESQ = 0.0 ACECSQ = 0.0 ACPSQ = 0.0 ACTSQ = 0.0 FLV = 0.0 FLK = 0.0 FLE = 0.0 FLEC = 0.0 C FLP = 0.0 FLT = 0.0 ** CALCULATE INITIAL VALUES ** CALL FORCE ( -DT, SIGMA, RCUT, NEWV, NEWVC, NEWW ) CALL MOVE ( -DT ) CALL FORCE ( -DT, SIGMA, RCUT, V, VC, W ) CALL FORCE ( DT, SIGMA, RCUT, V, VC, W ) CALL KINET ( OLDK ) CALL MOVE ( CALL FORCE ( DT ) DT, SIGMA, RCUT, NEWV, NEWVC, NEWW ) CALL KINET ( NEWK ) C ** INCLUDE LONG-RANGE CORRECTIONS ** 5.1. STUDIO DI UN FLUIDO ATOMICO V = V + VLRC W = W + WLRC 77 NEWV = NEWV + VLRC NEWW = NEWW + WLRC IF ( IPRINT .LE. 0 ) IPRINT = NSTEP + 1 WRITE(*,’(//1X,’’**** START OF DYNAMICS ****’’)’) WRITE(*,10001) C ******************************************************************* C ** MAIN LOOP BEGINS C ******************************************************************* ** DO 1000 STEP = 1, NSTEP C ** IMPLEMENT ALGORITHM ** CALL MOVE ( DT ) OLDV = V V = NEWV OLDVC = VC VC = NEWVC W = NEWW CALL FORCE ( DT, SIGMA, RCUT, NEWV, NEWVC, NEWW ) C ** INCLUDE LONG-RANGE CORRECTIONS ** NEWV = NEWV + VLRC NEWW = NEWW + WLRC C ** CALCULATE KINETIC ENERGY AT CURRENT STEP ** K : = ( NEWK + OLDK ) / 2.0 + ( NEWV - 2.0 * V + OLDV ) / 8.0 KC = ( NEWK + OLDK ) / 2.0 : + ( NEWVC - 2.0 * VC + OLDVC ) / 8.0 OLDK = NEWK CALL KINET ( NEWK ) C ** CALCULATE INSTANTANEOUS VALUES ** E = K + V EC = KC + VC VN = V / REAL ( N ) KN = K / REAL ( N ) EN = E / REAL ( N ) ECN = EC / REAL ( N ) TEMP = 2.0 * KN / FREE 78 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE PRES = DENS * TEMP + W C ** CONVERT TO LENNARD-JONES UNITS ** C ** INCREMENT ACCUMULATORS ** PRES = PRES * SIGMA ** 3 ACE = ACE + EN ACEC = ACEC + ECN ACK = ACK + KN ACV = ACV + VN ACP = ACP + PRES ACESQ = ACESQ + EN ** 2 ACECSQ = ACECSQ + ECN ** 2 C ACKSQ = ACKSQ + KN ** 2 ACVSQ = ACVSQ + VN ** 2 ACPSQ = ACPSQ + PRES ** 2 ** OPTIONALLY PRINT INFORMATION ** IF ( MOD( STEP, IPRINT ) .EQ. 0 ) THEN WRITE(*,’(1X,I8,6(2X,F10.4))’) : STEP, EN, ECN, KN, VN, PRES, TEMP ENDIF 1000 CONTINUE C ******************************************************************* C ** MAIN LOOP ENDS C ******************************************************************* ** WRITE(*,’(/1X,’’**** END OF DYNAMICS **** ’’//)’) C ** OUTPUT RUN AVERAGES ** NORM AVE = REAL ( NSTEP ) = ACE / NORM AVEC = ACEC / NORM AVK = ACK / NORM AVV = ACV / NORM AVP = ACP / NORM ACESQ = ( ACESQ / NORM ) - AVE ** 2 ACECSQ = ( ACECSQ / NORM ) - AVEC ** 2 ACKSQ = ( ACKSQ / NORM ) - AVK ** 2 ACVSQ = ( ACVSQ / NORM ) - AVV ** 2 ACPSQ = ( ACPSQ / NORM ) - AVP ** 2 IF ( ACESQ .GT. 0.0 ) FLE = SQRT ( ACESQ ) IF ( ACECSQ .GT. 0.0 ) FLEC = SQRT ( ACECSQ ) 5.1. STUDIO DI UN FLUIDO ATOMICO 79 IF ( ACKSQ .GT. 0.0 ) FLK = SQRT ( ACKSQ ) IF ( ACVSQ .GT. 0.0 ) FLV = SQRT ( ACVSQ ) IF ( ACPSQ .GT. 0.0 ) FLP = SQRT ( ACPSQ ) AVT = AVK * 2.0 / FREE FLT = FLK * 2.0 / FREE WRITE(*,’(’’ AVERAGES’’,6(2X,F10.5))’) : AVE, AVEC, AVK, AVV, AVP, AVT WRITE(*,’(’’ FLUCTS : C ’’,6(2X,F10.5))’) FLE, FLEC, FLK, FLV, FLP, FLT ** WRITE OUT FINAL CONFIGURATION ** CALL WRITCN ( CNFILE ) STOP 10001 FORMAT(//1X,’TIMESTEP ..ENERGY.. CUTENERGY.’ : ’ ..KINETIC. ..POTENT..’, : ’ .PRESSURE. ..TEMPER..’/) END Alcune routine sono riportate nel seguito. In particolare, si deve prestare atenzione al doppio ciclo presente nella routine force che costituisce la sezione del codice che utilizza la maggior parte del tempo di CPU richiesto dal programma (fino al 90%). SUBROUTINE FORCE ( DT, SIGMA, RCUT, V, VC, W ) include ’block.inc’ C ******************************************************************* C ** ROUTINE TO COMPUTE FORCES WITH CUTOFF & MINIMUM IMAGING. ** C ** ** C ** THE ROUTINE ACTUALLY RETURNS TWO DIFFERENT POTENTIAL ENERGIES.** C ** V IS CALCULATED USING THE UNSHIFTED LENNARD-JONES POTENTIAL. ** C ** WHEN LONG-RANGE TAIL CORRECTIONS ARE ADDED, THIS MAY BE USED ** C ** TO CALCULATE THERMODYNAMIC INTERNAL ENERGY ETC. ** C ** VC IS CALCULATED USING THE SHIFTED LENNARD-JONES POTENTIAL ** C ** WITH NO DISCONTINUITY AT THE CUTOFF. ** C ** CHECK ENERGY CONSERVATION. C ** PROGRAM UNITS MAKE EPSILON = MASS = 1, BUT SIGMA IS NOT UNITY ** C ** SINCE WE TAKE A BOX OF UNIT LENGTH. ** C ** THE ROUTINE IS COMBINED WITH THE LEAPFROG ALGORITHM FOR ** C ** ADVANCING VELOCITIES, I.E. FORCES ARE ACCUMULATED DIRECTLY ** C ** ONTO VELOCITIES. ** THIS MAY BE USED TO ** 80 C CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE ******************************************************************* REAL V, RCUT, DT, SIGMA, W, VC INTEGER I, J, NCUT REAL RCUTSQ, VCUT, SIGSQ REAL RXI, RYI, RZI, VXI, VYI, VZI REAL RXIJ, RYIJ, RZIJ, RIJSQ REAL SR2, SR6, SR12 REAL VIJ, WIJ, VELIJ, DVX, DVY, DVZ C ******************************************************************* C ** CALCULATE SQUARED DISTANCES FOR INNER LOOP ** SIGSQ = SIGMA ** 2 RCUTSQ = RCUT ** 2 C ** CONDUCT OUTER LOOP OVER ATOMS ** V = 0.0 W = 0.0 NCUT = 0 DO 1000 I = 1, N - 1 RXI = RX(I) RYI = RY(I) RZI = RZ(I) VXI = VX(I) VYI = VY(I) VZI = VZ(I) C ** CONDUCT INNER LOOP OVER ATOMS ** DO 900 J = I + 1, N RXIJ = RXI - RX(J) RXIJ = RXIJ - ANINT ( RXIJ ) IF ( ABS ( RXIJ ) .LT. RCUT ) THEN RYIJ = RYI - RY(J) RYIJ = RYIJ - ANINT ( RYIJ ) RIJSQ = RXIJ ** 2 + RYIJ ** 2 IF ( RIJSQ .LT. RCUTSQ ) THEN RZIJ = RZI - RZ(J) RZIJ = RZIJ - ANINT ( RZIJ ) 5.1. STUDIO DI UN FLUIDO ATOMICO RIJSQ = RIJSQ + RZIJ ** 2 IF ( RIJSQ .LT. RCUTSQ ) THEN SR2 = SIGSQ / RIJSQ SR6 = SR2 ** 3 SR12 = SR6 ** 2 VIJ = 4.0 * ( SR12 - SR6 ) WIJ = 24.0 * ( 2.0 * SR12 - SR6 ) VELIJ = WIJ * DT / RIJSQ DVX = VELIJ * RXIJ DVY = VELIJ * RYIJ DVZ = VELIJ * RZIJ VXI = VXI + DVX VYI = VYI + DVY VZI = VZI + DVZ VX(J) = VX(J) - DVX VY(J) = VY(J) - DVY VZ(J) = VZ(J) - DVZ V = V + VIJ W = W + WIJ NCUT = NCUT + 1 ENDIF ENDIF ENDIF 900 C CONTINUE ** END OF INNER LOOP ** VX(I) = VXI VY(I) = VYI VZ(I) = VZI 1000 CONTINUE C ** END OF OUTER LOOP ** C ** CALCULATE POTENTIAL SHIFT ** SR2 = SIGSQ / RCUTSQ SR6 = SR2 * SR2 * SR2 SR12 = SR6 * SR6 VIJ = 4.0 * ( SR12 - SR6 ) VC = V - REAL ( NCUT ) * VIJ 81 82 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE W = W / 3.0 RETURN END la routine move, che aggiorna le posizioni ad ogni passo temporale (mentre le velocità sono aggiornate direttamente nella routine force). SUBROUTINE MOVE ( DT ) include ’block.inc’ C ******************************************************************* C ** LEAPFROG VERLET ALGORITHM FOR ADVANCING POSITIONS C ******************************************************************* C REAL DT INTEGER I ** ******************************************************************* DO 1000 I = 1, N RX(I) = RX(I) + VX(I) * DT RY(I) = RY(I) + VY(I) * DT RZ(I) = RZ(I) + VZ(I) * DT 1000 CONTINUE RETURN END la routine fcc, che assegna la configurazione iniziale secondo un reticolo cubico a facce centrate SUBROUTINE FCC C ******************************************************************* C ** SETS UP THE ALPHA FCC LATTICE FOR N LINEAR MOLECULES. ** C ** ** C ** THE SIMULATION BOX IS A UNIT CUBE CENTRED AT THE ORIGIN. ** C ** N SHOULD BE AN INTEGER OF THE FORM ( 4 * ( NC ** 3 ) ), ** C ** WHERE NC IS THE NUMBER OF FCC UNIT CELLS IN EACH DIRECTION. ** C ** SEE FIGURE 5.10 FOR A DIAGRAM OF THE LATTICE AND A ** 5.1. STUDIO DI UN FLUIDO ATOMICO 83 C ** DEFINITION OF THE FOUR ORIENTATIONAL SUBLATTICES. ** C ** ** C ** PRINCIPAL VARIABLES: ** C ** ** C ** INTEGER N NUMBER OF MOLECULES ** C ** REAL RX(N),RY(N),RZ(N) MOLECULAR POSITIONS ** C ** REAL EX(N),EY(N),EZ(N) UNIT VECTORS GIVING ORIENTATIONS ** C ** REAL RROOT3 1.0 / SQRT ( 3.0 ) C ******************************************************************* ** INCLUDE ’block.inc’ REAL RROOT3 PARAMETER ( RROOT3 = 0.5773503 ) REAL CELL, CELL2 INTEGER I, IX, IY, IZ, IREF, M C ******************************************************************* C ** CALCULATE THE SIDE OF THE UNIT CELL ** CELL = 1.0 / REAL ( NC ) CELL2 = 0.5 * CELL C ** BUILD THE UNIT CELL ** C ** SUBLATTICE A ** C C C C RX(1) = 0.0 RY(1) = 0.0 RZ(1) = 0.0 ** SUBLATTICE B ** RX(2) = CELL2 RY(2) = CELL2 RZ(2) = 0.0 ** SUBLATTICE C ** RX(3) = 0.0 RY(3) = CELL2 RZ(3) = CELL2 ** SUBLATTICE D ** RX(4) = CELL2 RY(4) = 0.0 RZ(4) = CELL2 ** CONSTRUCT THE LATTICE FROM THE UNIT CELL ** 84 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE M = 0 DO 99 IZ = 1, NC DO 98 IY = 1, NC DO 97 IX = 1, NC DO 96 IREF = 1, 4 RX(IREF+M) = RX(IREF) + CELL * REAL ( IX - 1 ) RY(IREF+M) = RY(IREF) + CELL * REAL ( IY - 1 ) RZ(IREF+M) = RZ(IREF) + CELL * REAL ( IZ - 1 ) 96 CONTINUE M = M + 4 97 CONTINUE 98 CONTINUE 99 C CONTINUE ** SHIFT CENTRE OF BOX TO THE ORIGIN ** DO 100 I = 1, N RX(I) = RX(I) - 0.5 RY(I) = RY(I) - 0.5 RZ(I) = RZ(I) - 0.5 100 CONTINUE RETURN END la routine comvel, che assegna le velocità iniziali, definite in modo casuale secondo una distribuzione gaussiana C ******************************************************************* c ** centre of mass and angular velocities for linear molecules ** c ** ** c ** principal variables: ** c ** ** c ** integer n the number of molecules ** c ** real rx(n),ry(n),rz(n) positions ** c ** real vx(n),vy(n),vz(n) velocities ** c ** real temp reduced temperature ** c ** ** c ** supplied routines: ** c ** ** c ** subroutine comvel ( temp ) ** c ** ** c ** real function ranf ( dummy ) sets the centre of mass velocities for a configuration of ** 5.1. STUDIO DI UN FLUIDO ATOMICO 85 c ** returns a uniform random variate on the range zero to one c ** real function gauss ( dummy ) ** c ** returns a uniform random normal variate from a ** c ** distribution with zero mean and unit variance. ** c ** ** c ** units: ** c ** ** c ** we assume unit molecular mass and employ lennard-jones units ** c ** property units ** c ** rx, ry, rz (epsilon/m)**(1.0/2.0) ** c ** ox, oy, oz (epsilon/m*sigma**2)**(1.0/2.0) ** c ** inert c ******************************************************************* m*sigma**2 ** ** subroutine comvel ( temp ) include ’block.inc’ c ******************************************************************* c ** translational velocities from maxwell-boltzmann distribution ** c ** ** c ** the distribution is determined by temperature and (unit) mass.** c ** this routine is general, and can be used for atoms, linear ** c ** molecules, and non-linear molecules. ** c ** ** c ** routine referenced: ** c ** ** c ** real function gauss ( dummy ) ** c ** returns a uniform random normal variate from a ** c ** distribution with zero mean and unit variance. ** c ******************************************************************* REAL temp REAL rtemp, sumx, sumy, sumz REAL gauss, dummy REAL ranf external gauss external ranf c ******************************************************************* rtemp = dsqrt ( temp ) do 100 i = 1, n 86 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE vx(i) = rtemp * gauss ( dummy ) vy(i) = rtemp * gauss ( dummy ) vz(i) = rtemp * gauss ( dummy ) 100 c continue ** remove net momentum ** sumx = zero sumy = zero sumz = zero do 200 i = 1, n sumx = sumx + vx(i) sumy = sumy + vy(i) sumz = sumz + vz(i) 200 continue sumx = sumx / real ( n ) sumy = sumy / real ( n ) sumz = sumz / real ( n ) do 300 i = 1, n vx(i) = vx(i) - sumx vy(i) = vy(i) - sumy vz(i) = vz(i) - sumz 300 continue return end function gauss ( dummy ) include ’block.inc’ c ******************************************************************* c ** random variate from the standard normal distribution. ** c ** ** c ** the distribution is gaussian with zero mean and unit variance.** c ** ** c ** reference: ** c ** ** c ** knuth d, the art of computer programming, (2nd edition ** c ** c ** ** c ** routine referenced: ** c ** ** c ** real function ranf ( dummy ) ** c ** ** addison-wesley), 1978 returns a uniform random variate on the range zero to one ** 5.1. STUDIO DI UN FLUIDO ATOMICO c 87 ******************************************************************* REAL a1, a3, a5, a7, a9 parameter ( a1 = 3.949846138e0, a3 = 0.252408784e0 ) parameter ( a5 = 0.076542912e0, a7 = 0.008355968e0 ) parameter ( a9 = 0.029899776e0 REAL sum, r, r2 REAL ranf, dummy REAL gauss external c ) ranf ******************************************************************* sum = zero do 10 i = 1, 12 sum = sum + ranf ( dummy ) 10 continue r = ( sum - 6.e0 ) / 4.e0 r2 = r * r gauss = (((( a9 * r2 + a7 ) * r2 + a5 ) * r2 + a3 ) * r2 +a1 ) : * r return end function ranf ( dummy ) c ******************************************************************* c ** returns a uniform random variate in the range 0 to 1. ** c ** ** c ** *************** ** c ** ** ** ** c ** *************** ** c ** ** c ** good random number generators are machine specific. ** c ** please use the one recommended for your machine. ** c ******************************************************************* integer warning l, c, m parameter ( l = 1029, c = 221591, m = 1048576 ) integer seed REAL dummy save seed 88 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE data REAL c seed / 0 / ranf ******************************************************************* seed = mod ( seed * l + c, m ) ranf = real ( seed ) / m return end c ******************************************************************* c ** common block c ******************************************************************* ** integer nc,n parameter (nc=3,n=4*nc**3) real rx(n), ry(n), rz(n), vx(n), vy(n), vz(n) common / par / rx, ry, rz, vx, vy, vz Ecco il risultato di una simulazione di dinamica molecolare effettuata sul sistema precedente. Il sistema è formato da 108 atomi (vedi, nel listato precedentemente descritto, la variabile nc). La simulazione corre su 5000 passi temporali, e ciascun passo corrisponde a 0.004 unità temporali riscalate. Nono sono effettuati passi iniziali di equilibrazione. Ogni 500 passi il programma stampa l’energia totale del sistema, l’energia cinetica, l’energia potenziale, la pressione, la temperatura ed il coefficiente di compressibilità. Alla fine il programma calcola i valori medi di queste grandezze su tutta l’estensione temporale della simulazione, insieme alla deviazione quadratica media che dà una misura delle fluttuazioni presenti nel sistema. 1 **** PROGRAM FROGGY **** MOLECULAR DYNAMICS OF LENNARD-JONES ATOMS LEAPFROG ALGORITHM WITH MINIMAL STORAGE ENTER RUN TITLE test n. 1 ENTER NUMBER OF STEPS 5000 ENTER NUMBER OF STEPS BETWEEN OUTPUT LINES 500 ENTER CONFIGURATION FILENAME save ENTER THE FOLLOWING IN LENNARD-JONES UNITS ENTER DENSITY 5.1. STUDIO DI UN FLUIDO ATOMICO 89 0.81 ENTER INIT. TEMPERATURE 1.5 ENTER POTENTIAL CUTOFF DISTANCE 3.5 ENTER TIME STEP 0.004 test n. 1 NUMBER OF ATOMS = 108 NUMBER OF STEPS = 5000 OUTPUT FREQUENCY = 500 POTENTIAL CUTOFF = 3.5000 DENSITY = 0.8100 TIME STEP = 0.004000 **** START OF DYNAMICS **** TIMESTEP ..ENERGY.. ..KINETIC. ..POTENT.. .PRESSURE. ..TEMPER.. 500 ..COMPRESS.. -4.4422 1.2232 -5.6656 0.4121 0.8155 -0.3761 1000 -4.4422 1.2445 -5.6865 0.4484 0.8297 -0.3327 1500 -4.4422 1.2990 -5.7413 -0.0802 0.8660 -1.1143 2000 -4.4422 1.2282 -5.6708 0.3816 0.8188 -0.4246 2500 -4.4422 1.2470 -5.6891 0.3459 0.8314 -0.4863 3000 -4.4422 1.3362 -5.7786 -0.3143 0.8908 -1.4356 3500 -4.4422 1.1561 -5.5984 0.6978 0.7707 0.1177 4000 -4.4422 1.1903 -5.6324 0.5920 0.7935 -0.0789 4500 -4.4422 1.1678 -5.6101 0.6005 0.7785 -0.0477 5000 -4.4422 1.1185 -5.5607 0.6746 0.7457 0.1169 **** END OF DYNAMICS **** AVERAGES FLUCTS -4.44221 1.23578 -5.67808 0.29658 0.82385 -0.52308 0.00000 0.08129 0.08090 0.40580 0.05419 0.53147 90 CAPITOLO 5. DINAMICA MOLECOLARE: UN’APPLICAZIONE Parte V Il metodo Monte Carlo 91 Capitolo 6 Monte Carlo: metodologie 6.1 Introduzione Il metodo Monte Carlo è, essenzialmente, una tecnica di calcolo per la valutazione di integrali definiti. In particolare, nell’ambito della meccanica statistica, il metodo Monte Carlo consente di valutare in modo efficiente il valore medio di una proprietà osservabile in un sistema a molte coordinate, data, naturalmente la densità di probabilità degli stati del sistema. Consideriamo il seguente problema: è data una funzione osservabile F (q) definita rispetto ad un set di coordinate (classiche) q = (q1 , q2 , . . . qN )tr . Le coordinate q rappresentano uno stato del sistema, che supponiamo sia descritto nell’ambito del’insieme canonico. L’energia totale del sistema è 1 E = V (q) + T = V (q) + p · m−1 p 2 (6.1) dove p = (p1 , p2 , . . . pN )tr è il vettore dei momenti generalizzati; m è la matrice generalizzata delle masse (che può anche essere fuzione di q). Il valore medio dell’osservabile F è semplicemente R F = R dq dpF (q) exp[−E(q, p)/kB T ] R R dq dp exp[−E(q, p)/kB T ] (6.2) L’integrale configurazionale in dq è esteso al volume del sistema. Integrando rispetto ai momenti p, resta l’espressione, che coinvolge la sola energia potenziale del sistema: R F = dqF (q) exp[−V (q)/kB T ] R = dq exp[−V (q)/kB T ] R dqF (q) exp[−V (q)/kB T ] Q (6.3) dove Q è la funzione di partizione canonica configurazionale. Il metodo Monte Carlo, almeno nelle sue applicazioni standard, è appunto dedicato al calcolo numerico di espressioni analoghe a (6.3). L’idea che è alla base del metodo Monte Carlo è la seguente: si determini un insieme o campione rappresentativo di punti, generati casualmente all’interno dello spazio delle fasi del sistema; si sostituiscano gli integrali esatti a numeratore e denominatore di (6.3) con somme approssimate che dipendono dal campione di punti. Evidentemente sarà cruciale il criterio di campionamento adottato per scegliere il campione rappresentativo dei punti, che dovrà essere in grado di esplorare o rappresenare in modo efficiente lo spazio delle fasi complessivo del sistema. 93 94 CAPITOLO 6. MONTE CARLO: METODOLOGIE Esercizio 8. In Fig. (6.1) è riportato uno schema relativo ad un sistema di tre particelle monodimensionali che si muovono lungo una retta da 0 ad L. Lo spazio delle fasi è dunque costituito da una sfera di raggio L centrata nell’origine di una terna di assi x = (x1 , x2 , x3 ). Una collezione di punti x1 , x2 , . . . , xM è rappresentata in figura. x3 x1 x2 x3 L L x 2 x1 Figura 6.1: Spazio delle fasi e campione di punti rappresentativo per un sistema a tre coordinate La scelta di un campione rappresentativo dello spazio delle fasi del sistema potrebbe essere effettuata, in linea di principio semplicemente generando una sequenza o catena casuale1 di punti. È evidente però che in generale questa scelta non sarà molto efficiente nel caso di un potenziale generico V (q): è opportuno infatti generare punti dello spazio delle fasi o configurazioni che massimizzino l’integrando exp(−V /kB T ) cioè, sostanzialmente, configurazioni a bassa energia ed alta probabilità del sistema. Il campionamento deve dunque tener conto della distribuzione di Boltzmann delle energie del sistema: questa procedura (detta anche importance sampling) è implementata in modo efficiente dal cosiddetto schema Metropolis2 , che è descritto nella sezione successiva. 6.2 Metodologia Lo schema Metropolis può essere descritto brevemente nel seguente modo: 1. è dato una qualche stato iniziale del sistema q1 : utilizzando un qualche criterio di scelta stocastico, cioè basato su una scelta almeno parzialmente casuale, una nuova configurazione qprova viene 1 La scelta casuale o stocastica dei punti dello spazio delle fasi, analoga ai numeri casuali ottenuti da una roulette di un Casinò, dà il nome al metodo: Monte Carlo 2 Il nome deriva da uno dei coautori del lavoro N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth,, A.H. Teller e E. Teller, J. Chem. Phys., 21, 1087 (1953) 6.2. METODOLOGIA 95 generata; 2. si calcola la differenza di energia ∆V = V (qprova ) − V (q1 ): se tale differenza è minore di zero, cioè se l’energia della configurazione di prova è minore di quella precedente, la configurazione di prova viene accettata, ed entra a fare parte del campione rappresentativo, q2 = qprova ; 3. se invece ∆V > 0, la configurazione è accettata, q2 = qprova , nel campione solo se exp(−∆V /kB T ) è maggiore di un numero casuale ² uniformemente distribuito nell’intervallo [0, 1]; altrimenti la configurazione di prova viene rifiutata e si mantiene la configurazione precedente, q2 = q1 - in pratica la nuova configurazione viene accettata con una probabilità data dal fattore di Boltzmann exp(−∆V /kB T ). 4. data la nuova configurazione q2 si genera una nuova configurazione del campione ripartendo dal punto 1. Lo schema Metropolis dunque non sceglie configurazioni in modo casuale, ma le “pesa” tenendo conto del fattore di Boltzmann exp(−V /kB T ). Una volta che un numero M sufficientemente elevato di configurazioni è stato generato, il valor medio di una proprietà F (q) è ottenuto come una media non pesata su tutte le configurazioni del campione F = M 1 X F (qj ) M j (6.4) È possibile una giustificazione formale del metodo Monte Carlo secondo lo schema Metropolis, basata sull’idea che il campionamento costituisce una pseudo-dinamica del sistema: cioè che la successione di configurazioni è ottenuta in base ad un’evoluzione temporale, o traiettoria, definita nello spazio configurazionale del sistema. L’evoluzione temporale non è naturalmente data dalla vera dinamica del sistema, ciò che equivarrebbe ad una simulazione di Dinamica Molecolare, ma ha la caratteristica di mantenere alcune proprietà fondamentali per il calcolo delle proprietà di equilibrio del sistema. 6.2.1 Catene di Markov Consideriamo una sequenza di punti qj associati ai tempi discreti nj . La probabilità condizionale che il sistema sia nel punto qj+1 al tempo nj+1 , dato il suo precedente passaggio per q1 a n1 , q2 a n2 , . . ., qj a nj si indica con P (qj+1 , nj+1 |qj , nj ; . . . ; q2 , n2 ; q1 , n1 ). Se il sistema non ha memoria degli eventi precedenti a nj , allora P (qj+1 , nj+1 |qj , nj ; . . . ; q2 , n2 ; q1 , n1 ) = (6.5) e la sequenza di configurazioni è detta catena di Markov. Consideriamo ora una catena di Markov per la quale le probabilità condizionali siano indipendenti dal tempo: P (qj , nj |qi , ni ) = Pij (6.6) 96 CAPITOLO 6. MONTE CARLO: METODOLOGIE cioè dipendono solo dagli stati iniziale e finale qi e qj . La matrice Pij è detta matrice di transizione stocastica. Sia ρi (n) la probabilità che il sistema sia nello stato qi dopo n passi; allora in notazione matriciale si può scrivere ρ(n) = Ptr ρ(0) (6.7) dove ρ(0) è una distribuzione iniziale arbitraria. Nel limite n → ∞, esiste una distribuzione limite di stato stazionario lim Ptr ρ(0) = P (6.8) n→∞ Si può dimostrare che esiste un’unica distribuzione di stato stazionario se ogni stato del sistema può essere raggiunto da ogni altro stato del sistema attraverso almeno un cammino a più step con probabilità non nulla. In questo caso il sistema (e/o la catena di Markov) si dice ergodico. La scelta di una catena di Markov, ovvero la determinazione di una sequenza di punti dello spazio configurazionale, deve avvenire in maniera tale che all’equilibrio il numero di configurazioni accettate in uscita da uno stato i siano uguali a quelle che portano ad i da tutti gli altri stati.Una condizione sufficiente è che la matrice P verifichi il principio del bilancio dettagliato Pi Pij = Pj Pji (6.9) Lo schema Metropolis è una possibile soluzione alla scelta della matrice di transizione. Formalmente, si definisce una matrice simmetrica di transizione pij , che definisce il criterio per generare una nuova configurazione di prova, data una certa configurazione di partenza. La matrice di transizione è data come Pij = pij if ρi ≥ ρj con i 6= j ρj if ρi < ρj con i 6= j Pij = pij ρi La probabilità che il sistema rimanga nello stato i è data da Pii = 1 − X (6.10) (6.11) Pij (6.12) i6=j Se il campionamento viene effettuato rispetto ad una distribuzione canonica, cioè si utilizzano i pesi dati dalla distribuzione di Boltzmann, si può dimostrare che la distribuzione limite è data da exp[−V (qi )/kB T ] Pi = Q Si può notare che poichè in Eq. (6.11) compare solo il rapporto ρj ρi , (6.13) non è necessaria la conoscenza a priori della funzione di partizione Q. Possiamo concludere questa Sezione notando anche che lo schema di Metropolis non è l’unica soluzione possibile. Molti altri schemi alternativi possono essere scelti, che verificano l’Eq. (6.13), e che non richiedono la consocenza di Q, come per esempio lo schema: pij ρj Pij = i 6= j ρi + ρj Pii = 1 − X Pij (6.14) (6.15) i6=j Nella maggior parte delle applicazioni di letteratura, tuttavia, lo schema Metropolis è il più diffuso. 6.3. APPLICAZIONI 6.3 Applicazioni 6.3.1 Alcuni esempi 97 Ogni proprietà che possa essere scritta sotto forma di una media rispetto ad una distribuzione canonica (e non solo, vedi la Sezione successiva) di equilibrio può essere determinata una volta che sia stato selezionato un campione rappresentativo del sistema. Tra i sistemi più adatti ad essere studiati con il metodo Monte Carlo sono naturalmente i fluidi. Consideriamo per esempio il sistema definito nel Capitolo precedente, un insieme di N particelle puntiformi interagenti via un potenziale di LennardJones, in un volume cubico con condizione periodiche. Per generare una catena di Markov del sistema, secondo lo schema di Metropolis, possiamo procedere definendo la matrice pij per la transizione da uno stato ad un altro del sistema seguendo per esempio il seguente schema di Metropolis 1. uno stato del sistema è rappresentato dalla collezione di vettori ~r1 , ~r2 , . . . , ~rN e inizialmente il sistema è preparato in una qualche struttura cristallina; una nuova configurazione si può generare scegliendo per esempio una particella i in modo casuale, e cambiando il vettore ~ri di un vettore δ~r di direzione e lunghezza casuale (entro per esempio un certo raggio di cut off prescelto). 2. si calcola la differenza di energia ∆V : se tale differenza è minore di zero, cioè se l’energia della configurazione di prova è minore di quella precedente, la configurazione di prova viene accettata, ed entra a fare parte del campione rappresentativo 3. se invece ∆V > 0, la configurazione è accettata nel campione solo se exp(−∆V /kB T ) è maggiore di un numero casuale ² uniformemente distribuito nell’intervallo [0, 1]; altrimenti la configurazione di prova viene rifiutata e si mantiene la configurazione precedente in pratica la nuova configurazione viene accettata con una probabilità data dal fattore di Boltzmann exp(−∆V /kB T ). 4. data la nuova configurazione o collezione di punti si genera una nuova configurazione del campione ripartendo dal punto 1. In pratica lo schema Metropolis è implementato specificando il criterio di scelta delle configurazioni di prova, che nel caso specifico è basato sulla determinazione di quattro numeri casuali: la particella che deve essere mossa, la lunghezza del vettore δ~r e i due angoli che ne specificano l’orientazione. Un altro esempio classico, che sarà descritto nel dettaglio nel Capitolo successivo, è dato dallo studio delle proprietà di equilibrio di un polimero. Consideriamo una catena formata da M elementi o monomeri. I gradi di libertà interni del sistema sono specificati da N grandezze: gli angoli di legame tra i legami che uniscono due monomeri successivi, le distanze o lunghezze di legame tra due monomeri successivi e gli angoli torsionali identificati da tre legami consecutivi valore costante le distanze di legame. Supponiamo di fissare ad un valore uguale e costante gli angoli di legame e le distanze di legame. Se fissiamo nello spazio le posizioni dei primi tre monomeri, dovremo definire N = M − 3 angoli torsionali per definire in modo univoco una conformazione della molecola, cfr. Fig. (6.2). Possiamo definire 98 CAPITOLO 6. MONTE CARLO: METODOLOGIE z M-3 5 3 φ1 φ 2 4 2 φ 3 φ N-1 6 φ 0 M-2 M-1 1 y 0 x Figura 6.2: Catena di M monomeri definita da N angoli l’energia del sistema come una somma di interazioni steriche, rappresentate da semplici potenziale sitosito Lennard-Jones, e termini torsionali, che specificano l’energia conformazionale V = 4²S M −1 M −1 X X i=0 j=i+1 à !12 à !6 −1 σ σ ²T NX − + (1 + cos 3φk ) Rij Rij 2 (6.16) k=0 Il metodo Monte Carlo prevede un campionamento sulle possibili conformazioni del sistema. I criteri di scelta possibili delle conformazioni sono molteplici. Per esempio • ad ogni nuova scelta di una conformazione, data la conformazione precedente, si sceglie in modo casuale un angolo torsionale, e lo si ruota di un valore casuale • si genera la nuova conformazione, data la conformazione precedente, spostando un segmento (alcuni monomeri consecutivi), scelto in modo casuale, dalla sua posizione originale ad un’altra posizione, definita anch’essa in modo casuale • si sceglie un segmento, si fissano le posizioni del primo ed ultimo monomero del segmento, e si generano nuove conformazioni interne del segmento stesso In questo modo si possono esplorare le conformazioni possibili, sino a raccogliere un campione rappresentativo sufficientemente esteso per il calcolo di proprietà di equilibrio del sistema. Sistemi formati da singole catene o collezioni di catene sono importanti per lo studio di molecole o aggregati di interesse biochimico, come le proteine, gli acidi nucleici, le membrane fosfolipidiche. 6.3.2 Altri insiemi termodinamici Anche se finora sono state discusse applicazioni del metodo Monte Carlo solo nell’ambito dell’insieme canonico (NVT), è possibile effettuare simulazioni Monte Carlo anche nell’ambito di altri insiemi ter- 6.3. APPLICAZIONI 99 modinamici, come per esempio l’insieme grancanonico (µVT): il numero di particelle N diviene in questo caso una grandezza variabile, che viene campionata durante la scelta dei punti dello spazio delle configurazioni in modo analogo agli altri gradi di libertà del sistema. Il peso di ciascuna configurazione viene naturalmente dato dalla distribuzione configurazionale grandcanonica ρ= exp[µN/kB T − V (q)/kB T ] Ξ (6.17) dove Ξ è il corrispondente integrale di configurazione. Una simulazione Monte Carlo nell’insieme grandcanonico prevederà perciò l’inserzione o l’eliminazione casuale di particelle; il rifiuto o l’accettazione di queste mosse nella determinazione della catena di Markov è effettuato nel solito modo, ma la probabilità è ora dettata dalla distribuzione in Eq. (6.17). L’attrattiva del sistema grandcanonico è nella definizione iniziale del potenziale chimico, che permette perciò di definire in partenza l’energia libera del sistema. Tra gli altri insiemi utilizzati, possiamo ricordare l’insieme N P T , che permette di definire in partenza la pressione del sistema e riveste quindi una certa utilità per sistemi (e.g. fluidi di particelle rigide), per i quali il calcolo di P negli insiemi consueti sia difficile. In questo caso la densità di probabilità degli stati è proporzionale a ρ= exp[P V − V (q)/kB T ] Π (6.18) dove Π è l’integrale di configurazione. L’implementazione dell’insieme N P T richiede l’inclusione nei criteri di scelta della catena di Markov di mosse che modificano il volume del campione. 100 CAPITOLO 6. MONTE CARLO: METODOLOGIE Capitolo 7 Monte Carlo: un esempio 7.1 Studio conformazionale di una catena alchilica Concludiamo l’esposizione dedicata la metodo Monte Carlo con un esempio specifico. Come nel Capitolo (5), dedicato ad un’applicazione di Dinamica Molecolare, porremo soprattutto l’attenzione sugli aspetti pratici e computazionali. Consideriamo dunque il sistema precedentemente descritto di una singola catena formata da M monomeri, con N = M − 3 gradi di libertà interna costituiti da altrettanti angoli torsionali, cfr. Fig. (6.2). Vogliamo descrivere un semplice programma Fortran per il calcolo della distanza media tra il primo e l’ultimo atomo (nel seguito useremo i termini “atomo”, “monomero” o “sito” in modo equivalente). 7.1.1 Il sistema ~ i con La geometria del sistema è descritta in Fig. (6.2). Ogni atomo è identificato dal vettore R i = 0, . . . , M − 1; gli angoli torsionali sono φj con j = 0, . . . , N − 1. Per eliminare i gradi di libertà esterni (rotazionali e traslazionali) fissiamo i primi tre siti ponendo il sito i = 1 nell’origine: ~ 0 = (d sin θ, 0, d cos θ)tr R ~ 1 = (0, 0, 0)tr R ~ 0 = (0, 0, d)tr R (7.1) L’angolo θ definisce l’angolo di legame tra due legami; per esempio per un legame tetraedrico θ = 109◦ . La distanza di legame tra due siti adiacenti vale d. Noti gli N = M − 3 angoli torsionali φj , non è ~ i con i = 3, . . . , M − 1 usando la seguente relazione ricorsiva difficile ricavare i vettori R n ~i = R ~ i−1 + d cosθ[1 + cos φi−3 ](R ~ i−2 − R ~ i−1 ) + cos φi−3 (R ~ i−3 − R ~ i−2 ) R o − ~ i−2 − R ~ i−1 ) × (R ~ i−3 − R ~ i−2 ) sin φi−3 (R (7.2) L’energia di una configurazione, caratterizzata dal vettore φ avente elementi φj , è calcolabile come la somma di vari contributi: interazioni steriche, conformazionali, vibrazionali, etc., come è stato già accennato nel Capitolo precedente. Adotteremo nel resto del Capitolo la semplice Eq. (6.16): i parametri che specificano la forma funzionale dell’energia conformazionale sono σ, ²S e ²T - il diametro di un atomo, e due parametri energetici, relativamente al contributo sterico e conformazionale. 101 102 CAPITOLO 7. MONTE CARLO: UN ESEMPIO In un calcolo Monte Carlo applicato al sistema in questione dovremo generare, in accordo con lo schema Metropolis, una catena di Markov di conformazioni. Genereremo ogni nuova conformazione adottando il semplice criterio di muovere a caso, di una quantità compresa tra zero e φc , uno degli angoli torsionali. Ogni conformazione della catena di Markov potrà poi essere utilizzata per il calcolo ~ M −1 − R ~ 0 | La conformazione iniziale cordell’osservabile, che nel nostro caso è semplicemente R = |R risponderà ad una catena completamente estesa. Possiamo finalmente riassumere i parametri necessari a specificare in modo completo una simulazione Monte Carlo: θ, d, σ, ²S , ²T , la temperatura T , l’angolo di cut-off φc e eventualmente il numero massimo di conformazioni che si vogliono includere nella catena di Markov, Nc . In pratica è conveniente ricorrere ad un set parametrico leggermente ridotto, che descrive il sistema in termini di coordinate riscalate. Fisseremo perciò come unità di lunghezza la grandezza d; inoltre poichè la temperatura compare solo come denominatore nel calcolo dei pesi di ciascuna configurazione possiamo semplicemente introdurre i parametri riscalati ²S /kB T e ²T /kB T . I parametri riscalati che definiscono il sistema sono perciò: θ, σ = σ/d, ²S = ²S /kB T , ²T = ²T /kB T , più naturalmente φc e Nc . 7.1.2 Metodo di calcolo e codice Il programma, molto semplice, legge da file i parametri sigma, theta, eps, ept, m, angle (l’angolo di cut-off) e iseed. Quest’ultimo è un semplice parametro per inizializzare la routine che genera numeri casuali (vedi oltre). c............................................................... c c Testing Monte Carlo on a single chain c c M monomers c N = M-3 torsional angles c............................................................... implicit none include ’data.inc’ integer istep,nstep,iout,iseed double precision dist,average,sum c............................................................... c input open (unit=1,file=’file.in’,form=’formatted’,status=’unknown’) read (1,*) sigma,theta,eps,ept 7.1. STUDIO CONFORMAZIONALE DI UNA CATENA ALCHILICA 103 theta=theta*d2r read (1,*) m if (m.lt.5) m=5 n=m-3 read (1,*) nstep,iout if (nstep.le.1000) nstep=1000 read (1,*) angle,iseed angle=angle*d2r close (unit=1) c............................................................... c assign initial configuration call initial c............................................................... c Monte Carlo step open (unit=2,file=’file.out’,form=’formatted’,status=’unknown’) sum=zero do istep=1,nstep+1 call observable(dist) sum=sum+dist average=sum/istep if (mod(istep,iout).eq.0) then write (2,*) istep,average write (6,*) istep,average end if call choise(iseed) end do close (unit=2) c............................................................... end La routine initial ha il semplice scopo di scegliere la configurazione iniziale. Segue il calcolo Monte Carlo vero e proprio: la routine observable calcola il valore medio aggiornato dell’osservabile in esame, mentre la routine choise è il nucleo del programma: sceglie una nuova configurazione, ne calcola l’energia e la confronta con l’energia della configurazione precedente, decidendo se rifiutarla o accettarla secondo lo schema di Metropolis. 104 CAPITOLO 7. MONTE CARLO: UN ESEMPIO subroutine choise(iseed) implicit none include ’data.inc’ integer ibond,i,j,iseed double precision energy1,energy2,r1,r2,r3, _ rotate,oldq,oldr(3,0:mx-1),delta call potential(energy1) call random(iseed,r1) ibond=int(r1*n) call random(iseed,r2) rotate=r2*angle oldq=q(ibond) do i=0,m-1 do j=1,3 oldr(j,i)=r(j,i) end do end do q(ibond)=q(ibond)+rotate call cartesian call potential(energy2) delta=energy2-energy1 if (delta.lt.zero) then return else call random(iseed,r3) delta=dexp(-delta) if (delta.gt.r3) then return else q(ibond)=oldq do i=0,m-1 do j=1,3 r(j,i)=oldr(j,i) 7.1. STUDIO CONFORMAZIONALE DI UNA CATENA ALCHILICA 105 end do end do return end if end if end All’interno della routine choise troviamo le routine potential (per il calcolo dell’energia di una conformazione) e random per generare numeri casuali compresi tra 0 e 1. La routine potential implementa la formula (6.16), che implica a sua volta la conoscenza delle coordinate cartesiane degli atomi, date le coordinate interne torsionali: la conversione è effettuata dalla routine cartesian subroutine potential(energy) implicit none include ’data.inc’ integer i,ii,j double precision energy,ratio energy=zero do i=0,m-1 do ii=i+1,m-1 ratio=sigma/dsqrt((r(1,ii)-r(1,i))**two _ +(r(2,ii)-r(2,i))**two+(r(3,ii)-r(3,i))**two) ratio=ratio**six energy=energy+four*eps*(ratio**two-ratio) end do end do do j=0,n-1 energy=energy+half*ept*(one+dcos(3q(j))) end do return end c....................................................... subroutine cartesian 106 CAPITOLO 7. MONTE CARLO: UN ESEMPIO implicit none include ’data.inc’ integer i,j double precision cq(0:nx-1),sq(0:nx-1),a(3),b(3),c(3) do i=0,n-1 cq(i)=dcos(q(i)) sq(i)=dsin(q(i)) end do do i=3,m-1 do j=1,3 a(j)=r(j,i-2)-r(j,i-1) b(j)=r(j,i-3)-r(j,i-2) end do c(1)=a(3)*b(2)-a(2)*b(3) c(2)=a(1)*b(3)-a(3)*b(1) c(3)=a(2)*b(1)-a(1)*b(2) do j=1,3 r(j,i)=r(j,i-1) _ +ct*(one+cq(i-3))*a(j)+cq(i-3)*b(j)+sq(i-3)*c(j) end do end do return end Un esempio di calcolo è riportato nel seguito. Il file di input file.in è semplicemente 1.2d0,109.d0,1.0d0,1.0d0 5 100000,10000 5.d0,999 che definisce una catena di cinque atomi, con angoli di legame tetraedrici, σ = 1.2; i parametri di potenziale (non troppo realistici, per una catena alchilica) sono ²S = ²T = 1; si vogliono generare 106 configurazioni, con “mosse” di rotazione di 5◦ al massimo. L’andamento di R è riportato in Fig. (7.1). 7.1. STUDIO CONFORMAZIONALE DI UNA CATENA ALCHILICA 107 2.48 R 2.47 2.46 2.45 2.44 0 2 4 6 8 10 Nc (x 100000) Figura 7.1: Distanza media R tra il primo e l’ultimo atomo in una catena di cinque monomeri, in funzione del numero di elementi della catena di Markov generata in una simulazione Monte Carlo 108 CAPITOLO 7. MONTE CARLO: UN ESEMPIO Bibliografia [1] B.B. Berne, in Physical Chemistry: an Advanced Treatise, Vol. VIII B, Cap. 9. [2] A.S. Davydov, Meccanica Quantistica, (Ed. Mir, Mosca, 1981). [3] M.P. Allen e D.J. Tildesley, Computational Simulation of Liquids, Clarendon, 1987. [4] C.L. Perrin, Mathematics for Chemists, (Wiley, New York, 1970). [5] M. Abramowitz e I. Stegun, Handbook of Mathematical Functions, (Dover, New York, 1972). [6] H.D. Ikramov, Linear Algebra: Problems Book, (Mir Publishers, Mosca, 1983). [7] R.J. Jacob, in Physical Chemistry: an Advanced Treatise, Vol. XI A, Cap. 1. [8] S. Lang, Algebra Lineare, (Boringhieri, Torino, 1984). [9] D. Henderson, in Physical Chemistry: an Advanced Treatise, Vol. XI A, Cap. 4. [10] I.S. Gradshtein e I.M. Ryzhik, Table of Integrals, Series and Products (Academic Press, New York, 1972). [11] P.W. Atkins, Molecular Quantum Chemistry, (Oxford, 1983). [12] L.D. Landau e E.M. Lifšits, Meccanica Quantistica, (Editori Riuniti, 1982). [13] AA. VV., Modern Theoretical Chemistry voll. 3,4, ed. G.A. Segal (Plenum Press, N.Y. 1977). [14] AA. VV., Modern Theoretical Chemistry voll. 7,8, ed. G.A. Segal (Plenum Press, N.Y. 1977). [15] F.L. Pilar, Elementary Quantum Chemistry 2a edizione, (McGraw-Hill, N.Y. 1990). [16] W.J. Hehre, R.F. Stewart and J.A. Pople, J. Chem. Phys 51, 2657 (1969). [17] M.J.S. Dewar, E.G. Zoebisch, E.F. Healy and J.J.P. Stewart, J. Am. Chem. Soc. 107 [18] J. Gao, Methods and applications of combined quantum mechanical and molecular mechanical potentials, p.119-185 in Reviews in Computational Chemistry, vol. 7, 1996. [19] A. Warshel e M. Levitt, J. Mol. Biol.,100 , 13213 (1976). 109 110 BIBLIOGRAFIA [20] U.C. Singh e P.A. Kollman, J. Comput. Chem.,7 ,718 (1986). [21] J. Aqvist e A. Warshel, Chem. Rev., 93, 2523 (1993). [22] M.J.S. Dewar, E.G. Zoebisch, E.A. Healy e J.J.P. Stewart, J. Am. Chem. Soc.,107, 3902 (1985). [23] P.D. Lyne, M. Hodoscek e M. Karplus, J Phys. Chem. A, 103, 3462 (1999). [24] Y.S. Lee, M. Hodoscek e M. Karplus, Biophys. Chem., 70(3), 203 (1998). [25] Z. Barandiaran e L. Seijo, J. Chem. Phys., 89(9), 5739 (1988). [26] R. V. Stanton, D. S. Hartsough e K. M. Merz, J. Phys. Chem., 97, 11868 (1993). [27] D. Wei e D.R. Salahub, Chem. Phys. Lett., 224, 291 (1994). [28] X.P. Long, J.B. Nicholas, M.F. Guest e R.L. Ornstein, J. Mol. Struct., 412(1-2), 121 (1997). [29] M. Eichinger, P. Tavan, J. Hutter e M. Parrinello, J. Chem. Phys., 110(21), 10452 (1999). [30] P. Sherwood, Modern Methods and Algorithms of Quantum Chemistry, vol. 1,257 (2000). [31] Y.Q. Tu e A. Laaksonen, J. Chem. Phys., 1999, 111(16) , 7519 (1999). [32] D. Bakowies e W. Thiel, J. Phys. Chem., 100, 10580 (1996). [33] A. Warshel e R. M. Weiss, J. Am. Chem. Soc., 102, 6218 (1980). [34] S.P. Webb e M. S. Gordon, J. Phys. Chem. A, 103, 1265 (1999). [35] J. Gao, P. Amara, C. Alhambra e M.J. Field, J. Phys. Chem. A, 102, 4714 (1998). [36] A. Warshel e M. Levitt, J. Mol. Biol., 103, 227 (1976). [37] I. Antes e W. Thiel, J. Phys. Chem. A, 103(46), 9290 (1999). [38] D. Das, K.P. Eurenius, E. Billings, P. Sherwood, D.C. Chatfield, M. Hodoscek e B.R. Brooks, J. Chem. Phys., vol. 117, N. 23, 10534 (2002). [39] M. Swart, Int. J. of Quant. Chem., vol. 91, 177 (2003). [40] V. Thery, D. Rinaldi, J.L. Rivail, B. Maigret e G.G. Ferenczy, J. Comput. Chem., 15(3), 269 (1994). [41] N. Reuter, A. Dejaegere, B. Maigret e M. Karplus, J. Chem. Phys. A, 104, 1720 (2000). [42] V. Kairys e J. H. Jesen, J. Chem. Phys. A, 104, 6656 (2000). [43] M.P. Allen e D.J. Tildesley, Computer Simulations of Liquids, Oxford University Press, London, 1987 BIBLIOGRAFIA 111 [44] D. Beglov e B. Roux, J. Chem. Phys, 100, 9050 (1994). [45] M.J. Field, P.A. Bash e M. Karplus, J. Comput. Chem., 11, 700 (1990). [46] F. Maseras e K. Morokuma, J. Comp. Chem., 16(9),1170 (1995). [47] K. Breuer, J. H. Teles, D. Demuth, H. Hibst, A. Schafer, S. Brode e H. Domgorgen, Angew. Chem. Int. Ed. Engl., 38(1), 1401 (1999). [48] S. Dapprich, I. Komaromi, K.S. Byun, K. Morokuma e M.J. Frisch, J. Mol. Struct. (THEOCHEM), 1-21, 461 (1999). [49] J.A. Gascon e V.S. Batista, Biophys. J., 87, 2931 (2004). [50] M. Svensson, S. Humbel, R.D.J. Froese, T. Matsubara, S. Sieber e K. Morokuma, J. Phys. Chem., 100, 19357 (1996). [51] M. Torrent, T. Vrenen, D.G. Musaev, K. Morokuma, O. Farkas e H.B. Schlegel, J. Am. Chem. Soc., vol. 124, N.2 (2002). [52] L.L. Ho e A.D. MacKerel Jr., J. Phys. Chem., 100, 4466 (1996). [53] D.S. Hartsough e K.M. Merz Jr., J. Phys. Chem., 99, 11266 (1995). [54] P.D. Lyne, A.J. Mulholland e W.G. Richards, J. Am. Chem. Soc., 117, 11345 (1995). [55] H. Li, A.W. Hains, J.E. Everts, A.D. Robertson e J.H. Jensen, J. Phys. Chem. B, 106, 3486 (2002). [56] M.A. Thompson, J. Am. Chem. Soc., 117, 11341 (1995). [57] T. Matsubara, F. Maseras, N. Koga e K. Morokuma, J. Phys. Chem., 100, 2573 (1996). [58] L. Deng, T.K. Woo, L. Cavallo , P.M. Margl e T. Ziegler, J. Am. Chem. Soc., 119, 6177 (1997). [59] J. Gao, J. Phys. Chem., 96, 537 (1992). [60] J. Gao, J. Am. Chem. Soc., 116, 9324 (1994). [61] H. Liu, F. Muller-Plathe e W.F. van Gunsteren, J. Chem. Phys., 102, 1722 (1995). [62] P.A. Bash, M.J. Field, R.C. Davenport, G.A. Petsko, D. Ringe e M. Karplus, Biochem., 30, 5826 (1991). [63] L. Ridder, J.N. Harvey, I.M.C.M. Rietjens, J. Vervoort e A.J. Mulholland, J. Phys. Chem. B, 107, 2118 (2003). [64] M.C. Hutter, J.M. Hughes, J.R. Reimers e N.S. Hush, J. Phys. Chem. B, 103, 4906 (1999). [65] C.S. Carmer, B. Weiner e M. Frenklach, J. Chem. Phys., 99, 1356 (1993). 112 BIBLIOGRAFIA [66] S. Skokov, C.S. Carmer, B. Weiner e M. Frenklach, Phys. Rev. B., 49, 5662 (1994). [67] K. Raghavachari e M. D. Halls, Mol. Phys., 102, 381 (2004). [68] Y. Joung, C. H. Choi e M. S. Gordon, J. Phys. Chem. B, 105, 4039 (2001). [69] H.S. Lee, C.H. Choi e M.S. Gordon, J. Phys. Chem. B, 109, 5067 (2005). [70] S.T. Bromley, S.A. French, A.A. Sokol, C.R.A. Catlow e P. Sherwood, J. Phys. Chem. B, 107, 7045 (2003). [71] C.H. Choi e M. S. Gordon, J. Am. Chem. Soc., 124, 6162 (2002). [72] K. Bolton, J. Mol. Struct. (Theochem), 632, 145 (2003). [73] Y.A. Mantz, F.M. Geiger, L.T. Molina e B.L. Trout, Chem. Phys. Lett., 348, 285 (2001). Appendice A Appendici parte I A.1 Alcune proprietà della funzione delta di Dirac Per ogni funzione continua F (x) vale che Z b a dxF (x)δ(x) = F (0) (A.1) se e solo se 0 è compreso nell intervallo [a, b]. Valgono le seguenti rappresentazioni analitiche della funzione delta(x): sin xL δ(x) = lim (A.2) L→∞ πx Z ∞ 1 δ(x) = dk exp(ikx) (A.3) 2π −∞ a 1 (A.4) δ(x) = lim 2 a→0 π a + x2 La derivata della funzione δ(x) è definibile. Il calcolo degli integrali contenenti δ 0 (x) si effettua per parti, e ponendo δ(x) = 0 per x 6= 0: Z b a δ 0 (x)F (x) = −F 0 (0) (A.5) Altre uguaglianze valide sono µ ¶ 1 L cos Lx sin Lx 0 δ (x) = lim − π L→∞ x x2 0 xδ (x) = −δ(x) A.2 (A.6) (A.7) Teoria delle perturbazioni dipendenti dal tempo Supponiamo di aver definito un sistema mediante un’hamiltoniano H0 . Al tempo t = 0 accendiamo in modo istantaneo un campo perturbativo dipendente dal tempo, H0 (t), avente la forma 0 H (t) = 0 t<0 (A.8) V (t) 0 ≤ t ≤ τ 0 t>τ 113 114 APPENDICE A. APPENDICI PARTE I Siano |ni le autofunzioni dell’hamiltoniano del sistema imperturbato H0 , con autovalori En . Per semplicità consideriamo solo il caso di uno spettro discreto. Vogliamo determinare la funzione d’onda del sistema perturbato ih̄ ∂Ψ = [H0 + H0 (t)]Ψ ∂t (A.9) Poichè le funzioni |ni costituiscono un set completo o base ortonormale dello spazio hilbertiano delle funzioni d’onda del sistema, possiamo scrivere Ψ come Ψ= X an (t)|ni exp(−iEn t/h̄) (A.10) n Assumiamo che in assenza di perturbazione il sistema sia preparato nell’autostato |ii Ψin = ai |ii exp(−iEi t/h̄) t<0 (A.11) cioè an (t) = δni per t < 0. Durante la perturbazione, 0 ≤ t ≤ τ , i coefficienti cambiano fino a raggiungere i valori ani (τ ). Al cessare della perturbazione, la funzione d’onda è perciò Ψfin = X ani (τ )|ni exp(−iEn t/h̄) (A.12) n La probabilità che il sistema sia in uno stato stazionario |f i di energia Ef è perciò data dal coefficiente af l (τ ): wi→f = |af i (τ )|2 (A.13) Il calcolo dei coefficienti dipendenti dal tempo si può effetturare con un metodo perturbativo. Permoltiplicando l’equazione (A.9) per il bra hf | ed integrando, otteniamo ih̄ȧf (t) = X Vf i (t) exp(iωf i t)ai (t) (A.14) i dove Vf i (t) = hf |V (t)|ii e h̄ωf i = Ef − Ei . Integriamo con la condizione iniziale af (0) = δf i (A.15) Il sistema di equazioni (A.14) si può integrare numericamente noti i coefficienti Vf i (t). In pratica, se τ non è grande, si può supporre che la variazione dei coefficienti sia piccola. Applicando il metodo delle approssimazioni successive (1) 1 si ottiene al primo ordine per f 6= i Z 1 t dt0 Vf i (t0 ) exp(iωf i t0 ) ih̄ 0 da cui segue che af i = ¯ wi→f 1 (A.16) ¯ Z ¯2 1 ¯¯ τ = 2¯ dtVf i (t) exp(iωf i t)¯¯ h̄ 0 (A.17) È dato un sistema di equazioni differenziali al primo ordine, non autonomo ȧ(t) = f [a(t), t] con le condizioni iniziali a(0) = 0. Allora l’approssimazione di ordine k, a(k) (t), si ottiene dall’approssimazione di ordine k − 1 come Z a(k) (t) = t dt0 f[a(k−1) (t0 ), t0 ] 0 nella tacita ipotesi che la successione cosı̀ definita converga e converga alla soluzione del sistema per k → ∞. A.3. MATRICE DENSITÀ A.2.1 115 Probabilità di transizione nell’unità di tempo La probabilità di transizione si semplifica se V (t) ≡ V , cioè se la perturbazione non cambia nel tempo nell’intervallo τ . Allora, se Vf i = hf |V |ii, si può esprimere l’eq. (A.17) nella forma 2 wi→f = 2 |Vf i |2 f (Ef − Ei ) h̄ dove la funzione f (E) ha la forma (A.18) 1 − cos(Eτ /h̄) (A.19) E2 per τ >> h̄En , cioè se la durata della perturbazione è molto maggiore dei tempi caratteristici del sistema f (E) = h̄2 imperturbato, la funzione f (E) degenera in un delta di Dirac f (E) → τ πh̄δ(E), e quindi la probabilità di transizione è data da: 2π wi→f = |Vf i |2 τ δ(Ef − Ei ) h̄ la probabilità di transizione nell’unità di tempo è perciò wi→f 2π = |Vf i |2 δ(Ef − Ei ) pi→f = τ h̄ A.3 (A.20) (A.21) Matrice densità Consideriamo un sistema rappresentato in assenza di interazioni con il resto dell’universo, dall’hamiltoniano H0 , avente autofunzioni |ketn ed uno spettro discreto di livelli energetici corrispondenti En . La funzione d’onda generica del sistema è Ψ= X an |ni (A.22) n Una proprietà osservabile rappresentata dall’operatore B avrà il seguente valor medio: B= X a∗n am Bnm (A.23) mn dove Bnm = hn|B|mi. Supponiamo ora che il sistema non sia descritto in modo completo, da una funzione d’onda completamente nota: il sistema può essere per esempio una parte, o sottosistema caratterizzato dalle coordinate generiche r, di un sistema più grande, in cui le coordinate restanti q non sono descritte se non in termini di determinate proprietà medie. Il valor medio di una proprietà osservabile B, in generale agente sulle sole coordinate r del sottosistema di interesse, sarà in generale descritto da un’espressione analoga all’eq. (A.23) B= X ρmn Bnm (A.24) mn la matrice ρmn è detta matrice statistica o matrice densità, e può essere considerata come formata dagli elementi di un operatore ρ̂ rispetto alla base |ni. Formalmente, il valor medio di B si può scrivere come la traccia del prodotto degli operatori ρ̂ e B: B= X (ρ̂B)nn = Tr(ρ̂B) n Si noti come: (A.25) 116 APPENDICE A. APPENDICI PARTE I 1. la matrice statistica può essere determinata rispetto a qualunque sistema completo di funzioni d’onda, non solo relativamente agli autostati del sottosistema di interesse 2. in particolare, sia Ψ(r, q) la funzione d’onda del super-sistema r + q che in generale non è nota. Il valor medio di un osservabile B è calcolabile come Z Z drdqΨ∗ (r, q)BΨ(r, q) B= (A.26) che può essere riscritto in termini di un operatore secondo le espressioni Z 0 ρ(r, r ) = dqΨ(r, q)Ψ∗ (r0 , q) (A.27) dr[Bρ(r, r0 )]r=r0 (A.28) Z B = La relazione tra la matrice ρnm e la funzione ρ(r, r0 ) è ottenuta come ρ(r, r0 ) = X mn ρmn |ni∗r0 |mir (A.29) L’operatore ρ̂ gode delle seguenti proprietà: i) è hermitiano, ii) gli elementi diagonali ρnn sono positivi e iii) soddisfano alla condizione di normalizzazione Trρ̂ = 1. L’equazione di evoluzione temporale per la matrice densità si può determinare nel caso di un sistema isolato. Utilizzando l’operatore di commutazione, l’equazione di evoluzione temporale richiesta è ∂ ρ̂ ∂t = i [ρ̂, H0 ] = iLhatρ h̄ (A.30) detta equazione (quantistica) di Liouville per la matrice densità. L’operatore iL = [. . . , H] è detto operatore (quantistico) di Liouville: si confronti con l’eq. (1.44) che esprime l’analogo classico. La condizione di stazionarietà implica che ρ̂ commuti con H0 Nella rappresentazione dell’energia, ciò equivale alla condizione che ρmn sia diagonale. Nella meccanica statistica quantistica, un sistema isolato in equilibrio è perciò descritto dagli elementi diagonali positivi e indipendenti dal tempo della matrice densità.