Elementi di Chimica Quantistica Note integrative agli appunti di lezione Antonino Polimeno Dipartimento di Scienze Chimiche Università degli Studi di Padova Indice generale 1 Richiami di meccanica classica 1.1 Punti materiali . . . . . . . . . . . . 1.2 Sistemi di particelle . . . . . . . . . . 1.3 Momento angolare e forza totale . . . 1.4 Equazioni di Lagrange e di Hamilton . . . . 5 6 8 9 10 . . . . . . 13 13 16 17 19 21 22 . . . . . . . . . 25 25 27 30 32 40 41 42 44 46 4 Meccanica quantistica e spazi vettoriali 4.1 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Operatori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Postulati della quantomeccanica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 50 51 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Presentazione analitica della meccanica quantistica 2.1 Operatori . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Autofunzioni ed autovalori . . . . . . . . . . . . . . . 2.3 Il principio di indeterminazione . . . . . . . . . . . . 2.4 Verifica del principio di indeterminazione . . . . . . . 2.5 Meccanica classica e meccanica quantistica . . . . . . 2.6 Moto semi-classico . . . . . . . . . . . . . . . . . . . 3 Formalismo algebrico della 3.1 Spazi vettoriali . . . . . 3.2 Prodotti scalari . . . . . 3.3 Vettori e matrici . . . . 3.4 Matrici . . . . . . . . . . 3.5 Sistemi lineari . . . . . . 3.6 Trasformazioni . . . . . 3.7 Problemi agli autovalori 3.8 Funzioni di matrici . . . 3.9 Esercizi . . . . . . . . . meccanica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 INDICE GENERALE 4.4 4.5 4.6 Il metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Perturbazioni indipendenti dal tempo per sistemi non-degeneri . . . . . . . . . . . . Sistemi in ordine zero con autostati degeneri . . . . . . . . . . . . . . . . . . . . . . 5 Sistemi risolvibili analiticamente 5.1 Sistemi monodimensionali . . . . . . 5.2 Fuga dal pozzo . . . . . . . . . . . . 5.3 Una scatola con una barriera interna 5.4 Scatola tridimensionale . . . . . . . . 5.5 Particella in e su un anello . . . . . . 5.6 Particella in e su una sfera . . . . . . 5.7 Oscillatore armonico . . . . . . . . . 5.8 Potenziale di Morse . . . . . . . . . . 5.9 Atomo idrogenoide . . . . . . . . . . 6 I momenti angolari 6.1 Proprietà di commutazione . 6.2 Autovalori ed autovettori dei 6.3 Forma esplicita del momento 6.4 Il rotatore rigido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . momenti angolari . angolare orbitale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 L’equazione di Schrödinger 7.1 L’equazione di Schrödinger: insieme di punti materiali . . . . 7.2 Hamiltoniani atomici e molecolari . . . . . . . . . . . . . . . 7.3 Approssimazione di Born-Oppenheimer . . . . . . . . . . . . 7.4 Separazione delle coordinate elettroniche . . . . . . . . . . . 7.5 La molecola di idrogeno ionizzata: Hamiltoniano elettronico 7.6 Hamiltoniano nucleare . . . . . . . . . . . . . . . . . . . . . 7.7 Soluzione approssimata della struttura elettronica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 56 57 . . . . . . . . . 59 59 63 64 66 67 70 73 74 76 . . . . 79 79 80 82 83 . . . . . . . 85 86 88 90 91 93 96 98 8 Funzioni d’onda 101 8.1 Stati di spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.2 Principio di indistinguibilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 8.3 Determinanti di Slater . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 9 Metodi ab-initio 107 9.1 Metodo di Hartree-Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 9.2 Ottimizzazione degli spinorbitali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 9.3 Proprietà dell’operatore di Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 INDICE GENERALE 9.4 9.5 9.6 9.7 9.8 3 Sistemi a guscio chiuso . . . . . . . . . Soluzione numerica delle equazioni HF Interazione di configurazione . . . . . . Alcuni esempi di calcolo ab initio . . . Altri esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Teoria dei gruppi di simmetria ed orbitali molecolari 10.1 Gruppi di simmetria puntuale . . . . . . . . . . . . . . 10.2 Elementi ed operazioni di simmetria . . . . . . . . . . . 10.3 Gruppi puntuali . . . . . . . . . . . . . . . . . . . . . . 10.4 Rappresentazioni . . . . . . . . . . . . . . . . . . . . . 10.5 Operatori di proiezione . . . . . . . . . . . . . . . . . . 10.6 Applicazioni al calcolo di orbitali molecolari . . . . . . 10.7 Alcuni esempi . . . . . . . . . . . . . . . . . . . . . . . 10.8 Un esempio non triviale: il benzene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 114 116 119 122 . . . . . . . . 131 131 133 134 135 138 138 139 140 11 Metodi semiempirici 143 11.1 Metodi semiempirici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 11.2 Neglect-of-differential-overlap (NDO) . . . . . . . . . . . . . . . . . . . . . . . . . . 146 A Funzioni speciali A.1 Integrali ellittici . . . A.2 Funzione gamma . . A.3 Funzione dell’errore . A.4 Funzioni di Bessel . . A.5 Polinomi ortogonali . A.6 Polinomi di Legendre A.7 Polinomi di Hermite A.8 Polinomi di Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 149 150 150 151 151 152 152 152 B L’atomo idrogenoide 153 C Separazione del baricentro 155 D Problema generalizzato agli autovalori 157 E Valore di attesa per un guscio chiuso 159 F Separabilità σ − π (Likos-Parr) 161 4 INDICE GENERALE Capitolo 1 Richiami di meccanica classica In questa sezione saranno discussi i fondamenti della meccanica quantistica, e la loro connessione con i principi di base della meccanica classica. Senza pretesa di completezza - testi di vari autori, dedicati a questa tematica da un punto di vista fisico e formale e storico-epistemologico, sono comunque inclusi nella bibliografia - questi primi quattro capitoli dovrebbero servire a sottolineare la connessione tra le descrizioni classica e quantistica e a fornire una rapida formulazione egli assiomi della meccanica quantistica. La scienza fornisce modelli per l’interpretazione dei fenomeni percepiti dai nostri sensi, o da estensioni dei nostri sensi. Il successo di un modello o teoria fisica è proporzionale alla sua capacità di fornire uno schema di comprensione al maggior numero possibile di osservazioni, con il minor numero possibile di postulati o assiomi fondamentali, vale a dire affermazioni non dimostrabili all’interno della teoria stessa. Il confronto quantitativo delle previsioni dei modelli con i dati sperimentali è l’unico criterio per discriminare tra le varie descrizioni teoriche a nostra disposizione. Teorie che sembrano perfettamente adeguate per comprendere un insieme di osservazioni sperimentali diventano inadeguate quando nuovi dati sperimentali siano disponibili. Esempio 1. Storicamente, la crisi della meccanica classica nasce alla fine del XIX secolo. Varie osservazioni indipendenti divengono disponibili relativamente a vari fenomeni perlopiù legati all’emissione ed assorbimento di radiazioni. Tra questi, ricordiamo innanzitutto • gli esperimenti di O. Lummer ed E. Prinsheim (1877-1900) che determinano in modo quantitativo l’emissione energetica di un corpo nero in funzione della lunghezza d’onda della radiazione, in seguito interpretati correttamente da M. Planck (1900); la fisica classica si rivelò presto incapace di prevedere le tipiche curve a massimo con un intensità trascurabile ad altre frequenze della radiazione emessa; • l’effetto fotoelettrico, osservato da H. Hertz (1887), e da Lenard (1902), cioè l’emissione di elettroni dalla superficie di solidi provocata dalla luce di opportuna lunghezza d’onda; l’interpretazione di A. Einstein (1905) costituisce una delle conferme più significative dell’esistenza 5 6 CAPITOLO 1. RICHIAMI DI MECCANICA CLASSICA di livelli discreti di energia o quanti (e questa, non la teoria della relatività fu la motivazione del premio Nobel); • la presenza di righe discrete negli spettri di emissione atomica (osservata da Fraunhofer, 1823, Bunsen, 1861, Ångstrom, 1868, Balmer, 1885); l’interpretazione fornita da N. Bohr (1913) è basata sulla quantizzazione dei livelli energetici degli atomi. Cosı̀ la meccanica classica newtoniana nasce dall’esigenza di comprendere in modo quantitativo il moto degli oggetti macroscopici, mentre l’interpretazione di osservazioni sperimentali che coinvolgono energie e dimensioni atomiche è storicamente alla base dello sviluppo della meccanica quantistica1 . Figura 1.1: Il congresso Solvay nel 1927 a Bruxelles. 1.1 Punti materiali Richiamiamo alcuni i principi elementari della meccanica classica (non relativistica). L’oggetto di studio primario della meccanica classica è il punto materiale, descritto da un raggio vettore ~r rispetto all’origine di un sistema di riferimento. La velocità ~v del punto materiale è la variazione di ~r nel tempo ~v = 1 ∂~r ∂t (1.1) Lo sviluppo scientifico è perciò non solo causa, ma in parte conseguenza dello sviluppo tecnologico: migliori strumenti tecnici di osservazione comportano teorie più raffinate 1.1. PUNTI MATERIALI 7 Il momento lineare del punto materiale è semplicemente p~ = m~v , dove m è la massa del punto materiale. Le forze agenti sul punto si sommano in modo vettoriale per dare origine alla forza totale agente sul punto, F~ . Il principio fondamentale del moto del punto materiale è dato dalla II Legge di Newton, che stabilisce una relazione tra la forza ed il momento d~p F~ = dt (1.2) Un sistema di riferimento fisso od inerziale è tale che in esso la II legge di Newton è verificata. Sistemi di riferimento in accelarzione rispetto ad un sistema di riferimento inerziale sono detti noninerziali o non-galileiani. Nel seguito ci riferiremo sempre ad un sistema di riferimento inerziale o di “laboratorio”, se non specificato diversamente. Altre grandezze importanti, che saranno impiegate ~ definito nel seguito e di cui considereremo gli equivalenti quantistici, sono il momento angolare L, come ~ = ~r × p~ L (1.3) ~ ed il momento della forza o coppia N ~ = ~r × F~ N (1.4) che sono in una relazione reciproca analoga alla (1.2) e da questa ricavabile ~ ~ = dL N dt (1.5) Il lavoro fatto da F~ sul punto materiale che si muova da un punto ~r1 ad un punto ~r2 è dato dall’integrale di linea Z W = F~ · d~r (1.6) integrata, questa relazione può essere riscritta nella forma W = T2 − T1 (1.7) 1 T = mv 2 2 (1.8) dove T è l’energia cinetica del punto materiale. Se il lavoro W è indipendente dal cammino scelto tra i punti iniziale e finale della traiettoria del punto materiale, si dice che la forza e/o il sistema sono conservativi. In questo caso la forza si può calcolare, come conseguenza di un teorema fondamentale dell’analisi vettoriale in funzione di una funzione scalare V (~r) come F~ = −∇V (1.9) 8 CAPITOLO 1. RICHIAMI DI MECCANICA CLASSICA La somma delle energia potenziale V e dell’energia cinetica T è l’energia totale del punto materiale. Esempio 2. Un oscillatore armonico classico monodimensionale è una particella di massa m sottoposta ad un potenziale V (x) = kx2 /2; la legge del moto può essere scritta come una coppia di equazioni differenziali in x(t) e momento lineare p(t): p ẋ = m ṗ = −kx Se supponiamo che inizialmente x(0) = x0 e p(0) = 0, la soluzione in x(t) è x(t) = x0 cos ωt, q p(t) = −mω sin ωt, dove ω = k/m è la frequenza dell’oscillatore. Dalle definizioni precedenti discendono tre principi di base, che si possono esprimere sotto forma di di teoremi di conservazione Principio di conservazione del momento lineare: se la forza totale F~ è zero il momento lineare si conserva nel tempo (I Legge di Newton) ~ è zero Principio di conservazione del momento angolare: se il momento della forza totale N il momento angolare si conserva nel tempo Principio di conservazione dell’energia: se la forza è conservativa, l’energia totale si conserva nel tempo ~ ponendo F~ e N ~ pari a zero; dove i primi due principi discendono dalle leggi del moto di p~ e L, l’ultimo principio si ottiene integrando l’espressione del lavoro dopo aver sostituito l’espressione della forza in funzione del potenziale ed uguagliando con la (1.7). 1.2 Sistemi di particelle Un sistema di particelle è costituito da un insieme di N punti materiali, per i quali valgono N leggi del moto X j d~pi F~ji + F~ie = dt (1.10) dove F~ji è la forza agente sul punto i dovuta al punto j, mentre F~ie è la forza esterna agente sul punto i. La III Legge di Newton in forma debole assume che F~ji = −F~ij (legge di azione e reazione): non è valida per tutte le forze, ma nel seguito assumeremo che lo sia sempre. Sommando la precedente espressione, possiamo facilmente scrivere la seguente equazione che esprime l’effetto delle sole forze esterne sul sistema di particelle, in condizioni di validità della III Legge di Newton M ~ dP~ d2 R = M = F~ dt2 dt (1.11) 1.3. MOMENTO ANGOLARE E FORZA TOTALE P 9 P P ~ = i mi vri /M è il centro di massa del sistema P~ = i p~i dove M = i mi è la massa del sistema, R P è il momento lineare totale mentre F~ = i F~ie è la forza esterna totale: il momento lineare totale del sistema è quello di una unica particella avente massa M e la cui posizione coincide con il centro di massa del sistema di punti materiali. Esempio 3. Consideriamo un insieme di N particelle aventi la stessa massa m e costrette a muoversi lungo una retta; ciascuna particella è legata alle due particelle da una molla ideale k. Qual è la legge del moto? Basta generalizzare le espressioni precedenti relative all’oscillatore monodimensionale mẍ1 = k(−x1 + x2 ) mẍi = −k(xi − xi−1 ) − k(xi − xi+1 ) = k(xi−1 − 2xi + xi+1 ) 1<i<N mẍN = k(xN −1 − xN ) P Il baricentro del sistema è X = ( i xi )/N Le forze esterne agenti sul sistema sono nulle e le forze interne verificano, come tutte le forze centrali, la III legge di Newton; vale perciò che Ẍ = 0, come si può vedere anche sommando semplicemente tutte le equazioni precedenti: il baricentro del sistema è fermo o in moto rettilineo uniforme. 1.3 Momento angolare e forza totale ~ = P ~ri × p~i , per il quale vale la Possiamo anche calcolare il momento angolare totale del sistema L legge del moto ~ ∂L ∂t = X ~ri × F~ie + i X ~ri × F~ji (1.12) i6=j che si riduce alla legge più semplice ~ dL dt ~ = =N X ~ri × F~ie (1.13) i sole se i termini dipendenti dalle forze interne si possono trascurare nella (1.12), che è una forma forte della legge di azione e reazione. L’espressione del momento angolare può essere messa in una ~ la forma analoga a quella del momento lineare, ma più complicata. Se definiamo con ~ri0 = ~ri − R posizione del punto materiale i-esimo rispetto al baricentro e la corrispondente velocità ~vi0 = ~vi − ~v ~ allora il momento angolare totale può essere scritto come (e momento p~0i = mi~vi0 ) dove ~v = dR/dt, ~ =R ~ × M~v + L X i ~ri0 × p~0i (1.14) 10 CAPITOLO 1. RICHIAMI DI MECCANICA CLASSICA cioè il momento angolare è dato dal momento angolare del centro di massa più i momenti angolari rispetto al centro di massa. Le definizioni di lavoro ed energia cinetica sono analoghe al caso precedente di una singola particella. L’energia cinetica si può trascrivere separando la parte relativa al centro di massa 1 1X 2 T = M v2 + mi vi0 (1.15) 2 2 i Infine supponiamo che le forze agenti tra le particelle siano i) conservative, cioè ottenibili da un’unica funzione di coppia Vij , che ii) dipende solo dalla distanza mutua tra le due particelle, Vij = Vij (|~ri − ~rj |). Vagono perciò sia la forma forte che quella debole della III Legge di Newton, dato che F~ji − ∇i Vij = ∇j Vij = −F~ij ∝ ~ri − ~rj (1.16) Se anche le forze esterne sono conservative, possiamo scrivere l’energia totale come X 1 1X 1X 2 W = T + V = M v2 + mi vi0 + Vi + Vij 2 2 i 2 i6=j i (1.17) Possiamo imporre dei vincoli sia alle posizioni che alle velocità dei singoli punti materiali costituenti il sistema. Un vincolo è espresso dall’equazione f (t, {~ri }, {~vi }) = 0 (1.18) se le velocità non compaiono nell’espressione del vincolo, si parla di vincolo finito o geometrico od olonomo; un vincolo generale è invece detto differenziale o cinematico. Un vincolo geometrico è detto stazionario se il tempo non compare esplicitamente nell’espressione che lo definisce. Un sistema di punti è detto scleronomo se si impongono solo vincoli stazionari, mentre è detto olonomo se i vincoli sono finiti. Un corpo rigido è costituito da un sistema di punti materiali scleronomo, cioè con vincoli stazionari, in numero tale che nota la posizione di un punto materiale siano ricavabili dai soli vincoli le posizioni di tutti gli altri punti materiali. 1.4 Equazioni di Lagrange e di Hamilton Uno spostamento virtuale δ~ri è una variazione infinitesimale della posizione di un punto materiale compatibile con le forze ed i vincoli agenti sul sistema. Per un sistema in equilibrio, la forza agente su ciascuna particella è nulla, F~i = 0. Il lavoro virtuale totale è perciò anche nullo se si distinguono le forze agenti sulle particelli in forze agenti e forze di vincolo,F~i = F~ia + f~i ; possiamo scrivere X i F~ia · δ~ri + X f~i · δ~ri = 0 (1.19) i per un corpo rigido e in generale per sistemi olonomi, il lavoro totale virtuale dei vincoli vale zero X i F~ia · δ~ri = 0 (1.20) 1.4. EQUAZIONI DI LAGRANGE E DI HAMILTON 11 che è il principio del lavoro virtuale statico. L’equivalente dinamico è detto principio di D’Alembert X ~ia F − d~pi i dt · δ~ ri = 0 (1.21) che esprime una condizione generale indipendentemente dalle forze di vincolo, generalmente non note. Possiamo esprimere le leggi del moto del sistema eliminando i vincoli (che supponiamo olonomi), in funzione di un insieme di n coordinate generalizzate qj ? In generale si esprimono le coordinate assolute, i momenti e gli spostamenti virtuali in funzione delle coordinate generalizzate. Con un pò di algebra, si dimostra che il principio di D’Alembert assume la forma X d dt j ∂T ∂ q̇j − ∂T ∂qj − Qj δqj = 0 (1.22) P dove Qj = i F~i · (∂~ri /∂qj ) è una forza generalizzata. L’espressione precedente vale per qualunque insieme di coordinate generalizzate. Se però le coordinate qj sono un set di coordinate indipendenti ricavate da un insieme di vincoli olonomi, gli spostamenti virtuali deltaqj sono indipendenti, e dunque d dt ∂T ∂ q̇j − ∂T ∂qj = Qj (1.23) dette equazioni di Lagrange. Se le forze sono conservative, cioè ricavabili da un potenziale totale V , anche le forze generalizzate si possono scrivere come Qj = − X ∇i V · i ∂~ri ∂t =− ∂V (1.24) ∂qj e le equazioni di Lagrange assumono la forma più nota d dt ∂L ∂ q̇j − ∂L ∂qj =0 (1.25) dove L = T − V è la funzione lagrangiana del sistema. Esempio 4. Consideriamo una particella che si muova in un piano, con coordinate cartesiane x e y; vogliamo scrivere le equazioni del moto in coordinate polari r e θ. La relazione tra i due set di coordinate è nota: x = r cos θ, y = r sin θ; le velocità sono calcolabili come ẋ = ṙ cos θ − rθ̇ sin θ, ẏ = ṙ sin θ + rθ̇ cos θ; l’energia cinetica in coordinate cartesiane e polari è perciò · ¸ ´ ³ ´2 1 1 ³ T = m ẋ2 + ẏ 2 = m ṙ2 + rθ̇ 2 2 Le forze generalizzate sono semplicemente Qr = Fr e Qθ = rFθ . Sostituendo, e calcolando le varie derivate parziali, otteniamo le due equazioni di Lagrange mr̈ − mr(θ̇)2 = Fr 12 CAPITOLO 1. RICHIAMI DI MECCANICA CLASSICA mr2 θ̇ + 2mrṙθ̇ = Fθ Alla formulazione lagrangiana si affianca di solito la formulazione hamiltoniana delle equazioni del moto. Matematicamente, le equazioni del moto secondo Lagrange sono espresse come n equazioni differenziali del secondo ordine nelle n coordinate generalizzate qj . Possiamo definire un analogo set di 2n equazioni differenziali di primo ordine in 2n coordinate: le prime n sono ancora le qj , accanto alle quali si definiscono n momenti coniugati pj pj = ∂L (1.26) ∂ q̇j La procedura formale che permette di passare dall’insieme qj , q̇j , t all’insieme qj , pj , t è detta trasformazione di Legendre. Le equazioni canoniche del moto secondo Hamilton hanno la forma q̇j = ∂H (1.27) ∂pj ṗj = − ∂H (1.28) ∂qj a cui si aggiunge in generale ∂L ∂t = ∂H (1.29) ∂t P dove H = q̇j pj − L è detta funzione hamiltoniana. Per un sistema scleronomo conservativo (cioè con vincoli stazionari e sottoposto a sole forze conservative), L = T − V (quindi l’ultima equazione di Hamilton è subito verificata) ed H = T + V è l’energia totale del sistema. Capitolo 2 Presentazione analitica della meccanica quantistica 2.1 Operatori Formuleremo nel seguito i postulati fondamentali della meccanica quantistica (non relativistica) mantenendo al minimo il formalismo matematico. In un capitolo successivo, di approfondimento, saranno rivisti alcuni dei principi basilari dell’algebra lineare e riformuleremo i contenuti di questo capitolo nel linguaggio più conciso degli spazi funzionali. Consideriamo come oggetto di studio (o sistema) un insieme di N punti materiali, descritto dall’insieme di coordinate cartesiane {~ri }; nel seguito useremo semplicemente il simbolo r per indicare l’insieme delle coordinate del sistema. Indicheremo anche con dr un elemento di volume nello spazio delle coordinate del sistema. L’integrale di volume di una funzione generica f (r) verrà indicato come Z hf i = drf (r) (2.1) Infine con i simboli O, P̂ etc. definiremo semplicemente un operatore, cioè un insieme di istruzioni che modificano una generica funzione f . Avendo definito queste poche nozioni matematiche di base, la descrizione quantistica del sistema è definita dai seguenti postulati Postulato I. Lo stato fisico di un sistema al tempo t è descritto da una funzione, detta funzione d’onda, a valori complessi, Ψ(r, t); la funzione d’onda deve essere continua, finita e monotona per tutti i punti r. Postulato II. Una grandezza fisica osservabile sperimentalmente è rappresentata da un operatore lineare hermitiano. Un operatore lineare gode della proprietà O(af + bg) = aOf + bOg (2.2) 13 14 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA un operatore hermitiano soddisfa la condizione ·Z Z drf ∗ Og = drg ∗ Of ¸∗ (2.3) Postulato III. Siano x̂α e p̂α gli operatori che rappresentano gli osservabili posizione lungo l’asse α = x, y o z e momento lineare lungo i medesimi assi di una particella generica del sistema. Allora i sei operatori devono soddisfare le proprietà [x̂α , p̂α0 ] = ih̄δα,α0 (2.4) [x̂α , x̂α0 ] = 0 (2.5) [p̂α , p̂α0 ] = 0 (2.6) dove [A, B] = AB − BA si dice commutatore degli operatori A, B. Postulato IV. In una serie di misure ripetute di un’osservabile rappresentata dall’operatore generico O, il valore medio risultante è pari al valore d’attesa dell’operatore sulla funzione d’onda del sistema R drΨ∗ OΨ hOi = R drΨ∗ Ψ (2.7) Postulato V. La probabilità che il sistema sia in un intorno r + dr del punto r, cioè che sia rinvenibile in un elemento di volume dr intorno al punto r è proporzionale a |Ψ(r)|2 dr Postulato VI. La variazione nel tempo della funzione d’onda Ψ(r, t) è descritta dall’equazione di Schrödinger ih̄ ∂Ψ ∂t = HΨ Ψ(r, 0) = Ψ0 (r) (2.8) (2.9) dove H è l’operatore hamiltoniano, che è l’operatore rappresentativo dell’osservabile energia totale del sistema (cioè della funzione hamiltoniana classica). 2.1. OPERATORI 15 La presentazione degli assiomi o postulati della meccanica quantistica può variare, anche in dipendenza del linguaggio e del formalismo matematico impiegato (cfr. Cap. (3)). Tuttavia, è chiaro che l’impostazione finora presentata è notevolmente diversa da quella della meccanica classica. Innanzitutto lo stato del sistema è definito da un funzione, non da un insieme di coordinate. In altri termini, la conoscenza di un sistema è data da una relazione funzionale tra le coordinate o spazio delle fasi classico del sistema stesso, e non da una serie di traiettorie nel tempo che specificano ad ogni istante la configurazione del sistema. Inoltre il concetto di “osservabile” diviene centrale in meccanica quantistica. Quello che in fisica classica è solo una funzione delle coordinate e dei momenti del sistema (per esempio, l’osservabile energia cinetica, l’osservabile momento lineare totale etc.) diviene in fisica quantistica un operatore che agisce sugli stati del sistema. Nasce perciò il problema di rappresentare gli operatori. Data la prescrizione fondamentale tra l’operatore posizione e il corrispondente operatore momento (Postulato III), [x̂, p̂] = ih̄ (2.10) se si definisce l’uno, resta definito l’altro. Le due rappresentazioni sono perciò Rappresentazione della posizione: x̂ ≡ x, p̂ ≡ (h̄/i) Rappresentazione del momento: x̂ ≡ −(h̄/i) ∂ ∂p ∂ ∂x , p̂ ≡ p Nella prima, che sarà usata nel resto di questo testo, l’operatore posizione è semplicemente la moltiplicazione per x, mentre l’operatore momento è proporzionale alla derivata prima in x; l’opposto nel caso della rappresentazione del momento. Dati gli operatore momento e posizione, gli altri operatori rappresentativi delle varie osservabili classiche sono ottenuti usando il principio di corrispondenza, sostituendo cioè alle posizioni ed ai momenti i corrispondenti operatori. Per esempio, quali sono gli operatori rappresentativi dell’energia cinetica e dell’energia totale di un sistema di N particelle, in presenza di un potenziale V ? Per una singola particella, il momento lineare è semplicemente il vettore formato dai tre operatori momento lineare, lungo le tre coordinate, quindi −ih̄∇i , dove ∇i è il gradiente rispetto alle coordinate xi , yi , zi ∇i = ∂ ∂xi ∂ ∂yi ∂ ∂zi (2.11) 16 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA L’operatore energia cinetica delle singole particelle è semplicemente T i = −(h̄2 /2mi )∇2i dove ∇2i è il laplaciano rispetto alle coordinate xi , yi , zi ∇2i = ∇i · ∇i = ∂2 ∂xi 2 + ∂2 ∂yi 2 + ∂2 ∂zi 2 (2.12) L’operatore energia potenziale è la stessa funzione V . Quindi l’hamiltoniano del sistema è H=T +V = X i 2.2 h̄2 X 1 2 ∇ +V Ti+V =− 2 i mi i (2.13) Autofunzioni ed autovalori In meccanica quantistica assume grande importanza il concetto di autofunzione od autostato di un operatore Oψ = on ψn (2.14) o è l’autovalore associato all’autofunzione ψ dell’operatore O. L’importanza del concetto di autofunzioneautovalore è particolarmente evidente quando si discuta la teoria della misura di un’osservabile. Consideriamo un operatore O avente autofunzioni ψn ; nel seguito supporremo che le autofunzioni siano normalizzate ed ortogonali Z drψn∗ ψn0 = δn,n0 (2.15) e che ogni stato del sistema sia esprimibile come combinazione lineare delle autofunzioni stesse, cioè che il set di autofunzioni sia completo Ψ= X cn ψn (2.16) n (vedremo in seguito che ciò equivale ad affermare che le autofunzioni di O costituiscono una base ortonormale dello spazio funzionale del sistema). Se lo stato di un sistema coincide con un autostato, Ψ = ψn , il valore di attesa di O coincide con on . Altrimenti, un rapido calcolo algebrico permette di dedurre che il valore di attesa è una combinazione lineare dei vari autovalori hOi = X |cn |2 on (2.17) n Quindi, solo se lo stato di un sistema è ’puro’, cioè coincide con un autostato, misure ripetute portano ad unico risultato, on ; altrimenti si ottiene una combinazione lineare di autovalori, pesati dai valori |cn |2 , cioè dai quadrati dei pesi delle autofunzioni che contribuiscono a definire lo stato del sistema. 2.3. IL PRINCIPIO DI INDETERMINAZIONE 2.3 17 Il principio di indeterminazione Dato un operatore O, parliamo di operatore aggiunto O† : ·Z Z ∗ ∗ drf Og = † ¸∗ drg O f (2.18) dato un operatore generico, possiamo sempre definire l’operatore aggiunto; gli operatori hermitiani sono quei particolari operatori che coincidono con i loro aggiunti vale a dire O = O† . La preminenza che è data agli operatori hermitiani in meccanica quantistica nasce dal fatto che essi devono rappresentare grandezze fisiche sperimentali, a valori reali ed univocamente definiti. Nel caso degli operatori hermitiani, e solo per essi, valgono infatti due importanti proprietà: 1) gli autovalori di un operatore hermitiano sono reali e 2) ad autovalori distinti di un operatore hermitiano corrispondono funzioni ortogonali. La prima relazione è molto semplice da dimostrare. Supponendo, come è sempre possibile, che le autofunzioni siano normalizzate Z Oψn = on ψn → drψn∗ Oψn = on (2.19) e quindi anche µZ drψn∗ Oψn ¶∗ = o∗n (2.20) ma per definizione di operatore hermitiano, il primo membro è reale, e dunque anche il secondo, cioè l’autovalore generico on , è reale. Quanto all’ortogonalità di autofunzioni relative ad autovalori diversi, scriviamo Oψn = on ψn Oψm = om ψm (2.21) ∗ moltiplichiamo la prima uguaglianza per ψm , la complessa coniugata della seconda per ψm e sottraiamo membro a membro ∗ ∗ ∗ ψm Oψn − ψn Oψm = (on − om )ψn ψm (2.22) integrando a primo e secondo membro, resta Z Z ∗ drψm Oψn − Z ∗ drψn Oψm = (on − om ) ∗ drψn ψm (2.23) ma l’espressione a primo membro è nulla, perchè l’operatore è hermitiano, dunque l’integrale del prodotto delle due autofunzioni deve essere nullo. Nel seguito considereremo solo operatori lineari hermitiani, se non altrimenti specificato. Gli autovalori più importanti di un sistema conservativo sono senz’altro relativi all’operatore hamiltoniano HΨE = EΨE (2.24) gli autostati ΨE sono stati del sistema ad energia definita E. L’equazione precedente è l’equazione di Schrödinger indipendente dal tempo. 18 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA Esempio 5. L’esistenza di autovalori dell’operatore, cioè di valori definiti dell’energia di un sistema ha profonde conseguenze sulla descrizione fisica. Vedremo nei capitoli successivi come le proprietà di vari sistemi semplici siano completamente diversi se considerati quantisticamente. L’interpretazione di Planck della radiazione del corpo nero è basata proprio sull’assunzione, sostanzialmente fenomenologica, che un oscillatore armonico ammetta soli stati energetici discreti, e non continui. Ciò è sufficiente per modificare completamente un fenomeno ’macroscopico’ come l’emissione di un corpo nero. Ogni corpo a T > 0K costituisce una sorgente di radiazione elettromagnetica; se investito da una radiazione, ne assorbe una parte, e riflette la parte restante. A temperatura costante, il corpo è in uno stato di equilibrio. Un corpo nero ideale è un oggetto che assorbe tutta l’energia radiante incidente su di esso, senza rifletterne alcuna. A temperatura costante emette dunque radiazione su tutte le lunghezze d’onda. La migliore realizzione sperimentale di un corpo nero è un corpo cavo isolato mantenuto a temperatura costante: la radiazione termica viene osservata da una piccola fessura aperta nel corpo. Il problema è determinare la distribuzione spettrale della radiazione, cioè la frazione di energia irradiata E(ν)dν entro un intorno dν di una data frequenza ν. Secondo la fisica classica, all’equilibrio possiamo supporre che le varie frequenze della radiazione (oscillatori armonici monodimensionali) siano presenti nella cavità con un’energia media pari ²c = kT per il principio di equipartizione dell’energia: kT /2 per l’energia cinetica e kT /2 per l’energia potenziale. La distribuzione dell’energia tra le varie frequenze si riduce a determinare il numero di vibrazioni permesse in un intervallo di frequenze dν. Il risultato classico per il numero di onde stazionarie in un contenitore chiuso di volume V è dn = 4πV 2 ν dν c3 Qundi l’energia della radiazione dovrebbe crescere indefinitamente con ν, visto che ogni oscillatore ha energia media pari a kT : è questa la cosiddetta catastrofe ultravioletta: la radiazione dovrebbe crescere indefinitamente in intensità. In realtà, per una data temperatura, l’energia di emissione ha un massimo, in corrispondenza di una frequenza νmax = 1.035×1011 T Hz, e decade esponenzialmente a frequenze maggiori. L’interpretazione di Planck è la seguente: ogni oscillatore ammette energie discrete nhν, con n ≥ 0, dove h è una costante da determinarsi. L’energia media per oscillatore si può calcolare con i metodi della meccanica statistica usando la distribuzione di Boltzmann e porta al risultato ²q = hν exp(hν/kT ) − 1 La densità di energia di radiazione è ora data dalla precdente espressione per il numero di oscillatori per unità di volume, eq. (2.3) per l’energia media quantistica ²q . Il risultato (moltiplicato per due, poichè in un campo elettromagnetico oscillano sia il campo elettrico che quello magnetico) è la legge 2.4. VERIFICA DEL PRINCIPIO DI INDETERMINAZIONE 19 di Planck: 8πhν 3 1 E(ν) = c3 exp(hν/kT ) − 1 che è in ottimo accordo con i dati sperimentali di Lummer e Pringsheim, sostituendo a h il valore di 6.6262 × 10−34 Js. Sperimentalmente, un sistema è descritto da un insieme di proprietà fisiche, rappresentate dagli operatori A, B e cosı̀ via. Possiamo misurare contemporaneamente due proprietà osservabili con precisione arbitraria? Possiamo cioè individuare gli autostati comuni ad un set di operatori ? Consideriamo una coppia di osservabili e sia ψ un autostato comune, tale cioè che Aψ = aψ e Bψ = bψ. Vale il seguente, importante teorema: se due o più operatori ammettono un insieme completo di autofunzioni comuni, commutano e viceversa, se commutano, ammettono un insieme completo di autofunzioni comuni. Cioè osservabili multiple sono conoscibili simultaneamente con precisione arbitraria se e solo i loro operatori commutano. È facile verificare la prima parte del teorema. Ammettiamo che A, B abbiano un set completo di autofunzioni in comune, ψn : si ricordi che dire che un set di funzioni è completo significa affermare che ogni funzione può essere espressa come combinazione lineare delle funzioni stesse. Per una funzione generica f si ha perciò ABf = AB X n cn ψn = X n cn ABψn = X c n a n b n ψn (2.25) n e la stessa espressione si ottiene evidentemente applicando BA ad f ; quindi AB = BA, cioè [A, B]. Operatori non commutativi corrispondono a proprietà fisiche non conoscibili simultaneamente con precisione arbitraria in meccanica quantistica. Possiamo chiederci se sia possibile valutare qualitativamente il grado di precisione con cui due grandezze non commutative siano conoscibili. Nel caso di un operatore posizione e momento, vale il famoso principio di indeterminazione 1 ∆x∆px ≥ h̄ (2.26) 2 che limita la possibilità di conoscere con precisione arbitraria il momento e la posizione di una particella, simultanemamente. 2.4 Verifica del principio di indeterminazione Utilizziamo, come suggerisce Atkins, il metodo generale di Robertson, per il caso di due operatori hermitiani generici non commutativi, A e B, tali cioè che [A, B] = iC (2.27) dove C è non nullo (il fattore immaginario i è inserito per convenienza). Il sistema sia definito in uno stato arbitrario Ψ. Definiamo gli operatori differenza δA = A−hAi e δB = B −hBi; si dimostra subito che il loro commutatore è dato da iC: [δA, δB] = iC (2.28) 20 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA Consideriamo il valore di attesa dell’operatore (sδA + iδB)(sδA − iδB) Z I = h(sδA + iδB)(sδA − iδB)i = drΨ∗ (sδA + iδB)(sδA − iδB)Ψ = [(sδA − iδB)Ψ]∗ (2.29) che si riduce facilmente a Z I = [(sδA − iδB)Ψ] = dr|(sδA − iδB)Ψ|2 (2.30) dove s è un numero arbitrario reale: I è evidentemente sempre non-negativo poichè è stato ridotto all’integrale di un integrando sempre non-negativo, e può essere riscritto come I = s2 h(δA)2 i + shCi + h(δB)2 i ≥ 0 (2.31) Perchè l’espressione precedente sia maggiore o uguale a zero basta che il discriminante sia minore o uguale o zero, da cui si ricava subito che 1 h(δA)2 ih(δB)2 i ≥ hCi2 4 (2.32) Si definisce lo scarto quadratico medio ∆A di A come la radice quadrata di hA2 i − hAi2 , ed analogamente per B; poichè si dimostra facilmente che (∆A)2 = h(δA)2 i risulta che 1 1 ∆A∆B ≥ |hCi| = |h[A, B]i| 2 2 (2.33) Nel caso di A = x e B = p̂x si ottiene esattamente la (2.26). Se la particella è nota in una posizione definita, il suo momento è arbitrario; se la velocità della particella è nota con precisione arbitraria, la sua posizione è sconosciuta. Un approccio alternativo al principio di indeterminazione può essere basato un’interpretazione qualitativa, considerando solo il caso degli operatori posizione e momento di una particella generica seguendo l’argomento di Landau e Lifšits. Supponiamo che la particella sia in un volume di spazio finito ∆V = ∆x∆y∆z, e che il valore medio del momento della particella sia p~0 ; ciè equivale ad affermare che Ψ ≈ u(~r) exp(i~p0 · ~rh̄), dove u(~r) è una funzione che differisce da zero solo per valori di ~r nel volume ∆V . La funzione d’onda Ψ può essere sviluppata in funzione delle autofunzioni dell’operatore vettoriale momento, che ammette in generale autovalori continui p~, con autofunzioni ψp~ = exp(i~p · ~rh̄)1 . In altri termini, possiamo scrivere Ψ sotto forma di integrale di Fourier Ψ(r) = 1 1 Z d~pa(~p) exp(i~p · ~r/h̄) h3 (2.34) La normalizzazione di un set di autofunzioni con autovalori continui è analoga al caso di autovalori discreti, ma con la sostituzione di una funzione di Dirac al simbolo di Dirac; nel caso specifico le funzioni sono scelte in modo tale che Z ψp~∗0 ψp~ = h3 δ(~ p0 − p~) 2.5. MECCANICA CLASSICA E MECCANICA QUANTISTICA 21 dove le funzioni a(~p) sono ottenibili come Z a(~p) = Z d~rΨ(~r) exp(−i~p · ~r/h̄) = d~ru(~r) exp [i(~p0 − p~) · ~r/h̄] (2.35) Solo se i periodi delle funzioni oscillanti exp [i(~p0 − p~) · ~r/h̄] sono non trascurabile rispetto a ∆x, ∆y e ∆z nella regione ∆V i coefficienti a(~p) sono diversi da zero, cioè solo i coefficienti a(~p) relativi ai valori di p~ tali che (px 0 − px )∆x/h̄ ≤ 1 etc. contribuiscono a determinare la funzione d’onda. Ma |(a(~p)|2 non è altro che la probabilità che la particella abbia quantità di moto p~, quindi (px 0 − px ) = ∆px etc. indica gli intervalli ’possibili’ delle componenti delle quantità di moto, da cui segue che ∆pα ∆xα ∼ h̄ (2.36) Tanto maggiore è la precisione con cui è nota una delle coordinate, tanto minore è la conoscenza disponibile relativa al momento corrispondente. 2.5 Meccanica classica e meccanica quantistica Consideriamo la variazione nel tempo del valore di attesa di un operatore O, di per sè non dipendente dal tempo, per un sistema nello stato (normalizzato) Ψ(r, t) d Z dt Z ∗ drΨ OΨ = dr ∂Ψ∗ ∂t Z OΨ + 1 Z 1 Z ∗ drΨ O =− drΨ HOΨ + drΨ∗ OHΨ ih̄ ih̄ ∂t ∗ ∂Ψ (2.37) da cui segue che dhOi dt = 1 h[H, O]i ih̄ (2.38) Se e solo se il valore d’attesa del commutatore di O e dell’hamiltoniano del sistema commutano il valore di attesa di O è costante. Nel caso di una particella in una dimensione sottoposta ad un potenziale V (x), cui corrisponde una forza F = −dV /dx, non è difficile riscrivere la relazione precedente per gli operatori O = x e O = p̂x nella forma d dt d dt hp̂x i = hF i (2.39) hp̂x i m (2.40) hx̂i = note anche come relazioni di Ehrenfest, molto simili alle equazioni del moto canoniche classiche; la descrizione classica emerge dalla descrizione quantistica come descrizione dei valori medi degli osservabili posizione e momento. 22 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA 2.6 Moto semi-classico Ad ogni particella quantistica si può associare una lunghezza d’onda (principio di de Broglie) tale che se p è il valore di attesa del momento lineare, la lunghezza d’onda associata è h/p. È questo il principio di de Broglie, di natura assai profonda e che è alla base del problema del dualismo onda-particella, uno dei dibattiti scientifici più interessanti del XX secolo. In pratica, consideriamo l’onda di de Broglie come una misura della natura quantomeccanica della particella: se λ è molto piccola rispetto alle dimensioni caratteristiche di una dato sistema, le proprietà del sistema stesso sono sostanzialmente classiche. Consideriamo l’equazione di Schrödinger indipendente dal tempo per un sistema monodimensionale " # h̄2 d2 − + V (x) − E Ψ = 0 2m dx2 (2.41) e cerchiamo una soluzione formale nella forma Ψ = exp(iσ/h̄) (2.42) Un metodo comune di soluzione di equazioni differenziali, anche complesse, prevede di impiegare uno sviluppo in serie di potenze in funzione di qualche parametro piccolo; nel caso usiamo h̄ come parametro h̄ σ = σ0 + σ1 + . . . i (2.43) Possiamo sostituire la precedente espressione nell’equazione di Schrödinger e scrivere separatamente i termini in h̄0 (ordine zero), h̄ (primo ordine) e cosı̀ via: 2 1 dσ0 = E − V (x) 2m dx dσ0 dσ1 dx dx + (2.44) 1 d2 σ1 =0 2 dx2 (2.45) Risolvendo prima in σ0 e poi in σ1 troviamo la seguente soluzione, corretta al primo ordine in h̄ · ¸ · C− iZ iZ q exp dxp(x) + exp − dxp(x) h̄ h̄ p(x) p(x) C+ Ψ= q ¸ (2.46) q dove p(x) = 2m [E − v(x)] è la quantità di moto classica di una particella avente energia E e C ± sono costanti arbitrarie. Si può dimostrare che l’espansione in serie di potenze di h̄ è arrestabile al primo ordine sotto la condizione " mh̄|dV /dx| h̄2 =¿ 1 → λ ¿ p3 m|dV (x)/dx| #1/3 =L (2.47) 2.6. MOTO SEMI-CLASSICO 23 cioè quando il momento non è troppo piccolo, ovvero quando la lunghezza d’onda di de Broglie è molto minore della lunghezza caratteristica L, che dipende dalla massa e dalla forza classica. La forma della funzione d’onda semiclassica corrisponde al moto nei due sensi di un pacchetto d’onda localizzato (possiamo porre per esempio C − = 0 per indicare il moto nella direzione positiva). Il significato del fattore pre-esponenziale 1/sqrtp è il seguente: la probabilità |Ψ|2 di trovare la √ particella tra x e x + dx assume nel caso semi-classico, grazie appunto al fattore 1/ p il valore 1/p: in analogia al caso di un particella classica, che percorre il segmento infinitesimo dx in un tempo 1/p. 24 CAPITOLO 2. PRESENTAZIONE ANALITICA DELLA MECCANICA QUANTISTICA Capitolo 3 Formalismo algebrico della meccanica quantistica 3.1 Spazi vettoriali Iniziamo con una breve presentazione degli spazi vettoriali. Le definizioni che seguono sono del tutto generali: vale a dire le proprietà definite per uno spazio vettoriale non dipendono dalla natura dei suoi componenti, o vettori, che possono essere i vettori di uno spazio tridimensionale noti dai corsi di analisi matematica, o un insieme di funzioni e cosı̀ via. La definizione di uno spazio vettoriale V è fondata sulla precedente definizione di un insieme K di quantità scalari, cioè un insieme di numeri. Il corpo K gode delle proprietà: • Se a e b appartengono a K, allora a + b e ab appartengono a K • 0 e 1 appartengono a K • Se a appartiene a K, −a appartiene a K; se a non è 0 allora a−1 appartiene a K Esempio 6. Sia N l’insieme dei numeri naturali; si vede subito che non è un corpo, poiché se n appartiene a N , −n non è un numero naturale; analogamente per l’insieme dei numeri interi Z, per un cui elemento generico z si ha che 1/z non appartiene a Z. In effetti si parla di spazio vettoriale V sul corpo K di scalari. Il corpo K è in genere dato dall’insieme dei numeri razionali Q, o reali R o complessi C, o loro sottoinsiemi. Uno spazio vettoriale V sul corpo K è dunque un insieme di oggetti che possono essere addizionati fra loro e moltiplicati per elementi di K (nel seguito semplicemente numeri), in modo che il risultato appartenga ancora a V , con le seguenti proprietà aggiuntive: Associativa. Se u, v, w sono elementi di V , allora: (u + v) + w = u + (v + w) (3.1) 25 26 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Neutro. Esiste un elemento 0 di V , tale che 0+u=u+0=u (3.2) per ogni u di V Opposto. Per ogni u di V esiste −u di V tale che u + (−u) = (−u) + u = 0 (3.3) Commutativa. Per ogni coppia u, v vale che u+v=v+u (3.4) Proprietà in K. Se a, b, c sono numeri • c(u + v) = cu + cv • (a + b)u = au + bu • (ab)u = a(bu) • 1u = u Esempio 7. Alcuni esempi di spazi vettoriali: 1. lo spazio PN (x) di tutti i polinomi a coefficienti reali o complessi di grado N nella coordinata x; lo spazio F di tutte le funzioni di variabile complessa definite in un intervallo. 2. Dato l’insieme Rn di tutte le n-uple di numeri reali, dove la somma di due elementi è definita come la somma ordinata delle componenti, (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ) e il prodotto per uno scalare come a(x1 , . . . , xn ) = (ax1 , . . . , axn ), allora Rn è uno spazio vettoriale. Lo studente provi a dimostrarlo verificando i vari punti della definizione di spazio vettoriale. 3. Dato l’insieme di numeri reali positivi R+ , definiamo le seguenti operazioni: ’addizione’, x ⊗ y = xy (cioè l’ordinaria moltiplicazione di due reali), ’moltiplicazione per un numero reale a’, a · x = xa (potenza); allora si dimostra che R+ è uno spazio vettoriale rispetto alle due operazioni appena definite. Lo studente provi a dimostrarlo verificando i vari punti della definizione di spazio vettoriale. 3.2. PRODOTTI SCALARI 27 Una somma generica di elementi di uno spazio vettoriale V , n X ai xi = a1 x1 + a2 x2 + . . . + an xn (3.5) i=1 è detta combinazione lineare del set di vettori {xi }; gli n vettori sono linearmente dipendenti se esistono n scalari ai non tutti nulli tali che la combinazione lineare sia zero, o linearmente indipendenti se non esistono. Se è possibile esprimere tutti gli elementi di V come combinazioni lineari del set {xi }, allora si dice che il set genera (in inglese, span) lo spazio vettoriale. Una base dello spazio vettoriale è definita come un’insieme di vettori {ei } che sia linearmente indipendente e generi lo spazio. Si può dimostrare che due basi qualunque di uno spazio, se esistono, hanno lo stesso numero di elementi. La dimensione n dello spazio V è il numero di elementi di una base, e può anche essere infinita. Per un vettore generico possiamo scrivere perciò: x= n X xi e i (3.6) i=1 il coefficiente xi è la proiezione o componente di x sull’elemento i-esimo della base. L’insieme dei coefficienti è anche detto coordinate. Esempio 8. Quali sono le coordinate della funzione f (θ) = 3 sin θ + 5 cos θ in un opportuno spazio di dimensione 2? Evidentemente, se si considerano come elementi di base sin θ e cos θ, le componenti sono 3 e 5. E quali sono le coordinate della funzione df /dθ? deriando si ottiene df /dθ − 5sinθ + 3 cos θ, di componenti -5 e 3. In generale se consideriamo lo spazio vettoriale delle funzioni f (θ) a valori reali e periodiche in [−π, π], l’insieme degli elementi sin θ, sin 2θ, sin 3θ etc. e cos θ, cos 2θ, cos 3θ etc. costituisce una base 3.2 Prodotti scalari Se V è uno spazio vettoriale definito su un corpo K, definiamo con un prodotto scalare un modo per associare ad ogni coppia di elementi u e v di V uno scalare di K, che indichiamo con u · v. Valgono le seguenti proprietà Commutativa. Per ogni coppia u, v vale che u · v = v · u Distributiva. Per ogni terna u, v, w vale che u · (v + w) = u · v + uw Scalare. Se a appartiene a K allora (au) · v = a(u · v) e u · (av) = a(u · v). Due vettori u, v si dicono ortogonali o perpendicolari se u · v = 0. Data una base e1 , . . . , en , questa si dice ortogonale, se per ogni coppia di indici ei · ej = 0. 28 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Esempio 9. Consideriamo lo spazio vettoriale delle coppie di numeri reali R2 . Si noti che tale spazio è in corrispondenza biunivoca con lo spazio dei vettori (in senso tradizionale, quantità con una intensità, direzione e verso) nel piano. Definiamo il prodotto scalare di due vettori u = (u1 , u2 ) e v = (v1 , v2 ) come: u · v = u1 v 1 + u2 v 2 Torniamo all’insieme di tutte le funzioni periodiche a valori reali in [−π, π]. Definiamo il prodotto f (θ) · g(θ) = Z π −π dθf (θ)g(θ) Lo studente può verificare facilemente che si tratta di un prodotto scalare. Consideriamo ora nel seguito di questo paragrafo uno spazio vettoriale sul corpo R dei numeri reali. Definiamo un prodotto scalare. Si dice che il prodotto è definito positivo se per ogni u di V si ha che u · u ≥ 0, e per ogni u non nullo, u · u > 0. Per una coppia di vettori u e v, se v non è nullo definiamo la proiezione di u lungo v come: a= u·v v·v (3.7) detta anche coefficiente di Fourier. Data un base ortogonale, si può verificare che le coordinate di un elemento generico di V rispetto alla base stessa sono i coefficienti di Fourier rispetto agli elementi della base u= X i ui ei , ui = u · ei ei · ei (3.8) √ Dato un vettore u, Si dice norma la grandezza scalare u = u · u. Se la norma vale 1, il vettore u si dice normalizzato, o vettore unità, o versore 1 . Esempio 10. Consideriamo l’insieme dei polinomi P2 (x) di grado 2 in [0, 1] a valori reali. È uno spazio vettoriale (definendo l’addizione come somma dei coefficienti)? Di che dimensione? Possiamo definire una base? Ed un prodotto scalare? Ed una base ortonormale? Suggerimenti: la dimensione coincide con il numero massimo di coefficienti; una base è data semplicemente da 1, x e . . .; il prodotto scalare può essere definito come l’integrale da 0 ad 1 del prodotto di . . . Consideriamo nel seguito la generalizzazione del concetto di prodotto scalare che è valido per spazi vettoriali sul corpo dei numeri reali, al caso di spazi vettoriali sul corpo dei complessi. Parleremo in questo caso di prodotto hermitiano tra due vettori u e v, con le seguenti proprietà Commutativa. Per ogni coppia u, v vale che u · v = (v · u)∗ 1 Supponiamo che V abbia dimensione finita n. Una sua base e1 , . . . , en si dice ortonormale se essa è ortogonale e se ogni ogni suo elemento è un vettore unità; da una base ortogonale si può sempre ricavare una base ortonormale, dividendo ogni elemento della base per la sua norma. 3.2. PRODOTTI SCALARI 29 Distributiva. Per ogni terna u, v, w vale che u · (v + w) = u · v + uw Scalare. Se a è un numero complesso allora (au) · v = a(u · v) e u · (av) = a∗ (u · v). dove con a∗ indichiamo il complesso coniugato di a. Tutte le definizioni precedenti relative al prodotto scalare (definito positivo, ortogonalità, basi ortogonali, etc.) sono analoghe. Esempio 11. Ecco due esempi di prodotto hermitiano 1. Consideriamo lo spazio delle n-uple complesse, C n ; un elemento generico è u = (u1 , . . . , un ) dove ui appartiene a C. La dimensione dello spazio è evidentemente n; definiamo il prodotto hermitiano u·v= n X u∗i vi i=1 Il prodotto è definito positivo poiché se u 6= 0, allora almeno uno dei numeri ui è diverso da zero (complesso) e u∗i ui è sempre positivo. 2. Consideriamo lo spazio delle funzioni f (θ) a valori complessi definite in [−π, π]. È uno spazio vettoriale, di dimensione infinita, e possiamo introdurre il prodotto hermitiano definito positivo: f ·g = Z π −π dθf (θ)∗ g(θ) Non è difficile verificare che l’insieme di funzioni {1, e±iθ , e±2iθ , . . .} costituisce una base ortogonale del problema; se indichiamo con fn = einθ dove n è un numero intero, la norma di ciascuna funzione di base è fn · fn = Z π −π dθe−inθ einθ = 2π Ogni elemento generico dello spazio può essere espresso come combinazione lineare delle funzioni di base; il coefficiente di Fourier n-esimo è il coefficiente che misura il contributo di ciascuna funzione di base: f (θ) = X cn fn = X cn einθ n 1 Zπ f · fn = dθf (θ)∗ einθ cn = fn · fn 2π −π 30 3.3 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Vettori e matrici Nel corso di questa Sezione riassumeremo alcune proprietà già note allo studente dei vettori tridimensionali reali. Quindi procederemo alla definizione e allo studio delle grandezze matriciali. Un vettore nello spazio tridimensionale ordinario è definito come una coppia ordinata di punti dello spazio. In Figura 3.1 è riportata la rappresentazione di due vettori ~u e ~v , definiti rispetto ad un punto comune di origine. Si deve notare che lo spazio vettoriale delle triple di numeri reali R3 è in corrispondenza biunivoca con lo spazio dei vettori ordinari, che possono perciò essere identificati da una terna di numeri reali (le componenti rispetto ad un sistema di riferimento, vedi Figura 3.1). Comunque la definizione dello spazio vettoriale dei vettori ordinari può essere data prescindendo dalla rappresentazione: il vettore si può identificare come una freccia orientata, con una direzione, un verso ed un’intensità. Nel seguito useremo sempre caratteri in grassetto per indicare n-ple di numeri o matrici (es. la tripla di numeri v1 , v2 , v3 sarà v); e caratteri tipografici per indicare il vettore o la matrice indipendentemente dalla sua rappresentazione (es. v). Dove non sia necessario specificare la differenza useremo caratteri in grassetto. La somma di due vettori è descritta come e 3 u+v v u u x v u 3 e1 u u e 2 1 2 Figura 3.1: Vettori nello spazio 3D un vettore ottenibile con la regola del parallelogramma (vedi Figura 3.1). Il prodotto scalare è ottenuto in accordo con la definizione nota di prodotto scalare, ~u · ~v = uv cos θ, dove u e v sono il modulo dei due vettori e θ è l’angolo compreso. Alternativamente, se si considera l’equivalente 3.3. VETTORI E MATRICI 31 spazio R3 , introducendo una base di tre versori ~e1 , ~e2 , ~e3 , ed ogni vettore viene rappresentato dalle sue componenti sulla base, la somma e il prodotto scalare sono definiti u+v= 3 X (ui + vi )ei (3.9) i=1 u·v= 3 X ui vi (3.10) i=1 Altri prodotti possono essere definiti con un chiaro significato geometrico. Il prodotto vettoriale di ~u e ~v è un vettore che ha per modulo la quantità uv sin θ, per direzione la perpendicolare al piano definito da ~u e ~v e per verso quello ottenuto avvitando una vite destrorsa lungo la direzione definita, in modo da portare ~u su ~v (regola della vite o della mano destra). Il prodotto vettoriale è un esempio di applicazione definita in uno spazio vettoriale: ovvero un’operazione che associa elementi dello spazio ad altri elementi dello spazio. Ecco alcune utili identità: ~a × ~b = −~b × ~a (3.11) ~a · (~b × ~c) = ~b · (~c × ~a) = ~c · (~a × ~b) (3.12) ~a × (~b × ~c) = ~b(~a · ~c) − ~c(~a · ~b) (3.13) ~ = (~a · ~c)(~b · d) ~ − (~a · d)( ~ ~b · ~c) (~a × ~b) · (~c × d) (3.14) La notazione vettoriale è di grande utilità perché permette di riassumere in modo compatto equivalenze ed equazioni in tre dimensioni, o in n dimensioni, la generalizzazione a Rn essendo molto semplice. In R3 cosı̀ l’equazione che definisce un piano nello spazio passante per un punto x0 è (x − x0 ) · n = 0 (3.15) dove n è un versore normale al piano. L’angolo diedro tra due piani è invece dato come cos Θ = |n1 · n2 | (3.16) Molte altre identità e definizioni della geometria analitica nello spazio tridimensionale sono note allo studente dai corsi di matematica. L’uso della notazione vettoriale è utile anche per definire funzioni vettoriali. Possiamo distinguere funzioni scalari, o campi scalari, che associano elementi di R3 a R o funzioni vettoriali che associano elementi di R a R3 . Un campo vettoriale è infine una funzione che associa elementi di R3 a R3 . Esempio 12. Ecco alcuni esempi di campi scalari, funzioni vettoriali e campi vettoriali: 32 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Campi scalari: la temperatura di un laboratorio, intesa come funzione delle coordinate spaziali; la funzione f (x) = |x|; la funzione f (x) = x21 − x2 x3 ; la concentrazione di cloruro di terbutile in un reattore contenente alcol terbutilico, cloro e cloruro di terbutile. Funzioni vettoriali: la retta x(t) = x0 + nt; la funzione x(t) = r cos ωte1 + r sin ωte2 + vte3 , che rappresenta la traiettoria di una particella che si muova lungo un’elica destrorsa, con asse parallelo a e3 (vedi Figura 3.2). Campi di vettori: la forza di gravità tra due corpi; la funzione f(x) = x × n; l’orientazione delle molecole di cristallo liquido che formano il display di un orologio digitale. 3.4 Matrici Una matrice di mn elementi dove m ed n sono rispettivamente il numero di righe ed il numero di colonne, è definita come una tabella rettangolare di numeri, il cui elemento generico è aij (dove 1 ≤ i ≤ m e 1 ≤ j ≤ n), e si indica nel modo seguente a11 a21 A= a12 a22 am1 am2 a13 a23 ... am3 ... ... a1n a2n (3.17) . . . amn o con notazioni equivalenti: p.es. doppie linee invece di parentesi. Consideriamo l’insieme delle matrici m × n. Possiamo definire la moltiplicazione per uno scalare α di una matrice A come la matrice ottenuta moltiplicando ciascun elemento di A per α (αA)ij = αaij (3.18) La somma di due matrici si ottiene sommando gli elementi delle matrici addende (A + B)ij = aij + bij (3.19) La matrice nulla è formata solo da zeri 0ij = 0 (3.20) ed infine la matrice opposta di una matrice generica è (−A)ij = −aij (3.21) Si verifica facilmente che l’insieme cosı̀ definito è uno spazio vettoriale di dimensione mn. Una base è costituita dalle mn matrici con elementi ovunque nulli, tranne che in una posizione à e11 = 1 ... 0 0 ... 0 ! à ,..., emn = 0 ... 0 0 ... 1 ! (3.22) 3.4. MATRICI 33 z 10 5 0 −1 y −1 0 0 1 1 Figura 3.2: Una spirale destrorsa. x 34 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Esempio 13. Definiamo un prodotto tra due matrici m × n come la matrice ottenuta moltiplicando gli elementi nella stessa posizione (A ∗ B)ij = aij bij . L’operazione ∗ è un prodotto scalare? Il prodotto tra matrici è un’applicazione che associa a due matrici generiche A m × n e B n × p una matrice AB m × p (il numero di colonne della prima matrice deve essere uguale al numero di righe della seconda): (AB)ij = n X aik bkj (3.23) k=1 L’insieme delle n-uple di numeri, cioè gli elementi di Rn o C n si possono mettere in relazione biunivoca con le matrici 1 × n (matrici riga) oppure n × 1 (matrici colonna). Cosı̀ la moltiplicazione di una matrice m × n per un vettore n dimensionale significa in pratica la moltiplicazione per una matrice colonna n × 1 ed il risultato è una matrice colonna m × 1: a11 a21 a12 a22 am1 am2 v1 a1n u1 v u a2n 2 = 2 ≡ Au = v ... ... vm . . . amn un a13 a23 ... am3 ... ... (3.24) P dove vi = nj=1 aij uj . Esempio 14. Il prodotto tra matrici non è commutativo, ovvero AB 6= BA. Si definisce il commutatore come la matrice: [A, B] = AB − BA. Evidentemente perché il commutatore esista deve essere m = p; si dice che due matrici commutano se [A, B] = 0. Consideriamo nel seguito solo le matrici quadrate n × n (nel seguito, di dimensione n), e vettori (matrici riga o colonna). Alcune matrici quadrate speciali di dimensione n sono le seguenti: • la matrice identità 1 0 0 1 0 ... 0 0 ... 0 1= ... 0 0 0 ... 1 (3.25) • le matrici scalari, A= a 1 • le matrici diagonali d1 0 D= 0 d2 0 0 0 ... 0 0 ... 0 ... 0 . . . dn (3.26) 3.4. MATRICI 35 • le matrici tridiagonali d1 e1 Td = e1 d2 0 0 0 ... 0 0 ... 0 ... 0 . . . dn (3.27) • le matrici triangolari (superiori od inferiori) t11 0 T= t12 t22 0 0 t13 . . . t1n t23 . . . t2n ... 0 . . . tnn (3.28) • la potenza di una matrice: Ap = A · . . . A (p volte) • le matrici idempotenti: P2 = P In associazione con una generica matrice A con elementi aij si possono definire alcune matrici strettamente collegate • la matrice trasposta a11 a12 AT = a21 a22 a1n a2n a31 a32 ... a3n ... ... an1 an2 (3.29) . . . ann • la matrice complessa coniugata ∗ a A∗ = 11 a∗21 a∗12 a∗22 a∗1n a∗2n a∗13 a∗23 ... a∗3n ... ... a∗1n a∗2n (3.30) . . . a∗nn • la matrice aggiunta ∗ a A = † 11 ∗ a12 a∗21 a∗22 a∗1n a∗2n a∗31 a∗32 ... a∗3n ... ... a∗n1 a∗n2 . . . a∗nn (3.31) 36 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA evidentemente (AT )∗ = (A∗ )T = A† . Prima di procedere oltre consideriamo il concetto di funzione scalare di una matrice, ovvero una corrispondenza tra una matrice e l’insieme dei reali o complessi. Le funzioni scalari più importanti sono la traccia Tr(A) = n X aii (3.32) i=1 che è la somma di tutti gli elementi diagonali di una matrice; ed il determinante det(A) = X (−1)P Πnj=1 ajP(j) (3.33) P di definizione un poco più complicata: si tratta della somma di n! addendi, ciascun dei quali è ottenuto moltiplicando n quantità che coincidono con un elemento per ciascuna riga; vi sono appunto n! possibili scelte, che coincidono con le permutazioni tra gli n indici 1, 2, . . . , n; ogni permutazione è caratterizzata dal simbolo P ed è pari, (−1)P = 1 o dispari (−1)P = −1 a seconda che sia ottenuto con un numero pari o dispari di trasposizioni degli indici. In pratica il calcolo dei determinanti è effettuato applicando il seguente teorema det(A) = (−1)1+j a1j det(A1j ) + . . . + (−1)n+j anj det(Anj ) (3.34) cioè scegliendo una colonna della matrice (indice j) e sommando i determinanti delle sottomatrici di dimensione n − 1 ottenute cancellando la colonna e la riga corrispondente a ciascun elemento (e.g. A12 è la matrice ottenuta cancellando la prima riga e la seconda colonna). Un’analoga relazione sussiste per uno sviluppo lungo una riga. Varie proprietà elementari dei determinanti sono facilmente dimostrabili: • det(1) = 1 • det(D) = Πni=1 di • det(T) = Πni=1 tii • det(AT ) = det(A) • det(A∗ ) = det(A)∗ • det(A† ) = det(A)∗ • det(AB) = det(A) det(B) • det(αB) = αn det(A) 3.4. MATRICI 37 Possiamo ora definire esplicitamente la matrice inversa di una matrice generica come la matrice A−1 tale che AA−1 = A−1 A = 1 (3.35) Gli elementi della matrice inversa sono calcolabili infatti come: det(Aji ) (A−1 )ij = (−1)i+j det(A) (3.36) quindi una matrice ammette inversa solo se il determinante non è nullo (altrimenti si dice singolare). Le matrici associate ad applicazioni fisiche od utilizzate nei calcoli quantomeccanici godono spesso di alcune proprietà speciali, tra le quali • matrice simmetrica: AT = A • matrice hermitiana: A† = A • matrice ortogonale: AT = A−1 • matrice unitaria: A† = A−1 Una matrice reale simmetrica o ortogonale è anche hermitiana o unitaria. Esempio 15. Nel trattamento di Hückel dei polieni lineari è necessario calcolare il determinante della matrice tridiagonale x 1 AT = 1 x 0 0 0 1 ... 0 ... ... 0 0 ... x Come si può procedere per ridurlo ad un polinomio? In generale la moltiplicazione di un vettore per una matrice denota una trasformazione del vettore. Nello spazio tridimensionale possiamo usare analoghi geometrici per indicare una trasformazione (rotazione, traslazione etc.) del vettore stesso. In uno spazio n-dimensionale questo non è ovviamente possibile. Consideriamo per esempio il problema di descrivere la rotazione di un vettore nello spazio 3D: in generale una rotazione si può identificare mediante tre angoli, detti angoli di Eulero. Consideriamo un vettore generico ~u che abbia le coordinate (X, Y, Z) in un dato sistema di ~ Y~ , Z); ~ vogliamo riferimento fisso (per esempio solidale con il laboratorio, e definito dai versori (X, sapere quali sono le sue coordinate in un sistema di riferimento ruotato (per esempio solidale con una molecola, e definito dai versori ~x, ~y , ~z). Il sistema di riferimento ruotato è definito in modo complicato ma rigoroso, tramite tre rotazioni elementari successive (vedi Figura 3.3): ~ questa rotazione porta Y~ nella linea dei • una rotazione antioraria di un angolo α intorno a Z; ~; nodi N 38 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Z z β O X α γ Y y N x Figura 3.3: Angoli di Eulero α, β, γ per specificare la rotazione di un sistema di riferimento molecolare rispetto ad un sistema di riferimento di laboratorio. ~ ; questa rotazione porta Z ~ in ~z; • una rotazione antioraria di un angolo β intorno a N ~ in ~y ; • una rotazione antioraria di un angolo γ intorno a ~z; questa rotazione porta N Dopo la prima rotazione, le coordinate del vettore siano (x0 , y 0 , z 0 ); dopo la seconda rotazione (x00 , y 00 , z 00 ); dopo la terza, nel sistema di riferimento molecolare (x, y, z). Applicando la trigonometria, si vede che: 0 x cos α 0 y = − sin α z 0 0 00 x cos β 00 y = 0 z 00 sin β x cos γ y = − sin γ z 0 sin α 0 X cos α 0 Y 0 1 Z 0 1 cos β sin γ cos γ 0 − sin β 0 x 0 y 0 (3.37) z (3.38) 0 0 x00 00 0 y z 00 1 (3.39) Moltiplicando le tre matrici di rotazione elementari si ottiene: x cos α cos β cos γ − sin α sin γ y = − cos α cos β sin γ − sin α cos γ z cos α sin β sin α cos β cos γ + cos α sin γ − sin α cos β sin γ + cos α cos γ sin α sin β − sin β cos γ X sin β sin γ Y (3.40) cos β Z 3.4. MATRICI 39 La matrice di trasformazione è detta matrice di Eulero, E. Esempio 16. Qual è la trasformazione lineare che moltiplica le componenti di un vettore ndimensionale per uno scalare a? Scrivere la matrice che rappresenta la trasformazione. E qual è la trasformazione che scambia la componente i-esima con la componente j-esima? Matrici e vettori sono molto utili per la rappresentazione matematica di proprietà fisiche che dipendano dalla direzione di misura. Consideriamo per esempio il momento di dipolo indotto µ in una molecola da un campo elettrico E: in generale si dovrà scrivere ~ m ~ = aE (3.41) ~ sono vettori tridimensionali, mentre a è un tensore cartesiano del secondo ordine, dove m ~ e E cioè una proprietà rappresentabile da una matrice 3 × 3 (Figura 3.4). Se la nostra molecola ha una simmetria cilindrica, e si esprimono tutte le grandezze vettoriali in un sistema di riferimento solidale con la molecola ed avente l’asse z diretto lungo l’asse principale della molecola, allora la matrice di polarizzabilità assume una forma particolarmente semplice: a⊥ a= 0 0 0 a⊥ 0 0 0 ak (3.42) z O m E a II C aI O Figura 3.4: Schema del momento dipolare indotto in una molecola di CO2 da un campo elettrico esterno. In generale, le proprietà fisiche rappresentabili da matrici 3 × 3 sono dette proprietà tensoriali, e si può sempre identificare un sistema di riferimento (di solito solidale con la molecola), tale che siano rappresentate da matrici diagonali (i valori diagonali si chiamano allora valori principali). Le 40 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Relazione tensoriale Momento angolare = tensore di inerzia × velocità angolare Momento di dipolo = polarizzabilità × campo elettrico Induzione elettrica = tensore dielettrico × campo elettrico Magnetizzazione = suscettibilità magnetica × campo magnetico Velocità della luce = indice di rifrazione × velocità nel vuoto y ~ L m ~ ~ D ~ M ~v A x I ω ~ ~ a E ~ ² E ~ χ H n ~v0 Tabella 3.1: Relazioni tensoriali nella forma generica ~y = A~x grandezze tensoriali in Tabella (3.1) sono sempre rappresentabili come matrici reali simmetriche. Se i tre valori principali sono uguali, la rappresentazione della proprietà tensoriale è la stessa in qualunque sistema di riferimento, e si parla di proprietà scalare. Esempio 17. Consideriamo il seguente problema; è data una molecola del complesso Cu(NH3 )2+ 6 . Calcoliamo il tensore di inerzia nel sistema di riferimento indicato in Figura 3.5 dai versori ~x, ~y , ~z. Dal corso di Fisica I è noto che per un sistema di punti materiali con masse mi e coordinate P P ri = (xi , yi , zi ), il momento di inerzia ha componenti I11 = i mi (ri2 − x2i ), I12 = − i mi xi yi e cosı̀ via. Nel sistema di riferimento indicato in Figura 3.5 si ha perciò: 1 2 I = 4mNH3 l 0 0 0 1 0 0 0 1 Quindi il sistema di riferimento ~x, ~y , ~z è tale che il tensore di inerzia è già in forma diagonale. Lo studente può verificare facilmente che anche il sistema ruotato ~x0 , ~y 0 , ~z0 gode di questa proprietà). 3.5 Sistemi lineari Dopo aver discusso le proprietà principali delle matrici e dei vettori, riassumiamo brevemente alcune applicazioni a problemi matematici che ricorrono sistematicamente nello studio della chimica (e non solo della chimica quantistica). La soluzione dei sistemi lineari di equazioni si presta molto bene ad una implementazione in termini di matrici e vettori. Consideriamo solo il caso di n equazioni lineari in n incognite. Possiamo scrivere un sistema lineare in forma estesa a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 (3.43) .. . an1 x1 + an2 x2 + . . . + ann xn = bn o in forma compatta Ax = b; la soluzione si ottiene semplicemente nella forma x = A−1 b. Naturalmente la soluzione esiste solo se la matrice A è invertibile, cioè se il suo determinante non è nullo. 3.6. TRASFORMAZIONI 41 z’ NH 3 l NH 3 NH 3 Cu y 2+ x NH 3 NH 3 y ’ x’ NH 3 Figura 3.5: Calcolo del momento di inerzia del complesso Cu(NH3 )2+ 6 . Esempio 18. 100 ml di una soluzione di iodio I− e Cl− titola 100 ml 0.1 N di AgNO3 . 100 ml della stessa soluzione, trattati con un eccesso di AgNO3 , danno 1.5 g di precipitato. Calcolare la concentrazione di iodio e cloro nella soluzione. Di interesse sono anche i sistemi omogenei: Ax = 0 (3.44) in cui b = 0; se A non è singolare, l’unica soluzione possibile è A−1 0 = 0, cioè l’n-upla nulla. Se A è singolare, det(A) =, l’equazione ammette infinite soluzioni, multiple della soluzione generica: xi = (−1)i+j det(Aji ) (3.45) dove j è un indice di riga qualunque. 3.6 Trasformazioni Come un vettore tridimensionale ha diverse componenti in un diverso sistema di riferimento (o, nel linguaggio degli spazi vettoriali, in una diversa base), cosı̀ una matrice ha diverse componenti in un diverso sistema di riferimento. Nella Sezione precedente era stato discusso brevemente il concetto di rotazione di un sistema di riferimento; inoltre nell’esempio riferito alla polarizzabilità, il momento di dipolo, il campo elettrico e la polarizzabilità erano stati espressi implicitamente in un sistema di riferimento ‘conveniente’, che permetteva di esprimere la polarizzabilità in una forma semplice. In generale, qual è la relazione tra 42 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA la trasformazione di un sistema di riferimento e le componenti di un vettore o di una matrice? Ancora una volta si tratta di un problema facilmente descrivibile nel linguaggio degli spazi vettoriali. di n-uple di numeri. Consideriamo in generale una base ei (per esempio, nel caso della rotazione tridimensionale, la base di versori che identifica gli assi del laboratorio). Un vettore generico v ha componenti v1 , . . . , vn nella base, cioè l’n-upla v. Introduciamo un secondo sistema di riferimento, cioè una seconda base e0i , in cui il vettore v ha componenti v10 , . . . , vn0 , o v0 . La relazione tra le componenti del vettore nei due sistemi di riferimento è in generale esprimibile come una trasformazione lineare v = Tv0 (3.46) Nell’esempio della rotazione del sistema di riferimento T era l’inversa della matrice di Eulero, che coincide con la trasposta della matrice di Eulero (che è ortogonale), T = ET . Consideriamo ora una relazione tra due vettori generici, u e v, nella forma u = Av (3.47) Nelle due basi ei e e0i (o nei due sistemi di riferimento, se si preferisce), si possono scrivere due distinte relazioni matriciali: u = Av (3.48) u0 = A 0 v 0 (3.49) Sostituendo nella prima equazione le espressioni u = Tu0 e v = Tv0 si ottiene Tu0 = ATv0 → u0 = T−1 ATv0 (3.50) da cui si vede che la matrice trasformata è A0 = T−1 AT (3.51) La precedente equazione è detta anche trasformazione di similitudine; se T è unitaria o ortogonale, parleremo di trasformazione unitaria o ortogonale. 3.7 Problemi agli autovalori Un problema molto comune che ricorre nelle applicazioni fisiche è il calcolo degli autovettori e degli autovettori di una matrice, o della risoluzione del problema agli autovalori relativo ad una matrice. Un’autovettore x di una matrice A è un vettore tale che: Ax = λx (3.52) 3.7. PROBLEMI AGLI AUTOVALORI 43 cioè tale che la moltiplicazione per A non ne modifica altro che la lunghezza, di un coefficiente scalare λ, detto autovalore. L’insieme degli autovalori è detto spettro della matrice. La n-upla nulla, 0 è sempre una soluzione, triviale; dato un autovettore x, ogni vettore ax è pure un autovettore. E‘ possibile avere più di un autovettore linearmente indipendente corrispondente ad uno stesso autovalore. Il numero di autovettori linearmente indipendenti che condividono lo stesso autovalore è detto molteplicità dell’autovalore; se la molteplicità è diversa da uno, l’autovalore è degenere. La soluzione del problema agli autovalori è impostabile come il calcolo degli zeri di un polinomio di grado n. Infatti l’equazione agli autovalori si può scrivere come un sistema omogeneo (A − λ1)x = 0 (3.53) che ammette soluzioni non triviali solo se la matrice è singolare: det(A − λ1) = 0 (3.54) L’equazione precedente è detta equazione secolare. Se si è in grado di trovare gli autovalori e i corrispondenti autovettori, i quali possono essere eventualmente normalizzati per evitare l’arbitrarietà di un fattore scalare, possiamo costruire un matrice diagonale Λ con gli autovalori in diagonale ed una matrice X la cui colonna i-esima è l’autovettore i-esimo. L’insieme delle n equazioni lineari diviene dunque AX = XΛ (3.55) od anche Λ = X−1 AX (3.56) La matrice degli autovettori è dunque una matrice che trasforma A secondo una trasformazione di similitudine che la rende diagonale: se due matrici generiche A, B commutano, [A, B] = 0, allora si possono scegliere combinazioni lineari di autovettori di A che sono anche anche autovettori di B o viceversa. In altre parole, due matrici con commutatore nullo si possono diagonalizzare simultaneamente con la stessa trasformazione; questa affermazione si generalizza anche ad un numero generico di matrici: se A1 , A2 , . . . , An commutano fra loro, possono essere diagonalizzate simultaneamente. Esempio 19. Nella teoria MO, basata sull’approssimazione di Huckel, per calcolare gli orbitali molecolari π dell’alchene 1,4-butadiene è necessario diagonalizzare la seguente matrice 0 1 A= 0 0 1 0 1 0 0 1 0 1 0 0 1 0 44 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Il determinante secolare è dato da λ4 − 3λ2 + 1 = 0 Lo studente verifichi che è un’equazione biquadratica con le seguenti soluzioni s s s s √ √ √ √ 3+ 5 3− 5 3− 5 3+ 5 λ1 = − λ2 = − λ3 = λ4 = 2 2 2 2 Nelle applicazioni quantomeccaniche, i problemi agli autovalori coinvolgono sempre matrici hermitiane (non a caso; vedi il Capitolo 4). Le matrici hermitiane H godono delle seguenti importanti proprietà • gli autovalori di H sono reali • gli autovettori corrispondenti ad autovalori distinti sono ortogonali Poiché gli autovettori corrispondenti ad un autovalore degenere costituiscono comunque un set linearmente indipendente, si può trovare una trasformazione lineare che li trasforma in un set ortogonale. Di conseguenza, il set complessivo di autovettori normalizzati di una matrice hermitiana costituisce una base ortonormale, tale che per una coppia qualunque x†i xj = δij (3.57) dove δij è il simbolo di Kronecker (0 se i 6= j, 1 se i = j). In definitiva, se X è la matrice degli autovettori di H, e Λ è la matrice diagonale degli autovalori, si ha che: X† HX = Λ (3.58) dove X è unitaria e Λ e reale. 3.8 Funzioni di matrici Concludiamo questo capitolo introducendo il concetto di funzione di matrice. Data una funzione continua f (x) nella variabile x definita dalla serie convergente ∞ X f (x) = c n xn (3.59) n=0 si definisce la funzione della matrice A come la matrice ottenuta dalla serie f (A) = ∞ X cn An n=0 Esempio 20. Alcune funzioni di matrici: (3.60) 3.8. FUNZIONI DI MATRICI • Polinomio in A: f (A) = 45 PN n n=0 cn A • Esponenziale in A: f (A) = exp(A) = • Coseno in A: f (A) = cos(A) = • Seno in A: f (A) = sin(A) = P∞ n=0 An /n! P∞ n 2n n=0 (−1) A /(2n)! P∞ n 2n+1 /(2n n=0 (−1) A • Inversa di 1 + A: f (A) = (1 + A)−1 = P∞ + 1)! n n n=0 (−1) A ; con la condizione limn→∞ An = 0 • Inversa della radice di 1 + A: f (A) = (1 + A)−1/2 = condizione limn→∞ (2n)!An /22n n!2 = 0 P∞ n n 2n 2 n=0 (−1) (2n)!A /2 n! ; con la Dato lo sviluppo in serie di una funzione, la valutazione della funzione di matrice si persegue utilizzando il concetto di diagonalizzazione. Sia data la funzione generica (3.60) in A. Siano note la matrice degli autovalori Λ e la matrice degli autovettori X di A, allora f (A) = ∞ X ∞ X cn An = n=0 cn (XΛX−1 )n (3.61) n=0 e lo studente può verificare per ispezione che (XΛX−1 )n = XΛn X−1 da cui segue f (A) = X Ã∞ X ! n cn Λ X−1 = Xf (Λ)X−1 (3.62) n=0 e f (Λ) è immediatamente valutabile come una matrice diagonale il cui i-esimo elemento diagonale è f (λi ). Esempio 21. È data la matrice 2 × 2: Ã√ ! 2 1 √ A= 1 2 Valutare exp(A). Le matrici Λ e X (gli autovettori non sono normalizzati) sono: Ã√ ! à ! 2+1 0 1 1 √ λ= X= 0 2−1 1 −1 Quindi exp(A) è data da: à exp(A) = 1 1 1 −1 !à √ !à ! 0 1/2 1/2 exp( 2 + 1) √ 0 exp( 2 − 1) 1/2 −1/2 ed infine à A= √ √ √ √ ! exp( 2 + 1) + exp( 2 − 1) exp( 2 + 1) − exp( 2 − 1) √ √ √ √ /2 exp( 2 + 1) − exp( 2 − 1) exp( 2 + 1) + exp( 2 − 1) La soluzione di un sistema di equazioni lineari differenziali ordinarie può essere espressa formalmente usando la funzione esponenziale della matrice dei coefficienti. 46 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Esempio 22. La soluzione di un sistema di equazioni lineari differenziali ordinarie per n specie chimiche aventi concentrazioni al tempo t date da c1 (t), c2 (t), . . . , cn (t) si presta molto bene ad evidenziare l’utilità delle funzioni di matrici. Il sistema si può scrivere in forma compatta come: dc(t) dt = −Kc(t) dove K è una matrice di coefficienti costanti. Le condizioni iniziali, che specificano la concentrazione al tempo iniziale, sono c(0) = c0 . La soluzione del sistema è semplicemente c(t) = exp(−Kt)c0 che si può scrivere anche come: c(t) = X exp(−Λt)X−1 c0 . Quindi il problema è equivalente alla diagonalizzazione della matrice K. 3.9 Esercizi 1. Siano x ⊗1 y e x ⊗2 y due prodotti scalari definiti nello stesso spazio vettoriale. Dimostrare che anche le seguenti operazioni: x ¯1 y = x ⊗1 y + x ⊗2 y e x ¯2 y = λx ⊗1 y + µx ⊗2 y, sono prodotti scalari dove λ e µ sono numeri arbitrari non negativi e non simultaneamente nulli. 2. Definire il prodotto scalare dello spazio dei polinomi di grado ≤ n in modo che la base 1, t, t2 /2!, . . . , tn /n! sia ortonormale. 3. Valutare il determinante di una matrice triangolare superiore di dimensione n. 4. Valutare il determinante di una matrice triangolare inferiore di dimensione n. 5. Porre in forma di polinomio di t il determinante della matrice −t 0 0 . . . 0 a1 a2 −t 0 ... 0 0 A= 0 a −t . . . 0 0 3 0 0 . . . −t 0 0 0 0 0 . . . an −t 6. Per quali valori di λ il seguente sistema ammette soluzione? x1 + x2 + λx3 = 1 x1 + λx2 + x3 = 1 λx1 + x2 + x3 = 1 3.9. ESERCIZI 47 7. Trovare l’inversa della matrice 0 0 A= an 0 ... 0 0 . . . a2 ... 0 ... 0 a1 0 0 8. Trovare l’inversa della matrice 1 0 ... a 1 ... 0 a ... A= ... 0 0 ... 0 0 0 0 0 0 a 1 9. Esprimere l’equazione secolare della seguente matrice in forma polinomiale: 0 0 0 0 c1 0 c2 0 A= ... 0 ... 0 ... ... 0 . . . cn b1 b2 bn a 10. Trovare gli autovalori di una matrice triangolare superiore di dimensione n. 48 CAPITOLO 3. FORMALISMO ALGEBRICO DELLA MECCANICA QUANTISTICA Capitolo 4 Meccanica quantistica e spazi vettoriali L’estensione dei concetti introdotti nelle Sezioni del precedente Capitolo per spazi vettoriali di dimensioni finite è abbastanza ovvia. Un concetto completamente nuovo che deve però essere introdotto è quello di completezza, essenziale per il calcolo di autovalori ed autovettori e per il trattamento computazionale di matrici di dimensioni formalmente infinite. Gli spazi vettoriali di dimensioni infinite per i quali si possa definire la proprietà addizionale di completezza sono anche detti spazi di Hilbert e sono di importanza fondamentale per lo studio della meccanica quantistica. Per questo motivo cambieremo la simbologia generica del Capitolo precedente utilizzando la notazione di Dirac o notazione bracket tipica delle applicazioni quanto-meccaniche. Un vettore di uno spazio Hilbertiano è rappresentato da un ket |φi. 4.1 Spazi di Hilbert Consideriamo uno spazio vettoriale di dimensione infinita, con un prodotto hermitiano. Per due vettori generici, |φi e |ψi, il prodotto è hφ|ψi (dove il primo vettore appare in forma bra). L’opposto di |φi è −|φi, l’elemento nullo è |0i e cosı̀ via. Il modulo di un vettore è hφ|φi. Sia ora data una successione di vettori |φ1 i, . . . , |φn i, . . . ed un vettore limite |φi. La successione converge1 al vettore limite se per ogni numero ² positivo piccolo a piacere esiste un intero N (²) tale che per n > N (²) vale che hδφn |δφn i < ² (4.1) dove |δφn i = |φn i − |φi. Si dice che lo spazio vettoriale è uno spazio di Hilbert, di cui la successione φn è una base, se la successione converge a |φi per ogni |φi. Nel seguito considereremo solo spazi hilbertiani. Esempio 23. Lo spazio delle funzioni periodiche a valori complessi è uno spazio Hilbertiano. Qual è una sua base completa? 1 In senso forte: esiste anche una definizione di convergenza debole, più generale. 49 50 CAPITOLO 4. MECCANICA QUANTISTICA E SPAZI VETTORIALI Una volta definita una base, possiamo rappresentare ogni vettore nella base definendone le componenti. Se pensiamo agli elementi dello spazio hilbertiano come a delle funzioni generiche, queste possono essere rappresentate da vettori colonna di dimensioni infinite. Un’applicazione ovvero una corrispondenza che mette in relazione un vettore con un altro vettore può essere espressa tramite il concetto, fondamentale, di operatore O|φi = |ψi (4.2) Nell’equazione precedente l’operatore O agisce sul vettore |φi trasformandolo nel vettore |ψi. Sia ora data una base ortonormale {|ii}; stando alle definizioni del Capitolo 3, si ha che hi|ii = δij . Un vettore generico è |φi = X φj |ji (4.3) j sostituendo nell’equazione (4.2) e premoltiplicando per un generico |ii: X hi|O|jiφj = ψj (4.4) j che si può scrivere in termini matriciali come Oφ = ψ (4.5) La rappresentazione di un operatore è una matrice di dimensioni infinite. 4.2 Operatori lineari Nella meccanica quantistica sono impiegati solo gli operatori lineari che godono della proprietà O(a|φi + b|ψi) = aO|φi + bO|ψi (4.6) dove O è un operatore lineare, a e b due scalari generici. Tutti i concetti definiti in precedenza per le matrici possono essere generalizzati per gli operatori • operatore unità: 1̂ = P i |iihi| ∗ • operatore aggiunto di un operatore O: hψ|O† |φi = hφ|O|ψi • commutatore di due operatori: [O1 , O2 ] = O1 O2 − O2 O1 e cosı̀ via: per esempio, un’operatore O si dice hermitiano se O† = O. Esempio 24. Si dimostri, usando le proprietà degli operatori lineari, dei prodotti hermitiani e le definizioni precedenti, che (a1 O1 + a2 O2 )† = a∗1 O1† + a∗2 O2† 4.3. POSTULATI DELLA QUANTOMECCANICA 51 (O1 O2 )† = O2† O1† Il problema agli autovalori per un operatore si pone analogamente a quello di una matrice di dimensioni finite: O|φi = λ|φi (4.7) anzi, coincide con un problema matriciale a dimensioni infinite una volta che si sia introdotto una base: Oφ = λφ (4.8) Valgono per gli operatori hermitiani le medesime proprietà introdotte per le matrici hermitiane: gli autovalori sono reali, autovettori (o autofunzioni) corrispondenti ad autovalori distinti sono ortogonali; l’operatore di trasformazione è unitario. Nella notazione di Dirac un autovettore con autovalore λ si indica con |λi, ovvero O|λi = λ|λi. 4.3 Postulati della quantomeccanica Formuliamo i principi generali della meccanica quantistica appena introdotta. 2 utilizzando la simbologia matematica Principio I: lo stato fisico di un sistema isolato è descritto da un vettore |φi di un appropriato spazio hilbertiano. Principio II: una grandezza fisica osservabile è rappresentato da un operatore lineare hermitiano F̂ . Principio III: i risultati possibili della misura di un’osservabile F sono gli autovalori fi di F: F|fi i = fi |fi i (4.9) se |φi = |fi i, il sistema è in un autostato di F e la misura dà con certezza fi . Principio IV: il valore d’attesa di un’osservabile F è definito come F̄ = hφ|F|φi hφ|φi (4.10) dove F̄ è il risultato medio di una serie di misure di F 2 Ricordiamo ancora una volat: non si tratta di postulati rigorosi che costituiscano assiomi matematici da cui dedurre una struttura matematica coerente; piuttosto sono principi fisici, esposti in modo semplificato per comprendere le applicazioni della meccanica quantistica nella sua formulazione non-relativistica. 52 CAPITOLO 4. MECCANICA QUANTISTICA E SPAZI VETTORIALI Principio V: l’operatore relativo ad un’osservabile si può esprimere in funzione di operatori spostamento x̂ e momento p̂ (in una dimensione), che obbediscono al principio [x̂, p̂] = ih̄ (4.11) dove h̄ = h/2π = 1.054 × 10−34 Js. Principio VI: lo stato al tempo t di un sistema è ottenibile come la soluzione dell’equazione di Schrödinger ih̄ ∂ ∂t |φ(t)i = H|φ(t)i (4.12) dove H è l’operatore hamiltoniano del sistema isolato. Gli autovalori dell’hamiltoniano sono le autoenergie del sistema: H|Ei = E|Ei (4.13) |Ei è un autostato del sistema con energia E. Cosa significa ‘spazio appropriato’ ? Dipende dalla natura fisica del sistema. Consideriamo il caso di una particella che si muova lungo una retta: la coordinata (nel senso della meccanica classica) è x, il momento associato è p. Gli operatori quantomeccanici corrispondenti sono x̂ e p̂. Definiamo la base continua |xi come gli autostati di x̂ con autovalori x: x̂|xi = x|xi (4.14) Nella base continua |xi, un vettore |φi è rappresentato come una funzione φ(x), l’operatore spostamento x̂ è rappresentato dalla moltiplicazione per la funzione x, cioè x̂|φi = xφ(x) l’operatore p̂ è ∂ rappresentato da h̄/ i . L’hamiltoniano è invece dato dall’espressione ∂x H=− h̄2 ∂ 2 + U (x) 2m ∂x2 (4.15) dove il primo termine rappresenta l’energia cinetica (m è la massa), il secondo l’energia potenziale. 4.4. IL METODO VARIAZIONALE 4.4 53 Il metodo variazionale Dato l’operatore hamiltoniano del sistema, uno dei problemi fondamentali in meccanica quantistica è il calcolo degli autovalori, ovvero delle autoenergie del sistema, e dei corrispondenti autostati. Per esempio, un chimico che conosca, con vari gradi di approssimazione, l’espressione per l’energia totale classica di una molecola, e dunque sia in grado di costruire l’hamiltoniano quantomeccanico (applicando il principio di corrispondenza e sostituendo alle funzioni classiche posizione e momento le corrispondenti rappresentazioni nella base continua) vuole conoscere prima di ogni altra cosa l’energia dello stato fondamentale della molecola cioè il più basso autovalore dell’hamiltoniano. Ha cosı̀ informazioni sull’energia ‘di riposo’ della molecola, nel suo stato fondamentale, e può confrontare questo dato con misure di tipo calorimetrico e termodinamico. Il calcolo degli autovalori di un sistema richiede 1) la conoscenza dell’hamiltoniano del sistema; 2) una rappresentazione matriciale dell’hamiltoniano. In generale comunque si tratta di un problema non-triviale. I sistemi (gli hamiltoniani) di cui sia possibile calcolare in modo esatto (analitico) lo spettro di autoenergie sono pochi, e saranno discussi nel Capitolo seguente. Tecniche di risoluzione approssimata per lo studio di hamiltoniani elettronici atomici e molecolari sono disponibili e molto diffuse. Nei Capitoli successivi sarà presentata una loro discussione sistematica. In questo Capitolo considereremo i principi di base dei metodi di risoluzione approssimata: il metodo variazionale e la teoria delle perturbazioni. Consideriamo in questa Sezione il calcolo approssimato dell’autostato fondamentale di un sistema. In generale si potrà esprimere lo stato (il vettore) come una combinazione (non necessariamente lineare) di vettori di base noti; i coefficienti dell’espansione possono essere determinati sulla base del principio variazionale, che sostanzialmente sfrutta le proprietà di hermiticità dell’operatore hamiltoniano. È dato un sistema descritto dall’hamiltoniano H, con autofunzioni ψ, Hψ = Eψ. Ci poniamo il seguente problema: sotto quali condizioni il funzionale di una generica funzione d’onda ξ J[ξ] = hξ|H|ξi (4.16) è stazionario, cioè massimo o minimo? Assumiamo inoltre che ξ debba essere normalizzata hξ|ξi = 1 (4.17) Dal punto di vista del calcolo variazionale il problema può essere posto sotto forma della ricerca di un punto stazionario vincolato, ed è dunque equivalente ad individuare le condizioni di stazionarietà del funzionale non vincolato J 0 [ξ] = hξ|H|ξi − λ(hξ|ξi − 1) (4.18) Al primo ordine, la variazione di J 0 è data da δJ 0 = hδ²|H|²i + h²|H|δ²i − δλ(hξ|ξi − 1) − λhδξ|ξi − λhξ|δξi (4.19) 54 CAPITOLO 4. MECCANICA QUANTISTICA E SPAZI VETTORIALI che si può riscrivere come δJ 0 = (hδξ|H|ξi − λhδξ|ξi) + (hδξ|H|ξi − λhδξ|ξi)∗ − δλ(hξ|ξi − 1) (4.20) La soluzione si ottiene i) se hξ|ξi = 1, dato che solo cosı̀ il termine in δλ si annulla e poi ii) se hδξ|H|ξi = λhδξ|H|ξi (4.21) o in altri termini, dato che δξ è arbitraria, se Hξ = λξ (4.22) cioè se ξ è un’autofunzione normalizzata di H con autovalore λ. In pratica, definiamo il rapporto di Rayleigh per un generica funzione d’onda ξ hHi = ²[ξ] = hξ|H|ξi hξ|ξi (4.23) ²[|ξi è un funzionale della funzione generica ξ. Se J 0 [ξ] è reso stazionario da ξ anche ² è stazionario. Il principio variazionale può essere applicato utilmente al calcolo degli autovalori di un sistema. Il teorema di Eckart afferma che se E0 è il più basso autovalore del sistema, il rapporto di Rayleigh è sempre maggiore o uguale a E0 . ²[ξ] ≥ E0 (4.24) La dimostrazione è la seguente: espandiamo |ξi (usiamo la notazione di Dirac per convenienza) sulla base degli autostati esatti dell’hamiltoniano H H|ψn i = En |ψn i E0 ≤ E1 ≤ . . . (4.25) hψn |ψn0 i = δnn0 |ξi = X (4.26) cn |ψn i (4.27) n consideriamo la quantità hξ|H − E0 |ξi: hψn |H − E0 |ψn0 i = X c∗n cn0 (En − E0 )hψn |ψn0 i = nn0 X |cn |2 (En − E0 ) ≥ 0 (4.28) n infatti |cn |2 ≥ 0, En ≥ E0 ; segue che: hξ|H|ξi − E0 hξ|ξi ≥ 0 ⇒ ²[ξ] ≥ E0 QED (4.29) Data dunque una funzione generica normalizzabile, il rapporto di rayleigh costituisce sempre un limite superiore dell’auovalore più basso dell’hamiltoniano del sistema. Nella sua versione piú comune, il teorema variazionale è implementato sotto forma di metodo variazionale lineare. Il vettore 4.4. IL METODO VARIAZIONALE 55 d’onda di prova |ξi è cioè dato come una combinazione lineare di N vettori noti, che indichiamo semplicemente come |1i, |2i etc. |ξi = N X cn |ni (4.30) n=1 Il rapporto di Rayleigh può essere scritto come ²= c† Hc cSc (4.31) dove c è il vettore dei coefficienti cn , mentre H e S sono le matrici rappresentative di H e dell’unità sui vettori |ni, cioè le matrici N × N aventi elementi Hnn0 = hn|H|n0 i Snn0 = hn|n0 i (4.32) La variazione infinitesimale della funzione di prova diviene ora una variazione infinitesimale dei coefficienti cn ; dal principio variazionale segue perciò δ² = δc† Hc − ²δc† Sc + complesso coniugato = 0 c† Sc (4.33) che è verificata solo se δc† (Hc − ²Sc) = 0 ovvero Hc = ²Sc (4.34) cioè la forma generalizzata di un problema agli autovalori, che si può risolvere calcolando le radici dell’equazione secolare det(H − ²S) = 0 (4.35) Il problema agli autovalori diviene più semplice se si assumono delle funzioni di base ortonormali S = 1: Hc = Ec (4.36) che è ora un problema agli autovalori in forma standard, con matrici e vettori di dimensioni finite, poiché la rappresentazione (4.30) è di solito arrestata ad un numero finito di termini. Esempio 25. È dato l’hamiltoniano H=− h̄2 ∂ 2 + V (x) 2m ∂x2 per un sistema monodimensionale. il potenziale V (x) è V (x) = V 0 0 ∞ 0 < x < L/2 L/2 < x < L altrove 56 CAPITOLO 4. MECCANICA QUANTISTICA E SPAZI VETTORIALI Consideriamo le due funzioni di base s |1i = s |2i = µ 2 πx sin L L µ ¶ 2 2πx sin L L ¶ Calcolare un valore approssimante all’energia dello stato fondamentale mediante il metodo variazionale. Si deve procedere 1) calcolando gli elementi di matrice hi|H|ji con i, j pari a 1,2 (il prodotto hermitiano è l’integrale su x); diagonalizzando la matrice H 2 × 2 e scegliendo l’autovalore più piccolo. 4.5 Perturbazioni indipendenti dal tempo per sistemi nondegeneri Di solito è possibile conoscere in modo esatto, o quantomeno accurato, la soluzione esatta di un problema agli autovalori relativo ad un sistema fisico semplificato rispetto al sistema di cui si vogliono effettivamente calcolare le proprietà. Se il sistema semplificato differisce dal sistema reale solo per un termine piccolo dell’hamiltoniano (perturbazione) è possibile cercare sistematicamente la correzione alle autoenergie ed autostati del sistema semplificato mediante la teoria delle perturbazioni indipendenti dal tempo. Supponiamo perciò che l’hamiltoniano del sistema reale sia H = H0 + ²V (4.37) dove H0 è l’hamiltoniano del sistema semplificato (imperturbato) e V è la perturbazione; ² è un parametro che definisce l’ordine di grandezza della perturbazione. Sia nota la soluzione al problema imperturbato (PI) H0 |ni = En(0) |ni (4.38) Gli autovettori |ni costituiscono una base ortonormale e completa dello spazio hilbertiano. Cerchiamo la soluzione al problema perturbato (PP) H|Φi = E|Φi (4.39) Nel seguito, per semplicità considereremo inizialmente solo sistemi con spettri di autovalori discreti e non degeneri. Possiamo rappresentare le autofunzioni del PP nella base costituita dalle autofunzioni del PI: |Φi = X n cn |ni (4.40) 4.6. SISTEMI IN ORDINE ZERO CON AUTOSTATI DEGENERI 57 Sostituendo la precedente eguaglianza nell’espressione del PP si ottiene X n i h cn En(0) + ²V |ni = E X cn |ni (4.41) n ed integrando per un generico hm| i h (0) cm = ² E − Em X Vmn cn (4.42) n dove Vmn = hm|V|ni. Si vuole calcolare la correzione all’ m-esimo autostato, cioè si vuole che per ² → 0 (perturbazione nulla) il sistema perturbato tenda all’autostato m-esimo del sistema perturbato. Espandiamo ora i coefficienti cn e l’energia E in serie di ²: (0) + ²E (1) + ²2 E (2) + . . . E = Em (4.43) 2 (2) cn = δmn + ²c(1) n + ² cn + . . . (4.44) (0) come si vede, per ² → 0 l’energia diventa Em , mentre i coefficienti cn diventano δmn , e quindi 1 se m = n, e zero in caso contrario. Per calcolare le correzioni alle energie e ai coefficienti si procede sostituendo le espansioni in serie nelle equazioni (4.42), raccogliendo i termini nella stessa potenza di ² a primo e secondo membro, ed eguagliando. Cosı̀ per esempio la correzione al primo ordine per le energie si ottiene conservando solo i termini di primo ordine nell’equazione (4.42) con n = m: E (1) = Vmm (4.45) mentre le correzioni al primo ordine per i coefficienti si ottengono con n 6= m: c(1) n = Vmn (0) Em (0) − En n 6= m (4.46) il coefficiente c(1) m resta indeterminato. Si può specificare imponendo che l’autostato del PP al primo ordine sia normalizzato, a meno di termini al primo ordine: si può verificare che ciò avviene per c(1) m = 0. Le approssimazioni successive si calcolano in modo analogo. 4.6 Sistemi in ordine zero con autostati degeneri Supponiamo che l’hamiltoniano del problema imperturbato ammetta un set di autofunzioni degeneri (0) . Possiamo definire un set di combinazioni lineari k volte |m1 i, |m2 i, . . ., |mk i con autoenergia Em delle k autofunzioni, che sono ancora autofunzioni dell’operatore H0 |φi = k X j=1 |mj iaj (4.47) 58 CAPITOLO 4. MECCANICA QUANTISTICA E SPAZI VETTORIALI Gli autovalori del sistema perturbato sono ancora scritte nella forma E= (0) Em + ∞ X ²l E (l) (4.48) l=1 mentre per la generica autofunzione perturbata possiamo scrivere |Φi = |φi + X cn |ni (4.49) n6=m Per i coefficienti aji e cn vale lo sviluppo perturbativo aj = ∞ X (l) aj cn = l=0 ∞ X c(l) n (4.50) l=0 (l) Si tratta ora di trovare i termini correttivi E (l) , e i coefficienti aj e c(l) n ; possiamo limitarci a calcolare (1) le correzioni degli autovalori al primo ordine, cioè calcolare solo E e i coefficienti aj , cn in ordine zero. Sostituendo le varie espressioni precedenti nel PP e considerando i termini in ²1 : ³ H0 − (0) Em k ´X (0) aj |mj i = (1) (Em − V) j=1 k X (0) aj |mj i (4.51) j=1 che può essere moltiplicata per il generico elemento hmi |. Il termine relativo al sistema imperturbato si annulla, e resta l’espressione k X (0) (1) hmi |V|mj i = Em ai (4.52) j=1 dove naturalmente le autofunzioni imperturbate sono ritenute ortonormali; in forma matriciale la precedente espressione è semplicemente Va = Ea, chiamando per semplicità V, a ed E la matrice (0) rappresentativa di V, il vettore dei coefficienti aj e la correzione al primo ordine all’autovalore (0) degenere del PI. Si noti che se il sistema non è degenere, al posto di aj nella relazione abbiamo 1, e la somma è semplicemente hm|V|mi, e dunque si ritrova l’espressione della correzione al primo ordine per stati non-degeneri. Esempio 26. Consideriamo ancora l’hamiltoniano dell’esempio precedente, che descrive una particella di massa m in un scatola di lato L. L’hamiltoniano del problema imperturbato è naturalmente h̄2 ∂ 2 H=− 2m ∂x2 che, come vedremo nel capitolo successivo, ammette il set completo di autofunzioni s |ki = à 2 kπx sin L L ! (0) con autovalori non-degeneri Ek = k 2 h̄2 /2m e k > 1. Qual è la correzione al primo ordine dell’autovalore più basso del sistema, che definisce l’energia di punto zero del sistema impertur(0) bato, E1 = h̄2 /2m ? Sostituendo troviamo µ ¶ (π − 1) 2V0 Z L/2 πx (1) dx sin2 = V0 E1 = h1|V|1i = L 0 L 2π Capitolo 5 Sistemi risolvibili analiticamente In questo Capitolo è inclusa una raccolta di problemi risolti relativi a sistemi quantomeccanici risolvibili analiticamente. Tra i vari casi trattati sono compresi gli esempi che si trovano in tutti i libri di testo: particella nella scatola monodimensionale e bidimensionale, rotatore monodimensionale, oscillatore armonico, particella su una sfera, atomo idrogenoide. In più sono presentate “variazioni sul tema”, come particelle in scatole monodimensionali di forme svariate, scatole tridimensionali, scatole cilindriche e set di oscillatori interagenti. Esempi/esercizi non risolti (con suggerimenti e schemi di soluzione in alcuni casi) sono distribuiti nel corso del testo. 5.1 Sistemi monodimensionali Consideriamo lo schema in Fig. (5.1), che rappresenta il potenziale confinante per una particella (in una dimensione) imprigionata in una scatola dalle pareti infinite. Qual è l’andamento nel tempo della funzione d’onda della particella, data una determinata configurazione iniziale? Vedremo che per rispondere a questo quesito sarà necessario definire le autofunzioni e gli autovalori dell’operatore hamiltoniano. Anzi, poichè il problema è di natura generale, consideriamo per cominciare un sistema generico definito nello spazio delle funzioni f (x) dove x è l’insieme delle coordinate del sistema. Al tempo t il sistema è definito dalla funzione d’onda |ψ(x, t)i la cui evoluzione temporale è dettata dall’equazione di Schrödinger ih̄ ∂ ∂t |ψ(x, t)i = H|ψ(x, t)i (5.1) al tempo t = 0 la funzione è definita da una configurazione generica (che ci dice come il sistema è stato preparato inizialmente): |ψ(x, 0)i = |ψ0 (x)i (5.2) 59 60 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE Sappiamo che l’hamiltoniano ammette autostati |Ei con autoenergie E: H|Ei = E|Ei (5.3) che sono ortonormali hE|E 0 i = δE,E 0 e costituiscono una base completa dello spazio. Quindi possiamo espandere |ψ(x, t)i |ψ(x, t)i = X cE (t)|Ei (5.4) E i coefficienti CE (t) sono ottenute come proiezioni della funzione d’onda sulle autofunzioni cE (t) = hψ(x, t)|Ei (5.5) e al tempo t = 0 vale che cE (0) = hψ0 (x)|Ei (5.6) Sostituendo nell’Eq. (5.1) si ottiene, moltiplicando per un generico hE| ed integrando ih̄ċE (t) = EcE (t) (5.7) Infine, con le condizioni iniziali (5.6) si trova cE (t) = hψ0 (x)|Ei exp(Et/ih̄) (5.8) e la funzione d’onda si può scrivere al tempo t come: |ψ(x, t)i = X |Eihψ0 (x)|Ei exp(Et/ih̄) (5.9) E Dunque la funzione d’onda è una sovrapposizione degli autostati del sistema con ‘pesi’ che dipendono dal tempo in modo esponenziale, dove le ‘costanti di decadimento’ di ciascun esponenziale sono proporzionali agli autovalori, e dalle condizioni iniziali. In linea di principio possiamo distinguere lo spettro di autoenergie di un sistema in due parti: lo spettro discreto, ovvero l’insieme delle autoenergie separate da intervalli non accessibili, e lo spettro continuo. Consideriamo un sistema monodimensionale con un potenziale U (x) che tenda a U0 per x → +∞ e a U1 > U0 per x → −∞, vedi Fig. (5.2). Lo spettro discreto si ha per autostati con energie E < U0 : la particella è chiusa nella scatola. Se E > U0 lo spettro diviene continuo, e la partcella è libera. Il numero di autostati discreti può esser finito (se U0 e U1 sono quantità finite) od infinito. Nel seguito consideremo solo stati con autovalori discreti, cioè sistemi in stati confinati. Torniamo ora al caso della particella in una scatola monodimensionale con pareti infinite. Assumiamo che l’energia potenziale sia nulla all’interno della scatola ed infinita all’esterno. La funzione 5.1. SISTEMI MONODIMENSIONALI 61 L x Figura 5.1: Potenziale per una particella in una scatola 1D. d’onda è dunque definita solo per 0 ≤ x ≤ L, vedi Fig. (5.1). L’equazione di Schrödinger indipendente dal tempo assume la forma 1 : h̄2 d2 − ψE (x) = EψE (x) 2m dx2 (5.10) dove m è la massa della particella. Valgono le condizioni al contorno ψE (0) = 0, ψE (L) = 0 (5.11) L’Eq. (5.10) è un’equazione differenziale ordinaria a coefficienti costanti del secondo ordine. La sua soluzione generica ha la forma ψE (x, t) = A1 exp(α1 x) + A2 exp(α2 x) (5.12) dove α1,2 sono le radici dell’equazione h̄2 2 − α =E 2m (5.13) q vale a dire α1,2 = ±i 2mE . h̄2 Sostituendo nelle condizioni al contorno si ottiene A1 + A2 = 0 s (5.14) s 2mE 2mE A1 exp iL + A2 exp −iL =0 2 h̄ h̄2 1 (5.15) Ci poniamo nella rappresentazione continua, in modo da lavorare direttamente con funzioni della variabile x 62 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE U(x) U 1 U 0 x Figura 5.2: Un potenziale generico in una dimensione. che è un sistema lineare omogeneo in A1 e A2 , risolvibile solo se il determinante dei coefficienti è nullo. Si trova cosı̀ la condizione in E: s exp 2iL 2mE =1 h̄2 (5.16) le cui soluzioni sono h̄2 π 2 k 2 E= , k∈N (5.17) 2mL2 Gli autostati di una particella chiusa in un pozzo infinitamente profondo sono quantizzati come i quadrati dei numeri interi; sono anche inversamente proporzionali alla massa della particella e alla larghezza del pozzo. Vale a dire: per una massa molto grande, od un pozzo molto largo, gli autovalori sono molto vicini tra loro (lo spettro diviene quasi continuo), e il comportamento della particella si avvicina al comportamento previsto dalla meccanica classica. Le autofunzioni si trovano subito tenendo conto A1 = −A2 ; imponendo la condizione che siano normalizzate in [0, L] si trova: s ψk (x) = à 2 kπ sin x L L ! (5.18) 5.2. FUGA DAL POZZO 63 Supponiamo ora che la particella sia inizialmente al centro del pozzo: ψ(x, 0) = δ(x − L/2) (5.19) Da cui segue che al tempo t la funzione d’onda è " # à ! à 2X k 2 h̄π 2 kπ kπ ψ(x, t) = exp t sin x sin 2 L k≥1 2mL L 2 ! (5.20) ma il seno di kπ/2 vale è zero per k pari; per k = 2n + 1 dispari, con n ≥ 0, vale (−1)n ; perciò # " à 2 X kπ (2n + 1)2 h̄π 2 ψ(x, t) = t sin (−1)n exp x 2 L n≥0 2mL L ! (5.21) Naturalmente per una scatola con pareti infinite tutte le autoenergie sono discrete (non esistono stati “liberi” della particella). Esempio 27. Calcolare e rappresentare in un grafico ai tempi t: 1 ps, 10 ps, 1 ns e 1 µs la densità di probabilità |ψ 2 (x, t)| per un neutrone in un pozzo largo 1 Å, che sia posto al centro del pozzo a t = 0. 5.2 Fuga dal pozzo E se una le pareti del pozzo avessero un’altezza finita? Il potenziale è rappresentato in Fig. (5.3): V (x) = V 0 V x≤0 0<x<L L≤x (5.22) Consideriamo solo lo spettro discreto, vale a dire gli stati confinati della particella, E < V . La soluzione generica per l’autofunzione ψE (x) con autoenergia E è definita nei singoli intervalli come B1 exp(bx) x≤0 ψ(x) = A1 exp(iax) + A2 exp(−iax) 0 ≤ x < L B2 exp(−bx) L≤x q (5.23) q dove a = 2mE/h̄2 e b = 2m(V − E)/h̄2 ; si noti che che per x < 0 si pone a zero il coefficiente dell’esponenziale exp(−bx) che altrimenti divergerebbe per x → −∞ (ed analogamente per x ≥ L). Valgono poi quattro condizioni relative alla continuità e derivabilità dell’autofunzione in x = 0 e x = L: A1 + A2 = B1 (5.24) iaA1 − iaA2 = bB1 (5.25) 64 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE A1 exp(iaL) + A2 exp(−iaL) = B2 exp(−bL) (5.26) iaA1 exp(iaL) − iaA2 exp(−iaL) = −bB2 exp(−bL) (5.27) Risolvendo il determinante 4 × 4 (scrivetelo), si ottiene una condizione in E. Saltando vari passaggi algebrici il risultato è: arcsin √ h̄a nπ − kL = 2 2mV (5.28) con n ∈ N , che si risolve in a. Si verifica subito che il numero degli autostati discreti è finito. 5.3 Una scatola con una barriera interna L’esempio successivo è relativo al caso di un pozzo con un barriera interna finita, Fig. (5.3). Lo schema di soluzione è analogo ai casi precedenti: i) definizione delle forme generali delle autofunzioni; ii) imposizione di condizioni al contorno; iii) determinazione degli autostati dalla soluzione di un sistema lineare omogeneo. L’algebra è un più complicata, ma per geometrie elementari si semplifica considerevolmente. Il potenziale che descrive il nostro pozzo è dato in [0, L3 ]: V2 V x L 1 L 2 V3 L3 L (a) x (b) Figura 5.3: Potenziali per una particella in una scatola 1D con una barriera interna. 5.3. UNA SCATOLA CON UNA BARRIERA INTERNA V 1 V (x) = V2 V3 0 ≤ x < L1 L1 ≤ x < L 2 L2 < x ≤ L3 65 (5.29) La soluzione generica per l’autofunzione ψE (x) con autoenergia E è definita nei singoli intervalli come (1) (1) (1) (1) A exp(α1 x) + A2 exp(α2 x) 0 ≤ x < L1 1 (2) (2) (2) (2) ψ(x) = A1 exp(α1 x) + A2 exp(α2 x) L1 ≤ x < L2 (5.30) (3) (3) (3) (3) A1 exp(α1 x) + A2 exp(α2 x) L2 < x ≤ L3 (i) q i) dove α1,2 = ±i 2m(E−V . Le condizioni al contorno sono analoghe al primo caso: ai confini del h̄2 pozzo l’autofunzione deve annullarsi, poichè la particella non può penetrare una barriera infinita. I coefficienti ignoti dell’autofunzione sono sei, e disponiamo di due condizioni al contorno piú altre quattro condizioni: per ciascun dei punti interni, in L1 ed L2 la funzione deve essere continua e derivabile. In definitiva, valgono le sei relazioni lineari: (1) (1) A1 + A2 (1) (1) (1) (1) A1 exp(α1 L1 ) + A2 exp(α2 L1 ) (1) (1) (1) (1) (1) (1) α1 A1 exp(α1 L1 ) + α2 A2 exp(α2 L1 ) (2) (2) (2) (2) A1 exp(α1 L2 ) + A2 exp(α2 L2 ) (2) (2) (2) (2) (2) (2) α1 A1 exp(α1 L2 ) + α2 A2 exp(α2 L2 ) (3) (3) (3) (3) A1 exp(α1 L3 ) + A2 exp(α2 L3 ) = 0 (2) (2) (2) (2) = A1 exp(α1 L1 ) + A2 exp(α2 L1 ) (2) (2) (2) (2) (2) (2) = α1 A1 exp(α1 L1 ) + α2 A2 exp(α2 L1 ) (3) (3) (3) (3) = A1 exp(α1 L2 ) + A2 exp(α2 L2 ) (3) (3) (3) (3) (3) (3) = α1 A1 exp(α1 L2 ) + α2 A2 exp(α2 L2 ) = 0 (5.31) da cui si ricava il determinante 6 × 6 che permette di determinare E. A questo punto lo schema di soluzione per un potenziale generico monodimensionale che sia rapresentabile da una serie di segmenti orizzontali e verticali, con pareti infinite, vale a dire un pozzo monodimensionale infinitamente profonda con un “fondo” qualunque, dovrebbe risultare chiaro: 1) si imposta la soluzione generica in ciascun intervallo; 2) si impongono condizioni di continuità e derivabilità in ogni punto interno; 3) si annulla la soluzione alle due pareti. Il risultato è un sistema omogeneo di equazioni per i coefficienti dell’autofunzione in ciascun intervallo, il cui determinante si deve annullare e fornisce un’equazione per calcolare le energie. Esempio 28. 1. Impostare e risolvere numericamente il problema agli autostati relativo al pozzo (a) di Fig. (5.4). Cosa succede se V → 0, o l → 0? 2. Impostare e risolvere numericamente il problema agli autostati relativo al pozzo (b) di Fig. (5.4). Cosa succede se il numero di gradini diviene infinito, mentre la loro larghezza tende a zero (ovvero N → ∞ con N L → cost.)? 3. Impostare e risolvere numericamente il problema agli autostati relativo al pozzo (c) di Fig. (5.4). Cosa succede se il numero di gradini diviene infinito, mentre la loro larghezza tende a zero (ovvero N → ∞ con N L → cost.)? 66 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE V V1 l L V2 (a) (b) V3 L V2 V n-1 V1 Vn V1 V2 V3 V4 L V3 (c) (d) Figura 5.4: Varie scatole 1D. 4. Impostare e risolvere numericamente il problema agli autostati relativo ad un pozzo generico, come in (d) di Fig. (5.4). 5.4 Scatola tridimensionale Una particella di massa m in tre dimensioni è descritto dall’hamiltoniano generico H=− h̄2 ˆ 2 ∇ + U (x) 2m (5.32) ˆ è l’operatore laplaciano, che in coordinate cartesiane ha la forma dove ∇ 2 2 2 ˆ2 = ∂ + ∂ + ∂ ∇ ∂x1 2 ∂x2 2 ∂x3 2 (5.33) Nel caso di una particella racchiusa in una scatola in tre dimensioni, con pareti di lato a1 , a2 e a3 , il potenziale è nullo all’interno della scatola, ed infinito all’esterno. Il problema è ridotto allo studio di tre problemi separati lungo i tre assi; cioè l’autofunzione del sistema si può scrivere come: (1) (2) (3) ψE (x) = ψE (x1 )ψE (x2 )ψE (x3 ) (5.34) 5.5. PARTICELLA IN E SU UN ANELLO e 67 3 a 3 e 1 a2 a e 1 2 Figura 5.5: Scatola tridimensionale. (1) dove ψE (x1 ) è definita per 0 < x < a1 e cosı̀ via. Le autoenergie sono date dall’espressione: h̄2 π 2 E= 2m à k12 k22 k32 + + a21 a22 a23 ! (5.35) dove k1 , k2 e k3 sono interi. I corrispondenti autostati sono dati dall’equazione inserendo le forme (1) esplicite di ψE (x1 ) etc. nella (5.34): s ψE (x) = à ! à ! à 8 πk1 πk2 πk3 sin sin sin a1 a2 a3 a1 a2 a3 ! (5.36) È importante notare che nel caso tridimensionale le autoenergie possono essere degeneri: per una scatola cubica (a1 = a2 = a3 ) una coppia di autostati identificate da terne k1 , k2 e k3 che differiscano solo per una permutazione hanno lo stesso energia. Esempio 29. Consideriamo il caso di una scatola bidimensionale quadrata: i) scrivere le espressioni generali per le autoenergie e gli autostati; ii) porre in grafico le autofunzioni corrispondenti ai primi cinque autovalori distinti. 5.5 Particella in e su un anello Considereremo in questa Sezione e nelle Sezioni successive problemi agli autovalori relativi a sistemi che si possono risolvere analiticamente introducendo coordinate curvilinee, non cartesiane, che sono 68 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE dettate naturalmente dalla geometria del potenziale. Come primo caso prendiamo in analisi una particella che sia racchiusa in una zona dello spazio bidimensionale in una circonferenza: V = 0 se |x| < a, V = ∞ se |x| > a, vedi Fig. (5.6) (a); a è il raggio della circonferenza; oppure che sia costretta a muoversi sulla circonferenza stessa (rotatore planare). L’hamiltoniano per il sistema nel e 2 P r θ e 1 R e1 P(x 1 , x 2 ) (a) (b) e2 Figura 5.6: Un pozzo cilindrico ed un anello. piano è: ∂2 h̄2 ∂ 2 H=− + 2m ∂x1 2 ∂x2 2 (5.37) Introduciamo le coordinate polari: r, φ, dove r è il modulo del vettore x = (x1 , x2 ) e φ è l’angolo formato con l’asse delle ascisse. È facile dimostrare che l’hamiltoniano, proporzionale all’operatore laplaciano in due dimensioni, assume la forma: h̄2 ∂ 2 1 ∂ 1 ∂2 H=− + + 2m ∂r2 r ∂r r2 ∂φ2 (5.38) Consideriamo prima il caso del rotatore planare. La particella si muove su una circonferenza a r = a, di consequenza le derivate in r si annullano. L’hamiltoniano si riduce al solo termine dipendente da φ. L’equazione di Schrödinger assume la forma: h̄2 d2 − ΨE (θ) = EΨE (φ) 2I dφ2 (5.39) dove I = ma2 è il momento di inerzia. Risolvendo, si trova come nel caso della particella nella scatola monodimensionale: ΨE (θ) = A1 exp(iml φ) + A2 exp(−iml φ) (5.40) 5.5. PARTICELLA IN E SU UN ANELLO 69 q dove ml = 2IE/h̄2 . Le condizioni al contorno sono da ricercarsi nelle proprietà fondamentali delle funzioni d’onda di un sistema quantomeccanico, che devono sempre dar luogo ad una densità di probabilità univoca: cioè dato x, un punto dello spazio delle coordinate del sistema, la funzione |φ(x)| deve essere univocamente determinata. Nel caso in questione questo implica che la funzione calcolata in φ o in φ + 2π (quindi nello stesso punto), deve essere uguale: ΨE (φ + 2π) = ΨE (φ) (5.41) quindi ml deve essere un numero intero. Gli autovalori sono dunque: m2l h̄2 E= , 2I ml ∈ N (5.42) Lo stato di una particella con autoenergia E è dunque descritto da una somma di due esponenziali complessi, che rappresentano in realtà due moti sovrapposti, in un senso (ml ) e nel senso opposto (−ml ). Supponiamo di aver preparato la particella con un unico senso di rotazione, A2 = 0; la costante di normalizzazione dell’autofunzione rimanente si ottiene integrando |ΨE (φ)|. Si ottiene infine: s Ψml (φ) = 1 exp(iml φ) 2π (5.43) Ed ora consideriamo il caso di una particella racchiusa in un anello, che cioè sia costretta a muoversi all’interno della circonferenza. L’hamiltoniano è dato dalla (5.38). L’autofunzione generica si può scrivere in una forma fattorizzata, poichè le coordinate r e φ sono separabili: ΨE (r, φ) = R(r)Ψ(φ) (5.44) Sostituendo nell’equazione di Schrödinger, HΨE = EΨE , dividendo per ΨE e moltiplicando per r2 , si ottiene: h̄ dR h̄2 d2 Ψ 2 − r +r − Er = 2mR dr 2mΨ dφ2 dr2 2 2 2d R (5.45) che è un’equazione separabile; il primo e il secondo membro devono sempre essere uguali, indipendentemente dal valore di r e φ; scriviamo perciò d2 Ψ dφ2 = −m2l Ψ (5.46) dove m2l è una costante; poichè la funzione deve essere univocamente definita e dunque Ψ periodica, ml è un numero intero. Resta però da risolvere un’equazione in R: 2 2d R r 2 µ ¶ dR 2mE 2 + +r r − ml 2 R = 0 dr h̄2 dr (5.47) 70 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE le condizioni al contorno sono: i) la funzione d’onda deve essere continua ovunque, anche all’origine r = 0; e ii) deve annullarsi sul bordo r = a. Le funzioni che verificano l’equazione radiale con queste condizioni sono dette funzioni di Bessel di ordine intero: s 2mE Rml (r) = Jml r h̄2 (5.48) con il vincolo: s 2mEml ,n Jml a =0 h̄2 (5.49) risolvendo l’equazione precedente si trova un set di valori di Eml ,n per ogni valore di ml , con n = 1, 2, . . .. In definitiva la soluzione generica è: s 2mEml ,n Ψml ,n (r, φ) = exp(iml φ)Jml r h̄2 (5.50) con la condizione (5.49) sulle autoenergie. Esempio 30. Fate una ricerca bibliografica sulle proprietà delle funzioni di Bessel e valutate con l’ausilio di tabelle i valori di E0,l con l =≤ 3, se la massa della particella è quella di un protone e il raggio della circonferenza è pari a 2 Å. 5.6 Particella in e su una sfera Da due a tre dimensioni il passo è breve, almeno in questo caso. Generalizziamo le precedenti considerazioni al caso di una sfera: studiamo dunque il problema del moto di una particella di massa m su una sfera di raggio a e poi dentro la medesima sfera. L’hamiltoniano del sistema è in coordinate cartesiane, in analogia con il caso dell’anello: h̄2 ˆ 2 H=− ∇ 2m (5.51) dove si è fatto uso dell’operatore laplaciano. Introduciamo ora le coordinate polari sferiche r, φ, θ, vedi Fig. (5.7): x1 x2 x3 = r sin θ cos φ = r sin θ sin φ = r cos θ (5.52) Il laplaciano assume una forma particolarmente semplice nelle coordinate sferiche: ˆ 2 = 1 ∂ r2 ∂ + 1 M2 ∇ r2 ∂r ∂r r2 (5.53) 5.6. PARTICELLA IN E SU UNA SFERA 71 e3 θ φ r e 2 e 1 Figura 5.7: Coordinate polari sferiche. ∂ 1 ∂2 1 ∂ M = + sin θ 2 sin θ ∂φ2 sin θ ∂θ ∂θ 2 (5.54) dove M2 è anche detto operatore legendriano. Procediamo ora come abbiamo fatto per il caso del rotatore planare. Se la particella è costretta a muoversi sulla superficie della sfera, trascuriamo le derivate in r, e poniamo r = R. Dall’equazione di di Schrödinger si ottiene un’equazione in ΨE (φ, θ): h̄2 2 − M ΨE = EΨE 2I (5.55) dove I = ma2 . La funzione ΨE dovrà essere periodica in φ e in θ. Inoltre deve essere finita a θ = π. La soluzione generale si può scrivere in termini di funzioni speciali, note come funzioni armoniche sferiche, che altro non sono, da un certo punto di vista, che l’equivalente tridimensionale degli esponenziali complessi che sono stati usati nel caso bidimensionale. Varie loro proprietà sono note (e si rimanda lo studente ad opportuni testi specializzati). Tra le altre proprietà, fondamentale è il fatto che sono autofunzioni del legendriano: M2 Ylml (θ, φ) = −l(l + 1)Ylml (θ, φ) (5.56) 72 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE dove l = 0, 1, . . . e ml = −l, −l + 1, . . . , l − 1, l. Segue dunque che le autoenergie di una particella che si muova su una sfera sono caratterizzate da: Elml = h̄2 l(l + 1) 2I (5.57) Si noti che per ogni autostato, caratterizzato dai numeri quantici l e ml , esistono 2(l + 1) autovalori degeneri, dato che Elml non dipende da ml . Procediamo ora con il caso della particella confinata nella sfera. Ora dobbiamo considerare il laplaciano nella sua forma completa. Analogamente al caso precedente, si può assumere che la parte angolare debba essere quella determinata dal moto sulla sfera: ΨE (r, θ, φ) = R(r)Ylml (θ, φ) (5.58) Sostituendo nell’Eq. di Schrödinger si trova l’equazione per la parte radiale: 1 d 2 dR l(l + 1) 2m r − R + 2 ER = 0 2 2 r dr dr r h̄ (5.59) con le condizioni al contorno che R = 0 per r = a ed R finita a r = 0. In generale avremo dunque delle funzioni Rnl (r) che si ottengono risolvendo la precedente equazione differenziale ordinaria. Consideriamo nel seguito il solo caso l = 0, cioè le soluzioni del problema che siano indipendenti dagli angoli polari (Y0,0 è una costante). L’equazione in R si può porre nella forma ridotta 1 d2 rR − κ2 R = 0 r dr2 (5.60) q dove κ = R(r) = A 2mE/h̄2 . La soluzione finita a r = 0 è sin(κr) r (5.61) e la condizione al contorno impone che ka = 0, vale a dire ancora una volta E= h̄2 n2 π 2 2I (5.62) Esempio 31. Normalizzate l’autofunzione radiale. Ricordate che nel passaggio da coordinate cartesiane a coordinate sferiche si ha che: Z Z Z dx1 dx2 Z Z dx2 f (x1 , x2 , x3 ) = drr2 Z dθ sin θ dφf (r, θ, φ) 5.7. OSCILLATORE ARMONICO 5.7 73 Oscillatore armonico L’oscillatore lineare o armonico è un altro esempio di sistema risolvibile analiticamente, ovvero tale che le sue autofunzioni sono esprimibili in termini di funzioni note. Il potenziale è definito come una parabola, con una curvatura mω 2 : V (x) = mω 2 2 x 2 (5.63) ω è la frequenza dell’oscillatore. Consideriamo l’hamiltoniano del sistema: mω 2 2 h̄2 d2 − + x ψE (x) = EψE (x) 2m dx2 2 (5.64) Introduciamo per comodità di calcolo la coordinata adimensionale ξ = diviene: d2 µ q mω x. h̄ L’equazione in ψ(ξ) ¶ 2E ψ + − ξ 2 ψE = 0 2 E h̄ω dξ (5.65) La funzione ψ deve essere finita per ξ → ∞; per x molto grandi si può trascurare il termine in E rispetto a ξ 2 , quindi la funzione si deve comportare asintoticamente come exp(−ξ 2 /2): ψE (ξ) = exp(−ξ 2 /2)χ(ξ) (5.66) dove χ(ξ) può anche divergere con ξ → ∞, ma non più velocemente di exp(−ξ 2 /2); possiamo perciò ottenere l’equazione in χ(ξ): µ d2 χ ¶ dχ 2E − 2ξ + −1 χ=0 2 dξ h̄ω dξ (5.67) La soluzione generica all’equazione differenziale precedente, con la condizione al contorno che per ξ → ∞ la funzione χ non cresca più rapidamente di una potenza finita di ξ (in modo che comunque ψE vada a zero per ξ → ∞, è data dai polinomi di Hermite, con il vincolo che 2E − 1 = 2n h̄ω (5.68) ed n deve essere naturale. Le autofunzioni di un oscillatore armonico monodimensionale sono dunque proporzionali ai polinomi di Hermite, con autovalori quantizzati dall’indice n. La costante di proporzionalità è determinabile, come sempre, dalla condizione di normalizzazione della funzione d’onda. Sostituendo di nuovo x al posto di ξ infine si trova: µ mω ψn (x) = πh̄ ¶1/4 µ ¶ mω 2 1 exp − x Hn (2n n!)1/2 2h̄ "µ mω h̄ ¶1/2 # x (5.69) 74 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE cui corrisponde l’autovalore µ ¶ 1 En = n + h̄ω 2 (5.70) Esempio 32. Porre in grafico le prime tre autofunzioni di un oscillatore lineare con la massa di un elettrone e ω = 10−14 s−1 . La generalizzazione ad un oscillatore armonico in tre dimensioni è semplice. L’equazione di Schrödinger è data da: " # ´ h̄2 ˆ 2 1 ³ 2 2 − ∇ + ω1 x1 + ω22 x22 + ω32 x23 ΨE (x1 , x2 , x3 ) = EΨE (x1 , x2 , x3 ) 2m 2 (5.71) analogamente al caso della particella in tre dimensioni (e in generale in tutti i casi in cui il potenziale sia scritto come una somma di potenziali separati agenti ciascuno su una coordinata), possiamo scrivere gli autostati come il prodotto degli autostati lungo ciascuna coordinata µ ψn1 ,n2 ,n3 (x) = Π3i=1 mωi πh̄ ¶1/4 µ ¶ 1 mωi 2 exp − x Hni n 1/2 i (2 ni !) 2h̄ i "µ mωi h̄ # ¶1/2 xi (5.72) e le autoenergie come somme: E= Xµ i ¶ 1 h̄ωi ni + 2 (5.73) Esempio 33. Qual è la degenerazione in funzione di n = n1 + n2 + n3 dell’autostato E = (n1 + n2 + n3 + 3/2)h̄ω per un oscillatore armonico tridimensionale con ω1 = ω2 = ω3 = ω? 5.8 Potenziale di Morse Consideriamo il potenziale V (x) = D(1 − e−αx )2 (5.74) detto potenziale di Morse ed è mostrato in Fig. (5.8). Per x → ∞ il potenziale va a D; per x → −∞ il potenziale va a +∞. Evidentemente esisteranno autovalori discreti e positivi per E < D, ed uno spettro continuo per E > D. L’equazione di Schrödinger è data come al solito da − h̄2 ∂ 2 ψE (x) + D(1 − e−αx )2 ψE (x) = EψE (x) 2m ∂x2 Introduciamo la variabile ausiliaria ξ che va da 0 a ∞ √ 2 2mD ξ= exp(−αx) αh̄ (5.75) (5.76) 5.8. POTENZIALE DI MORSE 75 V(x) D x Figura 5.8: Potenziale di Morse. L’equazione di Schrödinger assume la forma ridotta: ∂ 2 ψE ∂ξ 2 à ! 1 n + s + 1/2 s2 1 ∂ψE + + − + − 2 ψE = 0 ξ ∂ξ 4 ξ ξ √ (5.77) √ 2m(D−E) dove s = e n = 2mD − s − 12 . Per ξ → ∞ la funzione deve evolvere come exp(−ξ/2) e αh̄ αh̄ per ξ → 0 come ξ s . La soluzione generica si può scrivere perciò come ψE (ξ) = exp(−ξ/2)ξ s χ(ξ) (5.78) Sostituendo, si trova un’equazione differenziale in χ(ξ) (come si vede la procedura è sostanzialmente analoga al caso dell’oscillatore armonico): ξ ∂ 2χ ∂ξ 2 + (2s + 1 − ξ) ∂χ ∂ξ + nχ = 0 (5.79) La soluzione generica è detta funzione ipergeometrica confluente e si scrive in generale χ = F (−n, 2s+ 1, ξ); sappiamo che χ deve essere finita per ξ → 0; per ξ → ∞ χ non può tendere all’infinito più rapidamente di una potenza finita di ξ. Queste condizioni si ottengono dallo studio delle proprietà 76 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE delle funzioni ipergeometriche confluenti, solo nel caso n intero non negativo. Da ciò segue che le autoenergie discrete sono: " ¶#2 µ αh̄ 1 En = D 1 − 1 − √ n+ (5.80) 2 2mD √ Si noti che se αh̄/ 2mD > 2 non esistono autovalori discreti. Il potenziale di interazione tra gli atomi di una molecola biatomica può essere rappresentato in modo qualitativo da una curva di Morse. In realtà possiamo interpretare un sistema rappresentato dalla curva di Morse come un esempio di oscillatore anarmonico. 5.9 Atomo idrogenoide Concludiamo questa Sezione con un sistema ‘chimico’ semplice, risolvibile analiticamente: il calcolo dello spettro di autoenergie e delle relative autofunzioni per l’elettrone di un atomo di idrogeno con un nucleo a riposo. In generale, se il nucleo non è a riposo dobbiamo semplicemente sostituire alla massa dell’elettrone la massa ridotta del sistema protone/elettrone. L’hamiltoniano del sistema è perciò: H=− e2 1 h̄2 ˆ 2 ∇ − 2µ 4π²0 r (5.81) dove µ è la massa ridotta e il secondo termine è il potenziale coulombiano attrattivo tra il nucleo con carica +e e l’elettrone con carica −e a distanza r. Il potenziale è a simmetria radiale. Possiamo perciò procedere senza perdere tempo come nel caso della particella racchiusa in una sfera: i) introduzione di coordinate sferiche; ii) fattorizzazione della funzione d’onda in una parte angolare dipendente da θ e φ e in una parte radiale dipendente da r; iii) imposizione di condizioni al contorno per il calcolo delle autoenergie. La parte angolare dell’autofunzione non cambia, ed è data ancora dalle funzioni armoniche sferiche: in realtà ciò è vero per qualunque potenziale a simmetria sferica, cioè dipendente solo dal modulo r: ΨE (r, θ, φ) = R(r)Ylml (θ, φ) (5.82) Sostituendo nell’Eq. di Schrödinger si trova l’equazione per la parte radiale: à ! 2m e2 1 1 d 2 dR l(l + 1) r − R+ 2 E+ R=0 r2 dr dr r2 4π²0 r h̄ (5.83) Lo spettro degli autovalori sarà discreto per E < 0, e continuo per E > 0 (il potenziale coulombiano tende a zero per r → ∞ e a −∞ per r → 0). A questo punto possiamo procedere come in tutti i casi precedenti: l’equazione differenziale in R, con le condizioni al contorno R finita a r → 0 e R → ∞ è riconoscibile com l’equazione che ha per soluzione delle funzioni note: le funzioni associate 5.9. ATOMO IDROGENOIDE 77 di Laguerre (moltiplicate per l’esponenziale di −r). In definitiva gli autostati e le autoenergie dell’atomo di idrogeno a riposo sono: Ψn,l,ml (r, θ, φ) = Rnl (r)Ylml (θ, φ) (5.84) dove le funzioni radiali Rnl sono Rnl = − 2 (n − l − 1)! l 2l+1 ρ Ln+l (ρ) exp(−ρ/2) na 2n [(n + l)!]3 (5.85) e gli autovalori corrispondenti sono En,l,ml 1 µe4 =− 2 32π 2 ²20 h̄ n2 (5.86) dove ρ = 2r/na ed a = 4π²0 h̄2 /µe2 . Gli autostati discreti sono negativi e dipendono solo da 1/n2 . Esempio 34. Qual è la degenerazione di ciascun livello energetico dell’atomo di idrogeno a riposo? E quanto vale il valore di attesa di r rispetto per l’autofunzione con n = l = ml = 0. 78 CAPITOLO 5. SISTEMI RISOLVIBILI ANALITICAMENTE Capitolo 6 I momenti angolari Nel Capitolo (1), dedicato ad un breve ripasso dei principi fondamentali della meccanica classica, ~ = ~r × p~. Esprimendo le componenti abbiamo definito il momento angolare di una particella come L ~ abbiamo di L Lx = ypz − zpy Ly = zpx − xpz Lz = xpy − ypx (6.1) Possiamo costruire l’equivalente operatore quantomeccanico per il momento angolare di una particella usando il principio di corrispondenza ∂ ∂ h̄ −z Lx = y i ∂z ∂y ∂ ∂ h̄ Ly = z −x i ∂x ∂z ∂ ∂ h̄ Lz = x −y i ∂y ∂x (6.2) di particolare importanza è l’operatore modulo quadrato del momento angolare L2 = L2x + L2y + L2z 6.1 (6.3) Proprietà di commutazione Le proprietà generali dell’operatore momento angolare di un punto materiale (o momento angolare orbitale) sono comuni ad una vasta classe di operatori, caratterizzati in un ultima analisi non dalla loro forma esplicita, ma, formalmente, solo dalle loro proprietà di commutazione. Ricaviamo perciò ora esplicitamente le proprietà di commutazione del momento angolare orbitale. È utile considerare le sue componenti in unità h̄ (che ha le dimensioni di un momento angolare, joule per secondo in unità SI). Dalle proprietà di commutazione degli operatori posizione e momento, si ricava facilmente [Lx , x] = 0 [Lx , y] = iz [Lx , z] = −iy [Ly , y] = 0 [Ly , z] = ix [Ly , x] = −iz [Lz , z] = 0 [Lz , x] = iy [Lz , y] = −ix (6.4) 79 80 CAPITOLO 6. I MOMENTI ANGOLARI regole analoghe valgono per le proprietà di commutazione con il momento lineare [Lx , p̂x ] = 0 [Lx , p̂y ] = ip̂z [Ly , p̂y ] = 0 [Ly , p̂z ] = ip̂x [Lz , p̂z ] = 0 [Lz , p̂x ] = ip̂y [Lx , p̂z ] = −ip̂y [Ly , p̂x ] = −ip̂z [Lz , p̂y ] = −ip̂x (6.5) In forma compatta, possiamo scrivere [Li , xj ] = i²ijk xk [Li , p̂j ] = i²ijk p̂k (6.6) dove ²ijk è il tensore di Levi-Civita o tensore di unità assiale: le sue 27 componenti sono pari a +1 se gli indici i, j, k sono una permutazione pari di 1,2,3, −1 se sono una permutazione dispari, zero altrimenti. Dalle precedenti espressioni possiamo ricavare finalmente le operazioni di commutazione del momento angolare con se stesso [Lx , Lx ] = 0 [Lx , Ly ] = iLz [Ly , Ly ] = 0 [Ly , Lz ] = iLx [Lz , Lz ] = 0 [Lz , Lx ] = iLy [Lx , Lz ] = −iLy [Ly , Lx ] = −iLz [Lz , Ly ] = −iLx (6.7) o in forma compatta [Li , Lj ] = i²ijk Lk (6.8) Rispetto all’operatore L2 , le regole di commutazione sono ricavabili dalla (6.3) [L2 , Lx ] = [L2 , Ly ] = [L2 , Lz ] = 0 (6.9) Relazioni analoghe valgono per il momento angolare di un sistema di particelle o di un corpo rigido (vedi Capitolo (1)), le cui componenti indichiamo nel seguito con il simbolo J i [J i , J j ] = i²ijk J k (6.10) [J 2 , J x ] = [J 2 , J y ] = [J 2 , J z ] = 0 (6.11) e come vedremo in seguito, per le componenti del momento angolare di spin di una particella o di un sistema di particelle. In generale possiamo definire un operatore vettore come un operatore momento angolare se valgono relazioni di commutazione analoghe alle (6.8) e (6.9). 6.2 Autovalori ed autovettori dei momenti angolari Consideriamo un generico momento angolare (adimensionale), che indichiamo con ˆl2 , ˆli , per cui valgono le proprietà di commutazione [ˆli , ˆlj ] = i²ijk ˆlk [ˆl2 , ˆli ] = 0 (6.12) 6.2. AUTOVALORI ED AUTOVETTORI DEI MOMENTI ANGOLARI 81 Le proprietà di commutazione degli operatori momento angolare hanno un’importante conseguenza: poichè le singole componenti non commutano tra loro, non è possibile misurare con una precisione arbitraria il momento angolare di un sistema: solo il modulo quadro e una delle componenti sono conoscibili in modo completo, cioè possiamo definire un set completo di autostati comuni a ˆl2 e ˆlz (o una qualunque delle componenti). In meccanica quantistica possiamo misurare con precisione arbitraria il modulo del momento angolare di un sistema e la sua proiezione lungo uno degli assi del sistema di riferimento (che nel seguito sarà sempre l’asse z). È possibile ricavare gli autovalori della coppia ˆl2 e ˆlz nonchè le proprietà generali degli autostati dalle sole proprietà di commutazione. L’operatore modulo quadro può essere scritto nella forma ˆl2 = ˆl+ ˆl− + ˆlz (6.13) dove definiamo con ˆl± = ˆlx ± ˆly gli ’operatori scaletta’ che, vedremo, hanno molte interessanti caratteristiche. Il termine ’operatori scaletta’ od ’operatori di spostamento’ dipende dalla loro azione sugli autostati. Per cominciare, diamo le relazioni, facilmente dimostrabili [ˆlz , ˆl± ] = ±ˆl± [ˆl± , ˆl2 ] = 0 (6.14) † = ˆl− ), non commutano fra loro, ma commutano dunque ˆl+ e ˆl− , che sono aggiunti l’uno dell’altro (ˆl+ con ˆl2 . e chiamiamo |a, mi gli autostati (normalizzati) di ˆl2 e ˆlz : ˆl2 |a, mi = a|a, mi ˆlz |a, mi = m|a, mi (6.15) dove a e m numeri per ora arbitrari. Grazie alle relazioni (6.14), si verifica che ˆlz ˆl± |a, mi = (m + ±)|a, mi (6.16) quindi ˆl+ ed ˆl− aumentano o diminuiscono di un’unità gli autovalori di ˆlz . Poichè invece commutano con ˆl2 non hanno effetto sui valori di a. Dalle relazioni precedenti segue che ˆl± |a, mi = c± |a, m ± 1i (6.17) dove c± sono costanti da definirsi. I due operatori di spostamento sono aggiunti l’uno dell’altro; dunque ha, m|ˆl+ ˆl− |a, mi ≥ 0 (dimostratelo) è hermitiano, perciò ha, m|ˆl2 − ˆlz (ˆlz + 1)|a, mi = a − m(m + 1) ≥ 0. Partendo dal valore di attesa di ˆl− ˆl+ otteniamo un’espressione analoga; in definitiva valgono le seguenti disequazioni a − m(m ± 1) ≥ 0 → a ≥ m2 (6.18) Per ogni a abbiamo perciò una valore minimo e massimo di m, che chiamiamo m e m. Poichè per definizione ˆl+ |a, mi = ˆl− |a, mi = 0 e quindi a − m(m + 1) = a − m(m − 1). Segue che il valore massimo e minimo sono legati dalla relazione m2 + m − m(m − 1) = 0, ovvero m = m − 1 (da 82 CAPITOLO 6. I MOMENTI ANGOLARI scartare perchè m ≥ m e m = −m. Chiamiamo l il valore di m, e rinominiamo il genrico ket come |l, mi: ˆl2 |l, mi = l(l + 1)|l, mi ˆlz |l, mi = m|l, mi (6.19) e combinando le relazioni precedenti si ottengono anche i valori espliciti di c± : ˆl± |l, mi = q l(l + 1) − m(m ± 1)|l, m ± 1i (6.20) Applicando ˆl+ ad una generica |l, −li si generano autostati di ˆlz con autovalori −l + 1, −l + 2, . . ., l. Quindi l − (−l) = 2l deve essere un numero intero, cioè l può essere un intero o un multiplo di 1/2. Tutte queste conclusioni sono state tratte partendo dalle sole relazioni di commutazione, senza invocare alcuna forma particolare degli operatori momento angolare. Sono dunque applicabili ad ogni operatore angolare, e proprietà analoghe alle (6.19) e (6.20) valgono anche per gli autostati comuni anche ad operatori che commutino con ˆlz e ˆl2 . 6.3 Forma esplicita del momento angolare orbitale Il momento angolare orbitale può essere posto in forma esplicita in coordinate sferiche x = r cos φ sin θ, y = r sin φ sin θ, z = r cos θ. Dopo aver trasformato le derivate rispetto alle coordinate cartesiane in derivate rispetto alle coordinate sferiche si ottiene Lz = −i L2 = − ∂ (6.21) ∂φ ∂ 1 ∂2 1 ∂ − sin θ 2 2 sin θ ∂θ sin θ ∂φ ∂θ (6.22) 2 si noti che L2 = −M̂ , operatore legendriano, già incontrato durante lo studio del moto di una particella su una sfera. Le autofunzioni di L2 e ˆlz sono dunque le armoniche sferiche, giv̀iste nella medesima occasione L2 Ylm (θ, φ) = l(l + 1)Ylm (θ, φ) (6.23) Lz Ylm (θ, φ) = mYlm (θ, φ) (6.24) con l ≥ 0 intero, e −l ≤ m ≤ l. Le funzioni armoniche sferiche possono essere scritte nella forma v Ylm (θ, φ) = lu u (−1) t (2l + 1)(l − |m|)! |m| Pl (cos θ)eimφ l 2 l! 4π(l + |m|)! (6.25) |m| le funzioni Pl (x) sono dette funzioni associate di legendre di grado l e ordine |m| e sono definibili in funzione dei polinomi di Legendre (vedi Appendice (A)) |m| Pl (x)(1 − x2 )|m|/2 d|m| Pl (x) dx|m| (6.26) 6.4. IL ROTATORE RIGIDO 6.4 83 Il rotatore rigido Il formalismo degli operatori momento angolare trova un’applicazione immediata allo studio degli autostati di un rotatore rigido. Consideriamo due masse m1 e m2 a distanza fissa R. Il sistema ruota intorno al centro di massa, fisso nell’origine del sistema di riferimento. L’energia cinetica classica del sistema é T = ω2 Iω 2 L2 (m1 r12 + m2 r22 ) = = 2 2 2I (6.27) dove ri è la distanza dal centro di massa della massa mi , ed omega è la velocità angolare di rotazione. L’energia cinetica può anche essre scritta in funzione del momento angolare classico, che per questo sistema è semplicemente L = Iω e del momento di inerzia I = m1 r12 + m2 r22 , od anche I = µR2 dove µ = m1 m2 /(m − 1 + m2 ) è la massa ridotta del sistema. L’hamiltoniano del sistema è perciò (usando la forma adimensionale dell’operatore momento angolare) H=− h̄2 2 L 2I (6.28) Le auofunzioni del rotatore sono dunque le armoniche sferiche Ylm (θ, φ) con autovalori El = h̄2 l(l + 1) 2I ogni livello energetico è degenere 2l + 1 perchè corrisponde ai possibili autostati di Lz . (6.29) 84 CAPITOLO 6. I MOMENTI ANGOLARI Capitolo 7 L’equazione di Schrödinger In questa dispensa sarà data un’introduzione schematica alle metodiche di calcolo più comuni per la determinazione di funzioni d’onda elettroniche. Le tecniche di calcolo quanto-meccanico permettono la previsione ed ottimizzazione di geometrie molecolari e lo studio di proprietà molecolari (momento di dipolo, polarizzabilità, densità elettronica etc.) a partire dalla definizione dell’operatore hamiltoniano di una data specie chimica, e dalla soluzione numerica dell’equazione di Schrödinger corrispondente. Tradizionalmente, le tecniche di calcolo vengono classificate in • metodi ab initio: calcoli autoconsistenti di Hartree-Fock (HF), interazione di configurazione (CI); l’equazione di Schrödinger viene risolta in modo ‘esatto’ (mediante un’espansione della funzione d’onda su una base di funzioni note, o mediante l’applicazione di tecniche perturbative); • metodi semiempirici: metodi di Hückel, Hückel esteso, PPP, i vari metodi NDO (neglect of differential overlap); varie approssimazioni e parametrizzazioni sono introdotte per semplificare gli integrale numerici a uno, due o più elettroni che sono definiti nell’approccio esatto. I metodi ab initio consentono una buona definizione del problema quantomeccanico, essendo basati fondamentalmente sull’hamiltoniano esatto del sistema molecolare, e dunque in principio definito solo da informazioni sulla struttura della molecola e di costanti fondamentali. La dimensione del problema di algebra lineare (diagonalizzazione di matrice) correlato ad un calcolo ab initio per un sistema molecolare di N elettroni cresce almeno come N 2 : molecole di media complessità possono già costituire un serio problema computazionale. D’altra parte, i metodi semiempirici sono in grado di trattare in modo veloce ed efficiente anche il calcolo delle strutture di equilibrio di molecole organiche di notevole complessità. Non sempre però l’hamiltoniano approssimato è definito in modo chiaro, nè la parametrizzazione degli integrali elettronici scelta per un determinato metodo semiempirico, in modo da ottimizzarne i risultati per determinate classi di molecole, consente di ottenere buoni risultati in diverse condizioni o per altre classi di sistemi molecolari. 85 86 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER HOMO del pirrolo calcolato con il metodo Extended Hückel (isosuperficie a 0.06 unità atomiche). 7.1 L’equazione di Schrödinger: insieme di punti materiali Consideriamo un insieme di N punti materiali {~ri } nello spazio ordinario cui siano associate le masse inerziali mi (i = 1, . . . , N ). La descrizione del comportamento nello spazio e nel tempo dell’insieme di punti è data in meccanica quantistica tramite la funzione d’onda Ψ({~ri }, t), definita mediante l’equazione di Schrödinger dipendente dal tempo: − h̄ ∂ Ψ({~ri }, t) = HΨ({~ri }, t) i ∂t (7.1) dove H è l’operatore di Hamilton o hamiltoniano, definito come la somma dell’operatore di energia cinetica T e dell’energia potenziale H = T + V ({~ri }) dove T = N X p~2i i=1 2mi (7.2) 7.1. L’EQUAZIONE DI SCHRÖDINGER: INSIEME DI PUNTI MATERIALI 87 L’operatore momento lineare p~i per la particella i-esima è definito come p~i = h̄ ∂ i ∂~ri (7.3) e dunque l’operatore energia cinetica può essere scritto anche nella forma T =− N h̄2 X 1 ˆ2 ∇ 2 i=1 mi i (7.4) 2 ˆ i è l’operatore di Laplace relativo alla particella i-esima. La funzione d’onda è definita quando dove ∇ siano stabilite delle condizioni iniziali, ovvero lo stato del sistema al tempo t = 0 e le condizioni al contorno, ovvero l’integrabilità della funzione d’onda. La soluzione formale dell’equazione di Schrödinger é data nella forma: µ ¶ iHt Ψ({~ri }, t) = exp − Ψ({~ri }, 0) h̄ con la condizione di integrabilità (7.5) Z hΨ|Ψi = d~rΨ({~ri }, t)∗ Ψ({~ri }, t) = 1 (7.6) dove d~r = d~r1 d~r2 . . . d~rN . La funzione d’onda generica è ottenibile come un’espansione rispetto alle autofunzioni dell’hamiltoniano Ψ({~ri }, t) = X exp(−iEn t/h̄)Ψn ({~ri })hΨn ({~ri })|Ψ({~ri }, , 0)i (7.7) n HΨn ({~ri }) = En Ψn ({~ri }) (7.8) L’equazione (7.8) è l’equazione di Schrödinger indipendente dal tempo. Esempio 35. Consideriamo, per fissare le idee, il caso di un sistema di 2 particelle ~r1 e ~r2 , accoppiate da un potenziale V (|~r1 − ~r2 |) L’hamiltoniano è dato nella forma: H=− h̄2 ˆ 2 h̄2 ˆ 2 ∇1 − ∇ + V (|~r1 − ~r2 |) 2m1 2m2 2 L’hamiltoniano è separabile, ovvero è riducibile alla somma di due hamiltoniani non interagenti, introducendo un nuovo set di variabili, date dalla distanza relativa tra le due particelle ~r = ~r1 − ~r2 r2 2~ : e dalla posizione del baricentro del sistema ~rc = m1m~r11 +m +m2 1 ˆ2 1 ˆ2 1 ˆ2 1 ˆ2 ∇1 + ∇2 = ∇ + ∇ m1 m2 µ M c m2 ˆ 2, ∇ ˆ 2 sono i laplaciani dove µ è la massa ridotta µ = mm11+m , M è la massa totale M = m1 + m2 e ∇ c 2 rispetto a ~r e ~rc . L’hamiltoniano risulta separabile poichè si può scrivere come: H=− h̄2 ˆ 2 h̄2 ˆ 2 ∇ + V (r) − ∇ 2µ 2M c 88 7.2 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER Hamiltoniani atomici e molecolari La definizione dell’hamiltoniano completo di un sistema atomico o molecolare non è affatto un problema semplice. Trascurando termini di interazione con campi elettrici e magnetici, che sono peraltro di grande importanza per l’interpretazione di osservabili spettroscopici, ed ignorando correzioni di natura relativistica, restano da considerare in dettaglio i vari termini di interazione elettrostatiche e magnetiche dei nuclei e degli elettroni. Consideriamo prima di tutto alcuni hamiltoniani relativi a sistemi atomici e molecolari semplici: l’atomo H, l’atomo He e la molecola H+ 2 , limitandoci ad includere nell’energia potenziale i soli termini di interazione elettrostatica. ~ di L’atomo di idrogeno, H, è un sistema descritto da due particelle tridimensionali: il nucleo R massa mH e l’elettrone ~re di massa me L’hamiltoniano dell’atomo di idrogeno è dato come: H=− h̄2 ˆ 2 h̄2 ˆ 2 2e2 1 ∇R − ∇e − ~ − ~re | 2mH 2me 4π²0 |R (7.9) ˆ 2e e ∇ ˆ 2R indichiamo il laplaciano rispetto ai vettori ~re e R. ~ I gradi di libertà complessivi del dove con ∇ sistema sono dunque 6. L’atomo di elio, He, è un sistema descritto da tre particelle tridimensionali e 1 |R - r | 1 He |r - r | 1 2 |R - r | 2 r 1 R e2 r 2 Figura 7.1: Sistema di riferimento e coordinate He 7.2. HAMILTONIANI ATOMICI E MOLECOLARI 89 (il nucleo e due elettroni). L’hamiltoniano dell’atomo di elio è dato come: h̄2 ˆ 2 h̄2 ˆ 2 ˆ 2 2e2 (∇1 + ∇2 ) − H=− ∇R − 2mHe 2me 4π²0 à 1 ~ − ~r1 | |R + ! 1 ~ − ~r2 | |R + e2 1 4π²0 |~r1 − ~r2 | (7.10) ˆ 2 indichiamo i laplaciani rispetto a ~r1 e ~r2 . I gradi di libertà complessivi del sistema dove con ∇ 1,2 sono dunque 9. In Fig. 1 viene riportato uno schema delle coordinate nell’ambito di un sistema di riferimento inerziale (di laboratorio). La molecola di idrogeno ionizzata, H+ 2 , è ancora un sistema descritto da tre particelle tridimensionali (due nuclei e un elettrone). L’hamiltoniano è dato come: ´ h̄2 ˆ 2 e2 h̄2 ³ ˆ 2 2 ˆ H=− ∇A + ∇B − ∇e − 2mH 2me 4π²0 à 1 ~ A − ~re | |R + 1 ~ B − ~re | |R ! + e2 1 ~ ~ A| 4π²0 |RB − R (7.11) ~ A ed R ~ B indichiamo la posizione dei nuclei, con ~re quella dell’elettrone. I gradi di libertà dove con R complessivi del sistema sono sempre 9. Definiamo ora con un certo grado di generalità l’hamiltoniano, limitato ai soli termini di in~ p (p = 1, . . . , M ) i terazione elettrostatica, per una molecola di M nuclei ed N elettroni. Siano R vettori posizione dei nuclei e ~ri (i = 1, . . . , N ) i vettori posizione degli elettroni. L’hamiltoniano molecolare non-relativistico con i soli termini elettrostatici è allora scritto come: M N X X X Zp Zq 1 Zp h̄2 X 1 ˆ 2 h̄2 X e2 M,M e2 N,N e2 M,N 2 ˆ H=− ∇p − ∇i + + − (7.12) ~ ~ ~ 2 p=1 mp 2me i=1 4π²0 p<q |Rp − Rq | 4π²0 i<j |~ri − ~rj | 4π²0 p,i |Rp − ~ri | È conveniente nel seguito introdurre un insieme di unità di misura ad hoc, dette unità atomiche, che permettano di definire grandezze fisiche riscalate in modo semplice. Nella Tabella 1 sono definite le principali unità atomiche: di particolare importanza sono l’unità di lunghezza, detta Bohr, e l’unità di energia, chiamata Hartree. Nel seguito si useranno sempre unità atomiche, se non massa lunghezza momento angolare energia carica mu lu Lu Eu e me = 9.1091 × 10−31 Kg 2 0 h̄ a0 = 4π² = 0.52917 × 10−10 m me e2 h̄ = 4.16336 × 10−33 J s−1 e2 = 4.359 × 10−18 J 4π²0 a0 e = 1.602 × 10−19 C Tabella 7.1: Unità atomiche verrà espressamente indicato altrimenti. L’hamiltoniano molecolare elettrostatico in unità atomiche diventa: M,N N M N X X X Zr 1 Zp Zq 1 ˆ2 1 X 2 ˆ ∇p − + + . H=− ∇i − ~ ~p − R ~ q| 2 i=1 ri | i<j |~ri − ~rj | p<q |R p=1 2mp p,i |Rp − ~ M X (7.13) 90 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER Indichiamo per semplicità con gli indici i, j coordinate elettroniche, con gli indici p, q coordinate nucleari. Esempio 36. Vogliamo scrivere l’hamiltoniano molecolare per un sistema con nuclei a spin nullo, non-relativistico ed in assenza di interazioni con campi esterni. L’hamiltoniano molecolare si può descrivere in prima approssimazione come dato da tre termini principali H = H0 + HSO + HSS Il primo contributo è dato dall’operatore relativo all’energia cinetica + elettrostatica (7.13). Il secondo contributo corrisponde al termine di interazione spin-orbitale, vale a dire tra il momento di spin (vedi Capitolo 8) di ciascun elettrone e il moto spaziale dell’elettrone stesso HSO = −gβe2 X 1 i6=j 3 rij ˆ j + sj · rij × ∇ ˆ j) (2si · rij × ∇ Il terzo termine è riferito all’energia di interazione spin-spin X 1 1 2 HSS = − gβe2 [3(si · rij )(sj · rij ) − rij si · sj ] 5 2 r i,j ij Parecchi termini di interazione al secondo ordine sono stati trascurati nella definizione (7.2). I nuclei sono considerati come aventi momento di spin nullo. Nei calcoli di strutture elettroniche si considera di solito solo il primo termine. 7.3 Approssimazione di Born-Oppenheimer Il primo problema che ci poniamo è la possibilità di separazione tra le coordinate nucleari ed elettroniche. Fisicamente, la massa dei nuclei, molto maggiore rispetto a quella degli elettroni, ci consente di affermare che il moto dei primi avviene su una scala dei tempi molto più lenta rispetto al moto dei secondi. Ciò equivale al fatto che, con buona approssimazione, le proprietà degli elettroni possono essere definite assumendo che lo ‘scheletro’ della molecola, formato dai nuclei, sia immobile. Fondamentalmente, questa è l’approssimazione di Born-Oppenheimer (BO). Consideriamo prima di tutto il problema della separazione del moto del centro di massa, che è conseguibile in modo esatto. È dato un sistema di N elettroni ed M nuclei. L’hamiltoniano molecolare è dato in (7.13). Definiamo il vettore baricentro N M X X ~ p ~ c = 1 me~ri + mp R R M i=1 p=1 (7.14) dove M è la massa totale del sistema; definiamo inoltre N coordinate vettoriali ~xi che specificano la posizione degli elettroni rispetto al baricentro dei soli nuclei ed infine 3M − 3 coordinate ’interne’ QI (con I = 1, . . . , 3M − 3) per i nuclei, che descrivono il moto rotazionale e vibrazionale della 7.4. SEPARAZIONE DELLE COORDINATE ELETTRONICHE 91 molecola e che si possono esprimere, per esempio [cfr. Appendice (C)] come combinazioni lineari delle coordinate vettoriali dei nuclei. In pratica siamo esattamente nelle condizioni descritte in Appendice (C) dove gli elettroni sono le particelle leggere e i nuclei le particelle pesanti. Usiamo le conclusioni che sono tratte in Appendice (C) per scrivere l’hamiltoniano nelle forma H = Hc + Hel + Hnu (7.15) dove l’hamiltoniano relativo al centro di massa è Hc = − 1 ˆ2 ∇ 2M c (7.16) l’hamiltoniano elettronico è M,N N N M X X X 2 1X 1 Xˆ ˆ 1 Zp Zp Zq ˆ Hel = − ∇i − ∇i · ∇j + − + ~ ~ ~ q| 2 i 2M ij ri − ~rj | ri | p<q |Rp − R i<j |~ p,i |Rp − ~ (7.17) ed infine il termine nucleare è Hnu = T nu (7.18) dove le coordinate vettoriali elettroniche sono definite relativamente al baricentro; la forma esatta dell’energia cinetica nucleare T nu dipende dalla scelta delle coordinate interne QI nucleari; le com~ p −~ri etc. sono funzioni di dette coordinate interne e dei vettori ~xi . Indichiamo ponenti dei vettori R ˆ i il gradiente relativo a ~xi e cosı́ via. Il primo contributo Hc è relativo al moto traslazionale con ∇ del baricentro. Il secondo termine è dato dalla somma dell’energia cinetica elettronica, corretta con un termine dipendente dall’inverso della massa totale del sistema detto di polarizzazione di massa, e dell’energia potenziale elettroni-elettroni ed elettroni-nuclei. Il terzo termine descrive il moto nucleare roto-vibrazionale. Si noti che l’energia potenziale nucleare è stata inclusa nell’hamiltoniano elettronico, per convenzione. 7.4 Separazione delle coordinate elettroniche Nel seguito indichiamo con Q l’insieme di coordinate nucleari interne e con x l’insieme delle coordinate elettroniche. L’equazione di Schrödinger indipendente dal tempo per l’hamiltoniano elettronico-nucleare, in cui d’ora in poi non includiamo il termine, separato, relativo al moto del baricentro, è scritta nella forma: HΞ(Q, x) = EΞ(Q, x) dove Ξ(Q, x) è l’autofunzione roto-vibro-elettronica della molecola con energia E. l’insieme di autofunzioni del solo hamiltoniano elettronico Hel Ψ(Q|x) = ²n (Q)Ψ(Q|x) (7.19) Definiamo (7.20) 92 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER che dipendono parametricamente dalle coordinate nucleari Q, con autovalori ²n (Q). Le autofunzioni Ψn costituiscono una base ortonormale per lo spazio di Hilbert in x. Il seguente sviluppo è perciò del tutto generale: Ξ(Q, x) = X Φn (Q)Ψn (Q|x) (7.21) n Sostituendo le equazioni (7.20) e (7.21) nella (7.19), si ottiene: X n [Enel (Q) + T nu − E]Φn (Q)Ψn (Q|x) = 0 (7.22) pre-moltiplicando per il bra hΨm (Q|r)| si trova l’espressione el [Em (Q) − E]Φm (Q) + X hΨm |T nu |Ψn iΦn (Q) = 0 (7.23) n che fornisce un sistema di equazioni per determinare le funzioni incognite Φn (Q). Si noti che l’integrazione hldotsi è rispetto a x. Sinora non è stata fatta alcuna approssimazione, e l’equazione (7.23) è equivalente all’equazione di Schrödinger di partenza. Si danno ora varie possibilità. Dal punto di vista fisico è lecito attendersi che ad ogni significativo cambiamento della configurazione nucleare gli elettroni vadano incontro ad un rapido riaggiustamento, in una scala dei tempi molto più veloce di quella tipica dei moti nucleari a causa della grande differenza di massa. È quindi ragionevole attendersi che la dipendenza parametrica delle funzioni d’onda elettroniche Ψn (Q|x) sia ’debole’, ed addirittura trascurabile in prima approssimazione. L’approssimazione di Born-Oppenheimer consiste nel trascurare completamente questa dipendenza, cosicchè il valor medio (in generale un’operatore agente sulle coordinate nucleari) che compare nel secondo termine della (7.23) diventa: B.O. hΨm |T nu |Ψn i = hΨm |Ψn iT nu = T nu δm,n (7.24) La funzione d’onda per la parte nucleare nell’approssimazione BO è data quindi come: el [Em (Q) + T nu ]Φm (Q) = EΦm (Q) (7.25) • L’equazione (7.20) è alla base dell’interpretazione delle osservazioni sperimentali basate sulla spettroscopia elettronica (UV, visibile); • l’equazione (7.25) è utilizzata per la comprensione delle osservazioni sperimentali basate sulla spettroscopia vibrazionale (IR); • l’approssimazione di Born-Oppenheimer non può essere impiegata per interpretare quei fenomeni chimico-fisici in cui vi siano interazioni forti fra elettroni e nuclei (es. scattering elettronico), o quando in generale non sia lecito considerare la funzione d’onda elettronica come debolmente dipendente dalle coordinate nucleari. 7.5. LA MOLECOLA DI IDROGENO IONIZZATA: HAMILTONIANO ELETTRONICO 7.5 93 La molecola di idrogeno ionizzata: Hamiltoniano elettronico Considereremo in questa sezione il sistema molecolare H+ 2 . Seguiamo le considerazioni generali svolte nella sezione precedente, separando il baricentro, applicando l’approssimazione di BornOppenheimer, trascurando i termini di polarizzazione di massa nell’hamiltoniano elettronico, definendo appropriate coordinate interne nucleari - che possiamo scegliere in modo conveniente come ~A − R ~ B |, θ e φ le coordinate polari del vettore R, θ and φ dove R è la distanza internucleare |R ~A − R ~ B . L’hamiltoniano elettronico è perciò R 1 1 1 ˆ2 1 − + Hel = − ∇ − (7.26) 2 rA rB R dove rA = q r2 + (z + R/2)2 e rB = q r2 + (z − R/2)2 [cfr. Fig. (7.2)]. Gli autostati e i livelli e2 A rA +R/2 rB z y e1 -R/2 x B e3 Figura 7.2: Sistema di riferimento e coordinate H+ 2 energetici della molecola di idrogeno ionizzata saranno in generale funzioni parametriche di R. Per R → 0 la molecola diviene l’atomo di elio ionizzato, ed i suoi orbitali e stati energetici sono quelli di un atomo idrogenoide con Z = 2. Per R → ∞ la molecola diviene equivalente alla coppia H + + H. Scriviamo l’equazione di Schrödinger nella forma µ ¶ 1 ˆ2 1 1 − ∇ − − Ψ = EΨ (7.27) 2 rA rB 94 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER L’energia di un autostato elettronico è data in funzione dell’autovalore E come 1 R E el = E + (7.28) Introduciamo le coordinate ellissoidali µ, ν e l’angolo azimutale φ relativo alla rotazione intorno all’asse internucleare; valgono le relazioni dirette ed inverse: µ = rA + rB /R ν = q rA − rB /R 2 (µ − 1)(1 − ν 2 )/R cos φ x = y z = = (7.29) q (µ2 − 1)(1 − ν 2 )/R sin φ µνR/2 con µ ≥ 1, −1 ≤ ν ≤ 1; µ descrive gli ellissoidi di rivoluzione aventi come fuochi i nuclei, mentre ν descrive gli iperboloidi confocali di rivoluzione [cfr. Fig. (7.3)]. Il laplaciano può essere espresso in ν µ 00 11 00 11 00111111111111111111 11 111 000 000000000000000000 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 111 000000000000000000 111111111111111111 000 000000000000000000 111111111111111111 A111 000 111 0000000000000000001 111111111111111111 11111111111111111111 00000000000000000000 0 1 0 0 1 0 1 B Figura 7.3: Coordinate ellissoidali H+ 2 queste coordinate nella forma: ∂ 2 ∂ ∂ ∂ ∂ (µ2 − ν 2 ) 4 2 ∂ ˆ = (µ − 1) + (1 − ν ) + ∇ 2 2 2 2 2 R (µ − ν ) ∂µ ∂µ ∂ν ∂ν ∂φ (µ − 1)(1 − ν ) ∂φ 2 (7.30) 7.5. LA MOLECOLA DI IDROGENO IONIZZATA: HAMILTONIANO ELETTRONICO 95 Sostituendo nell’equazione di Schrödinger, si ottiene un’equazione differenziale separabile, cioè ponendo Ψ(µ, ν, φ) = M (µ)N (ν)F (φ) (7.31) si trovano le tre equazioni separate: d dµ (µ2 − 1) d dµ − ²µ2 + 2Rµ − 2 λ + κ M (µ) = 0 −1 ν2 λ2 2 2 − κ N (ν) = 0 (1 − ν ) + ²ν + 1 − ν2 dν dν d d d2 2 dφ (7.32) (7.33) + λ2 F (φ) = 0 (7.34) λ e κ sono costanti di separazione, mentre ² = −R2 E/2. In particolare, λ è il numero quantico associato con la componente del momento angolare elettronico lungo l’asse internucleare, ed assume i valori 0, ±1, ±2, . . .. L’autovalore E dipende da λ2 , ovvero è presente una doppia degenerazione Figura 7.4: I primi due livelli energetici della molecola di H+ 2 [E. Teller, Z. Physik, 61, 474 (1930)] dovuta all’equivalenza delle due direzioni di rotazione attorno all’asse. I valori permessi di κ e ² sono determinabili numericamente. In generale i vari stati, doppiamente degeneri, di H+ 2 sono simboleggiati da una notazione del tipo nlαu,g dove: n ed l sono riferiti ai numeri quantici dell’orbitale atomico idrogenoide, cfr. Appendice (B), cui l’orbitale molecolare tende per R → 0; α è un una lettera greca σ, π, δ, φ, . . . corrispondente a |λ| = 0, 1, 2, 3, . . .; u o g corrispondono alla simmetria dell’orbitale molecolare rispetto all’operazione di inversione rispetto al punto centrale tra i nuclei si può dimostrare che l’orbitale molecolare cambia di segno (u) o resta invariato (g) rispetto questa operazione di simmetria. 96 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER MMMMOOOOLLLLDDDDEEEENNNN MMMOOOLLLDDDEEENNN defaults used Edge = 2.40 Contour 3D Psi = 1 CONTOUR VALUE 1 2 3 4 5 6 7 8 9 10 11 12 13 0.12500 0.15000 0.17500 0.20000 0.22500 0.25000 0.27500 0.30000 0.32500 0.35000 0.37500 0.40000 0.42500 Figura 7.5: Superficie che rappresenta l’orbitale 1sσg in un piano molecolare 7.6 Hamiltoniano nucleare Possiamo scrivere l’hamiltoniano risultante dall’approssimazione di Born-Oppenheimer nella seguente forma, in cui il laplaciano è espresso in coordinate rotazionali: 1 ∂ 2 ∂ − R − L2 + E el (R) Φ(R, θ, φ) = EΦ(R, θ, φ) mH R2 ∂R ∂R (7.35) dove L è l’operatore di momento angolare del sistema nucleare. Le coordinate angolari sono separabili e dunque la funzione d’onda è fattorizzata in una parte radiale (vibrazionale), ed in una parte rotazionale: Φ(R, θ, φ) = S(R)YJK (θ, φ) (7.36) 7.6. HAMILTONIANO NUCLEARE 97 MMMMOOOOLLLLDDDDEEEENNNN MMMOOOLLLDDDEEENNN defaults used Edge = 2.40 Contour 3D Psi = 2 CONTOUR VALUE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ............ 0.00000 0.02500 0.05000 0.07500 0.10000 0.12500 0.15000 0.17500 0.20000 0.22500 0.25000 0.27500 0.30000 0.32500 0.35000 -0.02500 -0.05000 -0.07500 -0.10000 -0.12500 -0.15000 -0.17500 -0.20000 -0.22500 -0.25000 Figura 7.6: Superficie che rappresenta l’orbitale 2pσu in un piano molecolare dove YJK è la generica armonica sferica L2 YJK (θ, φ) = J(J + 1)YJK (θ, φ) (7.37) dove L2 = −M2 in unità atomiche e la parte radiale è data dall’equazione d d 2 2 el R + mR [E − E (R)] − J(J + 1) S(R) = 0 dR dR (7.38) che può essere risolta per via numerica od anche analitica, se si assume una particolare forma funzionale per E el (R) che ne approssimi l’andamento. Consideriamo per esempio lo stato elettronico 1sσg ed approssimiamolo con un potenziale di Morse E el (R) = D{1 − exp[−β(R − Re )]} (7.39) 98 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER dove D, β ed Re sono costanti opportune. I livelli energetici rotovibrazionali sono calcolabili in modo esatto e risultano essere: µ ¶ µ µ ¶ ¶ 1 1 1 2 + b0 J(J + 1) − b1 J 2 (J + 1)2 − c n + E = a0 n + − a1 n + J(J + 1) (7.40) 2 2 2 dove Il primo termine ha la forma di un oscillatore armonico, il secondo è una correzione anarmonica, il terzo un contributo di tipo rotatore rigido, il quarto la correzione di moto centrifugo, il quinto l’accoppiamento tra moto vibrazionale (numero quantico n) e rotazionale (numero quantico J). 7.7 Soluzione approssimata della struttura elettronica Come vedremo nelle sezioni successive, lo studio di sistemi a molti elettroni dovrà tenere presente gli stati di spin e sarà necessario rispettare il principio di esclusione di Pauli per descrivere la natura fermionica degli elettroni. Nel caso della molecola di idrogeno ionizzata possiamo però adottare un approccio semplice dato che un solo elettrone è presente nel sistema. Seguiamo la metodogia illustrata nell’Appendice (D) ed introduciamo una base di sole due funzioni, 1sA (~r) e 1sB (~r), rispettivamente il primo orbitale idrogenoide centrato sul nucleo A ed il primo orbitale idrogenoide centrato sul nucleo B. Il calcolo della matrice rappresentativa dell’hamiltoniano (7.26) e della matrice di overlap portano alla semplice equazione secolare ¯ ¯ ¯ a + 1/R − E ¯ ¯ ¯ b + s/R − ES b + s/R − Es a + 1/R − E ¯ ¯ ¯ ¯=0 ¯ ¯ (7.41) dove a è l’elemento di matrice dell’hamiltoniano elettronico a meno del termine 1/R rispetto a 1sA (~r), b è l’elemento di matrice dell’hamiltoniano elettronico a meno del termine 1/R rispetto a 1sB (~r), s è l’elemento di matrice di overlap tra le due funzioni, che sono normalizzate ma non ortogonali: −2R a = − 12 + e−2R + e R −1 < 0 b = − 2s + e−R (1 + R)´ < 0 ³ 2 s = e−R 1 + R + R3 > 0 (7.42) Risolvendo si trovano le seguenti espressioni for i due autovalori E1 < E2 e relativi autostati Stato fondamentale E1 = 1 a+b + 1+s R 1 Ψ1 = q (1sA + 1sB ) 2(1 + s) (7.43) 1 Ψ1 = q (1sA − 1sB ) 2(1 + s) (7.44) Stato eccitato E2 = a−b 1 + 1−s R 7.7. SOLUZIONE APPROSSIMATA DELLA STRUTTURA ELETTRONICA 99 La scelta della base utilizzata per il calcolo approssimato dei primi due stati elettronici della molecola di idrogeno ionizzata è stata effettuata in base al comportamento al limite di R → ∞ della molecola, cioè assumendo che sostanzialmente gli orbitali molecolari siano ottenibili come combinazioni lineari degli orbitali atomici idrogenoidi centrati sui nuclei (metodo LCAO, Linear Combination of Atomic Orbitals). 100 CAPITOLO 7. L’EQUAZIONE DI SCHRÖDINGER Capitolo 8 Funzioni d’onda 8.1 Stati di spin Ad ogni particella è associato un momento di spin. La definizione completa dello coordinate di una particella deve includere dunque anche la descrizione del suo stato di spin. La giustificazione formale delle proprietà di spin richiede una formulazione della meccanica quantistica in modo che sia consistente con la teoria della relatività ristretta. Il problema, affrontato da P.A.M. Dirac, conduce alla definizione in modo non arbitrario di una proprietà assimilabile ad un momento an~ Le componenti dell’operatore di spin golare, che è descritta dall’operatore (vettoriale) di spin S. (Sx , Sy , Sz ) obbediscono alle consuete regole di commutazione delle componenti di un operatore momento angolare generico: [Sx , Sy ] [Sz , Sx ] [Sy , Sz ] [S 2 , Sx ] = iSz = iSy = iSx 2 = [S , Sy ] = [S 2 , Sz ] = 0 (8.1) Le autofunzioni dell’operatore di momento di spin sono ottenibili come: S 2 |S, MS i = S(S + 1)|S, MS i Sz |S, MS i = MS |S, MS i (8.2) con −S ≤ MS ≤ S Le autofunzioni dell’operatore di spin sono ortonormali. Per esempio, Per S = 1/2 sono permessi i valori MS = ±1/2 : MS = +1/2 MS = −1/2 |αi = |1/2, +1/2i |βi = |1/2, −1/2i (8.3) Le pseudo-coordinate di una particella avente spin S = 1/2 saranno quindi completamente definite solo dopo aver specificato le coordinate spaziali (x, y, z) e il numero quantico di spin MS che può essere 1/2 (stato α) o −1/2 (stato β). 101 102 8.2 CAPITOLO 8. FUNZIONI D’ONDA Principio di indistinguibilità Se una proprietà misurabile dipende dalle coordinate di un’insieme di particelle indistinguibili, ogni misura di detta proprietà deve essere indifferente al tipo di classificazione delle particelle. Consideriamo per semplicità il caso di due sole particelle indistinguibili il cui stato sia descritto da una determinata funzione d’onda Ψ. Se definiamo: • la probabilità di trovare 1 in q1 e 2 in q2 : |Ψ[q1 (1), q2 (2)]|2 dq1 dq2 ; • la probabilità di trovare 1 in q2 e 2 in q1 : |Ψ[q2 (1), q1 (2)]|2 dq1 dq2 ; ne consegue che le due probabilità devono essere uguali: |Ψ[q1 (1), q2 (2)]|2 = |Ψ[q2 (1), q1 (2)]|2 (8.4) Quindi, poiche’ si puo’ sempre scegliere una funzione d’onda in modo che sia reale (almeno in assenza di campi vettoriali, come un campo magnetico esterno), la funzione d’onda può solo cambiare di segno quando le coordinate delle due particelle siano scambiate fra loro: Ψ[q1 (1), q2 (2)] = ±Ψ[q2 (1), q1 (2)] (8.5) In generale, vale la seguente classificazione: • Tutte le particelle con momenti di spin multipli dispari di 1/2 sono descritti da funzioni d’onda antisimmetriche; p. es.: elettrone, protone, neutrone, 32 He2+ (e i nuclei a numero di massa dispari). Tali particelle sono dette FERMIONI e seguono la statistica di Fermi-Dirac. • Tutte le particelle con momenti di spin multipli pari di 1/2 sono descritti da funzioni d’onda simmetriche; p. es.: fotone (S = 1), deuterone (S = 1), 42 He2+ (e i nuclei a numero di massa pari). Tali particelle sono dette BOSONI e seguono la statistica di Bose-Einstein. Gli elettroni sono fermioni con S = 1/2 e di conseguenza la funzione d’onda elettronica di una molecola deve essere una funzione antisimmetrica rispetto allo scambio di coordinate tra due elettroni qualunque (principio di Pauli). In generale data una collezione di bosoni indistinguibili rappresentata dalla funzione d’onda Ψbosoni , se si definisce con P un generico operatore di permutazione (che opera un certo numero di scambi tra le coordinate delle particelle, argomenti della funzione d’onda), vale che PΨbosoni = Ψbosoni (8.6) 8.3. DETERMINANTI DI SLATER 103 cioè la funzione d’onda non cambia. Se è data invece una collezione di fermioni indistinguibili, con funzione d’onda Ψfermioni , gli scambi di coordinate portano ad un possibile cambio di segno della funzione d’onda: PΨfermioni = (−)P Ψfermioni (8.7) dove (−1)P indica la parità della permutazione P. 8.3 Determinanti di Slater È data una base completa ortonormale di funzioni delle coordinate spaziali di un elettrone φj (~r), detti anche orbitali. Le proprietà di spin dell’elettrone sono descritte dalla base |mi, con m = ±1/2. Il prodotto diretto della base di orbitali e di stati spin costituisce una base completa per l’elettrone, che definiamo spin-orbitali. Un generico spin-orbitale è Sk (q) = φj (~r)|mi dove k indica la coppia j, m e q indica le pseudo-coordinate (spaziali e di spin) dell’elettrone. La base di spinorbitali è ortonormale: Z [Sk |Sk0 ] = dqSk (q)∗ Sk0 (q) = hφj |φj 0 ihm|m0 i = δj,j 0 δm,m0 = δk,k0 (8.8) dove indichiamo con [. . .] l’integrazione in q. Una funzione d’onda elettronica è perciò sempre rappresentabile come una combinazione lineare di spin-orbitali: Ψ= X ck Sk (q) (8.9) k In un sistema multi-elettronico, sia Sk (n) un generico spin orbitale relativo all’elettrone n, cioè avente come argomento le pseudo-coordinate qn . Una funzione di N elettroni può essere scritta come il prodotto delle N funzioni spin-orbitaliche: ΨHartree = N Y Sk (k) (8.10) k=1 La funzione precedente è chiamata prodotto di Hartree e non può rappresentare un insieme di fermioni, poichè non verifica la (8.7). La costruzione di una funzione d’onda a N elettroni, simmetrizzata, si può ottenere sotto forma di determinante di una matrice di funzioni N × N : ¯ ¯ S (1) S (1) ¯ 1 2 ¯ ¯ 1 ¯ S1 (2) S2 (2) Ψ= √ ¯ ... N ! ¯¯ . . . ¯ ¯ S1 (N ) S2 (N ) . . . SN (1) . . . SN (2) ... ... . . . SN (N ) ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ (8.11) La funzione d’onda è detta determinante di Slater. La proprietà (8.7) è infatti verificata osservando che dalla definizione di determinante risulta: 1 X (−1)P PΨHartree (8.12) Ψ= √ N! P 104 CAPITOLO 8. FUNZIONI D’ONDA Esempio 37. Verifichiamo che la funzione d’onda soddisfi la (8.7). Le permutazioni costituiscono un gruppo, quindi date due permutazioni P0 e P, P0 P è un’altra permutazione e la sua parità è (−1)P0 +P = (−1)P0 (−1)P . Quindi: X 1 X 0 (−1)P P0 PΨHartree = (−1)P0 (−1)P P 0 ΨHartree = (−1)P0 Ψ P0 Ψ = √ N! P P0 Il principio di esclusione di Pauli è implicito nella definizione della funzione d’onda multielettronica det Ψ, poichè questa vale zero se 2 elettroni sono rappresentati dallo stesso spin-orbitale (infatti un determinante con due colonne uguali è zero) e cambia di segno se due elettroni scambiano la loro posizione (infatti un determinante cambia di segno se si scambiano due righe). In letteratura sono utilizzate di frequente le notazioni alternative: • Ψ ≡ |S1 S2 . . . SN | • φi (j) ≡ φi (j)α(j) • φi (j) ≡ φi (j)β(j). Una configurazione in cui gli elettroni hanno tutti gli spin accoppiati deve essere necessariamente una autofunzione di S 2 con spin 0 (singoletto) S 2Ψ = 0 (8.13) e può essere scritta a partire da N funzioni d’onda monoelettronica sotto forma del seguente determinante di Slater: Ψ = |φ1 φ1 φ2 φ2 . . . φN −1 φN −1 φN φN | (8.14) Il determinante di Slater è ottenuto dal prodotto di Hartree applicando l’operatore di antisimmetria: Ψ = AΨHartree (8.15) dove 1 X A= √ (−1)P P N! P (8.16) Nel seguito di questa sezione, consideriamo alcune proprietà degli operatori permutazione, dell’operatore A e dei determinanti di Slater, che ci saranno utili nel seguito. P è unitario. Ovvero P † = P −1 . Rappresentiamo con q l’insieme delle coordinate elettroniche. Applicando P ad una generica funzione multielettronica Ψ(q), sostituiamo a q un set di coordinate scambiate: PΨ(q) = Ψ(q0 ) (8.17) 8.3. DETERMINANTI DI SLATER 105 Vale anche, per definizione, che Ψ(q) = P −1 Ψ(q0 ) (8.18) Se consideriamo ora la definizione di aggiunto di P, si ha che hPΨq (q)|Ψ2 (q)i = hΨ1 (q)|P † |Ψ2 (q)i (8.19) ed applicando (8.17) al ket e (8.18) al bra del primo membro si ha hPΨq (q)|Ψ2 (q)i = hΨq (q)|P −1 |Ψ2 (q)i (8.20) quindi P † = P −1 . A è hermitiano. Infatti: 1 X 1 X 1 X A† = √ (−1)P P † = √ (−1)P P −1 = √ (−1)−P P −1 = A N! P N! P N ! −P (8.21) A2 è proporzionale a A. Sviluppando il quadrato si ottiene: A2 X 1 X 1 XX (−1)Pi +Pj Pi Pj = (−1)Pi Pi (−1)Pj Pj = N ! Pi N ! Pi Pj Pj √ X 1 = (−1)pk Pk = N !A N ! Pk (8.22) Commutazione. Dato un’operatore O simmetrico rispetto ad uno scambio di coordinate, vale naturalmente che [O, P] = 0 → [O, A] = 0 (8.23) Ortonormalità. I determinanti di Slater sono ortonormali. infatti: hΨ|Ψ0 i = hAΨHartree |AΨ0Hartree i = hΨHartree |A2 |Ψ0Hartree i = √ N !hΨHartree |A|Ψ0Hartree i (8.24) da cui segue che hΨ|Ψ0 i = hΨHartree | P P 0 P (−1) P|ΨHartree i = hΨHartree |Ψ0Hartree i = δΨ,Ψ0 (8.25) 106 CAPITOLO 8. FUNZIONI D’ONDA Invarianza. I determinanti di Slater sono invarianti rispetto ad una trasformazione unitaria degli spinorbitali. Sia U una matrice N × N unitaria, tale cioè che U† = U−1 , il che implica | det U|2 = 1. Una trasformazione unitaria degli spinorbitali conserva l’ortonormalità Si0 = X Sj Uji → [Si0 |Si00 ] = j X Uji∗ Uj 0 i0 [Sj |Sj 0 ] = (U† U)ii0 = δi,i0 (8.26) j,j 0 Se indichiamo con Ψ0 il determinante di Slater costruito con gli spinorbitali Si0 , abbiamo che ¯ ¯ S 0 (1) S 0 (1) ¯ 1 2 ¯ ¯ S 0 (2) S 0 (2) 1 ¯ 2 Ψ0 = √ ¯ 1 ¯ ... N! ¯ . . . ¯ 0 ¯ S (N ) S 0 (N ) 1 2 0 (1) . . . SN 0 . . . SN (2) ... ... 0 . . . SN (N ) ¯ ¯ ¯ ¯ S (1) S (1) ¯ ¯ 1 2 ¯ ¯ ¯ ¯ 1 ¯ S1 (2) S2 (2) ¯ ¯= √ ¯ ¯ ... N ! ¯¯ . . . ¯ ¯ ¯ ¯ ¯ S1 (N ) S2 (N ) . . . SN (1) . . . SN (2) ... ... . . . SN (N ) ¯ ¯ ¯ ¯ ¯ ¯ ¯ det U(8.27) ¯ ¯ ¯ ¯ vale a dire Ψ0 = Ψ det U = Ψ exp(iφ), cioè il nuovo determinante di Slater differisce dal vecchio solo per un fattore di fase, che è ininfluente nel calcolo dei valori di attesa. Capitolo 9 Metodi ab-initio 9.1 Metodo di Hartree-Fock L’approssimazione di Hartree-Fock è alla base del più usato metodo di calcolo ab initio per strutture elettroniche molecolari. Deve perciò essere chiaro che si tratta di una approssimazione appunto, e non di un metodo esatto di risoluzione dell’equazione di Schrödinger elettronica, ed ha per fine la determinazione dello stato fondamentale di un sistema di elettroni. Considereremo dunque una molecola di N elettroni. L’hamiltoniano elettronico in unità atomiche è: N X X 1 |~rn − ~rn0 | (9.1) X Zk 1 ĥ(n) = − ∇2n − ~ k| 2 rn − R k |~ (9.2) H= n=1 ĥ(n) + n6=n0 dove l’hamiltoniano monoelettronico di “core” di ciascun elettrone è relativo all’energia cinetica e di interazione con i nuclei. L’approssimazione di Hartree consiste nell’identificare la funzione d’onda multielettronica (autofunzione dell’hamiltoniano elettronico) come il prodotto di Hartree di N funzioni d’onda monoelettroniche. Evidentemente, l’approssimazione di Hartree agisce a due livelli 1. si assume una forma di funzione d’onda compatibile solo con un hamiltoniano separabile dei N elettroni; 2. si trascura il principio di indistinguibilità e dunque non si applica il principio di Pauli. L’approssimazione di Hartree-Fock (HF) consiste nell’obbligare la funzione d’onda ad obbedire al principio di Pauli, assumendo che la sua forma non sia un prodotto di Hartree, bensı̀ un determinante di Slater: cioè che sia data dall’equazione (8.3). Resta l’approssimazione fondamentale: una funzione 107 108 CAPITOLO 9. METODI AB-INITIO d’onda multielettronica è approssimata da una somma finita di prodotti di funzioni monoelettroniche. Il problema è a questo punto formulabile nel modo seguente: nell’ambito dell’approssimazione HF, quali sono le funzioni monoelettroniche spaziali e di spin (spinorbitali) S1 , . . . , SN che assicurino che l’energia totale della molecola sia più vicina a quella esatta? Allo scopo di determinare i migliori1 spinorbitali Si si impiega il principio variazionale: il valore di attesa dell’hamiltoniano rispetto ad una funzione d’onda arbitraria è sempre maggiore del primo autovalore del sistema. Vale a dire che se si calcola il valore di attesa (la media) dell’hamiltoniano elettronico rispetto al determinante di Slater, si ottiene una valore numerico che è sempre maggiore dell’energia esatta del sistema multi-elettronico. È chiaro perciò che i migliori orbitali si possono ottenere cercandone la forma che rende minimo, e perciò più vicino al valore esatto, il valore di attesa. 9.2 Ottimizzazione degli spinorbitali 2 Definiamo un algoritmo di calcolo degli spinorbitali che descrivono lo stato fondamentale Ψ0 = Ψ, dove Ψ è il determinante di Slater (8.3) per una molecola di N elettroni secondo l’approssimazione HF. È dato il valore di attesa dell’hamiltoniano rispetto al determinante di Slater: E = hΨ|H|Ψi (9.3) Assumiamo che gli N spinorbitali S1 , . . . , SN siano ortonormali; diciamo VHF il sottospazio generato dalla base S1 , . . . , SN ; per una variazione infinitesimale di ciascun spinorbitale Si0 = Si + δSi (9.4) possiamo costruire lo spinorbitale 0 Ψ0 = |S10 S20 . . . SN | (9.5) P e limitando lo sviluppo ai soli termini al primo ordine si ottiene Ψ0 = Ψ + i δΨi dove δΨi = |S1 . . . δSi SN |. Se le variazioni δSi sono ortogonali allo spazio VHF risulta che la variazione al primo ordine del valore di attesa dell’hamiltoniano rispetto al determinante di Slater è data da δE = X hδΨi |H|Ψi + hΨ|H|δΨi i (9.6) i Possiamo perciò affermare che la variazione infinitesimale δE è nulla al primo ordine (cioè E è minimo) se sono indipendentemente nulli i seguenti integrali hδΨi |H|Ψi = 0 1 (9.7) Nel senso appena definito: tali che ottimizzano il calcolo dell’energia elettronica dello stato fondamentale della molecola nell’approssimazione di Hartree-Fock, cioè rappresentando lo stato fondamentale stesso mediante un unico determinante di Slater 2 Questa sezione e la successiva sono in parte basate su appunti di lezione del prof. Giorgio J. Moro 9.2. OTTIMIZZAZIONE DEGLI SPINORBITALI 109 cioè se una variazione infinitesimale di un generico spinorbitale, ortogonale a VHF , dà un contributo nullo alla variazione del valore di attesa. La condizione (9.7) può essere ridotta al calcolo di un integrale monoelettronico: 1 X Z 0 00 −1 dq(−1)P (−1)P δΨi ∗Hartree P 0 HP 00 ΨHartree N ! P 0 ,P 00 hδΨi |H|Ψi = (9.8) dove si ricordi che q rappresenta l’insieme delle pseudocoordinate del sistema e ΨHartree è il prodotto di Hartree costruito con gli N spinorbitali; nell’equazione precedente siè fatto uso della proprietà P † = P −1 . La sommatoria su P 00 può essere sostituita con la sommatoria su P = P 0−1 P 00 , tenendo conto del fatto che H commuta con una generica permutazione, [H, P] = 0. Si ottiene perciò che hδΨi |H|Ψi = Z X dqδΨi ∗Hartree HPΨHartree (−1)P (9.9) P e quindi si può scrivere X Z (−1)P dqδΨi ∗Hartree ĥ(i) + X 1 PΨHartree (9.10) ([δSi Si |Sn Sn ] − [δSi Sn |Sn Si ]) (9.11) P n6=i rni che può essere scritto come hδΨi |H|Ψi = [δSi |ĥ|Si ] + X n6=i dove sono definiti i seguenti integrali mono e bi-elettronici: Z [Sa |ĥ|Sb ] = dq1 Sa (1)∗ ĥ(1)Sb (1) Z [Sa Sb |Sc Sd ] = dq1 dq2 Sa (1)∗ Sb (1) (9.12) 1 Sc (2)∗ Sd (2) = [Sb Sa |Sd Sc ]∗ = [Sc Sd |Sa Sb ] r12 (9.13) Possiamo definire l’operatore di Coulomb associato all’n-esimo spinorbitale ·Z ¸ dq2 Sn (2)∗ Jn (1)Sm (1) = 1 Sn (2) Sm (1) r12 (9.14) e l’operatore di scambio associato all’n-esimo spinorbitale ·Z Kn (1)Sm (1) = dq2 Sn (2)∗ 1 Sm (2)Sn (1) r12 ¸ (9.15) In questo modo gli integrali bi-elettronici si possono scrivere come elementi di matrice monoelettronici degli operatori di Coulomb [Sa Sb |Sn Sn ] = [Sa |Jn |Sb ] (9.16) e di scambio: [Sa Sn |Sn Sb ] = [Sa |Kn |Sb ] (9.17) 110 CAPITOLO 9. METODI AB-INITIO ed in definitiva possiamo scrivere la variazione hδΨi |H|Ψi nella forma: hδΨi |H|Ψi = [δSi |F|Si ] (9.18) dove F è l’operatore (monoelettronico) di Fock: F(1) = ĥ(1) + X [J n (1) − Kn (1)] (9.19) n L’operatore di Fock dipende, tramite gli operatori di Coulonb e di scambio, dal set di spinorbitali che definisce VHF . La condizione di stazionarietà variazionale è espressa dall’equazione [δSi |F|Si ] = 0 (9.20) per tutti gli spinorbitali Si e qualsiasi variazione δSi ortogonale a VHF , che deve perciò essere uno spazio chiuso rispetto a F: FSi ∈ VHF . 9.3 (9.21) Proprietà dell’operatore di Fock L’operatore di Fock F è definito in relazione agli spinorbitali che generano lo spazio hilbertiano VHF , ma non dipende da una scelta specifica di questi spinorbitali. In altre parole, vale il seguente teorema Teorema l’operatore F è invariante rispetto ad una trasformazione unitaria della base che genera lo spazio VHF Se infatti trasformiamo gli N spinorbitali secondo la trasformazione unitaria Si0 = X Sj Uji (9.22) j dove U−1 = U† , si trova che sia la somma degli operatori di Coulomb X n 0 J (n) Z X ∗ (UU ) jj 0 dq2 Sj (2)∗ jj 0 X 1 Sj 0 (2) = J (n) r12 n (9.23) che di quelli di scambio X n K0 (n)Sa (1) X jj 0 Z (UU∗ )jj 0 dq2 Sj (2)∗ X 1 K(n)Sa (1) Sa (2)Sj 0 (2) = r12 n (9.24) risulta invariata, e dunque l’operatore di Fock stesso risulta invariato. Un’altra importante proprietà dell’operatore di Fock è la seguente Teorema l’operatore F è autoaggiunto F † = F. 9.3. PROPRIETÀ DELL’OPERATORE DI FOCK 111 Infatti ĥ(1) è autoaggiunto per definizione; per gli operatori coulombiani e di scambio vale che: h i h i Sa |K†n |Sb ∗ ·Z Z Sa |J †n |Sb = [Sb |J n |Sa ]∗ = dq1 Sa (1)∗ ·Z Z = [Sb |Kn |Sa ] = ¸ dq2 Sn (2)∗ ∗ dq2 Sa (2) 1 Sn (2) Sb (1) = [Sa |J n |Sb ] r12 (9.25) ¸ 1 dq1 Sn (1) Sb (1) Sn (2) = [Sa |Kn |Sb ] r12 ∗ (9.26) Poichè F non genera spinorbitali che appartengono allo spazio complementare a VHF , una volta nota una base ortonormale completa di spinorbitali in cui i primi N elementi siano base per lo spazio VHF stesso, l’operatore di Fock è rappresentabile come una matrice diagonale a blocchi, ovvero (F)ij = [Si |F|Sj ] vale 0 se 1 ≤ i ≤ N e j ≥ N + 1 o i ≥ N + 1 e 1 ≤ j ≤ N . Per mezzo di una trasformazione unitaria della base ortonormale iniziale possiamo sempre rendere diagonale la matrice F, vale a dire possiamo sceglere come base ortonormale l’insieme di autofunzioni di F: FSi = ²i Si i = 1, . . . , N, N + 1, . . . (9.27) La procedura per il calcolo di un insieme completo di spinorbitali ortonormali che verifichino l’approssimazione HF è dunque 1. scelta di una base di spinorbitali e selezione di una sottobase, cioè dello spazio VHF 2. calcolo di F per il dato VHF 3. diagonalizzazione di F 4. confronto delle prime N autofunzioni di F e della base; iterazione della procedura dal punto 2. fino al raggiungimento della condizione di autoconsistenza, ovvero della indistinguibilità (a meno di qualche opportuno criterio di precisione numerica) tra le prime N autofunzioni di F e della base. L’algoritmo cosı̀ definito permette la determinazione di un insieme di spinorbitali che è completo, cioè include anche gli spinorbitali SN +1 , SN +2 , . . ., detti orbitali virtuali, che non compaiono nella definizione dello stato fondamentale e possono essere usati per rapresentare gli stati eccitati della molecola. Una volta noti gli spinorbitali che verifichino le condizioni precedenti, l’energia dello stato fondamentale della molecola si può calcolare direttamente del valore di attesa dell’hamiltoniano elettronico rispetto al determinante di Slater: E = hΨ|H|Ψi = X i 1X [Si |ĥ|Si ] + ([Si Si |Sn Sn ] − [Si Sn |Sn Si ]) 2 n6=i (9.28) vale a dire E= X i [Si |ĥ + 1X (J n − Kn )|Si ] 2 n (9.29) 112 CAPITOLO 9. METODI AB-INITIO L’energia totale non è la somma dei primi N autovalori di F, poichè la somma compare premoltiplicata per il fattore 1/2; se si scrive l’operatore di Fock come F = ĥ + G P n (J n − Kn ) (9.30) allora l’energia totale è X E= [Si |F − G/2|Si ] = i X [Si |ĥ + G/2|Si ] (9.31) i dove G descrive l’interazione tra un elettrone e tutti gli altri elettroni (da cui segue il fattore 1/2 per non contare l’interazione due volte). Il significato fisico degli autovalori ²i dell’operatore di Fock può essere ricavato dal teorema di Koopmans Teorema a meno di correzioni di ordine superiore al primo, gli spinorbitali ottenuti secondo la procedura HF per un sistema di N elettroni e equlli relativi ai sistemi con un’elettrone in più o in meno sono gli stessi Di conseguenza l’energia Ek del sistema dopo aver estratto un elettrone si può ottenere, secondo il teorema di Koopmans, come E − Ek = [Sk |ĥ + G|Sk ] = [Sk |F|Sk ] = ²k (9.32) Se quindi Sk è l’autostato dell’operatore di Fock con autovalore ²k più elevato occupato (Highest Occupied Molecular Orbital, HOMO, a cui segue il Lowest Unoccupied Molecular Orbital, LUMO), −²k è l’energia di prima ionizzazione del sistema, cioè la minima energia richiesta per la reazione + X(g) → X(g) + e− (9.33) dove X rappresenta il sistema molecolare di N elettroni. Per He e Li i potenziali di ionizzazione misurati sono rispettivamente -24.5 eV e -5.39 eV contro valori calcolati secondo HF pari a -24.98 eV e -5.34 eV. 9.4 Sistemi a guscio chiuso La procedura descritta nella sezione precedente è riferita ad uns sistema elettronico generico, ed è perciò detta UHF, cioè “unrestricted” HF. Se S~ è l’operatore di spin elettronico totale S~ = X ~ S(n) (9.34) n deve valere che [H, S 2 ] = [H, Sz ] = 0, poichè come abbiamo visto non includiamo termini espliciti di spin nell’hamiltoniano elettronico. Di conseguenza la funzione multielettronica deve essere 9.4. SISTEMI A GUSCIO CHIUSO 113 autofunzione di S 2 e di Sz : il metodo UHF non assicura questa proprietà. In pratica buona parte delle applicazioni sono per molecole stabili in stato di singoletto di spin, con un numero N pari di elettroni. Si può quindi definire fin dal principio un determinante di Slater scelto in maniera tale da verificare la condizione di essere uno stato di singoletto, cfr. Eq. (8.13). Come abbiamo visto nel capitolo precedente, se si definiscono N/2 orbitali φ1 , φ2 , . . . , φN/2 , il determinante di Slater si può costruire alternando stati di spin α e β Ψ = |φ1 φ1 φ2 φ2 . . . φN/2 φN/2 | (9.35) In questo caso di parla di metodo RHF, cioè “restricted” HF. La procedura RHF si può facilmente ricavare dal caso più generale UHF, verificando che l’operatore di Fock conserva la componente di spin F(1)φi (1)|m(1)i = |m(1)iF̂ φi (1) (9.36) dove F̂ è un’operatore di Fock che agisce sulla sola parte orbitalica F̂ (1) = ĥ(1) + N/2 h X 2Jˆn (1) − K̂ n (1) i (9.37) i=n dove si impiega l’operatore di Coulomb associato all’n-esimo orbitale Jˆn (1)φm (1) = ·Z ¸ 1 dr2 φn (2) φn (2) φm (1) r12 ∗ (9.38) e l’operatore di scambio associato all’n-esimo orbitale ·Z dr2 φn (2)∗ K̂ n (1)φm (1) = 1 φm (2)φn (1) r12 ¸ (9.39) L’energia totale di un sistema a guscio chiuso si può scrivere nella forma N/2 N/2 E=2 X i hi + X (2Jij − Kij ) (9.40) i,j dove sono definire i seguenti integrali mono e bi-elettronici Z hi = hφi (1)|ĥi (1)|φi (1)i = Z d~r1 d~r2 |φi (1)|2 Jij = 1 |φj (2)|2 r12 Z Kij = d~r1 φi (1)∗ ĥi (1)φi (1) d~r1 d~r2 φi (1)∗ φj (1) 1 φi (2)∗ φj (2) r12 (9.41) (9.42) (9.43) dove Jij e Kij sono detti gli integrali coulombiani e di scambio. In Appendice (E) il valore di attesa dell’hamiltoniano monoelettronico viene riderivato in modo esplicito e semplificato per il solo caso di un sistema a guscio chiuso. 114 CAPITOLO 9. METODI AB-INITIO 9.5 Soluzione numerica delle equazioni HF La natura delle equazioni di Hartree-Fock è intrinsecamente non-lineare: gli operatori agenti sugli orbitali φi dipendono a loro volta dagli orbitali φi stessi. Di conseguenza uno schema di soluzione numerica naturale è di tipo auto-consistente, come è stato già evidenziato nella sezione precedente (0) (0) 1. si definiscono delle funzioni in ordine 0, φ1 , . . . , φN/2 ; (0) (0) (0) 2. si calcolano le forme esplicite degli operatori Jˆj , K̂ j in funzione delle funzioni φi ; (1) (1) 3. si calcolano nuove funzioni φ1 , . . . , φN/2 , risolvendo il problema agli autovalori lineare con gli (0) (0) operatori Jˆ , K̂ ; j j (1) (1) (1) 4. si calcolano nuovi operatori Jˆj , K̂ j in funzione delle funzioni φi ; (n+1) 5. il ciclo si ripete finchè le funzioni φ1 un errore prefissato. (n+1) (n) (n) , . . . , φN/2 differiscono dalle φ1 , . . . , φN/2 a meno di Il modo migliore di procedere è, oggigiorno, quello di espandere linearmente le funzioni incognite φi su un set di funzioni di base note. I coefficienti numerici dell’espansione divengono poi le vere incognite del problema: in questo modo si riduce un sistema di equazioni differenziali ad un sistema di equazioni ordinarie, che deve poi comunque essere risolto in modo auto-consistente. Un set di funzioni di base permette di esprimere qualunque funzione come combinazione lineare delle funzioni componenti: φ = Ctr χ (9.44) dove χm = χm e C è una matrice il cui vettore colonna m sarà indicato con cm φ1 φ2 ... φM = c11 c12 c21 c22 ... ... cM 1 cM 2 . . . c1M . . . c2M ... ... . . . cM M tr χ1 χ2 ... χM = (c1 , c2 , . . . , cM )tr χ (9.45) Si possono definire varie grandezze matriciali e vettoriali in termini dei coefficienti cm e di altri integrali che coinvolgono gli orbitali (noti) χm : ∆pq = hχp |χq i (9.46) hi = hφi |ĥ(1)|φi i = c†i χ† ĥ(1)χci = c†i hci (9.47) Ji pq = hχp |Jˆi |χq i (9.48) Jij = c†i Jj ci = c†j Ji cj (9.49) 9.5. SOLUZIONE NUMERICA DELLE EQUAZIONI HF 115 Ki pq = hχp |K̂i |χq i (9.50) Kij = c†i Kj ci = c†j Ki cj (9.51) L’energia HF assume la forma: hHiav = 2 X † ci hci + i X † ci (2Jj − Kj )ci (9.52) ij Le equazioni di Hartree-Fock diventano le equazioni di Roothaan: FC = ∆C² (9.53) dove Fpq = hχp |F̂ |χq i. La scelta delle funzioni orbitaliche di base è di importanza fondamentale per l’acccuratezza del calcolo HF. Sostanzialmente è necessario bilanciare due fattori i) all’aumentare del numero di funzioni di base il calcolo sarà più accurato, ma il costo in termini computazionali (CPU, spazio di memoria per immagazzinare gli integrali mono e bielettronici) crescerà in modo superlineare con il numero di funzioni di base stesso; ii) funzioni di base accurate, costituite per esempio dagli orbitali dell’atomo idrogenoide, per quanto siano più efficienti in termini di numero di funzioni di base, possono comportare un aumento nel costo computazionale dovuto all’aumentata complessità nel calcolo degli integrali. Per un sistema molecolare si può in generale scegliere un set di funzioni di base tale da riprodurre lo stato fondamentale degli atomi componenti: è questa la cosiddetta base minima. Per esempio, nel caso della molecola CO si possono usare come base minima gli orbitali atomici (AO) 1s, 2s, 2px,y,z per il carbonio e gli stessi orbitali per l’ossigeno; per la molecola di ammoniaca NH3 si possono usare ancora i medesimi orbitali centrati sull’azoto gli orbitali 1s per i tre atomi di idrogeno e cosı̀ via. Si parla di basi estese quando si includono AO relativi a stati non occupati dei singoli atomi. Tra le funzioni più utilizzate per definire gli AO di partenza, ricordiamo orbitali idrogenoidi ottenuti dalla soluzione del problema agli autostati per un atomo idorgeonoide, della forma generica Ψn,l,ml (r, θ, φ) = Rnl (r)Ylml (θ, φ) (9.54) già discussi in precedenza, costituiti dal prodotto delle armoniche sferiche per le funzioni di Laguerre: v u u (n − l − 1)!Z ρl+1 L2l+1 Rnl = t 2 n+l (ρ) exp(−ρ/2) 3 n [(n + l)!] (9.55) Queste funzioni sono ortogonali, non-complete ed in generale computazionalmente ‘costose’, data la loro forma particolarmente complicata. 116 CAPITOLO 9. METODI AB-INITIO Slater-type orbitals, STO aventi la forma generale 1 uα,n,l,ml (r, θ, φ) = q (2n)! (2α)n+1/2 rn−1 exp(−αr)Ylml (θ, φ) (9.56) dove n ed α sono parametri variazionali; costituiscono un set completo relativamente poco costoso computazionalmente benchè non siano ortogonali. Gaussian-type orbitals, GTO espressi come gα,n,l,ml (r, θ, φ) = N rn−1 exp(−αr2 )Ylml (θ, φ) (9.57) Solitamente si impiegano combinazioni lineari di GTO per rappresentare in modo approssimato gli orbitali di tipo STO: si parla cosı̀ di basi STO-2G, STO-3G, . . . , STO-6G per descrivere basi costituite da funzioni STO approssimate come combinazioni lineari di 2, 3, . . . , 6 GTO. Riassumendo: un calcolo RHF secondo il metodo di Roothaan della struttura elettronica dell’acqua H2 O con una base minima STO-4G prevede l’applicazione del metodo RHF con la base di 7 AO nonortogonali 1sO , 2sO , 2px,y,zO e 1sH1 , 1sH2 descritti come STO approssimati da 4 GTO ciascuno. Altre basi molto usate sono caaratterizzate da un trattamento più accurato di alcuni elettroni rispetto ad altri, come le funzioni 3-21G, funzioni STO approssimate da 3 GTO per gli elettroni interni e 2 per ogni elettrone di valenza e le funzioni 6-21 o 6-31G, con 6 gaussiane per gli elettroni interni; ricordiamo anche le funzioni 6-31G∗ considerano anche AO di tipo d e 6-31G∗∗ che includono AO di tipo p centrati sugli idrogeni. 9.6 Interazione di configurazione A differenza del metodo di Hartree-Fock, il metodo dell’interazione di configurazione (CI), è almeno in principio in grado di fornire un risultato esatto (o arbitrariamente vicino al risultato esatto) del calcolo della funzione d’onda elettronica. L’idea alla base del metodo CI è molto semplice: la funzione d’onda è data da una combinazione (non necessariamente lineare) di funzioni di base note multielettroniche; i coefficienti dell’espansione sono determinati sulla base del principio variazionale. Riassumiamo brevemente il principio variazionale per il calcolo di una generica funzione d’onda multielettronica partendo dal rapporto di Rayleigh per una generica funzione d’onda Ψ ²[Ψ] = hΨ|H|Ψi hΨ|Ψi (9.58) Il principio variazionale afferma che se E0 è il più basso autovalore del sistema, il rapporto di Rayleigh è sempre maggiore o uguale di E0 ²[Ψ] ≥ E0 (9.59) 9.6. INTERAZIONE DI CONFIGURAZIONE 117 La dimostrazione è la seguente: espandiamo Ψ sulla base delle autofunzioni esatte dell’hamiltoniano H HΦ = En Φ E0 ≤ E1 ≤ . . . (9.60) hΦn |Φ0n i = δnn0 Ψ= X (9.61) cn Φn (9.62) n consideriamo la quantità hΨ|H − E0 |Ψi: X hΨ|H − E0 |Ψi = c∗n cn0 (9.63) nn0 hΦn |H − E0 |Φn0 i = X c∗n cn0 (En − E0 )hΦn |Φn0 i = X nn0 |cn |2 (En − E0 ) ≥ 0 (9.64) n infatti |cn |2 ≥ 0, En ≥ E0 ; segue che: hΨ|H|Ψi − E0 hΨ|Ψi ≥ 0 ⇒ ²[Ψ] ≥ E0 QED (9.65) Nella sua versione piú comune, il metodo CI è implementato sotto forma di metodo variazionale lineare. La funzione d’onda di prova Ψ è cioè data come una combinazione lineare di funzioni note: Ψ= N X cn0 Ψn0 (9.66) n0 =1 sostituendo in HΨ = EΨ: X cn0 HΨn0 = E n0 X cn0 Ψn0 (9.67) n0 premoltiplicando per Ψn ed integrando: X cn Hnn0 = E n0 X cn Snn0 (9.68) n0 dove Hnn0 = hΨn |H|Ψn0 i, Snn0 = hΨn |Ψn0 i; in forma matriciale: Hc = ESc (9.69) Il problema agli autovalori diviene più semplice se si assumono delle funzioni di base ortonormali S = 1: Hc = Ec (9.70) In linea di principio, un calcolo CI dovrebbe includere un numero infinito di funzioni multielettroniche. Se ci limitiamo a rappresentare ogni possibile configurazione multielettronica come un 118 CAPITOLO 9. METODI AB-INITIO determinante di Slater costruito a partire dagli spinorbitali (reali e virtuali) definiti nel corso di un calcolo UHF o RHF, dobbiamo comunque considerare un numero molto elevato di possibili configurazioni accoppiate con lo stato fondamentale rappresentato dalla funzione Ψ0 . Possiamo però considerare in ordine di importanza le correzioni apportate dalle varie configurazioni. Sia M lo spazio degli stati del sistema multielettronico, che si può ripartire come M = M0 ⊗ M1 ⊗ M2 ⊗ M3 ⊗ . . . (9.71) dove M0 è lo spazio monodimensionale costituito da Ψ0 ; M1 è lo spazio costituito dai determinanti di Slater ottenuti sostituendo in Ψ0 uno spinorbitale virtuale ad uno reale (configurazioni eccitate singolarmente); M1 è lo spazio costituito dai determinanti di Slater ottenuti sostituendo in Ψ0 due spinorbitali virtuali a due reali (configurazioni eccitate doppiamente); e cosı̀ via. Vale ora il seguente teorema Teorema di Brillouin. Gli elementi di matrice tra spinorbitali appartenenti a M1 e Ψ0 sono nulli. dal cui si può concludere che le configurazioni singolarmente eccitate non hanno un effetto diretto sulla correzione CI. In molti casi il metodo Ci viene applicato includendo solo le configurazioni di stato fondamentale e quelle doppiamente eccitate (M2 ). Si noti che un’effetto indiretto delle configurazioni singolarmente eccitate è naturalmente presente, dato che sono comunque accoppiate con gli elementi di M2 , M3 etc. M 0 M0 M 1 M2 M 1 M 2 11111 00000 00000 11111 00000 11111 00000 11111 00000 11111 0000000000000 1111111111111 00000 11111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 0000000000000 1111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000 111111111111111111111 Figura 9.1: Schema degli elementi di matrice H nel metodo CI. Sono indicati in nero i blocchi diagonali non nulli, in grigio i blocchi non-diagonali non nulli, in bianco i blocchi non-diagonali nulli 9.7. ALCUNI ESEMPI DI CALCOLO AB INITIO 119 La differenza tra l’energia esatta dello stato fondamentale e quella calcolata nell’approssimazione HF è detta energia di correlazione elettronica Ecorr = Eesatta − EHF (9.72) Una metologia sostanzialmente equivalente per il calcolo di Ecorr è basata su un trattamento perturbativo e va sotto il nome di correzione di Mœller-Plesset (o metodo MPPT, Mœller-Plesset perturbation theory). È basato su una separazione dell’hamiltoniano elettronico in due contributi: uno considerato di ordine zero secondo la teoria delle perturbazioni indipendenti dal tempo e coincidente con l’operatore di Fock, l’altro equivalente alla differenza tra F e H: H = H(0) + H(1) ≡ F + (H − F ) (9.73) L’energia dello stato fondamentale nel limite HF è data dai contributi perturbativi di ordine zero e di ordine uno: EHF = hΨ0 |H(0) + H(1) |Ψ0 i (9.74) assumendo come funzione d’onda dello stato fondamentale in ordine zero la solita funzione Ψ0 risultante dal calcolo HF. Correzioni non banali di ordine successivo si calcolano a partire dal secondo ordine in poi, che coinvolgono elementi di matrice tra Ψ0 e configurazioni doppiamente eccitate (metodo MPPT2). Ordini successivi di correzioni perturbative coinvolgono configurazioni una, due e tre volte eccitate (metodo MPPT3) e cosı̀ via. 9.7 Alcuni esempi di calcolo ab initio In questa sezione sono illustrati molto brevemente alcuni esempi di calcolo ab initio RHF. I calcoli sono stati effettuati impiegando il software Gaussian 94, un pacchetto per determinare strutture elettroniche, ottimizzazione di geometrie etc. La descrizione dei risultati è stata fatta impiegando Molden, un pacchetto per la visualizzazione di vari programmi di calcolo (oltre a Gaussian 94 sono disponibili come freeware, shareware od in commercio molti altri pacchetti software: ricordiamo tra gli altri Gamess, Spartan, Mopac). L’hamiltoniano elettronico della molecola di idrogeno è H = h(1) + h(2) + 1 r12 (9.75) La molecola è descritta nello stesso sistema di riferimento già utilizzato per la molecola di idrogeno r1 e ~r2 . Lo stato fondaionizzata, H+ 2 , salvo la presenza di due elettroni definiti dalle coordinate ~ mentale è descritto dal determinante di Slater Ψ = |φφ| (9.76) 120 CAPITOLO 9. METODI AB-INITIO e l’operatore di Fock (RHF, guscio chiuso, spin e parte orbitalica fattorizzate) può essere scritto come: F̂ = −∇2 − 1 1 − + 2Jˆ − K̂ rA rB (9.77) dove Jˆ e K̂ sono definiti come ˆ r)φ(~r) = K̂(~r)φ(vr) = J(~ ÃZ ! |φ(~r)|2 d~r φ(~r) |~r − ~r0 | 0 (9.78) Adottando il metodo di Roothaan con una base minima assumiamo che un generico orbitale sia φi = c1i 1sA + c2i 1sB (9.79) poichè usiamo una base di 2 funzioni per un sistema a guscio chiuso con 2 elettroni, otteremo due orbitali, uno reale (HOMO) e l’altro virtuale (LUMO). La diagonalizzazione dell’operatore di Fock sulla base scelta porta alla seguente equazione secolare ¯ ¯ ¯ a + J 0 − ² b + J 00 − ²s ¯ ¯ ¯ b + J 00 − ²s a + J 0 − ² ¯ ¯ ¯ ¯=0 ¯ ¯ (9.80) dove a, b ed s sono state definte in precedenza per lo studio approssimato della molecola di idrogeno ionizzata, mentre gli integrali J 0 e J 00 sono definiti come J 0 = h1sA |2Jˆ − K̂|1sA i = h1sB |2Jˆ − K̂|1sB i (9.81) J 00 = h1sA |2Jˆ − K̂|1sB i = h1sB |2Jˆ − K̂|1sA i (9.82) Gli autovalori ²i e i coefficienti di espansione cij si possono trovare immediatamente, senza cioè applicare alcun metodo iterativo, poichè il sistema è definito completamente dalle sue proprietà di simmetria. Gli autovalori sono ottenuti come ²1,2 = a ± +J 0 ∓ J 00 1±s (9.83) mentre gli orbitali sono dati da 1 φ1,2 = q 2(1 ± s) (1sA ± 1sB ) (9.84) Considerazioni di simmetria conducono al risultato corretto se si tiene conto che è possibile costruire una base orbitalica ortonormale simmetrica rispetto all’inversione delle coordinate ~r → −~r. Data la geometria della molecola si vede subito che un orbitale simmetrico è φg = φ1 , mentre un orbitale antisimmetrico è φu = φ2 . Costruendo l’operatore di Fock direttamente rispetto a φg si ottiene che F̂ (~r) ≡ F̂ (−~r) da cui segue che hφu |F̂ |φg i = 0 cioè F̂ è diagonale sulla base costruita per simmetria con autovalori ²g = ²1 e ²u = ²2 . 9.7. ALCUNI ESEMPI DI CALCOLO AB INITIO 121 Una volta nota la configurazione dello stato fondamentale, avendo a disposizione un’orbitale virtuale, possiamo costruire vari stati eccitati, come i tre stati degeneri di tripletto eccitato ΨT1 = |φg φu | = ΨT0 = φ1 (1)φ2 (2) − φ1 (2)φ2 (1) √ α(1)α(2) 2 |φg φu | + |φg φu | φ1 (1)φ2 (2) − φ1 (2)φ2 (1) α(1)β(2) + α(2)β(2) √ √ √ = 2 2 2 ΨT−1 = |φg φu | = φ1 (1)φ2 (2) − φ1 (2)φ2 (1) √ β(1)β(2) 2 (9.85) (9.86) (9.87) che ha un’energia calcolata come valore di attesa pari a ET = hΨTi |H|ΨTi i = hg + hu + Jg,u − Kg,u (9.88) e lo stato di singoletto eccitato ΨS1 = |φg φu | − |φg φu | φ1 (1)φ2 (2) + φ1 (2)φ2 (1) α(1)β(2) − α(2)β(2) √ √ √ = 2 2 2 (9.89) avente l’energia ES1 = hΨS1 |H|ΨS1 i = hg + hu + Jg,u + Kg,u . (9.90) Calcoli RHF effettuati su H2 con una base estesa 6-31G permettono di determinare una distanza di equilibrio R tra i due nuclei (ottenuta ripetendo il calcolo RHF a diverse distanze R fino ad individuare un minimo dell’energia dello stato fondamentale - un esempio di ottimizzazione di geometria molecolare) pari a 1.38 Å, contro 1.40 Å determinato sperimentalmente; il potenziale di ionizzazione calcolato è invece 3.49 eV contro 4.75 eV sperimentale. La funzione calcolata secondo la procedura RHF per la molecola di idrogeno nel suo stato fondamentale non rappresenta in modo adeguato il sistema, soprattutto per R → ∞. Se infatti calcoliamo la forma limite per R → ∞ si ottiene lim |φg φg | = [1sA (1)1sB (2) + 1sB (1)1sA (2)] + [1sA (1)1sA (2) + 1sB (1)1sB (2)] R→∞ (9.91) il primo termine indica due atomi H·, mentre il secondo indica la coppia ionica H+ , H− . Ciò implica il 50 % di probabilità che una molecola di idrogeno dissoci sotto forma di coppia biradicalica o ionica, che è del tutto irrealistico. Un calcolo realistico terrà conto di configurazioni aggiuntive che vanno oltre l’approssimazione HF. Si tratta perciò sostanzialmente di uan correzione CI al risultato RHF, ottenuta includendo configurazioni di tipo covalente e ionico scritte in modo opportuno per tener conto della indistinguilibilità degli elettroni: ³ ´ 1 |1s Ψcov = √ 1s | − |1s 1s | A B A B 2 1 + s2 (9.92) 122 CAPITOLO 9. METODI AB-INITIO ³ ´ 1 Ψion = √ 1s | + |1s 1s | |1s A A B B 2 1 + s2 (9.93) La generalizzazione del metodo CI per la molecola di idrogeno, basata sull’impiego di un set di funzioni bi-elettroniche completo, permette di ottenere un accordo con i dati sperimentali decisamente buono: il potenziale di ionizzazione calcolato con 50 configurazioni di base è 4.74 eV, mentre la distanza di equilibrio è 1.4 Å. 9.8 Altri esempi Nel caso di molecule lineari l’applicazione di vincoli di simmetria alla scelta delle funzioni di base semplifica grandemente il calcolo ab initio. L’uso di basi adattate per simmetria sarà descritto nel capitolo successivo. Qui ci limitiamo a commentare brevemente il risultato di altri due calcoli RHF effettuati per una molecola lineare, HCl, e per l’acqua, H2 O. Nel seguito, mostriamo l’esempio di un tabulato di calcolo risultante da una ottimizzazione di geometria per la molecola di aqcua eseguita con Gaussian 94: ********************************************************************** Population analysis using the SCF density. ********************************************************************** Orbital Symmetries: Occupied (A’) (A’) (A’) (A’) (A") Virtual (A’) (A’) (A’) (A’) (A") (A’) (A’) (A’) (A’) (A’) (A") (A’) (A’) (A’) The electronic state is 1-A’. Alpha occ. eigenvalues -- -20.54532 -1.35692 -0.73115 -0.55177 -0.50132 Alpha virt. eigenvalues -0.14513 0.21389 0.58263 0.58295 1.00216 Alpha virt. eigenvalues -1.02050 1.15363 1.43225 2.45181 2.51888 Alpha virt. eigenvalues -5.30956 5.41111 5.58159 51.43742 Molecular Orbital Coefficients 1 2 3 4 5 (A’)--O (A’)--O (A’)--O (A’)--O (A")--O EIGENVALUES --20.54532 -1.35692 -0.73115 -0.55177 -0.50132 1 1 O 1S 0.55143 -0.11348 0.00000 -0.03853 0.00000 2 2S 0.47167 -0.19044 -0.00001 -0.06523 0.00000 3 2PX 0.00000 -0.00001 0.22078 0.00001 0.00000 4 2PY -0.00246 -0.04002 0.00000 0.25682 0.00000 5 2PZ 0.00000 0.00000 0.00000 0.00000 0.29245 9.8. ALTRI ESEMPI 123 M O L D E N M O L D E N M O L D E N M O LL D EE N M M O D N M O L D E N M O L D E N M O L D E N MO OL LD DE EN N defaults used Edge = 5.60 Contour 3D Psi = 9 CONTOUR VALUE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ............ 0.00000 0.05000 0.10000 0.15000 0.20000 0.25000 0.30000 0.35000 0.40000 0.45000 0.50000 0.55000 0.60000 0.65000 0.70000 0.75000 -0.05000 -0.10000 -0.15000 -0.20000 -0.25000 -0.30000 -0.35000 -0.40000 -0.45000 M O L D E N M O L D E N M O L D E N M O LL D EE N M M O D N M O L D E N M O L D E N M O L D E N MO OL LD DE EN N defaults used Edge = 5.60 Contour 3D Psi = 10 CONTOUR VALUE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0.00000 0.05000 0.10000 0.15000 0.20000 0.25000 0.30000 0.35000 0.40000 0.45000 0.50000 0.55000 0.60000 -0.05000 -0.10000 -0.15000 -0.20000 -0.25000 -0.30000 -0.35000 -0.40000 -0.45000 -0.50000 -0.55000 -0.60000 Figura 9.2: Orbitali HOMO e LUMO di HCl, rappresentati come superficie 6 7 8 9 10 11 12 13 14 2 15 16 17 3 H H 3S 3PX 3PY 3PZ 4S 4PX 4PY 4PZ 1S 2S 3S 1S 0.00558 0.00000 0.00090 0.00000 -0.00020 0.00000 -0.00033 0.00000 0.00020 -0.00011 0.00011 0.00020 0.54438 -0.00001 -0.08843 0.00000 0.43887 0.00000 -0.05127 0.00000 0.09982 0.03908 -0.00396 0.09983 0.00001 0.36854 0.00000 0.00000 0.00003 0.21489 0.00000 0.00000 0.16213 0.19580 0.04616 -0.16214 0.19936 0.00001 0.38806 0.00000 0.26427 0.00001 0.40111 0.00000 -0.08409 -0.09301 -0.03139 -0.08409 0.00000 0.00000 0.00000 0.43983 0.00000 0.00000 0.00000 0.48851 0.00000 0.00000 0.00000 0.00000 124 18 19 CAPITOLO 9. METODI AB-INITIO 2S 3S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 EIGENVALUES -1 O 1S 2S 2PX 2PY 2PZ 3S 3PX 3PY 3PZ 4S 4PX 4PY 4PZ 2 H 1S 2S 3S 3 H 1S 2S 3S 1 2 3 4 5 6 7 8 9 10 11 12 13 EIGENVALUES -1 O 1S 2S 2PX 2PY 2PZ 3S 3PX 3PY 3PZ 4S 4PX 4PY 4PZ -0.00011 0.00011 6 (A’)--V 0.14513 -0.03453 -0.05645 0.00001 -0.07330 0.00000 0.10790 0.00001 -0.12323 0.00000 0.88554 0.00003 -0.20430 0.00000 -0.03829 0.03062 -0.83695 -0.03828 0.03062 -0.83685 11 (A’)--V 1.02050 0.01558 0.02682 -0.00002 -0.23105 0.00000 -0.08512 -0.00006 -0.84364 0.00000 -0.35054 0.00011 1.34290 0.00000 0.03908 -0.00396 7 (A’)--V 0.21389 0.00000 0.00000 0.12046 0.00000 0.00000 0.00000 0.13921 0.00000 0.00000 -0.00006 0.51385 -0.00003 0.00000 -0.02042 0.10816 -1.52605 0.02041 -0.10819 1.52615 12 (A’)--V 1.15363 0.00000 0.00000 -0.23607 0.00002 0.00000 0.00001 -0.90999 0.00007 0.00000 -0.00001 1.76898 -0.00012 0.00000 -0.19580 -0.04616 8 (A’)--V 0.58263 0.00154 0.00269 -0.13119 0.00447 0.00000 -0.00669 -0.19665 0.00722 0.00000 -0.05599 -1.21714 0.04192 0.00000 0.08034 1.59978 -0.76977 -0.07289 -1.44387 0.71209 13 (A’)--V 1.43225 0.11902 0.25119 0.00000 0.03803 0.00000 -1.81879 0.00000 0.10786 0.00000 2.82235 -0.00004 -0.63696 0.00000 -0.09299 -0.03138 9 (A’)--V 0.58295 0.03296 0.05733 0.00615 0.09530 0.00000 -0.14264 0.00922 0.15371 0.00000 -1.19721 0.05718 0.89445 0.00000 0.07574 1.59260 -0.57995 0.08292 1.73540 -0.64934 14 (A’)--V 2.45181 -0.01185 -0.01343 0.00000 -0.14705 0.00000 -0.08442 -0.00004 -0.03304 0.00000 -0.48794 0.00004 0.36023 0.00000 0.00000 0.00000 10 (A")--V 1.00216 0.00000 0.00000 0.00000 0.00000 -0.24082 0.00000 0.00000 0.00000 -0.83803 0.00000 0.00000 0.00000 1.13618 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 15 (A’)--V 2.51888 -0.00001 -0.00001 -0.19470 -0.00001 0.00000 0.00004 0.01704 -0.00003 0.00000 -0.00013 0.33600 0.00005 0.00000 9.8. ALTRI ESEMPI 14 2 15 16 17 3 18 19 H 1S 2S 3S 1S 2S 3S 0.04545 -0.03403 -0.00505 -1.09309 0.24804 -0.21412 -0.59360 1.59577 0.09448 -0.74736 -0.36175 -0.48824 H 0.04546 0.03405 -0.00508 -1.09291 0.24802 0.21403 -0.59358 1.59555 0.09456 0.74740 -0.36184 -0.48808 16 17 18 19 (A")--V (A’)--V (A’)--V (A’)--V EIGENVALUES -5.30956 5.41111 5.58159 51.43742 1 1 O 1S 0.00000 0.00427 0.00000 -2.24644 2 2S 0.00000 0.01050 0.00000 2.32902 3 2PX 0.00000 0.00006 -1.28379 0.00000 4 2PY 0.00000 -1.27272 -0.00006 -0.00424 5 2PZ -1.27030 0.00000 0.00000 0.00000 6 3S 0.00000 -0.07359 -0.00001 -0.24329 7 3PX 0.00000 -0.00007 1.49245 0.00000 8 3PY 0.00000 1.40721 0.00007 0.01308 9 3PZ 1.36970 0.00000 0.00000 0.00000 10 4S 0.00000 0.30033 0.00005 0.24052 11 4PX 0.00000 0.00004 -0.83840 -0.00001 12 4PY 0.00000 -0.65361 -0.00003 -0.04421 13 4PZ -0.52370 0.00000 0.00000 0.00000 14 2 H 1S 0.00000 0.21235 -0.28655 0.00635 15 2S 0.00000 -0.31639 0.35306 -0.03858 16 3S 0.00000 0.01468 0.15005 -0.03243 17 3 H 1S 0.00000 0.21233 0.28663 0.00635 18 2S 0.00000 -0.31637 -0.35316 -0.03859 19 3S 0.00000 0.01471 -0.15005 -0.03244 Condensed to atoms (all electrons): 1 2 3 1 O 8.292901 0.261664 0.261662 2 H 0.261664 0.364534 -0.034311 3 H 0.261662 -0.034311 0.364535 Total atomic charges: 1 1 O -0.816227 2 H 0.408113 3 H 0.408114 Sum of Mulliken charges= 0.00000 Atomic charges with hydrogens summed into heavy atoms: 125 1.10715 -1.63769 0.76446 -1.10733 1.63799 -0.76451 126 CAPITOLO 9. METODI AB-INITIO 1 1 O 0.000000 2 H 0.000000 3 H 0.000000 Sum of Mulliken charges= 0.00000 Electronic spatial extent (au): <R**2>= 19.0015 Charge= 0.0000 electrons Dipole moment (Debye): X= -0.0001 Y= -2.4886 Z= 0.0000 Tot= 2.4886 Quadrupole moment (Debye-Ang): XX= -3.8663 YY= -6.3645 ZZ= -7.2759 XY= -0.0002 XZ= 0.0000 YZ= 0.0000 Octapole moment (Debye-Ang**2): XXX= -0.0001 YYY= -1.4797 ZZZ= 0.0000 XYY= 0.0001 XXY= -1.3015 XXZ= 0.0000 XZZ= 0.0000 YZZ= -0.4291 YYZ= 0.0000 XYZ= 0.0000 Hexadecapole moment (Debye-Ang**3): XXXX= -5.3157 YYYY= -6.1828 ZZZZ= -5.3837 XXXY= 0.0000 XXXZ= 0.0000 YYYX= 0.0000 YYYZ= 0.0000 ZZZX= 0.0000 ZZZY= 0.0000 XXYY= -1.7032 XXZZ= -2.0640 YYZZ= -1.9605 XXYZ= 0.0000 YYXZ= 0.0000 ZZXY= 0.0000 N-N= 9.291362481815D+00 E-N=-1.993505611185D+02 KE= 7.611888714322D+01 Symmetry A’ KE= 7.153312626549D+01 Symmetry A" KE= 4.585760877728D+00 Leave Link 601 at Mon Mar 15 08:37:32 1999, MaxMem= 4000000 cpu: (Enter /usr/local/g94/l9999.exe) Final structure in terms of initial Z-matrix: O H,1,r2 H,2,r3,1,a3 Variables: r2=0.94565985 r3=1.56665299 a3=34.06847266 Test job not archived. 1\1\GINC-CFGAMMA\FOpt\RHF\6-311G\H2O1\NINOP\15-Mar-1999\0\\#P TEST OPT HF/6-311G GFINPUT IOP(6/7=3)\\This Gaussian input file generated by B abel 1.06e\\0,1\O,-0.0199352024,0.,-0.1040561682\H,-0.6895863854,0.,0. 5636562348\H,0.8490680049,0.,0.2687931105\\Version=SGI-G94RevE.2\State 0.3 9.8. ALTRI ESEMPI 127 =1-A’\HF=-76.0109546\RMSD=7.476e-09\RMSF=1.284e-04\Dipole=0.184244,0., 0.9615714\PG=CS [SG(H2O1)]\\@ AND ALL THIS SCIENCE I DON’T UNDERSTAND IT’S JUST MY JOB FIVE DAYS A WEEK -- ELTON JOHN, "ROCKET MAN" Job cpu time: 0 days 0 hours 1 minutes 18.3 seconds. File lengths (MBytes): RWF= 5 Int= 0 D2E= 0 Chk= Normal termination of Gaussian 94 2 Scr= 1 In entrambi i casi è stata impiegata una base 6-31G; nel caso dell’acido cloridrico il problema è dunque a 3 (H) + 21 (Cl) funzioni di base (1s, 2s, 3s per l’idrogeno e tutto gli AO di tipo s con n da 1 a 6 e tutti gli AO di tipo p da 1 a 5 per il Cl). In Fig. (9.2) sono mostrati gli orbitali HOMO e M O LLLLDDDDEEEENNNN M O M OO M M M O MO OLLLDDDEEENNN defaults used Edge = 5.60 Space = 0.1000 Psi = 9 Figura 9.3: Orbitale HOMO di HCl, rappresentato come una superficie ad uguale densità di carica LUMO per l’acido cloridrico, in corrispondenza della geometria di equilibrio. Le Figg. (9.3) e (9.4) mostrano gli stessi orbitali, rappresentati sotto forma di superficie aventi uguale valore di densità di carica. Infine in Figg. (9.5) e (9.6) sono raffigurati gli orbitali HOMO e LUMO ottenuti da un calcolo RHF per l’acqua, ancora usando una base 6-31G (19 funzioni di base). 128 CAPITOLO 9. METODI AB-INITIO M O LLLLDDDDEEEENNNN M O M OO M M M O MO OLLLDDDEEENNN defaults used Edge = 5.60 Space = 0.1000 Psi = 10 Figura 9.4: Orbitale LUMO di HCl, rappresentato come una superficie ad uguale densità di carica M O LLLLDDDDEEEENNNN M O M OO M M M O MO OLLLDDDEEENNN defaults used Edge = 4.04 Space = 0.3000 Psi = 5 Figura 9.5: Orbitale HOMO di H2 O, rappresentato come una superficie ad uguale densità di carica 9.8. ALTRI ESEMPI 129 M O LLLLDDDDEEEENNNN M O M OO M M M O MO OLLLDDDEEENNN defaults used Edge = 4.04 Space = 0.1000 Psi = 6 Figura 9.6: Orbitale LUMO di H2 O, rappresentato come una superficie ad uguale densità di carica 130 CAPITOLO 9. METODI AB-INITIO Capitolo 10 Teoria dei gruppi di simmetria ed orbitali molecolari 10.1 Gruppi di simmetria puntuale Un gruppo G è un insieme di elementi in cui è assegnata una operazione - detta legge di composizione, e che denotiamo per ora con ◦ - che permette di associare ad ogni coppia di elementi x, y ∈ G un elemento x ◦ y ∈ G, e che gode delle seguenti proprietà: Associativa Per ogni terna x, y, z ∈ G vale che (x ◦ y) ◦ z = x ◦ (y ◦ z) (10.1) Elemento neutro Esiste un elemento e ∈ G tale che e◦x=x◦e=x (10.2) Inverso Per ogni x ∈ G esiste un elemento y ∈ G tale che x◦y =y◦x=e (10.3) indichiamo l’inverso di x con x−1 . Se il gruppo G gode della proprietà aggiuntiva Commutativa Per ogni coppia x, y ∈ G vale che x◦y =y◦x (10.4) 131 132 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI allora si dice abeliano o commutativo. Esempio 38. Alcuni esempi di gruppi: l’insieme delle permutazioni dei nuclei di una molecola P rispetto all’operazione di composizione (moltiplicazione delle permutazioni); l’insieme di tutte le matrici m × n sul corpo di numeri K rispetto all’addizione; l’insieme dei numeri pari rispetto all’operazione di addizione. Alcune definizioni utili relative all’algebra dei gruppi saranno impiegate in seguito. I gruppi sono infiniti o finiti, se il numero dei loro elementi è finito o infinito. L’ordine h di un gruppo finito è il numero di elementi costituenti il gruppo. Definiamo tavola di moltiplicazione o tabella di un gruppo finito la matrice che riassume il risultato dell’operazione del gruppo tra ogni coppia di elementi del gruppo. Definiamo un sottogruppo come un sottoinsieme del gruppo che gode delle proprietà di gruppo. Diciamo gruppo ciclico quel gruppo costituito da e, un elemento a e da tutte le potenze con esponente 0 ≤ n ≤ h dell’elementoa, vale a dire a ◦ a ◦ . . . ◦ a (n volte). Definiamo infine il concetto di classe: • due elementi a e b di un gruppo G si dicono coniugati quando esiste un terzo elemento del gruppo x tale che b = x−1 ◦ a ◦ x; si noti che ogni elemento è coniugato di se stesso e che se a è coniugato a b e b è coniugato a c, allora a è coniugato a c. • il sottoinsieme di G che contiene tutti gli elementi coniugati fra loro è una classe di G. Nel seguito ci occuperemo dei gruppi formati dalle operazioni di simmetria di un corpo rigido: gruppo di simmetria: l’insieme di operazioni di simmetria relative ad un corpo rigido, considerato come un insieme di punti materiali verifica le condizioni di gruppo, rispetto all’operazione di composizione (applicazione successiva) di due operazioni di simmetria. In generale si definisce operazione di simmetria una trasformazione delle coordinate dell’insieme di punti materiali che porta ogni punto in un punto equivalente. Nel caso di un sistema molecolare l’insieme dei punti materiali coincide con i nuclei. Un’operazione di simmetria è definita rispetto ad elemento di simmetria, che è un ente geometrico (punto, retta o piano) rispetto al quale possono essere eseguite una o più operazioni di simmetria. La composizione, cioè l’applicazione successiva di due operazioni A1 e A2 (prima A1 e dopo A2 ) si indica con A2 A1 . Nel seguito considereremo i soli gruppi di simmetria puntuali, vale a dire quei gruppi di operazioni di simmetria che conservano la posizione di un punto, comune a tutte le operazioni del gruppo, e non tratteremo dei gruppi spaziali, che includono operazioni di traslazione e non conservano perciò alcun punto fermo. I gruppi spaziali sono necessari per la comprensione delle simmetrie presenti nei reticoli cristallini. 10.2. ELEMENTI ED OPERAZIONI DI SIMMETRIA 10.2 133 Elementi ed operazioni di simmetria Nella trattazione della simmetria molecolare è necessario considerare solo quattro tipi di elementi di simmetria e le relative operazioni di simmetria. Nel seguito useremo per chiarezza il carattere tipografico per indicare un elemento di simmetria, distinguendolo dalle operazioni di simmetria da esso generate. Assumiamo per semplicità che un sistema di riferimento xyz sia definito in modo solidale con la molecola (sistema di riferimento molecolare). identità: è l’operazione E che lascia invariata la configurazione del sistema molecolare rotazione propria: un asse proprio di simmetria Cn è associato ad un’operazione di rotazione propria, ovvero ad una rotazione in senso orario di un angolo 2π/n attorno all’asse dove n è il maggior intero che genera una configurazione equivalente. Un asse di simmetria C3 permetterà di definire le operazioni C3 (rotazione di 2π/3), C32 (rotazione di 4π/3) e C33 = E (rotazione di 2π, cioè l’identità). Facendo coincidere l’asse di simmetria con l’asse z moleco~ saranno ruotate dall’operazione Cn secondo la lare, le componenti di un generico vettore R trasformazione x0 cos 2π/n − sin 2π/n 0 x y 0 = sin 2π/n cos 2π/n 0 y z0 0 0 1 z (10.5) riflessione: un piano di simmetria molecolare σ permette di definire una operazione di riflessione σ. Si noti che σ 2 = E. Parliamo di operazioni di simmetria σv se sono associate a piani di simmetria che contengono l’asse principale di rotazione del sistema molecolare. Se l’asse del piano di simmetria forma un angolo φ con l’asse x del sistema molecolare le componenti di un vettore generico sono trasformate come x0 cos 2φ sin 2φ 0 x y 0 = sin 2φ − cos 2φ 0 y 0 z 0 0 1 z (10.6) Parliamo di operazioni di simmetria σh se sono associate al piano di simmetria xy perpendicolare all’asse principale di rotazione del sistema molecolare; le componenti di un vettore generico sono trasformate come 1 0 0 x x0 y0 = 0 1 0 y z0 0 0 −1 z (10.7) 134 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI inversione: un centro di inversione i permette di definire l’operazione di inversione i. Iterando i per n volte con n pari si ottiene l’identità, con n dispari si riottiene i. Se poniamo i nell’origine del sistema del sistema molecolare le componenti di un vettore generico sono trasformate come x0 −1 0 0 x y 0 = 0 −1 0 y z0 0 0 −1 z (10.8) rotazione impropria una rotazione impropria Sn di ordine n è costituita da una rotazione propria e da una riflessione rispetto ad un piano perpendicolare all’asse di rotazione (indipendentemente dall’ordine di esecuzione). L’asse di rotazione impropria si indica con Sn . Se esistono un asse di rotazione propria e un piano di riflessione perpendicolare esiste anche l’asse di rotazione impropria, ma può anche darsi l’esistenza di Sn senza Cn e σh . Per un vettore generico, la rotazione impropria si può scrivere come x0 cos 2π/n − sin 2π/n 0 x 0 y = sin 2π/n cos 2π/n 0 y z0 0 0 −1 z (10.9) Casi particolari sono dati dalla rotazione impropria di ordine 1, che coincide con σh , S2 = σh e dalla rotazione impropria di ordine 2, che coincide con l’inversione, S2 = i. Un asse improprio di ordine n genera le operazioni Sn , Sn2 , . . . , Snn ; per n pari Snm = Cnm se m è pari, quindi per esempio per n pari Snn = Cnn = E. Viceversa, per n dispari Snn = σh . Si noti che per n dispari l’esistenza di Sn implica l’esistenza di σh e Cn . Un sistema molecolare che non possiede nessun asse di simmetria improprio è dissimetrica, cioè non può essere sovrapposta alla sua immagine speculare (vale a dire, o ha solo assi di rotazione propria o non ha alcun elemento di simmetria). 10.3 Gruppi puntuali Possiamo classificare i vari gruppi puntuali di simmetria considerando i vari possibili insiemi completi di operazioni di simmetria. I gruppi di simmetria sono denominati secondo due nomenclature fondamentali, basate sulla notazione di Schœnflies ed internazionale. Nel seguito adotteremo sempre la notazione di Schœnflies1 . gruppo C1 È costituito dall’identità E. La molecola non ha elementi di simmetria. 1 La notazione di Schœnflies usa nomi simili alle operazioni di simmetria principali del gruppi considerati, che iniziano per C, da “cyclic”, D, da “dyhedral”, S, da “spiegel” con l’aggiunta di apici quali h , v e d rispettivamente da “horizontal”, “vertical” e “diagonal”. 10.4. RAPPRESENTAZIONI 135 gruppi Cs e Ci È presente solo un piano di riflessione σ o solo un centro di inversione i. Sono entrambi gruppi ciclici di ordine 2. gruppi Cn È presente un asse proprio Cn , che genera le operazioni Cn , Cn2 , . . . , Cnn = E. Sono gruppi ciclici di ordine n. gruppi Sn È presente un asse improprio di ordine n pari. Sono gruppi ciclici di ordine n. S2 è equivalente a i. gruppi Dn È presente un asse proprio Cn ed n assi di rotazione binaria perpendicolari. L’ordine è 2n. gruppi Cnh Sono presenti un asse proprio Cn ed il piano di riflessione σh . L’ordine è 2n. Corrispondono ai gruppi Sn con n dispari. gruppi Cnv Sono presenti un asse proprio Cn ed n piani verticali di riflessione σv . L’ordine è 2n. gruppi Dnh Sono presenti un asse proprio Cn , n assi di rotazione binaria perpendicolari ed il piano di riflessione σh . L’ordine è 4n. gruppi Dnd Sono presenti un asse proprio Cn , n assi di rotazione binaria perpendicolari ed n piani diedri σd , ovvero piani di riflessione che bisecano gli angoli tra coppie adiacenti di assi binari. L’ordine è 4n. gruppi C∞v e D∞h Sono gruppi infiniti relativi a molecole lineari eteronucleari, C∞v , con un asse C∞ ed infiniti assi binari perpendicolari; e molecole lineari omonucleari, D∞h , con un asse C∞ , infiniti assi binari perpendicolari ed un piano di riflessione orizzontale. gruppi dei solidi platonici Sono i gruppi ad elevata simmetria dei cinque solidi platonici: tetraedro (Td , ordine 24), cubo ed ottaedro (Oh , ordine 48), dodecaedro e icosaedro (Ih , ordine 120). 10.4 Rappresentazioni Consideriamo un gruppo di simmetria puntuale G ed un insieme di funzioni fi tali che applicando una qualunque delle operazioni di simmetria R ad una di esse si ottiene una combinazione lineare delle funzioni stesse: Rfi = g X Rki fk (10.10) k=1 Se non è possibile trovare un insieme di combinazioni lineari di m tra le funzioni fi , con m < g, diciamo che le funzioni fi formano una rappresentazione irriducibile di dimensione g del gruppo G. Altrimenti si parla di rappresentazione riducibile. Data una rappresentazione di dimensione g, 136 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI ad ogni operazione R è associabile la matrice R con elementi Rki . Il carattere χ(R) di una operazione R rispetto ad una data rappresentazione è la traccia della matrice associata. Nel caso di una rappresentazione (irriducibile, naturalmente) monodimensionale i caratteri sono tutti pari a +1 o −1. In generale una rappresentazione è descritta da una tabella dei caratteri che elenca i caratteri associati ad ogni operazione di simmetria. Le rappresentazioni irriducibili monodimensionali, bidimensionali, tridimensionali sono denominate con lettere e numeri in considerazione del carattere di alcune operazioni di simmetria secondo la seguente nomenclatura • A e B indicano rappresentazioni monodimensionali); E bidimensionali; T tridimensionali • gli indici 1 e 2 si aggiungono ad A o B per indicare che il carattere di ua rotazione relativa ad un asse C2 perpendicolare all’asse principale è +1 o −1. • gli indici 0 e 00 si aggiungono ad tutti simboli per indicare che il carattere di una riflessione relativa ad un piano σh è +1 o −1. • gli indici g (da “gerade”) e u da (“ungerade”) si aggiungono a tutti i simboli per indicare che il carattere di un’inversione relativa ad un centro σh è +1 o −1. Classificazioni più complesse con indici numerici, sono definite per rappresentazioni E, T e cosı̀ via. Il numero ed il tipo di rappresentazioni irriducibili distinte di un dato gruppo puntuale è una proprietà univocamente definita del gruppo stesso. Data una qualunque rappresentazione, o è irriducibile, o è possibile ridurla ad una somma di rappresentazioni irriducibili, tra quelle ammesse dal gruppo. La rappresentazione monodimensionale con caratteri tutti uguali a 1 è detta rappresentazione totalsimmetrica del gruppo. Consideriamo nel seguito due rappresentazioni, di dimensione gi e gj . Vale il seguente teorema generale: Teorema di ortogonalità Se h è l’ordine del gruppo, e gi , gj le dimensioni di due rappresentazioni, allora X R ∗ (j) (i) Rmn Rm0 n0 = √ h δij δmm0 δnn0 gi gj (10.11) (i) indichiamo l’elemento mn della matrice rappresentativa dell’operazione R reldove con Rmn ativo alla rappresentazione i-esima. Da questo teorema generale discendono varie conseguenze, di importanza applicativa, che si possono riassumere nei seguenti tre vincoli 1. La somma dei quadrati delle dimensioni delle rappresentazioni irriducibili di un gruppo è uguale all’ordine del gruppo 10.4. RAPPRESENTAZIONI 137 2. In una data rappresentazione, i caratteri di tutte le operazioni appartenenti alla stessa classe hanno lo stesso carattere. 3. Il numero delle rappresentazioni irriducibili di un gruppo è uguale al numero di classi del gruppo. Date due rappresentazioni irriducibili, vale il seguente teorema di ortogonalità derivato direttamente dal precedente teorema generale sommando i termini diagonali delle matrici rappresentativi delle operazioni: Teorema di ortogonalità delle rappresentazioni Se gi , gj sono le dimensioni di due rappresentazioni irriducibili, allora X ∗ χ(i) (R) χ(j) (R) = gi gj δij (10.12) R per i = j ritroviamo il primo vincolo. Data una rappresentazione riducibile, possiamo scrivere per ogni operazione χ(r) (R) = X ai χ(i) (R) (10.13) i ed utilizzando il precedente teorema di ortogonalità possiamo ricavare i coefficienti ai che permettono di sviluppare la r-esima rappresentazione riducibile come una combinazione lineare delle ∗ rappresentazioni irriducibili; moltiplicando per χ(j) (R) entrambi i membri e sommando su tutte le operazioni R si ottiene 1 X (j) ∗ aj = χ (R) χ(r) (R) (10.14) h R Noti i caratteri di una rappresentazione riducibile, e la tabella dei caratteri del gruppo di simmetria puntuale, è dunque possibile calcolare il coefficiente della rappresentazione irriducibile in analogia al calcolo della componente di Fourier di un elemento generico di uno spazio vettoriale (la rappresentazione riducibile) rispetto ad un elemento della base ortogonale (la rappresentazione irriducibile). Un utile concetto per la costruzione di rappresentazioni di gruppi di simmetria è dato dal prodotto diretto di due rappresentazioni. Siano αi le funzioni che definiscono una data rappresentazione e βi quelle che definiscono un’altra rappresentazione. Allora si può costruire la rappresentazione prodotto (β) (α) e Rm0 n0 sono le matrici rappresentative di una diretto come l’insieme di tutti i prodotti αi βj . Se Rmn generica operazione R del gruppo, allora la matrice rappresentativa nella rappresentazione prodotto diretto è data come (αβ) (β) (α) Rm0 n0 Rmm0 ,nn0 = Rmn (10.15) che è il prodotto di Kronecker delle due matrici Rα e Rβ ; formalmente si scrive anche R(αβ) = Rα ⊗ Rβ . Si noti che χ(αβ) (R) = χ(α) (R)χ(β) (R), e che in generale la rappresentazione prodotto diretto, anche di due rappresentazioni irriducibili, è riducibile. 138 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI 10.5 Operatori di proiezione Data un determinato insieme di funzioni che costituisca una rappresentazione di un gruppo, è utile disporre di un metodo sistematico per costruire le rappresentazioni irriducibili contenute. Uno strumento formale molto utile è l’operatore di proiezione P (i) che proietta la base per la i-esima rappresentazione irriducibile del gruppo, e che ha la forma gi X (i) ∗ P (i) = χ (R) R (10.16) h R L’utilità dell’operatore di proiezione è costituita dal fatto che si possono costruire basi per rappresentazioni irriducibili in modo semplice una volta nota basi per rappresentazioni irriducibili. Consideriamo per esempio il caso del gruppo C3v , che ammette le rappresentazioni irriducibili A1 , A2 ed E. Costruiamo i tre operatori di proiezione PA1 = ´ 1³ E + C3 + C32 + σ1 + σ2 + σ3 6 (10.17) PA2 = ´ 1³ E + C3 + C32 − σ1 − σ2 − σ3 6 (10.18) PE = ´ 2³ 2E − C3 − C32 3 (10.19) Prendiamo in esame la funzione x2 . Applicando gli operatori precedenti otteniamo: PA1 x2 ∝ x2 + y 2 (10.20) PA2 x2 ∝ 0 (10.21) PE x2 ∝ x2 − y 2 (10.22) dalla tabella del gruppo C3v troviamo infatti che x2 + y 2 è base per la rappresentazione irriducibile A1 , mentre x2 − y 2 è una delle funzioni di base per la rappresentazione irriducibile bidimensionale E. La funzione x2 non ha componenti appartenenti alla rappresentazione irriducibile A2 . 10.6 Applicazioni al calcolo di orbitali molecolari L’applicabilità della teoria dei gruppi puntuali al calcolo di orbitali molecolari è evidente nel caso del calcolo di elementi di matrice di operatori che condividono la simmetria del gruppo di punti di un sistema molecolare. Consideriamo un operatore F che sia invariante rispetto alle operazioni di simmetria di un gruppo puntuale e calcoliamo l’elemento di matrice Z hφ1 |F|φ2 i = dqφ∗1 Fφ2 (10.23) 10.7. ALCUNI ESEMPI 139 Il valore dell’integrale è zero a meno che la funzione integranda sia invariante rispetto a tutte le operazioni di simmetria del gruppo, o se almeno una sua parte sia invariante, cioè se costituisce o contiene una base per la rappresentazione totalsimmetrica del gruppo. Poichè l’operatore F è invariante rispetto a tutte le operazioni del gruppo, l’integrale è diverso da zero se la funzione φ∗1 φ2 appartiene alla rappresentazione totalsimmetrica. Possiamo considerare la funzione prodotto come un elemento della rappresentazione prodotto diretto α di due rappresentazioni α1 e α2 , cui appartengono rispettivamente φ∗1 e φ2 . Dalle proprietà delle rappresentazioni prodotto diretto, discende che α contiene la rappresentazione totalsimmetrica solo α1 = α2 . Infatti la componente aA della rappresentazione totalsimmetrica contenuta in α è aA = 1 X (α1 ) 1 X (α) ∗ χ (R) = χ (R) χ(α2 ) (R) = δα1 α2 h R h R (10.24) Il calcolo degli elementi di matrice dell’operatore hamiltoniano o dell’operatore di Fock può perciò essere notevolmente semplificati se si scelgono funzioni di base raggruppate secondo la loro appartenenza alle rappresentazioni irriducibili del gruppo di simmetria molecolare. Combinazioni lineari di orbitali determinate secondo questo criterio si dicono orbitali adattati per simmetria. La simmetria è infine conservata nella definizione degli autostati degeneri di un hamiltoniano. Nel caso infatti un hamiltoniano ammetta autostati degeneri è possibile dimostrare che Teorema Ogni autofunzione di un hamiltoniano di un sistema quantomeccanico corrisponde ad una rappresentazione irriducibile del gruppo di simmetria cui appartiene il sistema, vale a dire ogni insieme di autofunzioni relative ad un autovalore degenere g volte è base per una rappresentazione irriducibile di dimensione g. 10.7 Alcuni esempi Consideriamo un sistema costituito da un solo nucleo. Il gruppo di simmetria di appartenenza è il gruppo infinito delle rotazioni nello spazio R3 , in cui la rotazione di un angolo qualunque attorno ad un asse passante per il nucleo lascia il sistema invariato. Consideriamo ora le funzioni armoniche sferiche Ylml (θ, φ) per un dato valore di l: poichè per definizione una rotazione applicata ad una di queste 2l + 1 funzioni genera una loro combinazione lineare, costituiscono una base - che si può verificare essere irriducibile - del gruppo R3 . Gli autostati dell’hamiltoniano atomico saranno perciò almeno 2l + 1 degeneri e le autofunzioni avranno la forma generica φ(r, θ, φ) = R(r)Ylml (θ, φ) (10.25) dove R(r) è invariante per simmetria rotazione, quindi funzione del modulo r. I vari livelli energetici s, p, d sono dunque coincidenti con rappresentazioni irriducibili monodimensionali, tridimensionali, pentadimensionali del gruppo R3 . 140 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI Nel caso di molecole lineari omonucleari il gruppo di simmetria di appartenenza è, come abbiamo visto, D∞h . Lo stato fondamentale di una molecola lineare omonucleare apparterrà alla rappresen+ tazione irriducibile monodimensionale totalsimmetrica di D∞h , detta Σ+ proviene dal g (l’apice fatto che χ(σv ) = 1, mentre il pedice g è dovuto aχ(i) = 1). Lo stato successivo, primo singoletto eccitato, appartiene ancora ad un rappresentazione irriducibile monodimensionale, Σ+ u , antisimmetrica all’inversione. Continuando in questo modo possiamo classificare gli autostati degeneri appartenenti ad altre rappresentazioni, e.g. Πu , bidimensionale. Nella costruzione degli orbitali di simmetria adattati per il calcolo HF della molecola di idrogeno la scelta intuitiva di φg ∝ 1sA + 1sB e φu ∝ 1sA − 1sB si può quindi razionalizzare come la definizione di due funzioni di base rispetti+ vamente per Σ+ g e Σu . Consideriamo la base minimale per una calcolo HF relativo alla molecola di acqua, che appartiene al gruppo C2v : 1s per ciascun H e 1s,2s,2px,y,z per O. Gli AO si possono classificare facilmente secondo le rappresentazioni irriducibili di C2v √ A1 : 1s, 2s, 2pz , (1sH1 + 1sH2 )/ 2 B1 : 2px √ B2 : 2py , (1sH1 − 1sH2 )/ 2 Il calcolo HF è dunque fattorizzato in un blocco 4 × 4, in uno monodimensionale ed in uno 2 × 2. Lo stato fondamentale della molecola, che appartiene alla rappresentazione totalsimmetrica A1 di C2v ha la seguente configurazione: (1a1 )2 (2a1 )2 (1b2 )2 (3a1 )2 )(1b1 )2 dove 1a1 , 2a1 etc. sono orbitali atomici calcolati appartenenti ad A1 e cosı̀ via: la procedura HF genera perciò tre orbitali reali ed uno virtuale appartenenti alla A1 , un orbitale reale appartenente alla B1 , un orbitale reale ed uno virtuale appartenente alla B2 . 10.8 Un esempio non triviale: il benzene Discutiamo la scelta di un insieme di orbitali atomici SALC (Symmetry Adapted Linear Combination) per il benzene C6 H6 . La base minima per una calcolo HF è data da 36 orbitali atomici: sei di tipo 1s per ciascun idrogeno e sei insiemi 1s, 2s, 2p per ciascun carbonio. Nel caso degli orbitali 2p giacenti nel piano dell’anello, definiamo per ogni carbonio un sistema di riferimento locale, orientati in maniera tale da essere equivalenti per rotazione intorno all’asse di simmetria C6 del benzene, che appartiene al gruppo di simmetria D6h : per ogni carbonio scegliamo poi due opportune combinazioni lineari degli orbitali 2px e 2py che sono equivalenti per rotazione. Gli AO cosı̀ definiti si possono raggruppare secondo la tabella 10.1. Cosı̀ per esempio si possono costruire quattro orbitali molecolari appartenenti alla rappresentazione irriducibile A1g che coinvolgono gli orbitali degli idrogeni, gli orbitali 1s, 2s e 2p nel piano dei carboni, quattro orbitali molecolari appartenenti alla 10.8. UN ESEMPIO NON TRIVIALE: IL BENZENE 141 rappresentazione irriducibile tipo di funzioni di base numero di MO A1g 1sH , 1s, 2s, 2px,y 4 B1u 1sH , 1s, 2s, 2px,y 4 E1u 1sH , 1s, 2s, 2px,y 10 E2g 1sH , 1s, 2s, 2px,y 10 A2u 2pz 1 B2g 2pz 1 E1g 2pz 2 E2u 2pz 2 B2u 2px,y 2 Tabella 10.1: Rappresentazioni irriducibili e AO di base del benzene rappresentazione irriducibile B1u che coinvolgono gli orbitali degli idrogeni, gli orbitali 1s, 2s e 2p nel piano dei carboni etc. La matrice rappresentativa dell’operatore di Fock è perciò fattorizzabile in due blocchi 4 × 4, due 10 × 10 ed uno 2× che si riferiscono ad orbitali molecolari coinvolgenti legami nel piano dell’anello (A1g , B1u , E1u , E2u e B2u ) e due blocchi 1 × 1 e due blocchi 2 × 2 che si riferiscono ad orbitali molecolari coinvolgenti legami perpendicolari al piano dell’anello (A2u , B2g , E1g , E2u ). 142 CAPITOLO 10. TEORIA DEI GRUPPI DI SIMMETRIA ED ORBITALI MOLECOLARI y 1 6 2 x z 5 3 4 Figura 10.1: Set di orbitali 2p nel piano per il benzene Capitolo 11 Metodi semiempirici 11.1 Metodi semiempirici Come è stato già accennato nell’introduzione, i vari metodi semiempirici comportano l’introduzione di approssimazioni e semplificazioni nella forma degli hamiltoniani elettronici e nella definizione degli integrali mono e multi-centro che devono essere valutati nel corso di un calcolo esatto. È abbastanza difficile dare delle classificazioni generali dei vari metodi semiempirici. Di conseguenza discuteremo il piú semplice (e forse, malgrado tutto, ancora piú usato) schema semiempirico, l’approssimazione di Hückel, come un esempio particolare degli schemi generali di approssimazione tipici di molti metodi semiempirici. Questa Sezione si concluderà poi con un richiamo alla classe di metodi semiempirici del tipo NDO. Consideriamo innanzitutto l’approssimazione di Hückel Il metodo di Hückel è applicabile a molecole organiche, nelle quali sia possibile separare una classe di elettroni relativamente localizzati ed inattivi, tipicamente impegnati in legami σ, e un’insieme di elettroni delocalizzati e reattivi, impegnati in legami π. La natura di questa identificazione può non essere affatto chiara, anche se nei casi più comuni (p. es. l’insieme di legami coniugati nei sistemi aromatici) risulta essere abbastanza ovvia. Le classi piú comuni di molecole coinvolte sono: • Polieni lineari: es. 1,3-butadiene; • idrocarburi aromatici: benzene, naftalene; • etero-molecole aromatiche: piridina, furano, acroleina; Il sistema più semplice è il radicale planare CH3 · (1s)2 (Ω )2 (Ω )2 (Ω )2 (2p ) 1 2 3 z 2 Ωi = 1sH + λsp (1s)2 : inner shell (Ωi )2 : elettroni σ (2pz ) : elettrone π 143 144 CAPITOLO 11. METODI SEMIEMPIRICI 2p z H H C H Figura 11.1: Radicale CH3 · Un tentativo di sistematizzazione dell’approssimazione di Hückel è stato dato da Likos e Parr nell’ambito di un formalismo di partenza di tipo Hartree-Fock (vedi Appendice). Sotto le condizioni di separabilità σ −π si può separare il calcolo della parte della funzione d’onda riferita ai soli orbitali π. Le equazioni di Roothaan per l’hamiltoniano π−HF: Fπ C = ∆C² (11.1) generano il seguente problema agli autovalori per la determinazione dei livelli energetici: |Fπ − ²∆| = 0 (11.2) Come è tipico di quasi tutte le metodologie di calcolo semiempiriche, il passo successivo è dato dalla parametrizzazione degli elementi di matrice: ∆rs = δrs Frr = αr β r Frs = 0 atomi primi vicini altrimenti (11.3) (11.4) αr è l’integrale di Coulomb, βr è l’integrale di risonanza. In assenza di eteroatomi: αr = α βr = β (11.5) Ponendo x = (α − ²)/β, il calcolo è ricondotto alla diagonalizzazione della matrice topologica A: |A − x1| = 0 (11.6) 11.1. METODI SEMIEMPIRICI 2p 145 2p z z 2p C C 2p z z 2 1 C C 4 3 Figura 11.2: Esempio: 1,3-butadiene. dove Ars è 1 per atomi primi vicini, 0 altrimenti. Consideriamo p. es. il caso dell’1,3-butadiene. La matrice topologica è data da: A= 0 1 0 0 1 0 1 0 0 1 0 1 0 0 1 0 (11.7) Il gruppo di simmetria a cui appartiene il trans-1,3-butadiene è il C2h . C2h Ag Au Bg Bu E 1 1 1 1 C2 1 1 -1 -1 i 1 -1 1 -1 σh 1 -1 -1 1 Rz , x2 , y 2 , z 2 , xy z Rx , Ry , xz, yz x, y Tabella 11.1: Tabella dei caratteri del gruppo C2h Possiamo perciò utilizzare la simmetria delle funzioni di base nel gruppo C2h per semplificare il calcolo. La rappresentazione riducibile è 2Au ⊕ 2Bg . I livelli energetici calcolati corrispondono a due funzioni d’onda au e 2 funzioni d’onda bg : ²(2bg ) ²(2au ) ²(1bg ) ²(1au ) = = = = α − 1.618β α − 0.618β α + 0.618β α + 0.618β (11.8) 146 R̂ E C2 i σh CAPITOLO 11. METODI SEMIEMPIRICI R̂φ1 φ1 φ4 −φ4 −φ1 R̂φ2 φ2 φ3 −φ3 −φ2 R̂φ3 φ3 φ2 −φ2 −φ3 R̂φ4 φ4 φ1 −φ1 −φ4 Tabella 11.2: Funzioni φi in C2h la configurazione dello stato fondamentale è (1au )2 (1bg )2 =1 Ag Se si fosse partiti dall’isomero cis i risultati finali non sarebbero stati diversi (poichè la matrice topologica dipende solo dalla struttura topologica, cioè dalle connessioni tra atomi, e non dalla loro disposizione nello spazio), anche se si sarebbe dovuto impiegare, per sfruttare proprietà di simmetria, il gruppo C2v . 11.2 Neglect-of-differential-overlap (NDO) Concludiamo questa Sezione con un cenno alla classe di metodi semiempirici del tipo NDO. Il differential overlap tra due funzioni atomiche φk e φl è definito come la probabilità di trovare l’elettrone i-esimo in un elemento di volume comune: dkl = φk (i)φl (i) (11.9) L’approssimazione zero-differential-overlap (ZDO) consiste nel porre: dkl = dkk δkl (11.10) L’approssimazione ZDO comporta varie conseguenze nella valutazione dei gli integrali di overlap, di Coulomb etc.: Skl = hφk |φl i ∝ δkl overlap Nn = Zn hφk | r1ni |φl i ∝ δkl (11.11) interazione elettrone-nucleo J, K = hφk (i)φm (j)| r1ij |φl (i)φn (j)i ∝ δkl δmn scambio e repulsione (11.12) (11.13) Lascia però inalterati gli integrali che coinvolgono operatori differenziali: ˆ 2i |φl i Ii = hφk |∇ energia cinetica (11.14) I vari metodi semiempirici implicano sia regole di eliminazione o semplificazione degli integrali multicentro che di parametrizzazione di alcuni o tutti gli integrali rimanenti. I parametri ottimizzabili del calcolo sono di solito gli integrali a 1 elettrone e parti degli integrali a 2 elettroni (nel caso precedente dell’approssimazione di Hückel i numeri α e β). I vari schemi NDO corrispondono a diverse parametrizzazioni, fatta salva la comune applicazione a diversi livelli di sofisticazione, dell’approssimazione NDO. 11.2. NEGLECT-OF-DIFFERENTIAL-OVERLAP (NDO) 147 • Complete NDO; Pople et al.; adotta l’approssimazione ZDO – CNDO/1 – CNDO/2 • Intermediate NDO; adotta l’approssimazione ZDO solo per gli integrali a 2 centri • Modified NDO; Pople et al.; INDO con una parametrizzazione più complessa – MNDO/1 – MNDO/2 – MNDO/3 • Partial Neglect of Diatomic DO; MNDO solo per orbitali su centri diversi. Il metodo MNDO è stato utlizzato per calcolare calori di formazione, ottimizzare geometrie molecolari, calcolare potenziali di ionizzazione e momenti di dipolo, rivelandosi utile soprattutto per idrocarburi ciclici, ma dimostrando per esempio di non essere in grado di descrivere quantitativamente interazioni dovute a legami idrogeno. Metodi semiempirici più sofisticati sono ormai disponibili da molti anni in letteratura: ricordiamo tra gli altri i metodi PM3 e AM1. 148 CAPITOLO 11. METODI SEMIEMPIRICI Appendice A Funzioni speciali Questo capitolo è dedicato al riassunto delle proprietà di alcune classi di funzioni che ritornano spesso nelle soluzioni di problemi della meccanica quantistica. Si tratta di un compendio molto breve, e senza pretese di completezza, che ha il solo scopo di fornire un ‘formulario’ allo studente. A.1 Integrali ellittici Consideriamo gli integrali indefiniti1 Z I= · dxR x, ¸ q P (x) (A.1) dove R è una funzione razionale e P (x) è un polinomio di terzo o quarto grado. Si dimostra che I è sempre riducibile ad una funzione elementare di Z 1 I1 = dx q (A.2) (1 − x2 )(1 − k 2 x2 ) √ Z 1 − k 2 x2 I2 = dx √ (A.3) 1 − x2 Z 1 q I3 = dx (A.4) (1 + n2 x2 ) (1 − x2 )(1 − k 2 x2 ) che sono rispettivamente integrali ellittici di prima, seconda e terza specie nella forma di Legendre. La quantità k è detta modulo degli integrali. Altre espressioni utili sono le seguenti Rψ √ 1 2 F (ψ, k) = 0 dα 2 Rψ q (1−k sin α) 2 2 E(ψ, k) = 0 dα (1 − k sin α) F (ψ,k)−E(ψ,k) D(ψ, k) = k2 Rψ 1 √ Π(ψ, n, k) = 0 dα 2 2 2 2 (1+n sin α) (A.5) (1−k sin α) Gli integrali per ψ = π/2 si dicono integrali ellittici completi. 1 Nel seguito, se non altrimenti specificato si usa x per una variabile reale e z per una variabile complessa. 149 150 APPENDICE A. FUNZIONI SPECIALI A.2 Funzione gamma Definiamo la funzione gamma sotto forma di integrale di Eulero: Γ(z) = Z ∞ 0 dttz−1 e−t (A.6) Per z = n + 1 (n intero) la funzione gamma coincide con il fattoriale di n: Γ(n + 1) = n! (A.7) Vale la seguente espansione: 1 = zeγz Π∞ n=1 Γ(z) ·µ ¶ z −z/n 1+ e n ¸ (A.8) dove γ è la costante di Eulero: µ γ = limm→∞ ¶ 1 1 1 1 1 + + + + ... + − ln m = 0.5772156649 . . . 2 3 4 m (A.9) Di interesse è l’espansione per |z| → ∞ (formula di Stirling): −z z−1/2 Γ(z) ∼ e z A.3 √ µ 1 1 139 571 2π 1 + + − − + ... 2 3 12z 288z 51840z 2488320z 4 ¶ (A.10) Funzione dell’errore La funzione dell’errore è definita come: 2 Zz 2 √ erf(z) = dte−t π 0 (A.11) La funzione complementare erfc(z) è 1 − erf(z). Alcune relazioni utili sono le seguenti: dn+1 n 2 −z 2 √ erf(z) = (−1) H (z)e n dz n+1 z (A.12) 2 X (−1)n z 2n+1 erf(z) = √ z n=0 n!(2n + 1) (A.13) √ 2 πzez erfc(z) ∼ 1 + X (−1)n n=1 Z −(ax2 +2bx+c) dxe 1 · 3 · . . . (2n − 1) (2z 2 )n |z| → ∞ à ! √ √ 1 π b2 −ac b e a erf = ax + √ + costante 2 a a (A.14) (A.15) A.4. FUNZIONI DI BESSEL A.4 151 Funzioni di Bessel Sia ν un numero reale non-negativo. Le funzioni di Bessel del primo tipo J±ν (z) e del secondo tipo Y±ν (z) verificano la seguente equazione differenziale: d2 w dw + z + (z 2 − ν 2 )w = 0 (A.16) dz 2 dz Sono funzioni regolari, finite a z = 0; J±ν (z) ha un estremo superiore finito per <z → ∞. Le funzioni di Bessel modificate I±ν (z) e Kν (z) sono soluzioni dell’equazione differenziale z2 d2 w dw +z − (z 2 + ν 2 )w = 0 (A.17) 2 dz dz II±ν (z) tende ad un valore finito per z → 0. Le funzioni di Bessel sono utili p.es. per la soluzione di equazioni differenziali in problemi con una simmetria cilindrica (vedi II Dispensa). Valgono le seguenti relazioni: z2 1 Zπ Jn (z) = n dθeiz cos θ cos(nθ) i π 0 In (z) = (A.18) 1Zπ dθez cos θ cos(nθ) π 0 A.5 (A.19) Polinomi ortogonali È data una funzione reale non negativa w(x) ed un intervallo [a, b]. Supponiamo che Z b a dxxn w(x) esista per n naturale (0,1,2, . . .), e che sia positivo per n = 0. Allora esiste una successione di polinomi p0 (x), p1 (x), p2 (x) etc. determinata univocamente dalle condizioni: 1. pn (x) è un polinomio di grado n; il coefficiente qn di xn in pn (x) è positivo 2. i polinomi pn (x) sono ortogonali rispetto al prodotto scalare hf |gi = hpm |pn i = δmn km Z b a dxw(x)f (x)g(x): (A.20) dove km è la norma km = hpm |pm i. La successione costituisce un set di polinomi ortogonali su [a, b] rispetto alla funzione peso w(x). Valgono le seguenti relazioni generali 1. Relazione di Christoffel-Darboux X k=0 n pk (x)pk (y) = qn pn+1 (x)pn (y) − px (x)pn+1 (y) qn+1 x−y (A.21) 2. Relazione ricorsiva pn+1 (x) = (an x + bn )pn (x) − cn pn−1 (x) n ≥ 1 (A.22) 152 A.6 APPENDICE A. FUNZIONI SPECIALI Polinomi di Legendre I polinomi di Legendre Pn (x) sono definiti in [−1, 1]. Verificano l’equazione differenziale: (1 − x2 ) d2 Pn (x) dPn (x) − 2x + n(n + 1)Pn (x) = 0 2 dx dx (A.23) La funzione peso è w = 1, la norma è kn = 2/2n + 1. La relazione ricorsiva è: (n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x) (A.24) dove P0 (x) = 1, P1 (x) = x. A.7 Polinomi di Hermite I polinomi di Hermite Hn (x) sono definiti in [−∞, ∞]. Verificano l’equazione differenziale: d2 Hn (x) dHn (x) − 2x + 2nHn (x) = 0 dx2 dx 2 La funzione peso è w = e−x , la norma è kn = (A.25) √ π2n n!. La relazione ricorsiva è: Hn+1 (x) = 2nxHn (x) − 2nHn−1 (x) (A.26) dove H0 (x) = 1, H1 (x) = 2x. A.8 Polinomi di Laguerre I polinomi di Laguerre Ln (x) sono definiti in [0, ∞]. Verificano l’equazione differenziale: x d2 Ln (x) dLn (x) + (1 − x) + nLn (x) = 0 2 dx dx (A.27) La funzione peso è w = e−x , la norma è 1. La relazione ricorsiva è: (n + 1)Ln+1 (x) = (2n + 1 − x)Ln (x) − nLn−1 (x) dove L0 (x) = 1, L1 (x) = 1 − x. (A.28) Appendice B L’atomo idrogenoide L’hamiltoniano in unità atomiche è: 1 ˆ2 1 ˆ2 Z H=− ∇R − ∇ e − ~ 2mZ 2 |R − ~re | (B.1) ~ e ~re la posizione del nucleo e dell’elettrone, e con ∇ ˆ2 e ∇ ˆ e i relativi gradidove indichiamo con R R enti. Possiamo procedere come nell’Esercizio 1 ed introdurre le variabili di spostamento relativo ~ e ~rc = ~re +mZ R~ , dove M = 1 + mZ è la massa dell’elettrone e di centro di massa: ~r = ~re − R M totale del sistema. Rispetto alle nuove coordinate l’hamiltoniano risulta definito come la somma dell’hamiltoniano relativo al moto libero del baricentro con massa M e dell’hamiltoniano relativo al moto dell’elettrone rispetto ad un nucleo a riposo, ed avente massa ridotta µ = mZ /M in unità atomiche. In unità atomiche l’hamiltoniano separato risulta essere: H=− 1 ˆ2 Z 1 ˆ2 ∇ − ∇ − 2µ 2M c r (B.2) dove ora r è la distanza tra il baricentro e l’elettrone. La parte relativa al baricentro determina il moto traslazionale libero dell’atomo, e non sarà considerata oltre. La parte elettronica può essere scritta come l’hamiltoniano di una particella di carica -1 che si muova nel campo di potenziale elettrostatico generato da un nucleo immobile di carica Z, e avente massa µ: H=− 1 ˆ2 Z − ∇ r 2µ (B.3) Nel seguito considereremo µ ≈ 1: per Z = 1, assumendo per mZ la massa di un protone avremmo µ = 0.9994. Il potenziale è a simmetria radiale. Possiamo perciò procedere risolvendo il sistema nel seguente modo i) introduzione di coordinate sferiche (r, θ, φ); ii) fattorizzazione della funzione d’onda in una parte angolare dipendente da θ e φ e in una parte radiale dipendente da r; iii) imposizione di condizioni al contorno per il calcolo delle autoenergie. La parte angolare dell’autofunzione è data dalle funzioni armoniche sferiche (ciò è vero per qualunque potenziale a simmetria sferica) ΨE (r, θ, φ) = R(r)Ylml (θ, φ) (B.4) 153 154 APPENDICE B. L’ATOMO IDROGENOIDE Sostituendo nell’Eq. di Schrödinger si trova l’equazione per la parte radiale: " # 1 d 2 dR Z l(l + 1) r +2 E+ − R=0 2 r dr dr r 2r2 (B.5) Lo spettro degli autovalori sarà discreto per E < 0, e continuo per E > 0 (il potenziale coulombiano tende a zero per r → ∞ e a −∞ per r → 0). L’equazione differenziale in R, con le condizioni al contorno R finita per r → 0 e r → ∞ è riconoscibile come l’equazione che ha per soluzione delle funzioni note: le funzioni associate di Laguerre (moltiplicate per l’esponenziale di −r). In definitiva gli autostati e le autoenergie (in Hartree) dell’atomo di idrogeno sono: Ψn,l,ml (r, θ, φ) = Rnl (r)Ylml (θ, φ) (B.6) v u u (n − l − 1)!Z Rnl = t 2 ρl+1 L2l+1 n+l (ρ) exp(−ρ/2) 3 (B.7) n [(n + l)!] En,l,ml = − Z2 2n2 (B.8) dove ρ = 2Zr/na; Lαn (ρ) è un polinomio di Laguerre di grado n ed ordine α. Gli autostati discreti sono negativi e dipendono solo da 1/n2 . Appendice C Separazione del baricentro È data una collezione di punti materiali, che per convenienza dividiamo in due sottoinsiemi ~ri , ~ i , p = 1, . . . , M , con masse Mi (nel i = 1, . . . , N , con masse mi (nel seguito particelle ’leggere’) e R seguito particelle ’pesanti’). Definiamo l’hamiltoniano del sistema in unità atomiche H=T +V T =− V = (C.1) N X M 1 ˆ2 X 1 ˆ2 ∇i − ∇p p=1 2Mp i=1 2mi X V (~ri − ~rj ) + i<j X ~ p) + V (~ri − R (C.2) X ~p − R ~ q) V (R (C.3) p<q i,p dove l’unica assunzione è che l’energia potenziale sia data da sole interazioni a coppie dipendenti dalle distanze vettoriali relative. Vogliamo dimostrare che il baricentro del sistema è una coordinata separabile. A questo scopo, introduciamo il nuovo set di coordinate: ´ ³P P N 1 ~ ~c = ri + M R p=1 Mp Rp i=1 mi~ MT ~xi ~p Q P ~ = ~ri − M1 M i = 1, . . . , N p=1 Mp Rp ~p − R ~ p+1 = R p = 1, . . . , M (C.4) dove M è la massa totale delle particelle pesanti, MT è la massa totale del sistema; abbiamo definito cioè il vettore del centro di massa del sistema, le N coordinate delle particelle leggere relative al baricentro delle particelle pesanti, ed M − 1 coordinate vettoriali ottenute come le prime m − 1 ~ p : complessivamente i gradi di libertà del sistema sono 3 + 3N + 3(M − 1) = differenze tra i vettori R ~ c . Possiamo facilmente esprimere 3(N +M ). Dimostriamo che l’energia potenziale non dipende da R ~ 2, . . . , R ~ M e ~r1 , . . . , ~rN in funzione delle nuove coordinate e di R ~ 1: le vecchie coordinate R ~ ~p = ~ 1 − Pp−1 p>1 R R q=1 Qq (C.5) P P p−1 ~ M 1 ~ 1 + ~xi − ~ri = R q=1 Qq M p=2 ~ 1 è funzione di tutte le nuove coordinate, compreso R ~ c ; ma nell’energia potenziale compaiono R ~ c . Calcoliamo ora solo differenze tra le posizioni delle particelle, e quindi V è indipendente da R 155 156 APPENDICE C. SEPARAZIONE DEL BARICENTRO l’operatore di energia cinetica nelle nuove coordinate vettoriali. Il gradiente relativo alla i-esima particella leggera è ˆ i = mi ∇ ˆc +∇ ˆx ∇ i MT (C.6) ˆ x indichiamo il gradiente rispetto ~xi , con ∇ ˆ c rispetto a R ~ c . Segue che dove con ∇ i mi ˆ 2 2 ˆ ˆ 1 ˆ2 1 ˆ2 ∇i = 2 ∇ ∇x i + ∇c · ∇x i c + mi MT mi MT (C.7) Il gradiente relativo alla p-esima particella pesante è n X ˆ p = MP ∇ ˆ c − MP ˆx +∇ ˆ Qp − ∇ ˆ Qp−1 ∇ ∇ MT M i=1 i (C.8) ˆ Qp indichiamo il gradiente rispetto Q ~ p . Segue che dove con ∇ ´2 1 ˆ2 MP ˆ 2 MP X ˆ 1 ³ˆ ˆ ˆ ∇p = ∇ + ∇ ∇ · ∇ − ∇ + xi xj Qp Qp−1 MP MT2 c M i,j MP N n ´ ´ X 2 ³ˆ 2MP X 2 ˆ ³ˆ ˆ ˆ ˆ ˆ ˆx ∇Qp − ∇Qp−1 · ∇c · ∇xi + ∇c · ∇Qp − ∇Qp−1 − ∇ − i MT M i=1 MT M i=1 (C.9) Si può verificare che sostituendo le precedenti equazioni nell’espressione per l’energia cinetica otteniamo: M N ´ X 1 Xˆ 1 ³ˆ 1 ˆ2 X 1 ˆ2 ˆ ˆ Qp−1 2 ∇xi · ∇xj − ∇Qp − ∇ T =− ∇c − ∇x i − 2MT 2M i,j p=1 2MP i=1 2mi (C.10) il primo termine è relativo al moto traslazionale libero del baricentro; il secondo all’energia cinetica delle particelle leggere corretto dal terzo termine detto di polarizzazione di massa; il quarto è ~ p. l’energia cinetica delle particelle pesanti espressa nelle coordinate interne Q Appendice D Problema generalizzato agli autovalori Consideriamo l’equazione di Schrödinger indipendente dal tempo per le autofunzioni dell’operatore di Hamilton relativo ad un sistema definito rispetto alle coordinate q. Una (auto)-funzione Ψ(q) è un elemento dello spazio di Hilbert delle funzioni in q, e sarà indicata nel seguito con il ket |Ψi H|Ψi = E|Ψi (D.1) Introduciamo ora un insieme di funzioni linearmente indipendenti che costituiscano una base, non necessariamente ortonormale, nello spazio di Hilbert |v1 i, |v2 i, . . .; possiamo perciò esprimere |Ψi come una combinazione lineare degli elementi della base: |Ψi = X cj |vj i (D.2) j Sostituendo nella (D.1) e premoltiplicando per il generico bra hvi |: X hvi |H|vj icj = E j X hvi |vj icj (D.3) j che in notazione matriciale si può scrivere come Hc = ESc (D.4) dove Hij = hvi |H|vj i, Sij = hvi |vj i. Se la base è ortonormale, la matrice di overlap S coincide con la matrice unità, Sij = δij , e dunque Hc = Ec (D.5) In pratica, se la dimensione dello spazio hilbertiano considerato è infinita, il set di funzioni di base utilizzato viene troncato ad un numero finito N , introducendo un’approssimazione che dipende da N . Soluzioni non-triviali del sistema N -dimensionale (D.4) si ottengono dalle radici dell’equazione secolare: det(H − ES) = 0 (D.6) 157 158 APPENDICE D. PROBLEMA GENERALIZZATO AGLI AUTOVALORI Si ottengono N autovalori Ei , i = 1, . . . , N cui corrispondono N autovettori ci . Se si definisce la matrice C le cui colonne sono autovettori, Cij = (cj )i la matrice diagonale i cui elementi sono diagonali sono gli autovalori, Eij = δij Ej , risulta che: HC = SCE (D.7) Appendice E Valore di attesa per un guscio chiuso Assumiamo che le funzioni orbitali (spaziali) siano ortonormali: Z dqµ φ∗i (µ)φj (µ) = hφi |φj i = δi,j (E.1) Il valore di attesa dell’hamiltoniano H si può dividere in un contributo monoelettronico e in un termine bi-elettronico. Indicando con Si il generico spinorbitale E= X (−)P hS1 (1)S2 (2) . . . SN (N )| PN n=1 ĥ(n) + P P 1 n<n0 rn,n0 |P̂ S1 (1)S2 (2) . . . SN (N )i (E.2) Il contributo monoelettronico si può calcolare distinguendo i vari casi: Permutazione identica. Somma di N/2 termini in ordine zero: N X N/2 hSn (n)|ĥ(n)|Sn (n)i = 2 n X N/2 hφi (n)|ĥ(n)|φi (n)i = 2 i=1 X hi (E.3) i=1 Altre permutazioni. Contributo nullo, a causa dell’ortogonalità di spin. Si procede in modo analogo per il contributo bi-elettronico: Permutazione identica, n dispari, n0 = n + 1. Somma di integrali a due centri: X n disp.,n0 =n+1 hSn (n)Sn (n)| r 1 0 |Sn (n)Sn (n)i = nn N X i=1 N/2 hφi (n)φi (n0 )| r 1 0 |φi (n)φi (n0 )i = nn X Jii (E.4) i=1 Permutazione identica, altri valori di n e n0 . Somma di integrali a due centri: X n,n0 N/2 0 hSn (n)Sn0 (n )| r 1 0 |Sn (n)Sn0 (n )i = 4 0 nn X i<j N/2 0 hφi (n)φj (n )| r 159 1 0 |φi (n)φj (n )i = 4 0 nn X i<j Jij (E.5) 160 APPENDICE E. VALORE DI ATTESA PER UN GUSCIO CHIUSO Permutazioni di due elettroni. Somma di integrali a due centri: X − n<n0 N/2 hSn (n)Sn0 (n0 )| r 1 0 |Sn0 (n)Sn (n0 )i = −2 nn X i<j N/2 hφi (n)φj (n0 )| r 1 0 |φj (n)φi (n0 )i = −2 nn X Kij (E.6) i<j Altre permutazioni. Contributo nullo, a causa dell’ortogonalità della parte spaziale. Poichè Jij = Jji , Kij = Kji , Jii = Kii , resta l’espressione: N/2 N/2 E=2 X i hi + X (2Jij − Kij ) i,j dove Jij e Kij sono gli integrali di Coulomb e di scambio. (E.7) Appendice F Separabilità σ − π (Likos-Parr) Le condizioni di separabilità σ −π per una funzione d’onda multielettronica si possono scrivere nella forma: 1. è dato un sistema di N elettroni, nσ di tipo σ, nπ di tipo π: nσ + nπ = N (F.1) 2. la funzione d’onda è approssimata da un prodotto (simmetrizzato) di una funzione σ ed una funzione π: Ψ(1, 2, . . . , N ) = RΨσ (1, 2, . . . , nσ )Ψπ (nσ + 1, nσ+1 , . . . , nπ ) (F.2) R è l’operatore somma di tutte i possibili scambi tra elettroni σ e π; 3. le funzioni σ e π sono combinazioni lineari di determinanti di Slater, costruiti a partire da opportuni spin-orbitali P Ψσ = k ak Dk {Dk } ←- {SσI } P Ψπ = l bl Dl {Dl } ←- {SπJ } (F.3) 4. le due funzioni d’onda sono normalizzate: hΨσ |Ψσ i = hΨπ |Ψπ i = hΨ|Ψi (F.4) Le condizioni 1.-4. costituiscono l’approssimazione di separabilità σ − π. 161 162 APPENDICE F. SEPARABILITÀ σ − π (LIKOS-PARR) La funzione d’onda complessiva (nel caso Ψσ e Ψπ siano date ciascuna da un solo determinante di Slater) è data da: ¯ ¯ Sσ1 (1) ¯ ¯ .. ¯ ¯ . ¯ ¯ ¯ Sσ1 (nσ ) µ ¶ 1 1/2 ¯¯ Ψ(1, 2, . . . , N ) = ¯ ¯ N! ¯ ¯ Sσ1 (nσ + 1) ¯ ¯ .. ¯ . ¯ ¯ ¯ Sσ1 (N ) ... Sσnσ (1) .. . Sπnσ +1 (1) .. . ... Sσnσ (nσ ) Sπnσ +1 (nσ ) . . . Sσnσ (nσ + 1) .. . ... Sσnσ (N ) Sπnσ +1 (nσ + 1) .. . Sπnσ +1 (N ) ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ... SπN (nσ ) ¯¯ ¯ ¯(F.5) ¯ . . . SπN (nσ + 1) ¯¯ ¯ ¯ .. ¯ . ¯ ¯ ... SπnN (N ) ¯ ... SπN (1) .. . L’hamiltoniano molecolare elettronico si può scrivere nel modo consueto, evidenziando i due gruppi di elettroni: (0) H = H(0) σ + Hπ + Hσπ (0) Hi ni ni X Zk X 1 1X 2 ˆ ∇µ − =− + 2 µ µ,ν rµν µ,k rµk Hσπ = Hπ = core i = σ, π (F.7) nσ X nπ X 1 µ ĥµ (F.6) H(0) π ν (F.8) rµν + Hσπ = nπ X core µ ĥµ + nπ X 1 µ<ν (F.9) rµν nσ 1 ˆ 2 X Zk X 1 =− ∇ − + µ 2 ν rµν k rµk (F.10) Se si trascura lo scambio σ − π, il valore di attesa è dato dalla somma di valori di attesa: (0) (0) hHiav = hHπ + H(0) σ iav = hΨπ |Hπ |Ψπ i + hΨσ |Hσ |Ψσ i = Eπ + Eσ (F.11) Si può considerare Eσ(0) costante; resta definito l’operatore π−HF, rispetto ai soli elettroni π: F̂π = ĥ core + X (2Jˆj − K̂j ) j (F.12) Bibliografia [1] L.D. Landau e E.M. Lifšits, Meccanica Classica, (Editori Riuniti, 1982). [2] A. Rostagni, Fisica Generale, (UTET, Torino 1973). [3] H. Goldstein, Classical Mechanics, (Addison-Wesley, 1980). [4] C.L. Perrin, Mathematics for Chemists, (Wiley, New York, 1970). [5] M. Abramowitz e I. Stegun, Handbook of Mathematical Functions, (Dover, New York, 1972). [6] H.D. Ikramov, Linear Algebra: Problems Book, (Mir Publishers, Mosca, 1983). [7] R.J. Jacob, in Physical Chemistry: an Advanced Treatise, Vol. XI A, Cap. 1. [8] S. Lang, Algebra Lineare, (Boringhieri, Torino, 1984). [9] D. Henderson, in Physical Chemistry: an Advanced Treatise, Vol. XI A, Cap. 4. [10] I.S. Gradshtein e I.M. Ryzhik, Table of Integrals, Series and Products (Academic Press, New York, 1972). [11] P.W. Atkins, Molecular Quantum Chemistry, (Oxford, 1983). [12] L.D. Landau e E.M. Lifšits, Meccanica Quantistica, (Editori Riuniti, 1982). [13] AA. VV., Modern Theoretical Chemistry voll. 3,4, ed. G.A. Segal (Plenum Press, N.Y. 1977). [14] AA. VV., Modern Theoretical Chemistry voll. 7,8, ed. G.A. Segal (Plenum Press, N.Y. 1977). [15] F.L. Pilar, Elementary Quantum Chemistry 2a edizione, (McGraw-Hill, N.Y. 1990). [16] W.J. Hehre, R.F. Stewart and J.A. Pople, J. Chem. Phys 51, 2657 (1969). [17] M.J.S. Dewar, E.G. Zoebisch, E.F. Healy and J.J.P. Stewart, J. Am. Chem. Soc. 107 163