Appunti del corso Aspetti Matematici della Meccanica Quantistica (FM450 – A.A. 2014/15) Michele Correggi Dipartimento di Matematica e Fisica, Università degli Studi Roma Tre, L.go San Leonardo Murialdo, 1, 00146, Roma email: [email protected] 11 luglio 2015 versione provvisoria (riportare errori e refusi a [email protected]) Indice I Introduzione alla Meccanica Quantistica 5 1 Crisi della Fisica Classica 6 1.1 Meccanica Newtoniana e Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Corpo Nero e Effetto Fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.3 Modelli Atomici: da Democrito a Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2 I Postulati della Meccanica Quantistica 14 2.1 Cinematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2 Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3 Spazi di Hilbert e Teoria degli Operatori 3.1 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . 3.2 Trasformata di Fourier, Spazi di Sobolev e Distribuzioni 3.3 Operatori Lineari . . . . . . . . . . . . . . . . . . . . . . 3.4 Operatore Aggiunto e Inverso . . . . . . . . . . . . . . . 3.5 Operatori Simmetrici, Autoaggiunti, Unitari e Proiettori 3.6 Principio di Indeterminazione . . . . . . . . . . . . . . . 3.7 Criterio di Autoaggiunzione e Estensioni Autoaggiunte . 3.8 Spettro e Risolvente . . . . . . . . . . . . . . . . . . . . 3.9 Teorema Spettrale e Interpretazione Probabilistica . . . 3.10 Caratterizzazione dello Spettro . . . . . . . . . . . . . . 3.11 Operatori Compatti . . . . . . . . . . . . . . . . . . . . 3.12 Matrice Densità e Stati Misti . . . . . . . . . . . . . . . 3.13 Teorema di Stone e Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 17 23 25 28 32 36 37 42 46 54 57 59 60 4 Particella Libera e Oscillatore Armonico 4.1 La Particella Libera: Osservabili e Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Evoluzione Libera di Pacchetti d’Onda: Dispersione e Interferenza . . . . . . . . . . . . . . . 4.3 L’Oscillatore Armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 63 66 71 5 Atomo di Idrogeno 5.1 Autoaggiunzione e Stabilità 5.2 Spettro Energetico . . . . . 5.3 Momento Angolare . . . . . 5.4 Stati Legati . . . . . . . . . 77 77 80 84 88 II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stato Fondamentale e Stati Legati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6 Stato Fondamentale 95 6.1 Stabilità di Prima Specie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2 Esistenza dello Stato Fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 1 2 6.3 Unicità dello Stato Fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 7 Stati Eccitati 107 7.1 Proprietà degli Stati Eccitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 III Stabilità della Materia 109 8 Stabilità di Prima Specie 9 Particelle Identiche e Stabilità di Seconda Specie 9.1 Spin e Particelle Identiche . . . . . . . . . . . . . . 9.2 Matrici Densità Ridotte . . . . . . . . . . . . . . . 9.3 Sistemi a Molti Corpi Non Interagenti . . . . . . . 9.4 Stabilità di Seconda Specie e Proprietà Preliminari 112 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 115 119 122 125 10 Disuguaglianze di Lieb-Thirring 128 10.1 Teoria di Birman-Schwinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 10.2 Dimostrazione delle Disuguaglianze di Lieb-Thirring . . . . . . . . . . . . . . . . . . . . . . . 135 11 Elettrostatica 138 12 Stabilità di Seconda Specie 147 12.1 Dimostrazioni Alternative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 12.2 Conseguenze della Stabilità di Seconda Specie . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 Notazione • vettori in Rd o Cd saranno indicati con lettere in grassetto, ad esempio x o v, gli scalari in R o C saranno invece indicati come, ad esempio, x e v; nel caso in cui non ci sia rischio di ambiguità useremo inoltre la convenzione di indicare con x := |x| il modulo del relativo vettore; • dati due vettori u e v in Rd il prodotto scalare sarà indicato con u·v = d X ui vi , i=1 mentre, usando la notazione ijk per il tensore di Levi-Civita totalmente antisimmetrico, il prodotto vettore sarà indicato con d X u×v = ijk ui vj ei ; i,j,k=1 • dato un qualunque numero z ∈ C indicheremo con z ∗ il suo complesso coniugato; • il prodotto scalare in Cd sarà indicato come in Rd ovvero se z, w ∈ Cd , z·w = d X zi∗ wi ; i=1 • la palla di centro x ∈ Rd e raggio % > 0 sarà indicata con B% (x); • per la derivata rispetto a x ∈ R useremo la notazione sintetica ∂x = ∂ ∂x ; • la funzione caratteristica di un insieme S sarà indicata con 1S (·); • per le norme useremo sempre la notazione k · k; in assenza di ambiguità useremo tale espressione anche per indicare la norma L2 , mentre le norme Lp saranno indicate con k · kp ; • useremo la notazione H p (I) per indicare lo spazio di Sobolev di indice p > 0; • dato uno spazio di Hilbert H useremo le seguenti notazione per gli spazi di operatori da H in se stesso: – L (H ) operatori lineari; – B(H ) operatori limitati; – L 1 (H ) operatori classe traccia; – L 2 (H ) operatori Hilbert-Schmidt; – L k (H ) ideale di Schatten di ordine k ∈ N; • utilizzeremo spesso i simboli di Landau per lo studio degli andamenti asintotici: siano f (x) e g(x) ≥ 0 due funzioni continue di x, allora diremo che |f | ≤ C < +∞; x→0 g – f = O(g), se lim 3 4 – f = o(g), se lim x→0 |f | = 0; g |f | = C < +∞ e C > 0; x→0 g – f g, se f = o(g); – f ∼ g, se lim – f g, se f ≥ 0 e g = o(f ); con definizioni analoghe nel caso x → x0 o x → ∞. Parte I Introduzione alla Meccanica Quantistica 5 Capitolo 1 Crisi della Fisica Classica Fondata sui pilastri della meccanica newtoniana (o hamiltoniana) e della teoria dell’elettromagnetismo di Maxwell, la fisica alla fine del 1800 si presentava come una solida teoria in grado di descrivere i fenomeni naturali fondamentali. Negli anni a cavallo fra la fine del secolo XIX e l’inizio di quello successivo, la scoperta di una serie di fenomeni totalmente incompatibili con le teorie fisiche classiche e genericamente associati al comportamento di oggetti microscopici portò ad una crisi che sarebbe state superata da lı̀ a poco solamente con l’avvento della Meccanica Quantistica (MQ). In questo capitolo, dopo alcuni brevi richiami sulla meccanica newtoniana e hamiltoniana e la teoria dell’elettromagnetismo, discuteremo come avvenne storicamente questa rivoluzione. 1.1 Meccanica Newtoniana e Hamiltoniana Rivediamo brevemente in questa Sezione i due pilastri su cui si fondava la fisica classica alla fine dell 1800, la meccanica newtoniana e la teoria dell’elettromagnetismo. Il sistema elementare in meccanica newtoniana è il punto materiale ovvero un massa m > 0 concentrata in un punto nello spazio R3 , che può quindi essere individuato dalla posizione x ∈ R3 . Un’altra caratteristica fisica che caratterizza il sistema è la carica elettrica e, che sarà poi rilevante per determinare come si interfaccia il punto materiale con la teoria dell’elettromagnetismo. La dinamica di tale sistema è completamente descritta dall’equazione di Newton mẍ = F(x, ẋ, t), (1.1) e dalle condizioni iniziali x(0) = x0 e ẋ(0) = v0 , cioè , sotto ragionevoli ipotesi di regolarità su F (ad esempio F lipschitziana), una volta assegnati tali dati iniziali la traiettoria x(t), ẋ(t) è determinata ad ogni tempo t ∈ R. Il campo elettromagnetico è dato dalla coppia formata dal campo elettrico E(x) e dal campo magnetico B(x), che sono entrambi funzioni vettoriali: Ω ⊂ R3 → R3 . I campi si ottengono risolvendo le equazioni di Maxwell: ∇ · E = 4πρ, 1 ∂B ∇×E = − , c ∂t ∇ · B = 0, 4πj 1 ∂E ∇×B = + , c c ∂t (1.2) (1.3) (1.4) (1.5) dove ρ è la densità di carica e j la densità di corrente. E’ curioso osservare che le equazioni di Maxwell sono apparentemente 8 equazioni in 6 incognite, ma il sistema è comunque ben definito perché delle 8 equazioni solo 6 sono indipendenti. E’ infatti facile vedere che le 2 equazioni vettoriali in aggiunta con le proprietà dei dati iniziali implicano le due equazioni scalari: se poniamo E(0) = E0 , B(0) = B0 , con E0 , B0 tali che ∇ · E0 = 4πρ(0), 6 ∇ · B0 = 0, 7 allora prendendo la divergenza delle due equazioni vettoriali otteniamo ∂t (∇ · E) + 4π∇ · j = 0 ∂t (∇ · B) = 0, e la seconda implica immediatamente ∇ · B = 0, mentre la prima combinata con l’equazione di continuità ∂t ρ + ∇ · j = 0, (1.6) dà la prima equazione di Maxwell. Una distribuzione di carica ρ(x, t) con corrente j(x, t) subisce nel campo elettromagnetico E(x, t), B(x, t) la densità di forza 1 F(t) = ρ(x, t)E(x, t) + j(x, t) × B(x, t). c Nel caso elementare di un punto elementare ρ(x, t) = eδ(x − x(t)) e j(x, t) = eẋ(t)δ(x − x(t)) e si riottiene la forza di Lorentz e l’equazione di Newton e mẍ = FLorentz (x, t) = eE(x, t) + ẋ × B(x, t). c (1.7) Ricordiamo inoltre che la densità di energia del campo elettromagnetico è data dalla quantità E(x, t) = 1 |E(x, t)|2 + |B(x, t)|2 . 8π (1.8) Il vettore di Poynting 1 E(x, t) × B(x, t), 8π entra nella variazione dell’energia del campo elettromagnetico come descritto nella successiva S(x, t) = Proposizione 1.1 (Bilancio energetico del campo elettromagnetico). Sia Ω ⊂ R3 una regione compatta e n il versore normale a ∂Ω in direzione uscente, allora Z Z Z ∂t dx E(x, t) = − dx j(x, t) · E(x, t) − dσ n · S(x, t). Ω Ω (1.9) ∂Ω Osservazione 1.1. Una conseguenza più o meno diretta della precedente Proposizione 1.1 è che, se consideriamo un sistema di cariche confinato in una regione limitata, ad esempio contenuta in una palla di raggio R, e i campi E e B decadono quando |x| → ∞ abbastanza rapidamente, cioè più velocemente di |x|−1 , il secondo termine (di superficie) nella (1.9) si può trascurare. Se al contrario i campi decadono come |x|−1 o più lentamente, nel qual caso si dicono radiativi, il termine di superficie dà un contributo finito e non nullo per ogni t. Ricordiamo ora alcuni concetti essenziali del formalismo hamiltoniano della meccanica classica: lo spazio degli stati puri di un sistema classica è dato dell’insieme dei punti (p, q) nello spazio delle fasi Γ ⊂ R2d . Le equazioni del moto vengono espresse attraverso una funzione speciale sullo spazio delle fasi, l’Hamiltoniana del sistema H(p, q) : Γ → R che assumiamo tempo-indipendente e C 1 (Γ): ∂H , ∂p ∂H ṗ = − , ∂q q̇ = (1.10) con dati iniziali (p(0), q(0)) = (p0 , q0 ). Naturalmente la soluzione del problema di Cauchy determina la traiettoria del sistema ad ogni tempo t ∈ R. Le Hamiltoniane di alcuni sistemi elementari sono qui di seguito elencate: 8 • punto materiale o particella libera di massa m in Rd : H= |p|2 ; 2m • particella di massa m immersa nel campo conservativo V (q) (sottoposta alla forza F(q) = −∇V ): H= |p|2 + V (q); 2m • particella di massa m e carica e immersa nel campo elettrico generato da una carica puntiforme in R di carica q: |p|2 eq H= + ; 2m |q − R| • particella di massa m e carica e immersa nel campo magnetico B tale che B = ∇ × A per un potenziale vettore A (si noti che la possibilità di porre B = ∇ × A è una conseguenza dell’equazione di Maxwell ∇ · B = 0): 1 e 2 H= p− A ; 2m c con ovvie generalizzazioni al caso a più corpi. Esercizio 1.1. Si dimostri a partire dalla forma della Hamiltoniana di una particella in un campo magnetico che la forza a cui è sottoposta tale particella è la forza di Lorentz introdotta in precedenza. Vista l’importanza che assumerà nelle applicazioni successive, scriviamo ad esempio l’Hamiltoniana di N elettroni di carica −e, nel campo elettrico generato da M nuclei fissi di carica Zj e nei punti Rj e nel un campo magnetico di potenziale vettore A: N M X 2 X X 2 Zj e e e2 1 pi − A(qi ) − H(p1 , . . . , pN , q1 , . . . , qN ) = + . 2m c |qi − Rj | |qi − qj | i=1 j=1 i<j Un caso particolare è quello dell’Hamiltoniana classica dell’atomo di idrogeno, ovvero un sistema composto da un elettrone e un nucleo di carica e: H(p, q) = |p|2 e2 − . 2m |q| Se il momento angolare dell’elettrone è non nullo, le traiettorie limitate del sistema (stati legati) sono ellissi (o circonferenze), i cui semiassi sono variano con continuità come funzioni dell’energia del sistema. Se ne ricava immediatamente che la distanza media dal nucleo dell’elettrone può in meccanica classica assumere un intervallo continuo di valori, con un valore minimo corrispondente all’orbita con minima energia. Per certi dati iniziali tuttavia, corrispondenti a momento angolare nullo, si può verificare il fenomeno di caduta sul centro dell’elettrone, nel senso che esso raggiunge il nucleo in un tempo finito e la dinamica non è globale nel tempo. Altri problemi si presentano però quando si combina la descrizione classica con la teoria dell’elettromagnetismo: l’elettrone infatti muovendosi attorno al nucleo genera una distribuzione di carica tempo-dipendente e quindi una densità di corrente date da ρ(x, t) = −eδ(x − q(t)), j(x, t) = −eq̇(t)δ(x − q(t)). I campi elettrico e magnetico generati da tali densità di carica e corrente sono a loro volta tempo-dipendenti e, se facciamo le seguenti ipotesi semplificative sup |q̇(t)| c, sup |q(t)| |x|, t∈R t∈R q̈(t) 6= 0, 9 Figura 1.1: Leggi di Planck (P), Rayleigh-Jeans (RJ) e Plank (P) [GP1, p. 3]. ovvero assumiamo che la velocità dell’elettrone sia molto più piccola di quella della luce, valutiamo i campi a distanze molto maggiori di quella dell’elettrone dal nucleo e infine richiediamo che l’accelerazione dell’elettrone non si annulli mai, allora si ha e c B(x, t) = q̈ t − × x̂, E(x, t) = B(x, t) × x̂, 4πc2 |x| |x| dove abbiamo indicato con x̂ = x/|x|. Pertanto i campi generati dall’elettrone sono radiativi e nel bilancio energetico del campo elettromagnetico il termine di bordo della (1.9) dà un contributo non nullo. Un’analisi più raffinata mostra che, per dati iniziali generici, l’energia del sistema all’interno di una palla di raggio grande in effetti diminuisce a causa del campo elettromagnetico prodotto dall’elettrone, che quindi perdendo energia tende ad avvicinarsi e infine a cadere sul nucleo. 1.2 Corpo Nero e Effetto Fotoelettrico Storicamente il primo fenomeno a cui si associa l’inizio della crisi della fisica classica è il corpo nero o, per meglio dire, la spiegazione della radiazione emessa da tale sistema fisico. Descriviamo meglio di cosa si tratta: Kirchhoff fu il primo a proporre nel 1860 la definizione di corpo nero come un oggetto fisico che assorbe tutta la radiazione elettromagnetica con cui venga irraggiato. Una realizzazione sperimentale di questo oggetto ideale si può costruire immaginando di prendere un cubo cavo mantenuto a temperatura costante e di praticare nella superficie un piccolo foro. La radiazione che entra nel foro verrà riflessa infinite volte all’interno della cavità e, se il foro è abbastanza piccolo, non potrà mai uscirne. D’altra parte benché la radiazione entrante non possa mai emergere dal foro, esso emette una radiazione caratteristica, detta appunto radiazione di corpo nero, che si osserva essere indipendente dalla forma della cavità e dagli altri parametri del sistema, ad eccezione della temperatura T . Più precisamente l’intensità di radiazione u(ν, T ) ha un andamento classico, con u che tende a 0 quando ν → 0, +∞ ed ammette un unico massimo (il dato sperimentale è sostanzialmente sovrapponibile alla legge di Planck della Fig. 1.2). Per spiegare tale andamento in ambito classico furono proposti due modelli alternativi. Wien, partendo dall’ipotesi che le particelle del corpo fossero distribuite secondo la statistica di Maxwell, derivò la legge di Wien (β costante universale) βν (1.11) u(ν, T ) = Cν 3 e− T , 10 che approssimava abbastanza bene l’andamento a grandi frequenze dell’intensità osservata sperimentalmente, ma si discostava in modo significativo per piccole frequenze. Viceversa il modello proposto da Rayleigh nel 1900 e corretto qualche anno più tardi da Jeans nel 1905 si basava sull’ipotesi che le particelle della superficie della cavità potessero essere descritte come oscillatori armonici in interazione con il campo elettromagnetico. Sotto queste ipotesi fu derivata la legge di Rayleigh-Jeans u(ν, T ) = Cν 2 T, (1.12) che era in ottimo accordo con i dati sperimentali per piccole frequenze, mentre ovviamente si discostava in modo sensibile appena la frequenza si allontanava da 0. Nella Fig. 1.2 si può vedere un confronto grafico fra le due leggi, con anche un ingrandimento attorno a ν = 0. Come risulta evidente già a un primo sguardo le due leggi sono del tutto incompatibili e nessuna delle due dà una spiegazione soddisfacente della radiazione da corpo nero. La soluzione del problema fu data nel 1900 da Planck il quale riprese il modello di Rayleigh-Jeans ma assunse che le energie accessibili agli oscillatori della cavità fossero un insieme discreto. Più precisamente i livelli energetici raggiungibili dagli oscillatori erano nel modello di Planck dati da En = nhν, con h nuova costante fisica – da quel momento in poi chiamata costante di Planck – con le dimensioni di un’azione e esplicitamente uguale a h = 2π · 6.582 · 10−22 Mev · s. (1.13) La legge ricavata da Planck a partire dal modello appena descritto è quella che sappiamo oggi descrivere precisamente la radiazione da corpo nero per ogni ν e cioè 1 u(ν, T ) = Cν 2 e hν kB T , (1.14) −1 dove abbiamo indicato con kB la costante di Boltzmann. L’ipotesi di discretizzazione o quantizzazione dell’energia nel modello di Planck non aveva naturalmente nessuna giustificazione classica e fu in effetti il nucleo da cui cominciò a svilupparsi la teoria quantistica. Non entreremo qui nel dettaglio della storia dell’affermazione scientifica della MQ, ma citeremo brevemente un altro caso in cui l’ipotesi di quantizzazione fu essenziale per spiegare un fenomeno classicamente incomprensibile. Si tratta dell’effetto fotoelettrico: illuminando una lastra di metallo con una radiazione elettromagnetica si osserva la produzione di elettroni. Tale effetto era noto a livello sperimentale sin dagli ultimi anni del XIX secolo, ma constuiva un mistero dal punto di vista teorico, a causa delle proprietà caratteristiche del fenomeno e, in particolare, le seguenti: • il numero di elettroni (intensità di corrente) è proporzionale all’intensità della radiazione elettromagnetica; • esiste una frequenza di soglia ν0 > 0 tale che se ν < ν0 non sono emessi elettroni; • l’energia cinetica massima degli elettroni è proporzionale alla differenza ν − ν0 e non dipende dall’intensità della radiazione. Soprattutto le ultime due proprietà non avevano nessuna spiegazione classica plausibile, poiché la radiazione elettromagnetica può scambiare quantitità arbitrarie di energia con gli elettroni del metallo. Einstein nel 1905 fece sua l’ipotesi di quantizzazione di Planck, applicandola alla radiazione elettromagnetica e supponendo che essa fosse composta da quanti di energia hν, cioè proporzionale alla frequenza della radiazione. Tali ipotesi si dimostrò sufficiente per cosntruire un modello accurato dell’effetto fotoelettrico, tanto che Millikan nel 1916 usò l’effetto fotoelettrico per misurare la costante di Planck. 11 1.3 Modelli Atomici: da Democrito a Bohr L’idea che la materia sia composta da elementi microscopici identici fra loro risale addirittura ai filosofi presocratici greci nel V secolo a.C.. Ad esempio Democrito fondava il suo modello di realtà sull’esistenza di tali constituenti elementari, che chiamò appunto atomi, i quali muovendosi in modi differenti si combinavano per formare tutta la varietà di sostanze note. L’ipotesi atomica fu poi abbandonata per lungo tempo fino a tornare in auge a partire dal XVIII secolo grazie ai primi sperimenti di chimica di Dalton, Lavoisier, etc., i quali si accorsero che una teoria atomica si sarebbe ben sposata con le prime regole empiriche della chimica. Similmente Brown osservò che le traiettorie di moto – da allora detto browniano – di particelle microscopiche in soluzione acquose avevano una spiegazione naturale ipotizzando urti frequenti fra le particelle e i costituenti (atomi o molecole) della soluzione in agitazione termica. Il consenso non era però molto diffuso tanto che ancora alla fine del 1800 Mach e Ostwald dibattevano contro l’esistenza degli atomi o, più precisamente, la necessità dell’ipotesi atomica, sottolineando soprattuto l’impossibilità di verificarla sperimentalmente. Le cose cambiarono però all’inizio del 1900 quando un numero notevole di evidenze sperimentali sull’esistenza degli atomi cominciò ad accumularsi. Le informazioni di cui si disponeva riguardo alle proprietà degli atomi erano consistenti e si possono riassumere nella lista seguente: • il raggio di un atomo è ' 10−8 cm; • la massa di un atomo è ' 10−24 g; • gli atomi sono caricamente neutri; • gli atomi contengono elettroni con carica −e, e ' 10−10 C, e massa me ' 9.1 · 10−31 Kg; • se compliti da radiazione elettromagnetica gli atomo la assorbono e quindi emettono a loro volta radiazione elettromagnetica le cui frequenze possono essere misurate (spettri atomici di assorbimento o emissione). Nel 1885 Ballmer raccolse tutti i dati sperimentali sullo spettro di emissione dell’atomo di idrogeno e mostrò che esso contiene righe di emissione alle frequenze 1 1 νm,n = cRH − , m < n ∈ N, (1.15) m2 n2 dove RH è una costante misurata sperimentalmente – il Rydbergh – e c è la velocità della luce. Per spiegare la grande mole di dati sperimentali riguardo agli spettri atomici vari modelli di atomo cominciarono ad essere proposti a partire da inizio 1900. Si va dal modello planetario di Perrin nel 1901 al modello a panettone di Thomson nel 1904, fino a quello di Rutherford nel 1911. Ciascun modello proponeva un aggiustamento della descrizione classica che combinava la meccanica newtoniana con l’elettromagnetismo di Maxwell e, come abbiamo visto, produceva atomi instabili. Il modello planetario è sostanzialmente il più ingenuo, in quanto prescinde in qualche senso dagli effetti elettromagnetici descrivendo l’atomo di idrogeno come un satellite (elettrone) che ruota attorno al suo pianeta (nucleo). Nel modello a panettone invece l’atomo è descritto come una distribuzione di carica positiva – la carica nucleare – nella quale sono immerse cariche puntiformi negative – gli elettroni. In realtà tale modello fu abbandonato quasi subito per il fatto che si scontrava con l’evidenza sperimentale (vedi sotto) che il volume occupato da un atomo fosse in realtà per la maggior parte vuoto, cioè che elettroni e nucleo occupassero una frazione minuscola di tale volume. Il modello di Rutherford dell’atomo di idrogeno del 1911 constituiva in realtà un ritorno al modello planetario, in cui l’elettrone ruota su un’orbita ellittica attorno al nucleo (di dimensioni ' 10−13 cm) ad una distanza dell’ordine di 10−8 cm. I motivi dietro al ritorno a tale descrizione stavano nei risultati sperimentali ottenuti da Rutherford studiando l’interazioni di particelle α con atomi d’oro: un fascio di quelle che oggi sappiamo essere particelle α, cioè nuclei di He venivano sparati contro una sottilissima lamina d’oro di spessore ' 10−5 cm, per essere poi registrate dopo l’attraversamento della lamina. Quello che si osservava 12 era che la maggior parte delle particelle non veniva affatto deflessa come se lo spazio occupato dagli atomi fosse una frazione molto piccola del volume della lamina d’oro, il che chiaramente escludeva il modello di Thomson. Inoltre osservando le particelle deflesse si ricavava una dimensione lineare del volume occupato dall’atomo dell’ordine di 10−8 cm. Il modello planetario era in perfetto accordo con questi dati sperimentali, ma, come sappiamo, aveva problemi molto più profondi, prevedendo un atomo instabile. Dopo alcuni tentativi infruttuosi come il principio di combinazione proposto da Ritz nel 1908, una soluzione parziale al paradosso del modello planeterio fu trovata da Bohr nel 1913, sfruttando ancora una volta l’ipotesi di quantizzazione di Planck e Einstein. L’idea euristica prendeva spunto dal fatto che la nuova costante h introdotta da Planck avesse le dimensioni di un’azione, cosı̀ che combinando nel modo più semplice possibile i parametri fondamentali dell’atomo di idrogeno per trovare una lunghezza si ottiene la quantità mhe e2 ' 10−8 , cioè esattamente l’ordine di grandezza del raggio dell’atomo di idrogeno. Il modello atomico di Bohr si fonda sui seguenti postulati: • tranne che quando è coinvolto il campo elettromagnetico, sia nel fenomeno di emissione che di assorbimento, il moto dell’elettrone è descritto dalle equazioni del moto classiche (di Newton). In particolare l’elettrone si muove su traiettorie ellittiche attorno al nuceo ma non irraggia onde elettromagnetiche; • i livelli energetici accessibili dell’atomo sono discreti; • l’energia dei livelli energetici En è fissata dalla condizione di quantizzazione |L| = ~n, n ∈ N, (1.16) dove |L| è il modulo del momento angolare; • l’emissione/assorbimento di onde elettromagnetiche avviene solo quando l’elettrone passa da un livello En ad un altro Em e, in tal caso, l’energia del fotone emesso/assorbito è data da hν = |En − Em |. Vediamo ora cosa implica la condizione di quantizzazione. Supponiamo per semplicità che l’orbita classica sia una circonferenza nel piano x, y, cioè che l’energia coincida col minimo del potenziale efficace. In questo caso abbiamo che |L| = mr2 ω = ~n, dove ω è la velocità angolare e r raggio dell’orbita e dall’uguaglianza della forza centrifuga con l’attrazione elettrostatica e2 L2 ~2 n2 2 = mω r = = , r2 mr3 mr3 da cui ricaviamo L2 e2 1 me4 1 me4 1 mα2 c2 − = − = − = − , 2mr2 r 2 L2 2 ~2 n2 2 n2 dove abbiamo usato la costante di struttura fine α ' 1/137. Il raggio dell’orbita n−esima è En = (1.17) ~2 n2 . (1.18) me2 Nel caso dello stato ad energia più bassa, ovvero per n = 1, si ottiene r1 ' 0.52 ◦ A in ottimo accordo con gli esperimenti. Le frequenze νm,n delle righe di emissione/assorbimento sono ottenute dalle regole del modello e si ricava immediatamente che mα2 c2 1 1 − , (1.19) νm,n = 4π~ m2 n2 in perfetto accordo con la regola empirica di Ballmer. rn = Esercizio 1.2. Si dimostri che limn→∞ νn,n+1 = νe , dove νe = 2π/Te è la frequenza del moto circolare dell’elettrone. Nella trattazione quantistica dell’atomo di idrogeno vedremo che i livelli energetici e la relativa quantizzazione emergeranno naturalmente e che il modello di Bohr non è in realtà cosı̀ accurato, se si eccettuano le energie En . In effetti già pochi anni dopo l’introduzione del modello di Bohr ci si rese conto che esso non poteva spiegare l’intera mole di risultati sperimentali riguardo agli atomi, e, in particolare, due problemi risaltavano particolarmente: 13 • come estendere la descrizione agli atomi con più elettroni? • gli atomi sono contiuamente sottoposti a radiazioni elettromagnetiche ma non si osserva un’emissione continua di radiazione, come mai? Il modello di Bohr fu perciò modificato e affinato portando alla regola di quantizzazione di Bohr, Sommerfeld e, gradatamente, alla formulazione organica della MQ. Capitolo 2 I Postulati della Meccanica Quantistica In questo capitolo presenteremo i postulati su cui è costruita la MQ, seguendo la storica impostazione di Von Neumann [VN]. Sarà fin da subito evidente come la stuttura matematica della MQ sia particolarmente ricca, tanto da poter affermare che una parte notevole dell’analisi funzionale moderna sia stata sviuppata in ragione della rilevanza in ambito quantistico. Al contempo vedremo però come questa ricchezza sia alla base della necessità di interpretazione non banale della MQ, che individui una corrispondenza fra gli oggetti matematici della teoria e le grandezze fisiche coinvolte negli esperimenti, e come questo rappresenti a tutt’oggi un problema senza una soluzione soddisfacente. 2.1 Cinematica Le regole della cinematica quantistica rappresentano, come per ogni teoria fisica, il cuore della teoria stessa, identificando gli oggetti matematici, che rappresentano le grandezze fisiche misurate negli esperimenti, e fornendo le regole per estrarre previsioni sui dati sperimentali da tali oggetti matematici. Il primo e secondo postulato riguardano rispettivamente stati e osservabili, mentre il terzo e in una certa misura il quarto costituiscono i fondamenti dell’interpretazione della MQ. Postulato 1 (Stati puri). Gli stati puri di un sistema quantistico al tempo t ∈ R sono raggi unitari |Ψ(t)i in uno spazio di Hilbert separabile H su C. Si noti l’aggettivo puri nel postulato precedente che qualifica il tipo di stati. Vedremo che non si tratta del tipo più generale di stati e che esiste una classe più ampia formata dagli stati misti (si veda la Sezione 3.12). Postulato 2 (Osservabili). Le osservabili di un sistema quantistico con spazio di Hilbert H sono operatori linaeri autoaggiunti su H . Le grandezze fisiche di un sistema quantistico sono pertanto rappresentate da operatori in L (H ). E’ importante sottolineare a questo stadio che non si suppone necessariamente vero il contrario, ovvero non si assume che tutti gli operatori autoaggiunti su H siano effettivamente osservabili. Postulato 3 (Interpretazione). Dato uno stato |Ψ(t)i di un sistema quantistico al tempo t ∈ R e un’osservabile A, • i possibili valori della misura di A su |Ψ(t)i al tempo t sono i punti dello spettro σ(A) ⊂ R dell’operatore A; • la probabilità PA,Ψ (I) che nella misura si ottenga un valore λ ∈ I borelliano contenuto in σ(A) è PA,Ψ (I) = kEA (I)Ψ(t)k2 , dove EA (I) indica il proiettore spettrale di A relativo al borelliano I. 14 (2.1) 15 La natura probabilistica della MQ fa quindi la sua comparsa in questo terzo postulato, associando ai possibili risultati di un esperimento delle probabilità e quindi frequenze di visita: ripetendo il medesimo esperimento di misura di A sullo stato |Ψ(t)i al tempo t, si registreranno diversi valori di A, con frequenze sempre più vicine al valore asintotico dato dalle probabilità (2.1). Una conseguenza diretta del terzo postulato è inoltre che il valor medio della misura dell’osservabile A nello stato |Ψ(t)i, ovvero la media di valori ottenuti in un numero arbitrariamente grande di esperimenti identici, è dato dal valore di aspettazione di A su |Ψ(t)i: hAi := hΨ(t)| A |Ψ(t)i . (2.2) Il quarto e ultimo postulato della cinematica quantistica è in realtà quello più controverso e che ancora oggi non si considera una soluzione soddisfacente al problema della misura in MQ. Non lo presenteremo perciò qui nel dettaglio (si veda per maggiori informazione, per esempio, [GP1, Capitolo 2.8]) ma commenteremo soltanto il suo ruolo nell’interpretazione della MQ. Le regole introdotte in precedenza sarebbero infatti perfettamente sufficienti per costruire una cinematica completa, ma vi è la necessità di dare una definizione del processo di misura. Sfortunatamente questo non è possibile all’interno della stessa MQ, se non a patto di generare paradossi inaccettabili, poiché l’apparato di misura è tipicamente costituito da un oggetto macroscopico, che come tale obbedisce alle regole della meccanica classica. Si dovrebbe perciò fornire un modello che renda compatibile il carattere probabilitisco della MQ con l’assenza di incertezza (eccetto quella insita nell’errore sperimentale) tipico di ogni misura classica. Una possibile soluzione (debole) del problema è quello di ammettere questa separazione fra mondo microscopico quantistico e mondo macroscopico classico e fornire una regola empirica per descrivere l’interazione fra i due che avviene negli esperimenti (appunto il Postulato 4). Si è soliti spiegare tale interazione sottolineando il fatto che ogni misura genera una perturbazione del sistema in oggetto e quindi ne modifica lo stato. Tale spiegazione è tuttavia poco soddisfacente e anche problematica alla luce dei recenti esperimenti in cui misure indirette permettono di ricavare informazione dal sistema microscopico senza perturbarne lo stato. Altre soluzioni sono state proposte, ma nessuna totalmente accettabile o più soddisfacente della regola su cui si fonda la cosı̀ detta interpretazione di Copenhagen della MQ, ovvero il collasso della funzione d’onda: in estrema sintesi, se la misura1 dell’osservabile A dà come risultato un suo autovalore non degenere λ, allora dopo la misura il sitema si troverà nel relativo autostato. 2.2 Dinamica Per completare la descrizione di un sistema quantistico è necessario specificare una dinamica, ovvero un legge che descriva l’evoluzione temporale del sistema. Più precisamente da cosa è dato lo stato del sistema al tempo t > 0 se al tempo t = 0 esso si trovava nello stato (puro) |Ψ0 i? L’ultimo Postulato2 della MQ riguarda precisamente questa questione: Postulato 5 (Dinamica). Se al tempo t = 0 un sistema quantistico si trova nello stato |Ψ0 i, allora il suo evoluto al tempo t > 0 è lo stato |Ψt i che si ottiene risolvendo l’equazione di Schrödinger i~∂t |Ψt i = H(t) |Ψt i , (2.3) con dato iniziale |Ψt=0 i = |Ψ0 i e dove H(t) è un’osservabile speciale detta hamiltoniana del sistema. 1 Più precisamente il Postulato 4 si applica alle cosı̀ dette misure di prima specie o preparazioni che vanno dinstinte dalle misure di seconda specie: in quest’ultimo caso l’interferenza dell’apparato di misura con il sistema è cosı̀ drastica che il sistema stesso non sopravvive alla misura (ad esempio quando una particella è registrata su uno schermo), mentre nel primo caso si presuppone che dopo la misura il sistema continui ad esistere ed evolvere secondo le regole della dinamica quantistica (si veda la Sezione 2.2). 2 Per la numerazione seguiamo la tradizione di indicare quest’ultimo Postulato come quinto, anche se ne abbiamo formulati esplicitamente solo 3. Il motivo è che abbiamo tralasciato di discutere il Postulato 4, brevemente accennato nella precedente Sezione. 16 Osservazione 2.1. Come è evidente dal precedente Postulato la dinamica di un sistema quantistico è data da un problema di Cauchy nello spazio di Hilbert H degli stati del sistema. Questo è analogo a quanto si verifica nel caso dei sistemi classici. Tuttavia vedremo che vi è una differenza sostanziale nella soluzione della dinamica: in meccanica classica sono notoriamente necessarie delle assunzioni di regolarità sull’hamiltoniana del sistema, mentre la dinamica quantistica risulta essere più regolare e, sotto le ipotesi del Postulato 5, esiste sempre un’unica soluzione dell’equazione (2.3) (si veda la Sezione 3.13). Osservazione 2.2. E’ importante sottolineare che l’esistenza dell’hamiltoniana del sistema è in effetti una parte rilevante del postulato, nel senso che la dinamica di un sistema quantistico è totalmente identificata dalla sua hamiltoniana (Sezione 3.13 per ulteriori dettagli). Alla luce delle due Osservazioni precedenti e in particolare della seconda, risulta evidente che ogni sistema quantistico è univocamente individuato dallo spazio dei suoi stati – lo spazio di Hilbert H – e dall’hamiltoniana H(t) che ne genera la dinamica. In realtà un’ulteriore ipotesi che spesso non viene esplicitamente discussa riguarda le grandezze fisiche osservabili: si assume infatti in assenza di ulteriori specificazioni che tutti gli operatori autoaggiunti su H siano osservabili. Tuttavia quest’ipotesi presenta molti aspetti discutibili, anche in termimi di interpretazione della teoria. Non approfondiremo oltre la questione in questa sede. Si noti però che l’indentificazione di un sistema fisico con il suo spazio degli stati e la dinamica che lo caratterizza è tipico anche della meccanica classica e, più in generale, di ogni teoria fisica: la descrizione di qualunque sistema fisico è infatti caratterizzata anzitutto dall’insieme delle grandezze fisiche misurabili (che sia per la MQ che per la meccanica classica si assume essere massimale, come discusso in precedenza) e dall’insieme degli stati che associano alle osservabili il relativo valore di aspettazione (un numero reale); l’evoluzione temporale è quindi definita in termini di un problema di Cauchy. In ambito classico questi tre elementi sono dati rispettivamente dallo spazio delle fasi, i cui punti sono gli stati puri, dalle funzioni continue su di esso e dalle equazioni di Hamilton dell’evoluzione temporale. In MQ i corrispettivi sono invece lo spazio di Hilbert (o più propriamente lo spazio dei raggi in uno spazio di Hilbert separabile), gli operatori autoaggiunti su tale spazio e l’equazione di Schrödinger. Capitolo 3 Spazi di Hilbert e Teoria degli Operatori Questo capitolo è dedicato ad un richiamo delle nozioni fondamentali riguardanti la teoria degli spazi di Hilbert e degli operatori lineari agenti su di essi. Non discuteremo le dimostrazione della maggior parte dei risultati presentati, ma proporremo un ampia scelta di esempi ed esercizi per familiarizzare con i concetti chiave della teoria. Rivedremo poi in forma critica i postulati della MQ, sfruttando gli strumenti appena introdotti per ricavarne conseguenze e generalizzazioni. In particolare vedremo come l’interpretazione probabilistica della MQ sia una conseguenza naturale dei primi due Postulati della teoria, applicando il teorema spettrale agli operatori autoaggiunti (osservabili) sullo spazio di Hilbert. 3.1 Spazi di Hilbert Partiamo dunque dalla seguente Definizione 3.1 (Spazio di Hilbert). Uno spazio di Hilbert H su C è uno spazio vettoriale su C su cui sia definito un prodotto scalare h·| ·i: H × H → C e che sia completo rispetto alla metrica associata alla norma kuk2 := hu| ui indotta dal prodotto scalare. Ricordiamo che un prodotto scalare è un applicazione bilineare1 , positiva e non degenere. La metrica associata alla norma k · k è naturalmente definita come u, v ∈ H . dist (u, v) = ku − vk , Ricordiamo inoltre che uno spazio metrico è completo se ogni successione di Cauchy è convergente e che gli spazi di Hilbert sono casi speciali di spazi di Banach in cui la norma è indotta da un prodotto scalare. Esempio 3.1 1. Un banale di spazio di Hilbert è CN , N ∈ N, con il prodotto scalare standard (x, y) = x · y = PNesempio ∗ i=1 xi yi ; 2. per ogni aperto I ⊂ Rd , Z 2 L (I, dx) := f misurabili dx |f (x)| < +∞ , 2 (3.1) I è uno spazio di Hilbert con dx misura di Lebesgue in Rd . Naturalmente il prodotto scalare è dato da Z hf | gi := dx f ∗ (x)g(x). (3.2) I Più in generale ogni L2 (B, dµ) con B borelliano in Rd e µ misura borelliana regolare è ancora uno spazio di Hilbert; 1 Assumeremo sempre che il prodotto scalare sia antilineare nella prima componente e lineare nella seconda. 17 18 3. lo spazio delle successioni quadrato sommabili, i.e., X 2 `2 (Z) := {un }n∈Z , un ∈ C |un | < +∞ , (3.3) n∈Z è anch’esso uno spazio di Hilbert, il cui prodotto scalare è la naturale generalizzazione di quello su CN . Definizione 3.2 (Raggio). Un raggio unitario |Ψi nello spazio di Hilbert H è , dato un certo Ψ ∈ H con kΨk = 1, la classe di equivalenza |Ψi := eiα Ψ, α ∈ R . (3.4) In effetti la definizione (3.4) definisce una relazione di equivalenza in H , che a sua volta può essere usata per definire un opportuno spazio proiettivo a partire da H e idenficare con esso lo spazio degli stati di un sistema quantistico. Non svilluperemo oltre questo tipo di approccio. Il Postulato 1 può dunque essere riformulato nel seguente modo: gli stati puri di un sistema quantistico sono vettori in H normalizzati definiti a meno di una fase globale (costante). Vedremo come quest’ultima richiesta sia compatibile con il Postulato 3, nel senso che sia il valore di aspettazione che le probabilità dei valori misurati sono indipendenti dal rappresentativo scelto per il raggio |Ψi. La notazione che abbiamo usato per indicare i raggi in H è quella tipicamente usata dai fisici: l’espressione |Ψi si chiama2 ket di Ψ ed è la controparte del bra di Ψ, i.e., hΨ| che non è nient’altro che un elemento del duale dello spazio dei ket. Grazie al teorema di Riesz (si veda il prossimo Teorema 3.6) lo spazio dei ket è in corrispondenza uno a uno con lo spazio dei bra e dunque per ogni Ψ ∈ H ha senso l’espressione hΨ|. Inoltre hΨ |Φ i ∈ C è dato dal prodotto scalare usuale fra Ψ e Φ, dove Ψ e Φ sono due rappresentativi dei raggi in questione. Chiaramente il prodotto scalare dipende dalla scelta dei rappresentativi, ma il suo modulo oppure l’aspettazione di un osservabile su un singolo stato |Ψi, che sono le uniche quantità con significato fisico (si veda il Postulato 3), ne sono indipendenti. Come abbiamo visto un esempio di spazio di Hilbert sono gli spazi vettoriali finito dimensionali con un prodotto scalare, i.e., CN . Nel caso finito dimensionale sappiamo che qualunque spazio vettoriale ammette una base ortonormale. Vedremo che una cosa analoga vale anche per gli spazi di Hilbert. Definizione 3.3 (Denso). Dato un insieme S ⊂ H diciamo che S è denso in H se ogni u ∈ H è limite di elementi in S. P Esercizio 3.1. Dimostrare che le combinazioni lineari finite, i.e., N n=1 an en sono dense in `2 (N). Esercizio 3.2. Dimostrare che dato un intervallo aperto I ⊂ R, C ∞ (I) è denso in L2 (I, dx). Definizione 3.4 (Base e s.o.n.c). Dato uno spazio di Hilbert H diciamo sistema completo (s.c.) un insieme di vettori denso in H . Una base o sistema ortogonale completo (s.o.c.) è un insieme di vettori ortogonali massimale, ovvero non contenuto propriamente in nessun altro insieme di vettori ortogonali. Un sistema ortonormale completo (s.o.n.c.) è una base composta da vettori {uα }α∈I , I ⊂ R, tali che • (normale) kuα k = 1 per ogni α ∈ I; • (ortogonale) huα |uβ i = 0 se α 6= β. Una conseguenza dell’assioma della scelta è la seguente Proposizione 3.1 (Esistenza di un s.o.n.c.). Ogni spazio di Hilbert H ammette almeno un s.o.n.c. 2 Mettendo insieme i due elementi bra e ket, ovvero scrivendoli uno di fianco all’altro si ricostruisce il braket, la parentesi. 19 Definizione 3.5 (Spazio di Hilbert separabile). Uno spazio di Hilbert H si dice separabile se ammette una base numerabile. Definizione 3.6 (Dimensione). Dato uno spazio di Hilbert H definiamo la sua dimensione come il numero degli elementi di una qualsiasi base. Per gli spazi di Hilbert separabili l’analogia con il concetto di base finito-dimensionale è ancora più forte. Teorema 3.1 (Serie di Fourier). Sia H uno spazio di Hilbert separabile su C e {un }n∈N un suo s.o.n.c numerabile. Assegnato un vettore Ψ ∈ H i suoi coefficienti di Fourier {Ψn }n∈N sono i numeri complessi Ψn := hun |Ψ i . (3.5) Si ha allora • (serie di Fourier) Ψ = P n∈N Ψn un nel senso che N X lim Ψ − Ψn un = 0; N →∞ • (identità di Parseval) kΨk2 = 2 n∈N |Ψn | P (3.6) n=1 e più in generale per ogni Ψ, Φ ∈ H , hΨ |Φ i = X Ψ∗n Φn , (3.7) n∈N dove Φn sono i coefficienti di Fourier di Φ rispetto alla stessa base. Esercizio senza usare la (3.5) che, fissato il s.o.n.c., la serie di Fourier è unica, ovvero P 3.3. Dimostrare P 0 se Ψ = Ψn un = Ψn un allora Ψn = Ψ0n per ogni n. Dato uno spazio di Hilbert separabile dunque, una qualunque s.o.n.c. numerabile individua una corrispondenza uno a uno fra H e `2 (N) (o `2 (Z) a seconda del numero di elementi di base), associando ad ogni vettore di H i suoi coefficienti di Fourier e viceversa. Solitamente la terminologia serie di Fourier e coefficienti di Fourier si riserva per il caso speciale H = L2 (I) con I aperto in R e un (x) = |I|−1/2 exp{2πinx/|I|} (si veda anche Esempio 2 punto 2). In questo caso si può dimostrare che la serie di Fourier di ogni funzione in L2 (I) è puntualmente convergente q.o., mentre converge uniformemente se e solo se la funzione è continua e periodica (cioè assume lo stesso valore agli estremi dell’intervallo). Questa particolare base è inoltre utile per dare una definizione alternativa degli spazi di Sobolev: Definizione 3.7 (Spazi di Sobolev). Definiamo lo spazio di Sobolev di indice p > 0 come n o H p (I) := f ∈ L2 (I) |n|p fn ∈ `2 (Z) , (3.8) dove fn indicano i coefficienti di Fourier di f rispetto alla base un (x) = |I|−1/2 exp{2πinx/|I|}. Per decidere se un insieme di vettori linearmente indipendenti è un s.o.n.c è spesso utile uno dei seguenti criteri: Proposizione 3.2 (S.o.n.c). Sia H uno spazio di Hilbert separabile, allora un s.o.n. {un }n∈N è una base e quindi un s.o.n.c. se vale almeno una (e quindi entrambe) delle seguenti proprietà: 20 • le combinazioni lineari finite PN n=1 an un con an ∈ C e N < +∞ sono dense in H ; • hΨ |un i = 0 per ogni n ∈ N ⇐⇒ Ψ = 0. Esempio 3.2 Riprendiamo i casi discussi nell’Esempio 3.1: 1. la base standard di CN , ovvero {en }n=1,...N , è chiaramente un s.o.n.c.; 2. un s.o.n.c per L2 (I, dx) con I intervallo aperto di R è data dai vettori {un }n∈Z (teorema di Fourier) con 2πinx un (x) := √1L e L , (3.9) dove abbiamo chiamato L := |I| la lunghezza dell’intervallo. Nel caso in cui I non sia invece compatto, ad esempio per I = R, due possibili s.o.n.c. sono dati da Hn (x)e− x2 2 , x Ln (x)e− n+1 , (3.10) con n ∈ N e Hn e Ln rispettivamente i polinomi di Hermite e i polinomi di Laguerre. 3. una base per `2 (N) è ovviamente data dalla generalizzazione infinito dimensionale della base canonica in CN , ovvero {en }n∈N . Esercizio 3.4. 1. Dimostrare che le funzioni un (x) = 2 1/2 sin nx π formano un s.o.n.c. in L2 (0, π). 2. Si considerino le funzioni ( 1, fn (x) = 0, 1 se n+1 ≤ x ≤ n1 , altrove, con n ∈ N. Le fn formano un set ortogonale completo in L2 (0, 1)? 3. Le funzioni un (x) = e2inx , n ∈ Z, formano un set ortogonale completo in L2 (0, π)? e in L2 (0, 2π)? Si consideri poi il set vn (x) = un (x)eβx per un certo β ∈ C: il set {vn } è completo in L2 (0, π)? e in L2 (0, 2π)? 4. Dato un set completo {un } in H , quand’è che il set vn = un − v rimane un set completo per un certo v ∈ H ? e invece quand’è che il set wn = en − αm e1 non è completo in `2 (N)? 5. Il set un (x) = xeinx è ancora completo in L2 (−π, π)? In ogni spazio di Hilbert valgono due disuguaglianze che coinvolgono la norma e che hanno una grande utilità: Proposizione 3.3 (Disuguaglianze di Schwarz e triangolare). Per ogni u, v ∈ H spazio di Hilbert valgono la disuguaglianza di Schwarz e la disuguaglianza triangolare, i.e., |hu |v i| ≤ kuk kvk , ku + vk ≤ kuk + kuk . (3.11) Esercizio 3.5. Dimostrare le due disuguaglianze in (3.11) usando le proprietà della norma. (Suggerimento: calcolare la norma ku + λvk per λ ∈ C generico e scegliere valori ad hoc di λ). Come abbiamo visto uno spazio di Hilbert ammette una metrica indotta dalla norma, ma grazie alla presenza del prodotto scalare è possibile definire in H una topologia più debole di quella della norma, che in effetti coincide con quella generata dagli elementi del duale di H . 21 Definizione 3.8 (Convergenza forte e debole). Data una successione {un }n∈N in uno spazio di Hilbert H separabile si dice che • un converge fortemente o in norma oppure semplicemente converge a u ∈ H e si indica con s un −→ u se lim ku − un k = 0; (3.12) n→∞ w • un converge debolmente a u ∈ H e si indica con un −→ u se lim hv |un − u i = 0, n→∞ ∀v ∈ H . (3.13) La convergenza forte implica ovviamente la convergenza debole via ad esempio la disuguaglianza di Schwarz. w Esercizio 3.6. Dimostrare che se un −→ u in H , allora kuk ≤ lim inf n→∞ kun k (semicontinuità inferiore della norma). Proposizione 3.4 (Covergenza debole e forte). w s Sia {un }n∈N una successione in H separabile. Allora un −→ u ⇐⇒ un −→ u e lim kun k = kuk. n→∞ Dimostrazione. Un semplice calcolo dà ku − un k2 = kuk2 + kun k2 − hun |u i − hu |un i , ma la convergenza debole di un ci garantisce che hun |u i −→ kuk2 , n→∞ hu |un i −→ kuk2 . n→∞ Quindi h i lim ku − un k2 = lim kun k2 − kuk2 , n→∞ n→∞ da cui l’enunciato. Si sarebbe tentati di pensare che in L2 (I, dx) la convergenza debole sia sostanzialmente equivalente alla convergenza puntuale q.o.. Questo però è falso e in generale convergenza forte ; convergenza q.o., convergenza q.o. ; convergenza debole, tuttavia se una successione converge sia debole che puntualmente q.o. allora il limite è lo stesso. Nutaralmente il concetto di convergenza debole si può definire anche in spazi di Banach, come Lp (I, dx), dove il ruolo del prodotto scalare viene preso dai funzionali appartenti al duale di Lp cioè Lq con p1 + 1q = 1. Ricordiamo qui tre risultati fondamentali della teoria dell’integrazione in spazi L1 (I, dx) con I ⊂ Rd che saranno di grande utilità in tutto il resto del corso: Teorema 3.2 (Teorema della convergenza monotona). Sia fn ≥ 0 una successione in L1 (I, dx) tale che fn+1 (x) ≥ fn (x) per ogni n ∈ N e q.o.. Se kfn k1 ≤ C per ogni n e fn (x) −→ f (x) q.o., allora f ∈ L1 (I, dx) e limn→∞ kfn − f k1 = 0. n→∞ Teorema 3.3 (Teorema della convergenza dominata). Sia fn una successione in L1 (I, dx) tale che |fn (x)| ≤ g(x) per ogni n ∈ N e q.o. con g ∈ L1 (I, dx). Se fn (x) −→ f (x) q.o., allora f ∈ L1 (I, dx), |f |(x) ≤ g(x) e limn→∞ kfn − f k1 = 0. n→∞ Teorema 3.4 (Lemma di Fatou). Sia fn ≥ 0 una successione in L1 (I, dx) tale che lim inf n→∞ |fn |1 < +∞. Se lim inf fn = f allora f ∈ L1 (I, dx) e kf k1 ≤ lim inf n→∞ fn . 22 Esercizio 3.7. w 1. Sia Ψn ∈ L2 (R) e si abbia hΨn |f i −→ hΨ |f i per ogni f ∈ C0∞ (R). E’ vero che Ψn −→ Ψ? in caso negativo si trovi un controesempio. 1 1 2. Sia fn ∈ L2 ([0, 1]) la successione fn (x) = n−1/2 x 2n − 2 con n ∈ N. La successione converge debolmente (e eventualmente a cosa?)? in norma? 3. Consideriamo la successione di funzioni fn : R+ → R, ( tn , se t ∈ [0, 1], fn (t) = 0, per t > 1. La successione converge puntualmente? uniformemente su R+ ? debolmente in L2 (R+ )? in norma in L2 (R+ )? 4. Sia fn (x) la successione ( 1, fn (x) = 0, se n ≤ x ≤ 2n, altrimenti, con n ∈ N. La successione converge puntualmente (e eventualmente a che cosa?)? uniformemente? debolmente in L2 (R)? in norma in L2 (R)? 5. P Si considerino le funzioni fn introdotte nell’Esercizio 3.4 punto 2. Si ponga quindi gN (x) = N 2 n=1 fn (x): gN converge puntualmente quando N → ∞? debolmente in L (0, 1)? in norma nello stesso spazio? uniformemente su [0, 1]? Concludiamo questa sezione discutendo alcune proprietà geometriche elementari degli spazi di Hilbert e caratterizzandone il duale. Definizione 3.9 (Sottospazio ortogonale). Sia K un sottospazio (di Hilbert) proprio di H . Definiamo il suo complemento ortogonale come il sottospazio (3.14) K ⊥ := Φ ∈ H hΦ |Ψ i = 0, ∀Ψ ∈ K . Teorema 3.5 (Teorema della proiezione). Sia H uno spazio di Hilbert e K un suo sottospazio proprio. Allora ogni Ψ ∈ H si scrive in modo unico come somma Ψ = Φ + Φ0 con Φ ∈ K e Φ0 ∈ K ⊥ . Definizione 3.10 (Duale). Dato uno spazio di Hilbert H definiamo il suo duale H ∗ come lo spazio dei funzionali lineari limitati da H ∈ C. Il duale H ∗ contiene dunque le f : H → C che sono limitate nella norma kf k := sup Ψ∈H |f (Ψ)| . kΨk (3.15) Proposizione 3.5 (Completezza di H ∗ ). Il duale H ∗ è completo rispetto alla metrica indotta dalla norma (3.15). Un esempio immediato di funzionale su H è dato dall’applicazione fΦ : H → C che agisce nel seguente modo su ogni Ψ ∈ H : fΦ (Ψ) = hΦ |Ψ i . (3.16) Ovviamente per tale funzionale vale kfΦ k = kΦk e quindi il funzionale è limitato. Il contenuto del teorema di Riesz è precisamente che tutti i funzionali in H ∗ sono di questa forma: Teorema 3.6 (Teorema di Riesz). Per ogni f ∈ H ∗ ∃! Φ ∈ H tale che f (Ψ) = hΦ |Ψ i. 23 3.2 Trasformata di Fourier, Spazi di Sobolev e Distribuzioni Prima di introdurre la teoria degli operatori lineari, richiamiamo alcune utili proprietà della trasformata di Fourier. Definizione 3.11 (Trasformata di Fourier). Data una qualunque f ∈ C0∞ (Rd ), definiamo la sua trasformata di Fourier come Z 1 ˆ dx e−ik·x f (x). f (k) := (2π)d/2 Rd (3.17) Proposizione 3.6 (Estensione della trasformata di Fourier). La (3.17) definisce un’applicazione F : L1 (Rd ) → L∞ (Rd ) che ammette un’estensione naturale a L2 (Rd ). Inoltre i) F : L2 (Rd ) → L2 (Rd ) è un’applicazione bigettiva con trasformazione inversa data da Z 1 ˇ f (x) := dk eik·x f (k); (2π)d/2 Rd (3.18) ii) F individua un operatore unitario da L2 (Rd ) → L2 (Rd ), cioè D E fˆ ĝ = hf |g i , ∀f, g ∈ L2 (Rd ). La relazione fra la trasformata di Fourier e gli spazi Lp è più complicata ma vale la seguente utilissima disuguaglianza: Teorema 3.7 (Disuguaglianza di Hausdorff-Young). Esiste una constante Cd < +∞, dipendente solo da d, tale che per ogni 1 ≤ p ≤ 2 Ψ̂ q d ≤ Cd kΨk p d , L (R ) L (R ) con 1 p + 1 q (3.19) = 1 (e quindi 2 ≤ q ≤ ∞). Inoltre la trasformata di Fourier è molto utile per studiare operatori differenziali o integrale grazie alle seguenti proprietà : Proposizione 3.7 (Poprietà della trasformata di Fourier). Per ogni f, g ∈ L2 (Rd ) i) (convoluzione) definendo la convoluzione come Z (f ? g)(x) := dy f (x − y)g(y), (3.20) Rd si ha d f[ ? g (k) = (2π) 2 fˆ(k)ĝ(k); (3.21) ii) (traslazione e riscalamento) f\ (· − y)(k) = e−ik·y fˆ(k), f\ (·/λ)(k) = λd fˆ(λk); (3.22) iii) (derivazione) ˆ ∂\ xi f (·)(k) = −iki f (k). (3.23) Per questo motivo la trasformata di Fourier entra anche nella definizione degli spazi di Sobolev su Rd . 24 Definizione 3.12 (Spazio di Sobolev). Definiamo lo spazio di Sobolev di indice p su Rd come n o p/2 H p (Rd ) := f ∈ L2 (Rd ) k 2 + 1 fˆ(k) ∈ L2 (Rd ) . (3.24) Chiudiamo la discussione della trasformata di Fourier enunciando un risultato importantissimo. Teorema 3.8 (Teorema di Paley-Wiener). Una funzione analitica g(z), z ∈ Cd , è la trasformata di Fourier fˆ di una funzione f ∈ C0∞ (Rd ) tale che supp(f ) ⊂ BR (0), se e solo se per ogni N ∈ N ∃CN < ∞ tale che |g(z)| ≤ CN eR|=(z)| , (1 + |z|)N ∀z ∈ Cd . (3.25) Quindi la trasformata di Fourier mappa funzioni C0∞ (Rd ) in funzioni analitiche che soddisfano la stima di cui sopra. Analogamente funzioni analitiche (reali) a decrescenza rapida (come segue dalla (3.25)) sono mappate dalla (anti)trasformata di Fourier in funzioni C0∞ (Rd ). Un risultato più debole ma comunque molto utile è il seguente Teorema 3.9 (Analiticità della trasformata di Fourier). Sia f ∈ L2 (Rd ). Allora eb|x| f (x) ∈ L2 (Rd ) per ogni b < a, se e solo fˆ ammette continuazione analitica alla striscia {|=(z)| < a}. Inoltre fˆ(· + i=(z)) ∈ L2 (Rd ) se |=(z)| < a e, per ogni b < a, sup fˆ(· + i=(z)) < ∞. (3.26) 2 |=(z)|≤b Riassumiamo ora brevemente la teoria delle distribuzioni. Per semplicità consideriamo solo distribuzioni di una sola variabile reale. La generalizzazione a Rd è ovvia. Introduciamo anzitutto gli spazi delle funzioni test S e D definiti come h k ∞ S := f ∈ C (R) sup x ∂x f < +∞, ∀h, k ∈ N , D := C0∞ (R), (3.27) x∈R cioè dati dalle funzioni lisce rispettivamente a decrescenza rapida o a supporto compatto. Definiamo quindi gli spazi delle distribuzioni come i duali S 0 e D0 ovvero gli spazi dei funzionali lineari continui da S o D in C, dove la continuità è relativa alla seguente topologia in S o D: diciamo che una successione fn ∈ S o D converge a f se xh ∂xk fn −→ 0, uniformemente. n→∞ Di conseguenza una distribuzione F sarà continua se F (fn ) → F (f ) per ogni successione convergente in S o D. Indichiamo l’azione di una distribuzione F sullo spazio delle funzioni test come hF, f i. L’esempio canonico di distribuzione è l’applicazione Z hF, f i = dx F (x)f (x), R con F funzione misurabile localmente cioè F ∈ L1loc (R). Sotto queste ipotesi è facile vedere che l’espressione di sopra definisce un funzionale lineare continuo sia in S 0 che in D0 . Gli spazi S 0 e D0 contengono però “funzioni” molto più singolari ed è in effetti questo il motivo per cui è conveniente introdurli: un esempio caratteristico è dato dalla δ di Dirac che definiamo come Z hδ, f i = f (0) = dx δ(x)f (x), (3.28) R dove l’ultima espressione è puramente formale. Negli spazi delle distribuzioni è possibile definire una topologia (debole): una successione di distribuzioni Fn converge a F in S 0 o D0 se hFn , f i −→ hF, f i per ogni funzione test f ∈ S o D. Inoltre si definiscono n→∞ 25 derivata k−esima ∂ k F , trasformata F̂ e antitrasformata di Fourier F̌ di una distribuzione F ∈ S 0 o D0 nel modo seguente D E D E ∂ k F, f = (−1)k F, ∂xk f , (3.29) hF̂ , f i = hF, fˆi, hF̌ , f i = hF, fˇi. (3.30) Si verifica che queste operazioni sono continue rispetto alla topologia della convergenza debole fra distribuzioni. Questo permette di ottenere derivate e trasformate di Fourier di “funzioni” non derivabili né in L2 , come ad esempio la δ di Dirac o la funzione di Heaviside θ(x). 3.3 Operatori Lineari Al fine di investigare le conseguenze del Postulato 2 della MQ, introduciamo in questa sezione i concetti fondamentali della teoria degli operatori lineari su uno spazio di Hilbert, che assumeremo sempre separabile. Definizione 3.13 (Operatore lineare). Sia H uno spazio di Hilbert separabile. Un operatore lineare A : H → H è un applicazione tale che A(αu + βv) = αAu + βAv con u, v ∈ H e α, β ∈ C. Nello spazio degli operatori lineari L (H ) è naturale definire la norma data da kAΨk . Ψ∈D(A) kΨk kAk := sup (3.31) Una caratteristica essenziale di ogni operatore A è il suo dominio di definizione D(A), ovvero l’insieme delle u ∈ H su cui è assegnato A. Osservazione 3.1. Non assumeremo che il dominio di un operatore sia necessariamente massimale, ma in ogni caso chiederemo che D(A) sia denso in H . Definizione 3.14 (Operatore limitato). Un operatore A ∈ L (H ) è limitato se kAk < +∞. E’ evidente che c’è, almeno in apparenza, un’ambiguità nella definizione di un operatore e più precisamente del relativo dominio: se il dominio non coincide con una base, cioè un denso minimale, è sempre possibile rimuovere un certo numero di elementi da D(A) senza tuttavia modificare l’operatore. Per eliminare questa ambiguità si introducono i concetti di estensione e chiusura di un operatore, che giocano un ruolo cruciale nello studio degli operatori illimitati. Infatti nel caso in cui l’operatore sia limitato è facile vedere che il problema del dominio di definizione non sussiste, in quanto l’operatore può essere sempre esteso a tutto H . Definizione 3.15 (Estensione). Siano A e B due operatori con dominio D(A) ⊂ D(B). Diciamo che B è un’estensione di A se A = B su D(A). Proposizione 3.8 (Operatori limitati). Ogni operatore limitato A ammette un’estensione (unica) con dominio tutto H . Definizione 3.16 (Operatore chiuso). s s Un operatore A su H si dice chiuso se per ogni un ∈ D(A) tale che Ψn −→ Ψ ∈ H e AΨn −→ AΨ, allora Ψ ∈ D(A). Diciamo che A è chiudibile se ammette un’estensione chiusa e in tal caso indichiamo con Ā la più piccola estensione chiusa di A. La definizione di operatore chiuso è equivalente alla richiesta di chiusura dell’insieme grafo Γ(A) ⊂ H × H dell’operatore A, ovvero Γ(A) := {(Ψ, AΨ), Ψ ∈ D(A)} . Ovviamente ogni operatore limitato è chiudibile e la sua chiusura ha per dominio H . Tuttavia non tutti gli operatori sono chiudibili ma tutti quelli che consideremo e in particolare quelli che hanno significato fisico, i.e., sono per lo meno simmetrici (si veda la Sezione 3.4), sono sempre chiudibili. 26 Osservazione 3.2. Si noti che tipicamente D(A) 6= D(Ā). Infatti data l’ipotesi di densità di D(A), D(A) = H , ma quest’ultimo coincide con il dominio di Ā se e solo se A è limitato. Esempio 3.3 (Operatore di moltiplicazione) Sia F (x) una funzione misurabile su Rd . Definiamo l’operatore di moltiplicazione per F come (M Ψ) (x) := F (x)Ψ(x), (3.32) con dominio D(M ) = C0∞ (Rd ). Come dimostrato nella seguente Proposizione 3.9, M è limitato se e solo se M ∈ L∞ (Rd ) e in tal caso è facile vedere che D(M ) = L2 (Rd ). Proposizione 3.9 (Operatore di moltiplicazione). Sia M un operatore di moltiplicazione in L2 (Rd ) per la funzione misurabile F (x), allora kM k = kF kL∞ (Rd ) = sup |F (x)| . (3.33) x∈Rd Dimostrazione. Dimostriamo anzitutto che kM k = kF kL∞ (Rd ) : 2 Z kM Ψk = dx |F (x)|2 |Ψ|2 ≤ sup |F (x)|2 kΨk2 , Rd x∈Rd da cui otteniamo il risultato osservando che sup(F 2 ) = (sup |F |)2 . Se risucissimo quindi a trovare una successione di stati normalizzati Ψε tali che kM Ψε k −→ sup |F |, ε→0 Rd avremmo dimostrato l’assunto. Supponiamo allora per semplicità che F sia continua e che supRd |F | = F (x0 ) < +∞ per un certo x0 finito (nel caso in cui sia infinito l’argomento è analogo) e prendiamo una funzione f (x) ∈ C ∞ [0, 1] tale che f (0) 6= 0 e Z dx |f |2 = 1, B1 (0) dove abbiamo indicato con B% (x) la palla di raggio % centrata in x. Poniamo allora 1 0| Ψε (x) := εd/2 f |x−x . ε Calcoliamo 2 kM k ≥ ε −d Z 2 2 |x−x0 | |x−x0 | 2 −d dx |F (x)| f = ε dx |F (x)| f ε ε Rd Bε (x0 ) Z Z x 2 2 −d =ε = dx |F (x + x0 )| f ε dx |F (x0 + εx)|2 |f (x)|2 Bε (0) B1 (0) Z = |F (x0 )|2 − dx |F (x0 )|2 − |F (x0 + εx)|2 |f (x)|2 =: |F (x0 )|2 − Rε . Z 2 B1 (0) Ora grazie alla continuità di F , F (x) è certamente limitata in un intorno di x0 e pertanto l’integrabilità di |f |2 ci garantisce che Rε ≤ C per ogni ε sufficientemente piccolo. Possiamo allora applicare il teorema di convergenza dominata e fare il limite sotto il segno di integrale, ottenendo (ancora grazie alla continuità di F ) che Rε −→ 0. ε→0 Esercizio 3.8. Si trovi come modificare la dimostrazione della Proposizione 3.9 nel caso in cui x0 sia illimitato e più in generale nel caso in cui F sia misurabile ma non continua. 27 Esercizio 3.9. Si dimostri che M con M operatore di moltiplicazione limitato ha dominio uguale all’intero L2 (R) senza far uso della Proposizione 3.8. Esempio 3.4 (Operatore integrale) Sia K(x, y) una funzione misurabile su R × R. Definiamo l’operatore integrale K con kernel K(x, y) come Z dy K(x, y)Ψ(y), (3.34) (KΨ) (x) := R per ogni Ψ ∈ C0∞ (R). Iniziamo suppondendo che K(x, y) ∈ L2 (R2 ) e vediamo che questo garantisce la limitatezza dell’operatore. Si ha infatti 2 kKk = −2 Z kΨk sup Ψ∈C0∞ (R) R 2 Z dx dy K(x, y)Ψ(y) ≤ R Z Z sup dx Ψ∈C0∞ (R) dy |K(x, y)|2 R R = kKk2L2 (R2 ) < +∞. Anche in questo caso l’operatore non è chiuso e la sua chiusura K ha dominio che copre l’intero spazio di Hilbert L2 (R). In effetti la richiesta K(x, y) ∈ L2 (R2 ) può essere indebolita come discusso nella prossima Proposizione 3.10. Proposizione 3.10 (Test di Schur). Sia K un operatore integrale con kernel K(x, y) : Rd × Rd → C misurabile, allora p kKk ≤ k1 k2 , Z Z k1 := sup dy |K(x, y)| , k2 := sup dx |K(x, y)| . x∈Rd Rd y∈Rd (3.35) (3.36) Rd Dimostrazione. Il risultato è sostanzialmente una conseguenza diretta dell’applicazione della disuguaglianza di Schwarz: 1/2 Z Z Z |(KΨ) (x)| ≤ dy |K(x, y)| |Ψ(x)| ≤ dy K(x, y)|Ψ(y)|2 dy |K(x, y)| Rd Rd 1/2 Rd p Z ≤ k1 dy K(x, y)|Ψ(y)| 2 1/2 , Rd cosı̀ che kKΨk22 Z ≤ k1 Rd ×Rd dxdy |K(x, y)| |Ψ(x)|2 ≤ k1 k2 kΨk22 , e il risultato è dimostrato. Esempio 3.5 (Operatore posizione) Sia H = L2 (R) e definiamo (QΨ) (x) := xΨ(x), (3.37) con dominio D(Q) = C0∞ (R). Osserviamo anzitutto che l’operatore è illimitato cioè kQk = +∞. A questo scopo consideriamo una funzione dolce f ∈ C0∞ (0, 1) normalizzata a 1 in L2 ((0, 1), dx) e per ogni n ∈ N poniamo ( f (x − n), se n ≤ x ≤ n + 1, Ψn (x) := 0 altrimenti. 28 Chiaramente Ψn è normalizzata e quindi Z Z n+1 Z 2 2 2 2 2 dx x |f (x − n)| = dx x |Ψn (x)| = kQk ≥ R 1 dx (x + n)2 |f (x)|2 ≥ n2 −→ +∞. 0 n n→∞ Di conseguenza l’operatore non potrà mai essere definito su tutto L2 (R). Esercizio 3.10. L’operatore Q è chiuso? e se no qual è la sua chiusura Q? Esempio 3.6 (Operatore impulso) Sempre su L2 (R) definiamo l’operatore (P Ψ) (x) := −i∂x Ψ(x), (3.38) con dominio ancora D(P ) = C0∞ (R). Come nel caso di Q anche P è un operatore illimitato. Inoltre non è nemmeno chiuso e D(P ) = H 1 (R), come si vede facilmente usando le proprietà della trasformata di Fourier. Esercizio 3.11. Dimostrare che l’operatore P non è limitato. Esempio 3.7 (Operatori di creazione e distruzione) Sia H uno spazio di Hilbert separabile infinito-dimensionale e {un }n=0,1,...,∞ un suo s.o.n.c.. Definiamo allora gli operatori di creazione e distruzione come (√ √ n un−1 , per n > 0, a† un = n + 1 un+1 , aun = (3.39) 0, per n = 0. con dominio ovviamente definito dalle combinazioni lineari degli elementi della base. Chiaramente nessuno dei due operatori è limitato come banalmente segue dal calcolare la norma di a o a† sull’n-esimo vettore di base un . Inoltre si vede immediatamente che i due operatori non sono chiusi e il dominio della chiusura di entrambi è √ n o D(a/a† ) := Ψ ∈ H nΨn ∈ `2 (N) , dove Ψn sono i coefficienti di Fourier di Ψ nella base un . Esercizio 3.12. Si consideri l’operatore a† a. Come agisce sulla base {un }. Qual è il dominio della sua chiusura? Esercizio 3.13. Si verifichi se i seguenti operatori sono limitati: Z x 1 1. (Af ) (x) = dy √ f (y) in L2 (0, 1); x−y 0 Z e−|x−y| 2. (Af ) (x) = dy f (y) in L2 (R3 ); |x − y| 3 R 3. (δf )(x) = f (0) con dominio C(−1, 1) ⊂ L2 (−1, 1). L’operatore è chiuso o chiudibile? 3.4 Operatore Aggiunto e Inverso In questa sezione introduciamo le definizioni cruciali di operatore aggiunto, operatore simmetrico e operatore autoagginto che giocheranno un ruolo cruciale nel seguito alla luce del Postulato 2 della MQ, che appunto identifica le osservabili di un sistema quantistico con gli operatori autoaggiunti. Assumeremo sempre di avere a che fare con spazi di Hilbert separabili e operatori definiti su un denso in H . 29 Definizione 3.17 (Aggiunto). Sia A ∈ L (H ), il suo aggiunto è l’operatore A∗ definito nel modo seguente D(A∗ ) := Φ ∈ H ∃Ξ ∈ H t.c. hΦ |AΨ i = hΞ |Ψ i , ∀Ψ ∈ D(A) , A∗ Φ := Ξ. (3.40) Quindi se Φ ∈ D(A∗ ) e Ψ ∈ D(A) allora hA∗ Φ |Ψ i = hΦ |AΨ i. In effetti nel caso in cui A sia limitato (e quindi estendibile a tutto H ) è facile vedere che anche A∗ è limitato e kAk = kA∗ k. Più in generale è facile vedere che il dominio di A∗ è anche dato da (3.41) D(A∗ ) = Φ ∈ H |hΦ |AΨ i| ≤ CkΨk, ∀Ψ ∈ D(A) . Proposizione 3.11 (Proprietà dell’aggiunto). La mappa ∗ soddisfa le seguenti proprietà : • A∗ è chiuso; • A è chiudibile ⇐⇒ D(A∗ ) denso e in tal caso (A∗ )∗ = A; • (AB)∗ = B ∗ A∗ ; • dati due operatori A e B, se D(A) ⊂ D(B) allora D(B ∗ ) ⊂ D(A∗ ). Si noti fra le proprietà enunciate nella precedente Proposizione 3.11 il criterio al punto 2 che può essere molto utile per verificare se un operatore è chiudibile. In realtà vedremo fra poco che tutti gli operatori fisici (in quanto almento simmetrici) sono sempre chiudibili. Riprendiamo ora gli esempi discussi nella sezione precedente, per studiare gli aggiunti degli operatori in questione. Esempio 3.8 (Operatore di moltiplicazione) Sia F (x) ∈ L∞ (Rd ) e consideriamo l’operatore (limitato) di moltiplicazione per F in L2 (Rd ) con dominio C0∞ (Rd ) e verifichiamo che M ∗ è l’operatore di moltiplicazione per F ∗ con dominio tutto L2 (Rd ). Usando la definizione di dominio di M ∗ vediamo che esso è composto dalle Φ tali che sup |hΦ |M Ψ i| ≤ C, kΨk=1,Ψ∈D(M ) ma per ogni Ψ ∈ D(M ) normalizzata Z Z ∗ |hΦ |M Ψ i| = dx Φ (x)F (x)Ψ(x) ≤ kF kL∞ (Rd ) Rd Rd dx |Φ(x)| |Ψ(x)| ≤ C kΦk2 , che è limitato per ogni Φ ∈ L2 (Rd ). Inoltre per ogni Ψ ∈ D(M ) e Φ ∈ L2 (Rd ), Z Z ∗ hΦ |M Ψ i = dx Φ (x)F (x)Ψ(x) = dx (F ∗ (x)Φ(x))∗ Ψ(x) = hM ∗ Φ |Ψ i , Rd Rd e quindi (M ∗ Φ) (x) = F ∗ (x)Φ(x). Esercizio 3.14. Si consideri l’operatore integrale K discusso nell’esempio 3.4 sotto l’ipotesi che K(x, y) ∈ L2 (R2d ) e con D(K) = C0∞ (Rd ) e si dimostri che l’aggiunto K ∗ è anch’esso un operatore integrale con kernel K ∗ (y, x) e il suo dominio è L2 (Rd ). Esempio 3.9 (Operatore posizione) Riprendiamo l’Esempio 3.5 e cerchiamo Q∗ dato l’operatore Q con dominio D(Q) = C0∞ (R). Dimostreremo che D(Q∗ ) = Ψ ∈ L2 (R) xΨ ∈ L2 (R) . (3.42) 30 Osserviamo infatti che per ogni Φ nel dominio di cui sopra si ha Z sup |hΦ |QΨ i| ≤ sup dx (xΦ(x))∗ Ψ(x) ≤ kxΦk2 < +∞, kΨk2 =1,Ψ∈D(Q) kΨk2 =1,Ψ∈D(Q) R per cui certamente D(Q∗ ) contiene le Φ tali che xΦ ∈ L2 (R). Vediamo ora che coincide proprio con tale insieme: sia ξN (x) ≥ 0 una approssimante C0∞ (R) della funzione caratteristica dell’intervallo [−N, N ] tale che ξN (x) = 1 per ogni x ∈ [−N, N ] e che la successione sia monotona in N , allora ogni Φ ∈ D(Q∗ ) deve essere tale che kQ∗ Φk2 < +∞ e possiamo scrivere (per convergenza monotona) kQ∗ Φk2 = lim kQ∗ ξN Φk2 = lim N →∞ sup N →∞ kΨk =1,Ψ∈D(Q) 2 = lim sup N →∞ kΨk =1,Ψ∈D(Q) 2 |hΨ |Q∗ ξN Φ i| = lim sup N →∞ kΨk =1,Ψ∈D(Q) 2 |hQΨ |ξN Φ i| 1/2 Z 1/2 Z 2 dx Ψ∗ (x)xξn (x)Φ(x) = lim < +∞, dx |xξn (x)Φ(x)| N →∞ R R dove abbiamo usato che sup Ψ∈S,kΨk=1 |hΨ |Φ i| = kΦk2 , (3.43) per ogni insieme denso S in H (come D(Q)). Inoltre la successione |x|ξN (x)|Φ(x)| è ancora monotona in N per cui possiamo fare il limite sotto il segno di integrale ottenendo che Ψ ∈ D(Q∗ ) se e solo se Z dx x2 |Φ(x)|2 < +∞. R Naturalmente da quanto ottenuto ricaviamo anche che ∀Φ ∈ D(Q∗ ), (Q∗ Φ) (x) = xΦ(x). Si noti che Q∗ è quindi un’estensione di Q. Esercizio 3.15. Si consideri l’operatore impulso P definito nell’Esempio 3.6. Si dimostri che D(P ∗ ) = H 1 (R) e che su tale dominio P ∗ = P . (Suggerimento: si usi la trasformata di Fourier). Esercizio 3.16. Si riprenda l’Esempio 3.7 e si dimostri che a∗ = a† . E’ altrettanto vero che (a† )∗ = a? Esempio 3.10 Consideriamo l’operatore introdotto nell’Esercizio 3.13 e cerchiamo il suo aggiunto. Sappiamo che Φ ∈ D(δ ∗ ) se Z 1 ∗ sup |hΦ |δΨ i| = sup |Ψ(0)| dx Φ (x) < +∞, kΨk=1,Ψ∈D(δ) kΨk=1,Ψ∈D(δ) −1 C ∞ (−1, 1). per ogni Ψ ∈ Tuttavia è chiaro che il sup al membro di destra può essere solo 0 o +∞. Basta infatti prendere un approssimante in L2 della δ di Dirac: data una f ∈ C0∞ (−1, 1) positiva con f (0) = 1 e normalizzata in L2 (−1, 1), definiamo ( √1 f x , se − ε ≤ x ≤ ε, ε ε Ψε (x) = 0, altrimenti. cosı̀ che Ψε è ancora normalizzata in L2 (−1, 1), appartiene a D(δ) e 1 Ψε (0) = √ −→ ∞. ε ε→0 Abbiamo allora che se Z 1 −1 dx Φ∗ (x) 6= 0, 31 C |hΦ |δΨ i| ≥ C |Ψε (0)| = √ −→ ∞. ε ε→0 kΨk=1,Ψ∈D(δ) sup Quindi le uniche funzioni in D(δ ∗ ) sono quelle a media nulla, i.e., Z 1 ∗ 2 dx Φ(x) = 0 . D(δ ) = Φ ∈ L (−1, 1) −1 Inoltre su queste funzioni hΦ |δΨ i = 0 = hδ ∗ Φ |Ψ i , ∀Ψ ∈ D(δ), cioè, poiché D(δ) è un denso, δ ∗ Φ = 0 per ogni Φ ∈ D(δ ∗ ). Si noti che D(δ ∗ ) non è denso in L2 (−1, 1) (tutte le funzioni pari sono ortogonali a D(δ ∗ )) e perciò δ non è chiudibile. Esercizio 3.17. Sia F (x) un funzione misurabile su R ma F ∈ / L2 (R) e sia Ψ0 un qualsisi vettore non nullo 2 in L (R). Definiamo l’operatore Z 2 dx |F (x)| |Ψ(x)| < +∞ . T Ψ = hF |Ψ i Ψ0 , D(T ) = Ψ ∈ L (R) R Si trovi T ∗ e D(T ∗ ) e si dica se l’operatore è chiudibile. Concludiamo la sezione introducendo due sottospazi molto importanti per ogni operatore A ∈ L (H ): Definizione 3.18 (Immagine e nucleo). Dato un operatore A ∈ L (H ) definiamo • il suo nucleo ker(A) := Ψ ∈ D(A) AΨ = 0 ; • la sua immagine ran(A) := Φ ∈ H ∃Ψ ∈ D(A) t.c. Φ = AΨ . Possiamo ora chiederci quando A è invertibile, ovvero se esiste un operatore A−1 : ran(A) → D(A) tale che AA−1 = A−1 A = I. Un importante criterio per l’esistenza dell’inverso limitato è la seguente Proposizione 3.12 (Inverso limitato). Un operatore A ∈ L (H ) ammette inverso limitato se e solo se ∃C > 0 tale che kAΨk ≥ C kΨk , ∀Ψ ∈ D(A). (3.44) Dimostrazione. (⇐=) Se vale la (3.44) allora ker(A) = ∅. Quindi si può definire un operatore dal ran(A) → D(A) dato da A−1 Φ = Ψ tale che Φ = AΨ. Inoltre ponendo Φ = AΨ si ha sempre dalla (3.44) kΦk ≥ C A−1 Φ , cioè l’inverso è automaticamente limitato. (=⇒) Viceversa se esiste A−1 limitato, allora per definizione di operatore limitato −1 A Φ ≤ C kΦk , per una qualche C > 0 limitata e per ogni Φ ∈ D(A−1 ) = ran(A). Ma allora ponendo Ψ = A−1 Φ si ha Ψ ∈ D(A) e la (3.44) è soddisfatta. 32 3.5 Operatori Simmetrici, Autoaggiunti, Unitari e Proiettori Possiamo ora definire le due classi di operatori più rilevanti di questo corso. Definizione 3.19 (Operatore simmetrico). Un operatore A su H è detto simmetrico se A ⊂ A∗ , ovvero D(A) ( D(A∗ ) e A = A∗ su D(A). Definizione 3.20 (Operatore autoaggiunto). Un operatore A su H è detto autoaggiunto se A = A∗ , ovvero D(A) = D(A∗ ) e A = A∗ . Si dice essenzialmente autoaggiunto se A = A∗ . La differenza fra operatori simmetrici e autoaggiunti è una specificità degli operatori illimitati, in quanto per operatori limitati le due definizioni coincidono. In effetti se A = A∗ su D(A), automaticamente D(A) ⊂ D(A∗ ), cioè se A è simmetrico A∗ è sempre un’estensione di A. E’ importante sottolineare che ogni operatore simmetrico è chiudibile, poiché A∗ definisce un’estensione chiusa di A. Più precisamente si hanno le seguenti relazioni: A simmetrico =⇒ A ⊂ A∗∗ ⊂ A∗ , A simmetrico chiuso =⇒ A = A∗∗ ⊂ A∗ , A essenzialmente autoaggiunto =⇒ A ⊂ A∗∗ = A∗ , A autoaggiunto =⇒ A = A∗∗ = A∗ . (3.45) Osservazione 3.3. Grazie alle proprietà degli operatori autoaggiunti, per ogni osservabile A e stati Ψ, Φ ∈ D(A) di un determinato sistema quantistico si ha l’uguaglianza hΦ |AΨ i = hAΦ |Ψ i , cioè l’espressione non dipende dallo stato su cui si fa agire A. Per questo nel caso di osservabili e quindi di operatori autoaggiunti si usa l’espressione hΦ| A |Ψi := hΦ |AΨ i = hAΦ |Ψ i . (3.46) Torniamo a discutere gli esempi trattati in precedenza: Esempio 3.11 (Operatore di moltiplicazione) L’operatore (limitato) di moltiplicazione per F limitata in L2 (Rd ) con dominio C0∞ (Rd ) è essenzialmente autoaggiunto se e solo se F è reale. In tal caso ovviamente il dominio di autoaggiunzione è tutto L2 (Rd ). limitato, ma essoè Più in generale se F ∈ L2loc (R) l’operatore M con D(M ) = C0∞ (R) non è necessariamente essenzialmente autoaggiunto se e solo se F ∗ = F e in tal caso D(M ∗ ) = D(M ) = Ψ ∈ L2 (R) | F Ψ ∈ L2 (R) . ∞ Esercizio 3.18. Dimostrare quanto affermato per un operatore di moltiplicazione con F ∈ L∞ loc (R) \ L (R). Esercizio 3.19. Sia K un operatore integrale in L2 (Rd ) con kernel K(x, y) tale che k1 , k2 < +∞ (si veda la Proposizione 3.10). Si trovino le condizioni più generali di autoaggiunzione di K. Esempio 3.12 (Operatore posizione) Riprensiamo l’Esempio 3.5: come dimostrato Q ⊂ Q∗ , vediamo ora che Q è in effetti essenzialmente autoaggiunto, cioè Q = Q∗ . A questo proposito osserviamo che D(Q∗ ) in (3.42) è ovviamente il dominio di un operatore chiuso. Inoltre il dominio della chiusura di Q dovrà contenere tutti i vettori Ψ tali che ∃Ψn ∈ D(Q), Ψn → Ψ e QΨn → Φ ∈ L2 (R), ma questo è ovviamente equivalente a prendere la chiusura di D(Q) = C0∞ (R) nella norma (si verifichi che è una norma) k · k2Q := k · k2L2 (R) + kx · k2L2 (R) . D’altra parte tale chiusura coincide precisamente con D(Q∗ ). 33 Esercizio 3.20. Si dimostri che l’operatore impulso P discusso nell’Esempio 3.6 è anch’esso essenzialmente autoaggiunto. Esempio 3.13 (Operatore impulso sull’intervallo) Consideriamo ora l’operatore P in L2 (0, 1) con dominio di definizione D(P ) = C0∞ (0, 1). L’operatore non è ovviamente chiuso ma il suo aggiunto è facile da trovare: il dominio di P ∗ sarà dato dalle Φ ∈ L2 (0, 1) tali che sup |hΦ |P Ψ i| < +∞, kΨk=1,Ψ∈D(P ) ma questo è per definizione l’insieme delle funzioni che ammettono derivata debole. Tale insieme coincide con lo spazio D(P ∗ ) = AC[0, 1], (3.47) cioè le funzioni assolutamente continue3 nell’intervallo [0, 1]: f si dice assolutamente continua se ∀δ > 0, ∃ε > 0 tale che n n X X f (xi ) − f (x0i ) < ε, xi − x0i < δ =⇒ i=1 i=1 [xi , x0i ]. per ogni collezione finita di intervalli In effetti è facile verificare che AC[0, 1] coincide esattamente con H 1 (0, 1) definito nella Definizione 3.7: Ψ ammette derivata debole se e solo se Z 1 0 dx Ψ(x)f (x) < +∞, ∀f ∈ C0∞ (0, 1), 0 ma sviluppando l’integrale nella base di Fourier abbiamo X ∗ Ψn nfn < +∞, n∈Z per ogni f ∈ C0∞ (0, 1). D’altra parte C0∞ è denso in L2 (0, 1) e quindi i coefficienti di Fourier di una f ∈ C0∞ (0, 1) sono densi in `2 (Z). Perciò la condizione precedente equivale a X k{nΨn }k2`2 (Z) = |n|2 |Ψn |2 < +∞, n∈Z che è esattamente la definizione di H 1 (0, 1). L’azione di P ∗ sul suo dominio è facile da ricavare: se Φ ∈ D(P ∗ ) e Ψ ∈ D(P ), Z hΦ |P Ψ i = −i 1 dx Φ∗ (x)∂x Ψ(x) = i 0 Z 1 dx ∂x Φ∗ (x)Ψ(x) = 0 Z 1 dx (−i∂x Φ(x))∗ Ψ(x) = hP Φ |Ψ i , 0 dove abbiamo integrato per parti. Si noti che l’assenza di termini di bordo è dovuta al fatto che le funzioni in D(P ) hanno supporto compatto in (0, 1). A questo punto c’è da chiedersi se l’operatore sia essenzialmente autoaggiunto come nel caso di P sulla retta reale R. Sicuramente D(P ) ⊂ D(P ∗ ) quindi P ⊂ P ∗ , ma P non è chiuso anche se chiudibile. Dobbiamo perciò chiederci che dominio ha P : data una successione Ψ(j) ∈ C ∞ (0, 1), j ∈ N , assumiamo perciò che Ψ(j) −→ Ψ ∈ L2 (0, 1) e ∂x Ψ(j) −→ Φ ∈ L2 (0, 1). Allora questo implica la convergenza di Ψ(j) nella norma j→∞ j→∞ H 1 che è definita come kΨk2H 1 (0,1) = X n2 + 1 |Ψn |2 , (3.48) n∈Z Il teorema fondamentale del calcolo dice precisamente che se f ∈ AC[0, 1], allora f 0 è definita quasi ovunque, f 0 ∈ L1 (0, 1) e f coincide con l’integrale indefinito di f 0 . Viceversa se g ∈ L1 (0, 1), allora G(x) uguale all’integrale indefinito di g è assolutamente continua e G0 = g. 3 34 (j) dove gli Ψn sono i coefficienti rispetto alla base di Fourier di Ψ. D’altra parte la convergenza in H 1 (0, 1) implica la convergenza in L∞ (0, 1) (vedere la Proposizione 3.13) e quindi Ψ(j) converge a Ψ uniformemente. Ma siccome Ψ(j) (0) = Ψ(j) (1) = 0 per ogni j ∈ N, allora la convergenza uniforme implica che Ψ(0) = Ψ(1) = 0. (3.49) D(P ) = Ψ ∈ H 1 (0, 1) Ψ(0) = Ψ(1) = 0 ( D(P ∗ ), (3.50) Possiamo quindi conlcudere che cioè l’operatore è simmetrico ma non autoaggiunto. Proposizione 3.13 (Immersione di Sobolev). Sia I ⊂ R un intervallo della retta reale, allora ∃C < +∞ indipendente da I tale che kΨkL∞ (I) ≤ C kΨkH 1 (I) . (3.51) In particolare se Ψ ∈ H 1 (I) allora Ψ è continua e limitata su I. Dimostrazione. Dimostriamo la (3.51). Si noti anzitutto che per ogni Ψ ∈ H 1 (I) la serie di Fourier converge totalmente e quindi uniformemente: infatti per ogni x ∈ I |Ψ(x)| ≤ X n∈Z |Ψn | ≤ X 2 n + 1 |Ψn | 2 1/2 X n∈Z n∈Z 1 n2 + 1 1/2 ≤ C kΨkH 1 (I) dove abbiamo indicato con Ψn i coefficienti di Ψ rispetto alla base di Fourier. Prendendo il sup rispetto a x ∈ I otteniamo immediatamente il risultato. La continuità di Ψ segue in modo analogo, applicando il teorema di convergenza dominata. Chiudiamo la Sezione introducendo un’altra classe di operatori molto importanti in MQ, in quanto implementano le simmetrie dei sistemi quantistici (teorema di Wigner), cioè gli operatori unitari. Prendiamo allora due spazi di Hilbert (separabili) H e H 0 con i relativi prodotti scalari h· |· i e (·, ·), si ha la seguente Definizione 3.21 (Isometria). Un’isometria T : H −→ H 0 è un operatore lineare tale che hΨ |Φ i = (T Ψ, T Φ) , ∀Ψ, Φ ∈ H . (3.52) Definizione 3.22 (Operatore unitario). Un operatore U : H −→ H 0 è un operatore unitario se è un’isometria e ran(U ) = H 0 . Proposizione 3.14 (Inverso di un operatore unitario). Un operatore U è unitario se e solo se U −1 è limitato e U −1 = U ∗ . Osservazione 3.4. Si noti che l’aggiunto che compare nella Proposizione 3.14 non è quello usuale, nel senso che abbiamo definito l’aggiunto solo nel caso in cui H = H 0 . La generalizzazione è tuttavia banale: dato un operatore lineare A : H −→ H 0 , si ha D(A∗ ) = Φ ∈ H 0 ∃Ξ ∈ H 0 , hΦ |AΨ i = hΞ |Ψ i , ∀Ψ ∈ D(A) , A∗ Φ := Ξ. (3.53) Osservazione 3.5. L’unica differenza fra un’isometria e un operatore unitario sta nell’immagine: entrambi sono operatori limitati con norma 1 da H a H 0 e entrambi sono invertibili in quanto hanno nucleo banale. Tuttavia nel caso di un’isometria l’inverso non è definito in generale su tutto H 0 poiché un’isomtria non è necessariamente surgettiva. Quando questo accade allora l’isometria definisce un operatore unitario. 35 Esempio 3.14 (Trasformata di Fourier) Come già discusso in precedenza la trasformata di Fourier (3.17) definisce un operatore unitario da L2 (Rd ) −→ L2 (Rd ). Esempio 3.15 Un facile di esempio di operatore unitario si costruisce astrattamente data una base {un }n∈N di uno spazio di Hilbert numberabile H : l’operatore U : H −→ `2 (N) definito nel seguente modo è infatti ovviamente unitario (si veda il Teorema 3.1) X U Ψ = {hun |Ψ i}n∈N , U −1 {Ψn }n∈N = Ψn un . n∈N Esercizio 3.21. Dimostrare che gli operatori (Ua Ψ)(x) = eiax Ψ(x) e (Vb Ψ)(x) = Ψ(x − b) definiti da L2 (R) in se stesso con a, b ∈ R sono unitari e ricavare l’espressione esplicita dell’aggiunto. Esempio 3.16 (Operatori di shift) Consideriamo in `2 (N) il seguente operatore (operatore di right shift) T (a1 , . . . , an , . . .) = (0, a1 , . . .) . Alternativamente si può definire sugli elementi della base canonica come T en = en+1 . L’operatore ha ovviamente norma 1 poiché ∞ X 2 kT {an }k = |an |2 = k{an }k2 . n=1 Inoltre come operatore da `2 (N) → `2 (N) esso definisce un’isometria in quanto hT {an } |T {bn } i = ∞ X a∗n bn = h{an } |{bn } i . n=1 Resta da capire se si tratta di un operatore unitario ma si vede subito che cosı̀ non può essere: il vettore e1 è infatti ortogonale a tutti i vettori in ran(T ). Infatti ran(T ) contiene vettori della forma ∞ X an−1 en . n=2 D’altra parte sappiamo che T ∗ è l’operatore (operatore di left shift) T ∗ (a1 , . . . , an , . . .) = (a2 , . . .) , o sugli elementi della base T en = en−1 se n ≥ 2 e T e1 = 0. E’ quindi facile vedere che T ∗ T = I, T T ∗ = I − he1 |· i e1 , cioè T T ∗ coincide con l’identità ma solo nel sottospazio ortogonale a e1 . Una delle proprietà più utili degli operatori unitari riguarda gli operatori autoaggiunti: Teorema 3.10 (Equivalenza unitaria I). Dato un operatore A su H e un unitario U : H −→ H 0 , sia A0 l’operatore D(A0 ) = Ψ0 ∈ H 0 ∃Ψ ∈ D(A), Ψ0 = U Ψ , A0 Ψ0 := U AU −1 Ψ0 . Allora A è (essenzialmente) autoaggiunto se e solo se A0 è (essenzialmente) autoaggiunto. (3.54) 36 Osservazione 3.6. Abbiamo già usato implicitamente questo risultato studiando l’operatore impulso e osservando che a meno di un operatore unitario, la trasformata di Fourier appunto, esso coincide con l’operatore posizione Q e quindi ne condivide le proprietà. Vedremo che questa strategia, ovvero l’uso di un operatore unitario che trasforma l’operatore in questione in un operatore di moltiplicazione, è alla base del teorema spettrale. Chiudiamo la sezione introducendo un ultimo tipo di operatori che entrerà nella discussione del teorema spettrale. Definizione 3.23 (Proiettore). Un operatore P ∈ L (H ) si dice proiettore ortogonale se esiste un sottospazio K chiuso di H tale che per ogni Ψ ∈ H , Ψ = Φ + Φ⊥ con Φ ∈ K e P Ψ = Φ. Proposizione 3.15 (Proprietà dei proiettori). Un operatore P ∈ L (H ) è un proiettore ortogonale se e solo se P è limitato, P 2 = P e P ∗ = P . Esempio 3.17 Se consideriamo il sottospazio unidimensionale generato da un vettore Φ di modulo unitario, il relativo proiettore ortogonale è ovviamente P Ψ = hΦ |Ψ i Φ. La verifica delle proprietà della Proposizione 3.15 è lasciata per esercizio. 3.6 Principio di Indeterminazione Una cosenguenza diretta della struttura dello spazio (algrebra) delle osservabili di un sistema quantistico, ovvero degli operatori autoaggiunti su uno spazio di Hilbert separabile, è il principio di indeterminazione. In effetti il nome stesso di questa proprietà è fuorviante in quanto si può appunto vedere come conseguenza dei postulati su cui è construita la teoria4 . Tuttavia storicamente è stato introdotto indipendentemente dallo sviluppo assiomatico della MQ e per questo si conserva ancora il nome di principio di interminazione. In estrema sintesi il principio di intederminazione si può riassumere nel modo seguente: se due osservabili non commutano allora non esistono autostati simultanei di entrambe. Più precisamente l’dispersione o deviazione standard delle osservabili A e B su un generico stato Ψ, ovvero rD q E 2 ∆Ψ A := hA2 iΨ − hAiΨ = Ψ (A − hAiΨ )2 Ψ , hAiΨ := h Ψ |A| Ψ i , (3.55) soddisfa un’esplicita disguguaglianza, il principio di indeterminazione appunto. commutatore di due operatori A e B è definito come l’operatore Ricordiamo che il [A, B] := AB − BA. (3.56) Teorema 3.11 (Principio di indeterminazione). Siano A e B due operatori autoaggiunti su H e Ψ ∈ H tale che Ψ, AΨ, BΨ ∈ D(A) ∩ D(B), allora ∆Ψ A ∆Ψ B ≥ 1 2 |h Ψ |[A, B]| Ψ i| . (3.57) Dimostrazione. Sia Ψ un vettore che soddisfa le ipotesi dell’enunciato e λ ∈ C, allora ponendo A0 = A−hAiΨ e B 0 = B − hBiΨ (si noti che se A e B sono autoaggiunto lo stesso vale per A0 e B 0 ) 2 0 ≤ A0 + iλB 0 Ψ = A0 + iλB 0 Ψ A0 + iλB 0 Ψ = Ψ A0 − iλB 0 A0 + iλB 0 Ψ D E D E 2 2 = Ψ A0 Ψ + λ Ψ i[A0 , B 0 ] Ψ + λ2 Ψ B 0 Ψ = (∆Ψ A)2 + λ h Ψ |i[A, B]| Ψ i + λ2 (∆Ψ B)2 , dove abbiamo usato la definizione (3.55) di ∆Ψ A e sfruttato il fatto che [A0 , B 0 ] = [A, B]. Ora poiché [A, B] è simmetrico sul suo dominio, a cui Ψ appartiene per ipotesi, i coefficienti del polinomio in λ di sopra sono 4 In realtà in inglese si usa la terminologia uncertainty relation che è molto più appropriata. 37 reali. Pertanto la disuguaglianza può essere soffisfatta per ogni λ se e solo se l’equazione di secondo grado non ammette soluzione o ne ammette una sola, ovvero (h Ψ |i[A, B]| Ψ i)2 − 4 (∆Ψ A)2 (∆Ψ B)2 ≤ 0, da cui segue direttamente l’enunciato. Vediamo ora quali sono le conseguenze fisiche del principio di indeterminazione. Data una qualunque osservabile ∆Ψ A = 0 su un certo stato Ψ se e solo se Ψ è un autostato di A (si veda anche la Sezione 3.8. Al contrario preso genericamente uno stato Ψ, la misura dell’osservabile A avrà una deviazione standard non nulla. Il principio di indeterminazione afferma allora che date due osservabili A e B possono esistere stati senza dispersione per entrambe le osservabili solo se le due osservabili commutano. Non solo ma il prodotto delle dispersioni delle due osservabili è sempre maggiore o uguale di una certa quantità proporzionale al valore di aspettazione del commutatore. E’ particolarmente esemplificativo il caso in cui si prendano due osservabili A e B tali che [A, B] 6= 0 e un autovettore di A: in questo caso ∆Ψ A = 0, ma il membro di destra della (3.57) sarà in generale non nullo e quindi ∆Ψ B = +∞! Questa discussione conduce naturalmente alla seguente definizione: Definizione 3.24 (Osservabili compatibili). Due osservabili A e B si dicono compatibili se D(A) ∩ D(B) denso in H e [A, B] = 0 su D(A) ∩ D(B). Esempio 3.18 (Posizione e impulso) Il caso più importante in assoluto di una coppia di osservabili non compatibili sono la posizione Q e l’impulso P descritte negli Esempio 3.5 e 3.6. Come vedremo tali operatori descrivono la posizione e l’impulso di una particella sulla retta reale R. Osserviamo anzitutto che esiste un denso appartenente all’intersezione di D(Q) e D(P ), che è banalmente dato, ad esempio, da C0∞ (R). Presa una qualunque Ψ ∈ C0∞ (R), possiamo calcolare il commutatore [Q, P ]Ψ (x) = −ix∂x Ψ(x) + i∂x (xΨ(x)) = iΨ(x), cioè [Q, P ] = iI. (3.58) Il commutatore di Q e P è dunque non nullo e porporzionale all’identità. Inoltre se prendiamo ancora Ψ ∈ C0∞ (R) le ipotesi del Teorema 3.11 sono soddisfatte e quindi ∆Ψ Q ∆Ψ P ≥ 12 . (3.59) Tornando alla discussione precedente vediamo quindi che non esistono stati nell’intersezione del dominio di Q e P sui quali sia la posizione che l’impulso abbiano valore definito! Se perciò misurassimo l’impulso di una particella di cui conosciamo con esattezza la posizione, otterremmo qualunque valore sulla retta reale con dispersione infinita. Allo stesso modo la misura della posizione di una particella con impulso definito avrà dispersione infinita. Per questo si è soliti dire che non si può conoscere simultaneamente posizione e impulso di una particella quantistica allo stesso tempo. 3.7 Criterio di Autoaggiunzione e Estensioni Autoaggiunte Per capire se un operatore è autoaggiunto è spesso conveniente il seguente criterio. Teorema 3.12 (Criterio di autoaggiunzione). Sia A un operatore simmetrico su H . Allora le seguenti affermazioni sono equivalenti: i) A autoaggiunto; ii) A chiuso e ker(A∗ ± i) = {0}; 38 iii) ran(A ± i) = H . Dimostrazione. (1 =⇒ 2) Supponiamo che esista Ψ ∈ D(A∗ ) tale che A∗ Ψ = −iΨ (il caso di segno positivo è del tutto analogo), allora i kΨk2 = h−iΨ |Ψ i = hA∗ Ψ |Ψ i = hΨ |AΨ i = −i kΨk2 =⇒ Ψ = 0. (2 =⇒ 3) Poiché A∗ Ψ = −iΨ non ha soluzione non banale, ran(A − i) deve essere denso in H . Supponiamo infatti che cosı̀ non sia, cioè esista Ψ0 ∈ H non nullo tale che Ψ0 ⊥ ran(A − i), allora avremmo per ogni Ψ ∈ D(A) hΨ0 |(A − i)Ψ i = 0, il che implica che Ψ0 ∈ D(A∗ ). Inoltre 0 = hΨ0 |(A − i)Ψ i = h(A∗ + i)Ψ0 |Ψ i , che non è possibile in quanto per densità di D(A) implicherebbe (A∗ + i)Ψ0 = 0, che ha solo la soluzione nulla. Rimane quindi da dimostrare che ran(A − i) = H , cioè che ran(A − i) è chiuso in norma. Notiamo però che k(A − i)Ψk2 = kAΨk2 + kΨk2 , per cui se presa una successione Ψn ∈ D(A), si ha (A − i)Ψn → Φ ∈ H , allora si ha anche Ψn → Ψ ∈ D(A). Dato che l’operatore è chiuso concludiamo che Φ ∈ ran(A) e Φ = (A − i)Ψ. Pertanto ran(A − i) è chiuso e coincide con H . (3 =⇒ 1) Sia ora Φ ∈ D(A∗ ). Dato che ran(A − i) = H , ∃Ψ ∈ D(A) tale che (A∗ − i)Φ = (A − i)Ψ. D’altra parte D(A) ⊂ D(A∗ ) per cui Φ − Ψ ∈ D(A∗ ) e (A∗ − i)(Φ − Ψ) = 0. (3.60) Ma ran(A + i) = H implica che ker(A∗ − i) = {0}: ragionando come prima infatti se esistesse uno Ψ0 non nullo tale che (A∗ − i)Ψ0 = 0, allora per ogni Ψ ∈ D(A) si avrebbe 0 = hΨ |(A∗ − i)Ψ0 i = h(A + i)Ψ |Ψ0 i , cioè Ψ0 sarebbe ortogonale a ran(A + i), che contraddice le ipotesi. Perciò la (3.60) in combinazione con ker(A∗ − i) = {0} implica che Ψ = Φ, cioè ogni Φ ∈ D(A∗ ) appartiene anche a D(A). In altri termini D(A) = D(A∗ ) e l’operatore è autoaggiunto. Osservazione 3.7. Se A non è chiuso vale un teorema analogo a quello precedente in cui al punto 1 “autoaggiunto” va sostituito con “essenzialmente autoaggiunto” e il punto 2 diventa ker(A∗ ± i) = {0} e il punto 3 ran(A ± i) “denso in H ” anziché coincidente con l’intero H . Osservazione 3.8. E’ immediato verificare che l’enunciato del Teorema 3.12 precedente non cambia se anziché considerare A∗ ± i o A ± i si prende un generico numero complesso z tale che =(z) 6= 0 e si considerano gli operatori A∗ ± z e A ± z. In particolare il fatto che ran(A − z) = H implica che l’inverso (A − z)−1 è un operatore limitato e (A − z)−1 ≤ 1 , dist(z, ρ(A)) (3.61) come segue banalmente da k(A − z)Ψk2 = k(A − <(z))Ψk2 + |=(z)|2 kΨk2 ≥ |=(z)|2 kΨk2 , che vale per ogni Ψ ∈ D(A): ponendo quindi Φ = (A − z)Ψ ∈ H si ottiene la disuguaglianza. (3.62) 39 Esempio 3.19 (Operatore posizione) Sappiamo già che l’operatore Q dell’Esempio 3.5 è essenzialmente autoaggiunto. Dimostriamolo usando il punto 3 del Teorema 3.12. L’operatore Q agisce come moltiplicazione per x, per cui ci dobbiamo chiedere se al variare di Ψ ∈ D(Q), (x ± i)Ψ(x) sia denso in H . Ma questo è ovvio perché per ogni Φ ∈ C0∞ (R) Φ(x) ∈ C0∞ (R) = D(Q). x±i Pertanto ran(P ± i) contiene un denso dato da C0∞ (R). Esercizio 3.22. Applicare i criteri del Teorema 3.12 all’operatore P definito nell’Esempio 3.6 per trovare dimostrazioni alternative che è essenzialmente autoaggiunto. Esempio 3.20 (Operatore impulso sull’intervallo) Riprendiamo l’operatore impulso su L2 (0, 1) introdotto nell’Esempio 3.13. Come abbiamo visto esso non è autoaggiunto. Vediamo se si poteva arrivare alla medesima conclusione in modo alternativo, usando cioè il Teorema 3.12: usiamo il punto 2 e cerchiamo una soluzione non banale dell’equazione P Ψ = ±Ψ =⇒ ∂x Ψ(x) = ±Ψ(x), che ha come soluzioni Ψ± (x) = Ce±x . Siccome Ψ± ∈ D(P ∗ ) in quanto funzioni dolci, il nucleo di P ∗ ± i è non banale e quindi l’operatore non può essere essenzialmente autoaggiunto. Si noti che Ψ± ∈ / D(P ) per cui è essenziale che al punto 2 del criterio di autoaggiunzione si consideri l’aggiunto dell’operatore. Analogamente a quanto discusso nella dimostrazione del Teorema 3.12 inoltre Ψ± sono automaticamente ortogonali a tutto ran(P ± i) e quindi quest’ultimo non può essere denso. Esercizio 3.23. Si consideri l’operatore P definito nell’Esempio 3.20 1precedente e si dimostri che esso ammette infinite estensioni autoaggiunte con dominio D(Pα ) = Ψ ∈ H (0, 1) | Ψ(1) = αΨ(0) con α ∈ C, |α| = 1. Esempio 3.21 (Interazione puntuale) Si consideri l’operatore H = −∆ definito sul dominio D(H) := C0∞ (R \ {0}), cioè le funzioni dolci a supporto lontano dall’origine, quindi tali che Ψ(0) = 0. Come sappiamo −∆ è autoaggiunto su H 2 (R) per cui portemmo aspettarci che H sia essenzialmente autoaggiunta. Tuttavia è facile vedere che D(H) ( H 2 (R) in quanto la convergenza simultanea della funzione e della derivata seconda implica la convergenza uniforme della successione e, di conseguenza, tutte le funzioni in D(H) si annullano all’origine. Quindi il dominio della chiusura dell’operatore non coincide con H 2 (R). Verifichiamo che H non è essenzialmente autoaggiunto. Consideriamo le funzioni n o Ψ± (x) := exp − √12 (1 ± i) |x| , (3.63) e osserviamo che esse soddisfano − ∆Ψ± (x) = ∓iΨ± (x), ∀x 6= 0. (3.64) Dimostriamo che esse appartengono a ran(H ∓ i)⊥ : per ogni Ψ ∈ D(H) abbiamo che dist(supp(Ψ), {0}) ≥ ε, per un qualche ε > 0, allora Z hΨ± |(H ∓ i)Ψ i = dx Ψ∗± (x) (−∆ ± i) Ψ(x) R Z −ε Z ∞ Z ∗ ∗ = dx Ψ± (x) (−∆Ψ) (x) + dx Ψ± (x) (−∆Ψ) (x) ∓ i dx Ψ∗± (x)Ψ(x) = −∞ −ε Z = ε ∗ R Z dx (−∆Ψ± ) (x)Ψ(x) + −∞ ε ∞ ∗ Z dx (−∆Ψ± ) (x)Ψ(x) ∓ i dx Ψ∗± (x)Ψ(x) R Z Z = ±i dx Ψ∗± (x)Ψ(x) ∓ i dx Ψ∗± (x)Ψ(x) = 0. R R 40 Quindi ran(H ∓ i) non è denso e l’operatore non è essenzialmente autoaggiunto per il Teorema 3.12. Esercizio 3.24. Si dimostri che l’operatore H dell’Esempio 3.21 ammette infinite estensioni autoaggiunte Hα di dominio D(Hα ) = {Ψ ∈ H 1 (R) ∩ H 2 (R \ {0}) | Ψ0 (0+ ) − Ψ0 (0− ) = αΨ(0)} con α ∈ R. Esercizio 3.25. Si dimostri che l’operatore N := a† a introdotto nell’Esercizio 3.12 è essenzialmente autoaggiunto e si trovi il dominio di autoaggiunzione. Un metodo costruttivo per verificare l’autoaggiunzione di un operatore è fornito dal Teorema di Kato-Rellich che garantisce la stabilità dell’autoaggiunzione rispetto a piccole perturbazioni. Definizione 3.25 (Piccola perturbazione). Dati due operatori autoaggiunti A e B con D(A) ⊂ D(B), B è una piccola perturbazione (nel senso di Kato) di A se esistono a < 1 e b < ∞ tali che per ogni Ψ ∈ D(A) kBΨk ≤ a kAΨk + bkΨk. (3.65) Osservazione 3.9. Un caso banale in cui la (3.65) è verificata è quello di B operatore limitato autoaggiunto. In tal caso la disuguaglianza vale per a = 0 e b = kBk. Osservazione 3.10. Nella definizione di piccola perturbazione è sufficiente che la disuguaglianza (3.65) sia verificata su un dominio di essenziale autoaggiunzione di A che sia denso in H . Teorema 3.13 (Teorema di Kato-Rellich). Siano A un operatore autoaggiunto su D(A) e B un operatore simmetrico piccola perturbazione di A, allora A + B è autoaggiunto su D(A). Osservazione 3.11. Alla luce di quanto detto nell’Osservazione 3.10, il Teorema 3.13 si applica anche al caso in cui A sia essenzialmente autoaggiunto su un denso D(A) su cui B è una piccola perturbazione di A. In questo caso naturalmente A + B sarà essenzialmente autoaggiunto su D(A). Dimostrazione. Usiamo il punto 3 del Teorema 3.12, cioè dimostriamo che per un certo µ > 0, ran(A + B + iµ) = H . Osserviamo anzitutto che per la (3.61) A + iµ è invertibile e ponendo z = −iµ e Ψ = (A + iµ)−1 Φ nella (3.62) si ottiene che kA(A + iµ)−1 k ≤ 1. Allora usando la definizione di piccolezza B(A + iµ)−1 Ψ ≤ a A(A + iµ)−1 Ψ + b (A + iµ)−1 Ψ ≤ a + b kΨk, µ dove abbiamo usato la (3.61) e il fatto che per ogni Φ ∈ L2 (R3 ) k(A + iµ)Φk2 = kAΦk2 + |µ|2 kΦk2 , b che applicata a Φ = (A + iµ)−1 Ψ dà A(A + iµ)−1 Ψ ≤ 1. Prendendo µ > 1−a che è limitato poiché a < 1, −1 −1 otteniamo B(A + iµ) Ψ ≤ kΨk. Allora I + B(A + iµ) è un operatore invertibile con inverso limitato per la (3.44). Per ogni Φ ∈ H possiamo allora definire Ψ = (A + iµ)−1 I + B(A + iµ)−1 −1 Φ. Ovviamente Ψ ∈ D(A) e usando l’identità A + B + iµ = I + B(A + iµ)−1 (A + iµ) , otteniamo (A + B + iµ) (A + iµ)−1 I + B(A + iµ)−1 −1 = I, per cui ogni Φ ∈ H è ottenibile come (A+B +iµ)Ψ per una certa Ψ ∈ D(A), cioè ran(A+B +iµ) = H . Un altro caso in cui l’autoaggiunzione è garantita è quello degli operatori positivi limitati: 41 Definizione 3.26 (Operatore positivo). Diciamo che un operatore A ∈ L (H ) è positivo e lo indichiamo con A ≥ 0, se hΨ |AΨ i ≥ 0, ∀Ψ ∈ D(A). (3.66) Dati due operatori A e B diciamo che A ≥ B se A − B ≥ 0. Proposizione 3.16 (Autoaggiunzione degli operatori positivi). Se A ∈ B(H ) è chiuso e positivo, allora A è autoaggiunto. Dimostrazione. La dimostrazione è molto semplice e sfrutta il fatto che H è uno spazio di Hilbert complesso. Dato che A è limitato e chiuso D(A) = H . Inoltre per ogni Ψ ∈ H , 0 ≤ hΨ |AΨ i = hΨ |AΨ i∗ = hAΨ |Ψ i . Questo si generalizza facilmente a qualunque coppia di Ψ, Φ ∈ H , usando l’identità di polarizzazione hΨ |AΦ i = 1 4 hA(Ψ + Φ) |Ψ + Φ i + 41 hA(Ψ − Φ) |Ψ − Φ i + 4i hA(Ψ − iΦ) |Ψ − iΦ i − 4i hA(Ψ + iΦ) |Ψ + iΦ i , ricavando hΨ |AΦ i = hAΨ |Φ i , per ogni Ψ, Φ ∈ H . E’ importante sottolineare come nel caso in cui A sia limitato dal basso il Teorema di Kato-Rellich (3.13) garantisca anche la limitatezza dal basso di A + B. Prima di enunciare il risultato formuliamo precisamente la definizione di operatore limitato dal basso: Definizione 3.27 (Operatori limitati dal basso). Un operatore A simmetrico è limitato dal basso se ∃|λ0 | < +∞ tale che A ≥ −λ0 , i.e., hΨ |AΨ i ≥ −λ0 kΨk2 , ∀Ψ ∈ D(A). (3.67) Corollario 3.1 (Limitatezza dal basso di A + B). Siano A, B due operatori che soddisfano le ipotesi del Teorema di Kato-Rellich 3.13 e sia A limitato dal basso con limite dal basso −λ0 . Allora A + B è limitato dal basso e b (3.68) , a|λ0 | + b . A + B ≥ −λ0 − max 1−a Dimostrazione. E’ sufficiente ripercorrere la dimostrazione del Teorema 3.13 sostituendo (A + iµ)−1 con (A + λ)−1 , λ > λ0 . La limitatezza dal basso di A garantisce che tale operatore sia limitato. Dopodiché si procede allo stesso modo e si osserva che kB(A + λ)−1 k < 1 se b λ > λ0 + max , a|λ0 | + b . 1−a Infatti b B(A + λ)−1 Ψ ≤ a A(A + λ)−1 Ψ + b (A + λ)−1 Ψ ≤ a max 1, |λ0 | + kΨk, λ − λ0 λ − λ0 dove abbiamo usato la disuguaglianza |λ | 0 −1 A(A + λ) ≤ max 1, , λ − λ0 che può essere dimostrata sfruttando la proprietà degli operatori autoaggiunti kAk = supkΨk=1 h Ψ |A| Ψ i (si veda anche il teorema spettrale nella forma del Corollario 3.2). Quindi, per tale λ, A+B +λ è invertibile con inverso limitato, poiché A+B +λ = (A+λ)(1+(A+λ)−1 B) ed entrambi gli operatori al membro di destra sono invertibili: il primo perché λ ∈ ρ(A) e il secondo perché 1 + (A + λ)−1 B ≥ 1 − (A + λ)−1 B > 0. Se conclude quindi che λ ∈ ρ(A + B). 42 Se invece A è positivo ma illimitato le cose si complicano leggermente. Prima però di enunciare il risultato generale dobbiamo discutere la possibilità di estendere operatori simmetrici per ottenere operatori autoaggiunti. Come abbiamo visto se A ⊂ A∗ è simmetrico e B un’estensione di A, deve essere D(A) ⊂ D(B) ⊂ D(B ∗ ) ⊂ D(A∗ ), come segue banalmente dalla definizione del dominio dell’aggiunto: siccome Φ ∈ D(A∗ ) se supΨ∈D(A),kΨk=1 | hΦ |AΨ i | < +∞, un allargamento del dominio di A implica che la proprietà debba essere verificata su un dominio più ampio e quindi per un insieme di Φ al più uguale a quello precedente. Si potrebbe pensare quindi che, dato un operatore A simmetrico, a patto di prendere un’estensione “massimale”, questa debba essere autoaggiunta. In realtà questa procedura ha successo solo sotto certe ipotesi, cioè non tutti gli operatori simmetrici ammettono estensioni autoaggiunte. Definizione 3.28 (Spazi e indici di difetto). Sia A un operatore simmetrico, allora definiamo i suoi spazi di difetto H± e indici di difetto n± come H± := ker(A∗ ∓ i) = ran(A ± i)⊥ , n± (A) := dim H± . (3.69) Teorema 3.14 (Estensioni autoaggiunte). Sia A un operatore simmetrico chiuso, allora i) A autoaggiunto se e solo se n+ (A) = n− (A) = 0; ii) A ammette estensioni autoaggiunte se e solo se n+ = n− e in tal caso le estensioni autoaggiunte AU sono indicizzate dagli operatori unitari U : H+ → H− : D(AU ) = Ψ + Φ+ + U Φ+ Ψ ∈ D(A), Φ+ ∈ H+ , (3.70) AU (Ψ + Φ+ + U Φ+ ) = AΨ + iΦ+ − iU Ψ+ . (3.71) Il caso degli operatori positivi è compreso nel seguente risultato generale, che riguarda gli operatori limitati dal basso. Proposizione 3.17 (Estensioni autoaggiunte di operatori limitati dal basso). Sia A simmetrico e limitato dal basso, allora n+ (A) = n− (A) e A ammette entensioni autoaggiunte. Fra queste ce n’è almeno una (l’estensione di Friedrichs) che è ancora limitata dal basso con lo stesso limite dal basso di A. 3.8 Spettro e Risolvente Ricordiamo anzitutto che per matrici su CN lo spettro è l’insieme degli autovalori, o in altri termini l’insieme degli z ∈ C tali che A − z non è invertibile. Per gli operatori la definizione è del tutto analoga. Definizione 3.29 (Spettro). Dato un operatore A il suo spettro σ(A) è l’insieme degli z ∈ C tali che A − z non è invertibile con inverso limitato. Si dice risolvente o insieme risolvente ρ(A) l’insieme degli z ∈ C per cui A − z è invertibile con inverso limitato, cioè σ(A) = C \ ρ(A). Per ogni z ∈ ρ(A) si chiama risolvente l’operatore (A − z)−1 . Osservazione 3.12. I casi possibili in cui A − z non è invertibile con inverso limitato sono i seguenti: 1. A − z non iniettivo, ma allora ∃Ψ ∈ H tale che AΨ = zΨ cioè z è autovalore di A e Ψ un relativo autovettore; l’insieme degli autovalori di A si dice spettro puntuale e si indica con σpp (A); 2. A − z iniettivo ma non surgettivo con ran(A − z) denso in H : in questo caso (A − z)−1 è definibile su un denso e perciò non deve essere limitato. Alla luce della Proposizione 3.12 questo implica che inf kΨk=1,Ψ∈D(A) k(A − z)Ψk = 0, (3.72) 43 cioè esistono dei quasi-autovettori di A (si veda anche la Teorema 3.15), ovvero dei vettori Ψε tali che kχε k ≤ ε, AΨε = zΨε + χε , con ε → 0. Naturalmente Ψε non converge in H quando ε → 0, altrimenti avremmo che A − z è non iniettivo. In questo caso si parla di spettro continuo; 3. A − z iniettivo ma non surgettivo con ran(A − z) non denso in H : questo caso è escluso per operatori simmetrici, ma in generale si può presentare; gli z ∈ C con queste proprietà costituiscono quello che si chiama spettro residuo e si indica con σres (A). Proposizione 3.18 (Spettro non vuoto e chiuso). Per ogni operatore A ∈ B(H ), σ(A) 6= ∅, σ(A) è un insieme chiuso e conseguentemente ρ(A) è un insieme aperto. Proposizione 3.19 (Raggio spettrale). Dato un operatore A ∈ B(H ) sia il suo raggio spettrale r(A) := supλ∈σ(A) |λ|, allora vale 1 r(A) = lim kAn k n n→∞ (3.73) mentre, se A è autoaggiunto, r(A) = kAk. Esempio 3.22 (Operatori di shift) Rirpendiamo gli operatori di shift destro e sinistro definiti nell’Esempio 3.16. Cominciamo con l’osservare che poiché kT k = kT ∗ k = 1, allora tutti i λ ∈ C tali che |λ| > 1 appartengono a ρ(T ) e ρ(T ∗ ) (si veda la Proposizione 3.19). Cerchiamo ora gli autovalori di T e T ∗ : sia λ ∈ C con |λ| ≤ 1 e consideriamo l’equazione T {u} = λ{u}, che implica λu1 = 0, λu2 = u1 , λu3 = u2 , .. . che ammette solo la soluzione nulla: se λ 6= 0 la prima equazione implica u1 = 0 e le altre a seguire un = 0 per ogni n. Viceversa se λ = 0, le equazioni dalla seconda in poi implicano ancora un = 0 per ogni n. Quindi σpp (T ) = ∅. Vediamo ora se ci sono autovalori per T ∗ : l’equazione agli autovalori T ∗ {u} = λ{u} per |λ| ≤ 1 dà λu2 = λu1 , λu3 = λu2 , λu4 = λu3 , .. . che ha soluzione un = λn−1 u1 , dove u1 ∈ C è un qualunque numero complesso, che possiamo prendere uguale a 1, senza perdita di generalità. Ovviamente la successione appartiene a `2 (N) se e solo se |λ| < 1. Perciò σpp (T ∗ ) = {λ ∈ C | |λ| < 1} , (3.74) (λ) con relativi autovettori {u(λ) } di componenti un = λn−1 . Analizziamo ora T − λ per λ ∈ C, |λ| < 1: poiché come vedremo ran(T − λ) non è denso in `2 (N), tali punti appartengono allo spettro di T e più precisamente σres (T ) = {λ ∈ C | |λ| < 1} . (3.75) 44 ∗ Possiamo infatti mostrare che i vettori {u(λ ) } definiti sopra sono ortogonali all’immagine di T − λ: per ogni u∈H D E D E ∗ ∗ {u(λ ) } (T − λ){u} = (T − λ∗ ){u(λ ) } {u} = 0. Resta da decidere cosa succede ai λ tali che |λ| = 1. Poiché lo spettro è chiuso devono certamente appartenere allo spettro sia di T che di T ∗ . Osserviamo che tali punti non appartengono allo spettro puntuale di T ∗ , perché l’equazione agli autovalori non ha soluzione in `2 (N). D’altra parte non possono nemmeno appartenere allo spettro residuo di T ∗ perché altrimenti l’immagine di T ∗ − λ non sarebbe densa e qualunque vettore nel complemento ortogonale di ran(T ∗ − λ) sarebbe in realtà un autovalore di T , il che è assurdo visto che σpp (T ) = ∅. Se ne conclude che devono costituire spettro né puntuale né residuo (lo spettro descritto al punto 2 dell’Osservazione 3.3.12). Con lo stesso argomento usato sopra possiamo allora concludere che anche nel caso di T i punti al bordo dello spettro stanno nello spettro di tipo 2. E’ infatti un risultato generale che se un punto è nello spettro residuo di un operatore T , allora lo stesso punto è un autovalore di T ∗ , ma T ∗ non ha autovalori con |λ| = 1. D’altra parte T non ha autovalori e il risultato è dimostrato. Per riassumere abbiamo σ(T ) = σ(T ∗ ) = {λ ∈ C | |λ| ≤ 1} , σres (T ) = σpp (T ∗ ) = {λ ∈ C | |λ| < 1} . (3.76) Esercizio 3.26. Si considerino gli operatori T1 = −i∂x e T2 = −i∂x su L2 (0, 1) con domini D(T1 ) = H 1 (0, 1) e D(T2 ) = {Ψ ∈ H 1 (0, 1) | Ψ(0) = 0}. Si dimostri che σ(T1 ) = C mentre σ(T2 ) = ∅. L’operatore risolvente ha alcune proprietà molto utili: Proposizione 3.20 (Identità del risolvente). Sia A ∈ L (H ) e z, z 0 ∈ ρ(A), allora (A − z)−1 − (A − z 0 )−1 = (z − z 0 )(A − z)−1 (A − z 0 )−1 . (3.77) Se A inoltre è autoaggiunto, B è un operatore simmetrico piccola perturbazione di A e z ∈ ρ(A) ∪ ρ(A + B), allora (A + B − z)−1 = (A − z)−1 − (A − z)−1 B(A + B − z)−1 . (3.78) Nel caso di operatori autoaggiunti inoltre i punti dello spettro possono essere caratterizzati più in dettaglio. Proposizione 3.21 (Spettro degli operatori autoaggiunti). Sia A un operatore autoaggiunto, allora, i) σres (A) = ∅; ii) σ(A) ⊂ R; iii) autovettori relativi ad autovalori distinti sono ortogonali. Dimostrazione. La dimostrazione dei primi due punti è implicitamente contenuta in quanto affermato nell’Osservazione 3.3.8: siccome per ogni z ∈ C\R, A−z è invertibile con inverso limitato, allora σ(A) ⊂ R. L’assenza di spettro residuo è conseguenza di un risultato generale sullo spettro di ogni operatore: se λ ∈ σres (A) allora λ ∈ σpp (A∗ ), cioè i punti dello spettro residuo di un operatore appartengono necessariamente allo spettro puntuale dell’aggiunto. Per il punto c), come già argomentato nella dimostrazione del Teorema 3.12, se z ∈ C \ R fosse un autovalore di A con autovettore Ψz ∈ D(A) ⊂ D(A∗ ), avremmo z ∗ hΨz |Ψz i = hAΨz |Ψz i = hΨz |AΨz i = z hΨz |Ψz i =⇒ Ψz = 0. 45 Pertanto gli autovalori sono reali e se prendiamo λ, µ due autovalori distinti λ 6= µ con relativi autovettori Ψλ e Ψµ , abbiamo λ hΨλ |Ψµ i = hAΨλ |Ψµ i = hΨλ |AΨµ i = µ hΨλ |Ψµ i =⇒ hΨλ |Ψµ i = 0. Esercizio 3.27. Si considerino gli operatori Pα introdotti nell’Esercizio 3.23 e in particolare P1 : si trovi lo spettro σ(P1 ). Teorema 3.15 (Teorema di Weyl). Dato un operatore autoaggiunto A, λ ∈ σ(A) se e solo se esiste una successione (detta di Weyl) di stati Ψn ∈ D(A) tale che kΨn k = 1 e lim k(A − λ) Ψn k = 0. (3.79) n→∞ Dimostrazione. Il risultato è sostanzialmente già dimostrato nell’Osservazione 3.3.12. Osservando che per la Proposizione 3.21 A in quanto autoaggiunto non ha spettro residuo, allora si presentano due possibilità: o λ è un autovalore, ma allora la successione costante uguale a un autovettore relativo soddisfa la (3.79); altrimenti A − λ non è surgettivo ma la sua immagine è densa e allora l’argomento al punto 2 dell’Osservazione 3.3.12 mostra l’esistenza di una successione di Weyl. Infine mostriamo che lo spettro è invariante rispetto a trasformazioni unitarie. Teorema 3.16 (Equivalenza unitaria II). Dato un operatore A su H e un unitario U : H −→ H 0 , sia A0 = U AU −1 , allora σ(A) = σ(A0 ). Osservazione 3.13. Un caso interessante in cui l’uso di un operatore unitario permette di semplificare notevolmente lo studio di un operatore è quando esiste un sistema ortonormale completo di autovettori {un } ∈ H (l’analogo discreto di quanto detto nell’Osservazione 3.3.6). In questo caso possiamo fare uso di quanto detto nell’Esempio 3.15: la mappa che va dallo spazio di Hilbert di partenza H ad `2 (N) in cui si associa al generico vettore Ψ i suoi coefficienti di Fourier rispetto alla base {un } è infatti in questo caso automaticamente unitaria. Esempio 3.23 (Laplaciano con condizioni al bordo di Neumann) Vediamo un esempio esplicito in cui si può applicare la strategia descritta nell’Osservazione 3.3.13. Consideriamo l’operatore HN in L2 (0, π) definito come (HN Ψ) (x) = −∆Ψ(x), D(HN ) = Ψ ∈ H 2 (0, 1) Ψ0 (π) = Ψ0 (0) = 0 . (3.80) E’ facile vedere che ammette un set completo di autovettori: siano infatti {un } e {vn }, n ∈ N ∪ {0}, le funzioni q q u0 (x) = √1π , vn (x) = π2 sin(nx), (3.81) un (x) := π2 cos(nx), allora per ciascuna di esse vale −∆un = n2 un e −∆vn = n2 vn , però solo le un (x) soddisfano le condizioni al bordo che compaiono in D(HN ). Infatti u0n (π) = u0n (0) = 0 =⇒ un ∈ D(HN ), HN un = n2 un . Inoltre le {un } sono ovviamente ortonormali: Z Z 2 π 1 π 2 dx cos (nx) = dx (1 + cos(2nx)) = 1, π 0 π 0 Z Z 2 π 1 π dx cos(nx) cos(mx) = dx (cos[(n + m)x] + cos[(n − m)x]) = 0, π 0 π 0 46 se n 6= m. Infine le {un } costituiscono un sistema completo e quindi un s.o.n.c.: sappiamo che la base di Fourier {un }, {vn } è completa in L2 (−π, π), ma allora data una qualunque funzione Ψ in L2 (0, π) possiamo prolungarla in modo pari rispetto all’origine ovvero ponendo Ψ̃(x) = Ψ(x)+Ψ(−x) e tale funzione sviluppata nella base di Fourier {un }, {vn } avrà coefficienti non nulli solo nello sviluppo rispetto alle {un }, poiché le {vn } sono dispari. Quindi le {un } sono complete in L2 (0, π). Per inciso nello stesso modo si dimostra che le {vn } sono complete in L2 (0, π). A questo punto la trasformazione U definita nell’Esempio 3.15 è certamente unitaria. Quindi otteniamo immediatamente che σ(HN ) = σpp (HN ) = n2 , n ∈ N ∪ {0} . (3.82) Per altro il Teorema 3.10 ci dice anche che HN è autoaggiunto su D(HN ) in quando lo stesso vale per l’operatore N su `2 (N ∪ {0}) definito come N en = n2 en , D(N ) = {un } ∈ `2 (N ∪ {0}) n2 un ∈ `2 (N) . (3.83) Si noti anche che U ∗ D(N ) = D(HN ) per definizione di spazio H p : le condizioni al bordo sono conseguenza del fatto che la serie di Fourier delle derivate di ogni funzione Ψ in D(HN ) converge totalmente e quindi uniformemente grazie alle proprietà dei coefficienti di Fourier in D(N ) e perciò Ψ0 (π) = Ψ0 (0) = 0, dato che lo stesso vale per ogni elemento della base {un }. 2 Esercizio3.28. Dimostrare che l’operatoreHD su L (0, π) definito come (HD Ψ) (x) = −∆Ψ(x) sul dominio 2 D(HD ) = Ψ ∈ H (0, 1) Ψ(π) = Ψ(0) = 0 (Laplaciano con condizioni al bordo di Dirichlet) è autoaggiunto e trovarne lo spettro. 3.9 Teorema Spettrale e Interpretazione Probabilistica In questa Sezione formuleremo il teorema spettrale e ne discuteremo le conseguenze in MQ, più precisamente vedremo come una delle possibili versioni del teorema spettrale garantisca la possibilità di rappresentare ogni operatore autoaggiunto su H , e perciò ogni osservabile, come operatore di moltiplicazione su un opportuno spazio L2 . Gli operatori di moltiplicazione recitano perciò un ruolo privilegiato in MQ, che li rende in qualche senso l’analogo infinito-dimensionale delle matrici diagonalizzabili in dimensione finita. Più nel dettaglio ogni operatore di moltiplicazione ammette interpretazione probabilistica, ovvero, alla luce del Postulato 3 della MQ, la misura dell’osservabile associata si comporta come una variabile aleatoria con frequenze di aspettazione e valori medi previsti dalla teoria. Prima di formulare in generale il teorema spettrale vediamo come alcune delle sue implicazioni siano ovvie e naturali nel caso degli operatori di moltiplicazione. Prendiamo perciò un operatore M su L2 (Rd ) che sia di moltiplicazione per una funzione F ∈ C(Rd ) limitata, ovvero (M Ψ) (x) = F (x)Ψ(x). (3.84) Come abbiamo visto, se F è limitata, l’operatore M è anch’esso limitato. Assumiamo inoltre che F : Rd → R sia reale. In tal caso abbiamo visto che M è anche autoaggiunto. Grazie alle proprietà di M è naturale definire le potenze M k , k ∈ N, di M e si vede immediatamente che M k Ψ (x) = F k (x)Ψ(x), (3.85) e tali operatori P sono anch’essi limitati e autoaggiunti. Dalle potenze è poi banale passare ai polinomi. Inoltre se P (x) = k ak xk è un qualsiasi polinomio e Ψ ∈ H vale l’identità Z h Ψ |P (M )| Ψ i = dx |Ψ(x)|2 P (F (x)), (3.86) Rd 47 che può essere riscritta come Z h Ψ |P (M )| Ψ i = dµΨ (x) P (F (x)), (3.87) Rd dove abbiamo definito la misura spettrale di M come dµΨ (x) = |Ψ(x)|2 dx. (3.88) Grazie alla normalizzazione in L2 (Rd ) di Ψ e alla positività di |Ψ|2 , se vede immediatamente che µ è una misura di probabilità. Vale allora per M la seguente interpretazione proabilistica: l’operatore e più in generale i polinomi in M si rappresentano come funzioni di una variabile aleatoria x con distribuzione di probabilità |Ψ(x)|2 . Vediamo ora come questa interpretazione probabilistica per un operatore di moltiplicazione autoaggiunto si connette con il Postulato 3 della MQ. Assumiamo perciò che M sia un’osservabile data da un operatore di moltiplicazione autoaggiunto (limitato) M su L2 (Rd ). Il Postulato 3 riformulato per un operatore di moltiplicazione ci dice che il valore di aspettazione dell’osservabile M nello stato Ψ è dato da Z dµΨ (x) F (x), (3.89) hM i = h Ψ |M | Ψ i = Rd dove µΨ è la misura spettrale definita in (3.88). Inoltre i valori possibili nella misura di M sono σ(M ) = ran(F ), (3.90) ed essi appaiono con frequenze di visita che approssimano le probabilità cosı̀ definite: sia (a, b) ⊂ ran(F ) un qualunque aperto contenuto nell’immagine di F e I(a, b) la sua controimmagine, i.e., I(a, b) := F −1 (a, b), allora i valori di M in (a, b) hanno le seguenti probabilità PM,Ψ (a, b) di essere misurati nello stato Ψ, Z Z PM,Ψ (a, b) = dµΨ (x) = dx |Ψ(x)|2 . (3.91) I(a,b) I(a,b) Perciò l’interpretazione probilistica discussa in precedenza non è solo una rilettura matematica del formalismo degli operatori di moltiplicazione in L2 , ma l’intepretazione fisica della MQ: dato un’osservabile rappresentabile come operatore di moltiplicazione, la misura di tale grandezza fisica nello stato Ψ avrà lo stesso comportamento di una variabile stocastica con misura di probabilità µΨ . Prima di discutere la generalità dello schema intepretativo precedente, discutiamo altre conseguenze delle proprietà degli operatori di moltiplicazione. Notiamo infatti che dalla costruzione dei polinomi di M è facile passare alle funzioni continue di M : sia G ∈ C(R) una funzione continua, per il teorema di Stone-Weiestrass possiamo trovare una successione di polinomi Pn (x) tale che supx∈R |G(x) − Pn (x)| → 0 per n → ∞. Allora possiamo pensare di definire G(M ) come il limite della successione Pn (M ). Chiaramente è necessario specificare la topologia in cui si prende questo limite: Definizione 3.30 (Convergenza in norma). Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in norma (operatoriale) se kA − An k −→ 0. n→∞ Dimostriamo che sotto le ipotesi predecenti possiamo porre G(M ) := lim Pn (M ), (3.92) n→∞ o più concretamente che la successione Pn (M ) è una sucessione di Cauchy nella topologia in norma definita sopra: Z 2 kPn (M ) − Pm (M )k = sup dx |Pn (F (x)) − Pm (F (x))|2 |Ψ(x)|2 Ψ∈H ,kΨk2 =1 Rd ≤ sup |Pn (F (x)) − Pm (F (x))|2 −→ 0, x∈Rd n,m→∞ 48 grazie all’ipotesi di convergenza in norma sup della successione di polinomi Pn . In effetti si può dimostrare che questo modo di definire le funzioni continue di M induce un omomorfismo fra l’algebra delle funzioni continue su σ(M ) e la C ∗ algebra generata da M , ovvero la chiusura in norma dell’algebra dei polinomi di M. In modo simile si può dimostrare la possibilità di costruire l’operatore G(A) per ogni funzione misurabile G ∈ L∞ (R). Ogni funzione misurabile (borelliana) si può infatti ottenere come limite puntuale di una successione Gn ∈ C(R) di funzioni continue e limitate, i.e., G(x) = limn→∞ Gn (x) per ogni x ∈ R e |Gn (x)| ≤ C < +∞. Allora possiamo pensare di definire l’operatore G(M ) come limite degli operatori Gn (M ), dove il limite va però inteso in una topologia più debole di quella operatoriale. Definizione 3.31 (Convergenza forte). s Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in senso forte se k(A − An )Ψk −→ 0 per ogni Ψ ∈ H . n→∞ Definizione 3.32 (Convergenza debole). w Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in senso debole se hΦ |(A − An )Ψ i −→ 0 per ogni Φ, Ψ ∈ H . n→∞ Non discuteremo qui le differenze fra le varie nozioni convergenza e le relative topologie ma sottolianeamo che, come si può facilmente intuire e dimostrare, la convergenza in norma implica quella forte che a sua volta implica quella debole. Vediamo come questo si può realizzare in alcuni semplici esempi. Esempio 3.24 Consideriamo i seguenti operatori in `2 (N): Tn (u1 , u2 , . . .) = 1 1 n u1 , n u2 , . . . n termini , z }| { Sn (u1 , u2 , . . .) = (0, 0, . . . , 0, un+1 , un+2 , . . .), n termini z }| { Sn (u1 , u2 , . . .) = (0, 0, . . . , 0, u1 , u2 , . . .). (3.93) Dimostriamo che Tn −→ 0: n→∞ kTn k2 = X 1 1 |uj |2 = 2 −→ 0. 2 n n n→∞ {uj }∈`2 (N),k{uj }k2 =1 sup j∈N Invece Sn non converge in norma ma solo in senso forte: ∞ X kSn {uj }k2 = |uj |2 −→ 0, j=n+1 n→∞ per ogni {uj } ∈ `2 (N), ma kSn {uj }k2 = sup {uj }∈`2 (N),k{uj }k2 =1 ∞ X sup |uj |2 9 0, {uj }∈`2 (N),k{uj }k2 =1 j=n+1 come segue per esempio valutando l’espressione di sopra su en+1 . Infine nel caso di Wn dimostriamo che converge debolmente a 0 ma non converge né in norma né in senso forte: X 1/2 X 1/2 ∞ X ∗ −→ 0, h{vj } |Wn {uj } i = vj+n uj ≤ |uj |2 |vj |2 j=n+1 j∈N per ogni {uj }, {vj } ∈ `2 (N). Ma d’altra parte kWn {uj }k22 = X j∈N |uj |2 = 1, n→∞ 49 per ogni {uj } normalizzata e quindi W 9 0 né in senso forte né tanto meno in norma. Tornando alla discussione precedente possiamo allora notare che dovremo definire G(M ) come il limite forte della successione costruita cioè, G(M ) := s − lim Gn (M ). (3.94) n→∞ Tale successione converge infatti fortemente grazie alle ipotesi che abbiamo fatto sulle Gn : è suffciente dimostrare che la successione Gn (M )Ψ è di Cauchy per ogni Ψ ∈ H , ma 2 Z k(Gn (M ) − Gm (M )) Ψk = Rd dx |Gn (F (x)) − Gm (F (x))|2 |Ψ(x)|2 Z dµΨ (x) |Gn (F (x)) − Gm (F (x))|2 −→ 0, = n,m→∞ Rd per semplice convergenza dominata. Abbiamo perciò una “ricetta” per costruire tutte le funzioni misurabili di M a partire di polinomi in M . In realtà si può dimostrare che questa procedura induce un omomorfismo fra l’algebra delle funzioni misurabili su σ(M ) e la chiusura dell’algebra dei polinomi di M nella topologia forte. Quest’ultima prende il nome di algebra di Von Neumann di M e si dimostra che essa coincide con la chiusura debole dello stesso spazio. Un esempio molto importante di funzioni misurabili su σ(M ) è rappresentato dalle funzioni caratteristiche: sia (a, b) ⊂ σ(M ) un intervallo contenuto nello spettro di M , allora EM (a, b) il proiettore spettrale di M associato all’intervallo (a, b) è l’operatore associato alla funzione caratteristica dell’intervallo (a, b), ovvero EM (a, b) := 1(a,b) (M ), 1(a,b) (M )Ψ (x) = 1I(a,b) (x)Ψ(x), (3.95) dove I(a, b) = F −1 (a, b) è il borelliano controimmagine di (a, b). La seconda identità è una conseguenza ovvia della definizione e può essere facilmente verificata su una successione di funzioni continue che convergano puntualmente a 1(a,b) : poiché 1(a,b) (M ) deve essere non nullo solo su stati su cui il valore di F sia compreso fra (a, b) è chiaro che come operatore di moltiplicazione su L2 (Rd ) questo deve proiettare sulla controimmagine di (a, b). Ora verificheremo che l’operatore (3.95) sia effettivamente un proiettore e dimostreremo alcune proprietà della famiglia di proiettori al variare dell’intervallo in σ(M ). Prima però osserviamo che alla luce del Postulato 3 della MQ e della discussione precedente, tale definizione è necessaria al fine di poter identificare le probabilità con la (3.91): come stabilito nel Postulato 3 infatti la probabilità di osservare un valore di M nell’intervallo (a, b) nello stato Ψ è Z Z 2 2 kEM (a, b)Ψk = dx 1I(a,b) (x) |Ψ(x)| = dµΨ (x), (3.96) Rd I(a,b) che coincide con la (3.91). Per quanto riguarda l’operatore EM (a, b) vediamo che si tratta di un proiettore ortogonale come introdotto nella Definizione 3.23: sfruttiamo la Proposizione 3.15 e osserviamo che Z kEM (a, b)Ψk2 = dx 1I(a,b) (x) |Ψ(x)|2 ≤ kΨk22 , Rd per cui l’operatore è limitato e kEM (a, b)k ≤ 1. Inoltre è un operatore autoaggiunto in quanto operatore di 2 (a, b) = E (a, b) moltiplicazione per una funzione reale limitata (si veda la (3.95)). Infine il fatto che EM M 2 segue ancora dalla (3.95) e dall’indentità banale (1I(a,b) (x)) = 1I(a,b) (x). Poniamo ora per ogni λ ∈ R EM (λ) := EM (−∞, λ), (3.97) e verifichiamo che al variare di λ tali operatori soddisfano le proprietà di una famiglia spettrale (si veda la prossima Definizione 3.33): per ogni Ψ ∈ H normalizzata, i.e., tale che kΨk2 = 1, 1. lim EM (λ)Ψ = 0 e lim EM (λ)Ψ = Ψ; λ→−∞ λ→+∞ 50 2. se λ ≤ µ allora h Ψ |EM (λ)| Ψ i ≤ h Ψ |EM (µ)| Ψ i; 3. lim EM (λ + ε)Ψ = EM (λ)Ψ cioè la famiglia è continua al variare di λ. ε→0 Il punto 1. è il più facile da dimostrare in quanto segue direttamente dalla (3.95) e dalla normalizzazione di Ψ. Per il secondo è sufficiente osservare che l’integrando nella (3.95) è una funzione positiva. Infine il punto 3. segue per convergenza dominata. Usando le proprietà enunciate sopra si può definire una misura (di Lebesgue-Stieltjes) su R nel modo seguente: fissato lo stato Ψ ∈ H (non necessariamente normalizzato) e dato un qualsiasi intervallo (a, b) ⊂ R poniamo µΨ ((a, b)) := h Ψ |EM (b)| Ψ i − h Ψ |EM (a)| Ψ i , (3.98) e dagli aperti estendiamo la misura ai borelliani S di R via X µΨ (S) := inf µΨ (Ik ), Ik (3.99) k cioè richiedendo che sia regolare. Gli intervalli Ik sono scelti nella definizione precedente in modo che ovviamente S ⊂ ∪k Ik . Si noti che grazie alle proprietà enunciate in precedenza la funzione h Ψ |EM (λ)| Ψ i al variare di λ va da R a [0, kΨk], è monotona non decrescente e vale 0 per λ = −∞. Inoltre essa è continua al variare di λ. Questo ci garantisce che la definizione (3.98) è be posta e identifica una misura di Borel regolare su R, anch’essa chiamata misura spettrale. In effetti a meno di una trasformazione dello spazio di base (cambio di variabili) la misura coincide con quella definita nella (3.88). Si noti inoltre che supp(µΨ ) ⊂ σ(M ), (3.100) poiché la misura di ogni insieme che non interseca lo spettro di M è certamente nulla: se ad esempio (a, b) ∩ σ(M ) = ∅, allora I(a, b) = ∅ e quindi per la (3.95) µΨ ((a, b)) = 0. La misura spettrale dµΨ (λ) viene anche indicata con d h Ψ |EM (λ)| Ψ i ed è immediato estenderla a una misura complessa su coppie di vettori Ψ, Φ ∈ H usando l’identità di polarizzazione µΨ,Φ (λ) := 14 µΨ+Φ (λ) − 14 µΨ−Φ (λ) + 4i µΨ−iΦ (λ) − 4i µΨ+iΦ (λ), (3.101) che nella notazione precedente diventa dµΨ,Φ (λ) = d h Ψ |E(λ)| Φ i. Un’ultima importante proprietà della misura spettrale è che permette in modo alternativo di definire le funzioni misurabili di M . Infatti per ogni Ψ e Φ in H abbiamo Z h Ψ |M | Φ i = dµΨ,Φ (λ) λ, (3.102) σ(M ) e similmente per ogni funzione misurabile G : R → R Z h Ψ |G(M )| Φ i = dµΨ,Φ (λ) G(λ). (3.103) σ(M ) Quindi dalla prima identità ricaviamo che grazie alla misura spettrale lo spazio di Hilbert può essere mappato in uno spazio L2 (σ(M )), dove l’operatore agisce come operatore di moltiplicazione per la funzione λ, mentre le sue funzioni misurabili G(M ) corrispondono agli operatori di moltiplicazione per la funzione G(λ). Ovviamente questa rappresentazione dipende dalla coppia di vettori Ψ e Φ ma la separabilità dello spazio di Hilbert permette di estenderla all’intero spazio. Se ci limitiamo infatti alla misura reale e a un singolo stato Ψ e consideriamo la chiusura di P (M )Ψ questo può o meno coincidere con l’intero H . Se P (M )Ψ = H , nel qual caso si dice che Ψ è ciclico, allora la rappresentazione indotta dalla misura spettrale può essere ⊥ ovviamente estesa a tutto H . Se invece questo non avviene si può cercare una Ψ1 in P (M )Ψ e costruire la relativa misura spettrale. Alla fine della procedure la separabilità dello spazio d Hilbert garantisce che 51 si sarà trovata una successione al più numerabile {Ψn }n∈N , tale che in ogni spazio ciclico Hn := P (M )Ψn valga la rappresentazione indotta dalla misura dµΨn (λ), cioè 5 Hn ' L2 (σ(M ), dµΨn (λ)), (3.104) e per cui M agisca su Hn come operatore di moltiplicazione per λ. Se poi la successione degli Ψn è scelta in modo che la serie delle norme kΨn k2 sia sommabile, allora L (R , dx) = H = 2 d ∞ M Hn ' n=1 ∞ M L2 (σ(M ), dµΨn (λ)). (3.105) n=1 Nella discussione sviluppata fin qui, abbiamo dunque visto che l’interpretazione probabilistica si applica agli operatori di moltiplicazione, che quindi costuiscono una classe molto speciale di osservabili. In realtà è possibile dimostrare che tale interpretazione si applica solo agli operatori di moltiplicazione o, più precisamente, che se vale l’interpretazione probabilistica di un operatore allora esiste una rappresentazione dello spazio di Hilbert (isomorfismo isometrico) tale che l’operatore viene rapprentato come operatore di moltiplicazione. Teorema 3.17 (Interpretazione probabilistica parziale). Data un osservabile A e uno stato Ψ ∈ H , se l’intepretazione probabilistica vale per {P (A)Ψ} per ogni polinomio P , cioè ∃ una misura di Borel regolare νΨ tale che Z h Ψ |P (A)| Ψ i = dνΨ (x) P (x), (3.106) R allora {P (A)Ψ} è isomorfo a L2 (R, dνΨ ) e A agisce su tale spazio come operatore di moltiplicazione per x. Dimostrazione. Siano Ψ1 e Ψ2 due generici vettori in {P (A)Ψ} tali che Ψi = Pi (A)Ψ per due polinomi P1 e P2 , allora abbiamo h Ψ1 |A| Ψ2 i = h P1 (A)Ψ |A| P2 (A)Ψ i = h Ψ |P1∗ (A)AP2 (A)| Ψ i Z = dνΨ (x) P1∗ (x)xP2 (x) R = h P1 |x| P2 iL2 (R,dνΨ (x)) . L’isomorfismo è dunque identificato dalla corrispondenza fra il generico stato Ψ1 e il corrispondente polinomio P1 tale che Ψ1 = P1 (A)Ψ. Inoltre su L2 (R, dνΨ (x)) A agisce come operatore di moltiplicazione per x. La chiusura dello spazio dei polinomi in norma L2 (R, dνΨ (x)) completa l’enunciato. Teorema 3.18 (Intepretazione probabilistica globale). Se data un’osservabile A, la rappresentazione (3.106) vale per ogni Ψ ∈ H spazio di Hilbert separabile, allora esiste un operatore unitario U , una misura dµ e una funzione misurabile reale F (x) tale che U H = L2 (Rd , dµ(x)), U AU −1 Ψ (x) = F (x)Ψ(x). (3.107) Dimostrazione. La rappresentazione da H a L2 (Rd , dµ(x)) si costruisce esaurendo lo spazio di Hilbert con la collezione di Ψi , i = 1, . . . , ∞, e dei relativi spazi ciclici {P (A)Ψi } al variare del polinomio P , dove il vettore Ψi+1 è scelto nel complemento ortogonale di ∪ij=1 {P (A)Ψj }. La collezione dei Ψi definisce attraverso il Teorema 3.17 la decomposizione ∞ M H ' L2 (R, dµi ), (3.108) i=1 5 Con la notazione ' indichiamo un isomorfismo (isometrico) fra spazi di Hilbert, ovvero sostanzialmente l’esistenza di un operatore unitario U : H → H 0 . 52 con µi := P∞µΨi . La misura complessiva è allora definita sulle unioni numerabili di aperti2 I = ∪i Ii come µ(I) = i=1 µi (Ii ) ed è una misura finita se gli Ψi sono scelti in modo che la serie kΨi k sia sommabile, perché in tal caso ∞ ∞ X X ∞ µ(∪i=1 R) = µi (R) = kΨi k22 < +∞. i=1 i=1 Rimane quindi da capire quali siano gli operatori che possono essere rappresentati come operatori di moltiplicazione perché sappiamo che ad essi si applica l’interpretazione probabilistica. Il teorema spettrale ci dice appunto che sono tutti e soli gli operatori autoaggiunti. Teorema 3.19 (Teorema spettrale – operatore di moltiplicazione). Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora esiste uno spazio di misura (X, µ) con µ misura finita, un operatore unitario U : H → L2 (X, dµ) e una funzione reale F ∈ L∞ loc (X, dµ) tale che i) Ψ ∈ D(A) se e solo se F (x) (U Ψ) (x) ∈ L2 (X, dµ); ii) per ogni Ψ ∈ U D(A), U AU −1 Ψ (x) = F (x)Ψ(x). Osservazione 3.14. Se A oltre che ad essere autoaggiunto è anche limitato, allora il Teorema 3.19 può essere formulato più precisamente: se A è autoaggiunto limitato su H allora esiste una collezione al più numerabile di misure {µn }N n=1 con N ∈ N ∪ {∞} su σ(A) e un operatore unitario U : H −→ N M L2 (σ(A), dµn ), (3.109) n=1 tale che per ogni Ψ ∈ H , U Ψ = {Ψn }N n=1 e U AU −1 Ψ n (λ) = λΨn (λ). (3.110) Cioè in ciascuno sottospazio invariante per A, l’operatore agisce come operatore di moltiplicazione per la funzione λ. Come abbiamo già visto l’intepretazione probabilistica permette di costruire esplicitamente le funzioni misurabili di ogni operatore autoaggiunto A. In realtà questa costruzione può essere sollevata a un omomorfismo fra algebre: Teorema 3.20 (Teorema spettrale – calcolo funzionale). Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora esiste un’applicazione O : L∞ (R) → L (H ) tale che i) O è uno ∗-omomofismo; ii) O è continuo in norma, cioè kO(G)kL (H ) ≤ kGk∞ ; q.o. iii) se Gn ∈ L∞ (R), Gn (x) −→ x e |Gn (x)| ≤ |x| per ogni n, allora lim O(Gn )Ψ = AΨ per ogni Ψ ∈ D(A); n→∞ w s iv) se una successione di funzioni converge debolemente Gn −→ G, allora O(Gn ) −→ O(G); v) se AΨ = λΨ, λ ∈ R, allora O(G)Ψ = G(λ)Ψ; vi) se G ≥ 0 allora h Ψ |O(G)| Ψ i ≥ 0 per ogni Ψ ∈ D(G). Il teorema precedente è utile per costruire le funzioni misurabili di A, come ad esempio i proiettori spettrali di A ma anche eiAt , t ∈ R, che giocherà un ruolo cruciale nell’esistenza della dinamica di ogni sistema quantistico (si veda il Teorema 3.31). Una conseguenza ovvia del Teorema 3.20 è il seguente 53 Corollario 3.2 (Funzioni di operatori autoaggiunti). Sia A un operatore autoaggiunto e F, G ∈ L∞ (R) due funzioni misurabili limitate, allora i) σ(F (A)) = F (σ(A)); ii) kF (A)k = supλ∈σ(A) |F (λ)|; iii) (F (A))∗ = F ∗ (A); iv) (F · G) (A) = F (A)G(A). Fra le funzioni limitate di un operatore autoaggiunto sono particolarmente importanti i proiettori spettrali: Definizione 3.33 (Famiglia spettrale). Una famiglia spettrale in H è una famiglia di proiettori ortogonali {E(λ)}λ∈R su H che soddisfano le seguenti proprietà i) per ogni Ψ ∈ H , lim E(λ)Ψ = 0 e lim E(λ)Ψ = Ψ; λ→−∞ λ→+∞ ii) se λ ≤ µ allora h Ψ |E(λ)| Ψ i ≤ h Ψ |E(µ)| Ψ i; iii) lim E(λ + ε)Ψ = E(λ)Ψ. ε→0 Teorema 3.21 (Teorema spettrale – risoluzione spettrale). Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora ∃! famiglia spettrale PA (λ) tale che Z D(A) = Ψ ∈ H dµΨ;A (λ) λ2 < +∞ , (3.111) σ(A) Z h Φ |A| Ψ i = dµΦ,Ψ;A (λ) λ, (3.112) σ(A) per ogni Ψ ∈ D(A) e Φ ∈ H e dove le misure dµΨ;A (λ) = d h Ψ |EA (λ)| Ψ i e dµΦ,Ψ;A (λ) = d h Φ |EA (λ)| Ψ i sono date da (3.98), i.e., per ogni intervallo aperto (a, b) ⊂ R, µΨ;A ((a, b)) := h Ψ |EA (b)| Ψ i − h Ψ |EA (a)| Ψ i , (3.113) e (3.101) rispettivamente. Un aspetto che rende tuttavia il teorema spettrale in quest’ultima forma poco utile in generale è il fatto che non fornisce una ricetta per costruire la risoluzione spettrale, non è cioè un risultato costruttivo. Discuteremo ora alcuni esempi in cui la risoluzione spettrale può essere esplicitamente scritta. Esempio 3.25 (Operatore posizione) Torniamo all’Esempio 3.5: l’operatore è già nella forma di moltiplicazione per x, quindi non c’è bisogno di usare il Teorema 3.19 né la variante descritta nell’Osservazione 3.3.14. Possiamo però costruire la famiglia spettrale di Q: è facile vedere che i proiettori spettrali sono dati dagli operatori di moltiplicazione (EQ (λ)Ψ) (x) = 1(−∞,λ] (x)Ψ(x). (3.114) La misura spettrale di un intervallo (a, b) è quindi Z µΨ ((a, b)) = b dx |Ψ(x)|2 , a e più in generale dµΨ (x) = |Ψ(x)|2 dx. (3.115) 54 Esempio 3.26 (Operatore impulso) Nel caso dell’operatore impulso definito nell’Esempio 3.6 è sufficiente usare la trasformata di Fourier per ricondursi al caso precedente: poiché la trasformata di Fourier è un operatore unitario da L2 (R) a L2 (R), i proiettori spettrali di P sono EP (λ) := F −1 EQ (λ)F, (3.116) cioè (EP (λ)Ψ) (x) = F −1 1(−∞,λ) (k)Ψ̂(k) (x). Esercizio 3.29. Si trovi la risoluzione spettrale dell’operatore P 2 su L2 (R). Esempio 3.27 (Laplaciano con condizioni al bordo di Neumann) I proiettori spettrali per l’operatore HN definito nell’Esempio 3.23 sono dati, per ogni λ ≥ 0, da √ b λc (EHN (λ)Ψ) (x) = X hun |Ψ i un (x), (3.117) n=0 dove b · c indica la parte intera. Si noti che λ ∈ R+ , poiché σ(HN ) = {n2 | n ∈ N ∪ {0}}. Si verifichi che la definizione precedente identifica una famiglia spettrale. Esercizio 3.30. Si trovi la risoluzione spettrale per l’operatore HD introdotto nell’Esercizio 3.28. Esercizio 3.31. Si trovi la risoluzione spettrale dell’operatore P1 definito nell’Esercizio 3.23. La risoluzione spettrale che abbiamo visto per un singolo operatore si può facilmente estendere a un insieme di operatori A1 , . . . , AN sotto l’ipotesi essenziale che essi siano compatibili. Teorema 3.22 (Rappresentazione spettrale congiunta). Siano A1 , . . . , AN operatori autoaggiunti su H commutanti, allora esiste uno spazio di misura (X, µ) con µ misura finita, un operatore unitario U : H → L2 (X, dµ) e N funzioni reali Fi ∈ L∞ loc tali che i) Ψ ∈ D(Ai ) se e solo se Fi (x) (U Ψ) (x) ∈ L2 (X, dµ); ii) per ogni Ψ ∈ D(Ai ), U Ai U −1 Ψ (x) = Fi (x)Ψ(x). Grazie a questo risultato possiamo ora rispondere alla domanda: “sotto quali ipotesi un operatore si può rappresentare come operatore di moltiplicazione?”. Infatti il caso più generale di operatori per cui tale rappresentazione vale è quello degli operatori A normali, ovvero tali che [A, A∗ ] = 0. Questi operatori infatti si possono sempre scrivere come A = B + iC con A, B autoaggiunti commutanti, come segue facilmente ponendo B = A + A∗ e C = −i(A − A∗ ) e osservando che la condizione [A, A∗ ] = 0 implica [B, C] = 0. Applicando quindi il Teorema 3.22 all’insieme B, C si ottiene una rappresentazione spettrale congiunta in cui sia B che C sono operatori di moltiplicazione e, di conseguenza, anche A agisce come tale. 3.10 Caratterizzazione dello Spettro Grazie alla risoluzione spettrale fornita dal teorema spettrale e in particolare usando i proiettori spettrali associati ad ogni operatore autoaggiunto è possibile carattarizzare più precisamente lo spettro. Ricordiamo anzitutto un teorema generale della misura: Definizione 3.34 (Misura puntuale, continua, assolutamente continua, singolare). Sia µ una misura di Borel su R, allora diciamo che 55 i) µ è una misura puramente puntuale se ∃ un insiemeX al più numerabile di punti P = {x1 , . . . , xN } con N ∈ N ∪ ∞ tale che µ({xi }) 6= 0 e µ(S) = µpp := µ({xi }) per ogni misurabile S ⊂ R; xi ∈I∩P ii) µ è una misura continua se µ = µ − µpp ; iii) µ è una misura assolutamente continua rispetto alla misura di Lebesgue se ∃F ∈ L1loc (R) tale che Z Z dx F (x)f (x), ∀f ∈ L1 (R); (3.118) dµ f = R R iv) µ è una misura singolare rispetto alla misura di Lebesgue se ∃S misurabile tale che µ(S) = 0, mentre R \ S ha misura di Lebesgue 0. Teorema 3.23 (Teorema di Lebesgue). Ogni misura di Borel µ si decompone in modo unico in µ = µpp + µcont = µpp + µac + µsing , (3.119) dove µpp è una misura puntuale, µcont è una misura continua, µac è assolutamente continua rispetto alla misura di Lebesgue e infine µsing è singolare continua rispetto alla misura di Lebesgue. A questo punto possiamo definire i sottospazi di H invarianti per A autoaggiunto: Definizione 3.35 (Decomposizione di H ). Sia A un operatore autoaggiuto su H e µΨ la sua misura spettrale, allora definiamo • Hpp := {Ψ ∈ H | µΨ è puramente puntuale}; • Hcont := {Ψ ∈ H | µΨ è continua}; • Hac := {Ψ ∈ H | µΨ è assolutamente continua}; • Hsing := {Ψ ∈ H | µΨ è singolare continua}. Proposizione 3.22 (Sottospazi invarianti). I sottospazi della Definizione 3.35 sono tutti sottospazi invarianti per A e si ha la decomposizione H = Hpp ⊕ Hcont = Hpp ⊕ Hac ⊕ Hsing . (3.120) La decomposizione di σ(A) accennata nella Sezione 3.8 può essere resa rigorosa: Definizione 3.36 (Decomposizione spettrale I). Sia A un operatore autoaggiunto su H , allora definiamo • σpp (A) := {autovalori di A} lo spettro puntuale di A; • σcont := σ( A|Hcont ) lo spettro continuo di A; • σac := σ( A|Hac ) lo spettro assolutamente continuo di A; • σsing := σ( A|Hsing ) lo spettro singolare continuo di A. Questa prima decomposizione dello spettro, pur caratterizzando nel dettaglio il comportamento della misura spettrale, ha il difetto di dividere σ(A) in sottoinsiemi che non sono necessariamente disgiunti: il motivo è sostanzialmente che σpp non è definito come lo spettro di A ristretto a Hpp ma come l’insieme degli autovalori e cosı̀ abbiamo σ(A) = σpp (A) ∪ σcont (A), σcont (A) = σac (A) ∪ σsing (A). (3.121) 56 Esempio 3.28 (Operatore di posizione) Lo spettro dell’operatore Q definito nell’Esempio 3.5 è ovviamente continuo e più precisamente σ(Q) = σac (Q) = R. (3.122) Il motivo è che banalmente la misura spettrale dµΨ (x) è sempre assolutamente continua rispetto alla misura di Lebesgue poiché esiste F (x) ∈ L1 (R) tale che dµΨ (x) = F (x)dx dove F (x) = |Ψ(x)|2 . Esempio 3.29 (Laplaciano con condizioni al bordo di Neumann) L’operatore HN definito nell’Esempio 3.23 ha spettro puramente puntuale. Infatti come abbiamo visto σ(HN ) = σpp (HN ) = n2 | n ∈ N ∪ {0} . (3.123) Si noti che la misura spettrale dµΨ (λ) è puntuale in quanto il suo supporto coincide con N ∪ {0}. Esercizio 3.32. Si determini la decomposizione dello spettro degli operatori P definito nell’Esempio 3.6 e P1 introdotto nell’Esercizio 3.23. Una decomposizione alternativa è data sfruttando le proprietà dei proiettori spettrali di A. Premettiamo però un risultato generale su σ(A): Proposizione 3.23 (Spettro e proiettori spettrali). Sia A un operatore autoaggiunto su H e {EA (λ)}λ∈R i suoi proiettori spettrali, allora λ ∈ σ(A) se e solo se EA (λ + ε) − EA (λ − ε) 6= 0 per ogni ε > 0. Definizione 3.37 (Decomposizione spettrale II). Sia A un operatore autoaggiunto e {EA (λ)}λ∈R i suoi proiettori spettrali. Sia inoltre λ ∈ σ(A), allora diciamo che i) λ ∈ σdisc (A) lo spettro discreto di A se ran(EA (λ + ε) − EA (λ − ε)) è finito-dimensionale per qualche ε > 0; ii) λ ∈ σess (A) lo spettro essenziale di A se ran(EA (λ + ε) − EA (λ − ε)) è infinito-dimensionale per ogni ε > 0. Proposizione 3.24 (Spettro discreto e essenziale). Sia A un operatore autoaggiunto su H , allora σdisc (A) = σ(A) \ σess (A). (3.124) Inoltre λ ∈ σdisc (A) se e solo se i) ∃ε > 0 tale che (λ − ε, λ + ε) ∩ σ(A) = {λ}; ii) {Ψ ∈ H | AΨ = λΨ} è finito-dimensionale. Invece λ ∈ σess (A) se una o più delle seguenti è verificata i) λ ∈ σcont (A); ii) λ è punto di accumulazione di σpp (A); iii) λ è un autovalore di molteplicità infinita. Quindi riassumendo σdisc (A) contiene tutti e soli gli autovalori di A isolati e di molteplicità finita, mentre eventuali punti limite di σpp (A) e autovalori di molteplicità infinita sono contenuti in σess (A). Il seguente teorema è uno strumento molto utile per capire se un punto λ ∈ σ(A) appartenga a σdisc (A) o a σess (A): 57 Teorema 3.24 (Criterio di Weyl). Sia A un operatore autoaggiunto su H , allora λ ∈ σess (A) se e solo se la successione di Weyl definita nel Teorema 3.15 può essere scelta in modo che le Ψn siano tutte ortogonali fra di loro. Osservazione 3.15. In effetti la successione di Weyl dell’enunciato del Teorema 3.24 (detta successione di Weyl singolare) è sufficiente che converga debolmente a 0, cioè λ ∈ σess (A) se e solo se ∃{Ψn }n∈N , w kΨkn = 1, limn→∞ k(A − λ)Ψn k = 0 e Ψn −→ 0. In particolare poi la successione può essere scelta in modo tale che Ψn ⊥ Ψm per n 6= m. Osservazione 3.16. Riprendiamo l’Esempio 3.5 dell’operatore posizione: come abbiamo visto nell’Esempio 3.28, lo spettro di Q è puramente assolutamente continuo e coincide con l’intera retta reale. Di conseguenza si ha anche σess (Q) = R. Alla medesima conclusione si sarebbe potuti arrivare costruendo una successione di Weyl singolare per Q: per ogni λ ∈ R, un esempio esplicito è dato da {Ψn }n∈N con Ψn (x) = p n(n + 1)1(λ+ 1 1 ,λ+ n n+1 ]. Infatti le funzioni Ψn e Ψm sono ortogonali per ogni n 6= m dato che i supporti sono disgiunti. Inoltre kΨn k = 1 e k(Q − λ)Ψn k2 = n(n + 1) Z 1 λ+ n 1 λ+ n+1 dx |x − λ|2 = n(n + 1) Z 1 n 1 n+1 dx x2 ≤ C −→ 0. n2 n→∞ Esercizio 3.33. Costruire esplicitamente una successione di Weyl singolare per l’operatore impulso P introdotto nell’Esempio 3.6, che mostri che ogni λ ∈ R appartiene a σess (P ). 3.11 Operatori Compatti Introduciamo un’ampia classe di operatori, gli operatori compatti, che hanno caratteristiche spettrali uniche: il loro spettro è sempre puramente puntuale e ammettono un sistema ortonormale completo di autovettori. Definizione 3.38 (Operatore compatto). Un operatore T ∈ B(H ) è compatto se trasforma successioni debolmente convergenti in successioni w convergenti in norma, cioè se Ψn −→ Ψ allora T Ψn −→ Φ ∈ H . Un esempio tipico di operatori compatti è dato dagli operatori di rango finito: un operatore T ha rango finito se ran(T ) = span(Ψ1 , . . . , ΨN ), N < ∞, (3.125) con {Ψn } un sistema ortonormale completo di H . In altre parole T è compatto se la sua immagine è finito dimensionale. In effetti questo esempio è reso ancora più significativo dal seguente Teorema 3.25 (Caratterizzazione degli operatori compatti). Ogni operatore compatto T su H separabile è il limite in norma di una successione di operatori a rango finito. Inoltre il limite in norma di una successione di operatori compatti è ancora un operatore compatto. Le proprietà spettali degli operatori compatti sono molto speciali e sono caratterizzate nei prossimi due Teoremi. Teorema 3.26 (Teorema di Riesz-Schauder). Sia T un operatore compatto su H , allora σ(T ) è un insieme discreto. Inoltre σ(T ) non ha punti di accumulazione ad eccezione al più di 0 e ogni λ 6= 0 in σ(A) è un autovalore con molteplicità finita. 58 Teorema 3.27 (Teorema di Hilbert-Schmidt). Sia A un operatore compatto autoaggiunto su H , allora esiste un sistema ortonormale completo di H di autovettori {Ψn }n∈N di A e AΨn = λn Ψn , lim λn = 0. (3.126) n→∞ Più in generale se A è compatto ∃{Φn }, {Ψn } s.o.n. (non necessariamente completi) e λn ≥ 0 detti valori singolari di A tali che X A= λn |Φn i hΨn | , lim λn = 0. (3.127) n∈N n→∞ Prima di passare a studiare due sottoclassi di operatori compatti citiamo un teorema molto utile per studiare lo spettro essenziale degli operatori: Teorema 3.28 (Teorema di Weyl). Dati A, B operatori autoaggiunti, se ∃z ∈ ρ(A)∩ρ(B) tale che (A−z)−1 −(B −z)−1 è un operatore compatto, allora σess (A) = σess (B). Dimostrazione. Sia λ ∈ σess (A), allora per il criterio di Weyl (Teorema 3.24) esiste una successione di Weyl singolare {Ψn } tale che w k(A − λ)Ψn k −→ 0, kΨn k = 1, Ψn −→ 0. n→∞ n→∞ Sia ora z ∈ ρ(A) ∩ ρ(B) come da enunciato del teorema: 1 1 −1 (A − z) − (A − z)−1 (A − λ)Ψn −→ 0, Ψn = n→∞ λ−z |λ − z| poiché (A − z)−1 è un operatore limitato (e quindi continuo). Vogliamo allora dimostrare che da Φn = (B − z)−1 Ψn possiamo estrarre una successione di Weyl singolare per B. Notiamo anzitutto che Φn ∈ D(B) w e Φn −→ 0: scrivendo 1 1 −1 −1 −1 Φn = (B − z) − (A − z) Ψn + (A − z) − Ψn + Ψn , λ−z λ−z abbiamo che il tre termini al membro di destra convergono separatamente a 0 in senso debole. Infatti la convergenza dell’ultimo è equivalente a quella di Ψn , per il secondo l’abbiamo dimostrato poco sopra e il primo converge in realtà a 0 in norma grazie all’ipotesi di compattezza e alla Definizione 3.38. In aggiunta usando la precedente decomposizione per Φn e sfruttando che i primi due termini tendono a 0 in norma quando n → ∞, si ha anche 1 lim kΦn k = > 0, n→∞ |λ − z| e quindi i la successione è normalizzabile semplicemente definendo Φ̃n = Φn /kΦn k. Per dimostrare che Φ̃n è una successione di Weyl singolare per B manca solo di verificare che k(B − λ)Φ̃n k → 0, ma 1 −1 k(B − λ)Φn k = k(B − z)Φn + (z − λ)Φn k = |z − λ| (B − z) − Ψn λ−z −1 ≤ |z − λ| (B − z)−1 − (A − z)−1 Ψn + (A − z) − 1 Ψn −→ 0, n→∞ λ−z per quanto già discusso. Due sottoclassi degli operatori compatti sono gli operatori classe traccia e di Hilbert-Schmidt. 59 Definizione 3.39 (Traccia). Per ogni A ≥ 0 in B(H ) definiamo la sua traccia come X Tr(A) := hΨn |AΨn i , (3.128) n∈N dove {Ψn }n∈N è un s.o.n.c. in H . Proposizione 3.25 (Proprietà della traccia). La traccia non dipende dal s.o.n.c scelto e soddisfa le seguenti proprietà : i) Tr(A + B) = Tr(A) + Tr(B); ii) Tr(λA) = λTr(A), per ogni λ ≥ 0; iii) Tr(U AU −1 ) = Tr(A) per ogni unitario U ; iv) se 0 ≤ A ≤ B allora Tr(A) ≤ Tr(B); Definizione 3.40 (Operatori classe traccia). Gli operatori classe traccia L 1 (H ) sono gli operatori A ∈ B(H ) tali che kAk1 := Tr|A| < +∞. Teorema 3.29 (Operatori classe traccia e compatti). Un operatore A ∈ B(H ) è classe traccia se e solo se A compatto e i suoi valori singolari {λn } ∈ `1 (N), X i.e., λn < +∞. n∈N L’ultima classe di operatori che introduciamo è la naturale generalizzazione di L 1 (H ) come L2 lo è di L1 : Definizione 3.41 (Operatori di Hilbert-Schmidt). Gli operatori Hilbert-Schmidt L 2 (H ) sono gli operatori T ∈ B(H ) tali che Tr(T ∗ T ) < +∞. Teorema 3.30 (Operatori di Hilbert-Schmidt e compatti). X A è Hilbert-Schmidt se e solo se A compatto e i suoi valori singolari {λn } ∈ `2 (N), i.e., λ2n < +∞. n∈N L’importanza degli operatori di Hilbert-Schmidt è che essi ammettono una rappresentazione concreta: Proposizione 3.26 (Operatori di Hilbert-Schmidt e integrali). K ∈ B(L2 (X, dµ)) è Hilbert-Schmidt se e solo se ∃K(x, y) ∈ L2 (X, dµ) ⊗ L2 (X, dµ) tale che Z (KΨ) (x) = dµ(y) K(x, y)Ψ(y). (3.129) X 3.12 Matrice Densità e Stati Misti Al di là delle proprietà speciali che hanno, gli operatori classe traccia giocano un ruolo importantissimo in MQ, in quanto si identificano con gli stati misti. Tipicamente nella preparazione di un sistema quantistico è difficile riuscire a isolare uno stato puro |Ψi ∈ H , mentre più spesso accade che lo stato prodotto appartenga a un certo insieme ristretto {|Ψ1 i , . . . , |ΨNP i}, con N ∈ N ∪ {∞}, in cui ciascuno degli stati compare con una certa proabilità λn ≥ 0. Ovviamente N n=1 λn = 1, per normalizzazione della probabilità totale. Vi è quindi la necessità di definire uno stato (misto) associabile e a questa situazione sperimentale. Dal punto di vista matematico tale stato viene identificato con una matrice densità ρ ovvero un operatore classe traccia cosı̀ definito N X ρ= λn |Ψn i hΨn | , (3.130) n=1 60 ovvero la combinazione lineare convessa dei proiettori ortogonali sugli stati Ψn . Poiché per ipotesi N X λn = 1, (3.131) n=1 A ∈ L 1 (H ) e anzi Tr(ρ) = 1. Inoltre ρ ha altre due proprietà immediate da verificare ρ ≥ 0, ρ2 ≤ ρ. (3.132) Vediamo ora come, data un’osservabile A, si possa associare alla matrice densità ρ, un concetto di valore di aspettazione, di frequenze di visita, dispersione ecc. Definiamo infatti hAi := Tr(Aρ), (3.133) e per analogia con quanto affermato nel Postulato 3, la probabilità di ottenere una misura di A nell’intervallo (a, b) è PA;ρ (a, b) := Tr (EA (a, b)ρ) , (3.134) dove EA (a, b) è il proiettore spettrale di A relativo all’intervallo (a, b). Vediamo che le definizioni sono consistenti con quanto anticipato sull’interpretazione fisica degli stati misti: usando l’espressione esplicita di ρ otteniamo N X PA;ρ (a, b) = λn h Ψn |EA (a, b)| Ψn i , n=1 cioè la probabilità di osservare un valore di A nell’intervallo (a, b) è la somma pesata, con pesi λn , delle probabilità di osservare A in (a, b) negli stati Ψn . Questo coincide con l’interpretazione dello stato misto come stato “incerto”, nel senso che non si ha una conoscenza esatta di esso ma solo degli stati che possono comparire e delle relative probabilità. In questo senso gli stati misti in MQ giocano un ruolo analogo a quello degli stati misti (distribuzioni di probabilità) in meccanica classica: in seguito all’impossibilità di una precisione arbitraria nella misura o equivalentemente alla presenza di errori sperimentali, non si conosce esattamente lo stato puro in cui si trova il sistema ma tutti gli stati in un determinato insieme possono presentarsi con diversa probabilità. Anche per il valore di aspettazione di A la definizione è consistente perché N X hAi = λn h Ψn |A| Ψn i , n=1 che può ancora una volta essere pensata come la media dei valori di aspettazione di A sugli stati Ψn . 3.13 Teorema di Stone e Dinamica In questa Sezione discuteremo l’esistenza della dinamica di un sistema quantistico e come essa segua direttamente dall’ipotesi di autoaggiunzione dell’hamiltoniana del sistema: come affermato nel Postulato 5 della MQ, lo stato di un sistema quantistico al tempo t > 0 è la soluzione dell’equazione di Schrödinger con dato iniziale |Ψt=0 i = |Ψ0 i, i.e., i~∂t |Ψt i = H(t) |Ψt i . Considereremo per semplicità il caso di hamiltoniane tempo-indipendenti ma la generalizzazione al caso tempo-dipendente è del tutto ovvia (si veda l’Osservazione dopo il Teorema 3.31). Un caso in cui l’evoluzione temporale è sostanzialmente banale è quello degli autostati di H: se ΦE ∈ H è tale che HΦE = EΦE , allora l’equazione di Schrödinger (2.3) diventa i~∂t Ψt = EΨt , 61 con dato iniziale Ψ0 = ΦE , la cui soluzione è ovviamente E Ψt = e−i ~ t ΦE . (3.135) In altri termini l’evoluzione temporale è semplicemente data da un fattore di fase tempo-dipendente a moltiplicare lo stato. Pertanto si ha come conseguenza diretta |Ψt i = |ΦE i, cioè il ket e quindi lo stato quantistico è stazionario. Se l’hamiltoniana avesse un s.o.n.c. di autovettori questo sarebbe sufficiente per definire la dinamica sull’intero spazio di Hilbert via la decomposizione di ogni vettore di H in serie di Fourier. Naturalmente questo non è sempre vero, ma quand’anche non esistesse un s.o.n.c. di autovettori di H, il problema della definizione della dinamica è risolto alla fonte grazie all’applicazione del teorema spettrale, come discusso nel sucessivo Teorema 3.31. Si noti che in tal senso l’ipotesi di autoaggiunzione di H risulterà cruciale (si veda il Postulato 5). Premettiamo una utile definizione: Definizione 3.42 (Gruppo unitario ad un parametro fortemente continuo). Una famiglia di operatori {U (t)}t∈R ∈ B(H ) è detta un gruppo unitario ad un parametro fortemente continuo se i) U (t) unitario per ogni t ∈ R; ii) U (t + s) = U (t)U (s) per ogni t, s ∈ R; iii) limε→0 kU (ε)Ψ − Ψk = 0 per ogni Ψ ∈ H . Osservazione 3.17. La terza proprietà della Definizione 3.42 è equivalente a richiedere che s − limε→0 U (ε) = 1. Inoltre combinando la 2 e 3 si vede immediatamente che la continuità forte in 0 in realtà si estende ad ogni t ∈ R: s − lim U (t + ε) = U (t) s − lim U (ε) = U (t). ε→0 ε→0 Esercizio 3.34. Si dimostri che le seguenti famiglie di operatori definiscono due gruppi a un parametro fortemente continui: 1. {Uα }α∈R in B(L2 (R)), (Uα Ψ) (x) = eiαx Ψ(x); 2. {Vβ }β∈R in B(L2 (R)), (Vβ Ψ) (x) = Ψ(x − β). Come agisce la trasformata di Fourier sulle due famiglie, i.e., quanto vale FUα F −1 e FVβ F −1 ? Possiamo ora enunciare uno dei due risultati principali di questa Sezione: Teorema 3.31 (Operatori autoaggiunti generano gruppi unitari fortemente continui). Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora U (t) = eiAt definisce un gruppo unitario a un parametro t ∈ R fortemente continuo e per ogni Ψ ∈ D(A) lim t→0 U (t)Ψ − Ψ = iAΨ. t (3.136) Dimostrazione. Il teorema spettrale nella forma del Teorema 3.20 (si veda anche il Corollario 3.2) permette di definire U (t) = eiAt per ogni t ∈ R. Le altre proprietà del gruppo a un parametro sono conseguenza diretta dei risultati formulati nel Teorema 3.20 e nel successivo Corollario 3.2. Ad esempio si ottiene immediatamente che kU (t)k = supλ∈σ(A) |eiλt | = 1. Alternativamente si può usare il teorema spettrale nella forma del Teorema 3.21: in tal caso definiamo l’operatore eiAt via gli elementi di matrice Z iAt Ψ e Φ = dµΨ,Φ;A (λ) eiλt . (3.137) σ(A) 62 Ancora una volta le altre proprietà sono una conseguenza diretta della definizione. Per esempio la continuità forte segue per convergenza dominata. Discutiamo invece più nel dettaglio la (3.136): ricordando che il dominio di A è caratterizzato (Teorema 3.21) come ) ( Z 2 dµΨ;A (λ) λ < +∞ , D(A) = Ψ ∈ H σ(A) abbiamo che 2 Z U (t)Ψ − Ψ = − iAΨ dµΨ;A (λ) t σ(A) 2 iλt e − 1 . − iλ t Ora la funzione integranda si può stimare come 2 Z iλt e − 1 = − iλ t 0 λ dµ e iµt Z 2 −1 ≤λ λ 2 dµ eiµt − 1 ≤ 4λ2 , 0 e il risultato segue ancora per convergenza dominata. E’ importante osservare che il Teorema 3.31 implica unicità ed esistenza della soluzione dell’equazione di Schrödinger (2.3), che a sua volta genera la dinamica di ogni sistema quantistico. Si noti che da questo punto di vista l’esistenza dell’hamiltoniana e la sua autoaggiunzione sono ipotesi cruciali. Corollario 3.3 (Dinamica quantistica). Il problema di Cauchy (2.3) con dato iniziale Ψt=0 = Ψ0 ∈ H spazio di Hilbert separabile ammette soluzione Ψt ∈ H per ogni t ∈ R e tale soluzione è unica. Dimostrazione. Per ipotesi (Postulato 4) ∃H osservabile e quindi operatore autoaggiunto su D(H) denso in H . Pertanto per il precedente Teorema 3.31 H U (t) = e−i ~ t , (3.138) è un gruppo unitario ad un parametro fortemente continuo. E’ perciò facile verificare che U (t)Ψ0 risolve l’equazione di Schrödinger per ogni t ∈ R e, per unitarietà di U (t), kU (t)Ψ0 k = kΨ0 k, per cui U (t)Ψ0 ∈ H se Ψ0 ∈ H . L’unicità in H segue poi dalla bigettività di U (t) per ogni t ∈ R in quanto operatore unitario. Osservazione 3.18. Si noti che l’equazione di Schrödinger (2.3) richiede per essere ben posta che Ψt ∈ D(H), che, se ad esempio H è illimitato, non coincide con tutto H . Al contrario l’unitario U (t) (3.138) è invece definito su tutto H e quindi permette di implementare l’evoluzione temporale di qualunque stato in H. Abbiamo quindi visto che un operatore autoaggiunto genera un gruppo unitario, ma il contenuto del prossimo Teorema è che anche l’implicazione opposta è vera, ovvero ogni gruppo unitario fortemente continuo è generato da un operatore autoaggiunto. Da questo punto di vista si può meglio apprezzare il Postulato 4 della MQ: volendo richiedere la buona positura della dinamica e in particolare la conservazione della probabilità, che appunto equivale all’unitarietà dell’evoluzione temporale, è necessario richiedere che esista un generatore autoaggiunto. Teorema 3.32 (Teorema di Stone). Sia U (t) un gruppo unitario a un parametro fortemente continuo su H , allora ∃A autoaggiunto su D(A) denso in H , tale che U (t) = eiAt . Inoltre Ψ ∈ D(A), se e solo se ∃ limt→0 (U (t)Ψ − Ψ)/t e, se esiste, tale espressione definisce iAΨ. Esercizio 3.35. Si trovino i generatori autoaggiunti con relativo dominio di autoaggiunzione dei gruppi unitari introdotti nell’Esercizio 3.34. Capitolo 4 Particella Libera e Oscillatore Armonico In questo Capitolo affrontiamo la discussione dei sistemi quantistici più elementari, la particella libera e l’oscillatore armonico, alla luce dei postulati della MQ e dei risultati di teoria degli operatori del Capitolo 3. Nonostante si tratti di sistemi molto semplici vedremo che, a differenza del caso classico, la trattazione quantistica non è affatto banale, cosı̀ come alcuni fenomeni fisici che ne sono conseguenza. 4.1 La Particella Libera: Osservabili e Dinamica Per particella libera intendiamo naturalmente una particella puntiforme, come ad esempio possono essere considerati atomi, protoni, elettroni ecc. a velocità lontane da quella della luce, che si muove nello spazio d dimensionale Rd , con d tipicamente 1, 2 o 3. Come primo elemento della descrizione quantistica del sistema dobbiamo fornire lo spazio degli stati (puri) che si identifica con i raggi unitari nello spazio di Hilbert H = L2 (Rd ). (4.1) In altri termini ogni vettore di norma unitaria in Ψ ∈ H , anche detto funzione d’onda, identifica uno stato del sistema e solitamente l’intepretazione fisica che viene associata a tale scelta è che |Ψ(x)|2 rappresenta la probabilità che la particella sia osservata nel punto x. Vedremo ora come tale interpretazione della funzione d’onda segue banalmente dai Postulati della MQ che abbiamo introdotto nel Capitolo 2. A tale scopo dovremo anzitutto identificare le grandezze fisiche osservabili del sistema. Come nel caso classico e prescindendo da altre carattestiche (carica, spin, ecc.), l’unico parametro fisico del sistema è la massa m > 0 della particella. Sempre per analogia classica ci aspettiamo di poter osservare e misurare la posizione Q e l’impulso P della particella e, possibilmente, anche le loro funzioni elementari, ad esempio i polinomi. Sia Q che P dovranno essere osservabili vettoriali, cioè Q = (Q1 , . . . , Qd ) e P = (P1 , . . . , Pd ), la cui azione su una generica Ψ ∈ C0∞ (Rd ) è data da (Pj Ψ) (x) = −i~∂j Ψ(x), (Qj Ψ) (x) := xj Ψ(x), (4.2) ovvero Qj è un operatore di moltiplicazione per xj , con naturalmente x = (x1 , . . . , xd ), mentre Pj è un operatore differenziale di ordine 1. Abbiamo già studiato nel dettaglio questi operatori (si vedano gli Esempi 3.5, 3.6 e 3.9) e in particolare abbiamo visto che ogni singola componente Qj e Pj , in quanto operatore su L2 (R) (si veda la successiva Osservazione 4.1) è autoaggiunta sul dominio D(Qj ) := Ψ ∈ L2 (R) Qj Ψ ∈ L2 (R) , D(Pj ) = H 1 (R). (4.3) Osservazione 4.1. Nel restringerci allo spazio di Hilbert di una singola componente L2 (R) stiamo sfruttando il fatto che L2 (Rd ) ' L2 (R) ⊗ · · · ⊗ L2 (R) e Qj = 1 ⊗ · · · ⊗ 1 ⊗ Qj ⊗ 1 · · · ⊗ 1, cioè Qj agisce come l’identità sulle copie di L2 (R) diverse dalla j−esima. Quindi in L2 (Rd ) il dominio di autoaggiunzione di Qj si dovrebbe leggere L2 (R) ⊗ · · · ⊗ L2 (R) ⊗ D(Qj ) ⊗ L2 (R) ⊗ · · · ⊗ L2 (R). Tuttavia le diverse componenti degli operatori Q e P sono indipendenti e commutano fra loro, per cui da qui in poi ci restringeremo a considerare un sistema unidimensionale, con ovvia generalizzazione dei risultati a Rd . 63 64 Inoltre abbiamo visto che (si veda l’Esempio 3.28) σ(Q) = σ(P ) = σac (Q) = σac (P ) = R, (4.4) cioè entrambi gli operatori impulso e posizione hanno sono spettro assolutamente continuo e, in particolare, nessun autovalore. Per completare la descrizione del sistema resta solo da identificare l’hamiltoniana che, via il Postulato 4, definisce la dinamica. Esattamente come in meccanica classica questa è data da H0 = P2 ~2 =− ∆. 2m 2m (4.5) Anche questo operatore è stato parzialmente trattato nel Capitolo 3: grazie ai Teoremi 3.10 e 3.16 e al fatto che ~2 |k|2 FH0 F −1 Ψ̂ (k) = Ψ̂(k), 2m cioè la trasformata di Fourier mappa H in un operatore di moltiplicazione, è immediato verificare che H0 è autoaggiunta su D(H0 ) = H 2 (Rd ). Inoltre come nel Corollario 3.2 si può verificare facilmente che σ(P 2 ) = {λ2 |λ ∈ σ(P )} e quindi σ(H0 ) = σac (H0 ) = R+ , (4.6) dove il fatto che lo spettro sia totalmente assolutamente continuo segue dalla assoluta continuità della misura spettrale di H0 in trasformata di Fourier (si veda l’Esempio 3.28). Esercizio 4.1. Si costruisca una successione di Weyl singolare per H per ogni λ ∈ R+ . Benché si tratti di un semplice esercizio è utile costruire esplicitamente la risoluzione spettrale di H: Proposizione 4.1 (Risoluzione spettrale di H0 ). Per ogni λ ∈ R+ e Ψ ∈ L2 (Rd ), l’aspettazione dei proiettori spettrali di H0 è data da " 2 q 2 # Z λ q p −1/2 m 2mt 2mt + Ψ̂ − , Ψ̂ dt t 2 2 2 2~ ~ ~ 0 Z q 2 Z 2π λ h Ψ |EH0 (λ)| Ψ i = 1[0,+∞) (λ) · m2 dt dϑ Ψ̂ − 2mt 2 ,ϑ , ~ ~ 0 0 q 2 Z 2π √ 3/2 Z λ √ Z π Ψ̂ − 2mt , 2m3 dϑ sin ϑ dϕ dt t , ϑ, ϕ ~ ~2 0 0 d = 1; d = 2; (4.7) d = 3. 0 Dimostrazione. Per dimostrare il risultato è sufficiente osservare che FEH0 (λ)F −1 è l’operatore di moltiplicazione per la funzione 2 2 |k| . 1(−∞,λ] ~ 2m Per ottenere le espressioni esplicite (4.7) resta solo da fare un banale cambio di variabili, che è lasciato per esercizio. −1 Esercizio 2 4.2. Definendo EH0 (λ) = F Ẽ(λ)F con Ẽ(λ) operatore di moltiplicazione per la funzione 2 |k| 1(−∞,λ] ~ 2m , 1. verificare che EH0 (λ) è una famiglia spettrale; 2. dimostrare che {EH0 (λ)}λ∈R+ identifica la risoluzione spettrale di H0 ; 3. trovare l’espressione esplicita di (EH0 (λ)Ψ) (x). La trasformata di Fourier è l’ingrediente principale della dimostrazione di un altro risultato, che riguarda il risolvente di H0 e l’espressione esplicita del kernel relativo, anche detta funzione di Green di H0 . 65 Proposizione 4.2 (Risolvente di H0 ). Sia z ∈ C \ R+ , allora (H0 − z)−1 è un operatore integrale limitato con dominio L2 (Rd ) e kernel √ √ (H0 − z)−1 (x; x0 ) = Gz (x − x0 ), con (scegliendo la determinazione di z tale che =( z) ≥ 0) p nq o m 2mz i exp i |x| , d = 1; 2 2 2~ z n q~ o Gz (x) := (4.8) m 2 |x|−1 exp i 2mz |x| , d = 3. 2 2π~ ~ Osservazione 4.2. In d = 1 la funzione di Green non è singolare all’origine anche se non differenziabile. In d = 3 ha una singolarità a x = 0 propozionale a |x|−1 . Più in generale si può dimostrare che in dimensione d ≥ 3 la singolarità è |x|d−2 . Osservazione 4.3. Il caso bidimensionale è speciale: in effetti non abbiamo dato l’espressione esplicita di Gz (x) in d = 2 in quanto coinvolge la fuzione speciale di Hankel e non è particolarmente istruttiva. Tuttavia è importante sottolineare che la singolarità all’origine è in questo caso logaritmica ovvero Gz (x) ∼ log |x| quando x → 0. Osservazione 4.4. Sfruttando il fatto che σ(H0 ) = R+ si può considerare Gz per z = −λ con λ > 0. In questo caso l’espressione (4.8) diventa: q p m 2mλ exp − ~2 |x| , d = 1; 2~2 λ G−λ (x) := q 2mλ m −1 exp − |x| , d = 3. 2π~ 2 |x| ~2 Dimostrazione. Applicando la trasformata di Fourier si trova immediatamente che Z 1 1 Gz (x) = dk eik·x ~2 k2 . d (2π) Rd −z (4.9) 2m In d = 1, per calcolare l’integrale resta solo da applicare il Lemma di Jordan: estendendo l’integrale ad una semicirconferenza di raggio R nel semipiano superiore per x > 0 e in quello inferiore per x < 0 e osservando che l’integrale sulla semicirconferenza tende a 0 quando R → ∞ grazie al decadimento ∝ k −2 dell’integrando, resta solo da calcolare il contributo dei residui nel semipiano superiore o inferiore. Ma l’integranda ha solo √ due poli di ordine 1 rispettivamente in ± 2mz/~ e da un rapido calcolo si ricava il risultato: ad esempio se x > 0 il residuo che si ottiene è √ r q √ 2 2mπi m i 2mz x ikx 2mz = Res k = ~ =i e ~2 . √ e 2z ~2 k 2 2~ √2mz 2~π 2m + z k= ~ In d = 3 il calcolo è sostanzialmente analogo: per x 6= 0 abbiamo 1 4π 2 Z ∞ dk k 0 2 Z 1 dt e −1 ikxt 1 ~2 k2 2m Z ∞ k eikx − e−ikx Z ∞ 1 d eikx dk 2 2 2 2 ~ k ~ k2 4π x dx −∞ −z 0 2m − z r q 2mq i m d m 2mz 2mz =− exp i ~2 x = exp i ~2 x . 2πx 2~2 z dx 2π~2 x i =− 2 4π x −z dk =− Concludiamo questa Sezione con qualche commento sulla dinamica. L’evoluzione temporale è ovviaH mente implementata dall’operatore unitario U (t) = e−i ~ t , la cui esistenza segue dall’autoaggiunzione di H. Sfruttando poi la risoluzione spettrale o, equivalentemente, usando la trasformata di Fourier, è poi facile ricavare la forma esplicita dell’operatore: Z H ~k2 1 −i ~ t (U0 (t)Ψ) (x) = e Ψ (x) = dk eik·x e−i 2m t Ψ̂(k). (4.10) ) (2π d/2 Rd 66 4.2 Evoluzione Libera di Pacchetti d’Onda: Dispersione e Interferenza Un pacchetto d’onda è una funzione d’onda concentrata, ovvero il cui supporto è sostanzialmente confinato in un compatto. Questo è ovviamente vero se Ψ ha supporto compatto ma anche, più in generale, se Ψ decade esponenzialmente per grandi x. Come vedremo l’evoluzione temporale di tali stati è particolarmente significative in MQ: poiché per un pacchetto d’onda la possibilità di osservare la particella è confinata ad un compatto, è naturale pensare ai pacchetti d’onda come stati quasi classici. In effetti vedremo che l’evoluzione temporale di un pacchetto d’onda sovrappone caratteristiche classiche – il centro del pacchetto si muove come una particella classica, ovvero di moto rettilineo uniforme – con aspetti puramente quantistici – l’evoluzione temporale del pacchetto si accompagna con un fenomeno di dispersione. Concluderemo la Sezione con lo studio del fenomeno di intereferenza che si produce osservando il moto di due pacchetti d’onda unidimensionali con velocità opposte e discuteremo come tale fenomeno è una conseguenza diretta del principio di sovrapposizione. Per semplicità di calcolo restringiamoci anzitutto al caso unidimensionale e consideriamo un dato iniziale della forma i p0 x 0 Ψ0 (x) = √1ε f x−x (4.11) e ~ , ε dove x0 , p0 ∈ R sono dei parametri e f ∈ S è una funzione reale, pari e normalizzata, cioè f (−x) = f (x) e kf k2 = 1. Supporremo naturalmente che ε 1 e x0 , p0 non dipendano da ε. Inoltre per semplicità di notazione indicheremo per ogni osservabile A hAi0 := h Ψ0 |A| Ψ0 i , ∆A2 0 = A2 0 − hAi20 , hAit := h Ψt |A| Ψt i , ∆A2 t = A2 t − hAi2t , con Ψt = U0 (t)Ψ0 . Proposizione 4.3 (Valori di aspettazione a t = 0). Per ogni x0 , p0 ∈ R e ε 1 si ha hQi0 = x0 , ∆Q2 0 = O(ε2 ), 2 hP i0 = p0 , ∆P 2 0 = O ~ε2 . (4.12) Dimostrazione. Calcoliamo hQi0 = 1 ε Z R dx xf 2 x−x0 ε Z = x0 + ε dx xf 2 (x) = x0 , R poiché per ipotesi f è pari. Similmente Z Z i~ p0 0 0 hP i0 = dx f 2 x−x − dx ∂x f 2 x−x = p0 . ε ε ε R 2ε R Quindi ∆Q2 0 = Q2 0 − x20 e Z Z 2 1 2 2 x−x0 2 2 dx x f = x0 + ε Q 0= dx x2 f 2 (x) = x20 + O(ε2 ), ε ε R R dato che xk f ∈ L2 (R) per ogni k ∈ N. Allo stesso modo Z Z Z 2 2 ~2 x−x0 2 2 p20 ~2 2 x−x0 2 0 2 ~ P 0= dx f + dx ∂ f = p + dx f (x) = p + O . x 0 0 ε ε ε2 ε R ε R ε2 R Nel caso di un pacchetto d’onda l’evoluzione temporale assume una forma più semplice che per una generica funzione d’onda: 67 Proposizione 4.4 (Evoluzione temporale di un pacchetto d’onda). Sia Ψt = U0 (t)Ψ0 con U0 (t) come in (4.10) e Ψ0 in (4.11), allora 2 p0 p0 H0 t 1 ei ~ x e−i 2m~ t e−i ~ε f ε−1 x − (U0 (t)Ψ0 ) (x) = √ 2πε p0 mt − x0 . (4.13) Dimostrazione. E’ sufficiente applicare la definizione (4.10): calcoliamo anzitutto 1 Ψ̂0 (k) = √ 2πε Z dx e −ikx+i p0 x ~ f x−x0 ε R √ Z p0 ε p0 = √ exp −i k − ~ x0 e−iεkx+iε ~ x f (x) 2π R √ = ε exp −i k − p~0 x0 fˆ ε k − p0 , ~ (4.14) e quindi √ Z Z 2 ~k2 ε p0 1 ikx −i ~k t dk e e 2m Ψ̂0 (k) = √ ei ~ x0 dk eik(x−x0 ) e−i 2m t fˆ ε k − p~0 (U0 (t)Ψ0 ) (x) = √ 2π ZR 2π R n o p 1 ε 2 p2 p0 i ~0 x0 k ~ dk exp i ε + ~ (x − x0 ) exp −i 2mε k 2 + 2εp~0 k + ~2 0 t fˆ (k) =√ e 2 2πε R Z p20 ~k2 t p0 1 =√ ei ~ x e−i 2m~ t dk exp i kε x − x0 − pm0 t e−i 2mε2 fˆ (k) = 2πε R p20 p0 H0 t 1 √ ei ~ x e−i 2m~ t e−i ~ε f ε−1 x − x0 − 2πε p0 mt . Proposizione 4.5 (Valori di aspettazione a t > 0). Per ogni x0 , p0 ∈ R e ε 1 si ha hQit = x0 + p0 m t, hP it = p0 , ∆Q2 t = t2 t ∆P 2 0 + ∆Q2 0 + (hQP + P Qi0 − 2p0 x0 ) , 2 m m ∆P 2 t = O ~2 ε2 . (4.15) Osservazione 4.5. E’ importante osservare che i valori medi delle osservabili P e Q si evolvono esattamente come le corrispondenti osservabili classiche ovvero di moto rettilineo uniforme. Questo risultato che vediamo qui ricavato per la particella libera è in realtà un caso particolare del teorema di Erhenfest, che dice appunto che i valori medi hP it e hQit sotto l’evoluzione temporale generata dall’hamiltoniana −∆ + V (x) soddisfano equazioni del moto di tipo classico. Esplicitamente1 hP it = m∂t hQit , m∂t2 hQit = − V 0 t , (4.16) con condizioni iniziali hQit=0 = hQi0 e hP it=0 = hP i0 . Osservazione 4.6. Un effetto molto importante dell’evoluzione temporale libera in MQ è la dispersione, ovvero l’incremento nel tempo della incertezza nella misura della posizione della particella: la seconda delle equazioni in (4.15) implica che, almeno per t abbastanza grande la dispersione in Q cresce nel tempo. Quindi la distribuzione di probabilità di trovare la particella in x ha un valor medio che si muove di moto classico ma tende a spiattellarsi quando il tempo cresce. Naturalmente la norma L2 è conservata ma il massimo del modulo della funzione d’onda decresce con t (si veda il prossimo Esempio 1). Questo aspetto differenzia drasticamente la dinamica classica da quella quantistica: in questo secondo caso anche prendendo un dato iniziale ragionevolmente concentrato in x, ovvero uno stato quasi classico, dopo poco tempo tale carattestica viene a mancare a seguito della dispersione indotta dall’evoluzione temporale quantistica. Quindi il concetto di traiettoria perde totalmente di senso in MQ. Stiamo ovviamente assumendo che almeno V ∈ C 1 (R) e − hV 0 it sia lipschitziana, per assicuare l’esistenza della soluzione delle equazioni classiche del moto. 1 68 Dimostrazione. Per calcolare i valori di aspettazione conviene usare la trasformata di Fourier e in particolare la (4.14): Z n o o h n i 2 ˆ ε k − p0 i∂k exp −i k − p0 x0 − i ~k2 t fˆ ε k − p0 hQit = ε dk exp i k − p~0 x0 + i ~k t f 2m ~ ~ 2m ~ R Z Z 2 p0 ˆ dk fˆ ε k − p~0 fˆ0 ε k − p~0 = ε dk x0 + ~kt + iε2 m f ε k − ~ R Z R 2 ˆ (k) = x0 + p0 t, = dk x0 + pm0 t + ~kt f m m R dove abbiamo usato che fˆ(k) = fˆ(−k) = fˆ∗ (k) grazie alla parità di f e al fatto che f è reale. Per l’aspettazioni di P si ha Z 2 Z 2 ˆ p0 ˆ(k) = p0 , hP it = ε dk ~k f ε k − ~ = dk p0 + ~k f ε R R sempre per la parità di fˆ(k). Inoltre Z 2 2 2ˆ P t = ε dk ~ k f ε k − R Q2 2 p0 ~ Z dk p0 + = R 2 ~k 2 ˆ f (k) ε = p20 + O 2 ~ ε2 , Z = ε dk t R Z = ε dk h i2 o n p0 p0 ~k2 ˆ x − i t f ε k − ∂ exp −i k − k 0 ~ 2m ~ Z 2 2 ˆ ε k − p0 − 2ε= dk x0 + ~kt fˆ∗ ε k − p0 fˆ0 ε k − p0 x0 + ~kt f m ~ m ~ ~ R R Z 2 + ε3 dk fˆ0 ε k − p~0 RZ Z Z 2 2 2 ˆ p0 t p0 ˆ∗ 0 2 ~kt ~kt ˆ = dk x0 + εm + m f (k) − 2ε= dk x0 + εm + ~ f (k) f (k) + ε dk fˆ0 (k) R = x0 + p0 2 mt + t2 m2 R p20 t2 m2 p20 t2 m2 ∆P 2 0 − = x20 + R + t m + t2 m2 ε2 kQf k22 (hP f |Qf i + hQf |P f i) + ∆P 2 0 + ∆Q2 0 + mt (hP f |Qf i + hQf |P f i) . Vediamo ora un caso esplicito e significativo di pacchetto d’onda: Esempio 4.1 (Pacchetto d’onda gaussiano) Se scegliamo una f esplicita in (4.11) della forma f (x) = 1 2 1 e− 2 x , π 1/4 (4.17) è possibile anzitutto calcolare esplcitimente l’evoluzione temporale di Ψ0 : ( 2 ) n o x − pm0 t − x0 1 1 p20 p0 q √ exp −i 2m~ t + i ~ x exp − Ψt (x) = . i~t 2ε2 1 + mε 2 π 1/4 1 + i~t ε mε2 Infatti, usando la (4.10) e la (4.14), abbiamo Ψt (x) = p ε i 2π e p0 x ~ 0 Z ~k2 dk eik(x−x0 ) e−i 2m t fˆ ε k − R p0 , ~ e sostituendo la trasformata della gaussiana (si veda il prossimo Esercizio 4.3), fˆ(k) = 1 2 1 e− 2 k π 1/4 = f (k), (4.18) 69 otteniamo Ψt (x) = p p0 x ~ 0 Z ~k2 p 2 − 1 ε2 k− 0 ~ dk eik(x−x0 ) e−i 2m t e 2 R Z ε2 p2 p0 2 0 i x − x−x0 1 ~t 1 0 2 2~ dk exp − 12 1 + i mε = √2πε π1/4 e ~ 2 k + i ε + i ε 1 2π π 1/4 e R 1 = √ 1/4 q1 i~t 1+ 2 επ mε εp0 k ~ 2 iεp0 x−x0 − ε ~ , exp − 2 1+ i~t2 mε dove abbiamo ancora una volta applicato il risultato dell’Esercizio 4.3. Resta poi un semplice calcolo per ottenere l’espressione (4.18). Dall’espressione (4.18) ricaviamo facilmente kΨt kL∞ (R) = 1 q π 1/4 1 + 1 √ = O(t−1/2 ), i~t ε 2 (4.19) mε cioè il sup della funzione d’onda decade come t−1/2 a grandi tempi. Questo tipo di decadimento non si osserva esclusivamente per i pacchetti gaussiani ma, al contrario, è un fatto generale (stime dispersive) dovuto alle proprietà dell’evoluzione temporale libera quantistica. Esercizio 4.3. Sia a ∈ C con 0 < ϕ = arg(a) < π2 oppure a > 0 e b ∈ R qualunque. Allora si dimostri che Z q b2 2 π − 12 iϕ − 4a e dx e−ax eibx = |a| e . (4.20) R (Suggerimento: si chiami I(b) la quantità al membro di sinistra dell’identità (4.20) e poi si scriva I 0 (b) come funzione di I(b), si risolva l’equazione differenziale e si calcoli I(0) integrando su un settore circolare del piano complesso, con un lato sull’asse reale e angolo al centro ϕ/2.) Abbiamo dunque visto come in ambito quantistico, anche per il sistema più elementare – la particella libera – il concetto di traiettoria perda senso. La probabilità è perciò un elemento ineliminabile dalla descrizione quantistica e quand’anche si trovino dati iniziale di carattere quasi classico (i pacchetti d’onda), per cui la probabilità di osservare la particella è sostanzialmente confinata in una regione finita, l’evoluzione temporale tende a distruggere tale localizzazione. Un altro aspetto della MQ che non ha analogo classico è l’interferenza che si può osservare anche nella dinamica di un semplice sistema come la particella libera. Tale fenomeno è una diretta manifestazione del principio di sovrapposizione ovvero della linearità dello spazio degli stati quantistici: se ad esempio Ψ1 (x) e Ψ2 (x) sono due stati (normalizzati), anche Ψ1 + Ψ2 , se opportunamente normalizzato e assumendo che non sia nullo, è uno stato ammissibile per il sistema quantistico. Il punto cruciale è che mentre lo stato è la combinazione lineare dei due, la distribuzione di probabilità della particella è come sappiamo |Ψ(x)|2 = c2 |Ψ1 (x)|2 + |Ψ2 (x)|2 + 2< hΨ1 |Ψ2 i , (4.21) dove l’ultimo termine è proprio quello responsabile dell’interferenza. La costante c serve invece a imporre la normalizzazione kΨk = 1. Supponiamo ora che Ψ1 ⊥ Ψ2 perché ad esempio le due funzioni hanno supporto disgiunto. Allora c = √12 e 2 2 2 1 |Ψ(x)| = 2 |Ψ1 (x)| + |Ψ2 (x)| , cioè la particella ha il 50% di probabilità di essere osservata nella regione dove ha supporto Ψ1 e probabilità identica di essere misurata nel supporto di Ψ2 . 70 Quando però facciamo evolvere il sistema, a causa della dispersione prodotta dall’evoluzione temporale quantistica, i supporti delle due funzioni Ψ1 e Ψ2 tendono a espandersi e, se aspettiamo un tempo sufficientemente lungo, capiterà che supp (U0 (t)Ψ1 ) ∩ supp (U0 (t)Ψ2 ) 6= ∅. Ma allora al tempo t > 0 il terzo termine della (4.21) può non essere nullo e influenzare in modo drastico la distribuzione di probabilità della particella. Non solo ma proprio come due onde classiche, le due funzioni d’onda U0 (t)Ψ1 e U0 (t)Ψ2 possono interferire tra di loro e dar vita a fenomeni di interferenza costruttiva e distruttiva (frange di interferenza). Nel seguito vedremo come questo fenomeno sia osservabile esplicitamente nel caso dell’evoluzione temporale di due pacchetti d’onda gaussiani. Consideriamo quindi un dato iniziale della forma Ψ0 (x) = cε √ 2 (Ψ+ (x) + Ψ− (x)) , con Ψ± (x) = √1 f ε x∓x0 ε ei ±p0 x ~ , f (x) = (4.22) 1 2 1 e− 2 x , π 1/4 (4.23) e cε > 0 una costante di normalizzazione. Lo stato iniziale è perciò formato da due pacchetti d’onda centrati attorno a x0 e −x0 che hanno velocità iniziale opposta. I due pacchetti si muovono quindi uno incontro all’altro e dopo un certo tempo che andremo a calcolare ci aspettiamo che si sovrappongano. Prima di proseguire nell’analisi facciamo alcune ipotesi che semplificano i calcoli: assumiamo che ε ~ 1, x0 εp0 (4.24) che sono in particolare soddisfatte se x0 , p0 > 0 non dipendono da ε e ε2 ~ (naturalmente consideriamo che ~ 1). Per prima cosa andiamo a stimare la costante di normalizzazione: essendo Ψ± normalizzate abbiamo 2Z Z 2x2 cε x+x0 x−x0 c2ε − 2x220 2 p −x2 2 − ε20 2 2 0 ≤ √ ε dx cos ~ x f dx e = c e , f e kΨ0 k2 − cε = cε |< hΨ+ |Ψ− i| = ε ε ε ε R π R da cui segue cε = 1 + O ((ε/x0 )∞ ) , (4.25) dove abbiamo indicato con O(η ∞ ) una quantità più piccola di ogni potenza di η quando η → 0. In effetti saremmo potuti arrivare alla stessa conclusione, cioè che Ψ+ e Ψ− sono con buona approssimazioni ortogonali, osservando che la condizione (4.24) implica che i supporti sono sostanzialmente disgiunti. Più precisamente le uniche sovrapposizioni si verificano dove almeno una delle due funzioni è esponenzialmente piccola in ε/x0 . L’evoluzione temporale di Ψ0 fa si che, per linearità , i centri dei due pacchetti si muovano di moto rettilineo uniforme con velocità opposte uguali a p0 /m. Pertanto al tempo T = mx0 , p0 (4.26) i centri dei pacchetti sono esattamente sovrapposti a x = 0 e dobbiamo aspettarci la massima sovrapposizione dei supporti. Definiamo inoltre per convenienza α= ~x0 1, ε2 p 0 (4.27) come segue banalmente da (4.24). Notiamo inoltre che la seconda condizione in (4.24) garantisce che i pacchetti Ψ+ e Ψ− sono concentrati anche nell’impulso, compatibilmente con il principio di indeterminazione (3.57), sono cioè stati che saturano la disuguaglianza ∆P ∆Q ≥ 12 ~. Inoltre, in particolare, conservano la natura di pacchetti d’onda concentrati anche durante l’evoluzione temporale, benché come abbiamo visto 71 in precedenza, la dispersione in Q aumenti nel tempo. Si può tuttavia facilmente vedere dalla seconda delle (4.15) che la dispersione al tempo T in Q soddisfa ∆Q2 T x0 , cioè i pacchetti sono ancora concentrati nella posizione rispetto alla distanza iniziale. Se ora prendessimo seriamente l’analogia fra la MQ e una teoria probabilistica classica dovremmo aspettarci che al tempo T la distribuzione di probabilità sia la somma delle distribuzioni di probabilità dei due pacchetti d’onda e in quanto tale sia sostanzialmente coincidente con quella di un singolo pacchetto d’onda 2 centrato in x = 0 con una dispersione ∆Q t maggiore di quella iniziale. In realtà questo è in generale molto lontano dalla realtà : l’evoluzione temporale in MQ non agisce direttamente sulla distribuzione di probabilità , ma modifica la funzione d’onda. Questo fa sı̀ che il terzo addendo nella (4.21) possa essere modificato in modo drammatico dalla dinamica. Proposizione 4.6 (Interferenza di pacchetti d’onda). Sia Ψ0 il dato iniziale (4.22) e assumiamo che valgano le (4.24), allora |ΨT (x)|2 = √ x2 2 − √ e ε2 (1+α2 ) cos2 πε 1 + α2 p0 ~ x (1 + o(1)) , (4.28) uniformemente in x ∈ R. Osservazione 4.7. L’esponenziale al membro di destra della (4.28) suggerisce che la probabilità sia distribuita come nei pacchetti d’onda Ψ± . Tuttavia l’ultimo fattore mostra come questo esponenziale in realtà moduli delle oscillazioni dovute al cos2 di frequenza molto elevata (ricordiamo che abbiamo ipotizzato ~/p0 1). All’interno della regione dove la proabilità di osservare la particella è sensibilmente diversa da 0, ovvero ad esempio per |x| ≤ cεα, si presentano cioè delle oscillazioni fra un valore massimo, quando x = nπ~ p0 , . Naturalmente non esiste nessuna possibile spiegazione classica di questo n ∈ N, e 0, quando x = (2n+1)π~ 2p0 fenomeno che può essere osservato in laboratorio e, anzi, questo esempio suggerisce che la MQ non si possa reinterpretare semplicemente come una teoria probabilistica classica. Osservazione 4.8. Sottolineiamo che la (4.28) è in realtà una stima e non un’identità. In questo senso l’affermazione sull’uniformità per x ∈ R va intesa nel senso che l’errore o(1) è una quantità il cui sup rispetto a x ∈ R è controllato in modulo da una funzione di ε che tende a 0 quando ε → 0. Dimostrazione. La dimostrazione combina la linearità dell’evoluzione temporale U0 (t) con la (4.18). L’errore è dovuto alla sostituzione di c2ε con 1 e, come mostra la stima (4.25), è esponenzialmente piccolo in ε/x0 . 4.3 L’Oscillatore Armonico Un altro sistema elementare che è tuttavia alla base della modellizzazione di molti fenomeni fisici quantistici è l’oscillatore armonico. Come in meccanica classica l’hamiltoniana è data da H̃osc = |P|2 1 + mω 2 |Q|2 , 2m 2 (4.29) su L2 (Rd ). Naturalmente data l’azione delle osservabili P e Q, l’operatore Hosc agirà su una generica funzione d’onda Ψ ∈ S(Rd ) come ~2 1 H̃osc Ψ (x) = − ∆Ψ(x) + mω 2 |x|2 Ψ(x). 2m 2 (4.30) Nel seguito per semplificare l’analisi considereremo il caso unidimensionale d = 1, commentando poi alla fine di questa Sezione sull’estensione a d > 1. 72 Sia dunque H̃osc definita come in (4.29) su S(R). L’operatore è ovviamente illimitato e simmetrico. In particolare non è chiuso. Mostreremo però che è essenzialmente autoaggiunto esibendo esplicitamente una base di autofunzioni. Tale base definirà automaticamente un unitario da L2 (R) in `2 (N) che ci permetterà di trovare il dominio di autoaggiunzione di Hosc studiando l’operatore associato su `2 (N), come abbiamo già fatto nell’Esempio 3.23 (si veda anche l’Osservazione 3.3.13). Prima però di procedere con lo studio dell’operatore conviene cambiare unità e studiare un operatore adimensionale: Proposizione 4.7 (Oscillatore armonico adimensionale). Sia H̃osc l’operatore definito nella (4.29) con d = 1, allora ∃U : L2 (R) → L2 (R) unitario tale che U H̃osc U −1 =: ~ωHosc , (Hosc Ψ) (y) = − 21 ∆Ψ(y) + 21 y 2 Ψ(y). (4.31) Dimostrazione. Riscaliamo le lunghezze ponendo y = λx (4.32) con λ ∈ R+ da scegliere in seguito. Se indichiamo con Uλ : L2 (R) → L2 (R), l’operatore unitario che implementa il cambio di coordinate, cioè (U Ψ) (y) = √1 Ψ(λ−1 y). λ (4.33) allora abbiamo − 1 ~2 λ2 1 ~2 ∆Ψ(x) + mω 2 x2 Ψ(x) = − ∆y Ψ(λ−1 y) + 2 mω 2 y 2 Ψ(λ−1 y) 2m 2 2m 2λ √ 1 ~2 λ2 2 2 ∆y (Uλ Ψ) (y) + 2 mω y (Uλ Ψ) (y) . = λ − 2m 2λ A questo punto scegliamo r λ= mω , ~ in modo che i due coefficienti dei due addendi siano uguali e il risultato segue banalmente con U = Uλ , l’unitario associato al λ della formula precedente. Grazie alla Proposizione precedente possiamo restringerci a considerare l’hamiltoniana Hosc definita nella (4.31), visto il caso generale (4.29) si può riottenere con un cambio di variabili implementato da un operatore unitario. Per studiare lo spettro di Hosc conviene introdurre gli operatori di creazione e distruzione a := √12 Q̃ + iP̃ , a† := √12 Q̃ − iP̃ , (4.34) con dominio D(a) = D(a† ) = C0∞ (R) e Q̃Ψ (y) = yΨ(y), P̃ Ψ (y) = −i∂y Ψ(y). Proposizione 4.8 (Operatori di creazione e distruzione). Siano a, a† definiti come nella (4.34) con dominio S(R), allora e, per ogni Φ, Ψ ∈ S(R), hΦ |aΨ i = ha† Φ|Ψi, [a, a† ]Ψ = Ψ, [Hosc , a]Ψ = −aΨ, [Hosc , a† ]Ψ = a† Ψ, Hosc Ψ = a† a + 12 Ψ = aa† − 12 Ψ. (4.35) 73 Dimostrazione. Tutte le identità tranne la prima, che segue dall’essenziale autoaggiunzione di P e Q su S(R), sono conseguenza diretta della regola di commutazione fra P̃ e Q̃, cioè per ogni Ψ ∈ S(R), h i P̃ , Q̃ Ψ (y) = −i∂y (yΨ(y)) + iy∂y Ψ(y) = −iΨ(y). L’utilità degli operatori di creazione e distruzione sta in particolare nelle ultime tre relazioni in (4.35): Proposizione 4.9 (Proprietà degli autovalori di Hosc ). Se λ ∈ R è un autovalore di Hosc e Ψλ ∈ S(R) il relativo autovettore, allora i) λ ≥ 21 ; ii) a† Ψλ è ancora autovettore (di norma λ + 21 ) di Hosc all’autovalore λ + 1; iii) se λ ≥ 32 , aΨλ è ancora autovettore (di norma λ − 12 ) di Hosc all’autovalore λ − 1. Dimostrazione. Le ultime tre identità in (4.35) sono sufficienti per ottenere l’enunciato: dall’ultima otteniamo E D λ = h Ψλ |Hosc | Ψλ i = Ψλ a† a + 21 Ψλ = haΨλ |aΨλ i + 21 = kaΨλ k22 + 12 ≥ 12 . Mentre dalla terz’ultima e penultima identità Hosc a† Ψλ = λa† Ψλ + [Hosc , a† ]Ψλ = (λ + 1)Ψλ ; e, se λ ≥ 32 , Hosc aΨλ = λaΨλ + [Hosc , a† ]Ψλ = (λ − 1)Ψλ . Si noti che la condizione λ ≥ non nulla: nel primo caso † ka mentre nel secondo 3 2 Ψλ k22 è in realtà conseguenza della richiesta che il nuovo autostato abbia norma E = Ψλ aa† Ψλ = Ψλ Hosc + 12 Ψλ = λ + D 1 2 > 0; D E kaΨλ k22 = Ψλ a† a Ψλ = Ψλ Hosc − 21 Ψλ = λ − 12 , che è positivo se e solo se λ > 21 , ovvero λ ≥ 23 , per quanto dimostrato riguardo a a† . Osservazione 4.9. Si noti che il fatto che Ψλ stia in S è in realtà un ipotesi cruciale del risultato perché altrimenti non potremmo sfruttare le relazioni (4.35). Per poter quindi applicare la Proposizione 4.9 dovremmo assicurarci che Ψλ ∈ S(R). La precedente Proposizione è sufficiente per trovare tutti gli autovalori di Hosc : Teorema 4.1 (Autovalori di Hosc ). Si ha σpp (Hosc ) = n + 12 , n ∈ N ∪ {0} , (4.36) con autofunzioni normalizzate Ψn (y) = dove Hn è l’n−esimo polinomio di Hermite. 1 √ π 1/4 2n n! Hn (y)e− y2 2 , (4.37) 74 y2 Dimostrazione. Per prima cosa osserviamo che e− 2 è autofunzione di Hosc all’autovalore 12 . Inoltre essa sta in S(R) e quindi possiamo applicare la Proposizione 4.9 che implica automaticamente l’esistenza degli autovalori n+ 12 . Per identificare le autofunzioni è poi sufficiente applicare a† ripetutamente (rinormalizzando a ogni passo) e usare la definizione di polinomio di Hermite. Notiamo anzitutto che Ψn (y) = 1 √ π 1/4 2n n! (y − ∂y )n e− y2 2 , cosı̀ che, per la definizione di polinomio di Hermite, Hn (y) := (−1)n e y2 2 dn − y2 e 2, dxn rimane solo da dimostrare che (−∂y + y)n e− y2 2 = (−1)n e y2 2 dn − y2 e 2. dxn Dimostriamo l’asserto per induzione su n ∈ N. Per n = 0 è ovviamente vero. Supponiamo che sia vero per n ∈ N, allora dimostriamo che vale per n + 1: 2 n n+1 2 2 2 y d − y2 n+1 − y2 n n+1 y2 d − y2 2 2 = (−1) (−∂y + y) e e = (−1) e e . (−∂y + y) e dxn dxn+1 Per concludere che quelli trovati sono tutti e soli gli autovalori, si osserva che se esistesse un autovalore λ 6= n+ 12 potremmo ripetutamente applicare a al relativo autovettore ottenendo un autovettore all’autovalore 1 3 0 2 < λ < 2 . Si potrebbe allora applicare l’ultimo punto della Proposizione 4.9, ottenendo un autovalore strettamente minore di 12 , il che contraddice il primo punto della medesima Proposizione. L’argomento precedente contiene in realtà una piccola imprecisione: per poter applicare la Proposizione 4.9 dobbiamo assumere che l’autofunzione relativa all’autovalore λ sia in effetti in S(R). L’argomento quindi escluderebbe solo altri autovalori con autofunzioni in S(R). Tuttavia è facile osservare che il risultato della Proposizione 4.9 si estende banalmente a tutte le funzioni Ψλ tali che P̃ Ψλ e Q̃Ψλ siano entrambe in L2 (R), perché tali funzioni appartengono certamente al dominio di a e a† . Ma, d’altra parte, qualunque autofunzione di Hosc deve essere tale che Z n o dy 21 |Ψ0λ |2 + 12 y 2 |Ψλ |2 = λ < +∞, R e quindi la Proposizione 4.9 si può applicare. Osservazione 4.10. Un’importante conseguenza della Proposizione 4.1 o, più precisamente, della sua dimostrazione è che gli autovalori di Hosc sono anche non degeneri. Vi sono vari modi per vederlo, ma il più semplice è invocare l’unicità di Ψ0 o, in altri termini, della soluzione dell’equazione differenziale − 21 Ψ00 + 21 y 2 Ψ = 12 Ψ, e quindi sfruttare le proprietà di a† . Per completare l’analisi spettrale di Hosc resta da dimostrare che tutto lo spettro di Hosc è completamente discreto. Solitamente questo viene dimostrato sfruttando la completezza delle autofunzioni (4.37), mentre qui presentiamo una dimostrazione alternativa che sfrutta le proprietà del risolvente di Hosc , di cui diamo una rappresentazione nel prossimo Lemma 4.2. Sfrutteremo infatti un risultato generale di grande utilità nello studio dello spettro di operatori di Schrödinger con risolvente compatto, il prossimo Lemma 4.1. Teorema 4.2 (Spettro di Hosc ). Si ha σ(Hosc ) = σdisc (Hosc ) = σpp (Hosc ) = n + 21 , n ∈ N ∪ {0} . Inoltre le autofunzioni Ψn in (4.37) costituiscono un s.o.n.c in L2 (R). (4.38) 75 Osservazione 4.11. La dimostrazione del risultato strutta un risultato generale sugli operatori con risolvente compatto (Lemma 4.1) e lo combina con la rappresentazione (4.39) del risolvente di Hosc , la cui dimostrazione però è piuttosto complicata. Una dimostrazione più diretta si può ottenere combinando il criterio di Rellich [RS4, Teorema XIII.65] con una versione più dettagliata del Lemma 4.1 (si veda [RS4, Teorema XIII.64]). Dimostrazione. Grazie al Lemma 4.1 è sufficiente dimostrare che (Hosc + λ)−1 è compatto per un qualche λ ≥ 0. Prendiamo per semplicità λ = 1/2 e mostriamo che (Hosc + 1/2)−1 è il limite in norma di operatori di classe traccia: chiamiamo Rδ l’operatore integrale con kernel 1 o n n o Z 1−δ 1 ν λ− 2 2 0 1 1 2 0 Rδ (y; y ) = √ exp − 2 (y + y ) 2νyy 0 − ν 2 (y 2 + y 0 2 ) . dν √ exp 1−ν 2 π 1 − ν2 0 E’ facile vedere che Rδ −→ (Hosc + 1/2)−1 in norma operatoriale: applicando il test di Schur (Proposizione δ→0 3.10) abbiamo Z 1 1 n n oZ o 1 −1 0 1+ν 2 1+ν 2 2 0 2 + 2ν yy 0 dν √ y dy exp − y exp − 2(1−ν (Hosc + 1/2) − Rδ ≤ sup 2) 2(1−ν 2 ) 1−ν 2 π y∈R 1−δ 1 − ν2 R Z 1 Z 1 n o 1 1 1−ν 2 2 √ dν dν √ ≤ C sup exp − 2(1+ν 2 ) y ≤ C −→ 0. 2 1+ν 1 + ν 2 δ→0 y∈R 1−δ 1−δ Inoltre per ogni δ > 0 Z Z 1−δ Z Z 1−δ o n 1 1 1 1 1−ν 2 dy dν kRδ k1 = dy dν √ exp − 1+ν y = √ < +∞, π R 1−ν π R 1 − ν2 0 0 per cui (Hosc + 1/2)−1 è un operatore compatto in quanto limite in norma di operatori compatti (Teorema 3.25). Lemma 4.1 (Spettro discreto e risolvente compatto). Sia A un operatore autoaggiunto limitato dal basso, allora le seguenti affermazioni sono equivalenti: i) (A − z)−1 è compatto per un qualche z ∈ ρ(A); ii) (A − z)−1 è compatto per ogni z ∈ ρ(A); iii) σ(A) = σdisc (A) = σpp (A) e ∃ un s.o.n.c. {Ψn }n∈N di autovettori di A tale che AΨn = µn Ψn e µ1 ≤ µ2 ≤ · · · ≤ µn −→ +∞. n→∞ Dimostrazione. Dimostreremo che i) ⇐⇒ ii) e ii) =⇒ iii) =⇒ i). i) ⇐⇒ ii) segue immediatamente dalla prima identità del risolvente (3.77) e dal fatto che se A è compatto e B limitato allora AB e BA sono entrambi compatti. Dimostriamo ora che ii) =⇒ iii): siccome (A − z)−1 è compatto per ogni z ∈ ρ(A) e A è limitato dal basso ∃a > 0 tale che A ≥ −a e quindi (A + a)−1 è compatto. Allora, poiché (A + a)−1 è positivo e autoaggiunto, per il Teorema di Hilbert-Schmidt 3.27, ∃ un s.o.n.c. {Ψn }n∈N tale che (A + a)−1 Ψn = λn Ψn , con λ1 ≥ · · · ≥ λn −→ 0. Il risultato è quindi dimostrato definendo µn = λ−1 n − a. Si noti che l’affermazione n→∞ sullo spettro di A è conseguenza diretta dell’esistenza di una base di autovettori (appunto il s.o.n.c. {Ψn }) e del fatto che per il Teorema di Riesz-Schauder 3.26 la degenerazione dei λn è finita per ogni n ∈ N e non esistono punti di accumulazione diversi da 0 e +∞ per i λn . Per l’implicazione contraria iii) =⇒ i) prendiamo a > 0 come prima: è facile vedere che si ha la rappresentazione X 1 (A + a)−1 = |Ψn i hΨn | . µn + a n∈N Il Teorema 3.25 unitamente al fatto che µn −→ +∞ ci dà immediatamente il risultato. n→∞ 76 Lemma 4.2 (Risolvente di Hosc ). Per ogni λ > − 12 , (Hosc + λ)−1 è un operatore integrale limitato su L2 (R) con kernel (Hosc + λ) −1 o n 1 2 1 2 0 √ (y; y ) = exp − 2 (y + y ) π 0 Z 0 1 1 o n ν λ− 2 2 1 0 2 2 0 √ dν exp 1−ν 2 2νyy − ν (y + y ) . (4.39) 1 − ν2 Dimostrazione. La formula (4.39) è anche detta formula di Mehler. Per una dimostrazione si veda ad esempio [BC]. Possiamo ora tornare all’hamiltoniana fisica H̃osc da cui siamo partiti e osservare che il precedente Teorema 4.2 implica (sempre nel caso d = 1) σ(H̃osc ) = σdisc (H̃osc ) = σpp (H̃osc ) = ~ω n + 12 n ∈ N . (4.40) Per concludere lo studio dell’oscillatore armonico commentiamo brevemente sul caso d−dimensionale, d > 1: fruttando l’isomorfismo L2 (Rd ) ' L2 (R) ⊗ · · · ⊗ L2 (R) è ovvio che H0 in Rd sia scrivibile come (1) (1) Hosc = Hosc ⊗ 1 ⊗ · · · ⊗ 1 + 1 ⊗ Hosc ⊗ 1 ⊗ ··· ⊗ 1 + ··· , (4.41) (1) dove con Hosc abbiamo indicato l’hamiltoniana dell’oscillatore armonico unidimensionale. Proposizione 4.10 (Spettro dell’oscillatore armonico in d > 1). Sia H̃osc l’hamiltoniana (4.29) in d > 1, allora σ(H̃osc ) = σdisc (H̃osc ) = σpp (H̃osc ) = ~ω N + d2 N ∈ N . (4.42) Inoltre il livello energetico N −esimo ~ω(N + d2 ) è degenere e una base per l’autospazio relativo è data dalle autofunzioni d X Ψn1 ,...,nd (x) = Ψn1 (x1 ) · · · Ψnd (xd ), N= ni , (4.43) i=1 dove le {Ψn } sono gli autostati dell’oscillatore armonico unidimensionale. (n1 , . . . , nd ) ∈ Nd formano un s.o.n.c. in L2 (Rd ). Le Ψn al variare di n = Dimostrazione. Il risultato segue banalmente dalle proprietà dell’oscillatore armonico unidimensionale e dalla rappresentazione (4.41). Capitolo 5 Atomo di Idrogeno In questo Capitolo riprenderemo uno dei problemi connessi alla crisi della fisica classica che abbiamo discusso nella Sezione 1.3, ovvero la necessità di avere un modello stabile degli atomi, che sia in grado di dare conto delle osservazioni spettroscopiche. Vedremo come in ambito quantistico tale modello non solo esista ma riproduca in un certo senso le regole empiriche del modello atomico di Bohr (si veda ancora la Sezione 1.3), fornendone quindi una giustificazione teorica. In questo Capitolo studieremo esclusivamente l’atomo più elementare possibile, ovvero quello di idrogeno: un sistema costituito da due particelle cariche, il protone ed l’elettrone, con carica opposta e interagenti con il potenziale coulombiano. Gli atomi più complessi saranno studiati nei prossimi Capitoli. 5.1 Autoaggiunzione e Stabilità Il sistema che vogliamo descrivere è dunque costituito da due cariche uguali ed opposte con masse mp ' 2000me . E’ dunque naturale assumere che il nucleo dell’atomo, costituito dal protone, sia fermo all’origine del sistema di coordinate. In tal caso l’Hamiltoniana del sistema coincide con quella dell’elettrone ed è data da P2 e2 He = H0 + Ve = − , (5.1) 2me |Q| che agisce su C0∞ (R3 ) ⊂ L2 (R3 ) come l’operatore He = − ~2 e2 ∆− . 2me |x| (5.2) Esercizio 5.1. Si usi il cambiamento di coordinate (xp , xe ) −→ (xcm , r), con xcm = mp xp + me xe la coordinata del centro di massa e r = xe − xp , per ricavare la fattorizzazione dell’Hamiltoniana H dell’atomo di idrogeno comprensiva dell’energia cinetica del protone. Si dimostri che H = Hcm + Hrel e Hrel è una perturbazione piccola nel senso di Kato di He . Si sfrutti tale risultato e le seguenti proprietà di He per dimostrare autoaggiunzione e limitatezza dal basso di H. Il risultato principale di questa Sezione è il seguente Teorema 5.1 (Autoaggiunzione e limitatezza dal basso di He ). L’operatore He definito nella (5.1) è autoaggiunto su D(He ) = H 2 (R3 ) e essenzialmente autoaggiunto su C0∞ (R3 ). Inoltre He è limitata dal basso, cioè esiste λ0 < +∞ tale che He ≥ −λ0 . Dimostrazione. L’autoaggiunzione e la limitatezza dal basso sono conseguenza di un risultato generale che enunciamo nel prossimo Lemma 5.1: è infatti facile vedere che Ve ∈ L2 (R3 ) + L∞ (R3 ) decomponendolo come Ve = V1 + V2 con V1 (x) := Ve (x)1{|x|≤R} , V2 (x) := Ve (x)1{|x|>R} . 77 78 Lemma 5.1 (Autoaggiunzione per potenziali in L2 + L∞ ). Sia V reale tale che V = V1 + V2 con V1 ∈ L2 (R3 ) e V2 ∈ L∞ (R3 ) (che indicheremo da qui in poi come V ∈ L2 + L∞ ), allora H = −∆ + V è essenzialmente autoaggiunta su C0∞ (R3 ) e autoaggiunta su H 2 (R3 ). Inoltre ∃λ0 < +∞ tale che H ≥ −λ0 . Dimostrazione. Come suggerito dal titolo del Lemma, il risultato è dimostrato applicando il Teorema di Kato-Rellich 3.13. Dimostriamo quindi che sotto le ipotesi dell’enunciato V è piccolo nel senso di Kato rispetto a −∆. Anzitutto osserviamo che C0∞ (R3 ) ⊂ D(V ) e V è simmetrico su tale dominio. Inoltre per ogni Ψ ∈ L2 (R3 ) kV Ψk2 ≤ kV1 k2 kΨk∞ + kV2 k∞ kΨk2 ≤ a0 k∆Ψk2 + b0 kΨk2 , (5.3) dove abbiamo applicato il prossimo Lemma 5.2 con a0 = a kV1 k2 e b0 = b+kV2 k∞ . A questo punto il risultato segue dall’arbitrarietà di a, per cui possiamo sempre trovare un a0 < 1 tale che la disuguaglianza vale. Gli altri risultati dell’enunciato seguono direttamente dall’applicazione del Teorema di Kato-Rellich 3.13 (si vedano anche le Osservazioni 3.10 e 3.11 e il Corollario 3.1). Lemma 5.2 (Disuguaglianza di Sobolev). Sia Ψ ∈ H 2 (Rd ), d ≤ 3, allora Ψ è limitata e continua e ∀a > 0, ∃b < +∞ (indipendente da Ψ) tale che kΨk∞ ≤ a k∆Ψk2 + b kΨk2 . (5.4) Dimostrazione. Ci restringiamo al caso d = 3. La dimostrazione in d = 1, 2 è infatti identica. Osserviamo anzitutto che kΨk∞ ≤ (2π)13/2 kΨ̂ k1 , come segue banalmente dalla definizione di trasformata di Fourier scambiando il modulo con l’integrale. D’altra parte abbiamo che, per ogni λ > 0, k2 + λ dk|Ψ̂| = dk 2 |Ψ̂| ≤ k +λ R3 R3 Z Z Z 1 dk 2 (k + λ)2 R3 1/2 h i 2 k + λ Ψ̂ ≤ C λ−1/4 k∆Ψk2 + λ3/4 kΨk2 , 2 dove abbiamo usato le disuguaglianze di Cauchy e triangolare. Al variare di λ ∈ (0, +∞) si ottiene quindi l’enunciato. Osservazione 5.1. La possibilità di scegliere arbitrariamente la costante a > 0 nella disuguaglianza (5.4) può essere anche vista come conseguenza del comportamento della espressione al membro di destra sotto dilatazioni (scaling): ripetendo la dimostrazione per λ = 1, otterremmo kΨk∞ ≤ C [k∆Ψk2 + kΨk2 ] . √ Se però a questo punto definissimo Ψ̂λ (x) = λ3/2 Ψ̂( λx) e applicassimo la disuguaglianza precedente a Ψλ riotterremmo la (5.4), cioè h i kΨk∞ ≤ C λ−1/4 k∆Ψk2 + λ3/4 kΨk2 , dato che kΨ̂λ k1 = kΨ̂ k1 , kΨ̂λ k2 = λ3/4 kΨ̂ k2 e kk 2 Ψ̂λ k2 = λ−1/4 kk 2 Ψ̂ k2 . Nel caso paradigmatico dell’atomo di idrogeno abbiamo una chiara dimostrazione dell’importanza dell’ipotesi di autoaggiunzione per le osservabili quantistiche e in particolare per l’Hamiltoniana del sistema: Corollario 5.1 (Dinamica di idrogeno). dell’atomo Gli operatori U (t) = exp −i H~e t identificano un gruppo a un parametro fortemente continuo di operatori unitari e, per ogni t ∈ R, U (t)Ψ0 descrive la dinamica dell’atomo di idrogeno con dato iniziale Ψ0 ∈ L2 (R3 ). Dimostrazione. Si veda la Sezione 3.13 e in particolare il Teorema 3.31. 79 Osservazione 5.2. Il Corollario 5.1 garantisce l’esistenza globale nel tempo della dinamica dell’atomo di idrogeno. Non si ha perciò nessun fenomeno di “caduta sul centro” dell’elettrone e la dinamica quantistica è più regolare di quella classica. Tuttavia il Corollario 5.1 non risolve interamente il problema fisico della stabilità dell’atomo di idrogeno che abbiamo visto nella Sezione 1.3 essere uno dei fenomeni alla base della crisi della fisica classica. A tale scopo si dovrebbe infatti includere il campo elettromagnetico nella descrizione quantistica, cosa impossibile in ambito non relativistico. Questo è invece possibile in teoria di campo e si può in quel caso dare una soluzione completa al problema discusso nella Sezione 1.3, nonché spiegare il fenomeno dell’assorbimento ed emissione di onde elettromagnetiche da parte dell’atomo di idrogeno. Concludiamo la Sezione con una prima stima non ottimale del limite dal basso per He , cioè il λ0 che compare nell’enunciato del Teorema 5.1: Proposizione 5.1 (Limite dal basso per He ). Si ha He ≥ − 2me e4 . ~2 (5.5) Dimostrazione. Sia Ψ ∈ H 2 (R3 ) con kΨk = 1, allora il Lemma 5.3 implica Z ~2 e2 h Ψ |He | Ψ i ≥ dx − |Ψ|2 . 2 8m |x| |x| 3 e R Resta allora solo da minimizzare la funzione segue quindi dalla normalizzazione di Ψ. ~2 8me |x|2 − e2 |x| , il che equivale a scegliere |x| = ~2 . 4me e4 Lemma 5.3 (Disuguaglianza di Hardy). Per ogni Ψ ∈ H 1 (Rd ), d ≥ 3, si ha Z Z |Ψ|2 (d − 2)2 2 dx . dx |∇Ψ| ≥ 4 |x|2 Rd Rd Il risultato (5.6) Osservazione 5.3. La constante della disuguaglianza di Hardy è ottimale (sharp), nel senso che l’operatore 2 di Schrödinger −∆ − |x|ν 2 è un operatore illimitato dal basso se ν > (d−2) . 4 Dimostrazione. Per ogni β ∈ R calcoliamo 2 Z Z 2 x β x 2 2 2 dx ∇ + β 2 Ψ = dx |∇Ψ| − β|Ψ| ∇ · 2 + 2 |Ψ| , |x| |x| |x| Rd Rd dove abbiamo integrato per parti il secondo termine dello sviluppo del quadrato e sfruttato l’annullamento dei termini di bordo garantita dalla condizione Ψ ∈ H 1 (Rd ): Z Z 1 1 C dσ |Ψ|2 = ∇|Ψ|2 ≤ kΨk2 k∇Ψk2 −→ 0. R→∞ R ∂BR R BR R Inoltre d ∇· X |x|2 − 2x2 d−2 x i = = , |x|2 |x|4 |x|2 i=1 da cui otteniamo Z 0≤ 2 Z x dx ∇ + β 2 Ψ = |x| d R β 2 − β(d − 2) 2 2 dx |∇Ψ| + |Ψ| , |x|2 Rd e quindi, ottimizzando rispetto a β, cioè scegliendo β = d−2 2 , il risultato. 80 5.2 Spettro Energetico In questa Sezione studiamo lo spettro energetico di He . Per prima cosa applichiamo il Teorema di Weyl 3.28 per trovare lo spettro essenziale di He . Proposizione 5.2 (Spettro essenziale di He ). Si ha σess (He ) = R+ . (5.7) Dimostrazione. L’idea della dimostrazione è di applicare il Teorema di Weyl 3.28 e quindi a tale scopo mostrare che (He − z)−1 − (H0 − z)−1 è un operatore compatto per un qualche z ∈ ρ(He ) ∩ ρ(H0 ). Notiamo inoltre che è sufficiente dimostrare la compattezza dell’operatore Ve (H0 + λ)−1 , λ> 2me e4 , ~2 (5.8) poiché −λ ∈ ρ(He ) ∩ ρ(H0 ) e (He + λ)−1 − (H0 + λ)−1 = −(He + λ)−1 Ve (H0 + λ)−1 , (5.9) per la seconda identità del risolvente (3.78). Inoltre osserviamo che se Ve (H0 + λ)−1 è compatto anche il membro di destra della (5.9) è compatto in quanto prodotto di un operatore compatto per uno limitato (ricordiamo che grazie alla condizione (5.8) e alla Proposizione 5.1 λ ∈ ρ(He )). Usiamo ora una decomposizione di Ve simile a quella usata nella dimostrazione del Teorema 5.1: V e = V n + Wn , Vn (x) = Ve (x)1{|x|≤n} , Wn (x) = Ve (x)1{|x|>n} , cosı̀ che Wn ∈ L∞ (R3 ) e kWn k = kWn kL∞ (R3 ) −→ 0. n→∞ Osserviamo poi che Vn (H0 + λ)−1 è un operatore integrale con kernel √ Vn (x)e− λ|x−y| Vn (x)Gλ (x − y) = ∈ L2 (R6 ). 4π|x − y| Infatti √ V 2 (x)e−2 λ|x−y| dxdy n 2 ≤C 16π |x − y|2 R6 Z √ Z dx R3 Vn2 (x) e−2 λ|y| dy ≤ Cn < +∞. |y|2 R3 Z Pertanto Vn (H0 + λ)−1 è un operatore di classe Hilbert-Schmidt e in particolare compatto. Allora anche Ve (H0 + λ)−1 è un operatore compatto in quanto limite in norma di operatori compatti. Per quanto detto il risultato segue quindi dal fatto che σess (H0 ) = R+ , come abbiamo visto nella Sezione 4.1. Per chiudere l’indagine dello spettro essenziale enunciamo un risultato di cui non daremo la dimostrazione, che si può ottenere facendo ricorso alle proprietà di riscalamento di He sotto dilatazioni complesse (si veda ad esempio [T3, (4.1.16)]). Proposizione 5.3 (Assenza di spettro singolare di He ). Si ha σsing (He ) = ∅. (5.10) Una volta identificato lo spettro essenziale, vogliamo trovare lo spettro discreto. Un risultato che riveste un interesse a se stante e ci permetterà di ricavare importanti informazioni sugli autovalori di He e in particolare il fatto che tutti gli autovalori di He sono negativi è il teorema del viriale. 81 Proposizione 5.4 (Teorema del viriale). Sia Ψ un autovettore di He all’autovalore E, allora E= 1 2 h Ψ |Ve | Ψ i = − h Ψ |H0 | Ψ i . (5.11) Dimostrazione. La dimostrazione del teorema del viriale usa il comportamento di He sotto l’azione del gruppo delle dilatazioni: definiamo per ogni β ∈ R (U (β)Ψ) (x) = e 3β 2 Ψ(eβ x). (5.12) E’ facile vedere che U (β) è unitario e U (−β) = U ∗ (β) = U −1 (β) e più precisamente U (β) è un gruppo unitario ad un parametro fortemente continuo. Inoltre i h i h −3β ~2 −2β −β x) − e2 Ψ(e−β x) = U (−β) e−2β H + e−β V Ψ (x), (He U (−β)Ψ) (x) = e 2 − 2m e (∆Ψ) (e 0 e |x| e cioè U (β)He U (−β) = e−2β H0 + e−β Ve . Se Ψ è autovettore per ogni β ∈ R si ha h(He − E)Ψ |U (β)Ψ i = 0, 0 = h(He − E)U (−β)Ψ |Ψ i = hU (β)(He − E)U (−β)Ψ |U (β)Ψ i = cosı̀ che D E e−2β H0 + e−β Ve Ψ U (β)Ψ , E 1 D 1 − e−2β H0 + 1 − e−β Ve Ψ U (β)Ψ = 0. β Osserviamo poi che per ogni autovettore di He deve essere kH0 Ψk < +∞, kVe Ψk < +∞, e E 1 D 1 − e−2β H0 + 1 − e−β Ve Ψ U (β)Ψ β→0 β E 1 D = lim 1 − e−2β H0 + 1 − e−β Ve Ψ Ψ = h (2H0 + Ve ) Ψ| Ψi , β→0 β 0 = lim poiché E 1 D 1 − e−2β H0 + 1 − e−β Ve Ψ (U (β) − 1) Ψ = 0 β→0 β lim per convergenza dominata, mentre per ogni Ψ nel dominio di He e, in particolare, un autovettore, w 1−e−2β H0 −→ β β→0 2H0 , w 1−e−β −→ β Ve β→0 Ve . Corollario 5.2 (Autovalori negativi di He ). Tutti gli autovalori E di He sono negativi, cioè E < 0. Dimostrazione. Segue dalla (5.11) e dal fatto che sia H0 che Ve hanno un nucleo banale. Un altro fatto che discende dal comportamento di He sotto dilatazioni o, detto in altri termini, dal modo in cui He scala quando si riscalano le lunghezze è l’esistenza di ∞ autovalori di He . Proposizione 5.5 (Esistenza di ∞ autovalori di He ). Esistono ∞ autovalori negativi E1 ≤ E2 ≤ · · · di He . 82 Dimostrazione. Dimostriamo che dim[ran(EHe (−∞, 0])] = dim[ran(EHe [E1 , 0])] = +∞, dove abbiamo indicato con E1 = inf σ(He ), che sappiamo essere > −∞ per il Teorema 5.1. Inoltre è facile mostrare che esiste una Ψ di prova normalizzata tale che h Ψ |He | Ψ i < 0 (si veda sotto) e quindi E1 < 0 è certamente un autovalore perché sappiamo che σess (He ) = R+ . In particolare esiste almeno un autovalore < 0. Sia ora Ψ una funzione C0∞ (R+ ) tale che supp(Ψ) ⊂ (1, 2) e kΨk2 = 1. Definiamo inoltre Ψn (x) = 2− 3n 2 Ψ(2−n |x|). La successione {Ψn } soddisfa le seguenti proprietà: le Ψn sono normalizzate, hanno supporto disgiunto per n 6= m, infatti supp(Ψn ) = (2−n , 2−n+1 ). Pertanto h Ψn |He | Ψm i = 0 per m 6= n e h Ψn |He | Ψn i = 2−2n h Ψ |H0 | Ψ i + 2−n h Ψ |Ve | Ψ i < 0, per n ≥ n0 , (5.13) con n0 > 0 grande abbastanza, come segue banalmente dal fatto che h Ψ |Ve | Ψ i ≤ −C < 0. Ora affermiamo che per ogni k ≥ 0 (5.14) span {Ψn0 , . . . , Ψn0 +k } ⊂ ran (EHe [−E1 , 0]) . Dall’arbitrarietà di k nella (5.14) seguirebbe poi il risultato finale. Supponiamo infatti per assurdo che la (5.14) sia falsa e mostriamo come questo generi una contraddizione: assumendo la (5.14) falsa, avremmo che deve esistere una Ψ ∈ ranEHe [0, +∞) tale che Ψ 6= 0 e Ψ= k X cj Ψj+n0 = EHe [0, +∞)Φ j=0 per una certa Φ ∈ L2 (R3 ). Ma per il teorema spettrale Z Z Z dµΨ (λ) λ = d h Φ |EHe [0, +∞)EHe (λ)EHe [0, +∞)| Φ i λ = h Ψ |He | Ψ i = σ(He ) σ(He ) ∞ dµΦ (λ) λ ≥ 0, 0 da cui segue k X |cj |2 h Ψj+n0 |He | Ψj+n0 i = 0, j=0 per la (5.13). Ma per la stessa (5.13), cj = 0 per ogni j = 0, . . . , k, e quindi Ψ = 0, il che è assurdo. Riassumendo quanto trovato fin’ora abbiamo quindi che l’assenza di spettro singolare in aggiunta all’assenza di autovalori positivi implica che σess (He ) = σac (He ) = [0, +∞). (5.15) Mentre lo spettro discreto coincide con lo spettro puntuale ed è dato da un numero infinito di autovalori negativi con molteplicità finita. Concludiamo la Sezione mostrando come E1 , l’autovalore più basso di He , si possa ricavare da una stima variazionale: Proposizione 5.6 (Energia dello stato fondamentale di He ). L’autovalore più basso di He vale me e4 E1 = inf σ(He ) = − 2 . 2~ (5.16) Osservazione 5.4. L’ottimalità della disuguaglianza che useremo nella dimostrazione della (5.16) ci permette di ricavare anche la forma di un’autofunzione relativa a E1 (si veda l’Osservazione 5.5: Ψ1,0,0 (r) = dove a = Sezione. ~2 me e2 1 −r/a e , πa3/2 (5.17) è il raggio di Bohr. Gli indici che identificano l’autofunzioni saranno introdotti nella prossima 83 Dimostrazione. Per prima cosa notiamo che l’inf dello spettro di He deve essere un autovalore perché inf σ(He ) < 0 per quanto già mostrato e nel semiasse reale negativo He ha solo autovalori di molteplicità finita. Per trovare il valore di E1 poi dimostreremo una stima dall’alto e una dal basso che coincidono. Per la stima dall’alto è sufficiente valutare h Ψ |He | Ψ i su una funzione Ψ di norma unitaria, dato che E1 è per definizione il minimo di tale quantità . Useremo come funzione di prova 1 Ψλ (x) = cλ e− 2 λ|x| , con λ > 0 parametro rispetto al quale ottimizzeremo l’energia. La costante cλ serve per garantire la normalizzazione della funzione e possiamo calcolarne il valore esplicito facilmente Z Z 4πc2λ ∞ 8πc2 −λ|x| 2 dx e = 3 1 = cλ dr r2 e−r = 3 λ , λ λ R3 0 √ da cui cλ = λ3/2 / 8π. Inoltre un rapido calcolo dà 2 2 2 Z ∞ ~ e2 ~2 λ2 e2 λ ~ λ e2 − e−λr = 4πc2λ − dr r2 − 2 = . (5.18) h Ψλ |He | Ψλ i = 4πc2λ 8me r 4me λ λ 8me 2 0 Il valore ottimale di λ lo ricaviamo minimizzando la funzione, ovvero λ= 2me e2 , ~2 4 che sostituito nella (5.18) dà la stima dall’alto E1 ≤ − m2~e e2 . Per la stima dal basso usiamo la (5.19) dimostrata nel prossimo Lemma 5.4: 2 2 ~ me e4 ~ 2 2 2 2 k∇Ψk − e k∇Ψk ≥ inf x −e x ≥− 2 . E1 = inf h Ψ |He | Ψ i ≥ inf 2~ kΨk=1 kΨk=1 2me x∈R+ 2me Lemma 5.4 (Disuguaglianza per il potenziale coulombiano). Sia Ψ ∈ H 1 (R3 ), allora Z |Ψ(x)|2 dx ≤ k∇Ψk2 kΨk2 . |x| R3 (5.19) Osservazione 5.5. La costante della disuguaglianza (5.19) è ottimale nel senso che se aggiungessimo un prefattore c < 1 al membro di destra la disuguaglianza sarebbe falsa. In effetti studiando l’equazione variazionale associata alla minimizzazione del rapporto associato alla (5.19) è facile dimostrare che l’uguaglianza è soddisfatta se e solo se Ψ(x) = Ce−c|x| con C, c > 0. Dimostrazione. Verifichiamo la disuguaglianza per Ψ ∈ C0∞ (R3 ). L’affermazione generale si otterrà poi per densità. Il punto di partenza è l’identità 3 D h E X i E 1 x 2 Ψ |x| Ψ = Ψ ∂j , |x|j Ψ , D j=1 che si verifica facilmente: X X 3 3 3 X |x|2 − x2j xj xj 2 ∂j , = ∂j = = . |x| |x| |x|2 |x| j=1 j=1 j=1 84 Si ha quindi 3 hD 3 D E E D Ei X X 1 xj xj xj Ψ = − 2 Ψ |x| ∂ Ψ Ψ + Ψ |∂ Ψ ≤ 2 Ψ k∂ Ψk j |x| j j 2 |x| |x| j=1 2 j=1 ≤ 2 3 X 1/2 1/2 3 2 X xj = 2 k∇Ψk2 kΨk2 , k∂j Ψk22 |x| Ψ j=1 j=1 2 poiché 3 Z X j=1 5.3 R3 dx x2j |Ψ(x)|2 = kΨk22 . |x|2 Momento Angolare Una volta caratterizzato nel dettaglio lo spettro di He e mostrata la stabilità del sistema, per completare l’analisi dell’atomo di idrogeno resta da ricostruire gli spettri atomici di Ballmer o, più precisamente, trovare l’energia degli stati legati (autovalori negativi) di He . Questo richiederà di sfruttare la simmetria per rotazioni di He e diagonalizzare simultaneamente He e il momento angolare. Introduciamo anzitutto una nuova osservabile: il momento angolare. In meccanica classica il momento angolare di una particella libera è L = r × p. Il momento angolare in MQ sarà perciò rappresentato dall’operatore: L = (L1 , L2 , L3 ) = −i~r × ∇, (5.20) con dominio inizialmente dato dalle funzioni C0∞ (R3 ). L’operatore è chiaramente illimitato ma simmetrico. Per il momento tralasceremo la discussione della sua autoaggiunzione anche se non è difficile dimostrare che l’operatore (le sue tre componenti separamente) è in effetti autoaggiunto su C0∞ (R3 ). Ricaveremo il risultato come sottoprodotto dello studio dello spettro di L. Notiamo anzitutto una proprietà caratteristica del momento angolare: le tre componenti L1 , L2 , L3 non commutano fra di loro. Proposizione 5.7 (Regole di commutazione di Li e Lj ). Per ogni Ψ ∈ C0∞ (R3 ) [Li , Lj ] Ψ = i~ijk Lk Ψ, L2 , Li Ψ = 0, (5.21) per ogni i, j, k = 1, 2, 3. Osservazione 5.6. Poiché le diverse proiezioni di L non commutano fra di loro, non ammettono rappresentazione spettrale congiunta. Per esempio non esistono autovettori comuni a Li , Lj , Lk e, per il Teorema 3.11 vale una relazione fra le dispersioni di Li e Lj , i 6= j, simile a quella che abbiamo dimostrato per le osservabili Q e P . Al contrario L2 = L21 + L22 + L23 commuta con ogni Li singolarmente e pertanto ammette risoluzione spettrale congiunta con una componente di L. Osservazione 5.7. La prima delle (5.21) è la regola di commutazione soffisfatta dai generatori delle rotazioni in R3 . Più precisamente ogni base dell’algebra di Lie dei generatori infinitesimi del gruppo delle rotazioni SO3 soddisfa le regole di commutazione (5.21). Se ne deduce che L è proprio il generatore delle rotazioni in R3 e, se Rα è la combinazione di tre rotazioni di angoli (α1 , α2 , α3 ) = α attorno ai rispettivi assi, allora si ha che l’operatore (Uα Ψ) (x) = Ψ(R−1 α x), definisce un gruppo unitario fortemente continuo (a tre parametri) il cui generatore è L, cioè Uα = e−iα·L . Per maggiori dettagli si veda ad esempio [GP1, Capitolo 5]. (5.22) 85 Esercizio 5.2. Si ricavi la relazione di indeterminazione per le osservabili Li e Lj con i 6= j su una funzione d’onda Ψ ∈ C0∞ (R3 ). Esercizio 5.3. Si consideri la famiglia di operatori Uα = eiαL3 con dominio C0∞ (R3 ): si dimostri che Uα implementa le rotazioni attorno al terzo asse e che Uα è un gruppo a un parametro fortemente continuo. Se ne ricavi l’espressione del dominio di autoaggiunzione di L3 . Dimostrazione. La dimostrazione è sostanzialmente un esercizio di algebra. Osserviamo infatti che ogni Ψ ∈ C0∞ (R3 ) è tale che Lki Ψ ∈ C0∞ (R3 ) per ogni k. Inoltre ([Li , Lj ] Ψ) (x) = −~2 X ilm jl0 m0 {xl ∂m [xl0 ∂m0 Ψ(x)] − xl0 ∂m0 [xl ∂m Ψ(x)]} l,m,l0 ,m0 = −~2 X ilm jmm0 xl ∂m0 Ψ(x) − l,m,m0 X ilm jl0 l xl0 ∂m Ψ(x) l,m,l0 = −~2 X δi,m0 δl,j − δi,j δl,m0 xl ∂m0 Ψ(x) − l,m,m0 X ilm δm,j δi,l0 − δm,l0 δi,j jl0 l xl0 ∂m Ψ(x) l,m,l0 = −~2 (xj ∂i − xi ∂j ) Ψ(x) = iijk Lk Ψ(x). Per dimostrare la seconda identità fissiamo i = 1 senza perdita di generalità e calcoliamo 2 L , L1 Ψ = L22 + L23 , L1 = (L2 L2 L1 − L1 L2 L2 + L3 L3 L1 − L1 L3 L3 ) Ψ = (L2 L1 L2 − i~L2 L3 − L1 L2 L2 + L3 L1 L3 + i~L3 L2 − L1 L3 L3 ) Ψ = [−i~ (L2 L3 + L3 L2 ) + i~ (L3 L2 + L2 L3 )] Ψ = 0. Come già anticipato nell’Osservazione 5.6, ricordiamo che se due operatori autoaggiunti A e B commutano su un denso appartenente ad entrambi i domini e se Ψλ è un autovettore di A all’autovalore λ non degenere, allora Ψλ è anche autovettore di B. Più in generale se λ è autovalore di A degenere, allora esiste una base di Hλ = ker(A − λ) di autovettori comuni a A e B. Grazie alla (5.21) possiamo pensare di cercare degli autovettori comuni, ad esempio, di L2 e L3 . A questo scopo consideriamo quest’ultimo operatore e ricaviamone l’espressione esplicita in coordinate polari: siano (x1 , x2 , x3 ) ∈ R3 le coordinate cartesiane di un punto nello spazio, allora definiamo le coordinate polari (r, ϑ, ϕ) con r ∈ R+ , ϑ ∈ [0, π) e ϕ ∈ [0, 2π) attraverso il cambio di variabili x1 = r sin ϑ cos ϕ, (5.23) x2 = r sin ϑ sin ϕ, x3 = r cos ϑ, con trasformazione inversa p r = x21 +x22 + x23 , x 3 ϑ = arccos √ 2 2 2 , x1 +x2 +x3 ϕ = arctan x2 . x1 (5.24) Con questo cambio di coordinate rendiamo esplicito l’isomorfismo L2 (R3 ) ' L2 (R+ , r2 dr) ⊗ L2 (Ω, sin ϑdϑdϕ), (5.25) dove Ω = [0, π) × [0, 2π) rappresenta l’angolo solido o equivalentemente la sfera S 2 . In altri termini esiste un operatore unitario Upol : L2 (R3 ) −→ L2 (R+ , r2 dr) ⊗ L2 (Ω, sin ϑdϑdϕ) che implementa il cambio di 86 coordinate. Inoltre rispetto a tale isomorfismo gli operatori Li sono banali sulla prima componente dello −1 −1 spazio di Hilbert ovvero, con un piccolo abuso di notazione, si ha Upol Li Upol = 1 ⊗ Li , cioè Upol Li Upol agisce 2 + 2 come l’unità su L (R , r dr). Più precisamente abbiamo le espressioni esplicite cos ϕ −1 Upol L1 Upol = i~ − sin ϕ ∂ϑ + ∂ϕ , tan ϑ sin ϕ −1 Upol L2 Upol = i~ − cos ϕ ∂ϑ + ∂ϕ , tan ϑ −1 Upol L3 Upol = −i~ ∂ϕ ; (5.26) ~2 1 ∂ϑ (sin ϑ∂ϑ ) + L2 . (5.27) sin ϑ sin2 ϑ 3 Si noti in particolare come in nessuno dei tre operatori compare la variabile r, il che è equivalente alla −1 fattorizzazione Upol Li Upol = 1 ⊗ Li di cui abbiamo già parlato. Da qui in poi, con un altro abuso di notazione giustificato tuttavia dall’equivalenza unitaria, porremo −1 Upol L2 Upol = − −1 Li := Upol Li Upol , −1 L2 := Upol L2 Upol Esercizio 5.4. Si ricavino le espressioni (5.27). Nelle nuove varibili un dominio ragionevole (ovviamente più largo di C0∞ (R3 )) di L3 è il seguente D(L3 ) = Ψ(ϑ, ϕ) ∈ L2 (Ω, sin ϑdϑdϕ) Ψ ∈ C 1 (Ω), Ψ(ϑ, 0) = Ψ(ϑ, 2π), (∂ϕ Ψ) (ϑ, 0) = (∂ϕ Ψ) (ϑ, 2π), ∀ϑ ∈ [0, π)} . (5.28) L’operatore è ancora simmetrico su D(L3 ) ma non autoaggiunto. In effetti L3 su D(L3 ) non è chiuso. Vedremo però che L3 è essenzialmente autoaggiunto su tale dominio, in quanto ammette una base di autovettori contenuti in D(L3 ): Proposizione 5.8 (Spettro e autoaggiunzione di L3 ). L’operatore L3 definito nella (5.27) è essenzialmente autoaggiunto sulle funzioni C 1 (0, 2π) periodiche. Inoltre σ(L3 ) = σdisc (L3 ) = σpp (L3 ) = ~m m ∈ Z , (5.29) e i corrispettivi autovettori sono dati da 1 Φm (ϑ, ϕ) = √ Φ(ϑ)eimϕ . 2π (5.30) Dimostrazione. Si vede immediatamente che l’equazione agli autovalori L3 Ψ = λΨ è risolta da funzioni della forma Ψ(ϑ, ϕ) = Φ(ϑ)eiλϕ . Imponendo poi la condizione che Ψ ∈ D(L3 ) si ottiene la condizione e2πiλ = 1, e quindi λ deve essere un intero. L’autoaggiunzione segue poi banalmente dal fatto che eimϕ m∈Z è la base di Fourier in L2 (0, 2π). Per quanto detto in precedenza possiamo allora cercare una base comune di autovettori congiunti di L3 e L2 . La Proposizione 5.8 ci dice che tali autovettori comuni Φλ,m devono essere della forma 1 Φλ,m (ϑ, ϕ) = √ Φλ (ϑ)eimϕ . 2π (5.31) Per studiare lo spettro di L2 è conveniente, come per l’oscillatore armonico, introdurre gli operatori di salita e discesa L± = L1 ± iL2 , (5.32) che hanno le seguenti proprietà: 87 Proposizione 5.9 (Proprietà di L± ). Gli operatori L± definiti nella (5.32) soddisfano le seguenti identità: per ogni Ψ ∈ C0∞ (R3 ), i) L∗± Ψ = L∓ Ψ; ii) [L3 , L± ] Ψ = ±~L± Ψ; iii) L2 Ψ = L+ L− + L23 − ~L3 Ψ = L− L+ + L23 + ~L3 Ψ. Dimostrazione. Tutte e tre le identità sono conseguenze algebriche della regola di commutazione (5.21). Lasciamo perciò la dimostrazione come esercizio al lettore. Corollario 5.3 (Operatori di salita e discesa). Se Φλ,m è un autovettore congiunto normalizzato di L2 e L3 , con autovalori λ e m, e λ > ~2 (m2 ± m), allora L± Φλ,m è un autovettore congiunto di L2 e L3 agli autovalori rispettivamente λ e ~(m ± 1). Dimostrazione. Grazie alla prima delle proprietà elencate nella Proposizione 5.9 si ha L3 L± Φλ,m = (L± L3 ± ~L± ) Φλ,m = ~ (m ± 1) L± Φλ,m , per cui resta solo da verificare che L± Φλ,m non sia nullo. Ma dalla prima e dall’ultima delle proprietà abbiamo kL± Φλ,m k2 = hΦλ,m |L∓ L± Φλ,m i = λ2 − ~2 m2 ± 1 , da cui la condizione su λ. Con le informazioni fin qui ricavate possiamo caratterizzare completamente lo spettro congiunto di L2 e L3 . Proposizione 5.10 (Spettro di L2 ). Si ha σ(L2 ) = σdisc (L2 ) = σpp (L2 ) = ~2 `(` + 1) ` ∈ N ∪ {0} . (5.33) Inoltre se Y`,m (ϑ, ϕ) è un autovettore congiunto di L2 e L3 agli autovalori rispettivamente ~2 `(` + 1) e ~m, allora −` ≤ m ≤ `. Infine le autofunzioni congiunte sono esplicitamente date dalle armoniche sferiche s m+|m| 1 (2` + 1)(` − |m|)! |m| Y`,m (ϑ, ϕ) = √ (−1) 2 P` (cos ϑ)eimϕ . (5.34) 2(` + |m|)! 2π Osservazione 5.8. P Dalla Proposizione 5.10 si ricava immediatamente che la degenerazione degli autovalori di L2 è data da `m=−` = 2` + 1. In particolare l’autovalore ` = 0 (onda s) non è degenere, mentre ` = 1 (onda p) è tre volte degenere. Osservazione 5.9. Nella (5.34) compaiono i polinomi di Legendre generalizzati P`m (t), t ∈ [−1, 1], che sono definiti in termini dei polinomi di Legendre P` (t) dalla m P`m (t) = (1 − t2 ) 2 dm P` (t). dtm (5.35) I polinomi di Legendre sono invece definiti come P` (t) = 1 d` (1 − t2 )` . 2` `! dt` Per maggiori informazioni sui polinomi speciali si veda [AS, Capitolo 22]. (5.36) 88 Dimostrazione. La condizione λ > ~2 m(m ± 1) ereditata dal Corollario 5.3 si può leggere più facilmente se poniamo λ = ~2 `(` + 1) con q ` = − 12 + 12 1 + 4λ ≥ 0, ~2 poiché λ ≥ 0. In tal caso infatti si ha `(` + 1) > m(m ± 1) o equivalentemente m± 1 2 2 < `+ 1 2 , 2 da cui ricaviamo immediatamente −` ≤ m ≤ `. A questo punto ricordiamo che m ∈ Z e dimostriamo che ` ∈ N ∪ {0} per assurdo: supponiamo infatti che cosı̀ non sia, allora, fissato −` ≤ m ≤ `, deve esistere un k ∈ N tale che m + k < ` < m + k + 1, ma allora poiché per m + k la condizione è soddisfatta potremmo applicare L+ e generare un altro autostato di L2 e L3 : sia Y`,m+k l’autovettore relativo agli autovalori ~2 `(` + 1) e ~(m + k), allora L+ Y`,m+k sarebbe autovettore di L3 all’autovalore ~(m + k + 1), dato che kL+ Y`,m+k k2 = ~2 (`(` + 1) − (m + k)(m + k + 1)) > 0 ma poiché m + k + 1 > ` questo è impossibile. Prima di concludere la discussione degli operatori L2 , L3 , vediamo alcuni casi semplici di armoniche sferiche. Come già anticipato lo stato ` = 0 (onda s) è non degenere e la relativa autofunzione è 1 Y0,0 = √ , 4π cioè la funzione costante. Per ` = 1 (onda p) si hanno invece tre autofunzioni r r 3 3 Y1,0 (ϑ) = cos ϑ, Y1,±1 (ϑ, ϕ) = cos ϑe±iϕ . 4π 4π (5.37) (5.38) Diamo infine un risultato di cui ometteremo la dimostrazione: Proposizione 5.11 (Completezza delle armoniche sferiche). Le armoniche sferiche {Y`,m }`∈N∪{0},−`≤m≤` formano un s.o.n.c. in L2 (Ω, sin ϑdϑdϕ). Corollario 5.4 (Autoaggiunzione di L2 , L3 ). Gli operatori L2 e Li sono essenzialmente autoaggiunti su C0∞ (R3 ). L’operatore L3 è inoltre essenzialmente autoaggiunto anche su D(L3 ) definito nella (5.28). Dimostrazione. Il risultato per L2 e Li in L2 (R3 ) segue dall’isomorfismo (5.25), dalla completezza delle armoniche sferiche in L2 (Ω, sin ϑdϑdϕ) e infine dal fatto che si possa costruire una base di L2 (R3 ) della forma χn (r)Y`,m (ϑ, ϕ) con χn ∈ C0∞ (R+ ) (densità di C0∞ in L2 ). Analogamente la completezza delle armoniche sferiche e il fatto che Y`,m ∈ D(L3 ), per ogni `, m, implica l’essenziale autoaggiunzione di L3 su D(L3 ). 5.4 Stati Legati Una delle proprietà più rilevanti di He è l’invarianza per rotazioni. Infatti è facile verificare che 2 L , He = [Li , He ] = 0, (5.39) 89 per lo meno sul denso delle funzioni regolari a supporto compatto. In ogni caso grazie alla proprietà precedente possiamo cercare gli autovettori comuni di He , L2 e L3 : usando il cambio di variabili dalle coordinate cartesiane a quelle polari si ha −1 Upol (−∆) Upol =− 1 1 1 ∂r r 2 ∂r − 2 ∂ϑ (sin ϑ∂ϑ ) − 2 2 ∂ϕ2 , 2 r r sin ϑ r sin ϑ (5.40) dove Upol è l’unitario che realizza l’isomorfismo (5.25). Pertanto abbiamo anche che −1 Upol He Upol =− ~2 L2 e2 ∂r r 2 ∂r + − . 2 2 2me r 2me r r (5.41) Questo suggerisce che gli autovettori congiunti di He , L2 e L3 abbiano la forma RE,` (r)Y`,m (ϑ, ϕ), (5.42) con RE,` (r) soluzione del problema radiale − ~2 `(` + 1) e2 ~2 2 ∂ r ∂ R + R − RE,` = ERE,` , r r E,` E,` 2me r2 2me r2 r normalizzata in modo tale che Z ∞ (5.43) dr r2 |RE,` (r)|2 = 1. 0 2 Per risolvere l’equazione è conveniente introdurre una variabile adimensionale x = r/a con a = m~e e2 raggio di Bohr e definire Sη,` (y) = a3/2 y Re2 η/a,` (ay), (5.44) con η = aE/e2 , cosı̀ che la (5.43) diventa `(` + 1) 1 00 1 + (h` Sη,` ) (x) = − Sη,` Sη,` − Sη,` = ηSη,` , 2 2 2x x con x ∈ (0, ∞), η < 0 e Z ∞ (5.45) dx |Sη,` (x)|2 = 1. 0 Fin’ora non abbiamo detto nulla riguardo al dominio dell’operatore ma per semplicità continueremo ad assumerlo definito su C0∞ (R+ ): si noti che anche nel caso in cui il limite all’origine di RE,` sia non nullo, che è ammissibile per ` = 0, Sη,` tende in ogni caso a 0 quando x → 0. Quindi per essere maggiormente precisi dovremmo scegliere come dominio le funzioni in H02 (R+ ), cioè lo spazio delle funzioni C 1 (R+ ) che ammettono derivata seconda in senso debole quadrato sommabile e si annullano quando x → 0. Per trovare gli autovalori η usiamo ancora una volta il trucco di introdurre operatori di salita e discesa: definiamo perciò 1 `+1 1 A±,` = √ ±∂x + − . (5.46) x `+1 2 Le proprietà di A±,` sono raccolte nella prossima Proposizione, la cui dimostrazione è lasciata per esercizio. Proposizione 5.12 (Proprietà di A±,` ). Gli operatori A±,` definiti nella (5.46) soddisfano le seguenti identità: per ogni Ψ ∈ H02 (R+ ), i) A∗±,` Ψ = A∓,` Ψ; ii) [h` , A±,` ] Ψ = ±A±,` Ψ; 1 Ψ; iii) h` Ψ = A−,` A+,` − 2(`+1) 2 90 iv) h`+1 Ψ = A+,` A−,` − 1 2(`+1)2 Ψ. Corollario 5.5 (Operatori di salita e discesa). Se Sη,` è un autovettore congiunto normalizzato di h` e L2 , con autovalori η e ~2 `(` + 1), allora 1 • se η > − 2(`+1) 2 , A+,` Sη,` è autovettore di h`+1 all’autovalore η; • se η > − 2`12 e ` > 0, A−,` Sη,` è un autovettore di h`−1 all’autovalore η. Dimostrazione. Analogamente al Corollario 5.3 i risultati sono conseguenza diretta delle proprietà elencate 1 nella Proposizione 5.12. In particolare la condizione η > − 2(`+1) 2 segue dall’identità kA+,` Sη,` k2 = η + 1 , 2(` + 1)2 da cui la condizione su η. Il caso di A−,` è del tutto analogo. Abbiamo ora tutti gli ingredienti necessari a dimostrare il risultato più importante di questa Sezione: Teorema 5.2 (Stati legati di He ). Gli autovalori negativi di He sono dati da En = − me e4 , 2~2 n2 n ∈ N. (5.47) Le relative autofunzioni normalizzate sono n ∈ N, Ψn,`,m (r) = Rn,` (r)Y`,m (ϑ, ϕ), ` = 0, . . . , n − 1, dove Y`,m sono le armoniche sferiche (5.34) e s 1 (n − ` − 1)! 2r `+1 2`+1 Rn,` (r) = − Ln+` n [(n + `)!]3 n 2r n m = −`, . . . , `, n ro exp − . n (5.48) (5.49) Osservazione 5.10. Gli stati legati di He sono dunque infiniti e accumulano a 0 quando n → ∞, come avevamo già dimostrato nella Sezione precedente. Le corrispondenti autofunzioni formano un s.o.n.. Naturalmente il sistema non può essere completo in L2 (R3 ) perché c’è una parte non vuota di σ(He ) – lo spettro essenziale σess (He ) – il cui proiettore spettrale è ortogonale allo span delle (5.48). Osservazione 5.11. Lo stato legato n-esimo è degenere e la sua degenerazione è data da n−1 X (2` + 1) = n2 . (5.50) `=0 Osservazione 5.12. Nella (5.49) compaiono i polinomi di Laguerre generalizzati Ljk : il polinomio di Laguerre di ordine k ≥ 0 è definito come Lk (x) = ex dk k −x x e , dxk (5.51) con x ∈ (0, ∞), mentre quello generalizzato di indici k e 0 ≤ j ≤ k è Ljk (x) = (−1)j k! dk−j x−j ex k−j xk e−x . (k − j)! dx Per ulteriori informazioni si consulti ancora [AS, Capitolo 22]. (5.52) 91 Osservazione 5.13. L’energia dello stato legato n-esimo è indipendente da `. In generale avremmo dovuto aspettarci una dipendenza anche da ` ma il fatto che non compaia è una conseguenza delle special proprietà di simmetria dell’atomo di idrogeno (integrabilità). Osservazione 5.14. L’autofunzione relativa allo stato fondamentale E1 l’abbiamo già ricavata nella (5.17). Notiamo qui che essa coincide con l’espressione generale (5.48), ovvero Ψ1,0,0 (r) = √ r 1 e− a . 3/2 πa La probabilità di trovare l’elettrone nella corona sferica compresa fra r1 e r2 > r1 è Z r2 Z r2 4 4r2 − 2r 2 − 2r a dr r e e a. = dr P (r), P (r) = a 3 r1 a3 r1 (5.53) La densità di probabilità P (r) ha un massimo per r = a e quindi possiamo concludere che l’idea che l’elettrone orbiti a distanza a dal nucleo, su cui è fondato il modello atomico di Bohr possa essere considerata una buona approssimazione della realtà. Osservazione 5.15. Gli stati legati (5.47) riproducono perfettamente le regole empiriche di Ballmer per gli spettri atomici: le energie di assorbimento o emissione sono tutte date dalle differenze fra due livelli energetici e, quando si verifica uno dei due fenomeni di emissione o assorbimento, l’elettrone salta da un livello all’altro cosı̀ cedendo o assorbendo energia. Inoltre i livelli (5.47) coincidono con quelli ottenuti da Bohr con il suo modello empirico. Va però detto che risulta evidente dalle proprietà degli En e, in particolare, dalla degenerazione, che la regola di quantizzazione di Bohr è sbagliata: fissato il livello n-esimo il momento angolare (in effetti la terza componente del momento angolare) non è esattamente1 ~(n − 1) ma piuttosto ~m con m = −`, . . . , ` e ` = 0, . . . , n − 1. Dimostrazione. La prima parte della dimostrazione è analoga alla dimostrazione della Proposizione 5.10: poniamo anzitutto per convenienza η = − 2γ1 2 , con γ ∈ R+ , cosı̀ che le condizioni che compaiono nel Corollario 5.5 si leggono ` + 1 ≤ γ. (5.54) Se γ ∈ N non c’è altro da dimostrare ma si può far vedere che se cosı̀ non fosse si cadrebbe in contraddizione, di nuovo seguendo la stessa strategia della dimostrazione della Proposizione 5.10. Omettiamo i dettagli per brevità. Per quanto riguarda la derivazione delle autofunzioni radiali osserviamo che se ` = n − 1 l’equazione per Sn,n−1 (con un piccolo abuso di notazione chiamiamo Sn,` := Sη,` con η = − 2n1 2 ) diventa n(n − 1) 1 00 1 1 − Sn,n−1 + Sn,n−1 − Sn,n−1 = − 2 Sn,n−1 , 2 2 2x x 2n che è risolta da x Sn,n−1 (x) = cn xx e− n , con la costante cn fissata dalla normalizzazione in L2 della funzione, che dà n+ 1 2 2 cn = p . (2n)! n 1 La altre autofunzioni sono ottenute applicando ripetutamente a Sn,n−1 l’operatore di discesa A− e rinormalizzando a ogni passo lo stato ottenuto. Chiudiamo la Sezione lasciando alcuni esercizi al lettore: 1 In effetti la condizione di quantizzazione di Bohr darebbe ~n ma con n ∈ N ∪ {0}, per cui per paragonarla con quanto abbiamo trovato dobbiamo rimpiazzare n con n − 1. 92 Esercizio 5.5. Si trovi il valor medio della distanza dal nucleo nello stato Ψ1,0,0 . Si ricavi la distribuzione di probabilità radiale dell’elettrone nello stato Ψ2,1,0 (onda p). Si trovi il punto di massima probabilità e il valor medio della distanza dal nucleo. Esercizio 5.6. Si calcoli il potenziale elettrostatico generato dall’atomo di idrogeno (nucleo incluso) negli stati Ψ1,0,0 e Ψ2,0,0 . Esercizio 5.7. Si consideri in L2 (R6 ) l’Hamiltoniana dell’atomo di elio in unità naturali HHe = −∆1 − ∆2 − 2 2 1 − + . |x1 | |x2 | |x1 − x2 | Si trovi il dominio di autoaggiunzione di HHe . Si ricavino inoltre una stima dall’alto e una dal basso (non coincidenti) per inf σ(HHe ). [Suggerimento: per la stima dall’alto si usi uno stato prodotto Ψλ (x1 )Ψλ (x2 ) con Ψλ una funzione di prova analoga a quella usata nella dimostrazione della Proposizione 5.6]. Parte II Stato Fondamentale e Stati Legati 93 94 Un problema tipico in MQ è la ricerca dello stato fondamentale o stato a minima energia di un sistema quantistico. Come si intuisce già dai termini usati, tale problema ammette una naturale formulazione nell’ambito del calcolo delle variazioni: trovare lo stato a minima energia equivale a minimizzare un opportuno funzionale – l’aspettazione dell’Hamiltoniana del sistema – sulla varietà delle funzioni d’onda normalizzate. Le motivazioni fisiche che rendono il problema dello stato fondamentale cosı̀ importante in MQ sono molteplici. Ne menzioneremo due fra le più significative. La prima ragione è sostanzialmente legata alla stabilità della materia, di cui torneremo a parlare in maggiore dettaglio nell’ultima parte del corso: poiché i sistemi fisici tendono a rilasciare energia scambiandola con il mondo esterno, gli stati a bassa energia e in particolare quello fondamentale hanno una probabilità maggiore di essere osservati. In altri termini ogni sistema non perfettamente isolato dal resto dell’universo, in un tempo sufficientemente lungo, tenderà a occupare il suo stato a minima energia. In quest’ottica è chiaro come una questione fondamentale sia la limitatezza dal basso dell’energia dello stato fondamentale: se per assurdo un sistema fisico potesse raggiungere stati a energia arbitrariamente bassa, tenderebbe a rilasciare energia fino a collassare su se stesso. Da un punto di vista dinamico quindi si può anche vedere l’instabilità o l’illimitatezza dal basso dell’energia come una singolarità che impedisce alla dinamica di essere definita per tutti i tempi. A livello operatoriale si può leggere questo aspetto nella relazione fra illimitatezza dal basso e non autoaggiunzione dell’Hamiltoniana. In secondo luogo è naturalmente importante sapere quanta energia può rilasciare un sistema fisico e questo è chiaramente connesso con la più bassa energia raggiungibile dal sistema, ovvero quella dello stato fondamentale. Infatti se per assurdo esistesse un sistema fisico in natura la cui energia potesse essere resa arbitrariamente bassa, si potrebbe costruire un motore perfetto estraendo da esso energia all’infinito. Naturalmente questo non è possibile e tutti i sistemi fisici realistici sono stabili. Una volta che si sia dimostrata la stabilità del sistema è poi naturale chiedersi se l’energia più bassa possa essere in effetti raggiunta o se invece sia un punto di accumulazione dello spettro dell’Hamiltoniana. In termini variazionali questo equivale a chiedersi se l’inf del funzionale sia in effetti un minimo e sia raggiunto su una qualche funzione d’onda. Nota l’esistenza, diventa interessante discutere l’unicità e poi passare dallo stato fondamentale agli stati eccitati o stati legati, cioè gli autostati negativi dell’energia. Riassumendo, le questioni che affronteremo in questa parte del corso sono quindi • la limitatezza dal basso dell’energia dello stato fondamentale (stabilità); • l’esistenza dello stato fondamentale; • l’unicità dello stato fondamentale; • le proprietà degli stati legati. Capitolo 6 Stato Fondamentale In questa parte del corso prenderemo in considerazione sistemi quantistici descritti da Hamiltoniane della forma H = −∆ + V (x), (6.1) con x ∈ Rd . Sceglieremo perciò unità di misura naturali ~ = c = 1 e m = 1/2, per semplificare la discussione. Si noti che la dimensione dello spazio non sarà vincolata a essere 1, 2 o 3, ma potrà essere d > 3, nella prospettiva di applicare i risultati ottenuti ai sistemi a molti corpi. Inoltre assumeremo sempre implicitamente che H sia autoaggiunta ma, da un certo punto di vista, la discussione contenuta in questo Capitolo si può applicare anche a operatori simmetrici ma non autoaggiunti. Definizione 6.1 (Stato fondamentale). Dato un sistema quantistico con Hamiltoniana H, l’energia dello stato fondamentale è E0 = inf σ(H) = inf h Ψ |H| Ψ i . (6.2) Ψ∈D(H),kΨk=1 Chiameremo stato fondamentale una qualunque funzione d’onda Ψ0 normalizzata tale che E0 = h Ψ0 |H| Ψ0 i . (6.3) Per semplicità nel seguito useremo anche il funzionale dell’energia E : L2 (Rd ) → R definito come il valor medio di H sullo stato Ψ, cioè E[Ψ] = h Ψ |H| Ψ i . (6.4) Porremo inoltre E[Ψ] = T [Ψ] + V [Ψ], T [Ψ] = h Ψ |−∆| Ψ i , V [Ψ] = h Ψ |V | Ψ i , (6.5) dove T è l’energia cinetica e V l’energia potenziale del sistema. Equivalentemente si può anche scrivere Z T [Ψ] = dx |∇Ψ|2 . (6.6) Rd 6.1 Stabilità di Prima Specie La questione più rilevante che affronteremo in questo Capitolo è quella della stabilità o, equivalentemente, della limitatezza dal basso dell’energia: Definizione 6.2 (Stabilità di prima specie). Diciamo che un sistema quantistico è stabile di prima specie se E0 > −∞. 95 96 Dal punto di vista matematico è chiaro che, affinché un sistema sia stabile, è necessario che il potenziale non sia troppo negativo, o, in altri termini, che la sua parte negativa sia dominata dall’energia cinetica. Definiamo quindi la parte positiva V+ ≥ 0 e negativa V− ≥ 0 del potenziale nel modo seguente V (x) = V+ (x) − V− (x), V+ = max {V, 0} , V− = − min {V, 0} , (6.7) perché ci torneranno utili nel seguito. Tornando al problema della stabilità si potrebbe pensare che sia un falso problema, ovvero che tutte le Hamiltoniane della forma (6.1) siano stabili. Il prossimo Esempio mostra che cosı̀ non è. Esempio 6.1 (Instabilità per potenziali specifici) Si consideri l’operatore di Schrödinger −∆ − 1 |x|3 in Rd . Mostriamo che E0 = −∞. A tale scopo è sufficiente mostrare l’esistenza di una successione di Ψn (x) ∈ C0∞ (Rd ) tale che kΨn k = 1, lim E[Ψn ] = −∞. n→∞ (6.8) Prendiamo allora Ψn (x) = nd/2 Ψ(nx) con Ψ ∈ C0∞ (Rd ) e calcoliamo kΨn k = kΨk, T [Ψn ] = n2 T [Ψ], V [Ψn ] = n3 V [Ψ]. Per cui se scegliamo Ψ normalizzata tale che V [Ψ] < 0, cosa che è sempre possibile, allora la (6.8) è immediatamente verificata: E[Ψn ] = n2 T [Ψ] + n3 V [Ψ] −→ −∞. n→∞ C 1 Esercizio 6.1. Dimostrare l’instabilità nei casi in cui V (x) = − |x| α con α > 2 oppure α = 2 e C > 4 . Il risultato principale di questo Capitolo è il seguente Teorema 6.1 (Stabilità di prima specie). Sia V reale e d d ∞ d L 2 (R ) + L (R ), V− ∈ L1+ε (R2 ) + L∞ (R2 ), 1 L (R) + L∞ (R), se d ≥ 3, se d = 2, se d = 1, (6.9) allora E0 > −∞. Inoltre ∃C, D < +∞ tali che, per ogni Ψ ∈ H 1 (Rd ), T [Ψ] ≤ CE[Ψ] + DkΨk. (6.10) Osservazione 6.1. In dimensione 1 il potenziale può anche contenere un termine di misura e il risultato continua ad essere valido: se Z V [Ψ] = dµ(x) |Ψ(x)|2 , R con µ misura di Borel limitata, allora E0 > −∞. Naturalmente si possono aggiungere anche altri termini della forma L1 + L∞ . Un esempio particolarmente significativo è quello della delta di Dirac δ(x), cioè la misura concentrata in x = 0. Osservazione 6.2. Dalla dimostrazione è facile vedere che, assumendo che V = V− , si ricava come sottoprodotto la disuguaglianza (6.11) |V [Ψ]| ≤ 21 T [Ψ] + D kΨk22 , 97 per una qualche D < +∞. L’aspetto di questa disuguaglianza ricorda da molto vicino la definizione di piccola perturbazione o piccolezza nel senso di Kato (Definizione 3.25), con la differenza che la prima è scritta per le aspettazioni degli operatori mentre la seconda vale per le norme. Nonostante questa differenza tuttavia le due condizioni sono equivalenti nel senso che entrambe garantiscono l’autoaggiunzione dell’operatore −∆ + V : nel caso della disuguaglianza (6.11) questo è precisamente il contenuto del Teorema KLMN [RS2, Teorema X.17]. Pertanto, nel caso in cui le condizioni (6.9) siano soddisfatte dall’intero potenziale V , l’Hamiltoniana non è solo limitata dal basso ma anche autoaggiunta su H 2 (Rd ). Esercizio 6.2. Riprodurre la dimostrazione in d = 1, 2. Dimostrazione. Per semplicità discuteremo esplicitamente solo il caso d = 3. Partiremo dalla ovvia stima dal basso E[Ψ] ≥ T [Ψ] − V− [Ψ]. 3 3 Osserviamo che se V− ∈ L 2 + L∞ vuol dire che possiamo scrivere V− = V1 + V2 con V1 ∈ L 2 (R3 ) e V2 ∈ L∞ (R3 ). Inoltre possiamo sempre scegliere la norma 3/2 di V1 arbitrariamente piccola: fissiamo K > 0 grande, allora decomponendo V1 (x) = V1 (x)1{|V1 |≤K} + V1 (x)1{|V1 |>K} , abbiamo che il primo termine al membro di destra è ovviamente in L∞ (R3 ) mentre il secondo tende a 0 quando K → ∞, poiché V1 1{|V |>K} ≤ K −1/2 kV1 k3/2 −→ 0. 1 3/2 1 K→∞ Infatti |V1 |1{|V1 |>K} è una funzione positiva monotona decrescente in K, il cui integrale si annulla nel limite. Quindi la funzione deve tendere a 0 quasi ovunque ma anche puntualmente per monotonia. Inoltre poiché 3/2 per ipotesi V1 è integrabile, la norma L3/2 di V1 1{|V1 |>K} deve tendere a 0 quando K → ∞. In conclusione possiamo trovare una decomposizione V− = V1 + V2 con V2 ∈ L∞ (R3 ) e kV1 k3/2 ≤ 21 S3 , con S3 la costante che compare nella disuguaglianza di Sobolev (6.13). A questo punto stimiamo via Hölder con p = 3 e q = 3/2 Z 1/3 6 V1 [Ψ] ≤ kV1 k3/2 dx |Ψ| ≤ 12 S3 kΨk26 ≤ 12 T [Ψ], R3 dove abbiamo usato la (6.13) contenuta nel prossimo Lemma 6.1. Per l’intero V− abbiamo allora V− [Ψ] = V1 [Ψ] + V2 [Ψ] ≤ 12 T [Ψ] + kV2 k∞ kΨk22 , (6.12) che combinata con la stima di partenza implica E[Ψ] ≥ 21 T [Ψ] − kV2 k∞ kΨk22 , ovvero la (6.10), ma anche il fatto che E0 = inf E[Ψ] ≥ inf kΨk=1 kΨk=1 − kV2 k∞ kΨk22 = − kV2 k∞ > −∞. Lemma 6.1 (Disuguaglianze di Sobolev ottimali). Esistono delle costanti Sd , S2,p > 0 tali che per ogni Ψ ∈ H 1 (Rd ) k∇Ψk22 ≥ Sd kΨk22d , in d ≥ 3, (6.13) in d = 2 e ∀2 ≤ p < ∞, (6.14) in d = 1. (6.15) d−2 k∇Ψk22 + kΨk22 ≥ S2,p kΨk2p , k∇Ψk22 + kΨk22 ≥ 2 kΨk2∞ , 98 Ometteremo la dimostrazione delle disuguaglianze di Sobolev per brevità, ma il lettore interessato può trovarne la discussione dettagliata, ad esempio, in [LL, Capitolo 8]. tTuttavia prima di procedere oltre, vediamo come disuguaglianze simili a quelle nell’enunciato del Lemma 6.1, ma non ottimali, si possano ottenere sfruttando le proprietà della trasfromata di Fourier. Più precisamente mostriamo come ricavare in d ≥ 3 una disuguaglianza simile alla (6.13) ma con un p leggermente peggiore. Scegliamo ad esempio p = 2(d−ε) d−2 e ε > 0 un numero arbitrariamente piccolo. Usiamo anzitutto la disuguaglianza di Hausdorff-Young (Teorema 3.7): 2 kΨk22(d−ε) ≤ C Ψ̂ 2(d−ε) . (6.16) d+2−ε d−2 Si noti che la condizione 2 ≤ 2(d−ε) d−2 ≤ ∞ necessaria per applicare Hausdorff-Young è automaticamente soddisfatta in quanto equivalente alle disuguaglianze d − 2 ≤ d ≤ ∞. d−ε e q = d+2−2ε A questo punto applichiamo Hölder al membro di destra con esponenti p = d+2−2ε 2−ε : 2 Ψ̂ 2(d−ε) = d+2−ε Z Rd 2(d−ε) dk Ψ̂(k) d+2−ε d+2−ε Z d−ε = 2 dk (k + 1) d−ε − d+2−ε Rd Z ≤C Rd h d−ε 2 i d+2−ε (k + 1)Ψ̂(k) 2 2 dk (k 2 + 1)Ψ̂(k) Z dk Rd d+2−ε d−ε ! 2−ε d−ε 1 d−ε , (k 2 + 1) 2−ε 2(d−ε) d−ε ma la funzione (k 2 + 1)− 2−ε è certamente integrabile per k finito e quando |k| → ∞ è asintotica a k − 2−ε . Considerato che la misura in d dimensioni produce un fattore k d−1 , l’integranda si comporta in R+ per k grande come k alla potenza − 2(d − ε) + d − 1 = −1 − (d − 1)ε + O(ε2 ) < −1, 2−ε per ε sufficientemente piccolo, ed è perciò integrabile su tutta la semiretta. Ne concludiamo che ∃Cε < +∞ tale che kΨk22(d−ε) ≤ Cε kΨk2H 1 (Rd ) . d−2 La disuguaglianza cosı̀ ottenuta non è della forma (6.13) a causa della presenza della norma H 1 anziché della norma L2 del gradiente di Ψ . Tuttavia è sufficiente sfruttare le proprietà di scaling delle due norme (si applichi la disuguaglianza a Ψλ (x) = λd/2 Ψ(λx)) per ottenere che il coefficiente del termine L2 può essere reso piccolo a piacere, cioè per ogni δ > 0 esiste Cε,δ < +∞ tale che kΨk22(d−ε) ≤ Cε,δ k∇Ψk22 + δ kΨk22 . d−2 6.2 Esistenza dello Stato Fondamentale Nella Sezione precedente abbiamo visto che sotto ipotesi ragionevoli sulla parte negativa del potenziale l’energia dello stato fondamentale dell’operatore di Schrödinger −∆ + V è limitata dal basso e quindi il sistema è stabile. Viene a questo punto naturale chiedersi se tale energia sia raggiunta su uno stato Ψ0 , cioè se l’inf sia in realtà un minimo ed esista quindi un minimizzatore. Premettiamo una utile Definizione 6.3 (Succesione minimizzante). Diciamo che una successione {Ψn }n∈N in L2 (Rd ) è minimizzante per E[Ψ], se kΨn k2 = 1 e lim E[Ψn ] = E0 = inf E[Ψ]. n→∞ kΨk=1 (6.17) 99 L’esistenza di una successione minimizzante è naturalmente garantita ogni volta che E0 > −∞. La questione è se tale successione possa convergere e soprattutto in quale topologia. Vediamo come si procederebbe in dimensione finita: supponiamo che la funzione E[x] (l’analogo del funzionale E[Ψ]) per x ∈ X compatto, sia continua. Allora l’inf x∈X E[x] = E0 è sicuramente limitato dal basso. Poi data una successione minimizzante, cioè tale che E[xn ] → E0 = inf x∈X E[x], che ovviamente esiste sempre, si avrebbe che xn converge per compattezza a un punto x0 ∈ X e, per continuità della funzione, E[x0 ] = limn→∞ E[xn ] = E0 , cioè x0 è un punto di minimo. Le due ipotesi cruciali per ottenere il risultato, come si vede facilmente, sono la continuità della funzione e la compattezza dello spazio. Sfortunatamente in dimensione infinita nessuna delle due tipicamente è vera. Da un lato si sarebbe portati a considerare una topologia forte che renda il funzionale continuo, ad esempio H 1 (Rd ), ma in questo si perde immediatamente la compattezza dello spazio. In effetti questa seconda richiesta è quella più problematica, perché nessuno spazio di Hilbert Lp è compatto nella norma relativa. Non solo ma nemmeno la varietà su cui si minimizza, kΨk = 1, cioè la sfera unitaria in L2 (Rd ), è compatta nella norma L2 (Rd ). La soluzione di questo problema starà ovviamente nell’indebolimento della topologia considerata: vedremo infatti che la sfera unitaria in L2 (Rd ) è in effetti compatta nella topologia debole. Questo naturlemente richiederà di verificare la continuità (semicontinuità) del funzionale E[Ψ] rispetto a tale topologia. L’esistenza dello stato fondamentale Ψ0 è inoltre direttamente collegata con un’altro problema interessante, ovvero l’esistenza di una soluzione dell’equazione di Schrödinger − ∆Ψ + V Ψ = E0 Ψ, (6.18) o, in altri termini, il problema all’autovalore minimo per l’operatore −∆ + V . Il legame fra i due problemi è dato dal semplice fatto che l’equazione (6.18) è in realtà l’equazione di Eulero-Lagrange per il funzionale E[Ψ]: per convincersene è sufficiente calcolare per Φ ∈ C0∞ (Rd ) reale, assumendo che esista Ψ0 , E[Ψ0 + εΦ] − E0 kΨ0 + εΦk22 ε→0 ε Z o n 1 = lim dx 2ε< (∇Ψ∗0 · ∇Φ) + ε2 |∇Φ|2 + 2ε< (V Ψ∗0 Φ) + ε2 V |Φ|2 − 2εE0 < (Ψ∗0 Φ) − ε2 E0 |Φ|2 ε→0 ε Rd Z = 2< dx Ψ∗0 {−∆Φ + V Φ − E0 Φ} . 0 = lim Rd Rimpiazzando Φ con iΦ si dimostra poi che anche che la parte immaginaria di tale quantità deve annullarsi. Quindi, se Ψ0 è lo stato fondamentale, allora deve risolvere (6.18) in senso debole, in quanto punto critico (in particolare minimo assoluto) del funzionale E[Ψ] sulla varietà kΨk = 11 . Ricordiamo infatti che se H è un operatore differenziale simmetrico, Ψ soddisfa l’equazione differenziale HΨ = 0 in senso debole se, per ogni Φ ∈ C0∞ (Rd ), vale Z dx Ψ∗ (x) (HΦ) (x) = 0. Rd A questo punto possiamo formulare il risultato principale di questo Capitolo Teorema 6.2 (Esistenza dello stato fondamentale). Sia V reale, tale che per ogni a > 0, |{x ∈ Rd | |V (x)| > a}| < +∞ e d d ∞ d se d ≥ 3, L 2 (R ) + L (R ), 1+ε 2 ∞ 2 V ∈ L (R ) + L (R ), se d = 2, 1 L (R) + L∞ (R), se d = 1, (6.19) allora −∞ < E0 ≤ 0 e, se E0 < 0, ∃Ψ0 ∈ H 1 (Rd ) con kΨ0 k = 1 tale che E[Ψ0 ] = E0 . Inoltre Ψ0 soddisfa l’equazione di Schrödinger (6.18) in senso debole. 1 Abbiamo implicitamente usato il teorema dei moltiplicatori di Lagrange per minimizzare sulla varietà kΨk = 1, ovvero abbiamo considerato la minimizzazione non vincolata di E[Ψ] − λkΨk, con λ ∈ R moltiplicatore di Lagrange. Nel caso del minimo assoluto si vede immediatamente che λ = E0 . 100 Osservazione 6.3. Ci si potrebbe chiedere come mai la dimostrazione non fornisca automaticamente anche l’unicità dello stato fondamentale. Il motivo sostanziale è che Ψ0 potrebbe in astratto dipendere dalla scelta della successione debolmente convergente. Osservazione 6.4. La seconda condizione su V è semplicemente la richiesta per una funzione Lp (e quindi non necessariamente continua) di tendere a 0 quando |x| → ∞. Si noti inoltre che nelle ipotesi del Teorema l’intero V deve soddisfare le (6.19), non solo la sua parte negativa. Dimostrazione. Sia {Ψn }n∈N in H 1 (Rd ) una successione minimizzante. Allora per quanto dimostrato nel Teorema 6.1 E[Ψn ] → E0 > −∞, T [Ψn ] ≤ CE[Ψn ] + D kΨn k22 , per qualche costante C, D < +∞. Ma allora dalla stima sull’energia cinetica e dalla normalizzazione di Ψn deduciamo che sup kΨn kH 1 (Rd ) < +∞, (6.20) n∈N cioè per il Teorema di Banach-Alaoglu 6.5 siamo in un compatto nella topologia debole. Quindi (si veda anche l’Osservazione 6.7) ∃ una sottosuccessione che chiameremo ancora {Ψn }n∈N con un piccolo abuso di notazione tale che w (6.21) Ψn −→ Ψ0 ∈ H 1 (Rd ). n→∞ w Ψn −→ Ψ0 n→∞ Inoltre grazie al Lemma 6.2 vale anche in L2 (Rd ). Possiamo ora applicare i Lemma 6.3 e 6.4 ottenendo E0 = lim inf E[Ψn ] ≥ E[Ψ0 ]. n→∞ (6.22) Per ottenere la prima parte dell’enunciato rimane solo da dimostrare che kΨ0 k = 1, perché come sappiamo ci può essere perdita di norma sotto limite debole (si veda la Sezione 3.1). A tale scopo osserviamo che E0 ≤ 0, come segue banalmente dal fatto che l’inf dello spettro dell’operatore di Schrödinger H = −∆ + V è minore o uguale a 0: è sufficiente valutare E[Ψ] su una successione di stati di prova che approssimano funzioni caratteristiche di insiemi compatti che si allontanano verso l’infinito e usare l’ipotesi che V si annulli all’infinito. Allora per la (6.22) E0 = lim inf E[Ψn ] ≥ E[Ψ0 ] ≥ E0 kΨ0 k22 , n→∞ dove abbiamo usato il fatto che E0 = inf E[Ψ] sulle funzioni normalizzate a 1. Ma allora poiché E0 ≤ 0, otteniamo immediatamente che kΨ0 k2 ≥ 1. D’altra parte vale in generale che sotto limite debole la norma può solo decrescere, cioè kΨ0 k2 ≤ lim inf kΨn k2 = 1, n→∞ e quindi kΨ0 k2 = 1. Per mostrare che Ψ0 soddisfa l’equazione di Schrödinger in senso debole, dobbiamo rendere rigoroso il calcolo fatto all’inizio della Sezione: sia allora Φ ∈ C0∞ (Rd ) e ε ∈ R e chiamiamo R(ε) = E[Ψ0 + εΦ] . kΨ0 + εΦk La funzione R(ε) è differenziabile in ε in un intorno di ε = 0 in quanto rapporto di due polinomi di ε di ordine 2 e finita a ε = 0. Infatti R(0) = E0 ≤ R(ε) per ogni ε ∈ R, cioè R(0) = minε R(ε) e quindi R0 (0) = 0. Resta ora solo da osservare che R0 (0) = 0 è esattamente il conto riprodotto all’inizio della Sezione, il cui unico passaggio delicato è l’integrazione per parti del termine cinetico Z Z ∗ dx ∇Ψ0 · ∇Φ = dx Ψ∗0 (−∆Φ), Rd Rd che è però garantito dal fatto che Ψ0 ∈ H 1 (Rd ) e Φ ∈ C0∞ (Rd ) (per questo secondo motivo non ci sono termini di bordo). 101 Lemma 6.2 (Convergenza debole in H 1 e L2 ). w w Sia {Ψn }n∈N una successione in L2 (Rd ) tale che Ψn −→ Ψ in H 1 (Rd ), allora Ψn −→ Ψ anche in L2 (Rd ). n→∞ n→∞ Osservazione 6.5. Quanto affermato nel Lemma 6.2 è in realtà conseguenza di un fatto molto più generale: dato uno spazio X con due norme k · k1 e k · k2 , tali che k · k1 ≤ C k · k2 , C < ∞, cioè la topologia indotta dalla norma 2 è più forte di quella della norma 1, allora la convergenza debole rispetto alla norma 2 implica w la covergenza debole rispetto alla norma 1. Ricordiamo a tale proposito che Ψn −→ Ψ in X rispetto ad una n→∞ certa norma k · k se per ogni funzionale lineare limitato F ∈ X ∗ , si ha F [Ψn ] → F [Ψ]. Naturalmente la definizione dipende dalla norma k · k perché il duale di X è norma-dipendente e, nel caso delle due norme appena citato, Xk∗ · k ⊂ Xk∗ · k , che è anche l’ingrediente principale della dimostrazione. 1 2 Dimostrazione. Abbiamo che, per ogni Φ ∈ L2 (Rd ), grazie alla convergenza debole in H 1 di Ψn , si ha Φ̂∗ (k) dk k + 1 2 = Ψ̂n (k) = k +1 Rd Z hΦ |Ψn iL2 (Rd ) 2 Z Rd dk k 2 + 1 Ξ̂(k)Ψ̂n (k) −→ hΞ |Ψ iH 1 (Rd ) n→∞ = hΦ |Ψ iL2 (Rd ) , dove abbiamo posto Ξ̂(k) = Φ̂(k)/(k 2 + 1) e osservato che, per ogni Φ ∈ L2 (Rd ), Ξ ∈ H 1 (Rd ): kΞk2H 1 (Rd ) Φ̂(k)2 = dk 2 ≤ kΦk22 . k +1 Rd Z Lemma 6.3 (Semicontinuità dal basso dell’energia cinetica). w Sia {Ψn }n∈N una successione in H 1 (Rd ) tale che Ψn −→ Ψ in L2 (Rd ), allora n→∞ k∇Ψk22 ≤ lim inf k∇Ψn k22 . (6.23) n→∞ Dimostrazione. La dimostrazione è come strategia molto simile a quella del fatto che la norma può solo diminuire sotto convergenza debole. Ricordiamo che per il Teorema di Riesz e la densità delle funzioni regolari a supporto compatto in L2 (Rd ) si ha kΨk22 = |hΦ |Ψ i| , sup (6.24) Φ∈C0∞ (Rd ),kΦk=1 e dunque 2 k∇Ψk22 = k Ψ̂2 = = sup Φ∈C0∞ (Rd ),kΦk=1 sup k Φ̂Ψ̂ = lim inf Φ̂k Ψ̂n ≤ Φ∈C0∞ (Rd ),kΦk=1 n→∞ sup lim k Φ̂Ψ̂n Φ∈C0∞ (Rd ),kΦk=1 n→∞ sup Φ∈C0∞ (Rd ),kΦk=1 kΦk2 lim sup k Ψ̂n 2 = lim inf k∇Ψn k2 , n→∞ m≥n n→∞ dove abbiamo usato nell’ordine: • la convergenza debole di Ψn in L2 per rimpiazzare Ψ con il limite della successione (si noti che k Φ̂ ∈ L2 (Rd ) per ogni Φ ∈ C0∞ (Rd )); • il fatto che kΨn ∈ L2 (Rd ), che segue da Ψn ∈ H 1 (Rd ), per poter sostituire il lim con il lim inf; • la disuguaglianza di Cauchy sulle norme e la definizione di lim inf. 102 Lemma 6.4 (Continuità dell’energia potenziale). w Sia {Ψn }n∈N una successione uniformemente limitata in H 1 (Rd ) tale che Ψn −→ Ψ in L2 (Rd ), allora, se n→∞ V soddisfa le ipotesi del Teorema 6.2, lim V [Ψn ] = V [Ψ]. (6.25) n→∞ Dimostrazione. Poniamo per δ > 0 Vδ (x) = V (x)1{x∈Rd | |V (x)|≤ 1 } , δ cosı̀ che Vδ converge a V in Ld/2 (Rd ) quando δ → 0 (si veda la dimostrazione del Teorema 6.1). Allora Z 2 dx (V − V )|Ψ | 2d kV − Vδ k d ≤ C kΨn kH 1 kV − Vδ k d −→ 0, n δ ≤ kΨn k d−2 d 2 2 δ→0 R uniformemente in n poiché kΨn kH 1 è uniformemente limitata per ipotesi. Pertanto resta da dimostrare che Z Z 2 dx Vδ (x) |Ψ(x)|2 , dx Vδ (x) |Ψn (x)| −→ n→∞ Rd Rd per un certo δ fissato. Prendiamo allora ε > 0 e definiamo o n Dε = x ∈ Rd |Vδ | > ε , cosı̀ che per ipotesi |Dε | < +∞ per ogni ε > 0. Inoltre Z dx Vδ (x) |Ψn |2 ≤ ε kΨn k22 = ε, Dεc e similmente Z 2 dx Vδ (x) |Ψ| ≤ ε kΨk22 ≤ ε, Dεc per semicontinuità della norma kΨk ≤ lim inf kΨn k = 1. Allora decomponendo l’integrale su Dε e Dεc ci basta dimostrare che Z Vδ |Ψn |2 − |Ψ|2 −→ 0, n→∞ Dε per ogni fissato δ, ε > 0, poiché i resti sono piccoli (in ε e δ) uniformemente in n. Ma d’altra parte Z 1 2 2 2 Vδ |Ψn | − |Ψ| ≤ kΨn + Ψk2 kΨn − ΨkL2 (Dε ) ≤ kΨn − ΨkL2 (Dε ) −→ 0, n→∞ δ δ Dε per quanto dimostrato nel prossimo Teorema 6.3. Concludiamo questa Sezione enunciando due risultati generali che sono stati usati nella dimostrazione del Teorema 6.2 e dei Lemma relativi. Teorema 6.3 (Teorema di Rellich-Kondrashev). w kk n→∞ n→∞ Sia {Ψn }n∈N una successione in H 1 (Rd ) tale che Ψn −→ Ψ in H 1 (Rd ), d ≥ 3 , allora Ψn −→ Ψ in L2 (K), per ogni compatto K ⊂ Rd . Osservazione 6.6. In realtà con il nome di Teorema di Rellich-Kondrashev ci si riferisce solitamente a un 2d risultato più generale che dà convergenza in norma in Lp (K) con 1 ≤ p ≤ d−2 in d ≥ 3, 1 ≤ p < ∞ in d = 2 e 1 ≤ p ≤ ∞ in d = 1. 103 Dimostrazione. Usiamo un approssimante C ∞ dell’indentità jm ? Ψn come discusso nel Lemma 6.5, dove abbiamo posto per semplicità di notazione jm := jεm con ε = 1/m, m ∈ N. Dopodiché scriviamo kΨn − ΨkL2 (K) = kΨn − jm ? Ψn + jm ? (Ψn − Ψ) + jm ? Ψ − ΨkL2 (K) ≤ kΨn − jm ? Ψn kL2 (K) + kjm ? (Ψn − Ψ)kL2 (K) + kjm ? Ψ − ΨkL2 (K) . (6.26) Dei tre termini al membro di destra della disuguaglianza precedente l’ultimo è il più facile perché il Lemma 6.5 garantisce che lim kjm ? Ψ − ΨkL2 (K) = 0. (6.27) m→∞ La stessa cosa vale per il primo termine ma non uniformemente in n ∈ N. Stessa cosa per il secondo termine: puntualmente in K Z |jm ? (Ψn − Ψ)(x)| ≤ dy jm (y) |(Ψn − Ψ) (x − y)| ≤ kjm kL2 (K) kΨn − ΨkL2 (K 0 ) −→ 0, n→∞ Rd ma non uniformemente in m. Con K 0 abbiamo indicato un qualunque compatto che contenga l’insieme {z = x − y ∈ Rd | x ∈ K, y ∈ supp(jm )}. Per il primo termine al membro di destra della (6.26) la soluzione è contenuta nel principio di uniforme limitatezza (Teorema 6.4) che ci garantisce che sup kΨn kH 1 (Rd ) < +∞. n∈N Questo è sufficiente per concludere che la convergenza del primo termine a 0 quando m → ∞ è in realtà uniforme in n ∈ N: osserviamo anzitutto che per ogni Ψ ∈ H 1 (Rd ) Z Z Z 2 2 2 1 −ik·y 2 2 2 ≤ |y|2 kΨk2 1 d , dx |Ψ(x − y) − Ψ(x)| = dk e − 1 Ψ̂(k) ≤ |y| dkk Ψ̂(k) H (R ) d/2 (2π) Rd Rd Rd cosı̀ che Z kΨn − jm ? Ψn k2 ≤ Z dx Ψn (x) − d R = Z Z dx d R 2 !1/2 dy Ψn (x − y)jm (y) d R 2 !1/2 Z dy [Ψn (x) − Ψn (x − y)] jm (y) ≤ d Z dx |Ψn (x) − Ψn (x − y)| dy Rd R 2 1/2 jm (y) Rd Z ≤ kΨn kH 1 (Rd ) dy |y| jm (y) ≤ Rd C −→ 0, (6.28) m m→∞ dove abbiamo usato la disuguaglianza triangolare per le norme ovvero Z Z dya(y)Ψ(· − y) dy |a(y)| kΨ(· − y)k . ≤ Rd Rd Per il secondo termine invece osserviamo che puntualmente Z Z jm ? (Ψn − Ψ)(x) = dy Ψn (y)jm (x − y) −→ n→∞ Rd dy Ψ(y)jm (x − y), Rd per convergenza debole in L2 (Rd ) implicata dalla convergenza H 1 (Rd ) (Lemma 6.2). Inoltre |jm ? (Ψn − Ψ)(x)| ≤ kΨn k2 kjm k2 ≤ C kjm k2 , uniformemente in n ∈ N. Quindi sfruttando la convergenza dominata e la compattezza di K, la convergenza puntuale dimostrata sopra implica che lim kjm ? (Ψn − Ψ)k = 0. n→∞ (6.29) 104 Sottolineamo però che il limite precedente non è uniforme in m. Riassumendo e mettendo insieme le (6.28), (6.27) e (6.29) si ottiene che, fissato ε > 0, esiste m̄ tale che per m ≥ m̄ sia il primo che il terzo termine in modulo sono minori o uguali a ε/3. Fissato ora m ≥ m̄, quanto dimostrato nella (6.29) garantisce che esiste n̄(m) tale che se n ≥ n̄(m) anche il secondo termine in modulo è minore o uguale a ε/3. In conclusione l’intera somma nella (6.26) è minore o uguale a ε e il risultato è dimostrato. Lemma 6.5 (Approssimante C ∞ dell’identità). Sia Ψ ∈ Lp (Rd ) e j ∈ L1 (Rd ) ∩ C0∞ (Rd ) tale che j ≥ 0 e kjk1 = 1. Se chiamiamo jε (x) = ε−d j(x/ε) allora i) jε ? Ψ −→ Ψ in norma in Lp (Rd ); ε→0 (n) ii) jε ? Ψ ∈ C ∞ (Rd ) e (jε ? Ψ)(n) = jε ? Ψ. Cenni di dimostrazione. Il risultato è sostanzialmente una conseguenza diretta della densità di C ∞ (K) in Lp (K) con K compatto qualunque in Rd . Per i dettagli della dimostrazione si veda [LL, Teorema 2.16]. Gli ultimi due teoremi che presentiamo rivestono una grande importanza in analisi funzionale. Omettiamo le dimostrazioni ma il lettore interessato può consultare [RS1, Teorema III.9] e [RS1, Teorema IV.21]. Teorema 6.4 (Principio di uniforme limitatezza). w Sia {Ψn }n∈N una successione in uno spazio normato X, k k, tale che Ψn −→ Ψ ∈ X rispetto alla norma n→∞ k k, allora sup kΨn k < +∞. (6.30) n∈N Teorema 6.5 (Teorema di Banach-Alaoglu). Sia H uno spazio di Hilbert separabile, allora {kΨk ≤ C} è un insieme compatto nella topologia debole. Osservazione 6.7. Una conseguenza immediata del Teorema di Banach-Alaoglu è che se una successione {Ψn }n∈N è tale che kΨn k ≤ C < +∞ uniformemente in n, allora ∃ una sottosuccessione Ψnj j∈N tale che w Ψnj −→ Ψ ∈ H . j→∞ Osservazione 6.8. Il Teorema di Banach-Alaoglu è in realtà un risultato molto più generale fra quelli fondanti per l’analisi funzionale moderna. Vale infatti l’analogo del Teorema 6.5 in ogni spazio di Banach, con la topologia debole sostituita da quella ∗-debole, cioè la topologia che rende continui tutti i funzionali nel duale. 6.3 Unicità dello Stato Fondamentale Come anticipato nell’Osservazione 6.3, l’esistenza dello stato fondamentale non va di pari passo con la sua unicità, cioè perché Ψ0 sia unico è necessario fare ulteriori ipotesi e, in ogni caso, per dimostrarlo servono argomenti diversi. Notiamo però che il Teorema 6.2 dà un’indicazione interessante: se l’equazione di Schrödinger (6.18) è risolta in forma debole da Ψ0 , allora anche Ψ∗0 ne è una soluzione debole, come si verifica facilmente. Pertanto questo ci suggerisce che Ψ0 possa sempre essere preso reale. Inoltre l’equazione di Schrödinger ha anche conseguenze interessanti sulla regolarità di Ψ0 che riassumiamo nel prossimo Teorema di cui non daremo dimostrazione (si veda per ulteriori dettagli [LL, Teorema 11.7]). Teorema 6.6 (Regolarità delle soluzioni dell’equazione di Schrödinger). Sia B ⊂ Rd una palla aperta e siano Ψ, V ∈ L1 (Rd ) tali che la seguente equazione differenziale sia soddisfatta in senso debole − ∆Ψ + V Ψ = 0. (6.31) Allora per ogni palla B 0 concentrica con B e di raggio strettamente minore 105 i) in d = 1, Ψ ∈ C 1 (B 0 ); ii) in d = 2, Ψ ∈ Lp (B 0 ), ∀p < +∞; iii) in d ≥ 3, Ψ ∈ Lp (B 0 ), ∀p < d d−2 ; iv) per ogni d, se V ∈ C k (B 0 ) allora Ψ ∈ C k+2 (B 0 ). Il Teorema precedente si applica su un compatto, ma è facile generalizzarlo al caso dell’intero spazio. Ad esempio se assumiamo che Ψ ∈ L2 (Rd ) e V Ψ ∈ L2 (Rd ), l’equazione di Schrödinger ci garantisce automaticamente che Ψ ∈ H 2 (Rd ). Torniamo alla questione dell’unicità e formuliamo il risultato principale della Sezione: Teorema 6.7 (Unicità dello stato fondamentale). Sia Ψ0 ∈ H 1 (Rd ) lo stato fondamentale di H normalizzato kΨ0 k2 = 1, V ∈ L1loc (Rd ) reale, V localmente limitato dall’alto e V |Ψ0 |2 ∈ L1 (Rd ), allora Ψ0 soddisfa l’equazione di Schrödinger (6.18) in senso debole. Inoltre Ψ0 può essere scelta strettamente positiva e Ψ0 è unica a meno di moltiplicazione per fattori di fase costanti. Osservazione 6.9. Si noti che il fatto che Ψ0 soddisfi la (6.18) è un nuovo risultato, perché ottenuto con ipotesi diverse da quelle del Teorema 6.2. Infatti fra le ipotesi del Teorema 6.7 vi è l’esistenza di un minimizzatore. Dimostrazione. La dimostrazione che Ψ0 è soluzione di (6.18) è identica a quella contenuta nella dimostrazione del Teorema 6.2 e la omettiamo per brevità . La disuguaglianza diamagnetica (Lemma 6.6) poi implica che E[|Ψ0 |] ≤ E[Ψ0 ] = E0 ma siccome E0 = inf E[Ψ] deve anche essere E[|Ψ0 |] = E0 , cioè |Ψ0 | è ancora un minimizzatore. Inoltre per la seconda parte del Lemma 6.6, se |Ψ0 | > 0, deve anche essere Ψ0 = λ|Ψ0 |. Supponiamo ora che esistano due stati fondamentali Ψ̃0 6= Ψ0 e E[Ψ̃0 ] = E0 , allora possiamo scegliere sia Ψ0 ≥ 0 che Ψ̃0 ≥ 0 e supporre che Ψ̃0 ⊥ Ψ0 , per linearità dello spazio degli stati fondamentali: se Ψ0 e Ψ00 sono stati fondamentali allora anche Ψ̃0 = αΨ0 + βΨ00 lo è e possiamo aggiustare α, β ∈ C in modo che kΨ̃0 k = 1 e Ψ̃0 ⊥ Ψ0 . A questo punto avremmo che per ogni palla B ⊂ Rd Z dx Ψ0 (x)Ψ̃0 (x) = 0, (6.32) B poiché l’integrando è una funzione non negativa ovunque. Ma per la disuguaglianza di Harnack (Lemma 6.7 e la successiva Osservazione 6.12) se Ψ0 e Ψ̃0 non sono identicamente nulle deve esistere un compatto K ⊂ Rd tale che Ψ0 (x) > 0 e Ψ̃0 (x) > 0 per ogni x ∈ K, e, di conseguenza Z dx Ψ0 (x)Ψ̃0 (x) > 0, K che contraddice la (6.32). Pertanto lo stato fondamentale è unico. Ma se è unico allora può essere scelto positivo e di nuovo la disuguaglianza di Harnack implica che |Ψ0 | > 0, mentre la seconda parte del Lemma 6.6 che Ψ0 = λ|Ψ0 |. I due Lemma coinvolti nella dimostrazione del Teorema 6.7 sono formulati qui di seguito. dimostrazione di entrambi si vedano rispettivamente [LL, Teorema 7.8 e Teorema 9.10]. Per la Lemma 6.6 (Disuguaglianza diamagnetica). Per ogni Ψ ∈ H 1 (Rd ) si ha |Ψ| ∈ H 1 (Rd ) e k∇|Ψ|k2 ≤ k∇Ψk2 , e, se |Ψ| > 0, l’uguaglianza è soddisfatta se e solo se Ψ = λ|Ψ|, |λ| = ±1. (6.33) 106 Osservazione 6.10. In effetti dove Ψ può essere decomposta in Ψ = |Ψ|eiΦ cioè lontano dai punti in cui Ψ si annulla, la disuguaglianza vale sostanzialmente a livello puntuale q.o.: |∇Ψ|2 = |∇|Ψ||2 + |Ψ|2 |∇Φ|2 ≥ |∇|Ψ||2 . Questo in effetti è il modo in cui il risultato è dimostrato dove |Ψ| > 0. Vicino agli zeri di Ψ invece bisogna procedere a una regolarizzazione della funzione. Osservazione 6.11. Con il nome disuguaglianza diamagnetica si indica anche un risultato più generale che sia applica in presenza di campi magnetici: sia A : Rd → Rd una funzione sufficientemente regolare (ad esempio H 1 (Rd )) che viene detta potenziale vettore e B = ∇ × A il relativo campo magnetico, allora l’energia cinetica in presenza di tale campo deve essere modificata e diventa Z dx |(∇ − iA) Ψ|2 . (6.34) Rd La disuguaglianza diamagnetica generalizzata afferma che se la quantità di sopra è finita, allora |Ψ| ∈ H 1 (Rd ) e k∇|Ψ|k2 ≤ k(∇ − iA) Ψk2 . (6.35) Lemma 6.7 (Disuguaglianza di Harnack). Sia Ω ⊂ Rd connesso e aperto e V misurabile limitato dall’alto in Ω. Sia Ψ ≥ 0 in L1loc (Ω) tale che V Ψ ∈ L1loc (Ω) e − ∆Ψ + V Ψ ≥ 0, (6.36) in senso debole2 . Allora esiste una funzione Ψ̃ semicontinua inferiormente tale che Ψ = Ψ̃ q.o. e, per ogni K compatto contenuto in Ω, ∃C(K) > 0 tale che Z Ψ̃(x) ≥ C dy Ψ(y), (6.37) K per ogni x ∈ K. Osservazione 6.12. Una conseguenza banale ma sostanziale per l’uso che vogliamo fare della disuguaglianza di Harnack è che se Ψ ≥ 0 non è identicamente nulla in K ⊂ Ω, allora Z Ψ̃(x) ≥ C dy Ψ(y) > 0, (6.38) K per ogni x ∈ K, cioè la funzione è strettamente positiva in K. 2 Cioè testata su funzioni di prova Φ ∈ C0∞ (Ω) non negative. Capitolo 7 Stati Eccitati Fin’ora ci siamo limitati a considerare lo stato fondamentale ma viene naturale chiedersi se le stesse proprietà valgano anche per gli altri stati legati. Per prima cosa dobbiamo specificare cosa intendiamo per stato legato o stato eccitato: solitamente uno stato legato indica uno stato nel quale la probabilità di osservare il sistema al di fuori di un compatto tende a 0 quando la taglia del compatto tende all’infinito. Nel concreto Ψ ∈ L2 (Rd ) è stato legato se Z dx |Ψ(x)|2 −→ 0. R→∞ c BR (7.1) Quando poi il termine stato legato è riferito a un operatore di Schrödinger H si intende implicitamente che esso sia anche un autostato (eventualmente generalizzato) di H. Chiaramente la proprietà precedente vale per ogni autofunzione di H normalizzata in L2 (Rd ). Per capire la differenza discutiamo brevemente il caso opposto, cioè gli stati di scattering per cui la proprietà (7.1) è falsa: ogni quasi-autostato relativo a punti dello spettro essenziale di H è infatti di questo tipo. Si pensi ad esempio allo spettro dell’operatore impulso su L2 (R): lo spettro è l’intera retta reale ed è completamente continuo; i suoi quasi-autostati sono approssimanti L2 delle onde piane eikx , k ∈ R, che ovviamente non stanno in L2 e la cui norma al di fuori di qualunque compatto non decade mai, poiché il modulo della funzione stessa è costante. Quindi riassumendo identificheremo gli stati legati con autostati di H a energia negativa. Quest’ultima proprietà è conseguenza del fatto che tipicamente lo spettro essenziale di H copre il semiasse positivo e non sono presenti autovalori positivi (come abbiamo visto ad esempio per l’atomo di idrogeno). Esistono naturalmente delle eccezioni ma questo è sostanzialmente il caso che vogliamo prendere in considerazione. Più precisamente consideriamo un’Hamiltoniana H della forma H = −∆ + V (7.2) con V (x) ∈ L1loc (Rd ) che tende a 0 quando |x| → ∞ (faremo anche altre ipotesi su V successivamente). Si veda ad esempio l’enunciato del Teorema 6.2 per la formulazione corretta di tale proprietà. In ogni caso sotto queste ipotesi E0 ≤ 0 e, siccome siamo interessati a studiare ulteriori autovalori di H negativi, assumeremo che E0 < 0. (7.3) Possiamo allora definire iterativamente gli stati eccitati di H con energia negativa nel modo seguente Definizione 7.1 (Stati eccitati). Siano E0 ≤ . . . ≤ Ek−1 ≤ 0 e Ψ0 , . . . , Ψk−1 le energie e le autofunzioni dei primi k stati eccitati, allora l’energia dello stato eccitato k + 1-esimo è Ek = inf E[Ψ], Ψ∈Dk (7.4) con Dk = Ψ ∈ L2 (Rd ) | kΨk = 1, hΨ |Ψj i , j = 0, . . . , k − 1 . Se esiste Ψk ∈ Dk tale che E[Ψk ] = Ek , allora Ψk è lo stato eccitato k + 1-esimo. 107 108 Si noti che la definizione del k + 1-esimo stato eccitato richiede l’esistenza dei primi k stati eccitati. Inoltre è importante osservare che tutte le precedenti energie devono essere non positive. Come anche per lo stato fondamentale l’esistenza di Ψk è strettamente connessa con l’esistenza di una soluzione dell’equazione di Schrödinger − ∆Ψ + V Ψ = Ek Ψ. 7.1 (7.5) Proprietà degli Stati Eccitati Raccogliamo tutte le proprietà più rilevanti degli stati eccitati nel seguente Teorema 7.1 (Stati eccitati). Sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte e supponiamo che esistano k autofunzioni Ψ0 , . . . , Ψk−1 di H agli autovalori E0 ≤ E1 ≤ · · · ≤ Ek−1 < 0, allora esiste Ψk ∈ H 1 (Rd ) stato eccitato k-esimo. Inoltre Ψk può essere scelta reale e soddisfa (7.5) in senso debole. Infine Ek ha molteplicità finita. Osservazione 7.1. L’ipotesi che Ek < 0 è cruciale nella dimostrazione. Anzi si può applicare ripetutamente il precedente Teorema, ricavando progressivamente l’esistenza di stati eccitati fino a che Ek ≥ 0 per un certo k. Cenni di dimostrazione. Per quanto riguarda l’esistenza di Ψk si procede come nella dimostrazione del Teorema 6.2 con l’unica accortezza di osservare che il limite debole preserva il vincolo Ψ ⊥ Ψj , j = 0, . . . , k − 1. Si noti che la condizione Ek < 0 gioca lo stesso ruolo di E0 < 0 nella dimostrazione del Teorema 6.2. Vediamo ora come si dimostra che Ψk risolve la (7.5): considerando la variazione di E[Ψk ] data da E[Ψε ] con Ψε = Ψk + εΦ e Φ ∈ C0∞ (Rd ) ortogonale a tutte le Ψj , j = 0, . . . , k − 1, si ottiene che, in senso debole, − ∆Ψk + V Ψk − Ek Ψk = k−1 X cj Ψj . (7.6) j=0 Bisogna ora dimostrare che cj = 0 per ogni j. L’idea è sostanzialmente quella di prendere il prodotto scalare dell’equazione con Ψ∗j , ma tale funzione non è in C0∞ (Rd ). Prendiamo allora Ψj,ε data da un approssimante C ∞ di Ψj (si veda il Lemma 6.5) moltiplicata per un approssimate C ∞ della funzione caratteristica di una palla con raggio 1/ε. La funzione cosı̀ ottenuta ovviamente converge a Ψj in norma quando ε → 0 ed è in C0∞ (Rd ). Moltiplicando (7.6) per Ψ∗j,ε e integrando otteniamo k−1 X Z ci hΨj,ε |Ψi i = cj + o(1) = Rd i=0 Z = dx Rd ∇Ψ∗j,ε · ∇Ψk + V dx Ψ∗j,ε {−∆Ψk + V Ψk − Ek Ψk } Ψ∗j,ε Ψk Z + o(1) = d ZR = dx ∇Ψ∗j,ε · ∇Ψk + V Ψ∗j,ε Ψk − Ej Ψ∗j,ε Ψk + o(1) dx {−∆Ψj,ε + V Ψj,ε − Ej Ψj,ε }∗ Ψk + o(1) = o(1), Rd dove abbiamo usato ripetutamente che kΨj − Ψj,ε k = o(1). Assumiamo infine per assurdo che Ek abbia molteplicità infinita. Questo vorrebbe dire che esistono Ψk , Ψk+1 , . . . ortonormali che soddisfano la (7.5) in senso debole. Siccome per ciascuna di queste funzioni la norma H 1 è uniformemente limitata in k, possiamo estrarre una sottosuccessione {Ψkj }j∈N convergente w in senso debole per il Teorema di Banach-Alaoglu 6.5. Avremmo quindi Ψkj −→ Ψ, ma una successione di j→∞ funzioni ortonormali che converge debolmente non può che convergere a 0. Ma allora Z Z n 2 2 o 2 Ek = lim inf dx ∇Ψkj + V Ψkj = lim inf dx ∇Ψkj ≥ 0, j→∞ Rd che contraddice l’ipotesi che Ek < 0. j→∞ Rd Parte III Stabilità della Materia 109 110 Dal punto di vista fisico il problema della stabilità della materia è stato fra quelli che hanno recitato un ruolo cruciale nella nascita e sviluppo della MQ. Abbiamo infatti visto all’inizio del corso come la fisica classica non sia in grado di fornire un modello stabile di atomo o in generale di materia costituita da atomi in interazione. Per riassumere, in ambito classico, il moto dell’elettrone attorno al nucleo, cosı̀ come concepito nel modello planetario, produce irraggiamento di onde elettromagnetiche e, conseguentemente, perdita di energia cinetica dell’elettrone, che in un tempo finto cade sul nucleo. Le equazioni di evoluzione classica da quel momento in poi perdono senso e la dinamica del sistema non è globale nel tempo. In MQ il problema è risolto, dato che, come abbiamo dimostrato nel Capitolo 5, la dinamica quantistica dell’atomo di idrogeno è globale nel tempo. Tuttavia non è a questo ancora chiaro se tale proprietà si estenda a qualunque insieme di atomi, ovvero alla materia cosı̀ come la concepiamo. In MQ l’analogo del fenomeno di caduta sul centro è il collasso del sistema dovuto alla possibilità di raggiungere stati con energia arbitrariamente bassa. In altri termini la stabilità di cui stiamo parlando, che chiameremo stabilità di prima specie in analogia con quanto discusso nella Sezione 6.1, va di pari passo con la limitatezza dal basso dell’energia raggiungibile dal sistema fisico, o, dal punto di vista matematico, la limitatezza dal basso dell’energia dello stato fondamentale. Si noti che ancora nel 1915 Jeans si mostrava dubbioso sulla possibilità che ogni sistema interagente con un potenziale coulombiano genuino potesse essere stabile. Citando alla lettera da [J, p. 168]: “[...] there would be a very real difficulty in supposing that the law r12 held down to zero values of r. For the force between two charges at zero distance would be infinite; we should have charges of opposite sign continually rushing together and, when once together, no force would adequate to separate them. [...] Thus the matter in the universe would tend to shrink into nothing or to diminish indefinitely in size.”. Come vedremo, invece, anche per sistemi a molte particelle composti da più di un atomo, tale stabilità è garantita dalla MQ e, in un certo senso, il motivo fisico è sostanzialmente il principio di indeterminazione che dal punto di vista matematico prende la forma delle disuguaglianze di Sobolev, esattamente come per il Teorema 6.1. Vi è però una seconda forma di stabilità più sottile, che è tuttavia necessaria per dare conto del mondo che ci circonda. Sin dai primi anni del secolo XX infatti, con la comparsa delle prime teorie quantistiche, ci si è subito chiesti come mai la materia occupasse porzioni cosı̀ ampie di spazio o, equivalentemente, come mai all’interno di qualunque materiale il volume occupato fisicamente dagli atomi fosse una frazione minuscola dell’intero volume del corpo (si veda ad esempio la discussione dell’esperimento di Rutherford nella Sezione 1.3). Diceva al riguardo nel 1931 Ehrenfest in [E, p. 617]: “We take a piece of metal. Or a stone. When we think about it, we are astonished that this quantity of matter should occupy so large a volume. Admittedly, the molecules are packed tightly together, and likewise the atmos within each molecule. But why are the atoms themselves so big? Consider for example the Bohr model of an atom of lead. Why do so few of the 82 electrons run in the orbits close to the nucleus? The attraction of the 82 positive charges in the nucleus is so strong. Many more of the 82 electrons could be concentrated into the inner orbits, before their mutual repulsion would become too large. What prevents the atom from collapsing in this way?”. La risposta a queste domande è connessa al problema della stabilità di seconda specie, cioè al fatto che l’energia di un sistema di N particelle cariche in MQ sia proporzione al numero di particelle N stesso, e non a potenze più alte dello stesso numero N . Infatti la linearità in N dell’energia del fondamentale di N particelle comporta che il volume occupato dal sistema è anch’esso lineare in N (estensività della materia), come vedremo nel dettaglio. Il risultato principale che dimostreremo in quest’ultima parte del corso è proprio che un sistema di N cariche negative (elettroni) con M nuclei di carica positiva Zi e, i = 1, . . . , M è stabile di seconda specie. Riguardo al motivo fisico la risposta sta in quello che è noto come principio di esclusione di Pauli, ovvero nelle proprietà speciali dei sistemi di particelle identiche in MQ. Come vedremo lo spin delle particelle determina la loro natura nel senso che particelle identiche quantistiche possono essere di due tipi: bosoni (nel caso di spin intero) e fermioni (nel caso di spin semi-intero). Questi ultimi soddisfano il principio di esclusione di Pauli, che, a grandi linee, impedisce a due fermioni identici (come gli elettroni) di occupare lo stesso stato quantistico a una particella. A livello atomico perciò ci può essere al più un elettrone per orbita ammessa e cosı̀ si spiega il numero relativamente piccolo di elettroni nelle orbite interne. Tornando 111 a Ehrenfest in [E, p. 617] si rispondeva1 : “Answer: only the Pauli principle, ‘No two electrons in the same state.’ That is why atoms are so unnecessarily big, and why metal and stone are so bulky. You must admit, Pauli, that if you would only partially repeal your prohibition, you could relieve many of our practical worries, for example the traffic problem on our streets.”. Inoltre mostreremo come la natura fermionica degli elettroni sia non solo sufficiente ma anche necessaria per la stabilità di seconda specie: ipotizzando l’esistenza di un sistema analogo di cariche negative bosoniche interagenti con nuclei positivamente carichi, dimostreremo che la stabilità di seconda specie non vale per tale sistema e la sua energia dello stato fondamentale è proporzionale a N 5/3 . In effetti con qualche fatica in più e ammettendo che i nuclei si possano muovere è possibile dimostrare [Dy] una stima leggermente migliore. Afferma Dyson in [Dy] che senza il principio di esclusione di Pauli: “We show that not only individual atoms but matter in bulk would collapse into a condensed high-density phase. The assembly of any two macroscopic objects would release energy comparable to that of an atomic bomb. It is thus fortunate that Pauli was unwilling to comply with Ehrenfest’s well-intentioned proposal.” Nel seguito: • dimostreremo la stabilità di prima specie; • introdurremo alcune proprietà delle particelle identiche in MQ e definiremo la stabilità di seconda specie; • dimostreremo le disuguaglianze di Lieb-Thirring che riassumono in modo matematicamente sintetico il principio di esclusione di Pauli; • discuteremo brevemente alcuni risultati di elettrostatica, inclusa la disuguaglianza di Baxter; • completeremo la dimostrazione della stabilità della materia di seconda specie. 1 Queste parole erano infatti rivolte da Ehrenfest a Pauli in occasione della riconoscimento ottenuto con la medaglia Lorentz. Capitolo 8 Stabilità di Prima Specie Per prima cosa introduciamo il sistema che vogliamo studiare e l’Hamiltoniana relativa: consideremo la materia come composta da N elettroni di massa me e carica −e, interagenti fra di loro e con M nuclei di carica Zj e, con Zj ∈ N e j = 1, . . . , M . La posizione degli N elettroni nello spazio R3 sarà indicata da xi , i = 1, . . . , N , mentre indicheremo con Rj , j = 1, . . . , M , le posizioni dei nuclei. Vogliamo dunque scrivere l’energia di questo sistema di particelle interagenti in cui l’energia potenziale è generata solamente dall’interazione elettrostatica delle cariche coinvolte. Per semplificare la discussione sceglieremo delle unità di misura opportune in cui l’Hamiltoniana sia la più semplice possibile. In particolare misureremo • le lunghezze in unità di lunghezza Compton dell’elettrone λC = ~ ≈ 3.86 · 10−11 cm; me c • l’energia in unità di energia a riposo dell’elettrone me c2 ≈ 0.5MeV; • il tempo in unità di λC /(me c2 ) ≈ 1.29 · 10−19 s. √ Questa scelta sarà equivalente a porre ~ = me = c = 1 (unità naturali) e rimpiazzare la carica e con α, dove α è la costante di struttura fine e2 1 α= ≈ . (8.1) ~c 137 Una seconda semplificazione o, più precisamente, un’approssimazione che faremo è quella di considerare i nuclei fissi e trascurare la loro energia cinetica. Il semplice motivo è che ciascun nucleo ha una massa almeno Zj mp , con mp ≈ 2000me la massa del protone. Come è facile intuire il rapporto di massa è cosı̀ sbilanciato che sulle scale di energia, tempo e lunghezza che vogliamo considerare i nuclei si possono ragionevolmente considerare fermi. Va tuttavia ricordato che questa semplificazione non inficia il risultato che dimostreremo nel Capitolo 12: la presenza dell’energia cinetica dei nuclei richiederebbe infatti un adattamento della dimostrazione abbastanza semplice, ma allo stesso non darebbe origine a nuovi fenomeni. Per questo assumeremo i nuclei fermi nei punti {Rj }{j=1,...,M } che compariranno come parametri nella nostra energia. Fatte queste premesse allora dovremo scrivere un operatore che agisca sulla funzione d’onda di N elettroni in L2 (R3 ), dove trascureremo per il momento le proprietà fermioniche degli elettroni: H(N, M, R, Z) = N X − 21 ∆i + αVC (X; R, Z), (8.2) i=1 dove abbiamo indicato sinteticamente X = (x1 , . . . , xN ), R = (R1 , . . . , RM ) , Z = (Z1 , . . . , ZM ), (8.3) e il potenziale VC è dato da VC (X; R, Z) = W (X; R, Z) + I(X) + U (R, Z), 112 (8.4) 113 e W, I e U rappresentano rispettivamente le energie di interazione degli elettroni con i nuclei, degli elettroni fra di loro e dei nuclei fra di loro, cioè W (X; R, Z) = − N X M X i=1 j=1 I(X) = X 1≤i<j≤N U (R, Z) = X 1≤j<k≤M Zj ; |xi − Rj | (8.5) 1 ; |xi − xj | (8.6) Zj Zk . |Rj − Rk | (8.7) Indicheremo poi come nei Capitoli precedenti E[Ψ] = h Ψ |H| Ψ i = T [Ψ] + V [Ψ]. (8.8) La quantità che sarà al centro del nostro studio è l’energia dello stato fondamentale di H, ovvero E0,a = inf σ(H) oppure in termini variazionali1 E0,a (N, M, R, Z) = inf E[Ψ], (8.9) Ψ∈DN con DN = Ψ ∈ H 1 (R3N ) | kΨk2 = 1 . Definizione 8.1 (Stabilità di prima specie). Diciamo che la materia è stabile di prima specie se per ogni R ∈ R3M e Z ∈ RM , con Zj ≤ Z < ∞ per ogni j = 1, . . . , M , E0,a (N, M, R, Z) > −∞. (8.10) Si noti che a rigor di logica fra le possibili configurazioni dei nuclei vi è quella in cui le posizioni di 2 o più nuclei coincidono. Tale configurazione è ovviamente singolare per il potenziale coulombiano ma, grazie al fatto che il termine U (R, Z) del potenziale VC diverge a +∞ quando |Rj − Rk | → 0, tale configurazione è certamente stabile di prima specie. Perciò quando verificheremo la stabilità di prima specie della materia possiamo implicitamente assumere che Rj 6= Rk . Teorema 8.1 (Stabilità di prima specie della materia). Per ogni R ∈ R3M e Z ∈ RM , con Zj ≤ Z < ∞ per ogni j = 1, . . . , M , E0,a (N, M, R, Z) ≥ − 12 α2 Z 2 M 2 N. (8.11) Dimostrazione. Per prima cosa possiamo liberarci dell’energia potenziale di U (R, Z), il cui contributo è sicuramente positivo. Poi scriviamo H= N X hi + U (R, Z), hi = − 12 ∆i + Vi (xi ; xi+1 , . . . , xN , R, Z), (8.12) i=1 dove Vi (xi ; xi+1 , . . . , xN , R, Z) = Wi (xi ; R, Z) + Ii (xi ; xi+1 , . . . , xN ) = − M X j=1 N X αZj α + . (8.13) |xi − Rj | |xi − xj | j=i+1 Il contributo dell’energia potenziale dovuta alla repulsione fra gli elettroni è anch’esso positivo e quindi otteniamo la stima dal basso H≥ N X i=1 1 h̃i , h̃i = − 12 ∆i + Ṽi (xi ; R, Z), Ṽi (xi ; R, Z) = − M X j=1 αZj , |xi − Rj | La label a nell’energia E0,a indica che stiamo considerando lo stato fondamentale assoluto, cioè non vincolato, se si esclude la richiesta di normalizzazione in L2 (R3 ). Nel seguito considereremo altri domini di minimizzazione (più ristretti). 114 dove gli operatori h̃i sono ora della forma 1 ⊗ · · · ⊗ 1 ⊗ h̃i ⊗ 1 ⊗ · · · ⊗ 1, cioè scrivendo L2 (R3N ) = ⊗N L2 (R3 ), le altre copie di L2 (R3 ) sono lasciate invarianti. Per dimostrare la limitatezza dal basso di H ci basta allora dimostrare che ognuna delle h̃i è limitata dal basso e la stima (8.11) seguirà sommando su N la singola stima dal basso. D’altra parte possiamo applicare a h̃i direttamente il Teorema 6.1, grazie al fatto che ∈ L3/2 (R3 ) + L∞ (R3 ). (8.14) Ṽi − Per dimostrarlo osserviamo anzitutto che è sufficiente considerare un termine con j fissato alla volta; inoltre decomponendo M X = Ṽi − j=1 M X αZj = |xi − Rj | j=1 αZj αZj 1 + 1 , |xi − Rj | {|xi −Rj |≤R} |xi − Rj | {|xi −Rj |>R} si vede subito che, per ogni j = 1, . . . , M , il primo termine sta in L3/2 (R3 ) mentre il secondo è limitato da αZj /R. Per ottenere poi la (8.11) possiamo per prima cosa rimpiazzare ogni Zj con Z tale che Zj ≤ Z per ogni j = 1, . . . , M , poiché questo sicuramente abbassa l’energia. Usando poi la stima del Lemma 5.4 per ogni singolo termine di potenziale otteniamo che per ogni Φ ∈ L2 (R3 ) normalizzata D E Φ h̃i Φ ≥ 12 k∇i Φk22 − αZM k∇i Φk2 kΦk2 ≥ − 12 α2 Z 2 M 2 , da cui si ottiene immediatamente la (8.11). Osservazione 8.1. Decomponendo l’intero potenziale Vi (xi ; R, Z) come fatto per Ṽi , repulsione elettronica inclusa, si vede che Wi (xi ; R, Z) e Ii (xi ; xi+1 , . . . , xN ) appartengono entrambi a L2 (R3 ) + L∞ (R3 ), per ogni R, Z e xi+1 , . . . , xN . Possiamo allora applicare a hi il Teorema di Kato-Rellich 3.13 cosı̀ come abbiamo fatto per l’atomo di idrogeno (si veda la dimostrazione del Teorema 5.1), ottenendo che H è autoaggiunta su H 2 (R3N ). Capitolo 9 Particelle Identiche e Stabilità di Seconda Specie In questo Capitolo definiremo il concetto di stabilità di seconda specie. A tale scopo introdurremo il concetto di particelle identiche in MQ e discuteremo alcune proprietà cruciali dei sistemi di particelle identiche non interagenti, come la descrizione dello stato in termini di matrici densità ridotte e il comportamento dello stato fondamentale. 9.1 Spin e Particelle Identiche Come stiamo per vedere la richiesta che un sistema sia composto da particelle identiche ha conseguenze inaspettate in MQ. Prima però, dobbiamo introdurre un’altra caratteristica intrinseca delle particelle quantistiche. Fin qui abbiamo trattato elettroni e protoni e, in genere, ogni particella quantistica come se fossero punti materiali con i soli gradi di libertà associati al moto nello spazio R3 . Con questo assunzione siamo riusciti a costruire una teoria dell’atomo di idrogeno che riproducesse le osservazioni sperimentali sugli spettri energetici, pertanto in quell’intervallo di energie e in assenza di campi esterni forti, dobbiamo aspettarci che quelli siano gli unici gradi di libertà rilevanti. Tuttavia quando entrano in gioco campi magnetici intensi e, soprattutto, effetti relativistici legati alle velocità delle particelle prossime a quella della luce, si scopre che esistono altri gradi di libertà interni di tali particelle. Quando poi si richiede l’invarianza relativistica delle equazioni della dinamica quantistica emerge l’equazione di Dirac e con essa una nuova caratteristica dell’elettrone (cosı̀ come di ogni altra particella quantistica), lo spin. In effetti non è necessaria l’invarianza relativistica per ammettere l’esistenza di questi gradi di libertà addizionali, ma basta richiedere invarianza sotto trasformazioni di Galileo (non relativistiche), tuttavia è in ambito relativistico che lo spin diventa rilevante. Storicamente lo spin è stato ipotizzato inizialmente per dare conto della presenza di un momento magnetico anomalo negli atomi, in aggiunta al momento magnetico assciato al moto orbitale ml = µ~B S. Gli effetti di tale anomalia potevano essere spiegati supponendo che ogni particella, in particolare ogni elettrone, avesse un momento giromagnetico addizionale della forma ms = 2 µB S, ~ con µB il magnetone di Bohr e S un momento angolare intrinseco dell’elettrone, lo spin appunto. L’osservabile spin deve quindi essere un osservabile vettoriale S = (S1 , S2 , S3 ), le cui componenti devono soddisfare le regole di commutazione del momento angolare [Si , Sj ] = i~ijk Sk . (9.1) Questo implica che S è il generatore di una rappresentazione del gruppo SU2 , le cui rappresentazioni irriducibili sono 2S + 1-dimensionali, S un numero intero o semi-intero, cioè S ∈ N ∪ {0} oppure S = 2k−1 2 , k ∈ N. 115 116 Lo spazio di Hilbert dei gradi di libertà di spin è allora C2S+1 e in tale spazio una base è data dagli autovettori comuni |S, mi, m = −S, −S + 1, . . . , S, ad esempio, di S2 e S3 (si veda quanto detto nella Sezione 5.3): S2 |S, mi = ~2 S(S + 1) |S, mi , S3 |S, mi = ~m |S, mi . (9.2) Lo spazio di Hilbert complessivo di una particella quantistica di spin S è quindi H = L2 (R3 ) ⊗ C2S+1 , (9.3) e lo stato è una collezione di 2S + 1 funzioni d’onda in L2 (R3 ). Le osservabili traslazionali come posizione e impulso lasciano la componente di spin invariata, mentre, al contrario, le osservabili di spin agiscono solo su C2S+1 . Ad esempio nel caso dell’elettrone S = 12 e lo spazio di Hilbert di spin è bidimensionale. Le osservabili di spin si scrivono in termini delle matrici di Pauli e nella base { 21 , ± 12 } in cui sono diagonali S2 e S3 , si ha 1 1 1 1 ,+ = 1 , ,− = 0 , (9.4) 2 2 2 2 0 1 1 0 0 1 0 −i S3 = ~ , S1 = ~ , S2 = ~ . (9.5) 0 −1 1 0 i 0 A questo punto c’è da fare una piccola digressione sulla differenza fra spin e momento angolare per come lo abbiamo definito nella Sezione 5.3. Un modo di immaginare i gradi di libertà dello spin è infatti quello di supporre che l’elettrone cosı̀ come le altre particelle abbia una dimensione e lo spin sia il generatore delle rotazioni di tali oggetto attorno ai suoi assi. In realtà questo tipo di descrizione richiederebbe di introdurre un numero ancora maggiore di gradi di libertà: se si comportasse come un corpo rigido classico l’elettrone avrebbe bisogno di 6 (3 angoli e 3 coordinate spaziali) anziché 3 coordinate spaziale affinché la sua posizione sia identificata univocamente nello spazio. Perciò possiamo usare tale descrizione solo a livello di analogia. Notiamo però che benché S e L abbiano sostanzialemente propretà analoghe un’importante differenze emerge nella descrizione dei gradi di libertà relativi: l’autospazio relativo all’autovalore ~2 `(` + 1) di L2 ha anch’esso dimensione 2` + 1 ma ` può essere solamente intero, mentre a livello di rappresentazione anche valori semi-interi sarebbero ammissibili, come avviene per lo spin. Questa differenza si spiega studiando il comportamento degli operatori di rotazione1 generati da S e L: fissato un asse u e un angolo α, la rotazione di tale angolo attorno a u è data da Us (α) = e−iαu·S , nello spazio di spin, e da Ul (α) = e−iαu·L nello spazio dei gradi di libertà traslazionali. Ora nel caso in sui lo S sia semi-intero si vede immediatamente che Us (0) = 1 ma Us (2π) = −1 mentre Ul (0) = Ul (2π) = 1, cioè la condizione ` ∈ N è collegata alla richiesta che l’operatore di una rotazione di angolo 2π coincida con l’indentità . Questo ovviamente necessario nel caso della parte di funzione d’onda Ψ(x), che descrive i gradi di libertà traslazionali: poiché Ψ(x) è una funzione ovviamente Ψ(R(2π)x) = Ψ(x), dove R(2π) è una rotazione di angolo 2π attorno ad un asse qualunque. Tale vincolo al contrario non sussiste nello spazio di Hilbert relativo ai gradi di libertà di spin, da cui il fatto che S può essere semi-intero. Ora che abbiamo introdotto lo spin, possiamo specificare più precisamente cosa intendiamo per particelle identiche. In MQ due particelle che hanno le stesse caratteristiche fisiche, ovvero, massa, carica elettrica e, appunto, spin, si dicono identiche. Cosı̀ tutti gli elettroni – particelle con massa me , carica −e e spin 21 – sono identici fra di loro. Lo stesso vale per protoni, neutroni, etc.. Più precisamente quando parliamo di oggetti fisici identici intendiamo che non esistono esperimenti per quanto complicati che possano permettere di distinguere particelle uguali fra loro. A questo punto si inizia a intuire una differenza sostanziale con quanto avviene in meccanica classica. Anche ammesso infatti che esistano due sistemi classici perfettamente identici, è sempre possibile distinguirli a posteriori: risolvendo le equazioni del moto classiche per ciascun 1 In effetti a livello di teoria delle rappresentazione, la differenza segue dal fatto che sia S che L generano una rappresentazione del gruppo delle rotazioni SO3 ma tale gruppo non è semplicemente connesso ed ammette due ricoprimenti dati dal gruppo SU2 , che invece è semplicemente connesso, a seconda se il determinante della matrice sia 1 o −1. Allora sia S che L generano SU2 e quindi un ricoprimento semplicemente connesso di SO3 . Nel caso di L solo quello generato per continuità dall’identità è ammesso, mentre per S entrambi sono ammissibili. 117 sistema otteniamo due traiettorie univoche, assegnati i dati iniziali necessariamente distinti. Quindi se immaginassimo un esperimento in cui i due sistemi evolvono simultaneamente a partire da dati iniziali distinti, ad ogni tempo successivo potremmo distinguere con infinita precisione l’uno dall’altro semplicemente seguendo a ritroso la traiettoria percorsa (a meno di casi patologici in cui le traiettorie si sovrappongono). In MQ questa possibilità di distinzione a posteriori a partire dalla traiettoria percorsa non è semplicemente possibile e il motivo banale è che non esistono traiettorie in MQ: un sistema composto ad esempio da 2 particelle identiche avrà una funzione d’onda in Ψ(x) ∈ L2 (R6 ) che evolve secondo l’equazione di Schrödinger. Misurare una grandezza fisica relativa ad una particella equivale a agire su Ψ(x) con un operatore che coinvolge solo 3 coordinate spaziali, ma a quale oggetto queste coordinate si riferiscano non si può dire. Naturalmente si possono pensare stati prodotto Ψ(x1 , x2 ) = Ψ1 (x1 )Ψ2 (x2 ) in cui la due particelle sono distinguibili perché, ad esempio, i supporti di Ψ1 e Ψ2 sono disgiunti. Ma appena si accende l’evoluzione temporale, anche in assenza di interazione, il fenomeno di dispersione descritto nella Sezione 4.2 fa sı̀ che i supporti delle componenti tendano ad allargarsi e infine a occupare l’intero spazio, di fatto rendendo impossibile la distinzione fra i due sottosistemi. A livello matematico quanto abbiamo detto si concretizza nella richiesta che l’hamiltoniana di un sistema di N particelle identiche H sia invariante per permutazioni ovvero [H, P ] = 0, (9.6) per ogni P ∈ PN rappresentazione del gruppo delle permutazioni di N oggetti, cioè (P Ψ) (x1 , . . . , xN ) = Ψ(xπ(1) , . . . , xπ(N ) ), (9.7) con π ∈ PN permutazione di N elementi. Perciò lo spazio di Hilbert deve essere sede di una rappresentazione irriducibile del gruppo delle permutazioni, che ammette due sole rappresentazioni unidimensionali irriducibili, quella delle funzioni rispettivamente totalmente simmetriche e totalmente antisimmetriche sotto pemutazioni qualunque. Naturalmente diciamo che Ψ ∈ L2 (RdN ) è totalmente simmetrica se per ogni coppia i < j in {1, . . . , N } (Pij Ψ) (x1 , . . . , xi , . . . , xj , . . . , xN ) = Ψ(x1 , . . . , xj , . . . , xi , . . . , xN ) = Ψ(x1 , . . . , xN ), (9.8) e totalmente antisimmetrica se (Pij Ψ) (x1 , . . . , xi , . . . , xj , . . . , xN )Ψ = −Ψ(x1 , . . . , xN ). (9.9) Allora lo spazio di Hilbert L2 (R3N ) si decompone in L2 (R3N ) = L2s (R3N ) ⊕ L2a (R3N ), con ovvio significato della notazione. C’è però a questo punto da fare un commento sui gradi di libertà di spin: se teniamo conto anche dello spin, le rappresentazioni unidimensionali del gruppo delle permutazioni non sono più sufficienti ed la decomposizione dello spazio di Hilbert H è più complicata, perché oltre ai sottospazi Hs e Ha degli stati totalmente simmetrici o antisimmetrici, compaiono anche altri sottospazi sedi di rappresentazioni del gruppo delle permutazioni di dimensione maggiore di 1. Non approfondiremo ulteriormente questa discussione. Per ulteriori dettagli si veda [GP2, Capitolo 13] oppure [C-TDL2, Capitolo XIV]. Per riassumere quanto detto fin’ora formuliamo quello che possiamo considerare come un ulteriore Postulato a completamento dei 5 che abbiamo dato nel Capitolo 2, come fondamenti della teoria della MQ. Postulato 6 (Principio di simmetrizzazione). Uno stato puro di un sistema di particelle identiche deve essere totalmente simmetrico o antisimmetrico sotto scambio di due qualunque di esse. Osservazione 9.1. E’ cruciale osservare che il principio di simmetrizzazione si applica all’intera funzione d’onda, gradi di libertà di spin inclusi. Si dovrebbe perció tenere conto di rappresentazioni più complesse di quelle unidimensionali del gruppo delle permutazioni. Nel seguito però trascureremo completamente i gradi di libertà di spin, non perché non siano rilevanti in assoluto, il che è appunto falso, ma perché assumeremo 118 che non influiscano sui i vincoli di simmetria della funzione d’onda. Per meglio chiarire consideriamo il N 2 3 2 caso di un sistema di elettroni: la funzione d’onda complessiva in ⊗ L (R ) ⊗ C deve essere totalmente simmetrica o antisimmetrica sotto scambio, ma se la componente di spin è la stessa per ogni particella, la parte di spin è totalmente simmetrica, e il vincolo di simmetria si trasferisce alla parte orbitale della funzione d’onda. Assumerò perciò nel seguito che le componenti di spin di ogni elettrone siano uguali, cosı̀ che ogni altro vincolo di simmetria va a trasferirsi sulla componente in L2 (R3N ). A questo punto possiamo finalmente enunciare il risultato che mette in relazione lo spin di una particella con le proprietà di simmetria della funzione d’onda. Non forniremo la dimostrazione anche perché discende dalla richiesta di invarianza relativistica in teoria dei campi e non è riproducibile nell’ambito della MQ non relativistica: Definizione 9.1 (Bosoni e fermioni). Un particella quantistica è detta bosone/fermione se il suo spin è intero/semi-intero. Teorema 9.1 (Teorema di spin e statistica). Lo stato puro di un sistema di particelle identiche è totalmente simmetrico/antisimmetrico se le particelle sono bosoni/fermioni. Ovviamente se un sistema è composto da diverse specie di particelle identiche, li vincoli di simmetria devono essere soddisfatti rispetto allo scambio di particelle della stessa specie, mentre nessuna condizione è imposta sulla permutazione di particelle diverse. Vediamo ora in un esempio semplice quali possono essere le conseguenze del Teorema di spin e statistica: Esempio 9.1 (Sistema a due particelle) Consideriamo un sistema a due particelle e prendiamo due stati Ψ1 , Ψ2 ortonormali, cioè normalizzati e tali che Ψ1 ⊥ Ψ2 . Ci chiediamo che stato puro a due particelle identiche possiamo costruire a partire da questi due: indipendentemente dalla richiesta di simmetria vorremmo costruire uno stato che sia il più vicino possibile ad avere una particella nello stato Ψ1 e l’altra in Ψ2 . Se appunto non ci fossero vincoli di simmetria allora lo stato prodotto Ψ1 (x1 )Ψ(x2 ) farebbe esattamente al caso nostro. Ma nel caso di particelle identiche la risposta dipende in modo significativo dalle caratteristiche delle particelle: • se le particelle sono bosoni, allora cerchiamo lo stato simmetrico più vicino a quello prodotto e naturalmente esso sarà 1 √ (Ψ1 (x1 )Ψ2 (x2 ) + Ψ1 (x2 )Ψ2 (x1 )) . 2 • se le particelle sono fermioni, invece lo stato deve essere antisimmetrico e allora viene naturale considerare 1 √ (Ψ1 (x1 )Ψ2 (x2 ) − Ψ1 (x2 )Ψ2 (x1 )) . 2 Si noti che è già evidente una differenza sostanziale fra bosoni e fermioni: nel caso fermionico non è sempre possibile costruire lo stato, perché se Ψ1 = Ψ2 lo stato bosonico continuerebbe ad avere senso (a parte la normalizzazione sbagliata), mentre quello fermionico sarebbe identicamente nullo. Come suggerisce l’esempio, è interessante chiedersi come generare dato uno stato Ψ(x1 , . . . , xN ) a N particelle identiche, uno stato bosonico o fermionico. La risposta è piuttosto semplice e coinvolge i seguenti operatori: Definizione 9.2 (Simmetrizzatori). Definiamo l’operatore di simmetrizzazione SN : L2 (R3N ) → L2s (R3N ) e quello di antisimmetrizzazione AN : L2 (R3N ) → L2a (R3N ) come 1 X Ψ(xπ(1) , . . . , xπ(N ) ), (SN Ψ) (x1 , . . . , xN ) = N! π∈PN 1 X (AN Ψ) (x1 , . . . , xN ) = √ (−1)|π| Ψ(xπ(1) , . . . , xπ(N ) ), (9.10) N ! π∈P N 119 dove |π| è la parità della permutazione. Esercizio 9.1. Dimostrare che gli operatori SN e AN sono proiettori ortogonali. Quindi, in generale, assegnato Ψ ∈ L2 (R3N ), per costruire uno stato bosonico/fermionico è sufficiente applicare SN /AN . Naturalmente in questo secondo caso è possibile che non esista la versione antisimmetrizzata di Ψ, perché AN Ψ = 0. Un caso speciale di stato bosonico è quello in cui tutte le particelle sono nello stesso stato a una particella: sia ψ ∈ L2 (R3 ) una funzione d’onda normalizzata, allora uno stato bosonico fattorizzato ha la forma Ψ(x1 , . . . , xN ) = ⊗N ψ = N Y ψ(xi ). (9.11) i=1 Nel caso fermionico questo stato non è ammissibile: se proviamo a costruire uno stato fermionico a N particelle con M < N stati a una particella, non avremo mai successo. Possiamo infatti pensare di prendere ad esempio lo stato prodotto M Y ψi (xi ) · ψ1 (xM +1 ) · · · ψM −N (xN ) i=1 e poi antisimmetrizzarlo con AN . Ma dovendo ripetere almeno uno stato a singola particella nel prodotto, l’azione dell’operatore di antisimmetrizzazione darebbe identicamente 0. Se vogliamo costruire uno stato fermionico a N particelle da stati di singola particella, allora abbiamo bisogno di almeno N di tali stati: supponiamo di avere ψ1 , . . . , ψn normalizzati in L2 (R3 ), con ψi ⊥ ψj . Allora in questo caso si può effettivamente costruire lo stato fermionico AN N Y 1 ψi (xi ) = (ψ1 ∧ · · · ∧ ψN ) (x1 , . . . , xN ) = √ det {Ψi (xj )} , N! i=1 (9.12) che viene detto determinante di Slater. Esercizio 9.2. Siano ψ1 , . . . , ψn e φ1 , . . . , φN in L2 (R3 ) normalizzate con ψi ⊥ ψj per i 6= j. Si dimostri che 1. kψ1 ∧ · · · ∧ ψN k = 1; 2. hψ1 ∧ · · · ∧ ψN |φ1 ∧ · · · ∧ φN i = det hψi |φj i; P 3. se A ∈ MN (C) e ξi = j Aij ψj , allora ξ1 ∧ · · · ∧ ξN = det(A) ψ1 ∧ · · · ∧ ψN . 9.2 Matrici Densità Ridotte Fin qui abbiamo considerato soltanto stati puri di sistemi a molti corpi. In generale però , come abbiamo visto nella Sezione 3.12, lo stato di un sistema quantistico può anche essere uno stato misto e come tale rappresentato da una matrice densità Γ ∈ L 1 (L2 (R3N )). Nel caso in cui il sistema si trovi nello stato puro Ψ ∈ L2 (R3N ), Γ = ΓΨ = |Ψi hΨ| e le seguenti proprietà sono facilmente dimostrate TrΓΨ = 1, ΓΨ ≥ 0, Γ2Ψ = ΓΨ . (9.13) Proprietà simili, eccetto l’ultima, sono soddisfatte anche nel caso generico TrΓ = 1, 0 ≤ Γ ≤ 1. (9.14) Ricordiamo che, in quanto operatore di classe traccia, per ogni matrice densità vale la decomposizione Γ= ∞ X j=1 λj ΓΨj = ∞ X j=1 λj |Ψj i hΨj | , (9.15) 120 dove 0 ≤ λj ≤ 1, kernel P λj = 1 e {Ψj }j∈N è un s.o.n.c.. Inoltre Γ può anche visto come operatore integrale con Γ(X; Y) = ∞ X λj Ψ∗j (Y)Ψj (X), (9.16) j=1 dove abbiamo usato la notazione compatta X = (x1 , . . . , xN ) , Y = (y1 , . . . , yN ) . (9.17) Si noti che per ogni Γ ∈ L 1 (R3N ) vale anche la formula TrΓ = ∞ X Z dX Γ(X; X), λj = (9.18) R3N j=1 dove la seconda identità, benché vera, richiede di essere commentata: a rigor di logica Γ(X; X) non sarebbe ben definito, anche scegliendo un rappresentativo e intendendo l’identità q.o., ma perché Γ ∈ L1 (R6N ) e la varietà (X, X) ha misura nulla in L1 (R6N )! Tuttavia vi è un modo per dare significato all’espressione ovviando a questa ostruzione ed è quello di intendere Γ(X; X) = ∞ X λj |Ψj (X)|2 , j=1 che è una funzione ben definita grazie alle proprietà delle Ψj . Nella Sezione precedente abbiamo descritto la relazione fra la simmetria sotto permutazioni degli stati puri e le propriete.lle particelle identiche coinvolte. Per capire quali condizioni di simmetria si applichino agli stati misti e alle matrici densità è sufficiente fra riferimento alla (9.16): se Γ è uno stato puro o misto di un sistema di particelle identiche allora le Ψj devono soddisfare le richieste di simmetria del Teorema di spin e statistica 9.1. Perciò il kernel Γ(X; Y) deve essere separatamente simmetrico/antisimmetrico sotto scambio di i 6= j nelle X e nelle Y. Una delle conseguenze più rilevanti delle proprietà di simmetria di Γ è che si osservano proprietà di singola particella, o, più precisamente, se si fanno esperimenti che coinvolgono solo osservabili di singola particella, non è necessario usare tutta l’informazione contenuta in Γ. Similmente nel caso in cui ci si restringa a osservabili che coinvolgono k < N particelle. In effetti, data Γ, è possibile definire un operatore semplificato che contiene tutta l’informazione riguardo ai sottosistemi di k < N particelle: Definizione 9.3 (Matrici densità ridotte). Data una matrice densità normalizzata Γ ∈ L 1 (L2 (R3N )), la matrice densità ridotta γ (k) ∈ L 1 (L2 (R3k )) di ordine k ≤ N è l’operatore integrale con kernel Z N! (k) γ (x1 , . . . , xk ; y1 , . . . , yk ) = dyk+1 · · · dyN Γ(x1 , . . . , xk , yk+1 , . . . , yN ; Y), (9.19) (N − k)! R3(N −k) e indicheremo sinteticamente γ (k) = TrN −k Γ. Osservazione 9.2. La definizione del kernel (9.19) ha gli stessi problemi della (9.18), in quanto coinvolge la valutazione di Γ(X; Y) parzialmente sulla diagonale. Di nuovo per ovviare a questo problema è sufficiente pensare la (9.19) in termini della (9.16). Osservazione 9.3. Il prefattore nella (9.19) è solamente una convenzione che fa sı̀ che Trγ (k) = N! , (N − k)! (9.20) ma gioca anche un ruolo fisico: la scelta delle N −k coordinate su cui integrare nel caso di particelle identiche è ovviamente arbitrario. Lo stesso però non vale se le particelle fossero distinguibili: in questo caso per fare 121 in modo che la definizione sia ben posta, si dovrebbe sommare su tutte le possibili scelte di N − k variabili ! fra le N da cui dipende Ψ. E’ facile vedere che il numero di scelte possibili è proprio (NN−k)! . Infine si noti che nel caso k = 1, cioè per la matrice densità ridotta a una particella, la normalizzazione è Trγ (1) = N. (9.21) Osservazione 9.4. Se A è un’osservabile che coinvolge solo k < N particelle identiche, ovvero, per esempio, A = A(x1 , . . . , xk ), allora per ogni scelta delle k particelle hAi = TrL2 (R3N ) (AΓ) = TrL2 (R3k) Aγ (k) . (9.22) Esercizio P9.3. Dimostrare che nel caso fermionico la matrice densità ridotta di un determinante di Slater è γ (1) = |ψj i hψj |. L’Osservazione 9.4 è particolarmente importante per il tipo di problema che stiamo considerando: se consideriamo un’Hamiltoniana a N corpi della forma H= N X − 12 ∆j + V (xj ) + j=1 X I(xi , xj ), (9.23) 1≤i<j≤N come nel caso della (8.2), la sua aspettazione su un generico stato Γ si può esprimere totalmente in termini delle matrici densità ridotte γ (1) e γ (2) : (9.24) E[Ψ] = h Ψ |H| Ψ i = TrL2 (R3 ) hγ (1) + 21 TrL2 (R6 ) Iγ (2) , dove h = − 21 ∆ + I. Esercizio 9.4. Si derivi la (9.24). Nella ricerca dello stato fondamentale di H si sarebbe allora portati a minimizzare rispetto a γ (1) e γ (2) , ottenendo cosı̀ una sensibile semplificazione del problema. C’è però un problema per nulla banale e cioè identificare il corretto dominio di minimizzazione per le matrici densità ridotte. Più precisamente è necessario sapere quali operatori classe traccia su L2 (R3 ) e L2 (R6 ) sono matrici densità ridotte associabili a uno stato a N corpi bosonico o fermionico. Questo è quello che storicamente è stato chiamato problema della N rappresentabilità e, al contrario di quanto si possa pensare, è un problema ancora aperto, eccetto che per le matrici densità ridotte a un corpo. Vediamo prima però il risultato opposto, che caratterizza le matrici densità ridotte a un corpo bosoniche e fermioniche: Proposizione 9.1 (Poprietà delle matrici densità ridotte). Sia γ (1) = TrN −1 Γ una matrice densità ridotta associata allo stato misto Γ, allora i) γ (1) è autoaggiunta e γ ≥ 0; ii) γ (1) ∈ L 1 (L2 (R3 )) e Trγ (1) = N ; iii) se Γ è uno stato fermionico, allora γ (1) ≤ 1. Dimostrazione. Abbiamo sostanzialmente già visto le proprietà i) e ii), per cui dimostreremo esclusivamente la iii) nel caso fermionico. Introduciamo gli operatori di creazione e distruzione di una particella nello stato Φ: l’operatore di distruzione CΦ,N : L2a (R3N ) −→ L2a (R3(N −1) ) è dato da √ Z (CN,Φ Ψ) (x1 , . . . , xN −1 ) = N dx Φ∗ (x)Ψ(x1 , . . . , xN −1 , x), (9.25) R3 122 † mentre l’operatore di creazione (aggiunto di CN,Φ ) CN,Φ : L2a (R3(N −1) ) −→ L2a (R3N ) è 1 † CN,Φ Ψ (x1 , . . . , xN ) = √ AN (Ψ(x1 , . . . , xN −1 )Φ(xN )) . N (9.26) Gli operatori cosı̀ definiti soddisfano la seguente relazione, la cui dimostrazione è lasciata per esercizio al lettore: † † CN,Φ CN,Φ + CN +1,Φ CN (9.27) +1,Φ = kΦkL2 (R3 ) 1N , dove abbiamo indicato con 1N l’identità in L2 (R3N ). Supponiamo ora che lo stato fermionico in questione sia puro e commentiamo in seguito sui cambiamenti da fare nel caso di stato misto. Se Γ = ΓΨ per una certa Ψ ∈ L2 (R3N ) normalizzata, usando la (9.27) otteniamo, per ogni Φ ∈ L2 (R3 ), E Z D (1) Φ γ Φ = Z Z dx1 Φ∗ (x01 )Ψ∗ (x01 , x2 , . . . , xN )Ψ(x1 , . . . , xN )Φ(x1 ) D E † = hCN,Φ Ψ |CN,Φ Ψ iL2 (R3(N −1) ) = Ψ CN,Φ CN,Φ Ψ 2 3N L (R ) 2 D E † † = kΦk2L2 (R3 ) kΨk2L2 (R3N ) − Ψ CN,Φ CN,Φ Ψ 2 3N = kΦk2L2 (R3 ) − CN,Φ Ψ 2 3N ≤ kΦk2L2 (R3 ) . R3(N −1) dx2 · · · dxN R3 dx01 R3 L (R ) L (R ) Nel caso in cui invece Γ sia uno stato misto possiamo usare la decomposizione (9.16), cosı̀ che l’identità precedente diventa ∞ E X D (1) Φ γ Φ = λj hCN,Φ Ψj |CN,Φ Ψj iL2 (R3(N −1) ) j=1 = kΦk2L2 (R3 ) ∞ X λj kΨj k2L2 (R3N ) − j=1 ∞ X j=1 2 † λj CN,Φ Ψj 2 L (R3N ) ≤ kΦk2L2 (R3 ) . Come anticipato, vale anche il viceversa, cioè ogni operatore classe traccia su L2 (R3 ) che soddisfa le proprietà descritte nel Teorema precedente è la matrice densità ridotta a un corpo di uno stato a N corpi. Questo risolve il problema della N rappresentabilità per k = 1: si noti però la differenza fra il caso fermionico, in cui lo stato a N corpi non è necessariamente puro, e quello bosonico in Γ è puro se ci sono almeno due particelle. Teorema 9.2 (Rappresentabilità). Sia γ ∈ L 1 (L2 (R3 )) tale che γ ≥ 0 e Trγ = N , allora • ∃Γ matrice densità a N corpi bosonica, tale che γ = N TrN −1 Γ; inoltre se N ≥ 2, Γ può essere scelto uno stato puro, cioè Γ = ΓΨ per una qualche Ψ ∈ L2 (R3N ); • se in aggiunta γ ≤ 1, allora ∃Γ matrice densità a N corpi fermionica, tale che γ = N TrN −1 Γ. Osservazione 9.5. L’assenza di un analogo del teorema precedente per k ≥ 2 fa sı̀ che la riscrittura (9.24) non sia in realtà significativa al fine di minimizzare l’energia, perché resta ignoto il dominio di minimizzazione. 9.3 Sistemi a Molti Corpi Non Interagenti La discussione del problema della N rappresentabilità della Sezione precedente suggerisce che, in presenza di interazione, cioè per I 6= 0, la simmetria della funzione d’onda, benché permetta una semplificazione drastica nel calcolo dell’energia, non è in realtà di nessun aiuto nella ricerca dello stato fondamentale. Tuttavia nel 123 caso più semplice di sistemi non interagenti, cioè quando I = 0, è immediato vedere che (9.24) si riduce a un’espressione che coinvolge solo γ (1) , la matrice densità a un corpo. In questo caso, quindi, grazie al Teorema 9.2, il dominio di minimizzazione della (9.24) è noto esplicitamente, sia nel caso bosonico che in quello fermionico. Vedremo infatti che lo stato fondamentale e la relativa energia possono essere determinati esplicitamente sia nel caso bosonico che fermioni. Consideriamo allora un sistema a molti corpi con Hamiltoniana H= N X N X {−∆j + V (xj )} = j=1 h(xj ), (9.28) j=1 e studiamone lo stato fondamentale nel caso fermionico e bosonico. Assumiamo inoltre che il potenziale soddisfi le condizioni del Teorema 6.2 e che l’energia dello stato fondamentale e0 di h sia finita e strettamente negativa, cosı̀ che ne possiamo dedurre l’esistenza di M stati legati per h = −∆ + V di energia − ∞ < e0 ≤ e1 ≤ · · · ≤ 0, (9.29) con autofunzioni ortonormali ψ0 , . . . , ψM −1 . Indichiamo inoltre b/f E0 = inf Ψ∈L2s/a (R3N ),kΨk=1 h Ψ |H| Ψ i , (9.30) e sia Ψ0 un minimizzatore associato. Iniziamo dal caso bosonico: Teorema 9.3 (Stato fondamentale di N bosoni non interagenti). Sia H definita come in (9.28) e sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte. Se inoltre −∞ < e0 < 0, allora N −1 Y E0b = N e0 , Ψ0 = ψ0 (xi ). (9.31) i=0 Dimostrazione. Grazie alle ipotesi su V e e0 , abbiamo da un lato che h ≥ e0 e quindi H ≥ N e0 , ma se Ψ0 è lo stato prodotto (9.31), allora h Ψ0 |H| Ψ0 i = N e0 e quindi Ψ0 è lo stato fondamentale. Nel caso fermionico invece il comportamento è molto meno banale e può essere considerato una prima manifestazione del principio di esclusione di Pauli. Teorema 9.4 (Stato fondamentale di N fermioni non interagenti). Sia H definita come in (9.28) e sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte. Se inoltre −∞ < e0 ≤ e1 ≤ · · · ≤ eM −1 ≤ 0 sono gli stati legati di h con autofunzioni ortonormali ψ0 , . . . , ψM −1 , allora • se M ≥ N , E0f = N −1 X i=0 • se M < N , E0f = M −1 X ei e lo stato fondamentale è Ψ0 = N ^ ψi ; i=1 ei e non esiste stato fondamentale. i=0 Osservazione 9.6. Nel caso in cui M ≥ N , se tutti i livelli energetici e0 , . . . , eM sono occupati da fermioni, allora Ψ0 è anche unico, benché non sia necessariamente unico il modo di scriverlo come determinante di Slater: nel caso in cui ci sia degenerazione di uno o più dei livelli energetici, la scelta delle ψ0 , . . . , ψM non è infatti unica. Osservazione 9.7. Come si può facilmente intuire dalla dimostrazione, la non esistenza dello stato fondamentale per M < N segue dal fatto che le successioni minimizzanti non convergono in L2 (R3 ). 124 Osservazione 9.8. Il Teorema 9.4 si può pensare come una conseguenza del principio di esclusione di Pauli Nel contesto del Teorema e quindi nel caso di fermioni non interagenti, il principio di esclusione di Pauli si può formulare nel modo seguente: due fermioni identici non possono occupare lo stesso stato ψi a una particella. Il fatto che da questo discenda il comportamento dello stato fondamentale è di semplice verifica. Dimostrazione. Dimostriamo anzitutto una stima dal basso per l’energia. Sia Ψ ∈ L2a (R3N ) uno stato fermionico a N corpi, ΓΨ la matrice densità e γ (1) la matrice densità ridotta a un corpo associate a Ψ. Allora in quanto operatore di classe traccia esisteranno {φj }j∈N s.o.n.c. e dei coefficienti λj ≥ 0, tali che P λj = N e ∞ X γ (1) = λj |φj i hφj | . (9.32) j=1 L’energia di Ψ si riscrive allora E[Ψ] = N X λj h φj |h| φj i , (9.33) j=1 ma l’ortonormalità delle ψj implica che si possa scrivere φj = M X χj ∈ span {ψ0 , . . . , ψM −1 }⊥ , cj` ψ` + χj , `=0 e M −1 X 1 = kφj k22 = |cj` |2 + kχj k22 , `=0 da cui segue che M −1 X |cj` |2 ≤ 1. (9.34) `=0 Notiamo inoltre che poiché χj sta nel sottospazio ortogonale a tutti gli stati legati deve essere in Eh (0, +∞)L2 (R3 ) e quindi h χj |h| χj i ≥ 0. (9.35) L’ortogonalità degli ψj e il fatto che sono autostati implica anche che h ψj |h| ψk i = ej δjk , h χj |h| ψk i = 0. Mettendo insieme le (9.35) e (9.36) con la (9.33) otteniamo E[Ψ] ≥ ∞ X λj M −1 X j=1 dove µ` = ∞ X λj |cj` |2 ≤ j=1 |cj` |2 e` = `=0 ∞ X µ ` e` , `=0 |cj` |2 = j=1 M −1 X ∞ X |hφj |ψ` i|2 = kφ` k22 = 1, j=1 poiché {φj }j∈N è un s.o.n.c.. Inoltre M −1 X `=0 per la (9.34). µ` = ∞ X j=1 λj M −1 X `=0 |cj` |2 ≤ ∞ X j=1 λj = N, (9.36) 125 Abbiamo pertanto dimostrato che E[Ψ] ≥ inf (M −1 X M −1 X µ` e` 0 ≤ µ` ≤ 1, µ` = N `=0 ) . `=0 Il problema variazione al membro di destra può essere risolto facilmente assegnando µ` = 1 agli stati ` = 0, 1, . . ., finché o si esauriscono gli stati oppurePsono stati assegnati N coefficienti. Nel primo caso vuol −1 dire che M < N e il membro di destra è dato da M i=0 ei , mentre nel secondo M ≥ N e la somma arriva fino a N − 1. Questo conclude la dimostrazione della stima dal basso. Per completare la dimostrazione del Teorema dobbiamo dimostrare una stima dall’alto che coincida con la stima dal basso: se M ≥ N lo stato di prova è proprio lo stato fondamentale Ψ0 = N^ −1 ψi , i=0 mentre se M < N dobbiamo costruire una successione di stati della forma ψ0 ∧ · · · ∧ ψM −1 ∧ ξ1 ∧ · · · ∧ ξN −M , dove gli stati ξj devono essere scelti in modo da essere ortonormali, appartenere a Eh [0, +∞)L2 (R3 ) ed essere supportati in compatti che si allontanano verso l’infinito, con energia cinetica che tende a zero, cioè in altri termini essere quasi autostati con energia che tende a 0. Osserviamo che l’esistenza di una successione di stati con queste proprietà è abbastanza semplice da dimostrare (ometteremo però i dettagli), ma un’ipotesi cruciale è che il potenziale tenda a 0 quando |x| → ∞. Per fare un esempio concreto, prendiamo un potenziale a supporto compatto contenuto in BR0 , allora una scelta possibile è quella di prendere degli approssimanti C ∞ , opportunamente normalizzati, delle funzioni caratteristiche delle corone circolari {R ≤ |x| ≤ R + j}, dove R 1 e R > R0 . Nel limite R → ∞ si avrà che h ξj |h| ξj i → 0 e allo stesso tempo h ψj |h| ξk i = 0, cosı̀ P −1 riproducendo l’energia M i=0 ei . Esercizio 9.5. Si scriva esplicitamente la successione degli stati descritta alla fine della dimostrazione del Teorema 9.4 e si verifichi che soddisfa le proprietà richieste. 9.4 Stabilità di Seconda Specie e Proprietà Preliminari Torniamo ora all’Hamiltoniana della materia (8.2), ovvero H(N, M, R, Z) = N X − 12 ∆i + αVC (X; R, Z), i=1 dove il potenziale VC è stato definito nelle (8.4) - (8.7). Nel Capitolo 8 abbiamo studiato la stabilità di prima specie del sistema descritto da H e, a tale scopo, abbiamo trascurato i vincoli di simmetria dovuti alla presenza di particelle identiche e considerato lo stato fondamentale assoluto E0,a definito nella (8.9) (si veda anche il Teorema 8.1). Tuttavia per affrontare la questione più sottile della stabilità di seconda specie come descritta nell’introduzione a questa parte del corso, dobbiamo tener conto della simmetria della funzione d’onda. Osserviamo infatti che le particelle descritte da H sono in effetti elettroni e, come tali, sono un sistema di particelle identiche fermioniche (l’elettrone ha spin 1/2). Pertanto la funzione d’onda del sistema a N elettroni deve essere totalmente antisimmetrica. Definiamo perciò E0 (N, M, R, Z) = inf Ψ∈DN,f E[Ψ], (9.37) con DN,f = Ψ ∈ H 1 (R3N ) ∩ L2a (R3N ) | kΨk = 1 . Si noti che l’unica differenza con E0,a sta nella restrizione della minimizzazione alle funzioni antisimmetriche. Per convenienza introduciamo anche il minimo dell’energia E0 al variare della posizione dei nuclei, cioè E0 (N, M, Z) = inf R∈R3M E0 (N, M, R, Z). (9.38) 126 Possiamo ora dire con precisione cosa intendiamo con stabilità di seconda specie: Definizione 9.4 (Stabilità di seconda specie). Diciamo che il sistema descritto da H è stabile di seconda specie se, per ogni Z tale che Zj ≤ Z < +∞, ∃C(Z) < +∞ tale che E0 (N, M, Z) ≥ −C(Z)(N + M ). (9.39) Nel Capitolo 12 spiegheremo come la stabilità di seconda specie sia sufficiente per spiegare i fenomeni descritti all’inizio di questa parte del corso. Per ora formuleremo dei risultati preliminari che saranno di grande aiuto nella dimostrazione della stabilità di seconda specie, o, più in generale, daranno informazioni preziose sul comportamento dello stato fondamentale di un sistema a molti corpi interagenti. Un proprietà interessante riguarda la relazione fra E0,a , lo stato fondamentale assoluto, e lo stato fondamentale bosonico, ovvero E0,b (N, M, R, Z) = inf E[Ψ], (9.40) Ψ∈DN,b con DN,b = Ψ ∈ H 1 (R3N ) ∩ L2s (R3N ) | kΨk = 1 : Teorema 9.5 (Stato fondamentale assoluto e bosonico). Per ogni R ∈ R3M e Z ∈ RM tale che Zj ≤ Z < +∞, si ha E0,a (N, M, R, Z) = E0,b (N, M, R, Z). (9.41) Osservazione 9.9. Abbiamo enunciato il risultato relativamente all’Hamiltoniana (8.2) ma esso non dipende dal fatto che il potenziale sia quello coulombiano né che sia a due corpi. Come suggerisce il Lemma 9.1 si tratta di un fatto molto più generale. Va però detto che in presenza di campi magnetici può essere falso. Dimostrazione. La forma quadratica E[Ψ] è limitata dal basso e manifestamente invariante per permutazioni. Inoltre la disuguaglianza diamagnetica implica che E[Ψ] ≥ E[|Ψ|], per cui possiamo applicare il Lemma 9.1, che dà direttamente il risultato. Lemma 9.1 (Forme quadratiche simmetriche). Sia E[Ψ] : L2 (R3N ) → R una forma quadratica limitata dal basso, cioè tale che ∃C < +∞, E[Ψ] ≥ −C kΨk22 . Se inoltre E[Ψ] è invariante per permutazioni di particelle e E[Ψ] ≥ E[|Ψ|], allora inf E[Ψ] = kΨk=1 inf Ψ∈L2s (R3N ),kΨk=1 E[Ψ]. (9.42) Dimostrazione. Supponiamo che esista il minimizzatore Ψ0,a assoluto, cioè E0,a = E[Ψ0,a ] = inf E[Ψ]. kΨk=1 Allora possiamo assumere che sia positivo Ψ0,a ≥ 0 grazie all’ipotesi fatte su E[Ψ]. Inoltre possiamo decomporre Ψ0,a = Ψs + Ψr , dove Ψs = SN Ψ0,a = 1 X Ψ0,a (xπ(1) , . . . , xπ(N ) ) ≥ 0, N! π∈PN e kΨ0,a k22 = kΨs k22 E[Ψr , Ψs ] = + 1 (N !)2 kΨr k22 X poiché Ψs ⊥ Ψr . Il fatto che E[Ψ] sia invariante per permutazioni implica che E[Ψπ , Ψ0,a − Ψσ ] = π,σ∈PN 1 (N !)2 X E[Ψ0,a , Ψπ−1 − Ψπ−1 σ ] π,σ∈PN = 1 (N !)2 X X σ∈PN π∈PN E[Ψ0,a , Ψπ−1 ] − X π 0 ∈P N E[Ψ0,a , Ψπ0 −1 ] = 0, 127 dove abbiamo usato la notazione sintetica Ψπ (x1 , . . . , xN ) = Ψ(xπ(1) , . . . , xπ(N ) ). Quindi E0,a = E[Ψ0,a ] = E[Ψs ] + E[Ψr ]. Inoltre kΨs k22 = 1 (N !)2 X hΨπ |Ψσ i ≥ π,σ∈PN (9.43) X 1 1 kΨπ k22 = > 0, 2 (N !) N! π∈PN e quindi lo stato Ψs non è nullo. Sappiamo allora che deve valere E[Ψs ] ≥ E0,a kΨs k22 , E[Ψr ] ≥ E0,a kΨr k22 , per definizione di minimo, ma queste stime combinate con l’identità (9.43), implicano immediatamente che E[Ψs ] = E0,a kΨs k22 e quindi il minimo sulle funzioni simmetriche coincide con il minimo assoluto. L’argomento precedente si applica se esiste un minimizzatore assoluto, ma se non dovesse esistere, basterebbe applicare l’intera discussione ad una successione minimizzante. Un altro risultato preliminare sul comportamento dello stato fondamentale dell’Hamiltoniana (8.2) riguarda la dipendenza dalla carica nucleare Z: Teorema 9.6 (Monotonia nella carica nucleare). Se Zj ≤ Z < +∞ per ogni j = 1, . . . , M , allora E0 (N, M, R, Z) ≥ min E0 (N, M 0 , R0 , (Z, . . . , Z)). 0 (9.44) R ⊂R Se inoltre Zj ≤ Zj0 per ogni j = 1, . . . M , allora E0 (N, M, Z) ≥ E0 (N, M, Z0 ). (9.45) Osservazione 9.10. La prima disuguaglianza (9.44) suggerisce che il minimo venga raggiunto rimpiazzando Zj o con Z oppure con 0, cioè rimuovendo il corrispondente nucleo. Dimostrazione. L’energia E[Ψ] è una funzione lineare di Zj per ogni j, fissate le altre Zk , k 6= j. Poiché E0 (N, M, R, Z) è il minimo di una funzione lineare, esso deve essere una funzione concava di Zj : poniamo (1) (2) Zj = αZj + (1 − α)Zj per un certo α ∈ (0, 1) e indichiamo con una label la dipendenza di E[Ψ] da Zj . Allora abbiamo inf EαZ (1) +(1−α)Z (2) [Ψ] = inf αEZ (1) [Ψ] + (1 − α)EZ (2) [Ψ] kΨk=1 j j kΨk=1 j j ≥ α inf EZ (1) [Ψ] + (1 − α) inf EZ (2) [Ψ]. kΨk=1 j kΨk=1 j Si noti che invece E0 non è unitamente concavo in tutte le Zj . In ogni caso, fissate le altre Zk , k 6= j, l’energia dello stato fondamentale E0 , in quanto funzione concava di Zj , raggiunge il suo minimo in Zj ∈ [0, Z] ai bordi dell’intervallo, quindi o in Zj = 0 oppure in Zj = Z. Applicando a tutte le Zj separatamente tale argomento si ottiene la (9.44). Se ora minimizziamo rispetto alle posizioni dei nuclei abbiamo che E0 (N, M, Z) non può essere una funzione crescente stretta nell’intorno di Zj = 0: se infatti lo fosse avremmo che inf E0 (N, M, Z, R) > inf E0 N, M, Z|Zj =0 , R , R∈R3M R∈R3M ma questo è impossibile perché la configurazione con Zj = 0 è già compresa nell’inf rispetto a R, in quanto corrisponde a mandare la posizione del j-esimo nucleo all’infinito. Perciò E0 deve essere descrescente attorno a Zj = 0 per ogni j fissato. Ma allora per concavità il minimo deve essere in Zj = Z e la funzione deve essere descrescente in Zj in tutto l’intervallo [0, Z]. Capitolo 10 Disuguaglianze di Lieb-Thirring L’utilità delle disuguaglianze di Lieb-Thirring in fisica matematica non può essere sottostimata, anche grazie alle innumerevoli applicazioni nei campi più disparati. Vedremo infatti che esistono versioni differenti ma equivalenti di tale disuguaglianze: da un lato infatti si tratterà di stime relative alle proprietà spettrali, e, più specificamente, degli stati legati di operatori di Schrödinger tipicamente a una particella. Allo stesso tempo però dimostreremo un enunciato perfettamente equivalente che si applica alla stima dell’energia cinetica di un sistema a molti corpi bosonico o fermionico. In questo secondo caso, l’applicazione delle disuguaglianze di Lieb-Thirring alla stima dal basso dell’energia cinetica di N fermioni può considerarsi una formulazione matematicamente rigorosa del principio di esclusione di Pauli. La formulazione originaria e quella anche più studiata riguarda le proprietà spettrali di un operatore di Schrödinger h = −∆ + V (10.1) in L2 (Rd ). Teorema 10.1 (Disuguaglianze di Lieb-Thirring). Sia h l’operatore di Schrödinger (10.1) e supponiamo che il potenziale V soddisfi le ipotesi dei Teoremi 6.2 e 7.1. Siano allora −∞ < E0 ≤ E1 ≤ · · · ≤ 0 i suoi autovalori negativi, allora esiste una costante Lγ,d < +∞ tale che, se V− ∈ Lγ+d/2 (Rd ), Z X γ+d/2 |Ej |γ ≤ Lγ,d dx V− (x), (10.2) j≥0 dove Rd γ ≥ 12 , se d = 1; γ > 0, se d = 2; γ ≥ 0, se d ≥ 3. Osservazione 10.1. Per il valore esplicito della costante Lγ+d/2 rimandiamo ad esempio a [LSe, Teorema 4.1]. Il valore ottimale della costante è noto in alcuni casi, mentre in altri resta a tutt’oggi un problema aperto. Osservazione 10.2. Fra le somme di Riesz degli autovalori, recitano un ruolo particolarmente importante quelle per γ = 0 e γ = 1. Nel secondo caso si tratta proprio della somma del valore assoluto degli autovalori negativi di h e, come vedremo, tale stima sarà cruciale nella dimostrazione della stabilità della materia di seconda specie: il collegamento con un sistema diPN fermioni sarà fornito dal Teorema 9.4: l’energia dello stato fondamentale di N fermioni interagenti è ej e quindi può essere stimata dal basso con l’integrale della parte negativa del potenziale alla potenza 1 + d/2. Nel caso γ = 0 invece la disuguaglianza di Lieb-Thirring fornisce una stima dall’alto per il numero di autovalori negativi di h. L’importanza del risultato è tale che la stima ha una denominazione a parte – stima di Cwikel, Lieb, Rosenblum – e uno dei motivi è che la dimostrazione generica delle stime di Lieb-Thirring non si applica al caso γ = 0, per cui opportune correzioni sono richieste. 128 129 Osservazione 10.3. Sotto ipotesi deboli sul potenziale vettore A, le disuguaglianze di Lieb-Thirring rimangono valide anche in presenza di campi magnetici. Inoltre ne esiste una versione semi-relativistica in cui p l’energia cinetica classica 12 p2 è rimpiazzata dall’analogo relativistico |p| ' p2 + m2 − m2 . La dimostrazione del Teorema 10.1 sarà fornita alla fine del Capitolo. Prima enunciato una versione equivalente del Teorema 10.1, che è quella usata nella versione originale della dimostrazione della stabilità della materia. Anticipiamo che in termini sintetici tale disuguaglianza dice che l’energia cinetica di un sistema di fermioni cresce come la potenza 5/3 della densità ρΨ (x) a una particella. La disuguaglianza è in effetti banale per il sistema elementare costituito da una singola particella: via la disuguaglianza di Sobolev (Lemma 6.1) abbiamo per ogni Ψ ∈ H 1 (R3 ) normalizzata Z dx |Ψ(x)| T [Ψ] ≥ S3 6 1/3 = S3 kρΨ k3 , R3 dove abbiamo posto ρΨ = |Ψ|2 , ma usando Hölder abbiamo anche che 5/3 2/3 kρΨ k5/3 ≤ kρΨ k1 kρΨ k3 = kρΨ k3 , da cui concludiamo che Z T [Ψ] ≥ S3 R3 5/3 dx ρΨ (x). (10.3) Prima di enuciare il Teorema, ricordiamo che per un sistema a molti corpi ρΨ (x) = γ (1) (x; x), (10.4) e che pertanto la normalizzazione di ρΨ è kρΨ k1 = N. Si ricordi infine che per ogni operatore compatto autoaggiunto γ vale la decomposizione γ = e kγk∞ = kγk = sup |λj |. (10.5) P λj |Ψj i hΨj | (10.6) j∈N Teorema 10.2 (Stima dal basso per l’energia cinetica). Per ogni Ψ ∈ H 1 (RdN ) esiste K > 0 indipendente da Ψ tale che Z K 1+ 2 T [Ψ] ≥ dx ρΨ d (x). 2/d γ (1) Rd (10.7) ∞ Osservazione 10.4. La disuguaglianza vale in effetti nel caso più generale in cui 1 + 2/d sia rimpiazzato da q e 2/d da q/p, con p1 + 1q = 1. Inoltre la costante K è strettamente collegata a quella della disuguaglianza (10.2) via (pL1,d )q (qK)p = 1. (10.8) Osservazione 10.5. Abbiamo enunciato il Teorema per stati puri, ma ne esiste una versione che si applica agli stati misti e alle matrici densità. Dimostreremo fra poco l’equivalenza del Teorema 10.2 con il Teorema 10.1 (con γ = 1). Prima però discutiamo le conseguenze del Teorema 10.2 sul comportamento di un sistema di N fermioni: Corollario 10.1 (Energia cinetica di N fermioni in R3 ). Sia Ψ ∈ H 1 (R3N ) ∩ L2a (R3N ) uno stato di N fermioni, allora (con K stessa costante della (10.7)) Z 5/3 T [Ψ] ≥ K dx ρΨ (x). Rd (10.9) 130 Osservazione 10.6. Come conseguenza della (10.9) l’energia cinetica di N fermioni in una regione limitata Ω cresce come N 5/3 : applicando Hölder 3/5 Z Z dx ρΨ ≤ N= Ω dx Ω 5/3 ρΨ (x) |Ω|5/2 ≤ CΩ kρΨ k5/3 , da cui segue immediatamente che T [Ψ] ≥ KΩ N 5/3 . (10.10) Osservazione 10.7. La disuguaglianza (10.9) è stata quella che storicamente è stata usata da Lieb e Thirring nella dimostrazione della stabilità della materia di seconda specie [LT]. Come già anticipato rappresenta una possibile forma matematicamente rigorosa del principio di esclusione di Pauli, implicando una crescita più che lineare nel numero di particelle N dell’energia cinetica di N fermioni (vedi anche la prossima Osservazione 10.8. Osservazione 10.8. Nel caso bosonico (e anche in generale) γ (1) soddisfa la disuguaglianza γ (1)Q≤ N e tale valore può essere facilmente raggiunto su uno stato prodotto: prendiamo ad esempio Ψ(X) = ψ(xi ), (1) allora γΨ = N |ψi hψ| e si vede subito che kγ (1) k = N , per cui la disuguaglianza (10.9) diventa T [Ψ] ≥ K 5/3 kρΨ k5/3 , 2/3 N (10.11) e ripetendo l’argomento della Osservazione precedente si vede che l’energia cinetica di N bosoni in una regione limitata cresce linearmente con N . Questo andamento più debole del caso fermionico sarà all’origine dell’instabilità di seconda specie di N bosoni che dimostreremo nel Capitolo 12. (1) Dimostrazione. E’ sufficiente (1) usare (1)la Proposizione 9.1 che dà γ ≤ 1 nel caso fermionico, da cui segue immediatamente che γ ∞ = γ ≤ 1. Il risultato è poi conseguenza diretta della (10.2). Il fatto che l’energia cinetica di N fermioni cresca come N 5/3 si può anche vedere in un esempio banale: prendiamo N fermioni non interagenti in una scatola cubica Λ ⊂ R3 di lato 2π con condizioni al bordo Neumann. I livelli energetici accessibili per ogni singola particella sono ε(k) = 12 k2 , dove k ∈ Z3 e le autofunzioni relative ad una particella sono ψk (x) = L−3/2 exp {ik · x}, che sono poi le autofunzioni del Laplaciano su Λ con condizioni al bordo di tipo Neumann. Usando poi la ricetta del Teorema 9.4 dobbiamo sistema gli N fermioni in questi livelli energetici in modo che ogni livello sia occupato PK al più da una particella. Naturalmente i livelli sono degeneri e se k1 + k2 + k3 ≤ K il numero di stati è j=0 j(j + 1) ' K 3 , poichè fissato k1 = K − j, k2 + k3 = j e le possibili combinazioni sono j(j + 1). Pertanto se vogliamo sistemare N particelle in stati tutti diversi, dovremo occupare stati fino a |k| ' N 1/3 , ma l’energia del sistema complessivo (che ovviamente è puramente cinetica) sarà la somma delle energie di tutti i livelli energetici occupati, cioè all’incirca X k 2 ∝ N 5/3 . k∈Z3 ,|k|≤N 1/3 Dimostrazione dell’equivalenza fra i Teoremi 10.1 e 10.2. Per semplificare la discussione e restringerci al caso più interessante mostreremo in effetti l’equivalenza nel solo caso fermionico. Più precisamente dimostreremo che per un sistema fermionico, Corollario 10.1 ⇐⇒ Teorema 10.1 con γ = 1, d = 3. Iniziamo dall’implicazione (⇐=). Sia EH [Ψ] l’energia di N fermioni non interagenti in R3 , cioè l’aspetP tazione di H = (−∆i + V (xi)) per un qualche V tale che le ipotesi del Teorema 6.2 siano soddisfatte e in particolare V− ∈ L∞ + L3/2 (R3 ), allora il Teorema 9.4 implica che EH [Ψ] ≥ − M X j=0 |ej |, 131 dove ej , j = 0, . . . , M , sono le energie di tutti gli stati legati di h = −∆ + V , Hamiltoniana a una particella. Il Teorema 10.1 con γ = 1, d = 3 a sua volta implica che Z M X 5/2 dx V− (x). |ej | ≤ L1,3 R3 j=0 da cui Z Z 5/2 dx V (x)ρΨ (x) − L1,3 T [Ψ] ≥ − dx V− (x), R3 R3 (10.12) dove, se V− ∈ / L5/2 (R3 ) il membro di destra può anche essere −∞. La stima precedente si applica ad ogni potenziale V che soddisfi le condizioni fin qui assunte. Facciamo ora una scelta specifica di V , ovvero prendiamo 2/3 V (x) = −V− (x) = −cρΨ (x). E’ facile verificare che per tale scelta tutte le ipotesi sono soddisfatte e, in particolare, V− ∈ L3/2 (R3 ). In realtà non possiamo sapere se V− ∈ L5/2 (R3 ), ma questo sarà conseguenza della disuguaglianza finale. Rimpiazzando questa scelta in (10.12) otteniamo Z 5/3 5/2 dx ρΨ (x), T [Ψ] ≥ c − L1,3 c R3 e, ottimizzando rispetto a c, cioè scegliendo c = (2/(5L1,3 ))2/3 , 2/3 Z 3 2 5/3 T [Ψ] ≥ dx ρΨ (x), 5 5L1,3 3 R che coincide con la (10.9), via la (10.8).3 Vediamo ora come si dimostra l’implicazione (=⇒). Per le ipotesi fatte, l’Hamiltoniana a una particella h = −∆ + V in L2 (R3 ) ha M + 1 stati legati ψ0 , . . . , ψM , con M che assumeremo per semplicità finito. Nel caso in cui fosse M = +∞ sarebbe sufficiente riprodurre lo stesso argomento per M fissato e alla fine prendere il limite M → ∞. Prendiamo allora un sistema di M + 1 fermioni e costruiamo PMlo stato Ψ0 = ψ0 ∧ · · · ∧ ψM , che grazie al Teorema 9.4, sappiamo essere lo stato fondamentale di H = j=0 h(xj ) P P ej . La matrice densità ridotta di tale stato a M + 1 corpi è γ (1) = M con energia E0 = M j=0 |ψj i hψj | e j=0 (1) = 1. Allora il Corollario 10.1 applicato a T [Ψ0 ] dà soddisfa ovviamente γ ∞ − M X Z |ej | = E0 = EH [Ψ0 ] ≥ K dx R3 j=0 5/3 ρΨ0 Z − R3 dx V− (x)ρΨ0 (x), ma Hölder e la disuguaglianza ab ≤ ap /p + bq /q, valida per ogni a, b ≥ 0 e ogni δ ∈ (0, 1), Z 2/5 Z 3/5 Z 5/2 5/3 dx V− (x)ρΨ0 (x) ≤ dx V− (x) dx ρΨ0 (x) R3 R3 1 p + 1 q = 1, implicano che, per R3 2 ≤ 5/2 5δ Z dx R3 5/2 V− (x) 3δ 5/3 + 5 che sostituita nella (10.13) restituisce − M X j=0 2 ≥ − 5/2 5δ Z dx R3 5/2 V− (x) + 3δ 5/3 K− 5 !Z e, scegliendo δ 5/3 = 53 K, M X j=0 dove abbiamo usato la (10.8). (10.13) Z |ej | ≤ L1,3 R3 5/2 dx V− (x), R3 5/3 dx ρΨ0 (x), Z R3 5/3 dx ρΨ0 (x), 132 10.1 Teoria di Birman-Schwinger Un ingrediente cruciale nella dimostrazione delle disuguzglianze di Lieb-Thirring è il principio di BirmanSchwinger, che dimostreremo alla fine di questa Sezione. Si tratta di un risultato generale di teoria degli operatori di Schrödinger. In effetti la teoria di Birman-Schwinger non è che una conveniente riformulazione dell’equazione agli autovalori per un operatore di Schrödinger della forma −∆ + V , che permette di sfruttare proprietà di compatezza non presenti nella formulazione originaria. Consideriamo allora l’equazione agli autovalori negativi (problema di Stum-Liouville) (−∆ + V ) ψ = −eψ, (10.14) con ψ ∈ L2 (Rd ), V ≤ 0 e e > 0. Nell’applicazione alla dimostrazione delle disguguaglianze di Lieb-Thirring V sarà in realtà −V− , cioè la sola parte negativa del potenziale. Assumeremo inoltre che V soddisfi le condizioni sufficienti per la limitatezza dal basso dello spettro, cioè (6.9). Definizione 10.1 (Operatore di Birman-Schwinger). Sia V negativo tale che le ipotesi del Teorema 6.1 siano soddisfatte e in particolare (6.9), allora l’operatore di Birman-Schwinger Ke : L2 (Rd ) → L2 (Rd ) associato all’equazione di Schrödinger (10.14) è l’operatore integrale con kernel p p Ke (x; y) = |V (x)| G−e (x − y) |V (y)|, (10.15) dove la funzione di Green del Laplaciano G−e è definita in (4.9). Le proprietà più importanti di Ke sono enunciate nelle seguenti Proposizione 10.1 (Equivalenza dei problemi agli autovalori). L’operatore di Schrödinger −∆+V ha l’autovalore −e, e > 0, cioè esiste una soluzione di (10.14) in L2 (Rd ), se e solo se 1 è autovalore di Ke , cioè ∃φ ∈ L2 (Rd ) tale che Ke φ = φ. (10.16) Dimostrazione. Dimostriamo anzitutto che sotto le ipotesi fatte su V , l’operatore di Birman-Schwinger è un operatore limitato in L2 (Rd ): dalla definizione (10.15) si vede immediatamente che Ke ha la struttura p Ke = Be∗ Be , Be = |V | (−∆ + e)−1/2 , (10.17) p dove l’operatore (−∆ + e)−1/2 può essere facilmente definito usando il teorema spettrale e |V | indica p l’operatore di moltiplicazione per la funzione |V (x)|. Mostriamo ora che Be è un operatore limitato su L2 (Rd ), da cui segue immediatamente l’assunto. Facciamo anzitutto vedere che (−∆ + e)−1/2 : L2 (Rd ) → H 1 (Rd ): Z 2 2 k 2 + 1 −1/2 ψ 1 d = dk 2 ψ̂(k) ≤ max 1, 1e kψk22 . (−∆ + e) k +e H (R ) Rd p Inoltre si dimostra che |V | : H 1 (Rd ) → L2 (Rd ) e quindi mettendo insieme i due risultati ne segue che Be è limitato su L2 (Rd ): supponiamo per semplicità che d ≥ 3, dato che i casi d = 1, 2 sono del tutto analoghi, allora p 2 Z dx V (x) |ψ|2 ≤ kV1 k d kψk22d + kV2 k∞ kψk22 ≤ Sd−1 kV1 k d k∇ψk22 + kV2 k∞ kψk22 |V | ψ = 2 2 d−2 2 d R n o ≤ max Sd−1 kV1 k d , kV2 k∞ kψk2H 1 (Rd ) , 2 dove abbiamo usato la decomposizione V = V1 + V2 , V1 ∈ Ld/2 e V2 ∈ L∞ e le disuguaglianze di Sobolev enunciate nel Lemma 6.1. 133 p Supponiamo ora che la (10.14) sia soddisfatta per una certa ψ ∈ H 1 (Rd ) e poniamo φ = |V | ψ: il conto alla riga precedente implica che φ ∈ L2 (Rd ) e la (10.14) può essere riscritta nella forma (−∆ + e)ψ = |V |ψ, che a sua volta diventa p (−∆ + e)−1 |V |φ = ψ, ovvero Ke φ = φ. Si noti che quest’ultima equazione è ben posta grazie alla limitatezza in L2 (Rd ) di Ke e al fatto che φ ∈ L2 (Rd ). p Se viceversa φ è autofunzione di Ke all’autovalore 1, poniamo ψ = (−∆ + e)−1 |V |φ e calcoliamo (per il momento formalmente) p p (−∆ + e)ψ = |V |φ = |V |Ke φ = |V |ψ. p Rimane solo da mostrare che ψ = (−∆ + e)−1 |V |φ sta in L2 (Rd ), se φ ∈ L2 (Rd ): 2 D p p p E 1 Dp E p |V |φ (−∆ + e)−2 |V |φ ≤ |V |φ (−∆ + e)−1 |V |φ (−∆ + e)−1 |V |φ = e 2 1 1 = h φ |Ke | φ i = kφk22 , e e dove abbiamo sfruttato la stima operatoriale (−∆ + e)−2 ≤ e−1 (−∆ + e)−1 , che si dimostra banalmente usando la trasformata di Fourier F: E 1 E D E 1D D 2 2 −1 −2 −1 −2 ψ (−∆ + e)−1 ψ . ψ̂ (k + e) ψ̂ = ψ̂ F(−∆ + e) F ψ̂ = ψ̂ (k + e) ψ̂ ≤ e e Osservazione 10.9. Nella dimostrazione della precedente Proposizione abbiamo fatto uso della disuguaglianza operatoriale (−∆ + e)−2 ≤ e−1 (−∆ + e)−1 . Si potrebbe essere portati a pensare che si tratti di un caso particolare di una disuguaglianza ovvia per i numeri reali, ovvero che se a ≥ 0 e a ≤ b allora a2 ≤ ab. Più in generale si potrebbe pensare che valga l’analogo operatoriale di ac ≤ bc, per ogni c ≥ 0 e a ≤ b. In realtà a livello operatoriale tutte queste disuguaglianze sono false! Più precisamente dati tre operatori autoaggiunti C ≥ 0 e A ≤ B, non è vero che AC ≤ BC. Ovviamente la ragione di questo fatto sta nella non commutatività dell’algebra degli operatori (e più semplicemente delle matrici). Si noti però che una disuguaglianza sempre valida è la seguente: siano A ≤ B e C un operatore limitato qualunque, allora C ∗ AC ≤ C ∗ BC. (10.18) Per motivi analoghi è altrettanto falso che se 0 ≤ A ≤ B, allora An ≤ B n , qualunque sia n > 1 (si costruisca un controesempio per matrici 2 × 2 con n = 2). In effetti soltanto potenze minori di 1 conservano l’ordinamento operatoriale: se 0 ≤ A ≤ B e 0 ≤ γ ≤ 1, allora Aγ ≤ B γ , (10.19) dove le potenze sono definite ad esempio via il teorema spettrale. L’utilità della riformulazione della (10.14) usando l’operatore di Birman-Schwinger sta nelle proprietà speciali di quest’ultimo. Fissiamo per semplicità d = 3 (che è il caso su cui ci concentreremo per dimostrare la disuguaglianza di Lieb-Thirring), allora sotto ipotesi ragionevoli su V , si ha che Ke è un operatore compatto: Proposizione 10.2 (Compattezza di Ke ). Se V ∈ L2 (R3 ), allora Ke ∈ L 2 (L2 (R3 )), cioè Ke è un operatore Hilbert-Schmidt e, in particolare, compatto; inoltre kV k2 kKe k2L 2 (L2 (R3 )) ≤ √2 . (10.20) 8π e Osservazione 10.10. In dimensione generica d ≥ 3 l’ipotesi V ∈ L2 non garantisce automaticamente che Ke sia Hilbert-Schmidt. Tuttavia si può mostrare che Ke ∈ L m (L2 (Rd )), cioè Tr(Kem ) < +∞, per un m grande abbastanza, il che garantisce ancora la compattezza dell’operatore. 134 Dimostrazione. La dimostrazione è sostanzialmente una stima diretta di Tr(Ke2 ): √ Z Z e−2 e|x−y| 2 2 Tr(Ke ) = dxdy |V (x)| G−e (x − y) |V (y)| = dxdy |V (x)| |V (y)| 16π 2 |x − y|2 R6 R6 √ Z ∞ Z Z √ kV k22 e−2 e|x−y| 1 1 −2 e% 2 2 √ , d% e dxdy V (x) = dxV (x) = ≤ 16π 2 R6 4π R3 8π e |x − y|2 0 dove abbiamo usato la stima di Cauchy ab ≤ 21 a2 + 12 b2 . Proposizione 10.3 (Monotonia di Ke in e). Sia e0 > e, allora Ke0 ≤ Ke . Inoltre kKe k −→ +∞, e→0 kKe k −→ 0. e→+∞ (10.21) Dimostrazione. Il primo risultato segue dalla monotonia di (−∆ + e)−1 rispetto a e, ovvero dal fatto che se e0 > e, allora (−∆ + e0 )−1 ≤ (−∆ + e)−1 , come si dimostra facilmente usando la trasformata di Fourier. Inoltre per ogni ψ ∈ L2 (Rd ) p p Dp E Dp E 0 −1 −1 0 |V |ψ (−∆ + e ) |V |ψ ≤ |V |ψ (−∆ + e) |V |ψ = h ψ |Ke | ψ i . h ψ |Ke | ψ i = Per quanto riguarda le altre due proprietà osserviamo che (−∆+e)−1 tende a un operatore illimitato quando e → 0, che giustifica la prima delle (10.21). Per dimostrare la seconda fissiamo d = 3 e ipotizziamo per semplicità che V ∈ L2 (R3 ): allora, per quanto dimostrato nella Proposizione 10.2 e specificamente la stima (10.20), abbiamo che !1/2 X C kKe k = kKe k∞ = sup |λn | ≤ λ2n = kKe k2 ≤ √ , e n∈N n∈N dove abbiamo indicato con λn , n ∈ N, gli autovalori di Ke . Possiamo ora enunciare il principio di Birman-Schwinger. Fissiamo nuovamente per concretezza d = 3. Teorema 10.3 (Principio di Birman-Schwinger). Sia e > 0, d = 3, V ∈ L2 (R3 ) e Ne = # autovalori ≤ −e di − ∆ + V, (10.22) Me = # autovalori ≥ 1 di Ke , (10.23) allora Ne = Me . Dimostrazione. Per quanto dimostrato nella Proposizione 10.2, Ke è un operatore compatto. Inoltre Ke è manifestamente positivo, grazie alla positività di (−∆ + e)−1 : p Dp E h ψ |Ke | ψ i = |V |ψ (−∆ + e)−1 |V |ψ ≥ 0. Possiamo allora ordinare gli autovalori di Ke in ordine descrescente λ0 (e) ≥ λ1 (e) ≥ · · · ≥ 0. Per un risultato generale di teoria degli operatori (si veda ad esempio [RS4, Teorema XII.8]), gli autovalori λn (e) sono funzioni regolari di e. Inoltre per il principio del min-max (prossimo Teorema 10.4) λn (e0 ) è una funzione monotona descrescente di e0 . Le proprietà dell’operatore di Birman-Schwinger enunciate nella Proposizione 10.1 fanno sı̀ che ogni qualvolta λn (e) = 1 per un qualche n, allora −e è autovalore di h = −∆ + V . D’altra parte quanto dimostrato nella Proposizione 10.3 implica che λ1 (e) → +∞ quando e → 0 e λn → 0 per ogni n quando e → ∞ (si veda la Fig. 10.1 per una rappresentazione grafica) e in particolare, per ogni n, λn (e) < 1 per e abbastanza grande. Osservando la Fig. 10.1 è facile rendersi conto che il numero di autovalori di Ke maggiori o uguali a 1 coincide con il numero di attraversamenti della retta orizzontale λ = 1 da parte dei λn alla destra di e. Ma ogni attraversamento implica per quanto detto l’esistenza di un autovalore di h al di sotto di −e. Il risultato è allora dimostrato. 135 Figura 10.1: Comportamento degli autovalori di Ke al variare di e [LSe, p. 65]. Nella dimostrazione del Teorema 10.3 abbiamo usato un risultato fondamentale di teoria degli operatori che formuleremo in forma semplificata omettendo inoltre la dimostrazione. Il lettore interessato può trovare la discussione dettagliata in [RS4, Sezione XIII.1]. Teorema 10.4 (Principio del min-max). Siano V, W due potenziali tali che V ≤ W puntualmente e le ipotesi del Teorema 6.2 siano soddisfatte (con d = 3). Siano inoltre h = −∆ + V e h0 = −∆ + W i relativi operatori di Schrödinger. Se indichiamo con E0 ≤ E1 ≤ · · · ≤ 0 e E00 ≤ E10 ≤ · · · ≤ 0 gli autovalori negativi rispettivamente di h e h0 , si ha che Ej ≤ Ej0 , per ogni j. (10.24) Osservazione 10.11. Il principio del min-max si applica più in generale ogni qual volta abbiamo due forme quadratiche tali che h ψ |h| ψ i ≤ h ψ |h0 | ψ i e, come nel caso semplice dei potenziali V ≤ W , implica l’ordinamento relativo degli autovalori. 10.2 Dimostrazione delle Disuguaglianze di Lieb-Thirring Possiamo ora completare la dimostrazione delle disuguaglianze di Lieb-Thirring. Per semplificare la discussione e al contenpo restringerci al caso fisicamente interessante dell’applicazione alla teoria della stabilità della materia, dimostreremo il Teorema 10.1 solo in tre dimensioni (d = 3) e per γ = 1. Inoltre tralasceremo interamente la discussione della costante ottimale Ld,γ e ci accontenteremo di dimostrare che la stima vale per una certa costante finita. Dimostrazione del Teorema 10.1. Osserviamo anzitutto che è sufficiente restringersi al caso V = −V− : il motivo è che una stima sulla somma dei moduli degli autovalori negativi Ej di h = −∆ − V− fornisce automaticamente, grazie al principio del min-max (Teorema 10.4), una stima dall’alto anche per l’analoga somma degli autovalori negativi dell’hamitoniana completa −∆ + V . Se infatti chiamiamo Ej0 gli autovalori negativi di quest’ultima, abbiamo, via principio del min-max e stima banale V ≥ −V− , l’ordinamento Ej0 ≥ Ej e perciò |Ej0 | ≤ |Ej |. Inoltre Z ∞ X X |Ej | = ej = de Ne , j≥0 j≥0 0 136 dove Ne è stato definito nell’enunciato del Teorema 10.3 ed è il numero di autovalori negativi di h = −∆−V− uguali o più piccoli di −e. Per ricavare la seconda identità nell’espressione precedente è sufficiente osservare che Ne è una funzione continua a tratti (in effetti a scalini), la cui derivata in senso distribuzionale è data da X dNe δ(e − ej ), =− de j≥0 da cui l’identità via integrazione per parti Z Z ∞ ∞ de Ne = eNe 0 − ∞ de e 0 0 dNe X ej . = de j≥0 Si noti l’annullamento dei termini di bordo dovuto al fatto che Ne = 0 per e > e0 . A questo punto applichiamo il principio di Birman-Schwinger (Teorema 10.3), ottenendo Z ∞ X |Ej | = de Me , 0 j≥0 ma se chiamiamo j? ∈ N l’indice tale che λj ≥ 1 per j ≥ j? abbiamo anche che X X Me ≤ λ2j ≤ λ2j = kKe k22 , j≥j? da cui X j≥0 ∞ Z |Ej | ≤ j≥0 0 de kKe k22 . (10.25) Purtroppo anche assumendo che V− ∈ L2 (R3 ), la (10.25) non sarebbe sufficiente per chiudere l’argomento √ in quanto nella stima (10.20) compare la funzione 1/ e che non è integrabile per grandi e. L’idea è allora di ripetere il ragionamento sostituendo nello schema il potenziale V− con We (x) = V (x) + 12 e − . (10.26) Osserviamo anzitutto che V (x) + 12 e − = ( 0, V− − 2e , dove V (x) ≤ 2e , dove V (x) ≤ 0 e V− (x) ≥ 2e ; da cui la stima banale We (x) ≥ V− (x) − 12 e. (10.27) Se indichiamo la dipendenza dal potenziale, vale poi la catena di disuguaglianze Ne (−V− ) ≤ Ne/2 (−V− + e/2) ≤ Ne/2 (−We ), (10.28) come si dimostra nel modo seguente: se (−∆ − V− )ψ = Eψ, allora (−∆ − V− + e/2)ψ = (E + e/2)ψ; quindi se E ≤ −e è autovalore di −∆ − V− , allora E + e/2 ≤ −e/2 è autovalore di −∆ − V− + e/2, il che giustifica la prima disuguaglianza. Per la seconda è sufficiente usare la (10.27) e applicare il principio del min-max che garantisce che gli autovalori di −∆ − We sono minori o uguali ai corrispettivi autovalori di −∆ − V− + e/2. Ripetiamo allora l’argomento con cui abbiamo iniziato la dimostrazione rimpiazzando e con e/2 e V− con We : Z ∞ Z ∞ Z ∞ Z ∞ 2 X |Ej | = de Ne (−V− ) ≤ de Ne/2 (−We ) = de Me/2 (−We ) ≤ de K̃e/2 , j≥0 0 0 0 0 2 137 dove abbiamo indicato con K̃e l’operatore di Birman-Schwinger relativo al potenziale −We . A questo punto possiamo usare la (10.20) e ottenere X j≥0 Z |Ej | ≤ C 0 ∞ kWe k2 de √ 2 = C e Z 0 ∞ Z Z Z 2V− (x) 2 1 de √ V− (x) − 12 e e R3 0 R3 Z Z 2 Z 2 1 5/2 5/2 dx V− (x) de √ 1 − 12 e ≤ C 00 = C0 dx V− (x), e R3 0 R3 1 de √ e dx V (x) + 1 2 2e − =C dx dove abbiamo applicato Fubini per scambiare l’ordine degli integrali: come funzione di x, [V (x) + 12 e]2− è una funzione positiva, limitata e a supporto compatto per ogni e > 0, grazie all’ipotesi di decadimento fatta sul potenziale (si vedano le assunzioni su V del Teorema 6.2). Pertanto essa è integrabile in x per ogni e > 0 e l’integrale è finito. Resta da discutere il comportamento quando e → 0 ma poiché V ∈ L2 anche in questo caso la funzione è integrabile e il suo integrale finito. Capitolo 11 Elettrostatica Nel Capitolo precedente abbiamo dimostrato le disuguaglianze di Lieb-Thirring che ci permetteranno di stimare dal basso l’energia cinetica degli elettroni nel modello di materia che abbiamo considerato. Per ricavare un’analoga stima significativa dal basso dell’energia potenziale coulombiana del sistema elettroni – nuclei dovremo dare alcuni cenni di teoria del potenziale al fine di poter dimostrare la stima chiave ovvero la disuguaglianza di Baxter. Ricordiamo che il potenziale elettrostatico che vogliamo studiare è dato dalla (8.4), cioè VC (X; R, Z) = W (X; R, Z) + I(X) + U (R, Z), con W (X; R, Z) = − N X M X i=1 j=1 I(X) = X 1≤i<j≤N U (R, Z) = X 1≤j<k≤M Zj ; |xi − Rj | 1 ; |xi − xj | Zj Zk . |Rj − Rk | Come si vede l’unico contributo negativo è dato da W , ma purtroppo esso contiene N M termini, mentre il nostro scopo finale è dimostrare una stima dal basso che sia proporzionale a N + M . In effetti la stima dal basso che abbiamo ottenuto per dimostrare la stabilità della prima specie (8.11) va addirittura come M 2 N . D’altra parte i contributi repulsivi dell’interazione fra gli elettroni e di quella fra i nuclei, che abbiamo trascurato per arrivare alla (8.11), dovrebbero aiutare a raggiungere una stima dal basso migliore. Questo fenomeno prende il nome di screening elettronico: grazie alla repulsione fra gli elettroni, il campo elettronico che sente ogni singolo elettrone è in realtà più debole di quello prodotto dai nuclei. Nella disuguaglianza di Baxter tale effetto viene quantificato. In teoria del potenziale il problema fisico che si vuole risolvere è quello di trovare il potenziale elettrostatico generato da una certa distribuzione di carica. Supponiamo allora che le cariche siano distribuite secondo una misura di probabilità (misura di Borel regolare) µ ∈ M (Rd ), allora vogliamo studiare le proprietà del ptenziale generato. Esempio 11.1 (Distribuzioni di carica elementari) Nel caso elementare di un numero N di particelle puntiformi con carica qi , la distribuzione µ è semplicemente P data da µ = qi δ(x − xi ), dove xi indicano le posizioni delle N cariche. Analogamente una distribuzione di carica uniforme di densità ρ in una palla BR di raggio R sarà data da µ = ρ1BR . Definizione 11.1 (Potenziale elettrostatico). Sia µ ∈ M (R3 ) una misura di Borel regolare, allora il potenziale elettrostatico Φ(x) da essa generato è 138 139 la funzione Z dµ(y) Φ(x) = R3 1 . |x − y| (11.1) Osservazione 11.1. La funzione (11.1) è certamente ben definita se µ ≥ 0, anche se ovviamente non è necessariamente limitata. Se invece µ è una misura con segno e quindi µ = µ+ − µ− , con µ± ≥ 0, allora potrebbe esserci un ambiguità dovuta alla possibile cancellazione di divergenze con segno opposto. Se tuttavia assumiamo che Z 1 dµ± (y) < +∞, 1 + |y| R3 si può dimostrare che la (11.1) è ben posta anche per misure con segno. In effetti sotto queste ipotesi Φ ∈ L1loc (R3 ) ed è finita q.o.. Se prendiamo il caso elementare descritto nell’Esempio 1 otteniamo immediatamente che un insieme di N particelle puntiformi di carica qi nei punti xi produce un potenziale elettrostatico dato da Φ(x) = N X i=1 qi . |x − xi | che coincide con quanto ci saremmo aspettati dai noti risultati di elettrostatica. Similmente l’energia elettrostatica di una carica puntiforme q posta in x0 e immersa nel potenziale Φ(x) è data da qΦ(x0 ). Risulta quindi naturale definire l’energia di una distribuzione di carica µ come Definizione 11.2 (Energia di Coulomb). L’energia di Coulomb o elettrostatica D(µ; µ) associata a una misura di Borel regolare µ è Z Z 1 1 D(µ; µ) = dµ(x) dµ(y) . 2 R3 |x − y| R3 (11.2) Motivata dalla precedente Definizione e dall’Osservazione 11.1, introduciamo anche la seguente Definizione 11.3 (Distribuzione di carica). Una distribuzione di carica µ è una misura di Borel regolare tale che, se µ = µ+ − µ− , con µ± ≥ 0, allora D(µ± ; µ± ) < +∞. Osservazione 11.2. Come è noto data una misura di Borel regolare con segno µ si può trovare una decomposizione in misure positive µ = µ+ − µ− , dove in aggiunta le misure µ± hanno supporto disgiunto (decomposizione di Hahn). Si noti che nella definizione di distribuzione di carica è sufficiente che la condizione sia verificata per una qualunque decomposizione, in cui le misure µ± possono anche avere supporto non disgiunto. Per concludere definiamo l’energia di interazione fra due diverse distribuzioni di carica: Definizione 11.4 (Energia di interazione). Date due distribuzioni di carica µ, ν, l’energia di interazione fra di esse è Z Z 1 1 D(µ; ν) = dµ(x) dµ(y) . 2 R3 |x − y| 3 R (11.3) Nel caso in cui ν descriva una singola carica puntiforme q in x0 , si vede immediatamente che si riottiene il risultato classico per l’energia elettrostatica ovvero qΦ(x0 ), Φ è il potenziale generato da µ. L’utilità delle definizioni appena introdotte diventa più chiara alla luce della seguente Proposizione 11.1 (Proprietà dell’energia). Per ogni distribuzioni di carica µ, ν si ha i) 0 ≤ D(µ; µ) < +∞; 140 ii) |D(µ; ν)| ≤ p D(µ; µ)D(ν; ν). Dimostrazione. Dimostriamo anzitutto la positività dell’energia di Coulomb, mentre la limitatezza sarà ottenuta come sottoprodotto della seconda disuguaglianza. Osserviamo che vale la seguente semplice identità Z 1 C dz = , (11.4) 2 |y − z|2 |x − z| |x − y| 3 R dove C > 0 è una costante limitata (si veda anche il prossimo Esercizio 11.1: integrando il membro di sinistra abbiamo infatti Z Z Z ∞ Z 1 1 1 1 dz = dz 2 = 2π dz dt 2 2 2 2 2 |x − z| |y − z| |z| |z + x − y| z + |x − y| + 2z|x − y|t R3 R3 0 −1 Z ∞ Z 1 1 2π C dt 2 = dz = . |x − y| 0 z + 2zt + 1 |x − y| −1 Usando la (11.4) nella definizione di D(µ; µ) si ottiene Z 2 Z Z Z Z 1 1 1 1 dµ(y) dµ(x) dz = dz dµ(x) ≥ 0. D(µ; µ) = 2C R3 |x − z|2 |y − z|2 2C R3 |x − z|2 R3 R3 R3 Per dimostrare la seconda proprietà è sufficiente usare la (11.4) e applicare la disuguaglianza di CauchySchwarz: Z Z Z 1 1 1 |D(µ; ν)| ≤ dz dµ(x) dν(y) 2C R3 |x − z|2 R3 |y − z|2 R3 2 !1/2 Z 2 !1/2 Z Z Z p 1 1 1 = D(µ; µ)D(ν; ν). ≤ dz dµ(x) dz dν(y) 3 2C |x − z|2 |y − z|2 R3 R3 R3 R Usando questa seconda proprietà dell’energia di Coulomb è poi facile vedere che per ogni distribuzione di carica µ si ha D(µ; µ) < +∞: decomponendo µ = µ+ − µ− abbiamo per ipotesi sulle distribuzioni di carica D(µ± ; µ± ) < +∞, ma, grazie alla seconda proprietà , anche |D(µ+ ; µ− )| < +∞ e quindi D(µ; µ) < +∞. Esercizio 11.1. Usando l’identità Z ∞ α α 2 dλ λ 2 −1 e−πλ|x−y| = π − 2 Γ 0 α 2 |x − y|−α , (11.5) . (11.6) valida per ogni 0 < α < 3, si dimostri che 1 1 = 3 |x − y| π Z dz R3 1 |x − z|2 |y − z|2 Un’altra proprietà dei potenziali elettrostatici particolarmente utile è il teorema di Newton, che si applica a distribuzioni di carica a simmetria sferica. Premettiamo allora la seguente Definizione 11.5 (Distribuzione di carica a simmetria sferica). Una distribuzione di carica si dice a simmetria sferica attorno a un punto x0 ∈ R3 se per ogni rotazione R tale che Rx0 = x0 , allora µ(RS) = µ(S), per ogni S misurabile. Teorema 11.1 (Teorema di Newton). Sia µ una distribuzione di carica a simmetria sferica attorno all’origine, allora Z Z 1 1 dµ(y) + dµ(y) Φ(x) = . |x| |y|≤|x| |y| |y|>|x| (11.7) In particolare se µ(S) = 0 per ogni insieme S tale che S ∩ {y, |y| > R} = ∅, per un certo R < +∞ (cioè se la distribuzione di carica è supportata all’interno di una palla di raggio R), allora Φ(x) = µ(R3 ) , |x| per ogni |x| > R. (11.8) 141 Dimostrazione. Se µ è a simmetria sferica allora Φ deve essere invariante per rotazioni, ovvero Z Z Z 1 1 1 dω Φ(|x|ω) = dω dµ(y) Φ(x) = . 4π S 2 4π S 2 ||x|ω − y| R3 Scambiamo ora l’ordine degli integrali usando Fubini e calcoliamo 1 4π Z 1 1 dω = ||x|ω − y| 2 S2 Z 1 1 dt p |x|2 + |y|2 − 2|x||y|t −1 o n p p 1 = |x|2 + |y|2 + 2|x||y| − |x|2 + |y|2 − 2|x||y| 2|x||y| 1 1 1 , = {|x| + |y| − ||x| − |y||} = min , 2|x||y| |x| |y| da cui si ottiene immediatamente il risultato. Possiamo tornare ora a discutere la stima dal basso dell’energia coulombiana VC . Semplificando, possiamo dire che dovremo affrontare due tipi di problemi nel derivare tale stima: da un lato il potenziale VC è singolare in corrispondenza delle posizioni dei nuclei e questo chiaramente può essere un problema nel trovare una stima dal basso limitata, ma, dall’altro, il potenziale VC può essere “grande” in valora assoluto anche lontano dai nuclei, semplicemente per il fatto che contiene un numero grande di termini (ordine N M ). La soluzione di questo secondo problema sta in una partizione conveniente dello spazio in celle: Definizione 11.6 (Celle di Voronoi). Siano R1 , . . . , RM le posizioni di M nuclei, allora la j−esima cella di Voronoi è l’aperto Γj = x ∈ R3 |x − Rj | < |x − Ri | , ∀i 6= j . (11.9) Definiamo inoltre la distanza dal nucleo più vicino al j−esimo Dj = 1 |Rk 2 k6inf =j − Rj | = dist (Rj , ∂Γj ) , (11.10) e la minima distanza da un nucleo D(x) = inf j∈{1,...,M } |x − Rj | . (11.11) Osservazione 11.3. E’ facile vedere che le celle di Voronoi sono insiemi convessi il cui bordo ∂Γj è un insieme finito di sezioni di piani e, eventualmente, il punto all’infinito. Per una rappresentazione grafica semplificata si veda la Fig. 11.1. Possiamo a questo punto enunciare il risultato principale di questo Capitolo. Considereremo il potenziale VC introdotto nella (8.4) e richiamato all’inizio del Capitolo, ma assumeremo che le cariche nucleari siano tutte uguali, cioè Zj = Z per ogni j = 1, . . . , M . Nell’applicazione allo studio della stabilità della materia questa non sarà una restrizione significativa alla luce di quanto dimostrato nel Teorema 9.6. Ricordiamo che X = (x1 , . . . , xN ) e R = (R1 , . . . , RM ). Introduciamo inoltre la notazione w(x) = M X j=1 Z , |x − Rj | (11.12) per il potenziale complessivo generato dai nuclei. Teorema 11.2 (Disuguaglianza di Baxter). Sia VC il potenziale coulombiano definito in (8.4) con Zj = Z per ogni j = 1, . . . , M , allora vale la stima dal basso N M X 1 Z2 X 1 VC (X) ≥ −(2Z + 1) + . (11.13) D(xi ) 8 Dj i=1 j=1 142 Figura 11.1: Celle di Voronoi [LSe, p. 78]. Dimostrazione. L’idea chiave della dimostrazione della disuguaglianza di Baxter è l’applicazione del Lemma 11.1 alla distribuzione di carica elettronica µ(x) = N X δ(x − xi ). (11.14) i=1 Sfortunatamente vedremo che questo argomento non può funzionare direttamente ed è necessario regolarizzare la distribuzione di carica dando una “dimensione” alle cariche elettroniche che abbiamo sempre considerato puntiformi. Vediamo tuttavia come si procederebbe nel caso della distribuzione di carica (11.14): osserviamo intanto che X 1 D(µ; µ) = . |xi − xj | i<j cioè l’energia elettrostatica di µ coincide con la repulsione elettronica I(X). Inoltre Z − dµ(x) Φreg (x) = − R3 N X Φreg (xi ) = −Z i=1 N X M X i=1 j=1 da cui Z VC (X; R, Z) ≥ D(µ; µ) − N N i=1 i=1 X 1 X 1 Z +Z = W (X; R, Z) + Z , |xi − Rj | D(xi ) D(xi ) dµ(x) Φreg (x) − Z R3 N X i=1 X 1 Z2 + . D(xi ) |Rk − R` | (11.15) k<` L’applicazione del Lemma 11.1 a µ darebbe quindi la stima dal basso M N X Z2 X 1 1 VC (X; R, Z) ≥ −Z , 8 Dj D(xi ) j=1 i=1 che sfortunatamente è inutile a causa della divergenza di D(xi ) in Γi . Per ovviare a questo problema rimpiazziamo la distribuzione di carica elettronica (11.14) con µreg (x) = N X i=1 µi (x), µi (x) = 1 δ |x − xi | − πd2i di 2 , (11.16) 143 dove abbiamo posto per semplicità di notazione di = D(xi ). Si noti che la distribuzione di carica puntiforme µ è stata sostituita con una distribuzione di carica superificiale, supportata in sferette di raggio d2i centrate in xi . Usando i risultati dimostrati nel prossimo Lemma 11.2 e specificamente la (11.26), abbiamo che VC (X; R, Z) ≥ 2 X D(µi ; µj ) − i<j M Z X j=1 dµreg (x) R3 X Z Z2 + |x − Rj | |Rk − R` | k<` = D(µreg ; µreg ) − N X i=1 M 1 X − di j=1 Z dµreg (x) R3 X Z Z2 + , |x − Rj | |Rk − R` | k<` e, grazie al Lemma 11.1, Z M N X 1 Z2 X 1 1 dµreg (x) −Z , VC (X; R, Z) ≥ − + di D(x) 8 Dj R3 j=1 i=1 di 2 ma sul supporto di µi si ha D(x) ≥ per costruzione e quindi VC (X; R, Z) ≥ −(2Z + 1) N X i=1 M Z2 X 1 1 + , D(xi ) 8 Dj j=1 cioè il risultato finale. Cosı̀ come la decomposizione in celle di Voronoi ha permesso di risolvere il problema della dipendenza dal numero di nuclei e considerare “un nucleo alla volta”, cosı̀ il Lemma seguente permette di liberarsi della singolarità coulombiana generata all’interno della cella di Voronoi dal nucleo contenuto. Lemma 11.1 (Regolarizzazione del potenziale). Per ogni distribuzione di carica µ e per ogni scelta di M punti Rj , j = 1, . . . , M , si ha Z D(µ; µ) − dµ(x)Φreg (x) + R3 M X 1≤i<j dove M Z2 1 X Z2 ≥ , |Ri − Rj | 8 Dj (11.17) j=1 M X Z Z Z Φreg (x) = w(x) − = − . D(x) |x − Rj | minj∈{1,...,M } |x − Rj | (11.18) j=1 Osservazione 11.4. Il potenziale Φreg è naturalmente la regolarizzazione del potenziale Φ generato dai nuclei, a cui è stato sottratto il contributo singolare dovuto al nucleo nella cella di Voronoi in questione: più precisamente X Z Φreg (x) = , per ogni x ∈ Γk . |x − Rj | j6=k Inoltre Φreg è una funzione continua – in realtà C ∞ – all’interno di ciascuna cella di Voronoi. Tuttavia tale regolarità viene a mancare al bordo ∂Γj , dove Φreg è solamente continua. Similmente si vede facilmente che ∆Φreg = 0, (11.19) per ogni x ∈ / ∪j ∂Γj , cioè Φreg è una funzione armonica all’interno delle celle di Voronoi. Dimostrazione. Per prima cosa vogliamo cercare la distribuzione di carica che genera il potenziale Φreg , ovvero la ν tale che Z 1 Φreg (x) = dν(y) , |x − y| R3 144 o, in termini distribuzionali, −∆Φreg = 4πν. Prediamo allora una funzione test f ∈ C0∞ (R3 ) e calcoliamo (Z ) Z Z M Z M X X dx Φreg ∆f = dx Φreg ∆f = dσ Φreg nj · ∇f − dx ∇Φreg · ∇f , R3 Γj j=1 ∂Γj j=1 Γj dove abbiamo indicato con nj il versore lungo la normale uscente da ∂Γj e dσ la misura di superficie su ∂Γj . D’altra parte la continuità di Φreg e f implica che la somma di tutti i termini di bordo deve annullarsi perché per ogni termine ce n’è un altro uguale ma di segno opposto. Inoltre integrando ancora per parti Z Z dx ∇Φreg · ∇f = dσ f nj · ∇Φreg , Γj ∂Γj poiché Φreg è armonica all’interno di Γj . Abbiamo quindi Z dx Φreg ∆f = − R3 M Z X dσ f nj · ∇Φreg . (11.20) ∂Γj j=1 Si noti che la somma di termini di bordo nella (11.20) questa volta non si annulla a causa della non differenziabilità di Φreg su ∂Γj . Abbiamo quindi scoperto che la distribuzione di carica che genera Φreg è una distribuzione superficiale supportata su ∪j ∂Γj . Cerchiamo di trovarne l’espressione esplicita: ricordando che Φreg (x) = w(x) − Z/D(x), osserviamo che w è certamente una funzione differenziabile di x su ∂Γj e quindi, ancora una volta, i corrispondenti termini di bordo hanno somma nulla: Z dx Φreg ∆f = Z R3 M Z X j=1 dσ f nj · ∇ ∂Γj 1 D . (11.21) D’altra parte al bordo comune fra le celle Γj e Γk vale banalmente nj · ∇ 1 1 = nk · ∇ , |x − Rj | |x − Rk | poiché su tale bordo |x − Rj | = |x − Rk |. Ma allora poiché D(x) = minj |x − Rj | Z M Z X dx f nj · ∇ ∂Γj j=1 1 D Z dx f nj · ∇ = 2Z ∪j ∂Γj 1 D Z dx f nj · ∇ = 2Z ∪j ∂Γj 1 |x − Rj | o, alla luce della (11.21), la distribuzione di carica ν che genera Φreg ha supporto in ∪j ∂Γj ed è data da ν(x) = − Z 1 nj · ∇ σ(x), 2π |x − Rj | (11.22) dove σ(x) indica la misura superficiale ristretta a ∪j ∂Γj . Si noti che tale distribuzione di carica è positiva: poiché per convessità nj · (x − Rj ) ≥ 0, il gradiente ∇ 1 |x − Rj | punta in direzione entrante rispetto a ∂Γj . Ora per ogni distribuzione di carica µ Z D(µ; µ) − dµ(x) Φreg (x) + R3 X i<j X Z2 Z2 = D(µ; ν) − D(ν; ν) + |Ri − Rj | |Ri − Rj | i<j ≥ −D(ν; ν) + X i<j Z2 , (11.23) |Ri − Rj | 145 grazie a quanto dimostrato nella Proposizione 11.1. Resta allora da calcolare D(ν; ν) con ν data dalla (11.22). Notiamo anzitutto che Z dν(x) w(x) = Z R3 M Z X dν(x) X 1 δ(y − Rj ) = Z Φreg (Rj ), |x − y| dy R3 j=1 M Z R3 j=1 da cui 1 D(ν; ν) = 2 Z 1 dν(x) Φreg (x) = 2 R3 dν(x) w(x) − Z R3 Z M ZX 1 Z = dν(x) Φreg (Rj ) − 2 2 R3 D(x) j=1 Z X Z2 Z 1 = − dν(x) . (11.24) |Rk − Rj | 2 R3 D(x) Z D(x) k<j A questo punto resta da calcolare Z 2 1 Z2 dν(x) =− D(x) 4π R3 Z Z dσ nj · ∇ ∪j ∂Γj Z2 = 16π 1 |x − Rj | M Z X j=1 Γcj M Z 1 Z2 X 1 =− dσ nj · ∇ D(x) 16π |x − Rj |2 ∂Γj j=1 dx ∆ 1 |x − Rj |2 M Z Z2 X 1 = , (11.25) dx 8π |x − Rj |4 Γcj j=1 dove abbiamo usato l’identità ∆|x − Rj |−2 = 2|x − Rj |−4 la cui dimostrazione è lasciata per esercizio. Si noti che nel passaggio dall’integrale su ∪j ∂Γj alla somma degli integrali su ∂Γj abbiamo dovuto moltiplicare per 21 per evitare di contare due volte lo stesso integrale. Infine nell’ultimo passaggio abbiamo ottenuto un cambio di segno a prezzo di rimpiazzare Γj con il suo complemento Γcj . Per completare la stima basta osservare che Γcj contiene sicuramente il semi-spazio tangente alla sfera di raggio Dj centrata in Rj e, quindi, cambiando coordinate x − Rj → x, otteniamo Z 1 dx ≥ c |x − Rj |4 Γj Z ∞ Z ∞ dx −∞ Z ∞ dy −∞ Dj 1 = (x2 + y 2 + z 2 )2 Z ∞ Z 2π d% % Z ∞ 0 0 1 (%2 + z 2 )2 Z ∞ 1 π dz 2 = =π . z Dj Dj dz dϕ Dj Rimpiazzando questa stima nella (11.25) e sostituendo la (11.24) nella (11.23) otteniamo il risultato. Terminiamo questo Capitolo dimostrando alcune proprietà della distribuzione di carica regolarizzata µreg introdotta in (11.16): Lemma 11.2 (Lemma di Onsager). Sia µreg la distribuzione di carica (11.16), allora X i) I(X) ≥ 2 D(µi ; µj ); i<j 1 = ii) |xi − Rj | iii) D(µi ; µi ) = Z dµi (x) R3 1 ; |x − Rj | 1 . D(xi ) In particolare I(X) ≥ 2D(µreg ; µreg ) − N X i=1 1 , D(xi ) W (X; R, Z) = − M Z X j=1 R3 dµreg (x) Z . |x − Rj | (11.26) 146 Dimostrazione. Tutte e tre le stime sono conseguenza diretta del Teorema di Newton 11.1. Iniziamo dalla prima: per i 6= j Z Z Z Z 1 1 1 1 1 dµj (y) D(µi ; µj ) = dµi (x) dµi (x) dµi (x), = + 2 R3 |x − y| 2 |x−xj |≥ dj |x − xj | dj |x−xj |< dj R3 2 2 poiché la distribuzione di carica µj è a simmetria sferica rispetto a xj e quindi il potenziale che genera è 1 , |x − xj | Φj (x) = 2 , dj se |x − xj | ≥ dj 2 , se |x − xj | < dj 2 , ed esso ovviamente soddisfa la stima puntuale Φj (x) ≤ |x − xj |−1 . Quindi 1 D(µi ; µj ) = 2 Z 1 dµi (x) − |x − xj | R3 |x−xj |< 1 1 − dµi (x) |x − xj | dj Z 1 1 1 1 dµi (x) ≤ = Φi (xj ) ≤ . 2 R3 |x − xj | 2 2|xi − xj | Z dj 2 Consideriamo ora l’ultima identità: cambiando variabili x − xi = x0 e passando a coordinate sferiche abbiamo che Z Z ∞ 1 1 2 1 1 dµi (x) = 2 d%%2 δ % − d2i = . D(µi ; µi ) = 2 |x−xi |≥ di |x − xi | % di di di 2 2 Rimane da dimostrare la seconda identità: 1 , 1 i − Rj | dµi (x) = Φi (Rj ) = |x |x − Rj | R3 2, di Z ma |xi − Rj | ≥ D(xi ) = di > di 2, se |xi − Rj | ≥ di 2, se |xi − Rj | < di 2, per cui il secondo caso non si verifica mai e l’uguaglianza è dimostrata. Capitolo 12 Stabilità di Seconda Specie Dopo aver discusso gli strumenti essenziali nei Capitoli precedenti siamo ora in grado di formulare e dimostrare il risultato più importate di quest’ultima parte del corso. Ricordiamo che il modello in questione è stato discusso nella Sezione 9.4 (si veda in particolare la Definizione 9.4). Teorema 12.1 (Stabilità della materia di seconda specie). Se Zj ≤ Z < +∞ per ogni j = 1, . . . , M , esiste una costante C < +∞ tale che E0 (N, M, Z) ≥ −CZ 2 (N + M ), (12.1) e in particolare la materia è stabile di seconda specie. Osservazione 12.1. Come già ampiamente discusso, un elemento cruciale della dimostrazione della stabilità è il principio di esclusione di Pauli, che assumerà concretamente la forma delle disuguaglianze di Lieb-Thirring. La natura fermionica degli elettroni è quindi essenziale per la stabilità e infatti vedremo nella Sezione 12.2 come la materia bosonica sia instabile di seconda specie. Osservazione 12.2. Nel nostro modello abbiamo sempre trascurato lo spin degli elettroni. Non è però troppo complicato tenerne conto e, assumendo che le particelle ammettano q stati di spin (quindi q = 2 per gli elettroni), la stima dal basso (9.39) diventerebbe E0 (N, M, Z) ≥ −CZ 2 q 2/3 (N + M ), e quindi il sistema risulterebbe ancora stabile di seconda specie. Dimostrazione. Il primo passo è la sostituzione di ogni Zj con Z, che è permessa dal Teorema 9.6. Abbiamo quindi E0 (N, M, Z) ≥ E0 (N, M, (Z, . . . , Z)). (12.2) Perciò da qui in poi consideremo un sistema con Hamiltoniana H definita nella (8.2) con Zj = Z per ogni j. A questo punto applichiamo la disuguaglianza di Baxter (Teorema 11.2): N X 1 (2Z + 1)α H≥ − ∆i − , 2 D(xi ) (12.3) i=1 cosı̀ che abbiamo già eliminato il problema del numero (ordine N M ) di termini del potenziale elettrostatico. Il passo successivo è l’uso delle disuguaglianze di Lieb-Thirring. Si sarebbe tentati di applicarle al potenziale 1/D(x) ma questo non può funzionare. Scriviamo allora per un certo b > 0 N N X X 1 1 H≥ − ∆i − (2Z + 1)α −b − (2Z + 1)N αb = hi − (2Z + 1)N αb, 2 D(xi ) i=1 i=1 147 148 dove hi = h(xi ) = − 12 ∆i − 1 D(xi ) + b. P Osserviamo ora che lo stato fondamentale dell’Hamiltoniana a N corpi hi è descritto nel Teorema 9.4 e quindi, se l’Hamiltoniana a un corpo h ha Ñ stati legati E0 ≤ . . . ≤ EÑ −1 ≤ 0, N X min(N,Ñ )−1 X hi ≥ i=1 Ei ≥ i=0 X Z Ei ≥ −L3,1 dx R3 i≥0 5/2 V− (x) = −CZ 5/2 Z dx R3 5/2 1 −b , D(x) + 1 dove abbiamo applicato le disuguaglianze di Lieb-Thirring (Teorema 10.1) al potenziale V (x) = − D(x) + b. Rimpiazziamo ora la definizione di D(x) = minj∈{1,...,M } |x − Rj | per ottenere 5/2 5/2 X 5/2 M 1 1 1 −b ≤ max −b ≤ −b , D(x) |x − Rj | j∈{1,...,M } |x − Rj | + + + j=1 da cui N X i=1 M Z X 5/2 5/2 Z 1 1 −b dx −b = −CZ 5/2 M |x − Rj | |x| 3 R3 + + j=1 R 5/2 5/2 Z ∞ Z 1 1 5/2 2 5/2 −b ≥ −CZ M −b dx d%% dx = −CZ M 1 |x| % |x|≤ 1b b 5/2 Z ∞ 1 2 5/2 −1/2 d%% dx ≥ −CZ M b −1 ≥ −CZ 5/2 M b−1/2 . (12.4) % 1 hi ≥ −CZ 5/2 dx L’ultimo passaggio è semplicemente l’ottimizzazione rispetto al parametro variazionale b > 0: H ≥ −CZ 5/2 M b−1/2 − (2Z + 1)N αb ≥ −CZ 2 N 1/3 M 2/3 , (12.5) dove abbiamo massimizzato il membro di destra scegliendo b= CZM 2/3 . N 2/3 Resta solo da usare la stima ab ≤ p1 ap + 1q bq con p = 3, q = 32 , a = N e b = M , per ottenere il risultato finale. 12.1 Dimostrazioni Alternative La prima dimostrazione della stabilità della materia di seconda specie risale al 1967 e tu ottenuta da Dyson, Lenard [DL]. Si tratta forse di uno dei primi veri risultati di fisica matematica, ma l’argomento che viene usato nella dimostrazione è piuttosto involuto e complicato. E’ curioso per esempio come venga utilizzato il principio di esclusione di Pauli, ovvero per mostrare che localmente in una palla di raggio R, N fermioni hanno energia cinetica almeno (N − 1)/R2 , perché solo una particella si può trovare nello stato a energia 0 (funzione d’onda costante). Il resto della dimostrazione consiste in una lunga serie di disuguaglianze che alla fine forniscono il risultato desiderato. Come anticipato, la dimostrazione che abbiamo presentato in queste note segue abbastanza da vicino quella di Lieb, Thirring del 1975 [LT]. Tuttavia il completamento della dimostrazione è ottenuto in modo differente da quanto fatto in [LT]: la strada che abbiamo seguito infatti è la più diretta per dimostrare la stabilità di seconda specie e l’idea che ne è alla base è discussa la prima volta in [So]. La dimostrazione proposta da Lieb, Thirring del 1975 passava invece attraverso lo studio della teoria di Thomas-Fermi, che approssima l’energia di un sistema di elettroni e nuclei interagenti attraverso un funzionale lineare – il 149 funzionale di Thomas-Fermi appunto – che dipende solo dalla densità a una particella ρ(x) associata alla funzione d’onda complessiva’: E TF [ρ] = c Z dxρ5/3 (x)− R3 M X j=1 Z dx αZj R3 X ρ(x) +α |x − Rj | i<j Z Z dy dx R3 R3 X Zk Z` ρ(x)ρ(y) +α . (12.6) |x − y| |Rk − R` | k<` Usando le disuguaglianze di Lieb-Thirring nella forma del Tereoma 10.2 si vede facilmente che il primo termine fornisce una stima dal basso dell’energia cinetica fermionica degli elettroni. Più complicato è raffinare la disuguaglianza di Baxter (si veda [LSe, Capitolo 6]) per ricostruire i due termini seguenti (secondo e terzo termine in (12.6)) dall’aspettazione del potenziale elettrostatico. In ogni caso si dimostra [LT] che il funzionale E TF fornisce una stima dal basso per l’energia E[Ψ]. Inoltre minimizzando E TF rispetto a ρ ≥ 0 sotto la condizione di normalizzazione kρk1 = N , si ottiene una quantità E TF (N, M, R, Z) e E0 (N, M, R, Z) ≥ E TF (N, M, R, Z), (12.7) e il problema della stabilità della materia di seconda specie è ridotto a dimostrare analoghe proprietà per l’energia dello stato fondamentale del funzionale di Thomas-Fermi. In particolare si può dimostrare che la stabilità di seconda specie per Thomas-Fermi è equivalente all’assenza di legame (vedi sotto) fra gli atomi, risultato già noto al tempo del lavoro di Lieb, Thirring (era stato dimostrato da Lieb, Simon in [LSi1]). Si noti che l’assenza di legame è una proprietà certamente falsa nella realtà, poiché gli atomi si legano per formare le molecole, tuttavia non vi è nulla di strano nel fatto che la stabilità della materia si possa ottenere dall’assenza di legame per una teoria efficace. In altri termini la teoria di Thomas-Fermi non fornisce una descrizione accurata della materia (tranne che nel limite di grande Z, ovvero per grande numero di atomi), ma ciò nonostante l’energia di Thomas-Fermi è una buona approssimazione dal basso dell’energia della materia. Più precisamente l’energia di Thomas-Fermi soddisfa le seguenti proprietà (si veda ad esempio [LSi2] per una review): P • E TF (N, M, R, Z) = E TF ( Zi , M, R, Z), cioè lo stato fondamentale di Thomas-Fermi è raggiunto per atomi neutri; • vale l’assenza di legame, ovvero E TF (N, M, R, Z) ≥ min M X E TF (Ni , 1, Ri , Zi ), Ni ≥ 0, j=1 M X i=1 Ni = N , cioè spostando i nuclei in modo che siano arbitrariamente lontani fra di loro si abbassa l’energia. Si noti che E TF (Ni , 1, Ri , Zi ) è in effetti indipendente da Ri ; • E TF (N, 1, 0, Z) = Z 7/3 E TF (N/Z, 1, 0, 1); che combinate fra di loro implicano che (è facile vedere che E TF (1, 1, 0, 1) < 0) E TF (N, M, R, Z) ≥ E TF (1, 1, 0, 1) M X j=1 7/3 Zj ≥E TF (1, 1, 0, 1)Z 4/3 M X Zj = E TF (1, 1, 0, 1)Z 4/3 N. (12.8) j=1 Successivamente molte altre strade sono state proposte per dimostrare la stabilità della materia. Le ometteremo per brevità, facendo riferimento alla monografia [LSe] per una discussione dettagliata. Si noti che la dimostrazione proposta in [LSe] è una via di mezzo fra quella originale di Lieb, Thirring (usa le disuguaglianze di Lieb-Thirring ma non la teoria di Thomas-Fermi) e quella che abbiamo presentato in queste note: anziché seguire la via più diretta si usa infatti una stima più raffinata dell’energia elettrostatica (stima dell’energia di Coulomb di scambio), che permette di ottenere costanti più realistiche nella stima finale e, in particolare, una migliore approssimazione dell’energia per particella. 150 12.2 Conseguenze della Stabilità di Seconda Specie Possiamo ora tornare al problema da cui siamo partiti, ovvero dal fatto che il volume occupato dalla materia sia molto maggiore di quanto ci si potrebbe aspettare (si veda l’introduzione a questa parte delle note). Una conseguenza diretta del Teorema 12.1 è precisamente che il volume occupato dalla materia cresce linearmente con il numero di componenti o, più precisamente, è proporzionale al numero di elettroni N che ne fanno parte. Il volume è quindi una quantità estensiva e come tale per un generico sistema (ad esempio un atomo) non può essere arbitrariamente piccola. Enunciamo anzitutto un semplice Corollario del Teorema 12.1: Corollario 12.1. Per ogni Ψ ∈ L2a (R3N ) normalizzata, esistono due costanti A ≥ 0 e K > 0, tali che E[Ψ] ≥ −AN, Z 5/3 T [Ψ] ≥ K dx ρΨ (x). (12.9) (12.10) R3 Dimostrazione. La dimostrazione è immediata: la prima disuguaglianza non è nient’altro che la (9.39) dove A = A(Z, M/N ) = CZ 2 (1+M/N ). La seconda stima è invece la forma delle disuguaglianze di Lieb-Thirring formulata nel Corollario 10.1. Teorema 12.2 (Estensività della materia). Sia Ψ ∈ L2 (R3N ) una qualunque funzione d’onda normalizzata che soddisfa (12.9) e (12.10), allora i) ∃γ > 0 tale che 1 N Z dx |x|ρΨ (x) ≥ γN 1/3 (12.11) R3 cioè la distanza media degli elettroni dall’origine è ∝ N 1/3 e quindi il volume occupato è proporzionale a N; ii) dato un qualsiasi misurabile Ω ⊂ R3 , esiste una costante c > 0 tale che |Ω| N 2/5 c ≥ N Z dx ρΨ (x), (12.12) Ω quindi perché Ω possa contenere una frazione macroscopica (ordine N ) di particelle, il suo volume deve essere anch’esso ordine N . Dimostrazione. Dimostriamo per prima cosa che per ogni λ ∈ (0, 1) vale la disuguaglianza (1 − λ)T [Ψ] + V [Ψ] ≥ − AN . 1−λ (12.13) Usiamo le proprietà delle dilatazioni e poniamo Ψλ (X) = (1 − λ)3N/2 Ψ((1 − λ)X). Chiamiamo inoltre Rλ = (1 − λ)−1 R. Allora il Corollario 12.1 implica che E[Ψλ ] = T [Ψλ ] + VRλ [Ψλ ] ≥ −AN, dove abbiamo indicato esplicitamente la dipendenza del potenziale dalla posizione dei nuclei. Un semplice calcolo però mostra che T [Ψλ ] = (1 − λ)2 T [Ψ], VRλ [Ψλ ] = (1 − λ)VR [Ψ], cosı̀ che la (12.13) è dimostrata. Riformulando la (12.13) e indicando E[Ψ] = E, otteniamo inoltre la stima T [Ψ] ≤ AN E + AN + . λ 1−λ (12.14) 151 A questo minimizziamo il membro di destra rispetto a λ ∈ (0, 1), che equivale a scegliere √ E + AN λ= √ , √ AN + E + AN da cui √ AN + √ E + AN Z 2 5/3 ≥ T [Ψ] ≥ K R3 dx ρΨ (x), (12.15) per la (12.10). Usiamo ora la disuguaglianza (12.16) con p = 1 dimostrata nel prossimo Lemma 12.1: Z −2 Z 11/3 Z −2 √ 2 p 11/3 dx |x|ρΨ (x) N dx ρΨ (x) dx |x|ρΨ (x) = CN , A + E/N + A ≥ C R3 R3 R3 che implica la (12.11). Consideriamo ora la (12.12): la disuguaglianza di Hölder e la (12.15) implicano che Z 2/5 Z 3/5 Z 5/3 dx ρΨ (x) ≤ dx dx ρΨ (x) ≤ C|Ω|2/5 N 3/5 , Ω Ω Ω e di conseguenza il risultato. Lemma 12.1. Per ogni p > 0, ∃Cp > 0 tale che Z dx ρ 5/3 R3 p/2 Z dx |x|p ρ R3 1+5p/6 Z ≥ Cp , (12.16) dx ρ R3 per ogni ρ ≥ 0. Dimostrazione. Anzitutto possiamo assumere che kρk1 = 1, perché se cosı̀ non fosse potremmo dividere ρ per la sua norma L1 ed è facile vedere che il rapporto al membro di sinistra della (12.16) sarebbe invariante sotto questa trasformazione. Voglaimo allora minimizzare il funzionale Z p/2 Z Z 5/3 p F[ρ] = dx ρ dx |x| ρ − λ dx ρ, (12.17) R3 R3 R3 sulle ρ non vincolate. Il moltiplicatore di Lagrange λ sarà poi fissato dalla richiesta di normalizzazione. Per trovare l’equazione di Eulero-Lagrange associata alla minimizzazione imponiamo per una Φ ∈ C0∞ (R3 ) positiva lim {F[ρ + εφ] − F[ρ]} = 0, ε→0 da cui si ricava l’equazione ( Z ) p/2−1 Z Z p/2 Z 5 5/3 p 2/3 5/3 p dx Φ(x) p dy ρ (y) dy |y| ρ(y) ρ (x) + dy ρ (y) |x| − λ = 0, 6 R3 R3 R3 R3 e di conseguenza ρ2/3 (x) = 1−p/2 kρk5/3 kρk5/3 6 λ − |x|p , p 5p k|x| ρk1 k|x|p ρk1 (12.18) + dove la parte positiva è necessaria al fine di ottenere un minimizzatore nel dominio. Più semplicemente l’equazione precedente ci dice che il minimizzatore è della forma ρ(x) = [a − b|x|p ]+ , (12.19) cioè è una funzione a supporto compatto che dipende da due parametri a e b. Imponendo la normalizzazione L1 si trova ci si riduce ad un solo parametro indipendente e ottimizzando l’energia F rispetto a tale parametro si può trovare il valore esplicito di Cp . Omettiamo i dettagli per brevità. 152 Per concludere questo Capitolo, consideriamo il caso dei bosoni. Come vedremo nel prossimo Teorema 12.3 se gli elettroni fossero bosoni la materia non sarebbe stabile della seconda specie. In particolare lo stato fondamentale sarebbe proporzionale a −CN 5/3 : Teorema 12.3 (Instabilità della materia bosonica). Consideriamo N bosoni carichi negativamente in interazione con M nuclei con carica nucleare uguale Z, allora esistono una Ψ ∈ L2s (R3N ) e una configurazione dei nuclei R tali che E[Ψ] ≤ −CZ 4/3 min {N, ZM }5/3 . (12.20) Osservazione 12.3. In effetti il risultato del Teorema 12.3 non è ottimale perché si può mostrare [Dy] che, tenendo conto dell’energia cinetica dei nuclei, l’andamento dell’energia dello stato fondamentale è leggermente migliore, cioè −CN 7/5 anziché N 5/3 . In ogni caso però un sistema bosonico resta instabile di seconda specie, anche se stabile di prima specie. Dimostrazione. Assumiamo per semplicità che M = n3 , n ∈ N, e il sistema sia neutro, cioè N = M Z. Per dimostrare la (12.20) valutiamo l’energia sullo stato di prova Ψ(X) = N Y φλ (xi ), φλ (x) = λ3/2 g(λx), (12.21) i=1 con λ > 0 parametro variazionale da scegliere in seguito e g ∈ C0∞ (R3 ) reale normalizzata in L2 (R3 ). E’ immediato calcolare Z 2 dx |∇g|2 + αλṼ (N, R, Z), (12.22) E[Ψ] = N λ R3 dove 1 Ṽ (N, R, Z) = N (N − 1) 2 N/Z Z X g 2 (x)g 2 (y) dx dy − NZ |x − y| R3 R3 Z Z j=1 dx R3 g 2 (x) + U (R, Z). |x − Rj | (12.23) Dimostreremo ora che esiste una configurazione R tale che Ṽ (N, R, Z) ≤ −CZ 2/3 N 4/3 . (12.24) Vediamo prima però che tale stima permette di completare la dimostrazione: E[Ψ] ≤ N λ2 T [g] − CαλZ 2/3 N 4/3 e ottimizzando rispetto a λ, cioè prendendo λ = CZ 2/3 N 1/3 , dove abbiamo riassorbito l’energia cinetica di g nella costante (assumendo ovviamente che T [g] > 0), otteniamo E[Ψ] ≤ −CZ 4/3 N 5/3 . (12.25) Dimostriamo ora la (12.24): dividiamo il supporto di g in M celle Γk tali che Z 1 dx g 2 = , M Γk e collochiamo il k−esimo nucleo nella cella Γk e mediamone la posizione rispetto alla distribuzione di probabilità M g 2 in Γk . In tal modo l’energia elettrostatica che otteniamo soddisferà la stima Z Z 1 1 2 2 g 2 (x)g 2 (y) dy Ṽ (N, R, Z) ≤ N (N − 1) − ZN M + Z M dx 2 2 |x − y| R3 R3 Z Z Z M M Z 1 2 2X g 2 (x)g 2 (y) 1 2 2X g 2 (x)g 2 (y) − Z M dx dy ≤− Z M dx dy 2 |x − y| 2 |x − y| Γj Γj Γj Γj j=1 j=1 (12.26) 153 poiché 12 N (N − 1) − ZN M + 12 Z 2 M 2 = − 21 N < 0. Infatti il secondo termine nella (12.23) diventa −N ZM M Z X j=1 dx g 2 (x) R3 Z dy Γj g 2 (y) = −N ZM |x − y| Z Z dy dx R3 R3 g 2 (x)g 2 (y) , |x − y| mentre il terzo 2 Z M 2 g 2 (x)g 2 (y) 1 dy dx = Z 2M 2 |x − y| 2 Γ` Γk XZ k<` Z Z Z dy dx R3 R3 g 2 (x)g 2 (y) |x − y| M X 1 − Z 2M 2 2 j=1 Z Z dx Γj dy Γj g 2 (x)g 2 (y) . |x − y| Dalla (12.26) possiamo poi stimare M X 1 Ṽ (N, R, Z) ≤ − Z 2 min 2 {µ, suppµ⊂Bj , µ(Bj )=1} j=1 Z Z dµ(x) Bj dµ(y) Bj 1 , |x − y| (12.27) dove abbiamo rimpiazzato Γj con la più piccola palla Bj che la contiene. E’ noto [LL, Sezione 11.15] che il minimo dell’energia di Coulomb di una distribuzione di carica unitaria a supporto contenuto in una palla di raggio r è raggiunto su una distribuzione uniforme supportata sulla superficie della palla e tale minimo è 1 uguale a 2r , cosı̀ che M 1 X 1 1 1 Ṽ (N, R, Z) ≤ − Z 2 ≤ − Z 2M 1 P , 4 r 4 j rj M j=1 j dove abbiamo usato la disuguaglianza di Jensen (prossimo Lemma 12.2). A questo punto resta solo da far 1 P vedere che per una g ragionevole M rj ≤ CM −1/3 , perché questo implicherebbe la (12.24). Un esempio semplice è quello che si può costruire prendendo g(x) = f (x)f (y)f (z) con suppf = [−1/2, 1/2]. Possiamo poi decomporre [−1/2, 1/2] in n intervalli Ij tali che Z 1 dx f 2 (x) = , n Ij e costruire i Γk come prodotto degli intervalli Ij . Ricordando che M = n3 per ipotesi, se prendiamo un rettangolo Γk di lati sk , tk , uk , abbiamo che rk = 1/2 1 1 2 sk + t2k + u2k ≤ (sk + tk + uk ), 2 2 da cui 1 X 1 X 3 X 3 X 3 3 rk ≤ (sk + tk + uk ) = sk = 3 |Ik | = = , M 2M 2M 2n 2n 2M 1/3 perché la lunghezza media degli intervalli Ik è proprio 1/n. Lemma 12.2 (Disuguaglianza di Jensen). Sia f una funzione convessa e µ una misura positiva su R, allora Z Z 1 1 dµ(x) f (x) ≥ f dµ(x) x . µ(R) R µ(R) R (12.28) Bibliografia Per la prima parte del corso (Capitoli 1, 2, 4 e 5) un buon riferimento è [GP1, GP2]: si tratta di un libro di fisica in cui però i problemi matematici, se non risolti, sono almeno citati. E’ utile come riferimento anche se più orientato verso l’aspetto fisico. Un altro testo di fisica sulla MQ che può essere conveniente consultare è [C-TDL1, C-TDL2]. Dal punto di vista matematico o fisico-matematico è difficile identificare un testo completo di riferimento. Un buon riferimento potrebbe essere la serie di cui [T3] è parte ma si tratta di approccio molto sintetico, di non facile lettura. Due testi avanzati di grande interesse ma con un approccio diverso all’introduzione della MQ sono [De, St]. Per il Capitolo 3 e molti dei risultati di analisi funzionale che usiamo nel corso il riferimento classico è [RS1, RS2, RS4]. Naturalmente si tratta di un testo enciclopedico in cui è facile perdersi, ma, almeno nel primo volume, i Capitoli introduttivi contengono un buon richiamo dei risultati di base sulla teoria della misura, gli spazi di Banach ecc.. Per il Capitolo 6 e 7 e in generale per tutti i risultati più tecnici di analisi funzionale il riferimento perfetto è [LL]: i temi Capitoli 6 e 7 sono in effetti contenuti in [LL, Capitolo 11]. Anche questo testo contiene una quantità enorme di informazione ma è certamente più sintetico del Reed-Simon e, soprattutto, si può considerare un compendio esaustivo degli strumenti essenziali dell’analisi funzionale moderna. Una lettura sistematica dall’inizio alla fine non è necessaria per il corso, ma è sicuramente molto istruttiva. I Capitoli 8–12 sono tratti da [LSe], con aggiunta e espansione di materiale. Anche in questo caso la lettura dell’intero testo non è necessaria. La si consiglia comunque a chi fosse interessato a fare un giorno ricerca in area fisico-matematica. [AS] M. Abramowitz, A. Stegun, Handbook of Mathematical Functions, Dover, 1965. [BC] J. Bellandi Fo, E.S. Caetano Neto, “The Mehler formula and the Green function of the isotropic multi-dimensional harmonic oscillator”, J. Phys. A: Math. Gen. 9 (1976), 683 – 685. [C-TDL1] C. Cohen-Tannoudji, B. Diu, F. Laloé, Quantum Mechanics, Volume One, Wiley-Vch, 2006. [C-TDL2] C. Cohen-Tannoudji, B. Diu, F. Laloé, Quantum Mechanics, Volume Two, Wiley-Vch, 2006. [De] G. Dell’Antonio, Aspetti Matematici della Meccanica Quantistica. Vol. 1: Matematica e Concettuale, Bibliopolis, 2011. [Dy] F.J. Dyson, Ground state energy of a finite system of charged particles,J. Math. Phys. 8 (1966), 1538 – 1545. [DL] F.J. Dyson, A. Lenard, Stability of matter I, J. Math. Phys. 8 (1967), 423–434; Stability of Matter II, J. Math. Phys. 9 (1968), 1538–1545. 154 Struttura 155 [GP1] A. Galindo, P. Pascual, Quantum Mechanics I, Springer-Verlag, 1978. [GP2] A. Galindo, P. Pascual, Quantum Mechanics II, Springer-Verlag, 1978. [E] P. Ehrenfest, Collected Scientific Papers, North-Holland Publishing, 1959. [J] J.H. Jeans, The Mathematical Theory of Electricity and Magnetism, Cambridge University Press, 1915. [LL] E.H. Lieb, M. Loss, Analysis, Graduate Studies in Mathematics 14, American Mathematical Society, 1997. [LSe] E.H. Lieb, R. Seringer, The Stability of Matter in Quantum Mechanics, Cambridge University Press, 2010. [LSi1] E.H. Lieb, B. Simon, Thomas-Fermi theory revisited, Phys. Rev. Lett. 31 (1973), 681–683. [LSi2] E.H. Lieb, B. Simon, Thomas-Fermi theory of atoms, molecules and solids, Adv. Math. 23 (1977), 22–116. [LT] E.H. Lieb, W. Thirring, Bound for the Kinetic Energy of Fermions which Proves the Stability of Matter, Phys. Rev. Lett. 35 (1975), 687–689. Errata ibid. (1975), 1116. [RS1] M. Reed, B. Simon, Modern Methods of Mathematical Physics II: Functional Analysis, Academic Press, 1972. [RS2] M. Reed, B. Simon, Modern Methods of Mathematical Physics II: Fourier Analysis, SelfAdjointness, Academic Press, 1975. [RS4] M. Reed, B. Simon, Modern Methods of Mathematical Physics IV: Analysis of Operators, Academic Press, 1978. [So] J.P. Solovej, Stability of Matter, Encyclopedia of Mathematical Physics 5 (2006), 8–14. [St] F. Strocchi, An Introduction to the Mathematical Structure of Quantum Mechanics, Advanced Series in Mathematical Physics 27, World Scientific, 2005. [T3] W. Thirring, A Course in Mathematical Physics 3: Quantum Mechanics of Atoms and Molecules, Springer-Verlag, 1979. [VN] J. Von Neumann, Mathematical Foundations of Quantum Mechanics, Princeton University Press, 1955.