Aspetti Matematici della Meccanica Quantistica

Appunti del corso
Aspetti Matematici della Meccanica Quantistica
(FM450 – A.A. 2014/15)
Michele Correggi
Dipartimento di Matematica e Fisica,
Università degli Studi Roma Tre,
L.go San Leonardo Murialdo, 1,
00146, Roma
email: [email protected]
11 luglio 2015
versione provvisoria
(riportare errori e refusi a [email protected])
Indice
I
Introduzione alla Meccanica Quantistica
5
1 Crisi della Fisica Classica
6
1.1 Meccanica Newtoniana e Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Corpo Nero e Effetto Fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Modelli Atomici: da Democrito a Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 I Postulati della Meccanica Quantistica
14
2.1 Cinematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Spazi di Hilbert e Teoria degli Operatori
3.1 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . .
3.2 Trasformata di Fourier, Spazi di Sobolev e Distribuzioni
3.3 Operatori Lineari . . . . . . . . . . . . . . . . . . . . . .
3.4 Operatore Aggiunto e Inverso . . . . . . . . . . . . . . .
3.5 Operatori Simmetrici, Autoaggiunti, Unitari e Proiettori
3.6 Principio di Indeterminazione . . . . . . . . . . . . . . .
3.7 Criterio di Autoaggiunzione e Estensioni Autoaggiunte .
3.8 Spettro e Risolvente . . . . . . . . . . . . . . . . . . . .
3.9 Teorema Spettrale e Interpretazione Probabilistica . . .
3.10 Caratterizzazione dello Spettro . . . . . . . . . . . . . .
3.11 Operatori Compatti . . . . . . . . . . . . . . . . . . . .
3.12 Matrice Densità e Stati Misti . . . . . . . . . . . . . . .
3.13 Teorema di Stone e Dinamica . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
23
25
28
32
36
37
42
46
54
57
59
60
4 Particella Libera e Oscillatore Armonico
4.1 La Particella Libera: Osservabili e Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Evoluzione Libera di Pacchetti d’Onda: Dispersione e Interferenza . . . . . . . . . . . . . . .
4.3 L’Oscillatore Armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
63
66
71
5 Atomo di Idrogeno
5.1 Autoaggiunzione e Stabilità
5.2 Spettro Energetico . . . . .
5.3 Momento Angolare . . . . .
5.4 Stati Legati . . . . . . . . .
77
77
80
84
88
II
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Stato Fondamentale e Stati Legati
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
6 Stato Fondamentale
95
6.1 Stabilità di Prima Specie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2 Esistenza dello Stato Fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
1
2
6.3
Unicità dello Stato Fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
7 Stati Eccitati
107
7.1 Proprietà degli Stati Eccitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
III
Stabilità della Materia
109
8 Stabilità di Prima Specie
9 Particelle Identiche e Stabilità di Seconda Specie
9.1 Spin e Particelle Identiche . . . . . . . . . . . . . .
9.2 Matrici Densità Ridotte . . . . . . . . . . . . . . .
9.3 Sistemi a Molti Corpi Non Interagenti . . . . . . .
9.4 Stabilità di Seconda Specie e Proprietà Preliminari
112
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
115
115
119
122
125
10 Disuguaglianze di Lieb-Thirring
128
10.1 Teoria di Birman-Schwinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
10.2 Dimostrazione delle Disuguaglianze di Lieb-Thirring . . . . . . . . . . . . . . . . . . . . . . . 135
11 Elettrostatica
138
12 Stabilità di Seconda Specie
147
12.1 Dimostrazioni Alternative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
12.2 Conseguenze della Stabilità di Seconda Specie . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
Notazione
• vettori in Rd o Cd saranno indicati con lettere in grassetto, ad esempio x o v, gli scalari in R o C
saranno invece indicati come, ad esempio, x e v; nel caso in cui non ci sia rischio di ambiguità useremo
inoltre la convenzione di indicare con x := |x| il modulo del relativo vettore;
• dati due vettori u e v in Rd il prodotto scalare sarà indicato con
u·v =
d
X
ui vi ,
i=1
mentre, usando la notazione ijk per il tensore di Levi-Civita totalmente antisimmetrico, il prodotto
vettore sarà indicato con
d
X
u×v =
ijk ui vj ei ;
i,j,k=1
• dato un qualunque numero z ∈ C indicheremo con z ∗ il suo complesso coniugato;
• il prodotto scalare in
Cd
sarà indicato come in
Rd
ovvero se z, w ∈
Cd ,
z·w =
d
X
zi∗ wi ;
i=1
• la palla di centro x ∈ Rd e raggio % > 0 sarà indicata con B% (x);
• per la derivata rispetto a x ∈ R useremo la notazione sintetica ∂x =
∂
∂x ;
• la funzione caratteristica di un insieme S sarà indicata con 1S (·);
• per le norme useremo sempre la notazione k · k; in assenza di ambiguità useremo tale espressione
anche per indicare la norma L2 , mentre le norme Lp saranno indicate con k · kp ;
• useremo la notazione H p (I) per indicare lo spazio di Sobolev di indice p > 0;
• dato uno spazio di Hilbert H useremo le seguenti notazione per gli spazi di operatori da H in se
stesso:
– L (H ) operatori lineari;
– B(H ) operatori limitati;
– L 1 (H ) operatori classe traccia;
– L 2 (H ) operatori Hilbert-Schmidt;
– L k (H ) ideale di Schatten di ordine k ∈ N;
• utilizzeremo spesso i simboli di Landau per lo studio degli andamenti asintotici: siano f (x) e g(x) ≥ 0
due funzioni continue di x, allora diremo che
|f |
≤ C < +∞;
x→0 g
– f = O(g), se lim
3
4
– f = o(g), se lim
x→0
|f |
= 0;
g
|f |
= C < +∞ e C > 0;
x→0 g
– f g, se f = o(g);
– f ∼ g, se lim
– f g, se f ≥ 0 e g = o(f );
con definizioni analoghe nel caso x → x0 o x → ∞.
Parte I
Introduzione alla Meccanica Quantistica
5
Capitolo 1
Crisi della Fisica Classica
Fondata sui pilastri della meccanica newtoniana (o hamiltoniana) e della teoria dell’elettromagnetismo di
Maxwell, la fisica alla fine del 1800 si presentava come una solida teoria in grado di descrivere i fenomeni
naturali fondamentali. Negli anni a cavallo fra la fine del secolo XIX e l’inizio di quello successivo, la scoperta
di una serie di fenomeni totalmente incompatibili con le teorie fisiche classiche e genericamente associati al
comportamento di oggetti microscopici portò ad una crisi che sarebbe state superata da lı̀ a poco solamente
con l’avvento della Meccanica Quantistica (MQ).
In questo capitolo, dopo alcuni brevi richiami sulla meccanica newtoniana e hamiltoniana e la teoria
dell’elettromagnetismo, discuteremo come avvenne storicamente questa rivoluzione.
1.1
Meccanica Newtoniana e Hamiltoniana
Rivediamo brevemente in questa Sezione i due pilastri su cui si fondava la fisica classica alla fine dell 1800,
la meccanica newtoniana e la teoria dell’elettromagnetismo.
Il sistema elementare in meccanica newtoniana è il punto materiale ovvero un massa m > 0 concentrata
in un punto nello spazio R3 , che può quindi essere individuato dalla posizione x ∈ R3 . Un’altra caratteristica
fisica che caratterizza il sistema è la carica elettrica e, che sarà poi rilevante per determinare come si interfaccia il punto materiale con la teoria dell’elettromagnetismo. La dinamica di tale sistema è completamente
descritta dall’equazione di Newton
mẍ = F(x, ẋ, t),
(1.1)
e dalle condizioni iniziali x(0) = x0 e ẋ(0) = v0 , cioè , sotto ragionevoli ipotesi di regolarità su F (ad esempio
F lipschitziana), una volta assegnati tali dati iniziali la traiettoria x(t), ẋ(t) è determinata ad ogni tempo
t ∈ R.
Il campo elettromagnetico è dato dalla coppia formata dal campo elettrico E(x) e dal campo magnetico
B(x), che sono entrambi funzioni vettoriali: Ω ⊂ R3 → R3 . I campi si ottengono risolvendo le equazioni di
Maxwell:
∇ · E = 4πρ,
1 ∂B
∇×E = −
,
c ∂t
∇ · B = 0,
4πj 1 ∂E
∇×B =
+
,
c
c ∂t
(1.2)
(1.3)
(1.4)
(1.5)
dove ρ è la densità di carica e j la densità di corrente. E’ curioso osservare che le equazioni di Maxwell sono
apparentemente 8 equazioni in 6 incognite, ma il sistema è comunque ben definito perché delle 8 equazioni
solo 6 sono indipendenti. E’ infatti facile vedere che le 2 equazioni vettoriali in aggiunta con le proprietà dei
dati iniziali implicano le due equazioni scalari: se poniamo E(0) = E0 , B(0) = B0 , con E0 , B0 tali che
∇ · E0 = 4πρ(0),
6
∇ · B0 = 0,
7
allora prendendo la divergenza delle due equazioni vettoriali otteniamo
∂t (∇ · E) + 4π∇ · j = 0
∂t (∇ · B) = 0,
e la seconda implica immediatamente ∇ · B = 0, mentre la prima combinata con l’equazione di continuità
∂t ρ + ∇ · j = 0,
(1.6)
dà la prima equazione di Maxwell. Una distribuzione di carica ρ(x, t) con corrente j(x, t) subisce nel campo
elettromagnetico E(x, t), B(x, t) la densità di forza
1
F(t) = ρ(x, t)E(x, t) + j(x, t) × B(x, t).
c
Nel caso elementare di un punto elementare ρ(x, t) = eδ(x − x(t)) e j(x, t) = eẋ(t)δ(x − x(t)) e si riottiene
la forza di Lorentz e l’equazione di Newton
e
mẍ = FLorentz (x, t) = eE(x, t) + ẋ × B(x, t).
c
(1.7)
Ricordiamo inoltre che la densità di energia del campo elettromagnetico è data dalla quantità
E(x, t) =
1
|E(x, t)|2 + |B(x, t)|2 .
8π
(1.8)
Il vettore di Poynting
1
E(x, t) × B(x, t),
8π
entra nella variazione dell’energia del campo elettromagnetico come descritto nella successiva
S(x, t) =
Proposizione 1.1 (Bilancio energetico del campo elettromagnetico).
Sia Ω ⊂ R3 una regione compatta e n il versore normale a ∂Ω in direzione uscente, allora
Z
Z
Z
∂t
dx E(x, t) = − dx j(x, t) · E(x, t) −
dσ n · S(x, t).
Ω
Ω
(1.9)
∂Ω
Osservazione 1.1. Una conseguenza più o meno diretta della precedente Proposizione 1.1 è che, se consideriamo un sistema di cariche confinato in una regione limitata, ad esempio contenuta in una palla di raggio
R, e i campi E e B decadono quando |x| → ∞ abbastanza rapidamente, cioè più velocemente di |x|−1 , il
secondo termine (di superficie) nella (1.9) si può trascurare. Se al contrario i campi decadono come |x|−1 o
più lentamente, nel qual caso si dicono radiativi, il termine di superficie dà un contributo finito e non nullo
per ogni t.
Ricordiamo ora alcuni concetti essenziali del formalismo hamiltoniano della meccanica classica: lo spazio
degli stati puri di un sistema classica è dato dell’insieme dei punti (p, q) nello spazio delle fasi Γ ⊂ R2d . Le
equazioni del moto vengono espresse attraverso una funzione speciale sullo spazio delle fasi, l’Hamiltoniana
del sistema H(p, q) : Γ → R che assumiamo tempo-indipendente e C 1 (Γ):
∂H
,
∂p
∂H
ṗ = −
,
∂q
q̇ =
(1.10)
con dati iniziali (p(0), q(0)) = (p0 , q0 ). Naturalmente la soluzione del problema di Cauchy determina la
traiettoria del sistema ad ogni tempo t ∈ R. Le Hamiltoniane di alcuni sistemi elementari sono qui di seguito
elencate:
8
• punto materiale o particella libera di massa m in Rd :
H=
|p|2
;
2m
• particella di massa m immersa nel campo conservativo V (q) (sottoposta alla forza F(q) = −∇V ):
H=
|p|2
+ V (q);
2m
• particella di massa m e carica e immersa nel campo elettrico generato da una carica puntiforme in R
di carica q:
|p|2
eq
H=
+
;
2m
|q − R|
• particella di massa m e carica e immersa nel campo magnetico B tale che B = ∇ × A per un potenziale
vettore A (si noti che la possibilità di porre B = ∇ × A è una conseguenza dell’equazione di Maxwell
∇ · B = 0):
1 e 2
H=
p− A ;
2m
c
con ovvie generalizzazioni al caso a più corpi.
Esercizio 1.1. Si dimostri a partire dalla forma della Hamiltoniana di una particella in un campo magnetico
che la forza a cui è sottoposta tale particella è la forza di Lorentz introdotta in precedenza.
Vista l’importanza che assumerà nelle applicazioni successive, scriviamo ad esempio l’Hamiltoniana di
N elettroni di carica −e, nel campo elettrico generato da M nuclei fissi di carica Zj e nei punti Rj e nel un
campo magnetico di potenziale vettore A:


N 
M
 X
2
X
X
2
Zj e
e
e2
1
pi − A(qi ) −
H(p1 , . . . , pN , q1 , . . . , qN ) =
+
.
 2m
c
|qi − Rj | 
|qi − qj |
i=1
j=1
i<j
Un caso particolare è quello dell’Hamiltoniana classica dell’atomo di idrogeno, ovvero un sistema composto
da un elettrone e un nucleo di carica e:
H(p, q) =
|p|2
e2
−
.
2m
|q|
Se il momento angolare dell’elettrone è non nullo, le traiettorie limitate del sistema (stati legati) sono ellissi
(o circonferenze), i cui semiassi sono variano con continuità come funzioni dell’energia del sistema. Se ne
ricava immediatamente che la distanza media dal nucleo dell’elettrone può in meccanica classica assumere
un intervallo continuo di valori, con un valore minimo corrispondente all’orbita con minima energia. Per
certi dati iniziali tuttavia, corrispondenti a momento angolare nullo, si può verificare il fenomeno di caduta
sul centro dell’elettrone, nel senso che esso raggiunge il nucleo in un tempo finito e la dinamica non è globale
nel tempo.
Altri problemi si presentano però quando si combina la descrizione classica con la teoria dell’elettromagnetismo: l’elettrone infatti muovendosi attorno al nucleo genera una distribuzione di carica tempo-dipendente
e quindi una densità di corrente date da
ρ(x, t) = −eδ(x − q(t)),
j(x, t) = −eq̇(t)δ(x − q(t)).
I campi elettrico e magnetico generati da tali densità di carica e corrente sono a loro volta tempo-dipendenti
e, se facciamo le seguenti ipotesi semplificative
sup |q̇(t)| c,
sup |q(t)| |x|,
t∈R
t∈R
q̈(t) 6= 0,
9
Figura 1.1: Leggi di Planck (P), Rayleigh-Jeans (RJ) e Plank (P) [GP1, p. 3].
ovvero assumiamo che la velocità dell’elettrone sia molto più piccola di quella della luce, valutiamo i campi a distanze molto maggiori di quella dell’elettrone dal nucleo e infine richiediamo che l’accelerazione
dell’elettrone non si annulli mai, allora si ha
e
c
B(x, t) =
q̈ t −
× x̂,
E(x, t) = B(x, t) × x̂,
4πc2 |x|
|x|
dove abbiamo indicato con x̂ = x/|x|. Pertanto i campi generati dall’elettrone sono radiativi e nel bilancio
energetico del campo elettromagnetico il termine di bordo della (1.9) dà un contributo non nullo. Un’analisi
più raffinata mostra che, per dati iniziali generici, l’energia del sistema all’interno di una palla di raggio
grande in effetti diminuisce a causa del campo elettromagnetico prodotto dall’elettrone, che quindi perdendo
energia tende ad avvicinarsi e infine a cadere sul nucleo.
1.2
Corpo Nero e Effetto Fotoelettrico
Storicamente il primo fenomeno a cui si associa l’inizio della crisi della fisica classica è il corpo nero o,
per meglio dire, la spiegazione della radiazione emessa da tale sistema fisico. Descriviamo meglio di cosa
si tratta: Kirchhoff fu il primo a proporre nel 1860 la definizione di corpo nero come un oggetto fisico
che assorbe tutta la radiazione elettromagnetica con cui venga irraggiato. Una realizzazione sperimentale
di questo oggetto ideale si può costruire immaginando di prendere un cubo cavo mantenuto a temperatura
costante e di praticare nella superficie un piccolo foro. La radiazione che entra nel foro verrà riflessa infinite
volte all’interno della cavità e, se il foro è abbastanza piccolo, non potrà mai uscirne. D’altra parte benché
la radiazione entrante non possa mai emergere dal foro, esso emette una radiazione caratteristica, detta
appunto radiazione di corpo nero, che si osserva essere indipendente dalla forma della cavità e dagli altri
parametri del sistema, ad eccezione della temperatura T . Più precisamente l’intensità di radiazione u(ν, T )
ha un andamento classico, con u che tende a 0 quando ν → 0, +∞ ed ammette un unico massimo (il
dato sperimentale è sostanzialmente sovrapponibile alla legge di Planck della Fig. 1.2). Per spiegare tale
andamento in ambito classico furono proposti due modelli alternativi. Wien, partendo dall’ipotesi che le
particelle del corpo fossero distribuite secondo la statistica di Maxwell, derivò la legge di Wien (β costante
universale)
βν
(1.11)
u(ν, T ) = Cν 3 e− T ,
10
che approssimava abbastanza bene l’andamento a grandi frequenze dell’intensità osservata sperimentalmente,
ma si discostava in modo significativo per piccole frequenze. Viceversa il modello proposto da Rayleigh nel
1900 e corretto qualche anno più tardi da Jeans nel 1905 si basava sull’ipotesi che le particelle della superficie
della cavità potessero essere descritte come oscillatori armonici in interazione con il campo elettromagnetico.
Sotto queste ipotesi fu derivata la legge di Rayleigh-Jeans
u(ν, T ) = Cν 2 T,
(1.12)
che era in ottimo accordo con i dati sperimentali per piccole frequenze, mentre ovviamente si discostava in
modo sensibile appena la frequenza si allontanava da 0. Nella Fig. 1.2 si può vedere un confronto grafico fra
le due leggi, con anche un ingrandimento attorno a ν = 0. Come risulta evidente già a un primo sguardo le
due leggi sono del tutto incompatibili e nessuna delle due dà una spiegazione soddisfacente della radiazione
da corpo nero.
La soluzione del problema fu data nel 1900 da Planck il quale riprese il modello di Rayleigh-Jeans ma
assunse che le energie accessibili agli oscillatori della cavità fossero un insieme discreto. Più precisamente i
livelli energetici raggiungibili dagli oscillatori erano nel modello di Planck dati da
En = nhν,
con h nuova costante fisica – da quel momento in poi chiamata costante di Planck – con le dimensioni di
un’azione e esplicitamente uguale a
h = 2π · 6.582 · 10−22 Mev · s.
(1.13)
La legge ricavata da Planck a partire dal modello appena descritto è quella che sappiamo oggi descrivere
precisamente la radiazione da corpo nero per ogni ν e cioè
1
u(ν, T ) = Cν 2
e
hν
kB T
,
(1.14)
−1
dove abbiamo indicato con kB la costante di Boltzmann.
L’ipotesi di discretizzazione o quantizzazione dell’energia nel modello di Planck non aveva naturalmente
nessuna giustificazione classica e fu in effetti il nucleo da cui cominciò a svilupparsi la teoria quantistica.
Non entreremo qui nel dettaglio della storia dell’affermazione scientifica della MQ, ma citeremo brevemente un altro caso in cui l’ipotesi di quantizzazione fu essenziale per spiegare un fenomeno classicamente
incomprensibile. Si tratta dell’effetto fotoelettrico: illuminando una lastra di metallo con una radiazione
elettromagnetica si osserva la produzione di elettroni. Tale effetto era noto a livello sperimentale sin dagli
ultimi anni del XIX secolo, ma constuiva un mistero dal punto di vista teorico, a causa delle proprietà
caratteristiche del fenomeno e, in particolare, le seguenti:
• il numero di elettroni (intensità di corrente) è proporzionale all’intensità della radiazione
elettromagnetica;
• esiste una frequenza di soglia ν0 > 0 tale che se ν < ν0 non sono emessi elettroni;
• l’energia cinetica massima degli elettroni è proporzionale alla differenza ν − ν0 e non dipende
dall’intensità della radiazione.
Soprattutto le ultime due proprietà non avevano nessuna spiegazione classica plausibile, poiché la radiazione
elettromagnetica può scambiare quantitità arbitrarie di energia con gli elettroni del metallo. Einstein nel
1905 fece sua l’ipotesi di quantizzazione di Planck, applicandola alla radiazione elettromagnetica e supponendo che essa fosse composta da quanti di energia hν, cioè proporzionale alla frequenza della radiazione.
Tali ipotesi si dimostrò sufficiente per cosntruire un modello accurato dell’effetto fotoelettrico, tanto che
Millikan nel 1916 usò l’effetto fotoelettrico per misurare la costante di Planck.
11
1.3
Modelli Atomici: da Democrito a Bohr
L’idea che la materia sia composta da elementi microscopici identici fra loro risale addirittura ai filosofi
presocratici greci nel V secolo a.C.. Ad esempio Democrito fondava il suo modello di realtà sull’esistenza di
tali constituenti elementari, che chiamò appunto atomi, i quali muovendosi in modi differenti si combinavano
per formare tutta la varietà di sostanze note.
L’ipotesi atomica fu poi abbandonata per lungo tempo fino a tornare in auge a partire dal XVIII secolo
grazie ai primi sperimenti di chimica di Dalton, Lavoisier, etc., i quali si accorsero che una teoria atomica
si sarebbe ben sposata con le prime regole empiriche della chimica. Similmente Brown osservò che le
traiettorie di moto – da allora detto browniano – di particelle microscopiche in soluzione acquose avevano
una spiegazione naturale ipotizzando urti frequenti fra le particelle e i costituenti (atomi o molecole) della
soluzione in agitazione termica. Il consenso non era però molto diffuso tanto che ancora alla fine del 1800
Mach e Ostwald dibattevano contro l’esistenza degli atomi o, più precisamente, la necessità dell’ipotesi
atomica, sottolineando soprattuto l’impossibilità di verificarla sperimentalmente.
Le cose cambiarono però all’inizio del 1900 quando un numero notevole di evidenze sperimentali sull’esistenza degli atomi cominciò ad accumularsi. Le informazioni di cui si disponeva riguardo alle proprietà
degli atomi erano consistenti e si possono riassumere nella lista seguente:
• il raggio di un atomo è ' 10−8 cm;
• la massa di un atomo è ' 10−24 g;
• gli atomi sono caricamente neutri;
• gli atomi contengono elettroni con carica −e, e ' 10−10 C, e massa me ' 9.1 · 10−31 Kg;
• se compliti da radiazione elettromagnetica gli atomo la assorbono e quindi emettono a loro volta
radiazione elettromagnetica le cui frequenze possono essere misurate (spettri atomici di assorbimento
o emissione).
Nel 1885 Ballmer raccolse tutti i dati sperimentali sullo spettro di emissione dell’atomo di idrogeno e
mostrò che esso contiene righe di emissione alle frequenze
1
1
νm,n = cRH
−
,
m < n ∈ N,
(1.15)
m2 n2
dove RH è una costante misurata sperimentalmente – il Rydbergh – e c è la velocità della luce.
Per spiegare la grande mole di dati sperimentali riguardo agli spettri atomici vari modelli di atomo
cominciarono ad essere proposti a partire da inizio 1900. Si va dal modello planetario di Perrin nel
1901 al modello a panettone di Thomson nel 1904, fino a quello di Rutherford nel 1911. Ciascun
modello proponeva un aggiustamento della descrizione classica che combinava la meccanica newtoniana con
l’elettromagnetismo di Maxwell e, come abbiamo visto, produceva atomi instabili. Il modello planetario è
sostanzialmente il più ingenuo, in quanto prescinde in qualche senso dagli effetti elettromagnetici descrivendo
l’atomo di idrogeno come un satellite (elettrone) che ruota attorno al suo pianeta (nucleo). Nel modello
a panettone invece l’atomo è descritto come una distribuzione di carica positiva – la carica nucleare –
nella quale sono immerse cariche puntiformi negative – gli elettroni. In realtà tale modello fu abbandonato
quasi subito per il fatto che si scontrava con l’evidenza sperimentale (vedi sotto) che il volume occupato da
un atomo fosse in realtà per la maggior parte vuoto, cioè che elettroni e nucleo occupassero una frazione
minuscola di tale volume.
Il modello di Rutherford dell’atomo di idrogeno del 1911 constituiva in realtà un ritorno al modello
planetario, in cui l’elettrone ruota su un’orbita ellittica attorno al nucleo (di dimensioni ' 10−13 cm) ad una
distanza dell’ordine di 10−8 cm. I motivi dietro al ritorno a tale descrizione stavano nei risultati sperimentali
ottenuti da Rutherford studiando l’interazioni di particelle α con atomi d’oro: un fascio di quelle che oggi
sappiamo essere particelle α, cioè nuclei di He venivano sparati contro una sottilissima lamina d’oro di
spessore ' 10−5 cm, per essere poi registrate dopo l’attraversamento della lamina. Quello che si osservava
12
era che la maggior parte delle particelle non veniva affatto deflessa come se lo spazio occupato dagli atomi
fosse una frazione molto piccola del volume della lamina d’oro, il che chiaramente escludeva il modello di
Thomson. Inoltre osservando le particelle deflesse si ricavava una dimensione lineare del volume occupato
dall’atomo dell’ordine di 10−8 cm. Il modello planetario era in perfetto accordo con questi dati sperimentali,
ma, come sappiamo, aveva problemi molto più profondi, prevedendo un atomo instabile.
Dopo alcuni tentativi infruttuosi come il principio di combinazione proposto da Ritz nel 1908, una
soluzione parziale al paradosso del modello planeterio fu trovata da Bohr nel 1913, sfruttando ancora una
volta l’ipotesi di quantizzazione di Planck e Einstein. L’idea euristica prendeva spunto dal fatto che la
nuova costante h introdotta da Planck avesse le dimensioni di un’azione, cosı̀ che combinando nel modo più
semplice possibile i parametri fondamentali dell’atomo di idrogeno per trovare una lunghezza si ottiene la
quantità mhe e2 ' 10−8 , cioè esattamente l’ordine di grandezza del raggio dell’atomo di idrogeno. Il modello
atomico di Bohr si fonda sui seguenti postulati:
• tranne che quando è coinvolto il campo elettromagnetico, sia nel fenomeno di emissione che di assorbimento, il moto dell’elettrone è descritto dalle equazioni del moto classiche (di Newton). In particolare
l’elettrone si muove su traiettorie ellittiche attorno al nuceo ma non irraggia onde elettromagnetiche;
• i livelli energetici accessibili dell’atomo sono discreti;
• l’energia dei livelli energetici En è fissata dalla condizione di quantizzazione
|L| = ~n,
n ∈ N,
(1.16)
dove |L| è il modulo del momento angolare;
• l’emissione/assorbimento di onde elettromagnetiche avviene solo quando l’elettrone passa da un livello
En ad un altro Em e, in tal caso, l’energia del fotone emesso/assorbito è data da hν = |En − Em |.
Vediamo ora cosa implica la condizione di quantizzazione. Supponiamo per semplicità che l’orbita classica
sia una circonferenza nel piano x, y, cioè che l’energia coincida col minimo del potenziale efficace. In questo
caso abbiamo che |L| = mr2 ω = ~n, dove ω è la velocità angolare e r raggio dell’orbita e dall’uguaglianza
della forza centrifuga con l’attrazione elettrostatica
e2
L2
~2 n2
2
=
mω
r
=
=
,
r2
mr3
mr3
da cui ricaviamo
L2
e2
1 me4
1 me4
1 mα2 c2
−
=
−
=
−
=
−
,
2mr2
r
2 L2
2 ~2 n2
2 n2
dove abbiamo usato la costante di struttura fine α ' 1/137. Il raggio dell’orbita n−esima è
En =
(1.17)
~2 n2
.
(1.18)
me2
Nel caso dello stato ad energia più bassa, ovvero per n = 1, si ottiene r1 ' 0.52 ◦ A in ottimo accordo con gli
esperimenti. Le frequenze νm,n delle righe di emissione/assorbimento sono ottenute dalle regole del modello
e si ricava immediatamente che
mα2 c2
1
1
−
,
(1.19)
νm,n =
4π~
m2 n2
in perfetto accordo con la regola empirica di Ballmer.
rn =
Esercizio 1.2. Si dimostri che limn→∞ νn,n+1 = νe , dove νe = 2π/Te è la frequenza del moto circolare
dell’elettrone.
Nella trattazione quantistica dell’atomo di idrogeno vedremo che i livelli energetici e la relativa quantizzazione
emergeranno naturalmente e che il modello di Bohr non è in realtà cosı̀ accurato, se si eccettuano le energie
En . In effetti già pochi anni dopo l’introduzione del modello di Bohr ci si rese conto che esso non poteva
spiegare l’intera mole di risultati sperimentali riguardo agli atomi, e, in particolare, due problemi risaltavano
particolarmente:
13
• come estendere la descrizione agli atomi con più elettroni?
• gli atomi sono contiuamente sottoposti a radiazioni elettromagnetiche ma non si osserva un’emissione
continua di radiazione, come mai?
Il modello di Bohr fu perciò modificato e affinato portando alla regola di quantizzazione di Bohr,
Sommerfeld e, gradatamente, alla formulazione organica della MQ.
Capitolo 2
I Postulati della Meccanica Quantistica
In questo capitolo presenteremo i postulati su cui è costruita la MQ, seguendo la storica impostazione di
Von Neumann [VN]. Sarà fin da subito evidente come la stuttura matematica della MQ sia particolarmente
ricca, tanto da poter affermare che una parte notevole dell’analisi funzionale moderna sia stata sviuppata
in ragione della rilevanza in ambito quantistico. Al contempo vedremo però come questa ricchezza sia
alla base della necessità di interpretazione non banale della MQ, che individui una corrispondenza fra gli
oggetti matematici della teoria e le grandezze fisiche coinvolte negli esperimenti, e come questo rappresenti
a tutt’oggi un problema senza una soluzione soddisfacente.
2.1
Cinematica
Le regole della cinematica quantistica rappresentano, come per ogni teoria fisica, il cuore della teoria stessa,
identificando gli oggetti matematici, che rappresentano le grandezze fisiche misurate negli esperimenti, e
fornendo le regole per estrarre previsioni sui dati sperimentali da tali oggetti matematici.
Il primo e secondo postulato riguardano rispettivamente stati e osservabili, mentre il terzo e in una certa
misura il quarto costituiscono i fondamenti dell’interpretazione della MQ.
Postulato 1 (Stati puri).
Gli stati puri di un sistema quantistico al tempo t ∈ R sono raggi unitari |Ψ(t)i in uno spazio di Hilbert
separabile H su C.
Si noti l’aggettivo puri nel postulato precedente che qualifica il tipo di stati. Vedremo che non si tratta del
tipo più generale di stati e che esiste una classe più ampia formata dagli stati misti (si veda la Sezione 3.12).
Postulato 2 (Osservabili).
Le osservabili di un sistema quantistico con spazio di Hilbert H sono operatori linaeri autoaggiunti su H .
Le grandezze fisiche di un sistema quantistico sono pertanto rappresentate da operatori in L (H ). E’
importante sottolineare a questo stadio che non si suppone necessariamente vero il contrario, ovvero non si
assume che tutti gli operatori autoaggiunti su H siano effettivamente osservabili.
Postulato 3 (Interpretazione).
Dato uno stato |Ψ(t)i di un sistema quantistico al tempo t ∈ R e un’osservabile A,
• i possibili valori della misura di A su |Ψ(t)i al tempo t sono i punti dello spettro σ(A) ⊂ R
dell’operatore A;
• la probabilità PA,Ψ (I) che nella misura si ottenga un valore λ ∈ I borelliano contenuto in σ(A) è
PA,Ψ (I) = kEA (I)Ψ(t)k2 ,
dove EA (I) indica il proiettore spettrale di A relativo al borelliano I.
14
(2.1)
15
La natura probabilistica della MQ fa quindi la sua comparsa in questo terzo postulato, associando ai possibili
risultati di un esperimento delle probabilità e quindi frequenze di visita: ripetendo il medesimo esperimento
di misura di A sullo stato |Ψ(t)i al tempo t, si registreranno diversi valori di A, con frequenze sempre più
vicine al valore asintotico dato dalle probabilità (2.1). Una conseguenza diretta del terzo postulato è inoltre
che il valor medio della misura dell’osservabile A nello stato |Ψ(t)i, ovvero la media di valori ottenuti in un
numero arbitrariamente grande di esperimenti identici, è dato dal valore di aspettazione di A su |Ψ(t)i:
hAi := hΨ(t)| A |Ψ(t)i .
(2.2)
Il quarto e ultimo postulato della cinematica quantistica è in realtà quello più controverso e che ancora
oggi non si considera una soluzione soddisfacente al problema della misura in MQ. Non lo presenteremo
perciò qui nel dettaglio (si veda per maggiori informazione, per esempio, [GP1, Capitolo 2.8]) ma commenteremo soltanto il suo ruolo nell’interpretazione della MQ. Le regole introdotte in precedenza sarebbero
infatti perfettamente sufficienti per costruire una cinematica completa, ma vi è la necessità di dare una definizione del processo di misura. Sfortunatamente questo non è possibile all’interno della stessa MQ, se non a
patto di generare paradossi inaccettabili, poiché l’apparato di misura è tipicamente costituito da un oggetto
macroscopico, che come tale obbedisce alle regole della meccanica classica. Si dovrebbe perciò fornire un
modello che renda compatibile il carattere probabilitisco della MQ con l’assenza di incertezza (eccetto quella
insita nell’errore sperimentale) tipico di ogni misura classica.
Una possibile soluzione (debole) del problema è quello di ammettere questa separazione fra mondo microscopico quantistico e mondo macroscopico classico e fornire una regola empirica per descrivere l’interazione
fra i due che avviene negli esperimenti (appunto il Postulato 4). Si è soliti spiegare tale interazione sottolineando il fatto che ogni misura genera una perturbazione del sistema in oggetto e quindi ne modifica lo stato.
Tale spiegazione è tuttavia poco soddisfacente e anche problematica alla luce dei recenti esperimenti in cui
misure indirette permettono di ricavare informazione dal sistema microscopico senza perturbarne lo stato.
Altre soluzioni sono state proposte, ma nessuna totalmente accettabile o più soddisfacente della regola su
cui si fonda la cosı̀ detta interpretazione di Copenhagen della MQ, ovvero il collasso della funzione d’onda:
in estrema sintesi, se la misura1 dell’osservabile A dà come risultato un suo autovalore non degenere λ, allora
dopo la misura il sitema si troverà nel relativo autostato.
2.2
Dinamica
Per completare la descrizione di un sistema quantistico è necessario specificare una dinamica, ovvero un
legge che descriva l’evoluzione temporale del sistema. Più precisamente da cosa è dato lo stato del sistema
al tempo t > 0 se al tempo t = 0 esso si trovava nello stato (puro) |Ψ0 i?
L’ultimo Postulato2 della MQ riguarda precisamente questa questione:
Postulato 5 (Dinamica).
Se al tempo t = 0 un sistema quantistico si trova nello stato |Ψ0 i, allora il suo evoluto al tempo t > 0 è lo
stato |Ψt i che si ottiene risolvendo l’equazione di Schrödinger
i~∂t |Ψt i = H(t) |Ψt i ,
(2.3)
con dato iniziale |Ψt=0 i = |Ψ0 i e dove H(t) è un’osservabile speciale detta hamiltoniana del sistema.
1
Più precisamente il Postulato 4 si applica alle cosı̀ dette misure di prima specie o preparazioni che vanno dinstinte dalle
misure di seconda specie: in quest’ultimo caso l’interferenza dell’apparato di misura con il sistema è cosı̀ drastica che il sistema
stesso non sopravvive alla misura (ad esempio quando una particella è registrata su uno schermo), mentre nel primo caso si
presuppone che dopo la misura il sistema continui ad esistere ed evolvere secondo le regole della dinamica quantistica (si veda
la Sezione 2.2).
2
Per la numerazione seguiamo la tradizione di indicare quest’ultimo Postulato come quinto, anche se ne abbiamo formulati
esplicitamente solo 3. Il motivo è che abbiamo tralasciato di discutere il Postulato 4, brevemente accennato nella precedente
Sezione.
16
Osservazione 2.1. Come è evidente dal precedente Postulato la dinamica di un sistema quantistico è
data da un problema di Cauchy nello spazio di Hilbert H degli stati del sistema. Questo è analogo a
quanto si verifica nel caso dei sistemi classici. Tuttavia vedremo che vi è una differenza sostanziale nella
soluzione della dinamica: in meccanica classica sono notoriamente necessarie delle assunzioni di regolarità
sull’hamiltoniana del sistema, mentre la dinamica quantistica risulta essere più regolare e, sotto le ipotesi
del Postulato 5, esiste sempre un’unica soluzione dell’equazione (2.3) (si veda la Sezione 3.13).
Osservazione 2.2. E’ importante sottolineare che l’esistenza dell’hamiltoniana del sistema è in effetti una
parte rilevante del postulato, nel senso che la dinamica di un sistema quantistico è totalmente identificata
dalla sua hamiltoniana (Sezione 3.13 per ulteriori dettagli).
Alla luce delle due Osservazioni precedenti e in particolare della seconda, risulta evidente che ogni sistema
quantistico è univocamente individuato dallo spazio dei suoi stati – lo spazio di Hilbert H – e dall’hamiltoniana H(t) che ne genera la dinamica. In realtà un’ulteriore ipotesi che spesso non viene esplicitamente
discussa riguarda le grandezze fisiche osservabili: si assume infatti in assenza di ulteriori specificazioni che
tutti gli operatori autoaggiunti su H siano osservabili. Tuttavia quest’ipotesi presenta molti aspetti discutibili, anche in termimi di interpretazione della teoria. Non approfondiremo oltre la questione in questa
sede.
Si noti però che l’indentificazione di un sistema fisico con il suo spazio degli stati e la dinamica che lo
caratterizza è tipico anche della meccanica classica e, più in generale, di ogni teoria fisica: la descrizione
di qualunque sistema fisico è infatti caratterizzata anzitutto dall’insieme delle grandezze fisiche misurabili
(che sia per la MQ che per la meccanica classica si assume essere massimale, come discusso in precedenza)
e dall’insieme degli stati che associano alle osservabili il relativo valore di aspettazione (un numero reale);
l’evoluzione temporale è quindi definita in termini di un problema di Cauchy. In ambito classico questi
tre elementi sono dati rispettivamente dallo spazio delle fasi, i cui punti sono gli stati puri, dalle funzioni
continue su di esso e dalle equazioni di Hamilton dell’evoluzione temporale. In MQ i corrispettivi sono invece
lo spazio di Hilbert (o più propriamente lo spazio dei raggi in uno spazio di Hilbert separabile), gli operatori
autoaggiunti su tale spazio e l’equazione di Schrödinger.
Capitolo 3
Spazi di Hilbert e Teoria degli Operatori
Questo capitolo è dedicato ad un richiamo delle nozioni fondamentali riguardanti la teoria degli spazi di
Hilbert e degli operatori lineari agenti su di essi. Non discuteremo le dimostrazione della maggior parte dei
risultati presentati, ma proporremo un ampia scelta di esempi ed esercizi per familiarizzare con i concetti
chiave della teoria. Rivedremo poi in forma critica i postulati della MQ, sfruttando gli strumenti appena
introdotti per ricavarne conseguenze e generalizzazioni. In particolare vedremo come l’interpretazione probabilistica della MQ sia una conseguenza naturale dei primi due Postulati della teoria, applicando il teorema
spettrale agli operatori autoaggiunti (osservabili) sullo spazio di Hilbert.
3.1
Spazi di Hilbert
Partiamo dunque dalla seguente
Definizione 3.1 (Spazio di Hilbert).
Uno spazio di Hilbert H su C è uno spazio vettoriale su C su cui sia definito un prodotto scalare
h·| ·i: H × H → C e che sia completo rispetto alla metrica associata alla norma kuk2 := hu| ui indotta dal
prodotto scalare.
Ricordiamo che un prodotto scalare è un applicazione bilineare1 , positiva e non degenere. La metrica associata
alla norma k · k è naturalmente definita come
u, v ∈ H .
dist (u, v) = ku − vk ,
Ricordiamo inoltre che uno spazio metrico è completo se ogni successione di Cauchy è convergente e che gli
spazi di Hilbert sono casi speciali di spazi di Banach in cui la norma è indotta da un prodotto scalare.
Esempio 3.1
1. Un
banale di spazio di Hilbert è CN , N ∈ N, con il prodotto scalare standard (x, y) = x · y =
PNesempio
∗
i=1 xi yi ;
2. per ogni aperto I ⊂ Rd ,
Z
2
L (I, dx) := f misurabili dx |f (x)| < +∞ ,
2
(3.1)
I
è uno spazio di Hilbert con dx misura di Lebesgue in Rd . Naturalmente il prodotto scalare è dato da
Z
hf | gi := dx f ∗ (x)g(x).
(3.2)
I
Più in generale ogni L2 (B, dµ) con B borelliano in Rd e µ misura borelliana regolare è ancora uno
spazio di Hilbert;
1
Assumeremo sempre che il prodotto scalare sia antilineare nella prima componente e lineare nella seconda.
17
18
3. lo spazio delle successioni quadrato sommabili, i.e.,
X
2
`2 (Z) := {un }n∈Z , un ∈ C |un | < +∞ ,
(3.3)
n∈Z
è anch’esso uno spazio di Hilbert, il cui prodotto scalare è la naturale generalizzazione di quello su
CN .
Definizione 3.2 (Raggio).
Un raggio unitario |Ψi nello spazio di Hilbert H è , dato un certo Ψ ∈ H con kΨk = 1, la classe di
equivalenza
|Ψi := eiα Ψ, α ∈ R .
(3.4)
In effetti la definizione (3.4) definisce una relazione di equivalenza in H , che a sua volta può essere usata
per definire un opportuno spazio proiettivo a partire da H e idenficare con esso lo spazio degli stati di un
sistema quantistico. Non svilluperemo oltre questo tipo di approccio.
Il Postulato 1 può dunque essere riformulato nel seguente modo: gli stati puri di un sistema quantistico
sono vettori in H normalizzati definiti a meno di una fase globale (costante). Vedremo come quest’ultima
richiesta sia compatibile con il Postulato 3, nel senso che sia il valore di aspettazione che le probabilità dei
valori misurati sono indipendenti dal rappresentativo scelto per il raggio |Ψi.
La notazione che abbiamo usato per indicare i raggi in H è quella tipicamente usata dai fisici: l’espressione |Ψi si chiama2 ket di Ψ ed è la controparte del bra di Ψ, i.e., hΨ| che non è nient’altro che un elemento
del duale dello spazio dei ket. Grazie al teorema di Riesz (si veda il prossimo Teorema 3.6) lo spazio dei
ket è in corrispondenza uno a uno con lo spazio dei bra e dunque per ogni Ψ ∈ H ha senso l’espressione
hΨ|. Inoltre hΨ |Φ i ∈ C è dato dal prodotto scalare usuale fra Ψ e Φ, dove Ψ e Φ sono due rappresentativi
dei raggi in questione. Chiaramente il prodotto scalare dipende dalla scelta dei rappresentativi, ma il suo
modulo oppure l’aspettazione di un osservabile su un singolo stato |Ψi, che sono le uniche quantità con
significato fisico (si veda il Postulato 3), ne sono indipendenti.
Come abbiamo visto un esempio di spazio di Hilbert sono gli spazi vettoriali finito dimensionali con un
prodotto scalare, i.e., CN . Nel caso finito dimensionale sappiamo che qualunque spazio vettoriale ammette
una base ortonormale. Vedremo che una cosa analoga vale anche per gli spazi di Hilbert.
Definizione 3.3 (Denso).
Dato un insieme S ⊂ H diciamo che S è denso in H se ogni u ∈ H è limite di elementi in S.
P
Esercizio 3.1. Dimostrare che le combinazioni lineari finite, i.e., N
n=1 an en sono dense in `2 (N).
Esercizio 3.2. Dimostrare che dato un intervallo aperto I ⊂ R, C ∞ (I) è denso in L2 (I, dx).
Definizione 3.4 (Base e s.o.n.c).
Dato uno spazio di Hilbert H diciamo sistema completo (s.c.) un insieme di vettori denso in H . Una
base o sistema ortogonale completo (s.o.c.) è un insieme di vettori ortogonali massimale, ovvero non
contenuto propriamente in nessun altro insieme di vettori ortogonali. Un sistema ortonormale completo
(s.o.n.c.) è una base composta da vettori {uα }α∈I , I ⊂ R, tali che
• (normale) kuα k = 1 per ogni α ∈ I;
• (ortogonale) huα |uβ i = 0 se α 6= β.
Una conseguenza dell’assioma della scelta è la seguente
Proposizione 3.1 (Esistenza di un s.o.n.c.).
Ogni spazio di Hilbert H ammette almeno un s.o.n.c.
2
Mettendo insieme i due elementi bra e ket, ovvero scrivendoli uno di fianco all’altro si ricostruisce il braket, la parentesi.
19
Definizione 3.5 (Spazio di Hilbert separabile).
Uno spazio di Hilbert H si dice separabile se ammette una base numerabile.
Definizione 3.6 (Dimensione).
Dato uno spazio di Hilbert H definiamo la sua dimensione come il numero degli elementi di una qualsiasi
base.
Per gli spazi di Hilbert separabili l’analogia con il concetto di base finito-dimensionale è ancora più forte.
Teorema 3.1 (Serie di Fourier).
Sia H uno spazio di Hilbert separabile su C e {un }n∈N un suo s.o.n.c numerabile. Assegnato un vettore
Ψ ∈ H i suoi coefficienti di Fourier {Ψn }n∈N sono i numeri complessi
Ψn := hun |Ψ i .
(3.5)
Si ha allora
• (serie di Fourier) Ψ =
P
n∈N Ψn un
nel senso che
N
X
lim Ψ −
Ψn un = 0;
N →∞
• (identità di Parseval) kΨk2 =
2
n∈N |Ψn |
P
(3.6)
n=1
e più in generale per ogni Ψ, Φ ∈ H ,
hΨ |Φ i =
X
Ψ∗n Φn ,
(3.7)
n∈N
dove Φn sono i coefficienti di Fourier di Φ rispetto alla stessa base.
Esercizio
senza usare la (3.5) che, fissato il s.o.n.c., la serie di Fourier è unica, ovvero
P 3.3. Dimostrare
P 0
se Ψ = Ψn un = Ψn un allora Ψn = Ψ0n per ogni n.
Dato uno spazio di Hilbert separabile dunque, una qualunque s.o.n.c. numerabile individua una corrispondenza uno a uno fra H e `2 (N) (o `2 (Z) a seconda del numero di elementi di base), associando ad ogni
vettore di H i suoi coefficienti di Fourier e viceversa.
Solitamente la terminologia serie di Fourier e coefficienti di Fourier si riserva per il caso speciale H = L2 (I)
con I aperto in R e un (x) = |I|−1/2 exp{2πinx/|I|} (si veda anche Esempio 2 punto 2). In questo caso si
può dimostrare che la serie di Fourier di ogni funzione in L2 (I) è puntualmente convergente q.o., mentre
converge uniformemente se e solo se la funzione è continua e periodica (cioè assume lo stesso valore agli
estremi dell’intervallo). Questa particolare base è inoltre utile per dare una definizione alternativa degli
spazi di Sobolev:
Definizione 3.7 (Spazi di Sobolev).
Definiamo lo spazio di Sobolev di indice p > 0 come
n
o
H p (I) := f ∈ L2 (I) |n|p fn ∈ `2 (Z) ,
(3.8)
dove fn indicano i coefficienti di Fourier di f rispetto alla base un (x) = |I|−1/2 exp{2πinx/|I|}.
Per decidere se un insieme di vettori linearmente indipendenti è un s.o.n.c è spesso utile uno dei seguenti
criteri:
Proposizione 3.2 (S.o.n.c).
Sia H uno spazio di Hilbert separabile, allora un s.o.n. {un }n∈N è una base e quindi un s.o.n.c. se vale
almeno una (e quindi entrambe) delle seguenti proprietà:
20
• le combinazioni lineari finite
PN
n=1 an un
con an ∈ C e N < +∞ sono dense in H ;
• hΨ |un i = 0 per ogni n ∈ N ⇐⇒ Ψ = 0.
Esempio 3.2 Riprendiamo i casi discussi nell’Esempio 3.1:
1. la base standard di CN , ovvero {en }n=1,...N , è chiaramente un s.o.n.c.;
2. un s.o.n.c per L2 (I, dx) con I intervallo aperto di R è data dai vettori {un }n∈Z (teorema di Fourier)
con
2πinx
un (x) := √1L e L ,
(3.9)
dove abbiamo chiamato L := |I| la lunghezza dell’intervallo.
Nel caso in cui I non sia invece compatto, ad esempio per I = R, due possibili s.o.n.c. sono dati da
Hn (x)e−
x2
2
,
x
Ln (x)e− n+1 ,
(3.10)
con n ∈ N e Hn e Ln rispettivamente i polinomi di Hermite e i polinomi di Laguerre.
3. una base per `2 (N) è ovviamente data dalla generalizzazione infinito dimensionale della base canonica
in CN , ovvero {en }n∈N .
Esercizio 3.4.
1. Dimostrare che le funzioni un (x) =
2 1/2
sin nx
π
formano un s.o.n.c. in L2 (0, π).
2. Si considerino le funzioni
(
1,
fn (x) =
0,
1
se n+1
≤ x ≤ n1 ,
altrove,
con n ∈ N. Le fn formano un set ortogonale completo in L2 (0, 1)?
3. Le funzioni un (x) = e2inx , n ∈ Z, formano un set ortogonale completo in L2 (0, π)? e in L2 (0, 2π)?
Si consideri poi il set vn (x) = un (x)eβx per un certo β ∈ C: il set {vn } è completo in L2 (0, π)? e in
L2 (0, 2π)?
4. Dato un set completo {un } in H , quand’è che il set vn = un − v rimane un set completo per un certo
v ∈ H ? e invece quand’è che il set wn = en − αm e1 non è completo in `2 (N)?
5. Il set un (x) = xeinx è ancora completo in L2 (−π, π)?
In ogni spazio di Hilbert valgono due disuguaglianze che coinvolgono la norma e che hanno una grande
utilità:
Proposizione 3.3 (Disuguaglianze di Schwarz e triangolare).
Per ogni u, v ∈ H spazio di Hilbert valgono la disuguaglianza di Schwarz e la disuguaglianza
triangolare, i.e.,
|hu |v i| ≤ kuk kvk ,
ku + vk ≤ kuk + kuk .
(3.11)
Esercizio 3.5. Dimostrare le due disuguaglianze in (3.11) usando le proprietà della norma. (Suggerimento:
calcolare la norma ku + λvk per λ ∈ C generico e scegliere valori ad hoc di λ).
Come abbiamo visto uno spazio di Hilbert ammette una metrica indotta dalla norma, ma grazie alla presenza
del prodotto scalare è possibile definire in H una topologia più debole di quella della norma, che in effetti
coincide con quella generata dagli elementi del duale di H .
21
Definizione 3.8 (Convergenza forte e debole).
Data una successione {un }n∈N in uno spazio di Hilbert H separabile si dice che
• un converge fortemente o in norma oppure semplicemente converge a u ∈ H e si indica con
s
un −→ u se
lim ku − un k = 0;
(3.12)
n→∞
w
• un converge debolmente a u ∈ H e si indica con un −→ u se
lim hv |un − u i = 0,
n→∞
∀v ∈ H .
(3.13)
La convergenza forte implica ovviamente la convergenza debole via ad esempio la disuguaglianza di Schwarz.
w
Esercizio 3.6. Dimostrare che se un −→ u in H , allora kuk ≤ lim inf n→∞ kun k (semicontinuità inferiore
della norma).
Proposizione 3.4 (Covergenza debole e forte).
w
s
Sia {un }n∈N una successione in H separabile. Allora un −→ u ⇐⇒ un −→ u e lim kun k = kuk.
n→∞
Dimostrazione. Un semplice calcolo dà
ku − un k2 = kuk2 + kun k2 − hun |u i − hu |un i ,
ma la convergenza debole di un ci garantisce che
hun |u i −→ kuk2 ,
n→∞
hu |un i −→ kuk2 .
n→∞
Quindi
h
i
lim ku − un k2 = lim kun k2 − kuk2 ,
n→∞
n→∞
da cui l’enunciato.
Si sarebbe tentati di pensare che in L2 (I, dx) la convergenza debole sia sostanzialmente equivalente alla
convergenza puntuale q.o.. Questo però è falso e in generale
convergenza forte ; convergenza q.o.,
convergenza q.o. ; convergenza debole,
tuttavia se una successione converge sia debole che puntualmente q.o. allora il limite è lo stesso.
Nutaralmente il concetto di convergenza debole si può definire anche in spazi di Banach, come Lp (I, dx),
dove il ruolo del prodotto scalare viene preso dai funzionali appartenti al duale di Lp cioè Lq con p1 + 1q = 1.
Ricordiamo qui tre risultati fondamentali della teoria dell’integrazione in spazi L1 (I, dx) con I ⊂ Rd che
saranno di grande utilità in tutto il resto del corso:
Teorema 3.2 (Teorema della convergenza monotona).
Sia fn ≥ 0 una successione in L1 (I, dx) tale che fn+1 (x) ≥ fn (x) per ogni n ∈ N e q.o.. Se kfn k1 ≤ C per
ogni n e fn (x) −→ f (x) q.o., allora f ∈ L1 (I, dx) e limn→∞ kfn − f k1 = 0.
n→∞
Teorema 3.3 (Teorema della convergenza dominata).
Sia fn una successione in L1 (I, dx) tale che |fn (x)| ≤ g(x) per ogni n ∈ N e q.o. con g ∈ L1 (I, dx). Se
fn (x) −→ f (x) q.o., allora f ∈ L1 (I, dx), |f |(x) ≤ g(x) e limn→∞ kfn − f k1 = 0.
n→∞
Teorema 3.4 (Lemma di Fatou).
Sia fn ≥ 0 una successione in L1 (I, dx) tale che lim inf n→∞ |fn |1 < +∞. Se lim inf fn = f allora f ∈
L1 (I, dx) e kf k1 ≤ lim inf n→∞ fn .
22
Esercizio 3.7.
w
1. Sia Ψn ∈ L2 (R) e si abbia hΨn |f i −→ hΨ |f i per ogni f ∈ C0∞ (R). E’ vero che Ψn −→ Ψ? in caso
negativo si trovi un controesempio.
1
1
2. Sia fn ∈ L2 ([0, 1]) la successione fn (x) = n−1/2 x 2n − 2 con n ∈ N. La successione converge debolmente
(e eventualmente a cosa?)? in norma?
3. Consideriamo la successione di funzioni fn : R+ → R,
(
tn , se t ∈ [0, 1],
fn (t) =
0, per t > 1.
La successione converge puntualmente? uniformemente su R+ ? debolmente in L2 (R+ )? in norma in
L2 (R+ )?
4. Sia fn (x) la successione
(
1,
fn (x) =
0,
se n ≤ x ≤ 2n,
altrimenti,
con n ∈ N. La successione converge puntualmente (e eventualmente a che cosa?)? uniformemente?
debolmente in L2 (R)? in norma in L2 (R)?
5. P
Si considerino le funzioni fn introdotte nell’Esercizio 3.4 punto 2. Si ponga quindi gN (x) =
N
2
n=1 fn (x): gN converge puntualmente quando N → ∞? debolmente in L (0, 1)? in norma nello
stesso spazio? uniformemente su [0, 1]?
Concludiamo questa sezione discutendo alcune proprietà geometriche elementari degli spazi di Hilbert e
caratterizzandone il duale.
Definizione 3.9 (Sottospazio ortogonale).
Sia K un sottospazio (di Hilbert) proprio di H . Definiamo il suo complemento ortogonale come il
sottospazio
(3.14)
K ⊥ := Φ ∈ H hΦ |Ψ i = 0, ∀Ψ ∈ K .
Teorema 3.5 (Teorema della proiezione).
Sia H uno spazio di Hilbert e K un suo sottospazio proprio. Allora ogni Ψ ∈ H si scrive in modo unico
come somma Ψ = Φ + Φ0 con Φ ∈ K e Φ0 ∈ K ⊥ .
Definizione 3.10 (Duale).
Dato uno spazio di Hilbert H definiamo il suo duale H ∗ come lo spazio dei funzionali lineari limitati da
H ∈ C.
Il duale H ∗ contiene dunque le f : H → C che sono limitate nella norma
kf k := sup
Ψ∈H
|f (Ψ)|
.
kΨk
(3.15)
Proposizione 3.5 (Completezza di H ∗ ).
Il duale H ∗ è completo rispetto alla metrica indotta dalla norma (3.15).
Un esempio immediato di funzionale su H è dato dall’applicazione fΦ : H → C che agisce nel seguente
modo su ogni Ψ ∈ H :
fΦ (Ψ) = hΦ |Ψ i .
(3.16)
Ovviamente per tale funzionale vale kfΦ k = kΦk e quindi il funzionale è limitato. Il contenuto del teorema
di Riesz è precisamente che tutti i funzionali in H ∗ sono di questa forma:
Teorema 3.6 (Teorema di Riesz).
Per ogni f ∈ H ∗ ∃! Φ ∈ H tale che f (Ψ) = hΦ |Ψ i.
23
3.2
Trasformata di Fourier, Spazi di Sobolev e Distribuzioni
Prima di introdurre la teoria degli operatori lineari, richiamiamo alcune utili proprietà della trasformata di
Fourier.
Definizione 3.11 (Trasformata di Fourier).
Data una qualunque f ∈ C0∞ (Rd ), definiamo la sua trasformata di Fourier come
Z
1
ˆ
dx e−ik·x f (x).
f (k) :=
(2π)d/2 Rd
(3.17)
Proposizione 3.6 (Estensione della trasformata di Fourier).
La (3.17) definisce un’applicazione F : L1 (Rd ) → L∞ (Rd ) che ammette un’estensione naturale a L2 (Rd ).
Inoltre
i) F : L2 (Rd ) → L2 (Rd ) è un’applicazione bigettiva con trasformazione inversa data da
Z
1
ˇ
f (x) :=
dk eik·x f (k);
(2π)d/2 Rd
(3.18)
ii) F individua un operatore unitario da L2 (Rd ) → L2 (Rd ), cioè
D E
fˆ ĝ = hf |g i ,
∀f, g ∈ L2 (Rd ).
La relazione fra la trasformata di Fourier e gli spazi Lp è più complicata ma vale la seguente utilissima
disuguaglianza:
Teorema 3.7 (Disuguaglianza di Hausdorff-Young).
Esiste una constante Cd < +∞, dipendente solo da d, tale che per ogni 1 ≤ p ≤ 2
Ψ̂ q d ≤ Cd kΨk p d ,
L (R )
L (R )
con
1
p
+
1
q
(3.19)
= 1 (e quindi 2 ≤ q ≤ ∞).
Inoltre la trasformata di Fourier è molto utile per studiare operatori differenziali o integrale grazie alle
seguenti proprietà :
Proposizione 3.7 (Poprietà della trasformata di Fourier).
Per ogni f, g ∈ L2 (Rd )
i) (convoluzione) definendo la convoluzione come
Z
(f ? g)(x) :=
dy f (x − y)g(y),
(3.20)
Rd
si ha
d
f[
? g (k) = (2π) 2 fˆ(k)ĝ(k);
(3.21)
ii) (traslazione e riscalamento)
f\
(· − y)(k) = e−ik·y fˆ(k),
f\
(·/λ)(k) = λd fˆ(λk);
(3.22)
iii) (derivazione)
ˆ
∂\
xi f (·)(k) = −iki f (k).
(3.23)
Per questo motivo la trasformata di Fourier entra anche nella definizione degli spazi di Sobolev su Rd .
24
Definizione 3.12 (Spazio di Sobolev).
Definiamo lo spazio di Sobolev di indice p su Rd come
n
o
p/2
H p (Rd ) := f ∈ L2 (Rd ) k 2 + 1
fˆ(k) ∈ L2 (Rd ) .
(3.24)
Chiudiamo la discussione della trasformata di Fourier enunciando un risultato importantissimo.
Teorema 3.8 (Teorema di Paley-Wiener).
Una funzione analitica g(z), z ∈ Cd , è la trasformata di Fourier fˆ di una funzione f ∈ C0∞ (Rd ) tale che
supp(f ) ⊂ BR (0), se e solo se per ogni N ∈ N ∃CN < ∞ tale che
|g(z)| ≤
CN eR|=(z)|
,
(1 + |z|)N
∀z ∈ Cd .
(3.25)
Quindi la trasformata di Fourier mappa funzioni C0∞ (Rd ) in funzioni analitiche che soddisfano la stima di
cui sopra. Analogamente funzioni analitiche (reali) a decrescenza rapida (come segue dalla (3.25)) sono
mappate dalla (anti)trasformata di Fourier in funzioni C0∞ (Rd ).
Un risultato più debole ma comunque molto utile è il seguente
Teorema 3.9 (Analiticità della trasformata di Fourier).
Sia f ∈ L2 (Rd ). Allora eb|x| f (x) ∈ L2 (Rd ) per ogni b < a, se e solo fˆ ammette continuazione analitica alla
striscia {|=(z)| < a}. Inoltre fˆ(· + i=(z)) ∈ L2 (Rd ) se |=(z)| < a e, per ogni b < a,
sup fˆ(· + i=(z)) < ∞.
(3.26)
2
|=(z)|≤b
Riassumiamo ora brevemente la teoria delle distribuzioni. Per semplicità consideriamo solo distribuzioni di
una sola variabile reale. La generalizzazione a Rd è ovvia. Introduciamo anzitutto gli spazi delle funzioni
test S e D definiti come
h k ∞
S := f ∈ C (R) sup x ∂x f < +∞, ∀h, k ∈ N ,
D := C0∞ (R),
(3.27)
x∈R
cioè dati dalle funzioni lisce rispettivamente a decrescenza rapida o a supporto compatto. Definiamo quindi
gli spazi delle distribuzioni come i duali S 0 e D0 ovvero gli spazi dei funzionali lineari continui da S o D in
C, dove la continuità è relativa alla seguente topologia in S o D: diciamo che una successione fn ∈ S o D
converge a f se
xh ∂xk fn −→ 0,
uniformemente.
n→∞
Di conseguenza una distribuzione F sarà continua se F (fn ) → F (f ) per ogni successione convergente in S
o D. Indichiamo l’azione di una distribuzione F sullo spazio delle funzioni test come hF, f i.
L’esempio canonico di distribuzione è l’applicazione
Z
hF, f i =
dx F (x)f (x),
R
con F funzione misurabile localmente cioè F ∈ L1loc (R). Sotto queste ipotesi è facile vedere che l’espressione
di sopra definisce un funzionale lineare continuo sia in S 0 che in D0 . Gli spazi S 0 e D0 contengono però
“funzioni” molto più singolari ed è in effetti questo il motivo per cui è conveniente introdurli: un esempio
caratteristico è dato dalla δ di Dirac che definiamo come
Z
hδ, f i = f (0) =
dx δ(x)f (x),
(3.28)
R
dove l’ultima espressione è puramente formale.
Negli spazi delle distribuzioni è possibile definire una topologia (debole): una successione di distribuzioni
Fn converge a F in S 0 o D0 se hFn , f i −→ hF, f i per ogni funzione test f ∈ S o D. Inoltre si definiscono
n→∞
25
derivata k−esima ∂ k F , trasformata F̂ e antitrasformata di Fourier F̌ di una distribuzione F ∈ S 0 o D0 nel
modo seguente
D
E
D
E
∂ k F, f = (−1)k F, ∂xk f ,
(3.29)
hF̂ , f i = hF, fˆi,
hF̌ , f i = hF, fˇi.
(3.30)
Si verifica che queste operazioni sono continue rispetto alla topologia della convergenza debole fra distribuzioni. Questo permette di ottenere derivate e trasformate di Fourier di “funzioni” non derivabili né in L2 ,
come ad esempio la δ di Dirac o la funzione di Heaviside θ(x).
3.3
Operatori Lineari
Al fine di investigare le conseguenze del Postulato 2 della MQ, introduciamo in questa sezione i concetti
fondamentali della teoria degli operatori lineari su uno spazio di Hilbert, che assumeremo sempre separabile.
Definizione 3.13 (Operatore lineare).
Sia H uno spazio di Hilbert separabile. Un operatore lineare A : H → H è un applicazione tale che
A(αu + βv) = αAu + βAv con u, v ∈ H e α, β ∈ C.
Nello spazio degli operatori lineari L (H ) è naturale definire la norma data da
kAΨk
.
Ψ∈D(A) kΨk
kAk := sup
(3.31)
Una caratteristica essenziale di ogni operatore A è il suo dominio di definizione D(A), ovvero l’insieme delle
u ∈ H su cui è assegnato A.
Osservazione 3.1. Non assumeremo che il dominio di un operatore sia necessariamente massimale, ma in
ogni caso chiederemo che D(A) sia denso in H .
Definizione 3.14 (Operatore limitato).
Un operatore A ∈ L (H ) è limitato se kAk < +∞.
E’ evidente che c’è, almeno in apparenza, un’ambiguità nella definizione di un operatore e più precisamente
del relativo dominio: se il dominio non coincide con una base, cioè un denso minimale, è sempre possibile
rimuovere un certo numero di elementi da D(A) senza tuttavia modificare l’operatore. Per eliminare questa
ambiguità si introducono i concetti di estensione e chiusura di un operatore, che giocano un ruolo cruciale
nello studio degli operatori illimitati. Infatti nel caso in cui l’operatore sia limitato è facile vedere che il
problema del dominio di definizione non sussiste, in quanto l’operatore può essere sempre esteso a tutto H .
Definizione 3.15 (Estensione).
Siano A e B due operatori con dominio D(A) ⊂ D(B). Diciamo che B è un’estensione di A se A = B su
D(A).
Proposizione 3.8 (Operatori limitati).
Ogni operatore limitato A ammette un’estensione (unica) con dominio tutto H .
Definizione 3.16 (Operatore chiuso).
s
s
Un operatore A su H si dice chiuso se per ogni un ∈ D(A) tale che Ψn −→ Ψ ∈ H e AΨn −→ AΨ, allora
Ψ ∈ D(A). Diciamo che A è chiudibile se ammette un’estensione chiusa e in tal caso indichiamo con Ā
la più piccola estensione chiusa di A.
La definizione di operatore chiuso è equivalente alla richiesta di chiusura dell’insieme grafo Γ(A) ⊂ H × H
dell’operatore A, ovvero
Γ(A) := {(Ψ, AΨ), Ψ ∈ D(A)} .
Ovviamente ogni operatore limitato è chiudibile e la sua chiusura ha per dominio H . Tuttavia non tutti gli
operatori sono chiudibili ma tutti quelli che consideremo e in particolare quelli che hanno significato fisico,
i.e., sono per lo meno simmetrici (si veda la Sezione 3.4), sono sempre chiudibili.
26
Osservazione 3.2. Si noti che tipicamente D(A) 6= D(Ā). Infatti data l’ipotesi di densità di D(A),
D(A) = H , ma quest’ultimo coincide con il dominio di Ā se e solo se A è limitato.
Esempio 3.3 (Operatore di moltiplicazione)
Sia F (x) una funzione misurabile su Rd . Definiamo l’operatore di moltiplicazione per F come
(M Ψ) (x) := F (x)Ψ(x),
(3.32)
con dominio D(M ) = C0∞ (Rd ). Come dimostrato nella seguente Proposizione 3.9, M è limitato se e solo se
M ∈ L∞ (Rd ) e in tal caso è facile vedere che D(M ) = L2 (Rd ).
Proposizione 3.9 (Operatore di moltiplicazione).
Sia M un operatore di moltiplicazione in L2 (Rd ) per la funzione misurabile F (x), allora
kM k = kF kL∞ (Rd ) = sup |F (x)| .
(3.33)
x∈Rd
Dimostrazione. Dimostriamo anzitutto che kM k = kF kL∞ (Rd ) :
2
Z
kM Ψk =
dx |F (x)|2 |Ψ|2 ≤ sup |F (x)|2 kΨk2 ,
Rd
x∈Rd
da cui otteniamo il risultato osservando che sup(F 2 ) = (sup |F |)2 .
Se risucissimo quindi a trovare una successione di stati normalizzati Ψε tali che
kM Ψε k −→ sup |F |,
ε→0 Rd
avremmo dimostrato l’assunto. Supponiamo allora per semplicità che F sia continua e che supRd |F | =
F (x0 ) < +∞ per un certo x0 finito (nel caso in cui sia infinito l’argomento è analogo) e prendiamo una
funzione f (x) ∈ C ∞ [0, 1] tale che f (0) 6= 0 e
Z
dx |f |2 = 1,
B1 (0)
dove abbiamo indicato con B% (x) la palla di raggio % centrata in x. Poniamo allora
1
0|
Ψε (x) := εd/2
f |x−x
.
ε
Calcoliamo
2
kM k ≥ ε
−d
Z
2
2
|x−x0 | |x−x0 | 2
−d
dx |F (x)| f
=
ε
dx
|F
(x)|
f
ε
ε
Rd
Bε (x0 )
Z
Z
x 2
2
−d
=ε
=
dx |F (x + x0 )| f ε
dx |F (x0 + εx)|2 |f (x)|2
Bε (0)
B1 (0)
Z
= |F (x0 )|2 −
dx |F (x0 )|2 − |F (x0 + εx)|2 |f (x)|2 =: |F (x0 )|2 − Rε .
Z
2
B1 (0)
Ora grazie alla continuità di F , F (x) è certamente limitata in un intorno di x0 e pertanto l’integrabilità di
|f |2 ci garantisce che Rε ≤ C per ogni ε sufficientemente piccolo. Possiamo allora applicare il teorema di
convergenza dominata e fare il limite sotto il segno di integrale, ottenendo (ancora grazie alla continuità di
F ) che Rε −→ 0.
ε→0
Esercizio 3.8. Si trovi come modificare la dimostrazione della Proposizione 3.9 nel caso in cui x0 sia
illimitato e più in generale nel caso in cui F sia misurabile ma non continua.
27
Esercizio 3.9. Si dimostri che M con M operatore di moltiplicazione limitato ha dominio uguale all’intero
L2 (R) senza far uso della Proposizione 3.8.
Esempio 3.4 (Operatore integrale)
Sia K(x, y) una funzione misurabile su R × R. Definiamo l’operatore integrale K con kernel K(x, y) come
Z
dy K(x, y)Ψ(y),
(3.34)
(KΨ) (x) :=
R
per ogni Ψ ∈ C0∞ (R).
Iniziamo suppondendo che K(x, y) ∈ L2 (R2 ) e vediamo che questo garantisce la limitatezza
dell’operatore. Si ha infatti
2
kKk =
−2
Z
kΨk
sup
Ψ∈C0∞ (R)
R
2
Z
dx dy K(x, y)Ψ(y) ≤
R
Z
Z
sup
dx
Ψ∈C0∞ (R)
dy |K(x, y)|2
R
R
= kKk2L2 (R2 ) < +∞.
Anche in questo caso l’operatore non è chiuso e la sua chiusura K ha dominio che copre l’intero spazio di
Hilbert L2 (R). In effetti la richiesta K(x, y) ∈ L2 (R2 ) può essere indebolita come discusso nella prossima
Proposizione 3.10.
Proposizione 3.10 (Test di Schur).
Sia K un operatore integrale con kernel K(x, y) : Rd × Rd → C misurabile, allora
p
kKk ≤ k1 k2 ,
Z
Z
k1 := sup
dy |K(x, y)| ,
k2 := sup
dx |K(x, y)| .
x∈Rd
Rd
y∈Rd
(3.35)
(3.36)
Rd
Dimostrazione. Il risultato è sostanzialmente una conseguenza diretta dell’applicazione della disuguaglianza
di Schwarz:
1/2 Z
Z
Z
|(KΨ) (x)| ≤
dy |K(x, y)| |Ψ(x)| ≤
dy K(x, y)|Ψ(y)|2
dy |K(x, y)|
Rd
Rd
1/2
Rd
p Z
≤ k1
dy K(x, y)|Ψ(y)|
2
1/2
,
Rd
cosı̀ che
kKΨk22
Z
≤ k1
Rd ×Rd
dxdy |K(x, y)| |Ψ(x)|2 ≤ k1 k2 kΨk22 ,
e il risultato è dimostrato.
Esempio 3.5 (Operatore posizione)
Sia H = L2 (R) e definiamo
(QΨ) (x) := xΨ(x),
(3.37)
con dominio D(Q) = C0∞ (R).
Osserviamo anzitutto che l’operatore è illimitato cioè kQk = +∞. A questo scopo consideriamo una
funzione dolce f ∈ C0∞ (0, 1) normalizzata a 1 in L2 ((0, 1), dx) e per ogni n ∈ N poniamo
(
f (x − n), se n ≤ x ≤ n + 1,
Ψn (x) :=
0
altrimenti.
28
Chiaramente Ψn è normalizzata e quindi
Z
Z n+1
Z
2
2
2
2
2
dx x |f (x − n)| =
dx x |Ψn (x)| =
kQk ≥
R
1
dx (x + n)2 |f (x)|2 ≥ n2 −→ +∞.
0
n
n→∞
Di conseguenza l’operatore non potrà mai essere definito su tutto L2 (R).
Esercizio 3.10. L’operatore Q è chiuso? e se no qual è la sua chiusura Q?
Esempio 3.6 (Operatore impulso)
Sempre su L2 (R) definiamo l’operatore
(P Ψ) (x) := −i∂x Ψ(x),
(3.38)
con dominio ancora D(P ) = C0∞ (R). Come nel caso di Q anche P è un operatore illimitato. Inoltre non è
nemmeno chiuso e D(P ) = H 1 (R), come si vede facilmente usando le proprietà della trasformata di Fourier.
Esercizio 3.11. Dimostrare che l’operatore P non è limitato.
Esempio 3.7 (Operatori di creazione e distruzione)
Sia H uno spazio di Hilbert separabile infinito-dimensionale e {un }n=0,1,...,∞ un suo s.o.n.c.. Definiamo
allora gli operatori di creazione e distruzione come
(√
√
n un−1 , per n > 0,
a† un = n + 1 un+1 ,
aun =
(3.39)
0,
per n = 0.
con dominio ovviamente definito dalle combinazioni lineari degli elementi della base. Chiaramente nessuno
dei due operatori è limitato come banalmente segue dal calcolare la norma di a o a† sull’n-esimo vettore di
base un . Inoltre si vede immediatamente che i due operatori non sono chiusi e il dominio della chiusura di
entrambi è
√
n
o
D(a/a† ) := Ψ ∈ H nΨn ∈ `2 (N) ,
dove Ψn sono i coefficienti di Fourier di Ψ nella base un .
Esercizio 3.12. Si consideri l’operatore a† a. Come agisce sulla base {un }. Qual è il dominio della sua
chiusura?
Esercizio 3.13. Si verifichi se i seguenti operatori sono limitati:
Z x
1
1. (Af ) (x) =
dy √
f (y) in L2 (0, 1);
x−y
0
Z
e−|x−y|
2. (Af ) (x) =
dy
f (y) in L2 (R3 );
|x
−
y|
3
R
3. (δf )(x) = f (0) con dominio C(−1, 1) ⊂ L2 (−1, 1). L’operatore è chiuso o chiudibile?
3.4
Operatore Aggiunto e Inverso
In questa sezione introduciamo le definizioni cruciali di operatore aggiunto, operatore simmetrico e operatore
autoagginto che giocheranno un ruolo cruciale nel seguito alla luce del Postulato 2 della MQ, che appunto
identifica le osservabili di un sistema quantistico con gli operatori autoaggiunti.
Assumeremo sempre di avere a che fare con spazi di Hilbert separabili e operatori definiti su un denso
in H .
29
Definizione 3.17 (Aggiunto).
Sia A ∈ L (H ), il suo aggiunto è l’operatore A∗ definito nel modo seguente
D(A∗ ) := Φ ∈ H ∃Ξ ∈ H t.c. hΦ |AΨ i = hΞ |Ψ i , ∀Ψ ∈ D(A) ,
A∗ Φ := Ξ.
(3.40)
Quindi se Φ ∈ D(A∗ ) e Ψ ∈ D(A) allora hA∗ Φ |Ψ i = hΦ |AΨ i. In effetti nel caso in cui A sia limitato (e
quindi estendibile a tutto H ) è facile vedere che anche A∗ è limitato e kAk = kA∗ k. Più in generale è facile
vedere che il dominio di A∗ è anche dato da
(3.41)
D(A∗ ) = Φ ∈ H |hΦ |AΨ i| ≤ CkΨk, ∀Ψ ∈ D(A) .
Proposizione 3.11 (Proprietà dell’aggiunto).
La mappa ∗ soddisfa le seguenti proprietà :
• A∗ è chiuso;
• A è chiudibile ⇐⇒ D(A∗ ) denso e in tal caso (A∗ )∗ = A;
• (AB)∗ = B ∗ A∗ ;
• dati due operatori A e B, se D(A) ⊂ D(B) allora D(B ∗ ) ⊂ D(A∗ ).
Si noti fra le proprietà enunciate nella precedente Proposizione 3.11 il criterio al punto 2 che può essere
molto utile per verificare se un operatore è chiudibile. In realtà vedremo fra poco che tutti gli operatori
fisici (in quanto almento simmetrici) sono sempre chiudibili.
Riprendiamo ora gli esempi discussi nella sezione precedente, per studiare gli aggiunti degli operatori in
questione.
Esempio 3.8 (Operatore di moltiplicazione)
Sia F (x) ∈ L∞ (Rd ) e consideriamo l’operatore (limitato) di moltiplicazione per F in L2 (Rd ) con dominio
C0∞ (Rd ) e verifichiamo che M ∗ è l’operatore di moltiplicazione per F ∗ con dominio tutto L2 (Rd ). Usando
la definizione di dominio di M ∗ vediamo che esso è composto dalle Φ tali che
sup
|hΦ |M Ψ i| ≤ C,
kΨk=1,Ψ∈D(M )
ma per ogni Ψ ∈ D(M ) normalizzata
Z
Z
∗
|hΦ |M Ψ i| = dx Φ (x)F (x)Ψ(x) ≤ kF kL∞ (Rd )
Rd
Rd
dx |Φ(x)| |Ψ(x)| ≤ C kΦk2 ,
che è limitato per ogni Φ ∈ L2 (Rd ). Inoltre per ogni Ψ ∈ D(M ) e Φ ∈ L2 (Rd ),
Z
Z
∗
hΦ |M Ψ i =
dx Φ (x)F (x)Ψ(x) =
dx (F ∗ (x)Φ(x))∗ Ψ(x) = hM ∗ Φ |Ψ i ,
Rd
Rd
e quindi (M ∗ Φ) (x) = F ∗ (x)Φ(x).
Esercizio 3.14. Si consideri l’operatore integrale K discusso nell’esempio 3.4 sotto l’ipotesi che K(x, y) ∈
L2 (R2d ) e con D(K) = C0∞ (Rd ) e si dimostri che l’aggiunto K ∗ è anch’esso un operatore integrale con kernel
K ∗ (y, x) e il suo dominio è L2 (Rd ).
Esempio 3.9 (Operatore posizione)
Riprendiamo l’Esempio 3.5 e cerchiamo Q∗ dato l’operatore Q con dominio D(Q) = C0∞ (R). Dimostreremo
che
D(Q∗ ) = Ψ ∈ L2 (R) xΨ ∈ L2 (R) .
(3.42)
30
Osserviamo infatti che per ogni Φ nel dominio di cui sopra si ha
Z
sup
|hΦ |QΨ i| ≤
sup
dx (xΦ(x))∗ Ψ(x) ≤ kxΦk2 < +∞,
kΨk2 =1,Ψ∈D(Q)
kΨk2 =1,Ψ∈D(Q) R
per cui certamente D(Q∗ ) contiene le Φ tali che xΦ ∈ L2 (R). Vediamo ora che coincide proprio con tale
insieme: sia ξN (x) ≥ 0 una approssimante C0∞ (R) della funzione caratteristica dell’intervallo [−N, N ] tale
che ξN (x) = 1 per ogni x ∈ [−N, N ] e che la successione sia monotona in N , allora ogni Φ ∈ D(Q∗ ) deve
essere tale che kQ∗ Φk2 < +∞ e possiamo scrivere (per convergenza monotona)
kQ∗ Φk2 = lim kQ∗ ξN Φk2 = lim
N →∞
sup
N →∞ kΨk =1,Ψ∈D(Q)
2
= lim
sup
N →∞ kΨk =1,Ψ∈D(Q)
2
|hΨ |Q∗ ξN Φ i| = lim
sup
N →∞ kΨk =1,Ψ∈D(Q)
2
|hQΨ |ξN Φ i|
1/2
Z
1/2
Z
2
dx Ψ∗ (x)xξn (x)Φ(x) = lim
< +∞,
dx |xξn (x)Φ(x)|
N →∞
R
R
dove abbiamo usato che
sup
Ψ∈S,kΨk=1
|hΨ |Φ i| = kΦk2 ,
(3.43)
per ogni insieme denso S in H (come D(Q)). Inoltre la successione |x|ξN (x)|Φ(x)| è ancora monotona in
N per cui possiamo fare il limite sotto il segno di integrale ottenendo che Ψ ∈ D(Q∗ ) se e solo se
Z
dx x2 |Φ(x)|2 < +∞.
R
Naturalmente da quanto ottenuto ricaviamo anche che ∀Φ ∈ D(Q∗ ),
(Q∗ Φ) (x) = xΦ(x).
Si noti che Q∗ è quindi un’estensione di Q.
Esercizio 3.15. Si consideri l’operatore impulso P definito nell’Esempio 3.6. Si dimostri che D(P ∗ ) =
H 1 (R) e che su tale dominio P ∗ = P . (Suggerimento: si usi la trasformata di Fourier).
Esercizio 3.16. Si riprenda l’Esempio 3.7 e si dimostri che a∗ = a† . E’ altrettanto vero che (a† )∗ = a?
Esempio 3.10
Consideriamo l’operatore introdotto nell’Esercizio 3.13 e cerchiamo il suo aggiunto. Sappiamo che Φ ∈ D(δ ∗ )
se
Z 1
∗
sup
|hΦ |δΨ i| =
sup
|Ψ(0)| dx Φ (x) < +∞,
kΨk=1,Ψ∈D(δ)
kΨk=1,Ψ∈D(δ)
−1
C ∞ (−1, 1).
per ogni Ψ ∈
Tuttavia è chiaro che il sup al membro di destra può essere solo 0 o +∞. Basta
infatti prendere un approssimante in L2 della δ di Dirac: data una f ∈ C0∞ (−1, 1) positiva con f (0) = 1 e
normalizzata in L2 (−1, 1), definiamo
(
√1 f x , se − ε ≤ x ≤ ε,
ε
ε
Ψε (x) =
0,
altrimenti.
cosı̀ che Ψε è ancora normalizzata in L2 (−1, 1), appartiene a D(δ) e
1
Ψε (0) = √ −→ ∞.
ε ε→0
Abbiamo allora che se
Z
1
−1
dx Φ∗ (x) 6= 0,
31
C
|hΦ |δΨ i| ≥ C |Ψε (0)| = √ −→ ∞.
ε ε→0
kΨk=1,Ψ∈D(δ)
sup
Quindi le uniche funzioni in D(δ ∗ ) sono quelle a media nulla, i.e.,
Z 1
∗
2
dx Φ(x) = 0 .
D(δ ) = Φ ∈ L (−1, 1) −1
Inoltre su queste funzioni
hΦ |δΨ i = 0 = hδ ∗ Φ |Ψ i ,
∀Ψ ∈ D(δ),
cioè, poiché D(δ) è un denso, δ ∗ Φ = 0 per ogni Φ ∈ D(δ ∗ ).
Si noti che D(δ ∗ ) non è denso in L2 (−1, 1) (tutte le funzioni pari sono ortogonali a D(δ ∗ )) e perciò δ non è
chiudibile.
Esercizio 3.17. Sia F (x) un funzione misurabile su R ma F ∈
/ L2 (R) e sia Ψ0 un qualsisi vettore non nullo
2
in L (R). Definiamo l’operatore
Z
2
dx |F (x)| |Ψ(x)| < +∞ .
T Ψ = hF |Ψ i Ψ0 ,
D(T ) = Ψ ∈ L (R) R
Si trovi T ∗ e D(T ∗ ) e si dica se l’operatore è chiudibile.
Concludiamo la sezione introducendo due sottospazi molto importanti per ogni operatore A ∈ L (H ):
Definizione 3.18 (Immagine e nucleo).
Dato un operatore A ∈ L (H ) definiamo
• il suo nucleo ker(A) := Ψ ∈ D(A) AΨ = 0 ;
• la sua immagine ran(A) := Φ ∈ H ∃Ψ ∈ D(A) t.c. Φ = AΨ .
Possiamo ora chiederci quando A è invertibile, ovvero se esiste un operatore A−1 : ran(A) → D(A) tale che
AA−1 = A−1 A = I. Un importante criterio per l’esistenza dell’inverso limitato è la seguente
Proposizione 3.12 (Inverso limitato).
Un operatore A ∈ L (H ) ammette inverso limitato se e solo se ∃C > 0 tale che
kAΨk ≥ C kΨk ,
∀Ψ ∈ D(A).
(3.44)
Dimostrazione. (⇐=) Se vale la (3.44) allora ker(A) = ∅. Quindi si può definire un operatore dal ran(A) →
D(A) dato da A−1 Φ = Ψ tale che Φ = AΨ. Inoltre ponendo Φ = AΨ si ha sempre dalla (3.44)
kΦk ≥ C A−1 Φ ,
cioè l’inverso è automaticamente limitato.
(=⇒) Viceversa se esiste A−1 limitato, allora per definizione di operatore limitato
−1 A Φ ≤ C kΦk ,
per una qualche C > 0 limitata e per ogni Φ ∈ D(A−1 ) = ran(A). Ma allora ponendo Ψ = A−1 Φ si ha
Ψ ∈ D(A) e la (3.44) è soddisfatta.
32
3.5
Operatori Simmetrici, Autoaggiunti, Unitari e Proiettori
Possiamo ora definire le due classi di operatori più rilevanti di questo corso.
Definizione 3.19 (Operatore simmetrico).
Un operatore A su H è detto simmetrico se A ⊂ A∗ , ovvero D(A) ( D(A∗ ) e A = A∗ su D(A).
Definizione 3.20 (Operatore autoaggiunto).
Un operatore A su H è detto autoaggiunto se A = A∗ , ovvero D(A) = D(A∗ ) e A = A∗ . Si dice
essenzialmente autoaggiunto se A = A∗ .
La differenza fra operatori simmetrici e autoaggiunti è una specificità degli operatori illimitati, in quanto
per operatori limitati le due definizioni coincidono. In effetti se A = A∗ su D(A), automaticamente D(A) ⊂
D(A∗ ), cioè se A è simmetrico A∗ è sempre un’estensione di A.
E’ importante sottolineare che ogni operatore simmetrico è chiudibile, poiché A∗ definisce un’estensione
chiusa di A. Più precisamente si hanno le seguenti relazioni:
A simmetrico
=⇒ A ⊂ A∗∗ ⊂ A∗ ,
A simmetrico chiuso
=⇒ A = A∗∗ ⊂ A∗ ,
A essenzialmente autoaggiunto
=⇒ A ⊂ A∗∗ = A∗ ,
A autoaggiunto
=⇒ A = A∗∗ = A∗ .
(3.45)
Osservazione 3.3. Grazie alle proprietà degli operatori autoaggiunti, per ogni osservabile A e stati Ψ, Φ ∈
D(A) di un determinato sistema quantistico si ha l’uguaglianza
hΦ |AΨ i = hAΦ |Ψ i ,
cioè l’espressione non dipende dallo stato su cui si fa agire A. Per questo nel caso di osservabili e quindi di
operatori autoaggiunti si usa l’espressione
hΦ| A |Ψi := hΦ |AΨ i = hAΦ |Ψ i .
(3.46)
Torniamo a discutere gli esempi trattati in precedenza:
Esempio 3.11 (Operatore di moltiplicazione)
L’operatore (limitato) di moltiplicazione per F limitata in L2 (Rd ) con dominio C0∞ (Rd ) è essenzialmente
autoaggiunto se e solo se F è reale. In tal caso ovviamente il dominio di autoaggiunzione è tutto L2 (Rd ).
limitato, ma essoè
Più in generale se F ∈ L2loc (R) l’operatore M con D(M ) = C0∞ (R) non è necessariamente
essenzialmente autoaggiunto se e solo se F ∗ = F e in tal caso D(M ∗ ) = D(M ) = Ψ ∈ L2 (R) | F Ψ ∈ L2 (R) .
∞
Esercizio 3.18. Dimostrare quanto affermato per un operatore di moltiplicazione con F ∈ L∞
loc (R) \ L (R).
Esercizio 3.19. Sia K un operatore integrale in L2 (Rd ) con kernel K(x, y) tale che k1 , k2 < +∞ (si veda
la Proposizione 3.10). Si trovino le condizioni più generali di autoaggiunzione di K.
Esempio 3.12 (Operatore posizione)
Riprensiamo l’Esempio 3.5: come dimostrato Q ⊂ Q∗ , vediamo ora che Q è in effetti essenzialmente autoaggiunto, cioè Q = Q∗ . A questo proposito osserviamo che D(Q∗ ) in (3.42) è ovviamente il dominio
di un operatore chiuso. Inoltre il dominio della chiusura di Q dovrà contenere tutti i vettori Ψ tali che
∃Ψn ∈ D(Q), Ψn → Ψ e QΨn → Φ ∈ L2 (R), ma questo è ovviamente equivalente a prendere la chiusura di
D(Q) = C0∞ (R) nella norma (si verifichi che è una norma)
k · k2Q := k · k2L2 (R) + kx · k2L2 (R) .
D’altra parte tale chiusura coincide precisamente con D(Q∗ ).
33
Esercizio 3.20. Si dimostri che l’operatore impulso P discusso nell’Esempio 3.6 è anch’esso essenzialmente
autoaggiunto.
Esempio 3.13 (Operatore impulso sull’intervallo)
Consideriamo ora l’operatore P in L2 (0, 1) con dominio di definizione D(P ) = C0∞ (0, 1). L’operatore non è
ovviamente chiuso ma il suo aggiunto è facile da trovare: il dominio di P ∗ sarà dato dalle Φ ∈ L2 (0, 1) tali
che
sup
|hΦ |P Ψ i| < +∞,
kΨk=1,Ψ∈D(P )
ma questo è per definizione l’insieme delle funzioni che ammettono derivata debole. Tale insieme coincide
con lo spazio
D(P ∗ ) = AC[0, 1],
(3.47)
cioè le funzioni assolutamente continue3 nell’intervallo [0, 1]: f si dice assolutamente continua se ∀δ > 0,
∃ε > 0 tale che
n
n
X
X
f (xi ) − f (x0i ) < ε,
xi − x0i < δ =⇒
i=1
i=1
[xi , x0i ].
per ogni collezione finita di intervalli
In effetti è facile verificare che AC[0, 1] coincide esattamente
con H 1 (0, 1) definito nella Definizione 3.7: Ψ ammette derivata debole se e solo se
Z 1
0
dx Ψ(x)f (x) < +∞,
∀f ∈ C0∞ (0, 1),
0
ma sviluppando l’integrale nella base di Fourier abbiamo
X ∗
Ψn nfn < +∞,
n∈Z
per ogni f ∈ C0∞ (0, 1). D’altra parte C0∞ è denso in L2 (0, 1) e quindi i coefficienti di Fourier di una
f ∈ C0∞ (0, 1) sono densi in `2 (Z). Perciò la condizione precedente equivale a
X
k{nΨn }k2`2 (Z) =
|n|2 |Ψn |2 < +∞,
n∈Z
che è esattamente la definizione di H 1 (0, 1).
L’azione di P ∗ sul suo dominio è facile da ricavare: se Φ ∈ D(P ∗ ) e Ψ ∈ D(P ),
Z
hΦ |P Ψ i = −i
1
dx Φ∗ (x)∂x Ψ(x) = i
0
Z
1
dx ∂x Φ∗ (x)Ψ(x) =
0
Z
1
dx (−i∂x Φ(x))∗ Ψ(x) = hP Φ |Ψ i ,
0
dove abbiamo integrato per parti. Si noti che l’assenza di termini di bordo è dovuta al fatto che le funzioni
in D(P ) hanno supporto compatto in (0, 1).
A questo punto c’è da chiedersi se l’operatore sia essenzialmente autoaggiunto come nel caso di P sulla
retta reale R. Sicuramente D(P ) ⊂ D(P ∗ ) quindi P ⊂ P ∗ , ma P non è chiuso anche se chiudibile. Dobbiamo
perciò chiederci che dominio ha P : data una successione Ψ(j) ∈ C ∞ (0, 1), j ∈ N , assumiamo perciò che
Ψ(j) −→ Ψ ∈ L2 (0, 1) e ∂x Ψ(j) −→ Φ ∈ L2 (0, 1). Allora questo implica la convergenza di Ψ(j) nella norma
j→∞
j→∞
H 1 che è definita come
kΨk2H 1 (0,1) =
X
n2 + 1 |Ψn |2 ,
(3.48)
n∈Z
Il teorema fondamentale del calcolo dice precisamente che se f ∈ AC[0, 1], allora f 0 è definita quasi ovunque, f 0 ∈ L1 (0, 1) e f
coincide con l’integrale indefinito di f 0 . Viceversa se g ∈ L1 (0, 1), allora G(x) uguale all’integrale indefinito di g è assolutamente
continua e G0 = g.
3
34
(j)
dove gli Ψn sono i coefficienti rispetto alla base di Fourier di Ψ. D’altra parte la convergenza in H 1 (0, 1)
implica la convergenza in L∞ (0, 1) (vedere la Proposizione 3.13) e quindi Ψ(j) converge a Ψ uniformemente.
Ma siccome Ψ(j) (0) = Ψ(j) (1) = 0 per ogni j ∈ N, allora la convergenza uniforme implica che
Ψ(0) = Ψ(1) = 0.
(3.49)
D(P ) = Ψ ∈ H 1 (0, 1) Ψ(0) = Ψ(1) = 0 ( D(P ∗ ),
(3.50)
Possiamo quindi conlcudere che
cioè l’operatore è simmetrico ma non autoaggiunto.
Proposizione 3.13 (Immersione di Sobolev).
Sia I ⊂ R un intervallo della retta reale, allora ∃C < +∞ indipendente da I tale che
kΨkL∞ (I) ≤ C kΨkH 1 (I) .
(3.51)
In particolare se Ψ ∈ H 1 (I) allora Ψ è continua e limitata su I.
Dimostrazione. Dimostriamo la (3.51). Si noti anzitutto che per ogni Ψ ∈ H 1 (I) la serie di Fourier converge
totalmente e quindi uniformemente: infatti per ogni x ∈ I
|Ψ(x)| ≤
X
n∈Z
|Ψn | ≤
X
2
n + 1 |Ψn |
2
1/2 X
n∈Z
n∈Z
1
n2 + 1
1/2
≤ C kΨkH 1 (I)
dove abbiamo indicato con Ψn i coefficienti di Ψ rispetto alla base di Fourier. Prendendo il sup rispetto
a x ∈ I otteniamo immediatamente il risultato. La continuità di Ψ segue in modo analogo, applicando il
teorema di convergenza dominata.
Chiudiamo la Sezione introducendo un’altra classe di operatori molto importanti in MQ, in quanto implementano le simmetrie dei sistemi quantistici (teorema di Wigner), cioè gli operatori unitari. Prendiamo
allora due spazi di Hilbert (separabili) H e H 0 con i relativi prodotti scalari h· |· i e (·, ·), si ha la seguente
Definizione 3.21 (Isometria).
Un’isometria T : H −→ H 0 è un operatore lineare tale che
hΨ |Φ i = (T Ψ, T Φ) ,
∀Ψ, Φ ∈ H .
(3.52)
Definizione 3.22 (Operatore unitario).
Un operatore U : H −→ H 0 è un operatore unitario se è un’isometria e ran(U ) = H 0 .
Proposizione 3.14 (Inverso di un operatore unitario).
Un operatore U è unitario se e solo se U −1 è limitato e U −1 = U ∗ .
Osservazione 3.4. Si noti che l’aggiunto che compare nella Proposizione 3.14 non è quello usuale, nel
senso che abbiamo definito l’aggiunto solo nel caso in cui H = H 0 . La generalizzazione è tuttavia banale:
dato un operatore lineare A : H −→ H 0 , si ha
D(A∗ ) = Φ ∈ H 0 ∃Ξ ∈ H 0 , hΦ |AΨ i = hΞ |Ψ i , ∀Ψ ∈ D(A) ,
A∗ Φ := Ξ.
(3.53)
Osservazione 3.5. L’unica differenza fra un’isometria e un operatore unitario sta nell’immagine: entrambi
sono operatori limitati con norma 1 da H a H 0 e entrambi sono invertibili in quanto hanno nucleo banale.
Tuttavia nel caso di un’isometria l’inverso non è definito in generale su tutto H 0 poiché un’isomtria non è
necessariamente surgettiva. Quando questo accade allora l’isometria definisce un operatore unitario.
35
Esempio 3.14 (Trasformata di Fourier)
Come già discusso in precedenza la trasformata di Fourier (3.17) definisce un operatore unitario da
L2 (Rd ) −→ L2 (Rd ).
Esempio 3.15
Un facile di esempio di operatore unitario si costruisce astrattamente data una base {un }n∈N di uno spazio
di Hilbert numberabile H : l’operatore U : H −→ `2 (N) definito nel seguente modo è infatti ovviamente
unitario (si veda il Teorema 3.1)
X
U Ψ = {hun |Ψ i}n∈N ,
U −1 {Ψn }n∈N =
Ψn un .
n∈N
Esercizio 3.21. Dimostrare che gli operatori (Ua Ψ)(x) = eiax Ψ(x) e (Vb Ψ)(x) = Ψ(x − b) definiti da L2 (R)
in se stesso con a, b ∈ R sono unitari e ricavare l’espressione esplicita dell’aggiunto.
Esempio 3.16 (Operatori di shift)
Consideriamo in `2 (N) il seguente operatore (operatore di right shift)
T (a1 , . . . , an , . . .) = (0, a1 , . . .) .
Alternativamente si può definire sugli elementi della base canonica come T en = en+1 . L’operatore ha
ovviamente norma 1 poiché
∞
X
2
kT {an }k =
|an |2 = k{an }k2 .
n=1
Inoltre come operatore da `2 (N) → `2 (N) esso definisce un’isometria in quanto
hT {an } |T {bn } i =
∞
X
a∗n bn = h{an } |{bn } i .
n=1
Resta da capire se si tratta di un operatore unitario ma si vede subito che cosı̀ non può essere: il vettore e1
è infatti ortogonale a tutti i vettori in ran(T ). Infatti ran(T ) contiene vettori della forma
∞
X
an−1 en .
n=2
D’altra parte sappiamo che T ∗ è l’operatore (operatore di left shift)
T ∗ (a1 , . . . , an , . . .) = (a2 , . . .) ,
o sugli elementi della base T en = en−1 se n ≥ 2 e T e1 = 0. E’ quindi facile vedere che
T ∗ T = I,
T T ∗ = I − he1 |· i e1 ,
cioè T T ∗ coincide con l’identità ma solo nel sottospazio ortogonale a e1 .
Una delle proprietà più utili degli operatori unitari riguarda gli operatori autoaggiunti:
Teorema 3.10 (Equivalenza unitaria I).
Dato un operatore A su H e un unitario U : H −→ H 0 , sia A0 l’operatore
D(A0 ) = Ψ0 ∈ H 0 ∃Ψ ∈ D(A), Ψ0 = U Ψ ,
A0 Ψ0 := U AU −1 Ψ0 .
Allora A è (essenzialmente) autoaggiunto se e solo se A0 è (essenzialmente) autoaggiunto.
(3.54)
36
Osservazione 3.6. Abbiamo già usato implicitamente questo risultato studiando l’operatore impulso e osservando che a meno di un operatore unitario, la trasformata di Fourier appunto, esso coincide con l’operatore
posizione Q e quindi ne condivide le proprietà.
Vedremo che questa strategia, ovvero l’uso di un operatore unitario che trasforma l’operatore in questione
in un operatore di moltiplicazione, è alla base del teorema spettrale.
Chiudiamo la sezione introducendo un ultimo tipo di operatori che entrerà nella discussione del teorema
spettrale.
Definizione 3.23 (Proiettore).
Un operatore P ∈ L (H ) si dice proiettore ortogonale se esiste un sottospazio K chiuso di H tale che
per ogni Ψ ∈ H , Ψ = Φ + Φ⊥ con Φ ∈ K e P Ψ = Φ.
Proposizione 3.15 (Proprietà dei proiettori).
Un operatore P ∈ L (H ) è un proiettore ortogonale se e solo se P è limitato, P 2 = P e P ∗ = P .
Esempio 3.17 Se consideriamo il sottospazio unidimensionale generato da un vettore Φ di modulo unitario,
il relativo proiettore ortogonale è ovviamente P Ψ = hΦ |Ψ i Φ. La verifica delle proprietà della Proposizione
3.15 è lasciata per esercizio.
3.6
Principio di Indeterminazione
Una cosenguenza diretta della struttura dello spazio (algrebra) delle osservabili di un sistema quantistico,
ovvero degli operatori autoaggiunti su uno spazio di Hilbert separabile, è il principio di indeterminazione.
In effetti il nome stesso di questa proprietà è fuorviante in quanto si può appunto vedere come conseguenza
dei postulati su cui è construita la teoria4 . Tuttavia storicamente è stato introdotto indipendentemente
dallo sviluppo assiomatico della MQ e per questo si conserva ancora il nome di principio di interminazione.
In estrema sintesi il principio di intederminazione si può riassumere nel modo seguente: se due osservabili
non commutano allora non esistono autostati simultanei di entrambe. Più precisamente l’dispersione o
deviazione standard delle osservabili A e B su un generico stato Ψ, ovvero
rD q
E
2
∆Ψ A := hA2 iΨ − hAiΨ =
Ψ (A − hAiΨ )2 Ψ ,
hAiΨ := h Ψ |A| Ψ i ,
(3.55)
soddisfa un’esplicita disguguaglianza, il principio di indeterminazione appunto.
commutatore di due operatori A e B è definito come l’operatore
Ricordiamo che il
[A, B] := AB − BA.
(3.56)
Teorema 3.11 (Principio di indeterminazione).
Siano A e B due operatori autoaggiunti su H e Ψ ∈ H tale che Ψ, AΨ, BΨ ∈ D(A) ∩ D(B), allora
∆Ψ A ∆Ψ B ≥
1
2
|h Ψ |[A, B]| Ψ i| .
(3.57)
Dimostrazione. Sia Ψ un vettore che soddisfa le ipotesi dell’enunciato e λ ∈ C, allora ponendo A0 = A−hAiΨ
e B 0 = B − hBiΨ (si noti che se A e B sono autoaggiunto lo stesso vale per A0 e B 0 )
2 0 ≤ A0 + iλB 0 Ψ = A0 + iλB 0 Ψ A0 + iλB 0 Ψ = Ψ A0 − iλB 0 A0 + iλB 0 Ψ
D E
D E
2
2
= Ψ A0 Ψ + λ Ψ i[A0 , B 0 ] Ψ + λ2 Ψ B 0 Ψ = (∆Ψ A)2 + λ h Ψ |i[A, B]| Ψ i + λ2 (∆Ψ B)2 ,
dove abbiamo usato la definizione (3.55) di ∆Ψ A e sfruttato il fatto che [A0 , B 0 ] = [A, B]. Ora poiché [A, B]
è simmetrico sul suo dominio, a cui Ψ appartiene per ipotesi, i coefficienti del polinomio in λ di sopra sono
4
In realtà in inglese si usa la terminologia uncertainty relation che è molto più appropriata.
37
reali. Pertanto la disuguaglianza può essere soffisfatta per ogni λ se e solo se l’equazione di secondo grado
non ammette soluzione o ne ammette una sola, ovvero
(h Ψ |i[A, B]| Ψ i)2 − 4 (∆Ψ A)2 (∆Ψ B)2 ≤ 0,
da cui segue direttamente l’enunciato.
Vediamo ora quali sono le conseguenze fisiche del principio di indeterminazione. Data una qualunque
osservabile ∆Ψ A = 0 su un certo stato Ψ se e solo se Ψ è un autostato di A (si veda anche la Sezione 3.8. Al
contrario preso genericamente uno stato Ψ, la misura dell’osservabile A avrà una deviazione standard non
nulla. Il principio di indeterminazione afferma allora che date due osservabili A e B possono esistere stati
senza dispersione per entrambe le osservabili solo se le due osservabili commutano. Non solo ma il prodotto
delle dispersioni delle due osservabili è sempre maggiore o uguale di una certa quantità proporzionale al
valore di aspettazione del commutatore. E’ particolarmente esemplificativo il caso in cui si prendano due
osservabili A e B tali che [A, B] 6= 0 e un autovettore di A: in questo caso ∆Ψ A = 0, ma il membro di destra
della (3.57) sarà in generale non nullo e quindi ∆Ψ B = +∞!
Questa discussione conduce naturalmente alla seguente definizione:
Definizione 3.24 (Osservabili compatibili).
Due osservabili A e B si dicono compatibili se D(A) ∩ D(B) denso in H e [A, B] = 0 su D(A) ∩ D(B).
Esempio 3.18 (Posizione e impulso)
Il caso più importante in assoluto di una coppia di osservabili non compatibili sono la posizione Q e l’impulso
P descritte negli Esempio 3.5 e 3.6. Come vedremo tali operatori descrivono la posizione e l’impulso di una
particella sulla retta reale R.
Osserviamo anzitutto che esiste un denso appartenente all’intersezione di D(Q) e D(P ), che è banalmente
dato, ad esempio, da C0∞ (R). Presa una qualunque Ψ ∈ C0∞ (R), possiamo calcolare il commutatore
[Q, P ]Ψ (x) = −ix∂x Ψ(x) + i∂x (xΨ(x)) = iΨ(x),
cioè
[Q, P ] = iI.
(3.58)
Il commutatore di Q e P è dunque non nullo e porporzionale all’identità. Inoltre se prendiamo ancora
Ψ ∈ C0∞ (R) le ipotesi del Teorema 3.11 sono soddisfatte e quindi
∆Ψ Q ∆Ψ P ≥ 12 .
(3.59)
Tornando alla discussione precedente vediamo quindi che non esistono stati nell’intersezione del dominio di
Q e P sui quali sia la posizione che l’impulso abbiano valore definito! Se perciò misurassimo l’impulso di
una particella di cui conosciamo con esattezza la posizione, otterremmo qualunque valore sulla retta reale
con dispersione infinita. Allo stesso modo la misura della posizione di una particella con impulso definito
avrà dispersione infinita. Per questo si è soliti dire che non si può conoscere simultaneamente posizione e
impulso di una particella quantistica allo stesso tempo.
3.7
Criterio di Autoaggiunzione e Estensioni Autoaggiunte
Per capire se un operatore è autoaggiunto è spesso conveniente il seguente criterio.
Teorema 3.12 (Criterio di autoaggiunzione).
Sia A un operatore simmetrico su H . Allora le seguenti affermazioni sono equivalenti:
i) A autoaggiunto;
ii) A chiuso e ker(A∗ ± i) = {0};
38
iii) ran(A ± i) = H .
Dimostrazione. (1 =⇒ 2) Supponiamo che esista Ψ ∈ D(A∗ ) tale che A∗ Ψ = −iΨ (il caso di segno positivo
è del tutto analogo), allora
i kΨk2 = h−iΨ |Ψ i = hA∗ Ψ |Ψ i = hΨ |AΨ i = −i kΨk2
=⇒
Ψ = 0.
(2 =⇒ 3) Poiché A∗ Ψ = −iΨ non ha soluzione non banale, ran(A − i) deve essere denso in H . Supponiamo infatti che cosı̀ non sia, cioè esista Ψ0 ∈ H non nullo tale che Ψ0 ⊥ ran(A − i), allora avremmo per
ogni Ψ ∈ D(A)
hΨ0 |(A − i)Ψ i = 0,
il che implica che Ψ0 ∈ D(A∗ ). Inoltre
0 = hΨ0 |(A − i)Ψ i = h(A∗ + i)Ψ0 |Ψ i ,
che non è possibile in quanto per densità di D(A) implicherebbe (A∗ + i)Ψ0 = 0, che ha solo la soluzione
nulla. Rimane quindi da dimostrare che ran(A − i) = H , cioè che ran(A − i) è chiuso in norma. Notiamo
però che
k(A − i)Ψk2 = kAΨk2 + kΨk2 ,
per cui se presa una successione Ψn ∈ D(A), si ha (A − i)Ψn → Φ ∈ H , allora si ha anche Ψn → Ψ ∈ D(A).
Dato che l’operatore è chiuso concludiamo che Φ ∈ ran(A) e Φ = (A − i)Ψ. Pertanto ran(A − i) è chiuso e
coincide con H .
(3 =⇒ 1) Sia ora Φ ∈ D(A∗ ). Dato che ran(A − i) = H , ∃Ψ ∈ D(A) tale che (A∗ − i)Φ = (A − i)Ψ.
D’altra parte D(A) ⊂ D(A∗ ) per cui Φ − Ψ ∈ D(A∗ ) e
(A∗ − i)(Φ − Ψ) = 0.
(3.60)
Ma ran(A + i) = H implica che ker(A∗ − i) = {0}: ragionando come prima infatti se esistesse uno Ψ0 non
nullo tale che (A∗ − i)Ψ0 = 0, allora per ogni Ψ ∈ D(A) si avrebbe
0 = hΨ |(A∗ − i)Ψ0 i = h(A + i)Ψ |Ψ0 i ,
cioè Ψ0 sarebbe ortogonale a ran(A + i), che contraddice le ipotesi. Perciò la (3.60) in combinazione con
ker(A∗ − i) = {0} implica che Ψ = Φ, cioè ogni Φ ∈ D(A∗ ) appartiene anche a D(A). In altri termini
D(A) = D(A∗ ) e l’operatore è autoaggiunto.
Osservazione 3.7. Se A non è chiuso vale un teorema analogo a quello precedente in cui al punto 1
“autoaggiunto” va sostituito con “essenzialmente autoaggiunto” e il punto 2 diventa ker(A∗ ± i) = {0} e il
punto 3 ran(A ± i) “denso in H ” anziché coincidente con l’intero H .
Osservazione 3.8. E’ immediato verificare che l’enunciato del Teorema 3.12 precedente non cambia se
anziché considerare A∗ ± i o A ± i si prende un generico numero complesso z tale che =(z) 6= 0 e si
considerano gli operatori A∗ ± z e A ± z.
In particolare il fatto che ran(A − z) = H implica che l’inverso (A − z)−1 è un operatore limitato e
(A − z)−1 ≤
1
,
dist(z, ρ(A))
(3.61)
come segue banalmente da
k(A − z)Ψk2 = k(A − <(z))Ψk2 + |=(z)|2 kΨk2 ≥ |=(z)|2 kΨk2 ,
che vale per ogni Ψ ∈ D(A): ponendo quindi Φ = (A − z)Ψ ∈ H si ottiene la disuguaglianza.
(3.62)
39
Esempio 3.19 (Operatore posizione)
Sappiamo già che l’operatore Q dell’Esempio 3.5 è essenzialmente autoaggiunto. Dimostriamolo usando il
punto 3 del Teorema 3.12. L’operatore Q agisce come moltiplicazione per x, per cui ci dobbiamo chiedere
se al variare di Ψ ∈ D(Q), (x ± i)Ψ(x) sia denso in H . Ma questo è ovvio perché per ogni Φ ∈ C0∞ (R)
Φ(x)
∈ C0∞ (R) = D(Q).
x±i
Pertanto ran(P ± i) contiene un denso dato da C0∞ (R).
Esercizio 3.22. Applicare i criteri del Teorema 3.12 all’operatore P definito nell’Esempio 3.6 per trovare
dimostrazioni alternative che è essenzialmente autoaggiunto.
Esempio 3.20 (Operatore impulso sull’intervallo)
Riprendiamo l’operatore impulso su L2 (0, 1) introdotto nell’Esempio 3.13. Come abbiamo visto esso non è
autoaggiunto. Vediamo se si poteva arrivare alla medesima conclusione in modo alternativo, usando cioè il
Teorema 3.12: usiamo il punto 2 e cerchiamo una soluzione non banale dell’equazione
P Ψ = ±Ψ
=⇒
∂x Ψ(x) = ±Ψ(x),
che ha come soluzioni Ψ± (x) = Ce±x . Siccome Ψ± ∈ D(P ∗ ) in quanto funzioni dolci, il nucleo di P ∗ ± i è
non banale e quindi l’operatore non può essere essenzialmente autoaggiunto.
Si noti che Ψ± ∈
/ D(P ) per cui è essenziale che al punto 2 del criterio di autoaggiunzione si consideri
l’aggiunto dell’operatore. Analogamente a quanto discusso nella dimostrazione del Teorema 3.12 inoltre Ψ±
sono automaticamente ortogonali a tutto ran(P ± i) e quindi quest’ultimo non può essere denso.
Esercizio 3.23. Si consideri l’operatore P definito nell’Esempio
3.20 1precedente e si dimostri
che esso
ammette infinite estensioni autoaggiunte con dominio D(Pα ) = Ψ ∈ H (0, 1) | Ψ(1) = αΨ(0) con α ∈ C,
|α| = 1.
Esempio 3.21 (Interazione puntuale)
Si consideri l’operatore H = −∆ definito sul dominio
D(H) := C0∞ (R \ {0}),
cioè le funzioni dolci a supporto lontano dall’origine, quindi tali che Ψ(0) = 0. Come sappiamo −∆ è
autoaggiunto su H 2 (R) per cui portemmo aspettarci che H sia essenzialmente autoaggiunta. Tuttavia è
facile vedere che D(H) ( H 2 (R) in quanto la convergenza simultanea della funzione e della derivata seconda
implica la convergenza uniforme della successione e, di conseguenza, tutte le funzioni in D(H) si annullano
all’origine. Quindi il dominio della chiusura dell’operatore non coincide con H 2 (R).
Verifichiamo che H non è essenzialmente autoaggiunto. Consideriamo le funzioni
n
o
Ψ± (x) := exp − √12 (1 ± i) |x| ,
(3.63)
e osserviamo che esse soddisfano
− ∆Ψ± (x) = ∓iΨ± (x),
∀x 6= 0.
(3.64)
Dimostriamo che esse appartengono a ran(H ∓ i)⊥ : per ogni Ψ ∈ D(H) abbiamo che dist(supp(Ψ), {0}) ≥ ε,
per un qualche ε > 0, allora
Z
hΨ± |(H ∓ i)Ψ i =
dx Ψ∗± (x) (−∆ ± i) Ψ(x)
R
Z −ε
Z ∞
Z
∗
∗
=
dx Ψ± (x) (−∆Ψ) (x) +
dx Ψ± (x) (−∆Ψ) (x) ∓ i dx Ψ∗± (x)Ψ(x) =
−∞
−ε
Z
=
ε
∗
R
Z
dx (−∆Ψ± ) (x)Ψ(x) +
−∞
ε
∞
∗
Z
dx (−∆Ψ± ) (x)Ψ(x) ∓ i dx Ψ∗± (x)Ψ(x)
R
Z
Z
= ±i dx Ψ∗± (x)Ψ(x) ∓ i dx Ψ∗± (x)Ψ(x) = 0.
R
R
40
Quindi ran(H ∓ i) non è denso e l’operatore non è essenzialmente autoaggiunto per il Teorema 3.12.
Esercizio 3.24. Si dimostri che l’operatore H dell’Esempio 3.21 ammette infinite estensioni autoaggiunte
Hα di dominio D(Hα ) = {Ψ ∈ H 1 (R) ∩ H 2 (R \ {0}) | Ψ0 (0+ ) − Ψ0 (0− ) = αΨ(0)} con α ∈ R.
Esercizio 3.25. Si dimostri che l’operatore N := a† a introdotto nell’Esercizio 3.12 è essenzialmente
autoaggiunto e si trovi il dominio di autoaggiunzione.
Un metodo costruttivo per verificare l’autoaggiunzione di un operatore è fornito dal Teorema di Kato-Rellich
che garantisce la stabilità dell’autoaggiunzione rispetto a piccole perturbazioni.
Definizione 3.25 (Piccola perturbazione).
Dati due operatori autoaggiunti A e B con D(A) ⊂ D(B), B è una piccola perturbazione (nel senso di
Kato) di A se esistono a < 1 e b < ∞ tali che per ogni Ψ ∈ D(A)
kBΨk ≤ a kAΨk + bkΨk.
(3.65)
Osservazione 3.9. Un caso banale in cui la (3.65) è verificata è quello di B operatore limitato autoaggiunto.
In tal caso la disuguaglianza vale per a = 0 e b = kBk.
Osservazione 3.10. Nella definizione di piccola perturbazione è sufficiente che la disuguaglianza (3.65) sia
verificata su un dominio di essenziale autoaggiunzione di A che sia denso in H .
Teorema 3.13 (Teorema di Kato-Rellich).
Siano A un operatore autoaggiunto su D(A) e B un operatore simmetrico piccola perturbazione di A, allora
A + B è autoaggiunto su D(A).
Osservazione 3.11. Alla luce di quanto detto nell’Osservazione 3.10, il Teorema 3.13 si applica anche al
caso in cui A sia essenzialmente autoaggiunto su un denso D(A) su cui B è una piccola perturbazione di A.
In questo caso naturalmente A + B sarà essenzialmente autoaggiunto su D(A).
Dimostrazione. Usiamo il punto 3 del Teorema 3.12, cioè dimostriamo che per un certo µ > 0, ran(A + B +
iµ) = H . Osserviamo anzitutto che per la (3.61) A + iµ è invertibile e ponendo z = −iµ e Ψ = (A + iµ)−1 Φ
nella (3.62) si ottiene che kA(A + iµ)−1 k ≤ 1. Allora usando la definizione di piccolezza
B(A + iµ)−1 Ψ ≤ a A(A + iµ)−1 Ψ + b (A + iµ)−1 Ψ ≤ a + b kΨk,
µ
dove abbiamo usato la (3.61) e il fatto che per ogni Φ ∈ L2 (R3 )
k(A + iµ)Φk2 = kAΦk2 + |µ|2 kΦk2 ,
b
che applicata a Φ = (A + iµ)−1 Ψ dà A(A + iµ)−1 Ψ ≤ 1. Prendendo µ > 1−a
che è limitato poiché a < 1,
−1
−1
otteniamo B(A + iµ) Ψ ≤ kΨk. Allora I + B(A + iµ) è un operatore invertibile con inverso limitato
per la (3.44). Per ogni Φ ∈ H possiamo allora definire
Ψ = (A + iµ)−1 I + B(A + iµ)−1
−1
Φ.
Ovviamente Ψ ∈ D(A) e usando l’identità
A + B + iµ = I + B(A + iµ)−1 (A + iµ) ,
otteniamo
(A + B + iµ) (A + iµ)−1 I + B(A + iµ)−1
−1
= I,
per cui ogni Φ ∈ H è ottenibile come (A+B +iµ)Ψ per una certa Ψ ∈ D(A), cioè ran(A+B +iµ) = H .
Un altro caso in cui l’autoaggiunzione è garantita è quello degli operatori positivi limitati:
41
Definizione 3.26 (Operatore positivo).
Diciamo che un operatore A ∈ L (H ) è positivo e lo indichiamo con A ≥ 0, se
hΨ |AΨ i ≥ 0,
∀Ψ ∈ D(A).
(3.66)
Dati due operatori A e B diciamo che A ≥ B se A − B ≥ 0.
Proposizione 3.16 (Autoaggiunzione degli operatori positivi).
Se A ∈ B(H ) è chiuso e positivo, allora A è autoaggiunto.
Dimostrazione. La dimostrazione è molto semplice e sfrutta il fatto che H è uno spazio di Hilbert complesso.
Dato che A è limitato e chiuso D(A) = H . Inoltre per ogni Ψ ∈ H ,
0 ≤ hΨ |AΨ i = hΨ |AΨ i∗ = hAΨ |Ψ i .
Questo si generalizza facilmente a qualunque coppia di Ψ, Φ ∈ H , usando l’identità di polarizzazione
hΨ |AΦ i =
1
4
hA(Ψ + Φ) |Ψ + Φ i + 41 hA(Ψ − Φ) |Ψ − Φ i + 4i hA(Ψ − iΦ) |Ψ − iΦ i − 4i hA(Ψ + iΦ) |Ψ + iΦ i ,
ricavando
hΨ |AΦ i = hAΨ |Φ i ,
per ogni Ψ, Φ ∈ H .
E’ importante sottolineare come nel caso in cui A sia limitato dal basso il Teorema di Kato-Rellich (3.13)
garantisca anche la limitatezza dal basso di A + B. Prima di enunciare il risultato formuliamo precisamente
la definizione di operatore limitato dal basso:
Definizione 3.27 (Operatori limitati dal basso).
Un operatore A simmetrico è limitato dal basso se ∃|λ0 | < +∞ tale che A ≥ −λ0 , i.e.,
hΨ |AΨ i ≥ −λ0 kΨk2 ,
∀Ψ ∈ D(A).
(3.67)
Corollario 3.1 (Limitatezza dal basso di A + B).
Siano A, B due operatori che soddisfano le ipotesi del Teorema di Kato-Rellich 3.13 e sia A limitato dal
basso con limite dal basso −λ0 . Allora A + B è limitato dal basso e
b
(3.68)
, a|λ0 | + b .
A + B ≥ −λ0 − max
1−a
Dimostrazione. E’ sufficiente ripercorrere la dimostrazione del Teorema 3.13 sostituendo (A + iµ)−1 con
(A + λ)−1 , λ > λ0 . La limitatezza dal basso di A garantisce che tale operatore sia limitato. Dopodiché si
procede allo stesso modo e si osserva che kB(A + λ)−1 k < 1 se
b
λ > λ0 + max
, a|λ0 | + b .
1−a
Infatti
b
B(A + λ)−1 Ψ ≤ a A(A + λ)−1 Ψ + b (A + λ)−1 Ψ ≤ a max 1, |λ0 |
+
kΨk,
λ − λ0
λ − λ0
dove abbiamo usato la disuguaglianza
|λ
|
0
−1
A(A + λ) ≤ max 1,
,
λ − λ0
che può essere dimostrata sfruttando la proprietà degli operatori autoaggiunti kAk = supkΨk=1 h Ψ |A| Ψ i (si
veda anche il teorema spettrale nella forma del Corollario 3.2).
Quindi, per tale λ, A+B +λ è invertibile con inverso limitato, poiché A+B +λ = (A+λ)(1+(A+λ)−1 B)
ed entrambi gli operatori al membro di destra sono invertibili: il primo perché λ ∈ ρ(A) e il secondo perché
1 + (A + λ)−1 B ≥ 1 − (A + λ)−1 B > 0.
Se conclude quindi che λ ∈ ρ(A + B).
42
Se invece A è positivo ma illimitato le cose si complicano leggermente. Prima però di enunciare il risultato generale dobbiamo discutere la possibilità di estendere operatori simmetrici per ottenere operatori autoaggiunti. Come abbiamo visto se A ⊂ A∗ è simmetrico e B un’estensione di A, deve essere
D(A) ⊂ D(B) ⊂ D(B ∗ ) ⊂ D(A∗ ), come segue banalmente dalla definizione del dominio dell’aggiunto:
siccome Φ ∈ D(A∗ ) se supΨ∈D(A),kΨk=1 | hΦ |AΨ i | < +∞, un allargamento del dominio di A implica che
la proprietà debba essere verificata su un dominio più ampio e quindi per un insieme di Φ al più uguale a
quello precedente.
Si potrebbe pensare quindi che, dato un operatore A simmetrico, a patto di prendere un’estensione
“massimale”, questa debba essere autoaggiunta. In realtà questa procedura ha successo solo sotto certe
ipotesi, cioè non tutti gli operatori simmetrici ammettono estensioni autoaggiunte.
Definizione 3.28 (Spazi e indici di difetto).
Sia A un operatore simmetrico, allora definiamo i suoi spazi di difetto H± e indici di difetto n± come
H± := ker(A∗ ∓ i) = ran(A ± i)⊥ ,
n± (A) := dim H± .
(3.69)
Teorema 3.14 (Estensioni autoaggiunte).
Sia A un operatore simmetrico chiuso, allora
i) A autoaggiunto se e solo se n+ (A) = n− (A) = 0;
ii) A ammette estensioni autoaggiunte se e solo se n+ = n− e in tal caso le estensioni autoaggiunte AU
sono indicizzate dagli operatori unitari U : H+ → H− :
D(AU ) = Ψ + Φ+ + U Φ+ Ψ ∈ D(A), Φ+ ∈ H+ ,
(3.70)
AU (Ψ + Φ+ + U Φ+ ) = AΨ + iΦ+ − iU Ψ+ .
(3.71)
Il caso degli operatori positivi è compreso nel seguente risultato generale, che riguarda gli operatori limitati
dal basso.
Proposizione 3.17 (Estensioni autoaggiunte di operatori limitati dal basso).
Sia A simmetrico e limitato dal basso, allora n+ (A) = n− (A) e A ammette entensioni autoaggiunte. Fra
queste ce n’è almeno una (l’estensione di Friedrichs) che è ancora limitata dal basso con lo stesso limite dal
basso di A.
3.8
Spettro e Risolvente
Ricordiamo anzitutto che per matrici su CN lo spettro è l’insieme degli autovalori, o in altri termini l’insieme
degli z ∈ C tali che A − z non è invertibile. Per gli operatori la definizione è del tutto analoga.
Definizione 3.29 (Spettro).
Dato un operatore A il suo spettro σ(A) è l’insieme degli z ∈ C tali che A − z non è invertibile con inverso
limitato. Si dice risolvente o insieme risolvente ρ(A) l’insieme degli z ∈ C per cui A − z è invertibile
con inverso limitato, cioè σ(A) = C \ ρ(A). Per ogni z ∈ ρ(A) si chiama risolvente l’operatore (A − z)−1 .
Osservazione 3.12. I casi possibili in cui A − z non è invertibile con inverso limitato sono i seguenti:
1. A − z non iniettivo, ma allora ∃Ψ ∈ H tale che AΨ = zΨ cioè z è autovalore di A e Ψ un relativo
autovettore; l’insieme degli autovalori di A si dice spettro puntuale e si indica con σpp (A);
2. A − z iniettivo ma non surgettivo con ran(A − z) denso in H : in questo caso (A − z)−1 è definibile
su un denso e perciò non deve essere limitato. Alla luce della Proposizione 3.12 questo implica che
inf
kΨk=1,Ψ∈D(A)
k(A − z)Ψk = 0,
(3.72)
43
cioè esistono dei quasi-autovettori di A (si veda anche la Teorema 3.15), ovvero dei vettori Ψε tali che
kχε k ≤ ε,
AΨε = zΨε + χε ,
con ε → 0. Naturalmente Ψε non converge in H quando ε → 0, altrimenti avremmo che A − z è non
iniettivo. In questo caso si parla di spettro continuo;
3. A − z iniettivo ma non surgettivo con ran(A − z) non denso in H : questo caso è escluso per operatori
simmetrici, ma in generale si può presentare; gli z ∈ C con queste proprietà costituiscono quello che
si chiama spettro residuo e si indica con σres (A).
Proposizione 3.18 (Spettro non vuoto e chiuso).
Per ogni operatore A ∈ B(H ), σ(A) 6= ∅, σ(A) è un insieme chiuso e conseguentemente ρ(A) è un insieme
aperto.
Proposizione 3.19 (Raggio spettrale).
Dato un operatore A ∈ B(H ) sia il suo raggio spettrale r(A) := supλ∈σ(A) |λ|, allora vale
1
r(A) = lim kAn k n
n→∞
(3.73)
mentre, se A è autoaggiunto, r(A) = kAk.
Esempio 3.22 (Operatori di shift)
Rirpendiamo gli operatori di shift destro e sinistro definiti nell’Esempio 3.16. Cominciamo con l’osservare
che poiché kT k = kT ∗ k = 1, allora tutti i λ ∈ C tali che |λ| > 1 appartengono a ρ(T ) e ρ(T ∗ ) (si veda la
Proposizione 3.19).
Cerchiamo ora gli autovalori di T e T ∗ : sia λ ∈ C con |λ| ≤ 1 e consideriamo l’equazione T {u} = λ{u},
che implica
λu1 = 0,
λu2 = u1 ,
λu3 = u2 ,
..
.
che ammette solo la soluzione nulla: se λ 6= 0 la prima equazione implica u1 = 0 e le altre a seguire un = 0
per ogni n. Viceversa se λ = 0, le equazioni dalla seconda in poi implicano ancora un = 0 per ogni n. Quindi
σpp (T ) = ∅. Vediamo ora se ci sono autovalori per T ∗ : l’equazione agli autovalori T ∗ {u} = λ{u} per |λ| ≤ 1
dà
λu2 = λu1 ,
λu3 = λu2 ,
λu4 = λu3 ,
..
.
che ha soluzione un = λn−1 u1 , dove u1 ∈ C è un qualunque numero complesso, che possiamo prendere uguale
a 1, senza perdita di generalità. Ovviamente la successione appartiene a `2 (N) se e solo se |λ| < 1. Perciò
σpp (T ∗ ) = {λ ∈ C | |λ| < 1} ,
(3.74)
(λ)
con relativi autovettori {u(λ) } di componenti un = λn−1 .
Analizziamo ora T − λ per λ ∈ C, |λ| < 1: poiché come vedremo ran(T − λ) non è denso in `2 (N), tali
punti appartengono allo spettro di T e più precisamente
σres (T ) = {λ ∈ C | |λ| < 1} .
(3.75)
44
∗
Possiamo infatti mostrare che i vettori {u(λ ) } definiti sopra sono ortogonali all’immagine di T − λ: per ogni
u∈H
D
E D
E
∗
∗
{u(λ ) } (T − λ){u} = (T − λ∗ ){u(λ ) } {u} = 0.
Resta da decidere cosa succede ai λ tali che |λ| = 1. Poiché lo spettro è chiuso devono certamente
appartenere allo spettro sia di T che di T ∗ .
Osserviamo che tali punti non appartengono allo spettro puntuale di T ∗ , perché l’equazione agli autovalori
non ha soluzione in `2 (N). D’altra parte non possono nemmeno appartenere allo spettro residuo di T ∗
perché altrimenti l’immagine di T ∗ − λ non sarebbe densa e qualunque vettore nel complemento ortogonale
di ran(T ∗ − λ) sarebbe in realtà un autovalore di T , il che è assurdo visto che σpp (T ) = ∅. Se ne conclude che
devono costituire spettro né puntuale né residuo (lo spettro descritto al punto 2 dell’Osservazione 3.3.12).
Con lo stesso argomento usato sopra possiamo allora concludere che anche nel caso di T i punti al bordo
dello spettro stanno nello spettro di tipo 2. E’ infatti un risultato generale che se un punto è nello spettro
residuo di un operatore T , allora lo stesso punto è un autovalore di T ∗ , ma T ∗ non ha autovalori con |λ| = 1.
D’altra parte T non ha autovalori e il risultato è dimostrato.
Per riassumere abbiamo
σ(T ) = σ(T ∗ ) = {λ ∈ C | |λ| ≤ 1} ,
σres (T ) = σpp (T ∗ ) = {λ ∈ C | |λ| < 1} .
(3.76)
Esercizio 3.26. Si considerino gli operatori T1 = −i∂x e T2 = −i∂x su L2 (0, 1) con domini D(T1 ) = H 1 (0, 1)
e D(T2 ) = {Ψ ∈ H 1 (0, 1) | Ψ(0) = 0}. Si dimostri che σ(T1 ) = C mentre σ(T2 ) = ∅.
L’operatore risolvente ha alcune proprietà molto utili:
Proposizione 3.20 (Identità del risolvente).
Sia A ∈ L (H ) e z, z 0 ∈ ρ(A), allora
(A − z)−1 − (A − z 0 )−1 = (z − z 0 )(A − z)−1 (A − z 0 )−1 .
(3.77)
Se A inoltre è autoaggiunto, B è un operatore simmetrico piccola perturbazione di A e z ∈ ρ(A) ∪ ρ(A + B),
allora
(A + B − z)−1 = (A − z)−1 − (A − z)−1 B(A + B − z)−1 .
(3.78)
Nel caso di operatori autoaggiunti inoltre i punti dello spettro possono essere caratterizzati più in dettaglio.
Proposizione 3.21 (Spettro degli operatori autoaggiunti).
Sia A un operatore autoaggiunto, allora,
i) σres (A) = ∅;
ii) σ(A) ⊂ R;
iii) autovettori relativi ad autovalori distinti sono ortogonali.
Dimostrazione. La dimostrazione dei primi due punti è implicitamente contenuta in quanto affermato nell’Osservazione 3.3.8: siccome per ogni z ∈ C\R, A−z è invertibile con inverso limitato, allora σ(A) ⊂ R. L’assenza di spettro residuo è conseguenza di un risultato generale sullo spettro di ogni operatore: se λ ∈ σres (A)
allora λ ∈ σpp (A∗ ), cioè i punti dello spettro residuo di un operatore appartengono necessariamente allo
spettro puntuale dell’aggiunto.
Per il punto c), come già argomentato nella dimostrazione del Teorema 3.12, se z ∈ C \ R fosse un
autovalore di A con autovettore Ψz ∈ D(A) ⊂ D(A∗ ), avremmo
z ∗ hΨz |Ψz i = hAΨz |Ψz i = hΨz |AΨz i = z hΨz |Ψz i
=⇒
Ψz = 0.
45
Pertanto gli autovalori sono reali e se prendiamo λ, µ due autovalori distinti λ 6= µ con relativi autovettori
Ψλ e Ψµ , abbiamo
λ hΨλ |Ψµ i = hAΨλ |Ψµ i = hΨλ |AΨµ i = µ hΨλ |Ψµ i
=⇒
hΨλ |Ψµ i = 0.
Esercizio 3.27. Si considerino gli operatori Pα introdotti nell’Esercizio 3.23 e in particolare P1 : si trovi lo
spettro σ(P1 ).
Teorema 3.15 (Teorema di Weyl).
Dato un operatore autoaggiunto A, λ ∈ σ(A) se e solo se esiste una successione (detta di Weyl) di stati
Ψn ∈ D(A) tale che kΨn k = 1 e
lim k(A − λ) Ψn k = 0.
(3.79)
n→∞
Dimostrazione. Il risultato è sostanzialmente già dimostrato nell’Osservazione 3.3.12. Osservando che per la
Proposizione 3.21 A in quanto autoaggiunto non ha spettro residuo, allora si presentano due possibilità: o λ è
un autovalore, ma allora la successione costante uguale a un autovettore relativo soddisfa la (3.79); altrimenti
A − λ non è surgettivo ma la sua immagine è densa e allora l’argomento al punto 2 dell’Osservazione 3.3.12
mostra l’esistenza di una successione di Weyl.
Infine mostriamo che lo spettro è invariante rispetto a trasformazioni unitarie.
Teorema 3.16 (Equivalenza unitaria II).
Dato un operatore A su H e un unitario U : H −→ H 0 , sia A0 = U AU −1 , allora σ(A) = σ(A0 ).
Osservazione 3.13. Un caso interessante in cui l’uso di un operatore unitario permette di semplificare
notevolmente lo studio di un operatore è quando esiste un sistema ortonormale completo di autovettori
{un } ∈ H (l’analogo discreto di quanto detto nell’Osservazione 3.3.6). In questo caso possiamo fare uso
di quanto detto nell’Esempio 3.15: la mappa che va dallo spazio di Hilbert di partenza H ad `2 (N) in cui
si associa al generico vettore Ψ i suoi coefficienti di Fourier rispetto alla base {un } è infatti in questo caso
automaticamente unitaria.
Esempio 3.23 (Laplaciano con condizioni al bordo di Neumann)
Vediamo un esempio esplicito in cui si può applicare la strategia descritta nell’Osservazione 3.3.13.
Consideriamo l’operatore HN in L2 (0, π) definito come
(HN Ψ) (x) = −∆Ψ(x),
D(HN ) = Ψ ∈ H 2 (0, 1) Ψ0 (π) = Ψ0 (0) = 0 .
(3.80)
E’ facile vedere che ammette un set completo di autovettori: siano infatti {un } e {vn }, n ∈ N ∪ {0}, le
funzioni
q
q
u0 (x) = √1π ,
vn (x) = π2 sin(nx),
(3.81)
un (x) := π2 cos(nx),
allora per ciascuna di esse vale −∆un = n2 un e −∆vn = n2 vn , però solo le un (x) soddisfano le condizioni al
bordo che compaiono in D(HN ). Infatti
u0n (π) = u0n (0) = 0
=⇒
un ∈ D(HN ),
HN un = n2 un .
Inoltre le {un } sono ovviamente ortonormali:
Z
Z
2 π
1 π
2
dx cos (nx) =
dx (1 + cos(2nx)) = 1,
π 0
π 0
Z
Z
2 π
1 π
dx cos(nx) cos(mx) =
dx (cos[(n + m)x] + cos[(n − m)x]) = 0,
π 0
π 0
46
se n 6= m. Infine le {un } costituiscono un sistema completo e quindi un s.o.n.c.: sappiamo che la base di
Fourier {un }, {vn } è completa in L2 (−π, π), ma allora data una qualunque funzione Ψ in L2 (0, π) possiamo
prolungarla in modo pari rispetto all’origine ovvero ponendo Ψ̃(x) = Ψ(x)+Ψ(−x) e tale funzione sviluppata
nella base di Fourier {un }, {vn } avrà coefficienti non nulli solo nello sviluppo rispetto alle {un }, poiché le
{vn } sono dispari. Quindi le {un } sono complete in L2 (0, π). Per inciso nello stesso modo si dimostra che le
{vn } sono complete in L2 (0, π).
A questo punto la trasformazione U definita nell’Esempio 3.15 è certamente unitaria. Quindi otteniamo
immediatamente che
σ(HN ) = σpp (HN ) = n2 , n ∈ N ∪ {0} .
(3.82)
Per altro il Teorema 3.10 ci dice anche che HN è autoaggiunto su D(HN ) in quando lo stesso vale per
l’operatore N su `2 (N ∪ {0}) definito come
N en = n2 en ,
D(N ) = {un } ∈ `2 (N ∪ {0}) n2 un ∈ `2 (N) .
(3.83)
Si noti anche che U ∗ D(N ) = D(HN ) per definizione di spazio H p : le condizioni al bordo sono conseguenza
del fatto che la serie di Fourier delle derivate di ogni funzione Ψ in D(HN ) converge totalmente e quindi
uniformemente grazie alle proprietà dei coefficienti di Fourier in D(N ) e perciò Ψ0 (π) = Ψ0 (0) = 0, dato che
lo stesso vale per ogni elemento della base {un }.
2
Esercizio3.28. Dimostrare
che l’operatoreHD su L (0, π) definito come (HD Ψ) (x) = −∆Ψ(x) sul dominio
2
D(HD ) = Ψ ∈ H (0, 1) Ψ(π) = Ψ(0) = 0 (Laplaciano con condizioni al bordo di Dirichlet) è autoaggiunto
e trovarne lo spettro.
3.9
Teorema Spettrale e Interpretazione Probabilistica
In questa Sezione formuleremo il teorema spettrale e ne discuteremo le conseguenze in MQ, più precisamente
vedremo come una delle possibili versioni del teorema spettrale garantisca la possibilità di rappresentare ogni
operatore autoaggiunto su H , e perciò ogni osservabile, come operatore di moltiplicazione su un opportuno
spazio L2 .
Gli operatori di moltiplicazione recitano perciò un ruolo privilegiato in MQ, che li rende in qualche
senso l’analogo infinito-dimensionale delle matrici diagonalizzabili in dimensione finita. Più nel dettaglio
ogni operatore di moltiplicazione ammette interpretazione probabilistica, ovvero, alla luce del Postulato 3
della MQ, la misura dell’osservabile associata si comporta come una variabile aleatoria con frequenze di
aspettazione e valori medi previsti dalla teoria.
Prima di formulare in generale il teorema spettrale vediamo come alcune delle sue implicazioni siano
ovvie e naturali nel caso degli operatori di moltiplicazione. Prendiamo perciò un operatore M su L2 (Rd )
che sia di moltiplicazione per una funzione F ∈ C(Rd ) limitata, ovvero
(M Ψ) (x) = F (x)Ψ(x).
(3.84)
Come abbiamo visto, se F è limitata, l’operatore M è anch’esso limitato. Assumiamo inoltre che F : Rd → R
sia reale. In tal caso abbiamo visto che M è anche autoaggiunto.
Grazie alle proprietà di M è naturale definire le potenze M k , k ∈ N, di M e si vede immediatamente che
M k Ψ (x) = F k (x)Ψ(x),
(3.85)
e tali operatori
P sono anch’essi limitati e autoaggiunti. Dalle potenze è poi banale passare ai polinomi. Inoltre
se P (x) = k ak xk è un qualsiasi polinomio e Ψ ∈ H vale l’identità
Z
h Ψ |P (M )| Ψ i =
dx |Ψ(x)|2 P (F (x)),
(3.86)
Rd
47
che può essere riscritta come
Z
h Ψ |P (M )| Ψ i =
dµΨ (x) P (F (x)),
(3.87)
Rd
dove abbiamo definito la misura spettrale di M come
dµΨ (x) = |Ψ(x)|2 dx.
(3.88)
Grazie alla normalizzazione in L2 (Rd ) di Ψ e alla positività di |Ψ|2 , se vede immediatamente che µ è una
misura di probabilità. Vale allora per M la seguente interpretazione proabilistica: l’operatore e più in
generale i polinomi in M si rappresentano come funzioni di una variabile aleatoria x con distribuzione di
probabilità |Ψ(x)|2 .
Vediamo ora come questa interpretazione probabilistica per un operatore di moltiplicazione autoaggiunto
si connette con il Postulato 3 della MQ. Assumiamo perciò che M sia un’osservabile data da un operatore
di moltiplicazione autoaggiunto (limitato) M su L2 (Rd ). Il Postulato 3 riformulato per un operatore di
moltiplicazione ci dice che il valore di aspettazione dell’osservabile M nello stato Ψ è dato da
Z
dµΨ (x) F (x),
(3.89)
hM i = h Ψ |M | Ψ i =
Rd
dove µΨ è la misura spettrale definita in (3.88). Inoltre i valori possibili nella misura di M sono
σ(M ) = ran(F ),
(3.90)
ed essi appaiono con frequenze di visita che approssimano le probabilità cosı̀ definite: sia (a, b) ⊂ ran(F ) un
qualunque aperto contenuto nell’immagine di F e I(a, b) la sua controimmagine, i.e., I(a, b) := F −1 (a, b),
allora i valori di M in (a, b) hanno le seguenti probabilità PM,Ψ (a, b) di essere misurati nello stato Ψ,
Z
Z
PM,Ψ (a, b) =
dµΨ (x) =
dx |Ψ(x)|2 .
(3.91)
I(a,b)
I(a,b)
Perciò l’interpretazione probilistica discussa in precedenza non è solo una rilettura matematica del formalismo degli operatori di moltiplicazione in L2 , ma l’intepretazione fisica della MQ: dato un’osservabile
rappresentabile come operatore di moltiplicazione, la misura di tale grandezza fisica nello stato Ψ avrà lo
stesso comportamento di una variabile stocastica con misura di probabilità µΨ .
Prima di discutere la generalità dello schema intepretativo precedente, discutiamo altre conseguenze
delle proprietà degli operatori di moltiplicazione. Notiamo infatti che dalla costruzione dei polinomi di
M è facile passare alle funzioni continue di M : sia G ∈ C(R) una funzione continua, per il teorema di
Stone-Weiestrass possiamo trovare una successione di polinomi Pn (x) tale che supx∈R |G(x) − Pn (x)| → 0
per n → ∞. Allora possiamo pensare di definire G(M ) come il limite della successione Pn (M ). Chiaramente
è necessario specificare la topologia in cui si prende questo limite:
Definizione 3.30 (Convergenza in norma).
Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in norma (operatoriale) se
kA − An k −→ 0.
n→∞
Dimostriamo che sotto le ipotesi predecenti possiamo porre
G(M ) := lim Pn (M ),
(3.92)
n→∞
o più concretamente che la successione Pn (M ) è una sucessione di Cauchy nella topologia in norma definita
sopra:
Z
2
kPn (M ) − Pm (M )k =
sup
dx |Pn (F (x)) − Pm (F (x))|2 |Ψ(x)|2
Ψ∈H ,kΨk2 =1 Rd
≤ sup |Pn (F (x)) − Pm (F (x))|2 −→ 0,
x∈Rd
n,m→∞
48
grazie all’ipotesi di convergenza in norma sup della successione di polinomi Pn . In effetti si può dimostrare
che questo modo di definire le funzioni continue di M induce un omomorfismo fra l’algebra delle funzioni
continue su σ(M ) e la C ∗ algebra generata da M , ovvero la chiusura in norma dell’algebra dei polinomi di
M.
In modo simile si può dimostrare la possibilità di costruire l’operatore G(A) per ogni funzione misurabile
G ∈ L∞ (R). Ogni funzione misurabile (borelliana) si può infatti ottenere come limite puntuale di una
successione Gn ∈ C(R) di funzioni continue e limitate, i.e., G(x) = limn→∞ Gn (x) per ogni x ∈ R e
|Gn (x)| ≤ C < +∞. Allora possiamo pensare di definire l’operatore G(M ) come limite degli operatori
Gn (M ), dove il limite va però inteso in una topologia più debole di quella operatoriale.
Definizione 3.31 (Convergenza forte).
s
Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in senso forte se
k(A − An )Ψk −→ 0 per ogni Ψ ∈ H .
n→∞
Definizione 3.32 (Convergenza debole).
w
Sia An ∈ B(H ) una successione di operatori, allora diciamo che An −→ A in senso debole se
hΦ |(A − An )Ψ i −→ 0 per ogni Φ, Ψ ∈ H .
n→∞
Non discuteremo qui le differenze fra le varie nozioni convergenza e le relative topologie ma sottolianeamo
che, come si può facilmente intuire e dimostrare, la convergenza in norma implica quella forte che a sua
volta implica quella debole. Vediamo come questo si può realizzare in alcuni semplici esempi.
Esempio 3.24 Consideriamo i seguenti operatori in `2 (N):
Tn (u1 , u2 , . . .) =
1
1
n u1 , n u2 , . . .
n termini
,
z }| {
Sn (u1 , u2 , . . .) = (0, 0, . . . , 0, un+1 , un+2 , . . .),
n termini
z }| {
Sn (u1 , u2 , . . .) = (0, 0, . . . , 0, u1 , u2 , . . .).
(3.93)
Dimostriamo che Tn −→ 0:
n→∞
kTn k2 =
X 1
1
|uj |2 = 2 −→ 0.
2
n
n n→∞
{uj }∈`2 (N),k{uj }k2 =1
sup
j∈N
Invece Sn non converge in norma ma solo in senso forte:
∞
X
kSn {uj }k2 =
|uj |2 −→ 0,
j=n+1
n→∞
per ogni {uj } ∈ `2 (N), ma
kSn {uj }k2 =
sup
{uj }∈`2 (N),k{uj }k2 =1
∞
X
sup
|uj |2 9 0,
{uj }∈`2 (N),k{uj }k2 =1 j=n+1
come segue per esempio valutando l’espressione di sopra su en+1 .
Infine nel caso di Wn dimostriamo che converge debolmente a 0 ma non converge né in norma né in senso
forte:
X
1/2 X
1/2
∞
X
∗
−→ 0,
h{vj } |Wn {uj } i =
vj+n
uj ≤
|uj |2
|vj |2
j=n+1
j∈N
per ogni {uj }, {vj } ∈ `2 (N). Ma d’altra parte
kWn {uj }k22 =
X
j∈N
|uj |2 = 1,
n→∞
49
per ogni {uj } normalizzata e quindi W 9 0 né in senso forte né tanto meno in norma.
Tornando alla discussione precedente possiamo allora notare che dovremo definire G(M ) come il limite forte
della successione costruita cioè,
G(M ) := s − lim Gn (M ).
(3.94)
n→∞
Tale successione converge infatti fortemente grazie alle ipotesi che abbiamo fatto sulle Gn : è suffciente
dimostrare che la successione Gn (M )Ψ è di Cauchy per ogni Ψ ∈ H , ma
2
Z
k(Gn (M ) − Gm (M )) Ψk =
Rd
dx |Gn (F (x)) − Gm (F (x))|2 |Ψ(x)|2
Z
dµΨ (x) |Gn (F (x)) − Gm (F (x))|2 −→ 0,
=
n,m→∞
Rd
per semplice convergenza dominata. Abbiamo perciò una “ricetta” per costruire tutte le funzioni misurabili
di M a partire di polinomi in M . In realtà si può dimostrare che questa procedura induce un omomorfismo
fra l’algebra delle funzioni misurabili su σ(M ) e la chiusura dell’algebra dei polinomi di M nella topologia
forte. Quest’ultima prende il nome di algebra di Von Neumann di M e si dimostra che essa coincide con la
chiusura debole dello stesso spazio.
Un esempio molto importante di funzioni misurabili su σ(M ) è rappresentato dalle funzioni caratteristiche: sia (a, b) ⊂ σ(M ) un intervallo contenuto nello spettro di M , allora EM (a, b) il proiettore spettrale di M
associato all’intervallo (a, b) è l’operatore associato alla funzione caratteristica dell’intervallo (a, b), ovvero
EM (a, b) := 1(a,b) (M ),
1(a,b) (M )Ψ (x) = 1I(a,b) (x)Ψ(x),
(3.95)
dove I(a, b) = F −1 (a, b) è il borelliano controimmagine di (a, b). La seconda identità è una conseguenza ovvia
della definizione e può essere facilmente verificata su una successione di funzioni continue che convergano
puntualmente a 1(a,b) : poiché 1(a,b) (M ) deve essere non nullo solo su stati su cui il valore di F sia compreso fra
(a, b) è chiaro che come operatore di moltiplicazione su L2 (Rd ) questo deve proiettare sulla controimmagine
di (a, b).
Ora verificheremo che l’operatore (3.95) sia effettivamente un proiettore e dimostreremo alcune proprietà
della famiglia di proiettori al variare dell’intervallo in σ(M ). Prima però osserviamo che alla luce del
Postulato 3 della MQ e della discussione precedente, tale definizione è necessaria al fine di poter identificare
le probabilità con la (3.91): come stabilito nel Postulato 3 infatti la probabilità di osservare un valore di M
nell’intervallo (a, b) nello stato Ψ è
Z
Z
2
2
kEM (a, b)Ψk =
dx 1I(a,b) (x) |Ψ(x)| =
dµΨ (x),
(3.96)
Rd
I(a,b)
che coincide con la (3.91).
Per quanto riguarda l’operatore EM (a, b) vediamo che si tratta di un proiettore ortogonale come
introdotto nella Definizione 3.23: sfruttiamo la Proposizione 3.15 e osserviamo che
Z
kEM (a, b)Ψk2 =
dx 1I(a,b) (x) |Ψ(x)|2 ≤ kΨk22 ,
Rd
per cui l’operatore è limitato e kEM (a, b)k ≤ 1. Inoltre è un operatore autoaggiunto in quanto operatore di
2 (a, b) = E (a, b)
moltiplicazione per una funzione reale limitata (si veda la (3.95)). Infine il fatto che EM
M
2
segue ancora dalla (3.95) e dall’indentità banale (1I(a,b) (x)) = 1I(a,b) (x).
Poniamo ora per ogni λ ∈ R
EM (λ) := EM (−∞, λ),
(3.97)
e verifichiamo che al variare di λ tali operatori soddisfano le proprietà di una famiglia spettrale (si veda la
prossima Definizione 3.33): per ogni Ψ ∈ H normalizzata, i.e., tale che kΨk2 = 1,
1.
lim EM (λ)Ψ = 0 e lim EM (λ)Ψ = Ψ;
λ→−∞
λ→+∞
50
2. se λ ≤ µ allora h Ψ |EM (λ)| Ψ i ≤ h Ψ |EM (µ)| Ψ i;
3. lim EM (λ + ε)Ψ = EM (λ)Ψ cioè la famiglia è continua al variare di λ.
ε→0
Il punto 1. è il più facile da dimostrare in quanto segue direttamente dalla (3.95) e dalla normalizzazione di
Ψ. Per il secondo è sufficiente osservare che l’integrando nella (3.95) è una funzione positiva. Infine il punto
3. segue per convergenza dominata.
Usando le proprietà enunciate sopra si può definire una misura (di Lebesgue-Stieltjes) su R nel modo
seguente: fissato lo stato Ψ ∈ H (non necessariamente normalizzato) e dato un qualsiasi intervallo (a, b) ⊂ R
poniamo
µΨ ((a, b)) := h Ψ |EM (b)| Ψ i − h Ψ |EM (a)| Ψ i ,
(3.98)
e dagli aperti estendiamo la misura ai borelliani S di R via
X
µΨ (S) := inf
µΨ (Ik ),
Ik
(3.99)
k
cioè richiedendo che sia regolare. Gli intervalli Ik sono scelti nella definizione precedente in modo che
ovviamente S ⊂ ∪k Ik . Si noti che grazie alle proprietà enunciate in precedenza la funzione h Ψ |EM (λ)| Ψ i
al variare di λ va da R a [0, kΨk], è monotona non decrescente e vale 0 per λ = −∞. Inoltre essa è continua
al variare di λ. Questo ci garantisce che la definizione (3.98) è be posta e identifica una misura di Borel
regolare su R, anch’essa chiamata misura spettrale. In effetti a meno di una trasformazione dello spazio di
base (cambio di variabili) la misura coincide con quella definita nella (3.88). Si noti inoltre che
supp(µΨ ) ⊂ σ(M ),
(3.100)
poiché la misura di ogni insieme che non interseca lo spettro di M è certamente nulla: se ad esempio
(a, b) ∩ σ(M ) = ∅, allora I(a, b) = ∅ e quindi per la (3.95) µΨ ((a, b)) = 0.
La misura spettrale dµΨ (λ) viene anche indicata con d h Ψ |EM (λ)| Ψ i ed è immediato estenderla a una
misura complessa su coppie di vettori Ψ, Φ ∈ H usando l’identità di polarizzazione
µΨ,Φ (λ) := 14 µΨ+Φ (λ) − 14 µΨ−Φ (λ) + 4i µΨ−iΦ (λ) − 4i µΨ+iΦ (λ),
(3.101)
che nella notazione precedente diventa dµΨ,Φ (λ) = d h Ψ |E(λ)| Φ i.
Un’ultima importante proprietà della misura spettrale è che permette in modo alternativo di definire le
funzioni misurabili di M . Infatti per ogni Ψ e Φ in H abbiamo
Z
h Ψ |M | Φ i =
dµΨ,Φ (λ) λ,
(3.102)
σ(M )
e similmente per ogni funzione misurabile G : R → R
Z
h Ψ |G(M )| Φ i =
dµΨ,Φ (λ) G(λ).
(3.103)
σ(M )
Quindi dalla prima identità ricaviamo che grazie alla misura spettrale lo spazio di Hilbert può essere mappato
in uno spazio L2 (σ(M )), dove l’operatore agisce come operatore di moltiplicazione per la funzione λ, mentre
le sue funzioni misurabili G(M ) corrispondono agli operatori di moltiplicazione per la funzione G(λ).
Ovviamente questa rappresentazione dipende dalla coppia di vettori Ψ e Φ ma la separabilità dello spazio
di Hilbert permette di estenderla all’intero spazio. Se ci limitiamo infatti alla misura reale e a un singolo stato
Ψ e consideriamo la chiusura di P (M )Ψ questo può o meno coincidere con l’intero H . Se P (M )Ψ = H ,
nel qual caso si dice che Ψ è ciclico, allora la rappresentazione indotta dalla misura spettrale può essere
⊥
ovviamente estesa a tutto H . Se invece questo non avviene si può cercare una Ψ1 in P (M )Ψ e costruire
la relativa misura spettrale. Alla fine della procedure la separabilità dello spazio d Hilbert garantisce che
51
si sarà trovata una successione al più numerabile {Ψn }n∈N , tale che in ogni spazio ciclico Hn := P (M )Ψn
valga la rappresentazione indotta dalla misura dµΨn (λ), cioè 5
Hn ' L2 (σ(M ), dµΨn (λ)),
(3.104)
e per cui M agisca su Hn come operatore di moltiplicazione per λ. Se poi la successione degli Ψn è scelta
in modo che la serie delle norme kΨn k2 sia sommabile, allora
L (R , dx) = H =
2
d
∞
M
Hn '
n=1
∞
M
L2 (σ(M ), dµΨn (λ)).
(3.105)
n=1
Nella discussione sviluppata fin qui, abbiamo dunque visto che l’interpretazione probabilistica si applica agli operatori di moltiplicazione, che quindi costuiscono una classe molto speciale di osservabili. In
realtà è possibile dimostrare che tale interpretazione si applica solo agli operatori di moltiplicazione o, più
precisamente, che se vale l’interpretazione probabilistica di un operatore allora esiste una rappresentazione
dello spazio di Hilbert (isomorfismo isometrico) tale che l’operatore viene rapprentato come operatore di
moltiplicazione.
Teorema 3.17 (Interpretazione probabilistica parziale).
Data un osservabile A e uno stato Ψ ∈ H , se l’intepretazione probabilistica vale per {P (A)Ψ} per ogni
polinomio P , cioè ∃ una misura di Borel regolare νΨ tale che
Z
h Ψ |P (A)| Ψ i =
dνΨ (x) P (x),
(3.106)
R
allora {P (A)Ψ} è isomorfo a L2 (R, dνΨ ) e A agisce su tale spazio come operatore di moltiplicazione per x.
Dimostrazione. Siano Ψ1 e Ψ2 due generici vettori in {P (A)Ψ} tali che Ψi = Pi (A)Ψ per due polinomi P1
e P2 , allora abbiamo
h Ψ1 |A| Ψ2 i = h P1 (A)Ψ |A| P2 (A)Ψ i =
h Ψ |P1∗ (A)AP2 (A)| Ψ i
Z
=
dνΨ (x) P1∗ (x)xP2 (x)
R
= h P1 |x| P2 iL2 (R,dνΨ (x)) .
L’isomorfismo è dunque identificato dalla corrispondenza fra il generico stato Ψ1 e il corrispondente polinomio
P1 tale che Ψ1 = P1 (A)Ψ. Inoltre su L2 (R, dνΨ (x)) A agisce come operatore di moltiplicazione per x. La
chiusura dello spazio dei polinomi in norma L2 (R, dνΨ (x)) completa l’enunciato.
Teorema 3.18 (Intepretazione probabilistica globale).
Se data un’osservabile A, la rappresentazione (3.106) vale per ogni Ψ ∈ H spazio di Hilbert separabile,
allora esiste un operatore unitario U , una misura dµ e una funzione misurabile reale F (x) tale che
U H = L2 (Rd , dµ(x)),
U AU −1 Ψ (x) = F (x)Ψ(x).
(3.107)
Dimostrazione. La rappresentazione da H a L2 (Rd , dµ(x)) si costruisce esaurendo lo spazio di Hilbert con
la collezione di Ψi , i = 1, . . . , ∞, e dei relativi spazi ciclici {P (A)Ψi } al variare del polinomio P , dove il
vettore Ψi+1 è scelto nel complemento ortogonale di ∪ij=1 {P (A)Ψj }. La collezione dei Ψi definisce attraverso
il Teorema 3.17 la decomposizione
∞
M
H '
L2 (R, dµi ),
(3.108)
i=1
5
Con la notazione ' indichiamo un isomorfismo (isometrico) fra spazi di Hilbert, ovvero sostanzialmente l’esistenza di un
operatore unitario U : H → H 0 .
52
con µi :=
P∞µΨi . La misura complessiva è allora definita sulle unioni numerabili di aperti2 I = ∪i Ii come
µ(I) = i=1 µi (Ii ) ed è una misura finita se gli Ψi sono scelti in modo che la serie kΨi k sia sommabile,
perché in tal caso
∞
∞
X
X
∞
µ(∪i=1 R) =
µi (R) =
kΨi k22 < +∞.
i=1
i=1
Rimane quindi da capire quali siano gli operatori che possono essere rappresentati come operatori di moltiplicazione perché sappiamo che ad essi si applica l’interpretazione probabilistica. Il teorema spettrale ci
dice appunto che sono tutti e soli gli operatori autoaggiunti.
Teorema 3.19 (Teorema spettrale – operatore di moltiplicazione).
Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora esiste uno spazio di misura (X, µ)
con µ misura finita, un operatore unitario U : H → L2 (X, dµ) e una funzione reale F ∈ L∞
loc (X, dµ) tale
che
i) Ψ ∈ D(A) se e solo se F (x) (U Ψ) (x) ∈ L2 (X, dµ);
ii) per ogni Ψ ∈ U D(A), U AU −1 Ψ (x) = F (x)Ψ(x).
Osservazione 3.14. Se A oltre che ad essere autoaggiunto è anche limitato, allora il Teorema 3.19 può
essere formulato più precisamente: se A è autoaggiunto limitato su H allora esiste una collezione al più
numerabile di misure {µn }N
n=1 con N ∈ N ∪ {∞} su σ(A) e un operatore unitario
U : H −→
N
M
L2 (σ(A), dµn ),
(3.109)
n=1
tale che per ogni Ψ ∈ H , U Ψ = {Ψn }N
n=1 e
U AU −1 Ψ n (λ) = λΨn (λ).
(3.110)
Cioè in ciascuno sottospazio invariante per A, l’operatore agisce come operatore di moltiplicazione per la
funzione λ.
Come abbiamo già visto l’intepretazione probabilistica permette di costruire esplicitamente le funzioni misurabili di ogni operatore autoaggiunto A. In realtà questa costruzione può essere sollevata a un
omomorfismo fra algebre:
Teorema 3.20 (Teorema spettrale – calcolo funzionale).
Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora esiste un’applicazione O : L∞ (R) →
L (H ) tale che
i) O è uno ∗-omomofismo;
ii) O è continuo in norma, cioè kO(G)kL (H ) ≤ kGk∞ ;
q.o.
iii) se Gn ∈ L∞ (R), Gn (x) −→ x e |Gn (x)| ≤ |x| per ogni n, allora lim O(Gn )Ψ = AΨ per ogni Ψ ∈ D(A);
n→∞
w
s
iv) se una successione di funzioni converge debolemente Gn −→ G, allora O(Gn ) −→ O(G);
v) se AΨ = λΨ, λ ∈ R, allora O(G)Ψ = G(λ)Ψ;
vi) se G ≥ 0 allora h Ψ |O(G)| Ψ i ≥ 0 per ogni Ψ ∈ D(G).
Il teorema precedente è utile per costruire le funzioni misurabili di A, come ad esempio i proiettori spettrali
di A ma anche eiAt , t ∈ R, che giocherà un ruolo cruciale nell’esistenza della dinamica di ogni sistema
quantistico (si veda il Teorema 3.31). Una conseguenza ovvia del Teorema 3.20 è il seguente
53
Corollario 3.2 (Funzioni di operatori autoaggiunti).
Sia A un operatore autoaggiunto e F, G ∈ L∞ (R) due funzioni misurabili limitate, allora
i) σ(F (A)) = F (σ(A));
ii) kF (A)k = supλ∈σ(A) |F (λ)|;
iii) (F (A))∗ = F ∗ (A);
iv) (F · G) (A) = F (A)G(A).
Fra le funzioni limitate di un operatore autoaggiunto sono particolarmente importanti i proiettori spettrali:
Definizione 3.33 (Famiglia spettrale).
Una famiglia spettrale in H è una famiglia di proiettori ortogonali {E(λ)}λ∈R su H che soddisfano le
seguenti proprietà
i) per ogni Ψ ∈ H , lim E(λ)Ψ = 0 e lim E(λ)Ψ = Ψ;
λ→−∞
λ→+∞
ii) se λ ≤ µ allora h Ψ |E(λ)| Ψ i ≤ h Ψ |E(µ)| Ψ i;
iii) lim E(λ + ε)Ψ = E(λ)Ψ.
ε→0
Teorema 3.21 (Teorema spettrale – risoluzione spettrale).
Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora ∃! famiglia spettrale PA (λ) tale
che
Z
D(A) = Ψ ∈ H dµΨ;A (λ) λ2 < +∞ ,
(3.111)
σ(A)
Z
h Φ |A| Ψ i =
dµΦ,Ψ;A (λ) λ,
(3.112)
σ(A)
per ogni Ψ ∈ D(A) e Φ ∈ H e dove le misure dµΨ;A (λ) = d h Ψ |EA (λ)| Ψ i e dµΦ,Ψ;A (λ) = d h Φ |EA (λ)| Ψ i
sono date da (3.98), i.e., per ogni intervallo aperto (a, b) ⊂ R,
µΨ;A ((a, b)) := h Ψ |EA (b)| Ψ i − h Ψ |EA (a)| Ψ i ,
(3.113)
e (3.101) rispettivamente.
Un aspetto che rende tuttavia il teorema spettrale in quest’ultima forma poco utile in generale è il fatto che
non fornisce una ricetta per costruire la risoluzione spettrale, non è cioè un risultato costruttivo. Discuteremo
ora alcuni esempi in cui la risoluzione spettrale può essere esplicitamente scritta.
Esempio 3.25 (Operatore posizione)
Torniamo all’Esempio 3.5: l’operatore è già nella forma di moltiplicazione per x, quindi non c’è bisogno di
usare il Teorema 3.19 né la variante descritta nell’Osservazione 3.3.14. Possiamo però costruire la famiglia
spettrale di Q: è facile vedere che i proiettori spettrali sono dati dagli operatori di moltiplicazione
(EQ (λ)Ψ) (x) = 1(−∞,λ] (x)Ψ(x).
(3.114)
La misura spettrale di un intervallo (a, b) è quindi
Z
µΨ ((a, b)) =
b
dx |Ψ(x)|2 ,
a
e più in generale
dµΨ (x) = |Ψ(x)|2 dx.
(3.115)
54
Esempio 3.26 (Operatore impulso)
Nel caso dell’operatore impulso definito nell’Esempio 3.6 è sufficiente usare la trasformata di Fourier per
ricondursi al caso precedente: poiché la trasformata di Fourier è un operatore unitario da L2 (R) a L2 (R), i
proiettori spettrali di P sono
EP (λ) := F −1 EQ (λ)F,
(3.116)
cioè
(EP (λ)Ψ) (x) = F −1 1(−∞,λ) (k)Ψ̂(k) (x).
Esercizio 3.29. Si trovi la risoluzione spettrale dell’operatore P 2 su L2 (R).
Esempio 3.27 (Laplaciano con condizioni al bordo di Neumann)
I proiettori spettrali per l’operatore HN definito nell’Esempio 3.23 sono dati, per ogni λ ≥ 0, da
√
b λc
(EHN (λ)Ψ) (x) =
X
hun |Ψ i un (x),
(3.117)
n=0
dove b · c indica la parte intera. Si noti che λ ∈ R+ , poiché σ(HN ) = {n2 | n ∈ N ∪ {0}}. Si verifichi che la
definizione precedente identifica una famiglia spettrale.
Esercizio 3.30. Si trovi la risoluzione spettrale per l’operatore HD introdotto nell’Esercizio 3.28.
Esercizio 3.31. Si trovi la risoluzione spettrale dell’operatore P1 definito nell’Esercizio 3.23.
La risoluzione spettrale che abbiamo visto per un singolo operatore si può facilmente estendere a un insieme
di operatori A1 , . . . , AN sotto l’ipotesi essenziale che essi siano compatibili.
Teorema 3.22 (Rappresentazione spettrale congiunta).
Siano A1 , . . . , AN operatori autoaggiunti su H commutanti, allora esiste uno spazio di misura (X, µ) con µ
misura finita, un operatore unitario U : H → L2 (X, dµ) e N funzioni reali Fi ∈ L∞
loc tali che
i) Ψ ∈ D(Ai ) se e solo se Fi (x) (U Ψ) (x) ∈ L2 (X, dµ);
ii) per ogni Ψ ∈ D(Ai ), U Ai U −1 Ψ (x) = Fi (x)Ψ(x).
Grazie a questo risultato possiamo ora rispondere alla domanda: “sotto quali ipotesi un operatore si può
rappresentare come operatore di moltiplicazione?”. Infatti il caso più generale di operatori per cui tale
rappresentazione vale è quello degli operatori A normali, ovvero tali che [A, A∗ ] = 0. Questi operatori infatti
si possono sempre scrivere come A = B + iC con A, B autoaggiunti commutanti, come segue facilmente
ponendo B = A + A∗ e C = −i(A − A∗ ) e osservando che la condizione [A, A∗ ] = 0 implica [B, C] = 0.
Applicando quindi il Teorema 3.22 all’insieme B, C si ottiene una rappresentazione spettrale congiunta in
cui sia B che C sono operatori di moltiplicazione e, di conseguenza, anche A agisce come tale.
3.10
Caratterizzazione dello Spettro
Grazie alla risoluzione spettrale fornita dal teorema spettrale e in particolare usando i proiettori spettrali
associati ad ogni operatore autoaggiunto è possibile carattarizzare più precisamente lo spettro. Ricordiamo
anzitutto un teorema generale della misura:
Definizione 3.34 (Misura puntuale, continua, assolutamente continua, singolare).
Sia µ una misura di Borel su R, allora diciamo che
55
i) µ è una misura puramente puntuale se ∃ un insiemeX
al più numerabile di punti P = {x1 , . . . , xN }
con N ∈ N ∪ ∞ tale che µ({xi }) 6= 0 e µ(S) = µpp :=
µ({xi }) per ogni misurabile S ⊂ R;
xi ∈I∩P
ii) µ è una misura continua se µ = µ − µpp ;
iii) µ è una misura assolutamente continua rispetto alla misura di Lebesgue se ∃F ∈ L1loc (R) tale che
Z
Z
dx F (x)f (x),
∀f ∈ L1 (R);
(3.118)
dµ f =
R
R
iv) µ è una misura singolare rispetto alla misura di Lebesgue se ∃S misurabile tale che µ(S) = 0, mentre
R \ S ha misura di Lebesgue 0.
Teorema 3.23 (Teorema di Lebesgue).
Ogni misura di Borel µ si decompone in modo unico in
µ = µpp + µcont = µpp + µac + µsing ,
(3.119)
dove µpp è una misura puntuale, µcont è una misura continua, µac è assolutamente continua rispetto alla
misura di Lebesgue e infine µsing è singolare continua rispetto alla misura di Lebesgue.
A questo punto possiamo definire i sottospazi di H invarianti per A autoaggiunto:
Definizione 3.35 (Decomposizione di H ).
Sia A un operatore autoaggiuto su H e µΨ la sua misura spettrale, allora definiamo
• Hpp := {Ψ ∈ H | µΨ è puramente puntuale};
• Hcont := {Ψ ∈ H | µΨ è continua};
• Hac := {Ψ ∈ H | µΨ è assolutamente continua};
• Hsing := {Ψ ∈ H | µΨ è singolare continua}.
Proposizione 3.22 (Sottospazi invarianti).
I sottospazi della Definizione 3.35 sono tutti sottospazi invarianti per A e si ha la decomposizione
H = Hpp ⊕ Hcont = Hpp ⊕ Hac ⊕ Hsing .
(3.120)
La decomposizione di σ(A) accennata nella Sezione 3.8 può essere resa rigorosa:
Definizione 3.36 (Decomposizione spettrale I).
Sia A un operatore autoaggiunto su H , allora definiamo
• σpp (A) := {autovalori di A} lo spettro puntuale di A;
• σcont := σ( A|Hcont ) lo spettro continuo di A;
• σac := σ( A|Hac ) lo spettro assolutamente continuo di A;
• σsing := σ( A|Hsing ) lo spettro singolare continuo di A.
Questa prima decomposizione dello spettro, pur caratterizzando nel dettaglio il comportamento della misura
spettrale, ha il difetto di dividere σ(A) in sottoinsiemi che non sono necessariamente disgiunti: il motivo
è sostanzialmente che σpp non è definito come lo spettro di A ristretto a Hpp ma come l’insieme degli
autovalori e cosı̀ abbiamo
σ(A) = σpp (A) ∪ σcont (A),
σcont (A) = σac (A) ∪ σsing (A).
(3.121)
56
Esempio 3.28 (Operatore di posizione)
Lo spettro dell’operatore Q definito nell’Esempio 3.5 è ovviamente continuo e più precisamente
σ(Q) = σac (Q) = R.
(3.122)
Il motivo è che banalmente la misura spettrale dµΨ (x) è sempre assolutamente continua rispetto alla misura
di Lebesgue poiché esiste F (x) ∈ L1 (R) tale che dµΨ (x) = F (x)dx dove F (x) = |Ψ(x)|2 .
Esempio 3.29 (Laplaciano con condizioni al bordo di Neumann)
L’operatore HN definito nell’Esempio 3.23 ha spettro puramente puntuale. Infatti come abbiamo visto
σ(HN ) = σpp (HN ) = n2 | n ∈ N ∪ {0} .
(3.123)
Si noti che la misura spettrale dµΨ (λ) è puntuale in quanto il suo supporto coincide con N ∪ {0}.
Esercizio 3.32. Si determini la decomposizione dello spettro degli operatori P definito nell’Esempio 3.6 e
P1 introdotto nell’Esercizio 3.23.
Una decomposizione alternativa è data sfruttando le proprietà dei proiettori spettrali di A. Premettiamo
però un risultato generale su σ(A):
Proposizione 3.23 (Spettro e proiettori spettrali).
Sia A un operatore autoaggiunto su H e {EA (λ)}λ∈R i suoi proiettori spettrali, allora λ ∈ σ(A) se e solo
se EA (λ + ε) − EA (λ − ε) 6= 0 per ogni ε > 0.
Definizione 3.37 (Decomposizione spettrale II).
Sia A un operatore autoaggiunto e {EA (λ)}λ∈R i suoi proiettori spettrali. Sia inoltre λ ∈ σ(A), allora
diciamo che
i) λ ∈ σdisc (A) lo spettro discreto di A se ran(EA (λ + ε) − EA (λ − ε)) è finito-dimensionale per qualche
ε > 0;
ii) λ ∈ σess (A) lo spettro essenziale di A se ran(EA (λ + ε) − EA (λ − ε)) è infinito-dimensionale per ogni
ε > 0.
Proposizione 3.24 (Spettro discreto e essenziale).
Sia A un operatore autoaggiunto su H , allora
σdisc (A) = σ(A) \ σess (A).
(3.124)
Inoltre λ ∈ σdisc (A) se e solo se
i) ∃ε > 0 tale che (λ − ε, λ + ε) ∩ σ(A) = {λ};
ii) {Ψ ∈ H | AΨ = λΨ} è finito-dimensionale.
Invece λ ∈ σess (A) se una o più delle seguenti è verificata
i) λ ∈ σcont (A);
ii) λ è punto di accumulazione di σpp (A);
iii) λ è un autovalore di molteplicità infinita.
Quindi riassumendo σdisc (A) contiene tutti e soli gli autovalori di A isolati e di molteplicità finita, mentre
eventuali punti limite di σpp (A) e autovalori di molteplicità infinita sono contenuti in σess (A).
Il seguente teorema è uno strumento molto utile per capire se un punto λ ∈ σ(A) appartenga a σdisc (A)
o a σess (A):
57
Teorema 3.24 (Criterio di Weyl).
Sia A un operatore autoaggiunto su H , allora λ ∈ σess (A) se e solo se la successione di Weyl definita nel
Teorema 3.15 può essere scelta in modo che le Ψn siano tutte ortogonali fra di loro.
Osservazione 3.15. In effetti la successione di Weyl dell’enunciato del Teorema 3.24 (detta successione
di Weyl singolare) è sufficiente che converga debolmente a 0, cioè λ ∈ σess (A) se e solo se ∃{Ψn }n∈N ,
w
kΨkn = 1, limn→∞ k(A − λ)Ψn k = 0 e Ψn −→ 0. In particolare poi la successione può essere scelta in modo
tale che Ψn ⊥ Ψm per n 6= m.
Osservazione 3.16.
Riprendiamo l’Esempio 3.5 dell’operatore posizione: come abbiamo visto nell’Esempio 3.28, lo spettro di
Q è puramente assolutamente continuo e coincide con l’intera retta reale. Di conseguenza si ha anche
σess (Q) = R. Alla medesima conclusione si sarebbe potuti arrivare costruendo una successione di Weyl
singolare per Q: per ogni λ ∈ R, un esempio esplicito è dato da {Ψn }n∈N con
Ψn (x) =
p
n(n + 1)1(λ+
1
1
,λ+ n
n+1
].
Infatti le funzioni Ψn e Ψm sono ortogonali per ogni n 6= m dato che i supporti sono disgiunti. Inoltre
kΨn k = 1 e
k(Q − λ)Ψn k2 = n(n + 1)
Z
1
λ+ n
1
λ+ n+1
dx |x − λ|2 = n(n + 1)
Z
1
n
1
n+1
dx x2 ≤
C
−→ 0.
n2 n→∞
Esercizio 3.33. Costruire esplicitamente una successione di Weyl singolare per l’operatore impulso P
introdotto nell’Esempio 3.6, che mostri che ogni λ ∈ R appartiene a σess (P ).
3.11
Operatori Compatti
Introduciamo un’ampia classe di operatori, gli operatori compatti, che hanno caratteristiche spettrali uniche:
il loro spettro è sempre puramente puntuale e ammettono un sistema ortonormale completo di autovettori.
Definizione 3.38 (Operatore compatto).
Un operatore T ∈ B(H ) è compatto se trasforma successioni debolmente convergenti in successioni
w
convergenti in norma, cioè se Ψn −→ Ψ allora T Ψn −→ Φ ∈ H .
Un esempio tipico di operatori compatti è dato dagli operatori di rango finito: un operatore T ha rango
finito se
ran(T ) = span(Ψ1 , . . . , ΨN ),
N < ∞,
(3.125)
con {Ψn } un sistema ortonormale completo di H . In altre parole T è compatto se la sua immagine è finito
dimensionale. In effetti questo esempio è reso ancora più significativo dal seguente
Teorema 3.25 (Caratterizzazione degli operatori compatti).
Ogni operatore compatto T su H separabile è il limite in norma di una successione di operatori a rango
finito. Inoltre il limite in norma di una successione di operatori compatti è ancora un operatore compatto.
Le proprietà spettali degli operatori compatti sono molto speciali e sono caratterizzate nei prossimi due
Teoremi.
Teorema 3.26 (Teorema di Riesz-Schauder).
Sia T un operatore compatto su H , allora σ(T ) è un insieme discreto. Inoltre σ(T ) non ha punti di
accumulazione ad eccezione al più di 0 e ogni λ 6= 0 in σ(A) è un autovalore con molteplicità finita.
58
Teorema 3.27 (Teorema di Hilbert-Schmidt).
Sia A un operatore compatto autoaggiunto su H , allora esiste un sistema ortonormale completo di H di
autovettori {Ψn }n∈N di A e
AΨn = λn Ψn ,
lim λn = 0.
(3.126)
n→∞
Più in generale se A è compatto ∃{Φn }, {Ψn } s.o.n. (non necessariamente completi) e λn ≥ 0 detti valori
singolari di A tali che
X
A=
λn |Φn i hΨn | ,
lim λn = 0.
(3.127)
n∈N
n→∞
Prima di passare a studiare due sottoclassi di operatori compatti citiamo un teorema molto utile per studiare
lo spettro essenziale degli operatori:
Teorema 3.28 (Teorema di Weyl).
Dati A, B operatori autoaggiunti, se ∃z ∈ ρ(A)∩ρ(B) tale che (A−z)−1 −(B −z)−1 è un operatore compatto,
allora σess (A) = σess (B).
Dimostrazione. Sia λ ∈ σess (A), allora per il criterio di Weyl (Teorema 3.24) esiste una successione di Weyl
singolare {Ψn } tale che
w
k(A − λ)Ψn k −→ 0,
kΨn k = 1,
Ψn −→ 0.
n→∞
n→∞
Sia ora z ∈ ρ(A) ∩ ρ(B) come da enunciato del teorema:
1
1 −1
(A − z) −
(A − z)−1 (A − λ)Ψn −→ 0,
Ψn =
n→∞
λ−z
|λ − z|
poiché (A − z)−1 è un operatore limitato (e quindi continuo). Vogliamo allora dimostrare che da Φn =
(B − z)−1 Ψn possiamo estrarre una successione di Weyl singolare per B. Notiamo anzitutto che Φn ∈ D(B)
w
e Φn −→ 0: scrivendo
1
1
−1
−1
−1
Φn = (B − z) − (A − z)
Ψn + (A − z) −
Ψn +
Ψn ,
λ−z
λ−z
abbiamo che il tre termini al membro di destra convergono separatamente a 0 in senso debole. Infatti la
convergenza dell’ultimo è equivalente a quella di Ψn , per il secondo l’abbiamo dimostrato poco sopra e il
primo converge in realtà a 0 in norma grazie all’ipotesi di compattezza e alla Definizione 3.38. In aggiunta
usando la precedente decomposizione per Φn e sfruttando che i primi due termini tendono a 0 in norma
quando n → ∞, si ha anche
1
lim kΦn k =
> 0,
n→∞
|λ − z|
e quindi i la successione è normalizzabile semplicemente definendo Φ̃n = Φn /kΦn k.
Per dimostrare che Φ̃n è una successione di Weyl singolare per B manca solo di verificare che k(B −
λ)Φ̃n k → 0, ma
1
−1
k(B − λ)Φn k = k(B − z)Φn + (z − λ)Φn k = |z − λ| (B − z) −
Ψn λ−z
−1
≤ |z − λ| (B − z)−1 − (A − z)−1 Ψn + (A − z) −
1
Ψn −→ 0,
n→∞
λ−z
per quanto già discusso.
Due sottoclassi degli operatori compatti sono gli operatori classe traccia e di Hilbert-Schmidt.
59
Definizione 3.39 (Traccia).
Per ogni A ≥ 0 in B(H ) definiamo la sua traccia come
X
Tr(A) :=
hΨn |AΨn i ,
(3.128)
n∈N
dove {Ψn }n∈N è un s.o.n.c. in H .
Proposizione 3.25 (Proprietà della traccia).
La traccia non dipende dal s.o.n.c scelto e soddisfa le seguenti proprietà :
i) Tr(A + B) = Tr(A) + Tr(B);
ii) Tr(λA) = λTr(A), per ogni λ ≥ 0;
iii) Tr(U AU −1 ) = Tr(A) per ogni unitario U ;
iv) se 0 ≤ A ≤ B allora Tr(A) ≤ Tr(B);
Definizione 3.40 (Operatori classe traccia).
Gli operatori classe traccia L 1 (H ) sono gli operatori A ∈ B(H ) tali che kAk1 := Tr|A| < +∞.
Teorema 3.29 (Operatori classe traccia e compatti).
Un operatore
A ∈ B(H ) è classe traccia se e solo se A compatto e i suoi valori singolari {λn } ∈ `1 (N),
X
i.e.,
λn < +∞.
n∈N
L’ultima classe di operatori che introduciamo è la naturale generalizzazione di L 1 (H ) come L2 lo è di L1 :
Definizione 3.41 (Operatori di Hilbert-Schmidt).
Gli operatori Hilbert-Schmidt L 2 (H ) sono gli operatori T ∈ B(H ) tali che Tr(T ∗ T ) < +∞.
Teorema 3.30 (Operatori di Hilbert-Schmidt e compatti).
X
A è Hilbert-Schmidt se e solo se A compatto e i suoi valori singolari {λn } ∈ `2 (N), i.e.,
λ2n < +∞.
n∈N
L’importanza degli operatori di Hilbert-Schmidt è che essi ammettono una rappresentazione concreta:
Proposizione 3.26 (Operatori di Hilbert-Schmidt e integrali).
K ∈ B(L2 (X, dµ)) è Hilbert-Schmidt se e solo se ∃K(x, y) ∈ L2 (X, dµ) ⊗ L2 (X, dµ) tale che
Z
(KΨ) (x) =
dµ(y) K(x, y)Ψ(y).
(3.129)
X
3.12
Matrice Densità e Stati Misti
Al di là delle proprietà speciali che hanno, gli operatori classe traccia giocano un ruolo importantissimo in
MQ, in quanto si identificano con gli stati misti. Tipicamente nella preparazione di un sistema quantistico è
difficile riuscire a isolare uno stato puro |Ψi ∈ H , mentre più spesso accade che lo stato prodotto appartenga
a un certo insieme ristretto {|Ψ1 i , . . . , |ΨNP
i}, con N ∈ N ∪ {∞}, in cui ciascuno degli stati compare con
una certa proabilità λn ≥ 0. Ovviamente N
n=1 λn = 1, per normalizzazione della probabilità totale. Vi è
quindi la necessità di definire uno stato (misto) associabile e a questa situazione sperimentale. Dal punto di
vista matematico tale stato viene identificato con una matrice densità ρ ovvero un operatore classe traccia
cosı̀ definito
N
X
ρ=
λn |Ψn i hΨn | ,
(3.130)
n=1
60
ovvero la combinazione lineare convessa dei proiettori ortogonali sugli stati Ψn . Poiché per ipotesi
N
X
λn = 1,
(3.131)
n=1
A ∈ L 1 (H ) e anzi Tr(ρ) = 1. Inoltre ρ ha altre due proprietà immediate da verificare
ρ ≥ 0,
ρ2 ≤ ρ.
(3.132)
Vediamo ora come, data un’osservabile A, si possa associare alla matrice densità ρ, un concetto di valore
di aspettazione, di frequenze di visita, dispersione ecc. Definiamo infatti
hAi := Tr(Aρ),
(3.133)
e per analogia con quanto affermato nel Postulato 3, la probabilità di ottenere una misura di A nell’intervallo
(a, b) è
PA;ρ (a, b) := Tr (EA (a, b)ρ) ,
(3.134)
dove EA (a, b) è il proiettore spettrale di A relativo all’intervallo (a, b). Vediamo che le definizioni sono
consistenti con quanto anticipato sull’interpretazione fisica degli stati misti: usando l’espressione esplicita
di ρ otteniamo
N
X
PA;ρ (a, b) =
λn h Ψn |EA (a, b)| Ψn i ,
n=1
cioè la probabilità di osservare un valore di A nell’intervallo (a, b) è la somma pesata, con pesi λn , delle
probabilità di osservare A in (a, b) negli stati Ψn . Questo coincide con l’interpretazione dello stato misto
come stato “incerto”, nel senso che non si ha una conoscenza esatta di esso ma solo degli stati che possono
comparire e delle relative probabilità. In questo senso gli stati misti in MQ giocano un ruolo analogo a
quello degli stati misti (distribuzioni di probabilità) in meccanica classica: in seguito all’impossibilità di una
precisione arbitraria nella misura o equivalentemente alla presenza di errori sperimentali, non si conosce
esattamente lo stato puro in cui si trova il sistema ma tutti gli stati in un determinato insieme possono
presentarsi con diversa probabilità. Anche per il valore di aspettazione di A la definizione è consistente
perché
N
X
hAi =
λn h Ψn |A| Ψn i ,
n=1
che può ancora una volta essere pensata come la media dei valori di aspettazione di A sugli stati Ψn .
3.13
Teorema di Stone e Dinamica
In questa Sezione discuteremo l’esistenza della dinamica di un sistema quantistico e come essa segua direttamente dall’ipotesi di autoaggiunzione dell’hamiltoniana del sistema: come affermato nel Postulato 5 della
MQ, lo stato di un sistema quantistico al tempo t > 0 è la soluzione dell’equazione di Schrödinger con dato
iniziale |Ψt=0 i = |Ψ0 i, i.e.,
i~∂t |Ψt i = H(t) |Ψt i .
Considereremo per semplicità il caso di hamiltoniane tempo-indipendenti ma la generalizzazione al caso
tempo-dipendente è del tutto ovvia (si veda l’Osservazione dopo il Teorema 3.31).
Un caso in cui l’evoluzione temporale è sostanzialmente banale è quello degli autostati di H: se ΦE ∈ H
è tale che
HΦE = EΦE ,
allora l’equazione di Schrödinger (2.3) diventa
i~∂t Ψt = EΨt ,
61
con dato iniziale Ψ0 = ΦE , la cui soluzione è ovviamente
E
Ψt = e−i ~ t ΦE .
(3.135)
In altri termini l’evoluzione temporale è semplicemente data da un fattore di fase tempo-dipendente a
moltiplicare lo stato. Pertanto si ha come conseguenza diretta |Ψt i = |ΦE i, cioè il ket e quindi lo stato
quantistico è stazionario.
Se l’hamiltoniana avesse un s.o.n.c. di autovettori questo sarebbe sufficiente per definire la dinamica
sull’intero spazio di Hilbert via la decomposizione di ogni vettore di H in serie di Fourier. Naturalmente
questo non è sempre vero, ma quand’anche non esistesse un s.o.n.c. di autovettori di H, il problema della
definizione della dinamica è risolto alla fonte grazie all’applicazione del teorema spettrale, come discusso nel
sucessivo Teorema 3.31. Si noti che in tal senso l’ipotesi di autoaggiunzione di H risulterà cruciale (si veda
il Postulato 5).
Premettiamo una utile definizione:
Definizione 3.42 (Gruppo unitario ad un parametro fortemente continuo).
Una famiglia di operatori {U (t)}t∈R ∈ B(H ) è detta un gruppo unitario ad un parametro fortemente
continuo se
i) U (t) unitario per ogni t ∈ R;
ii) U (t + s) = U (t)U (s) per ogni t, s ∈ R;
iii) limε→0 kU (ε)Ψ − Ψk = 0 per ogni Ψ ∈ H .
Osservazione 3.17. La terza proprietà della Definizione 3.42 è equivalente a richiedere che s −
limε→0 U (ε) = 1. Inoltre combinando la 2 e 3 si vede immediatamente che la continuità forte in 0 in
realtà si estende ad ogni t ∈ R:
s − lim U (t + ε) = U (t) s − lim U (ε) = U (t).
ε→0
ε→0
Esercizio 3.34. Si dimostri che le seguenti famiglie di operatori definiscono due gruppi a un parametro
fortemente continui:
1. {Uα }α∈R in B(L2 (R)), (Uα Ψ) (x) = eiαx Ψ(x);
2. {Vβ }β∈R in B(L2 (R)), (Vβ Ψ) (x) = Ψ(x − β).
Come agisce la trasformata di Fourier sulle due famiglie, i.e., quanto vale FUα F −1 e FVβ F −1 ?
Possiamo ora enunciare uno dei due risultati principali di questa Sezione:
Teorema 3.31 (Operatori autoaggiunti generano gruppi unitari fortemente continui).
Sia A un operatore autoaggiunto su H spazio di Hilbert separabile, allora U (t) = eiAt definisce un gruppo
unitario a un parametro t ∈ R fortemente continuo e per ogni Ψ ∈ D(A)
lim
t→0
U (t)Ψ − Ψ
= iAΨ.
t
(3.136)
Dimostrazione. Il teorema spettrale nella forma del Teorema 3.20 (si veda anche il Corollario 3.2) permette
di definire U (t) = eiAt per ogni t ∈ R. Le altre proprietà del gruppo a un parametro sono conseguenza
diretta dei risultati formulati nel Teorema 3.20 e nel successivo Corollario 3.2. Ad esempio si ottiene
immediatamente che kU (t)k = supλ∈σ(A) |eiλt | = 1.
Alternativamente si può usare il teorema spettrale nella forma del Teorema 3.21: in tal caso definiamo
l’operatore eiAt via gli elementi di matrice
Z
iAt Ψ e Φ =
dµΨ,Φ;A (λ) eiλt .
(3.137)
σ(A)
62
Ancora una volta le altre proprietà sono una conseguenza diretta della definizione. Per esempio la continuità
forte segue per convergenza dominata.
Discutiamo invece più nel dettaglio la (3.136): ricordando che il dominio di A è caratterizzato (Teorema
3.21) come
)
(
Z
2
dµΨ;A (λ) λ < +∞ ,
D(A) = Ψ ∈ H σ(A)
abbiamo che
2 Z
U (t)Ψ − Ψ
=
−
iAΨ
dµΨ;A (λ)
t
σ(A)
2
iλt
e − 1
.
−
iλ
t
Ora la funzione integranda si può stimare come
2 Z
iλt
e − 1
=
−
iλ
t
0
λ
dµ e
iµt
Z
2
−1 ≤λ
λ
2
dµ eiµt − 1 ≤ 4λ2 ,
0
e il risultato segue ancora per convergenza dominata.
E’ importante osservare che il Teorema 3.31 implica unicità ed esistenza della soluzione dell’equazione
di Schrödinger (2.3), che a sua volta genera la dinamica di ogni sistema quantistico. Si noti che da questo
punto di vista l’esistenza dell’hamiltoniana e la sua autoaggiunzione sono ipotesi cruciali.
Corollario 3.3 (Dinamica quantistica).
Il problema di Cauchy (2.3) con dato iniziale Ψt=0 = Ψ0 ∈ H spazio di Hilbert separabile ammette soluzione
Ψt ∈ H per ogni t ∈ R e tale soluzione è unica.
Dimostrazione. Per ipotesi (Postulato 4) ∃H osservabile e quindi operatore autoaggiunto su D(H) denso in
H . Pertanto per il precedente Teorema 3.31
H
U (t) = e−i ~ t ,
(3.138)
è un gruppo unitario ad un parametro fortemente continuo. E’ perciò facile verificare che U (t)Ψ0 risolve
l’equazione di Schrödinger per ogni t ∈ R e, per unitarietà di U (t), kU (t)Ψ0 k = kΨ0 k, per cui U (t)Ψ0 ∈ H se
Ψ0 ∈ H . L’unicità in H segue poi dalla bigettività di U (t) per ogni t ∈ R in quanto operatore unitario.
Osservazione 3.18. Si noti che l’equazione di Schrödinger (2.3) richiede per essere ben posta che Ψt ∈
D(H), che, se ad esempio H è illimitato, non coincide con tutto H . Al contrario l’unitario U (t) (3.138) è
invece definito su tutto H e quindi permette di implementare l’evoluzione temporale di qualunque stato in
H.
Abbiamo quindi visto che un operatore autoaggiunto genera un gruppo unitario, ma il contenuto del prossimo
Teorema è che anche l’implicazione opposta è vera, ovvero ogni gruppo unitario fortemente continuo è
generato da un operatore autoaggiunto. Da questo punto di vista si può meglio apprezzare il Postulato
4 della MQ: volendo richiedere la buona positura della dinamica e in particolare la conservazione della
probabilità, che appunto equivale all’unitarietà dell’evoluzione temporale, è necessario richiedere che esista
un generatore autoaggiunto.
Teorema 3.32 (Teorema di Stone).
Sia U (t) un gruppo unitario a un parametro fortemente continuo su H , allora ∃A autoaggiunto su D(A)
denso in H , tale che U (t) = eiAt . Inoltre Ψ ∈ D(A), se e solo se ∃ limt→0 (U (t)Ψ − Ψ)/t e, se esiste, tale
espressione definisce iAΨ.
Esercizio 3.35. Si trovino i generatori autoaggiunti con relativo dominio di autoaggiunzione dei gruppi
unitari introdotti nell’Esercizio 3.34.
Capitolo 4
Particella Libera e Oscillatore Armonico
In questo Capitolo affrontiamo la discussione dei sistemi quantistici più elementari, la particella libera e
l’oscillatore armonico, alla luce dei postulati della MQ e dei risultati di teoria degli operatori del Capitolo
3. Nonostante si tratti di sistemi molto semplici vedremo che, a differenza del caso classico, la trattazione
quantistica non è affatto banale, cosı̀ come alcuni fenomeni fisici che ne sono conseguenza.
4.1
La Particella Libera: Osservabili e Dinamica
Per particella libera intendiamo naturalmente una particella puntiforme, come ad esempio possono essere
considerati atomi, protoni, elettroni ecc. a velocità lontane da quella della luce, che si muove nello spazio d
dimensionale Rd , con d tipicamente 1, 2 o 3.
Come primo elemento della descrizione quantistica del sistema dobbiamo fornire lo spazio degli stati
(puri) che si identifica con i raggi unitari nello spazio di Hilbert
H = L2 (Rd ).
(4.1)
In altri termini ogni vettore di norma unitaria in Ψ ∈ H , anche detto funzione d’onda, identifica uno stato
del sistema e solitamente l’intepretazione fisica che viene associata a tale scelta è che |Ψ(x)|2 rappresenta la
probabilità che la particella sia osservata nel punto x. Vedremo ora come tale interpretazione della funzione
d’onda segue banalmente dai Postulati della MQ che abbiamo introdotto nel Capitolo 2. A tale scopo
dovremo anzitutto identificare le grandezze fisiche osservabili del sistema.
Come nel caso classico e prescindendo da altre carattestiche (carica, spin, ecc.), l’unico parametro fisico
del sistema è la massa m > 0 della particella. Sempre per analogia classica ci aspettiamo di poter osservare
e misurare la posizione Q e l’impulso P della particella e, possibilmente, anche le loro funzioni elementari,
ad esempio i polinomi. Sia Q che P dovranno essere osservabili vettoriali, cioè Q = (Q1 , . . . , Qd ) e P =
(P1 , . . . , Pd ), la cui azione su una generica Ψ ∈ C0∞ (Rd ) è data da
(Pj Ψ) (x) = −i~∂j Ψ(x),
(Qj Ψ) (x) := xj Ψ(x),
(4.2)
ovvero Qj è un operatore di moltiplicazione per xj , con naturalmente x = (x1 , . . . , xd ), mentre Pj è un
operatore differenziale di ordine 1. Abbiamo già studiato nel dettaglio questi operatori (si vedano gli Esempi
3.5, 3.6 e 3.9) e in particolare abbiamo visto che ogni singola componente Qj e Pj , in quanto operatore su
L2 (R) (si veda la successiva Osservazione 4.1) è autoaggiunta sul dominio
D(Qj ) := Ψ ∈ L2 (R) Qj Ψ ∈ L2 (R) ,
D(Pj ) = H 1 (R).
(4.3)
Osservazione 4.1. Nel restringerci allo spazio di Hilbert di una singola componente L2 (R) stiamo sfruttando
il fatto che L2 (Rd ) ' L2 (R) ⊗ · · · ⊗ L2 (R) e Qj = 1 ⊗ · · · ⊗ 1 ⊗ Qj ⊗ 1 · · · ⊗ 1, cioè Qj agisce come l’identità
sulle copie di L2 (R) diverse dalla j−esima. Quindi in L2 (Rd ) il dominio di autoaggiunzione di Qj si dovrebbe
leggere L2 (R) ⊗ · · · ⊗ L2 (R) ⊗ D(Qj ) ⊗ L2 (R) ⊗ · · · ⊗ L2 (R). Tuttavia le diverse componenti degli operatori Q
e P sono indipendenti e commutano fra loro, per cui da qui in poi ci restringeremo a considerare un sistema
unidimensionale, con ovvia generalizzazione dei risultati a Rd .
63
64
Inoltre abbiamo visto che (si veda l’Esempio 3.28)
σ(Q) = σ(P ) = σac (Q) = σac (P ) = R,
(4.4)
cioè entrambi gli operatori impulso e posizione hanno sono spettro assolutamente continuo e, in particolare,
nessun autovalore.
Per completare la descrizione del sistema resta solo da identificare l’hamiltoniana che, via il Postulato 4,
definisce la dinamica. Esattamente come in meccanica classica questa è data da
H0 =
P2
~2
=−
∆.
2m
2m
(4.5)
Anche questo operatore è stato parzialmente trattato nel Capitolo 3: grazie ai Teoremi 3.10 e 3.16 e al fatto
che
~2 |k|2
FH0 F −1 Ψ̂ (k) =
Ψ̂(k),
2m
cioè la trasformata di Fourier mappa H in un operatore di moltiplicazione, è immediato verificare che
H0 è autoaggiunta su D(H0 ) = H 2 (Rd ). Inoltre come nel Corollario 3.2 si può verificare facilmente che
σ(P 2 ) = {λ2 |λ ∈ σ(P )} e quindi
σ(H0 ) = σac (H0 ) = R+ ,
(4.6)
dove il fatto che lo spettro sia totalmente assolutamente continuo segue dalla assoluta continuità della misura
spettrale di H0 in trasformata di Fourier (si veda l’Esempio 3.28).
Esercizio 4.1. Si costruisca una successione di Weyl singolare per H per ogni λ ∈ R+ .
Benché si tratti di un semplice esercizio è utile costruire esplicitamente la risoluzione spettrale di H:
Proposizione 4.1 (Risoluzione spettrale di H0 ).
Per ogni λ ∈ R+ e Ψ ∈ L2 (Rd ), l’aspettazione dei proiettori spettrali di H0 è data da
" 
2 q
2 #
Z λ
q
p

−1/2
m
2mt
2mt

+ Ψ̂ −
,
Ψ̂

dt
t
2
2
2

2~
~
~


0
 Z
q

2
Z 2π
λ
h Ψ |EH0 (λ)| Ψ i = 1[0,+∞) (λ) · m2
dt
dϑ Ψ̂ − 2mt
2 ,ϑ ,

~
~

0
0

q
2
Z 2π

 √ 3/2 Z λ √ Z π


Ψ̂ − 2mt
,
 2m3
dϑ
sin
ϑ
dϕ
dt
t
,
ϑ,
ϕ
~
~2
0
0
d = 1;
d = 2; (4.7)
d = 3.
0
Dimostrazione. Per dimostrare il risultato è sufficiente osservare che FEH0 (λ)F −1 è l’operatore di
moltiplicazione per la funzione
2 2
|k|
.
1(−∞,λ] ~ 2m
Per ottenere le espressioni esplicite (4.7) resta solo da fare un banale cambio di variabili, che è lasciato per
esercizio.
−1
Esercizio
2 4.2.
Definendo EH0 (λ) = F Ẽ(λ)F con Ẽ(λ) operatore di moltiplicazione per la funzione
2
|k|
1(−∞,λ] ~ 2m
,
1. verificare che EH0 (λ) è una famiglia spettrale;
2. dimostrare che {EH0 (λ)}λ∈R+ identifica la risoluzione spettrale di H0 ;
3. trovare l’espressione esplicita di (EH0 (λ)Ψ) (x).
La trasformata di Fourier è l’ingrediente principale della dimostrazione di un altro risultato, che riguarda il
risolvente di H0 e l’espressione esplicita del kernel relativo, anche detta funzione di Green di H0 .
65
Proposizione 4.2 (Risolvente di H0 ).
Sia z ∈ C \ R+ , allora (H0 − z)−1 è un operatore integrale limitato con dominio L2 (Rd ) e kernel
√
√
(H0 − z)−1 (x; x0 ) = Gz (x − x0 ), con (scegliendo la determinazione di z tale che =( z) ≥ 0)
p
nq
o
m
2mz
i
exp
i
|x|
,
d = 1;
2
2
2~ z
n q~
o
Gz (x) :=
(4.8)
 m 2 |x|−1 exp i 2mz
|x|
,
d
=
3.
2
2π~
~
Osservazione 4.2. In d = 1 la funzione di Green non è singolare all’origine anche se non differenziabile. In
d = 3 ha una singolarità a x = 0 propozionale a |x|−1 . Più in generale si può dimostrare che in dimensione
d ≥ 3 la singolarità è |x|d−2 .
Osservazione 4.3. Il caso bidimensionale è speciale: in effetti non abbiamo dato l’espressione esplicita di
Gz (x) in d = 2 in quanto coinvolge la fuzione speciale di Hankel e non è particolarmente istruttiva. Tuttavia
è importante sottolineare che la singolarità all’origine è in questo caso logaritmica ovvero Gz (x) ∼ log |x|
quando x → 0.
Osservazione 4.4. Sfruttando il fatto che σ(H0 ) = R+ si può considerare Gz per z = −λ con λ > 0. In
questo caso l’espressione (4.8) diventa:

q
p m

2mλ

exp − ~2 |x| ,
d = 1;

2~2 λ
G−λ (x) :=
q

2mλ
m
−1 exp −

|x| , d = 3.
 2π~
2 |x|
~2
Dimostrazione. Applicando la trasformata di Fourier si trova immediatamente che
Z
1
1
Gz (x) =
dk eik·x ~2 k2
.
d
(2π) Rd
−z
(4.9)
2m
In d = 1, per calcolare l’integrale resta solo da applicare il Lemma di Jordan: estendendo l’integrale ad una
semicirconferenza di raggio R nel semipiano superiore per x > 0 e in quello inferiore per x < 0 e osservando
che l’integrale sulla semicirconferenza tende a 0 quando R → ∞ grazie al decadimento ∝ k −2 dell’integrando,
resta solo da calcolare il contributo dei residui
nel semipiano superiore o inferiore. Ma l’integranda ha solo
√
due poli di ordine 1 rispettivamente in ± 2mz/~ e da un rapido calcolo si ricava il risultato: ad esempio se
x > 0 il residuo che si ottiene è
√
r
q
√
2 2mπi
m i 2mz
x
ikx 2mz
=
Res k = ~
=i
e ~2 .
√ e 2z
~2 k 2
2~
√2mz
2~π 2m + z
k=
~
In d = 3 il calcolo è sostanzialmente analogo: per x 6= 0 abbiamo
1
4π 2
Z
∞
dk k
0
2
Z
1
dt e
−1
ikxt
1
~2 k2
2m
Z
∞
k eikx − e−ikx
Z ∞
1 d
eikx
dk
2
2
2
2
~ k
~ k2
4π x dx −∞
−z
0
2m − z
r
q
2mq
i
m d
m
2mz
2mz
=−
exp i ~2 x =
exp i ~2 x .
2πx 2~2 z dx
2π~2 x
i
=− 2
4π
x
−z
dk
=−
Concludiamo questa Sezione con qualche commento sulla dinamica. L’evoluzione temporale è ovviaH
mente implementata dall’operatore unitario U (t) = e−i ~ t , la cui esistenza segue dall’autoaggiunzione di H.
Sfruttando poi la risoluzione spettrale o, equivalentemente, usando la trasformata di Fourier, è poi facile
ricavare la forma esplicita dell’operatore:
Z
H ~k2
1
−i ~ t
(U0 (t)Ψ) (x) = e
Ψ (x) =
dk eik·x e−i 2m t Ψ̂(k).
(4.10)
)
(2π d/2 Rd
66
4.2
Evoluzione Libera di Pacchetti d’Onda: Dispersione e Interferenza
Un pacchetto d’onda è una funzione d’onda concentrata, ovvero il cui supporto è sostanzialmente confinato
in un compatto. Questo è ovviamente vero se Ψ ha supporto compatto ma anche, più in generale, se Ψ
decade esponenzialmente per grandi x. Come vedremo l’evoluzione temporale di tali stati è particolarmente
significative in MQ: poiché per un pacchetto d’onda la possibilità di osservare la particella è confinata
ad un compatto, è naturale pensare ai pacchetti d’onda come stati quasi classici. In effetti vedremo che
l’evoluzione temporale di un pacchetto d’onda sovrappone caratteristiche classiche – il centro del pacchetto
si muove come una particella classica, ovvero di moto rettilineo uniforme – con aspetti puramente quantistici
– l’evoluzione temporale del pacchetto si accompagna con un fenomeno di dispersione.
Concluderemo la Sezione con lo studio del fenomeno di intereferenza che si produce osservando il moto
di due pacchetti d’onda unidimensionali con velocità opposte e discuteremo come tale fenomeno è una
conseguenza diretta del principio di sovrapposizione.
Per semplicità di calcolo restringiamoci anzitutto al caso unidimensionale e consideriamo un dato iniziale
della forma
i p0 x
0
Ψ0 (x) = √1ε f x−x
(4.11)
e ~ ,
ε
dove x0 , p0 ∈ R sono dei parametri e f ∈ S è una funzione reale, pari e normalizzata, cioè f (−x) = f (x)
e kf k2 = 1. Supporremo naturalmente che ε 1 e x0 , p0 non dipendano da ε. Inoltre per semplicità di
notazione indicheremo per ogni osservabile A
hAi0 := h Ψ0 |A| Ψ0 i ,
∆A2 0 = A2 0 − hAi20 ,
hAit := h Ψt |A| Ψt i ,
∆A2 t = A2 t − hAi2t ,
con Ψt = U0 (t)Ψ0 .
Proposizione 4.3 (Valori di aspettazione a t = 0).
Per ogni x0 , p0 ∈ R e ε 1 si ha
hQi0 = x0 , ∆Q2 0 = O(ε2 ),
2
hP i0 = p0 , ∆P 2 0 = O ~ε2 .
(4.12)
Dimostrazione. Calcoliamo
hQi0 =
1
ε
Z
R
dx xf 2
x−x0
ε
Z
= x0 + ε
dx xf 2 (x) = x0 ,
R
poiché per ipotesi f è pari. Similmente
Z
Z
i~
p0
0
0
hP i0 =
dx f 2 x−x
−
dx ∂x f 2 x−x
= p0 .
ε
ε
ε R
2ε R
Quindi ∆Q2 0 = Q2 0 − x20 e
Z
Z
2
1
2 2 x−x0
2
2
dx x f
= x0 + ε
Q 0=
dx x2 f 2 (x) = x20 + O(ε2 ),
ε
ε R
R
dato che xk f ∈ L2 (R) per ogni k ∈ N. Allo stesso modo
Z
Z
Z
2
2
~2
x−x0 2
2
p20
~2
2 x−x0
2
0
2
~
P 0=
dx f
+
dx
∂
f
=
p
+
dx
f
(x)
=
p
+
O
.
x
0
0
ε
ε
ε2
ε R
ε R
ε2 R
Nel caso di un pacchetto d’onda l’evoluzione temporale assume una forma più semplice che per una generica
funzione d’onda:
67
Proposizione 4.4 (Evoluzione temporale di un pacchetto d’onda).
Sia Ψt = U0 (t)Ψ0 con U0 (t) come in (4.10) e Ψ0 in (4.11), allora
2
p0 p0
H0 t
1
ei ~ x e−i 2m~ t e−i ~ε f ε−1 x −
(U0 (t)Ψ0 ) (x) = √
2πε
p0
mt
− x0
.
(4.13)
Dimostrazione. E’ sufficiente applicare la definizione (4.10): calcoliamo anzitutto
1
Ψ̂0 (k) = √
2πε
Z
dx e
−ikx+i
p0
x
~
f
x−x0
ε
R
√
Z
p0
ε
p0 = √ exp −i k − ~ x0
e−iεkx+iε ~ x f (x)
2π
R
√
= ε exp −i k − p~0 x0 fˆ ε k −
p0 ,
~
(4.14)
e quindi
√
Z
Z
2
~k2
ε p0
1
ikx −i ~k
t
dk e e 2m Ψ̂0 (k) = √ ei ~ x0
dk eik(x−x0 ) e−i 2m t fˆ ε k − p~0
(U0 (t)Ψ0 ) (x) = √
2π ZR
2π
R
n
o
p
1
ε 2 p2
p0
i ~0 x0
k
~
dk exp i ε + ~ (x − x0 ) exp −i 2mε
k 2 + 2εp~0 k + ~2 0 t fˆ (k)
=√
e
2
2πε
R
Z
p20
~k2 t
p0
1
=√
ei ~ x e−i 2m~ t
dk exp i kε x − x0 − pm0 t e−i 2mε2 fˆ (k) =
2πε
R
p20 p0
H0 t
1
√
ei ~ x e−i 2m~ t e−i ~ε f ε−1 x − x0 −
2πε
p0 mt .
Proposizione 4.5 (Valori di aspettazione a t > 0).
Per ogni x0 , p0 ∈ R e ε 1 si ha
hQit = x0 +
p0
m t,
hP it = p0 ,
∆Q2
t
=
t2 t
∆P 2 0 + ∆Q2 0 + (hQP + P Qi0 − 2p0 x0 ) ,
2
m m
∆P 2 t = O
~2
ε2
.
(4.15)
Osservazione 4.5. E’ importante osservare che i valori medi delle osservabili P e Q si evolvono esattamente
come le corrispondenti osservabili classiche ovvero di moto rettilineo uniforme. Questo risultato che vediamo
qui ricavato per la particella libera è in realtà un caso particolare del teorema di Erhenfest, che dice appunto
che i valori medi hP it e hQit sotto l’evoluzione temporale generata dall’hamiltoniana −∆ + V (x) soddisfano
equazioni del moto di tipo classico. Esplicitamente1
hP it = m∂t hQit ,
m∂t2 hQit = − V 0 t ,
(4.16)
con condizioni iniziali hQit=0 = hQi0 e hP it=0 = hP i0 .
Osservazione 4.6. Un effetto molto importante dell’evoluzione temporale libera in MQ è la dispersione,
ovvero l’incremento nel tempo della incertezza nella misura della posizione della particella: la seconda delle
equazioni in (4.15) implica che, almeno per t abbastanza grande la dispersione in Q cresce nel tempo. Quindi
la distribuzione di probabilità di trovare la particella in x ha un valor medio che si muove di moto classico
ma tende a spiattellarsi quando il tempo cresce. Naturalmente la norma L2 è conservata ma il massimo
del modulo della funzione d’onda decresce con t (si veda il prossimo Esempio 1). Questo aspetto differenzia
drasticamente la dinamica classica da quella quantistica: in questo secondo caso anche prendendo un dato
iniziale ragionevolmente concentrato in x, ovvero uno stato quasi classico, dopo poco tempo tale carattestica
viene a mancare a seguito della dispersione indotta dall’evoluzione temporale quantistica. Quindi il concetto
di traiettoria perde totalmente di senso in MQ.
Stiamo ovviamente assumendo che almeno V ∈ C 1 (R) e − hV 0 it sia lipschitziana, per assicuare l’esistenza della soluzione
delle equazioni classiche del moto.
1
68
Dimostrazione. Per calcolare i valori di aspettazione conviene usare la trasformata di Fourier e in particolare
la (4.14):
Z
n
o
o
h
n
i
2
ˆ ε k − p0 i∂k exp −i k − p0 x0 − i ~k2 t fˆ ε k − p0
hQit = ε dk exp i k − p~0 x0 + i ~k
t
f
2m
~
~
2m
~
R
Z
Z
2
p0 ˆ
dk fˆ ε k − p~0 fˆ0 ε k − p~0
= ε dk x0 + ~kt
+ iε2
m f ε k − ~
R Z
R
2
ˆ (k) = x0 + p0 t,
=
dk x0 + pm0 t + ~kt
f
m
m
R
dove abbiamo usato che fˆ(k) = fˆ(−k) = fˆ∗ (k) grazie alla parità di f e al fatto che f è reale. Per
l’aspettazioni di P si ha
Z
2 Z
2
ˆ
p0 ˆ(k) = p0 ,
hP it = ε dk ~k f ε k − ~ =
dk p0 + ~k
f
ε
R
R
sempre per la parità di fˆ(k). Inoltre
Z
2
2 2ˆ
P t = ε dk ~ k f ε k −
R
Q2
2
p0 ~
Z
dk p0 +
=
R
2
~k 2 ˆ
f
(k)
ε
= p20 + O
2
~
ε2
,
Z
=
ε
dk
t
R
Z
= ε dk
h
i2
o
n
p0 p0 ~k2
ˆ
x
−
i
t
f
ε
k
−
∂
exp
−i
k
−
k
0
~
2m
~
Z
2 2
ˆ ε k − p0 − 2ε= dk x0 + ~kt fˆ∗ ε k − p0 fˆ0 ε k − p0
x0 + ~kt
f
m
~
m
~
~
R
R
Z
2
+ ε3
dk fˆ0 ε k − p~0 RZ
Z
Z
2
2
2
ˆ p0 t
p0 ˆ∗
0
2
~kt
~kt
ˆ
=
dk x0 + εm + m f (k) − 2ε= dk x0 + εm + ~ f (k) f (k) + ε
dk fˆ0 (k)
R
= x0 +
p0 2
mt
+
t2
m2
R
p20 t2
m2
p20 t2
m2
∆P 2 0 −
= x20 +
R
+
t
m
+
t2
m2
ε2 kQf k22
(hP f |Qf i + hQf |P f i) +
∆P 2 0 + ∆Q2 0 + mt (hP f |Qf i + hQf |P f i) .
Vediamo ora un caso esplicito e significativo di pacchetto d’onda:
Esempio 4.1 (Pacchetto d’onda gaussiano)
Se scegliamo una f esplicita in (4.11) della forma
f (x) =
1 2
1
e− 2 x ,
π 1/4
(4.17)
è possibile anzitutto calcolare esplcitimente l’evoluzione temporale di Ψ0 :
(
2 )
n
o
x − pm0 t − x0
1
1
p20
p0
q
√ exp −i 2m~ t + i ~ x exp −
Ψt (x) =
.
i~t
2ε2 1 + mε
2
π 1/4 1 + i~t ε
mε2
Infatti, usando la (4.10) e la (4.14), abbiamo
Ψt (x) =
p
ε i
2π e
p0
x
~ 0
Z
~k2
dk eik(x−x0 ) e−i 2m t fˆ ε k −
R
p0 ,
~
e sostituendo la trasformata della gaussiana (si veda il prossimo Esercizio 4.3),
fˆ(k) =
1 2
1
e− 2 k
π 1/4
= f (k),
(4.18)
69
otteniamo
Ψt (x) =
p
p0
x
~ 0
Z
~k2
p 2
− 1 ε2 k− 0
~
dk eik(x−x0 ) e−i 2m t e 2
R
Z
ε2 p2
p0
2
0
i
x
−
x−x0
1
~t
1
0
2
2~
dk exp − 12 1 + i mε
= √2πε π1/4 e ~
2 k + i
ε +
i
ε 1
2π π 1/4 e
R
1
= √ 1/4 q1 i~t
1+ 2
επ
mε
εp0 k
~
 2 
iεp0
x−x0


−
ε
~
,
exp −


2 1+ i~t2
mε
dove abbiamo ancora una volta applicato il risultato dell’Esercizio 4.3. Resta poi un semplice calcolo per
ottenere l’espressione (4.18).
Dall’espressione (4.18) ricaviamo facilmente
kΨt kL∞ (R) =
1
q
π 1/4 1 +
1
√ = O(t−1/2 ),
i~t ε
2
(4.19)
mε
cioè il sup della funzione d’onda decade come t−1/2 a grandi tempi. Questo tipo di decadimento non si
osserva esclusivamente per i pacchetti gaussiani ma, al contrario, è un fatto generale (stime dispersive)
dovuto alle proprietà dell’evoluzione temporale libera quantistica.
Esercizio 4.3. Sia a ∈ C con 0 < ϕ = arg(a) < π2 oppure a > 0 e b ∈ R qualunque. Allora si dimostri che
Z
q
b2
2
π − 12 iϕ − 4a
e
dx e−ax eibx = |a|
e
.
(4.20)
R
(Suggerimento: si chiami I(b) la quantità al membro di sinistra dell’identità (4.20) e poi si scriva I 0 (b) come
funzione di I(b), si risolva l’equazione differenziale e si calcoli I(0) integrando su un settore circolare del
piano complesso, con un lato sull’asse reale e angolo al centro ϕ/2.)
Abbiamo dunque visto come in ambito quantistico, anche per il sistema più elementare – la particella libera
– il concetto di traiettoria perda senso. La probabilità è perciò un elemento ineliminabile dalla descrizione
quantistica e quand’anche si trovino dati iniziale di carattere quasi classico (i pacchetti d’onda), per cui la
probabilità di osservare la particella è sostanzialmente confinata in una regione finita, l’evoluzione temporale
tende a distruggere tale localizzazione.
Un altro aspetto della MQ che non ha analogo classico è l’interferenza che si può osservare anche nella
dinamica di un semplice sistema come la particella libera. Tale fenomeno è una diretta manifestazione del
principio di sovrapposizione ovvero della linearità dello spazio degli stati quantistici: se ad esempio Ψ1 (x)
e Ψ2 (x) sono due stati (normalizzati), anche Ψ1 + Ψ2 , se opportunamente normalizzato e assumendo che
non sia nullo, è uno stato ammissibile per il sistema quantistico. Il punto cruciale è che mentre lo stato è la
combinazione lineare dei due, la distribuzione di probabilità della particella è come sappiamo
|Ψ(x)|2 = c2 |Ψ1 (x)|2 + |Ψ2 (x)|2 + 2< hΨ1 |Ψ2 i ,
(4.21)
dove l’ultimo termine è proprio quello responsabile dell’interferenza. La costante c serve invece a imporre la
normalizzazione kΨk = 1. Supponiamo ora che Ψ1 ⊥ Ψ2 perché ad esempio le due funzioni hanno supporto
disgiunto. Allora c = √12 e
2
2
2
1
|Ψ(x)| = 2 |Ψ1 (x)| + |Ψ2 (x)| ,
cioè la particella ha il 50% di probabilità di essere osservata nella regione dove ha supporto Ψ1 e probabilità
identica di essere misurata nel supporto di Ψ2 .
70
Quando però facciamo evolvere il sistema, a causa della dispersione prodotta dall’evoluzione temporale quantistica, i supporti delle due funzioni Ψ1 e Ψ2 tendono a espandersi e, se aspettiamo un tempo
sufficientemente lungo, capiterà che
supp (U0 (t)Ψ1 ) ∩ supp (U0 (t)Ψ2 ) 6= ∅.
Ma allora al tempo t > 0 il terzo termine della (4.21) può non essere nullo e influenzare in modo drastico la
distribuzione di probabilità della particella. Non solo ma proprio come due onde classiche, le due funzioni
d’onda U0 (t)Ψ1 e U0 (t)Ψ2 possono interferire tra di loro e dar vita a fenomeni di interferenza costruttiva e
distruttiva (frange di interferenza). Nel seguito vedremo come questo fenomeno sia osservabile esplicitamente
nel caso dell’evoluzione temporale di due pacchetti d’onda gaussiani.
Consideriamo quindi un dato iniziale della forma
Ψ0 (x) =
cε
√
2
(Ψ+ (x) + Ψ− (x)) ,
con
Ψ± (x) =
√1 f
ε
x∓x0
ε
ei
±p0
x
~
,
f (x) =
(4.22)
1 2
1
e− 2 x ,
π 1/4
(4.23)
e cε > 0 una costante di normalizzazione. Lo stato iniziale è perciò formato da due pacchetti d’onda centrati
attorno a x0 e −x0 che hanno velocità iniziale opposta. I due pacchetti si muovono quindi uno incontro
all’altro e dopo un certo tempo che andremo a calcolare ci aspettiamo che si sovrappongano.
Prima di proseguire nell’analisi facciamo alcune ipotesi che semplificano i calcoli: assumiamo che
ε
~
1,
x0
εp0
(4.24)
che sono in particolare soddisfatte se x0 , p0 > 0 non dipendono da ε e ε2 ~ (naturalmente consideriamo
che ~ 1). Per prima cosa andiamo a stimare la costante di normalizzazione: essendo Ψ± normalizzate
abbiamo
2Z
Z
2x2
cε
x+x0 x−x0 c2ε − 2x220
2
p
−x2
2 − ε20
2
2
0
≤ √
ε
dx cos ~ x f
dx
e
=
c
e
,
f
e
kΨ0 k2 − cε = cε |< hΨ+ |Ψ− i| = ε
ε
ε
ε R
π
R
da cui segue
cε = 1 + O ((ε/x0 )∞ ) ,
(4.25)
dove abbiamo indicato con O(η ∞ ) una quantità più piccola di ogni potenza di η quando η → 0. In effetti
saremmo potuti arrivare alla stessa conclusione, cioè che Ψ+ e Ψ− sono con buona approssimazioni ortogonali,
osservando che la condizione (4.24) implica che i supporti sono sostanzialmente disgiunti. Più precisamente
le uniche sovrapposizioni si verificano dove almeno una delle due funzioni è esponenzialmente piccola in
ε/x0 .
L’evoluzione temporale di Ψ0 fa si che, per linearità , i centri dei due pacchetti si muovano di moto
rettilineo uniforme con velocità opposte uguali a p0 /m. Pertanto al tempo
T =
mx0
,
p0
(4.26)
i centri dei pacchetti sono esattamente sovrapposti a x = 0 e dobbiamo aspettarci la massima sovrapposizione
dei supporti. Definiamo inoltre per convenienza
α=
~x0
1,
ε2 p 0
(4.27)
come segue banalmente da (4.24). Notiamo inoltre che la seconda condizione in (4.24) garantisce che i
pacchetti Ψ+ e Ψ− sono concentrati anche nell’impulso, compatibilmente con il principio di indeterminazione
(3.57), sono cioè stati che saturano la disuguaglianza ∆P ∆Q ≥ 12 ~. Inoltre, in particolare, conservano la
natura di pacchetti d’onda concentrati anche durante l’evoluzione temporale, benché come abbiamo visto
71
in precedenza, la dispersione in Q aumenti nel tempo. Si può tuttavia facilmente vedere dalla seconda delle
(4.15) che la dispersione al tempo T in Q soddisfa
∆Q2 T x0 ,
cioè i pacchetti sono ancora concentrati nella posizione rispetto alla distanza iniziale.
Se ora prendessimo seriamente l’analogia fra la MQ e una teoria probabilistica classica dovremmo aspettarci che al tempo T la distribuzione di probabilità sia la somma delle distribuzioni di probabilità dei due
pacchetti d’onda e in quanto tale sia sostanzialmente
coincidente con quella di un singolo pacchetto d’onda
2
centrato in x = 0 con una dispersione ∆Q t maggiore di quella iniziale. In realtà questo è in generale
molto lontano dalla realtà : l’evoluzione temporale in MQ non agisce direttamente sulla distribuzione di
probabilità , ma modifica la funzione d’onda. Questo fa sı̀ che il terzo addendo nella (4.21) possa essere
modificato in modo drammatico dalla dinamica.
Proposizione 4.6 (Interferenza di pacchetti d’onda).
Sia Ψ0 il dato iniziale (4.22) e assumiamo che valgano le (4.24), allora
|ΨT (x)|2 = √
x2
2
−
√
e ε2 (1+α2 ) cos2
πε 1 + α2
p0 ~ x (1
+ o(1)) ,
(4.28)
uniformemente in x ∈ R.
Osservazione 4.7. L’esponenziale al membro di destra della (4.28) suggerisce che la probabilità sia distribuita come nei pacchetti d’onda Ψ± . Tuttavia l’ultimo fattore mostra come questo esponenziale in realtà moduli
delle oscillazioni dovute al cos2 di frequenza molto elevata (ricordiamo che abbiamo ipotizzato ~/p0 1).
All’interno della regione dove la proabilità di osservare la particella è sensibilmente diversa da 0, ovvero
ad esempio per |x| ≤ cεα, si presentano cioè delle oscillazioni fra un valore massimo, quando x = nπ~
p0 ,
. Naturalmente non esiste nessuna possibile spiegazione classica di questo
n ∈ N, e 0, quando x = (2n+1)π~
2p0
fenomeno che può essere osservato in laboratorio e, anzi, questo esempio suggerisce che la MQ non si possa
reinterpretare semplicemente come una teoria probabilistica classica.
Osservazione 4.8. Sottolineiamo che la (4.28) è in realtà una stima e non un’identità. In questo senso
l’affermazione sull’uniformità per x ∈ R va intesa nel senso che l’errore o(1) è una quantità il cui sup
rispetto a x ∈ R è controllato in modulo da una funzione di ε che tende a 0 quando ε → 0.
Dimostrazione. La dimostrazione combina la linearità dell’evoluzione temporale U0 (t) con la (4.18). L’errore
è dovuto alla sostituzione di c2ε con 1 e, come mostra la stima (4.25), è esponenzialmente piccolo in ε/x0 .
4.3
L’Oscillatore Armonico
Un altro sistema elementare che è tuttavia alla base della modellizzazione di molti fenomeni fisici quantistici
è l’oscillatore armonico. Come in meccanica classica l’hamiltoniana è data da
H̃osc =
|P|2 1
+ mω 2 |Q|2 ,
2m
2
(4.29)
su L2 (Rd ). Naturalmente data l’azione delle osservabili P e Q, l’operatore Hosc agirà su una generica
funzione d’onda Ψ ∈ S(Rd ) come
~2
1
H̃osc Ψ (x) = −
∆Ψ(x) + mω 2 |x|2 Ψ(x).
2m
2
(4.30)
Nel seguito per semplificare l’analisi considereremo il caso unidimensionale d = 1, commentando poi alla
fine di questa Sezione sull’estensione a d > 1.
72
Sia dunque H̃osc definita come in (4.29) su S(R). L’operatore è ovviamente illimitato e simmetrico. In
particolare non è chiuso. Mostreremo però che è essenzialmente autoaggiunto esibendo esplicitamente una
base di autofunzioni. Tale base definirà automaticamente un unitario da L2 (R) in `2 (N) che ci permetterà
di trovare il dominio di autoaggiunzione di Hosc studiando l’operatore associato su `2 (N), come abbiamo già
fatto nell’Esempio 3.23 (si veda anche l’Osservazione 3.3.13).
Prima però di procedere con lo studio dell’operatore conviene cambiare unità e studiare un operatore
adimensionale:
Proposizione 4.7 (Oscillatore armonico adimensionale).
Sia H̃osc l’operatore definito nella (4.29) con d = 1, allora ∃U : L2 (R) → L2 (R) unitario tale che
U H̃osc U −1 =: ~ωHosc ,
(Hosc Ψ) (y) = − 21 ∆Ψ(y) + 21 y 2 Ψ(y).
(4.31)
Dimostrazione. Riscaliamo le lunghezze ponendo
y = λx
(4.32)
con λ ∈ R+ da scegliere in seguito. Se indichiamo con Uλ : L2 (R) → L2 (R), l’operatore unitario che
implementa il cambio di coordinate, cioè
(U Ψ) (y) =
√1 Ψ(λ−1 y).
λ
(4.33)
allora abbiamo
−
1
~2 λ2
1
~2
∆Ψ(x) + mω 2 x2 Ψ(x) = −
∆y Ψ(λ−1 y) + 2 mω 2 y 2 Ψ(λ−1 y)
2m
2
2m
2λ
√
1
~2 λ2
2 2
∆y (Uλ Ψ) (y) + 2 mω y (Uλ Ψ) (y) .
= λ −
2m
2λ
A questo punto scegliamo
r
λ=
mω
,
~
in modo che i due coefficienti dei due addendi siano uguali e il risultato segue banalmente con U = Uλ ,
l’unitario associato al λ della formula precedente.
Grazie alla Proposizione precedente possiamo restringerci a considerare l’hamiltoniana Hosc definita nella
(4.31), visto il caso generale (4.29) si può riottenere con un cambio di variabili implementato da un operatore
unitario.
Per studiare lo spettro di Hosc conviene introdurre gli operatori di creazione e distruzione
a := √12 Q̃ + iP̃ ,
a† := √12 Q̃ − iP̃ ,
(4.34)
con dominio D(a) = D(a† ) = C0∞ (R) e
Q̃Ψ (y) = yΨ(y),
P̃ Ψ (y) = −i∂y Ψ(y).
Proposizione 4.8 (Operatori di creazione e distruzione).
Siano a, a† definiti come nella (4.34) con dominio S(R), allora e, per ogni Φ, Ψ ∈ S(R),
hΦ |aΨ i = ha† Φ|Ψi,
[a, a† ]Ψ = Ψ,
[Hosc , a]Ψ = −aΨ,
[Hosc , a† ]Ψ = a† Ψ,
Hosc Ψ =
a† a + 12 Ψ = aa† − 12 Ψ.
(4.35)
73
Dimostrazione. Tutte le identità tranne la prima, che segue dall’essenziale autoaggiunzione di P e Q su
S(R), sono conseguenza diretta della regola di commutazione fra P̃ e Q̃, cioè per ogni Ψ ∈ S(R),
h
i P̃ , Q̃ Ψ (y) = −i∂y (yΨ(y)) + iy∂y Ψ(y) = −iΨ(y).
L’utilità degli operatori di creazione e distruzione sta in particolare nelle ultime tre relazioni in (4.35):
Proposizione 4.9 (Proprietà degli autovalori di Hosc ).
Se λ ∈ R è un autovalore di Hosc e Ψλ ∈ S(R) il relativo autovettore, allora
i) λ ≥ 21 ;
ii) a† Ψλ è ancora autovettore (di norma λ + 21 ) di Hosc all’autovalore λ + 1;
iii) se λ ≥ 32 , aΨλ è ancora autovettore (di norma λ − 12 ) di Hosc all’autovalore λ − 1.
Dimostrazione. Le ultime tre identità in (4.35) sono sufficienti per ottenere l’enunciato: dall’ultima
otteniamo
E
D
λ = h Ψλ |Hosc | Ψλ i = Ψλ a† a + 21 Ψλ = haΨλ |aΨλ i + 21 = kaΨλ k22 + 12 ≥ 12 .
Mentre dalla terz’ultima e penultima identità
Hosc a† Ψλ = λa† Ψλ + [Hosc , a† ]Ψλ = (λ + 1)Ψλ ;
e, se λ ≥ 32 ,
Hosc aΨλ = λaΨλ + [Hosc , a† ]Ψλ = (λ − 1)Ψλ .
Si noti che la condizione λ ≥
non nulla: nel primo caso
†
ka
mentre nel secondo
3
2
Ψλ k22
è in realtà conseguenza della richiesta che il nuovo autostato abbia norma
E = Ψλ aa† Ψλ = Ψλ Hosc + 12 Ψλ = λ +
D
1
2
> 0;
D
E kaΨλ k22 = Ψλ a† a Ψλ = Ψλ Hosc − 21 Ψλ = λ − 12 ,
che è positivo se e solo se λ > 21 , ovvero λ ≥ 23 , per quanto dimostrato riguardo a a† .
Osservazione 4.9. Si noti che il fatto che Ψλ stia in S è in realtà un ipotesi cruciale del risultato perché altrimenti non potremmo sfruttare le relazioni (4.35). Per poter quindi applicare la Proposizione 4.9 dovremmo
assicurarci che Ψλ ∈ S(R).
La precedente Proposizione è sufficiente per trovare tutti gli autovalori di Hosc :
Teorema 4.1 (Autovalori di Hosc ).
Si ha
σpp (Hosc ) = n + 12 , n ∈ N ∪ {0} ,
(4.36)
con autofunzioni normalizzate
Ψn (y) =
dove Hn è l’n−esimo polinomio di Hermite.
1
√
π 1/4 2n n!
Hn (y)e−
y2
2
,
(4.37)
74
y2
Dimostrazione. Per prima cosa osserviamo che e− 2 è autofunzione di Hosc all’autovalore 12 . Inoltre essa
sta in S(R) e quindi possiamo applicare la Proposizione 4.9 che implica automaticamente l’esistenza degli
autovalori n+ 12 . Per identificare le autofunzioni è poi sufficiente applicare a† ripetutamente (rinormalizzando
a ogni passo) e usare la definizione di polinomio di Hermite. Notiamo anzitutto che
Ψn (y) =
1
√
π 1/4 2n n!
(y − ∂y )n e−
y2
2
,
cosı̀ che, per la definizione di polinomio di Hermite,
Hn (y) := (−1)n e
y2
2
dn − y2
e 2,
dxn
rimane solo da dimostrare che
(−∂y + y)n e−
y2
2
= (−1)n e
y2
2
dn − y2
e 2.
dxn
Dimostriamo l’asserto per induzione su n ∈ N. Per n = 0 è ovviamente vero. Supponiamo che sia vero per
n ∈ N, allora dimostriamo che vale per n + 1:
2 n
n+1
2
2
2
y
d − y2
n+1 − y2
n
n+1 y2 d
− y2
2
2
= (−1) (−∂y + y) e
e
=
(−1)
e
e
.
(−∂y + y)
e
dxn
dxn+1
Per concludere che quelli trovati sono tutti e soli gli autovalori, si osserva che se esistesse un autovalore
λ 6= n+ 12 potremmo ripetutamente applicare a al relativo autovettore ottenendo un autovettore all’autovalore
1
3
0
2 < λ < 2 . Si potrebbe allora applicare l’ultimo punto della Proposizione 4.9, ottenendo un autovalore
strettamente minore di 12 , il che contraddice il primo punto della medesima Proposizione.
L’argomento precedente contiene in realtà una piccola imprecisione: per poter applicare la Proposizione
4.9 dobbiamo assumere che l’autofunzione relativa all’autovalore λ sia in effetti in S(R). L’argomento quindi
escluderebbe solo altri autovalori con autofunzioni in S(R). Tuttavia è facile osservare che il risultato della
Proposizione 4.9 si estende banalmente a tutte le funzioni Ψλ tali che P̃ Ψλ e Q̃Ψλ siano entrambe in L2 (R),
perché tali funzioni appartengono certamente al dominio di a e a† . Ma, d’altra parte, qualunque autofunzione
di Hosc deve essere tale che
Z
n
o
dy 21 |Ψ0λ |2 + 12 y 2 |Ψλ |2 = λ < +∞,
R
e quindi la Proposizione 4.9 si può applicare.
Osservazione 4.10. Un’importante conseguenza della Proposizione 4.1 o, più precisamente, della sua dimostrazione è che gli autovalori di Hosc sono anche non degeneri. Vi sono vari modi per vederlo, ma
il più semplice è invocare l’unicità di Ψ0 o, in altri termini, della soluzione dell’equazione differenziale
− 21 Ψ00 + 21 y 2 Ψ = 12 Ψ, e quindi sfruttare le proprietà di a† .
Per completare l’analisi spettrale di Hosc resta da dimostrare che tutto lo spettro di Hosc è completamente
discreto. Solitamente questo viene dimostrato sfruttando la completezza delle autofunzioni (4.37), mentre
qui presentiamo una dimostrazione alternativa che sfrutta le proprietà del risolvente di Hosc , di cui diamo
una rappresentazione nel prossimo Lemma 4.2. Sfrutteremo infatti un risultato generale di grande utilità
nello studio dello spettro di operatori di Schrödinger con risolvente compatto, il prossimo Lemma 4.1.
Teorema 4.2 (Spettro di Hosc ).
Si ha
σ(Hosc ) = σdisc (Hosc ) = σpp (Hosc ) = n + 21 , n ∈ N ∪ {0} .
Inoltre le autofunzioni Ψn in (4.37) costituiscono un s.o.n.c in L2 (R).
(4.38)
75
Osservazione 4.11. La dimostrazione del risultato strutta un risultato generale sugli operatori con risolvente compatto (Lemma 4.1) e lo combina con la rappresentazione (4.39) del risolvente di Hosc , la cui
dimostrazione però è piuttosto complicata. Una dimostrazione più diretta si può ottenere combinando il
criterio di Rellich [RS4, Teorema XIII.65] con una versione più dettagliata del Lemma 4.1 (si veda [RS4,
Teorema XIII.64]).
Dimostrazione. Grazie al Lemma 4.1 è sufficiente dimostrare che (Hosc + λ)−1 è compatto per un qualche
λ ≥ 0. Prendiamo per semplicità λ = 1/2 e mostriamo che (Hosc + 1/2)−1 è il limite in norma di operatori
di classe traccia: chiamiamo Rδ l’operatore integrale con kernel
1
o
n
n
o Z 1−δ
1
ν λ− 2
2
0
1
1
2
0
Rδ (y; y ) = √ exp − 2 (y + y )
2νyy 0 − ν 2 (y 2 + y 0 2 ) .
dν √
exp 1−ν
2
π
1 − ν2
0
E’ facile vedere che Rδ −→ (Hosc + 1/2)−1 in norma operatoriale: applicando il test di Schur (Proposizione
δ→0
3.10) abbiamo
Z 1
1
n
n
oZ
o
1
−1
0
1+ν 2
1+ν 2
2
0 2 + 2ν yy 0
dν √
y
dy
exp
−
y
exp − 2(1−ν
(Hosc + 1/2) − Rδ ≤ sup
2)
2(1−ν 2 )
1−ν 2
π y∈R 1−δ
1 − ν2
R
Z 1
Z 1
n
o
1
1
1−ν 2
2
√
dν
dν √
≤ C sup
exp − 2(1+ν 2 ) y ≤ C
−→ 0.
2
1+ν
1 + ν 2 δ→0
y∈R 1−δ
1−δ
Inoltre per ogni δ > 0
Z
Z 1−δ
Z
Z 1−δ
o
n
1
1
1
1
1−ν
2
dy
dν
kRδ k1 =
dy
dν √
exp − 1+ν y = √
< +∞,
π R
1−ν
π R
1 − ν2
0
0
per cui (Hosc + 1/2)−1 è un operatore compatto in quanto limite in norma di operatori compatti (Teorema
3.25).
Lemma 4.1 (Spettro discreto e risolvente compatto).
Sia A un operatore autoaggiunto limitato dal basso, allora le seguenti affermazioni sono equivalenti:
i) (A − z)−1 è compatto per un qualche z ∈ ρ(A);
ii) (A − z)−1 è compatto per ogni z ∈ ρ(A);
iii) σ(A) = σdisc (A) = σpp (A) e ∃ un s.o.n.c. {Ψn }n∈N di autovettori di A tale che AΨn = µn Ψn e
µ1 ≤ µ2 ≤ · · · ≤ µn −→ +∞.
n→∞
Dimostrazione. Dimostreremo che i) ⇐⇒ ii) e ii) =⇒ iii) =⇒ i).
i) ⇐⇒ ii) segue immediatamente dalla prima identità del risolvente (3.77) e dal fatto che se A è compatto
e B limitato allora AB e BA sono entrambi compatti.
Dimostriamo ora che ii) =⇒ iii): siccome (A − z)−1 è compatto per ogni z ∈ ρ(A) e A è limitato
dal basso ∃a > 0 tale che A ≥ −a e quindi (A + a)−1 è compatto. Allora, poiché (A + a)−1 è positivo e
autoaggiunto, per il Teorema di Hilbert-Schmidt 3.27, ∃ un s.o.n.c. {Ψn }n∈N tale che
(A + a)−1 Ψn = λn Ψn ,
con λ1 ≥ · · · ≥ λn −→ 0. Il risultato è quindi dimostrato definendo µn = λ−1
n − a. Si noti che l’affermazione
n→∞
sullo spettro di A è conseguenza diretta dell’esistenza di una base di autovettori (appunto il s.o.n.c. {Ψn })
e del fatto che per il Teorema di Riesz-Schauder 3.26 la degenerazione dei λn è finita per ogni n ∈ N e non
esistono punti di accumulazione diversi da 0 e +∞ per i λn .
Per l’implicazione contraria iii) =⇒ i) prendiamo a > 0 come prima: è facile vedere che si ha la
rappresentazione
X 1
(A + a)−1 =
|Ψn i hΨn | .
µn + a
n∈N
Il Teorema 3.25 unitamente al fatto che µn −→ +∞ ci dà immediatamente il risultato.
n→∞
76
Lemma 4.2 (Risolvente di Hosc ).
Per ogni λ > − 12 , (Hosc + λ)−1 è un operatore integrale limitato su L2 (R) con kernel
(Hosc + λ)
−1
o
n
1
2
1 2
0
√
(y; y ) =
exp − 2 (y + y )
π
0
Z
0
1
1
o
n
ν λ− 2
2
1
0
2
2
0
√
dν
exp 1−ν 2 2νyy − ν (y + y ) . (4.39)
1 − ν2
Dimostrazione. La formula (4.39) è anche detta formula di Mehler. Per una dimostrazione si veda ad
esempio [BC].
Possiamo ora tornare all’hamiltoniana fisica H̃osc da cui siamo partiti e osservare che il precedente Teorema
4.2 implica (sempre nel caso d = 1)
σ(H̃osc ) = σdisc (H̃osc ) = σpp (H̃osc ) = ~ω n + 12 n ∈ N .
(4.40)
Per concludere lo studio dell’oscillatore armonico commentiamo brevemente sul caso d−dimensionale,
d > 1: fruttando l’isomorfismo L2 (Rd ) ' L2 (R) ⊗ · · · ⊗ L2 (R) è ovvio che H0 in Rd sia scrivibile come
(1)
(1)
Hosc = Hosc
⊗ 1 ⊗ · · · ⊗ 1 + 1 ⊗ Hosc
⊗ 1 ⊗ ··· ⊗ 1 + ··· ,
(4.41)
(1)
dove con Hosc abbiamo indicato l’hamiltoniana dell’oscillatore armonico unidimensionale.
Proposizione 4.10 (Spettro dell’oscillatore armonico in d > 1).
Sia H̃osc l’hamiltoniana (4.29) in d > 1, allora
σ(H̃osc ) = σdisc (H̃osc ) = σpp (H̃osc ) = ~ω N + d2 N ∈ N .
(4.42)
Inoltre il livello energetico N −esimo ~ω(N + d2 ) è degenere e una base per l’autospazio relativo è data dalle
autofunzioni
d
X
Ψn1 ,...,nd (x) = Ψn1 (x1 ) · · · Ψnd (xd ),
N=
ni ,
(4.43)
i=1
dove le {Ψn } sono gli autostati dell’oscillatore armonico unidimensionale.
(n1 , . . . , nd ) ∈ Nd formano un s.o.n.c. in L2 (Rd ).
Le Ψn al variare di n =
Dimostrazione. Il risultato segue banalmente dalle proprietà dell’oscillatore armonico unidimensionale e
dalla rappresentazione (4.41).
Capitolo 5
Atomo di Idrogeno
In questo Capitolo riprenderemo uno dei problemi connessi alla crisi della fisica classica che abbiamo discusso
nella Sezione 1.3, ovvero la necessità di avere un modello stabile degli atomi, che sia in grado di dare conto
delle osservazioni spettroscopiche. Vedremo come in ambito quantistico tale modello non solo esista ma
riproduca in un certo senso le regole empiriche del modello atomico di Bohr (si veda ancora la Sezione 1.3),
fornendone quindi una giustificazione teorica.
In questo Capitolo studieremo esclusivamente l’atomo più elementare possibile, ovvero quello di idrogeno:
un sistema costituito da due particelle cariche, il protone ed l’elettrone, con carica opposta e interagenti con
il potenziale coulombiano. Gli atomi più complessi saranno studiati nei prossimi Capitoli.
5.1
Autoaggiunzione e Stabilità
Il sistema che vogliamo descrivere è dunque costituito da due cariche uguali ed opposte con masse mp '
2000me . E’ dunque naturale assumere che il nucleo dell’atomo, costituito dal protone, sia fermo all’origine
del sistema di coordinate. In tal caso l’Hamiltoniana del sistema coincide con quella dell’elettrone ed è data
da
P2
e2
He = H0 + Ve =
−
,
(5.1)
2me |Q|
che agisce su C0∞ (R3 ) ⊂ L2 (R3 ) come l’operatore
He = −
~2
e2
∆−
.
2me
|x|
(5.2)
Esercizio 5.1. Si usi il cambiamento di coordinate (xp , xe ) −→ (xcm , r), con xcm = mp xp + me xe la
coordinata del centro di massa e r = xe − xp , per ricavare la fattorizzazione dell’Hamiltoniana H dell’atomo
di idrogeno comprensiva dell’energia cinetica del protone. Si dimostri che H = Hcm + Hrel e Hrel è una
perturbazione piccola nel senso di Kato di He . Si sfrutti tale risultato e le seguenti proprietà di He per
dimostrare autoaggiunzione e limitatezza dal basso di H.
Il risultato principale di questa Sezione è il seguente
Teorema 5.1 (Autoaggiunzione e limitatezza dal basso di He ).
L’operatore He definito nella (5.1) è autoaggiunto su D(He ) = H 2 (R3 ) e essenzialmente autoaggiunto su
C0∞ (R3 ). Inoltre He è limitata dal basso, cioè esiste λ0 < +∞ tale che He ≥ −λ0 .
Dimostrazione. L’autoaggiunzione e la limitatezza dal basso sono conseguenza di un risultato generale che
enunciamo nel prossimo Lemma 5.1: è infatti facile vedere che Ve ∈ L2 (R3 ) + L∞ (R3 ) decomponendolo come
Ve = V1 + V2 con
V1 (x) := Ve (x)1{|x|≤R} ,
V2 (x) := Ve (x)1{|x|>R} .
77
78
Lemma 5.1 (Autoaggiunzione per potenziali in L2 + L∞ ).
Sia V reale tale che V = V1 + V2 con V1 ∈ L2 (R3 ) e V2 ∈ L∞ (R3 ) (che indicheremo da qui in poi come
V ∈ L2 + L∞ ), allora H = −∆ + V è essenzialmente autoaggiunta su C0∞ (R3 ) e autoaggiunta su H 2 (R3 ).
Inoltre ∃λ0 < +∞ tale che H ≥ −λ0 .
Dimostrazione. Come suggerito dal titolo del Lemma, il risultato è dimostrato applicando il Teorema di
Kato-Rellich 3.13. Dimostriamo quindi che sotto le ipotesi dell’enunciato V è piccolo nel senso di Kato
rispetto a −∆. Anzitutto osserviamo che C0∞ (R3 ) ⊂ D(V ) e V è simmetrico su tale dominio. Inoltre per
ogni Ψ ∈ L2 (R3 )
kV Ψk2 ≤ kV1 k2 kΨk∞ + kV2 k∞ kΨk2 ≤ a0 k∆Ψk2 + b0 kΨk2 ,
(5.3)
dove abbiamo applicato il prossimo Lemma 5.2 con a0 = a kV1 k2 e b0 = b+kV2 k∞ . A questo punto il risultato
segue dall’arbitrarietà di a, per cui possiamo sempre trovare un a0 < 1 tale che la disuguaglianza vale.
Gli altri risultati dell’enunciato seguono direttamente dall’applicazione del Teorema di Kato-Rellich 3.13
(si vedano anche le Osservazioni 3.10 e 3.11 e il Corollario 3.1).
Lemma 5.2 (Disuguaglianza di Sobolev).
Sia Ψ ∈ H 2 (Rd ), d ≤ 3, allora Ψ è limitata e continua e ∀a > 0, ∃b < +∞ (indipendente da Ψ) tale che
kΨk∞ ≤ a k∆Ψk2 + b kΨk2 .
(5.4)
Dimostrazione. Ci restringiamo al caso d = 3. La dimostrazione in d = 1, 2 è infatti identica.
Osserviamo anzitutto che
kΨk∞ ≤ (2π)13/2 kΨ̂ k1 ,
come segue banalmente dalla definizione di trasformata di Fourier scambiando il modulo con l’integrale.
D’altra parte abbiamo che, per ogni λ > 0,
k2 + λ
dk|Ψ̂| =
dk 2
|Ψ̂| ≤
k +λ
R3
R3
Z
Z
Z
1
dk 2
(k + λ)2
R3
1/2 h
i
2
k + λ Ψ̂ ≤ C λ−1/4 k∆Ψk2 + λ3/4 kΨk2 ,
2
dove abbiamo usato le disuguaglianze di Cauchy e triangolare. Al variare di λ ∈ (0, +∞) si ottiene quindi
l’enunciato.
Osservazione 5.1. La possibilità di scegliere arbitrariamente la costante a > 0 nella disuguaglianza (5.4)
può essere anche vista come conseguenza del comportamento della espressione al membro di destra sotto
dilatazioni (scaling): ripetendo la dimostrazione per λ = 1, otterremmo
kΨk∞ ≤ C [k∆Ψk2 + kΨk2 ] .
√
Se però a questo punto definissimo Ψ̂λ (x) = λ3/2 Ψ̂( λx) e applicassimo la disuguaglianza precedente a Ψλ
riotterremmo la (5.4), cioè
h
i
kΨk∞ ≤ C λ−1/4 k∆Ψk2 + λ3/4 kΨk2 ,
dato che kΨ̂λ k1 = kΨ̂ k1 , kΨ̂λ k2 = λ3/4 kΨ̂ k2 e kk 2 Ψ̂λ k2 = λ−1/4 kk 2 Ψ̂ k2 .
Nel caso paradigmatico dell’atomo di idrogeno abbiamo una chiara dimostrazione dell’importanza dell’ipotesi
di autoaggiunzione per le osservabili quantistiche e in particolare per l’Hamiltoniana del sistema:
Corollario 5.1 (Dinamica
di idrogeno).
dell’atomo
Gli operatori U (t) = exp −i H~e t identificano un gruppo a un parametro fortemente continuo di operatori
unitari e, per ogni t ∈ R, U (t)Ψ0 descrive la dinamica dell’atomo di idrogeno con dato iniziale Ψ0 ∈ L2 (R3 ).
Dimostrazione. Si veda la Sezione 3.13 e in particolare il Teorema 3.31.
79
Osservazione 5.2. Il Corollario 5.1 garantisce l’esistenza globale nel tempo della dinamica dell’atomo di
idrogeno. Non si ha perciò nessun fenomeno di “caduta sul centro” dell’elettrone e la dinamica quantistica
è più regolare di quella classica. Tuttavia il Corollario 5.1 non risolve interamente il problema fisico della
stabilità dell’atomo di idrogeno che abbiamo visto nella Sezione 1.3 essere uno dei fenomeni alla base della
crisi della fisica classica. A tale scopo si dovrebbe infatti includere il campo elettromagnetico nella descrizione
quantistica, cosa impossibile in ambito non relativistico. Questo è invece possibile in teoria di campo e si
può in quel caso dare una soluzione completa al problema discusso nella Sezione 1.3, nonché spiegare il
fenomeno dell’assorbimento ed emissione di onde elettromagnetiche da parte dell’atomo di idrogeno.
Concludiamo la Sezione con una prima stima non ottimale del limite dal basso per He , cioè il λ0 che
compare nell’enunciato del Teorema 5.1:
Proposizione 5.1 (Limite dal basso per He ).
Si ha
He ≥ −
2me e4
.
~2
(5.5)
Dimostrazione. Sia Ψ ∈ H 2 (R3 ) con kΨk = 1, allora il Lemma 5.3 implica
Z
~2
e2
h Ψ |He | Ψ i ≥
dx
−
|Ψ|2 .
2
8m
|x|
|x|
3
e
R
Resta allora solo da minimizzare la funzione
segue quindi dalla normalizzazione di Ψ.
~2
8me |x|2
−
e2
|x| ,
il che equivale a scegliere |x| =
~2
.
4me e4
Lemma 5.3 (Disuguaglianza di Hardy).
Per ogni Ψ ∈ H 1 (Rd ), d ≥ 3, si ha
Z
Z
|Ψ|2
(d − 2)2
2
dx
.
dx |∇Ψ| ≥
4
|x|2
Rd
Rd
Il risultato
(5.6)
Osservazione 5.3. La constante della disuguaglianza di Hardy è ottimale (sharp), nel senso che l’operatore
2
di Schrödinger −∆ − |x|ν 2 è un operatore illimitato dal basso se ν > (d−2)
.
4
Dimostrazione. Per ogni β ∈ R calcoliamo
2 Z
Z
2
x
β
x
2
2
2
dx ∇ + β 2 Ψ =
dx |∇Ψ| − β|Ψ| ∇ · 2 + 2 |Ψ| ,
|x|
|x|
|x|
Rd
Rd
dove abbiamo integrato per parti il secondo termine dello sviluppo del quadrato e sfruttato l’annullamento
dei termini di bordo garantita dalla condizione Ψ ∈ H 1 (Rd ):
Z
Z
1
1
C
dσ |Ψ|2 =
∇|Ψ|2 ≤ kΨk2 k∇Ψk2 −→ 0.
R→∞
R ∂BR
R BR
R
Inoltre
d
∇·
X |x|2 − 2x2
d−2
x
i
=
=
,
|x|2
|x|4
|x|2
i=1
da cui otteniamo
Z
0≤
2 Z
x
dx ∇ + β 2 Ψ =
|x|
d
R
β 2 − β(d − 2) 2
2
dx |∇Ψ| +
|Ψ| ,
|x|2
Rd
e quindi, ottimizzando rispetto a β, cioè scegliendo β =
d−2
2 ,
il risultato.
80
5.2
Spettro Energetico
In questa Sezione studiamo lo spettro energetico di He . Per prima cosa applichiamo il Teorema di Weyl
3.28 per trovare lo spettro essenziale di He .
Proposizione 5.2 (Spettro essenziale di He ).
Si ha
σess (He ) = R+ .
(5.7)
Dimostrazione. L’idea della dimostrazione è di applicare il Teorema di Weyl 3.28 e quindi a tale scopo
mostrare che (He − z)−1 − (H0 − z)−1 è un operatore compatto per un qualche z ∈ ρ(He ) ∩ ρ(H0 ). Notiamo
inoltre che è sufficiente dimostrare la compattezza dell’operatore
Ve (H0 + λ)−1 ,
λ>
2me e4
,
~2
(5.8)
poiché −λ ∈ ρ(He ) ∩ ρ(H0 ) e
(He + λ)−1 − (H0 + λ)−1 = −(He + λ)−1 Ve (H0 + λ)−1 ,
(5.9)
per la seconda identità del risolvente (3.78). Inoltre osserviamo che se Ve (H0 + λ)−1 è compatto anche il
membro di destra della (5.9) è compatto in quanto prodotto di un operatore compatto per uno limitato
(ricordiamo che grazie alla condizione (5.8) e alla Proposizione 5.1 λ ∈ ρ(He )).
Usiamo ora una decomposizione di Ve simile a quella usata nella dimostrazione del Teorema 5.1:
V e = V n + Wn ,
Vn (x) = Ve (x)1{|x|≤n} ,
Wn (x) = Ve (x)1{|x|>n} ,
cosı̀ che Wn ∈ L∞ (R3 ) e
kWn k = kWn kL∞ (R3 ) −→ 0.
n→∞
Osserviamo poi che Vn (H0 +
λ)−1
è un operatore integrale con kernel
√
Vn (x)e− λ|x−y|
Vn (x)Gλ (x − y) =
∈ L2 (R6 ).
4π|x − y|
Infatti
√
V 2 (x)e−2 λ|x−y|
dxdy n 2
≤C
16π |x − y|2
R6
Z
√
Z
dx
R3
Vn2 (x)
e−2 λ|y|
dy
≤ Cn < +∞.
|y|2
R3
Z
Pertanto Vn (H0 + λ)−1 è un operatore di classe Hilbert-Schmidt e in particolare compatto. Allora anche
Ve (H0 + λ)−1 è un operatore compatto in quanto limite in norma di operatori compatti.
Per quanto detto il risultato segue quindi dal fatto che σess (H0 ) = R+ , come abbiamo visto nella Sezione
4.1.
Per chiudere l’indagine dello spettro essenziale enunciamo un risultato di cui non daremo la dimostrazione,
che si può ottenere facendo ricorso alle proprietà di riscalamento di He sotto dilatazioni complesse (si veda
ad esempio [T3, (4.1.16)]).
Proposizione 5.3 (Assenza di spettro singolare di He ).
Si ha
σsing (He ) = ∅.
(5.10)
Una volta identificato lo spettro essenziale, vogliamo trovare lo spettro discreto. Un risultato che riveste un
interesse a se stante e ci permetterà di ricavare importanti informazioni sugli autovalori di He e in particolare
il fatto che tutti gli autovalori di He sono negativi è il teorema del viriale.
81
Proposizione 5.4 (Teorema del viriale).
Sia Ψ un autovettore di He all’autovalore E, allora
E=
1
2
h Ψ |Ve | Ψ i = − h Ψ |H0 | Ψ i .
(5.11)
Dimostrazione. La dimostrazione del teorema del viriale usa il comportamento di He sotto l’azione del
gruppo delle dilatazioni: definiamo per ogni β ∈ R
(U (β)Ψ) (x) = e
3β
2
Ψ(eβ x).
(5.12)
E’ facile vedere che U (β) è unitario e U (−β) = U ∗ (β) = U −1 (β) e più precisamente U (β) è un gruppo
unitario ad un parametro fortemente continuo. Inoltre
i h
i h
−3β
~2 −2β
−β x) − e2 Ψ(e−β x) = U (−β) e−2β H + e−β V Ψ (x),
(He U (−β)Ψ) (x) = e 2 − 2m
e
(∆Ψ)
(e
0
e
|x|
e
cioè
U (β)He U (−β) = e−2β H0 + e−β Ve .
Se Ψ è autovettore per ogni β ∈ R si ha
h(He − E)Ψ |U (β)Ψ i = 0,
0 = h(He − E)U (−β)Ψ |Ψ i = hU (β)(He − E)U (−β)Ψ |U (β)Ψ i =
cosı̀ che
D
E
e−2β H0 + e−β Ve Ψ U (β)Ψ ,
E
1 D 1 − e−2β H0 + 1 − e−β Ve Ψ U (β)Ψ = 0.
β
Osserviamo poi che per ogni autovettore di He deve essere
kH0 Ψk < +∞,
kVe Ψk < +∞,
e
E
1 D 1 − e−2β H0 + 1 − e−β Ve Ψ U (β)Ψ
β→0 β
E
1 D = lim
1 − e−2β H0 + 1 − e−β Ve Ψ Ψ = h (2H0 + Ve ) Ψ| Ψi ,
β→0 β
0 = lim
poiché
E
1 D 1 − e−2β H0 + 1 − e−β Ve Ψ (U (β) − 1) Ψ = 0
β→0 β
lim
per convergenza dominata, mentre per ogni Ψ nel dominio di He e, in particolare, un autovettore,
w
1−e−2β
H0 −→
β
β→0
2H0 ,
w
1−e−β
−→
β Ve β→0
Ve .
Corollario 5.2 (Autovalori negativi di He ).
Tutti gli autovalori E di He sono negativi, cioè E < 0.
Dimostrazione. Segue dalla (5.11) e dal fatto che sia H0 che Ve hanno un nucleo banale.
Un altro fatto che discende dal comportamento di He sotto dilatazioni o, detto in altri termini, dal modo in
cui He scala quando si riscalano le lunghezze è l’esistenza di ∞ autovalori di He .
Proposizione 5.5 (Esistenza di ∞ autovalori di He ).
Esistono ∞ autovalori negativi E1 ≤ E2 ≤ · · · di He .
82
Dimostrazione. Dimostriamo che dim[ran(EHe (−∞, 0])] = dim[ran(EHe [E1 , 0])] = +∞, dove abbiamo indicato con E1 = inf σ(He ), che sappiamo essere > −∞ per il Teorema 5.1. Inoltre è facile mostrare che
esiste una Ψ di prova normalizzata tale che h Ψ |He | Ψ i < 0 (si veda sotto) e quindi E1 < 0 è certamente un
autovalore perché sappiamo che σess (He ) = R+ . In particolare esiste almeno un autovalore < 0.
Sia ora Ψ una funzione C0∞ (R+ ) tale che supp(Ψ) ⊂ (1, 2) e kΨk2 = 1. Definiamo inoltre
Ψn (x) = 2−
3n
2
Ψ(2−n |x|).
La successione {Ψn } soddisfa le seguenti proprietà: le Ψn sono normalizzate, hanno supporto disgiunto per
n 6= m, infatti supp(Ψn ) = (2−n , 2−n+1 ). Pertanto h Ψn |He | Ψm i = 0 per m 6= n e
h Ψn |He | Ψn i = 2−2n h Ψ |H0 | Ψ i + 2−n h Ψ |Ve | Ψ i < 0,
per n ≥ n0 ,
(5.13)
con n0 > 0 grande abbastanza, come segue banalmente dal fatto che h Ψ |Ve | Ψ i ≤ −C < 0. Ora affermiamo
che per ogni k ≥ 0
(5.14)
span {Ψn0 , . . . , Ψn0 +k } ⊂ ran (EHe [−E1 , 0]) .
Dall’arbitrarietà di k nella (5.14) seguirebbe poi il risultato finale.
Supponiamo infatti per assurdo che la (5.14) sia falsa e mostriamo come questo generi una contraddizione:
assumendo la (5.14) falsa, avremmo che deve esistere una Ψ ∈ ranEHe [0, +∞) tale che Ψ 6= 0 e
Ψ=
k
X
cj Ψj+n0 = EHe [0, +∞)Φ
j=0
per una certa Φ ∈ L2 (R3 ). Ma per il teorema spettrale
Z
Z
Z
dµΨ (λ) λ =
d h Φ |EHe [0, +∞)EHe (λ)EHe [0, +∞)| Φ i λ =
h Ψ |He | Ψ i =
σ(He )
σ(He )
∞
dµΦ (λ) λ ≥ 0,
0
da cui segue
k
X
|cj |2 h Ψj+n0 |He | Ψj+n0 i = 0,
j=0
per la (5.13). Ma per la stessa (5.13), cj = 0 per ogni j = 0, . . . , k, e quindi Ψ = 0, il che è assurdo.
Riassumendo quanto trovato fin’ora abbiamo quindi che l’assenza di spettro singolare in aggiunta all’assenza
di autovalori positivi implica che
σess (He ) = σac (He ) = [0, +∞).
(5.15)
Mentre lo spettro discreto coincide con lo spettro puntuale ed è dato da un numero infinito di autovalori
negativi con molteplicità finita.
Concludiamo la Sezione mostrando come E1 , l’autovalore più basso di He , si possa ricavare da una stima
variazionale:
Proposizione 5.6 (Energia dello stato fondamentale di He ).
L’autovalore più basso di He vale
me e4
E1 = inf σ(He ) = − 2 .
2~
(5.16)
Osservazione 5.4. L’ottimalità della disuguaglianza che useremo nella dimostrazione della (5.16) ci
permette di ricavare anche la forma di un’autofunzione relativa a E1 (si veda l’Osservazione 5.5:
Ψ1,0,0 (r) =
dove a =
Sezione.
~2
me e2
1 −r/a
e
,
πa3/2
(5.17)
è il raggio di Bohr. Gli indici che identificano l’autofunzioni saranno introdotti nella prossima
83
Dimostrazione. Per prima cosa notiamo che l’inf dello spettro di He deve essere un autovalore perché
inf σ(He ) < 0 per quanto già mostrato e nel semiasse reale negativo He ha solo autovalori di molteplicità
finita. Per trovare il valore di E1 poi dimostreremo una stima dall’alto e una dal basso che coincidono.
Per la stima dall’alto è sufficiente valutare h Ψ |He | Ψ i su una funzione Ψ di norma unitaria, dato che E1
è per definizione il minimo di tale quantità . Useremo come funzione di prova
1
Ψλ (x) = cλ e− 2 λ|x| ,
con λ > 0 parametro rispetto al quale ottimizzeremo l’energia. La costante cλ serve per garantire la
normalizzazione della funzione e possiamo calcolarne il valore esplicito facilmente
Z
Z
4πc2λ ∞
8πc2
−λ|x|
2
dx e
= 3
1 = cλ
dr r2 e−r = 3 λ ,
λ
λ
R3
0
√
da cui cλ = λ3/2 / 8π. Inoltre un rapido calcolo dà
2
2 2
Z ∞
~
e2
~2 λ2 e2 λ
~ λ
e2
−
e−λr = 4πc2λ
−
dr r2
− 2 =
.
(5.18)
h Ψλ |He | Ψλ i = 4πc2λ
8me
r
4me λ λ
8me
2
0
Il valore ottimale di λ lo ricaviamo minimizzando la funzione, ovvero
λ=
2me e2
,
~2
4
che sostituito nella (5.18) dà la stima dall’alto E1 ≤ − m2~e e2 .
Per la stima dal basso usiamo la (5.19) dimostrata nel prossimo Lemma 5.4:
2
2
~
me e4
~
2
2
2
2
k∇Ψk − e k∇Ψk ≥ inf
x −e x ≥− 2 .
E1 = inf h Ψ |He | Ψ i ≥ inf
2~
kΨk=1
kΨk=1 2me
x∈R+ 2me
Lemma 5.4 (Disuguaglianza per il potenziale coulombiano).
Sia Ψ ∈ H 1 (R3 ), allora
Z
|Ψ(x)|2
dx
≤ k∇Ψk2 kΨk2 .
|x|
R3
(5.19)
Osservazione 5.5. La costante della disuguaglianza (5.19) è ottimale nel senso che se aggiungessimo un
prefattore c < 1 al membro di destra la disuguaglianza sarebbe falsa. In effetti studiando l’equazione variazionale associata alla minimizzazione del rapporto associato alla (5.19) è facile dimostrare che l’uguaglianza
è soddisfatta se e solo se Ψ(x) = Ce−c|x| con C, c > 0.
Dimostrazione. Verifichiamo la disuguaglianza per Ψ ∈ C0∞ (R3 ). L’affermazione generale si otterrà poi per
densità. Il punto di partenza è l’identità
3 D h
E X
i E
1
x 2 Ψ |x| Ψ =
Ψ ∂j , |x|j Ψ ,
D
j=1
che si verifica facilmente:
X
X
3 3
3
X
|x|2 − x2j
xj
xj
2
∂j ,
=
∂j
=
=
.
|x|
|x|
|x|2
|x|
j=1
j=1
j=1
84
Si ha quindi
3 hD
3
D E
E D
Ei
X
X
1
xj
xj xj
Ψ
=
−
2 Ψ |x|
∂
Ψ
Ψ
+
Ψ
|∂
Ψ
≤
2
Ψ
k∂
Ψk
j |x|
j
j
2 |x| |x|
j=1
2
j=1

≤ 2
3
X
1/2
1/2 
3 2
X
xj 
= 2 k∇Ψk2 kΨk2 ,
k∂j Ψk22  
|x| Ψ
j=1
j=1
2
poiché
3 Z
X
j=1
5.3
R3
dx
x2j
|Ψ(x)|2 = kΨk22 .
|x|2
Momento Angolare
Una volta caratterizzato nel dettaglio lo spettro di He e mostrata la stabilità del sistema, per completare
l’analisi dell’atomo di idrogeno resta da ricostruire gli spettri atomici di Ballmer o, più precisamente, trovare
l’energia degli stati legati (autovalori negativi) di He . Questo richiederà di sfruttare la simmetria per
rotazioni di He e diagonalizzare simultaneamente He e il momento angolare.
Introduciamo anzitutto una nuova osservabile: il momento angolare. In meccanica classica il momento
angolare di una particella libera è L = r × p. Il momento angolare in MQ sarà perciò rappresentato
dall’operatore:
L = (L1 , L2 , L3 ) = −i~r × ∇,
(5.20)
con dominio inizialmente dato dalle funzioni C0∞ (R3 ). L’operatore è chiaramente illimitato ma simmetrico.
Per il momento tralasceremo la discussione della sua autoaggiunzione anche se non è difficile dimostrare che
l’operatore (le sue tre componenti separamente) è in effetti autoaggiunto su C0∞ (R3 ). Ricaveremo il risultato
come sottoprodotto dello studio dello spettro di L.
Notiamo anzitutto una proprietà caratteristica del momento angolare: le tre componenti L1 , L2 , L3 non
commutano fra di loro.
Proposizione 5.7 (Regole di commutazione di Li e Lj ).
Per ogni Ψ ∈ C0∞ (R3 )
[Li , Lj ] Ψ = i~ijk Lk Ψ,
L2 , Li Ψ = 0,
(5.21)
per ogni i, j, k = 1, 2, 3.
Osservazione 5.6. Poiché le diverse proiezioni di L non commutano fra di loro, non ammettono rappresentazione spettrale congiunta. Per esempio non esistono autovettori comuni a Li , Lj , Lk e, per il Teorema
3.11 vale una relazione fra le dispersioni di Li e Lj , i 6= j, simile a quella che abbiamo dimostrato per le
osservabili Q e P .
Al contrario L2 = L21 + L22 + L23 commuta con ogni Li singolarmente e pertanto ammette risoluzione
spettrale congiunta con una componente di L.
Osservazione 5.7. La prima delle (5.21) è la regola di commutazione soffisfatta dai generatori delle rotazioni in R3 . Più precisamente ogni base dell’algebra di Lie dei generatori infinitesimi del gruppo delle
rotazioni SO3 soddisfa le regole di commutazione (5.21). Se ne deduce che L è proprio il generatore delle
rotazioni in R3 e, se Rα è la combinazione di tre rotazioni di angoli (α1 , α2 , α3 ) = α attorno ai rispettivi
assi, allora si ha che l’operatore
(Uα Ψ) (x) = Ψ(R−1
α x),
definisce un gruppo unitario fortemente continuo (a tre parametri) il cui generatore è L, cioè
Uα = e−iα·L .
Per maggiori dettagli si veda ad esempio [GP1, Capitolo 5].
(5.22)
85
Esercizio 5.2. Si ricavi la relazione di indeterminazione per le osservabili Li e Lj con i 6= j su una funzione
d’onda Ψ ∈ C0∞ (R3 ).
Esercizio 5.3. Si consideri la famiglia di operatori Uα = eiαL3 con dominio C0∞ (R3 ): si dimostri che Uα
implementa le rotazioni attorno al terzo asse e che Uα è un gruppo a un parametro fortemente continuo. Se
ne ricavi l’espressione del dominio di autoaggiunzione di L3 .
Dimostrazione. La dimostrazione è sostanzialmente un esercizio di algebra. Osserviamo infatti che ogni
Ψ ∈ C0∞ (R3 ) è tale che Lki Ψ ∈ C0∞ (R3 ) per ogni k. Inoltre
([Li , Lj ] Ψ) (x) = −~2
X
ilm jl0 m0 {xl ∂m [xl0 ∂m0 Ψ(x)] − xl0 ∂m0 [xl ∂m Ψ(x)]}
l,m,l0 ,m0

= −~2 

X
ilm jmm0 xl ∂m0 Ψ(x) −
l,m,m0
X
ilm jl0 l xl0 ∂m Ψ(x)
l,m,l0

= −~2 

X
δi,m0 δl,j − δi,j δl,m0 xl ∂m0 Ψ(x) −
l,m,m0
X
ilm δm,j δi,l0 − δm,l0 δi,j jl0 l xl0 ∂m Ψ(x)
l,m,l0
= −~2 (xj ∂i − xi ∂j ) Ψ(x) = iijk Lk Ψ(x).
Per dimostrare la seconda identità fissiamo i = 1 senza perdita di generalità e calcoliamo
2
L , L1 Ψ = L22 + L23 , L1 = (L2 L2 L1 − L1 L2 L2 + L3 L3 L1 − L1 L3 L3 ) Ψ
= (L2 L1 L2 − i~L2 L3 − L1 L2 L2 + L3 L1 L3 + i~L3 L2 − L1 L3 L3 ) Ψ
= [−i~ (L2 L3 + L3 L2 ) + i~ (L3 L2 + L2 L3 )] Ψ = 0.
Come già anticipato nell’Osservazione 5.6, ricordiamo che se due operatori autoaggiunti A e B commutano
su un denso appartenente ad entrambi i domini e se Ψλ è un autovettore di A all’autovalore λ non degenere,
allora Ψλ è anche autovettore di B. Più in generale se λ è autovalore di A degenere, allora esiste una base
di Hλ = ker(A − λ) di autovettori comuni a A e B.
Grazie alla (5.21) possiamo pensare di cercare degli autovettori comuni, ad esempio, di L2 e L3 . A
questo scopo consideriamo quest’ultimo operatore e ricaviamone l’espressione esplicita in coordinate polari:
siano (x1 , x2 , x3 ) ∈ R3 le coordinate cartesiane di un punto nello spazio, allora definiamo le coordinate polari
(r, ϑ, ϕ) con r ∈ R+ , ϑ ∈ [0, π) e ϕ ∈ [0, 2π) attraverso il cambio di variabili


x1 = r sin ϑ cos ϕ,
(5.23)
x2 = r sin ϑ sin ϕ,


x3 = r cos ϑ,
con trasformazione inversa

p
r = x21 +x22 + x23 ,




x
3
ϑ = arccos √ 2 2 2 ,

x1 +x2 +x3


ϕ = arctan x2 .
x1
(5.24)
Con questo cambio di coordinate rendiamo esplicito l’isomorfismo
L2 (R3 ) ' L2 (R+ , r2 dr) ⊗ L2 (Ω, sin ϑdϑdϕ),
(5.25)
dove Ω = [0, π) × [0, 2π) rappresenta l’angolo solido o equivalentemente la sfera S 2 . In altri termini esiste
un operatore unitario Upol : L2 (R3 ) −→ L2 (R+ , r2 dr) ⊗ L2 (Ω, sin ϑdϑdϕ) che implementa il cambio di
86
coordinate. Inoltre rispetto a tale isomorfismo gli operatori Li sono banali sulla prima componente dello
−1
−1
spazio di Hilbert ovvero, con un piccolo abuso di notazione, si ha Upol Li Upol
= 1 ⊗ Li , cioè Upol Li Upol
agisce
2
+
2
come l’unità su L (R , r dr). Più precisamente abbiamo le espressioni esplicite
cos ϕ −1
Upol L1 Upol
= i~ − sin ϕ ∂ϑ +
∂ϕ ,
tan ϑ sin ϕ
−1
Upol L2 Upol
= i~ − cos ϕ ∂ϑ +
∂ϕ ,
tan ϑ
−1
Upol L3 Upol
= −i~ ∂ϕ ;
(5.26)
~2
1
∂ϑ (sin ϑ∂ϑ ) +
L2 .
(5.27)
sin ϑ
sin2 ϑ 3
Si noti in particolare come in nessuno dei tre operatori compare la variabile r, il che è equivalente alla
−1
fattorizzazione Upol Li Upol
= 1 ⊗ Li di cui abbiamo già parlato. Da qui in poi, con un altro abuso di
notazione giustificato tuttavia dall’equivalenza unitaria, porremo
−1
Upol L2 Upol
= −
−1
Li := Upol Li Upol
,
−1
L2 := Upol L2 Upol
Esercizio 5.4. Si ricavino le espressioni (5.27).
Nelle nuove varibili un dominio ragionevole (ovviamente più largo di C0∞ (R3 )) di L3 è il seguente
D(L3 ) = Ψ(ϑ, ϕ) ∈ L2 (Ω, sin ϑdϑdϕ) Ψ ∈ C 1 (Ω), Ψ(ϑ, 0) = Ψ(ϑ, 2π),
(∂ϕ Ψ) (ϑ, 0) = (∂ϕ Ψ) (ϑ, 2π), ∀ϑ ∈ [0, π)} . (5.28)
L’operatore è ancora simmetrico su D(L3 ) ma non autoaggiunto. In effetti L3 su D(L3 ) non è chiuso. Vedremo però che L3 è essenzialmente autoaggiunto su tale dominio, in quanto ammette una base di autovettori
contenuti in D(L3 ):
Proposizione 5.8 (Spettro e autoaggiunzione di L3 ).
L’operatore L3 definito nella (5.27) è essenzialmente autoaggiunto sulle funzioni C 1 (0, 2π) periodiche. Inoltre
σ(L3 ) = σdisc (L3 ) = σpp (L3 ) = ~m m ∈ Z ,
(5.29)
e i corrispettivi autovettori sono dati da
1
Φm (ϑ, ϕ) = √ Φ(ϑ)eimϕ .
2π
(5.30)
Dimostrazione. Si vede immediatamente che l’equazione agli autovalori L3 Ψ = λΨ è risolta da funzioni della
forma
Ψ(ϑ, ϕ) = Φ(ϑ)eiλϕ .
Imponendo poi la condizione che Ψ ∈ D(L3 ) si ottiene la condizione
e2πiλ = 1,
e quindi λ deve essere un intero.
L’autoaggiunzione segue poi banalmente dal fatto che eimϕ m∈Z è la base di Fourier in L2 (0, 2π).
Per quanto detto in precedenza possiamo allora cercare una base comune di autovettori congiunti di L3 e
L2 . La Proposizione 5.8 ci dice che tali autovettori comuni Φλ,m devono essere della forma
1
Φλ,m (ϑ, ϕ) = √ Φλ (ϑ)eimϕ .
2π
(5.31)
Per studiare lo spettro di L2 è conveniente, come per l’oscillatore armonico, introdurre gli operatori di
salita e discesa
L± = L1 ± iL2 ,
(5.32)
che hanno le seguenti proprietà:
87
Proposizione 5.9 (Proprietà di L± ).
Gli operatori L± definiti nella (5.32) soddisfano le seguenti identità: per ogni Ψ ∈ C0∞ (R3 ),
i) L∗± Ψ = L∓ Ψ;
ii) [L3 , L± ] Ψ = ±~L± Ψ;
iii) L2 Ψ = L+ L− + L23 − ~L3 Ψ = L− L+ + L23 + ~L3 Ψ.
Dimostrazione. Tutte e tre le identità sono conseguenze algebriche della regola di commutazione (5.21).
Lasciamo perciò la dimostrazione come esercizio al lettore.
Corollario 5.3 (Operatori di salita e discesa).
Se Φλ,m è un autovettore congiunto normalizzato di L2 e L3 , con autovalori λ e m, e λ > ~2 (m2 ± m),
allora L± Φλ,m è un autovettore congiunto di L2 e L3 agli autovalori rispettivamente λ e ~(m ± 1).
Dimostrazione. Grazie alla prima delle proprietà elencate nella Proposizione 5.9 si ha
L3 L± Φλ,m = (L± L3 ± ~L± ) Φλ,m = ~ (m ± 1) L± Φλ,m ,
per cui resta solo da verificare che L± Φλ,m non sia nullo. Ma dalla prima e dall’ultima delle proprietà
abbiamo
kL± Φλ,m k2 = hΦλ,m |L∓ L± Φλ,m i = λ2 − ~2 m2 ± 1 ,
da cui la condizione su λ.
Con le informazioni fin qui ricavate possiamo caratterizzare completamente lo spettro congiunto di L2 e L3 .
Proposizione 5.10 (Spettro di L2 ).
Si ha
σ(L2 ) = σdisc (L2 ) = σpp (L2 ) = ~2 `(` + 1) ` ∈ N ∪ {0} .
(5.33)
Inoltre se Y`,m (ϑ, ϕ) è un autovettore congiunto di L2 e L3 agli autovalori rispettivamente ~2 `(` + 1) e ~m,
allora −` ≤ m ≤ `. Infine le autofunzioni congiunte sono esplicitamente date dalle armoniche sferiche
s
m+|m|
1
(2` + 1)(` − |m|)! |m|
Y`,m (ϑ, ϕ) = √ (−1) 2
P` (cos ϑ)eimϕ .
(5.34)
2(` + |m|)!
2π
Osservazione 5.8.
P Dalla Proposizione 5.10 si ricava immediatamente che la degenerazione degli autovalori
di L2 è data da `m=−` = 2` + 1. In particolare l’autovalore ` = 0 (onda s) non è degenere, mentre ` = 1
(onda p) è tre volte degenere.
Osservazione 5.9. Nella (5.34) compaiono i polinomi di Legendre generalizzati P`m (t), t ∈ [−1, 1], che sono
definiti in termini dei polinomi di Legendre P` (t) dalla
m
P`m (t) = (1 − t2 ) 2
dm
P` (t).
dtm
(5.35)
I polinomi di Legendre sono invece definiti come
P` (t) =
1 d`
(1 − t2 )` .
2` `! dt`
Per maggiori informazioni sui polinomi speciali si veda [AS, Capitolo 22].
(5.36)
88
Dimostrazione. La condizione λ > ~2 m(m ± 1) ereditata dal Corollario 5.3 si può leggere più facilmente se
poniamo λ = ~2 `(` + 1) con
q
` = − 12 + 12 1 + 4λ
≥ 0,
~2
poiché λ ≥ 0. In tal caso infatti si ha `(` + 1) > m(m ± 1) o equivalentemente
m±
1 2
2
< `+
1 2
,
2
da cui ricaviamo immediatamente −` ≤ m ≤ `.
A questo punto ricordiamo che m ∈ Z e dimostriamo che ` ∈ N ∪ {0} per assurdo: supponiamo infatti
che cosı̀ non sia, allora, fissato −` ≤ m ≤ `, deve esistere un k ∈ N tale che
m + k < ` < m + k + 1,
ma allora poiché per m + k la condizione è soddisfatta potremmo applicare L+ e generare un altro autostato
di L2 e L3 : sia Y`,m+k l’autovettore relativo agli autovalori ~2 `(` + 1) e ~(m + k), allora L+ Y`,m+k sarebbe
autovettore di L3 all’autovalore ~(m + k + 1), dato che
kL+ Y`,m+k k2 = ~2 (`(` + 1) − (m + k)(m + k + 1)) > 0
ma poiché m + k + 1 > ` questo è impossibile.
Prima di concludere la discussione degli operatori L2 , L3 , vediamo alcuni casi semplici di armoniche sferiche.
Come già anticipato lo stato ` = 0 (onda s) è non degenere e la relativa autofunzione è
1
Y0,0 = √ ,
4π
cioè la funzione costante. Per ` = 1 (onda p) si hanno invece tre autofunzioni
r
r
3
3
Y1,0 (ϑ) =
cos ϑ,
Y1,±1 (ϑ, ϕ) =
cos ϑe±iϕ .
4π
4π
(5.37)
(5.38)
Diamo infine un risultato di cui ometteremo la dimostrazione:
Proposizione 5.11 (Completezza delle armoniche sferiche).
Le armoniche sferiche {Y`,m }`∈N∪{0},−`≤m≤` formano un s.o.n.c. in L2 (Ω, sin ϑdϑdϕ).
Corollario 5.4 (Autoaggiunzione di L2 , L3 ).
Gli operatori L2 e Li sono essenzialmente autoaggiunti su C0∞ (R3 ). L’operatore L3 è inoltre essenzialmente
autoaggiunto anche su D(L3 ) definito nella (5.28).
Dimostrazione. Il risultato per L2 e Li in L2 (R3 ) segue dall’isomorfismo (5.25), dalla completezza delle
armoniche sferiche in L2 (Ω, sin ϑdϑdϕ) e infine dal fatto che si possa costruire una base di L2 (R3 ) della
forma χn (r)Y`,m (ϑ, ϕ) con χn ∈ C0∞ (R+ ) (densità di C0∞ in L2 ).
Analogamente la completezza delle armoniche sferiche e il fatto che Y`,m ∈ D(L3 ), per ogni `, m, implica
l’essenziale autoaggiunzione di L3 su D(L3 ).
5.4
Stati Legati
Una delle proprietà più rilevanti di He è l’invarianza per rotazioni. Infatti è facile verificare che
2
L , He = [Li , He ] = 0,
(5.39)
89
per lo meno sul denso delle funzioni regolari a supporto compatto. In ogni caso grazie alla proprietà
precedente possiamo cercare gli autovettori comuni di He , L2 e L3 : usando il cambio di variabili dalle
coordinate cartesiane a quelle polari si ha
−1
Upol (−∆) Upol
=−
1
1
1
∂r r 2 ∂r − 2
∂ϑ (sin ϑ∂ϑ ) − 2 2 ∂ϕ2 ,
2
r
r sin ϑ
r sin ϑ
(5.40)
dove Upol è l’unitario che realizza l’isomorfismo (5.25). Pertanto abbiamo anche che
−1
Upol He Upol
=−
~2
L2
e2
∂r r 2 ∂r +
− .
2
2
2me r
2me r
r
(5.41)
Questo suggerisce che gli autovettori congiunti di He , L2 e L3 abbiano la forma
RE,` (r)Y`,m (ϑ, ϕ),
(5.42)
con RE,` (r) soluzione del problema radiale
−
~2 `(` + 1)
e2
~2
2
∂
r
∂
R
+
R
−
RE,` = ERE,` ,
r
r E,`
E,`
2me r2
2me r2
r
normalizzata in modo tale che
Z
∞
(5.43)
dr r2 |RE,` (r)|2 = 1.
0
2
Per risolvere l’equazione è conveniente introdurre una variabile adimensionale x = r/a con a = m~e e2
raggio di Bohr e definire
Sη,` (y) = a3/2 y Re2 η/a,` (ay),
(5.44)
con η = aE/e2 , cosı̀ che la (5.43) diventa
`(` + 1)
1 00
1
+
(h` Sη,` ) (x) = − Sη,`
Sη,` − Sη,` = ηSη,` ,
2
2
2x
x
con x ∈ (0, ∞), η < 0 e
Z
∞
(5.45)
dx |Sη,` (x)|2 = 1.
0
Fin’ora non abbiamo detto nulla riguardo al dominio dell’operatore ma per semplicità continueremo ad
assumerlo definito su C0∞ (R+ ): si noti che anche nel caso in cui il limite all’origine di RE,` sia non nullo,
che è ammissibile per ` = 0, Sη,` tende in ogni caso a 0 quando x → 0. Quindi per essere maggiormente
precisi dovremmo scegliere come dominio le funzioni in H02 (R+ ), cioè lo spazio delle funzioni C 1 (R+ ) che
ammettono derivata seconda in senso debole quadrato sommabile e si annullano quando x → 0.
Per trovare gli autovalori η usiamo ancora una volta il trucco di introdurre operatori di salita e discesa:
definiamo perciò
1
`+1
1
A±,` = √
±∂x +
−
.
(5.46)
x
`+1
2
Le proprietà di A±,` sono raccolte nella prossima Proposizione, la cui dimostrazione è lasciata per esercizio.
Proposizione 5.12 (Proprietà di A±,` ).
Gli operatori A±,` definiti nella (5.46) soddisfano le seguenti identità: per ogni Ψ ∈ H02 (R+ ),
i) A∗±,` Ψ = A∓,` Ψ;
ii) [h` , A±,` ] Ψ = ±A±,` Ψ;
1
Ψ;
iii) h` Ψ = A−,` A+,` − 2(`+1)
2
90
iv) h`+1 Ψ = A+,` A−,` −
1
2(`+1)2
Ψ.
Corollario 5.5 (Operatori di salita e discesa).
Se Sη,` è un autovettore congiunto normalizzato di h` e L2 , con autovalori η e ~2 `(` + 1), allora
1
• se η > − 2(`+1)
2 , A+,` Sη,` è autovettore di h`+1 all’autovalore η;
• se η > − 2`12 e ` > 0, A−,` Sη,` è un autovettore di h`−1 all’autovalore η.
Dimostrazione. Analogamente al Corollario 5.3 i risultati sono conseguenza diretta delle proprietà elencate
1
nella Proposizione 5.12. In particolare la condizione η > − 2(`+1)
2 segue dall’identità
kA+,` Sη,` k2 = η +
1
,
2(` + 1)2
da cui la condizione su η. Il caso di A−,` è del tutto analogo.
Abbiamo ora tutti gli ingredienti necessari a dimostrare il risultato più importante di questa Sezione:
Teorema 5.2 (Stati legati di He ).
Gli autovalori negativi di He sono dati da
En = −
me e4
,
2~2 n2
n ∈ N.
(5.47)
Le relative autofunzioni normalizzate sono
n ∈ N,
Ψn,`,m (r) = Rn,` (r)Y`,m (ϑ, ϕ),
` = 0, . . . , n − 1,
dove Y`,m sono le armoniche sferiche (5.34) e
s
1 (n − ` − 1)! 2r `+1 2`+1
Rn,` (r) = −
Ln+`
n
[(n + `)!]3
n
2r
n
m = −`, . . . , `,
n ro
exp −
.
n
(5.48)
(5.49)
Osservazione 5.10. Gli stati legati di He sono dunque infiniti e accumulano a 0 quando n → ∞, come
avevamo già dimostrato nella Sezione precedente. Le corrispondenti autofunzioni formano un s.o.n.. Naturalmente il sistema non può essere completo in L2 (R3 ) perché c’è una parte non vuota di σ(He ) – lo spettro
essenziale σess (He ) – il cui proiettore spettrale è ortogonale allo span delle (5.48).
Osservazione 5.11. Lo stato legato n-esimo è degenere e la sua degenerazione è data da
n−1
X
(2` + 1) = n2 .
(5.50)
`=0
Osservazione 5.12. Nella (5.49) compaiono i polinomi di Laguerre generalizzati Ljk : il polinomio di
Laguerre di ordine k ≥ 0 è definito come
Lk (x) = ex
dk k −x x e
,
dxk
(5.51)
con x ∈ (0, ∞), mentre quello generalizzato di indici k e 0 ≤ j ≤ k è
Ljk (x) = (−1)j
k!
dk−j x−j ex k−j xk e−x .
(k − j)!
dx
Per ulteriori informazioni si consulti ancora [AS, Capitolo 22].
(5.52)
91
Osservazione 5.13. L’energia dello stato legato n-esimo è indipendente da `. In generale avremmo dovuto
aspettarci una dipendenza anche da ` ma il fatto che non compaia è una conseguenza delle special proprietà
di simmetria dell’atomo di idrogeno (integrabilità).
Osservazione 5.14. L’autofunzione relativa allo stato fondamentale E1 l’abbiamo già ricavata nella (5.17).
Notiamo qui che essa coincide con l’espressione generale (5.48), ovvero
Ψ1,0,0 (r) = √
r
1
e− a .
3/2
πa
La probabilità di trovare l’elettrone nella corona sferica compresa fra r1 e r2 > r1 è
Z r2
Z r2
4
4r2 − 2r
2 − 2r
a
dr
r
e
e a.
=
dr
P
(r),
P
(r)
=
a 3 r1
a3
r1
(5.53)
La densità di probabilità P (r) ha un massimo per r = a e quindi possiamo concludere che l’idea che l’elettrone
orbiti a distanza a dal nucleo, su cui è fondato il modello atomico di Bohr possa essere considerata una buona
approssimazione della realtà.
Osservazione 5.15. Gli stati legati (5.47) riproducono perfettamente le regole empiriche di Ballmer per
gli spettri atomici: le energie di assorbimento o emissione sono tutte date dalle differenze fra due livelli
energetici e, quando si verifica uno dei due fenomeni di emissione o assorbimento, l’elettrone salta da un
livello all’altro cosı̀ cedendo o assorbendo energia.
Inoltre i livelli (5.47) coincidono con quelli ottenuti da Bohr con il suo modello empirico. Va però detto
che risulta evidente dalle proprietà degli En e, in particolare, dalla degenerazione, che la regola di quantizzazione di Bohr è sbagliata: fissato il livello n-esimo il momento angolare (in effetti la terza componente del
momento angolare) non è esattamente1 ~(n − 1) ma piuttosto ~m con m = −`, . . . , ` e ` = 0, . . . , n − 1.
Dimostrazione. La prima parte della dimostrazione è analoga alla dimostrazione della Proposizione 5.10:
poniamo anzitutto per convenienza η = − 2γ1 2 , con γ ∈ R+ , cosı̀ che le condizioni che compaiono nel Corollario
5.5 si leggono
` + 1 ≤ γ.
(5.54)
Se γ ∈ N non c’è altro da dimostrare ma si può far vedere che se cosı̀ non fosse si cadrebbe in contraddizione,
di nuovo seguendo la stessa strategia della dimostrazione della Proposizione 5.10. Omettiamo i dettagli per
brevità.
Per quanto riguarda la derivazione delle autofunzioni radiali osserviamo che se ` = n − 1 l’equazione per
Sn,n−1 (con un piccolo abuso di notazione chiamiamo Sn,` := Sη,` con η = − 2n1 2 ) diventa
n(n − 1)
1 00
1
1
− Sn,n−1
+
Sn,n−1 − Sn,n−1 = − 2 Sn,n−1 ,
2
2
2x
x
2n
che è risolta da
x
Sn,n−1 (x) = cn xx e− n ,
con la costante cn fissata dalla normalizzazione in L2 della funzione, che dà
n+ 1
2
2
cn = p
.
(2n)! n
1
La altre autofunzioni sono ottenute applicando ripetutamente a Sn,n−1 l’operatore di discesa A− e
rinormalizzando a ogni passo lo stato ottenuto.
Chiudiamo la Sezione lasciando alcuni esercizi al lettore:
1
In effetti la condizione di quantizzazione di Bohr darebbe ~n ma con n ∈ N ∪ {0}, per cui per paragonarla con quanto
abbiamo trovato dobbiamo rimpiazzare n con n − 1.
92
Esercizio 5.5. Si trovi il valor medio della distanza dal nucleo nello stato Ψ1,0,0 . Si ricavi la distribuzione
di probabilità radiale dell’elettrone nello stato Ψ2,1,0 (onda p). Si trovi il punto di massima probabilità e il
valor medio della distanza dal nucleo.
Esercizio 5.6. Si calcoli il potenziale elettrostatico generato dall’atomo di idrogeno (nucleo incluso) negli
stati Ψ1,0,0 e Ψ2,0,0 .
Esercizio 5.7. Si consideri in L2 (R6 ) l’Hamiltoniana dell’atomo di elio in unità naturali
HHe = −∆1 − ∆2 −
2
2
1
−
+
.
|x1 | |x2 | |x1 − x2 |
Si trovi il dominio di autoaggiunzione di HHe . Si ricavino inoltre una stima dall’alto e una dal basso (non
coincidenti) per inf σ(HHe ). [Suggerimento: per la stima dall’alto si usi uno stato prodotto Ψλ (x1 )Ψλ (x2 )
con Ψλ una funzione di prova analoga a quella usata nella dimostrazione della Proposizione 5.6].
Parte II
Stato Fondamentale e Stati Legati
93
94
Un problema tipico in MQ è la ricerca dello stato fondamentale o stato a minima energia di un sistema
quantistico. Come si intuisce già dai termini usati, tale problema ammette una naturale formulazione nell’ambito del calcolo delle variazioni: trovare lo stato a minima energia equivale a minimizzare un opportuno
funzionale – l’aspettazione dell’Hamiltoniana del sistema – sulla varietà delle funzioni d’onda normalizzate.
Le motivazioni fisiche che rendono il problema dello stato fondamentale cosı̀ importante in MQ sono
molteplici. Ne menzioneremo due fra le più significative.
La prima ragione è sostanzialmente legata alla stabilità della materia, di cui torneremo a parlare in maggiore
dettaglio nell’ultima parte del corso: poiché i sistemi fisici tendono a rilasciare energia scambiandola con il
mondo esterno, gli stati a bassa energia e in particolare quello fondamentale hanno una probabilità maggiore di essere osservati. In altri termini ogni sistema non perfettamente isolato dal resto dell’universo, in
un tempo sufficientemente lungo, tenderà a occupare il suo stato a minima energia. In quest’ottica è chiaro
come una questione fondamentale sia la limitatezza dal basso dell’energia dello stato fondamentale: se per
assurdo un sistema fisico potesse raggiungere stati a energia arbitrariamente bassa, tenderebbe a rilasciare
energia fino a collassare su se stesso. Da un punto di vista dinamico quindi si può anche vedere l’instabilità
o l’illimitatezza dal basso dell’energia come una singolarità che impedisce alla dinamica di essere definita
per tutti i tempi. A livello operatoriale si può leggere questo aspetto nella relazione fra illimitatezza dal
basso e non autoaggiunzione dell’Hamiltoniana.
In secondo luogo è naturalmente importante sapere quanta energia può rilasciare un sistema fisico e questo è chiaramente connesso con la più bassa energia raggiungibile dal sistema, ovvero quella dello stato
fondamentale. Infatti se per assurdo esistesse un sistema fisico in natura la cui energia potesse essere resa arbitrariamente bassa, si potrebbe costruire un motore perfetto estraendo da esso energia all’infinito.
Naturalmente questo non è possibile e tutti i sistemi fisici realistici sono stabili.
Una volta che si sia dimostrata la stabilità del sistema è poi naturale chiedersi se l’energia più bassa
possa essere in effetti raggiunta o se invece sia un punto di accumulazione dello spettro dell’Hamiltoniana. In
termini variazionali questo equivale a chiedersi se l’inf del funzionale sia in effetti un minimo e sia raggiunto
su una qualche funzione d’onda. Nota l’esistenza, diventa interessante discutere l’unicità e poi passare dallo
stato fondamentale agli stati eccitati o stati legati, cioè gli autostati negativi dell’energia.
Riassumendo, le questioni che affronteremo in questa parte del corso sono quindi
• la limitatezza dal basso dell’energia dello stato fondamentale (stabilità);
• l’esistenza dello stato fondamentale;
• l’unicità dello stato fondamentale;
• le proprietà degli stati legati.
Capitolo 6
Stato Fondamentale
In questa parte del corso prenderemo in considerazione sistemi quantistici descritti da Hamiltoniane della
forma
H = −∆ + V (x),
(6.1)
con x ∈ Rd . Sceglieremo perciò unità di misura naturali ~ = c = 1 e m = 1/2, per semplificare la
discussione. Si noti che la dimensione dello spazio non sarà vincolata a essere 1, 2 o 3, ma potrà essere
d > 3, nella prospettiva di applicare i risultati ottenuti ai sistemi a molti corpi. Inoltre assumeremo sempre
implicitamente che H sia autoaggiunta ma, da un certo punto di vista, la discussione contenuta in questo
Capitolo si può applicare anche a operatori simmetrici ma non autoaggiunti.
Definizione 6.1 (Stato fondamentale).
Dato un sistema quantistico con Hamiltoniana H, l’energia dello stato fondamentale è
E0 = inf σ(H) =
inf
h Ψ |H| Ψ i .
(6.2)
Ψ∈D(H),kΨk=1
Chiameremo stato fondamentale una qualunque funzione d’onda Ψ0 normalizzata tale che
E0 = h Ψ0 |H| Ψ0 i .
(6.3)
Per semplicità nel seguito useremo anche il funzionale dell’energia E : L2 (Rd ) → R definito come il valor
medio di H sullo stato Ψ, cioè
E[Ψ] = h Ψ |H| Ψ i .
(6.4)
Porremo inoltre
E[Ψ] = T [Ψ] + V [Ψ],
T [Ψ] = h Ψ |−∆| Ψ i ,
V [Ψ] = h Ψ |V | Ψ i ,
(6.5)
dove T è l’energia cinetica e V l’energia potenziale del sistema. Equivalentemente si può anche scrivere
Z
T [Ψ] =
dx |∇Ψ|2 .
(6.6)
Rd
6.1
Stabilità di Prima Specie
La questione più rilevante che affronteremo in questo Capitolo è quella della stabilità o, equivalentemente,
della limitatezza dal basso dell’energia:
Definizione 6.2 (Stabilità di prima specie).
Diciamo che un sistema quantistico è stabile di prima specie se E0 > −∞.
95
96
Dal punto di vista matematico è chiaro che, affinché un sistema sia stabile, è necessario che il potenziale
non sia troppo negativo, o, in altri termini, che la sua parte negativa sia dominata dall’energia cinetica.
Definiamo quindi la parte positiva V+ ≥ 0 e negativa V− ≥ 0 del potenziale nel modo seguente
V (x) = V+ (x) − V− (x),
V+ = max {V, 0} ,
V− = − min {V, 0} ,
(6.7)
perché ci torneranno utili nel seguito.
Tornando al problema della stabilità si potrebbe pensare che sia un falso problema, ovvero che tutte le
Hamiltoniane della forma (6.1) siano stabili. Il prossimo Esempio mostra che cosı̀ non è.
Esempio 6.1 (Instabilità per potenziali specifici)
Si consideri l’operatore di Schrödinger
−∆ −
1
|x|3
in Rd . Mostriamo che E0 = −∞.
A tale scopo è sufficiente mostrare l’esistenza di una successione di Ψn (x) ∈ C0∞ (Rd ) tale che
kΨn k = 1,
lim E[Ψn ] = −∞.
n→∞
(6.8)
Prendiamo allora Ψn (x) = nd/2 Ψ(nx) con Ψ ∈ C0∞ (Rd ) e calcoliamo
kΨn k = kΨk,
T [Ψn ] = n2 T [Ψ],
V [Ψn ] = n3 V [Ψ].
Per cui se scegliamo Ψ normalizzata tale che V [Ψ] < 0, cosa che è sempre possibile, allora la (6.8) è
immediatamente verificata:
E[Ψn ] = n2 T [Ψ] + n3 V [Ψ] −→ −∞.
n→∞
C
1
Esercizio 6.1. Dimostrare l’instabilità nei casi in cui V (x) = − |x|
α con α > 2 oppure α = 2 e C > 4 .
Il risultato principale di questo Capitolo è il seguente
Teorema 6.1 (Stabilità di prima specie).
Sia V reale e
 d
d
∞
d

L 2 (R ) + L (R ),
V− ∈ L1+ε (R2 ) + L∞ (R2 ),

 1
L (R) + L∞ (R),
se d ≥ 3,
se d = 2,
se d = 1,
(6.9)
allora E0 > −∞. Inoltre ∃C, D < +∞ tali che, per ogni Ψ ∈ H 1 (Rd ),
T [Ψ] ≤ CE[Ψ] + DkΨk.
(6.10)
Osservazione 6.1. In dimensione 1 il potenziale può anche contenere un termine di misura e il risultato
continua ad essere valido: se
Z
V [Ψ] =
dµ(x) |Ψ(x)|2 ,
R
con µ misura di Borel limitata, allora E0 > −∞. Naturalmente si possono aggiungere anche altri termini
della forma L1 + L∞ . Un esempio particolarmente significativo è quello della delta di Dirac δ(x), cioè la
misura concentrata in x = 0.
Osservazione 6.2. Dalla dimostrazione è facile vedere che, assumendo che V = V− , si ricava come
sottoprodotto la disuguaglianza
(6.11)
|V [Ψ]| ≤ 21 T [Ψ] + D kΨk22 ,
97
per una qualche D < +∞. L’aspetto di questa disuguaglianza ricorda da molto vicino la definizione di piccola
perturbazione o piccolezza nel senso di Kato (Definizione 3.25), con la differenza che la prima è scritta per le
aspettazioni degli operatori mentre la seconda vale per le norme. Nonostante questa differenza tuttavia le due
condizioni sono equivalenti nel senso che entrambe garantiscono l’autoaggiunzione dell’operatore −∆ + V :
nel caso della disuguaglianza (6.11) questo è precisamente il contenuto del Teorema KLMN [RS2, Teorema
X.17]. Pertanto, nel caso in cui le condizioni (6.9) siano soddisfatte dall’intero potenziale V , l’Hamiltoniana
non è solo limitata dal basso ma anche autoaggiunta su H 2 (Rd ).
Esercizio 6.2. Riprodurre la dimostrazione in d = 1, 2.
Dimostrazione. Per semplicità discuteremo esplicitamente solo il caso d = 3. Partiremo dalla ovvia stima
dal basso
E[Ψ] ≥ T [Ψ] − V− [Ψ].
3
3
Osserviamo che se V− ∈ L 2 + L∞ vuol dire che possiamo scrivere V− = V1 + V2 con V1 ∈ L 2 (R3 ) e
V2 ∈ L∞ (R3 ). Inoltre possiamo sempre scegliere la norma 3/2 di V1 arbitrariamente piccola: fissiamo K > 0
grande, allora decomponendo
V1 (x) = V1 (x)1{|V1 |≤K} + V1 (x)1{|V1 |>K} ,
abbiamo che il primo termine al membro di destra è ovviamente in L∞ (R3 ) mentre il secondo tende a 0
quando K → ∞, poiché
V1 1{|V |>K} ≤ K −1/2 kV1 k3/2 −→ 0.
1
3/2
1
K→∞
Infatti |V1 |1{|V1 |>K} è una funzione positiva monotona decrescente in K, il cui integrale si annulla nel limite.
Quindi la funzione deve tendere a 0 quasi ovunque ma anche puntualmente per monotonia. Inoltre poiché
3/2
per ipotesi V1 è integrabile, la norma L3/2 di V1 1{|V1 |>K} deve tendere a 0 quando K → ∞. In conclusione
possiamo trovare una decomposizione V− = V1 + V2 con V2 ∈ L∞ (R3 ) e
kV1 k3/2 ≤ 21 S3 ,
con S3 la costante che compare nella disuguaglianza di Sobolev (6.13).
A questo punto stimiamo via Hölder con p = 3 e q = 3/2
Z
1/3
6
V1 [Ψ] ≤ kV1 k3/2
dx |Ψ|
≤ 12 S3 kΨk26 ≤ 12 T [Ψ],
R3
dove abbiamo usato la (6.13) contenuta nel prossimo Lemma 6.1. Per l’intero V− abbiamo allora
V− [Ψ] = V1 [Ψ] + V2 [Ψ] ≤ 12 T [Ψ] + kV2 k∞ kΨk22 ,
(6.12)
che combinata con la stima di partenza implica
E[Ψ] ≥ 21 T [Ψ] − kV2 k∞ kΨk22 ,
ovvero la (6.10), ma anche il fatto che
E0 = inf E[Ψ] ≥ inf
kΨk=1
kΨk=1
− kV2 k∞ kΨk22 = − kV2 k∞ > −∞.
Lemma 6.1 (Disuguaglianze di Sobolev ottimali).
Esistono delle costanti Sd , S2,p > 0 tali che per ogni Ψ ∈ H 1 (Rd )
k∇Ψk22 ≥ Sd kΨk22d ,
in d ≥ 3,
(6.13)
in d = 2 e ∀2 ≤ p < ∞,
(6.14)
in d = 1.
(6.15)
d−2
k∇Ψk22 + kΨk22 ≥ S2,p kΨk2p ,
k∇Ψk22 + kΨk22 ≥ 2 kΨk2∞ ,
98
Ometteremo la dimostrazione delle disuguaglianze di Sobolev per brevità, ma il lettore interessato può
trovarne la discussione dettagliata, ad esempio, in [LL, Capitolo 8]. tTuttavia prima di procedere oltre,
vediamo come disuguaglianze simili a quelle nell’enunciato del Lemma 6.1, ma non ottimali, si possano
ottenere sfruttando le proprietà della trasfromata di Fourier. Più precisamente mostriamo come ricavare in
d ≥ 3 una disuguaglianza simile alla (6.13) ma con un p leggermente peggiore.
Scegliamo ad esempio p = 2(d−ε)
d−2 e ε > 0 un numero arbitrariamente piccolo. Usiamo anzitutto la
disuguaglianza di Hausdorff-Young (Teorema 3.7):
2
kΨk22(d−ε) ≤ C Ψ̂ 2(d−ε) .
(6.16)
d+2−ε
d−2
Si noti che la condizione 2 ≤ 2(d−ε)
d−2 ≤ ∞ necessaria per applicare Hausdorff-Young è automaticamente
soddisfatta in quanto equivalente alle disuguaglianze d − 2 ≤ d ≤ ∞.
d−ε
e q = d+2−2ε
A questo punto applichiamo Hölder al membro di destra con esponenti p = d+2−2ε
2−ε :
2
Ψ̂ 2(d−ε) =
d+2−ε
Z
Rd
2(d−ε)
dk Ψ̂(k) d+2−ε
d+2−ε
Z
d−ε
=
2
dk (k + 1)
d−ε
− d+2−ε
Rd
Z
≤C
Rd
h
d−ε
2 i d+2−ε
(k + 1)Ψ̂(k)
2
2
dk (k 2 + 1)Ψ̂(k)
Z
dk
Rd
d+2−ε
d−ε
! 2−ε
d−ε
1
d−ε
,
(k 2 + 1) 2−ε
2(d−ε)
d−ε
ma la funzione (k 2 + 1)− 2−ε è certamente integrabile per k finito e quando |k| → ∞ è asintotica a k − 2−ε .
Considerato che la misura in d dimensioni produce un fattore k d−1 , l’integranda si comporta in R+ per k
grande come k alla potenza
−
2(d − ε)
+ d − 1 = −1 − (d − 1)ε + O(ε2 ) < −1,
2−ε
per ε sufficientemente piccolo, ed è perciò integrabile su tutta la semiretta. Ne concludiamo che ∃Cε < +∞
tale che
kΨk22(d−ε) ≤ Cε kΨk2H 1 (Rd ) .
d−2
La disuguaglianza cosı̀ ottenuta non è della forma (6.13) a causa della presenza della norma H 1 anziché
della norma L2 del gradiente di Ψ . Tuttavia è sufficiente sfruttare le proprietà di scaling delle due norme (si
applichi la disuguaglianza a Ψλ (x) = λd/2 Ψ(λx)) per ottenere che il coefficiente del termine L2 può essere
reso piccolo a piacere, cioè per ogni δ > 0 esiste Cε,δ < +∞ tale che
kΨk22(d−ε) ≤ Cε,δ k∇Ψk22 + δ kΨk22 .
d−2
6.2
Esistenza dello Stato Fondamentale
Nella Sezione precedente abbiamo visto che sotto ipotesi ragionevoli sulla parte negativa del potenziale
l’energia dello stato fondamentale dell’operatore di Schrödinger −∆ + V è limitata dal basso e quindi il
sistema è stabile. Viene a questo punto naturale chiedersi se tale energia sia raggiunta su uno stato Ψ0 , cioè
se l’inf sia in realtà un minimo ed esista quindi un minimizzatore. Premettiamo una utile
Definizione 6.3 (Succesione minimizzante).
Diciamo che una successione {Ψn }n∈N in L2 (Rd ) è minimizzante per E[Ψ], se kΨn k2 = 1 e
lim E[Ψn ] = E0 = inf E[Ψ].
n→∞
kΨk=1
(6.17)
99
L’esistenza di una successione minimizzante è naturalmente garantita ogni volta che E0 > −∞. La questione
è se tale successione possa convergere e soprattutto in quale topologia.
Vediamo come si procederebbe in dimensione finita: supponiamo che la funzione E[x] (l’analogo del
funzionale E[Ψ]) per x ∈ X compatto, sia continua. Allora l’inf x∈X E[x] = E0 è sicuramente limitato dal
basso. Poi data una successione minimizzante, cioè tale che E[xn ] → E0 = inf x∈X E[x], che ovviamente esiste
sempre, si avrebbe che xn converge per compattezza a un punto x0 ∈ X e, per continuità della funzione,
E[x0 ] = limn→∞ E[xn ] = E0 , cioè x0 è un punto di minimo. Le due ipotesi cruciali per ottenere il risultato,
come si vede facilmente, sono la continuità della funzione e la compattezza dello spazio.
Sfortunatamente in dimensione infinita nessuna delle due tipicamente è vera. Da un lato si sarebbe
portati a considerare una topologia forte che renda il funzionale continuo, ad esempio H 1 (Rd ), ma in questo si perde immediatamente la compattezza dello spazio. In effetti questa seconda richiesta è quella più
problematica, perché nessuno spazio di Hilbert Lp è compatto nella norma relativa. Non solo ma nemmeno
la varietà su cui si minimizza, kΨk = 1, cioè la sfera unitaria in L2 (Rd ), è compatta nella norma L2 (Rd ).
La soluzione di questo problema starà ovviamente nell’indebolimento della topologia considerata: vedremo
infatti che la sfera unitaria in L2 (Rd ) è in effetti compatta nella topologia debole. Questo naturlemente
richiederà di verificare la continuità (semicontinuità) del funzionale E[Ψ] rispetto a tale topologia.
L’esistenza dello stato fondamentale Ψ0 è inoltre direttamente collegata con un’altro problema
interessante, ovvero l’esistenza di una soluzione dell’equazione di Schrödinger
− ∆Ψ + V Ψ = E0 Ψ,
(6.18)
o, in altri termini, il problema all’autovalore minimo per l’operatore −∆ + V . Il legame fra i due problemi
è dato dal semplice fatto che l’equazione (6.18) è in realtà l’equazione di Eulero-Lagrange per il funzionale
E[Ψ]: per convincersene è sufficiente calcolare per Φ ∈ C0∞ (Rd ) reale, assumendo che esista Ψ0 ,
E[Ψ0 + εΦ] − E0 kΨ0 + εΦk22
ε→0
ε
Z
o
n
1
= lim
dx 2ε< (∇Ψ∗0 · ∇Φ) + ε2 |∇Φ|2 + 2ε< (V Ψ∗0 Φ) + ε2 V |Φ|2 − 2εE0 < (Ψ∗0 Φ) − ε2 E0 |Φ|2
ε→0 ε Rd
Z
= 2<
dx Ψ∗0 {−∆Φ + V Φ − E0 Φ} .
0 = lim
Rd
Rimpiazzando Φ con iΦ si dimostra poi che anche che la parte immaginaria di tale quantità deve annullarsi.
Quindi, se Ψ0 è lo stato fondamentale, allora deve risolvere (6.18) in senso debole, in quanto punto critico
(in particolare minimo assoluto) del funzionale E[Ψ] sulla varietà kΨk = 11 . Ricordiamo infatti che se H è
un operatore differenziale simmetrico, Ψ soddisfa l’equazione differenziale HΨ = 0 in senso debole se, per
ogni Φ ∈ C0∞ (Rd ), vale
Z
dx Ψ∗ (x) (HΦ) (x) = 0.
Rd
A questo punto possiamo formulare il risultato principale di questo Capitolo
Teorema 6.2 (Esistenza dello stato fondamentale).
Sia V reale, tale che per ogni a > 0, |{x ∈ Rd | |V (x)| > a}| < +∞ e
 d
d
∞
d

se d ≥ 3,
L 2 (R ) + L (R ),
1+ε
2
∞
2
V ∈ L (R ) + L (R ), se d = 2,

 1
L (R) + L∞ (R),
se d = 1,
(6.19)
allora −∞ < E0 ≤ 0 e, se E0 < 0, ∃Ψ0 ∈ H 1 (Rd ) con kΨ0 k = 1 tale che E[Ψ0 ] = E0 . Inoltre Ψ0 soddisfa
l’equazione di Schrödinger (6.18) in senso debole.
1
Abbiamo implicitamente usato il teorema dei moltiplicatori di Lagrange per minimizzare sulla varietà kΨk = 1, ovvero
abbiamo considerato la minimizzazione non vincolata di E[Ψ] − λkΨk, con λ ∈ R moltiplicatore di Lagrange. Nel caso del
minimo assoluto si vede immediatamente che λ = E0 .
100
Osservazione 6.3. Ci si potrebbe chiedere come mai la dimostrazione non fornisca automaticamente anche
l’unicità dello stato fondamentale. Il motivo sostanziale è che Ψ0 potrebbe in astratto dipendere dalla scelta
della successione debolmente convergente.
Osservazione 6.4. La seconda condizione su V è semplicemente la richiesta per una funzione Lp (e quindi
non necessariamente continua) di tendere a 0 quando |x| → ∞. Si noti inoltre che nelle ipotesi del Teorema
l’intero V deve soddisfare le (6.19), non solo la sua parte negativa.
Dimostrazione. Sia {Ψn }n∈N in H 1 (Rd ) una successione minimizzante. Allora per quanto dimostrato nel
Teorema 6.1
E[Ψn ] → E0 > −∞,
T [Ψn ] ≤ CE[Ψn ] + D kΨn k22 ,
per qualche costante C, D < +∞. Ma allora dalla stima sull’energia cinetica e dalla normalizzazione di Ψn
deduciamo che
sup kΨn kH 1 (Rd ) < +∞,
(6.20)
n∈N
cioè per il Teorema di Banach-Alaoglu 6.5 siamo in un compatto nella topologia debole. Quindi (si veda
anche l’Osservazione 6.7) ∃ una sottosuccessione che chiameremo ancora {Ψn }n∈N con un piccolo abuso di
notazione tale che
w
(6.21)
Ψn −→ Ψ0 ∈ H 1 (Rd ).
n→∞
w
Ψn −→ Ψ0
n→∞
Inoltre grazie al Lemma 6.2 vale anche
in L2 (Rd ).
Possiamo ora applicare i Lemma 6.3 e 6.4 ottenendo
E0 = lim inf E[Ψn ] ≥ E[Ψ0 ].
n→∞
(6.22)
Per ottenere la prima parte dell’enunciato rimane solo da dimostrare che kΨ0 k = 1, perché come sappiamo
ci può essere perdita di norma sotto limite debole (si veda la Sezione 3.1). A tale scopo osserviamo che
E0 ≤ 0, come segue banalmente dal fatto che l’inf dello spettro dell’operatore di Schrödinger H = −∆ + V
è minore o uguale a 0: è sufficiente valutare E[Ψ] su una successione di stati di prova che approssimano
funzioni caratteristiche di insiemi compatti che si allontanano verso l’infinito e usare l’ipotesi che V si annulli
all’infinito. Allora per la (6.22)
E0 = lim inf E[Ψn ] ≥ E[Ψ0 ] ≥ E0 kΨ0 k22 ,
n→∞
dove abbiamo usato il fatto che E0 = inf E[Ψ] sulle funzioni normalizzate a 1. Ma allora poiché E0 ≤ 0,
otteniamo immediatamente che kΨ0 k2 ≥ 1. D’altra parte vale in generale che sotto limite debole la norma
può solo decrescere, cioè
kΨ0 k2 ≤ lim inf kΨn k2 = 1,
n→∞
e quindi kΨ0 k2 = 1.
Per mostrare che Ψ0 soddisfa l’equazione di Schrödinger in senso debole, dobbiamo rendere rigoroso il
calcolo fatto all’inizio della Sezione: sia allora Φ ∈ C0∞ (Rd ) e ε ∈ R e chiamiamo
R(ε) =
E[Ψ0 + εΦ]
.
kΨ0 + εΦk
La funzione R(ε) è differenziabile in ε in un intorno di ε = 0 in quanto rapporto di due polinomi di ε di
ordine 2 e finita a ε = 0. Infatti R(0) = E0 ≤ R(ε) per ogni ε ∈ R, cioè R(0) = minε R(ε) e quindi R0 (0) = 0.
Resta ora solo da osservare che R0 (0) = 0 è esattamente il conto riprodotto all’inizio della Sezione, il cui
unico passaggio delicato è l’integrazione per parti del termine cinetico
Z
Z
∗
dx ∇Ψ0 · ∇Φ =
dx Ψ∗0 (−∆Φ),
Rd
Rd
che è però garantito dal fatto che Ψ0 ∈ H 1 (Rd ) e Φ ∈ C0∞ (Rd ) (per questo secondo motivo non ci sono
termini di bordo).
101
Lemma 6.2 (Convergenza debole in H 1 e L2 ).
w
w
Sia {Ψn }n∈N una successione in L2 (Rd ) tale che Ψn −→ Ψ in H 1 (Rd ), allora Ψn −→ Ψ anche in L2 (Rd ).
n→∞
n→∞
Osservazione 6.5. Quanto affermato nel Lemma 6.2 è in realtà conseguenza di un fatto molto più generale:
dato uno spazio X con due norme k · k1 e k · k2 , tali che k · k1 ≤ C k · k2 , C < ∞, cioè la topologia indotta
dalla norma 2 è più forte di quella della norma 1, allora la convergenza debole rispetto alla norma 2 implica
w
la covergenza debole rispetto alla norma 1. Ricordiamo a tale proposito che Ψn −→ Ψ in X rispetto ad una
n→∞
certa norma k · k se per ogni funzionale lineare limitato F ∈ X ∗ , si ha F [Ψn ] → F [Ψ]. Naturalmente la
definizione dipende dalla norma k · k perché il duale di X è norma-dipendente e, nel caso delle due norme
appena citato, Xk∗ · k ⊂ Xk∗ · k , che è anche l’ingrediente principale della dimostrazione.
1
2
Dimostrazione. Abbiamo che, per ogni Φ ∈ L2 (Rd ), grazie alla convergenza debole in H 1 di Ψn , si ha
Φ̂∗ (k)
dk k + 1 2
=
Ψ̂n (k) =
k +1
Rd
Z
hΦ |Ψn iL2 (Rd )
2
Z
Rd
dk k 2 + 1 Ξ̂(k)Ψ̂n (k) −→ hΞ |Ψ iH 1 (Rd )
n→∞
= hΦ |Ψ iL2 (Rd ) ,
dove abbiamo posto Ξ̂(k) = Φ̂(k)/(k 2 + 1) e osservato che, per ogni Φ ∈ L2 (Rd ), Ξ ∈ H 1 (Rd ):
kΞk2H 1 (Rd )
Φ̂(k)2
=
dk 2
≤ kΦk22 .
k +1
Rd
Z
Lemma 6.3 (Semicontinuità dal basso dell’energia cinetica).
w
Sia {Ψn }n∈N una successione in H 1 (Rd ) tale che Ψn −→ Ψ in L2 (Rd ), allora
n→∞
k∇Ψk22 ≤ lim inf k∇Ψn k22 .
(6.23)
n→∞
Dimostrazione. La dimostrazione è come strategia molto simile a quella del fatto che la norma può solo
diminuire sotto convergenza debole. Ricordiamo che per il Teorema di Riesz e la densità delle funzioni
regolari a supporto compatto in L2 (Rd ) si ha
kΨk22 =
|hΦ |Ψ i| ,
sup
(6.24)
Φ∈C0∞ (Rd ),kΦk=1
e dunque
2
k∇Ψk22 = k Ψ̂2 =
=
sup
Φ∈C0∞ (Rd ),kΦk=1
sup
k Φ̂Ψ̂ =
lim inf Φ̂k Ψ̂n ≤
Φ∈C0∞ (Rd ),kΦk=1 n→∞
sup
lim k Φ̂Ψ̂n Φ∈C0∞ (Rd ),kΦk=1 n→∞
sup
Φ∈C0∞ (Rd ),kΦk=1
kΦk2 lim sup k Ψ̂n 2 = lim inf k∇Ψn k2 ,
n→∞ m≥n
n→∞
dove abbiamo usato nell’ordine:
• la convergenza debole di Ψn in L2 per rimpiazzare Ψ con il limite della successione (si noti che
k Φ̂ ∈ L2 (Rd ) per ogni Φ ∈ C0∞ (Rd ));
• il fatto che kΨn ∈ L2 (Rd ), che segue da Ψn ∈ H 1 (Rd ), per poter sostituire il lim con il lim inf;
• la disuguaglianza di Cauchy sulle norme e la definizione di lim inf.
102
Lemma 6.4 (Continuità dell’energia potenziale).
w
Sia {Ψn }n∈N una successione uniformemente limitata in H 1 (Rd ) tale che Ψn −→ Ψ in L2 (Rd ), allora, se
n→∞
V soddisfa le ipotesi del Teorema 6.2,
lim V [Ψn ] = V [Ψ].
(6.25)
n→∞
Dimostrazione. Poniamo per δ > 0
Vδ (x) = V (x)1{x∈Rd | |V (x)|≤ 1 } ,
δ
cosı̀ che Vδ converge a V in Ld/2 (Rd ) quando δ → 0 (si veda la dimostrazione del Teorema 6.1). Allora
Z
2
dx
(V
−
V
)|Ψ
|
2d kV − Vδ k d ≤ C kΨn kH 1 kV − Vδ k d −→ 0,
n
δ
≤ kΨn k d−2
d
2
2 δ→0
R
uniformemente in n poiché kΨn kH 1 è uniformemente limitata per ipotesi. Pertanto resta da dimostrare che
Z
Z
2
dx Vδ (x) |Ψ(x)|2 ,
dx Vδ (x) |Ψn (x)| −→
n→∞
Rd
Rd
per un certo δ fissato. Prendiamo allora ε > 0 e definiamo
o
n
Dε = x ∈ Rd |Vδ | > ε ,
cosı̀ che per ipotesi |Dε | < +∞ per ogni ε > 0. Inoltre
Z
dx Vδ (x) |Ψn |2 ≤ ε kΨn k22 = ε,
Dεc
e similmente
Z
2
dx Vδ (x) |Ψ| ≤ ε kΨk22 ≤ ε,
Dεc
per semicontinuità della norma kΨk ≤ lim inf kΨn k = 1. Allora decomponendo l’integrale su Dε e Dεc ci
basta dimostrare che
Z
Vδ |Ψn |2 − |Ψ|2 −→ 0,
n→∞
Dε
per ogni fissato δ, ε > 0, poiché i resti sono piccoli (in ε e δ) uniformemente in n. Ma d’altra parte
Z
1
2
2
2
Vδ |Ψn | − |Ψ| ≤ kΨn + Ψk2 kΨn − ΨkL2 (Dε ) ≤ kΨn − ΨkL2 (Dε ) −→ 0,
n→∞
δ
δ
Dε
per quanto dimostrato nel prossimo Teorema 6.3.
Concludiamo questa Sezione enunciando due risultati generali che sono stati usati nella dimostrazione del
Teorema 6.2 e dei Lemma relativi.
Teorema 6.3 (Teorema di Rellich-Kondrashev).
w
kk
n→∞
n→∞
Sia {Ψn }n∈N una successione in H 1 (Rd ) tale che Ψn −→ Ψ in H 1 (Rd ), d ≥ 3 , allora Ψn −→ Ψ in L2 (K),
per ogni compatto K ⊂ Rd .
Osservazione 6.6. In realtà con il nome di Teorema di Rellich-Kondrashev ci si riferisce solitamente a un
2d
risultato più generale che dà convergenza in norma in Lp (K) con 1 ≤ p ≤ d−2
in d ≥ 3, 1 ≤ p < ∞ in d = 2
e 1 ≤ p ≤ ∞ in d = 1.
103
Dimostrazione. Usiamo un approssimante C ∞ dell’indentità jm ? Ψn come discusso nel Lemma 6.5, dove
abbiamo posto per semplicità di notazione jm := jεm con ε = 1/m, m ∈ N. Dopodiché scriviamo
kΨn − ΨkL2 (K) = kΨn − jm ? Ψn + jm ? (Ψn − Ψ) + jm ? Ψ − ΨkL2 (K)
≤ kΨn − jm ? Ψn kL2 (K) + kjm ? (Ψn − Ψ)kL2 (K) + kjm ? Ψ − ΨkL2 (K) . (6.26)
Dei tre termini al membro di destra della disuguaglianza precedente l’ultimo è il più facile perché il Lemma
6.5 garantisce che
lim kjm ? Ψ − ΨkL2 (K) = 0.
(6.27)
m→∞
La stessa cosa vale per il primo termine ma non uniformemente in n ∈ N. Stessa cosa per il secondo termine:
puntualmente in K
Z
|jm ? (Ψn − Ψ)(x)| ≤
dy jm (y) |(Ψn − Ψ) (x − y)| ≤ kjm kL2 (K) kΨn − ΨkL2 (K 0 ) −→ 0,
n→∞
Rd
ma non uniformemente in m. Con K 0 abbiamo indicato un qualunque compatto che contenga l’insieme
{z = x − y ∈ Rd | x ∈ K, y ∈ supp(jm )}.
Per il primo termine al membro di destra della (6.26) la soluzione è contenuta nel principio di uniforme
limitatezza (Teorema 6.4) che ci garantisce che
sup kΨn kH 1 (Rd ) < +∞.
n∈N
Questo è sufficiente per concludere che la convergenza del primo termine a 0 quando m → ∞ è in realtà
uniforme in n ∈ N: osserviamo anzitutto che per ogni Ψ ∈ H 1 (Rd )
Z
Z
Z
2 2
2
1
−ik·y
2
2
2
≤ |y|2 kΨk2 1 d ,
dx |Ψ(x − y) − Ψ(x)| =
dk
e
−
1
Ψ̂(k)
≤
|y|
dkk
Ψ̂(k)
H (R )
d/2
(2π)
Rd
Rd
Rd
cosı̀ che
Z
kΨn − jm ? Ψn k2 ≤
Z
dx Ψn (x) −
d
R
=
Z
Z
dx d
R
2 !1/2
dy Ψn (x − y)jm (y)
d
R
2 !1/2 Z
dy [Ψn (x) − Ψn (x − y)] jm (y)
≤
d
Z
dx |Ψn (x) − Ψn (x − y)|
dy
Rd
R
2
1/2
jm (y)
Rd
Z
≤ kΨn kH 1 (Rd )
dy |y| jm (y) ≤
Rd
C
−→ 0, (6.28)
m m→∞
dove abbiamo usato la disuguaglianza triangolare per le norme ovvero
Z
Z
dya(y)Ψ(· − y)
dy |a(y)| kΨ(· − y)k .
≤
Rd
Rd
Per il secondo termine invece osserviamo che puntualmente
Z
Z
jm ? (Ψn − Ψ)(x) =
dy Ψn (y)jm (x − y) −→
n→∞
Rd
dy Ψ(y)jm (x − y),
Rd
per convergenza debole in L2 (Rd ) implicata dalla convergenza H 1 (Rd ) (Lemma 6.2). Inoltre
|jm ? (Ψn − Ψ)(x)| ≤ kΨn k2 kjm k2 ≤ C kjm k2 ,
uniformemente in n ∈ N. Quindi sfruttando la convergenza dominata e la compattezza di K, la convergenza
puntuale dimostrata sopra implica che
lim kjm ? (Ψn − Ψ)k = 0.
n→∞
(6.29)
104
Sottolineamo però che il limite precedente non è uniforme in m.
Riassumendo e mettendo insieme le (6.28), (6.27) e (6.29) si ottiene che, fissato ε > 0, esiste m̄ tale che
per m ≥ m̄ sia il primo che il terzo termine in modulo sono minori o uguali a ε/3. Fissato ora m ≥ m̄,
quanto dimostrato nella (6.29) garantisce che esiste n̄(m) tale che se n ≥ n̄(m) anche il secondo termine
in modulo è minore o uguale a ε/3. In conclusione l’intera somma nella (6.26) è minore o uguale a ε e il
risultato è dimostrato.
Lemma 6.5 (Approssimante C ∞ dell’identità).
Sia Ψ ∈ Lp (Rd ) e j ∈ L1 (Rd ) ∩ C0∞ (Rd ) tale che j ≥ 0 e kjk1 = 1. Se chiamiamo jε (x) = ε−d j(x/ε) allora
i) jε ? Ψ −→ Ψ in norma in Lp (Rd );
ε→0
(n)
ii) jε ? Ψ ∈ C ∞ (Rd ) e (jε ? Ψ)(n) = jε
? Ψ.
Cenni di dimostrazione. Il risultato è sostanzialmente una conseguenza diretta della densità di C ∞ (K) in
Lp (K) con K compatto qualunque in Rd . Per i dettagli della dimostrazione si veda [LL, Teorema 2.16].
Gli ultimi due teoremi che presentiamo rivestono una grande importanza in analisi funzionale. Omettiamo
le dimostrazioni ma il lettore interessato può consultare [RS1, Teorema III.9] e [RS1, Teorema IV.21].
Teorema 6.4 (Principio di uniforme limitatezza).
w
Sia {Ψn }n∈N una successione in uno spazio normato X, k k, tale che Ψn −→ Ψ ∈ X rispetto alla norma
n→∞
k k, allora
sup kΨn k < +∞.
(6.30)
n∈N
Teorema 6.5 (Teorema di Banach-Alaoglu).
Sia H uno spazio di Hilbert separabile, allora {kΨk ≤ C} è un insieme compatto nella topologia debole.
Osservazione 6.7. Una conseguenza immediata del Teorema di Banach-Alaoglu è che se
una successione
{Ψn }n∈N è tale che kΨn k ≤ C < +∞ uniformemente in n, allora ∃ una sottosuccessione Ψnj j∈N tale che
w
Ψnj −→ Ψ ∈ H .
j→∞
Osservazione 6.8. Il Teorema di Banach-Alaoglu è in realtà un risultato molto più generale fra quelli
fondanti per l’analisi funzionale moderna. Vale infatti l’analogo del Teorema 6.5 in ogni spazio di Banach,
con la topologia debole sostituita da quella ∗-debole, cioè la topologia che rende continui tutti i funzionali nel
duale.
6.3
Unicità dello Stato Fondamentale
Come anticipato nell’Osservazione 6.3, l’esistenza dello stato fondamentale non va di pari passo con la
sua unicità, cioè perché Ψ0 sia unico è necessario fare ulteriori ipotesi e, in ogni caso, per dimostrarlo
servono argomenti diversi. Notiamo però che il Teorema 6.2 dà un’indicazione interessante: se l’equazione
di Schrödinger (6.18) è risolta in forma debole da Ψ0 , allora anche Ψ∗0 ne è una soluzione debole, come si
verifica facilmente. Pertanto questo ci suggerisce che Ψ0 possa sempre essere preso reale.
Inoltre l’equazione di Schrödinger ha anche conseguenze interessanti sulla regolarità di Ψ0 che riassumiamo nel prossimo Teorema di cui non daremo dimostrazione (si veda per ulteriori dettagli [LL, Teorema
11.7]).
Teorema 6.6 (Regolarità delle soluzioni dell’equazione di Schrödinger).
Sia B ⊂ Rd una palla aperta e siano Ψ, V ∈ L1 (Rd ) tali che la seguente equazione differenziale sia soddisfatta
in senso debole
− ∆Ψ + V Ψ = 0.
(6.31)
Allora per ogni palla B 0 concentrica con B e di raggio strettamente minore
105
i) in d = 1, Ψ ∈ C 1 (B 0 );
ii) in d = 2, Ψ ∈ Lp (B 0 ), ∀p < +∞;
iii) in d ≥ 3, Ψ ∈ Lp (B 0 ), ∀p <
d
d−2 ;
iv) per ogni d, se V ∈ C k (B 0 ) allora Ψ ∈ C k+2 (B 0 ).
Il Teorema precedente si applica su un compatto, ma è facile generalizzarlo al caso dell’intero spazio.
Ad esempio se assumiamo che Ψ ∈ L2 (Rd ) e V Ψ ∈ L2 (Rd ), l’equazione di Schrödinger ci garantisce
automaticamente che Ψ ∈ H 2 (Rd ).
Torniamo alla questione dell’unicità e formuliamo il risultato principale della Sezione:
Teorema 6.7 (Unicità dello stato fondamentale).
Sia Ψ0 ∈ H 1 (Rd ) lo stato fondamentale di H normalizzato kΨ0 k2 = 1, V ∈ L1loc (Rd ) reale, V localmente
limitato dall’alto e V |Ψ0 |2 ∈ L1 (Rd ), allora Ψ0 soddisfa l’equazione di Schrödinger (6.18) in senso debole.
Inoltre Ψ0 può essere scelta strettamente positiva e Ψ0 è unica a meno di moltiplicazione per fattori di fase
costanti.
Osservazione 6.9. Si noti che il fatto che Ψ0 soddisfi la (6.18) è un nuovo risultato, perché ottenuto
con ipotesi diverse da quelle del Teorema 6.2. Infatti fra le ipotesi del Teorema 6.7 vi è l’esistenza di un
minimizzatore.
Dimostrazione. La dimostrazione che Ψ0 è soluzione di (6.18) è identica a quella contenuta nella
dimostrazione del Teorema 6.2 e la omettiamo per brevità .
La disuguaglianza diamagnetica (Lemma 6.6) poi implica che E[|Ψ0 |] ≤ E[Ψ0 ] = E0 ma siccome E0 =
inf E[Ψ] deve anche essere E[|Ψ0 |] = E0 , cioè |Ψ0 | è ancora un minimizzatore. Inoltre per la seconda parte
del Lemma 6.6, se |Ψ0 | > 0, deve anche essere Ψ0 = λ|Ψ0 |.
Supponiamo ora che esistano due stati fondamentali Ψ̃0 6= Ψ0 e E[Ψ̃0 ] = E0 , allora possiamo scegliere
sia Ψ0 ≥ 0 che Ψ̃0 ≥ 0 e supporre che Ψ̃0 ⊥ Ψ0 , per linearità dello spazio degli stati fondamentali: se Ψ0 e
Ψ00 sono stati fondamentali allora anche Ψ̃0 = αΨ0 + βΨ00 lo è e possiamo aggiustare α, β ∈ C in modo che
kΨ̃0 k = 1 e Ψ̃0 ⊥ Ψ0 . A questo punto avremmo che per ogni palla B ⊂ Rd
Z
dx Ψ0 (x)Ψ̃0 (x) = 0,
(6.32)
B
poiché l’integrando è una funzione non negativa ovunque. Ma per la disuguaglianza di Harnack (Lemma
6.7 e la successiva Osservazione 6.12) se Ψ0 e Ψ̃0 non sono identicamente nulle deve esistere un compatto
K ⊂ Rd tale che Ψ0 (x) > 0 e Ψ̃0 (x) > 0 per ogni x ∈ K, e, di conseguenza
Z
dx Ψ0 (x)Ψ̃0 (x) > 0,
K
che contraddice la (6.32). Pertanto lo stato fondamentale è unico. Ma se è unico allora può essere scelto
positivo e di nuovo la disuguaglianza di Harnack implica che |Ψ0 | > 0, mentre la seconda parte del Lemma
6.6 che Ψ0 = λ|Ψ0 |.
I due Lemma coinvolti nella dimostrazione del Teorema 6.7 sono formulati qui di seguito.
dimostrazione di entrambi si vedano rispettivamente [LL, Teorema 7.8 e Teorema 9.10].
Per la
Lemma 6.6 (Disuguaglianza diamagnetica).
Per ogni Ψ ∈ H 1 (Rd ) si ha |Ψ| ∈ H 1 (Rd ) e
k∇|Ψ|k2 ≤ k∇Ψk2 ,
e, se |Ψ| > 0, l’uguaglianza è soddisfatta se e solo se Ψ = λ|Ψ|, |λ| = ±1.
(6.33)
106
Osservazione 6.10. In effetti dove Ψ può essere decomposta in Ψ = |Ψ|eiΦ cioè lontano dai punti in cui
Ψ si annulla, la disuguaglianza vale sostanzialmente a livello puntuale q.o.:
|∇Ψ|2 = |∇|Ψ||2 + |Ψ|2 |∇Φ|2 ≥ |∇|Ψ||2 .
Questo in effetti è il modo in cui il risultato è dimostrato dove |Ψ| > 0. Vicino agli zeri di Ψ invece bisogna
procedere a una regolarizzazione della funzione.
Osservazione 6.11. Con il nome disuguaglianza diamagnetica si indica anche un risultato più generale
che sia applica in presenza di campi magnetici: sia A : Rd → Rd una funzione sufficientemente regolare
(ad esempio H 1 (Rd )) che viene detta potenziale vettore e B = ∇ × A il relativo campo magnetico, allora
l’energia cinetica in presenza di tale campo deve essere modificata e diventa
Z
dx |(∇ − iA) Ψ|2 .
(6.34)
Rd
La disuguaglianza diamagnetica generalizzata afferma che se la quantità di sopra è finita, allora |Ψ| ∈ H 1 (Rd )
e
k∇|Ψ|k2 ≤ k(∇ − iA) Ψk2 .
(6.35)
Lemma 6.7 (Disuguaglianza di Harnack).
Sia Ω ⊂ Rd connesso e aperto e V misurabile limitato dall’alto in Ω. Sia Ψ ≥ 0 in L1loc (Ω) tale che
V Ψ ∈ L1loc (Ω) e
− ∆Ψ + V Ψ ≥ 0,
(6.36)
in senso debole2 . Allora esiste una funzione Ψ̃ semicontinua inferiormente tale che Ψ = Ψ̃ q.o. e, per ogni
K compatto contenuto in Ω, ∃C(K) > 0 tale che
Z
Ψ̃(x) ≥ C
dy Ψ(y),
(6.37)
K
per ogni x ∈ K.
Osservazione 6.12. Una conseguenza banale ma sostanziale per l’uso che vogliamo fare della disuguaglianza
di Harnack è che se Ψ ≥ 0 non è identicamente nulla in K ⊂ Ω, allora
Z
Ψ̃(x) ≥ C
dy Ψ(y) > 0,
(6.38)
K
per ogni x ∈ K, cioè la funzione è strettamente positiva in K.
2
Cioè testata su funzioni di prova Φ ∈ C0∞ (Ω) non negative.
Capitolo 7
Stati Eccitati
Fin’ora ci siamo limitati a considerare lo stato fondamentale ma viene naturale chiedersi se le stesse proprietà
valgano anche per gli altri stati legati. Per prima cosa dobbiamo specificare cosa intendiamo per stato legato
o stato eccitato: solitamente uno stato legato indica uno stato nel quale la probabilità di osservare il sistema
al di fuori di un compatto tende a 0 quando la taglia del compatto tende all’infinito. Nel concreto Ψ ∈ L2 (Rd )
è stato legato se
Z
dx |Ψ(x)|2 −→ 0.
R→∞
c
BR
(7.1)
Quando poi il termine stato legato è riferito a un operatore di Schrödinger H si intende implicitamente
che esso sia anche un autostato (eventualmente generalizzato) di H. Chiaramente la proprietà precedente
vale per ogni autofunzione di H normalizzata in L2 (Rd ). Per capire la differenza discutiamo brevemente il
caso opposto, cioè gli stati di scattering per cui la proprietà (7.1) è falsa: ogni quasi-autostato relativo a
punti dello spettro essenziale di H è infatti di questo tipo. Si pensi ad esempio allo spettro dell’operatore
impulso su L2 (R): lo spettro è l’intera retta reale ed è completamente continuo; i suoi quasi-autostati sono
approssimanti L2 delle onde piane eikx , k ∈ R, che ovviamente non stanno in L2 e la cui norma al di fuori
di qualunque compatto non decade mai, poiché il modulo della funzione stessa è costante.
Quindi riassumendo identificheremo gli stati legati con autostati di H a energia negativa. Quest’ultima
proprietà è conseguenza del fatto che tipicamente lo spettro essenziale di H copre il semiasse positivo e
non sono presenti autovalori positivi (come abbiamo visto ad esempio per l’atomo di idrogeno). Esistono
naturalmente delle eccezioni ma questo è sostanzialmente il caso che vogliamo prendere in considerazione.
Più precisamente consideriamo un’Hamiltoniana H della forma
H = −∆ + V
(7.2)
con V (x) ∈ L1loc (Rd ) che tende a 0 quando |x| → ∞ (faremo anche altre ipotesi su V successivamente). Si
veda ad esempio l’enunciato del Teorema 6.2 per la formulazione corretta di tale proprietà. In ogni caso sotto
queste ipotesi E0 ≤ 0 e, siccome siamo interessati a studiare ulteriori autovalori di H negativi, assumeremo
che
E0 < 0.
(7.3)
Possiamo allora definire iterativamente gli stati eccitati di H con energia negativa nel modo seguente
Definizione 7.1 (Stati eccitati).
Siano E0 ≤ . . . ≤ Ek−1 ≤ 0 e Ψ0 , . . . , Ψk−1 le energie e le autofunzioni dei primi k stati eccitati, allora
l’energia dello stato eccitato k + 1-esimo è
Ek = inf E[Ψ],
Ψ∈Dk
(7.4)
con Dk = Ψ ∈ L2 (Rd ) | kΨk = 1, hΨ |Ψj i , j = 0, . . . , k − 1 . Se esiste Ψk ∈ Dk tale che E[Ψk ] = Ek , allora
Ψk è lo stato eccitato k + 1-esimo.
107
108
Si noti che la definizione del k + 1-esimo stato eccitato richiede l’esistenza dei primi k stati eccitati. Inoltre
è importante osservare che tutte le precedenti energie devono essere non positive.
Come anche per lo stato fondamentale l’esistenza di Ψk è strettamente connessa con l’esistenza di una
soluzione dell’equazione di Schrödinger
− ∆Ψ + V Ψ = Ek Ψ.
7.1
(7.5)
Proprietà degli Stati Eccitati
Raccogliamo tutte le proprietà più rilevanti degli stati eccitati nel seguente
Teorema 7.1 (Stati eccitati).
Sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte e supponiamo che esistano k autofunzioni
Ψ0 , . . . , Ψk−1 di H agli autovalori E0 ≤ E1 ≤ · · · ≤ Ek−1 < 0, allora esiste Ψk ∈ H 1 (Rd ) stato eccitato k-esimo. Inoltre Ψk può essere scelta reale e soddisfa (7.5) in senso debole. Infine Ek ha molteplicità
finita.
Osservazione 7.1. L’ipotesi che Ek < 0 è cruciale nella dimostrazione. Anzi si può applicare ripetutamente
il precedente Teorema, ricavando progressivamente l’esistenza di stati eccitati fino a che Ek ≥ 0 per un certo
k.
Cenni di dimostrazione. Per quanto riguarda l’esistenza di Ψk si procede come nella dimostrazione del Teorema 6.2 con l’unica accortezza di osservare che il limite debole preserva il vincolo Ψ ⊥ Ψj , j = 0, . . . , k − 1.
Si noti che la condizione Ek < 0 gioca lo stesso ruolo di E0 < 0 nella dimostrazione del Teorema 6.2.
Vediamo ora come si dimostra che Ψk risolve la (7.5): considerando la variazione di E[Ψk ] data da E[Ψε ]
con Ψε = Ψk + εΦ e Φ ∈ C0∞ (Rd ) ortogonale a tutte le Ψj , j = 0, . . . , k − 1, si ottiene che, in senso debole,
− ∆Ψk + V Ψk − Ek Ψk =
k−1
X
cj Ψj .
(7.6)
j=0
Bisogna ora dimostrare che cj = 0 per ogni j. L’idea è sostanzialmente quella di prendere il prodotto scalare
dell’equazione con Ψ∗j , ma tale funzione non è in C0∞ (Rd ). Prendiamo allora Ψj,ε data da un approssimante
C ∞ di Ψj (si veda il Lemma 6.5) moltiplicata per un approssimate C ∞ della funzione caratteristica di una
palla con raggio 1/ε. La funzione cosı̀ ottenuta ovviamente converge a Ψj in norma quando ε → 0 ed è in
C0∞ (Rd ). Moltiplicando (7.6) per Ψ∗j,ε e integrando otteniamo
k−1
X
Z
ci hΨj,ε |Ψi i = cj + o(1) =
Rd
i=0
Z
=
dx
Rd
∇Ψ∗j,ε
· ∇Ψk + V
dx Ψ∗j,ε {−∆Ψk + V Ψk − Ek Ψk }
Ψ∗j,ε Ψk
Z
+ o(1) =
d
ZR
=
dx ∇Ψ∗j,ε · ∇Ψk + V Ψ∗j,ε Ψk − Ej Ψ∗j,ε Ψk + o(1)
dx {−∆Ψj,ε + V Ψj,ε − Ej Ψj,ε }∗ Ψk + o(1) = o(1),
Rd
dove abbiamo usato ripetutamente che kΨj − Ψj,ε k = o(1).
Assumiamo infine per assurdo che Ek abbia molteplicità infinita. Questo vorrebbe dire che esistono
Ψk , Ψk+1 , . . . ortonormali che soddisfano la (7.5) in senso debole. Siccome per ciascuna di queste funzioni
la norma H 1 è uniformemente limitata in k, possiamo estrarre una sottosuccessione {Ψkj }j∈N convergente
w
in senso debole per il Teorema di Banach-Alaoglu 6.5. Avremmo quindi Ψkj −→ Ψ, ma una successione di
j→∞
funzioni ortonormali che converge debolmente non può che convergere a 0. Ma allora
Z
Z
n
2
2 o
2
Ek = lim inf
dx ∇Ψkj + V Ψkj
= lim inf
dx ∇Ψkj ≥ 0,
j→∞
Rd
che contraddice l’ipotesi che Ek < 0.
j→∞
Rd
Parte III
Stabilità della Materia
109
110
Dal punto di vista fisico il problema della stabilità della materia è stato fra quelli che hanno recitato
un ruolo cruciale nella nascita e sviluppo della MQ. Abbiamo infatti visto all’inizio del corso come la fisica
classica non sia in grado di fornire un modello stabile di atomo o in generale di materia costituita da atomi in
interazione. Per riassumere, in ambito classico, il moto dell’elettrone attorno al nucleo, cosı̀ come concepito
nel modello planetario, produce irraggiamento di onde elettromagnetiche e, conseguentemente, perdita di
energia cinetica dell’elettrone, che in un tempo finto cade sul nucleo. Le equazioni di evoluzione classica da
quel momento in poi perdono senso e la dinamica del sistema non è globale nel tempo.
In MQ il problema è risolto, dato che, come abbiamo dimostrato nel Capitolo 5, la dinamica quantistica
dell’atomo di idrogeno è globale nel tempo. Tuttavia non è a questo ancora chiaro se tale proprietà si
estenda a qualunque insieme di atomi, ovvero alla materia cosı̀ come la concepiamo. In MQ l’analogo
del fenomeno di caduta sul centro è il collasso del sistema dovuto alla possibilità di raggiungere stati con
energia arbitrariamente bassa. In altri termini la stabilità di cui stiamo parlando, che chiameremo stabilità
di prima specie in analogia con quanto discusso nella Sezione 6.1, va di pari passo con la limitatezza dal
basso dell’energia raggiungibile dal sistema fisico, o, dal punto di vista matematico, la limitatezza dal basso
dell’energia dello stato fondamentale.
Si noti che ancora nel 1915 Jeans si mostrava dubbioso sulla possibilità che ogni sistema interagente
con un potenziale coulombiano genuino potesse essere stabile. Citando alla lettera da [J, p. 168]: “[...]
there would be a very real difficulty in supposing that the law r12 held down to zero values of r. For the force
between two charges at zero distance would be infinite; we should have charges of opposite sign continually
rushing together and, when once together, no force would adequate to separate them. [...] Thus the matter
in the universe would tend to shrink into nothing or to diminish indefinitely in size.”.
Come vedremo, invece, anche per sistemi a molte particelle composti da più di un atomo, tale stabilità
è garantita dalla MQ e, in un certo senso, il motivo fisico è sostanzialmente il principio di indeterminazione
che dal punto di vista matematico prende la forma delle disuguaglianze di Sobolev, esattamente come per il
Teorema 6.1.
Vi è però una seconda forma di stabilità più sottile, che è tuttavia necessaria per dare conto del mondo
che ci circonda. Sin dai primi anni del secolo XX infatti, con la comparsa delle prime teorie quantistiche, ci si
è subito chiesti come mai la materia occupasse porzioni cosı̀ ampie di spazio o, equivalentemente, come mai
all’interno di qualunque materiale il volume occupato fisicamente dagli atomi fosse una frazione minuscola
dell’intero volume del corpo (si veda ad esempio la discussione dell’esperimento di Rutherford nella Sezione
1.3). Diceva al riguardo nel 1931 Ehrenfest in [E, p. 617]: “We take a piece of metal. Or a stone.
When we think about it, we are astonished that this quantity of matter should occupy so large a volume.
Admittedly, the molecules are packed tightly together, and likewise the atmos within each molecule. But why
are the atoms themselves so big? Consider for example the Bohr model of an atom of lead. Why do so few
of the 82 electrons run in the orbits close to the nucleus? The attraction of the 82 positive charges in the
nucleus is so strong. Many more of the 82 electrons could be concentrated into the inner orbits, before their
mutual repulsion would become too large. What prevents the atom from collapsing in this way?”. La risposta
a queste domande è connessa al problema della stabilità di seconda specie, cioè al fatto che l’energia di un
sistema di N particelle cariche in MQ sia proporzione al numero di particelle N stesso, e non a potenze più
alte dello stesso numero N . Infatti la linearità in N dell’energia del fondamentale di N particelle comporta
che il volume occupato dal sistema è anch’esso lineare in N (estensività della materia), come vedremo nel
dettaglio.
Il risultato principale che dimostreremo in quest’ultima parte del corso è proprio che un sistema di N
cariche negative (elettroni) con M nuclei di carica positiva Zi e, i = 1, . . . , M è stabile di seconda specie.
Riguardo al motivo fisico la risposta sta in quello che è noto come principio di esclusione di Pauli, ovvero
nelle proprietà speciali dei sistemi di particelle identiche in MQ. Come vedremo lo spin delle particelle
determina la loro natura nel senso che particelle identiche quantistiche possono essere di due tipi: bosoni
(nel caso di spin intero) e fermioni (nel caso di spin semi-intero). Questi ultimi soddisfano il principio di
esclusione di Pauli, che, a grandi linee, impedisce a due fermioni identici (come gli elettroni) di occupare
lo stesso stato quantistico a una particella. A livello atomico perciò ci può essere al più un elettrone per
orbita ammessa e cosı̀ si spiega il numero relativamente piccolo di elettroni nelle orbite interne. Tornando
111
a Ehrenfest in [E, p. 617] si rispondeva1 : “Answer: only the Pauli principle, ‘No two electrons in the
same state.’ That is why atoms are so unnecessarily big, and why metal and stone are so bulky. You must
admit, Pauli, that if you would only partially repeal your prohibition, you could relieve many of our practical
worries, for example the traffic problem on our streets.”.
Inoltre mostreremo come la natura fermionica degli elettroni sia non solo sufficiente ma anche necessaria
per la stabilità di seconda specie: ipotizzando l’esistenza di un sistema analogo di cariche negative bosoniche
interagenti con nuclei positivamente carichi, dimostreremo che la stabilità di seconda specie non vale per
tale sistema e la sua energia dello stato fondamentale è proporzionale a N 5/3 . In effetti con qualche fatica
in più e ammettendo che i nuclei si possano muovere è possibile dimostrare [Dy] una stima leggermente
migliore. Afferma Dyson in [Dy] che senza il principio di esclusione di Pauli: “We show that not only
individual atoms but matter in bulk would collapse into a condensed high-density phase. The assembly of
any two macroscopic objects would release energy comparable to that of an atomic bomb. It is thus fortunate
that Pauli was unwilling to comply with Ehrenfest’s well-intentioned proposal.”
Nel seguito:
• dimostreremo la stabilità di prima specie;
• introdurremo alcune proprietà delle particelle identiche in MQ e definiremo la stabilità di seconda
specie;
• dimostreremo le disuguaglianze di Lieb-Thirring che riassumono in modo matematicamente sintetico
il principio di esclusione di Pauli;
• discuteremo brevemente alcuni risultati di elettrostatica, inclusa la disuguaglianza di Baxter;
• completeremo la dimostrazione della stabilità della materia di seconda specie.
1
Queste parole erano infatti rivolte da Ehrenfest a Pauli in occasione della riconoscimento ottenuto con la medaglia
Lorentz.
Capitolo 8
Stabilità di Prima Specie
Per prima cosa introduciamo il sistema che vogliamo studiare e l’Hamiltoniana relativa: consideremo la
materia come composta da N elettroni di massa me e carica −e, interagenti fra di loro e con M nuclei
di carica Zj e, con Zj ∈ N e j = 1, . . . , M . La posizione degli N elettroni nello spazio R3 sarà indicata
da xi , i = 1, . . . , N , mentre indicheremo con Rj , j = 1, . . . , M , le posizioni dei nuclei. Vogliamo dunque
scrivere l’energia di questo sistema di particelle interagenti in cui l’energia potenziale è generata solamente
dall’interazione elettrostatica delle cariche coinvolte.
Per semplificare la discussione sceglieremo delle unità di misura opportune in cui l’Hamiltoniana sia la
più semplice possibile. In particolare misureremo
• le lunghezze in unità di lunghezza Compton dell’elettrone λC =
~
≈ 3.86 · 10−11 cm;
me c
• l’energia in unità di energia a riposo dell’elettrone me c2 ≈ 0.5MeV;
• il tempo in unità di λC /(me c2 ) ≈ 1.29 · 10−19 s.
√
Questa scelta sarà equivalente a porre ~ = me = c = 1 (unità naturali) e rimpiazzare la carica e con α,
dove α è la costante di struttura fine
e2
1
α=
≈
.
(8.1)
~c
137
Una seconda semplificazione o, più precisamente, un’approssimazione che faremo è quella di considerare i
nuclei fissi e trascurare la loro energia cinetica. Il semplice motivo è che ciascun nucleo ha una massa almeno
Zj mp , con mp ≈ 2000me la massa del protone. Come è facile intuire il rapporto di massa è cosı̀ sbilanciato
che sulle scale di energia, tempo e lunghezza che vogliamo considerare i nuclei si possono ragionevolmente
considerare fermi. Va tuttavia ricordato che questa semplificazione non inficia il risultato che dimostreremo
nel Capitolo 12: la presenza dell’energia cinetica dei nuclei richiederebbe infatti un adattamento della dimostrazione abbastanza semplice, ma allo stesso non darebbe origine a nuovi fenomeni. Per questo assumeremo
i nuclei fermi nei punti {Rj }{j=1,...,M } che compariranno come parametri nella nostra energia.
Fatte queste premesse allora dovremo scrivere un operatore che agisca sulla funzione d’onda di N elettroni
in L2 (R3 ), dove trascureremo per il momento le proprietà fermioniche degli elettroni:
H(N, M, R, Z) =
N
X
− 21 ∆i + αVC (X; R, Z),
(8.2)
i=1
dove abbiamo indicato sinteticamente
X = (x1 , . . . , xN ),
R = (R1 , . . . , RM ) ,
Z = (Z1 , . . . , ZM ),
(8.3)
e il potenziale VC è dato da
VC (X; R, Z) = W (X; R, Z) + I(X) + U (R, Z),
112
(8.4)
113
e W, I e U rappresentano rispettivamente le energie di interazione degli elettroni con i nuclei, degli elettroni
fra di loro e dei nuclei fra di loro, cioè
W (X; R, Z) = −
N X
M
X
i=1 j=1
I(X) =
X
1≤i<j≤N
U (R, Z) =
X
1≤j<k≤M
Zj
;
|xi − Rj |
(8.5)
1
;
|xi − xj |
(8.6)
Zj Zk
.
|Rj − Rk |
(8.7)
Indicheremo poi come nei Capitoli precedenti
E[Ψ] = h Ψ |H| Ψ i = T [Ψ] + V [Ψ].
(8.8)
La quantità che sarà al centro del nostro studio è l’energia dello stato fondamentale di H, ovvero E0,a =
inf σ(H) oppure in termini variazionali1
E0,a (N, M, R, Z) = inf E[Ψ],
(8.9)
Ψ∈DN
con DN = Ψ ∈ H 1 (R3N ) | kΨk2 = 1 .
Definizione 8.1 (Stabilità di prima specie).
Diciamo che la materia è stabile di prima specie se per ogni R ∈ R3M e Z ∈ RM , con Zj ≤ Z < ∞ per
ogni j = 1, . . . , M ,
E0,a (N, M, R, Z) > −∞.
(8.10)
Si noti che a rigor di logica fra le possibili configurazioni dei nuclei vi è quella in cui le posizioni di 2 o più
nuclei coincidono. Tale configurazione è ovviamente singolare per il potenziale coulombiano ma, grazie al
fatto che il termine U (R, Z) del potenziale VC diverge a +∞ quando |Rj − Rk | → 0, tale configurazione è
certamente stabile di prima specie. Perciò quando verificheremo la stabilità di prima specie della materia
possiamo implicitamente assumere che Rj 6= Rk .
Teorema 8.1 (Stabilità di prima specie della materia).
Per ogni R ∈ R3M e Z ∈ RM , con Zj ≤ Z < ∞ per ogni j = 1, . . . , M ,
E0,a (N, M, R, Z) ≥ − 12 α2 Z 2 M 2 N.
(8.11)
Dimostrazione. Per prima cosa possiamo liberarci dell’energia potenziale di U (R, Z), il cui contributo è
sicuramente positivo. Poi scriviamo
H=
N
X
hi + U (R, Z),
hi = − 12 ∆i + Vi (xi ; xi+1 , . . . , xN , R, Z),
(8.12)
i=1
dove
Vi (xi ; xi+1 , . . . , xN , R, Z) = Wi (xi ; R, Z) + Ii (xi ; xi+1 , . . . , xN ) = −
M
X
j=1
N
X
αZj
α
+
. (8.13)
|xi − Rj |
|xi − xj |
j=i+1
Il contributo dell’energia potenziale dovuta alla repulsione fra gli elettroni è anch’esso positivo e quindi
otteniamo la stima dal basso
H≥
N
X
i=1
1
h̃i ,
h̃i = − 12 ∆i + Ṽi (xi ; R, Z),
Ṽi (xi ; R, Z) = −
M
X
j=1
αZj
,
|xi − Rj |
La label a nell’energia E0,a indica che stiamo considerando lo stato fondamentale assoluto, cioè non vincolato, se si esclude
la richiesta di normalizzazione in L2 (R3 ). Nel seguito considereremo altri domini di minimizzazione (più ristretti).
114
dove gli operatori h̃i sono ora della forma 1 ⊗ · · · ⊗ 1 ⊗ h̃i ⊗ 1 ⊗ · · · ⊗ 1, cioè scrivendo L2 (R3N ) = ⊗N L2 (R3 ),
le altre copie di L2 (R3 ) sono lasciate invarianti.
Per dimostrare la limitatezza dal basso di H ci basta allora dimostrare che ognuna delle h̃i è limitata dal
basso e la stima (8.11) seguirà sommando su N la singola stima dal basso. D’altra parte possiamo applicare
a h̃i direttamente il Teorema 6.1, grazie al fatto che
∈ L3/2 (R3 ) + L∞ (R3 ).
(8.14)
Ṽi
−
Per dimostrarlo osserviamo anzitutto che è sufficiente considerare un termine con j fissato alla volta; inoltre
decomponendo
M
X
=
Ṽi
−
j=1
M
X
αZj
=
|xi − Rj |
j=1
αZj
αZj
1
+
1
,
|xi − Rj | {|xi −Rj |≤R} |xi − Rj | {|xi −Rj |>R}
si vede subito che, per ogni j = 1, . . . , M , il primo termine sta in L3/2 (R3 ) mentre il secondo è limitato da
αZj /R.
Per ottenere poi la (8.11) possiamo per prima cosa rimpiazzare ogni Zj con Z tale che Zj ≤ Z per ogni
j = 1, . . . , M , poiché questo sicuramente abbassa l’energia. Usando poi la stima del Lemma 5.4 per ogni
singolo termine di potenziale otteniamo che per ogni Φ ∈ L2 (R3 ) normalizzata
D E
Φ h̃i Φ ≥ 12 k∇i Φk22 − αZM k∇i Φk2 kΦk2 ≥ − 12 α2 Z 2 M 2 ,
da cui si ottiene immediatamente la (8.11).
Osservazione 8.1. Decomponendo l’intero potenziale Vi (xi ; R, Z) come fatto per Ṽi , repulsione elettronica
inclusa, si vede che Wi (xi ; R, Z) e Ii (xi ; xi+1 , . . . , xN ) appartengono entrambi a L2 (R3 ) + L∞ (R3 ), per ogni
R, Z e xi+1 , . . . , xN . Possiamo allora applicare a hi il Teorema di Kato-Rellich 3.13 cosı̀ come abbiamo
fatto per l’atomo di idrogeno (si veda la dimostrazione del Teorema 5.1), ottenendo che H è autoaggiunta
su H 2 (R3N ).
Capitolo 9
Particelle Identiche e Stabilità di Seconda
Specie
In questo Capitolo definiremo il concetto di stabilità di seconda specie. A tale scopo introdurremo il concetto
di particelle identiche in MQ e discuteremo alcune proprietà cruciali dei sistemi di particelle identiche non
interagenti, come la descrizione dello stato in termini di matrici densità ridotte e il comportamento dello
stato fondamentale.
9.1
Spin e Particelle Identiche
Come stiamo per vedere la richiesta che un sistema sia composto da particelle identiche ha conseguenze inaspettate in MQ. Prima però, dobbiamo introdurre un’altra caratteristica intrinseca delle particelle
quantistiche.
Fin qui abbiamo trattato elettroni e protoni e, in genere, ogni particella quantistica come se fossero
punti materiali con i soli gradi di libertà associati al moto nello spazio R3 . Con questo assunzione siamo
riusciti a costruire una teoria dell’atomo di idrogeno che riproducesse le osservazioni sperimentali sugli spettri
energetici, pertanto in quell’intervallo di energie e in assenza di campi esterni forti, dobbiamo aspettarci che
quelli siano gli unici gradi di libertà rilevanti. Tuttavia quando entrano in gioco campi magnetici intensi
e, soprattutto, effetti relativistici legati alle velocità delle particelle prossime a quella della luce, si scopre
che esistono altri gradi di libertà interni di tali particelle. Quando poi si richiede l’invarianza relativistica
delle equazioni della dinamica quantistica emerge l’equazione di Dirac e con essa una nuova caratteristica
dell’elettrone (cosı̀ come di ogni altra particella quantistica), lo spin. In effetti non è necessaria l’invarianza
relativistica per ammettere l’esistenza di questi gradi di libertà addizionali, ma basta richiedere invarianza
sotto trasformazioni di Galileo (non relativistiche), tuttavia è in ambito relativistico che lo spin diventa
rilevante.
Storicamente lo spin è stato ipotizzato inizialmente per dare conto della presenza di un momento magnetico anomalo negli atomi, in aggiunta al momento magnetico assciato al moto orbitale ml = µ~B S. Gli
effetti di tale anomalia potevano essere spiegati supponendo che ogni particella, in particolare ogni elettrone,
avesse un momento giromagnetico addizionale della forma
ms = 2
µB
S,
~
con µB il magnetone di Bohr e S un momento angolare intrinseco dell’elettrone, lo spin appunto. L’osservabile
spin deve quindi essere un osservabile vettoriale S = (S1 , S2 , S3 ), le cui componenti devono soddisfare le
regole di commutazione del momento angolare
[Si , Sj ] = i~ijk Sk .
(9.1)
Questo implica che S è il generatore di una rappresentazione del gruppo SU2 , le cui rappresentazioni irriducibili sono 2S + 1-dimensionali, S un numero intero o semi-intero, cioè S ∈ N ∪ {0} oppure S = 2k−1
2 , k ∈ N.
115
116
Lo spazio di Hilbert dei gradi di libertà di spin è allora C2S+1 e in tale spazio una base è data dagli autovettori comuni |S, mi, m = −S, −S + 1, . . . , S, ad esempio, di S2 e S3 (si veda quanto detto nella Sezione
5.3):
S2 |S, mi = ~2 S(S + 1) |S, mi ,
S3 |S, mi = ~m |S, mi .
(9.2)
Lo spazio di Hilbert complessivo di una particella quantistica di spin S è quindi
H = L2 (R3 ) ⊗ C2S+1 ,
(9.3)
e lo stato è una collezione di 2S + 1 funzioni d’onda in L2 (R3 ). Le osservabili traslazionali come posizione
e impulso lasciano la componente di spin invariata, mentre, al contrario, le osservabili di spin agiscono solo
su C2S+1 .
Ad esempio nel caso dell’elettrone S = 12 e lo spazio di Hilbert di spin
è bidimensionale. Le osservabili
di spin si scrivono in termini delle matrici di Pauli e nella base { 21 , ± 12 } in cui sono diagonali S2 e S3 , si
ha
1 1
1 1
,+ = 1 ,
,− = 0 ,
(9.4)
2
2
2
2
0
1
1 0
0 1
0 −i
S3 = ~
,
S1 = ~
,
S2 = ~
.
(9.5)
0 −1
1 0
i 0
A questo punto c’è da fare una piccola digressione sulla differenza fra spin e momento angolare per come
lo abbiamo definito nella Sezione 5.3. Un modo di immaginare i gradi di libertà dello spin è infatti quello
di supporre che l’elettrone cosı̀ come le altre particelle abbia una dimensione e lo spin sia il generatore delle
rotazioni di tali oggetto attorno ai suoi assi. In realtà questo tipo di descrizione richiederebbe di introdurre
un numero ancora maggiore di gradi di libertà: se si comportasse come un corpo rigido classico l’elettrone
avrebbe bisogno di 6 (3 angoli e 3 coordinate spaziali) anziché 3 coordinate spaziale affinché la sua posizione
sia identificata univocamente nello spazio. Perciò possiamo usare tale descrizione solo a livello di analogia.
Notiamo però che benché S e L abbiano sostanzialemente propretà analoghe un’importante differenze
emerge nella descrizione dei gradi di libertà relativi: l’autospazio relativo all’autovalore ~2 `(` + 1) di L2 ha
anch’esso dimensione 2` + 1 ma ` può essere solamente intero, mentre a livello di rappresentazione anche
valori semi-interi sarebbero ammissibili, come avviene per lo spin. Questa differenza si spiega studiando il
comportamento degli operatori di rotazione1 generati da S e L: fissato un asse u e un angolo α, la rotazione
di tale angolo attorno a u è data da Us (α) = e−iαu·S , nello spazio di spin, e da Ul (α) = e−iαu·L nello
spazio dei gradi di libertà traslazionali. Ora nel caso in sui lo S sia semi-intero si vede immediatamente che
Us (0) = 1 ma Us (2π) = −1 mentre Ul (0) = Ul (2π) = 1, cioè la condizione ` ∈ N è collegata alla richiesta che
l’operatore di una rotazione di angolo 2π coincida con l’indentità . Questo ovviamente necessario nel caso
della parte di funzione d’onda Ψ(x), che descrive i gradi di libertà traslazionali: poiché Ψ(x) è una funzione
ovviamente Ψ(R(2π)x) = Ψ(x), dove R(2π) è una rotazione di angolo 2π attorno ad un asse qualunque.
Tale vincolo al contrario non sussiste nello spazio di Hilbert relativo ai gradi di libertà di spin, da cui il fatto
che S può essere semi-intero.
Ora che abbiamo introdotto lo spin, possiamo specificare più precisamente cosa intendiamo per particelle
identiche. In MQ due particelle che hanno le stesse caratteristiche fisiche, ovvero, massa, carica elettrica e,
appunto, spin, si dicono identiche. Cosı̀ tutti gli elettroni – particelle con massa me , carica −e e spin 21 –
sono identici fra di loro. Lo stesso vale per protoni, neutroni, etc.. Più precisamente quando parliamo di
oggetti fisici identici intendiamo che non esistono esperimenti per quanto complicati che possano permettere
di distinguere particelle uguali fra loro. A questo punto si inizia a intuire una differenza sostanziale con
quanto avviene in meccanica classica. Anche ammesso infatti che esistano due sistemi classici perfettamente
identici, è sempre possibile distinguirli a posteriori: risolvendo le equazioni del moto classiche per ciascun
1
In effetti a livello di teoria delle rappresentazione, la differenza segue dal fatto che sia S che L generano una rappresentazione
del gruppo delle rotazioni SO3 ma tale gruppo non è semplicemente connesso ed ammette due ricoprimenti dati dal gruppo
SU2 , che invece è semplicemente connesso, a seconda se il determinante della matrice sia 1 o −1. Allora sia S che L generano
SU2 e quindi un ricoprimento semplicemente connesso di SO3 . Nel caso di L solo quello generato per continuità dall’identità è
ammesso, mentre per S entrambi sono ammissibili.
117
sistema otteniamo due traiettorie univoche, assegnati i dati iniziali necessariamente distinti. Quindi se
immaginassimo un esperimento in cui i due sistemi evolvono simultaneamente a partire da dati iniziali
distinti, ad ogni tempo successivo potremmo distinguere con infinita precisione l’uno dall’altro semplicemente
seguendo a ritroso la traiettoria percorsa (a meno di casi patologici in cui le traiettorie si sovrappongono).
In MQ questa possibilità di distinzione a posteriori a partire dalla traiettoria percorsa non è semplicemente possibile e il motivo banale è che non esistono traiettorie in MQ: un sistema composto ad esempio
da 2 particelle identiche avrà una funzione d’onda in Ψ(x) ∈ L2 (R6 ) che evolve secondo l’equazione di
Schrödinger. Misurare una grandezza fisica relativa ad una particella equivale a agire su Ψ(x) con un operatore che coinvolge solo 3 coordinate spaziali, ma a quale oggetto queste coordinate si riferiscano non si
può dire. Naturalmente si possono pensare stati prodotto Ψ(x1 , x2 ) = Ψ1 (x1 )Ψ2 (x2 ) in cui la due particelle
sono distinguibili perché, ad esempio, i supporti di Ψ1 e Ψ2 sono disgiunti. Ma appena si accende l’evoluzione temporale, anche in assenza di interazione, il fenomeno di dispersione descritto nella Sezione 4.2 fa sı̀
che i supporti delle componenti tendano ad allargarsi e infine a occupare l’intero spazio, di fatto rendendo
impossibile la distinzione fra i due sottosistemi.
A livello matematico quanto abbiamo detto si concretizza nella richiesta che l’hamiltoniana di un sistema
di N particelle identiche H sia invariante per permutazioni ovvero
[H, P ] = 0,
(9.6)
per ogni P ∈ PN rappresentazione del gruppo delle permutazioni di N oggetti, cioè
(P Ψ) (x1 , . . . , xN ) = Ψ(xπ(1) , . . . , xπ(N ) ),
(9.7)
con π ∈ PN permutazione di N elementi. Perciò lo spazio di Hilbert deve essere sede di una rappresentazione irriducibile del gruppo delle permutazioni, che ammette due sole rappresentazioni unidimensionali
irriducibili, quella delle funzioni rispettivamente totalmente simmetriche e totalmente antisimmetriche sotto
pemutazioni qualunque. Naturalmente diciamo che Ψ ∈ L2 (RdN ) è totalmente simmetrica se per ogni coppia
i < j in {1, . . . , N }
(Pij Ψ) (x1 , . . . , xi , . . . , xj , . . . , xN ) = Ψ(x1 , . . . , xj , . . . , xi , . . . , xN ) = Ψ(x1 , . . . , xN ),
(9.8)
e totalmente antisimmetrica se
(Pij Ψ) (x1 , . . . , xi , . . . , xj , . . . , xN )Ψ = −Ψ(x1 , . . . , xN ).
(9.9)
Allora lo spazio di Hilbert L2 (R3N ) si decompone in L2 (R3N ) = L2s (R3N ) ⊕ L2a (R3N ), con ovvio significato
della notazione. C’è però a questo punto da fare un commento sui gradi di libertà di spin: se teniamo conto
anche dello spin, le rappresentazioni unidimensionali del gruppo delle permutazioni non sono più sufficienti ed
la decomposizione dello spazio di Hilbert H è più complicata, perché oltre ai sottospazi Hs e Ha degli stati
totalmente simmetrici o antisimmetrici, compaiono anche altri sottospazi sedi di rappresentazioni del gruppo
delle permutazioni di dimensione maggiore di 1. Non approfondiremo ulteriormente questa discussione. Per
ulteriori dettagli si veda [GP2, Capitolo 13] oppure [C-TDL2, Capitolo XIV].
Per riassumere quanto detto fin’ora formuliamo quello che possiamo considerare come un ulteriore
Postulato a completamento dei 5 che abbiamo dato nel Capitolo 2, come fondamenti della teoria della
MQ.
Postulato 6 (Principio di simmetrizzazione).
Uno stato puro di un sistema di particelle identiche deve essere totalmente simmetrico o antisimmetrico
sotto scambio di due qualunque di esse.
Osservazione 9.1. E’ cruciale osservare che il principio di simmetrizzazione si applica all’intera funzione
d’onda, gradi di libertà di spin inclusi. Si dovrebbe perció tenere conto di rappresentazioni più complesse di
quelle unidimensionali del gruppo delle permutazioni. Nel seguito però trascureremo completamente i gradi
di libertà di spin, non perché non siano rilevanti in assoluto, il che è appunto falso, ma perché assumeremo
118
che non influiscano sui i vincoli di simmetria della funzione d’onda. Per meglio chiarire
consideriamo il
N
2
3
2
caso di un sistema di elettroni: la funzione d’onda complessiva in ⊗ L (R ) ⊗ C deve essere totalmente
simmetrica o antisimmetrica sotto scambio, ma se la componente di spin è la stessa per ogni particella,
la parte di spin è totalmente simmetrica, e il vincolo di simmetria si trasferisce alla parte orbitale della
funzione d’onda. Assumerò perciò nel seguito che le componenti di spin di ogni elettrone siano uguali, cosı̀
che ogni altro vincolo di simmetria va a trasferirsi sulla componente in L2 (R3N ).
A questo punto possiamo finalmente enunciare il risultato che mette in relazione lo spin di una particella
con le proprietà di simmetria della funzione d’onda. Non forniremo la dimostrazione anche perché discende
dalla richiesta di invarianza relativistica in teoria dei campi e non è riproducibile nell’ambito della MQ non
relativistica:
Definizione 9.1 (Bosoni e fermioni).
Un particella quantistica è detta bosone/fermione se il suo spin è intero/semi-intero.
Teorema 9.1 (Teorema di spin e statistica).
Lo stato puro di un sistema di particelle identiche è totalmente simmetrico/antisimmetrico se le particelle
sono bosoni/fermioni.
Ovviamente se un sistema è composto da diverse specie di particelle identiche, li vincoli di simmetria devono
essere soddisfatti rispetto allo scambio di particelle della stessa specie, mentre nessuna condizione è imposta
sulla permutazione di particelle diverse.
Vediamo ora in un esempio semplice quali possono essere le conseguenze del Teorema di spin e statistica:
Esempio 9.1 (Sistema a due particelle)
Consideriamo un sistema a due particelle e prendiamo due stati Ψ1 , Ψ2 ortonormali, cioè normalizzati e
tali che Ψ1 ⊥ Ψ2 . Ci chiediamo che stato puro a due particelle identiche possiamo costruire a partire da
questi due: indipendentemente dalla richiesta di simmetria vorremmo costruire uno stato che sia il più vicino
possibile ad avere una particella nello stato Ψ1 e l’altra in Ψ2 . Se appunto non ci fossero vincoli di simmetria
allora lo stato prodotto Ψ1 (x1 )Ψ(x2 ) farebbe esattamente al caso nostro. Ma nel caso di particelle identiche
la risposta dipende in modo significativo dalle caratteristiche delle particelle:
• se le particelle sono bosoni, allora cerchiamo lo stato simmetrico più vicino a quello prodotto e
naturalmente esso sarà
1
√ (Ψ1 (x1 )Ψ2 (x2 ) + Ψ1 (x2 )Ψ2 (x1 )) .
2
• se le particelle sono fermioni, invece lo stato deve essere antisimmetrico e allora viene naturale
considerare
1
√ (Ψ1 (x1 )Ψ2 (x2 ) − Ψ1 (x2 )Ψ2 (x1 )) .
2
Si noti che è già evidente una differenza sostanziale fra bosoni e fermioni: nel caso fermionico non è sempre
possibile costruire lo stato, perché se Ψ1 = Ψ2 lo stato bosonico continuerebbe ad avere senso (a parte la
normalizzazione sbagliata), mentre quello fermionico sarebbe identicamente nullo.
Come suggerisce l’esempio, è interessante chiedersi come generare dato uno stato Ψ(x1 , . . . , xN ) a N particelle identiche, uno stato bosonico o fermionico. La risposta è piuttosto semplice e coinvolge i seguenti
operatori:
Definizione 9.2 (Simmetrizzatori).
Definiamo l’operatore di simmetrizzazione SN : L2 (R3N ) → L2s (R3N ) e quello di antisimmetrizzazione
AN : L2 (R3N ) → L2a (R3N ) come
1 X
Ψ(xπ(1) , . . . , xπ(N ) ),
(SN Ψ) (x1 , . . . , xN ) =
N!
π∈PN
1 X
(AN Ψ) (x1 , . . . , xN ) = √
(−1)|π| Ψ(xπ(1) , . . . , xπ(N ) ),
(9.10)
N ! π∈P
N
119
dove |π| è la parità della permutazione.
Esercizio 9.1. Dimostrare che gli operatori SN e AN sono proiettori ortogonali.
Quindi, in generale, assegnato Ψ ∈ L2 (R3N ), per costruire uno stato bosonico/fermionico è sufficiente applicare SN /AN . Naturalmente in questo secondo caso è possibile che non esista la versione antisimmetrizzata
di Ψ, perché AN Ψ = 0.
Un caso speciale di stato bosonico è quello in cui tutte le particelle sono nello stesso stato a una particella:
sia ψ ∈ L2 (R3 ) una funzione d’onda normalizzata, allora uno stato bosonico fattorizzato ha la forma
Ψ(x1 , . . . , xN ) = ⊗N ψ =
N
Y
ψ(xi ).
(9.11)
i=1
Nel caso fermionico questo stato non è ammissibile: se proviamo a costruire uno stato fermionico a N
particelle con M < N stati a una particella, non avremo mai successo. Possiamo infatti pensare di prendere
ad esempio lo stato prodotto
M
Y
ψi (xi ) · ψ1 (xM +1 ) · · · ψM −N (xN )
i=1
e poi antisimmetrizzarlo con AN . Ma dovendo ripetere almeno uno stato a singola particella nel prodotto,
l’azione dell’operatore di antisimmetrizzazione darebbe identicamente 0. Se vogliamo costruire uno stato
fermionico a N particelle da stati di singola particella, allora abbiamo bisogno di almeno N di tali stati: supponiamo di avere ψ1 , . . . , ψn normalizzati in L2 (R3 ), con ψi ⊥ ψj . Allora in questo caso si può effettivamente
costruire lo stato fermionico
AN
N
Y
1
ψi (xi ) = (ψ1 ∧ · · · ∧ ψN ) (x1 , . . . , xN ) = √ det {Ψi (xj )} ,
N!
i=1
(9.12)
che viene detto determinante di Slater.
Esercizio 9.2. Siano ψ1 , . . . , ψn e φ1 , . . . , φN in L2 (R3 ) normalizzate con ψi ⊥ ψj per i 6= j. Si dimostri
che
1. kψ1 ∧ · · · ∧ ψN k = 1;
2. hψ1 ∧ · · · ∧ ψN |φ1 ∧ · · · ∧ φN i = det hψi |φj i;
P
3. se A ∈ MN (C) e ξi = j Aij ψj , allora ξ1 ∧ · · · ∧ ξN = det(A) ψ1 ∧ · · · ∧ ψN .
9.2
Matrici Densità Ridotte
Fin qui abbiamo considerato soltanto stati puri di sistemi a molti corpi. In generale però , come abbiamo
visto nella Sezione 3.12, lo stato di un sistema quantistico può anche essere uno stato misto e come tale
rappresentato da una matrice densità Γ ∈ L 1 (L2 (R3N )). Nel caso in cui il sistema si trovi nello stato puro
Ψ ∈ L2 (R3N ), Γ = ΓΨ = |Ψi hΨ| e le seguenti proprietà sono facilmente dimostrate
TrΓΨ = 1,
ΓΨ ≥ 0,
Γ2Ψ = ΓΨ .
(9.13)
Proprietà simili, eccetto l’ultima, sono soddisfatte anche nel caso generico
TrΓ = 1,
0 ≤ Γ ≤ 1.
(9.14)
Ricordiamo che, in quanto operatore di classe traccia, per ogni matrice densità vale la decomposizione
Γ=
∞
X
j=1
λj ΓΨj =
∞
X
j=1
λj |Ψj i hΨj | ,
(9.15)
120
dove 0 ≤ λj ≤ 1,
kernel
P
λj = 1 e {Ψj }j∈N è un s.o.n.c.. Inoltre Γ può anche visto come operatore integrale con
Γ(X; Y) =
∞
X
λj Ψ∗j (Y)Ψj (X),
(9.16)
j=1
dove abbiamo usato la notazione compatta
X = (x1 , . . . , xN ) ,
Y = (y1 , . . . , yN ) .
(9.17)
Si noti che per ogni Γ ∈ L 1 (R3N ) vale anche la formula
TrΓ =
∞
X
Z
dX Γ(X; X),
λj =
(9.18)
R3N
j=1
dove la seconda identità, benché vera, richiede di essere commentata: a rigor di logica Γ(X; X) non sarebbe
ben definito, anche scegliendo un rappresentativo e intendendo l’identità q.o., ma perché Γ ∈ L1 (R6N ) e
la varietà (X, X) ha misura nulla in L1 (R6N )! Tuttavia vi è un modo per dare significato all’espressione
ovviando a questa ostruzione ed è quello di intendere
Γ(X; X) =
∞
X
λj |Ψj (X)|2 ,
j=1
che è una funzione ben definita grazie alle proprietà delle Ψj .
Nella Sezione precedente abbiamo descritto la relazione fra la simmetria sotto permutazioni degli stati
puri e le propriete.lle particelle identiche coinvolte. Per capire quali condizioni di simmetria si applichino
agli stati misti e alle matrici densità è sufficiente fra riferimento alla (9.16): se Γ è uno stato puro o misto
di un sistema di particelle identiche allora le Ψj devono soddisfare le richieste di simmetria del Teorema di
spin e statistica 9.1. Perciò il kernel Γ(X; Y) deve essere separatamente simmetrico/antisimmetrico sotto
scambio di i 6= j nelle X e nelle Y.
Una delle conseguenze più rilevanti delle proprietà di simmetria di Γ è che si osservano proprietà di
singola particella, o, più precisamente, se si fanno esperimenti che coinvolgono solo osservabili di singola
particella, non è necessario usare tutta l’informazione contenuta in Γ. Similmente nel caso in cui ci si
restringa a osservabili che coinvolgono k < N particelle. In effetti, data Γ, è possibile definire un operatore
semplificato che contiene tutta l’informazione riguardo ai sottosistemi di k < N particelle:
Definizione 9.3 (Matrici densità ridotte).
Data una matrice densità normalizzata Γ ∈ L 1 (L2 (R3N )), la matrice densità ridotta γ (k) ∈ L 1 (L2 (R3k ))
di ordine k ≤ N è l’operatore integrale con kernel
Z
N!
(k)
γ (x1 , . . . , xk ; y1 , . . . , yk ) =
dyk+1 · · · dyN Γ(x1 , . . . , xk , yk+1 , . . . , yN ; Y),
(9.19)
(N − k)! R3(N −k)
e indicheremo sinteticamente γ (k) = TrN −k Γ.
Osservazione 9.2. La definizione del kernel (9.19) ha gli stessi problemi della (9.18), in quanto coinvolge
la valutazione di Γ(X; Y) parzialmente sulla diagonale. Di nuovo per ovviare a questo problema è sufficiente
pensare la (9.19) in termini della (9.16).
Osservazione 9.3. Il prefattore nella (9.19) è solamente una convenzione che fa sı̀ che
Trγ (k) =
N!
,
(N − k)!
(9.20)
ma gioca anche un ruolo fisico: la scelta delle N −k coordinate su cui integrare nel caso di particelle identiche
è ovviamente arbitrario. Lo stesso però non vale se le particelle fossero distinguibili: in questo caso per fare
121
in modo che la definizione sia ben posta, si dovrebbe sommare su tutte le possibili scelte di N − k variabili
!
fra le N da cui dipende Ψ. E’ facile vedere che il numero di scelte possibili è proprio (NN−k)!
.
Infine si noti che nel caso k = 1, cioè per la matrice densità ridotta a una particella, la normalizzazione
è
Trγ (1) = N.
(9.21)
Osservazione 9.4. Se A è un’osservabile che coinvolge solo k < N particelle identiche, ovvero, per esempio,
A = A(x1 , . . . , xk ), allora per ogni scelta delle k particelle
hAi = TrL2 (R3N ) (AΓ) = TrL2 (R3k) Aγ (k) .
(9.22)
Esercizio
P9.3. Dimostrare che nel caso fermionico la matrice densità ridotta di un determinante di Slater
è γ (1) = |ψj i hψj |.
L’Osservazione 9.4 è particolarmente importante per il tipo di problema che stiamo considerando: se
consideriamo un’Hamiltoniana a N corpi della forma
H=
N
X
− 12 ∆j + V (xj ) +
j=1
X
I(xi , xj ),
(9.23)
1≤i<j≤N
come nel caso della (8.2), la sua aspettazione su un generico stato Γ si può esprimere totalmente in termini
delle matrici densità ridotte γ (1) e γ (2) :
(9.24)
E[Ψ] = h Ψ |H| Ψ i = TrL2 (R3 ) hγ (1) + 21 TrL2 (R6 ) Iγ (2) ,
dove h = − 21 ∆ + I.
Esercizio 9.4. Si derivi la (9.24).
Nella ricerca dello stato fondamentale di H si sarebbe allora portati a minimizzare rispetto a γ (1) e γ (2) ,
ottenendo cosı̀ una sensibile semplificazione del problema. C’è però un problema per nulla banale e cioè
identificare il corretto dominio di minimizzazione per le matrici densità ridotte. Più precisamente è necessario
sapere quali operatori classe traccia su L2 (R3 ) e L2 (R6 ) sono matrici densità ridotte associabili a uno stato
a N corpi bosonico o fermionico. Questo è quello che storicamente è stato chiamato problema della N rappresentabilità e, al contrario di quanto si possa pensare, è un problema ancora aperto, eccetto che per
le matrici densità ridotte a un corpo. Vediamo prima però il risultato opposto, che caratterizza le matrici
densità ridotte a un corpo bosoniche e fermioniche:
Proposizione 9.1 (Poprietà delle matrici densità ridotte).
Sia γ (1) = TrN −1 Γ una matrice densità ridotta associata allo stato misto Γ, allora
i) γ (1) è autoaggiunta e γ ≥ 0;
ii) γ (1) ∈ L 1 (L2 (R3 )) e Trγ (1) = N ;
iii) se Γ è uno stato fermionico, allora γ (1) ≤ 1.
Dimostrazione. Abbiamo sostanzialmente già visto le proprietà i) e ii), per cui dimostreremo esclusivamente
la iii) nel caso fermionico.
Introduciamo gli operatori di creazione e distruzione di una particella nello stato Φ: l’operatore di
distruzione CΦ,N : L2a (R3N ) −→ L2a (R3(N −1) ) è dato da
√ Z
(CN,Φ Ψ) (x1 , . . . , xN −1 ) = N
dx Φ∗ (x)Ψ(x1 , . . . , xN −1 , x),
(9.25)
R3
122
†
mentre l’operatore di creazione (aggiunto di CN,Φ ) CN,Φ
: L2a (R3(N −1) ) −→ L2a (R3N ) è
1
†
CN,Φ
Ψ (x1 , . . . , xN ) = √ AN (Ψ(x1 , . . . , xN −1 )Φ(xN )) .
N
(9.26)
Gli operatori cosı̀ definiti soddisfano la seguente relazione, la cui dimostrazione è lasciata per esercizio al
lettore:
†
†
CN,Φ
CN,Φ + CN +1,Φ CN
(9.27)
+1,Φ = kΦkL2 (R3 ) 1N ,
dove abbiamo indicato con 1N l’identità in L2 (R3N ).
Supponiamo ora che lo stato fermionico in questione sia puro e commentiamo in seguito sui cambiamenti
da fare nel caso di stato misto. Se Γ = ΓΨ per una certa Ψ ∈ L2 (R3N ) normalizzata, usando la (9.27)
otteniamo, per ogni Φ ∈ L2 (R3 ),
E Z
D (1) Φ γ Φ =
Z
Z
dx1 Φ∗ (x01 )Ψ∗ (x01 , x2 , . . . , xN )Ψ(x1 , . . . , xN )Φ(x1 )
D E
†
= hCN,Φ Ψ |CN,Φ Ψ iL2 (R3(N −1) ) = Ψ CN,Φ
CN,Φ Ψ 2 3N
L (R )
2
D E
†
†
= kΦk2L2 (R3 ) kΨk2L2 (R3N ) − Ψ CN,Φ CN,Φ
Ψ 2 3N = kΦk2L2 (R3 ) − CN,Φ
Ψ 2 3N ≤ kΦk2L2 (R3 ) .
R3(N −1)
dx2 · · · dxN
R3
dx01
R3
L (R
)
L (R
)
Nel caso in cui invece Γ sia uno stato misto possiamo usare la decomposizione (9.16), cosı̀ che l’identità
precedente diventa
∞
E X
D (1) Φ γ Φ =
λj hCN,Φ Ψj |CN,Φ Ψj iL2 (R3(N −1) )
j=1
= kΦk2L2 (R3 )
∞
X
λj kΨj k2L2 (R3N ) −
j=1
∞
X
j=1
2
†
λj CN,Φ
Ψj 2
L (R3N )
≤ kΦk2L2 (R3 ) .
Come anticipato, vale anche il viceversa, cioè ogni operatore classe traccia su L2 (R3 ) che soddisfa le proprietà
descritte nel Teorema precedente è la matrice densità ridotta a un corpo di uno stato a N corpi. Questo
risolve il problema della N rappresentabilità per k = 1: si noti però la differenza fra il caso fermionico, in
cui lo stato a N corpi non è necessariamente puro, e quello bosonico in Γ è puro se ci sono almeno due
particelle.
Teorema 9.2 (Rappresentabilità).
Sia γ ∈ L 1 (L2 (R3 )) tale che γ ≥ 0 e Trγ = N , allora
• ∃Γ matrice densità a N corpi bosonica, tale che γ = N TrN −1 Γ; inoltre se N ≥ 2, Γ può essere scelto
uno stato puro, cioè Γ = ΓΨ per una qualche Ψ ∈ L2 (R3N );
• se in aggiunta γ ≤ 1, allora ∃Γ matrice densità a N corpi fermionica, tale che γ = N TrN −1 Γ.
Osservazione 9.5. L’assenza di un analogo del teorema precedente per k ≥ 2 fa sı̀ che la riscrittura
(9.24) non sia in realtà significativa al fine di minimizzare l’energia, perché resta ignoto il dominio di
minimizzazione.
9.3
Sistemi a Molti Corpi Non Interagenti
La discussione del problema della N rappresentabilità della Sezione precedente suggerisce che, in presenza di
interazione, cioè per I 6= 0, la simmetria della funzione d’onda, benché permetta una semplificazione drastica
nel calcolo dell’energia, non è in realtà di nessun aiuto nella ricerca dello stato fondamentale. Tuttavia nel
123
caso più semplice di sistemi non interagenti, cioè quando I = 0, è immediato vedere che (9.24) si riduce
a un’espressione che coinvolge solo γ (1) , la matrice densità a un corpo. In questo caso, quindi, grazie al
Teorema 9.2, il dominio di minimizzazione della (9.24) è noto esplicitamente, sia nel caso bosonico che in
quello fermionico. Vedremo infatti che lo stato fondamentale e la relativa energia possono essere determinati
esplicitamente sia nel caso bosonico che fermioni.
Consideriamo allora un sistema a molti corpi con Hamiltoniana
H=
N
X
N
X
{−∆j + V (xj )} =
j=1
h(xj ),
(9.28)
j=1
e studiamone lo stato fondamentale nel caso fermionico e bosonico. Assumiamo inoltre che il potenziale
soddisfi le condizioni del Teorema 6.2 e che l’energia dello stato fondamentale e0 di h sia finita e strettamente
negativa, cosı̀ che ne possiamo dedurre l’esistenza di M stati legati per h = −∆ + V di energia
− ∞ < e0 ≤ e1 ≤ · · · ≤ 0,
(9.29)
con autofunzioni ortonormali ψ0 , . . . , ψM −1 . Indichiamo inoltre
b/f
E0
=
inf
Ψ∈L2s/a (R3N ),kΨk=1
h Ψ |H| Ψ i ,
(9.30)
e sia Ψ0 un minimizzatore associato.
Iniziamo dal caso bosonico:
Teorema 9.3 (Stato fondamentale di N bosoni non interagenti).
Sia H definita come in (9.28) e sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte. Se inoltre
−∞ < e0 < 0, allora
N
−1
Y
E0b = N e0 ,
Ψ0 =
ψ0 (xi ).
(9.31)
i=0
Dimostrazione. Grazie alle ipotesi su V e e0 , abbiamo da un lato che h ≥ e0 e quindi H ≥ N e0 , ma se Ψ0
è lo stato prodotto (9.31), allora h Ψ0 |H| Ψ0 i = N e0 e quindi Ψ0 è lo stato fondamentale.
Nel caso fermionico invece il comportamento è molto meno banale e può essere considerato una prima
manifestazione del principio di esclusione di Pauli.
Teorema 9.4 (Stato fondamentale di N fermioni non interagenti).
Sia H definita come in (9.28) e sia V tale che le ipotesi del Teorema 6.2 siano soddisfatte. Se inoltre
−∞ < e0 ≤ e1 ≤ · · · ≤ eM −1 ≤ 0 sono gli stati legati di h con autofunzioni ortonormali ψ0 , . . . , ψM −1 ,
allora
• se M ≥ N , E0f =
N
−1
X
i=0
• se M < N , E0f =
M
−1
X
ei e lo stato fondamentale è Ψ0 =
N
^
ψi ;
i=1
ei e non esiste stato fondamentale.
i=0
Osservazione 9.6. Nel caso in cui M ≥ N , se tutti i livelli energetici e0 , . . . , eM sono occupati da fermioni,
allora Ψ0 è anche unico, benché non sia necessariamente unico il modo di scriverlo come determinante di
Slater: nel caso in cui ci sia degenerazione di uno o più dei livelli energetici, la scelta delle ψ0 , . . . , ψM non
è infatti unica.
Osservazione 9.7. Come si può facilmente intuire dalla dimostrazione, la non esistenza dello stato
fondamentale per M < N segue dal fatto che le successioni minimizzanti non convergono in L2 (R3 ).
124
Osservazione 9.8. Il Teorema 9.4 si può pensare come una conseguenza del principio di esclusione di Pauli
Nel contesto del Teorema e quindi nel caso di fermioni non interagenti, il principio di esclusione di Pauli
si può formulare nel modo seguente: due fermioni identici non possono occupare lo stesso stato ψi a una
particella. Il fatto che da questo discenda il comportamento dello stato fondamentale è di semplice verifica.
Dimostrazione. Dimostriamo anzitutto una stima dal basso per l’energia. Sia Ψ ∈ L2a (R3N ) uno stato
fermionico a N corpi, ΓΨ la matrice densità e γ (1) la matrice densità ridotta a un corpo associate a Ψ.
Allora
in quanto operatore di classe traccia esisteranno {φj }j∈N s.o.n.c. e dei coefficienti λj ≥ 0, tali che
P
λj = N e
∞
X
γ (1) =
λj |φj i hφj | .
(9.32)
j=1
L’energia di Ψ si riscrive allora
E[Ψ] =
N
X
λj h φj |h| φj i ,
(9.33)
j=1
ma l’ortonormalità delle ψj implica che si possa scrivere
φj =
M
X
χj ∈ span {ψ0 , . . . , ψM −1 }⊥ ,
cj` ψ` + χj ,
`=0
e
M
−1
X
1 = kφj k22 =
|cj` |2 + kχj k22 ,
`=0
da cui segue che
M
−1
X
|cj` |2 ≤ 1.
(9.34)
`=0
Notiamo inoltre che poiché χj sta nel sottospazio ortogonale a tutti gli stati legati deve essere in
Eh (0, +∞)L2 (R3 ) e quindi
h χj |h| χj i ≥ 0.
(9.35)
L’ortogonalità degli ψj e il fatto che sono autostati implica anche che
h ψj |h| ψk i = ej δjk ,
h χj |h| ψk i = 0.
Mettendo insieme le (9.35) e (9.36) con la (9.33) otteniamo
E[Ψ] ≥
∞
X
λj
M
−1
X
j=1
dove
µ` =
∞
X
λj |cj` |2 ≤
j=1
|cj` |2 e` =
`=0
∞
X
µ ` e` ,
`=0
|cj` |2 =
j=1
M
−1
X
∞
X
|hφj |ψ` i|2 = kφ` k22 = 1,
j=1
poiché {φj }j∈N è un s.o.n.c.. Inoltre
M
−1
X
`=0
per la (9.34).
µ` =
∞
X
j=1
λj
M
−1
X
`=0
|cj` |2 ≤
∞
X
j=1
λj = N,
(9.36)
125
Abbiamo pertanto dimostrato che
E[Ψ] ≥ inf
(M −1
X
M
−1
X
µ` e` 0 ≤ µ` ≤ 1,
µ` = N
`=0
)
.
`=0
Il problema variazione al membro di destra può essere risolto facilmente assegnando µ` = 1 agli stati
` = 0, 1, . . ., finché o si esauriscono gli stati oppurePsono stati assegnati N coefficienti. Nel primo caso vuol
−1
dire che M < N e il membro di destra è dato da M
i=0 ei , mentre nel secondo M ≥ N e la somma arriva
fino a N − 1. Questo conclude la dimostrazione della stima dal basso.
Per completare la dimostrazione del Teorema dobbiamo dimostrare una stima dall’alto che coincida con
la stima dal basso: se M ≥ N lo stato di prova è proprio lo stato fondamentale
Ψ0 =
N^
−1
ψi ,
i=0
mentre se M < N dobbiamo costruire una successione di stati della forma
ψ0 ∧ · · · ∧ ψM −1 ∧ ξ1 ∧ · · · ∧ ξN −M ,
dove gli stati ξj devono essere scelti in modo da essere ortonormali, appartenere a Eh [0, +∞)L2 (R3 ) ed essere
supportati in compatti che si allontanano verso l’infinito, con energia cinetica che tende a zero, cioè in altri
termini essere quasi autostati con energia che tende a 0. Osserviamo che l’esistenza di una successione di
stati con queste proprietà è abbastanza semplice da dimostrare (ometteremo però i dettagli), ma un’ipotesi
cruciale è che il potenziale tenda a 0 quando |x| → ∞. Per fare un esempio concreto, prendiamo un potenziale
a supporto compatto contenuto in BR0 , allora una scelta possibile è quella di prendere degli approssimanti
C ∞ , opportunamente normalizzati, delle funzioni caratteristiche delle corone circolari {R ≤ |x| ≤ R + j},
dove R 1 e R > R0 . Nel limite R → ∞ si avrà che h ξj |h| ξj i → 0 e allo stesso tempo h ψj |h| ξk i = 0, cosı̀
P −1
riproducendo l’energia M
i=0 ei .
Esercizio 9.5. Si scriva esplicitamente la successione degli stati descritta alla fine della dimostrazione del
Teorema 9.4 e si verifichi che soddisfa le proprietà richieste.
9.4
Stabilità di Seconda Specie e Proprietà Preliminari
Torniamo ora all’Hamiltoniana della materia (8.2), ovvero
H(N, M, R, Z) =
N
X
− 12 ∆i + αVC (X; R, Z),
i=1
dove il potenziale VC è stato definito nelle (8.4) - (8.7). Nel Capitolo 8 abbiamo studiato la stabilità di
prima specie del sistema descritto da H e, a tale scopo, abbiamo trascurato i vincoli di simmetria dovuti
alla presenza di particelle identiche e considerato lo stato fondamentale assoluto E0,a definito nella (8.9)
(si veda anche il Teorema 8.1). Tuttavia per affrontare la questione più sottile della stabilità di seconda
specie come descritta nell’introduzione a questa parte del corso, dobbiamo tener conto della simmetria della
funzione d’onda. Osserviamo infatti che le particelle descritte da H sono in effetti elettroni e, come tali,
sono un sistema di particelle identiche fermioniche (l’elettrone ha spin 1/2). Pertanto la funzione d’onda del
sistema a N elettroni deve essere totalmente antisimmetrica. Definiamo perciò
E0 (N, M, R, Z) =
inf
Ψ∈DN,f
E[Ψ],
(9.37)
con DN,f = Ψ ∈ H 1 (R3N ) ∩ L2a (R3N ) | kΨk = 1 . Si noti che l’unica differenza con E0,a sta nella restrizione della minimizzazione alle funzioni antisimmetriche. Per convenienza introduciamo anche il minimo
dell’energia E0 al variare della posizione dei nuclei, cioè
E0 (N, M, Z) =
inf
R∈R3M
E0 (N, M, R, Z).
(9.38)
126
Possiamo ora dire con precisione cosa intendiamo con stabilità di seconda specie:
Definizione 9.4 (Stabilità di seconda specie).
Diciamo che il sistema descritto da H è stabile di seconda specie se, per ogni Z tale che Zj ≤ Z < +∞,
∃C(Z) < +∞ tale che
E0 (N, M, Z) ≥ −C(Z)(N + M ).
(9.39)
Nel Capitolo 12 spiegheremo come la stabilità di seconda specie sia sufficiente per spiegare i fenomeni
descritti all’inizio di questa parte del corso. Per ora formuleremo dei risultati preliminari che saranno di
grande aiuto nella dimostrazione della stabilità di seconda specie, o, più in generale, daranno informazioni
preziose sul comportamento dello stato fondamentale di un sistema a molti corpi interagenti.
Un proprietà interessante riguarda la relazione fra E0,a , lo stato fondamentale assoluto, e lo stato
fondamentale bosonico, ovvero
E0,b (N, M, R, Z) = inf E[Ψ],
(9.40)
Ψ∈DN,b
con DN,b
= Ψ ∈ H 1 (R3N ) ∩ L2s (R3N ) | kΨk = 1 :
Teorema 9.5 (Stato fondamentale assoluto e bosonico).
Per ogni R ∈ R3M e Z ∈ RM tale che Zj ≤ Z < +∞, si ha
E0,a (N, M, R, Z) = E0,b (N, M, R, Z).
(9.41)
Osservazione 9.9. Abbiamo enunciato il risultato relativamente all’Hamiltoniana (8.2) ma esso non dipende dal fatto che il potenziale sia quello coulombiano né che sia a due corpi. Come suggerisce il Lemma
9.1 si tratta di un fatto molto più generale. Va però detto che in presenza di campi magnetici può essere
falso.
Dimostrazione. La forma quadratica E[Ψ] è limitata dal basso e manifestamente invariante per permutazioni.
Inoltre la disuguaglianza diamagnetica implica che E[Ψ] ≥ E[|Ψ|], per cui possiamo applicare il Lemma 9.1,
che dà direttamente il risultato.
Lemma 9.1 (Forme quadratiche simmetriche).
Sia E[Ψ] : L2 (R3N ) → R una forma quadratica limitata dal basso, cioè tale che ∃C < +∞, E[Ψ] ≥ −C kΨk22 .
Se inoltre E[Ψ] è invariante per permutazioni di particelle e E[Ψ] ≥ E[|Ψ|], allora
inf E[Ψ] =
kΨk=1
inf
Ψ∈L2s (R3N ),kΨk=1
E[Ψ].
(9.42)
Dimostrazione. Supponiamo che esista il minimizzatore Ψ0,a assoluto, cioè
E0,a = E[Ψ0,a ] = inf E[Ψ].
kΨk=1
Allora possiamo assumere che sia positivo Ψ0,a ≥ 0 grazie all’ipotesi fatte su E[Ψ]. Inoltre possiamo
decomporre
Ψ0,a = Ψs + Ψr ,
dove
Ψs = SN Ψ0,a =
1 X
Ψ0,a (xπ(1) , . . . , xπ(N ) ) ≥ 0,
N!
π∈PN
e
kΨ0,a k22
=
kΨs k22
E[Ψr , Ψs ] =
+
1
(N !)2
kΨr k22
X
poiché Ψs ⊥ Ψr . Il fatto che E[Ψ] sia invariante per permutazioni implica che
E[Ψπ , Ψ0,a − Ψσ ] =
π,σ∈PN
1
(N !)2
X
E[Ψ0,a , Ψπ−1 − Ψπ−1 σ ]
π,σ∈PN

=
1
(N !)2
X

X

σ∈PN
π∈PN
E[Ψ0,a , Ψπ−1 ] −
X
π 0 ∈P
N
E[Ψ0,a , Ψπ0 −1 ] = 0,
127
dove abbiamo usato la notazione sintetica
Ψπ (x1 , . . . , xN ) = Ψ(xπ(1) , . . . , xπ(N ) ).
Quindi
E0,a = E[Ψ0,a ] = E[Ψs ] + E[Ψr ].
Inoltre
kΨs k22 =
1
(N !)2
X
hΨπ |Ψσ i ≥
π,σ∈PN
(9.43)
X
1
1
kΨπ k22 =
> 0,
2
(N !)
N!
π∈PN
e quindi lo stato Ψs non è nullo. Sappiamo allora che deve valere
E[Ψs ] ≥ E0,a kΨs k22 ,
E[Ψr ] ≥ E0,a kΨr k22 ,
per definizione di minimo, ma queste stime combinate con l’identità (9.43), implicano immediatamente che
E[Ψs ] = E0,a kΨs k22 e quindi il minimo sulle funzioni simmetriche coincide con il minimo assoluto.
L’argomento precedente si applica se esiste un minimizzatore assoluto, ma se non dovesse esistere,
basterebbe applicare l’intera discussione ad una successione minimizzante.
Un altro risultato preliminare sul comportamento dello stato fondamentale dell’Hamiltoniana (8.2) riguarda
la dipendenza dalla carica nucleare Z:
Teorema 9.6 (Monotonia nella carica nucleare).
Se Zj ≤ Z < +∞ per ogni j = 1, . . . , M , allora
E0 (N, M, R, Z) ≥ min
E0 (N, M 0 , R0 , (Z, . . . , Z)).
0
(9.44)
R ⊂R
Se inoltre Zj ≤ Zj0 per ogni j = 1, . . . M , allora
E0 (N, M, Z) ≥ E0 (N, M, Z0 ).
(9.45)
Osservazione 9.10. La prima disuguaglianza (9.44) suggerisce che il minimo venga raggiunto rimpiazzando
Zj o con Z oppure con 0, cioè rimuovendo il corrispondente nucleo.
Dimostrazione. L’energia E[Ψ] è una funzione lineare di Zj per ogni j, fissate le altre Zk , k 6= j. Poiché
E0 (N, M, R, Z) è il minimo di una funzione lineare, esso deve essere una funzione concava di Zj : poniamo
(1)
(2)
Zj = αZj + (1 − α)Zj per un certo α ∈ (0, 1) e indichiamo con una label la dipendenza di E[Ψ] da Zj .
Allora abbiamo
inf EαZ (1) +(1−α)Z (2) [Ψ] = inf
αEZ (1) [Ψ] + (1 − α)EZ (2) [Ψ]
kΨk=1
j
j
kΨk=1
j
j
≥ α inf EZ (1) [Ψ] + (1 − α) inf EZ (2) [Ψ].
kΨk=1
j
kΨk=1
j
Si noti che invece E0 non è unitamente concavo in tutte le Zj . In ogni caso, fissate le altre Zk , k 6= j, l’energia
dello stato fondamentale E0 , in quanto funzione concava di Zj , raggiunge il suo minimo in Zj ∈ [0, Z] ai
bordi dell’intervallo, quindi o in Zj = 0 oppure in Zj = Z. Applicando a tutte le Zj separatamente tale
argomento si ottiene la (9.44).
Se ora minimizziamo rispetto alle posizioni dei nuclei abbiamo che E0 (N, M, Z) non può essere una
funzione crescente stretta nell’intorno di Zj = 0: se infatti lo fosse avremmo che
inf E0 (N, M, Z, R) > inf E0 N, M, Z|Zj =0 , R ,
R∈R3M
R∈R3M
ma questo è impossibile perché la configurazione con Zj = 0 è già compresa nell’inf rispetto a R, in quanto
corrisponde a mandare la posizione del j-esimo nucleo all’infinito. Perciò E0 deve essere descrescente attorno
a Zj = 0 per ogni j fissato. Ma allora per concavità il minimo deve essere in Zj = Z e la funzione deve
essere descrescente in Zj in tutto l’intervallo [0, Z].
Capitolo 10
Disuguaglianze di Lieb-Thirring
L’utilità delle disuguaglianze di Lieb-Thirring in fisica matematica non può essere sottostimata, anche grazie
alle innumerevoli applicazioni nei campi più disparati. Vedremo infatti che esistono versioni differenti ma
equivalenti di tale disuguaglianze: da un lato infatti si tratterà di stime relative alle proprietà spettrali, e, più
specificamente, degli stati legati di operatori di Schrödinger tipicamente a una particella. Allo stesso tempo
però dimostreremo un enunciato perfettamente equivalente che si applica alla stima dell’energia cinetica di
un sistema a molti corpi bosonico o fermionico. In questo secondo caso, l’applicazione delle disuguaglianze
di Lieb-Thirring alla stima dal basso dell’energia cinetica di N fermioni può considerarsi una formulazione
matematicamente rigorosa del principio di esclusione di Pauli.
La formulazione originaria e quella anche più studiata riguarda le proprietà spettrali di un operatore di
Schrödinger
h = −∆ + V
(10.1)
in L2 (Rd ).
Teorema 10.1 (Disuguaglianze di Lieb-Thirring).
Sia h l’operatore di Schrödinger (10.1) e supponiamo che il potenziale V soddisfi le ipotesi dei Teoremi 6.2 e
7.1. Siano allora −∞ < E0 ≤ E1 ≤ · · · ≤ 0 i suoi autovalori negativi, allora esiste una costante Lγ,d < +∞
tale che, se V− ∈ Lγ+d/2 (Rd ),
Z
X
γ+d/2
|Ej |γ ≤ Lγ,d
dx V−
(x),
(10.2)
j≥0
dove
Rd
γ ≥ 12 , se d = 1;
γ > 0, se d = 2;
γ ≥ 0, se d ≥ 3.
Osservazione 10.1. Per il valore esplicito della costante Lγ+d/2 rimandiamo ad esempio a [LSe, Teorema
4.1]. Il valore ottimale della costante è noto in alcuni casi, mentre in altri resta a tutt’oggi un problema
aperto.
Osservazione 10.2. Fra le somme di Riesz degli autovalori, recitano un ruolo particolarmente importante
quelle per γ = 0 e γ = 1. Nel secondo caso si tratta proprio della somma del valore assoluto degli autovalori
negativi di h e, come vedremo, tale stima sarà cruciale nella dimostrazione della stabilità della materia di
seconda specie: il collegamento con un sistema diPN fermioni sarà fornito dal Teorema 9.4: l’energia dello
stato fondamentale di N fermioni interagenti è
ej e quindi può essere stimata dal basso con l’integrale
della parte negativa del potenziale alla potenza 1 + d/2.
Nel caso γ = 0 invece la disuguaglianza di Lieb-Thirring fornisce una stima dall’alto per il numero di
autovalori negativi di h. L’importanza del risultato è tale che la stima ha una denominazione a parte –
stima di Cwikel, Lieb, Rosenblum – e uno dei motivi è che la dimostrazione generica delle stime di
Lieb-Thirring non si applica al caso γ = 0, per cui opportune correzioni sono richieste.
128
129
Osservazione 10.3. Sotto ipotesi deboli sul potenziale vettore A, le disuguaglianze di Lieb-Thirring rimangono valide anche in presenza di campi magnetici. Inoltre ne esiste una versione
semi-relativistica in cui
p
l’energia cinetica classica 12 p2 è rimpiazzata dall’analogo relativistico |p| ' p2 + m2 − m2 .
La dimostrazione del Teorema 10.1 sarà fornita alla fine del Capitolo. Prima enunciato una versione
equivalente del Teorema 10.1, che è quella usata nella versione originale della dimostrazione della stabilità
della materia. Anticipiamo che in termini sintetici tale disuguaglianza dice che l’energia cinetica di un
sistema di fermioni cresce come la potenza 5/3 della densità ρΨ (x) a una particella.
La disuguaglianza è in effetti banale per il sistema elementare costituito da una singola particella: via
la disuguaglianza di Sobolev (Lemma 6.1) abbiamo per ogni Ψ ∈ H 1 (R3 ) normalizzata
Z
dx |Ψ(x)|
T [Ψ] ≥ S3
6
1/3
= S3 kρΨ k3 ,
R3
dove abbiamo posto ρΨ = |Ψ|2 , ma usando Hölder abbiamo anche che
5/3
2/3
kρΨ k5/3 ≤ kρΨ k1 kρΨ k3 = kρΨ k3 ,
da cui concludiamo che
Z
T [Ψ] ≥ S3
R3
5/3
dx ρΨ (x).
(10.3)
Prima di enuciare il Teorema, ricordiamo che per un sistema a molti corpi
ρΨ (x) = γ (1) (x; x),
(10.4)
e che pertanto la normalizzazione di ρΨ è
kρΨ k1 = N.
Si ricordi infine che per ogni operatore compatto autoaggiunto γ vale la decomposizione γ =
e
kγk∞ = kγk = sup |λj |.
(10.5)
P
λj |Ψj i hΨj |
(10.6)
j∈N
Teorema 10.2 (Stima dal basso per l’energia cinetica).
Per ogni Ψ ∈ H 1 (RdN ) esiste K > 0 indipendente da Ψ tale che
Z
K
1+ 2
T [Ψ] ≥ dx ρΨ d (x).
2/d
γ (1) Rd
(10.7)
∞
Osservazione 10.4. La disuguaglianza vale in effetti nel caso più generale in cui 1 + 2/d sia rimpiazzato da
q e 2/d da q/p, con p1 + 1q = 1. Inoltre la costante K è strettamente collegata a quella della disuguaglianza
(10.2) via
(pL1,d )q (qK)p = 1.
(10.8)
Osservazione 10.5. Abbiamo enunciato il Teorema per stati puri, ma ne esiste una versione che si applica
agli stati misti e alle matrici densità.
Dimostreremo fra poco l’equivalenza del Teorema 10.2 con il Teorema 10.1 (con γ = 1). Prima però
discutiamo le conseguenze del Teorema 10.2 sul comportamento di un sistema di N fermioni:
Corollario 10.1 (Energia cinetica di N fermioni in R3 ).
Sia Ψ ∈ H 1 (R3N ) ∩ L2a (R3N ) uno stato di N fermioni, allora (con K stessa costante della (10.7))
Z
5/3
T [Ψ] ≥ K
dx ρΨ (x).
Rd
(10.9)
130
Osservazione 10.6. Come conseguenza della (10.9) l’energia cinetica di N fermioni in una regione limitata
Ω cresce come N 5/3 : applicando Hölder
3/5
Z
Z
dx ρΨ ≤
N=
Ω
dx
Ω
5/3
ρΨ (x)
|Ω|5/2 ≤ CΩ kρΨ k5/3 ,
da cui segue immediatamente che
T [Ψ] ≥ KΩ N 5/3 .
(10.10)
Osservazione 10.7. La disuguaglianza (10.9) è stata quella che storicamente è stata usata da Lieb e
Thirring nella dimostrazione della stabilità della materia di seconda specie [LT]. Come già anticipato
rappresenta una possibile forma matematicamente rigorosa del principio di esclusione di Pauli, implicando
una crescita più che lineare nel numero di particelle N dell’energia cinetica di N fermioni (vedi anche la
prossima Osservazione 10.8.
Osservazione 10.8. Nel caso bosonico (e anche in generale) γ (1) soddisfa la disuguaglianza γ (1)Q≤ N e
tale valore può essere facilmente raggiunto su uno stato prodotto: prendiamo ad esempio Ψ(X) = ψ(xi ),
(1)
allora γΨ = N |ψi hψ| e si vede subito che kγ (1) k = N , per cui la disuguaglianza (10.9) diventa
T [Ψ] ≥
K
5/3
kρΨ k5/3 ,
2/3
N
(10.11)
e ripetendo l’argomento della Osservazione precedente si vede che l’energia cinetica di N bosoni in una
regione limitata cresce linearmente con N . Questo andamento più debole del caso fermionico sarà all’origine
dell’instabilità di seconda specie di N bosoni che dimostreremo nel Capitolo 12.
(1)
Dimostrazione. E’ sufficiente
(1) usare
(1)la Proposizione 9.1 che dà γ ≤ 1 nel caso fermionico, da cui segue
immediatamente che γ ∞ = γ ≤ 1. Il risultato è poi conseguenza diretta della (10.2).
Il fatto che l’energia cinetica di N fermioni cresca come N 5/3 si può anche vedere in un esempio banale:
prendiamo N fermioni non interagenti in una scatola cubica Λ ⊂ R3 di lato 2π con condizioni al bordo
Neumann. I livelli energetici accessibili per ogni singola particella sono ε(k) = 12 k2 , dove k ∈ Z3 e le
autofunzioni relative ad una particella sono ψk (x) = L−3/2 exp {ik · x}, che sono poi le autofunzioni del
Laplaciano su Λ con condizioni al bordo di tipo Neumann. Usando poi la ricetta del Teorema 9.4 dobbiamo
sistema gli N fermioni in questi livelli energetici in modo che ogni livello sia occupato
PK al più da una particella.
Naturalmente i livelli sono degeneri e se k1 + k2 + k3 ≤ K il numero di stati è j=0 j(j + 1) ' K 3 , poichè
fissato k1 = K − j, k2 + k3 = j e le possibili combinazioni sono j(j + 1). Pertanto se vogliamo sistemare N
particelle in stati tutti diversi, dovremo occupare stati fino a |k| ' N 1/3 , ma l’energia del sistema complessivo
(che ovviamente è puramente cinetica) sarà la somma delle energie di tutti i livelli energetici occupati, cioè
all’incirca
X
k 2 ∝ N 5/3 .
k∈Z3 ,|k|≤N 1/3
Dimostrazione dell’equivalenza fra i Teoremi 10.1 e 10.2. Per semplificare la discussione e restringerci al
caso più interessante mostreremo in effetti l’equivalenza nel solo caso fermionico. Più precisamente
dimostreremo che per un sistema fermionico, Corollario 10.1 ⇐⇒ Teorema 10.1 con γ = 1, d = 3.
Iniziamo dall’implicazione
(⇐=). Sia EH [Ψ] l’energia di N fermioni non interagenti in R3 , cioè l’aspetP
tazione di H =
(−∆i + V (xi)) per un qualche V tale che le ipotesi del Teorema 6.2 siano soddisfatte e
in particolare V− ∈ L∞ + L3/2 (R3 ), allora il Teorema 9.4 implica che
EH [Ψ] ≥ −
M
X
j=0
|ej |,
131
dove ej , j = 0, . . . , M , sono le energie di tutti gli stati legati di h = −∆ + V , Hamiltoniana a una particella.
Il Teorema 10.1 con γ = 1, d = 3 a sua volta implica che
Z
M
X
5/2
dx V− (x).
|ej | ≤ L1,3
R3
j=0
da cui
Z
Z
5/2
dx V (x)ρΨ (x) − L1,3
T [Ψ] ≥ −
dx V− (x),
R3
R3
(10.12)
dove, se V− ∈
/ L5/2 (R3 ) il membro di destra può anche essere −∞. La stima precedente si applica ad
ogni potenziale V che soddisfi le condizioni fin qui assunte. Facciamo ora una scelta specifica di V , ovvero
prendiamo
2/3
V (x) = −V− (x) = −cρΨ (x).
E’ facile verificare che per tale scelta tutte le ipotesi sono soddisfatte e, in particolare, V− ∈ L3/2 (R3 ).
In realtà non possiamo sapere se V− ∈ L5/2 (R3 ), ma questo sarà conseguenza della disuguaglianza finale.
Rimpiazzando questa scelta in (10.12) otteniamo
Z
5/3
5/2
dx ρΨ (x),
T [Ψ] ≥ c − L1,3 c
R3
e, ottimizzando rispetto a c, cioè scegliendo c = (2/(5L1,3 ))2/3 ,
2/3 Z
3
2
5/3
T [Ψ] ≥
dx ρΨ (x),
5 5L1,3
3
R
che coincide con la (10.9), via la (10.8).3
Vediamo ora come si dimostra l’implicazione (=⇒). Per le ipotesi fatte, l’Hamiltoniana a una particella
h = −∆ + V in L2 (R3 ) ha M + 1 stati legati ψ0 , . . . , ψM , con M che assumeremo per semplicità finito.
Nel caso in cui fosse M = +∞ sarebbe sufficiente riprodurre lo stesso argomento per M fissato e alla
fine prendere il limite M → ∞. Prendiamo allora un sistema di M + 1 fermioni e costruiamo
PMlo stato
Ψ0 = ψ0 ∧ · · · ∧ ψM , che grazie al Teorema 9.4, sappiamo essere lo stato fondamentale di H = j=0 h(xj )
P
P
ej . La matrice densità ridotta di tale stato a M + 1 corpi è γ (1) = M
con energia E0 = M
j=0 |ψj i hψj | e
j=0
(1) = 1. Allora il Corollario 10.1 applicato a T [Ψ0 ] dà
soddisfa ovviamente γ
∞
−
M
X
Z
|ej | = E0 = EH [Ψ0 ] ≥ K
dx
R3
j=0
5/3
ρΨ0
Z
−
R3
dx V− (x)ρΨ0 (x),
ma Hölder e la disuguaglianza ab ≤ ap /p + bq /q, valida per ogni a, b ≥ 0 e
ogni δ ∈ (0, 1),
Z
2/5 Z
3/5
Z
5/2
5/3
dx V− (x)ρΨ0 (x) ≤
dx V− (x)
dx ρΨ0 (x)
R3
R3
1
p
+
1
q
= 1, implicano che, per
R3
2
≤ 5/2
5δ
Z
dx
R3
5/2
V− (x)
3δ 5/3
+
5
che sostituita nella (10.13) restituisce
−
M
X
j=0
2
≥ − 5/2
5δ
Z
dx
R3
5/2
V− (x)
+
3δ 5/3
K−
5
!Z
e, scegliendo δ 5/3 = 53 K,
M
X
j=0
dove abbiamo usato la (10.8).
(10.13)
Z
|ej | ≤ L1,3
R3
5/2
dx V− (x),
R3
5/3
dx ρΨ0 (x),
Z
R3
5/3
dx ρΨ0 (x),
132
10.1
Teoria di Birman-Schwinger
Un ingrediente cruciale nella dimostrazione delle disuguzglianze di Lieb-Thirring è il principio di BirmanSchwinger, che dimostreremo alla fine di questa Sezione. Si tratta di un risultato generale di teoria degli
operatori di Schrödinger. In effetti la teoria di Birman-Schwinger non è che una conveniente riformulazione
dell’equazione agli autovalori per un operatore di Schrödinger della forma −∆ + V , che permette di sfruttare
proprietà di compatezza non presenti nella formulazione originaria.
Consideriamo allora l’equazione agli autovalori negativi (problema di Stum-Liouville)
(−∆ + V ) ψ = −eψ,
(10.14)
con ψ ∈ L2 (Rd ), V ≤ 0 e e > 0. Nell’applicazione alla dimostrazione delle disguguaglianze di Lieb-Thirring
V sarà in realtà −V− , cioè la sola parte negativa del potenziale. Assumeremo inoltre che V soddisfi le
condizioni sufficienti per la limitatezza dal basso dello spettro, cioè (6.9).
Definizione 10.1 (Operatore di Birman-Schwinger).
Sia V negativo tale che le ipotesi del Teorema 6.1 siano soddisfatte e in particolare (6.9), allora l’operatore
di Birman-Schwinger Ke : L2 (Rd ) → L2 (Rd ) associato all’equazione di Schrödinger (10.14) è l’operatore
integrale con kernel
p
p
Ke (x; y) = |V (x)| G−e (x − y) |V (y)|,
(10.15)
dove la funzione di Green del Laplaciano G−e è definita in (4.9).
Le proprietà più importanti di Ke sono enunciate nelle seguenti
Proposizione 10.1 (Equivalenza dei problemi agli autovalori).
L’operatore di Schrödinger −∆+V ha l’autovalore −e, e > 0, cioè esiste una soluzione di (10.14) in L2 (Rd ),
se e solo se 1 è autovalore di Ke , cioè ∃φ ∈ L2 (Rd ) tale che
Ke φ = φ.
(10.16)
Dimostrazione. Dimostriamo anzitutto che sotto le ipotesi fatte su V , l’operatore di Birman-Schwinger è
un operatore limitato in L2 (Rd ): dalla definizione (10.15) si vede immediatamente che Ke ha la struttura
p
Ke = Be∗ Be ,
Be = |V | (−∆ + e)−1/2 ,
(10.17)
p
dove l’operatore (−∆ + e)−1/2 può essere facilmente
definito usando il teorema spettrale e |V | indica
p
l’operatore di moltiplicazione per la funzione |V (x)|. Mostriamo ora che Be è un operatore limitato su
L2 (Rd ), da cui segue immediatamente l’assunto. Facciamo anzitutto vedere che (−∆ + e)−1/2 : L2 (Rd ) →
H 1 (Rd ):
Z
2
2
k 2 + 1 −1/2 ψ 1 d =
dk 2
ψ̂(k) ≤ max 1, 1e kψk22 .
(−∆ + e)
k +e
H (R )
Rd
p
Inoltre si dimostra che |V | : H 1 (Rd ) → L2 (Rd ) e quindi mettendo insieme i due risultati ne segue che Be
è limitato su L2 (Rd ): supponiamo per semplicità che d ≥ 3, dato che i casi d = 1, 2 sono del tutto analoghi,
allora
p
2 Z
dx V (x) |ψ|2 ≤ kV1 k d kψk22d + kV2 k∞ kψk22 ≤ Sd−1 kV1 k d k∇ψk22 + kV2 k∞ kψk22
|V | ψ =
2
2
d−2
2
d
R
n
o
≤ max Sd−1 kV1 k d , kV2 k∞ kψk2H 1 (Rd ) ,
2
dove abbiamo usato la decomposizione V = V1 + V2 , V1 ∈ Ld/2 e V2 ∈ L∞ e le disuguaglianze di Sobolev
enunciate nel Lemma 6.1.
133
p
Supponiamo ora che la (10.14) sia soddisfatta per una certa ψ ∈ H 1 (Rd ) e poniamo φ = |V | ψ: il conto
alla riga precedente implica che φ ∈ L2 (Rd ) e la (10.14) può essere riscritta nella forma (−∆ + e)ψ = |V |ψ,
che a sua volta diventa
p
(−∆ + e)−1 |V |φ = ψ,
ovvero Ke φ = φ. Si noti che quest’ultima equazione è ben posta grazie alla limitatezza in L2 (Rd ) di Ke e al
fatto che φ ∈ L2 (Rd ).
p
Se viceversa φ è autofunzione di Ke all’autovalore 1, poniamo ψ = (−∆ + e)−1 |V |φ e calcoliamo (per
il momento formalmente)
p
p
(−∆ + e)ψ = |V |φ = |V |Ke φ = |V |ψ.
p
Rimane solo da mostrare che ψ = (−∆ + e)−1 |V |φ sta in L2 (Rd ), se φ ∈ L2 (Rd ):
2 D p
p
p
E 1 Dp
E
p
|V |φ (−∆ + e)−2 |V |φ ≤
|V |φ (−∆ + e)−1 |V |φ
(−∆ + e)−1 |V |φ =
e
2
1
1
= h φ |Ke | φ i = kφk22 ,
e
e
dove abbiamo sfruttato la stima operatoriale (−∆ + e)−2 ≤ e−1 (−∆ + e)−1 , che si dimostra banalmente
usando la trasformata di Fourier F:
E 1
E D E 1D D 2
2
−1 −2 −1 −2 ψ (−∆ + e)−1 ψ .
ψ̂ (k + e) ψ̂ =
ψ̂ F(−∆ + e) F ψ̂ = ψ̂ (k + e) ψ̂ ≤
e
e
Osservazione 10.9. Nella dimostrazione della precedente Proposizione abbiamo fatto uso della disuguaglianza operatoriale (−∆ + e)−2 ≤ e−1 (−∆ + e)−1 . Si potrebbe essere portati a pensare che si tratti di un
caso particolare di una disuguaglianza ovvia per i numeri reali, ovvero che se a ≥ 0 e a ≤ b allora a2 ≤ ab.
Più in generale si potrebbe pensare che valga l’analogo operatoriale di ac ≤ bc, per ogni c ≥ 0 e a ≤ b.
In realtà a livello operatoriale tutte queste disuguaglianze sono false! Più precisamente dati tre operatori
autoaggiunti C ≥ 0 e A ≤ B, non è vero che AC ≤ BC. Ovviamente la ragione di questo fatto sta nella
non commutatività dell’algebra degli operatori (e più semplicemente delle matrici). Si noti però che una
disuguaglianza sempre valida è la seguente: siano A ≤ B e C un operatore limitato qualunque, allora
C ∗ AC ≤ C ∗ BC.
(10.18)
Per motivi analoghi è altrettanto falso che se 0 ≤ A ≤ B, allora An ≤ B n , qualunque sia n > 1 (si
costruisca un controesempio per matrici 2 × 2 con n = 2). In effetti soltanto potenze minori di 1 conservano
l’ordinamento operatoriale: se 0 ≤ A ≤ B e 0 ≤ γ ≤ 1, allora
Aγ ≤ B γ ,
(10.19)
dove le potenze sono definite ad esempio via il teorema spettrale.
L’utilità della riformulazione della (10.14) usando l’operatore di Birman-Schwinger sta nelle proprietà speciali
di quest’ultimo. Fissiamo per semplicità d = 3 (che è il caso su cui ci concentreremo per dimostrare la
disuguaglianza di Lieb-Thirring), allora sotto ipotesi ragionevoli su V , si ha che Ke è un operatore compatto:
Proposizione 10.2 (Compattezza di Ke ).
Se V ∈ L2 (R3 ), allora Ke ∈ L 2 (L2 (R3 )), cioè Ke è un operatore Hilbert-Schmidt e, in particolare, compatto;
inoltre
kV k2
kKe k2L 2 (L2 (R3 )) ≤ √2 .
(10.20)
8π e
Osservazione 10.10. In dimensione generica d ≥ 3 l’ipotesi V ∈ L2 non garantisce automaticamente che
Ke sia Hilbert-Schmidt. Tuttavia si può mostrare che Ke ∈ L m (L2 (Rd )), cioè Tr(Kem ) < +∞, per un m
grande abbastanza, il che garantisce ancora la compattezza dell’operatore.
134
Dimostrazione. La dimostrazione è sostanzialmente una stima diretta di Tr(Ke2 ):
√
Z
Z
e−2 e|x−y|
2
2
Tr(Ke ) =
dxdy |V (x)| G−e (x − y) |V (y)| =
dxdy |V (x)| |V (y)|
16π 2 |x − y|2
R6
R6
√
Z ∞
Z
Z
√
kV k22
e−2 e|x−y|
1
1
−2 e%
2
2
√ ,
d%
e
dxdy
V
(x)
=
dxV
(x)
=
≤
16π 2 R6
4π R3
8π e
|x − y|2
0
dove abbiamo usato la stima di Cauchy ab ≤ 21 a2 + 12 b2 .
Proposizione 10.3 (Monotonia di Ke in e).
Sia e0 > e, allora Ke0 ≤ Ke . Inoltre
kKe k −→ +∞,
e→0
kKe k −→ 0.
e→+∞
(10.21)
Dimostrazione. Il primo risultato segue dalla monotonia di (−∆ + e)−1 rispetto a e, ovvero dal fatto che
se e0 > e, allora (−∆ + e0 )−1 ≤ (−∆ + e)−1 , come si dimostra facilmente usando la trasformata di Fourier.
Inoltre per ogni ψ ∈ L2 (Rd )
p
p
Dp
E Dp
E
0 −1 −1 0
|V |ψ (−∆ + e ) |V |ψ ≤
|V |ψ (−∆ + e) |V |ψ = h ψ |Ke | ψ i .
h ψ |Ke | ψ i =
Per quanto riguarda le altre due proprietà osserviamo che (−∆+e)−1 tende a un operatore illimitato quando
e → 0, che giustifica la prima delle (10.21). Per dimostrare la seconda fissiamo d = 3 e ipotizziamo per
semplicità che V ∈ L2 (R3 ): allora, per quanto dimostrato nella Proposizione 10.2 e specificamente la stima
(10.20), abbiamo che
!1/2
X
C
kKe k = kKe k∞ = sup |λn | ≤
λ2n
= kKe k2 ≤ √ ,
e
n∈N
n∈N
dove abbiamo indicato con λn , n ∈ N, gli autovalori di Ke .
Possiamo ora enunciare il principio di Birman-Schwinger. Fissiamo nuovamente per concretezza d = 3.
Teorema 10.3 (Principio di Birman-Schwinger).
Sia e > 0, d = 3, V ∈ L2 (R3 ) e
Ne = # autovalori ≤ −e di − ∆ + V,
(10.22)
Me = # autovalori ≥ 1 di Ke ,
(10.23)
allora Ne = Me .
Dimostrazione. Per quanto dimostrato nella Proposizione 10.2, Ke è un operatore compatto. Inoltre Ke è
manifestamente positivo, grazie alla positività di (−∆ + e)−1 :
p
Dp
E
h ψ |Ke | ψ i =
|V |ψ (−∆ + e)−1 |V |ψ ≥ 0.
Possiamo allora ordinare gli autovalori di Ke in ordine descrescente λ0 (e) ≥ λ1 (e) ≥ · · · ≥ 0. Per un
risultato generale di teoria degli operatori (si veda ad esempio [RS4, Teorema XII.8]), gli autovalori λn (e)
sono funzioni regolari di e. Inoltre per il principio del min-max (prossimo Teorema 10.4) λn (e0 ) è una
funzione monotona descrescente di e0 .
Le proprietà dell’operatore di Birman-Schwinger enunciate nella Proposizione 10.1 fanno sı̀ che ogni
qualvolta λn (e) = 1 per un qualche n, allora −e è autovalore di h = −∆ + V . D’altra parte quanto
dimostrato nella Proposizione 10.3 implica che λ1 (e) → +∞ quando e → 0 e λn → 0 per ogni n quando
e → ∞ (si veda la Fig. 10.1 per una rappresentazione grafica) e in particolare, per ogni n, λn (e) < 1 per
e abbastanza grande. Osservando la Fig. 10.1 è facile rendersi conto che il numero di autovalori di Ke
maggiori o uguali a 1 coincide con il numero di attraversamenti della retta orizzontale λ = 1 da parte dei
λn alla destra di e. Ma ogni attraversamento implica per quanto detto l’esistenza di un autovalore di h al
di sotto di −e. Il risultato è allora dimostrato.
135
Figura 10.1: Comportamento degli autovalori di Ke al variare di e [LSe, p. 65].
Nella dimostrazione del Teorema 10.3 abbiamo usato un risultato fondamentale di teoria degli operatori che
formuleremo in forma semplificata omettendo inoltre la dimostrazione. Il lettore interessato può trovare la
discussione dettagliata in [RS4, Sezione XIII.1].
Teorema 10.4 (Principio del min-max).
Siano V, W due potenziali tali che V ≤ W puntualmente e le ipotesi del Teorema 6.2 siano soddisfatte (con
d = 3). Siano inoltre h = −∆ + V e h0 = −∆ + W i relativi operatori di Schrödinger. Se indichiamo con
E0 ≤ E1 ≤ · · · ≤ 0 e E00 ≤ E10 ≤ · · · ≤ 0 gli autovalori negativi rispettivamente di h e h0 , si ha che
Ej ≤ Ej0 ,
per ogni j.
(10.24)
Osservazione 10.11. Il principio del min-max si applica più in generale ogni qual volta abbiamo due
forme quadratiche tali che h ψ |h| ψ i ≤ h ψ |h0 | ψ i e, come nel caso semplice dei potenziali V ≤ W , implica
l’ordinamento relativo degli autovalori.
10.2
Dimostrazione delle Disuguaglianze di Lieb-Thirring
Possiamo ora completare la dimostrazione delle disuguaglianze di Lieb-Thirring. Per semplificare la discussione e al contenpo restringerci al caso fisicamente interessante dell’applicazione alla teoria della stabilità
della materia, dimostreremo il Teorema 10.1 solo in tre dimensioni (d = 3) e per γ = 1. Inoltre tralasceremo
interamente la discussione della costante ottimale Ld,γ e ci accontenteremo di dimostrare che la stima vale
per una certa costante finita.
Dimostrazione del Teorema 10.1. Osserviamo anzitutto che è sufficiente restringersi al caso V = −V− : il
motivo è che una stima sulla somma dei moduli degli autovalori negativi Ej di h = −∆ − V− fornisce
automaticamente, grazie al principio del min-max (Teorema 10.4), una stima dall’alto anche per l’analoga
somma degli autovalori negativi dell’hamitoniana completa −∆ + V . Se infatti chiamiamo Ej0 gli autovalori
negativi di quest’ultima, abbiamo, via principio del min-max e stima banale V ≥ −V− , l’ordinamento
Ej0 ≥ Ej e perciò |Ej0 | ≤ |Ej |.
Inoltre
Z ∞
X
X
|Ej | =
ej =
de Ne ,
j≥0
j≥0
0
136
dove Ne è stato definito nell’enunciato del Teorema 10.3 ed è il numero di autovalori negativi di h = −∆−V−
uguali o più piccoli di −e. Per ricavare la seconda identità nell’espressione precedente è sufficiente osservare
che Ne è una funzione continua a tratti (in effetti a scalini), la cui derivata in senso distribuzionale è data
da
X
dNe
δ(e − ej ),
=−
de
j≥0
da cui l’identità via integrazione per parti
Z
Z ∞
∞
de Ne = eNe 0 −
∞
de e
0
0
dNe X
ej .
=
de
j≥0
Si noti l’annullamento dei termini di bordo dovuto al fatto che Ne = 0 per e > e0 . A questo punto
applichiamo il principio di Birman-Schwinger (Teorema 10.3), ottenendo
Z ∞
X
|Ej | =
de Me ,
0
j≥0
ma se chiamiamo j? ∈ N l’indice tale che λj ≥ 1 per j ≥ j? abbiamo anche che
X
X
Me ≤
λ2j ≤
λ2j = kKe k22 ,
j≥j?
da cui
X
j≥0
∞
Z
|Ej | ≤
j≥0
0
de kKe k22 .
(10.25)
Purtroppo anche assumendo che V− ∈ L2 (R3 ), la (10.25) non sarebbe sufficiente per chiudere l’argomento
√
in quanto nella stima (10.20) compare la funzione 1/ e che non è integrabile per grandi e. L’idea è allora
di ripetere il ragionamento sostituendo nello schema il potenziale V− con
We (x) = V (x) + 12 e − .
(10.26)
Osserviamo anzitutto che
V (x) + 12 e − =
(
0,
V− − 2e ,
dove V (x) ≤ 2e ,
dove V (x) ≤ 0 e V− (x) ≥ 2e ;
da cui la stima banale
We (x) ≥ V− (x) − 12 e.
(10.27)
Se indichiamo la dipendenza dal potenziale, vale poi la catena di disuguaglianze
Ne (−V− ) ≤ Ne/2 (−V− + e/2) ≤ Ne/2 (−We ),
(10.28)
come si dimostra nel modo seguente: se (−∆ − V− )ψ = Eψ, allora (−∆ − V− + e/2)ψ = (E + e/2)ψ; quindi
se E ≤ −e è autovalore di −∆ − V− , allora E + e/2 ≤ −e/2 è autovalore di −∆ − V− + e/2, il che giustifica la
prima disuguaglianza. Per la seconda è sufficiente usare la (10.27) e applicare il principio del min-max che
garantisce che gli autovalori di −∆ − We sono minori o uguali ai corrispettivi autovalori di −∆ − V− + e/2.
Ripetiamo allora l’argomento con cui abbiamo iniziato la dimostrazione rimpiazzando e con e/2 e V−
con We :
Z ∞
Z ∞
Z ∞
Z ∞
2
X
|Ej | =
de Ne (−V− ) ≤
de Ne/2 (−We ) =
de Me/2 (−We ) ≤
de K̃e/2 ,
j≥0
0
0
0
0
2
137
dove abbiamo indicato con K̃e l’operatore di Birman-Schwinger relativo al potenziale −We . A questo punto
possiamo usare la (10.20) e ottenere
X
j≥0
Z
|Ej | ≤ C
0
∞
kWe k2
de √ 2 = C
e
Z
0
∞
Z
Z
Z
2V− (x)
2
1
de √ V− (x) − 12 e
e
R3
0
R3
Z
Z 2
Z
2
1
5/2
5/2
dx V− (x)
de √ 1 − 12 e ≤ C 00
= C0
dx V− (x),
e
R3
0
R3
1
de √
e
dx V (x) +
1 2
2e −
=C
dx
dove abbiamo applicato Fubini per scambiare l’ordine degli integrali: come funzione di x, [V (x) + 12 e]2− è
una funzione positiva, limitata e a supporto compatto per ogni e > 0, grazie all’ipotesi di decadimento fatta
sul potenziale (si vedano le assunzioni su V del Teorema 6.2). Pertanto essa è integrabile in x per ogni e > 0
e l’integrale è finito. Resta da discutere il comportamento quando e → 0 ma poiché V ∈ L2 anche in questo
caso la funzione è integrabile e il suo integrale finito.
Capitolo 11
Elettrostatica
Nel Capitolo precedente abbiamo dimostrato le disuguaglianze di Lieb-Thirring che ci permetteranno di
stimare dal basso l’energia cinetica degli elettroni nel modello di materia che abbiamo considerato. Per
ricavare un’analoga stima significativa dal basso dell’energia potenziale coulombiana del sistema elettroni –
nuclei dovremo dare alcuni cenni di teoria del potenziale al fine di poter dimostrare la stima chiave ovvero
la disuguaglianza di Baxter.
Ricordiamo che il potenziale elettrostatico che vogliamo studiare è dato dalla (8.4), cioè
VC (X; R, Z) = W (X; R, Z) + I(X) + U (R, Z),
con
W (X; R, Z) = −
N X
M
X
i=1 j=1
I(X) =
X
1≤i<j≤N
U (R, Z) =
X
1≤j<k≤M
Zj
;
|xi − Rj |
1
;
|xi − xj |
Zj Zk
.
|Rj − Rk |
Come si vede l’unico contributo negativo è dato da W , ma purtroppo esso contiene N M termini, mentre
il nostro scopo finale è dimostrare una stima dal basso che sia proporzionale a N + M . In effetti la stima
dal basso che abbiamo ottenuto per dimostrare la stabilità della prima specie (8.11) va addirittura come
M 2 N . D’altra parte i contributi repulsivi dell’interazione fra gli elettroni e di quella fra i nuclei, che abbiamo
trascurato per arrivare alla (8.11), dovrebbero aiutare a raggiungere una stima dal basso migliore. Questo
fenomeno prende il nome di screening elettronico: grazie alla repulsione fra gli elettroni, il campo elettronico
che sente ogni singolo elettrone è in realtà più debole di quello prodotto dai nuclei. Nella disuguaglianza di
Baxter tale effetto viene quantificato.
In teoria del potenziale il problema fisico che si vuole risolvere è quello di trovare il potenziale elettrostatico generato da una certa distribuzione di carica. Supponiamo allora che le cariche siano distribuite secondo
una misura di probabilità (misura di Borel regolare) µ ∈ M (Rd ), allora vogliamo studiare le proprietà del
ptenziale generato.
Esempio 11.1 (Distribuzioni di carica elementari)
Nel caso elementare
di un numero N di particelle puntiformi con carica qi , la distribuzione µ è semplicemente
P
data da µ =
qi δ(x − xi ), dove xi indicano le posizioni delle N cariche. Analogamente una distribuzione
di carica uniforme di densità ρ in una palla BR di raggio R sarà data da µ = ρ1BR .
Definizione 11.1 (Potenziale elettrostatico).
Sia µ ∈ M (R3 ) una misura di Borel regolare, allora il potenziale elettrostatico Φ(x) da essa generato è
138
139
la funzione
Z
dµ(y)
Φ(x) =
R3
1
.
|x − y|
(11.1)
Osservazione 11.1. La funzione (11.1) è certamente ben definita se µ ≥ 0, anche se ovviamente non è
necessariamente limitata. Se invece µ è una misura con segno e quindi µ = µ+ − µ− , con µ± ≥ 0, allora
potrebbe esserci un ambiguità dovuta alla possibile cancellazione di divergenze con segno opposto. Se tuttavia
assumiamo che
Z
1
dµ± (y)
< +∞,
1 + |y|
R3
si può dimostrare che la (11.1) è ben posta anche per misure con segno. In effetti sotto queste ipotesi
Φ ∈ L1loc (R3 ) ed è finita q.o..
Se prendiamo il caso elementare descritto nell’Esempio 1 otteniamo immediatamente che un insieme di N
particelle puntiformi di carica qi nei punti xi produce un potenziale elettrostatico dato da
Φ(x) =
N
X
i=1
qi
.
|x − xi |
che coincide con quanto ci saremmo aspettati dai noti risultati di elettrostatica.
Similmente l’energia elettrostatica di una carica puntiforme q posta in x0 e immersa nel potenziale Φ(x)
è data da qΦ(x0 ). Risulta quindi naturale definire l’energia di una distribuzione di carica µ come
Definizione 11.2 (Energia di Coulomb).
L’energia di Coulomb o elettrostatica D(µ; µ) associata a una misura di Borel regolare µ è
Z
Z
1
1
D(µ; µ) =
dµ(x)
dµ(y)
.
2 R3
|x − y|
R3
(11.2)
Motivata dalla precedente Definizione e dall’Osservazione 11.1, introduciamo anche la seguente
Definizione 11.3 (Distribuzione di carica).
Una distribuzione di carica µ è una misura di Borel regolare tale che, se µ = µ+ − µ− , con µ± ≥ 0,
allora D(µ± ; µ± ) < +∞.
Osservazione 11.2. Come è noto data una misura di Borel regolare con segno µ si può trovare una decomposizione in misure positive µ = µ+ − µ− , dove in aggiunta le misure µ± hanno supporto disgiunto
(decomposizione di Hahn). Si noti che nella definizione di distribuzione di carica è sufficiente che la condizione sia verificata per una qualunque decomposizione, in cui le misure µ± possono anche avere supporto
non disgiunto.
Per concludere definiamo l’energia di interazione fra due diverse distribuzioni di carica:
Definizione 11.4 (Energia di interazione).
Date due distribuzioni di carica µ, ν, l’energia di interazione fra di esse è
Z
Z
1
1
D(µ; ν) =
dµ(x)
dµ(y)
.
2 R3
|x
−
y|
3
R
(11.3)
Nel caso in cui ν descriva una singola carica puntiforme q in x0 , si vede immediatamente che si riottiene il
risultato classico per l’energia elettrostatica ovvero qΦ(x0 ), Φ è il potenziale generato da µ.
L’utilità delle definizioni appena introdotte diventa più chiara alla luce della seguente
Proposizione 11.1 (Proprietà dell’energia).
Per ogni distribuzioni di carica µ, ν si ha
i) 0 ≤ D(µ; µ) < +∞;
140
ii) |D(µ; ν)| ≤
p
D(µ; µ)D(ν; ν).
Dimostrazione. Dimostriamo anzitutto la positività dell’energia di Coulomb, mentre la limitatezza sarà
ottenuta come sottoprodotto della seconda disuguaglianza. Osserviamo che vale la seguente semplice identità
Z
1
C
dz
=
,
(11.4)
2 |y − z|2
|x
−
z|
|x
−
y|
3
R
dove C > 0 è una costante limitata (si veda anche il prossimo Esercizio 11.1: integrando il membro di
sinistra abbiamo infatti
Z
Z
Z ∞ Z 1
1
1
1
dz
=
dz 2
= 2π
dz
dt 2
2
2
2
2
|x − z| |y − z|
|z| |z + x − y|
z + |x − y| + 2z|x − y|t
R3
R3
0
−1
Z ∞ Z 1
1
2π
C
dt 2
=
dz
=
.
|x − y| 0
z + 2zt + 1
|x − y|
−1
Usando la (11.4) nella definizione di D(µ; µ) si ottiene
Z
2
Z
Z
Z
Z
1
1
1
1
dµ(y)
dµ(x)
dz
=
dz
dµ(x)
≥ 0.
D(µ; µ) =
2C R3
|x − z|2 |y − z|2
2C R3
|x − z|2
R3
R3
R3
Per dimostrare la seconda proprietà è sufficiente usare la (11.4) e applicare la disuguaglianza di CauchySchwarz:
Z
Z
Z
1
1
1
|D(µ; ν)| ≤
dz dµ(x)
dν(y)
2C R3
|x − z|2 R3
|y − z|2 R3
2 !1/2 Z
2 !1/2
Z
Z
Z
p
1
1
1
=
D(µ; µ)D(ν; ν).
≤
dz dµ(x)
dz
dν(y)
3
2C
|x − z|2 |y − z|2 R3
R3
R3
R
Usando questa seconda proprietà dell’energia di Coulomb è poi facile vedere che per ogni distribuzione di
carica µ si ha D(µ; µ) < +∞: decomponendo µ = µ+ − µ− abbiamo per ipotesi sulle distribuzioni di carica
D(µ± ; µ± ) < +∞, ma, grazie alla seconda proprietà , anche |D(µ+ ; µ− )| < +∞ e quindi D(µ; µ) < +∞.
Esercizio 11.1. Usando l’identità
Z ∞
α
α
2
dλ λ 2 −1 e−πλ|x−y| = π − 2 Γ
0
α
2
|x − y|−α ,
(11.5)
.
(11.6)
valida per ogni 0 < α < 3, si dimostri che
1
1
= 3
|x − y|
π
Z
dz
R3
1
|x −
z|2 |y
− z|2
Un’altra proprietà dei potenziali elettrostatici particolarmente utile è il teorema di Newton, che si applica a
distribuzioni di carica a simmetria sferica. Premettiamo allora la seguente
Definizione 11.5 (Distribuzione di carica a simmetria sferica).
Una distribuzione di carica si dice a simmetria sferica attorno a un punto x0 ∈ R3 se per ogni rotazione
R tale che Rx0 = x0 , allora µ(RS) = µ(S), per ogni S misurabile.
Teorema 11.1 (Teorema di Newton).
Sia µ una distribuzione di carica a simmetria sferica attorno all’origine, allora
Z
Z
1
1
dµ(y) +
dµ(y)
Φ(x) =
.
|x| |y|≤|x|
|y|
|y|>|x|
(11.7)
In particolare se µ(S) = 0 per ogni insieme S tale che S ∩ {y, |y| > R} = ∅, per un certo R < +∞ (cioè se
la distribuzione di carica è supportata all’interno di una palla di raggio R), allora
Φ(x) =
µ(R3 )
,
|x|
per ogni |x| > R.
(11.8)
141
Dimostrazione. Se µ è a simmetria sferica allora Φ deve essere invariante per rotazioni, ovvero
Z
Z
Z
1
1
1
dω Φ(|x|ω) =
dω
dµ(y)
Φ(x) =
.
4π S 2
4π S 2
||x|ω − y|
R3
Scambiamo ora l’ordine degli integrali usando Fubini e calcoliamo
1
4π
Z
1
1
dω
=
||x|ω − y|
2
S2
Z
1
1
dt p
|x|2 + |y|2 − 2|x||y|t
−1
o
n
p
p
1
=
|x|2 + |y|2 + 2|x||y| − |x|2 + |y|2 − 2|x||y|
2|x||y|
1
1 1
,
=
{|x| + |y| − ||x| − |y||} = min
,
2|x||y|
|x| |y|
da cui si ottiene immediatamente il risultato.
Possiamo tornare ora a discutere la stima dal basso dell’energia coulombiana VC . Semplificando, possiamo
dire che dovremo affrontare due tipi di problemi nel derivare tale stima: da un lato il potenziale VC è singolare
in corrispondenza delle posizioni dei nuclei e questo chiaramente può essere un problema nel trovare una
stima dal basso limitata, ma, dall’altro, il potenziale VC può essere “grande” in valora assoluto anche lontano
dai nuclei, semplicemente per il fatto che contiene un numero grande di termini (ordine N M ). La soluzione
di questo secondo problema sta in una partizione conveniente dello spazio in celle:
Definizione 11.6 (Celle di Voronoi).
Siano R1 , . . . , RM le posizioni di M nuclei, allora la j−esima cella di Voronoi è l’aperto
Γj = x ∈ R3 |x − Rj | < |x − Ri | , ∀i 6= j .
(11.9)
Definiamo inoltre la distanza dal nucleo più vicino al j−esimo
Dj =
1
|Rk
2 k6inf
=j
− Rj | = dist (Rj , ∂Γj ) ,
(11.10)
e la minima distanza da un nucleo
D(x) =
inf
j∈{1,...,M }
|x − Rj | .
(11.11)
Osservazione 11.3. E’ facile vedere che le celle di Voronoi sono insiemi convessi il cui bordo ∂Γj è un
insieme finito di sezioni di piani e, eventualmente, il punto all’infinito. Per una rappresentazione grafica
semplificata si veda la Fig. 11.1.
Possiamo a questo punto enunciare il risultato principale di questo Capitolo. Considereremo il potenziale
VC introdotto nella (8.4) e richiamato all’inizio del Capitolo, ma assumeremo che le cariche nucleari siano
tutte uguali, cioè Zj = Z per ogni j = 1, . . . , M . Nell’applicazione allo studio della stabilità della materia
questa non sarà una restrizione significativa alla luce di quanto dimostrato nel Teorema 9.6.
Ricordiamo che X = (x1 , . . . , xN ) e R = (R1 , . . . , RM ). Introduciamo inoltre la notazione
w(x) =
M
X
j=1
Z
,
|x − Rj |
(11.12)
per il potenziale complessivo generato dai nuclei.
Teorema 11.2 (Disuguaglianza di Baxter).
Sia VC il potenziale coulombiano definito in (8.4) con Zj = Z per ogni j = 1, . . . , M , allora vale la stima
dal basso
N
M
X
1
Z2 X 1
VC (X) ≥ −(2Z + 1)
+
.
(11.13)
D(xi )
8
Dj
i=1
j=1
142
Figura 11.1: Celle di Voronoi [LSe, p. 78].
Dimostrazione. L’idea chiave della dimostrazione della disuguaglianza di Baxter è l’applicazione del Lemma
11.1 alla distribuzione di carica elettronica
µ(x) =
N
X
δ(x − xi ).
(11.14)
i=1
Sfortunatamente vedremo che questo argomento non può funzionare direttamente ed è necessario regolarizzare la distribuzione di carica dando una “dimensione” alle cariche elettroniche che abbiamo sempre
considerato puntiformi. Vediamo tuttavia come si procederebbe nel caso della distribuzione di carica (11.14):
osserviamo intanto che
X
1
D(µ; µ) =
.
|xi − xj |
i<j
cioè l’energia elettrostatica di µ coincide con la repulsione elettronica I(X). Inoltre
Z
−
dµ(x) Φreg (x) = −
R3
N
X
Φreg (xi ) = −Z
i=1
N X
M
X
i=1 j=1
da cui
Z
VC (X; R, Z) ≥ D(µ; µ) −
N
N
i=1
i=1
X 1
X 1
Z
+Z
= W (X; R, Z) + Z
,
|xi − Rj |
D(xi )
D(xi )
dµ(x) Φreg (x) − Z
R3
N
X
i=1
X
1
Z2
+
.
D(xi )
|Rk − R` |
(11.15)
k<`
L’applicazione del Lemma 11.1 a µ darebbe quindi la stima dal basso
M
N
X
Z2 X 1
1
VC (X; R, Z) ≥
−Z
,
8
Dj
D(xi )
j=1
i=1
che sfortunatamente è inutile a causa della divergenza di D(xi ) in Γi .
Per ovviare a questo problema rimpiazziamo la distribuzione di carica elettronica (11.14) con
µreg (x) =
N
X
i=1
µi (x),
µi (x) =
1
δ
|x − xi | −
πd2i
di
2
,
(11.16)
143
dove abbiamo posto per semplicità di notazione di = D(xi ). Si noti che la distribuzione di carica puntiforme
µ è stata sostituita con una distribuzione di carica superificiale, supportata in sferette di raggio d2i centrate
in xi . Usando i risultati dimostrati nel prossimo Lemma 11.2 e specificamente la (11.26), abbiamo che
VC (X; R, Z) ≥ 2
X
D(µi ; µj ) −
i<j
M Z
X
j=1
dµreg (x)
R3
X
Z
Z2
+
|x − Rj |
|Rk − R` |
k<`
= D(µreg ; µreg ) −
N
X
i=1
M
1 X
−
di
j=1
Z
dµreg (x)
R3
X
Z
Z2
+
,
|x − Rj |
|Rk − R` |
k<`
e, grazie al Lemma 11.1,
Z
M
N
X
1
Z2 X 1
1
dµreg (x)
−Z
,
VC (X; R, Z) ≥ −
+
di
D(x)
8
Dj
R3
j=1
i=1
di
2
ma sul supporto di µi si ha D(x) ≥
per costruzione e quindi
VC (X; R, Z) ≥ −(2Z + 1)
N
X
i=1
M
Z2 X 1
1
+
,
D(xi )
8
Dj
j=1
cioè il risultato finale.
Cosı̀ come la decomposizione in celle di Voronoi ha permesso di risolvere il problema della dipendenza dal
numero di nuclei e considerare “un nucleo alla volta”, cosı̀ il Lemma seguente permette di liberarsi della
singolarità coulombiana generata all’interno della cella di Voronoi dal nucleo contenuto.
Lemma 11.1 (Regolarizzazione del potenziale).
Per ogni distribuzione di carica µ e per ogni scelta di M punti Rj , j = 1, . . . , M , si ha
Z
D(µ; µ) −
dµ(x)Φreg (x) +
R3
M
X
1≤i<j
dove
M
Z2
1 X Z2
≥
,
|Ri − Rj |
8
Dj
(11.17)
j=1
M
X
Z
Z
Z
Φreg (x) = w(x) −
=
−
.
D(x)
|x − Rj | minj∈{1,...,M } |x − Rj |
(11.18)
j=1
Osservazione 11.4. Il potenziale Φreg è naturalmente la regolarizzazione del potenziale Φ generato dai
nuclei, a cui è stato sottratto il contributo singolare dovuto al nucleo nella cella di Voronoi in questione: più
precisamente
X
Z
Φreg (x) =
,
per ogni x ∈ Γk .
|x − Rj |
j6=k
Inoltre Φreg è una funzione continua – in realtà C ∞ – all’interno di ciascuna cella di Voronoi. Tuttavia tale
regolarità viene a mancare al bordo ∂Γj , dove Φreg è solamente continua. Similmente si vede facilmente che
∆Φreg = 0,
(11.19)
per ogni x ∈
/ ∪j ∂Γj , cioè Φreg è una funzione armonica all’interno delle celle di Voronoi.
Dimostrazione. Per prima cosa vogliamo cercare la distribuzione di carica che genera il potenziale Φreg ,
ovvero la ν tale che
Z
1
Φreg (x) =
dν(y)
,
|x
−
y|
R3
144
o, in termini distribuzionali, −∆Φreg = 4πν. Prediamo allora una funzione test f ∈ C0∞ (R3 ) e calcoliamo
(Z
)
Z
Z
M Z
M
X
X
dx Φreg ∆f =
dx Φreg ∆f =
dσ Φreg nj · ∇f −
dx ∇Φreg · ∇f ,
R3
Γj
j=1
∂Γj
j=1
Γj
dove abbiamo indicato con nj il versore lungo la normale uscente da ∂Γj e dσ la misura di superficie su
∂Γj . D’altra parte la continuità di Φreg e f implica che la somma di tutti i termini di bordo deve annullarsi
perché per ogni termine ce n’è un altro uguale ma di segno opposto. Inoltre integrando ancora per parti
Z
Z
dx ∇Φreg · ∇f =
dσ f nj · ∇Φreg ,
Γj
∂Γj
poiché Φreg è armonica all’interno di Γj . Abbiamo quindi
Z
dx Φreg ∆f = −
R3
M Z
X
dσ f nj · ∇Φreg .
(11.20)
∂Γj
j=1
Si noti che la somma di termini di bordo nella (11.20) questa volta non si annulla a causa della non
differenziabilità di Φreg su ∂Γj . Abbiamo quindi scoperto che la distribuzione di carica che genera Φreg è
una distribuzione superficiale supportata su ∪j ∂Γj . Cerchiamo di trovarne l’espressione esplicita: ricordando
che Φreg (x) = w(x) − Z/D(x), osserviamo che w è certamente una funzione differenziabile di x su ∂Γj e
quindi, ancora una volta, i corrispondenti termini di bordo hanno somma nulla:
Z
dx Φreg ∆f = Z
R3
M Z
X
j=1
dσ f nj · ∇
∂Γj
1
D
.
(11.21)
D’altra parte al bordo comune fra le celle Γj e Γk vale banalmente
nj · ∇
1
1
= nk · ∇
,
|x − Rj |
|x − Rk |
poiché su tale bordo |x − Rj | = |x − Rk |. Ma allora poiché D(x) = minj |x − Rj |
Z
M Z
X
dx f nj · ∇
∂Γj
j=1
1
D
Z
dx f nj · ∇
= 2Z
∪j ∂Γj
1
D
Z
dx f nj · ∇
= 2Z
∪j ∂Γj
1
|x − Rj |
o, alla luce della (11.21), la distribuzione di carica ν che genera Φreg ha supporto in ∪j ∂Γj ed è data da
ν(x) = −
Z
1
nj · ∇
σ(x),
2π
|x − Rj |
(11.22)
dove σ(x) indica la misura superficiale ristretta a ∪j ∂Γj . Si noti che tale distribuzione di carica è positiva:
poiché per convessità nj · (x − Rj ) ≥ 0, il gradiente
∇
1
|x − Rj |
punta in direzione entrante rispetto a ∂Γj .
Ora per ogni distribuzione di carica µ
Z
D(µ; µ) −
dµ(x) Φreg (x) +
R3
X
i<j
X
Z2
Z2
= D(µ; ν) − D(ν; ν) +
|Ri − Rj |
|Ri − Rj |
i<j
≥ −D(ν; ν) +
X
i<j
Z2
, (11.23)
|Ri − Rj |
145
grazie a quanto dimostrato nella Proposizione 11.1. Resta allora da calcolare D(ν; ν) con ν data dalla
(11.22). Notiamo anzitutto che
Z
dν(x) w(x) = Z
R3
M Z
X
dν(x)
X
1
δ(y − Rj ) = Z
Φreg (Rj ),
|x − y|
dy
R3
j=1
M
Z
R3
j=1
da cui
1
D(ν; ν) =
2
Z
1
dν(x) Φreg (x) =
2
R3
dν(x) w(x) −
Z
R3
Z
M
ZX
1
Z
=
dν(x)
Φreg (Rj ) −
2
2 R3
D(x)
j=1
Z
X
Z2
Z
1
=
−
dν(x)
. (11.24)
|Rk − Rj |
2 R3
D(x)
Z
D(x)
k<j
A questo punto resta da calcolare
Z
2
1
Z2
dν(x)
=−
D(x)
4π
R3
Z
Z
dσ nj · ∇
∪j ∂Γj
Z2
=
16π
1
|x − Rj |
M Z
X
j=1
Γcj
M Z
1
Z2 X
1
=−
dσ nj · ∇
D(x)
16π
|x − Rj |2
∂Γj
j=1
dx ∆
1
|x − Rj |2
M Z
Z2 X
1
=
, (11.25)
dx
8π
|x − Rj |4
Γcj
j=1
dove abbiamo usato l’identità ∆|x − Rj |−2 = 2|x − Rj |−4 la cui dimostrazione è lasciata per esercizio. Si
noti che nel passaggio dall’integrale su ∪j ∂Γj alla somma degli integrali su ∂Γj abbiamo dovuto moltiplicare
per 21 per evitare di contare due volte lo stesso integrale. Infine nell’ultimo passaggio abbiamo ottenuto un
cambio di segno a prezzo di rimpiazzare Γj con il suo complemento Γcj .
Per completare la stima basta osservare che Γcj contiene sicuramente il semi-spazio tangente alla sfera di
raggio Dj centrata in Rj e, quindi, cambiando coordinate x − Rj → x, otteniamo
Z
1
dx
≥
c
|x
−
Rj |4
Γj
Z
∞
Z
∞
dx
−∞
Z
∞
dy
−∞
Dj
1
=
(x2 + y 2 + z 2 )2
Z
∞
Z
2π
d% %
Z
∞
0
0
1
(%2 + z 2 )2
Z ∞
1
π
dz 2 =
=π
.
z
Dj
Dj
dz
dϕ
Dj
Rimpiazzando questa stima nella (11.25) e sostituendo la (11.24) nella (11.23) otteniamo il risultato.
Terminiamo questo Capitolo dimostrando alcune proprietà della distribuzione di carica regolarizzata µreg
introdotta in (11.16):
Lemma 11.2 (Lemma di Onsager).
Sia µreg la distribuzione di carica (11.16), allora
X
i) I(X) ≥ 2
D(µi ; µj );
i<j
1
=
ii)
|xi − Rj |
iii) D(µi ; µi ) =
Z
dµi (x)
R3
1
;
|x − Rj |
1
.
D(xi )
In particolare
I(X) ≥ 2D(µreg ; µreg ) −
N
X
i=1
1
,
D(xi )
W (X; R, Z) = −
M Z
X
j=1
R3
dµreg (x)
Z
.
|x − Rj |
(11.26)
146
Dimostrazione. Tutte e tre le stime sono conseguenza diretta del Teorema di Newton 11.1. Iniziamo dalla
prima: per i 6= j
Z
Z
Z
Z
1
1
1
1
1
dµj (y)
D(µi ; µj ) =
dµi (x)
dµi (x)
dµi (x),
=
+
2 R3
|x − y|
2 |x−xj |≥ dj
|x − xj | dj |x−xj |< dj
R3
2
2
poiché la distribuzione di carica µj è a simmetria sferica rispetto a xj e quindi il potenziale che genera è
1
,
|x − xj |
Φj (x) = 2

 ,
dj



se |x − xj | ≥
dj
2 ,
se |x − xj | <
dj
2 ,
ed esso ovviamente soddisfa la stima puntuale Φj (x) ≤ |x − xj |−1 . Quindi
1
D(µi ; µj ) =
2
Z
1
dµi (x)
−
|x − xj |
R3
|x−xj |<
1
1
−
dµi (x)
|x − xj | dj
Z
1
1
1
1
dµi (x)
≤
= Φi (xj ) ≤
.
2 R3
|x − xj |
2
2|xi − xj |
Z
dj
2
Consideriamo ora l’ultima identità: cambiando variabili x − xi = x0 e passando a coordinate sferiche
abbiamo che
Z
Z ∞
1
1
2
1
1
dµi (x)
= 2
d%%2 δ % − d2i
= .
D(µi ; µi ) =
2 |x−xi |≥ di
|x − xi |
%
di
di di
2
2
Rimane da dimostrare la seconda identità:
1
,
1
i − Rj |
dµi (x)
= Φi (Rj ) = |x

|x − Rj |
R3
2,
di



Z
ma |xi − Rj | ≥ D(xi ) = di >
di
2,
se |xi − Rj | ≥
di
2,
se |xi − Rj | <
di
2,
per cui il secondo caso non si verifica mai e l’uguaglianza è dimostrata.
Capitolo 12
Stabilità di Seconda Specie
Dopo aver discusso gli strumenti essenziali nei Capitoli precedenti siamo ora in grado di formulare e dimostrare il risultato più importate di quest’ultima parte del corso. Ricordiamo che il modello in questione è
stato discusso nella Sezione 9.4 (si veda in particolare la Definizione 9.4).
Teorema 12.1 (Stabilità della materia di seconda specie).
Se Zj ≤ Z < +∞ per ogni j = 1, . . . , M , esiste una costante C < +∞ tale che
E0 (N, M, Z) ≥ −CZ 2 (N + M ),
(12.1)
e in particolare la materia è stabile di seconda specie.
Osservazione 12.1. Come già ampiamente discusso, un elemento cruciale della dimostrazione della stabilità è il principio di esclusione di Pauli, che assumerà concretamente la forma delle disuguaglianze di
Lieb-Thirring. La natura fermionica degli elettroni è quindi essenziale per la stabilità e infatti vedremo nella
Sezione 12.2 come la materia bosonica sia instabile di seconda specie.
Osservazione 12.2. Nel nostro modello abbiamo sempre trascurato lo spin degli elettroni. Non è però
troppo complicato tenerne conto e, assumendo che le particelle ammettano q stati di spin (quindi q = 2 per
gli elettroni), la stima dal basso (9.39) diventerebbe
E0 (N, M, Z) ≥ −CZ 2 q 2/3 (N + M ),
e quindi il sistema risulterebbe ancora stabile di seconda specie.
Dimostrazione. Il primo passo è la sostituzione di ogni Zj con Z, che è permessa dal Teorema 9.6. Abbiamo
quindi
E0 (N, M, Z) ≥ E0 (N, M, (Z, . . . , Z)).
(12.2)
Perciò da qui in poi consideremo un sistema con Hamiltoniana H definita nella (8.2) con Zj = Z per ogni j.
A questo punto applichiamo la disuguaglianza di Baxter (Teorema 11.2):
N X
1
(2Z + 1)α
H≥
− ∆i −
,
2
D(xi )
(12.3)
i=1
cosı̀ che abbiamo già eliminato il problema del numero (ordine N M ) di termini del potenziale elettrostatico.
Il passo successivo è l’uso delle disuguaglianze di Lieb-Thirring. Si sarebbe tentati di applicarle al
potenziale 1/D(x) ma questo non può funzionare. Scriviamo allora per un certo b > 0
N N
X
X
1
1
H≥
− ∆i − (2Z + 1)α
−b
− (2Z + 1)N αb =
hi − (2Z + 1)N αb,
2
D(xi )
i=1
i=1
147
148
dove
hi = h(xi ) = − 12 ∆i −
1
D(xi )
+ b.
P
Osserviamo ora che lo stato fondamentale dell’Hamiltoniana a N corpi
hi è descritto nel Teorema 9.4 e
quindi, se l’Hamiltoniana a un corpo h ha Ñ stati legati E0 ≤ . . . ≤ EÑ −1 ≤ 0,
N
X
min(N,Ñ )−1
X
hi ≥
i=1
Ei ≥
i=0
X
Z
Ei ≥ −L3,1
dx
R3
i≥0
5/2
V− (x)
= −CZ
5/2
Z
dx
R3
5/2
1
−b
,
D(x)
+
1
dove abbiamo applicato le disuguaglianze di Lieb-Thirring (Teorema 10.1) al potenziale V (x) = − D(x)
+ b.
Rimpiazziamo ora la definizione di D(x) = minj∈{1,...,M } |x − Rj | per ottenere
5/2
5/2 X
5/2
M 1
1
1
−b
≤ max
−b
≤
−b
,
D(x)
|x − Rj |
j∈{1,...,M } |x − Rj |
+
+
+
j=1
da cui
N
X
i=1
M Z
X
5/2
5/2
Z
1
1
−b
dx
−b
= −CZ 5/2 M
|x − Rj |
|x|
3
R3
+
+
j=1 R
5/2
5/2
Z ∞
Z
1
1
5/2
2
5/2
−b
≥ −CZ M
−b
dx
d%% dx
= −CZ M
1
|x|
%
|x|≤ 1b
b
5/2
Z ∞
1
2
5/2
−1/2
d%% dx
≥ −CZ M b
−1
≥ −CZ 5/2 M b−1/2 . (12.4)
%
1
hi ≥ −CZ 5/2
dx
L’ultimo passaggio è semplicemente l’ottimizzazione rispetto al parametro variazionale b > 0:
H ≥ −CZ 5/2 M b−1/2 − (2Z + 1)N αb ≥ −CZ 2 N 1/3 M 2/3 ,
(12.5)
dove abbiamo massimizzato il membro di destra scegliendo
b=
CZM 2/3
.
N 2/3
Resta solo da usare la stima ab ≤ p1 ap + 1q bq con p = 3, q = 32 , a = N e b = M , per ottenere il risultato
finale.
12.1
Dimostrazioni Alternative
La prima dimostrazione della stabilità della materia di seconda specie risale al 1967 e tu ottenuta da Dyson,
Lenard [DL]. Si tratta forse di uno dei primi veri risultati di fisica matematica, ma l’argomento che viene
usato nella dimostrazione è piuttosto involuto e complicato. E’ curioso per esempio come venga utilizzato
il principio di esclusione di Pauli, ovvero per mostrare che localmente in una palla di raggio R, N fermioni
hanno energia cinetica almeno (N − 1)/R2 , perché solo una particella si può trovare nello stato a energia
0 (funzione d’onda costante). Il resto della dimostrazione consiste in una lunga serie di disuguaglianze che
alla fine forniscono il risultato desiderato.
Come anticipato, la dimostrazione che abbiamo presentato in queste note segue abbastanza da vicino
quella di Lieb, Thirring del 1975 [LT]. Tuttavia il completamento della dimostrazione è ottenuto in modo
differente da quanto fatto in [LT]: la strada che abbiamo seguito infatti è la più diretta per dimostrare la
stabilità di seconda specie e l’idea che ne è alla base è discussa la prima volta in [So]. La dimostrazione
proposta da Lieb, Thirring del 1975 passava invece attraverso lo studio della teoria di Thomas-Fermi,
che approssima l’energia di un sistema di elettroni e nuclei interagenti attraverso un funzionale lineare – il
149
funzionale di Thomas-Fermi appunto – che dipende solo dalla densità a una particella ρ(x) associata alla
funzione d’onda complessiva’:
E TF [ρ] = c
Z
dxρ5/3 (x)−
R3
M
X
j=1
Z
dx
αZj
R3
X
ρ(x)
+α
|x − Rj |
i<j
Z
Z
dy
dx
R3
R3
X Zk Z`
ρ(x)ρ(y)
+α
. (12.6)
|x − y|
|Rk − R` |
k<`
Usando le disuguaglianze di Lieb-Thirring nella forma del Tereoma 10.2 si vede facilmente che il primo
termine fornisce una stima dal basso dell’energia cinetica fermionica degli elettroni. Più complicato è
raffinare la disuguaglianza di Baxter (si veda [LSe, Capitolo 6]) per ricostruire i due termini seguenti (secondo
e terzo termine in (12.6)) dall’aspettazione del potenziale elettrostatico. In ogni caso si dimostra [LT] che il
funzionale E TF fornisce una stima dal basso per l’energia E[Ψ]. Inoltre minimizzando E TF rispetto a ρ ≥ 0
sotto la condizione di normalizzazione kρk1 = N , si ottiene una quantità E TF (N, M, R, Z) e
E0 (N, M, R, Z) ≥ E TF (N, M, R, Z),
(12.7)
e il problema della stabilità della materia di seconda specie è ridotto a dimostrare analoghe proprietà per
l’energia dello stato fondamentale del funzionale di Thomas-Fermi. In particolare si può dimostrare che la
stabilità di seconda specie per Thomas-Fermi è equivalente all’assenza di legame (vedi sotto) fra gli atomi,
risultato già noto al tempo del lavoro di Lieb, Thirring (era stato dimostrato da Lieb, Simon in [LSi1]).
Si noti che l’assenza di legame è una proprietà certamente falsa nella realtà, poiché gli atomi si legano per
formare le molecole, tuttavia non vi è nulla di strano nel fatto che la stabilità della materia si possa ottenere
dall’assenza di legame per una teoria efficace. In altri termini la teoria di Thomas-Fermi non fornisce una
descrizione accurata della materia (tranne che nel limite di grande Z, ovvero per grande numero di atomi),
ma ciò nonostante l’energia di Thomas-Fermi è una buona approssimazione dal basso dell’energia della
materia. Più precisamente l’energia di Thomas-Fermi soddisfa le seguenti proprietà (si veda ad esempio
[LSi2] per una review):
P
• E TF (N, M, R, Z) = E TF ( Zi , M, R, Z), cioè lo stato fondamentale di Thomas-Fermi è raggiunto per
atomi neutri;
• vale l’assenza di legame, ovvero
E TF (N, M, R, Z) ≥ min

M
X

E TF (Ni , 1, Ri , Zi ), Ni ≥ 0,
j=1
M
X
i=1
Ni = N


,

cioè spostando i nuclei in modo che siano arbitrariamente lontani fra di loro si abbassa l’energia. Si
noti che E TF (Ni , 1, Ri , Zi ) è in effetti indipendente da Ri ;
• E TF (N, 1, 0, Z) = Z 7/3 E TF (N/Z, 1, 0, 1);
che combinate fra di loro implicano che (è facile vedere che E TF (1, 1, 0, 1) < 0)
E
TF
(N, M, R, Z) ≥ E
TF
(1, 1, 0, 1)
M
X
j=1
7/3
Zj
≥E
TF
(1, 1, 0, 1)Z
4/3
M
X
Zj = E TF (1, 1, 0, 1)Z 4/3 N.
(12.8)
j=1
Successivamente molte altre strade sono state proposte per dimostrare la stabilità della materia. Le
ometteremo per brevità, facendo riferimento alla monografia [LSe] per una discussione dettagliata. Si noti
che la dimostrazione proposta in [LSe] è una via di mezzo fra quella originale di Lieb, Thirring (usa
le disuguaglianze di Lieb-Thirring ma non la teoria di Thomas-Fermi) e quella che abbiamo presentato in
queste note: anziché seguire la via più diretta si usa infatti una stima più raffinata dell’energia elettrostatica
(stima dell’energia di Coulomb di scambio), che permette di ottenere costanti più realistiche nella stima
finale e, in particolare, una migliore approssimazione dell’energia per particella.
150
12.2
Conseguenze della Stabilità di Seconda Specie
Possiamo ora tornare al problema da cui siamo partiti, ovvero dal fatto che il volume occupato dalla materia
sia molto maggiore di quanto ci si potrebbe aspettare (si veda l’introduzione a questa parte delle note). Una
conseguenza diretta del Teorema 12.1 è precisamente che il volume occupato dalla materia cresce linearmente
con il numero di componenti o, più precisamente, è proporzionale al numero di elettroni N che ne fanno
parte. Il volume è quindi una quantità estensiva e come tale per un generico sistema (ad esempio un atomo)
non può essere arbitrariamente piccola.
Enunciamo anzitutto un semplice Corollario del Teorema 12.1:
Corollario 12.1.
Per ogni Ψ ∈ L2a (R3N ) normalizzata, esistono due costanti A ≥ 0 e K > 0, tali che
E[Ψ] ≥ −AN,
Z
5/3
T [Ψ] ≥ K
dx ρΨ (x).
(12.9)
(12.10)
R3
Dimostrazione. La dimostrazione è immediata: la prima disuguaglianza non è nient’altro che la (9.39) dove
A = A(Z, M/N ) = CZ 2 (1+M/N ). La seconda stima è invece la forma delle disuguaglianze di Lieb-Thirring
formulata nel Corollario 10.1.
Teorema 12.2 (Estensività della materia).
Sia Ψ ∈ L2 (R3N ) una qualunque funzione d’onda normalizzata che soddisfa (12.9) e (12.10), allora
i) ∃γ > 0 tale che
1
N
Z
dx |x|ρΨ (x) ≥ γN 1/3
(12.11)
R3
cioè la distanza media degli elettroni dall’origine è ∝ N 1/3 e quindi il volume occupato è proporzionale
a N;
ii) dato un qualsiasi misurabile Ω ⊂ R3 , esiste una costante c > 0 tale che
|Ω|
N
2/5
c
≥
N
Z
dx ρΨ (x),
(12.12)
Ω
quindi perché Ω possa contenere una frazione macroscopica (ordine N ) di particelle, il suo volume deve
essere anch’esso ordine N .
Dimostrazione. Dimostriamo per prima cosa che per ogni λ ∈ (0, 1) vale la disuguaglianza
(1 − λ)T [Ψ] + V [Ψ] ≥ −
AN
.
1−λ
(12.13)
Usiamo le proprietà delle dilatazioni e poniamo Ψλ (X) = (1 − λ)3N/2 Ψ((1 − λ)X). Chiamiamo inoltre
Rλ = (1 − λ)−1 R. Allora il Corollario 12.1 implica che
E[Ψλ ] = T [Ψλ ] + VRλ [Ψλ ] ≥ −AN,
dove abbiamo indicato esplicitamente la dipendenza del potenziale dalla posizione dei nuclei. Un semplice
calcolo però mostra che
T [Ψλ ] = (1 − λ)2 T [Ψ],
VRλ [Ψλ ] = (1 − λ)VR [Ψ],
cosı̀ che la (12.13) è dimostrata. Riformulando la (12.13) e indicando E[Ψ] = E, otteniamo inoltre la stima
T [Ψ] ≤
AN
E + AN
+
.
λ
1−λ
(12.14)
151
A questo minimizziamo il membro di destra rispetto a λ ∈ (0, 1), che equivale a scegliere
√
E + AN
λ= √
,
√
AN + E + AN
da cui
√
AN +
√
E + AN
Z
2
5/3
≥ T [Ψ] ≥ K
R3
dx ρΨ (x),
(12.15)
per la (12.10). Usiamo ora la disuguaglianza (12.16) con p = 1 dimostrata nel prossimo Lemma 12.1:
Z
−2
Z
11/3 Z
−2
√
2
p
11/3
dx |x|ρΨ (x)
N
dx ρΨ (x)
dx |x|ρΨ (x)
= CN
,
A + E/N + A ≥ C
R3
R3
R3
che implica la (12.11).
Consideriamo ora la (12.12): la disuguaglianza di Hölder e la (12.15) implicano che
Z
2/5 Z
3/5
Z
5/3
dx ρΨ (x) ≤
dx
dx ρΨ (x)
≤ C|Ω|2/5 N 3/5 ,
Ω
Ω
Ω
e di conseguenza il risultato.
Lemma 12.1.
Per ogni p > 0, ∃Cp > 0 tale che
Z
dx ρ
5/3
R3
p/2 Z
dx |x|p ρ
R3
1+5p/6
Z
≥ Cp ,
(12.16)
dx ρ
R3
per ogni ρ ≥ 0.
Dimostrazione. Anzitutto possiamo assumere che kρk1 = 1, perché se cosı̀ non fosse potremmo dividere ρ
per la sua norma L1 ed è facile vedere che il rapporto al membro di sinistra della (12.16) sarebbe invariante
sotto questa trasformazione. Voglaimo allora minimizzare il funzionale
Z
p/2 Z
Z
5/3
p
F[ρ] =
dx ρ
dx |x| ρ − λ
dx ρ,
(12.17)
R3
R3
R3
sulle ρ non vincolate. Il moltiplicatore di Lagrange λ sarà poi fissato dalla richiesta di normalizzazione.
Per trovare l’equazione di Eulero-Lagrange associata alla minimizzazione imponiamo per una Φ ∈ C0∞ (R3 )
positiva
lim {F[ρ + εφ] − F[ρ]} = 0,
ε→0
da cui si ricava l’equazione
( Z
)
p/2−1 Z
Z
p/2
Z
5
5/3
p
2/3
5/3
p
dx Φ(x)
p
dy ρ (y)
dy |y| ρ(y) ρ (x) +
dy ρ (y)
|x| − λ = 0,
6
R3
R3
R3
R3
e di conseguenza

ρ2/3 (x) =
1−p/2
kρk5/3

kρk5/3
6 
λ
−
|x|p  ,
p
5p
k|x| ρk1
k|x|p ρk1
(12.18)
+
dove la parte positiva è necessaria al fine di ottenere un minimizzatore nel dominio. Più semplicemente
l’equazione precedente ci dice che il minimizzatore è della forma
ρ(x) = [a − b|x|p ]+ ,
(12.19)
cioè è una funzione a supporto compatto che dipende da due parametri a e b. Imponendo la normalizzazione
L1 si trova ci si riduce ad un solo parametro indipendente e ottimizzando l’energia F rispetto a tale parametro
si può trovare il valore esplicito di Cp . Omettiamo i dettagli per brevità.
152
Per concludere questo Capitolo, consideriamo il caso dei bosoni. Come vedremo nel prossimo Teorema
12.3 se gli elettroni fossero bosoni la materia non sarebbe stabile della seconda specie. In particolare lo stato
fondamentale sarebbe proporzionale a −CN 5/3 :
Teorema 12.3 (Instabilità della materia bosonica).
Consideriamo N bosoni carichi negativamente in interazione con M nuclei con carica nucleare uguale Z,
allora esistono una Ψ ∈ L2s (R3N ) e una configurazione dei nuclei R tali che
E[Ψ] ≤ −CZ 4/3 min {N, ZM }5/3 .
(12.20)
Osservazione 12.3. In effetti il risultato del Teorema 12.3 non è ottimale perché si può mostrare [Dy]
che, tenendo conto dell’energia cinetica dei nuclei, l’andamento dell’energia dello stato fondamentale è
leggermente migliore, cioè −CN 7/5 anziché N 5/3 . In ogni caso però un sistema bosonico resta instabile di
seconda specie, anche se stabile di prima specie.
Dimostrazione. Assumiamo per semplicità che M = n3 , n ∈ N, e il sistema sia neutro, cioè N = M Z. Per
dimostrare la (12.20) valutiamo l’energia sullo stato di prova
Ψ(X) =
N
Y
φλ (xi ),
φλ (x) = λ3/2 g(λx),
(12.21)
i=1
con λ > 0 parametro variazionale da scegliere in seguito e g ∈ C0∞ (R3 ) reale normalizzata in L2 (R3 ). E’
immediato calcolare
Z
2
dx |∇g|2 + αλṼ (N, R, Z),
(12.22)
E[Ψ] = N λ
R3
dove
1
Ṽ (N, R, Z) = N (N − 1)
2
N/Z Z
X
g 2 (x)g 2 (y)
dx
dy
− NZ
|x − y|
R3
R3
Z
Z
j=1
dx
R3
g 2 (x)
+ U (R, Z).
|x − Rj |
(12.23)
Dimostreremo ora che esiste una configurazione R tale che
Ṽ (N, R, Z) ≤ −CZ 2/3 N 4/3 .
(12.24)
Vediamo prima però che tale stima permette di completare la dimostrazione:
E[Ψ] ≤ N λ2 T [g] − CαλZ 2/3 N 4/3
e ottimizzando rispetto a λ, cioè prendendo λ = CZ 2/3 N 1/3 , dove abbiamo riassorbito l’energia cinetica di
g nella costante (assumendo ovviamente che T [g] > 0), otteniamo
E[Ψ] ≤ −CZ 4/3 N 5/3 .
(12.25)
Dimostriamo ora la (12.24): dividiamo il supporto di g in M celle Γk tali che
Z
1
dx g 2 =
,
M
Γk
e collochiamo il k−esimo nucleo nella cella Γk e mediamone la posizione rispetto alla distribuzione di
probabilità M g 2 in Γk . In tal modo l’energia elettrostatica che otteniamo soddisferà la stima
Z
Z
1
1 2 2
g 2 (x)g 2 (y)
dy
Ṽ (N, R, Z) ≤
N (N − 1) − ZN M + Z M
dx
2
2
|x − y|
R3
R3
Z
Z
Z
M
M Z
1 2 2X
g 2 (x)g 2 (y)
1 2 2X
g 2 (x)g 2 (y)
− Z M
dx
dy
≤− Z M
dx
dy
2
|x − y|
2
|x − y|
Γj
Γj
Γj
Γj
j=1
j=1
(12.26)
153
poiché 12 N (N − 1) − ZN M + 12 Z 2 M 2 = − 21 N < 0. Infatti il secondo termine nella (12.23) diventa
−N ZM
M Z
X
j=1
dx g 2 (x)
R3
Z
dy
Γj
g 2 (y)
= −N ZM
|x − y|
Z
Z
dy
dx
R3
R3
g 2 (x)g 2 (y)
,
|x − y|
mentre il terzo
2
Z M
2
g 2 (x)g 2 (y)
1
dy
dx
= Z 2M 2
|x − y|
2
Γ`
Γk
XZ
k<`
Z
Z
Z
dy
dx
R3
R3
g 2 (x)g 2 (y)
|x − y|
M
X
1
− Z 2M 2
2
j=1
Z
Z
dx
Γj
dy
Γj
g 2 (x)g 2 (y)
.
|x − y|
Dalla (12.26) possiamo poi stimare
M
X
1
Ṽ (N, R, Z) ≤ − Z 2
min
2 {µ, suppµ⊂Bj , µ(Bj )=1}
j=1
Z
Z
dµ(x)
Bj
dµ(y)
Bj
1
,
|x − y|
(12.27)
dove abbiamo rimpiazzato Γj con la più piccola palla Bj che la contiene. E’ noto [LL, Sezione 11.15] che il
minimo dell’energia di Coulomb di una distribuzione di carica unitaria a supporto contenuto in una palla
di raggio r è raggiunto su una distribuzione uniforme supportata sulla superficie della palla e tale minimo è
1
uguale a 2r
, cosı̀ che
M
1 X 1
1
1
Ṽ (N, R, Z) ≤ − Z 2
≤ − Z 2M 1 P
,
4
r
4
j rj
M
j=1 j
dove abbiamo usato la disuguaglianza
di Jensen (prossimo Lemma 12.2). A questo punto resta solo da far
1 P
vedere che per una g ragionevole M
rj ≤ CM −1/3 , perché questo implicherebbe la (12.24). Un esempio
semplice è quello che si può costruire prendendo g(x) = f (x)f (y)f (z) con suppf = [−1/2, 1/2]. Possiamo
poi decomporre [−1/2, 1/2] in n intervalli Ij tali che
Z
1
dx f 2 (x) = ,
n
Ij
e costruire i Γk come prodotto degli intervalli Ij . Ricordando che M = n3 per ipotesi, se prendiamo un
rettangolo Γk di lati sk , tk , uk , abbiamo che
rk =
1/2 1
1 2
sk + t2k + u2k
≤ (sk + tk + uk ),
2
2
da cui
1 X
1 X
3 X
3 X
3
3
rk ≤
(sk + tk + uk ) =
sk = 3
|Ik | =
=
,
M
2M
2M
2n
2n
2M 1/3
perché la lunghezza media degli intervalli Ik è proprio 1/n.
Lemma 12.2 (Disuguaglianza di Jensen).
Sia f una funzione convessa e µ una misura positiva su R, allora
Z
Z
1
1
dµ(x) f (x) ≥ f
dµ(x) x .
µ(R) R
µ(R) R
(12.28)
Bibliografia
Per la prima parte del corso (Capitoli 1, 2, 4 e 5) un buon riferimento è [GP1, GP2]: si tratta
di un libro di fisica in cui però i problemi matematici, se non risolti, sono almeno citati. E’ utile
come riferimento anche se più orientato verso l’aspetto fisico. Un altro testo di fisica sulla MQ
che può essere conveniente consultare è [C-TDL1, C-TDL2]. Dal punto di vista matematico o
fisico-matematico è difficile identificare un testo completo di riferimento. Un buon riferimento
potrebbe essere la serie di cui [T3] è parte ma si tratta di approccio molto sintetico, di non facile
lettura. Due testi avanzati di grande interesse ma con un approccio diverso all’introduzione della
MQ sono [De, St].
Per il Capitolo 3 e molti dei risultati di analisi funzionale che usiamo nel corso il riferimento
classico è [RS1, RS2, RS4]. Naturalmente si tratta di un testo enciclopedico in cui è facile
perdersi, ma, almeno nel primo volume, i Capitoli introduttivi contengono un buon richiamo dei
risultati di base sulla teoria della misura, gli spazi di Banach ecc..
Per il Capitolo 6 e 7 e in generale per tutti i risultati più tecnici di analisi funzionale il riferimento
perfetto è [LL]: i temi Capitoli 6 e 7 sono in effetti contenuti in [LL, Capitolo 11]. Anche questo
testo contiene una quantità enorme di informazione ma è certamente più sintetico del Reed-Simon
e, soprattutto, si può considerare un compendio esaustivo degli strumenti essenziali dell’analisi
funzionale moderna. Una lettura sistematica dall’inizio alla fine non è necessaria per il corso, ma
è sicuramente molto istruttiva.
I Capitoli 8–12 sono tratti da [LSe], con aggiunta e espansione di materiale. Anche in questo
caso la lettura dell’intero testo non è necessaria. La si consiglia comunque a chi fosse interessato
a fare un giorno ricerca in area fisico-matematica.
[AS]
M. Abramowitz, A. Stegun, Handbook of Mathematical Functions, Dover, 1965.
[BC]
J. Bellandi Fo, E.S. Caetano Neto, “The Mehler formula and the Green function of the
isotropic multi-dimensional harmonic oscillator”, J. Phys. A: Math. Gen. 9 (1976), 683 – 685.
[C-TDL1] C. Cohen-Tannoudji, B. Diu, F. Laloé, Quantum Mechanics, Volume One, Wiley-Vch,
2006.
[C-TDL2] C. Cohen-Tannoudji, B. Diu, F. Laloé, Quantum Mechanics, Volume Two, Wiley-Vch,
2006.
[De]
G. Dell’Antonio, Aspetti Matematici della Meccanica Quantistica. Vol. 1:
Matematica e Concettuale, Bibliopolis, 2011.
[Dy]
F.J. Dyson, Ground state energy of a finite system of charged particles,J. Math. Phys. 8 (1966),
1538 – 1545.
[DL]
F.J. Dyson, A. Lenard, Stability of matter I, J. Math. Phys. 8 (1967), 423–434; Stability of
Matter II, J. Math. Phys. 9 (1968), 1538–1545.
154
Struttura
155
[GP1]
A. Galindo, P. Pascual, Quantum Mechanics I, Springer-Verlag, 1978.
[GP2]
A. Galindo, P. Pascual, Quantum Mechanics II, Springer-Verlag, 1978.
[E]
P. Ehrenfest, Collected Scientific Papers, North-Holland Publishing, 1959.
[J]
J.H. Jeans, The Mathematical Theory of Electricity and Magnetism, Cambridge University
Press, 1915.
[LL]
E.H. Lieb, M. Loss, Analysis, Graduate Studies in Mathematics 14, American Mathematical
Society, 1997.
[LSe]
E.H. Lieb, R. Seringer, The Stability of Matter in Quantum Mechanics, Cambridge University
Press, 2010.
[LSi1]
E.H. Lieb, B. Simon, Thomas-Fermi theory revisited, Phys. Rev. Lett. 31 (1973), 681–683.
[LSi2]
E.H. Lieb, B. Simon, Thomas-Fermi theory of atoms, molecules and solids, Adv. Math. 23
(1977), 22–116.
[LT]
E.H. Lieb, W. Thirring, Bound for the Kinetic Energy of Fermions which Proves the Stability
of Matter, Phys. Rev. Lett. 35 (1975), 687–689. Errata ibid. (1975), 1116.
[RS1]
M. Reed, B. Simon, Modern Methods of Mathematical Physics II: Functional Analysis,
Academic Press, 1972.
[RS2]
M. Reed, B. Simon, Modern Methods of Mathematical Physics II: Fourier Analysis, SelfAdjointness, Academic Press, 1975.
[RS4]
M. Reed, B. Simon, Modern Methods of Mathematical Physics IV: Analysis of Operators,
Academic Press, 1978.
[So]
J.P. Solovej, Stability of Matter, Encyclopedia of Mathematical Physics 5 (2006), 8–14.
[St]
F. Strocchi, An Introduction to the Mathematical Structure of Quantum Mechanics, Advanced
Series in Mathematical Physics 27, World Scientific, 2005.
[T3]
W. Thirring, A Course in Mathematical Physics 3: Quantum Mechanics of Atoms and
Molecules, Springer-Verlag, 1979.
[VN]
J. Von Neumann, Mathematical Foundations of Quantum Mechanics, Princeton University
Press, 1955.