5. I principi della Fisica Quantistica

annuncio pubblicitario
5.
I principi della Fisica Quantistica
Variabili e stati
Sulla base delle idee di Heisenberg, assumeremo che le variabili di un sistema
siano gli elementi reali, detti anche hermitiani, o autoaggiunti, A = A∗ , di
un’algebra (non commutativa) sui numeri complessi, con una involuzione,
∗, cioè di una ∗ algebra sui complessi. Ricordiamo che una ∗ algebra A è
uno spazio vettoriale con un prodotto associativo, distributivo rispetto alla
somma e compatibile con il prodotto per numeri,
(λA)(µB) = (λµ)(AB) ∀λ, µ ∈ C,
I A, B ∈ A ,
con
(λA)∗ = λ̄ A∗ , (A + B)∗ = A∗ + B ∗ , (AB)∗ = B ∗ A∗ .
Assumeremo anche che A contenga una (automaticamente unica) identità,
indicata con 1. La struttura algebrica di A permetterà di scrivere equazioni
e relazioni per le variabili in termini dei loro polinomi e, come vederemo in
seguito, anche di loro “funzioni” non polinomiali, in una classe anzi molto
ampia. Analogamente alla coniugazione complessa sulle funzioni, l’involuzione ∗ definisce una nozione di positività: sono positivi gli elementi A della
forma A = B ∗ B.
Le relazioni in A avranno la interpretazione di leggi fisiche, soddisfatte in
modo del tutto generale, indipendente dalla particolare situazione fisica cui
si fa riferimento, in particolare indipendentemente da qualsiasi “condizione
iniziale”.
Per la descrizione delle singole situazioni fisiche introduciamo la nozione
di stato, che interpreteremo come l’insieme delle informazioni che si hanno
su un sistema, associate anche, nel caso di sistemi preparati in laboratorio.
a una procedura di preparazione o di selezione. Indipendentemente dalla
sua origine, uno stato si caratterizzerà per i risultati che darà per le diverse
variabili. Assumiamo perciò che siano ben definite delle procedure di misura
associate a ciascuna delle variabili e che il loro risultato sia in generale un
numero reale. Da un punto di vista sperimentale, sono anzi tali procedure
che definiscono le variabili ed è la teoria ad assegnare loro relazioni algebriche
appropriate, da verificare a posteriori.
Diversamente dalla descrizione classica, in conseguenza del principio di
indeterminazione, i risultati per una variabile su un dato stato non possono
essere assunti come univocamente determinati e ammetteranno in generale al
1
più una descrizione probabilistica. In particolare, ogni stato ω darà origine
a una nozione di media, che assumiamo lineare, positiva e normalizzata,
ω : A 7→ C
I , ω(λA + µB) = λω(A) + µω(B) , ω(A∗ A) ≥ 0 , ω(1) = 1. (1)
Vedremo che, in conseguenza della struttura algebrica delle variabili, ogni
funzionale (lineare, positivo e normalizzato) definisce automaticamente non
solo una media, ma, per ciascuna variabile hermitiana, una (unica) distribuzione di probabilità su una variabile reale. Le medie che abbiamo introdotto
saranno perciò a posteriori vere distribuzioni probabilistiche, e l’equazione
(1) rappresenta un modo molto economico per introdurle, anche nel caso
classico di un’algebra commutativa.
Nel caso di variabili che possano assumere valori arbitrariamente grandi,
questa costruzione richiederà anche una certa ipotesi di regolarità; per evitarla, ci si potrebbe restringere ad algebre che escludano tali variabili illimitate,
assumendo l’esistenza di una norma su A come spazio vettoriale, con
||AB|| ≤ ||A|| ||B|| , ||A∗ A|| = ||A||2 .
Completandola in tale norma, A definisce allora una B ∗ algebra (B per Banach, trattandosi di uno spazio di Banach che è anche un’algebra). Questo
schema presenta anche altri vantaggi dal punto di vista tecnico e vi ricorreremo qualche volta per precisare risultati che richiedono altrimenti ipotesi che
possono sembrare speciali.
La costruzione GNSW
Variabili e stati appaiono a questo punto come nozioni piuttosto generali
ed astratte. Vogliamo mostrare che possono invece essere identificate con
strutture matematiche più familiari e controllabili, le variabili con operatori
in spazi di Hilbert, nei casi più semplici con matrici in spazi vettoriali a
dimensione finita, e gli stati con funzionali definiti sugli operatori da
Φ(A) = (ψ, Aψ) ,
con ( , ) il prodotto scalare in uno spazio di Hilbert.
Più precisamente dimostriamo il risultato seguente: Dato uno stato ω su
una ∗ algebra A, con identità, sui complessi, esistono uno spazio di Hilbert
H, una rappresntazione π di A negli operatori in H, cioè un’applicazione che
2
rispetta le operazioni algebriche e trasforma l’involuzione nella coniugazione
hermitiana, e un vettore ψω ∈ H tali che
ω(A) = (ψω , π(A) ψω ) .
(2)
Il vettore ψω è ciclico per π(A), cioè il sottospazio π(A)ψω è denso in H.
H, π, ψω sono unici a meno di una isometria invertibile U che scambia gli
spazi e i vettori ciclici, e agisce sulle rappresentazioni con
π2 (A) = U π1 (A) U −1
(3)
La costruzione di H, π e ψω si indica con i nomi di Gelfand, Naimark, Segal e Wightman e procede cosı̀: consideriamo A stessa come spazio vettoriale;
essendo lineare e positivo, ω vi definisce il prodotto scalare
(A, B) = ω(A∗ B) ;
Il sottospazio a norma nulla è anche un ideale sinistro di A, dato che (A, B) =
0 ∀A implica
(A, CB) = ω(A∗ CB) = ω(C ∗ A)∗ B) = 0 ∀A, C .
Quozientando tale sottospazio, il prodotto scalare è non degenere e lo spazio
cosı̀ ottenuto si identifica perciò con un sottospazio denso, D, di uno spazio
di Hilbert H. Su D possiamo definire π(A)B ≡ AB perchè se B è un
vettore nullo, anche AB lo è per la proprietà di ideale del sottospazio nullo.
Evidentemente
π(AC)B = ACB = π(A)π(C)B
e lo stesso per A + C. Inoltre
(π(A∗ )C, B) = (A∗ C, B) = ω((A∗ C)∗ B) =
= ω(C ∗ AB) = (C, AB) = (C, π(A)B) = (π(A)∗ C, B) ,
cioè π(A∗ ) = π(A)∗ . Sia ora ψω ≡ 1; allora
(ψω , π(A)ψω ) = (1, A1) = ω(A)
e π(A)ψω = A non è altro che il sottospazio D, denso in H. Se ψ 0 ∈ H0
e π 0 soddisfano l’eq.(2) e lo spazio vettoriale D0 ≡ π 0 (A)ψ 0 è denso in H0 ,
allora, essendo i prodotto scalari definiti dalla stessa relazione, l’operatore
U : π(A)ψω 7→ π 0 (A)ψ 0 scambia π e π 0 e mette in corrispondenza isometrica
D e D0 , e perciò H e H0 . I vettori ψω hanno norma 1 per la condizione
3
di normalizzazione su ω. I funzionali della forma (ψ, Aψ) vengono anche
chiamati “il valore di aspettazione di A su ψ ”.
In generale, due rappresentazioni si dicono unitariamente equivalenti, o
anche equivalenti se esiste una isometria invertibile tra gli spazi di Hilbert su
cui sono definiti che le scambia, eq.(3). Una rappresentazioni si dice irriducibile se non esiste un sottospazio di Hilbert proprio e non nullo invariante
sotto gli operatori della rappresentazione.
Poichè ammettiamo anche operatori non limitati, occorre precisare che
le rappresentazioni consistono di operatori definiti su un dominio denso, invariante sotto la loro azione. Gli operatori unitari che scambiano rappresentazioni devono perciò in particolare scambiare tali domini e i sottospazi
invarianti devono contenere domini densi invarianti. Tali complicazioni non
nascono nel caso di una B ∗ algebra, dato che allora la costruzione GNSW dà
origine a operatori limitati, definiti su tutto lo spazio di Hilbert.
Sempre in grande generalità, uno stato si dice misto se può essere scritto
come combinazione convessa di due stati diversi,
ω = λω1 + (1 − λ)ω2 , 0 < λ < 1 ,
(4)
altrimenti si dice puro.
Nel caso di B ∗ algebre, stati puri danno origine a rappresentazioni GNSW
irriducibili, e viceversa; infatti, H1 e H2 sono gli spazi ottenuti da ω1 e ω2 ,
si verifica facilmente che il funzionale ω è dato dai valori di aspettazione sul
vettore
λ1/2 ψω1 + (1 − λ)1/2 ψω2
nella somma diretta degli spazi, H = H1 ⊕ H2 ; viceversa, se la rappresentazione definita da ω è riducibile, le proiezioni di ψω su un sottospazio
invariante e sul suo ortogonale (automaticamente invariante per la presenza
della coniugazione ∗) definiscono i funzionali λω1 e (1 − λ)ω2 (e si può verificae che ω1 6= ω2 segue dalla ciclicità di ψω . Sempre per operatori limitati,
una rappresentazione è riducibile se e solo se e ci sono operatori (limitati),
non multipli dell’identità, che commutano con tutti i suoi operatori.
La costruzione dello spazio H sembra dipendere in modo essenziale da ω,
che ne definisce il prodotto scalare, oltre a individuare il vettore ψω . È chiaro
però che tutti i vettori φC = π(C)ψω danno origine a stati ωC che soddisfano
un’equazione della forma (2); differenti stati possono perciò essere rappresentati dall’eq.(2) nello stesso spazio di Hilbert. Anzi, applicando loro gli
operatori π(A), i vettori φC definiscono una rappresentazione, in un sottospazio di H, equivalente a quella ottenuta da ωC con la costruzione GNSW,
4
data la coincidenza dei prodotti scalari,
(π(B)φC , π(A) φC ) = ω(C ∗ B ∗ AC) = ωC (B ∗ A) .
Se π è irriducibile tale rappresentazione coincide necessariamente con π. Ne
segue che, al variare degli stati, si ottiene in una certa generalità la stessa
rappresentazione GNSW, a meno di equivalenza. Gli stati (puri) possono
essere perciò pensati suddivisi in classi, ciascuna associata a una rappresentazione (irriducibile). Vedremo che nel caso di un sistema di punti materiali
c’è una unica rappresentazione irriducibile, a cui sono associati tutti gli stati
puri fisicamente significativi; in questi casi, si può identificare l’algebra delle
variabili con un’algebra di operatori in uno spazio di Hilbert H e gli stati con
i funzionali della forma (2), con ψω ∈ H.
L’interpretazione probabilistica
Vediamo ora come si costruisce l’interpretazione probabilistica di variabili
e stati a cui abbiamo accennato. Fissiamo uno stato ω; per la costruzione
GNSW, i valori ω(A), che ω assegna alle variabili, si scrivono in termini degli
operatori π(A) in uno spazio di Hilbert H, e scriveremo per semplicità A
invece di π(A), intendendo sempre il corrispondente operatore in H. Gli spazi
di Hilbert che appaiono nella costruzione GNSW sono separabili, cioè hanno
dimensione numerabile, se l’algebra delle variabili è generata da un insieme
finito, o numerabile, di elementi; inoltre nelle considerazioni che seguono,
fissati ω e A, ci si può anche limitare all’algebra generata da A, e H è allora
automaticamente separabile.
Supponiamo, per cominciare, che l’operatore hermitiano A abbia una base
di autovettori, ei , con autovalori λi . Allora, ∀k ∈ N,
I
ω(Ak ) = (ψω , Ak ψω ) =
X
n
(ψω , en )λkn (en , ψω ) ≡
X
n
|cn |2 λkn .
(5)
Poichè, per la completezza della base en e la normalizzazione di ψω , i coefficienti |cn |2 si sommano a 1, l’eq.(5) può essere interpretata come l’espressione
per i momenti < xk > di una variabile reale x, che assume i valori λn con
probabilità |cn |2 . Tale distribuzione della variabile x è anzi univocamente
determinata dalla condizione che i momenti < xk >, k ∈ N,
I siano dati, in
k
questo caso da ω(A ); infatti, nel caso che x sia una variabile limitata, la trasformata di Fourier di una misura su un intervallo è una funzione olomorfa
in tutto il piano complesso, determinata dallo sviluppo in serie nell’origine,
5
dove la derivata k−esima è data proprio da < xk >; per variabili illimitate,
l’unicità richiede una discussione, che porta alla stessa conclusione se la crescita dei i momenti è ancora compatibile con l’analiticità della trasformata
di Fourier, < xk > < c k!.
Se ne conclude, almeno nel caso limitato, che la successione ω(Ak ) si può
identificare, in modo unico, con la successione dei momenti di una misura di
probabilità in una variabile reale; in particolare, tale variabile assume come
valori esattamente gli autovalori di A.
Alla stessa conclusione si arriva se A è un operatore di moltiplicazione,
per una funzione reale x(ξ), in uno spazio L2 (dµ(ξ)); in questo caso, l’eq.(5)
si scrive
Z
k
ω(A ) = dµ(ξ) |ψω (ξ)|2 x(ξ)k ,
che si interpreta ancora in termini della misura di probabilità
dµ(ξ) |ψω (ξ)|2 ,
con gli stessi vincoli di unicità. Anzi, il caso di una base di autovettori si ottiene precisamente quando la misura è concentrata su un insieme numerabile
di punti.
I due casi appena discussi riproducono in realtà la situazione che si presenta in generale, perchè il teorema spettrale afferma che ogni operatore
hermitiano e limitato in uno spazio di Hilbert separabile si scrive, a meno di
una isometria invertibile, come il moltiplicatore per una funzione reale limitata in uno spazio L2 . Nel caso di operatori hermitiani illimitati, il teorema
spettrale si estende, a rappresentare gli operatori come moltiplicatori per variabili illimitate, sotto una condizione di autoaggiunzione, che è appena più
stringente di quella di hermiticità, richiedendo la coincidenza dei domini dell’operatore e dell’aggiunto; l’uso di variabili illimitate richiede perciò qualche
verifica aggiuntiva. In ogni caso, a ogni stato e a ogni elemento hermitiano dell’algebra delle variabili (che sia rappresentato da un autoaggiunto, nel
caso illimitato) è associata una unica misura di probabilità su una variabile
reale.
I valori λ che tale variabile assume (con probabilità non nulla) sono anche
quelli per cui l’operatore A − λ non ha inverso limitato, cioè lo spettro di
A, dato che tale inverso non è altro che il moltiplicatore per 1/(x − λ); più
esattamente, la condizione di invertibilità riguarda πω (A) nella costruzione
GNSW su ω e i polinomi in A; sullo spettro di A in una data rappresentazione sono perciò concentrate tutte le misure di probablità associate agli stati
definiti dai suoi vettori.
6
Il risultato dell’analisi che precede è che lo schema di variabili in una
∗ algebra e di stati come funzionali lineari positivi dà origine a una teoria
della probabilità generalizzata, nel senso ogni stato definisce una distribuzione di probabilità su ogni variabile hermitiana, ma possono non essere
definite le distribuzioni congiunte. Queste vengono introdotte, con lo stesso
procedimento che per le singole variabili, solo nel caso di variabili commutanti (limitate), usando la rappresentazione spettrale congiunta di operatori
commutanti, come moltiplicatori per diverse variabili in uno spazio L2 .
Al contrario, che delle distribuzioni congiunte non possano essere definite,
attraverso i loro momenti, dai funzionali ω su prodotti di variabili che non
commutano è chiaro, dato che i corrispondenti momenti non distinguerebbero
l’ordine dei fattori; del resto, il prodotto di variabili hermitiane non comutanti
non è neppure hermitiano. Tuttavia questo non esclude, di per sé, che delle
distribuzioni congiunte possano essere introdotte diversamente, in modo da
riprodurre una vera teoria probabilistica.
La discussione dell’esistenza di una descrizione in un’unico spazio di probabilità dell’insieme delle distibuzioni di probabilità fornite dalle teorie quantistiche è centrale per precisare il contenuto stesso del Principio di indeterminazione di Heisenberg; a priori, esso può infatti essere inteso sia nel senso
che i valori assunti da variabili non commutanti, come posizione e impulso,
non sono sperimentalmente determinabili insieme, oppure nel senso, più forte, che le previsioni delle teorie quantistiche sono incompatibili con qualsiasi
attribuzione di tali valori.
A parte sistemi particolari e speciali limitazioni sulle variabili, i risultati
sulla rappresentabilità classica delle distribuzioni di probabilità quantistiche
sono negativi e fanno concludere che le teorie quantistiche danno origine a
una vera generalizzazione della teoria classica della probabilità.
Evoluzione temporale e trasformazioni unitarie
Il quadro che abbiamo costruito rappresenta un nuovo modo di descrivere,
ottenuto sostanzialmente generalizzando il concetto classico di variabile, e
di conseguenza quello di stato di cose, o situazione fisica. In vista della
costruzione di una meccanica si tratta ora di vedere quali siano le implicazioni
della descrizione quantistica sulla identificazione di una nozione di evoluzione
temporale.
L’idea fondamentale è che la descrizione che abbiamo introdotto non distingue nessun tempo in particolare e può essere assunta per tutti i tempi;
7
al variare del parametro tempo avrà allora luogo una specie di cambiamento
di variabili, per esempio posizioni e impulsi al tempo t dovranno sostituire
poisizioni e impulsi al tempo 0, mantenendo tra loro le stesse relazioni. Inoltre le variabili al tempo t dovranno essere funzioni di quelle al tempo 0, cioè
appartenere all’algebra da esse generata.
Il risultato è che a ogni variabile A al tempo 0 ne deve corrispondere una
al tempo t, A 7→ αt (A), e tale corrispondenza deve mantenere le relazioni
algebriche,
αt (λA + µB) = λαt (A) + µαt (B) ,
αt (AB) = αt (A)αt (B) , αt (A∗ ) = αt (A)∗ .
(6)
Inoltre, per l’indipendenza dall’origine dei tempi, l’evoluzione dal tempo s al
tempo s + t deve essere data da αt e di conseguenza
αt αs = αt+s ∀s, t ∈ IR .
(7)
Un’applicazione di una ∗ algebra in sé che soddisfi l’eq.(6) si denota come un
morfismo, un automorfismo in caso di invertibilità, che in questo caso segue
dall’eq.(7) per t = −s; il risultato è perciò un gruppo a un parametro di
automorfismi dell’algebra A delle variabili.
In generale, gli automorfismi α danno origine a trasformazioni degli stati,
ω 7→ α∗ (ω), definite da
α∗ (ω)(A) ≡ ω(α(A)) ,
(8)
dato che α rispetta linearità, positività e normalizzazione (α(1) = 1 per
l’unicità dell’identità). Inoltre mandano stati puri in stati puri (e misti in
misti), come si vede dalla definizione di stato puro, usando la surgettività di
α.
Il risultato è quindi un gruppo di trasformazioni degli stati, che mandano
stati puri in stati puri. Inoltre, se π è una rappresentazione di A in uno
spazio di Hilbert H, π(α(A)) definisce ancora una rappresentazione, indicata
con π · α, irriducibile se lo è π, dato che α agisce in modo invertibile.
In generale, si possono perciò presentare due casi, a seconda che le rappresentazioni π · αt siano equivalenti o meno a π: se non c’è equivalenza,
l’evoluzione temporale resta un fatto algebrico astratto; se invece, per tutti i
t, π · αt è equivalente a π, l’equivalenza unitaria si scrive
π(αt (A)) = U (t)−1 π(A)U (t)
(9)
con U (t) operatori unitari nello spazio H della rappresentazione π. Questo è
automaticamente il caso se le rappresentazioni irriducibili di A, o comunque
8
quelle significative per la descrizione di una classe di situazioni fisiche, sono
tutte equivalenti.
Gli operatori U (t) devono soddisfare la legge di gruppo solo a meno di
operatori che commutano con π(A), cioè, per rappresentazioni irriducibili, di
multipli (di modulo 1) dell’identità. D’altra parte, gli stessi operatori sono
definiti, dall’eq.(9), a meno di multipli dell’identità ed è stato dimostrato che
in questi casi, per un gruppo a un parametro, la legge di gruppo può sempre essere solddisfatta ridefinendo ciascun operatore U (t) per un opportuno
multiplo dell’identità.
A questo punto, assumendo che le variabili siano indentificabili con un’algebra irriducibile di operatori in uno spazio di Hilbert, l’evoluzione temporale
è descritta da un gruppo di operatori unitari, U (t), univocamente determinati dall’eq.(9), a meno di costanti moltiplicative che soddisfano la legge di
gruppo.
Considerazioni molto simili si applicano a tutte le trasformazioni delle
variabili in sé che rispettano le relazioni algebriche, per esempio, alle rotazioni
e alle traslazioni nello spazio, con la sola differenza che i possibili fattori che
modificano la legge di gruppo non sono sempre eliminabili.
Hamiltoniano, equazioni del moto
I gruppi a un parametro di operatori unitari, U (t), si caratterizzano in modo
molto semplice alla sola condizione che siano continui, in senso forte, cioè
che, per ogni vettore ψ, i suoi evoluti
ψ(t) = U (t)ψ
dipendano da t con continuità. In spazi complessi a dimensione finita è facile
vedere che sono tutti della forma
U (t) = eiAt ,
(10)
con A = A∗ : le matrici unitarie U (t) sono infatti diagonalizzabili, lo sono
tutte nella stessa base perchè commutano tra loro in conseguenza della legge
di gruppo; i loro autovalori λi (t) soddisfano la legge di gruppo, sono continui
in t e sono perciò della forma
λi (t) = eiαi t ,
e perciò vale l’eq.(10), con A definita, nella stessa base, dagli αi come autovalori.
9
In generale, lo stesso risultato vale in spazi di Hilbert, con due precisazioni: A∗ = A vale in senso stretto cioè, nel caso (frequente e inevitabile) di
operatori illimitati, il dominio di A∗ è identico a quello di A, cioà A è autoaggiunto; inoltre, la serie di potenze che definisce l’esponenziale converge solo
su un sottospazio (ancora denso) del dominio di A. Inoltre, ogni operatore
autoaggiunto A dà origine a un gruppo di unitari a un parametro, fortemente
continuo U (t) = eiAt , dove la funzione esponenziale può anche essere definita
dalla sua serie di potenze, su un opportuno dominio, oppure costruita usando
la rappresentazione spettrale di A; in spazi separabili, se A si identifica con la
moltiplicazione per x(ξ) in L2 (dµ(ξ)), U (t) è definito come la moltiplicazione
per eix(ξ)t .
Convenzionalmente, si scrive A = −H/h̄, con h̄ = h/2π, e l’eq.(10) si
scrive
U (t) = e−iHt/h̄ .
(11)
Dalla costruzione dell’esponenziale tramite il teorema spettrale si vede anche
facilmente che i vettori U (t)ψ sono derivabili rispetto a t per tutti i vettori
ψ nel dominio di H, che è anche invariante sotto l’azione degli U (t), e
d/dt U (t)ψ = −iH/h̄ ψ .
(12)
Ritornando all’evoluzione delle variabili, eq.(9), ne segue, assumendo per
esempio la stabilità del dominio di H sotto la variabile π(A) e tralasciando
di precisare la rappresentazione π,
d/dt αt (A) = i/h̄ [H, αt (A)] .
(13)
Le equazioni (13), al variare di A in un’algebra irriducibile di operatori (limitati), individuano H a parte l’addizione di un multiplo dell’identità, dato
che la differenza tra due operatori Hi che soddisfino l’eq.(13) commuta con
tutte le variabili.
Le equazioni (13) hanno la stessa forma delle equazioni del moto della
meccanica classica hamiltoniana, con il commutatore, moltiplicato per i/h̄,
che sostituisce le parentesi di Poisson. Per questo l’operatore H si indica
come Hamiltoniano e si interpreta come la variabile energia; l’introduzione
della costante di Planck nell’eq.(11) è in questo senso opportuna perchè dà
ad H le dimensioni di un’energia, che puo‘ essere perciò espressa nelle solite
unità.
La derivazione delle equazioni (13) non ha tuttavia fatto alcun riferimento né alla meccanica hamiltoniana né ad altre strutture o risultati della
meccanica classica. L’operatore H è determinato dalle trasformazioni αt , o
10
dalle equazioni del moto, definite sulle variabili non commutative. Introdurre una dinamica non richiede perciò nessuna analogia classica; significa in
sostanza assegnare delle equazioni del moto che definiscano un gruppo di automorfismi, che sono anche caratterizzati, nel caso in cui siano implementati
unitariamente, dall’operatore autoaggiunto H che genera il corrispondente
gruppo unitario e soddisfa l’eq.(13)
11
6.
La Meccanica dei punti materiali
L’algebra di Heisenberg e la rappresentazione di Schroedinger
La meccanica dei punti materiali si ottiene specializzando lo schema generale
al caso di sistemi descritti da variabili di posizione e impulso. Per semplicità
discutiamo punti materiali, detti anche particelle, che si muovano nello spazio
euclideo, anche se una costruzione simile può essere fatta per punti su una
varietà. Consideriamo perciò variabili di posizione, qi e di impulso, pi , i =
1 . . . n, con le relazioni
[pi , qj ] = −i h̄ δij
(14)
Sull’algebra dei polinomi nelle variabili qi e pi , che si indica come l’algebra di Heisenberg, AH , consideriamo stati ω con la sola restrizione che la
corrispondente costruzione GNSW dia origine a rappresentazioni in cui esistano, come limiti su un dominio denso delle corrispondenti serie di potenze,
almeno le funzioni esponenziali,
eiαpi , eiβqi ,
(15)
che commutano per indici diversi e assumiamo soddisfino le relazioni, formalmente equivalenti alle eq.(14),
eiαpi eiβqi = eiβqi eiαpi eih̄αi βi .
(16)
L’algebra definita dalle relazioni (16) si indica come Algebra di Weyl.
Tutti gli stati sull’algebra di Heisenberg, regolari nel senso sopra indicato, risulteranno rappresentabili da vettori in una unica rappresentazione πS ,
detta di Schroedinger, dell’algebra di Heisenberg, o in una somma diretta
di tali rappresentazioni. πS è definita nello spazio di Hilbert L2 (IRn , dn x)
rappresentando le variabili qi come operatori di moltiplicazione e le pi come
operatori di derivazione, in modo da soddisfare l’eq.(14):
πS (qi ) = xi , πS (pi ) = −i h̄ ∂/∂xi .
I vettori di questa rappresentazione vengono indicati come funzioni d’onda,
ψ(x); la interpretazione probabilistica che abbiamo costruito in generale è
data per le variabili xi direttamente dalla misura |ψ(x)|2 dn x; per funzioni
d’onda decrescenti abbastanza rapidamente, i valori medi dei polinomi in x
sono infatti dati da
Z
(ψ, P (x) ψ) =
P (x)|ψ(x)|2 dn x .
12
La misura di probabilità per le variabili pi è invece data da
dµψ (p/h̄) = |ψ̃(k)|2 dn k ,
con ψ̃ la trasformata di Fourier di ψ; infatti,
Z
(ψ, P (−i∂/∂xi ) ψ) =
P (k) |ψ̃(k)|2 dn x .
Le serie esponenziali delle p e delle q esistono per esempio sul dominio
D = {P (x) e−x
2 /2
},
sul quale danno origine a serie di funzioni convergenti totalmente e maggiorate sempre da gaussiane; le relazioni (16) seguono dalla convergenza totale.
Inoltre, gli operatori eiαpi moltiplicano per eiαh̄ki in trasformata di Fourier e
agiscono perciò come traslazioni su ψ(x):
eiαpi ψ(x) = ψ(x + h̄α) .
Le traslazioni spaziali, definite su AH da q 7→ q + a, p 7→ p, sono perciò
implementate da tali gruppi di operatori unitari.
Infine, πS è irriducibile, più precisamente, dà una rappresentazione irriducibile dell’algebra di Weyl; infatti, se un operatore commuta con tutti
gli operatori di moltiplicazione eiβqi , è necessariamente un operatore di moltiplicazione per una funzione di x, come si
P vede applicandolo per es. al
i i βi xi −x2 /2
e
; se commuta anche
sottospazio denso dei vettori della forma e
con gli operatori di traslazione, si tratta di una funzione costante, cioè un
multiplo dell’identità.
L’introduzione degli operatori unitari di Weyl, eq.(16), è abbastanza importante per la discussione della irriducibilità; infatti, le funzioni regolari a
supporto in un intevallo qualsiasi danno una sottorappresentazione dell’algebra di Heisenberg, che non soddisfa però la condizione di esponenziabilità.
Il teorema di unicità di Von Neumann
Per verificare che tutti gli stati ω su AH , che diano origine a esponenziali
con le relazioni (16), si rappresentano come vettori in spazi somma diretta di
rappresentazioni di Schreodinger è sufficiente verificare che qualsiasi rappresentazione dell’algebra di Heisenberg, con la condizione di regolarità per gli
esponenziali, contiene un sottospazio su cui coincide, a meno di equivalenza
13
unitaria, con πS . In questo caso infatti, per l’invarianza dell’ortogonale di
ogni spazio invariante, lo spazio di rappresentazione ottenuto da ω via GNSW
si scompone in somma ortogonale di sottospazi sede dalla rappresentazione
πS .
Data una rappresentazione π, per costruire un sottospazio sede di πS , è
sufficiente costruire un vettore φ0 che dia origine, applicandogli AH , a uno
spazio vettoriale su cui AH abbia la stessa rappresentazione che sul dominio D di πS introdotto sopra. Per semplicità ragionaiamo in un solo grado
di libertà, la generalizzazione a un numero finito richiedendo solo qualche
2
indice e qualche somma. Ora, il vettore ψ0 (x) ≡ e−x /2 in πS può essere
caratterizzato, a meno di una normalizzazione, da
(q + ip)ψ0 = 0 .
Inoltre, introducendo gli operatori
√
√
a ≡ (q + ip)/ 2 , a∗ ≡ (q − ip)/ 2 ,
(17)
(18)
che soddisfano
[a, a∗ ] = 1 ,
(19)
è facile vedere che tutti i prodotti scalari
((a∗ )n ψ0 , (a∗ )k )ψ0 ) = n! δn,k
seguono dalle eq.(17),(18) e determinano tutti i prodotti
(P (p, q)ψ0 , Q(p.q)ψ0 ) ,
e perciò la rappresentazione di AH in D. È sufficiente perciò trovare nello
spazio della rappresentazione π un vettore che soddisfi l’eq.(17). Ma l’eq.(19)
implica
(a∗ a) a = a (a∗ a − 1) .
(20)
Ne segue che, se un vettore ψ soddisfa (a∗ a)ψ = λψ, il vettore aψ è autovettore di a∗ a all’autovalore λ − 1; dato che a∗ a è un operatore positivo, per
qualche n, ψ0 ≡ an ψ 6= 0 e aψ0 = 0. Indipendentemente dall’esistenza di autovalori, lo stesso vale partendo da un vettore ψ che abbia rappresentazione
sullo spettro di a∗ a a supporto limitato.
La rappresentazione di AH in D, pensata astrattamente, come conseguenza delle eq.(17),(19), si chiama anche rappresentazione di Fock; come
abbiamo visto, tale rappresentazione è unitariamente equivalente a quella di
Schroedinger e l’argomento che precede afferma che in ogni rappresentazione
14
(regolare nel senso dell’esistenza degli esponenziali di Weyl) di AH è sempre
contenuta una rappresentazione di Fock.
L’ipotesi di regolarità entra in realtà per la validità dell’eq.(20) su un
dominio contenente vettori a supporto limitato sullo spettro di a∗ a. Alternativamente rispetto all’analisi dei domini, la costruzione di ψ0 può essere fatta direttamente come conseguenza dell’esistenza degli esponenziali di Weyl,
mostrando che l’operatore
Z
1/π
2 +β 2 )/4
IR2
ei(αp+βq) e−(α
dα dβ
è sempre un proiettore non nullo, e che i vettori nella sua immagine soddisfano
l’eq.(17).
L’equazione di Schroedinger
L’unicità della rappresentazione dell’algebra di Heisenberg implica l’implementabilità, eq.(9) della Sez.5, dell’evoluzione temporale, come anche di ogni
altro automorfismo di AH . L’analisi della Sez.5 implica perciò le eq.(11),(12)
della Sez.5, con H definito dalle equazioni del moto. Inoltre, la stabilità di
AH , o dell’algebra degli operatori di Weyl sotto evoluzione temporale non è
strettamente necessaria per questi risultati; infatti, l’unicità della rappresentazione permette di estendere le variabili introducendo i loro limiti, in senso
forte. Anzi, poichè gli operatori di Weyl sono rappresentati in πS in modo
irriducibile, i loro limiti forti sono tutti gli operatori in L2 (IR, dx), dato che
un risultato di Von Neuman identifica i limiti forti con tutti gli operatori
che commutano con il comutante dell’algebra e per l’irriducibilità il commutante consiste dei multipli dell’identità. Di conseguenza, la dinamica può
essere formulata più in generale in termini degli automorfismi dell’algebra
degli operatori limitati in L2 implementati da operatori unitari, in accordo
con la stabilità nel tempo della rappresentazione di AH .
La dinamica di una particella libera è definita dalle equazioni
d/dt qi = pi /m , d/dt pi = 0 ,
P
(21)
che individuano l’Hamiltoniano H = p2 /2m ≡ 3i=1 p2i /2m. In presenza di
un potenziale V (q) la seconda delle eq.(21) diventa d/dt pi = −∂i V (q) e
perciò
H = p2 /2m + V (q)
(22)
15
Per N particelle, in interazione con potenziali Vij (q (i) − q (j) ),
(k)
d/dt pi
=−
X
(k)
∂/∂qi Vsk
s6=k
e perciò
H=
N
X
(p(i) )2 /2m(i) +
X
Vi<j (q (i) − q (j) )
(23)
i=1
Più esplicitamente, p2 si scrive in πS −h̄2 ∆; per esempio, l’eq.(22) diventa
perciò
H = −h̄2 ∆/2m + V (x)
e l’evoluzione dei vettori si scrive
ih̄ d/dt ψt (x) = (−h̄2 ∆/2m + V (x)) ψ(x) ,
che viene chiamata equazione di Schroedinger.
Spettro discreto e spettro continuo
La discussione dell’evoluzione temporale ha portato all’introduzione della variabile energia come il generatore del gruppo unitario U (t). Per il teorema di
Stone, l’associazione tra variabili e gruppi di operatori unitari, che definiscono gruppi di automorfismi dell’algebra delle osservabili, o della sua chiusura
nella topologia forte, è un fatto generale; come abbiamo visto, l’impulso di
una particella genera le traslazioni spaziali e lo stesso vale per l’impulso totale, definito dalla somma degli impulsi, per un sistema di N particelle. La
posizione di una particella (moltiplicata per la sua massa), o, per un sistema,
la stessa espressione per il baricentro,
Q=
N
X
m i qi
i=1
genera invece le trasformazioni di Galilei,
pi 7→ pi + v , qi 7→ qi ,
a parte una costante h̄, che non appare se si adotta la stessa convenzione che
nell’eq.(11) della Sez.5.
La relazione che ne segue tra variabili e automorfismi (implementati da
gruppi unitari) è analoga a quella della meccanica classica nello spazio delle
16
fasi, che associa a ogni funzione f il gruppo di trasformazioni (canoniche) αs
generato da f via la struttura di Poisson,
d/ds αs (g) = {f, αs (g)} .
Come abbiamo visto in generale, l’interpretazione della variabile energia,
cioè dell’operatore hamiltoniano H, è data in termini del suo spettro, che fornisce l’insieme dei suoi possibili valori. Per operatori A autoaggiunti i punti
dello spettro, cioè i numeri complessi λ per cui A − λ non ha inverso limitato,
sono reali e si classificano come spettro puntuale se si tratta di autovalori
(che rendono A − λ non iniettivo); come spettro continuo se l’immagine di
A − λ è densa e (A − λ)−1 è illimitato.
Altri casi non si possono presentare perchè per operatori autoaggiunti il
nucleo è lo spazio ortogonale all’immagine; perciò per nucleo {0} l’immagine
è densa e l’inverso (che esiste per iniettività) è illimitato perchè altrimenti si
estenderebbe per continuità a un operatore limitato in tutto lo spazio, che
invertirebbe la chiusura di A − λ, che per definizione non ha inverso limitato
se λ è nello spettro.
È anche utile avere presenta che i punti dello spettro continuo non sono
altro che i numeri (a priori complessi) che soddisfano l’equazione per gli
autovalori a meno di una correzione arbitrariamente piccola; la illimitatezza
di (A − λ)−1 significa infatti che è 0 l’estremo inferiore di ||(A − λ)ψ||, al
variare di ψ di norma 1. Ai punti dello spettro continuo sono perciò associabili
successioni (non convergenti) di vettori normalizzati, su cui A si identifica
con λ a meno di ε, e anzi tale condizione caratterizza lo spettro continuo.
Per esempio, lo spettro di p sono tutti i numeri reali, come si vede dal
fatto che p moltiplica per la variabile in trasformata di Fourier; le successioni
associate sono le “approssimazioni delle onde piane”, esattamente nel senso
2
dell’equazione agli autovalori approssimata, per es. e−εx eikx , a parte una
normalizzazione, con ε → 0.
Per gli operatori hamiltoniani in rappresentazione di Schroedinger, tenendo presente che gli autovettori sono funzioni a quadrato integrabile, cioè con
interpretazione probabilistica di localizzazione, a meno di ε, in in un insieme
limitato, lo spettro discreto rappresenta perciò moti limitati nello spazio, tipicamente stati legati in un potenziale attrattivo, mentre i punti dello spettro
continuo corrispondono a moti illimitati, più precisamente, a stati stazionari,
indipendenti dal tempo, assimilabili a orbite classiche illimitate.
17
Problemi solubili algebricamente
L’analisi del moto dei sistemi quantistici, in particolare di N particelle, consiste in generale nella discussione del gruppo di automorfismi αt , del gruppo
unitario U (t) e dello spettro del corrispondente operatore hamiltoniano.
In un certo numero di casi semplici, l’analisi può essere fatta in termini puramente algebrici, integrando esplicitamente le equasioni del moto e
derivando lo spettro dell’Hamiltoniano dai suoi commutatori con le variabili.
Per una particella libera, le equazioni del moto (21) definiscono il gruppo
di automorfismi
p(t) = p , q(t) = q + p/m t ,
(24)
dove p e q indicano, per una particella in tre dimensioni, triple di operatori
pi , qi ; l’Hamiltoniano, H = p2 /2m, moltiplica per una somma di quadrati di
variabili reali e ha perciò spettro [0, ∞), puramene continuo. La stessa analisi
si applica a N particelle libere: le eq.(24) valgono per ciascuna particella e
l’Hamiltoniano è la somma di quelli di singola particella,
Ancora con metodi algebrici si ottiene il moto del centro di massa di un
sistema di N particelle interagenti con potenziali dipendenti dalla differenza
delle coordinate. È sufficiente introdurre le coordinate del centro di massa,
Q≡
N
X
m i qi /
i=1
X
mi
i
e l’impulso totale
P ≡
N
X
pi ,
i=1
dove l’indice si riferisce alle particelle e posizione e impulso sono triple di
operatori autoaggiunti. Dalle equazioni del moto segue
d/dt Q = P/
X
mi , d/dt P = 0 ,
i
che implicano l’evoluzione libera, eq.(24) per le variabili del baricentro.
Nel caso di due particelle, la descrizione è completata introducendo le
coordinate relative e il corrispondente impulso,
Qr ≡ q2 − q1 , Pr ≡ µ(p2 /m2 − p1 /m1 ) , µ ≡ (1/m1 + 1/m2 )−1 ,
che soddisfano
d/dt Qr = Pr /µ , d/dt Pr = −∂/∂q2 V (q2 − q1 ) .
18
Le variabili del baricentro e quelle relative soddisfano le relazioni di Heisenberg e commutano una coppia con l’altra.
Per una particella in un campo di forza costante F , le equazioni del moto
sono
d/dt q = p/m , d/dt p = F
(25)
e definiscono gli automorfismi (verificare per esercizio la proprietà di gruppo)
p(t) = p + F t , q(t) = q + p/m t + 1/2 F/m t2 ,
(26)
L’Hamiltoniano individuato dalle eq.(25) è
H = p2 /2m − F q ;
(27)
il suo spettro è omogeneo, cioè invariante per traslazioni della variabile, dato
che
eipa/h̄ (p2 /2m − F q)e−ipa/h̄ = p2 /2m − F q − F a
e lo spettro non cambia sotto trasformazioni unitarie; lo spettro è perciò
tutto IR ed è puramente continuo (lo spazio di Hilbert sarebbe altrimenti
non separabile).
La descrizione di una particella su una circonferenza richiede un’algebra
un poco diversa da quella di Heisenberg; poiché la posizione è data da un
angolo, le sue funzioni possono essere identificate con le funzioni su una
circonferenza e come algebra possiamo considerare quella generata da un
operatore unitario U , che si interpreta come eiϕ , o come eix , x ∈ IR, e da un
impulso pϕ , con la relazione
U ∗ pϕ U = pϕ + h̄ ,
(28)
che segue dalla relazione di Heisenberg per p e x; l’eq.(28) implica che
eiαpϕ /h̄ implementa le rotazioni di un angolo α; l’operatore di rotazione di
2π, ei 2π pϕ /h̄ commuta con tutte le variabili ed è perciò un multiplo dell’identità, eiθ , in ogni rappresentazione irriducibile. L’evoluzione nel tempo è data
da
pϕ (t) = pϕ , U (t) = ei(x+pϕ /m t) = U eitpϕ /m eith̄/2m ,
(29)
dove la prima delle equazioni per U definisc l’evoluzione di ϕ come l’evoluzione libera di x, eq.(24) con x ≡ q, modulo 2π, e la seconda esplicita la
dinamica nell’algebra generata da U e dagli esponenziali di pϕ , l’ultimo termine derivando dal calcolo dell’esponenziale con le regole di Heisenberg per
p e x. L’Hamiltonano è determinato dalla dinamica, a meno di una costante
additiva in ciascuna rappresentazione irriducibile: H = p2ϕ /2m + c.
19
Lo spettro di pϕ dipende dalla rappresentazione attraverso il parametro
θ: la relazione
ei 2π pϕ /h̄ = eiθ
implica infatti
ei 2π λ/h̄ = eiθ
per λ nello spettro di pϕ , che consiste perciò di punti λn = (θ/2π + n)h̄,
n ∈ ZZ e anzi coincide con questo insieme in conseguenza dell’eq.(28).
Lo spettro dell’hamiltoniano dipende dalla rappresentazione, essendo dato da {λ2 /2m, λ = (θ/2π + n)h̄. Il parametro θ ha perciò un effetto sui
livelli energetici (e il caso θ 6= 0 si presenta per particelle su un filo circolare
attraversato da un flusso di campo magnetico).
Nel caso di un oscillatore armonico, le equazioni del moto sono
d/dt q = p/m , d/dt p = −kq ,
(30)
che definiscono il gruppo di automorfismi
p(t) = p cos ωt − q k/ω sin ωt ,
q(t) = q cos ωt + p/mω sin ωt , ω ≡ (k/m)1/2 .
(31)
Nelle variabili
P ≡ (mω)−1/2 p , Q ≡ (mω)1/2 q ,
che soddisfano ancora le regole di commutazione di Heisenberg, l’evoluzione
si scrive
P (t) = P cos ωt − Q sin ωt , Q(t) = Q cos ωt + P sin ωt
(32)
e il corrispondente Hamiltoniano è
H = ω/2 (P 2 + Q2 ) = ω/2(−h̄2 d2 /dQ2 + Q2 ) ,
l’ultima espressione valendo nella rappresentazione di Schroedinger per le
variabili P e Q, indicando con Q anche la variabile per cui Q moltiplica.
Con lo stesso procedimento che abbiamo usato per definire la rappresentazione di Fock, si verifica che i vettori definiti da
(P + iQ)n ψ0 ,
(P − iQ)ψ0 = 0
sono autovettori di H all’autovalore λn = (n + 1/2)h̄ω. Tali vettori sono (a
meno di normalizzazione) una base nello spazio di Fock, equivalentemente
20
in quello della rappresentazione di Schroedinger; la funzione d’onda di ψ0 è
l’unica soluzione, a parte una normalizzazione, dell’equazione
(−ih̄ d/dQ − iQ) ψ0 (Q) = 0 ,
2 /2h̄
ψ0 = e−Q
= e−mωq
2 /2h̄
;
in unità di misura con h̄ = 1, gli autovettori di H si ottengono da ψ0 moltiplicando per i polinomi di Hermite, Hn (Q) ≡ ψ0−1 (−id/dQ + iQ)n ψ0 . Si
noti che l’operatore (−d2 /dQ2 + Q2 ) commuta con la trasformata d Fourier,
e infatti i suoi autovettori (gli autovalori non hanno molteplicità) sono anche
autovettori dell’operatore unitario corrispondente.
L’equazione di Schroedinger in una dimensione
In una dimensione, lo spettro dell’hamiltoniano di una particella di Schreodinger in un potenziale V (q) si ottiene risolvendo un’equazione differenziale
lineare ordinaria,
Hψ = −h̄2 /2m d2 /dx2 ψ(x) + V (x) ψ(x) = E ψ(x) .
(33)
Le soluzioni a quadrato integrabile dell’eq.(33) definiscono autovettori, all’autovalore E; per potenziali che hanno limite a ±∞, le soluzioni a quadrato
non integrabile sono asintoticamente funzioni trigonometriche o esponenziali crescenti verso ±∞; nel primo caso, in base al criterio sullo spettro discusso sopra, E appartiene allo spettro continuo; nel secondo, se ad E non
corrispondono altre soluzioni, E non appartiene allo spettro.
Per potenziali localmente limitati, l’eq.(33) implica che la derivata seconda di ψ(x) è localmente in L2 , in quanto prodotto di ψ per una funzione
limitata, e perciò localmente in L1 ; ne segue che sia ψ che d/dx ψ sono funzioni continue; in particolare, se V (x) è una funzione regolare a tratti, la
continuità di ψ e della sua derivata definiscono condizioni di raccordo per le
soluzioni nei diversi intervalli di regolarità di V .
Vediamo come esempio le soluzioni dell’eq.(33) per un potenziale V (x)
con
V (x) = 0 ∀x : |x| < L , V (x) = C ∀x : |x| ≥ L .
Per E ≥ C le soluzioni sono funzioni trigonometriche, anche negli intervalli
|x| > L, ed E appartiene perciò allo spettro continuo. Per E < C le soluzioni
sono esponenziali negli intervalli |x| > L; trascurando quelle crescenti verso
21
l’infinito, che non aggiungono informazioni sullo spettro di H, nei punti x =
±L esse soddisfano perciò
d/dx ψ(x) = ∓(2m(C − E))1/2 /h̄ ψ(x) , x = ±L .
Negli intervalli (−L.L) sono della forma
ψ(x) = a cos kx + b sin kx , k = (2mE))1/2 /h̄
Dato che H commuta con l’operatore di parità P ,
P ψ(x) = ψ(−x) ,
H lascia invariati i sottospazi delle funzioni pari e di quelle dispari e possiamo
perciò studiare separatamente i due casi. Per funzioni pari, b si annulla e le
condizioni di raccordo in ±L si riducono a quelle in x = L; a meno di
una costante moltiplicativa per la funzione ψ, è sufficiente la condizione di
raccordo per d/dx ψ/ψ, che si scrive
k tan kL = (kC2 − k 2 )1/2 , 0 < k < kC ≡ (2mC)1/2 /h̄
Dato che il lato sinistro dell’equazione è una funzione positiva e crescente di
k in ciascun intervallo nπ/L, (n + 1/2)π/L (e negativa negli altri intervalli),
mentre il lato destro è positivo e decrescente, l’equazione ha esattamente una
soluzione in ciascun intervallo, e perciò approssimativamente (2mC)1/2 L/πh̄
soluzioni. Lo stesso si verifica per le soluzioni dispari e perciò lo spettro di
H consiste, oltre che dello spettro continuo [C, ∞), di N autovalori,
N ∼ 2(2mC)1/2 L/πh̄ = 4(2mC)1/2 L/h .
È interessante confrontare N con la stima che si ottiene direttamente dalla
idea di Planck di considerare orbite discrete intervallate da un’area h nello
spazio delle fasi: lo spazio delle fasi disponibile per i moti limitati è la regione
−L < q < L , −(2mC)1/2 < p < (2mC)1/2 ,
di area
4(2mC)1/2 L ,
identica al numero di autovettori moltiplicato per la costante di Planck; per
i singoli autovalori λn si otterrebbe dal criterio di Planck
λn = h̄2 /2m(πn/2L)2 ,
identici a quelli dati dai valori di k agli estremi degli intevalli introdotti sopra.
22
Nel limite C → ∞, le condizioni agli estremi diventano semplicemente
ψ(±L) = 0; lo spettro continuo sparisce, mentre autovettori e autovalori
convergono a quelli della particella libera in [−L, L] con le condizioni al bordo
di Dirichlet ψ(±L) = 0, gli autovalori essendo dati esattamente dal criterio
di Planck.
7.
Momento angolare e potenziali centrali
Simmetrie e spettro
L’analisi dei sistemi di più particelle in tre dimensioni spaziali viene molto
semplificata dalla presenza di simmetrie dell’hamiltoniano. Come abbiano
visto, grazie all’unicità della rappresentazione, gli automorfismi dell’algebra
di Heisenberg definiscono operatori unitari che li implementano,
α(A) = U −1 A U .
(34)
In particolare, operazioni con interpretazione fisica diretta come rotazioni e
traslazioni spaziali definiscono gruppi di automorfismi dell’algebra di Heisenberg; in generale, le relazioni di gruppo degli automorfismi si estendono agli
operatori unitari che li implementano solo a meno di correzioni per multipli
dell’identità, dando origine a rappresentazioni a meno di fasi.
Abbiamo visto che tali correzioni possono essere eliminate, con un scelta
opportuna degli operatori unitari, nel caso di gruppi a un parametro. Lo
stesso risultato vale, limitatamente a un intorno dell’identità, nel caso dei
gruppi compatti; dato che le relazioni di Lie tra i generatori di un gruppo
derivano direttamente dalle relazioni di gruppo in un qualsiasi intorno dell’identità, ne segue che esse valgono per gli operatori che implementano gruppi
compatti di automorfismi.
Inoltre, poichè nei gruppi di Lie la mappa esponenziale copre un intorno
dell’identità, le relazioni di Lie tra i generatori sono equivalenti alle relazioni
di gruppo in un intorno dell’identità, e sono perciò esattamente le relazioni
di Lie tra i generatori dei sottogruppi a un parametro a caratterizzare gli
operatori unitari che implementano i gruppi compatti di automorfismi.
Si dice che un gruppo di automorfismi è una simmetria di un hamiltoniano
H se i corrispondenti operatori unitari commutano con H, cioè se H rimane
23
invariato sotto l’estensione dell’automorfismo a tutti gli operatori definita
dall’eq.(34).
Nel caso che H commuti con un solo operatore, U , gli autospazi di U
sono automaticamente invarianti sotto H, che può perciò essere studiato
separatamente in ciascuno ci essi. Lo stesso si applica agli autospazi comuni
di insiemi di operatori commutanti tra loro e con H.
Una situazione anche più interessante nasce se H commuta con operatori
che non commutano tra loro, come succede nel caso degli operatori unitari
U (g) che implementano un gruppo di simmetria non commutativo. In questo
caso, se un sottospazio V è invariante sotto gli U (g), fissato comunque t ∈
IR, eiHt V è evidentemente ancora un sottospazio invariante, sede di una
rappresentazione unitariamente equivalente; ne segue che H lascia invariati i
sottospazi su cui le rappresentazioni del gruppo di automorfismi sono somme
di rappresentazioni equivalenti tra loro. Inoltre, se H lascia invariato un
sottospazio sede di una rappresentazione irriducibile, per il Lemma di Schur,
H è un multiplo dell’identità in tale sottospazio.
La riduzione in sottospazi sede ciascuno di rappresentazioni tra loro equivalenti di un gruppo di simmetria di un hamiltoniano H è perciò un fondamentale strumento di analisi dello spettro di H.
Momento angolare
Vediamo come l’analisi sopra delineata si concretizza nel caso del gruppo
delle rotazioni. Il gruppo è definito dalle trasformazioni lineari di IR3 che
lasciano invariato il prodotto scalare euclideo; i sottogruppi a un parametro
R(φ) = eφT
soddisfano perciò, al primo ordine in φ,
((I + φT )x, (I + φT )y) = (x, y) + φ((T x, y) + (x, T y)) = (x, y) ,
cioè T è antisimmetrica. L’algebra di Lie del gruppo ha perciò dimensione 3,
ed esplicitando i generatori Ti delle rotazioni intorno all’asse i, si ottengono
i commutatori di Lie
[Ti , Tj ] = εijk Tk
(35)
Come per tutti i gruppi compatti, le rappresentazioni (a meno di fasi) unitarie
e irriducibili (in spazi di Hilbert sui complessi) hanno dimensione finita. Per
la eliminabilità locale delle fasi, sono date tutte e sole dalle rappresentazioni
24
irriducibili, con operatori in dimensione finita, dell’algebra di Lie definita
dalle eq.(35).
La classificazione delle rappresentazioni dell’algebra di Lie segue in modo
molto semplice dalle stesse equazioni: indicando con −iLi i rappresentativi
di Ti , le matrici Li sono hermitiane e soddisfano
[Li , Lj ] = i εijk Lk
(36)
Indicato con ψl un autovettore di L3 all’autovalore massimo, indicato con l,
si ottiene
(L1 + iL2 )ψl = 0 ,
poiché le eq.(36) implicano che si tratta di un autovettore di L3 all’autovalore
l + 1. Ne segue (usando il commutatore tra L1 e L2 )
L 2 ψl ≡
X
L2i ψl =
i
= ((L1 − iL2 )(L1 + iL2 ) + L3 + L23 )ψl = l(l + 1)ψl .
Per le eq.(36), L2 commuta con gli Li ed è perciò, in una rappresentazione
irriducibile, un multiplo dell’identità,
L2 = l(l + 1) I .
Applicando a ψl (L1 − iL2 ) si ottengono, per le stesse equazioni, autovettori
ψm all’autovalore m = l − 1, l − 2, ecc., che si annullano solo per
0 = ((L1 − iL2 )ψm , (L1 − iL2 )ψm ) =
= (ψm , (L2 + L3 − L23 )ψm ) = (l(l + 1) − m(m − 1))(ψm , ψm ) ,
cioè per m = −l. l può perciò assumere solo valori interi o semiinteri; i
vettori ψm , m = −l, −l +1, . . . l −1, l sono una base per una rappresentazione
dell’algebra di Lie; per la irriducibilità, ψl è unico, e cosı̀ gli altri ψm ; inoltre,
comunqie fissato l intero o semiintero, le relazioni sopra introdotte definiscono
una rappresentazione.
Nel caso di rappresentazioni con l semiintero, si ottiene una rappresentazione del gruppo delle rotazioni solo a meno di fasi, dato che per esempio le
rotazioni di 2π intorno all’asse k sono rappresentate da
e2πiLk = −I ,
come segue immediatamente dallo spettro (j/2, j dispari) di Lk .
25
Nello spazio di Schroedinger di una particella in tre dimensioni, le rotazioni sono rappresentate da U (R)ψ(x) = ψ(R−1 x), con R matrice di rotazione, dato che tali operatori evidentemente implementano gli automorfismi
dell’algebra di Heisenberg
qi 7→ Rij qj , pi 7→ Rij pj .
Derivando i corrispondenti sottogruppi a un parametro, si vede che i generatori Ti sono rappresentati da −iLi , con
Li = εijk qj pk .
Essendo verificate le relazioni di gruppo, le rappresentazioni irriducibili contenute nello spazio di Schroedinger sono tutte a l intero; anzi, ogni l intero (non negativo) definisce uno spazio di rappresentazioni, tutte tra loro
unitariamente equivalenti, date dai sottospazi di L2 generati da
f (r) Ylm (θ, φ) ,
con r, θ, φ coordinate polari, f in L2 (r2 dr) e Ylm le armoniche sferiche (m
intero, |m| ≤ l).
Più in generale, si possono considerare “particelle” con gradi di libertà interni, su cui le rotazioni agiscano con rappresentazioni unitarie, che non sono
allora vincolate ad avere l intero; nel caso di rappresentazioni irriducibili, tali
particelle sono perciò caratterizzate da un parametro di momento angolare
intrinseco che prende il nome di spin, il caso più semplice essendo quello di
spin 1/2, corrispondente alla rappresentazione irriducibile di dimensione 2
dell’algerba di Lie del gruppo delle rotazioni.
L’atomo di idrogeno
Gli operatori Li di momento angolare di una particella permettono di esprimere l’hamiltoniano libero, H0 = p2 /2m come la somma di un termine radiale
e di uno angolare; per ottenere questo è sufficiente calcolare
1/r2 L2 = 1/r2
X
εijk qj pk εilm ql pm =
i
= 1/r2 (qj pk qj pk − qj pk qk pj ) = 1/r2 (qj qj pk pk + 2iqj pj ) + 1/r qj pj 1/r qk pk =
= p2 + 2/r ∂/∂r + ∂ 2 /∂r2 ;
26
il risultato si può scrivere nella forma
p2 = 1/r2 L2 − 1/r ∂ 2 /∂r2 r .
(37)
L’hamiltoniana di una particella in un potenziale centrale si scrive perciò, in
rappresentazione di Schroedinger, con h̄ = 1,
H = −1/2m (1/r ∂ 2 /∂r2 r + 1/r2 L2 ) + V (r) ;
(38)
negli spazi a fissato momento angolare totale L2 = l(l+1)I, cioè sulle funzioni
d’onda della forma
ψ(x) = f (r) Ylm (θ, φ) ,
H si riduce a un operatore differenziale ordinario e l’equazione di Schroedinger si discute in termini del puro moto radiale, in un potenziale che differisce
da V (r) per il termine centrifugo l(l + 1)/2mr2 . In particolare, l’equazione
agli autovalori si scrive
−1/2m 1/r ∂ 2 /∂r2 r f (r) + (l(l + 1)/2mr2 + V (r)) f (r) = E f (r) ,
(39)
con f in L2 (r2 dr); le soluzioni dell’eq.(39) determinano gli autovalori E
dell’hamiltoniana, eq.(38), a cui corrispondono 2l + 1 autovettori,
ψE,l,m (x) = fE (r)Ylm (θ, φ) , −l ≤ m ≤ l .
La molteplicità, detta anche degenerazione, degli autovalori, (2l + 1) per ogni
soluzione della equazione radiale (39), riflette la simmetria sferica del problema, che rende H un multiplo dell’identità nelle rappresentazioni irriducibili
delle rotazioni individute da ciascuna fE (r). La condizione f ∈ L2 (r2 dr)
rappresenta, per potenziali regolari a parte l’origine (che danno origine a
soluzioni regolari fuori dell’origine), solo un vincolo sull’andamento della f
vicino allo 0 e all’infinito.
Moltiplicando l’eq.(39) per r si ottiene un’equazione della stessa forma dell’equazione di Schroedinger unidimensionale per la funzione g(r) =
rf (r) ∈ L2 ((0, ∞), dr). Ne segue la stessa discussione e la stessa intepretazione per gli autovalori e in generale per lo spettro; in particolare, almeno
per potenziali regolari a supporto limitato, gli autovalori sono tutti negativi;
i corrispondenti autovettori vengono chiamati stati legati.
Nel caso di potenziale Coulombiano attrattivo, che si presenta per l’atomo
di idrogeno, nelle variabili relative e con la massa ridotta, l’equazione (39)
può essere risolta in termini di esponenziali e polinomi. L’equazione per
g(r) = rf (r) si scrive infatti
−1/2m ∂ 2 /∂r2 g(r) + (l(l + 1)/2mr2 − e2 /r) g(r) = E g(r) ,
27
(40)
Ponendo, per E < 0,
−
√
g(r) = χ(r) e
2m|E|
≡ χ(r) e−γr ,
si ottiene
−d2 /dr2 χ(r) + 2γ d/dr χ(r)) + (l(l + 1)/r2 − 2me2 /r) χ(r) = 0 .
Espandendo
χ(r) =
∞
X
an rn ,
n=0
si trova che a0 si deve annullare, e cosı̀ anche a1 se non si annulla l; inoltre,
per n ≥ 0, gli an devono soddisfare
−((n + 2)(n + 1) − l(l + 1)) an+2 + (2γ(n + 1) − 2m e2 ) an+1 = 0 .
(41)
Se la successione dei coefficienti non termina, si vede immediatamente che,
per n abbastanza grande, il segno dei suoi termini resta costante e vale la
minorazione
|an | > (2γ − ε)n /n! .
Ne segue che in questo caso χ(r) e−γr cresce esponenzialmente all’infinito. Le
soluzioni in L2 si ottengono perciò solo quando la serie termina, e sia allora
an0 il suo ultimo termine non nullo (n0 ≥ 1); allora
2γn0 = 2me2
cioè
2mE = m2 e4 /n20 ,
o anche, reintroducendo la costante di Planck nei termini cinetici,
E = me4 /2h̄2 n20 .
(42)
Fissato n0 , sia ora an1 il primo termine non nullo, 1 ≤ n1 ≤ n0 ; se n1 ≥ 2,
nell’eq.(41) con n = n1 − 2 il coefficiente del primo termine deve annullarsi,
cioè deve essere n1 = l + 1, e la stessa relazione vale per n1 = 1 (infatti l deve
in questo caso annullarsi, come detto sopra). Il risultato è una relazione tra
l e n0 : 0 ≤ l ≤ n0 − 1.
In definitiva, gli autovalori sono dati dall’eq.(42), dove n0 si indica come
numero quantico principale e si denota di solito con n = 1, 2 . . .; l’autovalore
En , eq.(42) si presenta per 0 ≤ l ≤ n − 1, cioè con una molteplicità, n2 , data
dalla somma da 0 a n − 1 delle dimensioni 2l + 1 degli spazi delle armoniche
sferiche a momento angolare l.
28
Considerando anche le espansioni in potenze negative di r, si ottiene,
per ogni E, un’altra soluzione, che non è mai in L2 ; essendo l’eq.(40) del
secondo ordine abbiamo perciò ottenuto sopra tutte le soluzioni che sono in
L2 , cioè tutti gli sutovalori dell’hamiltoniano di una particella in potenziale
coulombiano attrattivo.
La degenerazione si spiega con una simmetria aggiuntiva, che si presenta
per potenziali coulombiani, associata classicamente alla conservazione della direzione della direzione degli assi delle ellissi descritte dalle orbite. Le
espressioni per gli autovalori coincidono con quelle della teoria di Bohr.
8.
Particelle identiche
Per i sistemi composti da più particelle è importante la nozione di indistinguibilità: particelle con la stessa massa e le stesse interazioni non sono
distinguibili, nel senso che non ha significato distinguere stati che differiscano
solo per l’ordine in cui le particelle vengono elencate.
Le variabili che si possono osservare non sono in questo caso tutti i polinomi nelle coordinate e negli impulsi delle singole particelle, ma solo i polinomi simmetrici sotto permutazione degli indici di particella. Per stato si
deve perciò intendere un funzionale lineare positivo e normalizzato sulla sottoalgebra dell’algebra di Heisenberg definita dagli elementi invarianti sotto
permutazioni.
Consideriamo, in questo senso, gli stati definiti dai vettori della unica
rappresentazione dell’intera algebra di Heisenberg; passando all’algebra di
Weyl, si può anche verificare che tutti gli stati (regolari) sulla sottoalgebra simmetrica si ottengono in questo modo, ma la dimostrazione non è
elementare.
Le permutazioni P delle particelle, che definiscono automorfismi dell’intera algebra di Heisenberg, sono implementate da operatori unitari U (P ),
U (P ) ψ(q1 . . . qn ) = ψ(qP (1) . . . qP (n) ) .
Tali operatori commutano con le osservabili, che agiscono perciò all’interno di
spazi di rappresentazioni equivalenti; la classificazione delle rappresentazioni
delle permutazioni in L2 (IR3n ), che si fa in termini di simmetria e antisimmetria delle ψ rispetto a sottoinsiemi di variabili, dà perciò origine a una
classificazione degli stati definiti dalle ψ sulla sottoalgebra simmetrica.
29
Le stesse considerazioni si applicano a particelle con un grado di libertà
di spin, descritte in rappresentazione di Schroedinger da funzioni ψ(x, s), s
una variabile di momento angolare interno rispetto a un asse fissato, che
identifica gli stati di spin (essendo dato il momento angolare interno totale
come caratteristica della particella). Per esempio, per particelle di spin 1/2,
s = ±1/2.
In conclusione, gli stati sono classificati dalle proprietà di simmetria della
ψ; in realtà, soltanto i due casi più semplici si presentano, cioè quelli di ψ
simmetrica in tutte le variabili e quello di ψ antisimmetica rispetto a ogni
scambio di due variabili.
Le particelle descritte da funzioni simmetriche si indicano come Bosoni,
quelle i cui stati sono descritte da ψ completamente antisimmetriche Fermioni. I Bosoni sono tutti particelle di momento angolare intrinseco (spin)
intero, in particolare 0, i Fermioni hanno tutti spin semiintero (si tratta della
relazione spin-statistica, che ha una spiegazione molto generale nell’ambito
della teoria quantistica relativistica dei campi).
La antisimmetria dei vettori di stato dei fermioni può essere detta anche
nel modo seguente: considerata una base ei (x, s) per lo spazio di singola
particella, lo spazio di due particelle ha una base
eij (x1 , x2 , s1 , s2 ) = ei (x1 , s1 ) ej (x2 , s2 ) .
I vettori antisimmetrici sotto scambio delle due particelle si espandono
ψ=
X
αij eij ,
con αij = −αji ; in particolare, αii = 0 e le αij sono determinate dalla
restrizione degli indici a i < j; questo si può interpretare come il fatto che
lo stato di singola particelle ei , una volta “occupato” dalla prima particella,
non può essere “occupato” dalla seconda. Generalizzzando a n particelle,
i vettori eij... disponibili per l’espansione di ψ possono essere considerati a
indici diversi e crescenti.
In questa forma l’antisimmetria di ψ si formula come il principio di Pauli:
lo stesso stato non può essere occupato da più di un Fermione.
La tavola periodica degli elementi
La classificazione degli stati legati in potenziale coulombiano (e in generale la
conservazione del momento angolare in potenziali centrali), lo spin 1/2 dell’elettrone e il Principio di Pauli sono sufficienti a spiegare la Tavola periodica
degli Elementi.
30
Gli atomi sono infatti caratterizzati dal numero atomico Z, dato dalla
carica elettrica del nucleo, in unità di carica dell’elettrone. Trascurando le
interazioni (coulombiane) tra gli elettroni, gli stati legati del sistema, elettricamente neutro, costituito da un nucleo e Z elettroni, si ottengono risolvendo
prima un problema identico a quello dell’atomo di Idrogeno, in assenza di
spin, per ciascun elettrone e tenendo poi conto dello spin (1/2) degli elettroni
e del principio di Pauli.
In questa approssimazione, lo stato di energia più bassa si ottiene ponendo
nelle autofunzioni dell’atomo di idrogeno due elettroni per ciascuna, in stati
di spin ortogonali, corrispondenti per esempio a componenti sz = ±1/2, in
ordine crescente di energia.
Una migliore approssimazione si ottiene tenendo conto delle interazioni
tra gli elettroni attraverso un “potenziale effettivo”, ancora centrale, con
cui ciascun elettrone interagisce e che rappresenta in modo semplificato il
potenziale elettrostatico generato dagli altri elettroni.
Come risultato, al potenziale (attrattivo) del nucleo si somma quello (repulsivo) generato dagli elettroni e corrispondente a una carica totale che
cresce con la distanza dal nucleo; il suo effetto, pensando fissata la distribuzione di carica degli altri elettroni, è evidentemente quello di attribuire
energie più basse agli stati di un elettrone a momento angolare minore, le cui
autofunzioni sono maggiormente concentrate vicino al nucleo.
Il principale risultato qualitativo di questa correzione sugli stati legati di
un elettrone è perciò quello di rimuovere la degenerazione tre gli autostati
dell’Hamiltoniano dell’atomo di Idrogeno con lo stesso n e diversi l, mentre il momento angolare rimane evidentemente conservato e resta perciò la
degenerazione 2l + 1 dei livelli con n e l dati.
Le autofunzioni dell’idrogeno sono perciò “riempite”, con due elettroni,
in ordine di momento angolare crescente, oltre che in ordine di numero quantico principale crescente. Inoltre, per atomi grandi, si presenta l’effetto di
assegnare energie maggiori agli stati a momento angolare grande rispetto agli
stati a momento angolare minore e numero quantico principale n maggiore
(di una unità).
Il carattere periodico delle proprietà chimiche viene dal fatto che ogni
volta che il numero di elettroni è tale da riempire completamente gli stati con
certi numeri principali n (n ≥ 1) e momenti angolari fino a l (l < n), solo gli
elettroni aggiuntivi, che si trovano in stati a energia maggiore, partecipano
a generare i legami e le proprietà chimiche; tali proprietà vengono quindi
da elettroni tutti in stati con lo stesso momento angolare l, con effetti che
dipendono dal valore di l e dal numero degli elettroni in tali stati. Sia il
31
valore di l che il numero di elettroni si ripresentano al variare del numero
principale n.
La tavola periodica può perciò contenere l’indicazione della configurazione elettronica, che ha senso solo nella approssimazione di elettroni interagenti
ciascuno con un potenziale centrale; la notazione usa un atomo di riferimento
per la configurazione degli elettroni più interni e indica gli stati attribuiti agli
elettroni più esterni attraverso un numero progressivo di configurazione radiale, un indice di momento angolare, s, p, d, f corrispondenti a l = 0, 1, 2, 3,
e il numero degli elettroni negli stati cosı̀ descritti.
Occorre considerare che, per la presenza dello spin, gli stati di un elettrone
disponibili con un dato n ed l sono 2(2l + 1); per esempio, i sei atomi da
Z = 5 a Z = 10, Boro, Carbonio, Azoto, Ossigeno, Fluoro, Neon, hanno
configurazioni elettroniche della forma 1s2, 2s2, 2pN , con N da 1 a 6, che
indicano due elettroni negli stati a n = 1, l = 0, due negli stati n = 2, l = 0,
N negli stati n = 2, l = 1.
9.
Perturbazioni e stabilità
A parte qualche caso di equazione di Schroedinger unidimensionale, i problemi che abbiamo risolto esplicitamente sono stati speciali, relativi cioè a
potenziali di interazione di forma specifica, che permettono, come in Meccanica Classica, un controllo esplicito. A differenza della Meccanica Classica,
in cui perturbazioni anche molto piccole danno origine a orbite con stuttura
diversa, (i sistemi completamente integrabili non restano tali sotto pertubazione), gli autovalori degli Hamiltoniani della MQ sono spesso stabili, nel
senso che le perturbazioni danno spesso origine a autovettori e autovalori
espandibili in un parametro.
Per avere un’idea del comportamento di autovettori e autovalori sotto
perturbazione, supponiamo che l’operatore
H0 + λH1
abbia un autovettore, ψ(λ) (normalizzato), con autovalore E(λ) (senza molteplicità) che ammettano espansione al primo ordine in λ,
ψ(λ) = ψ + λψ 0 + ϕ(λ) ,
32
ϕ(λ) di norma infinitesima rispetto a λ,
E(λ) = E + E 0 λ + o(λ) .
Scrivendo l’equazione agli autovalori all’ordine λ si ottiene
H0 ψ + λ(H1 ψ + H0 ψ 0 ) =
= Eψ + λ(E 0 ψ + Eψ 0 ) .
Uguagliando i termini in λ,
(H0 − E) ψ 0 = (E 0 − H1 ) ψ .
Poiché il prodotto scalare del termine di sinistra con ψ si annulla, il termine
di destra dà
E 0 = (ψ, H1 ψ) .
La variazione al primo ordine dell’autovalore è dunque data dal valor medio
della perturbazione sullo stato imperturbato. Proiettando la stessa equazione
sullo spazio ortogonale a ψ, si ottiene
ψ 0 = −(H0 − E)−1 H1 ψ ,
dove l’inverso, nello spazio ortogonale a ψ, esiste per l’assenza di molteplicità
dell’autovalore E.
L’analisi può essere continuata, assumendo espandibilità di autovettori
e autovalori, a ogni ordine in λ, dando origine alla serie perturbativa di
Schroedinger. È facile, tuttavia, fare esempi di autovettori e autovalori che
scompaiono appena si aggiunge una perturbazione; per esempio, aggiungendo
a un potenziale V (x) a forma di “buca” in una dimensione un termine λx
si ottengono per l’equazione agli autovalori funzioni sempre a quadrato non
integrabile.
È perciò necessario discutere condizioni che assicurino la stabilità di autovettori e autovalori e possibilmente la loro espanibilità in serie di potenze.
Una condizione molto generale, di applicazione molto estesa, e anche difficile
da eludere è data dalla nozione di perturbazioni piccole nel senso di Kato:
Un operatore hermitiano H1 si dice piccolo rispetto a un operatore autoaggiunto H0 se esistono a < 1, b < ∞ tali che
||H1 ψ|| ≤ a ||H0 ψ|| + b ||ψ||
per ogni ψ nel dominio D0 di H0 .
33
(43)
In particolare, H1 deve essere definito su tutto D0 . Per D0 si può intendere
il dominio su cui H0 è autoaggiunto, ma è sufficiente che l’eq.(43) valga su
un qualsiasi dominio di essenziale autoaggiunzione (cioè tale che la chiusura
di H0 sia autoaggiunta).
Per perturbazioni piccole nel senso di Kato vale il Teorema di Kato:
H0 + H1 è autoaggiunto su D0 (essenzialmente autoaggiunto nel caso di D0
di essenziale autoaggiunzione).
Se H0 è limitato in basso, H0 ≥ M , anche H0 + H1 lo è.
I sottoinsiemi isolati dello spettro di H0 restano tali per lo spettro di H0 +
λH1 , per λ piccolo. I proiettori sugli spazi relativi a tali sottoinsiemi sono
sviluppabili in serie di potenze convergente in norma.
In particolare, autovettori e autovalori isolati (senza molteplicità) sono sviluppabili in serie di potenze con raggio di convergenza positivo.
La dimostrazione del teorema di Kato si basa sulla discussione degli operatori risolventi (H0 + λH1 − µI)−1 ; per λ = 0 e Im(µ) 6= 0 la loro esistenza
è equivalente all’(essenziale) autoaggiunzione di H0 ; per |Im(µ)| grande la
loro esistenza implica ancora l’(essenziale) autoaggiunzione di H0 + λH1 e
segue dalla convergenza della loro espanzione in λ, che segue a sua volta
dalla condizione di piccolezza nel senso di Kato. Sempre dalla condizione di
Kato, e ancora attraverso l’espansione in λ dei risolventi, segue l’esistenza dei
risolventi per µ reale negativo grande, e di qui la limitatezza in basso dello
spettro. Allo stesso modo segue che l’espansione dei risolventi converge per
λ abbastanza piccolo, dato µ fuori dello spettro di H0 ; i proiettori spettrali si
scrivono come integrali di tali risolvanti su contorni, nel piano complesso, che
circondano le componenti isolate dello spettro, e di qui segue l’espansione di
proiettori, autovettori e autovalori.
Stabilità degli atomi e della materia
Il teorema di Kato ha implicazioni fondamentali sull’analisi degli Hamiltoniani atomici e molecolari. I potenziali coulombiani sono infatti piccoli nel
senso di Kato rispetto agli Hamiltoniani di particelle libere, anzi la costante a dell’eq.(43) può essere scelta arbitrariamente piccola (al solo costo di
un b grande) e di conseguenza anche somme finite di potenziali coulombiani
restano piccole nel senso di Kato.
34
La stima fondamentale che mostra la piccolezza dei potenziali coulombiani
è quella che si applica a una particella in potenziale esterno; in questo caso,
scrivendo il potenziale coulombiano come la somma di un potenziale limitato,
che nella condizione di Kato si aggiunge senza problemi, e di un potenziale
V di norma L2 piccola come si vuole, si ottiene la stima
||V (x) ψ(x)||2L2 ≤ ||V ||2L2 Supx |ψ(x)|2 ;
stimando, con ψ̃ la trasformata di Fourier,
Z
|ψ(x)| ≤
|ψ̃(k)|(1 + k 2 )/(1 + k 2 ) d3 k ≤
≤ ||(1 − ∆) ψ||L2 ||1/(1 + k 2 )||L2 ≤ c(||ψ||L2 + ||∆ψ||L2 ) ,
si ottiene la condizione di Kato, con a arbitrariamente piccolo.
La stima si estende facilmente alla somma di tutti i termini di interazione
coulombiana in un qualsiasi sistema di elettroni e nuclei. Ne segue che gli
Hamiltoniani di una qualsiasi sistema atomico o molecolare sono autoaggiunti sul dominio della somma dei laplaciani che definisce l’energia cinetica, e
limitati in basso; ogni sistema di nuclei ed elettroni ha perciò un minimo per
il suo spettro, in altri termini è impossibile estrarne energia oltre un certo
limite, un fatto che si indica anche come stabilità, nel senso che il sistema
non può “implodere” indefinitamente. La teoria di Kato mostra perciò che
la Meccanica Quantistica effetivamente risolve il problema di stabilità dei
sistemi atomici che le ha dato origine.
Il teorema di Kato non dice tuttavia in che modo il limite inferiore dello
spettro dell’Hamiltoniano di un sistema, per esempio elettricamente neutro,
composto di N elettroni e di nuclei con masse e cariche date, dipende da N .
Il controllo che tale dipendenza sia stimabile come lineare è essenziale per la
stabilità dei sistemi grandi: la differenza tra la somma dei minimi dell’energia
di due sistemi di N costituenti e il minimo dell’energia del sistema composto
rappresenta l’energia che si rende disponibile nel momento in cui i due sistemi
vengono avvicinati; il comportamento estensivo della materia consiste nel
fatto che tale energia è di ordine N , per esempio occorre consumare il doppio
del gas (e dell’ossigeno) per far bollire una pentola d’acqua di volume doppio.
Per stabilità dei sistemi grandi si intendono tali proprietà di estensività,
in assenza delle quali i sistemi grandi non rimarrebbero con le stesse proprietà
per unità di massa e di volume. In effetti, la costruzione della Termodinamica dalla Meccanica Statistica richiede un limite di volume infinito, la cui
esistenza non è automatica e che ha fra le sue condizioni una stima lineare
in N per il minimo dell’energia di un sistema di N costituenti.
35
La validità, sulla base della MQ, di tali stime per sistemi con interazione
coulombiana non è un fatto generale. Per sistemi di bosoni è anzi falsa e
si possono costruire stati di sistemi coulombiani con energia che scende più
rapidamente del numero di costituenti.
Per i sistemi di nuclei ed elettroni tali stime sono però valide e seguono
dal fatto che gli elettroni sono fermioni. Per fermioni, infatti, il principio di
Pauli impedisce che più particelle occupino la stessa funzione d’onda; questo
dà origine a una specie di effetto repulsivo, dato che per avvicinare molti
elettroni occorre usare funzioni d’onda vicine e ortogonali, perciò con un valore alto dell’energia cinetica. Questo meccanismo è stato usato da Lieb e
Thirring per generare un stima per il minimo dell’energia, per sistemi coulombiani in cui le particelle con carica per es. negativa siano fermioni, lineare
nel numero dei costituenti e anche realistica.
36
Scarica