Operatori in Spazi di Hilbert e Struttura Matematica della Meccanica

Operatori in Spazi di Hilbert e Struttura Matematica
della Meccanica Quantistica: un’Introduzione
Valter Moretti
Dipartimento di Matematica
Facoltà di Scienze M.F.N
Università di Trento
1
Prefazione.
Una parte di questo libro è stata in realtà scritta, in forma preiminare, quando ero studente del
corso di laurea in Fisica all’Università degli Studi di Genova. Il corso obbligatorio di Istituzioni
di Fisica Teorica, al terzo anno, era il secondo scoglio insormontabile per molti studenti (il primo
era il famigerato corso di Fisica II che includeva la termodinamica insieme all’elettrodinamica
classica).
La Meccanica Quantistica necessita un modo di pensare nuovo e difficile e lo sforzo era davvero
notevole per noi volenterosi studenti: ci si muoveva per molti mesi in un contesto nebbioso
ed insicuro, senza capire cosa fosse davvero importante nelle nozioni fisiche che cercavamo di
imparare – con molta difficoltà – insieme ad un formalismo del tutto nuovo: quello della teoria spettrale degli operatori lineari su spazi di Hilbert. In realtà all’epoca non comprendevamo
ancora che stavamo lavorando con tale teoria matematica, e per molti dei miei colleghi la cosa
era, forse a ragione, del tutto irrilevante; i vettori bra di Dirac erano vettori bra di Dirac e basta
e non gli elementi del duale dello spazio di Hilbert. La nozione di spazio di Hilbert e di spazio duale non aveva ancora diritto di cittadinanza nella classe degli strumenti matematici della
quasi totalità dei miei colleghi, anche se sarebbe entrata a breve dal corso di Metodi Matematici
della Fisica. La matematica, la formalizzazione matematica della fisica, era sempre stato il mio
cavallo di battaglia per superare tutte le difficoltà insite nello studio della fisica, tanto che alla
fine (ma dopo avere preso anche un dottorato in fisica teorica) sono istituzionalmente diventato
un matematico. Armato delle mie nozioni di matematica, imparate in un percorso extracurriculare che coltivavo parallelamente agli studi di fisica da sempre, cercai di formalizzare anche
le interessanti nozioni nelle quale mi stavo imbattendo, con questo nuovo ed interessantissimo
corso di fisica. In parallelo portavo avanti una analogo progetto riguardante la formalizzazione
matematica della teoria della Relatività Generale, non sapendo ancora che lo sforzo dedicato
alla Meccanica Quantistica sarebbe stato incommensurabilmente superiore.
La formulazione del teorema spettrale più o meno come è presentata nel capitolo 9 di questo
libro è la stessa con la quale arrivai a sostenere l’esame del corso di Istituzioni di Fisica Teorica
che fu, di conseguenza, un po’ un discorso tra sordi.
Successivamente i miei interessi si spostarono verso la teoria quantisica dei campi, argomento di
cui, dal punto di vista matematico, mi occupo ancora oggi nel contesto un po’ più generale della
teoria quantistica dei campi su spaziotempo curvo. Tuttavia il mio interesse per la formulazione
elementare della MQ non è andato scemando negli anni e, di tanto in tanto, ho continuato ad
aggiungere qualche altro capitolo all’opera iniziata da studente. L’occasione di insegnare queste
2
cose in vari corsi per matematici e per fisici, nelle lauree specialistiche e nei dottorati, infliggendo
ai miei poveri studenti i risultati dei miei sforzi di sintesi, si è rivelata fondamentale per per migliorare l’opera, trascrivendo il testo in LaTeX, ma anche corregendola in vari punti accogliendo
le numerose osservazioni che mi sono giunte da varie persone. Vorrei a tal proposito ringraziare
vari studenti e colleghi, che hanno contribuito a migliorare le diverse versioni preliminari di
questo trattato: P. Armani, G. Bramanti, M. Dalla Brida, L. Di Persio, C. Fontanari, A. Franceschetti, A. Giacomini, V. Marini, G. Tessaro, A. Pugliese, G. Ziglio. Ringrazio in particolare
R. Aramini e D. Cadamuro che mi hanno segnalato errori di vario genere. Sono grato ai miei
amici e collaboratori R. Brunetti e N. Pinamonti per varie discussioni su molti degli argomenti
trattati e per avermi segnalato importanti riferimenti bibliografici.
Sarò grato a chiunque voglia scrivermi per segnalarmi le (sicuramente numerose) imprecisioni,
mancanze e gli errori che quest’opera possiede ancora. A parte le evidenti limitazioni nel contenuto: non sono trattati gli aspetti matematici di importantissimi argomenti di fisica, primo
fra tutti la teoria della diffusione quantistica. Inoltre – per ironia della sorte, dato che la mia
attività di ricerca concerne le teorie relativistiche – tutta la trattazione si sviluppa ad un livello non realtivistico e la trattazione quantistica della simmetria di Poincaré rimane del tutto
trascurata. D’altra parte alcuni argomenti chiave per la fisica, quali la nozione di simmetria
(anche in relazione al problema della dinamica) oppure le proprietà delle funzioni di operatori
autoaggiunti, sono affrontati con una certa profondità ed ampiezza.
Ottobre 2009
Valter Moretti
Dipartimento di Matematica
Facoltà di Scienze MFN
Università di Trento
[email protected]
3
Indice
1 Introduzione
1.1 Scopi, struttura del libro e prerequisiti. . .
1.2 La MQ come teoria matematica. . . . . .
1.3 La MQ nel panorama della Fisica attuale.
1.4 Convenzioni generali. . . . . . . . . . . . .
I
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Elementi di teoria degli operatori su spazi di Hilbert
9
9
11
13
15
16
2 Alcune nozioni e teoremi generali nella teoria degli spazi normati e di Banach.
2.1 Spazi normati, di Banach e algebre. . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Operatori, spazi di operatori, norme di operatori. . . . . . . . . . . . . . . . . . .
2.3 I teoremi fondamentali negli spazi di Banach e le topologie deboli. . . . . . . . .
2.3.1 Il teorema di Hahn-Banach e le sue conseguenze elementari. . . . . . . . .
2.3.2 Il teorema di Banach-Steinhaus e topologie operatoriali. . . . . . . . . . .
2.3.3 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal
Teorema di Baire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Proiettori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Norme equivalenti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
18
23
30
30
34
3 Spazi di Hilbert ed operatori limitati.
3.1 Nozioni elementari, teorema di Riesz e riflessività. . . . . . . . . . . . . . . . . .
3.2 Basi hilbertiane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Nozione di aggiunto e applicazioni. . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 L’operazione di coniugazione hermitiana o aggiunzione. . . . . . . . . . .
3.3.2 ∗ -algebre e C ∗ -algebre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi. . .
3.4 Proiettori ortogonali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati.
3.6 La trasformata di Fourier-Plancherel. . . . . . . . . . . . . . . . . . . . . . . . . .
48
49
57
69
69
72
74
78
81
89
4
39
43
45
4 Proprietà elementari degli operatori compatti, di Hilbert-Schmidt e di classe
traccia.
101
4.1 Generalità sugli operatori compatti in spazi normati, di Banach e Hilbert. . . . . 102
4.2 Operatori compatti in spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . 104
4.3 Operatori di Hilbert-Schmidt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.4 Operatori di classe traccia (o nucleari). . . . . . . . . . . . . . . . . . . . . . . . . 126
5 Operatori non limitati con domini densi in spazi di Hilbert.
5.1 Operatori non limitati con dominio non massimale. . . . . . . . . . . . . . . . . .
5.1.1 Operatori non limitati con dominio non massimale in spazi normati e di
Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 La definizione generale di operatore aggiunto in spazi di Hilbert. . . . . .
5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti. .
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso. . . . . .
5.3.1 L’operatore posizione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 L’operatore impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Criteri di esistenza ed unicità per le estensioni autoaggiunte. . . . . . . . . . . . .
5.4.1 La trasformata di Cayley e gli indici di difetto. . . . . . . . . . . . . . . .
5.4.2 Criteri di Von Neumann e di Nelson. . . . . . . . . . . . . . . . . . . . . .
134
135
II
164
Il formalismo della Meccanica Quantistica e la Teoria Spettrale
135
137
139
144
144
146
151
151
155
6 Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria.
165
6.1 Generalità sui sistemi quantistici. . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
6.2 Alcune proprietà particellari delle onde elettromagnetiche. . . . . . . . . . . . . . 167
6.2.1 Effetto Fotoelettrico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.2.2 Effetto Compton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.3 Cenni di Meccanica ondulatoria. . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.3.1 Onde di de Broglie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.3.2 Funzione d’onda di Schrödinger e interpretazione probabilistica di Born. . 171
6.4 Principio di indeterminazione di Heisenberg. . . . . . . . . . . . . . . . . . . . . . 173
6.5 Le grandezze compatibili ed incompatibili. . . . . . . . . . . . . . . . . . . . . . . 175
7 Il formalismo matematico di base della MQ: proposizioni, stati quantistici e
osservabili.
177
7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia
quantistica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.2 Stati classici come misure di probabilità sulla σ-algebra delle proposizioni elementari. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
7.2.1 Stati come misure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5
7.2.2
7.2.3
7.2.4
7.2.5
7.3
7.4
7.5
Proposizioni e insiemi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interpretazione insiemistica dei connettivi logici. . . . . . . . . . . . . . .
Proposizioni “infinite” e grandezze fisiche. . . . . . . . . . . . . . . . . . .
Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle
proposizioni elementari. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali.
7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert. . . . . . . . . . . . . .
Le proposizioni e gli stati relativi a sistemi quantistici. . . . . . . . . . . . . . . .
7.4.1 Proposizioni e stati di sistemi quantistici: il teorema di Gleason. . . . . .
7.4.2 Stati puri, stati misti, ampiezze di transizione. . . . . . . . . . . . . . . .
7.4.3 Stati successivi ai processi di misura e preparazione degli stati. . . . . . .
7.4.4 Regole di superselezione e settori coerenti. . . . . . . . . . . . . . . . . . .
Le osservabili come Misure a Valori di Proiezione (PVM) su R. . . . . . . . . . .
7.5.1 La nozione di osservabile . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5.2 Operatori autoaggiunti associati ad osservabili: esempi elementari. . . . .
7.5.3 Misure di probabilità associate a coppie stato - osservabile. . . . . . . . .
7.5.4 Un accenno alle osservabili generalizzate in termini di “POVM”. . . . . .
181
182
183
185
188
189
197
198
205
211
213
215
215
218
222
225
8 Teoria Spettrale su spazi di Hilbert I: generalità ed operatori normali limitati.227
8.1 Spettro, risolvente, operatore risolvente. . . . . . . . . . . . . . . . . . . . . . . . 228
8.1.1 Nozioni fondamentali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
8.1.2 Il raggio spettrale e la formula di Gelfand. . . . . . . . . . . . . . . . . . . 232
8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert. . . 235
8.2 ∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da operatori limitati
autoaggiunti in spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
8.3 Misure a valori di proiezione e teorema spettrale per operatori limitati normali. . 247
8.3.1 Misure a valori di proiezione (PVM) dette anche misure spettrali. . . . . . 247
8.3.2 Proprietà degli operatori ottenuti integrando funzioni limitate rispetto a
PVM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
8.3.3 Teorema di decomposizione spettrale per operatori limitati normali. . . . 262
9 Teoria Spettrale su spazi di Hilbert II: operatori autoaggiunti non limitati ed
applicazioni.
280
9.1 Teorema spettrale per operatori autoaggiunti non limitati. . . . . . . . . . . . . . 281
9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali. . . . . . 281
9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati.293
9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico . 302
9.1.4 Un esempio a spettro continuo: gli operatori posizione ed impulso. . . . . 306
9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
9.2 Gruppi unitari ad un parametro fortemente continui. . . . . . . . . . . . . . . . . 308
6
9.2.1
9.3
9.4
9.5
9.6
Gruppi unitari ad un parametro fortemente continui, teorema di von
Neumann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
9.2.2 Gruppi unitari ad un parametro generati da operatori autoaggiunti e
Teorema di Stone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
9.2.3 Condizioni per la commutatività di misure spettrali. . . . . . . . . . . . . 319
Prodotto tensoriale hilbertiano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
9.3.1 Prodotto tensoriale di spazi di Hilbert. . . . . . . . . . . . . . . . . . . . . 323
9.3.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro proprietà spettrali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
9.3.3 Un esempio: il momento angolare orbitale. . . . . . . . . . . . . . . . . . 331
Esponenziale di operatori non limitati: vettori analitici. . . . . . . . . . . . . . . 335
Teorema di decomposizione polare per operatori non limitati. . . . . . . . . . . . 339
9.5.1 Proprietà degli operatori A∗ A, radici quadrate di operatori autoaggiunti
positivi non limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti.344
I teoremi di Kato-Rellich e di Kato. . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.6.1 Il teorema di Kato-Rellich. . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.6.2 Un esempio: l’operatore −∆ + V ed il teorema di Kato. . . . . . . . . . . 348
10 La formulazione matematica della Meccanica Quantistica non relativistica. 355
10.1 Sistemi elementari non relativistici: particella a spin 0. . . . . . . . . . . . . . . . 359
10.1.1 le Relazioni di Commutazione Canonica (CCR) e non implementabilità con
operatori limitati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361
10.1.2 Il Principio di Indeterminazione di Heisenberg come teorema. . . . . . . . 363
10.2 Le relazioni di Weyl, il teorema di Stone-von Neumann ed il teorema di Mackey. 364
10.2.1 Famiglie irriducibili di operatori e lemma di Schur. . . . . . . . . . . . . . 364
10.2.2 Le relazioni di Weyl dalle CCR. . . . . . . . . . . . . . . . . . . . . . . . . 366
10.2.3 Il teorema di Stone-von Neumann ed il teorema di Mackey. . . . . . . . . 375
10.2.4 La ∗-algebra di Weyl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
10.2.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey. . . . . . . 381
10.2.6 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg.387
10.3 Il principio di corrispondenza di Dirac. . . . . . . . . . . . . . . . . . . . . . . . . 390
11 Introduzione alle Simmetrie Quantistiche.
11.1 Nozione e caratterizzazione di simmetrie quantistiche. .
11.1.1 Qualche esempio. . . . . . . . . . . . . . . . . . .
11.1.2 Simmetrie in presenza di regole di superselezione.
11.1.3 Simmetrie nel senso di Kadison. . . . . . . . . .
11.1.4 Simmetrie nel senso di Wigner. . . . . . . . . . .
11.1.5 Teoremi di Wigner, di Kadison. . . . . . . . . . .
11.1.6 Azione duale delle simmetrie sulle osservabili. . .
11.2 Introduzione ai gruppi di simmetria. . . . . . . . . . . .
7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
393
393
395
396
397
400
402
414
421
11.2.1
11.2.2
11.2.3
11.2.4
11.2.5
11.2.6
11.2.7
11.2.8
Rappresentazioni proiettive, unitarie proiettive, estensioni centrali. . . . .
Gruppi di simmetria topologici. . . . . . . . . . . . . . . . . . . . . . . . .
Rappresentazioni unitarie proiettive fortemente continue. . . . . . . . . .
Il caso notevole del gruppo topologico R. . . . . . . . . . . . . . . . . . .
Richiami sui gruppi ed algebre di Lie. . . . . . . . . . . . . . . . . . . . .
Gruppi di simmetria di Lie, teoremi di Bargmann, Gårding, Nelson, FS3 .
Un esempio: il gruppo di simmetria SO(3) e lo spin . . . . . . . . . . . .
Il gruppo di Galileo e la regola di Bargmann di superselezione della massa
421
430
433
436
443
453
464
468
12 Alcuni argomenti più avanzati di Meccanica Quantistica.
12.1 L’assioma di evoluzione temporale e le simmetrie dinamiche. . . . . . . . . . . . .
12.1.1 L’equazione di Schrödinger e gli stati stazionari. . . . . . . . . . . . . . .
12.1.2 L’azione del gruppo di Galileo in rappresentazione posizione. . . . . . . .
12.1.3 L’evolutore temporale in assenza di omogeneità temporale e la serie di
Dyson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1.4 Inversione del tempo antiunitaria. Teorema di Pauli. . . . . . . . . . . . .
12.2 Relazione tra simmetrie dinamiche e costanti del moto. . . . . . . . . . . . . . . .
12.2.1 La rappresentazione di Heinsenberg e le costanti del moto. . . . . . . . . .
12.2.2 Un accenno al teorema di Ehrenfest ed ai problemi matematici ad esso
connessi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2.3 Costanti del moto associate a gruppi di Lie di simmetria ed il caso del
gruppo di Galileo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3 Sistemi composti: sistemi con struttura interna e sistemi a più particelle. . . . .
12.3.1 Stati entangled ed il cosiddetto “paradosso EPR”. . . . . . . . . . . . . .
12.3.2 Impossibilità di trasmettere informazione tramite le correlazioni EPR. . .
12.3.3 Sistemi di particelle identiche. . . . . . . . . . . . . . . . . . . . . . . . . .
479
480
486
493
A Relazioni d’ordine, topologia, gruppi.
A.1 Relazioni d’ordine, insiemi parzialmente ordinati, lemma di Zorn. . . . . . . . . .
A.2 Richiami di topologia generale elementare. . . . . . . . . . . . . . . . . . . . . . .
A.3 Richiami di teoria dei gruppi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
528
528
529
532
B Elementi di geometria differenziale.
B.1 Varietà differenziabili, varietà differenziabili prodotto, funzioni differenziabili. .
B.2 Spazio tangente e cotangente. Campi vettoriali covarianti e controvarianti. . . .
B.3 Differenziali, curve e vettori tangenti. . . . . . . . . . . . . . . . . . . . . . . . .
B.4 Pushforward e pullback. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
536
536
541
544
545
C Teoria della misura, integrale di funzioni a valori spazi di Banach.
C.1 Richiami di teoria della misura. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C.2 Derivazione sotto il segno di integrale. . . . . . . . . . . . . . . . . . . . . . . . .
C.3 Integrale di funzioni a valori spazi di Banach. . . . . . . . . . . . . . . . . . . . .
546
546
552
553
8
496
500
503
503
508
511
516
517
521
523
Capitolo 1
Introduzione
1.1
Scopi, struttura del libro e prerequisiti.
Uno degli scopi principali di questo libro è quello di esporre i fondamenti matematici della Meccanica Quantistica (MQ) in modo matematicamente rigoroso. Tuttavia si tratta di un testo di
(Fisica-)Matematica e non di un manuale di Meccanica Quantistica. Escludendo alcune parti
del libro, la fenomenologia fisica sarà lasciata sullo sfondo per concentrarci sugli aspetti logicoformali della teoria. In ogni caso daremo delle esemplificazioni fisiche del formalismo per non
perdere il contatto con la realtà dei fisici. Il libro può anche essere considerato come un testo
introduttivo di analisi funzionale lineare sugli spazi di Hilbert con particolare enfasi su alcuni
risultati di teoria spettrale, – come le varie formulazioni del teorema spettrale per operatori
normali limitati ed autoaggiunti non necessariamente limitati – indipendentemente dalla formulazione matematica della Meccanica Quantistica. Questo è – di fatto – il secondo scopo del
libro. La formalizzazione matematica della MQ è “confinata” nei capitoli 6, 7, 10, 11 e 12 da cui
i rimanenti capitoli sono logicamente indipendenti, anche se motivazioni per talune definizioni
matematiche si possono trovare nei capitoli 7, 10, 11 e 12. Il terzo scopo del libro è quello di
raccogliere in un unico testo diversi utili risultati rigorosi, ma più avanzati di quanto si trova
nei manuali di fisica quantistica, sulla struttura matematica della Meccanica Quantistica. Tali
risultati sono noti da molto tempo, ma sparsi nella letteratura avanzata. Possiamo menzionare
il teorema di Gleason, i teoremi di Stone-von Neumann e di Mackey, il teorema di Kadison, oltre
che il più noto teorema di Wigner; oppure argomenti di teoria degli operatori, come il teorema
di decomposizione polare per operatorori chiusi non limitati (che ha grande rilevanza nella teoria
di Tomita-Takesaki e in meccanica quantistica statistica, in riferimento alla condizione KMS),
oppure alcuni risultati, dovuti a Nelson, sulle proprietà di autoaggiunzione di operatori simmetrici come conseguenza all’esistenza di insiemi densi di vettori analitici ed anche, infine, alcuni
risultati dovuti a Kato (ma non solo) sull’essenziale autoaggiunzione di certi tipi di operatori
e sui loro limiti dal basso dello spettro (risultati in massima parte basati sul teorema di KatoRellich).
Il contenuto del libro può coprire una buona parte di un corso avanzato di Metodi Matematici
9
della Fisica, in un corso di laurea specialistico/magistrale in Fisica, assumendo che lo studente
sia già familiare con le tecniche elementari della teoria della misura. Alternativamente, il testo
può anche essere adoperato in un corso di Fisica Matematica avanzato, che tratti argomenti di
Meccanica Quantistica.
Se si guarda il testo con l’occhio del fisico più che con quello del matematico, ci si accorge che
il libro è diviso in due parti. Nella prima parte, che termina con il capitolo 5 incluso, ci si
occupa di enunciare la teoria generale degli operatori in spazi di Hilbert (dando anche alcune
nozioni valide per contesti più generali quali gli spazi di Banach e provando risultati generali
fondamentali, quali il teorema di Baire, di Hahn-Banach e Banach-Steinhaus e le loro conseguenze elementari). Nella seconda parte viene inizialmente (nel capitolo 9) sviluppata la teoria
spettrale in termini di misure a valori di proiezione, fino ad enunciare e provare i teoremi di
decomposizione spettrale per operatori autoaggiunti non limitati in spazi di Hilbert, includendo
le proprietà delle funzioni di operatori (calcolo funzionale) per funzioni misurabili e non necessariamente limitate, studiandone con cura la proprietà spettrali generali e le proprietà dei loro
domini. Con tali strumenti viene quindi sviluppato tutto il formalismo matematico fondazionale
della Meccanica Quantistica.
Nei capitoli relativi alla formulazione matematica generale della Meccanica Quantistica, dopo
una discussione ed una motivazione di carattere fisico, si assume come punto di partenza matematico il fatto che che le proposizioni sui sistemi fisici quantistici siano descritte dal reticolo
dei proiettori ortogonali su uno spazio di Hilbert complesso. Insiemi massimali di proposizioni
fisicamente compatibili (in senso quantistico) sono descritte da reticoli distributivi ortocomplementati limitati e σ-completi. In questa ottica, la definizione quantistica di osservabile in termini
di operatore autoaggiunto risulta essere estremamente naturale come, d’altra parte, la formulazione del teorema di decomposizione spettrale. Gli stati quantistici vengono introdotti come
misure sull’insieme di tali proiettori. Tramite il teorema di Gleason, si caratterizzano gli stati
come operatori positivi di classe traccia con traccia unitaria. Gli stati puri (i raggi dello spazio
di Hilbert del sistema fisico) si ottengono come elementi estremali del corpo convesso degli stati.
In questo contesto, e tra diversi altri argomenti, si discute la nozione di simmetria quantistica e
di gruppo di simmetria in modo approfondito (riferendosi sia alla nozione dovuta a Wigner, ma
anche a quella dovuta a Kadison), includendo lo studio delle le simmetrie dinamiche e la versione
quantistica del teorema di Nöther. Come gruppo di simmetria di riferimento, che useremo nelle
varie esemplificazioni della teoria delle rappresentazioni unitarie proiettive, ci riferiremo al gruppo di Galileo ed alle sue estensioni centrali ed ai sottogruppi di tale gruppo. Daremo anche una
dimostrazione del teorema di Bargmann sull’esistenza di rappresentazioni unitarie per gruppi
di Lie semplicemente connessi la cui algebra di Lie soddisfa una certa condizione coomologica.
Discuteremo la regola di superselezione della massa dovuta a Bargamnn. Discuteremo anche
alcuni utili risultati sulle rappresentazioni unitarie proiettive di gruppi di Lie di simmetrie dovuti a Gårding e Nelson. Tratteremo anche alcuni argomenti importanti, ma presentati in modo
poco approfondito sui manuali, come le formulazioni relative all’unicità delle rappresentazioni
unitarie delle relazioni di commutazione canonica (teoremi di Stone-von Neumann e Mackey)
oppure la difficoltà teorica nel definire operatore tempo come operatore coniugato all’operatore
energia (l’hamiltoniano). Discuteremo brevemente le difficoltà matematiche che si incontrano
10
nel voler rtendere rigoroso l’enunciato del teorema di Ehrenfest.
Le appendici, in fondo al libro, richiamano le nozioni elementari di topologia generale, geometria
differenziale (utile nel capitolo 11) e teoria della misura.
La scelta dell’autore è stata di non trattare alcuni argomenti, sia pure importanti, come la
teoria degli spazi di Hilbert attrezzati (le famose triplette di Gelfand) perché avrebbe richisto
l’introduzione di ulteriore materiale, specialmente riguardante la teoria delle distribuzioni.
Prerequisiti matematici necessari per comprendere il contenuto di questo libro sono essenzialmente, oltre ai contenuti di un normale corso completo di algebra lineare, che includa elementi
di teoria dei gruppi e delle loro rappresentazioni, uno di analisi per funzioni di una e di più variabili, qualche nozione di topologia elementare degli spazi metrici, i fondamenti della teoria della
misura su σ-algebre [Rud82] (riassunti in appendice a fine libro), qualche nozione elementare di
teoria delle funzioni analitiche di una variabile complessa.
Dal punto di vista fisico è necessaria la conoscenza di alcuni argomenti dei corsi universitari
elementari di argomento Fisico. Più precisamente le nozioni di Meccanica elementare con alcuni elementi di Meccanica Analitica (i primi rudimenti della formulazione di Hamilton della
dinamica) unitamente ad alcune nozioni di Elettromagnetismo (proprietà elementari delle Onde
Elettromagnetiche e fenomeni ondulatori principali quali interferenza, diffrazione, diffusione).
Le nozioni meno elementari ed altre nozioni utili solo in alcuni punti verranno comunque riassunte brevemente nel testo (anche negli esempi), presentando i risultati sufficienti per proseguire
nella lettura. In una sezione del capitolo 11 si farà uso della nozione di gruppo di Lie e di alcune
proprietà e risultati fondamentali della teoria corrispondente. Per tali argomenti ci riferiamo ai
testi [War75, NaSt84]. Come già detto, in appendice a fine libro, sono richiamati con un certo
dettaglio alcuni risultati di geometria differenziale utili in tale contesto.
Nota importante. Gli esempi presentati nei vari capitoli devono considerarsi come parte
integrante del testo e non possono essere omessi quasi mai. Alcuni risultati, ottenuti negli
esercizi proposti, verranno successivamente usati nel testo come proposizioni note. Gli esercizi
in questione saranno comunque corredati di suggerimenti, traccia di soluzione o, addirittura,
soluzione completa.
1.2
La MQ come teoria matematica.
Dal punto di vista matematico la Meccanica Quantistica rappresenta una rara sintesi di eleganza
matematica e profondità descrittiva del contesto fisico. La teoria usa essenzialmente tecniche di
analisi funzionale lineare, ma con diverse intersezioni con la teoria della misura, la teoria della
probabilità e la logica matematica.
Esistono (almeno) due possibili formulazioni matematiche della Meccanica Quantistica elementare. La più antica in ordine storico, dovuta essenzialmente a von Neumann (1932), è formulata
usando il linguaggio della teoria degli spazi di Hilbert e della teoria spettrale degli operatori
non limitati su tali spazi. La formulazione più recente ed avanzata, sviluppata dalla scuola
del matematico Gel’fand nel tentativo di risolvere alcuni problemi fisico-matematici della teoria
11
quantistica dei campi, è presentata nel linguaggio delle algebre astratte (∗-algebre e C ∗ -algebre)
costruite sul modello delle algebre di operatori definite e studiate dallo stesso von Neumann (oggi
note come W ∗ algebre o algebre di von Neumann), ma emancipandosi dalla struttura di spazio
di Hilbert (vedi per es. il testo classico sulle algebre di operatori [BrRo02]). Tale formulazione
ha il suo centro nel famoso teorema GNS [Haa96, BrRo02]. La seconda formulazione, in un
senso molto specifico che non possiamo chiarire qui, può considerarsi un’estensione della prima
formulazione anche per i nuovi contenuti fisici introdotti. In particolare essa permette di dare
un senso matematicamente preciso alla richiesta di località delle teorie di campo quantistiche
relativistiche [Haa96] e permette l’estensione delle teorie quantistiche di campo in spaziotempo
curvo.
In questo libro ci occuperemo unicamente della prima formulazione che ha comunque una complessità matematica notevole accompagnata da una notevole eleganza formale.
Uno strumento matematico fondamentale per sviluppare la MQ è il cosiddetto teorema spettrale
per operatori autoaggiunti (generalmente non limitati) definiti in varietà lineari dense in uno
spazio di Hilbert. Tale teorema, che può essere esteso al caso di operatori normali, fu dimostrato per la prima volta proprio da von Neumann nel suo libro fondamentale sulla struttura
matematica della MQ [Neu32] che può considerarsi una pietra miliare della fisica matematica
oltre che della matematica pura del XX secolo1 . Il legame tra MQ e teoria spettrale è dovuto al
seguente fatto. Nell’interpretazione standard della MQ si vede in modo naturale che le grandezze
fisiche misurabili su sistemi quantistici possono essere associate ad operatori autoaggiunti non
limitati in un opportuno spazio di Hilbert. Lo spettro di ciascuno di questi operatori coincide
con l’insieme dei valori assumibili dalla grandezza associata. La procedura di costruzione delle grandezze fisiche a partire dalle proprietà o proposizioni elementari del tipo “il valore della
grandezza cade nell’intervallo (a, b]”, che nello schema matematico adottato corrispondono a
proiettori ortogonali, non è altro che una procedura di integrazione su una appropriata misura
spettrale a valori di proiezione. Tale procedura ricorda molto da vicino il metodo per definire
l’integrale di Lebesgue di una funzione misurabile. Il teorema spettrale in sostanza altro non
è che un metodo che permette di costruire operatori più complessi partendo da proiettori o,
viceversa, di decomporre operatori in termini di misure a valori di proiezione.
La formulazione moderna della teoria spettrale è sicuramente differente da quella originale di
von Neumann che però conteneva quasi tutti gli elementi fondamentali. Ancora oggi il testo di
von Neumann (che è stato scritto nel lontano 1932) rivela una profondità impressionante specie
nei problemi più difficili dell’interpretazione fisica del formalismo della MQ di cui, leggendo il
libro, si evince che von Neumann era chiaramente conscio a differenza di molti dei suoi colleghi.
Sarebbe interessante fare un paragone tra il testo di von Neumann e il, molto più famoso, testo
di Dirac [Dir30] sui fondamenti della MQ, cosa che lasciamo al lettore interessato. In ogni caso
la profondità dell’impostazione data da von Neumann alla MQ comincia anche ad essere riconosciuta da chi si occupa di fisica sperimentale ed in particolare di misure quantistiche [BrKh95].
Le cosiddette Logiche Quantistiche nascono dal tentativo di formulare la MQ partendo dal
1
La definizione del concetto di spazio di Hilbert infinito dimensionale e gran parte della teoria generale degli
spazi di Hilbert cosı̀ come la conosciamo oggi sono anch’essi dovuti a von Neumann e alla sua formulazione della
MQ.
12
punto di vista più radicale possibile, attribuendo alla stessa logica usata nel trattare i sistemi
quantistici, alcune proprietà differenti da quelle della logica classica e modificando la teoria dell’interpretazione. Per esempio, sono usati più di due valori di verità e il reticolo booleano delle
proposizioni è rimpiazzato da una struttura non distributiva più complessa. Nella prima formulazione della logica quantistica, oggi denominata Logica Quantistica Standard, proposta da Von
Neumann e Birkhoff nel 1936, la struttura dell’algebra booleana delle proposizioni era rimpiazzata con quella di un reticolo ortomodulare che di fatto ha come modello l’insieme dei proiettori
ortogonali su uno spazio di Hilbert ovvero, l’insieme dei sottospazi chiusi su cui proiettano i
proiettori [Bon97], unitamente ad alcune regole di composizione. È noto che, a dispetto della
sua eleganza, tale modellizzazione contiene diversi difetti quando si cerca di tradurla in termini
operativi fisici (o più precisamente operazionali). Accanto alle diverse formulazioni delle Logiche Quantistiche [Bon97, DCGi02, EGL09], esistono oggi formulazioni fondazionali alternative
basate su altri punti di vista (come la teoria dei topos).
1.3
La MQ nel panorama della Fisica attuale.
La Meccanica Quantistica – genericamente parlando la teoria della fisica del mondo atomico e
sub atomico – insieme alla Teoria della Relatività Speciale e Generale (RSG) – genericamente
parlando la teoria fisica della gravità, del mondo macroscopico e della cosmologia – costituiscono
i due paradigmi attraverso i quali si è sviluppata la fisica del XX secolo e quella dell’inizio del
secolo attuale. I due paradigmi si sono fusi in vari contesti dando luogo a teorie quantistiche
relativistiche, in particolare alla Teoria Quantistica Relativistica dei Campi [StWi00, Wei99],
che ha avuto uno sviluppo impressionante con straordinari successi esplicativi e predittivi nel
contesto della teoria delle particelle elementari e delle forze fondamentali. A titolo d’esempio
tale teoria ha previsto, all’interno del cosiddetto modello standard delle particelle elementari,
l’unificazione della forza debole ed elettromagnetica che è poi stata confermata sperimentalmente
alla fine degli anni ’80 con un esperimento spettacolare al C.E.R.N. di Ginevra in cui si sono
osservate le particelle Z0 e W ± previste dalla teoria dell’unificazione elettrodebole.
La previsione del valore di una grandezza fisica che è stata poi confermata con una delle maggiori
precisioni di tutta la storia della Fisica si è avuta nell’elettrodinamica quantistica. Si tratta del
valore del cosiddetto rapporto giromagnetico dell’elettrone g. Tale grandezza fisica è un numero
puro. Il valore previsto dall’elettrodinamica quantistica per a := g/2 − 1 è:
0.001159652359 ± 0.000000000282 ,
quello ottenuto sperimentalmente è risultato essere
0.001159652209 ± 0.000000000031 .
Molti fisici ritengono che la MQ sia la teoria fondamentale dell’Universo (più profonda delle
teorie relativistiche) anche per il fatto che risulta essere valida per scale lineari di lunghezza che
variano in uno spettro di ampiezza impressionante: da 1m (condensati di Bose-Einstein) almeno
fino a 10−16 m (interno dei nucleoni: quarks). La MQ ha avuto un enorme successo sia teorico
13
che sperimentale anche nella scienza che studia la struttura della materia solida, nell’ottica, nell’elettronica, con diverse importantissime ricadute tecnologiche: ogni oggetto tecnologico di uso
comune che sia moderatamente sofisticato (giocattoli per i bambini, telefonini, telecomandi...)
da contenere qualche elemento semiconduttore sfrutta proprietà quantistiche della materia.
Tornando ai due paradigmi scientifici del XX secolo – MQ e RSG – rimangono diversi punti
oscuri in cui i due paradigmi sembrano venire in conflitto, in particolare il problema della cosiddetta “quantizzazione della gravità” e della struttura dello spaziotempo alle scale di Planck
– 10−33 cm, 1043 s – le scale di lunghezza e di tempo che si ottengono combinando le costanti
fondamentali delle due teorie: la velocità della luce, la costante di gravitazione universale e la
costante di Planck. La necessità di una struttura discontinua dello spaziotempo a scale ultramicroscopiche è suggerita anche da alcune difficoltà matematiche (ma anche concettuali) non
completamente risolte dalla cosiddetta teoria della Rinormalizzazione quantistica, dovute all’apparire di infiniti che si incontrano nei calcoli dei processi dovuti alle interazioni fondamentali tra
le particelle elementari. Tutti questi problemi hanno dato luogo a recenti ed importanti sviluppi
teorici, che hanno avuto influenze nello sviluppo della stessa matematica pura, come la teoria
delle (super) stringhe (e brane) e le varie versioni di Geometria non commutativa, prima fra
tutte quella di A. Connes. La difficoltà nel decidere quale di queste teorie abbia un senso fisico e
descriva l’universo alle scale piccolissime è anche di natura tecnologica: la tecnologia attuale non
è in grado di preparare esperimenti che permettano il discernimento tra le varie teorie proposte.
Altri punti di contrasto tra MQ e RSG, su cui la discussione è oggi un po’ più pacata rispetto
al passato, riguardano il rapporto della MQ con concetti di località di natura relativistica (paradosso Einstein-Podolsky-Rosen[Bon97]) in relazione ai fenomeni di entanglement della MQ. Ciò
è dovuto in particolare all’analisi di Bell della fine degli anno ’60 ed ai celebri esperimenti di
Aspect che hanno dato torto alle aspettative di Einstein, ragione all’interpretazione di Copenaghen, ed hanno provato che la nonlocalità è una caratteristica della natura, indipendentemente
dall’accettazione o meno dell’interpretazione standard della MQ. Sembra ormai condivisa dalla
maggior parte dei fisici l’idea che l’esistenza di processi fisici non locali, prevista teoricamente
dalla MQ, non implichi alcuna reale violazione dei fondamenti della Relatività (l’entanglement
quantistico non coinvolge trasmissione superluminare di informazioni e violazione della causalità
[Bon97]).
Nell’interpretazione standard della MQ detta di Copenaghen, rimangono punti fisicamente
e matematicamente poco chiari, ma di estremo interesse concettuale. In particolare non è per
nulla chiaro come la meccanica classica si possa ottenere come sottocaso o caso limite della MQ
e come si possa fissare un limite (anche provvisorio o impreciso) tra i due mondi. Ulteriormente
rimane aperto il problema della descrizione fisica e matematica del cosiddetto processo di misura
quantistica di cui parleremo più avanti e che è strettamente connesso a quello del limite classico
della MQ. Anche prendendo spunto da questo problema sono nate altre interpretazioni del
formalismo della MQ, profondamente differenti dall’interpretazione di Copenaghen. Tra queste
nuove interpretazioni, una volta considerate eretiche, di grande interesse è in particolare quella
a variabili nascoste di Bohm [Bon97, Des80].
Talvolta vengono sollevate riserve sulla formulazione Meccanica Quantistica e sul fatto che
non sia veramente comprensibile, ma che si tratti semplicemente di un elenco di procedure che
14
“materialmente funzionano”, mentre la vera essenza sia qualcosa di inaccessibile. È opinione
dell’autore che dietro a questo punto di vista ci sia un pericoloso errore epistemologico. Basato
sulla credenza che “spiegare” un fenomeno significhi ridurlo alle categorie dell’esperienza quotidiana. Come se queste fossero qualcosa di più profondo della realtà stessa. L’opinione dell’autore
è che sia il esattamente il contrario: le categorie dell’esperienza quotidiana sono state costruite
con l’esperienza quotidiana senza, conseguentemente, alcuna pretesa di profondità metafisica.
Dietro quel semplice “materialmente funziona” ci potrebbe essere un mare filosofico profondo
che ci avvicina alla realtà invece che allontanarcene. La Meccanica Quantistica ci ha insegnato
a pensare in un modo differente ed è stata (anzi è ), per questo, un opportunità incredibile per
l’esperienza umana. Voltarle le spalle dicendo che non l’abbiamo compresa, perché si rifiuta
di ricadere nelle nostre categorie usuali, significa chiudere una porta su qualcosa di enorme.
Questo è il parere dell’autore, che è fermamente convinto che il principio di indeterminazione di
Heisenberg (ridotto a semplice teorema nella formulazione moderna) sia una delle massime vette
raggiunte dall’intelletto umano.
1.4
Convenzioni generali.
Nel seguito, se non sarà precisato altrimenti il campo degli scalari di uno spazio di Hilbert sarà
sempre C. Il complesso coniugato di un numero c sarà indicato con c. Lo stesso simbolo è anche
usato per denotare la chiusura di insiemi o di operatori, ciò non dovrebbe comunque creare fraintendimenti e, dove fosse necessario, un commento preciserà quale deve essere l’interpretazione
del simbolo.
Il prodotto scalare hermitiano tra due vettori ψ, φ di uno spazio di Hilbert sarà indicato con
(ψ|φ). Si supporrà sempre che l’entrata di sinistra del prodotto scalare sia quella antilineare:
(αψ|φ) = α(ψ|φ).
Il termine operatore significa comunque operatore lineare anche se talvolta questa specificazione è omessa.
Un operatore lineare U : H → H0 , dove H e H0 sono spazi di Hilbert, che sia isometrico e
surgettivo sarà detto unitario, anche se in altri testi la terminologia è riservata al solo caso in
cui valga anche H = H0 .
La locuzione sottospazio sarà riservata ai sottospazi rispetto alla semplice struttura di spazio
vettoriale anche nel caso in cui esista un’ulteriore struttura (spazio di Hilbert, Banach o altro)
nello spazio ambiente. In altri testi, in riferimento alla teoria degli spazi di Hilbert, sottospazio
significa quello che noi chiamiamo sottospazio chiuso, mentre un sottospazio rispetto alla sola
struttura algebrica è spesso indicato con il nome di varietà lineare.
L’operazione di coniugazione hermitiana sarà sempre indicata con ∗ e operatore hermitiano,
operatore simmetrico ed operatore autoaggiunto non saranno considerati sinonimi; si vedano le
definizioni corrispondenti nel seguito.
15
Parte I
Elementi di teoria degli operatori su
spazi di Hilbert
16
Capitolo 2
Alcune nozioni e teoremi generali
nella teoria degli spazi normati e di
Banach.
In questo capitolo presenteremo alcune nozioni ed alcuni risultati fondamentali della teoria generale degli spazi normati e degli spazi di Banach. Introdurremo anche alcune strutture algebriche
modellizzate su algebre naturali di operatori sugli spazi di Banach. Le algebre di Banach di
operatori svolgono un ruolo di grande importanza nelle formulazioni moderne della Meccanica
Quantistica.
Questo capitolo serve essenzialmente ad introdurre il linguaggio e gli strumenti elementari della
teoria degli spazi di operatori lineari.
Le nozioni più importanti di questa sezione sono sicuramente la nozione di operatore limitato e le
varie nozioni di topologia (indotta da norme o da seminorme) negli spazi di operatori. L’importanza di questi strumenti matematici deriva dal fatto che il linguaggio degli operatori lineari su
spazi lineari è il linguaggio con cui è formulato la Meccanica Quantistica. In questo contesto la
classe degli operatori limitati riveste un ruolo tecnico centrale anche se, per motivi di carattere
fisico, in Meccanica Quantistica ci si trova costretti ad introdurre e lavorare anche con operatori
non limitati. Vedremo tutto ciò nella seconda parte.
Nella prima parte di questo capitolo introdurremo le nozioni elementari di spazio normato e di
spazio di Banach e delle loro proprietà elementari.
Nella seconda parte passeremo a prentare la nozione di norma operatoriale e delle propretà più utili
di tale concetto.
Nella terza parte enunceremo e dimostreremo i teoremi fondamentali generali degli spazi di Banach, nelle versioni più elementari. Il teorema di Hahn-Banach, il teorema di Banach-Steinhaus
teorema dellapplicazione aperta (partendo dal teorema di Baire). Dimostrando anche diverse
utili conseguenze (teorema delloperatore inverso continuo e del grafico chiuso). Il teorema di
Banach-Steinhaus consentirà di discutere brevemente le varie topologie operatoriali che entrano
in gioco nella teoria degli operatori, accennando brevente alla nozione di spazio di Fréchet.
17
La quarta parte sarà dedicata alla nozione di proiettore nelgi spazi normati, nozione che specializzeremo nel capito successivo a quella, più utile per i nostri scopi, di proiettore ortogonale.
L’ultima parte, sarà dedicata ad un argomento importante, ma spesso tralasciato sui vari manuali: la nozione di norma equivalente e la dimostrazione del fatto che gli spazi normati di dimensione
n finita, sono di Banach ed omeomorfi ad un corrispondente Cn con norma standard.
2.1
Spazi normati, di Banach e algebre.
Diamo di seguito le principali definizioni sugli spazi normati e sulle algebre.
Definizione 2.1. Sia X uno spazio vettoriale sul campo K = C o R. Un’applicazione N : X → R
si dice norma su X e (X, N ) si dice spazio normato, quando N soddisfa le seguenti proprietà:
N0. N (u) ≥ 0 per u ∈ X,
N1. N (λu) = |λ|N (u) per λ ∈ K e u ∈ X,
N2. N (u + v) ≤ N (u) + N (v), per u, v ∈ X,
N3. N (u) = 0 ⇒ u = 0, per u ∈ X.
Se N0, N1 e N2 sono soddisfatte ma non lo è necessariamente N3, N si dice seminorma.
Nota. È chiaro che da N1 discende che N (0) = 0.
Notazione 2.1. Nel seguito || || e p( ), aggiungendo eventuali indici quando necessari, indicheranno sempre rispettivamente norme e seminorme.
È chiaro che ogni spazio normato ammette una topologia metrica naturale indotta dalla distanza d(u, v) := ||u − v|| per u, v ∈ X. (d : X × X → [0, +∞) è una metrica in quanto per
costruzione è simmetrica, positiva, nulla solo se u = v e vale la disuguaglianza triangolare
||x − y|| ≤ ||x − z|| + ||z − y|| per x, y, z ∈ X.)
Nel seguito ci riferiremo quasi sempre a tale topologia usando concetti topologici in uno spazio
normato.
Definizione 2.2. Se (X, || ||X ) e (Y, || ||Y ) sono spazi normati sullo stesso campo C o R, un’applicazione lineare L : X → Y è detta isometria se soddisfa ||L(x)||Y = ||x||X per ogni x ∈ X.
Se l’isometria L : X → Y è anche suriettiva, è detta isomorfismo di spazi normati.
Se esiste un isomorfismo di spazi normati (L) dallo spazio normato X allo spazio normato Y,
tali spazi si dicono isomorfi (secondo L).
Osservazioni.
(1) Frequentemente si trova in letteratura una definizione alternativa e non equivalente di isomorfismo di spazi normati. Tale definizione richiede che l’isomorfismo sia un’applicazione lineare
bicontinua (cioè un omeomorfismo lineare). È chiaro che un isomorfismo nel senso della definizione definizione 2.2 lo è anche rispetto a questa seconda definizione, tuttavia non vale il viceversa.
18
(2) È chiaro che ogni isometria L : X → Y è iniettiva per N3, ma può non essere suriettiva (se
vale X = Y la non surgettività può esserci solo se la dimensione dello spazio X non è finita).
Ogni isometria è ovviamente continua rispetto alle due topologie metriche dei due spazi e, se è
suriettiva (cioè se è un isomorfismo), la sua inversa è ancora un’isometria e quindi un isomorfismo.
Definizione 2.3. Uno spazio normato si dice spazio di Banach quando è completo nella sua
topologia metrica (cioè ogni successione di Cauchy di elementi dello spazio converge a qualche
elemento dello spazio.)
È chiaro che la proprietà di completezza è invariante per isomorfismi di spazi normati ma non
lo è sotto omeomorfismi. Un controesempio è dato dalla coppia di spazi R e (0, 1) entrambi
dotati della norma valore assoluto. I due spazi sono omeomorfi ma il primo è completo, mentre
il secondo non lo è.
È immediato provare che ogni sottospazio chiuso di uno spazio di Banach è a sua volta uno spazio
di Banach rispetto alla restrizione della norma. È un fatto noto che ogni spazio normato può
essere completato producendo uno spazio di Banach in cui lo spazio di partenza è rappresentato
da un sottospazio denso. Vale a tal proposito il:
Teorema del completamento per spazi di Banach. Sia X uno spazio vettoriale sul campo
K = C o R dotato di una norma N .
(a) Esiste uno spazio di Banach (Y, M ) su K, detto completamento di X tale che X si identifica
isometricamente con un sottospazio denso di Y tramite un applicazione lineare iniettiva J : X →
Y.
In altre parole, esiste un applicazione lineare iniettiva J : X → Y con
J(X) = Y
e
M (J(x)) = N (x) per ogni x ∈ X.
(b) Se la terna (J1 , Y1 , M1 ) con J1 : X → Y1 lineare isometrica e (Y1 , M1 ) spazio di Banach su
K è tale che X si identifica isometricamente con un sottospazio denso di Y1 tramite J1 allora
esiste ed è unico un isomorfismo di spazi normati φ : Y → Y1 tale che J1 = φ ◦ J.
Schema della dimostrazione. Diamo solo l’idea generale della dimostrazione. (a) Conviene
considerare lo spazio C delle successioni di Cauchy di elementi di X e definire la relazione di
equivalenza in C:
xn ∼ x0n ⇔ esiste lim ||xn − x0n || = 0 .
n→∞
È chiaro che X ⊂ C/ ∼ identificando ogni x di X con la classe di equivalenza della successione costante xn = x. L’applicazione che definisce tale identificazione la indicheremo con J. Si
prova facilmente che C/ ∼ è uno spazio vettoriale su K normato rispetto alla struttura indotta
naturalmente da quella di X. Si prova infine che C/ ∼ è completo, che J è lineare, isometrica (e quindi iniettiva) e che J(X) è denso in Y := C/ ∼. (b) J1 ◦ J −1 : J(X) → Y1 è una
trasformazione lineare isometrica continua definita su un insieme denso J(X) ⊂ Y a valori in
uno spazio di Banach Y1 , e pertanto si estende unicamente ad una trasformazione φ lineare
19
continua ed isometrica su Y (vedi esercizi (3) e (4) in esercizi 2.1). Essendo φ isometrica, è
anche iniettiva. La stessa cosa si può dire per l’estensione φ0 di J ◦ J1−1 : J1 (X) → Y e per
costruzione (J ◦ J1−1 ) ◦ (J1 ◦ J −1 ) = idJ(X) . Estendendo per continuità su J(X) = Y troviamo
che φ0 ◦ φ = idY e con un analogo ragionamento troviamo anche che φ ◦ φ0 = idY1 . Concludiamo
che φ e φ0 sono anche surgettive ed in particolare φ è un isomorfismo di spazi normati e che per
costruzione vale J1 = φ ◦ J. L’unicità di un isomorfismo φ : Y → Y0 che soddisfa J1 = φ ◦ J
si ha facilmente notando che ogni altro siffatto isomorfismo di spazi normati ψ : Y → Y1 , per
linearità deve soddisfare J − J = (φ − ψ) ◦ J e quindi (φ − ψ) J(X) = 0. L’unicità dell’estensione
dell’applicazione (φ−ψ) J(X) , continua con dominio J(X) denso, a J(X) = Y prova che φ = ψ. 2
Come vedremo esiste uno stretto legame tra algebre e spazi normati, tale legame passa per la
nozione di operatore lineare su uno spazio normato. Le definizioni principali riguardante la
nozione di algebra sono riassunte di seguito.
Definizione 2.4. Un’ algebra A sul campo K = C o R è uno spazio vettoriale su K dotato di
un’ulteriore applicazione detta prodotto dell’algebra: ◦ : A × A → A tale che:
A1. a ◦ (b + c) = a ◦ b + a ◦ c
per a, b, c ∈ A,
A2. (b + c) ◦ a = b ◦ a + c ◦ a
per a, b, c ∈ A,
A3. α(a ◦ b) = (αa) ◦ b = a ◦ (αb)
per α ∈ K e a, b ∈ A.
L’algebra A è detta:
commutativa o abeliana se
A4. a ◦ b = b ◦ a per ogni coppia a, b ∈ A;
algebra con unitàse contiene un elemento I, detto unità dell’algebra, tale che:
A5. I ◦ u = u ◦ I = u per ogni a ∈ A;
algebra normata ovvero algebra normata con unità se è uno spazio vettoriale normato
con norma || || che soddisfi la relazione
A6. ||a ◦ b|| ≤ ||a||||b|| per a, b ∈ A;
e, nel caso di algebra normata con unità, valga anche:
A7. ||I|| = 1;
algebra di Banach ovvero algebra di Banach con unità se A è spazio di Banach e
rispettivamente algebra normata, o algebra normata con unità rispetto alla stessa norma.
Un omomorfismo di algebre (con unità, normate, di Banach), φ : A → A0 è un omomorfismo rispetto alla struttura di spazio vettoriale (funzione lineare) che preserva il prodotto
delle algebre e l’unità se presente. φ è detto isomorfismo di algebre(con unità, normate,
di Banach) se è anche biettivo. Se esiste un isomorfismo φ : A → A0 , le algebre A e A0 (con
unità, normate, di Banach) sono dette isomorfe.
Osservazioni.
(1) Si dimostra immediatamente che l’unità, se esiste è unica.
(2) La nozione di norma non viene coinvolta nella definizione di omomorfismo e isomorfismo di
algebre con unità, normate, di Banach.
20
Notazione 2.2. Nel seguito, se ciò non darà luogo a fraintendimenti, indicheremo il prodotto
di due elementi di un’algebra semplicemente con ab invece che con a ◦ b.
Esempi 2.1.
(1) I campi C e R sono banalmente algebre commutative di Banach. In entrambi i casi la norma
è l’operazione di estrazione del valore assoluto o modulo.
(2) Se X è un insieme qualsiasi e K = C o R, indichiamo con L(X) l’insieme di tutte le funzioni
f : X → K limitate (cioè supx∈X |f (x)| < ∞). L(X) ha una struttura naturale di spazio vettoriale
su K rispetto alla solita operazione di composizione lineare di funzioni. Possiamo aggiungere
un prodotto che rende L(X) un’algebra: se f, g ∈ L(X), f g è definita come, punto per punto,
(f g)(x) := f (x)·g(x). Si osservi che l’algebra è commutativa e con unità (data dalla funzione che
vale sempre 1). Una norma che rende L(X) algebra di Banach commutativa è quella dell’estremo
superiore: ||f || := supx∈X |f (x)| [Rud82].
(3) Se sull’insieme X di sopra definiamo una σ-algebra, Σ, la sottoalgebra delle funzioni Σmisurabili, M (X, Σ) ⊂ L(X), è un insieme chiuso in L(X) rispetto alla topologia della norma
dell’estremo superiore. Quindi M (X, Σ) è a sua volta un algebra di Banach commutativa [Rud82].
(4) Se X è uno spazio topologico, lo spazio vettoriale delle funzioni continue a valori nel campo C si indica con C(X). Cb (X) ⊂ C(X) denota il sottospazio delle funzioni continue limitate,
Cc (X) ⊂ Cb (X) denota infine il sottospazio delle funzioni continue a supporto compatto. Nel
caso X sia compatto i tre spazi coincidono evidentemente. I tre spazi sono sicuramente algebre
commutative rispetto alle operazioni dette nell’esempio (2). C(X) e Cb (X) sono algebre con unità
data dalla funzione costante di valore 1, mentre non lo è Cc (X) quando X non è compatto. Rispetto alla norma dell’estremo superiore definita nell’esempio (2) Cb (X) è algebra di Banach. È
un risultato importante delle teorie delle algebre di Banach [Rud91] che ogni algebra di Banach
con unità e commutativa sul campo C è isomorfa ad un’algebra C(K) con K compatto. Se X
è uno spazio topologico di Hausdorff (cioè per ogni coppia di punti x, y ∈ X con x 6= y esistono
due aperti A, B tali che A 3 x, B 3 y e A ∩ B = ∅) che sia anche localmente compatto (cioè
per ogni punto p ∈ X c’è un aperto A ed un compatto K tali che p ∈ A ⊂ K), completando lo
spazio normato Cc (X) si ottiene un’algebra di Banach (senza unità) commutativa, tale algebra di
Banach si chiama l’algebra delle funzioni continue che tendono a zero all’infinito in X [Rud82].
Si tratta delle funzioni continue f : X → C, tali che, per ogni > 0 esiste un compatto K ⊂ X
(dipendente da f in generale) con |f (x)| < se x ∈ X \ K .
(5) Se X è spazio di Hausdorff compatto, consideriamo in C(X) una sottoalgebra A che soddisfi i
seguenti requisiti: contenga l’unità (data dalla funzione che vale ovunque 1) e sia chiusa rispetto
alla coniugazione complessa – se f ∈ A allora f ∗ ∈ A, dove f ∗ (x) := f (x) per ogni x ∈ X in cui
la barra indica la coniugazione complessa –. Diremo che A separa i punti di X, se per ogni coppia
x, y ∈ X con x 6= y esiste f ∈ A con f (x) 6= f (y). Il teorema di Stone-Weierstrass [Rud91],
21
prova quanto segue.
Teorema (di Stone-Weierstrass). Ogni sottoalgebra A ⊂ C(X), con X di Hausdorff compatto, che contenga l’unità, sia chiusa rispetto alla coniugazione complessa e separi i punti, è tale
che la sua chiusura rispetto alla norma dell’estremo superiore coincide con C(X) stessa.
Un esempio tipico è quello in cui X è un compatto di Rn e A è l’algebra dei polinomi complessi
ad n variabili (le coordinate di Rn ) ristretti ad A. Dal teorema di Stone-Weierstrass si ricava che
con i polinomi possiamo approssimare uniformemente ogni funzione complessa continua definita
su X. Tale risultato è utile nella teoria degli spazi di Hilbert per costruire basi hilbertiane.
(6) Se (X, Σ, µ) è uno spazio con misura positiva e 1 ≤ p < ∞ valgono le disuguaglianze di
Hölder e di Minkowski, rispettivamente:
Z
‹1/p Z
‹1/q
,
|f (x)g(x)|dµ(x) ≤
|f (x)|p dµ(x)
|g(x)|q dµ(x)
X
X
X
‹1/p
Z
‹1/p Z
Z
‹1/p
p
p
p
,
+
|g(x)| dµ(x)
≤
|f (x)| dµ(x)
|f (x) + g(x)| dµ(x)
Z
(2.2)
X
X
X
(2.1)
dove f, g : X → C sono funzioni misurabili e 1/p + 1/q = 1 [Rud82]. Se indichiamo con
Lp (X, µ) l’insieme contenente tutte le funzioni f : X → C che sono µ-misurabili e tali che
R
p
p
X |f (x)| dµ(x) < ∞, si prova facilmente che, in base alle disuguaglianze di sopra, L (X, µ) è
uno spazio vettoriale rispetto alle solite composizioni lineari di funzioni e che Pp definita sotto
è effettivamente una seminorma:
Z
‹1/p
Pp (f ) :=
|f (x)|p dµ(x)
(2.3)
X
Per ottenere una vera norma, cioè per avere che sia soddisfatta N3, bisogna fare in modo da
identificare con la funzione nulla ogni funzione che differisce da essa per un insieme di misura
nulla. Tali funzioni pur non essendo nulle annullano l’integrale di sopra violando N3 a Pp . A
tal fine si può definire la relazione di equivalenza su Lp (X, µ) data da f ∼ g se e solo se f − g
è nulla quasi ovunque rispetto a µ. Si indica con Lp (X, µ) lo spazio quoziente Lp (X, µ)/ ∼.
Questo spazio eredita naturalmente una struttura di spazio vettoriale su C da quella di Lp (X, µ)
semplicemente definendo [f ] + [g] := [f + g] e α[f ] := [αf ] (si verifica che le definizioni non
dipendono nei secondi membri dai rappresentanti scelti nelle classi di equivalenza usate a primo
membro).
Si riesce a provare ([Rud82], teorema 3.11) che Lp (X, µ) è spazio di Banach rispetto alla norma
||[f ]||p :=
Z
p
|f (x)| dµ(x)
‹1/p
(2.4)
X
dove f è un rappresentante arbitrario di [f ] ∈ Lp (X, µ). Lo spazio di Banach ottenuto non è
algebra rispetto al prodotto puntuale dato che il prodotto puntuale di funzioni di Lp (X, µ) non
è, in generale elemento dello stesso spazio.
22
N.B. Nella letteratura corrente prevale l’uso del simbolo f per denotare la classe di equivalenza
[f ] ∈ L2 (X, µ). Noi seguiremo tale uso nelle situazioni in cui ciò non produrrà confusione.
(7) In riferimento all’esempio (6), consideriamo il caso particolare in cui X è un insieme non
necessariamente numerabile, Σ è l’insieme delle parti di X e µ è la misura che conta i punti:
se S ⊂ X, µ(S) = numero di elementi di S e µ(S) = ∞ se S contiene infiniti punti. In questo
caso lo spazio Lp (X, µ) si indica semplicemente con lp (X). I suoi elementi sono le “successioni”
{zx }x∈X di complessi etichettati su X, tali che:
X
|zx |p < ∞ ,
x∈X
dove la somma è definita come:

 X


sup
|zx |p X0 ⊂ X, X0 finito .


x∈X0
Si osservi che, nel caso X sia numerabile, X = N o Z in particolare, la definizione data sopra di
somma di un insieme di numeri positivi etichettati su X si riduce a quella solita di somma di una
serie (vedi definizione 3.4 e proposizione 3.2 nel capitolo 3).
(8) Se (X, Σ, µ) è uno spazio con misura positiva e f : X → C una funzione misurabile definiamo
Sf := {r ∈ R | µ(|f |−1 (r, +∞)) = 0}. Le funzioni misurabili f : X → C per cui Sf 6= ∅
costituiscono un’algebra commutativa con unità con le solite operazioni definite negli esempi di
sopra per gli spazi di funzioni. È possibile definire una norma su tale algebra rispetto alla quale si
abbia un’algebra di Banach (vedi [Rud82], teorema 3.11 per la dimostrazione della completezza):
||f || := ess supf dove l’estremo superiore essenziale di f , ess supf , è definito come inf Sf ossia
n
ess supf := inf r ∈ R µ(|f |−1 (r, +∞)) = 0
o
.
(2.5)
L’algebra di Banach che si ottiene si indica con L∞ (X, µ) e si chiama l’algebra delle funzioni
essenzialmente limitate.
(9) In riferimento all’esempio (8), nel caso particolare in cui Σ è l’insieme delle parti di X e
µ è la misura che conta i punti, lo spazio L∞ (X, µ) si indica semplicemente con l∞ (X). I suoi
elementi sono le “successioni” di complessi etichettati su X {zx }x∈X tali che supx∈X |zx | < +∞.
(Per cui, in riferimento alla notazione usata nell’esempio (2), l∞ (X) = L(X).)
2.2
Operatori, spazi di operatori, norme di operatori.
Definizione 2.5. Siano X e Y spazi vettoriali sullo stesso campo K := R o C.
(a) T : X → Y è detto operatore lineare (o semplicemente operatore) da X in Y se è
23
lineare. L(X, Y) denota l’insieme degli operatori lineari da X in Y. Quando X e Y sono normati, B(X, Y) ⊂ L(X, Y) denota il sottoinsieme degli operatori lineari continui. In particolare
L(X) := L(X, X) e B(X) := B(X, X).
(b) T : X → K è detto funzionale lineare (o semplicemente funzionale) su X se è lineare.
(c) Lo spazio X∗ := L(X, K) è detto duale algebrico di X mentre, se K è inteso come uno
spazio normato rispetto alla norma indotta dal valore assoluto, X0 := B(X, K) è detto duale
topologico (o semplicemente duale) di X.
Al solito se T, T 0 ∈ L(X, Y) e α, β ∈ K, la combinazione lineare αT + βT 0 è definita come l’applicazione (αT + βT 0 ) : u 7→ α(T u) + β(T 0 u) per ogni u ∈ X ed è quindi ancora un elemento di
L(X, Y). Dato che come è facile provare vale anche che ogni combinazione lineare di operatori
continui è un operatore continuo concludiamo che L(X, Y), L(X) e X∗ e B(X, Y), B(X) e X0 , sono
tutti spazi vettoriali su K.
Introduciamo il concetto di operatore e funzionale limitato.
Teorema 2.1. Siano (X, || ||X ), (Y, || ||Y ) spazi normati sullo stesso campo K = C o R. Si
consideri T ∈ L(X, Y).
(a) Le seguenti due condizioni sono equivalenti
(i) esiste K ∈ R tale che ||T u||Y ≤ K||u||X per ogni u ∈ X;
u||Y
(ii) esiste supu∈X\{0} ||T
||u||X < +∞.
(b) Se vale la condizione (i) allora
¨
«
||T u||Y sup
u ∈ X \ {0} = inf {K ∈ R | ||T u||Y ≤ K||u||X per ogni u ∈ X} .
||u||X Prova. (a) Se vale (i), per costruzione supu∈X\{0}
A :=
u||Y
supu∈X\{0} ||T
||u||X ,
||T u||Y
||u||X
≤ K < +∞. Se vale (ii) posto
K := A soddisfa (i).
(b) Detto I l’estremo inferiore dell’insieme dei K che soddisfano (i), valendo supu∈X\{0}
K deve essere
u||Y
supu∈X\{0} ||T
||u||X
||T u||Y
||u||X
≤
≤ I. Supponiamo per assurdo che valga la disuguaglianza stret-
u||Y
ta. Sia allora J un punto con supu∈X\{0} ||T
||u||X < J e J < I. Dalla prima condizione segue che
||T u||Y < J||u||X per ogni u 6= 0 e quindi ||T u||Y ≤ J||u||X per ogni u ∈ X, ma allora J soddisfa
la condizione (i) e ciò contraddice J < I. 2
Nel seguito ometteremo gli indici nelle norme per denotare gli spazi su cui sono definite se ciò
sarà ovvio dal contesto.
Definizione 2.6. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) è detto
limitato se vale una delle due condizioni equivalenti dette in (a) nell’enunciato del teorema 2.1.
24
In tal caso il numero
||T u||
.
||u||6=0 ||u||
||T || := sup
(2.6)
è detto norma (operatoriale) di T .
Nota.
Dalla definizione di ||T || si ha subito che se T : X → Y è limitato vale l’utile proprietà:
||T u|| ≤ ||T || ||u|| ,
per ogni u ∈ X .
(2.7)
La norma operatoriale può essere calcolata anche in altri modi talvolta utili nelle dimostrazioni.
Vale la seguente proposizione in proposito.
Proposizione 2.1. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) è limitato
se e solo se esiste ed è finito uno dei secondi membri delle tre identità di sotto ed in tal caso tali
identità sono verificate.
||T || = sup ||T u|| ,
(2.8)
||u||=1
ovvero
||T || = sup ||T u|| ,
(2.9)
||u||≤1
ovvero
||T || = inf {K ∈ R | ||T u|| ≤ K||u|| per ogni u ∈ X} .
(2.10)
Prova. Il fatto che T sia limitato se e solo se il secondo membro di (2.8) esista e sia finito e la
stessa identità (2.8) seguono facilmente dalla linearità di T e dalla proprietà N1 delle norme.
Il fatto che T sia limitato se e solo se il secondo membro di (2.9) esista e sia finito e la stessa
identità (2.9) seguono facilmente dal seguente ragionamento. Dato che l’insieme degli u con
||u|| ≤ 1 include l’insieme degli u con ||u|| = 1, vale sup||u||≤1 ||T u|| ≥ sup||u||=1 ||T u||. D’altra
parte, se ||u|| ≤ 1, vale ||T u|| ≤ ||T v|| per qualche v con ||v|| = 1 (qualunque v suddetto se u = 0
e v = u/||u|| altrimenti). Quindi vale anche sup||u||≤1 ||T u|| ≤ sup||u||=1 ||T u||, da cui si ottiene
sup||u||≤1 ||T u|| = sup||u||=1 ||T u|| che dimostra quanto volevamo.
Il fatto che T sia limitato se e solo se il secondo membro di (2.10) esista e sia finito e la stessa
identità (2.10) seguono facilmente da (b) del teorema 2.1 2
Il legame tra continuità e limitatezza è dato dal seguente teorema che prova, tra l’altro, che gli
operatori limitati sono tutti e soli quelli continui.
25
Teorema 2.2. Sia T ∈ L(X, Y) con X, Y spazi normati sul medesimo campo. I seguenti fatti
sono equivalenti:
(i) T è continuo in 0;
(ii) T è continuo;
(iii) T è limitato.
Prova. (i) ⇔ (ii). La continuità implica banalmente la continuità in 0. Mostriamo che la continuità in 0 implica la continuità. Valendo (T u) − (T v) = T (u − v) si ha che (limu→v T u) − T v =
limu→v (T u − T v) = lim(u−v)→0 T (u − v) = 0 per la continuità in 0.
(i) ⇒ (iii). Dalla continuità in 0, esiste δ > 0 tale che, se ||u|| < δ allora ||T u|| < 1. Scelto δ 0 > 0
con δ 0 < δ, se v ∈ X \ {0}, u = δ 0 v/||v|| ha norma inferiore a δ per cui ||T u|| < 1, che in termini
di v si scrive ||T v|| < (1/δ 0 )||v||. Vale allora la condizione (a) del teorema 2.1 con K = 1/δ 0 e
pertanto, per la definizione 4.2 T è limitato.
(iii) ⇒ (i). Si tratta di un fatto ovvio. Se T è limitato allora ||T u|| ≤ ||T ||||u|| da cui la continuità in 0. 2.
Il nome “norma” per ||T || non è casuale; in effetti la norma di operatori rende a tutti gli effetti
B(X, Y), e quindi in particolare B(X) e X0 , uno spazio normato come proveremo tra poco. Più
precisamente, vedremo che B(X, Y) è uno spazio di Banach se Y è di Banach e quindi, in particolare, X0 è sempre spazio di Banach.
Il teorema che segue riguarda anche un altro importante fatto in relazione alla struttura di
algebra. Cominciamo con l’osservare che la composizione di operatori di L(X), rispettivamente
B(X), produce operatori nello stesso spazio (in particolare perché la composizione di funzioni
continue produce funzioni continue). Ulteriormente, è immediato provare che lo spazio vettoriale
L(X), rispettivamente B(X), soddisfa gli assiomi A1, A2 e A3 della definizione di algebra quando il prodotto dell’algebra è definito come la composizione di operatori. In questo modo risulta
chiaro che L(X) e B(X) possiedono una struttura naturale di algebra con unità, quest’ultima
data dalla funzione identità I : X → X, inoltre B(X) risulta essere una sottoalgebra di L(X).
Nell’ultima parte del teorema seguente si rafforza ulteriormente il risultato, provando che B(X) è
sempre un’algebra normata con unità rispetto alla norma operatoriale ed è ulteriormente algebra
di Banach se X è uno spazio di Banach.
Teorema 2.3. Siano X, Y spazi normati sullo stesso campo.
(a) L’applicazione || || : T 7→ ||T ||, dove ||T || è definita da (2.6) per T ∈ B(X, Y), è una norma
su B(X, Y) e rende B(X, Y) spazio normato.
(b) Sull’algebra con unità B(X) valgono le ulteriori relazioni che la rendono algebra normata
con unità:
(i) ||T S|| ≤ ||T ||||S|| e T, S ∈ B(X),
(ii) ||I|| = 1.
(c) Se Y è completo B(X, Y) è uno spazio di Banach.
In particolare:
(i) se X è uno spazio di Banach, B(X) è un’algebra di Banach;
26
(ii) X0 è sempre uno spazio di Banach rispetto alla norma dei funzionali, anche se X non è
completo.
Prova. (a) è diretta conseguenza della definizione di norma di un operatore: le proprietà definitorie della norma N1, N2, N3 per la norma operatoriale possono essere immediatamente
verificate usando le stesse proprietà N1, N2, N3 per la norma dello spazio Y, la formula (2.8)
per la norma operatoriale e la definizione di estremo superiore.
(b) Il punto (i) è immediata conseguenza della (2.7) e della (2.8). (ii) è di immediata verifica
usando l’espressione per la norma operatoriale (2.8).
Passiamo a provare la parte (c). Proviamo che se Y è completo allora B(X, Y) è uno spazio di
Banach. Sia {Tn } ⊂ B(X, Y) una successione di Cauchy rispetto alla norma operatoriale. Da
(2.7) segue che
||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| ,
il fatto che {Tn } sia di Cauchy implica che sia di Cauchy la successione dei vettori Tn u. Essendo
Y completo, per ogni fissato u ∈ X esisterà un vettore di Y:
T u := lim Tn u .
n→∞
X 3 u 7→ T u è un operatore lineare essendo tali tutti gli operatori Tn . Mostriamo, per concludere,
che T ∈ B(X, Y) e che ||T − Tn || → 0 per n → ∞.
Essendo {Tn } una successione di Cauchy, se > 0, varrà ||Tn −Tm || ≤ per n, m sufficientemente
grandi e quindi anche ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| ≤ ||u||. Allora:
||T u − Tm u|| = || lim Tn u − Tm u|| = lim ||Tn u − Tm u|| ≤ ||u||
n→+∞
n→+∞
se m è grande a sufficienza. Dalla stima ottenuta, essendo ||T u|| ≤ ||T u − Tm u|| + ||Tm u|| ed
usando (2.7), segue ancora che
||T u|| ≤ ( + ||Tm ||)||u|| .
Ciò dimostra che T è limitato e quindi T ∈ B(X, Y) per il teorema 2.2. Valendo, come provato
sopra, ||T u−Tm u|| ≤ ||u|| si ha anche che ||T −Tm || ≤ dove può essere scelto arbitrariamente
piccolo pur di scegliere m grande a sufficienza. In altre parole ||T − Tn || → 0 se n → ∞.
La prova dei sottocasi (i) e (ii) è immediata. (i) segue dal fatto che B(X) = B(X, X) e (ii) segue dal fatto che X0 := B(X, K) ed il campo di X, K = C o R è completo come spazio normato. 2
Esempi 2.2
(1) Una misura complessa su X [Rud82] è un’applicazione µ : Σ → C, che associa un numero
complesso ad ogni insieme misurabile di una σ-algebra Σ su X, in modo tale che: (i) µ(∅) = 0 e
P
(ii) µ(∪n∈N En ) = +∞
n=0 µ(En ) indipendentemente dall’ordine di somma (questo è equivalente a
dire che la convergenza deve valere in valore assoluto), per ogni classe numerabile, {En }n∈N , di
insiemi misurabili di Σ disgiunti a due a due. La misura positiva |µ|, detta variazione totale di
µ, è definita come segue: se E è insieme di Σ,
(
|µ|(E) := sup
X
i
)
|µ(Ei )| {Ei } partizione di E di insiemi di Σ.
27
La variazione totale di una misura complessa soddisfa sempre |µ|(X) < +∞ per definizione di
misura complessa ed è quindi, una misura finita. (N.B. Quando µ è una misura positiva, l’applicazione diretta della definizione di sopra produce µ = |µ|, ma in questo caso la finitezza di
|µ|(X) non è assicurata e vale se e solo se µ è finita; le misure con segno si intendono qui un
sottocaso di quelle complesse). Dal Teorema di Radon-Nikodym segue in particolare il seguente
risultati [Rud82].
Teorema (di caratterizzazione delle misure complesse). Per ogni misura complessa µ sullo spazio misurabile X esiste, ed è unica a meno di ridefinizione su insiemi di misura nulla,
una
R
funzione misurabile h : X → C con |h| = 1 su X, che sia in L1 (X, |µ|) e tale che µ(E) = E h d|µ|.
Se f ∈ L1 (X, |µ|) si definisce pertanto X f dµ := X f h d|µ|.
Consideriamo X spazio topologico di Hausdorff localmente compatto dotato di una misura complessa µ, definita sulla σ-algebra di Borel di X. Sappiamo che l’algebra normata Cc (X) ha come
completamento nella norma dell’estremo superiore l’algebra di Banach C0 (X) delle funzioni che
si annullano all’infinito ((4) in esempi 2.1). Nelle ipotesi fatte definiamo ||µ|| := |µ|(X). È chiaro
che, se f ∈ C0 (X),
Z
R
R
X
f dµ ≤ ||µ||||f ||∞ ,
dove ||f ||∞ = supx∈X |f (x)| . Da tale fatto segue subito che ogni misura complessa di Borel
definisce un elemento del duale (topologico) di C0 (X). Il teorema di Riesz per misure complesse
[Rud82] prova che questo è in realtà il caso generale, precisando anche qualcosa in più. Per
enunciare il teorema di Riesz, ricordiamo che, se µ è una misura di Borel positiva sullo spazio
di Hausdorff localmente compatto X, µ è detta regolare se, per ogni boreliano E, µ(E) coincide con (i) l’estremo superiore dell’insieme dei numeri µ(K) dove K ⊂ E è compatto, e (ii)
con l’estremo inferiore dell’insieme dei numeri µ(V ) dove V ⊃ E è aperto. Una misura di Borel
complessa, µ, è detta regolare se è tale la misura di Borel positiva finita data dalla sua variazione
totale |µ|. Il teorema di Riesz per misure di Borel afferma quanto segue.
Teorema (di Riesz per misure complesse regolari). Sia X uno spazio topologico di Hausdorff localmente compatto, se Λ : C0 (X) → C è un funzionale lineare continuo, allora esiste
un’unica misura di Borel complessa regolare µΛ tale che, per ogni f ∈ C0 (X):
Z
Λ(f ) =
f dµΛ .
X
Vale inoltre ||Λ|| = ||µΛ ||.
Si osservi che, dato che Cc (X) è denso in C0 (X), un funzionale continuo sul primo spazio ne individua univocamente uno sul secondo, per cui il teorema caratterizza anche i funzionali continui
rispetto alla norma dell’estremo superiore su Cc (X).
Si osservi ancora che, se X è tale che ogni aperto sia unione numerabile di compatti, la parola regolare si può omettere nell’enunciato del teorema. Risulta infatti che (teorema 2.18 in [Rud82]),
se ν è una misura di Borel positiva sullo spazio di Hausdorff localmente compatto X in cui
28
ogni aperto è unione numerabile di compatti1 e i compatti hanno misura finita (come nel caso
in esame, essendo la misura |µ| finita), allora ν è regolare. In particolare vale il seguente teorema.
Teorema (di Riesz per misure complesse su Rn ). Se K ⊂ Rn oppure K ⊂ C è un compatto
(rispetto alla topologia standard di Rn oppure C) e Λ : C0 (K) → C è un funzionale lineare
continuo, allora esiste un’unica misura di Borel complessa µΛ tale che, per ogni f ∈ C0 (K):
Z
Λ(f ) =
f dµΛ .
X
(2) In riferimento all’esempio (6) in esempi 2.1, se 1 ≤ p < +∞ e 1/p + 1/q = 1, il duale di Lp (X,
µ) risulta essere Lq (X, µ) nel senso che l’applicazione Lq (X, µ) 3 [g] 7→ Λg dove
R
Λg (f ) := X f g dµ, è un isomorfismo di spazi normati da Lq (X, µ) a (Lp (X, µ))0 . Analogamente
il duale di L1 (X, µ) si identifica con L∞ (X, µ).
Esercizi 2.1.
(1) Provare che ogni seminorma p soddisfa p(x) = p(−x).
(2) Si dimostri che in uno spazio normato (X, N ) ogni successione convergente è successione di
Cauchy.
Soluzione. Sia {xn }n∈N ⊂ X convergente a x nella topologia indotta dalla norma N . Valendo
N (xn − xm ) = N (xn − x + x − xm ) ≤ N (xn − x) + N (x − xm ) per la disuguaglianza triangolare, si
ha che per ogni > 0 esiste M > 0 per cui se n, m > M , N (xn − x) < /2 e N (xm − x) < /2.
Quindi per ogni > 0 esiste M > 0 per cui se n, m > N , N (xn − xm ) < e la successione è di
Cauchy.
(3) Si consideri una coppia di spazi normati X, Y, con Y spazio di Banach, e un sottospazio
S ⊂ X la cui chiusura rispetto alla norma di X coincida con tutto X (in altre parole S è denso
in X). Sia poi T : S → Y un operatore lineare limitato su S. Si dimostri che esiste un’unica
estensione limitata di T , T 0 : X → Y.
Soluzione. Se x ∈ X ci sarà una successione {xn } di elementi di S che converge a x. Vale
||T xn − T xm || ≤ K||xn − xm || con K < +∞ per ipotesi. Dato che xn → x, la successione degli
xn è di Cauchy e quindi lo è anche quella dei vettori T xn . Dato che Y è completo, esiste dunque
T 0 x := limn→∞ T xn ∈ Y. Tale limite dipende solo da x e non dalla successione in S usata per
approssimarlo: se S 3 zn → x allora per la continuità delle norme
|| lim T xn − lim T zn || = lim ||T xn − T zn || ≤ lim K||xn − zn || = K||x − x|| = 0 .
n→+∞
n→+∞
n→+∞
n→+∞
Ovviamente T 0 S = T , cioè T 0 è un’estensione di T e questo si prova scegliendo per ogni x ∈ S
la successione costante di termini xn := x che tende a x banalmente. Le proprietà di linearità di
T 0 sono di verifica immediata dalla stessa definizione. Infine prendendo il limite a n → +∞ ad
ambo membri di ||T xn || ≤ K||xn || si ricava che ||T 0 x|| ≤ K||x|| per cui T 0 è limitato. Veniamo
alla prova dell’unicità. Se U è un’altra estensione limitata di T su X allora, per ogni x ∈ X,
1
Ciò accade in Rn in cui gli aperti sono unione numerabile di palle chiuse di raggio non nullo.
29
per continuità T 0 x − U x = limn→+∞ (T 0 xn − U xn ) dove gli xn appartengono a S (denso in X).
Essendo T 0 S = T = U S il limite è banale e fornisce T 0 x = U x per ogni x ∈ X ossia T 0 = U .
(4) In riferimento all’esercizio precedente, si provi che l’unica estensione limitata T 0 di T soddisfa
anche ||T 0 || = ||T ||.
Soluzione. Se x ∈ X e {xn } ⊂ S converge a x:
||T 0 x|| = lim ||T xn || ≤ lim ||T ||||xn || = ||T ||||x|| ,
n→+∞
n→+∞
per cui ||T 0 || ≤ ||T ||. Ma essendo anche S ⊂ X e T 0 S = T ,
¨
«
¨
«
¨
||T 0 x|| ||T 0 x|| ||T x||
0
||T || = sup
0 6= x ∈ X ≥ sup
0 6= x ∈ S = sup
||x|| ||x|| ||x||
«
0 6= x ∈ S .
L’ultimo termine nella catena di identità scritta sopra è ||T ||. Quindi ||T 0 || ≥ ||T ||. Allora
||T 0 || = ||T ||.
(5)* Se definiamo un isomorfismo di spazi normati come un’applicazione lineare continua con
inversa continua, la proprietà di completezza di uno spazio normato è invariante sotto isomorfismi?
Suggerimento. Se non si arriva ad una conclusione si legga il paragrafo 2.5 generalizzando la
proposizione 2.6 al caso di due spazi normati connessi da un’applicazione lineare continua con
inversa continua.
2.3
I teoremi fondamentali negli spazi di Banach e le topologie
deboli.
In questa sezione dimostreremo i teoremi fondamentali della teoria degli spazi normati e di
Banach nella versione più elementare possibile e ne esaminiamo le più importanti conseguenze generali: il teorema di Hahn-Banach, quello di Banach-Steinhaus e quello dell’applicazione
aperta, studiandone anche qualche immediata conseguenza importante.
Le applicazioni del secondo teorema, quello di Banach-Steinhaus, forniscono l’occasione per
introdurre diverse topologie negli spazi di operatori. Tali topologie rivestono un ruolo importantissimo in Meccanica Quantistica quando lo spazio di Banach di partenza è lo spazio di Hilbert
della teoria, l’algebra di operatori limitati di interesse è costituita da (alcune) osservabili della
teoria, mentre le proprietà elementari del sistema quantistico associate ai processi di misura sono
una sottoclasse della classe degli operatori di proiezione ortogonale. Per passare con continuità
dall’algebra delle osservabili a quella dei proiettori sono necessarie topologie più deboli rispetto
a quella standard. Questo genere di problematiche che discuteremo più oltre hanno portato alla
nozione di algebra (di operatori) di Von Neumann.
2.3.1
Il teorema di Hahn-Banach e le sue conseguenze elementari.
Il primo teorema è il famosissimo teorema di Hahn-Banach che si occupa del problema dell’estensione di un funzionale lineare continuo, da un sottospazio dello spazio ambiente ad un funzionale
30
continuo, definito tutto lo spazio e che conservi la norma iniziale. Esistono in realtà versioni molto più elaborate e potenti di tale teorema che si possono trovare, per esempio, in [Rud91]. Noi
ci limiteremo qui alla situazione più elementare possibile.
Per enunciare il teorema, notiamo che se X è uno spazio normato e M ⊂ X un suo sottospazio (rispetto alla sola struttura di spazio vettoriale di X), la restrizione della norma di X a M definisce
su M una struttura di spazio normato. In questo senso si può parlare di operatori o funzionali
definiti su M e continui (ossia limitati rispetto alla struttura di spazio normato indotta da quella
di X).
Teorema di Hahn-Banach (per spazi normati). Sia M un sottospazio (non necessariamente
chiuso) di uno spazio normato X con campo K = C o R e sia g : M → K un funzionale lineare
continuo. Esiste un funzionale lineare f : X → K continuo tale che f M = g e ||f ||X = ||g||M .
Prova. Seguiremo essenzialmente la dimostrazione data nel Cap.5 di [Rud82]. Partiamo dal
caso in cui K = R. Se g = 0, un’estensione che soddisfa la tesi è f = 0. Supponiamo dunque
che g 6= 0 e, senza perdere generalità , assumiamo anche che ||g|| = 1. Costruiamo l’estensione
f come segue. Sia x0 ∈ X \ M e sia M1 := {x + λx0 | x ∈ M , λ ∈ R}, il sottospazio di X generato
da M e x0 . Se, per ν ∈ R fissato, definiamo g1 : M1 → R come
g1 (x + λx0 ) = g(x) + λν ,
abbiamo un’estensione di g a M1 . Proviamo che si può sempre scegliere ν in modo tale che
||g1 || = 1. A tal fine è sufficiente che ν sia scelto in modo che valga:
|g(x) + λν| ≤ ||x + λx0 || ,
per ogni x ∈ M e λ ∈ R \ {0}.
(2.11)
Sostituiamo −λx a x e dividiamo i due membri di (2.11) per |λ|, ottenendo la condizione
equivalente alla (2.11):
|g(x) − ν| ≤ ||x − x0 || ,
per ogni x ∈ M.
(2.12)
e bx := g(x) + ||x − x0 ||.
(2.13)
Poniamo quindi:
ax := g(x) − ||x − x0 || ,
La (2.12), e quindi ||g1 || = 1, vale se ν si fissa in modo tale da soddisfare ax ≤ ν ≤ bx per ogni
x ∈ M. È sufficiente dunque provare che chi intervalli [ax , bx ], con x ∈ M, hanno un punto in
comune, cosa che è equivalente a dimostrare che per ogni x, y ∈ M, vale
ax ≤ by .
(2.14)
D’altra parte:
g(x) − g(y) = g(x − y) ≤ ||x − y|| ≤ ||x − x0 || + ||y − x0 ||
e la (2.14) è conseguenza della (2.13). Abbiamo ottenuto che si può fissare ν in modo tale che
||g1 || = 1 come volevamo.
31
Consideriamo ora la famiglia P di tutte le coppie (M0 , g 0 ) tali che M0 ⊃ M sia un sottospazio di
X e g 0 : M0 → R sia lineare, estenda g e valga ||g 0 || = 1. Sappiamo che P non è vuoto dato che
contiene almeno (M1 , g1 ). Possiamo ordinare parzialmente P (vedi l’Appendice A anche per il
seguito) definendo (M0 , g 0 ) ≤ (M00 , g 00 ) quando M00 ⊃ M0 e g 00 estende g 0 e ||g 0 || = ||g 00 || = 1. Si
dimostra facilmente che ogni sottoinsieme totalmente ordinato di P ammette un maggiorante
in P. Il lemma di Zorn implica allora che esiste un elemento massimale in P che denoteremo
con (M1 , f 1 ). Si osservi ora che deve essere necessariamente M1 = X, altrimenti esisterebbe
x0 ∈ X \ M1 e, con la procedura vista all’inizio, potremmo costruire un’estensione propria di f 1
al sottospazio generato da x0 e M1 che rispetti la richiesta sulla norma, in contraddizione con la
massimalità di (M1 , f 1 ). Concludiamo che f := f 1 è l’estensione cercata nella tesi.
Passiamo infine al caso K = C. Se u : M → R è la parte reale di g, cioè u(x) = Reg(x) per ogni
x ∈ M, deve essere g(x) = u(x)−iu(ix) e anche ||g|| = ||u||, come si prova facilmente. Sappiamo,
dal caso precedente, che esiste un’estensione lineare U : X → R di u con ||U || = ||u|| = ||g||. Ma
allora, se definiamo l’applicazione lineare f : X → C come:
f (x) := U (x) − iU (ix) ,
per ogni x ∈ X,
abbiamo che f estende g a tutto X e soddisfa ||f || = ||U || = ||g|| come richiesto nella tesi. 2
Una delle più utili conseguenze del teorema di Hahn-Banach è il seguente corollario. Ricordiamo
che, se X è uno spazio normato, X0 indica il suo duale topologico B(X, C).
Corollario 1. Sia X spazio normato e x0 ∈ X con x0 6= 0. Esiste f ∈ X0 con ||f || = 1 tale che
f (x0 ) = ||x0 ||.
Prova. Si scelga M := {λx0 | λ ∈ K} e g : λx0 → λ||x0 ||. Sia f ∈ X0 il funzionale limitato
che estende g secondo il teorema di Hahn-Banach. Per costruzione f (x0 ) = g(x0 ) = ||x0 || e
||f ||X = ||g||M = 1.2
Un altro risultato, che ha importanti conseguenze nella teoria delle algebre di Banach, è il seguente.
Corollario 2. Sia X spazio normato non banale. Gli elementi di X0 sono separanti per X. Cioè,
se x1 6= x2 sono punti di X (ed esistono tali punti se X non è lo spazio vettoriale banale {0})
allora c’è almeno un funzionale f ∈ X0 per cui f (x1 ) 6= f (x2 ).
Prova. Basta scegliere nel corollario 1 x0 := x1 − x2 ottenendo f (x1 ) − f (x2 ) = f (x1 − x2 ) =
||x1 − x2 || =
6 0. 2
Se x ∈ X e f ∈ X0 con ||f || = 1, allora |f (x)| ≤ 1||x|| per cui
sup{|f (x)| | f ∈ X0 , ||f || = 1} ≤ ||x|| .
32
Il corollario 1 consente di rafforzare il risultato provando immediatamente che
sup{|f (x)| | f ∈ X0 , ||f || = 1} = max{|f (x)| | f ∈ X0 , ||f || = 1} = ||x|| .
Questo fatto apparentemente non molto profondo ha invece una certa rilevanza in una questione
importante che nasce nella teoria degli spazi normati infinito-dimensionali, quando la si confronta con quella nel caso finito dimensionale.
È noto, dalla teoria elementare degli spazi vettoriali, che lo spazio (X∗ )∗ , duale algebrico del
duale algebrico di uno spazio vettoriale di dimensione finita, ha la notevole proprietà di essere
naturalmente isomorfo a X stesso. L’isomorfismo è dato dalla applicazione lineare che associa
ad x ∈ X il funzionale lineare su X∗ , I(x), definito da (I(x))(f ) := f (x) per ogni f ∈ X∗ .
Nel caso infinito dimensionale I identifica X con un sottospazio di (X∗ )∗ , ma non, in generale con
tutto (X∗ )∗ . C’è qualche proposizione generale a riguardo che vale lavorando con spazi normati
infinito dimensionali considerando però i duali in senso topologico?
Si noti che (X0 )0 è il duale topologico di uno spazio normato (X0 , la cui norma è quella operatoriale). Di conseguenza (X0 )0 è uno spazio normato a sua volta, la norma essendo ancora una
volta quella operatoriale.
Consideriamo ancora la trasformazione lineare naturale I : X → (X0 )∗ che associa a x ∈ X
l’elemento I(x) ∈ (X0 )∗ , cioè la funzione lineare I(x) : X0 → K, definita come
(I(x))(f ) := f (x) per ogni f ∈ X0 e x ∈ X .
(2.15)
(È chiaro per costruzione che I(x) è un funzionale lineare su X0 per cui effettivamente I(x) ∈
(X0 )∗ ). Il fatto che
sup{|f (x)| | f ∈ X0 , ||f || = 1} = ||x||
ha due implicazioni immediate: (1) I(x) è un funzionale limitato, per cui appartiene a (X0 )0 e
(2) ||I(x)|| = ||x||. Per cui la trasformazione lineare I : X → (X0 )0 è un’isometria e quindi in
particolare è iniettiva. In definitiva si ha l’inclusione isometrica X ⊂ (X0 )0 data dall’isometria
I : X → (X0 )0 . Abbiamo provato il seguente corollario.
Corollario 3. La trasformazione lineare I : X → (X0 )0 definita da (I(x))(f ) := f (x) per ogni
x ∈ X e f ∈ X0 è un’isometria. In tal modo X si identifica isometricamente con un sottospazio
di (X0 )0 .
Si possono trovare esempi, nel caso infinito dimensionale, in cui X non ricopre tutto (X0 )0 . Ciò
porta a dare la seguente definizione.
Definizione 2.7. Uno spazio normato X è detto riflessivo se l’isometria I : X → (X0 )0 , che
associa x ∈ X con I(x) secondo la (2.15), è suriettiva (cioè è un isomorfismo di spazi normati).
In altre parole X è riflessivo quando X e (X0 )0 sono isometricamente isomorfi tramite la trasformazione naturale I. Vedremo nella prossima sezione che se X è uno spazio di Hilbert la riflessività
è assicurata. Gli spazi di Banach Lp (X, µ) introdotti negli esempi 2.1 sono riflessivi se 1 < p < ∞.
33
2.3.2
Il teorema di Banach-Steinhaus e topologie operatoriali.
Passiamo al teorema di Banach-Steinhaus nella formulazione più elementare ed alle sue conseguenze immediate.
Teorema di Banach-Steinhaus. Sia {Tα }α∈A una famiglia di operatori in B(X, Y) dove X è
uno spazio di Banach e Y uno spazio normato. Se, per ogni x ∈ X
sup ||Tα x|| < +∞ ,
α∈A
allora esiste K ≥ 0 tale che
||Tα || ≤ K per ogni α ∈ A .
Prova. Per dimostrare il teorema possiamo evidentemente restringerci al caso di una famiglia numerabile {Tn }α∈N . La dimostrazione si ottiene dimostrando che esiste una palla aperta
Bρ (z) ⊂ X, di raggio ρ > 0 e centro z ∈ X, su cui {Tn }n∈N è uniformemente limitata in x e n,
cioè, esiste M ≥ 0 per il quale ||Tn (x)|| ≤ M per ogni n ∈ N e ogni x ∈ Bρ (z). Infatti, in tal
caso si avrebbe, per ogni x ∈ Bρ (0):
||Tn (x)|| ≤ ||Tn (x + z)|| + ||Tn (z)|| ≤ 2M ,
per ogni n ∈ N ,
dove abbiamo usato la decomposizione x = (x + z) − z. Pertanto avremmo che ||Tn || ≤ 2M/ρ
per ogni n ∈ N, dimostrando la tesi.
Proviamo, per assurdo, che Bρ (z) suddetta esiste davvero. Assumiamo che non esista alcuna
Bρ (z) con le proprietà suddette. Allora, per una palla aperta Br0 (x0 ) fissata arbitrariamente,
deve esistere x1 ∈ Br0 (x0 ) per cui ||Tn1 (x1 )|| > 1, per qualche n1 ∈ N. Dato che Tn1 è continuo,
possiamo trovare una seconda palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ Br0 (x0 ) e con 0 < r1 < r0
tale che ||Tn1 (x)|| ≥ 1 se x ∈ Bn1 (x1 ). Questa procedura può essere iterata all’infinito in modo
da ottenere una successione di palle aperte in X, {Brk (xk )}k∈N , che soddisfano:
(i) Brk (xk ) ⊃ Brk+1 (xk+1 ),
(ii) rk → 0 per k → +∞,
(iii) per ogni k ∈ N c’è un nk ∈ N tale che ||Tnk (x)|| ≥ k se x ∈ Bnk (xk ).
Si verifica subito, che (i) e (ii) implicano che la successione {xk }k∈N deve essere di Cauchy.
Per la completezza di X, esiste y ∈ ∩k∈N Bnk (xk ); d’altra parte, la condizione (iii) implica che ||Tnk (y)|| ≥ k per ogni k ∈ N contraddicendo l’ipotesi che, per ogni x ∈ X, vale
supn∈N ||Tn x|| < +∞. Abbiamo ottenuto un assurdo che conclude la dimostrazione. 2
Un immediato ed utile corollario del teorema di Banach-Steinhaus è il seguente.
Corollario 1. Nelle stesse ipotesi del teorema di Banach-Steinhaus la famiglia di operatori
{Tα }α∈A è equicontinua ossia, per ogni > 0 esiste δ > 0 tale che, per ogni coppia x, x0 ∈ X,
se ||x − x0 ||X < δ allora ||Tα x − Tα x0 || < per ogni α ∈ A.
34
Prova. Nel seguito Cγ := {x ∈ X | ||x||X ≤ γ} per ogni γ > 0. Fissiamo > 0, dobbiamo
trovare il δ > 0 che soddisfa la proprietà scritta nella tesi. Per il teorema di Banach-Steinhaus
ed usando la proposizione 2.1, ||Tα x||Y ≤ K < +∞ per ogni α ∈ A e x ∈ C1 . Se K = 0 non c’è
nulla da provare, assumiamo pertanto K > 0. Scegliamo δ > 0 per cui Cδ ⊂ C/K . Con le scelte
fatte, se ||x − x0 ||X < δ, vale K(x − x0 )/ ∈ CKδ/ ⊂ C1 e quindi
||Tα x − Tα x0 ||Y = ||Tα (x − x0 )||Y =
K(x − x0 )
||Tα
|| < K = ,
K
K
indipendentemente da α ∈ A. 2
Per introdurre altri due corollari del teorema di Banach-Steinhaus abbiamo bisogno di alcune
nozioni topologiche.
Notazione 2.3. Se δ > 0 e p è una seminorma sullo spazio vettoriale X, sul campo K = C o R,
e x ∈ X, indicheremo con Bp,δ (x) la palla aperta associata a p, centrata sul vettore x e di raggio
δ:
Bp,δ (x) := {z ∈ X | p(z − x) < δ} .
Nel caso in cui x = 0 scriveremo semplicemente Bp,δ in luogo di Bp,δ (0). Se A ⊂ X, x ∈ X e
β ∈ K indicheremo l’insieme {x + βu | u ∈ A} con la notazione
x + βA := {x + βu | u ∈ A} .
Si prova subito che le palle Bp,δ con δ > 0 sono insiemi convessi, cioé se x, y ∈ Bp,δ allora
(1 − λ)x + λy ∈ Bp,δ per λ ∈ [0, 1], bilanciati (detti anche equilibrati), cioé λx ∈ Bp,δ se
x ∈ Bp,δ e 0 ≤ λ ≤ 1, assorbenti, cioé ogni x ∈ X soddisfa λ−1 x ∈ Bp,δ per qualche λ > 0.
Queste proprietà sono invarianti per intersezione, per cui anche insiemi ottenuti intersecando
palle centrate nell’origine, ma ottenute da seminorme differenti, godono di tali proprietà.
Se P := {pi }i∈I è una famiglia di seminorme sullo spazio vettoriale X sul campo K = C o R, la
topologia su X generata da P, T(P), è l’unica che ammette come base la classe degli insiemi
Š
€
x + Bpi1 ,δ1 ∩ · · · ∩ Bpin ,δn
per ogni scelta di x ∈ X, di n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei numeri δ1 > 0, . . . δn > 0.
Si dimostra facilmente che la topologia indotta come sopra da seminorme sullo spazio vettoriale
X è compatibile con la struttura di spazio vettoriale, cioé le operazioni di somma e di prodotto
per scalare risultano essere continue rispetto alla detta topologia. Ricordiamo che uno spazio
vettoriale dotato di topologia compatibile con la struttura di spazio vettoriale è detto spazio
vettoriale topologico. Quando la topologia di uno spazio vettoriale topologico è quella indotta
da una classe di seminorme, si dice che lo spazio vettoriale è uno spazio localmente convesso.
È chiaro che nel caso generale la topologia indotta da una seminorma o da una classe di seminorme P = {pi }i∈I sullo spazio vettoriale X non sarà di Hausdorff. Si vede facilmente che la
35
proprietà di Hausdorff vale se e solo se ∩i∈I p−1
i (0) = 0, il secondo 0 essendo il vettore nullo di X.
In particolare ciò accade se almeno una delle pi è una norma. Infine si prova facilmente che ogni
spazio vettoriale dotato di una topologia indotta da una classe finita o numerabile di seminorme
{pn }n∈I con la proprietà ∩n∈I p−1
n (0) = 0 è metrizzabile, cioè è la stessa che si ottiene da una
opportuna distanza d : X × X → R+ . In particolare, la topologia coincide con quella indotta
dalla distanza invariante per traslazioni
d(x, y) :=
pn (x − y)
.
2n 1 + pn (x − y)
X 1
n∈I
Uno spazio di Fréchet è uno spazio X localmente convesso la cui topologia è di Hausdorff, è
indotta da una classe finita o numerabile di seminorme, e, come spazio metrico, X è completo2 .
Questi spazi, di cui non ci occuperemo molto a causa del livello elementare di questo libro sono di fondamentale importanza nella fisica teorica e matematica per quanto concerne le teorie
quantistiche. Ovviamente ogni spazio di Banch è un caso elementare di spazio di Fréchet.
Ricordiamo che in uno spazio topologico X, una successione di punti {xn }n∈N ⊂ X è detta convergere a x ∈ X quando: per ogni aperto A 3 x esiste NA ∈ N tale che xn ∈ A se n > NA . Si
prova facilmente che:
Proposizione 2.2. Una successione {xn }n∈N ⊂ X converge a x0 ∈ X nella topologia T(P) se e
solo se, per ogni pi ∈ P, pi (xn ) → pi (x0 ) quando n → +∞.
È chiaro che se la classe P si riduce ad un unico elemento dato da una norma, la topologia
indotta da P è la solita topologia metrica indotta da una norma.
Con la nozione introdotta sopra di topologia indotta da una classe di seminorme si possono
definire alcune topologie “standard” su L(X, Y), B(X, Y) e sul duale X0 : una di queste topologie
(e la corrispondente sul duale) la conosciamo già perché è quella indotta dalla norma operatoriale.
Definizione 2.8. Siano X, Y spazi normati sullo stesso campo K = C o R.
(a) Si definiscono su L(X, Y) e B(X, Y) le seguenti topologie operatoriali.
(i) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme definite
come, se T ∈ L(X, Y) (rispettivamente B(X, Y),
px,f (T ) := |f (T (x))|
per ogni x ∈ X e f ∈ Y0 , che è detta topologia debole su L(X, Y) (rispettivamente B(X, Y));
(ii) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme
definite come, se T ∈ L(X, Y) (rispettivamente B(X, Y)),
px (T ) := ||T (x)||Y
2
Si prova facilmente che una successione di Cauchy rispetto alla distanza di uno spazio localmente compatto
metrizzabile è tale se e solo se è di Cauchy rispetto ad ogni seminorma della classe generante la topologia, di
conseguenza tale nozione non dipende dalla distanza usata (che può non essere unica) per generare la topologia.
36
per ogni x ∈ X, che è detta topologia forte su L(X, Y) (rispettivamente B(X, Y));
(iii) La topologia indotta su B(X, Y) dalla norma operatoriale (2.6) è detta topologia uniforme su B(X, Y).
(b) Se Y = K, la topologia uniforme definita in (iii) prende il nome di topologia (duale) forte
e le topologie debole e forte definite in (i) e (ii), che risultano coincidere, prendono il nome di
topologia ∗ -debole.
Note.
(1) Si prova facilmente che la topologia forte è più forte di quella debole (cioè gli aperti della
topologia debole sono aperti anche nella topologia forte). Nello stesso modo si prova facilmente
che la topologia uniforme è più forte della topologia forte. Per gli spazi duali vale ovviamente
l’analoga proprietà: la topologia forte è più forte della topologia ∗ -debole.
(2) Data una successione di operatori {Tn } ⊂ L(X, Y) (o B(X, Y)) e un operatore T ∈ L(X, Y)
(o rispettivamente B(X, Y)), si prova facilmente che:
Tn → T nella topologia debole, se e solo se
f (Tn (x)) → f (T (x))
per ogni scelta di x ∈ X e f ∈ Y0 .
Nello stesso modo, si prova facilmente che:
Tn → T nella topologia forte se e solo se
||Tn (x) − T (x)||Y → 0
per ogni scelta di x ∈ X.
È chiaro che la convergenza di una successione di operatori di B(X, Y) in senso uniforme (cioè
rispetto alla topologia uniforme) implica la convergenza della stessa successione in senso forte
(cioè rispetto alla topologia forte).
Similmente, la convergenza di una successione di operatori di L(X, , Y) o B(X, Y) in senso forte
implica la convergenza della stessa successione in senso debole (cioè rispetto alla topologia debole).
(3) Data una successione di funzionali {fn } ⊂ X0 e un funzionale f ∈ X0 , si prova facilmente
che:
fn → f nella topologia ∗ -debole se e solo se
fn (x) → f (x)
per ogni scelta di x ∈ X.
È chiaro che la convergenza di una successione di funzionali di X0 in senso forte (cioè rispetto
alla topologia duale forte) implica la convergenza della stessa successione in senso ∗ -debole (cioè
rispetto alla topologia ∗ -debole).
37
Notazione 2.4. Per denotare i limiti rispetto alle topologie forti e deboli solitamente si usano
le seguenti convenzioni notazionali, che adotteremo anche in questo testo.
T = s- lim Tn
significa che T è il limite nella topologia forte della successione di operatori {Tn }. La stessa
notazione si usa nel caso in cui gli operatori coinvolti siano funzionali e la topologia è quella
duale forte.
T = w- lim Tn
significa che T è il limite nella topologia debole della successione di operatori {Tn }.
f = w∗ - lim fn
significa che f è il limite nella topologia ∗ -debole della successione {fn }.
Le nozioni topologiche acquisite permettono di provare altri due rilevanti corollari del teorema
di Banach-Steinhaus.
Sappiamo già che se X è uno spazio normato allora X0 è completo rispetto alla topologia duale
forte come provato in (ii) di (c) del teorema 2.3. Si può provare che la completezza sussiste
anche rispetto alla topologia ∗ -debole purché X sia spazio di Banach.
Corollario 2. Se X è uno spazio di Banach sul campo K = C o R, allora X0 è completo anche
rispetto alla topologia ∗-debole. In altre parole se {fn } ⊂ X0 è tale che {fn (x)} è una successione
di Cauchy per ogni x ∈ X, allora esiste f ∈ X0 tale che f = w∗ -limfn .
Prova. Il campo di X è completo per ipotesi, di conseguenza, per ogni x ∈ X esisterà f (x) ∈ K
con fn (x) → f (x). È immediato verificare che f : X 3 x 7→ f (x) definisce un funzionale lineare.
Per concludere la dimostrazione proviamo che f è continuo. Per ogni x ∈ X, fn (x) è limitata
(perché di Cauchy) per cui, dal teorema di B-S, |fn (x)| ≤ K < +∞ per ogni x ∈ X con ||x|| ≤ 1.
Facendo il limite a n → +∞ segue che |f (x)| ≤ K se ||x|| ≤ 1 da cui ||f || ≤ K < +∞ e pertanto,
dal teorema 2.2, f è continuo. 2
Corollario 3. Sia X uno spazio normato sul campo C o R. Se S ⊂ X è debolmente limitato,
cioè per ogni f ∈ X0 esiste c(f ) ≥ 0 tale che |f (x)| ≤ c(f ) per ogni x ∈ S, allora S è limitato
rispetto alla norma di X.
Prova. Consideriamo gli elementi x ∈ S ⊂ X come funzionali del duale di X0 , (X0 )0 facendo
uso della trasformazione isometrica I : X → (X0 )0 definita nel corollario 3 al teorema di HahnBanach. La famiglia di funzionali su X0 , S ⊂ (X0 )0 è limitata su ogni f ∈ X0 per ipotesi essendo
(scriviamo x in luogo di I(x)) |x(f )| = |f (x)| ≤ c(f ). Dato che X0 è completo possiamo applicare
il teorema di B-S concludendo che sup{|x(f )| | ||f || = 1} ≤ K < +∞ per ogni x ∈ S ossia
(essendo I un’isometria) ||x|| ≤ K < +∞ per ogni x ∈ S. 2
38
2.3.3
Il teorema dell’applicazione aperta e dell’operatore inverso continuo
dal Teorema di Baire.
Concludiamo la sezione con l’ultimo importante teorema generale, quello dell’applicazione aperta, che avrà come conseguenza il teorema dell’operatore inverso continuo.
Per provare tali teoremi vogliamo introdurre il minimo indispensabile della teoria degli spazi
di Baire. Ricordiamo che un sottoinsieme S di uno spazio topologico X si dice ovunque non
denso (nowhere dense), quando la sua chiusura S ha interno vuoto.
Un insieme S ⊂ X, con X spazio topologico, è detto insieme di prima categoria o anche insieme magro (meager set), se è ottenibile come l’unione di una classe numerabili di insiemi
ovunque non densi. Un insieme S ⊂ X, con X spazio topologico, è detto insieme di seconda categoria o anche insieme non magro se non è di prima categoria. Risultano immediatamente
i seguenti risultati.
(1) L’unione numerabile di insiemi di prima categoria è ancora di prima categoria.
(2) Se h : X → X0 è un omeomorfismo di spazi topologici S ⊂ X è di prima (seconda) categoria
se e solo se h(S) è di prima (risp. seconda) categoria.
(3) Se A ⊂ B ⊂ X e B è di prima categoria nello spazio topologico X, allora A è di prima
categoria.
(4) Se B ⊂ X è un insieme chiuso dello spazio topologico X e Int(B) = ∅, allora B è di prima
categoria in X. Vale infine l’importante teorema di Baire.
Teorema di Baire. Sia X uno spazio metrico completo (in particolare uno spazio di Banach).
Se {Un }n∈N è una collezione numerabile di sottoinsiemi aperti e densi di X, allora ∩n∈N Un è
denso in X.
Di conseguenza X è di seconda categoria.
Prova. Sia A ⊂ X un insieme aperto e x ∈ A. Se fosse U0 ∩ A = ∅, avremmo che x ammette
un intorno aperto di che non interseca U0 che, di conseguenza, non potrebbe essere denso in X.
Quindi U0 ∩ A è un aperto (in quanto intersezione di aperti) non vuoto. Esiste allora una palla
aperta Br0 (x0 ) di raggio r0 > 0 e centro x0 ∈ X tale che Br0 (x0 ) ⊂ U0 ∩ A. Possiamo ripetere la
procedura usando Br0 (x0 ) al posto di A, U1 al posto di U0 , e trovando una nuova palla aperta
Br1 (x1 ) con Br1 (x1 ) ⊂ U1 ∩ Br0 (x0 ).
Iterando la procedura, possiamo costruire una classe numerabile di palle aperte Brn (xn ), di
raggi rn , con n ∈ N e 0 < rn < 1/n, tali che Brn (xn ) ⊂ Un ∩ Brn−1 (xn−1 ). Dato che
xn ∈ Brm (xm ) quando m ≥ n, la successione {xn }n∈N deve essere di Cauchy. Essendo X
completo, xn → x per qualche x ∈ X se n → +∞. Per costruzione, per ogni n ∈ N,
x ∈ Brn−1 (xn−1 ) ⊂ Brn (xn ) ⊂ · · · ⊂ U0 ∩ A ⊂ A. Concludiamo che vale x ∈ A e x ∈ Un
per ogni n ∈ N e pertanto (∩n∈N Un ) ∩ A 6= ∅ per ogni sottoinsieme aperto A ⊂ X. Di conseguenza ∩n∈N Un è denso in X, dato che interseca ogni intorno aperto di ogni elemento di X.
Passiamo al secondo asserto. Supponiamo ora che {Ek }k∈N X sia una collezione numerabile di
insiemi Ek ⊂ X ovunque non densi. Se Vk è il complemento di Ek , per ogni k ∈ N, Vk deve essere
aperto e denso in X. La prima parte del teorema dimostra che ∩k∈N Vn 6= ∅ e quindi, prendendo
39
il complemento X 6= ∪k∈N Ek ed, a maggior ragione, X 6= ∪k∈N Ek . Per cui X non è di prima
categoria ed è dunque di seconda categoria. 2
Nota. Il teorema di Baire, vale anche nel caso in cui X sia uno spazio topologico di Hausdorff
localmente compatto. La dimostrazione della prima parte è simile alla della prima parte del
caso dello spazio metrico completo [Rud91], la seconda è identica.
Teorema dell’applicazione aperta (di Banach-Schauder). Siano X e Y due spazi di
Banach sullo stesso campo C o R e sia B1 (0) ⊂ X la palla aperta di raggio 1 e centrata in 0.
Per ogni T ∈ B(X, Y) suriettivo esiste una palla aperta, Bδ (0) ⊂ Y, centrata nell’origine e di
raggio δ > 0, tale che:
T (B1 (0)) ⊃ Bδ (1) .
(2.16)
Nota. Il nome del teorema è dovuto al seguente fatto evidente. (2.16) e la linearità di T implicano che l’immagine secondo T di qualunque palla aperta B (x) = x + B1 (0) centrata in
qualunque punto x ∈ X, contiene la palla aperta di Y centrata in T x: Bδ (0) := T x + Bδ (0)
(per δ > 0 sufficientemente piccolo). Quindi l’immagine secondo T di un qualsiasi aperto di
X, A = ∪x∈A Bx (x) risulta essere un aperto di Y: T (A) = ∪x∈A Bδx (T x). In altre parole, la
funzione T è aperta.
Prova del Teorema dell’applicazione aperta. Seguiremo essenzialmente la dimostrazione più generale
di questo teorema data in [Rud91] per spazi localmente convessi, specializzandola al caso in esame. Definiamo la palla aperta Bn := B2−n 1 (0), di raggio 2−n e centrata nell’origine. Proveremo
che esiste un intorno aperto W dell’origine di Y tale che:
W ⊂ T (B1 ) ⊂ T (B0 ) .
(2.17)
Questo risultato implica immediatamente la tesi.
Per provare (2.17), notiamo che, come si prova facilmente da B1 ⊃ B2 − B2 , dalla linearità e
contuinuità di T :
T (B1 ) ⊃ T (B2 ) − T (B2 ) ⊃ T (B2 ) − T (B2 ) .
(2.18)
La prima inclusione di (2.17) risulta quindi essere vera se T (B2 ) ha interno non vuoto. Per
provare che Int(T (B2 )) 6= ∅, notiamo che, nelle nostre ipotesi:
Y = T (X) =
+∞
[
kT (B2 ) ,
(2.19)
k=1
dal momento che B2 è un intorno aperto di 0. Dato che Y è di seconda categoria, almeno uno
dei kT (B2 ) deve essere di seconda categoria (se fossero tutti di prima categoria, Y sarebbe di
prima categoria e questo non può accadere per il teorema di Baire). Dato che y 7→ ky è un
omeomorfismo da Y a Y, T (B2 ) deve essere di seconda categoria in Y. Concludiamo che la
chiusura di T (B2 ) ha interno non vuoto. Questo prova la prima inclusione in (2.17).
40
Per provare la seconda inclusione in (2.17), usiamo una successione di elementi yn ∈ Y costruita
induttivamente come segue. Fissiamo y1 ∈ T (B1 ). Assumiamo quindi n ≥ 1 e che yn sia stato
scelto in T (Bn ) e vogliamo definire yn+1 . Quello che abbiamo provato per V1 vale nello stesso
modo per Vn+1 , in modo tale che T (Bn+1 ) contiene un intorno aperto dell’origine. Allora:
Š
€
(2.20)
yn − T (Bn+1 ) ∩ T (Bn ) 6= ∅ .
Questo implica che esiste xn ∈ Bn tale che:
T (xn ) ∈ yn − T (Bn+1 ) .
(2.21)
Definiamo allora: yn+1 := yn − T xn . Si noti che yn+1 ∈ T (Bn+1 ), e la costruzione induttiva
procede in questo modo ad ogni passo.
Dato che ||xn || < 2−n , per n = 1, 2, . . ., la somma x1 + · · · + xn forma una successione di Cauchy
che converge a qualche x ∈ X, per la completezza di X, e vale ||x|| < 1. Quindi x ∈ B0 . Dal
momento che:
m
m
X
n=1
T xn =
X
(yn − yn+1 ) = y1 − ym+1 ,
(2.22)
n=1
e dato che ym+1 → 0 per m → +∞ (per continuità di T ), concludiamo che y1 = T x ∈ T (B0 ).
Dato che y1 era un generico elemento di T (B1 ), questo risultato dimostra la seconda inclusione
in (2.17) e conclude la dimostrazione. 2
La conseguenza elementare più importante del teorema dell’applicazione aperta è sicuramente
il Teorema di Banach dell’operatore inverso nel caso di spazi di Banach (esiste una versione che
usa solo l’ipotesi di spazi vettoriali dotati di metrica e completi).
Corollario 1 (Teorema di Banach dell’operatore inverso). Siano X e Y due spazi di
Banach sullo stesso campo C o R. Se T ∈ B(X, Y) è iniettivo e suriettivo, allora valgono i
seguenti due fatti.
(a) T −1 : Y → X è un operatore limitato cioè T −1 ∈ B(Y, X).
(b) Esiste c > 0 tale che:
||T x|| ≥ c||x|| , per ogni x ∈ X.
(2.23)
Prova. (a) Il fatto che T −1 sia lineare è di immediata verifica. Bisogna solo provare che T −1
è continuo. Essendo T aperta, la controimmagine di un aperto di X secondo T −1 è un aperto,
quindi T −1 è continua. (b) Dato che T −1 è limitata, esiste K ≥ 0 tale che ||T −1 y|| ≤ K||y||
per ogni y ∈ Y. Notare che K > 0, altrimenti varrebbe T −1 = 0 e di conseguenza T −1 e T non
sarebbero biettive. Per ogni x ∈ X definiamo y = T x. Sostituendo in ||T −1 y|| ≤ K||y|| troviamo
la (2.23) ponendo c = 1/K. 2
Per concludere passiamo a dimostrare un utilissimo teorema in teoria degli operatori chiamato
il teorema del grafico chiuso.
41
Notazione 2.5. Se ∅ 6= K1 , . . . , Kn ⊂ X, con X spazio vettoriale, < K1 , · · · , Kn > denota il
sottospazio vettoriale di X generato dagli insiemi Ki cioè il sottospazio di X contenente tutte le
combinazioni lineari (finite) di elementi degli insiemi Ki . Se K ⊂ X e ∅ =
6 K1 , . . . , Kn ⊂ X sono
sottospazi, K = K1 ⊕ · · · ⊕ Kn significa che K è somma diretta degli spazi Ki . In altre parole
vale che K =< K1 , · · · , Kn > e Ki ∩ Kj = {0} per ogni coppia di indici i, j con i 6= j, ovvero
equivalentemente, ogni vettore di K può essere decomposto in maniera unica come una somma
di vettori degli spazi Ki .
Per dimostrare il teorema abbiamo bisogno di alcuni risultati preliminari. Prima di tutto notiamo
che se (X, NX ) e (Y, NY ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare
lo spazio vettoriale S costituito sul prodotto cartesiano X×Y definendo le operazioni di prodotto
per scalare e somma di vettori come: α(x, y) = (αx, αy) e (x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 ). È
chiaro che X e Y si identificano naturalmente con due sottospazi di S, che indicheremo ancora
con X e Y rispettivamente, e che vale S = X ⊕ Y. S è dotato naturalmente della topologia
prodotto indotta da quella dei fattori X e Y.
(Ricordiamo che la topologia prodotto su uno spazio vettoriale prodotto X = ×α∈A Xα è la meno
forte topologia per cui tutte le proiezioni canoniche Πα : X → Xα sono continue. Nel caso di un
numero finito di fattori (come nel caso considerato), tale topologia ammette come base di aperti
i prodotti cartesiani di tutte le palle aperte negli spazi Xα .)
Le operazioni della struttura di spazio vettoriale di S sono continue rispetto alla topologia
prodotto di X e Y.
La topologia prodotto di S è normabile: cioè esiste un norma su S la cui topologia metrica
associata è proprio la topologia prodotto di S. Tale norma è definita come
||(x, y)|| := max{NX (x), NY (y)} per ogni (x, y) ∈ X ⊕ Y .
(2.24)
Il fatto che questa norma generi la stessa topologia generata dai prodotti delle palle metriche di
X e Y si prova come segue. Consideriamo l’intorno aperto di (x0 , y0 ) dato dal prodotto di due
palle aperte Bδ (x0 ) × Bµ (y0 ) rispettivamente in X e Y. La palla aperta di X ⊕ Y centrata ancora
in (x0 , y0 ):
{(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < min{δ, µ}}
è contenuta in Bδ (x0 ) × Bµ (y0 ). Viceversa, il prodotto Bδ (x0 ) × Bδ (y0 ) che contiene il punto
(x0 , y0 ) è incluso nella palla metrica centrata in (x0 , y0 )
{(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < } ,
se > δ. Questo conclude la prova perché ne segue che ogni unione di prodotti di palle metriche
di X e Y è anche unione di palle metriche di X ⊕ Y ed ogni unione di palle metriche di X ⊕ Y è
anche unione di prodotti di palle metriche di X e Y. Quindi le due topologie coincidono.
Si prova immediatamente che (X ⊕ Y, || ||) è uno spazio di Banach se sono tali (X, NX ) e (Y, NY ).
(Questo fatto implica, in base alla proposizione 2.3 della prossima sezione, che qualunque norma
che generi la topologia prodotto rende X⊕Y spazio di Banach.) Sia infatti {(xn , yn )} una successione di Cauchy in X ⊕ Y, allora {xn } e {yn } risultano essere di Cauchy in X e Y rispettivamente
42
dalla stessa definizione di norma su X ⊕ Y data sopra. Siano x ∈ X e y ∈ Y i limiti di queste
due successioni che esistono essendo X e Y spazi di Banach. Quindi, se > 0 esistono Nx e Ny
interi positivi tali che, se n > max{Nx , Ny } allora
||(x, y) − (xn , yn )|| < ,
e quindi (xn , yn ) → (x, y) per n → +∞ nella topologia indotta dalla norma di X ⊕ Y. Tale spazio
è quindi spazio di Banach.
Definizione 2.9. Siano X, Y spazi normati sullo stesso campo C o R. T ∈ L(X, Y) è detto
chiuso se il grafico dell’operatore T , cioè il sottospazio G(T ) := {(x, T x) | x ∈ X} ⊂ X ⊕ Y, è
chiuso nella topologia prodotto. In altre parole T è chiuso quando per ogni successione {xn } ⊂ X
tale che {xn } e {T xn } convergono in X e Y rispettivamente, limn→∞ T (xn ) = T (limn→∞ xn ).
Possiamo enunciare e dimostrare il teorema dell’operatore chiuso o grafico chiuso.
Corollario 2 (Teorema dell’operatore chiuso o del grafico chiuso). Siano X, Y spazi di
Banach sullo stesso campo K = C o R e sia T : X → Y un operatore lineare. T è limitato se e
solo se è chiuso.
Prova. Se T è limitato allora è banalmente chiuso. Si supponga quindi che T sia chiuso e mostriamo che è limitato. Consideriamo l’applicazione lineare biettiva M : G(T ) 3 (x, T x) 7→ x ∈ X.
G(T ) è per ipotesi un sottospazio chiuso nello spazio di Banach X ⊕ Y per cui è a sua volta uno
spazio di Banach rispetto alla restrizione della norma || || (2.24). Dalla definizione di tale norma
troviamo che vale banalmente ||M (x, T x)||X = ||x||X ≤ ||(x, T x)||G(T ) per cui M è limitato. Per
il teorema dell’inverso limitato di Banach M −1 : X → G(T ) ⊂ X ⊕ Y è limitato. Dato che la
proiezione canonica di ΠY : X ⊕ Y → Y è continua nella topologia prodotto, concludiamo che
l’applicazione lineare ΠY ◦ M −1 : x 7→ T x per ogni x ∈ X è continua ossia limitata. 2
2.4
Proiettori.
Introduciamo, usando il teorema del grafico chiuso, la nozione e le proprietà elementari di alcuni operatori continui detti proiettori. La nozione di proiettore giocherà il ruolo centrale nella
formulazione della Meccanica Quantistica quando lo spazio normato sarà uno spazio di Hilbert.
Definizione 2.10 Sia (X, || ||) spazio normato sul campo C o R. P ∈ B(X) è detto proiettore
se è idempotente, cioè se
PP = P .
(2.25)
M := P (X) è detto spazio di proiezione di P e si dice anche che P proietta su M.
43
I proiettori sono naturalmente associati ad una decomposizione diretta dello spazio ambiente X
in una coppia di sottospazi chiusi.
Proposizione 2.4. Sia P ∈ B(X) un proiettore sullo spazio normato (X, || ||). Vale quanto
segue.
(a) Se Q : X → X è l’applicazione lineare che soddisfa
Q+P =I ,
(2.26)
P Q = QP = 0 ,
(2.27)
Q è proiettore e
dove 0 è l’operatore nullo (quello che trasforma nel vettore 0 ogni vettore di X).
(b) Gli spazi di proiezione M := P (X) ed N := Q(X) sono sottospazi chiusi di X e vale
X=M⊕N.
(2.28)
Prova. (a) Q è continuo perché somma di operatori continui, QQ = (I − P )(I − P ) = I − 2P +
P P = I − 2P + P = I − P = Q. P Q = P (I − P ) = P − P P = P − P = O, (I − P )P =
P − P P = P − P = O.
(b) Se P (xn ) → y per n → +∞ allora, dalla continuità di P : P P (xn ) → P (y). Per (2.25) questo
si scrive P (xn ) → P (y) da cui y = P (y) per l’unicità del limite (essendo X di Hausdorff). In
definitiva y ∈ M implica y ∈ M(⊂ M) per cui M = M ed M è dunque un insieme chiuso. Con lo
stesso ragionamento si prova che N è chiuso. Il fatto che M ed N siano sottospazi è immediata
conseguenza della linearità di P e Q rispettivamente. Sia ora x ∈ X, dalla definizione di Q vale
x = P (x) + Q(x) ,
di conseguenza X =< M, N >. Per concludere basta provare che M ∩ N = {0}. Se x ∈ M, N
allora x = P (x) e x = Q(x) per (2.25): per es. se x ∈ M allora x = P z per qualche z ∈ X, ma
allora P x = P P z = P z = x. Applicando Q alla identità x = P x e tenendo conto di x = Qx si
ha: x = Q(x) = QP (x). Ma QP (x) = 0 per (2.27). Abbiamo ottenuto che x ∈ M ∩ N implica
x = 0 che è quanto volevamo provare. 2
Il teorema del grafico chiuso prova che la proposizione 2.4 può essere invertita come segue, assumendo l’ulteriore ipotesi che lo spazio ambiente sia di Banach.
Proposizione 2.5. Sia (X, || ||) spazio di Banach e M, N ⊂ X due sottospazi chiusi tali che
X = M ⊕ N. Si considerino le applicazioni P : X → M e Q : X → N che associano a x ∈ M i
rispettivi elementi di M ed N secondo la decomposizione diretta X = M ⊕ N. Allora vale quanto
segue.
(a) P e Q sono proiettori che proiettano rispettivamente su M ed N.
44
(b) Valgono le identità (2.26) e (2.27).
Prova. Per ipotesi, se x ∈ X allora vale la decomposizione x = uM + uN con uM ∈ M e un ∈ N
e tale decomposizione è l’unica possibile rispetto a tale coppia di sottospazi. L’unicità ed il
fatto che M ed N sono rispettivamente chiusi per combinazioni lineari implicano che le funzioni
P : x 7→ uM e Q : x 7→ uN siano lineari e che valga P P = P e QQ = Q. Si noti anche che
P (X) = M e Q(X) = N per costruzione e che (2.26) vale in quanto X =< M, N >, mentre (2.27)
vale perchè M ∩ N = {0}. Per concludere la dimostrazione bisogna solo provare che P e Q
sono continui. Mostriamo che P è chiuso, il teorema dell’operatore chiuso implica allora che P
è continuo. La dimostrazione per Q è analoga. Sia {xn } ⊂ X una successione che converge a
x ∈ X e tale che {P xn } converge anch’essa ad un elemento di X. Dobbiamo provare che
P x = lim P xn .
n→+∞
Dato che N è chiuso:
N 3 Qxn = xn − P xn → x − lim P xn = z ∈ N .
n→+∞
Abbiamo ottenuto che
x = lim P xn + z ,
n→+∞
con z ∈ N ma anche limn→+∞ P xn ∈ M perchè M è chiuso e P xn ∈ M per ogni n. D’altra parte
sappiamo che vale anche
x = P x + Qx
Per l’unicità della decomposizione di x come somma di vettori in N ed M deve essere
P x = lim P xn
n→+∞
e z = Qx, quindi l’operatore P è chiuso ed è pertanto continuo. 2
2.5
Norme equivalenti.
Un’interessante applicazione del teorema dell’operatore inverso di Banach è un criterio per stabilire quando due norme sullo stesso spazio vettoriale, che risulta essere completo per entrambe,
sono associate alla stessa topologia. Introduciamo qualche nozione prima di enunciare il criterio
detto nella proposizione 2.6.
Concluderemo il capitolo con la dimostrazione del fatto che tutte le norme sugli spazi vettoriali
di dimensione finita sono equivalenti e rendono tali spazi spazi di Banach.
Definizione 2.11. Due norme N1 e N2 sullo stesso spazio vettoriale X (su C o R) si dicono
equivalenti se esistono due costanti c, c0 > 0 tali che:
cN2 (x) ≤ N1 (x) ≤ c0 N2 (x) ,
45
per ogni x ∈ X.
(2.29)
Osservazioni.
(1) Si osservi che (2.29) è equivalente all’analoga disuguaglianza che si ottiene scambiando N1
con N2 e sostituendo c, c0 con 1/c0 , 1/c rispettivamente.
(2) Si prova immediatamente che se uno spazio normato è completo allora è tale ogni altro
spazio normato sullo stesso spazio vettoriale dotato di una norma equivalente.
(3) Se due norme sullo stesso spazio sono equivalenti allora generano la stessa topologia. La
proposizione di sotto prova che vale anche il viceversa.
(4) Nello spazio delle norme su un fissato spazio vettoriale, la nozione di norma equivalente
definisce una relazione di equivalenza. La prova di ciò è immediata dalle definizioni date.
Proposizione 2.6. Sia X uno spazio vettoriale su C o R. Le norme N1 e N2 su X sono equivalenti se e solo se l’applicazione identica I : (X, N2 ) 3 x 7→ x ∈ (X, N1 ) è un omeomorfismo (che
equivale a dire che le topologie metriche generate dalle due norme coincidono).
Prova. Bisogna solo dimostrare che se I è omeomorfismo allora le norme sono equivalenti. L’altra implicazione è ovvia dalla definizione di norme equivalenti. Se I è un omeomorfismo allora è
continuo nell’origine e quindi, in particolare, la palla metrica rispetto alla norma N1 di raggio 1
e centrata in 0 deve contenere completamente una palla aperta rispetto alla norma N2 centrata
in 0 di raggio δ > 0 sufficientemente piccolo. Ossia N2 (x) ≤ δ ⇒ N1 (x) < 1. In particolare, per
x 6= 0, N2 (δx/N2 (x)) ≤ δ per cui: N1 (δx/N2 (x)) < 1 ossia δN1 (x) ≤ N2 (x). Per x = 0 vale
banalmente l’uguaglianza. Abbiamo provato che esiste c0 = 1/δ > 0 per cui N1 (x) ≤ c0 N2 (x) per
ogni x ∈ X. L’altra parte della (2.29) si prova analogamente scambiando il ruolo dei due spazi. 2
Proposizione 2.7. Sia X uno spazio vettoriale su C o R. Si supponga che X sia spazio di
Banach rispetto ad entrambe le norme N1 , N2 . Se esiste c > 0 tale che, per ogni x ∈ X:
cN2 (x) ≤ N1 (x)
allora le due norme sono equivalenti.
Prova. Si consideri la funzione identità I : x 7→ x. Tale funzione è lineare e continua quando la pensiamo come I : (X, N1 ) → (X, N2 ) perché N2 (x) ≤ (1/c)N1 (x) per ogni x ∈ X. Per
il punto (b) nella tesi del teorema di Banach della funzione inversa esisterà c0 > 0 tale che
N1 (x) ≤ c0 N2 (x) per ogni x ∈ X. N1 e N2 soddisfano allora la (2.29). 2
Come ultima proposizione diamo il seguente importante risultato, che vale anche per spazi reali
scambiando C con R usando la stessa dimostrazione.
Proposizione 2.8. Tutte le norme su uno spazio vettoriale X sul campo C di dimensione finita
assegnata sono tra di loro equivalenti ed ognuna di esse definisce una struttura di spazio di Banach su X.
46
Prova. È chiaro che possiamo ridurci a studiare il caso dello spazio Cn , visto che ogni spazio
vettoriale complesso di dimensione finita n è isomorfo a Cn . Come conseguenza delle osservazioni
(2) e (4) di sopra, è sufficiente provare che ogni norma su Cn è equivalente alla norma standard.
Si tenga conto del fatto, noto dall’analisi elementare, che Cn con la norma standard è completo.
P
P
Sia N una norma su Cn e sia e1 , · · · , en la base canonica di Cn . Se x = i xi ei e y = i yi ei
sono elementi generici di Cn , dalla proprietà di positività (N0), dalla disuguaglianza triangolare
(N2) e dalla proprietà di omogeneità (N1) della definizione di norma:
0 ≤ N (x − y) ≤
n
X
|xi − yi |N (ei ) ≤ Q
i=1
dove Q :=
P
i N (ei ).
n
X
|xi − yi | ,
i=1
D’altra parte vale banalmente, se || · || è la norma standard su Cn
Ì
|xj − yj | ≤ M ax{|xi − yi | | i = 1, 2, · · · , n} ≤
n
X
|xi − yi |2 = ||x − y|| ,
i=1
da cui
0 ≤ N (x − y) ≤ nQ||x − y|| .
Questo prova che N è continua rispetto alla topologia della norma standard. Se S := {x ∈
Cn | ||x|| = 1} e N 0 è una seconda norma su Cn , che quindi sarà continua rispetto alla topologia
della norma standard, la funzione
S 3 x 7→ f (x) :=
N (x)
N 0 (x)
sarà continua perché rapporto di funzioni continue con denominatore mai nullo. Dato che S è
compatto nella topologia della norma standard, esisteranno il minimo m ed il massimo M di f .
In particolare M ≥ m > 0 perché N, N 0 sono strettamente positive su S e i valori m, M sono
assunti da f per opportuni vettori xm , xM in S. Per costruzione:
mN 0 (x) ≤ N (x) ≤ M N 0 (x) ,
per ogni x ∈ S .
Questa disuguaglianza vale in realtà per ogni vettore x ∈ Cn come ora proviamo. Si può
sempre scrivere x = λx0 con x0 ∈ S e λ ≥ 0, quindi moltiplicando per λ ≥ 0 i termini della
disuguaglianza di sopra valutata in x0 si ha
mλN 0 (x0 ) ≤ λN (x0 ) ≤ M λN 0 (x0 ) .
Usando infine la proprietà N1 delle norme per λ = |λ| si ottiene mN 0 (x) ≤ N (x) ≤ M N 0 (x) per
ogni x ∈ Cn . Scegliendo N 0 := || · || si conclude che ogni norma su Cn è equivalente a quella
standard. 2
47
Capitolo 3
Spazi di Hilbert ed operatori
limitati.
In questa sezione introdurremo alcune prime nozioni matematiche relative agli spazi di Hilbert
che ci serviranno per dare un fondamento matematico alla MQ.
Una parte importante del capitolo sarà dedicata alla nozione di base hilbertiana (detta anche
sistema ortonormale completo), che tratteremo nel modo più generale possibile non assumendo
la separabilità dello spazio di Hilbert. Prima di tale nozione enunceremo e proveremo il teorema
più importante della teoria degli spazio di Hilbert: il teorema della rappresentazione di Riesz,
che prova che esiste un anti isomorfismo naturale tra uno spazio di Hilbert ed il suo duale topologico. Tale discussione consentirà di accennare brevemente alla nozione di spazio riflessimo.
La terza parte del capitolo, sarà dedicata ad introdurre e studiare la nozione di operatore aggiunto (nel caso di operatori limitati), introdotto tramite ol teorema di Riesz, e tutte le sue
fondamentali conseguenze nella teoria degli operatori limitati. Introdurremo in particolare la
nozione di C ∗ algebra (di operatori ed in senso astratto, e nelle esemplificazioni presenteremo
la struttura di algebra di von Neumann citando il celebre teorema del doppio commutante). In
tale sezione introdurremo le classi degli operatori autoaggiunti, unitari e normali, discutendone
le loro proprietà elementari.
La quarta sezione sarà interamente dedicata alla nozione di proiettore ortogonale e delle proprietà più importanti di tali tipi di operatori. La struttura di reticolo ortocoplementato sarà analizzata
successivamante.
La penultima sezione sarà dedicata all’importante teorema di decomposizione polare per operatori limitati definiti su tutto lo spazio di Hilbert. Come strumento tecnico, sarà introdotta la
nozione di radice quadrata positiva di un operatore limitato. I teoremi presentati sono dimostrati
indipendentemente dal teorema spettrale che sarà provato successivamente.
L’ultima sezione riguarda la teoria elementare della trasformata di Fourier e di Fourier-Plancherel,
che introdurremo in modo molto rapido e conciso, senza fare riferimento alla teoria delle distribuzioni di Schwartz. Negli esempi finali sarà menzionato il teorema di Paley-Wiener, che sarà poi
usato per costruire basi Hilbertiane nelgli spazi L2 .
48
3.1
Nozioni elementari, teorema di Riesz e riflessività.
Definizione 3.1. Se X è uno spazio vettoriale sul campo complesso, un’applicazione S : X×X →
C si dice prodotto scalare (hermitiano) e (X, S) spazio con prodotto scalare quando S
soddisfa:
H0. S(u, u) ≥ 0 per ogni u ∈ X;
H1. S(u, αv + βw) = αS(u, v) + βS(u, w) per ogni α, β ∈ C e u, v, w ∈ X;
H2. S(u, v) = S(v, u) per ogni u, v ∈ X;
H3. S(u, u) = 0 ⇒ u = 0, per ogni u ∈ X.
Se valgono H0, H1, H2 ma non necessariamente H3, S si dice semi-prodotto scalare.
Nello spazio vettoriale X con (semi-)prodotto scalare hermitiano S, vettori u, v ∈ X si dicono
ortogonali se:
S(u, v) = 0 .
In tal caso si dice anche che u è ortogonale, o equivalentemente normale, a v e v è ortogonale, o equivalentemente, normale a u.
Se ∅ =
6 K ⊂ X, lo spazio ortogonale aK, K ⊥ , è l’insieme dei vettori di X ortogonali a ciascun
elemento di K.
Note.
(1) H1 e H2 implicano insieme che S è antilineare nel primo argomento:
S(αv + βw, u) = αS(v, u) + βS(w, u)
per ogni α, β ∈ C e u, v, w ∈ X.
(2) Dalla H2 segue che u è ortogonale a v se e solo se v è ortogonale a u, per cui la definizione
di ortogonalità è ben posta.
(3) Si verifica immediatamente che K ⊥ è un sottospazio vettoriale di X per la proprietà H1,
per cui il termine spazio ortogonale è appropriato.
Proposizione 3.1. Sia X uno spazio vettoriale su C dotato di un semi prodotto scalare S.
(a) Vale la disuguaglianza di Cauchy-Schwartz: per ogni coppia x, y ∈ X
|S(x, y)|2 ≤ S(x, x)S(y, y) ;
(3.1)
in (3.1) vale il segno di uguaglianza se x e y sono linearmente dipendenti e solo in tal caso se
S è prodotto scalare.
(b) Al variare di x ∈ X,
È
p(x) := S(x, x)
(3.2)
definisce una seminorma, ovvero una norma se S è un prodotto scalare, che si dice essere
indotta da S.
(c) p soddisfa l’identità del parallelogramma:
p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) ,
49
(3.3)
per ogni x, y ∈ X.
Prova. (a) Se α ∈ C vale, usando le proprietà del semi-prodotto scalare,
0 ≤ S(x − αy, x − αy) = S(x, x) − αS(x, y) − αS(y, x) + |α|2 S(y, y) .
(3.4)
Supponiamo S(y, y) 6= 0. In tal caso ponendo α := S(x, y)/S(y, y) si ottiene da (3.4)
0 ≤ S(x, x) − |S(x, y)|2 /S(y, y) ,
che è la tesi. Se S(y, y) = 0 troviamo invece da (3.4) che deve comunque valere per ogni α ∈ C:
0 ≤ S(x, x) − αS(x, y) − αS(y, x) .
(3.5)
Scegliendo α ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.5) è
impossibile a meno che S(x, y) + S(y, x) = 0. Scegliendo poi α = iλ con λ ∈ R sufficientemente
grande in valore assoluto, si vede che la disuguaglianza (3.4) può valere solo se oltre all’identità
S(x, y) = −S(y, x) provata sopra, vale anche S(x, y) − S(y, x) = 0 e quindi S(x, y) = 0. In
definitiva, se S(y, y) = 0 vale ancora (3.5) perchè S(x, y) = 0. Se x e y sono linearmente
dipendenti allora vale x = αy oppure y = αx per qualche α ∈ C. Si verifica immediatamente
che in tal caso i due membri di (3.1) sono uguali. Supponiamo ora che S sia un prodotto
scalare e che valga |S(x, y)|2 = S(x, x)S(y, y). Se almeno uno dei due vettori x, y è nullo (ed
in tal caso l’uguaglianza vale) allora è banalmente vero che x e y sono linearmente dipendenti.
Mettiamoci nel caso in cui
È entrambi i vettori
È siano non nulli e valga l’uguaglianza detta. In tal
caso, ridefinendo u = x/ S(x, x) e v = y/ S(y, y), vale |S(u, v)| = 1 e quindi S(u, v) = eiη per
qualche η ∈ R. Per H3 l’equazione in α e β, αu + βv = 0 equivale a S(αu + βv, αu + βv) = 0.
Sviluppandola si ottiene che essa equivale a
|α|2 + |β|2 + αβeiη + βαe−iη = 0 .
Scegliendo α = eiµ e β = eiν in modo che −µ + ν + η = π, l’equazione di sopra risulta essere
soddisfatta. Abbiamo trovato che, per opportuni µ, ν ∈ R vale
È
È
eiµ S(y, y)x + eiν S(x, x)y = 0
ossia che x e y sono linearmente dipendenti.
(b) Tutte le proprietà delle seminorme si verificano immediatamente dalla definizione di p e dalle
proprietà del prodotto scalare, eccetto la disuguaglianza triangolare N2 che proviamo ora. Dalle
proprietà del prodotto scalare risulta subito che
p(x + y)2 = p(x)2 + 2ReS(x, y) + p(y)2 ,
dove Rez := (z + z)/2 indica la parte reale del numero complesso z. 2ReS(x, y) ≤ 2|S(x, y)| e
quindi per (3.1), 2ReS(x, y) ≤ 2p(x)p(y), da cui si ottiene:
p(x + y)2 ≤ p(x)2 + 2p(x)p(x) + p(y)2 ,
50
ossia
p(x, y)2 ≤ (p(x) + p(y))2 ,
che implica N2. La proprietà N3 segue immediatamente da H3, nel caso S sia un prodotto
scalare.
(c) Si verifica immediatamente usando la definizione di p e le proprietà del prodotto scalare. 2
Nota. La disuguaglianza di Cauchy-Schwartz ha come immediata conseguenza il fatto che un
prodotto scalare S : X × X → C è una funzione continua sullo spazio X × X dotato della topologia
prodotto, quando su X si usi la topologia metrica indotta dal prodotto scalare tramite la norma
(3.2). In particolare il prodotto scalare è anche continuo nei suoi singoli argomenti separatamente.
Definizione 3.2. Se (X, SX ) e (Y, SY ) sono spazi con prodotto scalare (hermitiano), un’applicazione lineare L : X → Y è detta isometria se soddisfa SY (L(x), L(y)) = SX (x, y) per ogni
x, y ∈ X.
Se l’isometria L : X → Y è anche surgettiva è detta isomorfismo di spazi con prodotto
scalare.
Se esiste un isomorfismo (L) di spazi con prodotto scalare dallo spazio X allo spazio Y, tali spazi
si dicono isomorfi (secondo L).
È chiaro che ogni isometria L : X → Y è iniettiva per H3, ma può non essere surgettiva (anche se
X = Y se la dimensione dello spazio X non è finita). Inoltre ogni isometria è ovviamente continua
rispetto alle due topologie metriche dei due spazi indotte dalle norme indotte dai prodotti scalari
e, se è surgettiva (cioè se è un isomorfismo), la sua inversa è ancora un’isometria (e quindi un
isomorfismo).
Esercizi 3.1.
(1) Mostrare che se, su uno spazio vettoriale sul campo C, una seminorma (norma) p soddisfa l’identità del parallelogramma, allora esiste, ed è unico, un semi prodotto scalare (rispettivamente
un prodotto scalare) S che induce p tramite (3.2).
Suggerimento. Se S è un semi-prodotto scalare vale
4S(x, y) = S(x + y, x + y) − S(x − y, x − y) − iS(x + iy, x + iy) + iS(x − iy, x − iy).
(2) Si può dare la definizione di (semi-)prodotto scalare anche per spazi vettoriali sul campo
reale, semplicemente cambiando H2 in S(u, v) = S(v, u) ed usando ovviamente combinazioni
lineari a coefficienti in R in H1. Mostrare che vale ancora la proposizione 3.1
(3) Si consideri uno spazio vettoriale con campo reale. Provare che se una seminorma (norma) p
su tale spazio soddisfa l’identità del parallelogramma allora esiste, ed è unico, un semi-prodotto
scalare (rispettivamente un prodotto scalare) S che induce p tramite (3.2).
Suggerimento. Se S è un semiprodotto scalare vale
4S(x, y) = S(x + y, x + y) − S(x − y, x − y).
51
(4) Dimostrare quanto asserito nella nota sotto la proposizione 3.1 per uno spazio con prodotto
scalare (X, S).
Suggerimento. Se X × X 3 (xn , yn ) → (x, y) ∈ X × X per n → +∞, usando la disuguaglianza
di C.-S. provare che se S è il prodotto scalare e p la norma associata, allora vale
|S(x, y) − S(xn , yn )| ≤ p(xn )p(yn − y) + p(xn − x)p(y) ,
e tenere conto che p(xn ) → p(x) e che la proiezione canonica è continua nella topologia prodotto.
(5) Siano (X, S) e (X1 , S1 ) spazi con prodotto scalare hermitiano. Sia L : X → X1 lineare e tale
che S1 (L(x), L(x)) = S(x, x) per ogni x ∈ X. Provare che L è un’isometria (di spazi con prodotto
scalare). Si può generalizzare il risultato al caso di spazi sul campo reale?
Suggerimento. Usare i suggerimenti agli esercizi (1) e (3).
Notazione 3.1. Nel seguito, se non sarà specificato altrimenti, ( |) denoterà un prodotto scalare
e || || la norma indotta da esso come in proposizione 3.1.
Definizione 3.3. Uno spazio con prodotto scalare (hermitiano) si dice spazio di Hilbert se è
spazio di Banach rispetto alla norma indotta dal prodotto scalare.
Un isomorfismo di spazi con prodotto scalare tra due spazi di Hilbert è detto isomorfismo tra
spazi di Hilbert o, equivalentemente, trasformazione unitaria o, equivalentemente, operatore unitario.
Deve essere chiaro che se U : H → H2 è un isomorfismo di spazi con prodotto scalare (hermitiano), H1 è spazio di Hilbert se e solo se è tale H. In tal caso U è una trasformazione unitaria.
Vale un teorema del completamento analogo a quello valido per spazi di Banach.
Teorema del completamento per spazi di Hilbert. Sia X uno spazio vettoriale sul campo
C dotato di un prodotto scalare S.
(a) Esiste uno spazio di Hilbert (H, ( | )), detto completamento di X, tale che X si identifica
con un sottospazio denso (rispetto alla topologia metrica di H indotta dal prodotto scalare ( | ))
di H tramite un’applicazione lineare iniettiva J : X → H che estende il prodotto scalare S in ( | ).
In altre parole, esiste un’applicazione lineare iniettiva J : X → H con
J(X) = H
e
(J(x)|J(y)) = S(x, y) per ogni x, y ∈ X.
(b) Se la terna (J1 , H1 , ( | )1 ) con J1 : X → H1 lineare isometrica e (H1 , ( | )1 ) spazio di Hilbert
è tale che X si identifica con un sottospazio denso di H1 tramite J1 estendendo il prodotto scalare S in ( | )1 , allora esiste ed è unico una trasformazione unitaria φ : H → H1 tale che J1 = φ◦J.
Schema della dimostrazione. (a) Conviene usare il teorema del completamento per gli spazi
di
È Banach e costruire il completamento di Banach dello spazio normato (X, N ) dove N (x) :=
S(x, x). Dato che S è continuo e X è denso nel completamento secondo la funzione lineare J,
S induce un semiprodotto scalare ( | ) sul completamento di Banach H. ( | ) è un prodotto scalare
52
su H in quanto, sempre per continuità risulta indurre la stessa norma dello spazio di Banach.
Di conseguenza H è spazio di Hilbert e la funzione lineare J che identifica X con un sottospazio
denso di H soddisfa le proprietà prescritte nella tesi. (b) La dimostrazione è essenzialmente
uguale a quella data nel caso di spazi di Banach. 2
Esempi 3.1.
P
(1) Cn dotato del prodotto scalare (u|v) := ni=1 ui vi , dove u = (u1 , . . . , un ) e v = (v1 , . . . , vn ),
è uno spazio di Hilbert.
(2) Un esempio di spazio di Hilbert estremamente importante in fisica si ricava dall’esempio (6)
in esempi 2.1: lo spazio L2 (X, µ), dove X è uno spazio con misura positiva µ su una σ-algebra
Σ. Sappiamo che L2 (X, µ) è uno spazio di Banach rispetto alla norma
||f ||2 :=
Z
f (x)f (x)dµ(x)
X
essendo f un qualsiasi rappresentante della classe di equivalenza di funzioni uguali quasi ovunque rispetto a µ, f ∈ L2 (X, µ). Usando essenzialmente la stessa dimostrazione per provare la
disuguaglianza di Cauchy-Schwartz e tenendo conto della finitezza delle norme degli elementi
dello spazio di Banach L2 (X, µ), è facile provare che
(f |g) :=
Z
f (x)g(x)dµ(x)
(3.6)
X
è finito se f, g ∈ L2 (X, µ) e definisce un prodotto scalare hermitiano su tale spazio di Banach.
È ovvio che tale prodotto scalare induce la norma || ||2 per cui L2 (X, µ) è uno spazio di Hilbert
rispetto al prodotto scalare (3.6).
Passiamo ora a provare che gli spazi di Hilbert sono riflessivi. Per fare ciò dobbiamo introdurre
alcuni utili strumenti legati al concetto di spazio ortogonale di centrale importanza nello sviluppo del formalismo della MQ.
Notazione 3.2. Se K ⊂ X, con X spazio topologico, X indica la chiusura di X, cioè il più piccolo
chiuso (nel senso dell’intersezione) che include K. Ciò è equivalente a dire che X è l’unione di K
e di tutti i suoi punti di accumulazione.
Ricordiamo che se ∅ 6= K ⊂ X, con X spazio vettoriale, K è detto convesso se αu + βv ∈ K
quando α, β ≥ 0, α + β = 1 e u, v ∈ K. Chiaramente ogni sottospazio di X è convesso, ma non
tutti i sottoinsiemi convessi di X sono sottospazi di X. Per esempio una palla aperta di raggio
finito rispetto alla norma su uno spazio vettoriale è un insieme convesso che non è sottospazio.
Ricordiamo che se K ⊂ X, allora < K > denota il sottospazio di X generato da K.
Teorema 3.1. Sia (H, ( | )) spazio di Hilbert e K ⊂ H un sottoinsieme non vuoto.
(a) K ⊥ è un sottospazio chiuso di H.
⊥
(b) K ⊥ =< K >⊥ = < K >⊥ = < K > .
53
(c) Se K è chiuso e convesso, allora per ogni x ∈ H esiste ed è unico PK (x) ∈ K tale che
||x − PK (x)|| = min{||x − y|| | y ∈ K}, dove || || denota la norma indotta da ( | ).
(d) Se K è un sottospazio chiuso, allora ogni x ∈ H si decompone in modo unico come zx + yx
con zx ∈ K e yx ∈ K ⊥ e quindi vale:
H = K ⊕ K⊥ .
(3.7)
Infine risulta zx := PK (x) definito in (c).
(e) (K ⊥ )⊥ = < K >.
Nota. In realtà (a) e (b) valgono anche se lo spazio non è di Hilbert ma solo spazio vettoriale
con prodotto scalare e la topologia è quella indotta dal prodotto scalare.
Prova del teorema 3.1. (a) K ⊥ è sottospazio per le proprietà di (anti-)linearità del prodotto
scalare. Dalla continuità del prodotto scalare segue subito che se {xn } ⊂ K ⊥ converge a x ∈ H
allora (x|y) = 0 per ogni y ∈ K, per cui x ∈ K ⊥ . Quindi K ⊥ è chiuso contenendo tutti i suoi
punti di accumulazione.
(b) La dimostrazione della prima identità è ovvia dalla definizione di ortogonale e dalla linearità (antilinerarità) del prodotto scalare. La seconda identità segue quindi immediatamente
da (a). Riguardo all’ultima identità notiamo che sicuramente, essendo < K >⊂ < K > vale
⊥
⊥
< K >⊥ ⊃ < K > . D’altra parte < K >⊥ ⊂ < K > per la continuità del prodotto scalare.
⊥
Di conseguenza < K >⊥ = < K > , che conclude la catena di uguaglianze avendo già provato
che < K >⊥ = < K >⊥ .
(c) Sia 0 ≤ d = inf y∈K ||x − y||, che esiste perché l’insieme dei numeri ||x − y|| con y ∈ K è
limitato inferiormente e non vuoto. Sia {yn } ⊂ K una successione di punti per cui ||x−yn || → d.
Mostriamo che si tratta di una successione di Cauchy. Dall’identità del parallelogramma (3.3),
con x e y in tale formula sostituiti con x − yn e x − ym rispettivamente, segue che
||yn − ym ||2 = 2||x − yn ||2 + 2||x − ym ||2 − ||2x − yn − yn ||2 .
Osserviamo ora che ||2x − yn − yn ||2 = 4||x − (yn + ym )/2||2 ≥ 4d2 , dato che yn /2 + ym /2 ∈ K
nell’ipotesi di convessità di K e che d è l’estremo inferiore dei numeri ||x − y|| se y ∈ K. Fissato
> 0, prendendo n e m grandi a sufficienza avremo: ||x − yn ||2 ≤ d2 + , ||x − ym ||2 ≤ d2 + ,
da cui
||yn − ym ||2 ≤ 4(d2 + ) − 4d2 = 4 .
Quindi la successione è di Cauchy. Essendo H completo, yn converge a qualche y ∈ K dato che
K è chiuso. Per la continuità della norma d = ||x − y||. Mostriamo che y ∈ K è l’unico punto
che soddisfa d = ||x − y||. Ogni altro y 0 ∈ K con la stessa proprietà soddisfa, dall’identità del
parallelogramma:
||y − y 0 ||2 = 2||x − y||2 + 2||x − y 0 ||2 − ||2x − y − y 0 ||2 ≤ 2d2 + 2d2 − 4d2 = 0 ,
dove abbiamo ancora usato ||2x − y − y||2 = 4||x − (y + y)/2||2 ≥ 4d2 (dato che y/2 + y 0 /2 ∈ K
nell’ipotesi di convessità di K e che d è l’estremo inferiore dei numeri ||x−z|| se z ∈ K). Valendo
54
||y − y 0 || = 0 deve essere y = y 0 . Quindi PK (x) := y soddisfa tutte le richieste.
(d) Sia x ∈ H e x1 ∈ K a distanza minima da x. Poniamo x2 := x − x1 e mostriamo che
x2 ∈ K ⊥ . Sia y ∈ K, la funzione R 3 t 7→ f (t) := ||x − x1 + ty||2 ha un minimo per t = 0. Si
noti che tale fatto vale nell’ipotesi che K sia sottospazio, per cui −x1 + ty ∈ K per ogni t ∈ R
se x1 , y ∈ K. Quindi la sua derivata si annulla in t = 0:
||x2 + ty||2 − ||x2 ||2
= (x2 |y) + (y|x2 ) = 2Re(x2 |y) .
t→0
t
f 0 (0) = lim
Di conseguenza Re(x2 |y) = 0. Sostituendo y con iy si ricava che anche la parte immaginaria di
(x2 |y) vale zero, per cui (x2 |y) = 0 e x2 ∈ K ⊥ . Con questo abbiamo provato che < K, K ⊥ >= H.
Non resta che mostrare che K ∩ K ⊥ = {0}. Ma questo è ovvio dal fatto che se x ∈ K ∩ K ⊥
allora x deve essere ortogonale a x allora ||x||2 = (x|x) = 0 e quindi x = 0.
(e) Se y ∈ K, allora y è ortogonale ad ogni elemento di K ⊥ ; per linearità e continuità del
prodotto scalare questo vale anche se y ∈ < K >. In altre parole
< K > ⊂ (K ⊥ )⊥ .
(3.8)
Usando (d) e sostituendo al posto di K il sottospazio chiuso < K > otteniamo che H = < K >⊕
⊥
< K > . Ossia, tenendo conto di (b)
H = < K > ⊕ K⊥ .
(3.9)
Se u ∈ (K ⊥ )⊥ , in base alla (3.9) c’è una decomposizione fatta di vettori ortogonali ((u0 |v) = 0)
u = u0 + v con u0 ∈ < K > e v ∈ K ⊥ e quindi (u|v) = (v|v). Valendo (u|v) = 0 (perché
u ∈ (K ⊥ )⊥ e v ∈ K ⊥ ) deve essere (v|v) = 0 e dunque (K ⊥ )⊥ 3 u = u0 ∈ < K >. Concludiamo
che < K > ⊃ (K ⊥ )⊥ da cui la tesi valendo (3.8). 2
Il teorema provato ha il seguente corollario che segue immediatamente da (b) e (d).
Corollario. Se S è un sottoinsieme di uno spazio di Hilbert H, < S > è denso in H se e solo
se S ⊥ = {0}.
Possiamo ora enunciare e provare il teorema dovuto a F. Riesz, che è sicuramente il teorema più
importante della teoria degli spazi di Hilbert.
Teorema 3.2 (Riesz). Sia (H, ( | )) spazio di Hilbert. Ogni funzionale lineare continuo su H,
f , è univocamente rappresentabile come
f (x) = (yf |x) ,
per ogni x ∈ H ,
dove yf ∈ H. Al variare di f ∈ H0 , yf assume ogni valore in H.
55
Prova. È chiaro che ogni applicazione H 3 x 7→ (y|x) definisce un elemento di H0 per la continuità
del prodotto scalare. D’altra parte si ottengono due diverse applicazioni usando due y differenti:
(y|x) = (y 0 |x) per ogni x ∈ K implica ||y − y 0 ||2 = (y − y 0 |y − y 0 ) = 0 da cui y = y 0 . Quindi
l’applicazione H0 3 f → yf ∈ H se esiste è iniettiva.
Per concludere il teorema è quindi sufficiente provare che per ogni f ∈ H0 esiste yf ∈ H tale che
f (x) = (yf |x) per ogni x ∈ H. Il nucleo di f , Kerf := {x ∈ H | f (x) = 0}, è un sottospazio
chiuso dato che f è continuo. Se Kerf = H allora yf = 0, altrimenti H = Kerf ⊕ (Kerf )⊥ per il
teorema 3.1. Proviamo che (Kerf )⊥ ha dimensione 1. Sia 0 6= y ∈ (Kerf )⊥ . In tal caso f (y) 6= 0
(z)
(y 6∈ Kerf !). Per ogni z ∈ (Kerf )⊥ , il vettore z − ff (y)
y cade in (Kerf )⊥ perché combinazione
lineare di elementi di (Kerf )⊥ , ma anche z −
Quindi z −
f (z)
f (y) y
∈ Kerf ∩ (Kerf )⊥ e dunque
f (z)
f (y) y ∈ Kerf
(z)
z − ff (y)
y = 0.
come si verifica immediatamente.
Quindi y è una base per (Kerf )⊥
dato che ogni altro vettore z ∈ (Kerf )⊥ è una combinazione lineare di y: z =
yf :=
f (z)
f (y) y.
Definiamo
f (y)
y.
(y|y)
Mostriamo che yf rappresenta f nel senso voluto.
Se x ∈ H, possiamo decomporre x rispetto alla decomposizione Kerf ⊕ (Kerf )⊥ ottenendo:
x = n + x⊥ , dove
f (x⊥ )
f (x)
x⊥ =
y=
y
f (y)
f (y)
per quanto provato sopra ed avendo tenuto conto del fatto che f (x⊥ ) = f (x) per linearità essendo f (n) = 0. Il calcolo diretto di (yf |x) fornisce immediatamente: (yf |x) = f (x) concludendo
la dimostrazione. 2.
Corollario. Ogni spazio di Hilbert è riflessivo.
Prova. Prima di tutto notiamo che possiamo mettere su H0 un prodotto scalare definito come
(f |g)0 := (yg |yf ), dove f (x) = (yf |x) e g(x) = (yg |x) per ogni x ∈ H. Si osservi che la norma
indotta da ( | )0 in H0 coincide con la norma naturale di H0 ,
||f || := sup |f (x)| ,
||x||=1
rispetto alla quale H0 è completo per il teorema 2.3. Infatti questa definizione si può scrivere,
per il teorema 3.2:
||f || = sup |(yf |x)| ;
||x||=1
la disuguaglianza di Cauchy-Schwartz implica subito che ||f || ≤ ||yf ||, inoltre vale |(yf |x)| = ||yf ||
se x = yf /||yf ||. Quindi ||f || = ||yf ||, ma quest’ultima è proprio, come volevamo, la norma di f
indotta dal prodotto scalare ( | )0 .
56
Quindi (H0 , (|)0 ) è uno spazio di Hilbert e (H0 )0 il suo duale. Il teorema 3.2 assicura che gli elementi
di (H0 )0 , F , sono tutti e soli quelli per cui esiste qualche gF ∈ H0 tale che F (f ) = (gF |f )0 per
ogni f ∈ H0 . Ma (gF |f )0 = (yf |ygF ) = f (ygF ). Abbiamo cioè che per ogni F ∈ (H0 )0 esiste (ed
è unico per il corollario 3 del teorema di Hahn-Banach) un vettore ygF ∈ H tale che, per ogni
f ∈ H0 :
F (f ) = f (ygF ) .
Questa proprietà altro non è che la riflessività di H. 2
Nota. Dalla dimostrazione del corollario, risulta che lo spazio duale topologico H0 dotato del
prodotto scalare ( | )0 , definito come (f |g)0 := (yg |yf ), è uno spazio di Hilbert. L’applicazione
H0 3 f 7→ yf ∈ H risulta essere anti-lineare, iniettiva e suriettiva e preserva il prodotto scalare
per costruzione. In questo senso H e H0 sono anti isomorfi.
3.2
Basi hilbertiane.
Passiamo ora ad introdurre tutto l’armamentario matematico relativo al concetto di base hilbertiana. Abbiamo bisogno di qualche risultato preliminare.
Chiameremo insieme indiciato, e lo indicheremo con {αi }i∈I , ogni applicazione I 3 i 7→ αi .
L’insieme I è detto insieme degli indici; la coppia (i, αi ), è detto elemento i-esimo dell’insieme indiciato. Si osservi che può accadere che αi = αj con i 6= j.
Definizione 3.4. Se A = {αi }i∈I è un insieme non vuoto di numeri reali non negativi indiciati
sull’insieme I di cardinalità arbitraria, la somma dell’insieme indiciato A è il numero in
[0, +∞) ∪ {+∞} definito come:

X


αj F ⊂ I , F finito .
αi := sup


i∈I
j∈F
X
(3.10)
Nota. D’ora in poi un insieme si dirà numerabile quando può essere messo in corrispondenza
biunivoca con l’insieme dei numeri naturali N. Quindi il caso numerabile non include il caso
finito.
Proposizione 3.2. In riferimento alla definizione 3.4 vale quanto segue.
(a) Se I è finito o numerabile, la somma dell’insieme indiciato A coincide con la somma, ovvero
rispettivamente con la somma della serie {αin }n∈N (che converge sempre, al più a +∞, essendo
serie di termini non negativi) indipendentemente dall’ordinamento, cioè dalla funzione biettiva
N 3 n 7→ in ∈ I.
(b) Se la somma dell’insieme A è finita, allora il sottoinsieme di I per cui αi 6= 0 è finito o
numerabile. In tal caso, restringendosi al sottoinsieme detto, la somma di A coincide con la
somma su un insieme finito di indici o, rispettivamente, la somma di una serie come precisato
57
in (a).
(c) Se µ è la misura che conta i punti di I definita sulla σ-algebra dell’insieme della parti di I
(se J ⊂ I allora µ(J) ≤ +∞ è il numero di elementi di J per definizione), allora
X
Z
αi =
i∈I
αi dµ(i) .
(3.11)
A
Prova. (a) Il caso di I finito è ovvio; consideriamo il caso di I infinito numerabile e supponiamo di
avere scelto un particolare ordinamento di I, per cui possiamo riscrivere A come A = {αin }n∈N .
P
Mostriamo che la somma della serie di elementi {αin }n∈N , ∞
n=0 αin , coincide con la somma nel
senso (3.10) che, per definizione, non dipende dall’ordinamento scelto. Vale, per (3.10):
N
X
αin ≤
n=0
X
αi .
i∈I
E quindi, prendendo il limite per N → +∞, che esiste e coincide con l’estremo superiore
dell’insieme delle ridotte della serie, essendo non decrescente la successione delle ridotte:
+∞
X
αin ≤
n=0
X
αi .
(3.12)
i∈I
D’altra parte, se F ⊂ I è finito, possiamo sempre fissare NF sufficientemente grande in modo
tale che {αi }i∈F ⊂ {αi0 , αi1 , αi2 , . . . , αiNF }. In tal modo
X
αi ≤
NF
X
α in ,
n=0
i∈F
Prendendo l’estremo superiore di entrambi i membri della disuguaglianza precedente al variare
degli insiemi F ⊂ I finiti, e ricordando che l’estremo superiore dell’insieme delle ridotte coincide
con la somma della serie abbiamo:
X
i∈I
αi ≤
+∞
X
αin .
(3.13)
n=0
Le (3.12) e (3.13) implicano la tesi.
(b) sia S < +∞, S ≥ 0, la somma dell’insieme indiciato A. Se S = 0, tutti gli elementi di A
devono essere nulli e la tesi è verificata banalmente. Si supponga che S > 0. È chiaro che ogni αi
è contenuto in [0, S] – altrimenti la somma sarebbe maggiore di S – e in particolare, se αi 6= 0,
allora αi ∈ (0, S]. Poniamo Sn := S/n per n = 1, 2, . . .. Se Nk è il numero di elementi i ∈ I per
P
P
cui αi cade nell’intervallo (Sk , Sk+1 ], sicuramente i∈I αi ≥ Sk Nk , ovvero i∈I αi = +∞ se Nk
è infinito. Quindi Nk deve essere finito per ogni k. Dato che l’unione degli intervalli disgiunti
(Sk , Sk+1 ] è (0, S], ogni αi 6= 0 cade esattamente in uno solo di tali intervalli, che contiene un
numero finito di αi 6= 0 come provato sopra. La cardinalità dell’insieme degli i per cui αi 6= 0 è
quindi al più numerabile perché tale insieme è unione finita o numerabile di insiemi finiti.
58
(c) Notando che ogni funzione è misurabile rispetto alla misura detta (dato che la σ-algebra è
l’insieme delle parti) l’identità (3.11) è immediata conseguenza della definizione di integrale di
una funzione positiva [Rud82]. 2
Passiamo a definire in vari passi il concetto di sistema ortonormale completo ovvero base hilbertiana.
Definizione 3.5. Sia (H, ( | )) spazio con prodotto scalare hermitano e ∅ =
6 N ⊂ H.
(a) N è detto insieme ortogonale se N 63 0 e se x, y ∈ N sono ortogonali quando x 6= y.
(b) N è detto insieme ortonormale se è ortogonale ed ogni suo elemento ha norma (indotta
da prodotto scalare) unitaria.
(c) Se (H, ( | )) è spazio di Hilbert, N è detto sistema ortonormale completo, o equivalentemente base hilbertiana, se è un insieme ortonormale e soddisfa la proprietà:
N ⊥ = {0} .
(3.14)
Nota. È chiaro che un insieme di vettori ortogonali N è linearmente indipendente: se F ⊂
P
P
P
P
P
N è finito e 0 = x∈F αx x, allora 0 = ( x∈F αx x| y∈F αy y) = x∈F y∈F αx αy (x|y) =
P
2
2
2
x∈F |αx | ||x|| . Dato che ||x|| > 0 e |αx | ≥ 0, deve necessariamente essere |αx | = 0 per ogni
x ∈ F . Ossia αx = 0 per ogni x ∈ F .
Teorema 3.3 (Disuguaglianza di Bessel). Siano (H, ( | )) spazio con prodotto scalare
hermitano e N un insieme ortonormale in H. Per ogni x ∈ H
X
|(x|z)|2 ≤ ||x||2 .
(3.15)
z∈N
In particolare solo una quantità numerabile di elementi (x|z) sono non nulli.
Prova. È sufficiente provare (3.15) per i sottoinsiemi F ⊂ N finiti. Se (3.15) vale in tali casi, la
prova nel caso generale, inclusa la proposizione enunciata sotto (3.15), è immediata conseguenza
della definizione 3.4 e di (b) della proposizione 3.2. Dimostriamo dunque la (3.15) per F ⊂ N
finito contenente n elementi z1 , . . . , zn . Siano x ∈ H e α1 , . . . , αn ∈ C. Sviluppando la norma
P
||x − nk=1 αk zk ||2 in termini del prodotto scalare di H e tenendo conto dell’ortonormalità degli
elementi zp e zq e delle proprietà di (anti-)linearità del prodotto scalare, si trova subito che:
2
n
n
n
n
X
X
X
X
2
2
x −
|α
|
−
α
(x|z
)
−
α
z
=
||x||
+
αk (x|zk ) .
k
k
k
k k k=1
k=1
k=1
k=1
Il secondo membro può riscriversi
||x||2 −
n
X
k=1
|(x|zk )|2 +
n €
X
Š
|(x|zk )|2 − αk (x|zk ) − αk (x|zk ) + |αk |2 ,
k=1
59
ossia
2
n
n
n
X
X
X
2
2
x −
α
z
=
||x||
−
|(x|z
)|
+
| (zk |x) − αk |2 .
k k k
k=1
k=1
k=1
È chiaro che il secondo membro ha un unico minimo assoluto per αk = (zk |x), k = 1, . . . , n. In
tal caso si ottiene proprio:
2
n
n
X
X
2
0 ≤ x −
(zk |x)zk = ||x|| −
|(x|zk )|2 ,
k=1
k=1
da cui
n
X
|(x|zk )|2 ≤ ||x||2 .
k=1
Ciò completa la dimostrazione 2.
Lemma 3.1. Sia {xn }n∈N un insieme ortogonale numerabile indicizzato su N nello spazio di
Hilbert (H, ( | )). Sia || || la norma indotta da ( | ). Se
+∞
X
||xn ||2 < +∞ ,
(3.16)
n=0
allora:
(a) esiste, ed è unico, x ∈ H tale che
+∞
X
xn = x ,
(3.17)
n=0
dove la convergenza della serie è intesa come convergenza della successione delle ridotte nella
topologia metrica di || ||;
(b) la serie in (3.18) può essere riordinata, ossia, per ogni f : N → N biettiva,
+∞
X
xf (n) = x .
(3.18)
n=0
Prova.
P
(a) Sia An := nk=0 xk ; dalle proprietà di ortonormalità dei vettori xk e dalla definizione della
norma in termini di prodotto scalare segue subito che, se n > m, allora
n
X
||An − Am ||2 =
||xk ||2 .
k=m+1
Dato che la serie a secondo membro converge per ipotesi,
||An − Am ||2 =
n
X
k=m+1
||xk ||2 ≤
+∞
X
k=m+1
60
||xk ||2 → 0 per m → +∞
e questo implica immediatamente che la successione delle ridotte {An } sia di Cauchy. Dato
che H è completo, esisterà x ∈ H limite di tali successioni e quindi, per definizione, limite della
serie. Dato che H è spazio normato e quindi metrico, vale la proprietà di Hausdorff che implica
l’unicità dei limiti e quindi in particolare quella di x.
P
P
(b) Si fissi f : N → N biettiva. Poniamo come sopra An := nk=0 xn e σn := nk=0 xf (n) . La serie
P
2
a termini positivi +∞
k=0 ||xf (k) || converge perché la sue ridotte sono maggiorate dalle ridotte
P
2
della serie convergente a termini positivi +∞
k=0 ||xk || . Come conseguenza di (a), esisterà il limite
in H delle ridotte σn , ovvero anche la serie riordinata convergerà in H. Mostriamo che la serie
riordinata converge sempre a x.
Se definiamo rn := max{f (0), f (1), . . . , f (n)}, vale allora
X
||Arn − σn ||2 ≤
||xk ||2
k∈Jn
dove Jn si ottiene eliminando dall’insieme
{0, 1, 2, . . . , max{f (0), f (1), . . . , f (n)}}
i numeri f (0), f (1), . . . , f (n). È chiaro che, per la biettività della funzione, i numeri che
rimangono corrisponderanno ad alcuni elementi dell’insieme infinito
{f (n + 1), f (n + 2), . . .} .
Di conseguenza
||Arn − σn ||2 ≤
X
||xk ||2 ≤
k∈Jn
Dato che
P+∞
2
k=0 ||xf (k) ||
+∞
X
||xf (k) ||2 .
(3.19)
k=n+1
< +∞, (3.19) implica che:
lim (Arn − σn ) = 0 .
n→+∞
D’altra parte vale anche rn ≥ n (dato che f è iniettiva, se fosse max{f (0), f (1), . . . , f (n)} < n,
gli f (n) dovrebbero essere n + 1 numeri interi non negativi strettamente inferiori a n e questo è
impossibile) e quindi limn→+∞ rn = +∞ per cui
x = lim An = lim Arn = lim σn .
n→+∞
n→+∞
n→+∞
Questo conclude la dimostrazione. 2
Possiamo quindi enunciare e dimostrare il teorema fondamentale delle basi hilbertiane. Tale teorema prova che le basi hilbertiane soddisfano proprietà che sono dirette generalizzazioni di quelle
delle basi ortonormali negli spazi vettoriali di dimensione finita dotati di prodotto scalare. La
differenza è che ora sono ammesse, usando la topologia di H, anche combinazioni lineari infinite:
ogni elemento dello spazio di Hilbert può essere scritto in modo univoco come una combinazione
61
lineare infinita di elementi di una base hilbertiana.
Si deve osservare che, indipendentemente dal fatto che negli spazi di Hilbert esistano tali basi
hilbertiane, esistono comunque, come conseguenza del lemma di Zorn (o assioma della scelta)
anche basi algebriche che non richiedono alcuna nozione topologica. La differenza tra le basi hilbertiane e quelle algebriche è quindi che le seconde riguardano solo combinazioni lineari finite:
ogni elemento dello spazio vettoriale (in questo caso di Hilbert) può essere scritto in modo univoco come una combinazione lineare finita degli elementi della base (che comunque sono infiniti).
Teorema 3.4. Sia (H, ( | )) spazio di Hilbert e N ⊂ H un insieme ortonormale. I seguenti fatti
sono equivalenti.
(a) N è una base hilbertiana (ossia N è insieme ortonormale e N ⊥ = {0}).
(b) Fissato x ∈ H, una quantità al più numerabile di numeri (z|x) è non nulla per z ∈ N e vale:
x=
X
(z|x)z ,
(3.20)
z∈N
dove la convergenza della serie è intesa come convergenza della successione delle ridotte nella
topologia indotta dal prodotto scalare.
(c) Fissati x, y ∈ H, una quantità al più numerabile di numeri (z|x), (y|z) è non nulla se z ∈ N
e vale:
X
(x|y) =
(x|z)(z|y) .
(3.21)
z∈N
(d) Se x ∈ H, vale, nel senso della definizione 3.4:
||x||2 =
X
|(z|x)|2 .
(3.22)
z∈N
(e) < N > = H, cioè il sottospazio generato da N è denso in H.
Se vale una delle proprietà equivalenti dette sopra, in (3.20), (3.21) non conta l’ordine con cui
si etichettano i coefficienti (x|z), (z|x) = (x|z) e (z|y) non nulli.
Prova.
(a) ⇒ (b). Per il teorema 3.3 solo una quantità al più numerabile di coefficienti (z|x) è non
P
nullo. Indichiamo con (zn |x) tali coefficienti, n ∈ N, e poniamo SN := N
n=0 (zn |x)zn . L’insieme
{(zn |x)zn }n∈N è per costruzione ortogonale, inoltre essendo ||zn || = 1 la disuguaglianza di Bessel
P
2
implica che +∞
Usando (a) del lemma 3.1 segue che la serie (3.20)
n=0 ||(zn |x)zn || < +∞. P
0
converge ad un unico x ∈ H con x0 = +∞
n=0 (zn |x)zn . Inoltre la serie può essere riordinata
pur convergendo allo stesso x0 per (b) di lemma 3.1. Mostriamo che x0 = x. Dalla linearità e
continuità del prodotto scalare si ha che, se z0 ∈ N :
(x − x0 |z0 ) = (x|z0 ) −
X
(x|z)(z|z0 ) = (x|z0 ) − (x|z0 ) = 0
z∈N
dove si è tenuto conto del fatto che l’insieme dei coefficienti z costituisce un insieme ortonormale.
Dato che z0 ∈ N è arbitrario, x − x0 ∈ N ⊥ e quindi x − x0 = 0 in quanto N ⊥ = {0} per ipotesi.
62
Questo prova che (3.20) vale indipendentemente dall’ordine con cui si etichettano i coefficienti
(z|x) 6= 0.
(b) ⇒ (c). Se (b) è valida, (c) è una sua ovvia conseguenza dovuta alla continuità e (anti)linearità del prodotto scalare e al fatto che N è ortonormale.
(c) ⇒ (d). (d) è un caso particolare di (c) quando y = x.
(d) ⇒ (a). Se (d) è vera e se x ∈ H è tale che (x|z) = 0 per ogni z ∈ N , allora ||x|| = 0 ossia
x = 0. In altre parole N ⊥ = {0}, cioè vale (a).
Abbiamo provato che (a),(b),(c) e (d) sono equivalenti. Per concludere notiamo che (b) implica
immediatamente (e), mentre (e) implica (a): se x ∈ N ⊥ allora, per la linearità del prodotto
⊥
scalare, x ∈ < N >⊥ ⊂ < N >⊥ . Ma per (b) del teorema 3.1 < N >⊥ = < N > . Essendo
< N > = H per ipotesi, x ∈ H⊥ = {0}. In altre parole, essendo N ⊥ = {0}, vale (a).
Il fatto che la serie di numeri complessi in (3.21) può essere riordinata arbitrariamente conservandone la somma si ottiene dal seguente ragionamento. Si consideri l’insieme
A := {z | (x|z) 6= 0 oppure (y|z) 6= 0} .
Tale insieme è numerabile. La disuguaglianza di Cauchy-Schwartz in l2 (A) produce:
X
|(x|z)||(z|y)| ≤ (
z∈A
X
|(x|z)|2 )1/2 (
z∈A
P
per (d). Quindi la serie z∈N (x|z)(z|y) =
perché è assolutamente convergente. 2
X
|(y|z)|2 )1/2 < +∞
z∈A
P
z∈A (x|z)(z|y)
può essere riordinata arbitrariamente
Il lemma di Zorn implica immediatamente che ogni spazio di Hilbert ammette una base hilbertiana.
Teorema 3.5. Ogni spazio di Hilbert ammette una base hilbertiana.
Prova. Sia H uno spazio di Hilbert. Consideriamo la classe A i cui elementi sono gli insiemi
ortonormali in H. Definiamo in A la relazione d’ordine parziale data dall’inclusione insiemistica. Per costruzione ogni sottoinsieme ordinato E di A è superiormente limitato dall’elemento
costituito dall’unione degli elementi di E. Per il lemma di Zorn esiste allora in A un elemento
massimale N . Con le definizioni date, la massimalità di N implica che non ci sono in H vettori
normali a tutti gli elementi di N , non nulli e non appartenenti a N stesso. In altre parole, N è
un sistema ortonormale completo.2
Prima di passare al caso degli spazi di Hilbert separabili, diamo ancora un importante risultato
della teoria generale.
Teorema 3.6. Sia H uno spazio di Hilbert con base hilbertiana N . Valgono i seguenti fatti.
(a) H è isomorfo come spazio di Hilbert a L2 (N, µ) dove µ è la misura positiva che conta i punti
63
di N (vedi (6) e (7) in esempi 2.1 e (2) in esempi 3.1); la trasformazione unitaria che identifica
i due spazi è data dall’applicazione
H 3 x 7→ {(z|x)}z∈N ∈ L2 (N, µ) .
(3.23)
(b) Tutte le basi hilbertiane di H hanno la stessa cardinalità (pari a quella di N ), che si dice
dimensione dello spazio di Hilbert.
(c) Se H1 è spazio di Hilbert con la stessa dimensione di H, allora i due spazi sono isomorfi
come spazi di Hilbert.
Prova. (a) L’applicazione U : H 3 x 7→ {(z|x)}z∈N ∈ L2 (N, µ) è ben definita, in quanto, se
x ∈ H e N è una base hilbertiana, allora vale la proprietà (d) del teorema 3.4, la quale afferma
proprio che {(z|x)}z∈N ∈ L2 (N, µ). Tale applicazione è sicuramente iniettiva: se x, x0 ∈ H producono gli stessi coefficienti (z|x) = (z|x0 ) per ogni z ∈ N , allora x = x0 per (b) del teorema 3.4.
P
L’applicazione è anche suriettiva: se {αz }z∈N ∈ L2 (N, µ) e quindi z∈N |αz |2 < +∞, allora
P
per il lemma 3.1 esiste x := z∈N αz z e (z|x) = αz per la continuità del prodotto scalare e
l’ortonormalità dell’insieme N . Infine (c) del teorema 3.4 implica che U sia isometrica. Pertanto
U : H → L2 (N, µ) è un operatore unitario e quindi H e L2 (N, µ) sono isomorfi come spazi di
Hilbert.
(b) Se una delle basi hilbertiane ha cardinalità finita c, allora essa è anche base algebrica di
H. Con la geometria elementare si prova che se esiste una base con cardinalità finita c, allora
ogni altro insieme di vettori linearmente indipendenti M ha cardinalità ≤ c e = c se e solo
se M genera finitamente tutto lo spazio. Tenendo conto che ogni base hilbertiana, in quanto
insieme ortogonale, è costituita da vettori linearmente indipendenti, si conclude facilmente che
ogni base hilbertiana di H deve avere cardinalità sicuramente ≤ c e quindi = c perchè genera
(finitamente) H. Quanto detto esclude anche il caso in cui, in H, una base hilbertiana abbia
cardinalità finita ed un’altra abbia cardinalità infinita. Siano dunque N e M basi hilbertiane
di H entrambe di cardinalità infinita. Se x ∈ M , definiamo Nx := {z ∈ N | (x|z) 6= 0}. Dato
P
che 1 = (z|z) = x∈M |(z|x)|2 , deve accadere che per ogni z ∈ N esiste x ∈ M tale che z ∈ Nx .
Quindi N ⊂ ∪x∈M Nx e allora la cardinalità di N sarà inferiore o uguale a quella di ∪x∈M Nx
che coincide con quella di M dato che ogni insieme Nx è al più numerabile per (b) del teorema
3.4. Quindi la cardinalità di N è inferiore o uguale a quella di M . Scambiando i ruoli di N
ed M si ottiene anche che la cardinalità di M è inferiore o uguale a quella di N . Il teorema di
Schröder-Bernstein implica infine che la cardinalità di M e quella di N coincidano.
(c) Siano N e N1 due basi hilbertiane di H e H1 rispettivamente, e si supponga che N e N1
abbiano la stessa cardinalità. Allora esiste un’applicazione biettiva che identifica i punti di N
con quelli di N1 e tale applicazione genera naturalmente un isomorfismo di spazi con prodotto
scalare V dallo spazio L2 su N allo spazio L2 su N1 rispetto alla misura che conta i punti che
è quindi un isomorfismo tra spazi di Hilbert. Se U1 : H1 → L2 (N1 , µ) è l’isomorfismo analogo a
U : H → L2 (N, µ) descritto sopra, U V U1−1 : H1 → H è una trasformazione unitaria per costruzione e dunque H e H1 sono isomorfi come spazi di Hilbert.2
64
Di particolare interesse in fisica sono i cosiddetti spazi di Hilbert separabili.
Definizione 3.6. Uno spazio di Hilbert si dice separabile se ammette un insieme denso e
numerabile.
Vale un ben noto e utile teorema di caratterizzazione.
Teorema 3.7. Sia H spazio di Hilbert.
(a) H è separabile se e solo se ha dimensione finita oppure ammette una base hilbertiana numerabile.
(b) Se H è separabile, tutte le basi hilbertiane sono finite con lo stesso numero di elementi pari
alla dimensione dello spazio, oppure sono tutte numerabili.
(c) Se H è separabile è isomorfo a Cn dotato del prodotto scalare hermitiano standard con n
finito pari alla dimensione di H, oppure è isomorfo a l2 (N).
Prova. (a) Se lo spazio di Hilbert ammette una base hilbertiana finita o numerabile, allora, in
base a (b) del teorema 3.4, esiste un insieme denso numerabile: quello costituito dalle combinazioni lineari finite di elementi della base usando come coefficienti numeri complessi di parte
reale ed immaginaria razionale. Lasciamo i dettagli della facile dimostrazione al lettore. Supponiamo viceversa che uno spazio di Hilbert sia separabile. Sappiamo che, per il teorema 3.5,
esistono sempre basi hilbertiane in tale spazio: mostriamo che ciascuna di esse deve essere al
più numerabile.
Supponiamo per assurdo che N sia base hilbertiana non numerabile per lo spazio di Hilbert H
separabile. Scelti z, z 0 ∈ N con z 6= z 0 , ogni punto x ∈ H è tale che, per la disuguaglianza triangolare riferita alla norma indotta dal prodotto scalare: ||z − z 0 || ≤ ||x − z 0 || + ||z − x||. D’altra parte
essendo {z, z 0 } un insieme ortonormale
||z − z 0 ||2 = (z − z 0 |z − z 0 ) = ||z||2 + ||z 0 ||2 + 0 = 1 + 1 = 2.
√
0
Quindi ||x −
implica immediatamente che palle aperte di
√ z|| + ||x − z || ≥ 2. Questo risultato
raggio < 2/2 centrate rispettivamente in z e z 0 sono disgiunte comunque scegliamo z, z 0 ∈ N
con z 6= z 0 . Sia {B(z)}z∈N una classe di tale palle disgiunte a due a due e ciascuna centrata sul
rispettivo z ∈ N . Se D ⊂ H è l’insieme denso e numerabile che esiste per l’ipotesi di separabilità,
dovrà accadere che, per ogni z ∈ N , esiste x ∈ D con x ∈ B(z). Dato che le palle sono disgiunte,
avremo un diverso x per ogni palla. Ma la cardinalità di {B(z)}z∈N non è numerabile, per cui
nemmeno D può essere numerabile e questo è assurdo.
(b) e (c) sono immediate conseguenze del teorema 3.6. Tuttavia, per completezza diamo una
traccia di una dimostrazione di esse.
(b) Come è noto dalla teoria elementare, se una base (hilbertiana o no) ha un numero finito di
elementi, allora tutte le altre basi (hilbertiane o no) hanno lo stesso numero di elementi pari alla
dimensione dello spazio; inoltre, tutti gli insiemi di vettori linearmente indipendenti (come le
basi hilbertiane) contengono un numero di elementi che non supera la dimensione dello spazio.
Da questo fatto segue immediatamente che, se uno spazio di Hilbert è separabile ed una sua base
hilbertiana è finita, allora tutte le basi hilbertiane dello spazio sono finite con lo stesso numero
di elementi pari alla dimensione dello spazio. Nelle stesse ipotesi, se una base hilbertiana è
65
numerabile allora tutte le altre basi hilbertiane devono essere numerabili per (a).
(c) Fissata una base hilbertiana N ed usando il teorema 3.4, si verifica immediatamente che
P
l’applicazione che trasforma H 3 x = u∈N αu u nell’insieme (finito o infinito a seconda del
caso) {αu }u∈N è un isomorfismo di spazi con prodotto scalare da H a Cn , oppure, da H a l2 (N),
a seconda che la dimensione di H sia finita oppure non lo sia. 2
Un’altra utile proposizione per spazi di Hilbert separabili è la seguente.
Proposizione 3.4. Sia (H, ( | )) spazio di Hilbert con H 6= {0}. Valgono i seguenti fatti.
(a) Se Y := {yn }n∈N è un insieme di vettori linearmente indipendenti e tali che Y ⊥ := {0}
o equivalentemente < Y > = H. Allora H è separabile ed esiste una base hilbertiana di H,
X := {xn }n∈N , tale che, per ogni p ∈ N, il sottospazio generato dai vettori y0 , y1 , . . . , yp coincide
con quello generato dai vettori x0 , x1 , . . . , xp .
(b) Se H è separabile e S ⊂ H è un sottospazio (non chiuso) di H denso in H, allora S contiene
una base hilbertiana di H.
Prova. (a) Diamo solo una traccia della dimostrazione perché si tratta essenzialmente della
procedura di ortogonalizzazione di Gram-Schmidt, nota dai corsi di geometria elementare.
Per ipotesi è y0 6= 0. Poniamo quindi x0 := y0 /||y0 ||. Successivamente consideriamo il vettore
non nullo (perché y0 e y1 sono linearmente indipendenti) z1 := y1 − (x0 |y1 )x0 . È chiaro che
x0 , z1 sono non nulli, ortogonali (quindi linearmente indipendenti) e generano la stesso spazio
di y0 e y1 . Non resta che porre x1 := z1 /||z1 || per ottenere l’insieme ortonormale {x0 , x1 } che
genera lo stesso spazio di y0 , y1 . Possiamo ora ripetere la procedura definendo induttivamente
l’insieme di vettori:
zn := yn −
n−1
X
(xk |yn )xk ,
k=0
e quindi quello dei vettori xn := zn /||zn ||. Per induzione si verifica facilmente che i vettori
z0 , . . . , zk sono non nulli, ortogonali (quindi linearmente indipendenti) e generano lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk ; di conseguenza i vettori x0 , . . . , xk
formano un insieme ortonormale che genera lo stesso spazio generato dai vettori linearmente
indipendenti y0 , . . . , yk . Se u ⊥ yn per ogni n ∈ N, allora vale anche (scrivendo gli xn come
combinazione lineare di y0 , . . . , yn ) u ⊥ xn per ogni n ∈ N e viceversa (scrivendo ogni yn come
combinazione lineare di x0 , . . . , xn ). Quindi X ⊥ = Y ⊥ = {0} e dunque X è una base hilbertiana
per H.
(b) S deve contenere un sottoinsieme S0 numerabile e denso in H. Sia infatti {yn }n∈N un insieme
denso e numerabile in H. Per ogni yn ci sarà una successione {xnm }m∈N ⊂ S tale che xnm → yn
per m → +∞. Si verifica subito che il sottoinsieme numerabile di S, S0 := {xn,m }(n,m)∈N×N , è
ancora denso in H. Rietichettiamo gli elementi di S0 sui naturali in modo che x1 6= 0. Avremo dunque S0 = {xq }q∈N e dividiamo S0 in due sottoinsiemi S1 , che conterrà almeno x1 per
definizione, e S2 nel modo seguente. Se x2 è linearmente indipendente da x1 includiamo x2
in S1 altrimenti lo includiamo in S2 . Se x3 è linearmente indipendente dagli elementi in S1
66
lo includiamo in S1 altrimenti lo includiamo in S2 . Procediamo in questo modo per tutti gli
elementi di S0 . S1 conterrà, per costruzione, un insieme di generatori di S0 . In questo modo
< S1 >=< S0 >⊃ S0 sarà un insieme denso in H e composto da vettori linearmente indipendenti. Inoltre, visto che S ⊃ S1 è sottospazio vettoriale, posto Y := S0 , avremo che la procedura di
costruzione di un sistema ortonormale completo tramite combinazioni lineari finite di elementi
di Y descritta in (a), produce una base hilbertiana di elementi di S stesso. 2
Esempi 3.2.
(1) Consideriamo lo spazio di Hilbert L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.1), dove dx è
la solita misura di Lebesgue sui boreliani di R e L > 0. Consideriamo le funzioni misurabili
(perché continue) definite come, per n ∈ Z e x ∈ [−L/2, L/2],
2πn
ei L x
fn (x) := √
.
L
(3.24)
Si verifica immediatamente che le funzioni fn appartengono allo spazio considerato e costituiscono un insieme ortonormale rispetto al prodotto scalare di L2 ([−L/2, L/2], dx) (vedi (2) in
esempi 3.1)
(f |g) :=
Z L/2
f (x)g(x)dx .
(3.25)
−L/2
Consideriamo l’algebra di Banach di funzioni continue C([−L/2, L/2]) (che è sottospazio di
L2 ([−L/2, L/2], dx)) con norma data dalla norma dell’estremo superiore ((4) e (5) in esempi
2.1). Il sottospazio vettoriale S di C([−L/2, L/2]) generato da tutti i vettori fn , n ∈ Z, è
una sottoalgebra di C([−L/2, L/2]). S contiene 1, è chiusa rispetto alla coniugazione complessa e, come è facile provare, separa i punti di [−L/2, L/2] (l’insieme delle funzioni fn da
solo separa i punti), per cui, per il teorema di Stone-Weierstrass ((5) in esempi 2.1), è densa
in C([−L/2, L/2]). D’altra parte è noto che le funzioni continue di [−L/2, L/2] costituiscono uno spazio vettoriale denso in L2 ([−L/2, L/2], dx) nella topologia di quest’ultimo ([Rud82]
p.85); infine la topologia di C([−L/2, L/2]) è più forte di quella di L2 ([−L/2, L/2], dx), valendo (f |f ) ≤ L sup |f |2 = L(sup |f |)2 se f ∈ C([−L/2, L/2]). Ne consegue che S è denso in
L2 ([−L/2, L/2], dx). Per (e) del teorema 3.4, i vettori fn costituiscono una base hilbertiana di
L2 ([−L/2, L/2], dx), che di conseguenza risulta anche essere separabile.
(2) Consideriamo lo spazio di Hilbert L2 ([0, 1], dx), dove dx è la misura di Lebesgue. Come nell’esempio precedente l’algebra di Banach C([0, 1]) è sottospazio denso in L2 ([0, 1], dx) nella topologia di quest’ultimo. Definiamo ora, diversamente dall’esempio precedente, per n = 0, 1, 2, . . .,
x ∈ [0, 1]:
gn (x) := xn .
(3.26)
Si dimostra subito che i vettori scritti sopra sono linearmente indipendenti. Il sottospazio vettoriale S di C([0, 1]) generato da tutti i vettori gn , n ∈ N, è una sottoalgebra di C([0, 1]). S
contiene 1, è chiusa rispetto alla coniugazione complessa e separa i punti, per cui, per il teorema
di Stone-Weierstrass, è densa in C([0, 1]) e anche in L2 ([0, 1], dx), ragionando come nell’esempio
67
precedente. La differenza dal caso precedente è che ora che le funzioni gn non costituiscono un
insieme ortonormale. Tuttavia, usando la proposizione 3.4 si costruisce immediatamente un sistema ortonormale completo per L2 ([0, 1], dx). Gli elementi di tale base hilbertiana si chiamano
i polinomi di Legendre.
(3) I due esempi precedenti esibiscono due spazi L2 separabili. Si può provare che Lp (X, µ)
(1 ≤ p < +∞) è separabile se e solo se la misura µ è separabile, cioè ammette un sottoinsieme
denso e numerabile lo spazio metrico costruito sul sottoinsieme della σ-algebra Σ della misura µ
contenente insiemi di misura finita, prendendo il quoziente rispetto alla relazione di equivalenza
che identifica insiemi che differiscono per insiemi di misura nulla, e infine definendo la distanza
come:
d(A, B) := µ((A \ B) ∪ (B \ A)) .
A tal fine vale la seguente proposizione sulle misure separabili.
Proposizione (misure e spazi Lp separabili). Una misura positiva σ-additiva µ, e quindi
Lp (X, µ), è separabile se µ è σ-finita (cioè X è unione numerabile di insiemi di misura finita) ed
esiste una classe al più numerabile di insiemi misurabili la σ-algebra generata dai quali coincide
con quella della misura µ. [Hal69]
Si osservi che, di conseguenza, come corollario.
Proposizione (misure di Borel e spazi Lp separabili). Ogni misura di Borel σ-finita riferita ad uno spazio topologico a base numerabile produce spazi Lp separabili.
In particolare questo accade per la misura di Lebesgue su Rn ristretta ai boreliani e quindi anche
per gli Lp riferiti alla misura di Lebesgue stessa, dato che tali spazi Lp sono isomorfi, come spazi
di Banach, ai corrispondenti ottenuti dalla misura ristretta alla σ-algebra di Borel (le eventuali
funzioni misurabili aggiunte cadono nella classe di equivalenza della funzione nulla). Le misure
di Borel positive definite su spazi di Hausdorff localmente compatti si chiamano misure di Radon
se sono regolari e i compatti hanno misura finita. Una misura di Radon è σ-finita se lo spazio
su cui è definita è σ-compatto, cioè unione numerabile di compatti.
(4) Consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura
di Lebesgue su R. Sussiste la seguente utilissima proposizione dopo avere introdotto la trasformata di Fourier e Fourier-Plancherel (proposizione 3.14):
Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f (x) = 0} ha misura nulla, (2)
esistono C, δ > 0 per cui |f (x)| < Ce−δ|x| per ogni x ∈ (a, b).
In questo caso lo spazio lineare finitamente generato da tutte le funzioni x 7→ xn f (x) per
n = 0, 1, 2, . . . è denso in L2 ((a, b), dx).
L’importanza di questo risultato è che consente di costruire facilmente delle basi hilbertiane in
L2 ((a, b), dx) anche se a o b sono infiniti (per cui non è possibile usare Stone-Weierstrass). Infatti,
la procedura di ortogonalizzazione di Gram-Schmidt applicata ai vettori fn , con fn (x) := xn f (x),
fornisce una base hilbertiana, secondo la procedura illustrata in proposizione 3.4.
2
A titolo di esempio, se f (x) := e−x /2 , la procedura di Gram-Schmidt definisce la base hilbertiana
2
di L2 (R, dx) delle cosiddette funzioni di Hermite, che hanno tutte la forma ψn (x) := Hn (x)e−x /2
dove Hn è un polinomio di grado n = 0, 1, 2, . . . chiamato n-esimo polinomio di Hermite. Nella
Meccanica Quantistica questa base hilbertiana è importante quando si studia il sistema fisico
68
detto oscillatore armonico unidimensionale. Il calcolo diretto con procedura di Gram-Schmidt
2
mostra che ψ0 = π −1/4 e−x /2 e i successivi elementi sono individuati dalla la relazione di ricord
renza ψn+1 = (2(n + 1))−1/2 (x − dx
)ψn .
Con la stessa procedura ed usando f (x) := e−x si trova una base hilbertiana di L2 ((0, +∞), dx)
data dalle cosiddette funzioni di Laguerre, che sono della forma e−x Ln (x) con n = 0, 1, . . .. Ogni
polinomio Ln è di grado n e si dice n-esimo polinomio di Laguerre. In Meccanica Quantistica
questa base hilbertiana è importante quando si lavora con sistemi fisici con simmetria sferica,
come l’atomo di idrogeno.
(5) Consideriamo lo spazio di Hilbert separabile L2 (Rn , dx) (dove dx denota la solita misura di
Lebesgue sui Boreliani di Rn ). È un fatto noto [Vla81] che gli spazi di funzioni su Rn infinitamente differenziabili, a valori reali (o complessi) e, rispettivamente, a supporto compatto oppure
che decrescono all’infinito più rapidamente di ogni potenza negativa di |x|, sono sottospazi di
Lp (Rn , dx), (1 ≤ p < ∞) densi in questi spazi. Consegue immediatamente da (b) di proposizione
3.4 che tali sottospazi contengono basi hilbertiane di L2 (Rn , dxn ).
3.3
Nozione di aggiunto e applicazioni.
Esaminiamo ora una delle più importanti nozioni della teoria degli operatori in uno spazio di
Hilbert: la nozione di operatore aggiunto (hermitiano). In questa sezione considereremo solo il
caso di operatori limitati. Il caso generale sarà trattato più avanti.
3.3.1
L’operazione di coniugazione hermitiana o aggiunzione.
Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Consideriamo, per u ∈ H2 fissato,
l’applicazione:
H1 3 v 7→ (u|T v)2 ∈ C .
(3.27)
L’applicazione di sopra è sicuramente lineare ed anche limitata: |(u|T v)2 | ≤ ||u||2 ||T || ||v||1 . Si
tratta dunque di un elemento di H01 . Per il teorema di Riesz (teorema 3.2), esisterà wT,u ∈ H1
tale che
(u|T v)2 = (wT,u |v)1 , per ogni v ∈ H1 .
(3.28)
Possiamo ancora notare che l’applicazione H2 3 u 7→ wT,u è lineare. Infatti:
(wT,αu+βu0 |v)1 = (αu + βu0 |T v)2 = α(u|T v)2 + β(u0 |T v)2 = (αwT,u + βwT,u0 |v)1 ,
per cui, per ogni v ∈ H,
0 = (wT,αu+βu0 − αwT,u − βwT,u0 |v)1 ;
scegliendo v := wT,αu+βu0 − αwT,u − βwT,u0 , si ha che deve essere wT,αu+βu0 − αwT,u − βwT,u0 = 0
e quindi
wT,αu+βu0 = αwT,u + βwT,u0
69
per ogni α, β ∈ C e u, u0 ∈ H2 . Quindi esiste un operatore lineare T ∗ : H2 3 u 7→ wT,u ∈ H1 .
Questo operatore soddisfa (u|T v)2 = (T ∗ u|v)1 per ogni coppia u ∈ H2 , v ∈ H1 ed è l’unico
operatore lineare a soddisfare questa identità. Se ci fosse un altro operatore B ∈ L(H2 , H1 ) che
soddisfa l’identità detta, varrebbe anche (T ∗ u|v)1 = (Bu|v)1 per ogni v ∈ H1 . Di conseguenza
avremmo che ((T ∗ − B)u|v)1 = 0 per ogni v ∈ H1 . Scegliendo v := (T ∗ − B)u si ha che deve
essere ||(T ∗ − B)u||21 = 0 e quindi T ∗ u − Bu = 0. Dato che u ∈ H2 è arbitrario, deve infine valere
T ∗ = B. Abbiamo in definitiva provato che vale la proposizione seguente.
Proposizione 3.5. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ).
Esiste ed è unico un operatore lineare T ∗ : H2 → H1 tale che:
(u|T v)2 = (T ∗ u|v)1 ,
per ogni coppia u ∈ H2 , v ∈ H1 .
(3.29)
Possiamo dare la definizione di operatore aggiunto hermitiano. Nel seguito ometteremo l’aggettivo “hermitiano”, dato che in queste dispense non lavoreremo mai con operatori aggiunti non
hermitiani, definibili lavorando con spazi di Banach senza usare la struttura di spazio di Hilbert.
Definizione 3.7. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ).
L’unico operatore lineare T ∗ ∈ L(H2 , H1 )che soddisfa (3.29) si dice aggiunto (hermitiano) o
anche coniugato hermitiano dell’operatore T .
L’operazione di coniugazione hermitiana gode delle seguenti proprietà elementari. Ricordiamo
che dato un operatore lineare tra due spazi vettoriali, T : X → Y, Ran(T ) := {T (x) | x ∈ X} e
Ker(T ) := {x ∈ X | T (x) = 0} indicano rispettivamente is ottospazi di Y e X rispettivamente
detti il rango (o immagine) dell’operatore T e il nucleo dell’operatore T .
Proposizione 3.6. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) due spazi di Hilbert e T ∈ B(H1 , H2 ). Valgono
i seguenti fatti.
(a) T ∗ ∈ B(H2 , H1 ) e più precisamente
||T ∗ || = ||T || ,
∗
(3.30)
∗
2
||T T || = ||T || = ||T T || .
(3.31)
(b) L’operazione di coniugazione hermitiana è involutiva:
(T ∗ )∗ = T .
(c) Se, rispettivamente, S ∈ B(H1 , H2 ) e α, β ∈ C, oppure S ∈ B(H1 , H), con H spazio di
Hilbert, valgono le identità
(αT + βS)∗ = αT ∗ + βS ∗ ,
∗
(T S)
∗
∗
= S T .
70
(3.32)
(3.33)
(d) Vale
Ker(T ) = [Ran(T ∗ )]⊥ ,
Ker(T ∗ ) = [Ran(T )]⊥ .
(3.34)
(e) T è biettivo se e solo se T ∗ è biettivo. In tal caso vale: (T ∗ )−1 = (T −1 )∗ .
Prova. Ometteremo nel seguito la specificazione della norma e del prodotto scalare e scriveremo,
per esempio, || || indifferentemente per || ||1 e || ||2 . Quale norma o prodotto scalare sia in uso
sarà chiaro dal contesto.
(a) Per ogni coppia u ∈ H2 , x ∈ H1 vale |(T ∗ u|x)| = |(u|T x)| ≤ ||u|| ||T || ||x||. Scegliendo
x := T ∗ u si ha in particolare ||T ∗ u||2 ≤ ||T || ||u|| ||T ∗ u|| e quindi ||T ∗ u|| ≤ ||T || ||u||. Quindi
T ∗ è limitato e ||T ∗ || ≤ ||T ||. Ha senso quindi definire (T ∗ )∗ ed ottenere ||(T ∗ )∗ || ≤ ||T ∗ ||.
Questa disuguaglianza si può riscrivere ||T || ≤ ||T ∗ || per (b), la cui dimostrazione usa solo il
fatto che T ∗ sia limitato. Poiché ||T ∗ || ≤ ||T || e ||T || ≤ ||T ∗ || vale, (3.30). Passiamo a dimostrare
(3.31). È sufficiente dimostrare la prima delle due identità, la seconda segue dalla prima e da
(3.30). Notiamo che, per (b)(i) del teorema 2.3, la cui tesi vale banalmente anche per operatori
S ∈ B(Y, X), T ∈ B(Z, Y) con X, Y, Z spazi normati, ||T ∗ T || ≤ ||T ∗ || ||T || = ||T ||2 . D’altra
parte:
||T ||2 = ( sup ||T x||)2 = sup ||T x||2 = sup (T x|T x) .
||x||≤1
||x||≤1
||x||≤1
Usando la definizione di aggiunto e poi la disuguaglianza di Cauchy-Schwartz sull’ultimo termine
della catena di uguaglianze scritte sopra, troviamo che :
||T ||2 = sup (T x|T x) = sup |(T ∗ T x|x)| ≤ sup ||T ∗ T x|| = ||T ∗ T || .
||x||≤1
||x||≤1
||x||≤1
In definitiva abbiamo ottenuto che ||T ∗ T || ≤ ||T ||2 e ||T ||2 ≤ ||T ∗ T ||, per cui vale ||T ∗ T || = ||T ||2 .
(b) Segue immediatamente dall’unicità dell’operatore aggiunto, valendo, per le note proprietà
del prodotto scalare e per la stessa definizione di operatore aggiunto dell’operatore T :
(v|T ∗ u) = (T ∗ u|v) = (u|T v) = (T v|u) .
(c) Se u ∈ H2 , v ∈ H1
(u|(αT + βS)v) = α(u|T v) + β(u|Sv) = α(T ∗ u|v) + β(S ∗ u|v) = ((αT ∗ + βS ∗ )u|v) .
Per l’unicità dell’operatore aggiunto vale (3.32). Se v ∈ H, u ∈ H2
(u|(T S)v) = (T ∗ u|Sv) = ((S ∗ T ∗ )u|v) .
Per l’unicità dell’operatore aggiunto vale (3.33).
(d) È sufficiente provare la prima delle due identità, la seconda segue subito dalla prima usando
(b). Dato che (T ∗ u|v) = (u|T v), se v ∈ Ker(T ) allora (T ∗ u|v) = 0 per ogni u ∈ H2 e quindi
v ∈ [Ran(T ∗ )]⊥ . Viceversa, sempre per (T ∗ u|v) = (u|T v), se v ∈ [Ran(T ∗ )]⊥ , allora (u|T v) = 0
per ogni u ∈ H2 . Scegliendo u := T v segue che T v = 0 e quindi v ∈ Ker(T ).
71
(e) Se T è biettivo allora T −1 è limitato per il teorema di Banach dell’operatore inverso. Di conseguenza esiste (T −1 )∗ . Vale: T −1 T = T T −1 = I. Calcolando l’aggiunto ad ambo membri, usando
la seconda proprietà in (c) e tenendo conto che I ∗ = I, abbiamo: T ∗ (T −1 )∗ = (T −1 )∗ T ∗ = I.
Queste identità sono equivalenti a dire che T ∗ è biettivo e che (T ∗ )−1 = (T −1 )∗ . Infine, se T ∗ è
biettivo, allora, per quanto appena provato, lo deve essere anche (T ∗ )∗ = T per (b). 2
3.3.2
∗
-algebre e C ∗ -algebre.
L’operazione di coniugazione hermitiana consente di introdurre uno dei concetti matematici più
utili nelle formulazioni avanzate della Meccanica Quantistica: stiamo parlando della la struttura
di C ∗ -algebra (anche detta B ∗ -algebra). Torneremo ad usare tale struttura nel capitolo 8 in
relazione al teorema di decomposizione spettrale.
Definizione 3.8. Sia A un’algebra (commutativa, con unità, normata con norma || ||, di
Banach) sul campo C. Se esiste un’applicazione ∗ : A → A che gode delle seguenti proprietà:
I1. (antilinearità) (αx + βy)∗ = αx∗ + βy ∗ per ogni x, y ∈ A, α, β ∈ C,
I2. (involutività) (x∗ )∗ = x per ogni x ∈ A,
I3. (xy)∗ = y ∗ x∗ per ogni x, y ∈ A,
tale applicazione è detta involuzione e la struttura (A,∗ ) si dice ∗ -algebra (rispettivamente
commutativa, con unità, normata, di Banach).
Una ∗ -algebra di Banach (con unità) si dice C ∗ -algebra (rispettivamente con unità) se vale la
ulteriore proprietà
||x∗ x|| = ||x||2 .
(3.35)
Un omomorfismo tra due ∗ -algebre: f : A → B è detto ∗ -omomorfismo se preserva l’involuzione: f (x∗ ) = f (x)∗ per ogni x ∈ A (dove ∗ a primo membro indica l’involuzione in A e quella
a secondo membro indica l’involuzione in B), ed detto ∗ -isomorfismo se è anche biettivo.
Un elemento x di una ∗ -algebra è detto normale se xx∗ = x∗ x ed è detto hermitiano se x∗ = x.
Prima di tornare alla C ∗ -algebra B(H), diamo alcune immediate proprietà generali delle ∗algebre che seguono dalla stessa definizione.
Proposizione 3.7. Sia A una ∗-algebra. Indicando con ∗ l’involuzione in A, vale quanto segue.
(a) Se A è C ∗ -algebra con norma || || e x ∈ A è normale, allora, per ogni m = 1, 2, . . .:
||xm || = ||x||m .
(b) Se A è C ∗ -algebra con norma || || e x ∈ A, allora
||x∗ || = ||x|| .
(c) Se A ammette unità I, vale I∗ = I.
72
Prova. (a) Se ||x|| = 0 la tesi eovvia. Supponiamo x 6= 0 Usando ripetutamente (3.35), I2 e I3
e il fatto che xx∗ = x∗ x:
||x2 ||2 = ||(x2 )∗ x2 || = ||(x∗ )2 x2 || = ||(x∗ x)∗ (x∗ x)|| = ||x∗ x||2 = (||x||2 )2
k
da cui ||x2 || = ||x||2 per la positività della norma. Iterando la procedura si prova che ||x2 || =
k
||x||2 per ogni naturale k. Se m = 3, 4, . . . esistono due naturali n, k tali che m + n = 2k . In
questo modo:
||x||m ||x||n = ||x||n+m = ||xn+m || ≤ ||xm || ||xn || ≤ ||xm || ||x||n ≤ ||x||m ||x||n .
Ma allora tutte le disuguaglianze devono essere uguaglianze, in particolare:
||xm || ||x||n = ||x||m ||x||n
e pertanto, dividendo per ||x||m (che è non nullo perché x 6= 0 e || · || è una norma) si ha la tesi.
(b) (3.35) implica che ||x||2 = ||xx∗ || ≤ ||x|| ||x∗ || da cui ||x|| ≤ ||x∗ ||. Nello stesso modo
||x∗ || ≤ ||(x∗ )∗ ||, ma (x∗ )∗ = x da cui la tesi.
(c) II∗ = I∗ (1) per definizione di unità; d’altra parte II∗ = (I∗ )∗ I∗ = (I∗ I)∗ (2). Da (1) e (2)
segue che I∗ = (I∗ I)∗ = (I∗ )∗ = I. 2
Esempi 3.3.
(1) Le algebre di Banach di funzioni a valori complessi viste negli esempi (2),(3),(4),(8) e (9)
in esempi 2.1 sono tutte C ∗ -algebre commutative in cui l’involuzione è data dalla coniugazione
complessa delle funzioni.
(2) Abbiamo immediatamente che, in virtù di (a), (b) e (c) in proposizione 3.6:
l’algebra di Banach B(H) è anche una C ∗ -algebra se l’involuzione è definita come la coniugazione hermitiana e gli operatori autoaggiunti (vedi successiva definizione 3.9) coincidono con gli
elementi hermitiani di B(H).
(3) Un esempio di C ∗ -algebra, fondamentale per le applicazioni di teoria quantistica dei campi
(ma non solo) è l’algebra di von Neumann. Se M è un sottoinsieme dello spazio di Hilbert
complesso H, il commutante di M è definito come:
M0 := {T ∈ B(H) | T A − AT = 0
per ogni A ∈ M} .
Se M è chiuso sotto l’operazione di coniugazione hermitiana (cioé A∗ ∈ M se A ∈ M) il commutante M0 è sicuramente una ∗-algebra con unità . Nel caso generale vale: M01 ⊂ M02 se M2 ⊂ M1
e anche M ⊂ (M0 )0 , che implicano M0 = ((M0 )0 )0 , per cui iterando l’operazione di calcolo del
commutate non si supera il secondo commutante.
Dalla continuità del prodotto operatoriale, che il commutante M 0 è chiuso nella topologia uniforme e quindi, se M è chiuso rispetto alla coniugazione hermitiana, il suo commutante M0 è una
C ∗ -algebra (sotto C ∗ -algebra) di B(H).
73
M0 ha altre fondamentali proprietà topologiche nel caso generale. Si dimostra facilmente che M0
è chiuso rispetto alla topologia operatoriale forte e rispetto alla topologia operatoriale debole.
Il risultato vale indipendentemente dal fatto che il prodotto di operatori non è congiuntamente
continuo nei due argomenti, dato che è sufficiente la continuità separatamente nei due argomenti.
Nel seguito, come di consuetudine nella teoria della algebre di von Neumann, scriveremo M00 al
posto di (M0 )0 e via di seguito. Vale il seguente fondamentale teorema dovuto a von Neumann,
detto [BrRo02]:
Teorema (del doppio commutante).
Se A è una sotto ∗-algebra di B(H), con H spazio di Hilbert complesso, i seguenti fatti sono
equivalenti.
(a) A = A00 .
(b) A è chiusa rispetto alla topologia operatoriale debole e I ∈ A.
(c) A è chiusa rispetto alla topologia operatoriale forte e I ∈ A.
Che (a) implichi (b) che, a sua volta, implichi (c) è abbastanza facile da provare. Il punto difficile
è dimostrare che (c) implichi (a). Un’algebra di von Neumann in B(H) è una sotto ∗-algebra
che soddisfi una delle proprietà equivalenti del teorema di von Neumann citato sopra. Quindi,
in particolare M0 è sempre un’algebra di von Neumann se M è un sottoinsieme di B(H), valendo
(M0 )00 = M0 come visto sopra. Si osservi anche che, per costruzione, un’algebra di von Neumann
in B(H) è una C ∗ -algebra, più precisamente una sotto C ∗ -algebra di B(H).
Si verifica subito che l’intersezione di due algebre di von Neumann è ancora un’algebra di von
Neumann. Se M ⊂ B(H), M00 risulta essere la più piccola (nel senso dell’intersezione) algebra
di von Neumann che include M come sottoinsieme [BrRo02]. Pertanto M00 si chiama l’algebra
di von Neumann generata da M.
3.3.3
Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi.
Tornando alla C ∗ -algebra B(H) (ma anche più in generale a B(H, H1 )), possiamo dare alcune
definizioni riguardanti i più importanti tipi di operatori.
Definizione 3.9. Siano (H, ( | )) e (H1 , ( | )1 ) spazi di Hilbert e si denotino con IH e IH1 , rispettivamente, gli operatori identità su H e H1 .
(a) T ∈ B(H) è detto normale se T T ∗ = T ∗ T .
(b) T ∈ B(H) è detto autoaggiunto se T = T ∗ .
(c) T ∈ L(H, H1 ) è detto isometrico se è limitato e T ∗ T = IH ; equivalentemente T ∈ L(H, H1 )
è isometrico se (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H.
(d) T ∈ L(H, H1 ) è detto unitario se è limitato e T ∗ T = IH , T T ∗ = IH1 ; equivalentemente
T ∈ L(H, H1 ) è unitario se è isometrico e suriettivo.
(e) T ∈ L(H) è detto positivo, e si scrive T ≥ 0, se (u|T u) ≥ 0 per ogni u ∈ H.
(f ) Se U ∈ L(H), si dice che T maggiora U , e si scrive T ≥ U , se T − U ≥ 0.
74
Osservazioni.
(1) Si osservi, a commento di (c), che se T ∈ B(H, H1 ) e T ∗ T = IH , allora vale (T x|T y)1 = (x|y)
per ogni coppia x, y ∈ H in quanto (x|y) = (x|T ∗ T y) = (T x|T y)1 . Viceversa, se T ∈ L(H, H1 ) e
vale (T x|T y)1 = (x|y) per ogni x, y ∈ H, allora T è limitato (basta porre y = x) e dunque esiste
T ∗ ; infine vale T ∗ T = IH perché (x|T ∗ T y) = (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H e quindi
in particolare (x|(T ∗ T − I)y) = 0 con x = (T ∗ T − I)y.
A commento di (d) si osservi che ogni operatore isometrico T è ovviamente iniettivo, perché
T u = 0 implica ||u|| = 0 e quindi u = 0. Allora la surgettività è equivalente all’esistenza di
un’inversa destra che coincida con quella sinistra, che esiste già per l’iniettività ed è T ∗ . Da
ciò segue immediatamente che T ∗ T = IH e T T ∗ = IH1 è equivalente a dire che T ∈ L(H, H1 )
è isometrico (e quindi limitato) ed è anche suriettivo. (La definizione data qui di operatore
unitario è quindi in accordo con la definizione 3.3).
(2) Esistono operatori isometrici in B(H) che non sono operatori unitari (ovviamente ciò non
accade se H ha dimensione finita). Un esempio è l’operatore sullo spazio l2 (N):
A : (z0 , z1 , z2 , . . .) 7→ (0, z0 , z1 , , . . .) ,
per ogni (z0 , z1 , z2 , . . .) ∈ l2 (N).
(3) Gli operatori unitari in B(H) e quelli autoaggiunti sono operatori normali, ma non vale il
viceversa in generale.
Per concludere questa sezione, restringendoci a lavorare con un unico spazio di Hilbert, diamo
alcune proprietà elementari degli operatori normali, autoaggiunti, unitari e positivi nella seguente proposizione preceduta da una definizione.
Definizione 3.10. Siano X spazio vettoriale sul campo K e T ∈ L(X); λ ∈ K è detto autovalore
dell’operatore T se
T u = λu
(3.36)
per qualche u ∈ X \ {0}. In tal caso u è detto autovettore di T con autovalore λ (o associato
all’autovalore λ). Il sottospazio di tutti gli autovettori con autovalore λ è detto autospazio di
T con autovalore λ (o associato all’autovalore λ).
Proposizione 3.8. Sia (H, ( | )) spazio di Hilbert.
(a) Se T ∈ B(H) è autoaggiunto, allora:
||T || = sup {|(x|T x)| | x ∈ H , ||x|| = 1} .
(3.37)
Più in generale, se T ∈ L(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H ed il secondo membro di
(3.37) è finito, allora T è limitato.
(b) Se T ∈ B(H) è normale (e quindi in particolare autoaggiunto oppure unitario):
(i) λ ∈ C è autovalore di T con autovettore u se e solo se λ è autovalore per T ∗ con lo stesso
autovettore u;
75
(ii) autospazi di T con autovalori distinti sono ortogonali.
(c) Sia T ∈ L(H). Valgono i seguenti fatti:
(i) se T è positivo, i suoi possibili autovalori sono reali non negativi;
(ii) se T è limitato ed autoaggiunto, i suoi possibili autovalori sono reali;
(iii) se T è isometrico (ed in particolare unitario), i suoi possibili autovalori sono complessi
con modulo uguale a 1.
(d) Se T ∈ L(H) soddisfa (y|T x) = (T y|x) per ogni coppia x, y ∈ H, allora T è limitato ed è
autoaggiunto.
(e) Se T ∈ B(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H, allora T è autoaggiunto.
(f ) Se T ∈ B(H) è positivo, allora è autoaggiunto.
(g) ≥ è una relazione di ordine parziale in L(H) (e quindi anche in B(H)).
Prova. (a) Posto Q := sup {|(x|T x)| | x ∈ H , ||x|| = 1}, dato che ||x|| = 1,
|(x|T x)| ≤ ||T x||||x|| ≤ ||T x|| ≤ ||T || .
Quindi: Q ≤ ||T ||. Per concludere, è sufficiente provare che ||T || ≤ Q. Vale l’identità di
immediata verifica
4(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) + i(x + iy|T (x + iy)) − i(x − iy|T (x − iy)) .
Da tale identità e tenendo conto del fatto che (z|T z) = (T z|z) = (z|T z), si ricava che 4Re(x|T y) =
2(x|T y) + 2(x|T y) può essere scritto:
4Re(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) ≤ Q||x + y||2 + Q||x − y||2 = 2Q||x||2 + 2Q||y||2 .
Abbiamo provato che:
4Re(x|T y) ≤ 2Q||x||2 + 2Q||y||2 .
Sia y ∈ H con ||y|| = 1. Se T y = 0, allora è ovvio che ||T y|| ≤ Q; altrimenti definiamo
x := T y/||T y|| e otteniamo dalla disuguaglianza provata sopra:
4||T y|| = 4Re(x|T y) ≤ 2Q(||x||2 + ||y||2 ) = 2Q(1 + 1) = 4Q
da cui, ancora, ||T y|| ≤ Q. In definitiva ||T y|| ≤ Q se ||y|| = 1 e quindi
||T || = sup{||T y|| | y ∈ H , ||y|| = 1} ≤ Q .
La seconda proposizione segue dalla seconda parte della dimostrazione di sopra (||T || ≤ Q).
(b)(i) Se A è normale
||Au||2 = (Au|Au)2 = (A∗ Au|u) = (AA∗ u|u) = (A∗ u|A∗ u) = ||A∗ u||2 .
Se T è normale, T − λI è normale con aggiunto T ∗ − λI, per cui applicando il risultato di sopra,
||T u − λu||2 = ||T ∗ u − λu||2 .
76
La tesi segue immediatamente. (ii) Sia u autovettore di T con autovalore λ e v autovettore di T
con autovalore µ. Per (i), λ(v|u) = (v|T u) = (T ∗ v|u) = (µv|u) = µ(v|u) per cui (λ−µ)(v|u) = 0.
Essendo λ 6= µ, deve essere (v|u) = 0.
(c) Se T ≥ 0 e T u = λu con u 6= 0, allora 0 ≤ (u|T u) = λ(u|u); essendo (u|u) > 0, segue che deve
essere λ ≥ 0. Sia poi T = T ∗ e T u = λu con u 6= 0: allora λ(u|u) = (u|T u) = (T u|u) = λ(u|u).
Essendo (u|u) 6= 0, si ha λ = λ ossia λ ∈ R. Se invece T è isometrico: (u|u) = (T u|T u) =
|λ|2 (u|u). Essendo u 6= 0, si ha che |λ| = 1.
(d) La tesi si prova dimostrando che T è limitato. L’unicità dell’aggiunto implica allora che
T = T ∗ in quanto (y|T x) = (T y|x) per ogni coppia x, y ∈ H. A causa del teorema del grafico
chiuso (corollario 2 del teorema dell’applicazione aperta 2.3 in cap.2), per dimostrare che T è
limitato è sufficiente provare che T è chiuso. Sia allora {xn } ⊂ H una successione convergente a
x e supponiamo che i vettori T xn definiscano una successione convergente: dobbiamo mostrare
che T xn → T x. Nelle nostre ipotesi, fissato y ∈ H, si ha:
(y|T xn ) = (T y|xn ) → (T y|x) = (y|T x) .
Per la continuità del prodotto scalare e tenendo conto che esiste per ipotesi limn→+∞ T xn ,
possiamo allora scrivere:
 ‹
y T x − lim T xn = 0 .
n→+∞
Dato che y è arbitrario, scegliendo proprio y := T x − limn→+∞ T xn concludiamo che T x −
limn→+∞ T xn = 0.
(e) e (f) Nelle ipotesi fatte ((T ∗ − T )x|x) = 0 per ogni x ∈ H. Per (2) in esercizi 3.2 (vedi dopo)
deve essere T ∗ − T = 0 ossia T = T ∗ . Se T ∈ B(H) è positivo, allora (x|T x) è reale e coincide
quindi con il suo complesso coniugato, che vale (T x|x) per le proprietà del prodotto scalare, per
cui si ricade nel caso precedente.
(g) Bisogna provare tre fatti. (i) T ≥ T : questo è ovvio perchè significa che ((T − T )x|x) ≥ 0
per ogni x ∈ H. (ii) se T ≥ U e U ≥ S allora T ≥ S: questo si prova immediatamente notando
che T − S = (T − U ) + (U − S) e quindi ((T − S)x|x) = ((T − U )x|x) + ((U − S)x|x) ≥ 0 per
ogni x ∈ H, dato che T ≥ U e U ≥ S. (iii) se T ≥ U e U ≥ T allora T = U . Per provare (iii)
si osservi che nelle ipotesi fatte (x|(T − U )x) = 0 per ogni x ∈ H. Per (2) in esercizi 3.2 deve
essere T − U = 0 ossia T = U .
2
Nota. Si osservi che per spazi di Hilbert sul campo reale ≥ non è una relazione d’ordine parziale,
perché non è vero che se A ≥ 0 e 0 ≥ A, allora A = 0. A titolo di esempio, si consideri una
matrice antisimmetrica A su Rn (visto come spazio vettoriale sul campo R), dotato del prodotto scalare ordinario. Vale A ≥ 0 e anche 0 ≥ A, in quanto (x|Ax) = 0 per ogni x ∈ Rn , ma A 6= 0.
77
3.4
Proiettori ortogonali.
Come ultimo concetto elementare introduciamo la nozione di proiettore ortogonale, che giocherà
il ruolo centrale nel costruire il formalismo della meccanica quantistica.
In riferimento alla definizione 2.10 ed alle successive proposizioni 4.2 e 5.2, possiamo dare la
seguente definizione.
Definizione 3.11. Se (H, ( | )) è spazio di Hilbert, un proiettore P ∈ B(H) è detto proiettore
ortogonale se P ∗ = P .
Nota. Quindi i proiettori ortogonali sono tutti e soli gli operatori limitati da H in H definiti
dalle due condizioni P = P P (idempotenza) e P = P ∗ (autoaggiuntezza). Si osservi che come
immediata conseguenza della definizione data si ha la positività dei proiettori ortogonali: per
ogni x ∈ H
(u|P u) = (u|P P u) = (P ∗ u|P u) = (P u|P u) = ||P u||2 ≥ 0 .
Abbiamo la seguente coppia di proposizioni che caratterizzano i proiettori ortogonali.
Proposizione 3.9. Sia P ∈ B(H) un proiettore ortogonale (nello spazio di Hilbert H) che
proietta su M : allora vale quanto segue.
(a) Il proiettore associato Q := I − P è ancora un proiettore ortogonale.
(b) Q(H) = M ⊥ , per cui la decomposizione diretta associata a P e Q secondo (b) di proposizione
2.4 è quella dovuta a M ed al suo ortogonale M ⊥ :
H = M ⊕ M⊥ .
(c) Per ogni x ∈ H, ||x − P (x)|| = min{||x − y|| | y ∈ M } .
(d) Se N è una base hilbertiana di M , allora:
P = s-
X
u (u| ) ,
u∈N
dove il simbolo “s-” indica che la serie è calcolata nella topologia forte se la somma è infinita.
(e) I ≥ P ; inoltre, se P non è l’operatore nullo (il proiettore su {0}), ||P || = 1.
Prova. (a) Sappiamo già che Q := I − P è proiettore (proposizione 2.4). Per (c) di proposizione
3.6, essendo anche I ∗ = I, segue subito che Q∗ = Q, per cui Q è proiettore ortogonale.
(b) Per la (b) della proposizione 2.4, è sufficiente provare che Q(H) = M ⊥ . A tal fine si noti che
se x ∈ Q(H) e y ∈ M , allora (x|y) = (Qx|y) = (x|Qy) = (x|y − P y) = (x|y − y) = 0, per cui
Q(H) ⊂ M ⊥ . Mostriamo che deve essere anche M ⊥ ⊂ Q(H), per cui M ⊥ = Q(H).
Per la proposizione 2.4, sussiste la decomposizione diretta di H:
H = M ⊕ Q(H)
78
D’altra parte, per (d) di teorema 3.1, si ha anche la decomposizione diretta (e ortogonale)
H = M ⊕ M⊥ .
Se y ∈ M ⊥ , in base alla prima decomposizione si ha la decomposizione unica di y: y = yM +z con
yM ∈ M e z ∈ Q(H). Ma, come visto, Q(H) ⊂ M ⊥ , per cui, per l’unicità della decomposizione,
y = yM +z deve coincidere anche con la decomposizione rispetto alla seconda coppia di sottospazi:
e quindi yM ∈ M e z ∈ M ⊥ . In tal caso yM = 0 per ipotesi, per cui y = z ∈ Q(H). Dato che
y ∈ M ⊥ è un vettore arbitrario, abbiamo provato che M ⊥ ⊂ Q(H).
(c) La tesi è immediata conseguenza di (d) del teorema 3.1, quando K := M , tenuto conto
dell’unicità della decomposizione diretta.
(d) Possiamo completare N a base hilbertiana di H tramite l’unione con una base hilbertiana N 0
di M ⊥ (infatti N ∪ N 0 è un insieme ortonormale per costruzione; inoltre, valendo H = M ⊕ M ⊥
per (b), se x ∈ H è ortogonale a N e N 0 , deve essere il vettore nullo. Per definizione di base
hilbertiana, N ∪ N 0 è base hilbertiana di H.) Allora si verifica immediatamente che
R=
X
u (u| )
u∈N
e
R0 =
X
u (u| )
u∈N 0
(dove le somme, se contengono infiniti addendi, sono calcolate nella topologia forte) sono operatori limitati, soddisfano RR = R, R(H) = M , R0 R0 = R0 , R0 (H) = M ⊥ ed infine R0 R = RR0 = 0
e R + R0 = I. Per la proposizione 2.4, R ed R0 sono proiettori associati alla decomposizione
diretta M ⊕ M ⊥ . Per l’unicità della decomposizione su M e M ⊥ di ogni vettore, concludiamo
che deve essere R = P (e R0 = Q).
(e) Q = I − P è proiettore ortogonale per cui:
0 ≤ (Qx|Qx) = (x|QQx) = (x|Qx) = (x|Ix) − (x|P x) ,
per ogni x ∈ H. Questo significa che I ≥ P . Da quanto appena detto segue anche che:
||P x||2 = (P x|P x) = (x|P P x) = (x|P x) ≤ (x|x) = ||x||2 .
Prendendo l’estremo superiore su x con ||x|| = 1, si ha ||P || ≤ 1. Se P 6= 0, ci sarà x ∈ H con
||x|| = 1 per cui P x = x e quindi ||P x|| = 1. In tal caso dovrà essere ||P || = 1. 2
Proposizione 3.10. Sia H spazio di Hilbert e M ⊂ H un sottospazio chiuso. I proiettori P e Q
associati alla somma diretta ortogonale H = M ⊕ M⊥ secondo la proposizione 2.5 (con N := M⊥ )
e che proiettano rispettivamente su M e M⊥ sono proiettori ortogonali.
Prova. Bisogna solo provare che P = P ∗ . Il fatto che Q = Q∗ segue da Q = I − P .
Se x ∈ H, allora si ha la decomposizione univoca x = y + z con y = P (x) ∈ M e z = Q(x) ∈ M⊥ .
79
Sia x0 = y 0 + z 0 l’analoga decomposizione per x0 ∈ H. Vale (x0 |P x) = (y 0 + z 0 |y) = (y 0 |y). Ma
anche (P x0 |x) = (y 0 |y + z) = (y 0 |y), per cui (x0 |P x) = (P x0 |x) ossia ((P ∗ − P )x0 |x) = 0 per ogni
x, x0 ∈ H. Scegliendo x = (P ∗ − P )x0 si vede che deve valere P x0 = P ∗ x0 per ogni x0 e quindi
P = P ∗. 2
Esercizi 3.2.
(1) Mostrare che se H è spazio di Hilbert, U ∈ L(H) è operatore isometrico se e solo se ||U x|| =
||x|| per ogni x ∈ H.
Più in generale, provare che se T : D(T ) → X è un operatore sullo spazio vettoriale D(T ) sul
campo complesso e con prodotto scalare ( | ), dove D(T ) è un sottospazio (non necessariamente
chiuso) di X, allora i due fatti seguenti sono equivalenti (|||| indica la norma indotta dal prodotto
scalare):
(a) ||T x|| = ||x|| per ogni x ∈ D(T );
(b) (T x|T y) = (x|y) per ogni coppia x, y ∈ D(T ).
Suggerimento. (5) di Esercizi 3.1
(2) Siano H uno spazio di Hilbert e T : D(T ) → H un operatore lineare, dove D(T ) ⊂ H è
un sottospazio denso in H (eventualmente D(T ) = H). Si provi che se (u|T u) = 0 per ogni
u ∈ D(T ) allora T = 0, cioè T è l’operatore nullo (che manda ogni vettore in 0).
Soluzione. Vale
0 = (u + v|T (u + v)) = (u|T u) + (v|T v) + (u|T v) + (v|T u) = (u|T v) + (v|T u) .
Similmente
0 = i(u + iv|T (u + iv)) = i(u|T u) + i(v|T v) − (u|T v) + (v|T u) = −(u|T v) + (v|T u) .
Quindi, sommando membro a membro, (v|T u) = 0 per ogni u, v ∈ D(T ). Scegliendo {vn }n∈N ⊂
D(T ) tale che vn → T u per n → +∞, si ha che ||T u||2 = (T u|T u) = limn→+∞ (vn |T u) = 0 per
ogni u ∈ D(T ), ossia T u = 0 per ogni u ∈ D(T ) e quindi T = 0.
(3) Si consideri L2 ([0, 1], m) dove m è la solita misura di Lebesgue. Sia f ∈ L2 ([0, 1], m).
Mostrare che l’operatore Tf : L2 ([0, 1], m) 3 g 7→ f · g, dove · è l’ordinario prodotto di funzioni
punto per punto, è ben definito, limitato con norma ||Tf || ≤ ||f || e normale. Infine Tf è
autoaggiunto se e solo se f ammette solo valori reali.
(4) Sia T ∈ B(H) autoaggiunto. Per λ ∈ R, si consideri la serie di operatori
U (λ) :=
∞
X
(iλ)n
n=0
Tn
,
n!
dove T 0 := I, T 1 := T , T 2 := T T e via di seguito e la convergenza è quella nella topologia
uniforme. Si dimostri che la serie converge ad un operatore unitario.
(5) In riferimento all’esercizio precedente, provare che se λ, µ ∈ R, U (λ)U (µ) = U (λ + µ).
(6) Mostrare che la serie nell’esercizio (5) converge per ogni λ ∈ C ad un operatore limitato e
che U (λ) è sempre normale.
80
(7) Mostrare che l’operatore U (λ) dell’esercizio (7) è positivo se λ ∈ iR. Ci sono valori di λ ∈ C
per cui U (λ) è un proiettore (non necessariamente ortogonale)?
(8) Calcolare esplicitamente U (λ) dell’esercizio (5) se T è definito come Tf dell’esercizio (4) con
f = f.
(9) In l2 (N) si consideri l’operatore T : {xn } 7→ {xn+1 /n}. Provare che T è limitato e calcolare
T ∗.
3.5
Radici quadrate di operatori positivi e decomposizione polare di operatori limitati.
In questa sezione piuttosto tecnica vedremo alcune nozioni molto utili in teoria degli operatori
limitati in uno spazio di Hilbert. Il risultato più importante è il cosiddetto teorema di decomposizione polare per operatori limitati. Si tratta di una decomposizione di un operatore che
generalizza la decomposizione di un numero complesso z nel prodotto del suo valore assoluto e
di un esponenziale immaginario: z = |z|ei arg z . La nozione valore assoluto di un operatore è utile
per introdurre una generalizzazione del concetto di “convergenza assoluta” di serie numeriche
costruite a partire da operatori e basi hilbertiane. Useremo queste serie nel definire gli operatori
di Hilbert-Schmidt e gli operatori di classe traccia, alcuni dei quali rappresentano gli stati in
meccanica quantistica. Parte delle dimostrazioni sono tratte da [Mar82] e [KaAk80].
Definizione 3.12. Se A ∈ B(H), con H spazio di Hilbert, B ∈ B(H) si dice radice quadrata
ovvero radice quadrata (positiva) di A se B 2 = A (e rispettivamente B ≥ 0).
Mostreremo tra poco che ogni operatore limitato positivo ha una ed una sola radice quadrata
positiva. Ci serve un lemma iniziale che diamo sotto forma di proposizione in quanto si tratta, a
sua volta, di un utilissimo risultato molto usato nella teoria spettrale lavorando con successioni
e serie di proiettori ortogonali nella topologia forte.
Proposizione 3.11. Sia H spazio di Hilbert. Se {An }n∈N ⊂ B(H) è una successione monotona non decrescente (non crescente) di operatori autoaggiunti limitata superiormente (rispettivamente inferiormente) da K ∈ B(H), allora esiste A ∈ B(H) autoaggiunto con A ≤ K
(rispettivamente A ≥ K) e tale che:
A = s- lim An .
n→+∞
(3.38)
Prova. Dimostriamo la tesi nel caso non decrescente; l’altro caso si riporta a questo considerando
la successione di termini K − An .
Posto Bn := An + ||A0 ||I per ogni n ∈ N, si verifica facilmente che la successione dei Bn è
81
monotona non decrescente fatta di operatori positivi1 e vale ancora Bn ≤ K + ||A0 ||I =: K1 e
K1 è positivo (K può non esserlo). Valendo (x|K1 x) ≥ (x|Bn x), ma anche −(x|Bm x) ≤ 0 ed
infine (x|Bn x) − (x|Bm x) ≥ 0 se n ≥ m, vale anche
(x|K1 x) ≥ (x|Bn x) − (x|Bm x) ≥ 0
per ogni x ∈ H.
Dato che che ogni operatore positivo T definisce un semiprodotto scalare per cui è valida la
disuguaglianza di Schwartz
|(x|T y)|2 ≤ (x|T x)(y|T y) ,
(3.39)
avremo che, se n ≥ m:
|(x|(Bn − Bm )y)|2 ≤ (x|(Bn − Bm )x)(y|(Bn − Bm )y) ≤ (x|K1 x)(y|K1 y) ≤ ||K1 ||2 ||x||2 ||y||2 .
Quindi
|(x|(Bn − Bm )y)|2 ≤ ||K1 ||2 ||x||2 ||y||2 .
Se si pone x = (Bn − Bm )y e si prende l’estremo superiore sugli y ∈ H con ||y|| = 1, si ricava che
||Bn − Bm || ≤ ||K1 || .
(3.40)
Dalla (3.39) con y = (Bn − Bm )x e T = Bn − Bm si ricava che, per ogni x ∈ H, se n ≥ m:
||(Bn − Bm )x||4 = ((Bn − Bm )x|(Bn − Bm )x)2 ≤ (x|(Bn − Bm )x)((Bn − Bm )x|(Bn − Bm )2 x) .
Per (3.40), l’ultimo termine è maggiorato da
(x|(Bn − Bm )x)||Bn − Bm ||3 ||x||2 ≤ ||K1 ||3 ||x||2 [(x|Bn x) − (x|Bm x)] .
Quindi:
||(Bn − Bm )x||4 ≤ ||K1 ||3 ||x||2 [(x|Bn x) − (x|Bm x)] .
La successione non decrescente limitata di numeri positivi (x|Bk x) è necessariamente convergente, per cui è di Cauchy. Concludiamo che deve essere di Cauchy anche quella di vettori Bk x.
Esisterà dunque il limite per k → +∞ di tale successione. Definiamo
B : H 3 x 7→ lim Bn x .
n→+∞
Si verifica facilmente che per costruzione B è lineare; inoltre soddisfa
0 ≤ (Bx|x) = (x|Bx) ≤ (x|K1 x)
1
Si osservi che, in particolare se ||x|| = 1, (x|An x) + ||A0 || ≥ (x|A0 x) + ||A0 ||, ma −||A0 || ≤ (x|A0 x) ≤ ||A0 ||
per (a) di Proposizione 3.8. Di conseguenza (x|An x) + ||A0 || ≥ 0 per ogni x tale che ||x|| = 1. Questo equivale a
dire che (y|An y) + ||A0 ||(y|y) ≥ 0 per ogni y ∈ H, ossia An + ||A0 ||I ≥ 0.
82
dato che 0 ≤ (Bk x|x) = (x|Bk x) ≤ (x|K1 x) per ogni k ∈ N.
Dato che K1 è limitato ed autoaggiunto (essendo positivo), da (a) di proposizione 3.8 concludiamo che B è limitato, valendo
sup{|(x|Bx)| | x ∈ H , ||x|| = 1} ≤ sup{|(x|K1 x)| | x ∈ H , ||x|| = 1} = ||K1 || .
B è anche autoaggiunto per (e) di proposizione 3.8. Quindi, A := B − ||A0 ||I è un operatore
limitato, autoaggiunto e vale
Ax = lim (Bn − ||A0 ||I)x = lim An x ;
n→+∞
n→+∞
inoltre A ≤ K perché per ogni x ∈ H vale (x|An x) ≤ (x|Kx) per ipotesi e tale risultato permane
prendendo il limite per n → +∞. 2
Come detto sopra, questo risultato ci permette di dimostrare l’esistenza delle radici quadrate
degli operatori limitati positivi.
Teorema 3.8. Sia H spazio di Hilbert √
e A ∈ B(H) un operatore positivo. Esiste un’unica radice
quadrata
positiva,
che
indichiamo
con
A. Inoltre:
√
(a) A commuta con tutti gli operatori
√ limitati che commutano con A;
(b) se A è biettivo, è biettivo anche A.
Nota. Come d’uso comune nella teoria degli operatori e delle algebre, dire che due operatori
A e B commutano, ovvero che A commuta con B ovvero che B commuta con A, significa
semplicemente che
AB = BA .
(3.41)
Senza precisare null’altro si sottintende quindi che l’identità scritta valga sul dominio di A e su
quello di B (che devono coincidere) ed inoltre Ran(A) deve essere incluso nel dominio di B e
Ran(B) deve essere incluso nel dominio di A. È chiaro che tutto ciò è banalmente vero usando
operatori A, B ∈ L(X), dove X è un qualsiasi spazio vettoriale.
Prova del teorema 3.8. Senza limitare la generalità, possiamo assumere che ||A|| ≤ 1. Quindi
poniamo A0 := I − A. Mostriamo prima di tutto che A0 ≥ 0 e ||A0 || ≤ 1.
A0 ≥ 0 dato che (x|A0 x) = (x|x) − (x|Ax) ≥ ||x||2 − ||A||||x||2 , dove abbiamo usato il fatto che
A = A∗ per cui (per (a) di proposizione 3.8) ||A|| = sup{|(z|Az)| | ||z|| = 1} e tenendo conto
che |(z|Az)| = (z|Az) per la positività di A. Dato che la forma sesquilineare (x, y) 7→ (x|A0 y) è
positiva, vale la disuguaglianza di Cauchy-Schwartz per cui:
|(x|A0 y)|2 ≤ (x|A0 x)(y|A0 y) ≤ ||x||2 ||y||2 ,
dove abbiamo usato la positività di A = I − A0 e A0 nell’ultimo passaggio. Per y = A0 x
otteniamo da sopra che ||A0 x|| ≤ ||x||, da cui infine si ha che
||A0 || ≤ 1 .
83
(3.42)
Passiamo a definire una successione di operatori limitati Bn : H → H, per n = 1, 2, · · · , ponendo:
B1 := 0 ,
1
Bn+1 := (A0 + Bn2 ) .
2
(3.43)
Usando (3.42) si verifica immediatamente, usando le proprietà della norma, che per ogni n come
sopra,
||Bn || ≤ 1 .
(3.44)
Per induzione si verifica immediatamente che gli operatori Bn sono polinomi in A0 a coefficienti
non negativi. Si tenga conto, qui e nel seguito, che tutti gli operatori Bk commutano tra di
loro e commutano con A0 per costruzione. Similmente gli operatori Bn+1 − Bn risultano essere
polinomi di A0 a coefficienti non negativi. Infatti dalla (3.43) si ha che:
1
1
1
2
2
Bn+1 − Bn = (A0 + Bn2 ) − (A0 + Bn−1
) = (Bn2 − Bn−1
)
2
2
2
ossia
1
Bn+1 − Bn = (Bn + Bn−1 )(Bn − Bn−1 ) .
2
Dall’ultima identità segue facilmente, per induzione, che gli operatori Bn+1 − Bn sono polinomi
di A0 a coefficienti non negativi: si tenga conto del fatto che ogni Bn +Bn−1 è somma di polinomi
a coefficienti non negativi per cui è un polinomio a coefficienti non negativi ed infine si usi il
fatto che il prodotto di polinomi a coefficienti non negativi è un polinomio dello stesso genere.
Dato che A0 ≥ 0, ogni suo polinomio a coefficienti non negativi è un operatore positivo: il
2n
n n
polinomio è somma di termini a2n A2n
0 che sono positivi (essendo a2n ≥ 0 e A0 = A0 A0 con
2n+1
n
2n
n
n
che sono
A0 autoaggiunto, per cui a2n (x|A0 x) = a2n (A0 x|A0 x) ≥ 0), e di termini a2n+1 A0
2n+1
n
n
n
n
x) = (x|A0 AA0 x) = (A0 x|A A0 x) ≥ 0).
ancora positivi (perché a2n+1 ≥ 0 e (x|A0
Concludiamo che gli operatori limitati Bn e Bn+1 − Bn sono operatori positivi. In altre parole,
la successione degli operatori limitati positivi (e quindi autoaggiunti) Bn è non decrescente.
Questa successione è anche maggiorata dall’operatore I. Infatti, essendo Bn∗ = Bn ≥ 0 vale, per
(a) di proposizione 3.8, (x|Bn x) = |(x|Bn x)| ≤ ||Bn ||||x||2 . Da (3.44) segue subito che Bn ≤ I.
Possiamo allora applicare la proposizione 3.11 ottenendo che esiste un operatore limitato positivo
B0 ≤ I tale che:
B0 = s − lim Bn .
n→+∞
Vale ulteriormente per la definizione di convergenza nella topologia operatoriale forte, per la
commutatività degli operatori Bk e per la continuità di essi:
B0 Bm x = ( lim Bn )Bm x = lim Bn Bm x = lim Bm Bn x = Bm lim Bn x = Bm B0 x .
n→+∞
n→+∞
n→+∞
Quindi B0 commuta con ogni Bm e di conseguenza:
B02 − Bn2 = (B0 + Bn )(B0 − Bn )
84
n→+∞
da cui, per n → +∞
||B02 x − Bn2 x|| ≤ ||B0 + Bn ||||B0 x − Bn x|| ≤ (||B0 || + ||Bn ||)||B0 x − Bn x|| ≤ 2||B0 x − Bn x|| → 0 .
In altre parole
B02 x = lim Bn2 x .
n→+∞
Passando allora al limite nella relazione ottenuta da (3.43)
1
Bn+1 x = (A0 x + Bn2 x) ,
2
troviamo, per ogni x ∈ H,
1
B0 x = (A0 x + B02 x) ,
2
ossia
2B0 = A0 + B02 .
Per concludere, esprimendo l’identità di sopra in termini di B := I − B0 , troviamo immediatamente che
B 2 = I − A0 ,
cioè,
B2 = A .
Quindi B è una radice quadrata di A. Si osservi che B ≥ 0 dato che B0 ≤ I e B = I − B0 . Per
cui B è una radice quadrata positiva di A. Ancora, se C è un operatore limitato che commuta
con A allora commuterà con A0 e quindi con ogni Bn . Di conseguenza C commuterà con B0 e
con B = I − B0 .
Proviamo infine l’unicità della radice quadrata positiva. Sia V una radice quadrata positiva di
A. La radice positiva B costruita sopra ha la proprietà di commutare con tutti gli operatori che
commutano con A. Siccome
AV = V 3 = V A ,
V e A commutano tra di loro e quindi B dovrà commutare con V . Fissiamo arbitrariamente
x ∈ H e poniamo y := Bx − V x. Abbiamo allora:
||Bx − V x||2 = ([B − V ]x|[B − V ]x) = ([B − V ]x|y) = (x|[B ∗ − V ∗ ]y) = (x|[B − V ]y) (3.45)
Mostriamo ora che, nelle nostre ipotesi, By = 0 e V y = 0 separatamente. Ciò conclude la prova
perché, per l’arbitrarietà di x ∈ H, ||Bx − V x|| = 0 implica B = V .
Vale
(y|By) + (y|V y) = (y|[B + V ][B − V ]x) = (y|[B 2 − V 2 ]x) = (y|[A − A]x) = 0 ,
Poiché (y|V y) ≥ 0 e (y|By) ≥ 0 deve quindi essere
(y|V y) = (y|By) = 0 .
85
Questo implica che V y = By = 0, infatti, se W è una radice quadrata positiva di V , essendo
||W y||2 = (W y|W y) = (y|W 2 y) = (y|V y) = 0 ,
dovrà essere W y = 0 e, a maggior ragione, V y = W (W y) = 0. Nello stesso modo si trova
By = 0.
√
Non resta che provare che A è biettivo se lo √
è A. Se A è biettivo, allora commuta con
−1 anche
A−1 ,√di conseguenza
commuta
con
A
√ −1
√ A. Si verifica allora immediatamente che
−1
A
A = AA è inverso destro e sinistro di A, che è di conseguenza biettivo. 2
Corollario. Sia H spazio di Hilbert; se A, B ∈ B(H) sono positivi e commutano tra di loro,
allora il loro prodotto è un operatore limitato positivo.
Prova.
√
B commuta con A, perciò
√ 2
√
√
√
√
(x|ABx) = (x|A B x) = (x| BA Bx) = ( Bx|A Bx) ≥ 0 .
2
Concludiamo la sezione mostrando che ogni operatore limitato A su uno spazio di Hilbert ammette una decomposizione in un prodotto di un operatore positivo P , univocamente determinato, e
un operatore isometrico U definito sul rango di quello positivo ed ivi univocamente determinato: A = U P . Tale decomposizione si dice decomposizione polare dell’operatore e ha molteplici
applicazioni in fisica matematica. Noi useremo la decomposizione polare di operatori limitati
compatti nella prossima sezione. Una definizione preliminare è necessaria.
Definizione 3.12. Siano H spazio di Hilbert e A ∈ B(H). L’operatore limitato, positivo e
quindi autoaggiunto:
√
|A| := A∗ A ,
(3.46)
è detto valore assoluto di A.
Nota. Valendo, per ogni x ∈ H: || |A| x||2 = (x| |A|2 x) = (x|A∗ Ax) = ||Ax||2 , otteniamo
|| |A| x|| = ||Ax|| ,
(3.47)
Ker(|A|) = Ker(A)
(3.48)
da cui segue che
e quindi |A| è iniettivo se e solo se lo è A. Un’altra utile proprietà è:
Ran(|A|) = (Ker(A))⊥ ,
(3.49)
che vale in quanto Ran(|A|) = ((Ran(|A|))⊥ )⊥ = (Ker(|A|∗ ))⊥ = (Ker(|A|))⊥ = (Ker(A))⊥ .
Passiamo al teorema di decomposizione polare.
86
Teorema 3.9. Siano H spazio di Hilbert e A ∈ B(H).
(a) Esiste una sola coppia di operatori P, U ∈ B(H) tali che valgano insieme le condizioni
seguenti:
(1) vale la decomposizione
A = UP ,
(3.50)
(2) P è positivo,
(3) U è isometrico su Ran(P ) (ossia ||U x|| = ||x|| per ogni x ∈ Ran(P )),
(4) Ker(U ) ⊃ Ker(P ) (o equivalentemente (4)’ Ker(U ) ⊃ Ker(A)).
(b) Risulta essere P = |A| e quindi Ker(U ) = Ker(A) = (Ran(P ))⊥ .
(c) Se A è biettivo, U coincide con l’operatore unitario A|A|−1 .
Prova. (a) Cominciamo con il provare l’unicità. Se esiste la decomposizione (3.50) A = U P
con P ≥ 0 (oltre che limitato) e U limitato, allora A∗ = P U ∗ , essendo P autoaggiunto perché
positivo ((c) in teorema 3.8); quindi
A∗ A = P U ∗ U P .
(3.51)
La condizione che U sia isometrico su Ran(P ) si scrive (U P x|U P y) = (P x|P y) per ogni x, y ∈ H,
che equivale a (x|[P U ∗ U P − P 2 ]y) = 0 per ogni x, y ∈ H. Quindi P U ∗ U P = P 2 . Sostituendo in
(3.51) concludiamo che deve essere P 2 = A∗ A e dunque, essendo P positivo ed estraendo l’unica
radice quadrata positiva (teorema 3.8) ad ambo membri, troviamo P = |A|. Quindi, se esiste
una decomposizione con i requisiti fissati in (a), necessariamente P = |A|. Mostriamo che anche
U è fissato unicamente. Notiamo che H = Ker(P ) ⊕ (Ker(P ))⊥ ma, usando (d) di proposizione
3.6 e la (e) del teorema 3.1, vale anche (Ker(P ))⊥ = Ran(P ∗ ) = Ran(P ) per il fatto che P è
autoaggiunto. Quindi H = Ker(P ) ⊕ Ran(P ). Per assegnare un operatore su H, è sufficiente
assegnarlo su ciascuno dei due addendi della somma diretta scritta sopra: U = 0 su Ker(P )
nelle ipotesi del teorema, mentre la condizione U P x = Ax per ogni x ∈ H fissa univocamente
U su Ran(P ). D’altra parte, essendo per ipotesi U limitato, lo sarà anche ristretto a Ran(P ).
Un operatore limitato definito in un dominio denso è estendibile univocamente ad un operatore
limitato definito sulla chiusura del dominio (vedi (3) e (4) in esercizi 2.1). Quindi, per le ipotesi
fatte, U è in realtà fissato su tutto Ran(P ) e quindi su tutto H. La dimostrazione di unicità è
conclusa; passiamo a quella di esistenza.
In base a quanto visto sopra, è necessario, innanzi tutto, mostrare che la condizione U P = A
con P = |A|, riscritta equivalentemente come U : |A|x 7→ Ax per ogni x ∈ H, definisce effettivamente un operatore, che indicheremo con U0 , su Ran(|A|). Perché tale funzione sia ben
definita è necessario sufficiente che valga |A|x = |A|y ⇒ Ax = Ay, altrimenti non avremmo
una funzione. Notiamo che, da (3.47), se |A|x = |A|y, allora Ax = Ay e quindi l’applicazione
U0 : Ran(|A|) 3 |A|x 7→ Ax è ben definita (non è plurivoca). Il fatto che U0 sia lineare è ovvio
per costruzione, come lo è il fatto che sia un’isometria, poiché U0 preserva le norme per (3.47)
(si tenga conto di (1) in esercizi 3.2). Il fatto che U0 sia un’isometria su Ran(|A|) implica, per
continuità, che si estenda in modo unico ad un’isometria sulla chiusura di Ran(|A|). Indichiamo
87
ancora con U0 tale estensione. Infine definiamo un operatore U : H → H tale che, rispetto
alla somma diretta vista sopra H = Ker(|A|) ⊕ Ran(|A|), si decomponga in U Ker(|A|) := 0 e
U Ran(|A|) := U0 . È immediato verificare che U ∈ B(H) e che U soddisfa (3.50) per costruzione.
Infine vale Ker(U ) ⊃ Ker(|A|) per costruzione. Proviamo, per concludere, che i due nuclei in
realtà coincidono. Ogni eventuale u con U u = 0 si decompone come u0 + x, con u0 ∈ Ker(|A|),
su cui U si annulla, e x ∈ Ran(|A|), per cui deve valere U0 x = 0. Dato che su tale spazio U0
è isometrico, deve essere x = 0 e quindi u = u0 ∈ Ker(|A|). Quindi Ker(U ) ⊂ Ker(|A|) e,
tenendo conto anche dell’altra inclusione, vale infine Ker(U ) = Ker(|A|) = Ker(A) per (3.48).
(b) è già stato provato completamente provando (a).
(c) Se A è iniettivo, usando (b), si trova che Ker(A) = Ker(U ) è banale e quindi U è iniettivo.
D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A)
e pertanto, se A è suriettivo, deve esserlo U . Concludiamo che, se A è biettivo, U deve essere tale.
In tal caso, per (b), U è un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H
ed è quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| è biettivo e
quindi possiamo scrivere: U = A|A|−1 . 2
Definizione 3.13. Siano H spazio di Hilbert e A ∈ B(H). Si dice decomposizione polare
dell’operatore A la decomposizione
A = UP ,
dove P, U ∈ B(H) soddisfano le proprietà: P è positivo, U è isometrico su Ran(P ) e Ker(U ) =
Ker(P ).
Un utile corollario del teorema di decomposizione polare è il seguente.
Corollario. Nelle ipotesi del teorema 3.9, se U |A| = A è la decomposizione polare di A, vale
l’identità:
|A∗ | = U |A|U ∗ .
(3.52)
Prova. Da A = U |A| segue immediatamente che A∗ = |A|U ∗ = U ∗ U |A|U ∗ , dove si è tenuto
conto del fatto che U ∗ U |A| = |A|, dato che U è isometrico su Ran(|A|). Quindi, per l’operatore
autoaggiunto AA∗ vale:
AA∗ = U |A|U ∗ U |A|U ∗ .
Dato che U |A|U ∗ è evidentemente positivo, avremo, per l’unicità della radice quadrata:
È
√
|A∗ | = (A∗ )∗ A∗ = AA∗ = U |A|U ∗ .
Questo prova la tesi. 2
88
3.6
La trasformata di Fourier-Plancherel.
Introduciamo molto brevemente la trasformata di Fourier e di Fourier-Plancherel.
Notazione 3.3. I punti di Rn saranno indicati con singole lettere e le componenti con la stessa
lettera ed un indice, in tal modo x = (x1 , . . . , xn ), mentre dx denoterà l’ordinaria misura di
Lebesgue in Rn .
Diremo multindice ogni n-pla, α = (α1 , . . . , αn ) con αi = 0, 1, 2, . . . e indicheremo con |α| la
P
somma |α| := ni=1 αi . Useremo inoltre le seguenti notazioni:
∂xα :=
∂ |α|
,
∂xα1 1 · · · ∂xαnn
e nello stesso modo
M α (x) := xα1 1 · · · xαnn .
Con D(Rn ) indicheremo lo spazio, anche indicato con Cc∞ (Rn ), delle funzioni a valori complessi
infinitamente differenziabili con supporto compatto. Con S(Rn ) indicheremo lo spazio di Schwartz su Rn , ovvero lo spazio vettoriale complesso delle funzioni C ∞ (Rn ) a valori complessi che
godono dell’ulteriore proprietà: per ogni f ∈ S(Rn ) e per ogni coppia di multindici α e β, esiste
K < +∞ (dipendente da f , α e β!) tale che
|M α (x)∂xβ f (x)| ≤ K,
per ogni x ∈ Rn .
(3.53)
Le norme || ||1 , || ||2 e || ||∞ in questa sezione denoteranno rispettivamente la norma di L1 (Rn , dx),
L2 (Rn , dx) e L∞ (Rn , dx) (vedi (6) e (8) in Esempi 2.1).
Ovviamente D(Rn ) e S(Rn ) sono invarianti sotto l’azione degli operatori M α (x) (visto come
operatore moltiplicativo) e ∂xα : funzioni di ciascuno dei due spazi rimangono nel rispettivo spazio quando trasformate sotto l’azione di M α (x) e ∂xα .
È chiaro che D(Rn ) ⊂ Lp (R, dx) come sottospazio per ogni 1 ≤ p ≤ ∞ dato che i compatti su Rn
hanno misura di Lebesgue finita e che ogni f ∈ D(Rn ) è continua e quindi limitata sui compatti.
Vale anche che S(Rn ) ⊂ Lp (R, dx) per ogni 1 ≤ p ≤ ∞ come sottospazio. Infatti, se C ⊂ Rn è
un compatto contenente l’origine, f ∈ S(Rn ) è limitata su C essendo ivi continua e, fuori da C,
vale |f (x)| ≤ Cn |x|−n per ogni n = 0, 1, 2, 3, . . . pur di scegliere Cn ≥ 0 sufficientemente grande.
In definitiva |f | è limitata su Rn e quindi appartiene a L∞ ma, per ogni p ∈ [1, +∞), è anche
limitata da una funzione che appartiene a Lp : tale funzione è costante su C e vale Cn /|x|n con
n > 1/p fuori da C. Oltre al fatto ovvio che D(Rn ) ⊂ S(Rn ), ricordiamo un fatto notissimo
(indipendente dai risultati che troveremo in questa sezione) che sarà utile tra poco [KiGv83]:
gli spazi D(Rn ) e S(Rn ) sono sottospazi densi di ogni Lp (R, dx) per ogni 1 ≤ p < ∞.
Vale infine il seguente importante Lemma la cui dimostrazione si può trovare in [Bre86] (Corollario IV.24) ed è indipendente dai risultati che troveremo in questa sezione.
89
Lemma 3.2. Se f ∈ L1 (Rn , dx) e
Z
f (x)g(x) dx = 0
Rn
per ogni g ∈ D(Rn ) ,
allora f (x) = 0 quasi ovunque rispetto alla misura di Lebesgue dx su Rn .
Definizione 3.14. Le trasformazioni lineari da L1 (Rn , dx) in L∞ (Rn , dx) definite da:
eik·x
f (x) dx , per ogni f ∈ L1 (Rn , dx) e ogni k ∈ Rn ;
n/2
Rn (2π)
Z
e−ik·x
(F− g)(x) :=
g(k) dk , per ogni g ∈ L1 (Rn , dk) e ogni x ∈ Rn
n/2
n
(2π)
R
Z
(Ff )(k) :=
(3.54)
(3.55)
sono dette rispettivamente: trasformata di Fourier e trasformata inversa di Fourier.
Osservazioni.
(1) Si osservi che dk indica comunque la misura di Lebesgue in Rn . Abbiamo usato un nuovo
nome per la variabile di Rn (k invece di x) nell’esplicitare la trasformata inversa di Fourier solo
perché tale notazione è quella tradizionale e ciò si rivelerà comodo nei calcoli.
(2) È ovvio che, per le proprietà elementari dell’integrale,
Z
Z
Z
dx
||f ||1
dxn
dx ik·x
ik·x
|(Ff )(k)| ≤ =
|f (x)|
=
≤
|e
|
|f
(x)|
e f (x)
n/2
n/2
n/2
Rn
(2π) (2π)
(2π)
(2π)n/2
Rn
Rn
e similmente |(F− g)(x)| ≤ ||g||1 /(2π n/2 ) per ogni x, k ∈ Rn , per cui ha senso definire la trasformata di Fourier e la trasformata inversa di Fourier come operatori a valori almeno in L∞ (Rn , dx).
Vediamo nel seguito solo le proprietà più immediate della trasformata di Fourier che si connettono più direttamente con la trasformazione di Fourier-Plancherel. Tralasceremo importanti
risultati come la continuità rispetto alla topologia naturale indotta da seminorme nello spazio
di Schwartz, per i quali si rimanda a qualsiasi testo di teoria delle funzioni ed analisi funzionale
oppure teoria delle distribuzioni [Vla81].
Proposizione 3.12. La trasformazione di Fourier e la trasformazione inversa di Fourier godono delle seguenti proprietà.
(a) Sono continue rispetto alle norme naturali del dominio e codominio, valendo le disuguaglianze
||f ||1
||g||1
||Ff ||∞ ≤
e ||F− g||∞ ≤
.
n/2
(2π)
(2π)n/2
(b) Lo spazio di Schwartz è invariante sotto F e F− , cioè F(S(Rn )) ⊂ S(Rn ) e F− (S(Rn )) ⊂
S(Rn ).
90
(c) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono una l’inversa dell’altra: se
f ∈ S(Rn ), allora
Z
eik·x
g(k) =
f (x) dx
n/2
Rn (2π)
se e solo se
Z
f (x) =
Rn
e−ik·x
g(k) dk
(2π)n/2
(d) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono isometriche rispetto al
semi-prodotto scalare di L2 (Rn , dxn ): se f1 , f2 , g1 , g2 ∈ S(Rn ), allora
Z
Z
Rn
e
(Ff1 )(k)(Ff2 )(k)dk =
Z
Rn
Rn
f1 (x)f2 (x)dx
Z
(F− g1 )(x)(F− g2 )(x)dx =
Rn
g1 (k)g2 (k)dk .
(e) Le due trasformazioni individuano trasformazioni limitate da L1 (Rn , dx) a C0 (Rn ) (lo spazio
delle funzioni continue che tendono a zero all’infinito (4) in Esempi 2.1) e pertanto vale il
Lemma di Riemann-Lebesgue: per ogni f ∈ L1 (Rn , dx),
(F) (k) → 0
per |x| → +∞
e vale l’analoga proprietà per F− .
(f ) Le due trasformazioni, definite su L1 (Rn , dx), sono iniettive.
Osservazione. Riguardo al punto (f), si può dimostrare [Rud91] ancora più fortemente che se
f ∈ L1 (Rn , dx) è tale che Ff ∈ L1 (Rn , dk), allora vale anche F− (Ff ) = f . È valido lo stesso
risultato scambiando il ruolo di F e F− .
Prova della proposizione 3.12. (a) è già stata dimostrata nella (2) di note seguenti la definizione
3.14. (b) Diamo la prova per F; per F− si può procedere analogamente. Poniamo
Z
g(k) :=
Rn
eik·x
f (x) dx
(2π)n/2
Si verifica facilmente che il secondo membro può essere derivato in k tramite un operatore ∂kα
facendo passare la derivata sotto il segno di integrale. Infatti risulta immediatamente che
α ik·x
f (x) = i|α| M α (x)eik·x f (x) ≤ |M α (x)f (x)| .
∂k e
La funzione x 7→ |M α (x)f (x)| è in L1 in quanto f ∈ S(Rn ). Dato che il modulo della derivata dell’integrando è maggiorato uniformemente da una funzione positiva ed integrabile, noti
91
teoremi sul passaggio del simbolo di derivata sotto quello di integrale (basati sul teorema della
convergenza dominata di Lebesgue) permettono di concludere che
∂kα g(k)
=i
|α|
Z
Rn
eik·x
M α (x)f (x) dx
(2π)n/2
(3.56)
Notando che f si annulla più rapidamente di ogni potenza inversa di |x| per |x| → +∞, si trova
che:
‚ ik·x Œ
Z
e
β
|β| β
f (x) dx
M (k)g(k) =
(−i) ∂x
(2π)n/2
Rn
e quindi, usando l’integrazione per parti,
M β (k)g(k) = i|β|
Z
Rn
eik·x β
∂ f (x) dx .
(2π)n/2 x
(3.57)
Quindi, inserendo ∂kα g al posto della funzione g in (3.57) e tenendo conto di (a), si ha:
|M β (k)∂kα g(k)| ≤ ∂ β (M α f ) ,
1
per ogni k ∈ Rn . Essendo finito il secondo membro, in quanto f ∈ S(Rn ), ed essendo α e β
arbitrari, concludiamo che g ∈ S(Rn ).
(c) Le identità (3.56) e (3.57) si scrivono in altro modo come
∂ α F = i|α| FM α ,
|β|
M F = i
β
(3.58)
F∂ ,
β
(3.59)
dove F è in realtà la restrizione della trasformata di Fourier a S(Rn ). Osservando che
Fh = F− h
per ogni h ∈ S(Rn ), si ricava facilmente:
∂ α F− = (−1)|α| i|α| F− M α ,
|β| |β|
M F− = (−1) i
β
F− ∂ .
β
(3.60)
(3.61)
Dalle (3.58), (3.59), (3.60) e (3.61), troviamo in particolare che
FF− M α = M α FF− ,
(3.62)
F− F M
(3.63)
α
= M F− F ,
α
dove M α è pensato come operatore moltiplicativo (M α f )(x) := M α (x)f (x), e anche
FF− ∂ α = ∂ α FF− ,
(3.64)
F− F ∂
(3.65)
α
= ∂ F− F .
α
92
Mostreremo ora che, in virtù di tali relazioni di commutazione, gli operatori J := FF− e J− :=
F− F devono essere l’operatore identità di S(Rn ). Per prima cosa proviamo che, fissati x0 ∈ Rn e
f ∈ S(Rn ), il valore di (Jf )(x0 ) dipende solo da f (x0 ). Se f ∈ S(Rn ) possiamo sempre scrivere
f (x) = f (x0 ) +
Z 1
df (x0 + t(x − x0 ))
dt
0
dt = f (x0 ) +
n
X
(xi − x0i )gi (x) ,
i=1
dove le funzioni gi (che sono C ∞ (Rn ), come si verifica facilmente) sono definite da
gi (x) :=
∂
∂xi
Z 1
f (x0 + t(x − x0 ))dt
0
e dunque, se f1 , f2 ∈ S(Rn ) e f1 (x0 ) = f2 (x0 ), risulta
f1 (x) = f2 (x) +
n
X
(xi − x0i )hi (x) ,
(3.66)
i=1
dove, per differenza, la funzione x 7→ ni=1 (xi − x0i )hi (x) e quindi le funzioni hi sono in S(Rn ).
Applicando J ad ambo i membri di (3.66) e tenendo conto del fatto che J commuta con i
polinomi in x per (3.62), otteniamo
P
(Jf1 )(x) = (Jf2 )(x) +
n
X
(xi − x0i )(Jhi )(x) .
i=1
Prendendo x = x0 , si vede che (Jf1 )(x0 ) = (Jf2 )(x0 ) sotto l’ipotesi iniziale di f1 (x0 ) = f2 (x0 ).
Quindi, come dicevamo, (Jf )(x0 ) è una funzione soltanto di f (x0 ). Tale funzione deve anche
essere lineare, dato che J è lineare per costruzione. Ne consegue che sarà (Jf )(x0 ) = j(x0 )f (x0 ),
dove j è una funzione su Rn a valori in C. Per l’arbitrarietà di x0 , abbiamo provato che J agisce
come la moltiplicazione per una funzione j. Si osservi che tale funzione deve essere C ∞ . Per
provare ciò, si scelga f ∈ S(Rn ) che valga costantemente 1 in un intorno I(x0 ) di x0 . Se x ∈ I(x0 ),
vale (Jf )(x) = j(x). Dato che il primo membro è C ∞ (I(x0 )), lo deve essere anche il secondo.
Valendo ciò nell’intorno di ogni punto di Rn , vale anche j ∈ C ∞ (Rn ). La (3.64) implica allora
che, per ogni f ∈ S(Rn ) ed ogni x ∈ Rn :
j(x)
∂
∂
f (x) =
j(x)f (x) .
i
∂x
∂xi
Scegliendo, come prima, f con valore costantemente uguale a 1 in un aperto, si ha dall’identità
di sopra che in quell’aperto tutte le derivate di j devono annullarsi. Dato che ciò vale nell’intorno
di ogni punto di Rn che è connesso, la funzione continua j deve essere una funzione costante
su tutto Rn . Il valore della costante ovviamente non dipende dall’argomento di J e quindi può
essere calcolato valutando J su una funzione arbitraria di S(Rn ). Un utile esercizio è quello di
2
calcolare J sulla funzione x 7→ e−x e si vede che il valore della costante è proprio 1. La prova
per J− si esegue nello stesso modo.
93
(d) Usando (c) la tesi si prova immediatamente. Facciamo la dimostrazione per F; quella per
F− è essenzialmente la stessa. Se f1 , f2 ∈ S(Rn ), poniamo, per i = 1, 2:
Z
gi (k) :=
Rn
eik·x
fi (x) dx .
(2π)n/2
È immediato verificare che, nelle nostre ipotesi, possiamo usare il teorema di Fubini-Tonelli,
ottenendo
Z
Z
Rn
g1 (k)g2 (k)dk =
Z
Rn
g1 (k)
Rn
eik·x
f2 (x)dxdk =
(2π)n/2
Z
Rn ×Rn
eik·x
g1 (k)f2 (x)dx ⊗ dk .
(2π)n/2
Usando nuovamente il teorema di Fubini-Tonelli per l’ultimo integrale opportunamente riscritto,
abbiamo
Z
Rn
Z
g1 (k)g2 (k)dk =
Rn ×Rn
e−ik·x
g1 (k)f2 (x)dx ⊗ dk =
(2π)n/2
Z
Rn
Z
f2 (x)
Rn
e−ik·x
g1 (k)dkdx
(2π)n/2
Z
=
Rn
f1 (x)f2 (x)dx ,
dove abbiamo usato il risultato in (c). Questa è la tesi che volevamo provare.
(e) Facciamo la dimostrazione per F, p per F− la dimostrazione è analoga. Si osservi anche
che entrambe le trasformazioni sono ben definite su L1 (Rn , dx) dato che l’integrale è invariante
||f ||1
quando alteriamo le funzioni su insiemi di misura di Lebesgue nulla. La stima ||Ff ||∞ ≤ (2π)
n/2
assicura che l’applicazione lineare F : S(Rn ) → S(Rn ) ⊂ C0 (Rn ) econtinua quando il dominio
è dotato della norma L1 e il codominio della norma || · ||∞ . Dato che S(Rn ) è denso in L1 nella
norma detta e il codominio è completo rispetto alla seconda norma, la trasformata di Fourier
inizialmente definita su S(Rn ) si estende per continutà unicamente (e quindi coincide con la trasf.
lineare già definita su L1 (Rn , dx)) ad una trasformazione lineare limitata da L1 (Rn , dx) a C0 (Rn )
che conserva la stessa norma (cfr (2) e (3) in Esercizi 2.1). Dato che, se f ∈ L1 , Ff ∈ C0 (Rn ),
per ogni > 0 esiste un compatto K ⊂ Rn tale che |(Ff )(k)| < se k 6∈ K . Scegliendo per ogni
> 0 una palla di raggio r centrata nell’origine tanto grande da includere K , concludiamo che,
per ogni > 0 esiste un reale r > 0 tale che |(Ff )(k)| < se |k| > r .
(f) Facciamo la dimostrazione per F, p per F− la dimostrazione è analoga. Dato che l’operatore
F è lineare, è sufficiente dimostrare che se Ff è la funzione nulla, allora f è quasi ovunque nulla.
Si supponga pertanto che:
Z
Rn
eik·x
f (x) dx = 0 ,
(2π)n/2
per ogni k ∈ Rn .
Se g ∈ S(Rn ), applicando il teorema di Fubini-Tonelli, abbiamo che:
Œ
Z
Z
Z ‚Z
eik·x
eik·x
0=
g(k)
f (x) dx dk =
g(k) dk f (x) dx .
n/2
n/2
Rn
Rn (2π)
Rn
Rn (2π)
94
Dato che F è biettiva su S(Rn ), quanto ottenuto è equivalente a dire che (notare che ψf ∈
L1 (Rn , dx) per ogni ψ ∈ S(Rn ) dato che ψ è limitata):
Z
ψ(x)f (x) dx = 0
Rn
per ogni ψ ∈ S(Rn ).
Dato che D(Rn ) ⊂ S(Rn ), il lemma 3.2 implica che f è nulla quasi ovunque. 2
Passiamo alla trasformata di Fourier-Plancherel. Dato che S(Rn ) è denso in L2 (Rn ), passando
alle classi di equivalenza di funzioni si potrà dire che S(Rn ) individua un sottospazio denso, che
indicheremo ancora con lo stesso simbolo S(Rn ), nello spazio di Hilbert L2 (Rn ). Gli operatori
F e F− possono essere pensati come definiti su tale sottospazio denso in L2 (R, dx). Il punto (d)
della proposizione 3.12 implica in particolare che tali operatori sono limitati con norma pari a
1, dato che sono operatori isometrici. Come sappiamo dall’esercizio (3) di esercizi 2.1, F e F−
individueranno univocamente due operatori lineari limitati su tutto L2 (Rn , dx). Per esempio,
l’operatore che estende F su L2 (Rn , dx) è definito come, se f ∈ L2 (Rn , dx),
b := lim Ff ,
Ff
n
n→+∞
dove {fn }n∈N ⊂ S(Rn ) è una qualunque successione che converge a f nella topologia di L2 (Rn , dx)
(come provato nell’esercizio citato sopra, il limite esiste sempre e non dipende dalla successione
b continuerà a conservare il
scelta). Per la continuità del prodotto scalare, l’operatore esteso F
2
2
2
b sarà iniettivo su L (Rn , dx). In realtà sarà anche
prodotto scalare di L (R , dx) e pertanto F
b possiamo similmente cosuriettivo per il seguente motivo elementare. Accanto all’operatore F
2
n
n
Ó
struire l’operatore che estende su L (R , dx) la trasformata inversa di Fourier F
− . Su S(R , dx)
vale
FF− = IS(Rn )
Passando alle estensioni su L2 per linearità e continuità, tenendo conto del fatto che l’unica
estensione lineare dell’identità su S(Rn , dx) (costruita con la procedura generale detta sopra) è
l’identità su L2 (Rn , dx), otteniamo che deve valere
bF
b =I,
F
−
b
dove I è l’identità su L2 (Rn , dx). Questo fatto implica immediatamente la surgettività di F.
b : L2 (Rn , dx) → L2 (Rn , dx) che estende per linearità
Definizione 3.15 L’unico operatore F
e continuità la trasformata di Fourier ristretta a S(Rn ) è detto trasformazione di FourierPlancherel.
b : L2 (Rn , dx) →
Teorema 3.10 (di Plancherel). La trasformazione di Fourier-Plancherel F
L2 (Rn , dx) è un operatore lineare biettivo ed isometrico.
95
Prova. La dimostrazione è stata data immediatamente sopra la definizione 3.15. 2
b
Rimane aperta una questione. Se f ∈ L1 (Rn , dx) ∩ L2 (Rn , dx) (ma f 6∈ S(Rn )), a priori Ff e Ff
b non abbiamo esteso F partendo da L1 (Rn , dx), ma siamo parsono diversi, perché per definire F
n
titi dal suo sottospazio S(R ). Questa era l’unica possibilità, visto che L1 (Rn , dx) 6⊂ L2 (Rn , dx).
La seguente proposizione fa luce sulla questione, dando anche un metodo pratico per calcolare
la trasformata di Fourier-Plancherel in termini di limiti di quella di Fourier.
Nota. Ricordiamo che se K ⊂ Rn è un insieme di misura finita ed in particolare se K è un
compatto (i compatti hanno misura di Lebesgue finita), allora:
(1) L2 (K, dx) ⊂ L1 (K, dx);
(2) se {fn }n∈N ⊂ L2 (K, dx) converge nella norma || ||2 a f ∈ L2 (K, dx) allora converge alla
stessa funzione anche nella norma || ||1 ;
(3) L∞ (K, dx) ⊂ Lp (K, dx) per 1 ≤ p < ∞;
(4) se {fn }n∈N ⊂ L∞ (K, dx) converge nella norma || ||∞ a f ∈ L∞ (K, dx), allora converge alla
stessa funzione anche nella norma || ||p .
Queste quattro affermazioni si provano immediatamente come segue, tenendo conto, per le prime
due, che la funzione che vale costantemente 1 su un compatto, che quindi ha misura finita, è
integrabile. Per la prima affermazione si osservi che vale
2|f (x)| ≤ |f (x)|2 + 1 ,
per cui l’integrale del primo membro è maggiorato da quello del secondo. Per la seconda
affermazione si noti che, dalla disuguaglianza di Cauchy-Schwartz
Z
‹2
|g(x)| 1 dx
≤
Z
K
2
|g(x)| dx
K
‹ Z
‹
1dx ,
K
sostituendo f (x) − fn (x) a g(x) si ha la prova della seconda affermazione. Riguardo alla terza
e quarta affermazione è sufficiente notare che, per la stessa definizione di integrale di Lebesgue:
Z
K
|g|p dx ≤ ess sup |g|p
K
Z
dx = (||g||∞ )p
K
Z
dx
K
per ogni funzione misurabile g definita su K.
Proposizione 3.13. La trasformazione di Fourier-Plancherel e quella di Fourier godono delle
seguenti proprietà.
(a) Se f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx), la sua trasformata di Fourier-Plancherel si riduce alla
trasformata di Fourier Ff calcolata direttamente con la formula integrale (3.54).
(b) Se f ∈ L2 (Rn , dx), la sua trasformata di Fourier-Plancherel può essere calcolata come
F̂f = lim gn
n→+∞
96
dove il limite è nel senso di L2 (Rn , dk),
Z
gn (k) :=
Kn
eik·x
f (x)dx ,
(2π)n/2
(3.67)
essendo gli insiemi Kn ⊂ Rn tutti compatti e tali che Km+1 ⊃ Km per m = 1, 2, . . ., con
n
∪∞
m=1 Km = R .
Prova. (a) Cominciamo a provare la tesi per le funzioni f ∈ L2 (Rn , dx) tali che f sia differente
da 0 su un insieme di misura nulla fuori da un compatto K0 . In questo caso f appartiene anche
a L1 (Rn , dx). Sia quindi {sn } ⊂ S(Rn ) una successione di funzioni che tendono a f nella norma
di L2 (Rn , dx). Se B e B 0 sono due palle aperte di raggio finito tali che B ⊃ B 0 ⊃ B 0 ⊃ K0 ,
possiamo costruire una funzione h ∈ D(Rn ) tale da valere costantemente 1 su B 0 e da annullarsi
fuori da B. È chiaro che se fn := h · sn , la successione {fn } è costituita da funzioni di D(Rn ),
e quindi S(Rn ), con supporti contenuti nel compatto K := B. Quindi tutte le fn sono anche
in L1 (Rn , dx) e la successione {fn } tende a f sia nella norma di L2 (Rn , dx) che in quella di
L1 (Rn , dx).
Per definizione, valendo fn → f nella norma || ||2 , sarà
||Ffn − F̂f ||2 → 0
(3.68)
per n → +∞. D’altra parte, dato che fn → f anche nella norma || ||1 , per (a) di proposizione
3.12 ||Ffn − Ff ||∞ → 0 per n → +∞. Dato che, sugli insiemi di misura finita, la convergenza
nella norma || ||∞ implica quella nella norma || ||2 , avremo che
||Ffn − Ff ||2 → 0
(3.69)
b = Ff .
e quindi, valendo (3.68) e per l’unicità del limite, dovrà essere Ff
2
n
1
n
Supponiamo ora che f ∈ L (R , dx)∩L (R , dx) senza altre restrizioni. Consideriamo una classe
di compatti {Kn } che soddisfino le ipotesi nel punto (b). Definiamo le funzioni fn := χKn · f ,
dove χE è la funzione caratteristica dell’insieme E (definita in modo che χE (x) = 0 se x 6∈ E
e χE (x) = 1 se x ∈ E). È chiaro che vale fn → f puntualmente per n → +∞. Inoltre
|f (x) − fn (x)|p ≤ |f (x)|p per p = 1, 2, . . .. Allora, per il teorema della convergenza dominata di
Lebesgue, fn → f per n → +∞ in particolare rispetto alla norma || ||1 e a quella || ||2 . D’altra
parte, per quanto dimostrato sopra,
b .
Ffn = Ff
n
Quindi, per (a) di proposizione 3.12, troviamo che ||Ff − Ffn ||∞ → 0 ed allo stesso tempo
b − Ff || → 0. Questi fatti varranno anche per le funzioni che si ottengono
vale anche ||Ff
n 2
b , Ff , Ff ad un qualsiasi compatto K. Tenendo conto che per funzioni nulle
restringendo Ff
n
fuori da un compatto la convergenza uniforme implica quella in L2 , si ha che se x appartiene
b )(x) quasi ovunque. Ma ogni x ∈ Rn appartiene ad un
ad un compatto qualsiasi, (Ff )(x) = (Ff
b come elementi di L2 (Rn , dx).
compatto, per cui Ff = Ff
97
(b) La prova è stata data nella parte finale della dimostrazione del punto (a). 2
Esempi 3.4
(1) Un fatto piuttosto importante che distingue nettamente lo spazio D(Rn ) da S(Rn ) è che il
primo spazio, al contrario del secondo, non è invariante sotto la trasformazione di Fourier (e la
trasformata inversa di Fourier). Infatti vale il seguente risultato:
se f ∈ D(Rn ), allora Ff ∈ S(Rn ), ma se Ff ∈ D(Rn ), allora f e Ff sono la funzione nulla. Lo
stesso fatto vale per la trasformata inversa di Fourier.
La prova è semplice; la svolgiamo per F, ma la stessa prova vale anche per F− . Se vale
Z
g(k) =
Rn
eip·x
f (x) dx ,
(2π)n/2
dove f ha supporto compatto, allora l’integrale di sopra converge anche per k ∈ Cn . Inoltre,
facendo uso del teorema della convergenza dominata di Lebesgue, si può far passare la derivata
nelle componenti ki di k, e nelle loro parti reale ed immaginaria, sotto il segno di integrale.
Dato che k 7→ eik·x è analitica (cioè analitica in ogni variabile ki separatamente), soddisferà
le condizioni di Cauchy-Riemann in ogni variabile ki . Di conseguenza tali condizioni saranno
soddisfatte anche per la funzione g in ogni variabile ki . Si conclude che g è una funzione analitica
su tutto Cn . La restrizione di g ad Rn definirà, tramite la parte reale e quella immaginaria, due
funzioni analitiche di variabile reale su tutto Rn . Se g ha supporto compatto, esisterà un aperto
non vuoto di Rn in cui Re g e Im g si annullano. È un fatto ben noto nella teoria delle funzioni
analitiche (reali di variabile reale) che se una funzione analitica definita su un aperto connesso
(in questo caso tutto Rn ) si annulla su un aperto non vuoto incluso nel suo dominio, allora si
annulla ovunque nel dominio. Dobbiamo quindi concludere che, nelle nostre ipotesi su f , se g ha
supporto compatto, essa deve necessariamente essere la funzione nulla. Tale dovrà anche essere
f , in quanto F è invertibile su S(Rn ).
(2) Un fatto connesso con (1) è il noto teorema di Paley-Wiener (vedi per es. [KiGv83]):
Teorema (di Paley-Wiener). Sia a > 0 e si consideri L2 ([−a, a], dx) come sottospazio di
L2 (R, dx). Lo spazio F̂(L2 ([−a, a], dx)) contiene tutte e sole le funzioni g = g(k) tali che ciascuna
di esse possa essere estesa analiticamente ed univocamente a tutto il piano complesso nella
variabile k ∈ C in una funzione analitica che soddisfa
|g(k)| ≤ Ce2πa|Imk| ,
per ogni k ∈ C
per qualche costante C ≥ 0 dipendente da g.
Visto che deve essere F̂(L2 ([−a, a], dx)) ⊂ L2 (R, dk) per il teorema di Plancherel, il teorema di
Paley-Wiener implica che le funzioni analitiche g che sono limitate secondo la disuguaglianza di
sopra per qualche costante C ≥ 0, individuano elementi di L2 (R, dk) quando k è ristretta a R.
Per concludere, consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota
l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione usata in (4) di
98
esempi 3.2 per costruire basi Hilbertiane che deriva dalla teoria della trasformata di FourierPlancherel.
Proposizione 3.14. Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f (x) = 0}
ha misura nulla, (2) esistono C, δ > 0 per cui |f (x)| < Ce−δ|x| per ogni x ∈ (a, b).
In questo caso lo spazio lineare finitamente generato da tutte le funzioni x 7→ xn f (x) := fn (x)
per n = 0, 1, 2, . . . è denso in L2 ((a, b), dx).
Prova Sia S := {fn }n∈N . È sufficiente provare che S ⊥ = {0} dato che è S ⊥ ⊕ < S > =
L2 ((a, b), dx) per il teorema 3.1. Sia allora h ∈ L2 ((a, b), dx) tale che
Z b
xn f (x)h(x)dx = 0
a
per ogni n = 0, 1, 2, . . .. Possiamo estendere la funzione h a tutta la retta reale definendola nulla
fuori da (a, b). La condizione di sopra si riscrive
Z
xn f (x)h(x)dx = 0 ,
(3.70)
R
per ogni n = 0, 1, 2, . . .. Valgono inoltre i seguenti fatti:
(i) f · h ∈ L1 (R, dx): infatti entrambe le funzioni sono in L2 (R, dx), per cui il loro prodotto è in
L1 (R, dx);
(ii) f · h ∈ L2 (R, dx), perché |f (x)|2 < C 2 e−2δ|x| < C 2 < +∞ e |h|2 è integrabile per ipotesi;
0
(iii) La funzione che manda x ∈ R in eδ |x| f (x)h(x) è in L1 (R, dx) per ogni δ 0 < δ. Infatti, essendo
0
0
0
x 7→ |eδ |x| f (x)| ≤ Ce−(δ−δ )|x| , la funzione x 7→ eδ |x| f (x) è in L2 (R, dx); inoltre h ∈ L2 (R, dx)
per ipotesi, per cui il loro prodotto è in L1 (R, dx).
Per (i) possiamo calcolare la trasformata di Fourier
Z
g(k) =
R
eik·x
√ f (x)h(x) dx .
2π
Questa coinciderà con la trasformata di Fourier-Plancherel di f · h per i punti (i) e (ii) insieme,
tenuto conto di (a) della proposizione 3.13. Per (iii), se k è complesso e |Imk| < δ, la funzione
g = g(k) di sopra è ben definita ed analitica nella banda aperta B ⊂ C definita da Rek ∈ R,
|Imk| < δ; la prova si costruisce analogamente a quanto fatto nell’esempio (1). Usando il teorema
della convergenza dominata di Lebesgue e passando sotto il segno di integrale l’operatore di
derivazione, è infine facile provare che, per ogni n = 0, 1, . . .,
dn g
in
|k=0 = √
n
dk
2π
Z
xn f (x)h(x)dx .
R
Tutte queste derivate sono nulle per (3.70), di conseguenza lo sviluppo di Taylor di g nell’origine
è nullo e quindi g si annulla in un disco aperto contenuto nella banda B. Essendo g analitica,
si annullerà identicamente nell’aperto connesso B ed in particolare sull’asse k reale. Quindi,
99
in particolare, avremo che la trasformata di Fourier-Plancherel della funzione f · h è il vettore
nullo di L2 (R, dk). Dato che la trasformata di Fourier-Plancherel è una trasformazione unitaria
dobbiamo concludere che f · h = 0 quasi ovunque su R ed in particolare su (a, b) dove per ipotesi
f 6= 0 quasi ovunque. Ma allora deve essere h = 0 quasi ovunque su (a, b), ovvero ogni h ∈ S ⊥
coincide con l’elemento nullo di L2 ((a, b), dx). Questo conclude la prova. 2
100
Capitolo 4
Proprietà elementari degli operatori
compatti, di Hilbert-Schmidt e di
classe traccia.
In questo capitolo introdurremo alcuni tipi di operatori che saranno necessari quando definiremo il concetto di stato quantistico. Tali operatori sono noti in letteratura come operatori di
classe traccia oppure operatori nucleari. Si tratta di operatori limitati definiti su uno spazio
di Hilbert che ammettono traccia. Tali operatori giocano un ruolo fondamentale nelle teorie
fisiche in quanto, per il celebre teorema di Gleason, che avremo occasione di discutere più avanti,
rappresentano gli stati quantistici. Purtroppo, tali operatori sono poco discussi nella letteratura
matematica elementare a dispetto della loro importanza in fisica, pertanto ci dilungheremo un
poco sulle loro notevoli proprietà .
Per arrivare a definirli è necessario introdurre qualche nozione in più riguardante in particolare
gli operatori compatti, detti anche completamente continui, che rivestono una notevole importanza in vari rami della matematica e delle applicazioni alla fisica, indipendentemente dalle teorie
quantistiche.
Nella prima sezione del capitolo presenteremo la nozione generale di operatore compatto su uno
spazio normato, discutendone molto brevemente le proprietà generali. Proveremo anche il classico risultato riguardante la non compattezza della palla unitaria in dimensione infinita.
Nella seconda sezione specializzaeremo la definizione al caso di spazi di Hilbert, in riferimento,
in particolare agli spazi L2 , sui quali gli operatori compatti (come quelli di Hilbert-Schmidt)
ammettono una certa rappresentazione integrale. Mostreremo che l’insieme degli operatori compatti individua uno ∗-ideale bilatero nella C ∗ algebra degli operatori limitati sullo spazio di
Hilbert. In questa sede enunceremo e dimostreremo il celebre teorema di Hilbert sollo sviluppo
spettrale degli operatori compatti, che può essere considerato come il precursore di tutti i teoremi di decomposizione spettrale. La quarta sezione riguarderà lo ∗-ideale bilatero degli operatori
di Hilbert-Schmidt e le loro proprietà più elementari. In particolare mostreremo che lo spazio
degli operatori di H-S è a sua volta uno spazio di Hilbert.
101
L’ultima sezione concernerà l’introduzione dello ∗-ideale bilatero degli operatori di classe traccia e la dimostrazione delle proprietà più importanti (e più utili in fisica) di tali operatori. In
particolare dimostreremo la proprietà di ciclicità della traccia.
4.1
Generalità sugli operatori compatti in spazi normati, di
Banach e Hilbert.
Ricordiamo che in uno spazio topologico un insieme compatto K è definito dalla proprietà seguente:
K è detto compatto se da ogni ricoprimento di aperti di K (cioè una classe di aperti {Ai }i∈I
con ∪i∈I Ai ⊃ K) è possibile estrarre un sotto ricoprimento finito (ossia esiste un insieme finito
J ⊂ I tale che ∪i∈J Ai ⊃ K).
Una nozione connessa è quella di compattezza sequenziale:
K è detto sequenzialmente compatto se per ogni successione {xn }n∈N ⊂ K esiste una sotto
successione {xnp }p∈N convergente ad un punto di K.
Ricordiamo che i sottoinsiemi chiusi dei compatti sono compatti e, negli spazi di Hausdorff (in
particolare gli spazi vettoriali normati, come gli spazi di Hilbert), i compatti sono chiusi. Negli
spazi topologici che siano anche spazi metrici (e quindi ancora in particolare gli spazi vettoriali
normati, come gli spazi di Hilbert), la proprietà di compattezza è equivalente a quella di compattezza sequenziale. Un’altra proprietà utile che vale in spazi metrici è la seguente.
Proposizione 4.1. Sia (X, || ||) spazio normato. Se A ⊂ X è tale che ogni successione di
punti di A ammette una sotto successione convergente (non necessariamente in A), allora A è
compatto.
Prova. L’unica cosa da mostrare è che se {yn } ⊂ A, allora esiste una sotto successione di {yn }
che converge (in A, essendo esso chiuso). Evidentemente, ci saranno delle successioni, una per
(k)
(k)
ogni k, {xn } ⊂ A, con xn → yk per n → +∞. Fissando k e prendendo un corrispondente nk
sufficientemente grande, possiamo allora costruire termine per termine una nuova successione
(k)
{zk := xnk } ⊂ A tale che ||yk −zk || < 1/k. Nelle ipotesi fatte su A, esisterà una sotto successione
di {zk }, {zkp }, che converge a qualche y ∈ A. Si ha:
||ykp − y|| ≤ ||ykp − zkp || + ||zkp − y|| .
Dato che 1/kp → 0 per p → +∞, fissato > 0 esisterà P tale che, se p > P , allora ||zkp −y|| < /2
insieme a 1/kp < /2, per cui ||ykp − y|| < . In altre parole {ykp } → y per p → +∞. 2
Nota. La proposizione provata vale anche per spazi metrici, con banali modifiche nella dimostrazione.
Un risultato importante e notevole, che distingue nettamente il caso di uno spazio normato
finito-dimensionale da quello infinito-dimensionale e che si applica, più in generale, a spazi me102
trici, è il seguente .
Proposizione 4.2. Sia (X, || ||) uno spazio normato.
Se X ha dimensione infinita, la chiusura della palla aperta unitaria {x ∈ X | ||x|| < 1} non può
essere compatta.
Nota. La chiusura della palla aperta unitaria coincide con la palla chiusa unitaria
{x ∈ X | ||x|| ≤ 1}
(lo si provi per esercizio). Nel caso di dimensione finita, la palla chiusa unitaria è compatta.
Ciò segue dal fatto che in spazi normati di dimensione finita tutte le norme inducono la stessa
topologia (e rendono lo spazio di Banach, lo si dimostri per esercizio), per cui ci si può sempre
ridurre ad usare la metrica euclidea identificando lo spazio con un Rn . In tal caso la chiusura
della palla aperta coincide banalmente con la palla chiusa, che è compatta perché insieme chiuso
e limitato di Rn (teorema di Heine-Borel).
Prova della proposizione 4.2. Indichiamo con B la palla aperta unitaria centrata nell’origine e
supponiamo che B sia compatta. Allora possiamo ricoprire B, e quindi B, con un numero N > 0
di palle aperte Bk , di raggio 1/2 e centrate rispettivamente in xk , k = 1, . . . , N . Consideriamo
un sottospazio Xn di X, di dimensione finita n, tale da contenere i vettori xk . Dato che la dimensione di X è infinita, possiamo scegliere n > N arbitrariamente grande. Definiamo le ulteriori
palle, di raggi 1 e 1/2 rispettivamente, P := B ∩ Xn e Pk := Bk ∩ Xn per ogni k = 1, . . . , N .
Identifichiamo Xn con R2n (o Rn se il campo di X è R) tramite la scelta di una base di Xn ,
{zk }k=1,...,n . Notare che una palla Pk non soddisfa necessariamente l’equazione di una palla in
R2n in questa costruzione. Se normalizziamo la misura di Lebesgue m di R2n dividendo per il
volume di P (che è non nullo dato che è aperto non vuoto per la proposizione 2.8) abbiamo
che m(P ) = 1. Mostriamo che allora m(Pk ) = (1/2)n . La misura di Lebesgue è invariante per
traslazioni per cui ci si può ridurre a considerare le palle centrate nell’origine di raggio r, B(r).
Dato che ogni norma è una funzione omogenea vale B(λr) = {λu | u ∈ B(r)} =: λB(r) per ogni
λ > 0. Dato che la misura di Lebesgue su R2n soddisfa m(λE) = λ2n m(E), nelle ipotesi fatte risulta che deve essere m(Pk ) = m((1/2)P ) = (1/2)n m(P ) = (1/2)n . Essendo infine B ⊂ ∪N
k=1 Bk
PN
N
e dunque P ⊂ ∪k=1 Pk , deve essere m(P ) ≤ k=1 m(Pk ) per subadditività, ossia 1 ≤ N (1/2)2n .
Questo è impossibile se n è abbastanza grande (N è fissato). 2
Ricordiamo che in uno spazio normato (X, || ||) un insieme M è detto limitato (rispetto alla
norma || ||) se esiste una palla metrica, Bδ (x0 ), di raggio finito δ > 0 e centrata in qualche punto
x0 ∈ X, tale che M ⊂ Bδ (x0 ).
È chiaro, allora, che M è limitato se e solo se esiste una palla metrica di raggio finito δ > 0
e centrata nell’origine di X, che contiene M (basta scegliere il raggio di tale palla pari a δ+||x0 ||).
Definizione 4.1. Siano X, Y spazi normati sullo stesso campo R o C (in particolare X = Y = H
spazio di Hilbert). T ∈ L(X, Y) è detto compatto o completamente continuo se vale una
103
delle due condizioni equivalenti:
(a) per ogni sottoinsieme M ⊂ X limitato, T (M ) è compatto in Y;
(b) ogni successione limitata, {xn }n∈N , ammette una sotto successione, {xnk }k∈N ⊂ X, tale che
{T xnk }k∈N converge in Y.
B0 (X, Y) denota il sottoinsieme degli operatori compatti da X a Y e, in particolare, B0 (X) denota
il sottoinsieme degli operatori compatti da X in X.
Osservazioni.
(1) È chiaro che (a) ⇒ (b). L’implicazione inversa, (b) ⇒ (a), è immediata conseguenza della
proposizione 4.1.
(2) Ogni operatore compatto è sicuramente limitato. Infatti, la palla chiusa di raggio 1 centrata
nell’origine di X è mappata in un insieme (che contiene l’origine) a chiusura compatta K. Essendo compatto, K è ricopribile da un numero finito, N , di palle aperte di raggio finito r > 0,
Br (yi ). Vale allora K ⊂ ∪N
i=1 Br (yi ) ⊂ BR+r (0), dove R è il massimo delle distanze tra i centri
yi delle palle e l’origine. In particolare ||T (x)|| ≤ (R+r) per ||x|| = 1 per cui ||T || ≤ r+R < +∞.
4.2
Operatori compatti in spazi di Hilbert.
D’ora in avanti ci restringeremo a considerare operatori compatti in spazi di Hilbert, anche se
molte delle proprietà che enunceremo valgono anche in ambiente meno sofisticato, come spazi
normati o spazi di Banach. Nel teorema che segue, l’ipotesi di completezza dello spazio viene in
realtà usata solo nell’ultima proprietà.
Abbiamo bisogno di una proposizione preliminare prima di enunciare e provare il teorema.
Proposizione 4.3. Sia H spazio di Hilbert. A ∈ B(H) è compatto se e solo se |A| (definizione
3.12) è compatto.
Prova. Supponiamo A compatto. Sia {xk }k una successione limitata in H e sia {Axkn }n una
sotto successione di {Axk }k convergente in virtù della compattezza di A. Essendo tale sotto
successione successione di Cauchy, in virtù di (3.47), la sotto successione di {|A|xk }k , {|A|xkn }n
è successione di Cauchy e quindi converge. Pertanto |A| è compatto. Scambiando il ruolo di A
e |A| ed usando la stessa dimostrazione, si prova che se |A| è compatto, è tale anche A.
Teorema 4.1. Sia H spazio di Hilbert. Valgono i seguenti fatti.
(a) B0 (H) è un sottospazio vettoriale di B(H).
(b) B0 (H) è uno ∗-ideale bilatero di B(H), ossia, oltre ad essere un sottospazio, B0 (H) gode della proprietà che se T ∈ B0 (H), allora T K, KT ∈ B0 (H) per ogni K ∈ B(H) ed inoltre
T ∗ ∈ B0 (H).
(c) B0 (H) è chiuso rispetto alla topologia uniforme.
104
Prova. (a) Se T è compatto e a ∈ C, segue banalmente dalla stessa definizione di operatore
compatto che aT è compatto. Se T e S sono compatti lo è T + S. Proviamolo. Se {un } è
successione limitata, sia {unk } una sotto successione per cui {T unk } è convergente (sarà quindi
tale ogni sua sotto successione). Dato che {unk } è limitata per costruzione, esisterà una sua
sotto successione {unkp } per cui {Sunkp } è convergente. Per costruzione {Sunkp } e {T unkp } sono
entrambe convergenti e quindi è tale la successione di elementi (T + S)unkp = T unkp + Sunkp .
Abbiamo provato che, se {un } è successione limitata c’è una sua sotto successione {unkp } per
cui {(T + S)unkp } converge; pertanto T + S è compatto.
(b) Data la successione {xn } limitata, esiste una sotto successione di {T xn } convergente, e quindi
anche di {KT xn }, dato che K è continuo. Quindi KT è compatto. Data la successione {xn }
limitata, anche {Kxn } è limitata, dato che K è limitato (||Kxn || ≤ ||K||||xn || ≤ ||K||C < +∞).
Dalla compattezza di T segue che {T Kxn } ammette una sotto successione convergente. Quindi
T K è compatto. Per dimostrare la chiusura rispetto all’operazione di coniugazione hermitiana,
notiamo che |T | è compatto se e solo se T è compatto per proposizione 4.3. Decomponendo
polarmente T = U |T | secondo il teorema 3.9, segue che T ∗ = |T |U ∗ , dove si è tenuto conto del
fatto che |T | ≥ 0, per cui |T | è autoaggiunto. La limitatezza di U ∗ insieme alla compattezza
di |T | implicano che T ∗ = |T |U ∗ è compatto per quanto provato all’inizio di questa parte di
dimostrazione.
(c) Sia B(H) 3 A = limi→+∞ Ai con Ai ∈ B0 (H). Sia {xn } una successione limitata di vettori di
H: ||xn || ≤ C per ogni n. Vogliamo provare che esiste una sottosuccesione di {Axn } convergente.
Con una procedura ricorsiva, costruiamo una famiglia di sottosuccessioni
(2)
{xn } ⊃ {x(1)
n } ⊃ {xn } ⊃ · · ·
(i+1)
(4.1)
(i)
(i+1)
tale che, per ogni i = 1, 2, . . ., {xn } è sotto successione di {xn } tale che {Ai+1 xn } è
(i)
convergente. Questo è sempre possibile, in quanto ogni {xn } è limitata da C essendo sotto
successione di {xn } ed inoltre Ai+1 è compatto per ipotesi. La sotto successione di {Axn } che
(i)
proveremo convergere è quella di elementi Axi . Usando la disuguaglianza triangolare abbiamo
facilmente che
(i)
(k)
(i)
(i)
(i)
(k)
(k)
(k)
||Axi − Axk || ≤ ||Axi − An xi || + ||An xi − An xk || + ||An xk − Axk || .
Usando la stima scritta, nelle nostre ipotesi si ha che:
(i)
(k)
(i)
(k)
(i)
(k)
(i)
(k)
||Axi −Axk || ≤ ||A−An ||(||xi ||+||xk ||)+||An (xi −xk )|| ≤ 2C||A−An ||+||An xi −An xk ||.
Fissato > 0, se n è grande a sufficienza, varrà 2C||A − An || ≤ /2, dato che An → A per
(r)
ipotesi. Fissato n e se r ≥ n, {An (xp )}p è sotto successione della successione convergente
(n)
(p)
{An (xp )}p . È facile vedere che la successione {An (xp )}p costruita, per p ≥ n, con i termini “diagonali” di tutte queste sottosuccessioni, ciascuna sotto successione della precedente per
(n)
(4.1), è ancora sotto successione della successione convergente {An (xp )}p , per cui è anche essa
convergente (allo stesso limite). Concludiamo che se i, k ≥ n sono grandi a sufficienza, vale anche
105
(i)
(k)
(i)
(k)
||An xi −An xk || ≤ /2. Quindi, se i, k sono grandi a sufficienza ||Axi −Axk || ≤ /2+/2 = .
Ciò prova la tesi. 2
Esempi 4.1.
(1) Se X, Y sono spazi normati e T ∈ B(X, Y) è tale che Ran(T ) ha dimensione finita, allora
T deve essere compatto. Proviamolo. Se V ⊂ X è limitato, cioè ||x|| < K se x ∈ V per un
fissato K < +∞ indipendente da x, allora ||T (V )|| ≤ K||T || < +∞, per cui T (V ) è limitato.
T (V ) è chiuso e limitato in uno spazio normato di dimensione finita che è sempre omeomorfo ad
un Cn (Proposizione 2.8). Per il teorema di Heine-Borel T (V ) è allora compatto rispetto alla
topologia indotta sul rango di T . Quindi T è compatto dato che, dalla definizione generale di
compatto, la compattezza rispetto alla topologia indotta implica immediatamente quella rispetto
alla topologia globale.
Come ulteriore sottocaso, se H è spazio di Hilbert si consideri un operatore Tx ∈ L(H) della
forma
Tx : u 7→ (x|u)y ,
dove x, y ∈ H sono fissati vettori (eventualmente coincidenti). È chiaro che tale operatore è
compatto, avendo rango di dimensione finita.
(2) Se {xn }n∈N e {yn }n∈N sono sottoinsiemi ortogonali di H e se, interpretando la serie nella
P
topologia uniforme, risulta che T = n∈N (xn | )yn è un operatore limitato, allora T è compatto
per (a) e (c) del teorema 4.1.
(3) In l2 (N) consideriamo l’operatore A : {xn } 7→ {xn+1 /n}. Tale operatore è compatto in
quanto è limite nella topologia uniforme degli operatori, per n = 1, 2 . . . ,
Am : {xn } 7→ {x2 /1, x3 /2, . . . , xm+1 /m, 0, 0, . . .} .
Si verifica infatti facilmente che (lo si provi per esercizio)
||A − An || ≤ 1/(n + 1) .
(4) Si consideri lo spazio X con misura µ sulla σ-algebra Σ in X e sia µ σ-finita, in modo da
definire la misura prodotto µ ⊗ µ. Consideriamo quindi K ∈ L2 (X × X, µ ⊗ µ). Si può provare
che
Z
TK : L2 (µ) 3 f 7→ K(x, y)f (y)dµ(y)
definisce un operatore TK ∈ B(L2 (X, µ)) che è compatto quando µ è anche separabile. Per
prima cosa notiamo che, indipendentemente dall’ipotesi di separabilità, se f ∈ L2 (µ):
Z
e
K(·, y)f (y)dµ(y) ∈ L2 (µ)
Z
K(·, y)f (y)dµ(y)
L2 (X,µ)
≤ ||K||L2 (X×X,µ⊗µ) ||f ||L2 (X,µ) ,
106
che equivale a dire:
||TK || ≤ ||K||L2 (X×X,µ⊗µ) .
(4.2)
(La prova di questo fatto è interamente basata sul teorema di Fubini-Tonelli: Se K ∈ L2 (µ ⊗ µ)
allora, per Fubini-Tonelli:
(1) |K(x,
·)|2 ∈ L1 (µ), µ-quasi ovunque,
R
(2) |K(x, y)|2 dµ(y) ∈ L1 (µ) .
Da (1) segue che K(x, ·) ∈ L2 (µ) quasi ovunque e quindi K(x, ·)f ∈ L1 (µ) quasi ovunque e per
la disuguaglianza
di Cauchy-Schwarz:
R
(3) |K(x, y)||fR (y)|dµ(y) ≤ ||K(x, ·)||L2 ||f ||L2 .
Posto F (x) := K(x,
y)f (y)dµ(y), F è misurabile e vale, per la (3):
R
2
2
(4) |F (x)| ≤ ||f ||L2 |K(x, y)|2 dµ(y).
Per (2) si ha quindi che |F |2 ∈ L2 (µ) ed è quindi vero che vale
Z
K(·, y)f (y)dµ(y) ∈ L2 (µ) .
Da (4) e dal teorema di Fubini-Tonelli segue infine anche
Z
K(·, y)f (y)dµ(y)
L2 (µ)
≤ ||K||L2 (µ⊗µ) ||f ||L2 (µ) ,
da cui (4.2).) Facciamo l’ipotesi ulteriore che µ sia separabile in modo che sia separabile L2 (X, µ).
Per esempio X può essere un qualsiasi intervallo (o un boreliano) di R e µ la misura di Lebesgue
su R. Se {un }n∈N è una base Hilbertiana di L2 (X, µ), allora {un ·um }n,m∈N è una base Hilbertiana
di L2 (X × X, µ ⊗ µ) (· è l’ordinario prodotto di funzioni punto per punto) e allora, nella topologia
di L2 (X × X, µ ⊗ µ),
X
K=
knm un · um ,
n,m
dove i numeri knm ∈ C dipendono da K. Quindi, posto
Kp :=
X
knm un · um
n,m≤p
si ha che Kp → K per p → +∞ nella norma di L2 (X × X, µ ⊗ µ). Tenuto conto di (4.2) applicata
agli operatori TKp −K = TKp − TK , dove TKp è indotto dal nucleo integrale Kp , segue che, per
p → +∞,
X
||TK − TKp || = knm un · um n,m>p
→0,
L2 (X×X,µ⊗µ)
per cui TK è compatto in quanto gli operatori TKp sono compatti essendo somme finite di operatori con rango di dimensione finita come quelli discussi nell’esempio (1).
Gli operatori compatti in spazi di Hilbert godono di notevoli proprietà; in particolare gli operatori compatti e autoaggiunti hanno caratteristiche che generalizzano al caso infinito-dimensionale
107
le proprietà della matrici hermitiane finito-dimensionali. Oltre a ciò sono uno strumeto utilissimo per estendere ulteriormente la teoria.
Teorema 4.2 (di Hilbert). Siano H spazio di Hilbert e T ∈ B0 (H) con T = T ∗ : allora vale
quanto segue.
(a) Ogni autospazio di T con autovalore λ 6= 0 ha dimensione finita.
(b) L’insieme σp (T ) degli autovalori di T ha le seguenti caratteristiche:
(1) è non vuoto,
(2) è reale,
(3) è al più numerabile,
(4) ha al più un solo punto di accumulazione dato da 0,
(5) vale l’identità
sup{|λ| | λ ∈ σp (T )} = ||T || .
Più precisamente, l’estremo superiore suddetto è anche massimo ed è raggiunto in Λ ∈ σp (T )
tale che
Λ = ||T || se sup||x||=1 (x|T x) = ||T || ,
(4.3)
oppure
Λ = −||T || se
inf ||x||=1 (x|T x) = −||T || .
(4.4)
(6) T coincide con l’operatore nullo se e solo 0 è l’unico autovalore.
Prova di parte del teorema 4.2.
(a) Sia Hλ l’autospazio di T con autovalore λ 6= 0. Se B ⊂ Hλ è la palla aperta di raggio 1
centrata nell’origine, allora si può scrivere B = T (λ−1 B) e λ−1 B è limitato a sua volta per costruzione. Dato che T è compatto, B è compatto. Quindi, nello spazio di Hilbert Hλ , la chiusura
della palla aperta unitaria è un insieme compatto, pertanto dimHλ < +∞ per la proposizione
4.2.
(b) Proveremo tutti i punti eccetto (3) e (4), che saranno provati nella dimostrazione del teorema
successivo. σp (T ), se è non vuoto è fatto di elementi reali per (c) (ii) di proposizione 3.8, essendo
T autoaggiunto. Per (a) in proposizione 3.8 −||T || ≤ (x|T x) ≤ ||T || per ogni x di norma unitaria, di conseguenza ci possono essere solo le seguenti due possibilità: sup||x||=1 (x|T x) = ||T ||
oppure inf ||x||=1 (x|T x) = −||T ||. Supponiamo vero il primo fatto ed eseguiamo la dimostrazione
in questo caso. L’altro caso si tratta con la stessa dimostrazione scambiando T con −T . Assumeremo che ||T || > 0, altrimenti la prova della tesi è ovvia. Per ogni autovalore λ possiamo
scegliere un autovettore x con ||x|| = 1 e quindi ||T || ≥ |(x|T x)| = |λ|(x|x) = |λ|, di conseguenza sup |σp (T )| ≤ ||T ||. Per provare (5), basta quindi esibire un autovettore con autovalore
Λ = ||T ||. Si noti che ciò prova anche che σp (T ) 6= ∅. Per ipotesi esisterà una successione di
punti xn con ||xn || = 1 tali che (xn |T xn ) → ||T || =: Λ > 0. Vale (dove usiamo anche il fatto che
||T xn || ≤ ||T ||||xn || = ||T ||)
||T xn − Λxn ||2 = ||T xn ||2 − 2Λ(xn |T xn ) + Λ2 ≤ ||T ||2 + Λ2 − 2Λ(xn |T xn ) .
108
Essendo ||T || = Λ, nel limite per n → +∞ della precedente disuguaglianza, si ha che
T xn − Λxn → 0 .
(4.5)
Per concludere ci basterebbe provare che anche {xn }n∈N converge a qualche punto, oppure
che ciò accade per una sua sotto successione. Dato che ||xn || = 1, la successione {xn }n∈N è
limitata; essendo T compatto, possiamo estrarre da {T xn }n∈N una sotto successione convergente:
{T xnk }k∈N .
Da (4.5), si ha che:
1
xnk = [T xnk − (T xnk − Λxnk )]
Λ
converge a qualche x ∈ H se k → +∞, in quanto combinazione lineare di successioni convergenti.
Dato che T è continuo e xnk → x, (4.5) implica che
T x = Λx .
Notiamo che x 6= 0 perché ||x|| = limk→+∞ ||xnk || = 1. Abbiamo provato che x è un autovettore
con autovalore Λ.
(6) è immediata conseguenza di (5). 2
Passiamo al teorema di Hilbert riguardante lo sviluppo degli operatori compatti autoaggiunti su
una base hilbertiana di autovettori.
Teorema 4.3 (di Hilbert). Siano (H, ( | )) spazio di Hilbert e T ∈ B0 (T ) con T = T ∗ .
(a) Se Pλ è il proiettore ortogonale sull’autospazio con autovalore λ ∈ σp (T ) (insieme degli
autovalori di T ), vale:
X
T =
λPλ .
(4.6)
λ∈σp (T )
Se σp (T ) è infinito, la serie in (4.6) è intesa nel senso della topologia uniforme e gli autovalori in
σp (T ): λ0 , λ1 , . . . (con λi 6= λj se i 6= j) sono ordinati in modo tale che |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . ..
(b) Se Bλ denota una base hilbertiana dell’autospazio di T associato a λ ∈ σp (T ), allora
∪λ∈σp (T ) Bλ è una base hilbertiana per H; in altre parole, H ammette una base hilbertiana fatta
di autovettori di T .
Nota. Si osservi che ci possono essere al più due autovalori non nulli con lo stesso valore assoluto (essendo gli autovalori reali). L’unica possibile ambiguità nell’ordinamento dei termini della
serie di sopra, valendo |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . ., è nella scelta dell’ordinamento di ogni coppia
λ, λ0 se |λ| = |λ0 |. Come vedremo dalla dimostrazione del teorema, la somma della serie non
dipende da qualunque scelta venga fatta per tale ordinamento.
Prova del teorema 4.3 e della parte rimanente del teorema 4.2. (a) Sia λ un autovalore con
autospazio Hλ . Sia Pλ il proiettore ortogonale su Hλ e Qλ := I − Pλ il proiettore ortogonale su
H⊥
λ . Vale
T Pλ = Pλ T = λPλ .
(4.7)
109
Questa identità si dimostra notando che se x ∈ H, Pλ x ∈ Hλ e allora T Pλ x = λPλ x, da cui
T Pλ = λPλ . Prendendo l’aggiunto ad ambo membri e tenendo conto del fatto che λ ∈ R,
T = T ∗ , Pλ = Pλ∗ , si ha subito che Pλ T = λPλ = T Pλ . Come ulteriore conseguenza troviamo
che vale anche, direttamente dalla definizione di Qλ e da quanto appena provato,
Qλ T = T Qλ .
(4.8)
Notiamo ancora che, essendo I = Pλ + Qλ abbiamo che T = Pλ T + Qλ T , ossia
T = λPλ + Qλ T .
(4.9)
Si osservi che Qλ T soddisfa:
(i) è autoaggiunto essendo (Qλ T )∗ = T ∗ Q∗λ = T Qλ = Qλ T ,
(ii) è compatto per (b) del teorema 4.1,
(iii) soddisfa per costruzione Pλ (Qλ T ) = (Qλ T )Pλ = 0 valendo Pλ Qλ = Qλ Pλ = 0.
Nel seguito useremo ripetutamente queste identità anche senza citarle esplicitamente e d’ora in
poi scriveremo Pn , Qn , Hn per, rispettivamente, Pλn Qλn , Hλn .
Cominciamo a scegliere un autovalore λ = λ0 con valore assoluto più alto: ci sono al più due di
tali autovalori che differiscono per un segno; in tal caso scegliamo uno dei due. Avremo che, se
T1 := Q1 T , allora vale
T = λ0 P0 + T1
dove T1 soddisfa le proprietà (i), (ii) e (iii) suddette. Se T1 = 0, la dimostrazione è finita; se
non lo è sappiamo comunque che T1 è autoaggiunto compatto, per cui possiamo reiterare la
procedura appena illustrata usando T1 in luogo di T e trovando, se T2 := Q1 T1 ,
T = λ0 P0 + λ1 P1 + T2 .
λ1 è un autovalore di T1 , non nullo e con massimo valore assoluto (se un autovalore di valore
assoluto massimo fosse nullo, sarebbe T1 = 0 per (6) in (b) del teorema 4.2), e P1 è il proiettore
ortogonale sull’autospazio di T1 associato a λ1 .
Si osservi ancora che ogni autovalore λ1 di T1 è anche autovalore di T essendo, se T1 u1 = λ1 u1 ,
T u1 = (λ0 P0 + T1 )u1 = λ0 P0 T1
= λ0 · 0 · T
1
1
u1 + T1 u1 = λ0 P0 Q0 T u1 + T1 u1
λ1
λ1
1
u1 + λ1 u1 = λ1 u1 .
λ1
λ1 6= λ0 perché u1 ∈ RanT1 = Ran(Q0 T ) ⊂ H⊥
0 . Si osservi infine che ogni autovettore u
di T con autovalore λ1 deve essere anche autovettore di T1 con autovalore λ1 . Infatti usando
T1 = Q0 T = (I − P0 )T si ha, se T u = λ1 u:
T1 u = λ1 u − λ1 P0 u = λ1 u + 0 = λ1 u ,
dove abbiamo usato P0 u = 0, che segue dal fatto che autospazi con autovalori distinti per
(T )
operatori autoaggiunti (T ) sono ortogonali. In definitiva, l’autospazio H1 1 con autovalore λ1
110
di T1 coincide con l’autospazio H1 di T con autovalore λ1 . Quindi P1 è il proiettore ortogonale
in H su tale autospazio per T oltre che per T1 .
Dato che |λ0 | ha valore massimo possibile, vale comunque
|λ1 | ≤ |λ0 |.
Questo fatto ha una conseguenza importante. Dato che ||T || = |λ0 | e ||T1 || = λ1 per il teorema
precedente, avremo che
||T1 || ≤ ||T || .
Se risulta T2 = 0 la dimostrazione è finita, altrimenti procederemo nello stesso modo ottenendo
che
n
T−
X
λk Pk = Tn ,
(4.10)
k=0
dove
|λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . .
e
||Tk || = |λk |
(4.11)
Se nessuno degli operatori Tk è l’operatore nullo, la procedura continua indefinitamente. Mostriamo che, in tal caso, la serie decrescente dei numeri positivi |λk | deve tendere a 0 (non ci può
essere un punto di accumulazione precedente a 0). Supponiamo che |λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥
. . . ≥ > 0 Scegliamo un vettore xn ∈ Hn per ogni n ed in modo tale che ||xn || = 1. Dunque la
successione degli xn è limitata, per cui la successione dei T xn o una sua sotto successione deve
convergere, essendo T compatto. Ma questo è impossibile perché, sviluppando il quadrato della
norma di ||λn xn − λm xm || tenendo conto che xn e xm sono perpendicolari in quanto autovettori
con autovalori distinti per un operatore autoaggiunto ((ii) in (b) di proposizione 3.8), si ha
||T xn − T xm ||2 = ||λn xn − λm xm ||2 = |λn |2 + |λm |2 ≥ 2 ,
per ogni n e m, per cui né la successione dei T xn né una sua sotto successione può convergere
non potendo essere di Cauchy. Questo è assurdo e quindi la successione dei λn (se effettivamente
sono infiniti) deve convergere a 0. Come conseguenza di (4.10) e (4.11), quanto appena provato
implica che vale anche, nella topologia uniforme,
T =
+∞
X
λ k Pk .
(4.12)
k=0
Si osservi che, per costruzione, il risultato non dipende dall’ordinamento che abbiamo adottato
all’interno delle eventuali coppie di autovalori distinti con lo stesso valore assoluto. Mostriamo
ora che l’identità (4.12) coincide con la (4.6) in quanto la successione trovata di autovalori
{λk } esaurisce l’insieme degli autovalori di T eccetto al più l’autovalore nullo che non fornisce
comunque contributo a (4.12) e (4.6). Sia λ 6= λn per ogni n un autovalore di T e Pλ sia il
111
proiettore ortogonale associato. Valendo Pn Pλ = 0 per ogni n (perché autospazi di autovalori
distinti di operatori autoaggiunti sono ortogonali per (ii) in (b) di proposizione 3.8), (4.12)
implica
T Pλ =
+∞
X
λ k Pk Pλ = 0 ,
k=0
da cui, se u ∈ Hλ ,
T u = T Pλ u = 0 .
Questo significa che λ = 0.
La prova di (a) è conclusa ed abbiamo contestualmente provato anche le parti rimanenti del
teorema 4.2.
(b) Si osservi che le basi hilbertiane Bλ esistono sempre per il teorema 3.5, essendo gli autospazi
di T sottospazi chiusi (lo si dimostri per esercizio) dello spazio di Hilbert H e quindi spazi di
Hilbert a loro volta. Sia B := ∪λ∈σp (T ) Bλ . Mostriamo che che se u ∈ B ⊥ allora u = 0 e ciò
conclude la dimostrazione in quanto l’insieme B è ortonormale per costruzione per cui la definizione 3.5 è soddisfatta. Se u ∈ B ⊥ , allora u ⊥ Bλ per ogni λ ∈ σp (T ), per cui Pλ u = 0 per
ogni λ ∈ σp (T ). Usando la decomposizione di T data in (4.6), abbiamo che T u = 0; pertanto
u appartiene all’autospazio di T con autovalore nullo H0 . Ma essendo anche u ortogonale ad
ogni autospazio di T per costruzione, dovrà essere contemporaneamente u ∈ H0 e u ∈ H⊥
0 , ossia
u = 0 che conclude la prova. 2
Il teorema di Hilbert insieme al teorema 9.3 di decomposizione polare consentono di estendere
la formula (4.6) dello sviluppo di un operatore compatto autoaggiunto ad un’analoga formula
valida nel caso non autoaggiunto. Diamo prima una definizione che sarà utile nel seguito.
Definizione 4.2. Siano H spazio di Hilbert e A ∈ B0 (H). Gli autovalori λ non nulli di |A|
vengono detti valori singolari di A e il loro insieme si indica con sing(A). La dimensione
(finita) mλ dell’autospazio corrispondente a λ ∈ sing(A) viene detta molteplicità di λ.
Teorema 4.4. Siano (H, ( | )) spazio di Hilbert e A ∈ B0 (H) con A 6= 0, in modo che l’insieme
dei valori singolari di A, sing(A), sia non vuoto. Ordinando sing(A) in modo decrescente:
λ0 > λ1 > λ2 > . . ., ed usando tale ordinamento nelle somme scritte sotto, vale:
A =
A∗ =
X
mλ
X
λ∈sing(A) i=1
mλ
X X
λ (uλ,i | ) vλ,i ,
(4.13)
λ (vλ,i | ) uλ,i ,
(4.14)
λ∈sing(A) i=1
dove le somme, se infinite, sono intese nel senso della convergenza della topologia uniforme e, per
ogni λ ∈ sing(A), l’insieme degli elementi uλ,1 , . . . , uλ,mλ è una base ortonormale nell’autospazio
112
di |A| associato all’autovalore λ. Inoltre, per λ ∈ sing(A) e i = 1, 2, . . . , mλ i vettori
vλ,i :=
1
Auλ,i ,
λ
(4.15)
definiscono un insieme ortonormale. Per gli stessi valori di λ e i risulta infine
vλ,i = U uλ,i ,
(4.16)
dove U è l’operatore che appare nella decomposizione polare A = U |A|.
Prova. Notiamo che |A| è autoaggiunto, positivo e compatto. I suoi autovalori saranno quindi
reali, positivi e distribuiti come specificato in (a) e (b) del teorema 4.2. Studieremo il caso in
cui l’insieme degli autovalori è infinito (e quindi numerabile), lasciando il sottocaso banale al
lettore. Il teorema 4.3 permette di sviluppare |A| come
X
|A| =
λPλ ,
λ∈σp (|A|)
dove la convergenza è intesa rispetto alla topologia uniforme. È chiaro che ci si può ridurre a
considerare solo gli autovalori non nulli dato che quello nullo non fornisce contributo alla serie :
X
|A| =
λPλ .
λ∈sing(A)
Se non ci fossero autovalori non nulli, ci sarebbe l’unico autovalore nullo e sarebbe |A| = 0 per il
teorema 4.2, quindi dalla decomposizione polare avremmo A = 0 e la prova del teorema sarebbe
ovvia.
Se U è limitato, si prova subito che se B(H) 3 Tn → T ∈ B(H) nella topologia uniforme,
vale anche U Tn → U T , sempre nel senso della topologia uniforme degli operatori. Dato che
l’operatore U della decomposizione polare di A, A = U |A|, è limitato, avremo subito che, nella
convergenza della topologia uniforme:
A = U |A| =
X
λU Pλ .
(4.17)
λ∈sing(A)
Il teorema 4.2 nel punto (a) precisa che il sottospazio chiuso su cui proietta ogni Pλ (con λ > 0)
ha dimensione finita mλ . Possiamo sempre trovare una base ortonormale di tale autospazio:
{uλ,i }i=1,...,mλ . Si osservi che (uλ,i |uλ0 ,j ) = δλλ0 δij per costruzione, siccome autovettori con autovalori distinti sono ortogonali (essendo |A| normale perché positivo) per (ii) in (b) di proposizione
3.8. Dato che uλ,i = |A|(uλ,i /λ), segue che uλ,i ∈ Ran(|A|). Quindi U agisce sugli uλ,i in modo
isometrico, per cui i vettori a secondo membro di (4.16) sono ancora ortonormali. La (4.16)
equivale alla (4.15) per la decomposizione polare di A:
Auλ,i = U |A|uλ,i = U λuλ,i = λvλ,i .
113
È un facile esercizio provare che il proiettore ortogonale Pλ (λ > 0) si può scrivere come
Pλ =
mλ
X
(uλ,i | ) uλ,i .
i=1
Di conseguenza
U Pλ =
mλ
X
(uλ,i | ) U uλ,i =
i=1
mλ
X
(uλ,i | ) vλ,i .
i=1
Sostituendo in (4.17) si trova (4.13). La (4.14) si ottiene dalla (4.13) tenendo conto dei seguenti
fatti. (i) L’operazione di coniugazione hermitiana A 7→ A∗ è antilineare, per cui trasforma
combinazioni lineari di operatori in combinazioni lineari dei loro aggiunti e con i corrispondenti
coefficienti sostituiti dai complessi coniugati dei coefficienti della combinazione lineare iniziale.
(ii) L’operazione di coniugazione hermitiana è continua nella topologia uniforme di B(H) in
quanto ||A∗ || = ||A|| per (a) di proposizione 3.6.
In conseguenza di ciò, da (4.13) troviamo (si tenga conto del fatto che λ ∈ R):
A∗ =
X
mλ
X
λ [(uλ,i | ) vλ,i ]∗ ,
λ∈sing(A) i=1
dove la serie converge nella topologia uniforme. È un facile esercizio verificare che
[(uλ,i | ) vλ,i ]∗ = (vλ,i | ) uλ,i ,
da cui segue immediatamente la (4.14). 2
Il teorema provato consente di introdurre la nozione di operatore di Hilbert-Schmidt e di operatore di classe traccia, che vedremo nelle prossime sezioni.
Esercizi 4.1.
(1) Provare che se A∗ = A ∈ B0 (H), con H spazio di Hilbert, allora
σp (|A|) = {|λ| |λ ∈ σp (A)} .
Concludere che se A∗ = A ∈ B0 (H), allora
sing(A) = {|λ| |λ ∈ σp (A) \ {0}} .
Soluzione. Sviluppando gli operatori compatti autoaggiunti A ed |A| secondo il teorema 4.3 si
ha, con ovvie notazioni,
A=
X
λPλ e |A| =
λ∈σp (A)
X
µ∈σp (|A|)
114
µPµ0 .
Calcolando il quadrato degli operatori A e |A|, usando la continuità di tali operatori (che permette lavorare come se le tutte le serie fossero somme finite), l’idempotenza e l’ortogonalità dei
proiettori relativi ad autovettori distinti ed infine tenendo conto che |A|2 = A∗ A = A2 , si ha che
deve valere
X
X
λ 2 Pλ =
µ2 Pµ0 .
(4.18)
λ∈σp (A)
µ∈σp (|A|)
Si tenga ora conto che Pλ Pλ0 = 0 se λ 6= λ0 e Pλ Pλ0 = Pλ0 altrimenti e che l’analoga proprietà
vale per i proiettori della decomposizione di |A|. Applicando Pλ0 a destra di ambo membri di
(4.18), prendendo l’aggiunto del risultato e applicando Pµ0 0 a destra dei membri dell’identità
finale, si ricava infine che, per ogni λ0 ∈ σ(A) e µ0 ∈ σp (|A|): deve valere λ20 Pλ0 Pµ0 0 = µ20 Pλ0 Pµ0 0
ossia
(λ20 − µ20 )Pλ0 Pµ0 0 = 0 .
(4.19)
Il fatto che A ammetta una base Hilbertiana di autovettori (teorema 4.3) si può scrivere come
ben noto:
X
P λ0 .
I = sλ0 ∈σ(A)
Pλ0 Pµ0 0
Fissiamo µ0 ∈ σp (|A|). Se fosse
= 0 per ogni λ0 ∈ σ(A) dall’identità di sopra avremmo
0
Pµ0 = 0 che è impossibile per definizione di autospazio. Di conseguenza, dovendo valere (4.19),
ci deve essere λ0 ∈ σ(A) tale che λ2 = µ20 , ovvero µ0 = |λ0 |. Se λ0 ∈ σp (A), usando un’analoga
procedura scambiando il ruolo di A e |A|, si prova che deve esistere µ0 ∈ σp (|A|) tale che λ2 = µ20 ,
ovvero µ0 = |λ0 |. La prima affermazione è provata. La seconda affermazione è ora evidente dalla
definizione di valore singolare.
(2) Si dimostri che se T ∈ B0 (H) e se H 3 xn → x ∈ H in senso debole, cioè :
(g|xn ) → (g|x)
se n → +∞, per ogni fissato g ∈ H,
allora ||T (xn ) − T (x)|| → 0 per n → +∞. In altre parole gli operatori compatti trasformano
successioni convergenti debolmente in successioni convergenti in norma. Osservare che il risultato
vale anche se T ∈ B(X, Y) con X e Y spazi normati, pur di interpretare la nozione di convergenza
debole opportunamente.
Soluzione. Sia xn → x in senso debole. Se si tiene conto del teorema di Riesz, si ha subito
che l’insieme {xn }n∈N è debolmente limitato nel senso del corollario 3 del teorema di BanachSteinhaus. In base a tale risultato, vale ||xn || ≤ K per ogni n ∈ N, per qualche K > 0. Definiamo
allora yn := T xn , y := T x e notiamo che, per ogni h ∈ H,
(h|yn ) − (h|y) = (T ∗ h|xn ) − (T ∗ h|x) → 0
se n → +∞,
e quindi anche la successione degli yn converge debolmente a y. Supponiamo, per assurdo, che
||yn − y|| 6→ 0 se n → +∞. Allora devono esistere un > 0 e una sottosuccessione {ynk }k∈N
con ||y − ynk || ≥ per ogni k ∈ N. Dato che {xnk }k∈N è limitata da K come osservato sopra,
e T compatto, deve esistere una sottosuccessione {ynkr }r∈N che converge a qualche y 0 6= y.
115
Questa sottosuccessione {ynkr }r∈N deve quindi convergere anche debolmente a y 0 . Ma questo
è impossibile dato che {yn }n∈N converge debolmente a y 6= y 0 . Allora deve essere: yn → y nel
senso della norma di H. Il ragionamento si può ripetere nel caso generale in cui T ∈ B(X, Y)
con X e Y spazi normati, intepretando X 3 xn → x ∈ X in senso debole come:
g(xn ) → g(x)
se n → +∞, per ogni fissatog ∈ X0 ,
dato che il corollario 3 del teorema di Banach-Steinhaus vale in questo caso. (Nella dimostrazione
si deve osservare che se h ∈ Y0 allora h◦T ∈ X0 perché composizione di funzioni lineari continue.)
4.3
Operatori di Hilbert-Schmidt.
Una classe particolare di operatori compatti sono quelli di Hilbert-Schmidt. Questi trovano
applicazioni in vasti rami della fisica matematica, oltre che nella meccanica quantistica.
Definizione 4.3. Sia (H, ( | )) spazio di Hilbert e sia || || la norma indotta dal prodotto
A ∈ B(H) è detto operatore di Hilbert-Schmidt se esiste una base hilbertiana U
l’insieme {||Au||2 }u∈U ammette somma finita nel senso della definizione 3.4.
La classe degli operatori di Hilbert-Schmidt su H sarà indicata con B2 (H) e, se A ∈
allora
ÊX
||A||2 :=
||Au||2 ,
scalare.
per cui
B2 (H),
(4.20)
u∈U
dove U è la base hilbertiana suddetta.
Per prima cosa mostriamo che la particolare base scelta nella definizione è in realtà generica e
che anche ||A||2 non dipende dalla scelta di tale base.
Proposizione 4.4. Siano (H, ( | )) spazio di Hilbert, || || la norma indotta dal prodotto scalare,
U e V due basi hilbertiane (eventualmente coincidenti) e A ∈ B(H).
(a) {||Au||2 }u∈U ammette somma finita se e solo se {||Av||2 }v∈V ammette somma finita. In tal
caso vale
X
X
||Au||2 =
||Av||2 .
(4.21)
u∈U
{||Au||2 }
(b)
tal caso vale
u∈U
v∈V
ammette somma finita se e solo se {||A∗ v||2 }v∈V ammette somma finita. In
X
||Au||2 =
u∈U
X
||A∗ v||2 .
v∈V
Prova. Consideriamo che, per (d) del teorema 3.4,
||Au||2 =
X
|(v|Au)|2 < +∞ ,
v∈V
116
(4.22)
per cui, fissato u, solo una quantità al più numerabile di coefficienti |(v|Au)| è non nulla per (b)
di proposizione 3.2. Ciò determina un insieme al più numerabile V(u) ⊂ V tale che
X
||Au||2 =
u∈U
X X
|(v|Au)|2 < +∞ .
(4.23)
u∈U v∈V(u)
Questo significa in particolare, riutilizzando (b) di proposizione 3.2, che solo un insieme al
P
più numerabile di elementi u ∈ U fornisce somme v∈V(u) |(v|Au)|2 non nulle. In definitiva i
coefficienti (v|Au) sono non nulli solo per un insieme Z al più numerabile di coppie (u, v) ∈ U×V.
Definiamo gli insiemi al più numerabili
U := {u ∈ U | esiste v ∈ V con (v|Au) 6= 0}
e
V := {v ∈ V | esiste u ∈ U con (v|Au) 6= 0} .
In tal modo Z ⊂ U × V . Possiamo mettere su U e V le misure µ e ν rispettivamente che contano
gli elementi di U e V e le serie sopra considerate si trascrivono in termini di integrali rispetto
alle misure dette ((c) proposizione 3.2). In particolare (4.23) si riscrive:
X
X X
2
||Au|| =
u∈U
2
|(v|Au)| =
Z
Z
dµ(u)
U
u∈U v∈V(u)
dν(v)|(v|Au)|2 < +∞ .
(4.24)
V
Le misure µ e ν sono σ-finite perché U e V sono al più numerabili, per cui ha senso definire la
misura prodotto µ ⊗ ν e applicare il teorema di Fubini-Tonelli. Tale teorema assicura che, per
l’ultima parte di (4.24), la funzione (v, u) 7→ |(v|Au)|2 è integrabile rispetto alla misura prodotto
e che possiamo interscambiare gli integrali:
X
2
||Au|| =
Z
2
|(v|Au)| dµ(u) ⊗ dν(v) =
U ×V
u∈U
Z
Z
dµ(u)|(v|Au)|2 < +∞ .
dν(v)
V
U
Notiamo che (v|Au) = (A∗ v|u), per cui solo una quantità al più numerabile di elementi (A∗ v|u)
(con (u, v) ∈ U × V ) sarà non nulla e avremo in particolare
XX
∗
2
|(A v|u)| =
Z
dν(v)
V
v∈V u∈U
Z
dµ(u)|(A∗ v|u)|2 =
U
X
||Au||2 < +∞ .
u∈U
Ma il primo membro è proprio v∈V ||A∗ v||2 . Abbiamo provato parte della proposizione (b): se
{||Au||2 }u∈U ammette somma finita allora {||A∗ v||2 }v∈V ammette somma finita e le due somme
coincidono. Usando la stessa dimostrazione, scambiando i nomi delle basi e dei loro elementi e
partendo dall’operatore A∗ , ricordando che vale (A∗ )∗ = A per operatori limitati, si prova nello
stesso modo che vale la parte rimanente di (b): se {||A∗ v||2 }v∈V ammette somma finita, allora
{||Au||2 }u∈U ammette somma finita, ed in tal caso vale (4.22).
La dimostrazione di (a) si prova immediatamente da (b) tenendo conto dell’arbitrarietà delle
P
117
basi usate. 2
Possiamo enunciare e provare alcune delle numerose ed interessanti proprietà matematiche degli
operatori di Hilbert-Schmidt. La proprietà più interessante dal punto di vista matematico è la
(b) del teorema scritto sotto: gli operatori di Hilbert-Schmidt formano uno spazio di Hilbert
con un prodotto scalare che induce una norma che coincide, per ogni operatore A di HilbertSchimdt, proprio con il numero che avevamo indicato con ||A||2 . Un altro fatto importante è
che gli operatori di Hilbert-Schmidt sono compatti e formano un ideale bilatero chiuso rispetto
alla coniugazione hermitiana all’interno dello spazio degli operatori limitati.
Teorema 4.5. Sia H spazio di Hilbert. Gli operatori di Hilbert-Schmidt godono delle seguenti
proprietà.
(a) B2 (H) è un sottospazio di B(H) e più fortemente uno ∗-ideale bilatero di B(H); inoltre:
(i) ||A||2 = ||A∗ ||2 per ogni A ∈ B2 (H);
(ii) ||AB||2 ≤ ||B|| ||A||2 e ||BA||2 ≤ ||B|| ||A||2 per ogni A ∈ B2 (H) e B ∈ B(H);
(iii) ||A|| ≤ ||A||2 per ogni A ∈ B2 (H).
(b) Se A, B ∈ B2 (H) e se B è una base hilbertiana in H, si definisca
(A|B)2 :=
X
(Ax|Bx) .
(4.25)
x∈B
L’applicazione
( | )2 : B2 (H) × B2 (H) → C
è ben definita (la somma di sopra si riduce sempre ad una serie assolutamente convergente e non
dipende dalla base hilbertiana) e determina un prodotto scalare su B2 (H) che per ogni A ∈ B2 (H)
soddisfa:
(A|A)2 = ||A||22
(4.26)
(c) (B2 (H), ( | )2 ) è spazio di Hilbert.
(d) B2 (H) ⊂ B0 (H). Più precisamente, A ∈ B2 (H) se e solo se è compatto e l’insieme dei
numeri positivi {mλ λ2 }λ∈sing(A) (essendo mλ la molteplicità di λ) ha somma finita. In tal caso
risulta
s X
||A||2 =
mλ λ2 .
(4.27)
λ∈sing(A)
Prova. (a) Ovviamente B2 (H) è chiuso rispetto alla moltiplicazione per scalare. Mostriamo
che lo è rispetto a quello di somma di operatori. Se A, B ∈ B2 (H) e B è una qualsiasi base
hilbertiana:


X
u∈B
||(A + B)u||2 ≤
X
(||Au|| + ||Bu||)2 ≤ 2 
u∈B
X
u∈B
118
||Au||2 +
X
u∈B
||Bu||2  .
Quindi B2 (H) è sottospazio di B(H). Il fatto che sia chiuso rispetto alla coniugazione hermitiana
è una immediata conseguenza di (b) della proposizione 4.4, che implica anche (i). Mostriamo
che vale (ii) e contestualmente che B2 (H) è chiuso rispetto alla composizione destra e sinistra
con operatori limitati. Se A ∈ B2 (H) e B ∈ B(H) allora:
X
||BAu||2 ≤
u∈B
X
||B||2 ||Au||2 = ||B||2
X
||Au||2 .
u∈B
u∈B
Questo prova insieme che B2 (H) è chiuso rispetto alla composizione sinistra con operatori limitati
e che vale la seconda disuguaglianza in (ii). La chiusura rispetto alla moltiplicazione a destra è
immediata conseguenza di quella a sinistra e della chiusura rispetto alla coniugazione hermitiana:
B ∗ A∗ ∈ B2 (H) se A ∈ B2 (H) e B ∈ B(H), e quindi (B ∗ A∗ )∗ ∈ B2 (H), ossia AB ∈ B2 (H). Da
(i) abbiamo anche che se A ∈ B2 (H) e B ∈ B(H), allora ||AB||2 = ||(AB)∗ ||2 = ||B ∗ A∗ ||2 ≤
||B ∗ || ||A∗ ||2 = ||B|| ||A||2 che completa la dimostrazione di (ii). Per provare (iii) notiamo che:
Ž1/2
„
X
||A|| = sup ||Ax|| = sup (||Ax||2 )1/2 = sup
||x||=1
||x||=1
||x||=1
|(u|Ax)|2
= sup
||x||=1
u∈B
Ž1/2
„
X
|(A∗ u|x)|2
u∈B
dove abbiamo usato (d) del teorema 3.4 rispetto alla base hilbertiana B. Utilizzando la disuguaglianza di Cauchy-Schwartz nell’ultimo termine della catena di uguaglianze di sopra,
otteniamo:
„
Ž1/2 „
Ž1/2
||A|| ≤ sup
||x||=1
X
||A∗ u||2 ||x||2
=
u∈B
X
||A∗ u||2
= ||A∗ ||2 = ||A||2 .
u∈B
(b) Se A, B ∈ B2 (H) e B è una base hilbertiana, allora la quantità di termini Au e Bu non nulli,
per u ∈ B, è al più numerabile per la definizione 4.3 e (b) di proposizione 3.2. Valendo
1
|(Au|Bu)| ≤ ||Au|| ||Bu|| ≤ (||Au||2 + ||Bu||2 ) ,
2
concludiamo che la quantità di termini non nulli (Au|Bu) per u ∈ B è anch’essa al più numerabile
e che la serie dei termini non nulli (Au|Bu) è assolutamente convergente, per cui non conta
l’ordinamento scelto nel calcolare (4.25). Mostreremo tra poco che la scelta della base hilbertiana
è irrilevante. Prima notiamo che (4.26) è vera banalmente e che ( | )2 soddisfa gli assiomi di
un semiprodotto scalare, come è immediato verificare. L’assioma di positività H3 è immediata
conseguenza di (iii), pertanto ( | )2 è un prodotto scalare che induce la norma || ||2 . Quindi vale
la formula in (1) di esercizi 3.1, che sussiste per ogni prodotto scalare:
4(A|B)2 = ||A + B||22 + ||A − B||22 − i||A + iB||22 + i||A − iB||22 .
Dato che, per la proposizione 4.4, il secondo membro non dipende dalla base hilbertiana usata,
non dipenderà dalla scelta della base nemmeno il primo membro.
(c) Bisogna solo provare che lo spazio è completo. Sia B una base hilbertiana di H. Sia {An }n
119
una successione di Cauchy di operatori di Hilbert-Schmidt rispetto alla norma || ||2 . Da (iii) di
(a) la successione è di Cauchy anche nella topologia uniforme, per cui, essendo B(H) completo
per il teorema 2.3, esisterà A ∈ B(H) con ||A − An || → 0 per n → +∞. La proprietà di Cauchy
dice che preso > 0, esiste N tale che, ||An − Am ||22 ≤ 2 se n, m > N . Tenendo conto della
definizione di || ||2 , varrà anche che, per lo stesso , per ogni sottoinsieme finito I ⊂ B:
X
||(An − Am )u||2 ≤ ||An − Am ||22 ≤ 2
u∈I
quando n, m > N . Passando al limite per m → +∞, si trova che vale ancora:
X
||(An − A)u||2 ≤ 2
u∈I
per ogni sottoinsieme finito I ⊂ B se n > N . In definitiva, per l’arbitrarietà di I, abbiamo che:
||A − An ||2 ≤ se n > N .
(4.28)
Da questo fatto segue in particolare che A − An ∈ B2 (H) e quindi A = An + (A − An ) ∈ B2 (H);
inoltre, per l’arbitrarietà di > 0 in (4.28), vale anche che An tende a A rispetto alla norma
|| ||2 . Quindi ogni successione di Cauchy nella norma || ||2 converge in B2 (H), che di conseguenza
è completo.
(d) Sia A ∈ B2 (H): mostriamo che è compatto e che soddisfa (4.27). Sia B una base hilbertiana.
P
Vale u∈B ||Au||2 < +∞, dove solo una quantità al più numerabile di addendi è non nulla ed
infine sappiamo che la somma si può scrivere come una serie o una somma finita, come ben noto,
considerando solo i vettori un per cui ||Aun ||2 > 0. Di conseguenza varrà che per ogni > 0
esiste N tale che
+∞
X
||Aun ||2 ≤ 2 .
n=N
La stessa proprietà si può quindi trascrivere in termini di tutti gli elementi di B: per ogni > 0
esiste un sottoinsieme finito I ⊂ B tale che
X
||Au||2 ≤ 2 .
u∈B\I
Sia quindi AI l’operatore definito imponendo: AI u := Au se u ∈ I e AI u := 0 se u ∈ B \ I .
Il rango di AI è generato dai vettori Au con u ∈ I , essendo tali vettori in numero finito AI è
limitato e compatto ((1) in esempi 4.1). Per costruzione esiste ||A − AI ||2 e vale:
X
||A − AI ||22 =
||(A − AI )u||2 =
u∈B
X
||Au||2 ,
u∈B\I
pertanto, per (iii) di (a) abbiamo che
„
||A − AI || ≤ ||A − AI ||2 =
Ž1/2
X
u∈B\I
120
||Au||2
≤.
Quindi A è un punto di accumulazione dello spazio degli operatori compatti rispetto alla topologia uniforme. Tenendo conto del fatto che l’ideale degli operatori compatti è chiuso nella
topologia uniforme ((c) di teorema 4.1), il risultato ottenuto prova che A è compatto.
√ Dimostriamo adesso che vale (4.27): consideriamo l’operatore positivo compatto |A| = A∗ A e
sia {uλ,i }λ∈sing(A),i={1,2,...,mλ } una base hilbertiana di Ker(|A|)⊥ costruita come nel teorema
4.4. Possiamo completarla a base dello spazio di Hilbert aggiungendo una base hilbertiana per
Ker(|A|), che coincide con Ker(A) per la nota dopo la definizione 3.12. (Se {ui } è base hilbertiana per il sottospazio chiuso Ker(|A|) e {vj } è una base hilbertiana per il sottospazio chiuso
Ker(|A|)⊥ , allora l’insieme ortonormale B := {ui } ∪ {vj } è base hilbertiana per H, perché, come è facile provare dalla decomposizione ortogonale H = Ker(|A|) ⊕ Ker(|A|)⊥ , se x ∈ H è
ortogonale a B, allora x = 0.) Usando la base hilbertiana detta per esprimere ||A||2 , abbiamo:
||A||22 =
X
mλ
X
X
(Auλ,i |Auλ,i ) =
mλ
X
(A∗ Auλ,i |uλ,i ) =
mλ
X
mλ λ2 ,
(4.29)
λ∈sing(A) i=1
λ∈sing(A) i=1
λ∈sing(A) i=1
X
dove si è tenuto conto del fatto
√ che la parte di base riguardante Ker(A) per costruzione non
fornisce contributo, |A|uλ,i = A∗ Auλ,i = λuλ,i e (uλ,i |uλ0 ,j ) = δλλ0 δij .
Se, viceversa, A è compatto e {mλ λ2 }λ∈sing(A) ha somma finita, allora da (4.29) segue che
||A||2 < +∞, per cui A ∈ B2 (H). 2
Esempi 4.2.
(1) Torniamo all’esempio (4) in esempi 4.1. Consideriamo gli operatori
TK : L2 (X, µ) → L2 (X, µ)
indotti dai nuclei integrali K ∈ L2 (X × X, µ ⊗ µ) (con µ misura σ-finita separabile),
Z
(TK f )(x) :=
K(x, y)f (y)dµ(y)
per ogni f ∈ L2 (X, µ) .
X
Abbiamo provato che tali operatori sono compatti. Mostriamo ora che sono anche di HilbertSchmidt.
Usando le stesse definizioni dell’esempio in questione, se f ∈ L2 (X, µ) avevamo visto che (vedi
punto (3) nell’esempio (4)), per ogni x ∈ X,
Z
F (x) =
|K(x, y)| |f (y)|dµ(y) < +∞ .
X
Dato che F ∈ L2 (X, µ), per ogni g ∈ L2 (X, µ) la funzione x 7→ g(x)F (x) è una funzione integrabile
(in modo da poter definire il prodotto scalare di g e F ). Il teorema di Fubini-Tonelli assicura
quindi che la funzione (x, y) 7→ g(x)K(x, y)f (y) è in L2 (X × X, µ ⊗ µ) e che
Z
X×X
g(x)K(x, y)f (y) dµ(x) ⊗ dµ(y) =
Z
Z
dµ(x) g(x)
X
K(x, y)f (y)dµ(y) = (g|Tk f ) .
X
121
(4.30)
Consideriamo allora una base hilbertiana di L2 (X × X, µ ⊗ µ) del tipo {ui · uj }i,j , dove {uk }k è
una base hilbertiana per L2 (X, µ) (e quindi lo è anche {uk }k , come si prova immediatamente).
Dato che K ∈ L2 (X × X, µ ⊗ µ), varrà lo sviluppo
K=
X
αij ui · uj ,
(4.31)
i,j
per cui
||K||2L2 =
X
|αij |2 < +∞ .
(4.32)
i,j
D’altra parte, da (4.30) e (4.31), si ha
(ui |TK uj ) =
Z
ui (x)uj (y)K(x, y) dµ(x) ⊗ dµ(y) = (ui · uj |K) = αij ,
X×X
per cui (4.32) si può riscrivere
||K||2L2 =
X
|(ui |TK uj )|2 < +∞ .
i,j
Per definizione di operatore di Hilbert-Schmidt, TK è quindi un operatore di Hilbert-Schmidt e
vale anche
||TK ||2 = ||K||L2 .
(2) È abbastanza facile provare che se H = L2 (X, µ) con µ σ-finita e separabile, allora B2 (H)
consiste di tutti e soli gli operatori TK con K ∈ L2 (X × X, µ ⊗ µ) e che quindi l’applicazione che
identifica K con TK è un isomorfismo di spazi di Hilbert L2 (X × X, µ ⊗ µ) allo spazio di Hilbert
B2 (H). Consideriamo a tal fine T ∈ B2 (H) ed esibiamo K ∈ L2 (X × X, µ ⊗ µ) per cui T = TK .
P
Presa una qualsiasi base Hilbertiana {un }n∈N di L2 (X, µ) deve essere n∈N ||T un ||2 < +∞.
Conseguentemente, sviluppando T un sulla stessa base {un }n∈N , si ottiene che:
+∞ >
X
||T un ||2 =
n∈N
X X
|(um |T un )|2 .
m∈N n∈N
Interpretando le somme come integrali su {un }n∈N , ed applicando il teorema di Fubini-Tonelli,
P
concludiamo che: (n,m)∈N2 |(um |T un )|2 < +∞ e quindi l’operatore integrale di Hilbert-Schmidt
TK con nucleo integrale K ∈ L2 (X × X, µ ⊗ µ) dato da:
K :=
X
(um |T un )um · un
(n,m)∈N2
è ben definito. D’altra parte, usando i risultati dell’esempio precedente, per costruzione vale:
(um |TK un ) =
Z
Z
dµ(x)um (x)
X
dµ(y)K(x, y)un (y) = (um |T un )
X
122
e quindi: TK un = T un per ogni n ∈ N. Per continuità segue immediatamente che TK = T .
(3) Consideriamo l’equazione di Volterra nella funzione incognita f ∈ L2 ([0, 1], dx):
Z x
f (x) = ρ
f (y)dy + g(x) ,
0
con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato. (4.33)
Sopra dx indica la misura di Lebesgue e l’integrale esiste dato che, per ogni fissato x ∈ [0, 1],
può essere intepretato come il prodotto scalare tra f e la funzione [0, 1] 3 y 7→ θ(x − y), e quindi
riscritto come:
Z
Z
x
1
θ(x − y)f (y)dy ,
f (y)dy =
0
0
dove θ(u) = 1 se u ≥ 0 oppure θ(u) = 0 se u < 0. Dato che evidentemente (x, y) 7→ θ(x − y)
è anche una funzione in L2 ([0, 1]2 , dx ⊗ dy), l’equazione può essere riscritta in termini di un
operatore di Hilbert-Schmidt T come:
f = ρT f + g ,
con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato.
(4.34)
dove abbiamo introdotto l’operatore di Volterra:
Z x
g ∈ L2 ([0, 1], dx) .
g(y)dy
(T g)(x) :=
(4.35)
0
Più in generale gli operatori di Volterra, e quindi le equazioni associate, sono definiti come
Z 1
(TV f )(x) :=
θ(x − y)V (x, y)g(y)dy ,
0
per qualche V ∈ L2 ([0, 1]2 , dx ⊗ dy). Noi studiamo qui il caso più semplice dato dalla (4.35). Se
l’operatore (I − ρT ) fosse invertibile, la soluzione dell’equazione (4.34) sarebbe data da
f = (I − ρT )−1 g .
(4.36)
Formalmente, usando lo stesso sviluppo della serie geometrica, abbiamo che l’operatore inverso
(destro e sinistro) di I − ρT è dato dalla somma della serie:
+∞
X
(I − ρT )−1 = I +
ρn+1 T n+1 .
(4.37)
n=0
intepretando la convergenza della serie nella topologia uniforme. Una condizione sufficiente
per la convergenza è ||ρT || < 1 e la dimostrazione è la stessa che per la serie geometrica. Noi
vogliamo però cercare di fare una stima più fine. Usiamo la norma dello spazio B2 (L2 ([0, 1], dx)),
tenendo conto di (iii) in (a) del teorema 4.5 ed infine notando che se, per An ∈ B(L2 ([0, 1], dx)),
P
P+∞
vale ||An || ≤ an ≥ 0 dove la serie +∞
n=0 an converge, allora converge anche la serie
n=0 An
nella topologia di B(L2 ([0, 1], dx)). La dimostrazione di ques’ultimo fatto è la stessa che si ha
123
in analisi elementare, per esempio per dimostrare il criterio di Weierstrass della serie dominata.
Il calcolo diretto tramite (4.35), mostra che, se n ≥ 1:
(T n+1 g)(x) =
Z x
(x − y)n
n!
0
g(y)dy ,
per cui T n ∈ B2 (L2 ([0, 1], dx)) e anche:
Ì
n
n
||T || ≤ ||T ||2 =
(x − y)n−1 2
2n−1
|θ(x − y)|2 .
dx ⊗ dy ≤
(n − 1)! (n − 1)!
[0,1]2
Z
n n
Dato che la serie di termine generico ρ n!2 converge, concludiamo che, per ogni valore di ρ 6= 0,
l’operatore (I − ρT )−1 esiste in B(L2 ([0, 1], dx)) ed è dato dalla somma a secondo membro di
(4.37). E dunque (4.36) è la soluzione dell’equazione di Volterra iniziale. Si può infine dare la
forma esplicita dell’operatore (I − ρT )−1 .
€
−1
(I − ρT )
Š
g (x) = g(x) +
+∞
X
n+1
ρ
+∞
€
Š
XZ
n+1
T
g (x) = g(x) + ρ
n=1 0
n=0
x
(ρ(x − y))n
g(y)dy .
n!
In teorema della convergenza dominata prova che si può scambiare la serie con l’integrale trovando, per la soluzione dell’equazione di Volterra:
Z
€
Š
f (x) = (I − ρT )−1 g (x) = g(x) + ρ
x
eρ(x−y) g(y)dy .
0
Tuttavia, nel fare queste operazioni, abbiamo usato una nozione di convergenza puntuale, differente da quella operatoriale uniforme. Il fatto che l’espressione di sopra sia davvero la forma
esplicita dell’operatore inverso di I −ρT si può verificare per computo diretto, usando l’espressione esplicita (4.35) ed integrando per parti lavorando con g ∈ C([0, 1]). Il risultato si estende su
tutto L2 ([0, 1], dx), tenendo conto che l’operatore con nucleo integrale θ(x − y)eρ(x−y) è limitato
(essendo di Hilbert-Schmidt) e C([0, 1]) è denso in L2 ([0, 1], dx). L’unicità dell’inverso conclude
la dimostrazione.
(4) Sia L2 (X, µ) con µ separabile. Un operatore integrale TK : L2 (X, µ) → L2 (X, µ) individuato
dal nucleo integrale
K(x, y) =
N
X
pk (x)qk (y) ,
k=1
L2 (X, µ),
dove pk , qk ∈
k = 1, 2, 3, . . . , N sono funzioni arbitrarie, è detto operatore degenere. Gli operatori degeneri formano uno ∗-ideale bilatero BD (L2 (X, µ)) di B(L2 (X, µ))
che é sottospazio di B0 (L2 (X, µ)) e B2 (L2 (X, µ)). Si può provare abbastanza facilmente che
BD (L2 (X, µ)) è denso in B2 (L2 (X, µ)) nella topologia naturale di quest’ultimo.
124
Il contenuto delle osservazioni (1) e (2) può essere racchiuso in un teorema. L’ultima affermazione è di immediata dimostrazione ed lasciata per esercizio.
Teorema 4.6. Se µ è una misura positiva σ-additiva e separabile su X, lo spazio B2 (L2 (X, µ))
è costituito da tutti e soli gli operatori TK della forma, dove N ∈ N è arbitrario:
Z
(TK f )(x) :=
K(x, y)f (y)dy ,
per ogni f ∈ L2 (X, µ),
X
dove K ∈ L2 (X × X, µ ⊗ µ). Inoltre risulta:
||TK ||2 = ||K||L2 (X×X,µ⊗µ) .
L’applicazione L2 (X × X, µ ⊗ µ) 3 K 7→ TK ∈ B2 (L2 (X, µ)) è un isomorfismo di spazi di Hilbert.
Esercizi 4.2.
(1) In riferimento agli esempi 4.2, provare che dati TK , TK 0 ∈ B2 (L2 (X, µ)) (dove la misura
è assunta essere separabile) che sono dunque individuati dai nuclei integrali K e K 0 , allora
l’operatore di Hilbert-Schmidt aTK + bTK 0 , con a, b ∈ C ha nucleo integrale aK + bK 0 .
(2) Provare che dato TK ∈ B2 (L2 (X, µ)) individuato dal nucleo integrale K allora l’operatore
∗ ha nucleo integrale K ∗ con K ∗ (x, y) = K(y, x).
di Hilbert-Schmidt TK
(3) Nelle stesse ipotesi di (1) mostrare che il nucleo integrale di TK TK 0 è
K 00 (x, z) :=
Z
K(x, y)K 0 (y, z) dµ(y) .
X
(4) Se L2 (X, µ) è separabile, si consideri l’applicazione L2 (X×X, µ⊗µ) 3 K 7→ TK ∈ B2 (L2 (X, µ)).
Si dimostri che si tratta di un isomorfismo di spazi di Hilbert. Si discuta se si può o meno pensare
tale applicazione come un’isometria tra spazi normati, assumendo B(L2 (X, µ)) come codominio.
Più debolmente si discuta la continuità dell’omomorfismo.
(5) In riferimento a (4) in esempi 4.2, dimostrare che, se g ∈ C0 ([0, 1]), allora:
Z
€
Š
(I − ρT )−1 g (x) = g(x) + ρ
x
eρ(x−y) g(y)dy .
0
Suggerimento. Applicare l’operatore I − ρT , tenendo conto dell’espressione integrale di T e
∂ ρ(x−y)
osservando che ρeρ(x−y) = ∂x
e
.
(6) Si consideri l’insieme BD (L2 (X, µ)) degli operatori degeneri su L2 (X, µ), con µ separabile.
Provare che le seguenti affermazioni sono equivalenti.
(a) T ∈ BD (L2 (X, µ)).
(b) Ran(T ) ha dimensione finita.
(c) T ∈ B2 (L2 (X, µ)) (e pertanto T è un opertore integrale) con nucleo integrale che può sempre
P
2
essere scritto come K(x, y) = N
k=1 pk (x)qk (y) dove le funzioni: p1 , . . . , pN ∈ L (X, µ) e q1 , . . . , qN ∈
L2 (X, µ) sono, separatamente, linearmente indipendenti.
125
(7) Si consideri l’insieme BD (L2 (X, µ)) degli operatori degeneri su L2 (X, µ), con µ separabile. Mostrare BD (L2 (X, µ)) è uno ∗-ideale bilatero di B(L2 (X, µ)) sottospazio di B2 (L2 (X, µ)).
In altre parole si deve provare che BD (L2 (X, µ) ⊂ B2 (L2 (X, µ)), che è un sottospazio chiuso rispetto alla coniugazione hermitiana e che AD, DA ∈ BD (L2 (X, µ) se A ∈ B(L2 (X, µ)) e
D ∈ BD (L2 (X, µ)).
(8) Si consideri BD (L2 (X, µ)) con L2 (X, µ), con µ separabile. La chiusura topologica di BD (L2 (X, µ))
in B2 (L2 (X, µ)) rispetto alla topologia naturale di B(L2 (X, µ)) coincide con B2 (L2 (X, µ))?
Suggerimento. Si consideri l’operatore, dove la convergenza della serie è quella rispetto alla
norma operatoriale uniforme:
+∞
X 1
√ TKn ,
T :=
n
n=0
e dove Kn (x, y) = φn (x)φn (y), essendo {φn }n∈N una base hilbertiana di L2 (X, µ). Provare che
T ∈ B(L2 (X, µ)) è ben definito, ma T 6∈ B2 (L2 (X, µ)), dato che ||T φn ||2 = 1/n.
4.4
Operatori di classe traccia (o nucleari).
Passiamo ad introdurre gli operatori di classe traccia, detti anche operatori nucleari. Seguiremo
essenzialmente l’approccio in [Mar82] (un altro approccio si trova in [Pru81]).
Proposizione 4.5. Siano H spazio di Hilbert e A ∈ B(H). I seguenti tre fatti sono equivalenti.
(a) Esiste una base hilbertiana N di H per cui {(u||A|u)}u∈N ha somma finita:
X
(u||A|u) < +∞ .
u∈N
È
(a)’ |A| è operatore di Hilbert-Schmidt.
(b) A è compatto ed inoltre l’insieme indiciato {mλ λ}λ∈sing(A) , dove mλ è la molteplicità di λ,
ha somma finita.
Prova.
È È Si osservi che (a)’ è una semplice trascrizione di (a), tenendo conto del fatto che
|A| |A| = |A|. Per cui (a) e (a)’ sono equivalenti.
È
È
Mostriamo che (a) implica (b). A è compatto perché |A| = ( |A|)2 è compatto essendo |A|
compatto, in quanto ogni operatore di Hilbert-Schmidt è compatto ((d) teorema 4.5), il prodotto
di operatori compatti è compatto ((b) teorema 4.1), ed infine |A| è compatto se e solo se lo è
A (proposizione 4.3). Costruiamo una base hilbertiana di H usando autovettori di |A|: uλ,i con
i = 1, . . . , mλ (mλ = +∞ al più solo per λ = 0) e |A|uλ,i = λuλ,i . Rispetto a tale base:
È 2
È
X
È
X
X È
X
|A|uλ,i |A|uλ,i =
uλ,i ( |A|)2 uλ,i =
(uλ,i ||A|uλ,i ) =
mλ λ .
|A| =
2
λ,i
λ,i
λ,i
λ
È 2
per cui {mλ λ}λ∈sing(A) , ha somma finita essendo |A| < +∞ per ipotesi. È ora ovvio che
2
È 2
(b) implica (a)’ procedendo all’indietro nelle argomentazioni e calcolando |A| in una base
2
126
di autovettori di |A|. 2
Definizione 4.4. Sia H spazio di Hilbert. A ∈ B(H) è detto operatore di classe traccia o
equivalentemente operatore nucleare se soddisfa una delle tre condizioni (a), (a)’ o (b) in
proposizione 4.5. L’insieme degli operatori di classe traccia su H sarà indicato con B1 (H) e, se
A ∈ B1 (H), allora
È 2
X
||A||1 := |A| =
mλ λ ,
(4.38)
2
λ∈sing(A)
dove abbiamo usato le stesse notazioni che in proposizione 4.5.
Note.
(1) Il nome “classe traccia” deriva evidentemente almeno dal seguente fatto. Per un operatore
A di classe traccia, il numero reale ||A||1 generalizza al caso infinito-dimensionale la nozione di
traccia della matrice corrispondente ad |A| (e non ad A). In realtà le analogie non finiscono qui,
come vedremo tra poco.
(2) Valgono le inclusioni:
B1 (H) ⊂ B2 (H) ⊂ B0 (H) ⊂ B(H) ,
ossia
op. classe traccia ⊂ op. Hilbert-Schmidt ⊂ op. compatti ⊂ op. limitati .
L’unica inclusione non È
ancora dimostrata è la prima.ÈPerÈprovarla notiamo che, se A ∈ B1 (H),
allora, per definizione, |A| ∈ B2 (H), quindi |A| = |A| |A| è di Hilbert-Schmidt per (a) del
teorema 4.5; in virtù della decomposizione polare A = U |A|, essendo U ∈ B(H), si ha A ∈ B2 (H)
per (a) del teorema 4.5.
(3) Ciascuno degli insiemi scritti è sottospazio vettoriale dello spazio degli operatori limitati ed
in più ∗-ideale bilatero (per gli operatori di classe traccia lo proveremo tra poco); infine ciascuno
di questi sottospazi è anche spazio di Hilbert o di Banach rispetto ad una naturale struttura:
gli operatori compatti formano un sottospazio chiuso rispetto alla topologia uniforme in B(H) e
quindi uno spazio di Banach rispetto alla norma operatoriale, gli operatori di Hilbert-Schmidt
definiscono uno spazio di Hilbert rispetto al prodotto scalare di Hilbert-Schmidt e gli operatori di
classe traccia definiscono uno spazio di Banach rispetto alla norma || ||1 , come diremo più avanti.
Prima di passare ad estendere il concetto di traccia al caso infinito-dimensionale, vediamo le
proprietà più importanti degli operatori nucleari o di classe traccia.
Teorema 4.7. Sia H spazio di Hilbert. Gli operatori nucleari in H godono delle seguenti
proprietà.
(a) Se A ∈ B1 (H) allora esistono due operatori B, C ∈ B2 (H) tali che A = BC. Viceversa, se
B, C ∈ B2 (H) allora BC ∈ B1 (H) ed in tal caso:
||BC||1 ≤ ||B||2 ||C||2 .
127
(4.39)
(b) B1 (H) è un sottospazio di B(H) e più fortemente è uno ∗-ideale bilatero, inoltre:
(i) ||AB||1 ≤ ||B|| ||A||1 e ||BA||1 ≤ ||B|| ||A||1 per ogni A ∈ B1 (H) e B ∈ B(H);
(ii) ||A||1 = ||A∗ ||1 per ogni A ∈ B1 (H);
(c) || ||1 definisce una norma su B1 (H).
Nota. È possibile provare che B1 (H) è uno spazio di Banach rispetto alla norma || ||1 (vedi
referenze in [Mar82]).
Prova della proposizione 4.6 eccetto (ii) in (b) che verrà dimostrata in proposizione 4.7. (a)
Se A è di classe traccia, usando la decomposizione
polareÈdi A = U |A| (teorema 3.9), B e C
È
possono sempre essere definiti come B := U |A| e C := |A|. Per definizione di operatore di
È
classe traccia, |A| è operatore di Hilbert-Schmidt, dunque C è Hilbert-Schmidt. Lo è anche
B, in quanto U ∈ B(H) e gli operatori di Hilbert-Schmidt formano un ideale in B(H), come
provato nel teorema 4.5. Siano ora B e C di Hilbert-Schmidt, mostriamo che A := BC è di
classe traccia. Notiamo che A è compatto per (d) di teorema 4.5 e (b) di teorema 4.1; quindi
P
dobbiamo solo provare che λ∈sing(A) mλ λ < +∞. Se BC = 0, la tesi è ovvia. Assumiamo
BC 6= 0 e sviluppiamo l’operatore compatto BC come nel teorema 4.4:
mλ
X
X
A = BC =
λ(uλ,i | )vλ,i .
λ∈sing(A) i=1
Per non caricare troppo le notazioni, poniamo Γ := {(λ, i)|λ ∈ sing(A), i = 1, 2, . . . , mλ } e λj
indichi il primo elemento della coppia j = (λ, i). Allora è chiaro che
X
X
λj =
j∈Γ
mλ λ .
λ∈singA
Dal teorema di decomposizione polare A = U |A| con U ∗ U = I sul rango di |A| e tendo conto
che vj = U uj per cui U ∗ vj = uj , segue che:
(vj |BCuj ) = (vj |Auj ) = (vj |U |A|uj ) = λj (vj |U uj ) = λj (U ∗ vj |uj ) = λj (uj |uj ) = λj .
Se S ⊂ Γ è finito:
X
j∈S
λj =
X
j∈S
(vj |BCuj ) =
X
(B ∗ vj |Cuj ) ≤
j∈S
X
||B ∗ vj || ||Cuj || ≤
sX
j∈S
j∈S
||B ∗ vj ||2
sX
||Cuj ||2 .
j∈S
Dato che gli insiemi ortonormali di elementi uj = uλ,i e vj = vλ,i possono essere separatamente
completati a base hilbertiana di H, l’ultimo termine della catena di disuguaglianze di sopra è
maggiorato da:
||B ∗ ||2 ||C||2 = ||B||2 ||C||2 .
Prendendo l’estremo superiore su tutti gli S finiti, concludiamo che:
||BC||1 =
X
mλ λ ≤ ||B||2 ||C||2
λ∈sing(A)
128
ed in particolare A = BC ∈ B1 (H).
(b) e (c). La chiusura di B1 (H) rispetto al prodotto per scalare si prova immediatamente dalla
stessa definizione di operatore nucleare. Mostriamo che B1 (H) è chiuso rispetto alla somma.
Siano A, B ∈ B1 (H). Se A + B = 0, allora A + B è nucleare banalmente. Assumiamo pertanto
A + B 6= 0, che è comunque compatto. Decomponendo polarmente abbiamo: A = U |A|,
B = V |B|, A + B = W |A + B|. Usando la solita decomposizione sui valori singolari come nella
prova di (a) avremo:
A+B =
mβ
X
X
β(uβ,i | )vβ,i .
β∈sing(A+B) i=1
Se Γ := {(β, i)|β ∈ sing(A + B), i = 1, 2, . . . , mβ }, S ⊂ Γ è finito e βj è il primo elemento della
coppia j ∈ Γ, si ha:
X
j∈S
βj =
X
j∈S
(vj |(A + B)uj ) =
X
(vj |Auj ) +
j∈S
X
(vj |Buj ) .
j∈S
La somma delle due somme ottenuta alla fine può essere riscritta in altro modo, ottenendo
È
È
X È
X
X È
( |B|V ∗ vj | |B|uj ) .
βj =
( |A|U ∗ vj | |A|uj ) +
j∈S
j∈S
j∈S
Procedendo come per l’analoga dimostrazione in (a), otteniamo
È
È
È
È
È
È
X
βj ≤ || |A|U ∗ ||2 || |A|||2 + || |B|V ∗ ||2 || |B|||2 ≤ || |A|||22 + || |B|||22
j∈S
(nell’ultimo passaggio abbiamo tenuto
A vale la disuguaÈ conto del fatto
È che, per esempio, per È
∗
∗
glianza ((a) (ii) del teorema 4.5) || |A|U ||2 ≤ || |A|||2 ||U ||, dato che |A| è di HilbertSchmidt; inoltre ||U ∗ || ≤ 1, come è immediato provare, visto che è un operatore isometrico su
Ker(|A|)⊥ e si annulla su Ker(|A|)).
Notiamo infine che
È
È
|| |A|||22 + || |B|||22 = ||A||1 + ||B||1 .
Abbiamo in definitiva provato che A + B ∈ B1 (H) e che in B1 (H) vale la disuguaglianza
triangolare:
||A + B||1 ≤ ||A||1 + ||B||1 .
Quindi || ||1 è una seminorma. In realtà è una norma, in quanto ||A||1 = 0 implica che gli
autovalori di |A| siano tutti nulli e quindi, essendo |A| compatto, |A| = 0 per (6) in (a) di
teorema 4.2. Per la decomposizione polare di A = U |A|, segue infine che A = 0. Fino ad ora
abbiamo provato che B1 (H) è sottospazio vettoriale di B(H) e che || ||1 è una norma. Mostriamo
ora che B1 (H) è chiuso rispetto alla composizione, a destra È
e a sinistra,
con operatori limitati.
È
Siano A ∈ B1 (H), B ∈ B(H) e A = U |A|. Allora BA = (BU |A|) |A|, dove i due fattori sono
129
operatori di Hilbert-Schmidt e quindi, per (a), BA ∈ B1 (H). Usando (ii) di (a) in teorema 4.5,
(4.38) e (a) del presente teorema, si ha:
È
È
√
√
√
||BA||1 ≤ ||BU |A|||2 || |A|||2 ≤ ||BU || || A||2 || A||2 ≤ ||B|| || A||22 = ||B|| ||A||1 .
È
È
Inoltre AB = (U |A|) |A|B ∈ B1 (H) perché entrambi i fattori sono di Hilbert-Schmidt e vale
(a). In modo analogo al caso trattato sopra, si trova che ||AB||1 ≤ ||B|| ||A||1 . La prova di (ii)
in (b) sarà data nella prova della proposizione 6.5. 2
Per concludere introduciamo il concetto di traccia di un operatore nucleare e mostriamo come
la traccia abbia le stesse proprietà formali della traccia di matrici.
Proposizione 4.6. Se (H, ( | )) è uno spazio di Hilbert, A ∈ B1 (H) e N è una base hilbertiana
di H, è ben definita:
X
trA :=
(u|Au) ;
(4.40)
u∈N
inoltre:
(a) trA non dipende dalla base hilbertiana scelta;
(b) per ogni coppia ordinata (B, C) di operatori di Hilbert-Schmidt tali che A = BC vale:
trA = (B ∗ |C)2 ;
(4.41)
||A||1 = tr|A| .
(4.42)
(c) |A| ∈ B1 (H) e vale:
Prova. (a) e (b). Ogni operatore di classe traccia può decomporsi nel prodotto di due operatori di
Hilbert-Schmidt, come provato in (a) di teorema 4.7. Cominciamo con il notare che se A = BC
con B, C operatori di Hilbert-Schmidt, allora
(B ∗ |C)2 =
X
(B ∗ u|Cu) =
u∈N
X
(u|BCu) =
u∈N
X
(u|Au) = trA .
u∈N
Questo prova che trA è ben definito, essendo un prodotto scalare di Hilbert-Schmidt, e che vale
(4.41). (Quanto scritto sopra mostra anche che (B ∗ |C)2 = (B 0 ∗ |C 0 )2 se BC = B 0 C 0 , essendo
B, B 0 , C, C 0 operatori di Hilbert-Schmidt.) Si osservi inoltre che il risultato ottenuto prova anche
l’invarianza di trA al variare della base hilbertiana, visto che ( | )2 non dipende dalla scelta della
base hilbertiana.
(c) Prima di tutto, per l’unicità della radice quadrata positiva, vale | (|A|) | = |A|. Infatti | (|A|) |
è l’unico operatore limitato positivo il cui quadrato è |A|∗ |A| = |A|2 e |A| è limitato, positivo
con quadrato pari a |A|2 . Quindi, essendo A di classe traccia
+∞ >
X
(u||A|u) =
u∈N
X
u∈N
130
(u|| (|A|) |u) ,
per cui, dalla definizione 4.4, |A| stesso è di classe traccia. Infine, scegliendo una base hilbertiana
fatta di autovettori di |A|, {uλ,i }, si ha
tr|A| =
X
mλ
X
(uλ,i | |A|uλ,i ) =
X
mλ
X
λ∈sing(A) i=1
λ∈sing(A) i=1
X
λ=
mλ λ = ||A||1 .
λ∈sing(A)
Questo conclude la dimostrazione. 2
Definizione 4.5. Siano H spazio di Hilbert e A ∈ B1 (H). Il numero trA ∈ C è detto traccia
dell’operatore A di A.
La seguente proposizione enuncia altre utili proprietà degli operatori nucleari: in particolare,
esattamente come nel caso finito-dimensionale, la ciclicità della traccia. Si osservi che non è
richiesto che tutti gli operatori nella traccia siano di classe traccia (e ciò è importante per le
applicazioni in fisica).
Proposizione 4.7. Sia H spazio di Hilbert. La traccia gode delle seguenti proprietà.
(a) Se A, B ∈ B1 (H) e α, β ∈ C, allora:
trA∗ = trA ,
tr(αA + βB) = α trA + β trB .
(4.43)
(4.44)
(b) Se A è di classe traccia e B ∈ B(H), oppure A e B sono entrambi di Hilbert-Schmidt, allora
trAB = trBA .
(4.45)
(c) Se A1 , A2 , . . . An sono in B(H) con almeno un operatore di classe traccia oppure almeno due
operatori di Hilbert-Schmidt, allora vale la proprietà di ciclicità della traccia
tr (A1 A2 · · · An ) = tr (Aσ(1) Aσ(2) · · · Aσ(n) ) ,
(4.46)
dove (σ(1), σ(2), . . . , σ(n)) è una permutazione ciclica di (1, 2, . . . , n).
Prova della proposizione 4.7 e di (ii) in (b) del teorema 4.7.
(a) La prova è immediata dalla stessa definizione di traccia.
(b) Per dimostrare la tesi cominciamo con il provare che essa vale se A e B sono entrambi di
Hilbert-Schmidt. Per (b) di teorema 4.5, (4.45) è equivalente a dire che
(A∗ |B)2 = (B ∗ |A)2 .
(4.47)
La prova di (4.47) è immediata usando la relazione, valida per tutti i prodotti scalari e le norme
da essi generate:
4(X|Y ) = ||X + Y ||2 + ||X − Y ||2 − i||X + iY ||2 + i||X − iY ||2 ,
131
e ricordando che, nel caso della norma di Hilbert-Schmidt, ||Z||2 = ||Z ∗ ||2 ((i) in (a) di teorema
4.5).
Supponiamo ora che A sia di classe traccia e B ∈ B(H). Allora A = CD, con C e D di HilbertSchmidt per (a) del teorema 4.7. Inoltre DB e BC sono di Hilbert-Schmidt, in quanto B2 (H) è
un ideale bilatero di B(H). Quindi, usando la proprietà di interscambio provata valida nel caso
di due operatori di Hilbert-Schmidt, si ha:
trAB = trCD B = trC DB = trDB C = trD BC = trBC D = trB CD = trBA .
(c) È chiaro che, essendo B1 (H) un ideale bilatero di B(H), è sufficiente che un solo operatore
tra A1 , . . . , An sia di classe traccia perché lo sia il loro prodotto. In particolare, usando (a) del
teorema 4.7 unitamente al fatto che anche B2 (H) è un ideale di B(H), si vede subito che se due
operatori tra A1 , . . . , An sono di Hilbert-Schmidt, allora il prodotto totale è di classe traccia. È
chiaro che la (4.46) è equivalente a
tr (A1 A2 · · · An ) = tr (A2 A3 · · · An A1 ) ;
(4.48)
infatti, continuando a permutare un passo alla volta, si ottengono tutte le permutazioni cicliche.
Proviamo la (4.48). Consideriamo dapprima il caso in cui due operatori, Ai e Aj con i < j,
siano di Hilbert-Schmidt. Se i = 1, la tesi segue subito da (b) con la coppia di operatori di
Hilbert-Schmidt A = A1 e B = A2 · · · An . Se i > 1, allora i quattro operatori (i) A1 · · · Ai , (ii)
Ai+1 · · · An , (iii) Ai+1 · · · An A1 , (iv) A2 · · · Ai sono necessariamente di Hilbert-Schmidt perché
contengono ciascuno Ai oppure Aj (mai entrambi), quindi vale
tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai )
= tr(A2 · · · Ai Ai+1 · · · An A1 ) ,
che è quanto volevamo provare.
Dimostriamo ora la proprietà di ciclicità nell’ipotesi che Ai sia di classe traccia. Se i = 1 la
tesi segue immediatamente da (b) con A = A1 e B = A2 · · · An . Supponiamo allora che i > 1.
Allora A1 · · · Ai e A2 · · · Ai sono di classe traccia perché ciascuno dei due contiene Ai , quindi,
ricordando (b) della presente proposizione, si ha:
tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai )
= tr(A2 · · · Ai Ai+1 · · · An A1 ) .
La proprietà di ciclicità della traccia consente di provare (ii) in (b) del teorema 4.7. In base
a (4.42) si tratta di provare che tr|A| = tr|A∗ |. Dal corollario del teorema di decomposizione
polare (teorema 3.9) sappiamo che |A∗ | = U |A|U ∗ , dove U |A| = A è la decomposizione polare
di A. Vale allora
||A∗ ||1 = tr|A∗ | = tr(U |A|U ∗ ) = tr(U ∗ U |A|) = tr|A| = ||A||1 ,
132
dove abbiamo usato il fatto che U ∗ U |A| = |A|, dato che U è isometria su Ran(|A|) (teorema
3.9). 2
Esercizi 4.3.
(1) Considerare un operatore integrale TK su L2 ([0, L]N , dx), con nucleo integrale K(x, y) dove
K ∈ C 1 ([0, L]N ). Assumendo che TK ∈ B1 (L2 ([0, L]N , dx)), mostrare che
Z
tr(TK ) =
K(x, x)dx .
[0,L]N
Suggerimento. Usare come base di Hilbert per sviluppare la traccia la base hilbertiana degli
esponenziali
1 i 2π PN ni xi
, n1 , n2 , . . . , nN ∈ Z .
e L k=1
LN/2
Ricordare che, se f : [0, L]N → C è di classe C 1 allora la serie di Fourier converge puntualmente
(escluso al più l’insieme di misura nulla rappresentato dal bordo di [0, L]N ):
X
1
f (x) =
L n ,...,n
1
e
i 2π
L
PN
k=1
ni xi
Z
2π
e−i L
PN
k=1
ni yi
f (y)dy .
[0,L]N
N ∈Z
Usare infine il teorema di Fubini-Tonelli opportunamente.
(2) Considerare un operatore integrale TK su L2 ([0, 2π], dx), con nucleo integrale:
K(x, y) =
1
2π
1 in(x−y)
e
.
n2
n∈Z\{0}
X
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia.
(3) Dimostrare che l’operatore TK nell’esercizio (2) è un inverso sinistro dell’operatore differenziale:
d2
− 2,
dx
definito sulle funzione infinitamente differenziabili su [0, π] che soddisfano condizioni di periodicità (includendo tutte le derivate). Tenendo conto di tale dominio, TK può essere anche un
inverso destro?
(4) Considerare un operatore integrale Ts su L2 ([0, 2π], dx), con nucleo integrale:
Ks (x, y) =
1
2π
1 in(x−y)
e
.
n2s
n∈Z\{0}
X
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia se
s > 1/2. Dimostrare che:
tr(Ts ) = ζR (s) ,
dove il secondo memebro è la funzione zeta di Riemann.
133
Capitolo 5
Operatori non limitati con domini
densi in spazi di Hilbert.
In questo capitolo estenderemo la teoria degli operatori in spazi di Hilbert considerando operatori non limitati (in particolare operatori autoaggiunti non limitati, che sono gli operatori più
importanti della Meccanica Quantistica).
Nella prima sezione introdurremo i primi rudimenti di teoria degli operatori non limitati definiti
su domini che non coincidono con tutto lo spazio di Hilbert. Daremo, in particolare, la nozione
di dominio naturale. Introdurremo la nozione di operatore chiuso e chiudibile. Quindi, presenteremo la nozione generale di operatore aggiunto, per operatori non limitati e densamente definiti,
provando che tale nozione estende quella già data nel caso di operatori limitati definiti su tutto
lo spazio di Hilbert.
La sezione successiva si occuperà di discutere le generalizzazioni al caso di operatore non limitato, della nozione di operatore autoaggiunto, precedentemente data nel caso di operatori
di B(H). Introdurremo quindi i concetti di operatore hermitiano, simmetrico, essenzialmente
autoaggiunto ed autoaggiunto, discutendone le proprietà generali più importanti. In particolare
presentermo la nozione di core di un operatore e quella di indici di difetto.
La terza sezione sarà completamente dedicata a due esempi di operatori autoaggiunti della
massima importanza in Meccanica Quantistica: gli operatori posizione ed impulso negli spazi L2 (R3 , dx). Studieremo a fondo tali operatori, presentandone le varie possibili equivalenti
definizioni.
L’ultima sezione sarà dedicata a criteri più avanzati per stabilire se un operatore simmetrico ammette estensioni autoaggiunte e se è essenzialmente autoaggiunto. In particolare presenteremo il
criterio di von Neumann. Alcuni strumenti tecnici per affrontare questo tipo di analisi, oltre alla
nozione di core di un operatore, sono la trasformata di Cayley e la nozione di vettore analitico,
discussi nello stessa sezione.
134
5.1
5.1.1
Operatori non limitati con dominio non massimale.
Operatori non limitati con dominio non massimale in spazi normati e
di Hilbert.
Le prime nozioni che diamo sono abbastanza generali e non necessitano ancora della struttura
di spazio di Hilbert.
Definizione 5.1. Se X è uno spazio normato, un operatore in X è un’applicazione lineare:
T : D(T ) → X ,
dove D(T ) ⊂ X è un sottospazio di X (in generale non chiuso), detto dominio di T .
Il grafico G(T ) dell’operatore T è il sottospazio di X ⊕ X:
G(T ) := {(x, T x) | x ∈ D(T )} .
Se α ∈ C e A e B sono operatori in X con dominio D(A) e D(B) rispettivamente, si definiscono
gli operatori in H:
AB, tale che ABf := A(Bf ) sul suo dominio naturale:
D(AB) := {f ∈ D(B) | Bf ∈ D(A)}
A + B tale che (A + B)f := Af + Bf sul suo dominio naturale:
D(A + B) := D(A) ∩ D(B)
αA, tale che αAf := α(Af ) sul suo dominio naturale: D(αA) = D(A) se α 6= 0,
D(0A) := H .
È chiaro che le definizioni date sopra si riducono a quelle già viste nel caso di operatori T ∈ L(X),
che non sono altro che operatori in X con D(T ) = X.
Il concetto di estensione di un operatore e quello di operatore chiuso e chiudibile giocano un
ruolo importante nel seguito.
Definizione 5.2. Se A è un operatore nello spazio normato X, un operatore B sullo spazio X
si dice estensione di A, e si scrive A ⊂ B, se G(A) ⊂ G(B).
Definizione 5.3. Sia A operatore nello spazio normato X.
(a) A è detto chiuso se il suo grafico è chiuso nella topologia prodotto di X × X.
In altre parole A è chiuso se, per ogni successione {xn }n∈N ⊂ D(A) tale che, per n → +∞:
(i) xn → x ∈ X,
(ii) T xn → y ∈ X,
vale x ∈ D(A) e y = T x.
135
(b) A è detto chiudibile se la chiusura G(A) del suo grafico è ancora il grafico di un operatore
(che risulta essere necessariamente chiuso). Tale operatore si indica con A e si dice chiusura
di A.
La seguente proposizione caratterizza gli operatori chiudibili.
Proposizione 5.1. Sia A operatore nello spazio normato X; i seguenti fatti sono equivalenti:
(i) A è chiudibile,
(ii) non esistono in G(A) elementi del tipo (0, z) con 0 6= z ∈ X,
(iii) A ammette estensioni chiuse.
Prova. (i) ⇔ (ii) A non è chiudibile se e solo se ci sono due successioni in D(A), {xn } e {x0n },
tali che xn → x ← x0n , ma Axn → y 6= y 0 ← Ax0n . Per linearità questo è equivalente a dire che
c’è una successione di elementi x00n = xn − x0n → 0 tale che T x00n → y − y 0 = z 6= 0. Questo è
equivalente a dire che G(A) contiene il punto (0, z).
(i) ⇔ (iii) Se A è chiudibile, A è un’estensione chiusa di A. Se viceversa esiste un’estensione
chiusa B di A non può accadere che esistano in G(A) elementi del tipo (0, z) con 0 6= z ∈ X,
altrimenti, essendo A ⊂ B e B chiuso, avremmo che G(B) = G(B) ⊃ G(A) 3 (0, z) e quindi B
non sarebbe un operatore. 2
Restringiamoci al caso in cui X sia uno spazio di Hilbert, che indicheremo con H. È per molti
motivi conveniente definire una struttura di spazio di Hilbert sullo spazio somma diretta H ⊕ H
(vedi il testo dopo notazione 2.5). Dal punto di vista topologico, H ⊕ H ha la topologia naturale
data dalla topologia prodotto di H × H. Vogliamo pertanto che la struttura di spazio di Hilbert
su H ⊕ H induca proprio la topologia prodotto.
Definiamo il prodotto scalare su H ⊕ H come ((x, x0 )|(y, y 0 )) := (x|x0 ) + (y|y 0 ), per ogni coppia
(x, x0 ), (y, y 0 ) ∈ H ⊕ H. Siccome la norma indotta da questo prodotto scalare è tale che
||(z, z 0 )||2 = ||z||2 + ||z 0 ||2
(5.1)
per ogni (z, z 0 ) ∈ H ⊕ H, si ha immediatamente che ogni successione di Cauchy {(xn , x0n )}n∈N in
H⊕H rispetto alla norma indotta dal prodotto scalare su H⊕H definisce le successioni di Cauchy
in H: {xn }n∈N e {x0n }n∈N . Tali successioni di Cauchy convergono dunque rispettivamente a x e
x0 in H. È quindi immediato provare che (xn , x0n ) → (x, x0 ) per n → +∞ direttamente da (5.1).
Pertanto H ⊕ H è completo. Inoltre, il prodotto scalare definito su H ⊕ H induce una norma la
cui topologia su H ⊕ H è, come volevamo, la topologia prodotto. Per provare ciò, è sufficiente
notare che, se (x, y) ∈ H ⊕ H e se Bδ ((x, y)) è la palla metrica aperta in H ⊕ H centrata in (x, y)
di raggio δ > 0 e B (z) l’analoga palla aperta in H centrata in z di raggio > 0, allora valgono
le inclusioni:
Bδ/√2 (x) × Bδ/√2 (y) ⊂ Bδ ((x, y)) ⊂ Bδ√2 (x) × Bδ√2 (y)
Concludiamo che, per esempio, la nozione di operatore chiuso su uno spazio di Hilbert (definizione 5.3) può essere equivalentemente data rispetto alla topologia indotta dal prodotto scalare
136
su H ⊕ H.
Per dimostrare alcune proposizioni conviene introdurre fin d’ora l’operatore unitario τ : H⊕H →
H ⊕ H tale che
τ : (x, y) 7→ (−y, x) .
Si osservi che τ τ = −I. Si verifica immediatamente per computo diretto che, se F ⊂ H ⊕ H,
allora
τ (F ⊥ ) = (τ (F ))⊥ ,
(5.2)
dove
⊥
5.1.2
è riferito al prodotto scalare di H ⊕ H; in altre parole τ e
⊥
commutano.
La definizione generale di operatore aggiunto in spazi di Hilbert.
Passiamo a definire l’aggiunto di un operatore A nello spazio di Hilbert H, nel caso in cui D(A)
sia denso in H. Consideriamo un vettore x ∈ H per cui esiste un vettore zA,x tale che, per ogni
y ∈ D(A):
(x|Ay) = (zA,x |y) .
(5.3)
Si osservi che 0 soddisfa sicuramente la proprietà richiesta per x. Inoltre, se esiste zA,x per un
0
certo x, zA,x è univocamente fissato da x. Infatti se zA,x
soddisfa la stessa identità di sopra per
tutti gli y ∈ D(A), allora deve essere:
0
0 = (x|Ay) − (x|Ay) = (zA,x − zA,x
|y)
(5.4)
per ogni y ∈ D(A). Dato che D(A) è denso in H, ci sarà una successione {yn }n∈N ⊂ D(A)
0 . Per la continuità del prodotto scalare, (5.4) implica subito che
per cui yn → zA,x − zA,x
0 ||2 = 0 e quindi z
0
||zA,x − zA,x
A,x = zA,x .
Indicheremo con D(A∗ ) l’insieme degli x ∈ H che soddisfano la condizione (5.3) per qualche zA,x
e per ogni y ∈ D(A).
Ragionando come per la definizione dell’operatore aggiunto nel caso in cui A ∈ B(H), si verifica
subito che D(A∗ ) è un sottospazio di H e che l’applicazione
D(A∗ ) 3 x 7→ zA,x
è lineare.
Definizione 5.4. Se T è un operatore nello spazio di Hilbert H con D(T ) = H, l’operatore
aggiunto di T , T ∗ , è l’operatore su H definito sul sottospazio:
D(T ∗ ) := {x ∈ H | esiste zT,x ∈ H con (x|T y) = (zT,x |y) per ogni y ∈ D(T )}
e tale che:
T ∗ : x 7→ zT,x .
137
Note.
(1) È chiaro che vale:
(T ∗ x|y) = (x|T y) ,
per ogni coppia (x, y) ∈ D(T ∗ ) × D(T ).
(2) Se T ∈ B(H), applicando la definizione 5.4 per T ∗ si vede immediatamente che vale D(T ∗ ) =
H a causa del teorema di Riesz, come visto nel paragrafo 3.3. Concludiamo che:
per gli operatori di B(H) la definizione di aggiunto data in definizione 5.4 coincide con quella
data in definizione 3.7.
(3) Si osservi che non è detto che D(T ∗ ) sia denso in H, per cui, in generale, non esiste (T ∗ )∗ .
(4) Esplicitando l’insieme τ (G(T ))⊥ troviamo subito che
τ (G(T ))⊥ = {(x, y) ∈ H ⊕ H | − (x|T z) + (y|z) = 0 per ogni z ∈ D(T )} .
In altre parole τ (G(T ))⊥ è il grafico di T ∗ (purché tale operatore sia definito):
τ (G(T ))⊥ = G(T ∗ ) .
(5) Se A ⊂ B ed entrambi gli operatori sono densamente definiti, allora A∗ ⊃ B ∗ . La prova è
immediata dalla definizione di aggiunto.
Teorema 5.1. Sia A operatore sullo spazio di Hilbert H con dominio denso; allora valgono le
seguenti proprietà:
(a) A∗ è un operatore chiuso e vale:
τ (G(A))⊥ = G(A∗ ) ;
(5.5)
(b) A è chiudibile se e solo se D(A∗ ) è denso. In tal caso:
A ⊂ A = (A∗ )∗ ;
(c) KerA∗ = [RanA]⊥ e Ker(A) ⊂ [RanA∗ ]⊥ (dove possiamo sostituire ⊂ con = se D(A∗ ) è
denso in H).
(d) Se A è chiuso (oltre ad avere dominio denso) allora vale la decomposizione ortogonale di
H ⊗ H:
H ⊕ H = τ (G(A)) ⊕ G(A∗ ) .
(5.6)
Prova. (a) L’identità (5.5) è stata provata nella nota precedente. In essa: τ (G(A))⊥ è chiuso
per costruzione, essendo l’ortogonale di un insieme ((a) di teorema 3.1), quindi A∗ è chiuso.
(b) Consideriamo la chiusura del grafico di A; vale D(A) = (D(A)⊥ )⊥ per il teorema 3.1.
Tenendo conto che τ τ = −I, che S ⊥ = −S ⊥ per ogni insieme S, e che valgono (5.2) e (5.5),
troviamo che:
G(A) = −τ ( τ (G(A))⊥ )⊥ = −τ (G(A∗ ))⊥ = τ (G(A∗ ))⊥ .
(5.7)
138
Per proposizione 5.1, G(A) è il grafico di un operatore (la chiusura di A) se e solo se G(A) non
contiene elementi del tipo (0, z) con z 6= 0. In altre parole G(A) non è il grafico di un operatore
se e solo se esiste z 6= 0 con (0, z) ∈ τ (G(A∗ ))⊥ . Questa condizione si esplicita in
esiste z 6= 0 tale che
0 = ((0, z)|(−A∗ x, x)) ,
per ogni x ∈ D(A∗ ) .
In altre parole G(A) non è il grafico di un operatore se e solo se D(A∗ )⊥ 6= {0}, che è equivalente
a dire che D(A∗ ) non è denso in H. In definitiva: G(A) è il grafico di un operatore se e solo se
D(A∗ ) è denso in H.
Se D(A∗ ) è denso in H, allora (A∗ )∗ è definito e, usando (5.7) e (5.5),
G(A) = τ (G(A∗ ))⊥ = G((A∗ )∗ ) .
D’altra parte, per la definizione di chiusura dell’operatore A, G(A) = G(A). Sostituendo sopra:
G(A) = G((A∗ )∗ ) ,
e quindi A = (A∗ )∗ .
(c) Seguono immediatamente da
(A∗ x|y) = (x|Ay) ,
per ogni coppia (x, y) ∈ D(A∗ ) × D(A)
e dalla densità di D(A) (e da quella di D(A∗ )).
(d) Dato che A è chiuso, G(A) è chiuso e quindi τ (G(A)) è chiuso perchè τ : H ⊕ H → H ⊕ H
è evidentemente unitario. Dalla (5.5) e da (b) e (d) del teorema 3.1 abbiamo immediatamente
che (5.6) deve essere vera. Questo conclude la dimostrazione. 2
Nota. Tenuto conto del fatto che, se D(A) è denso e λ ∈ C, allora (A − λI)∗ = A∗ − λI, la
prima relazione del punto (c) implica immediatamente che valga anche la seguente identità, che
useremo spesso in seguito:
Ker(A∗ − λI) = [Ran(A − λI)]⊥ ,
mentre la seconda relazione del punto (c) fornisce:
Ker(A − λI) ⊂ [Ran(A∗ − λI)]⊥ .
5.2
Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti.
Possiamo ora dare la definizione di operatore autoaggiunto e le nozioni connesse.
Definizione 5.5. Siano (H, ( | )) spazio di Hilbert e A operatore in H.
(a) A è detto hermitiano se (Ax|y) = (x|Ay) per ogni coppia x, y ∈ D(A).
139
(b) A è detto simmetrico se è hermitiano e D(A) è denso. In altre parole A è simmetrico
quando D(A) è denso e A ⊂ A∗ .
(c) A è detto autoaggiunto se D(A) è denso e A = A∗ .
(d) A è detto essenzialmente autoaggiunto se D(A) e D(A∗ ) sono densi e A∗ = (A∗ )∗ ovvero, equivalentemente, D(A) è denso, A è chiudibile e vale A∗ = A.
(e) A è detto normale se A∗ A = AA∗ , dove i due membri sono definiti sui loro domini naturali.
Note.
(1) A commento di (c) nella definizione 5.5, si osservi che, per (a) di teorema 5.1, ogni operatore
autoaggiunto è chiuso.
(2) Val la pena di notare che:
(i) le definizioni di operatore hermitiano, simmetrico, autoaggiunto ed essenzialmente autoaggiunto coincidono quando il dominio dell’operatore è tutto lo spazio di Hilbert;
(ii) vale il teorema di Hellinger-Toeplitz: un operatore hermitiano con dominio dato da
tutto lo spazio di Hilbert (cioé un operatore autoaggiunto definito su tutto lo spazio di Hilbert) è
necessariamente limitato. Questo evero per (d) della proposizione 3.8, ed è quindi autoaggiunto
anche nel senso della definizione 3.9;
(iii) gli operatori limitati autoaggiunti nel senso della definizione 3.9 sono operatori autoaggiunti con dominio dato da tutto lo spazio, nel senso della definizione di sopra.
(3) La nozione di operatore essenzialmente autoaggiunto è la più importante delle quattro presentate sopra nelle applicazioni in Meccanica Quantistica, per il seguente fatto. Come vedremo
tra poco, gli operatori essenzialmente autoaggiunti ammettono una sola estensione autoaggiunta,
per cui portano tutta l’informazione di un operatore autoaggiunto. Per motivi che vedremo più
avanti, gli operatori importanti in Meccanica Quantistica sono operatori autoaggiunti; d’altra
parte gli operatori più comodi da trattare sono gli operatori differenziali. Risulta spessissimo
che operatori differenziali definiti su domini opportuni siano essenzialmente autoaggiunti. In
tal modo gli operatori differenziali essenzialmente autoaggiunti sono, da una parte, comodi per
essere usati, dall’altra, portano le informazioni, in maniera univoca, di operatori autoaggiunti
utili in Meccanica Quantistica. Per questo motivo ci soffermiamo su alcune proprietà connesse
all’autoaggiunzione essenziale.
(4) Dato un operatore A : D(A) → H nello spazio di Hilbert H, si dice che B ∈ B(H) commuta
con A, quando
BA ⊂ AB .
Se il dominio di A è denso e quindi esiste A∗ , si verifica facilmente che se B ∈ B(H) commuta
con A allora B ∗ commuta con A∗ (lo si provi per esercizio). Estendendo quanto detto in (3) in
esempi 3.3, indichiamo con {A}0 il commutante di A : D(A) → H, cioé :
{A}0 := {B ∈ B(H) | BA ⊂ AB}
Nel caso in cui A = A∗ risulta che {A}0 è una sotto ∗-algebra di B(H) che è chiusa rispetto
alla topologia operatoriale forte. Si tratta dunque di un’algebra di von Neumann (vedi (3) in
esempi 3.3). L’ulteriore commutante {A}00 := {{A}0 }0 è ancora un’algebra di von Neumann che
140
si chiama algebra di von Neumann generata da A.
Notazione 5.1. D’ora in poi scriveremo anche A∗∗···∗ in luogo di (((A∗ )∗ ) · · · )∗ .
Proposizione 5.2. Siano (H, ( | )) spazio di Hilbert e A operatore in H; allora valgono i seguenti
fatti.
(a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora:
∗
A∗ = A = A∗ = A∗∗∗ .
(5.8)
(b) A è essenzialmente autoaggiunto se e solo se A è autoaggiunto.
(c) Se A è autoaggiunto, allora è simmetrico massimale: non ha estensioni proprie simmetriche.
(d) Se A è essenzialmente autoaggiunto, allora A ammette solo una estensione autoaggiunta: A
(che coincide con A∗ ).
Prova. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora esistono A∗ , A∗∗ e A∗∗∗ . Inoltre
∗
A = (A∗∗ )∗ = A∗∗∗ = (A∗ )∗∗ = A∗
per (b) del teorema 5.1. Dato che A∗ è chiuso (per (a) di teorema 5.1), vale infine: A∗ = A∗ .
(b) Se A è essenzialmente autoaggiunto, allora A = A∗ e quindi, in particolare, D(A) = D(A∗ ) è
∗
denso. Calcolando l’aggiunto di A e tenendo conto di (b) in teorema 5.1, si ha: A = (A∗ )∗ = A,
ossia A è autoaggiunto.
∗
Viceversa, se A è autoaggiunto, ossia esiste A = A, allora D(A), D(A∗ ), D(A∗∗ ) sono densi e,
∗
applicando (a): A∗ = A∗ = A ; quindi A∗ = A. Allora A è essenzialmente autoaggiunto.
(c) Sia A autoaggiunto e A ⊂ B con B simmetrico. Prendendo gli aggiunti, si ha A∗ ⊃ B ∗ . Ma
B ∗ ⊃ B per la simmetria. Allora:
A ⊂ B ⊂ B ∗ ⊂ A∗ = A ,
e quindi A = B = B ∗ .
(d) Sia A∗ = A∗∗ e A ⊂ B con B = B ∗ . Prendendo l’aggiunto di A ⊂ B si ha che: B = B ∗ ⊂ A∗ .
Prendendo due volte l’aggiunto di A ⊂ B troviamo anche che A∗∗ ⊂ B, ma allora:
B = B ∗ ⊂ A∗ = A∗∗ ⊂ B ,
per cui B = A∗∗ , che coincide con A per (b) del teorema 5.1. 2
Passiamo ora a dare i due teoremi fondamentali che caratterizzano gli operatori autoaggiunti ed
essenzialmente autoaggiunti.
Teorema 5.2. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti:
(a) A è autoaggiunto;
141
(b) A è chiuso e Ker(A∗ ± iI) = {0};
(c) Ran(A ± iI) = H.
Prova. (a) ⇒ (b) Se A = A∗ , allora A è chiuso perché A∗ è chiuso. Se x ∈ Ker(A∗ + iI), allora
vale anche Ax = −ix e quindi
i(x|x) = (Ax|x) = (x|Ax) = (x| − ix) = −i(x|x) ,
per cui (x|x) = 0 e quindi x = 0.
La prova per Ker(A∗ − iI) = {0} è analoga.
(b) ⇒ (c) Dalla definizione di operatore aggiunto segue che (vedi nota dopo teorema 5.1):
[Ran(A − iI)]⊥ = Ker(A∗ + iI). Quindi da (b) segue che Ran(A − iI) è denso in H. Ora
teniamo conto della chiusura di A per mostrare che in realtà Ran(A − iI) = H. Si fissi y ∈ H
arbitrariamente e si scelga {xn }n∈N ⊂ D(A) per cui (A − iI)xn → y ∈ H. Vale, se z ∈ D(A),
||(A − iI)z||2 = ||Az||2 + ||z||2 ≥ ||z||2 ,
da cui il fatto che {xn }n∈N è una successione di Cauchy ed esiste x = limn→+∞ xn . La chiusura di
A comporta subito quella di A−iI, per cui: (A−iI)x = y e quindi Ran(A−iI) = Ran(A − iI) =
H. La prova per Ker(A∗ − iI) = {0} è analoga.
(c) ⇒ (a) Dato che A ⊂ A∗ per l’ipotesi di simmetria, è sufficiente provare che D(A∗ ) ⊂ D(A).
Sia y ∈ D(A∗ ). Dato che Ran(A − iI) = H, esiste un vettore x− ∈ D(A) tale che:
(A − iI)x− = (A∗ − iI)y .
Su D(A) l’operatore A∗ coincide con A e pertanto, dall’identità di sopra, si trova che:
(A∗ − iI)(y − x− ) = 0 .
Ma Ker(A∗ − iI) = Ran(A + iI)⊥ = {0}, per cui y = x− e y ∈ D(A). La dimostrazione nel
caso di Ran(A + iI) è analoga. 2
Teorema 5.3. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti:
(a) A è essenzialmente autoaggiunto;
(b) Ker(A∗ ± iI) = {0};
(c) Ran(A ± iI) = H.
Prova.
(a) ⇒ (b) Se A è essenzialmente autoaggiunto, allora A∗ = A∗∗ e quindi A∗ è autoaggiunto (e
dunque chiuso). Applicando il teorema 5.2, segue che Ker(A∗∗ ± iI) = {0} e quindi vale (b)
perché A∗∗ = A∗ .
(b) ⇒ (a) A ⊂ A∗ per ipotesi e quindi, essendo D(A) denso, lo è anche D(A∗ ). Di conseguenza,
per la (b) del teorema 5.1, A è chiudibile e A ⊂ A = A∗∗ (in particolare D(A∗∗ ) = D(A) ⊃ D(A)
142
∗
è denso). Pertanto, da A ⊂ A∗ segue A ⊂ A∗ e, per la (a) di proposizione 5.2, si ha A∗ = A . In
∗
definitiva, A ⊂ A , ovvero A è simmetrico. Possiamo allora applicare il teorema 5.2 all’operatore
A, valendo per esso la proposizione (b) in tale teorema. Concludiamo che A è autoaggiunto. Da
(b) di proposizione 5.2 segue che A è essenzialmente autoaggiunto.
(b) ⇔ (c) Dato che Ran(A ± iI)⊥ = Ker(A∗ ∓ iI) e che Ran(A ± iI) ⊕ Ran(A ± iI)⊥ = H, (b)
e (c) sono equivalenti. 2
Per concludere presentiamo un concetto utile nelle applicazioni: quello di core per un operatore.
Definizione 5.6. Sia A un operatore nello spazio di Hilbert H con dominio denso e sia A
chiudibile. Un sottospazio denso S ⊂ D(A) è detto essere un core di A se A S è chiudibile e:
A S = A .
Vale la seguente ovvia ma importante proposizione.
Proposizione 5.3. Se A è un operatore autoaggiunto nello spazio di Hilbert H, un sottospazio
S ⊂ D(A) è un core per A se e solo se A S è essenzialmente autoaggiunto.
Prova. Se A S è essenzialmente autoaggiunto, allora ammette un’unica estensione autoaggiunta, che coincide con la sua chiusura per (d) in proposizione 5.2; nel caso in esame, tale estensione
coincide necessariamente con A, che per ipotesi è autoaggiunto. Quindi A S è un core.
Viceversa, se A S è un core, significa che la chiusura di A S è autoaggiunta perché coincide
con l’operatore autoaggiunto A. Per (b) di proposizione 5.2, A S è dunque essenzialmente
autoaggiunto. 2
Esercizi 5.1.
(1) Sia A un operatore nello spazio di Hilbert H con dominio denso D(A). Siano α, β ∈ C e si
consideri il dominio naturale D(αA + β) := D(A). Provare che:
(i) αA + βI : D(αA + β) → H ammette aggiunto e
(αA + βI)∗ = αA∗ + βI .
(ii) αA + βI è hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto se e solo se
A è, rispettivamente, hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto.
(iii) αA + βI è chiudibile se e solo se A è chiudibile ed in tal caso vale:
αA + βI = αA + βI .
Suggerimento. Applicare direttamente le definizioni necessarie.
(2) Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che se A + B :
D(A) ∩ D(B) → H è densamente definito, allora:
(A + B)∗ ⊂ A∗ + B ∗ .
143
(3) Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che se il
dominio naturale D(AB) è densamente definito allora AB : D(AB) → H ammette aggiunto e
(AB)∗ ⊂ B ∗ A∗ .
(4) Sia A un operatore nello spazio di Hilbert H densamente definito e L : H → H un operatore
limitato. Provare, applicando la definizione di aggiunto, che valgono le relazioni:
(LA)∗ = A∗ L∗ ,
(AL)∗ = L∗ A∗
e quindi, in particolare, D(A∗ )L∗ = D((LA)∗ ) e D((AL)∗ ) = L∗ D(A∗ ).
Dimostrare anche che vale la relazione:
(L + A)∗ = L∗ + A∗ ,
e quindi, in particolare, D((L + A)∗ ) = D(L∗ ) ∩ D(L∗ ) = D(A∗ ).
(5) Sia A operatore simmetrico sullo spazio di Hilbert H. Provare che se A : D(A) → H
è biettivo allora è autoaggiunto. Tenere conto del fatto che, come si dimostra dal teorema
spettrale per operatori autoaggiunti non limitati che vedremo più avanti, l’inverso di un operatore
autoaggiunto (quando esiste) è autoaggiunto.
Suggerimento. Se A è simmetrico lo è A−1 : H → D(A). Questo è definito su tutto lo spazio
di Hilbert per cui è autoaggiunto.
(6) Nel seguito se A è un operatore su H, il commutante {A}0 è l’insieme degli operatori di B(H)
per cui BA ⊂ AB. Sia A : D(A) → H operatore nello spazio di Hilbert H. Provare che se D(A)
è denso e A è chiuso, allora {A}0 ∩ {A∗ } è una sotto ∗-algebra di B(H) con unità ed è chiusa
rispetto alla topologia forte. Dimostrare che se A è autoaggiunto ed è definito su tutto H, allora
l’algebra di von Neumann ({A}0 )0 coincide con l’algebra di von Neumann generata da {A} nel
senso di (3) in esempi 3.3.
5.3
Alcune importanti applicazioni: operatore posizione e operatore impulso.
Come esempi del formalismo introdotto in questo capitolo fino a questo punto, introduciamo e
studiamo alcune caratteristiche di due operatori autoaggiunti, di grande importanza in Meccanica Quantistica, che si chiamano rispettivamente operatore posizione ed operatore impulso.
Il significato fisico di tali operatori sarà chiarito nella seconda parte del trattato.
Nel seguito adotteremo le convenzioni le definizioni e le notazioni usate nella sezione 3.6.
x = (x1 , . . . , xn ) denota il punto generico di Rn .
5.3.1
L’operatore posizione.
Definizione 5.7. Consideriamo l’operatore in H := L2 (Rn , dx), dove dx è la misura di Lebesgue
su Rn e i è un numero in {1, 2, . . . , n}, dato da:
(Xi f )(x) = xi f (x) ,
144
(5.9)
con dominio:
§
D(Xi ) := f ∈ L2 (Rn , dx)
Z
Rn
|xi f (x)|2 dx < +∞
ª
.
(5.10)
Questo operatore si chiama operatore posizione rispetto alla coordinata i-esima.
Proposizione 5.4. Si consideri l’operatore Xi definito in (5.9) con dominio definito in (5.10).
Valgono i seguenti fatti.
(a) L’operatore Xi è autoaggiunto.
(b) Xi D(Rn ) e Xi S(Rn ) sono dei core per Xi e quindi:
Xi = Xi D(Rn ) = Xi S(Rn ) .
Prova. (a) Il dominio di Xi è sicuramente denso in H in quanto include lo spazio D(Rn ) delle
funzioni infinitamente differenziabili a supporto compatto e anche lo spazio delle funzioni di
Schwartz S(Rn ) (vedi notazione 3.3) che sono entrambi densi in L2 (Rn , dx). Quindi Xi è chiudibile ed ammette aggiunto. Dalla definizione di Xi e del suo dominio risulta immediatamente
che (g|Xi f ) = (Xi g|f ) se f, g ∈ D(Xi ). Di conseguenza Xi è hermitiano e simmetrico. Mostriamo che è anche autoaggiunto. Dato che, per la simmetria Xi ⊂ Xi∗ è sufficiente provare che
D(Xi∗ ) = D(Xi ). Determiniamo l’aggiunto di Xi direttamente dalla definizione. f ∈ D(Xi∗ ) se
e solo se esiste h ∈ L2 (Rn , dx) per cui:
Z
Z
Rn
f (x)xi g(x)dx =
per ogni g ∈ D(Xi ). Infine:
h(x)g(x)dx
Rn
Xi∗ : f 7→ h .
Dato che D(Xi ) è denso e vale
Z
Rn
[xi f (x) − h(x)]g(x)dx = 0
per ogni g ∈ D(Xi ), possiamo anche dire che:
f ∈ L2 (Rn , dx) appartiene a D(Xi∗ ) se e solo se xi f (x) = h(x) quasi ovunque, con h ∈
L2 (Rn , dx).
In definitiva, D(Xi∗ ) è composto da tutte e sole funzioni f ∈ L2 (Rn , dx) per cui
Z
Rn
|xi f (x)|2 dx < +∞ ,
e quindi D(Xi∗ ) = D(Xi ) e Xi è autoaggiunto.
(b) Se definiamo l’operatore Xi come abbiamo fatto sopra, eccetto per il fatto che restringiamo il
suo dominio allo spazio D(Rn ) delle funzioni infinitamente differenziabili a supporto compatto,
oppure S(Rn ), l’operatore ottenuto in tal modo cessa di essere autoaggiunto, ma rimane simmetrico come è immediato provare. Notiamo che gli aggiunti di Xi D(Rn ) e Xi S(Rn ) coincidono
145
entrambi con l’operatore Xi∗ già trovato sopra. Questo perché nella costruzione di Xi∗ abbiamo
solo usato il fatto che Xi è l’operatore che moltiplica per xi su un dominio denso: che fosse
D(Xi ) definito in (5.10) o un suo sottospazio non cambiava il risultato. Definendo Xi come
in (5.9) e (5.10), il suo aggiunto Xi∗ deve soddisfare Ker(Xi∗ ± iI) = {0} per (b) del teorema
5.2. Ma dato che Xi∗ è lo stesso che si ottiene restringendo il dominio di Xi a D(Rn ) o S(Rn ),
valendo (b) del teorema 5.3, l’operatore Xi , con dominio ristretto, risulta essere essenzialmente
autoaggiunto. L’ultima proposizione è conseguenza immediata di (d) in proposizione 5.2. 2
5.3.2
L’operatore impulso.
Passeremo ora ad introdurre l’operatore impulso. Abbiamo bisogno di una definizione preliminare. Ricordiamo che che f : Rn → C è una funzione localmente integrabile su Rn se f · g è in
L1 (Rn , dx) per ogni funzione g ∈ D(Rn ).
Definizione 5.8. Sia f localmente integrabile. Se α è un multi indice, diremo che h : Rn → C
è la α-esima derivata di f in senso debole, e scriveremo w-∂ α f = h, se h : Rn → C è
localmente integrabile e vale
Z
|α|
Z
h(x)g(x) dx = (−1)
Rn
Rn
f (x)∂xα g(x) dx
(5.11)
per ogni funzione g ∈ D(Rn ).
Note.
(1) La derivata in senso debole, se esiste è univocamente determinata (a meno di un insieme di
misura nulla): se h e h0 sono localmente integrabili e soddisfano (5.11), allora
Z
(h(x) − h0 (x))g(x) dx = 0
(5.12)
Rn
per ogni funzione g ∈ D(Rn ). Ma allora h(x) − h0 (x) = 0 quasi ovunque per il lemma di Du
Bois-Reymond
[Vla81], che afferma che φ, localmente integrabile su Rn , è nulla quasi ovunque
R
se e solo se Rn φ(x)f (x) dx = 0 per ogni f ∈ D(Rn ).
(2) È chiaro che, nel caso che f ∈ C |α| (Rn ), la derivata di ordine α in senso debole di f esiste e
coincide con quella in senso ordinario (a meno di un insieme di misura nulla). Tuttavia vi sono
casi in cui la derivata ordinaria non esiste ed esiste solo quella debole.
(3) È chiaro che le funzioni L2 (Rn , dx) sono localmente integrabili essendo D(Rn ) ⊂ L2 (Rn , dx)
ed essendo in L1 il prodotto di funzioni L2 .
Al fine di introdurre l’operatore impulso, consideriamo l’operatore su H := L2 (Rn , dx), dato da:
(Ai f )(x) = −i~
146
∂
f (x) ,
∂xi
dove ~ è una costante positiva, con dominio: D(Ai ) := D(Rn ).
Dalla definizione di Ai e del suo dominio risulta immediatamente che (g|Ai f ) = (Ai g|f ) se f, g ∈
D(Ai ). Di conseguenza Ai è hermitiano e simmetrico. Mostriamo che Ai è anche essenzialmente
autoaggiunto. Determiniamo l’aggiunto di Ai che si indica con Pi := A∗i direttamente dalla
definizione. Per f ∈ D(Pi ) deve esistere φ ∈ L2 (Rn , dx) per cui:
Z
f (x)g(x)dx = −i~
Rn
Z
φ(x)
Rn
∂
g(x)dx ,
∂xi
per ogni g ∈ D(Rn ) .
(5.13)
Prendendo il complesso coniugato ad ambo membri, la condizione (5.13) si esprime dicendo che:
φ ∈ L2 (Rn , dx) appartiene a D(Pi ) se e solo se ammette derivata in senso debole f che appartiene a L2 (Rn , dx). Infine Pi : φ 7→ f .
Definizione 5.9. Consideriamo l’operatore in H := L2 (Rn , dx), dove dx è la misura di Lebesgue
su Rn e i è un numero in {1, 2, . . . , n}, dato da:
(Pi f )(x) = −i~w-
∂
f (x) ,
∂xi
(5.14)
con dominio:
n
∂
D(Pi ) := f ∈ L2 (Rn , dx) esiste w- ∂x
f ∈ L2 (Rn , dx)
i
o
.
(5.15)
Pi si dice operatore impulso rispetto alla coordinata i-esima.
Nota. Se Rn = R, un modo alternativo, ma equivalente, di definire D(Pi ) è quello di dire che
tale spazio è lo spazio di Sobolev H1 (R, dx).
Proposizione 5.5. Si consideri l’operatore Pi definito in (5.14) con dominio definito in (5.15).
Valgono i seguenti fatti.
(a) L’operatore Pi è autoaggiunto.
(b) Gli spazi D(Rn ) e S(Rn ) sono dei core per Pi .
In altre parole, le restrizioni di Pi a tali spazi date dagli operatori differenziali definiti da:
∂
f (x) ,
∂xi
∂
(A0 i f )(x) = −i~
f (x) ,
∂xi
(Ai f )(x) = −i~
(5.16)
(5.17)
con, rispettivamente, f ∈ D(Ai ) := D(Rn ) e f ∈ D(A0i ) := S(Rn ), sono essenzialmente
autoaggiunti e vale:
Ai = A0i = Pi .
147
Prova. Nel seguito indichiamo brevemente la derivata parziale rispetto alla coordinata i-esima
con ∂i e l’analoga derivata parziale in senso debole con w-∂i . D(Pi ) è composto dalle funzioni h
di L2 (Rn , dx) che ammettono derivata debole a quadrato integrabile e
Pi φ = −i~w-∂i φ .
Vogliamo provare che Ker(A∗i ± iI) = {0}. Ciò proverebbe, in virtù del teorema 5.3, che A∗i è
essenzialmente autoaggiunto, ossia Pi è autoaggiunto.
Proveremo che, se f ∈ L2 (Rn , dx) soddisfa
i(~w-∂i f ± f ) = 0 ,
(5.18)
allora f (x) = e±x/~ g(x) dove g è costante lungo xi . Quindi, affinché f ∈ L2 (Rn , dx), deve essere
g = 0 identicamente, da cui Ker(Pi ± iI) = {0}.
Per dimostrare quanto voluto, notiamo che se f soddisfa (5.18) allora vale:
€
Š
w-∂i e±xi /~ f = 0 ,
(5.19)
Ci riduciamo quindi a provare che vale il seguente fatto.
Lemma. Se h : Rn → C è localmente integrabile e soddisfa
w-∂i h = 0 ,
(5.20)
allora h coincide quasi ovunque con una funzione costante nella variabile xi .
Prova del lemma. Per fissare le idee supporremo n = 2 e i = 1 ed indicheremo con (x, y) le
coordinate di R2 . Il caso di Rn è una generalizzazione immediata; di fatto la dimostrazione è la
stessa: basta pensare inglobate nella variabile y le coordinate diverse da xi .
Assumiamo dunque che h localmente integrabile soddisfi la condizione (5.20), che scriveremo
esplicitamente:
Z
∂
h(x, y) g(x, y)dx ⊗ dy = 0 , per ogni g ∈ D(R) .
(5.21)
2
∂x
R
Sia f ∈ D(R2 ) e scegliamo a > 0 sufficientemente grande
in modo che valga suppf ⊂ [−a, a] ×
R
[−a, a]. Definiamo χ ∈ D(R) per cui suppχ = [−a, a] e R χ(x)dx = 1. Allora esiste una funzione
g ∈ D(R2 ) tale che
Z
∂
g(x, y) = f (x, y) − χ(x)
f (u, y)du .
∂x
R
Infatti basta considerare:
Z x
g(x, y) :=
f (u, y)du −
−∞
Z x
Z
χ(u)du
−∞
f (u, y)du .
R
Questa funzione è C ∞ per costruzione, la sua derivata in x coincide con
f (x, y) − χ(x)
Z
f (u, y)du .
R
148
(5.22)
Inoltre il supporto di g è limitato: se |y| > a, f (u, y) = 0 qualunque sia u per cui g(x, y) = 0
qualunque sia x. Se x < −a si annullano il primo integrale in (5.22) ed anche il secondo visto
che χ ha supporto in [−a, a]. Viceversa, se x > a vale:
Z +∞
g(x, y) :=
f (u, y)du − 1
−∞
Z
f (u, y)du = 0 ,
R
R
dove abbiamo tenuto conto delle condizioni suppχ = [−a, a] R χ(x)dx = 1. In definitiva g si
annulla fuori da [−a, a] × [−a, a]. Inserendo g in (5.21) ed usando il teorema di Fubini-Tonelli,
troviamo:
Z
Z Z
‹
h(x, y)f (x, y) dx ⊗ dy −
h(x, y)χ(x)dx f (u, y) du ⊗ dy = 0 .
R2
R2
R
Cambiando nome alle variabili:
Z §
Z
ܻ
h(x, y) −
h(u, y)χ(u)du f (x, y) dx ⊗ dy = 0 ,
R2
(5.23)
R
essendo f una funzione qualsiasi di D(R2 ). Si osservi che la funzione
(x, y) 7→ k(y) :=
Z
h(u, y)χ(u)du
R
è localmente integrabile su R2 , perché
(x, y, u) 7→ f (x, y)h(u, y)χ(u)
è integrabile su R3 per ogni f ∈ D(R2 ) (basta notare che |f (x, y)| ≤ |f1 (x)||f2 (y)| per f1 e f2
opportune in D(R)). La (5.23), valida per ogni f ∈ D(R2 ), implica immediatamente che
h(x, y) −
Z
h(u, y)χ(u)du = 0
R
quasi ovunque su R2 per il lemma di Du Bois-Reymond (vedi (1) in note dopo definizione 5.8).
In altre parole:
h(x, y) = k(y)
quasi ovunque su R2 . 2
Abbiamo conseguentemente provato che Pi è autoaggiunto e che Ai è essenzialmente autoaggiunto e il suo aggiunto (che coincide con la chiusura per (d) do proposizione 5.2) è Pi stesso.
Dato che D(Rn ) ⊂ S(Rn ), con la stessa procedura usata sopra, abbiamo che, che se φ ∈ D(A0 ∗i )
allora φ ammette derivata generalizzata e vale:
∗
A0 i φ = −i~ w −
149
∂
φ.
∂xi
Usando la stesa procedura seguita sopra, si prova immediatamente che A0i è essenzialmente autoaggiunto. Essendo Ai ⊂ A0i ed essendo anche Ai essenzialmente autoaggiunto, deve allora
valere che A0 ∗∗ = A0 = A∗∗ = A = Pi per (d) di proposizione 5.2. 2
Esiste un altro modo per introdurre l’operatore Pi .
Consideriamo la trasformata di Fourier-Plancherel F̂ : L2 (Rn , dx) → L2 (Rn , dk) vista nella sezione 3.6. Useremo le stesse notazioni usate in tale sezione. Definiamo nello spazio L2 (Rn , dk)
l’analogo dell’operatore Xi introdotto sopra, che però indicheremo con Ki dato che le coordinate di Rn vengono indicate con (k1 , . . . , kn ) nello spazio “di arrivo” della trasformata di
Fourier-Plancherel. Dato che F̂ una trasformazione unitaria, l’operatore F̂−1 Ki F̂ sarà autoaggiunto se definito sul dominio F̂−1 D(Ki ).
Proposizione 5.6. Se Ki è l’operatore posizione rispetto alla coordinata i-esima nello spazio
di arrivo della trasformata di Fourier-Plancherel F̂ : L2 (Rn , dx) → L2 (Rn , dk), vale:
Pi = ~ F̂−1 Ki F̂ .
Prova. Per provare ciò è sufficiente mostrare che i due operatori coincidono su un dominio in cui
sono essenzialmente autoaggiunti. Consideriamo lo spazio S(Rn ). Come sappiamo dalla sezione
3.6, la trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier su tale spazio e vale:
F̂(S(Rn )) = S(Rn ). Inoltre, direttamente dalle proprietà della trasformata di Fourier abbiamo
che, se g ∈ S(Rn ) e
Z
1
f (x) =
eik·x g(k) dk
(2π)n/2 Rn
allora
∂
1
−i~
f (x) =
∂xi
(2π)n/2
Z
Rn
eik·x ~kg(k) dk .
In altre parole abbiamo ottenuto che
Pi S(Rn ) = ~ F̂−1 Ki S(Rn ) F̂
Notiamo che Ki è essenzialmente autoaggiunto su S(Rn ) per la proposizione 5.4 per cui lo è anche
~ F̂−1 Ki S(Rn ) F̂ su S(Rn ) essendo F unitaria. In effetti tale operatore coincide con l’operatore
A0i introdotto nella proposizione 5.5. Dato che anche Pi S(Rn ) è essenzialmente autoaggiunto e
che le estensioni autoaggiunte di operatori essenzialmente autoaggiunti sono uniche e coincidono
con la chiusura dell’operatore, concludiamo che
Pi = ~ F̂−1 Ki S(Rn ) F̂ = ~ F̂−1 Ki S(Rn ) F̂ = ~ F̂−1 Ki F̂ .
Questo conclude la dimostrazione 2.
150
5.4
Criteri di esistenza ed unicità per le estensioni autoaggiunte.
Per concludere il capitolo presentiamo ancora alcuni utili criteri per stabilire se un operatore
ammette estensioni autoaggiunte.
5.4.1
La trasformata di Cayley e gli indici di difetto.
Lo strumento tecnico centrale per dimostrare questi criteri è la cosiddetta trasformata di Cayley che introduciamo nel seguito. Prima estendiamo il concetto di isometria agli operatori con
dominio più piccolo di tutto lo spazio di Hilbert.
Definizione 5.10. Un operatore U nello spazio di Hilbert H, con dominio dato dal sottospazio
D(U ), è detto isometria, se vale
(U x|U y) = (x|y) ,
per ogni coppia x, y ∈ D(U ).
Note
(1) È chiaro che se D(U ) = H la definizione di isometria data sopra individua gli operatori
isometrici nel senso della definizione 3.9.
(2) Per l’esercizio (1) in esercizi 3.2, la definizione di isometria data sopra equivale a richiedere
che U soddisfi ||U x|| = ||x||, per ogni x ∈ D(U ).
La trasformazione:
t−i
t+i
definisce una corrispondenza biunivoca tra la retta reale R ed il cerchio di raggio 1, centrato
nell’origine, nel piano complesso C, escluso il punto 1. Esiste una generalizzazione di tale corrispondenza che associa operatori isometrici ad operatori simmetrici. Questa corrispondenza, di
cui studieremo solo alcune proprietà, è la trasformata di Cayley.
t 7→
Teorema 5.4. Sia H uno spazio di Hilbert.
(a) Se A è un operatore simmetrico in H, l’operatore
V := (A − iI)(A + iI)−1 ,
(5.24)
detto trasformata di Cayley dell’operatore A, definisce un’isometria suriettiva dallo spazio
Ran(A + iI) allo spazio Ran(A − iI).
(b) Se vale (5.24) allora valgono i seguenti fatti:
(i) D(A) = Ran(I − V );
(ii) I − V è iniettivo e, su D(A) = Ran(I − V ), A si ricostruisce come:
A := i(I + V )(I − V )−1 .
151
(5.25)
(c) A operatore simmetrico in H è autoaggiunto se e solo se la sua trasformata di Cayley V è
un operatore unitario su H.
(d) Sia V operatore unitario su H. Se I − V è iniettivo, V è la trasformata di Cayley di un
operatore simmetrico in H.
Prova. (a) Per computo diretto, usando la simmetria di A e le proprietà di (anti-)linearità del
prodotto scalare, si verifica subito che, se f ∈ D(A):
||(A ± iI)f ||2 = ||Af ||2 + ||f ||2 .
(5.26)
Di conseguenza, se (A ± iI)f = 0, allora f = 0. Gli operatori A ± iI sono quindi iniettivi su
D(A) e quindi V è ben definita dallo spazio Ran(A + iI) allo spazio Ran(A − iA) ed è suriettiva
per costruzione. Proviamo che V è anche isometrica. Da (5.26) segue che, per ogni g ∈ D(A)
||(A − iI)g|| = ||(A + iI)g|| .
Se poniamo g = (A + iI)−1 f , per f ∈ Ran(A + iI), troviamo immediatamente:
||(A − iI)(A + iI)f || = ||f || ,
per cui V definisce un’isometria suriettiva dallo spazio Ran(A + iI) allo spazio Ran(A − iA).
(b) Per definizione, D(V ) è costituito dai vettori g = (A + iI)f per f ∈ D(A). Applicando V
a g troviamo V g = (A − iI)f . Aggiungendo e togliendo g = (A + iI)f membro a membro, si
ottengono le relazioni:
(I + V )g = 2Af ,
(5.27)
(I − V )g = 2if .
(5.28)
(5.28) mostra che (I − V ) è iniettiva in quanto, se (I − V )g = 0 allora f = 0 e quindi g =
(A + iI)f = 0. Possiamo allora scrivere, se f ∈ D(A):
g = 2i(I − V )−1 f .
Inoltre Ran(I − V ) = D(A). Applicando (I + V ) ad ambo membri ed usando (5.27) otteniamo:
Af = i(I + V )(I − V )−1 f
per ogni f ∈ D(A).
(c) Supponiamo che A = A∗ . Per il teorema 5.2, deve accadere che Ran(A+iI) = Ran(A−iI) =
H. Allora, per il teorema 5.4, V è isometrica su Ran(A + iI) = H ed è suriettiva, dato che la
sua immagine è Ran(A − iI) = H. Quindi V è unitaria.
Supponiamo ora che V sia un operatore unitario su H. Allora il suo dominio e la sua immagine
devono coincidere con H, ossia deve essere Ran(A + iI) = Ran(A − iI) = H. Questo equivale a
152
dire che A = A∗ per il teorema 5.2.
(d) Per ipotesi, c’è una corrispondenza biettiva z 7→ x, tra D(V ) = H e Ran(I − V ), data da
x := z − V z .
Definiamo l’operatore S : Ran(I − V ) → H, dato da:
Sx := i(z + V z) ,
se x = z − V z.
(5.29)
Se x, y ∈ D(S) = Ran(I − V ), allora x = z − V z e y = u − V u per qualche coppia z, u ∈ D(V ).
Dato che V è un’isometria, vale che:
(Sx|y) = i(z + V z|u − V u) = i(V z|u) − i(z|V u) = (z − V z|iu + iV u) = (x|Sy) ,
e quindi S è hermitiano. Per provare che è anche simmetrico, notiamo che D(S) = Ran(I − V )
è denso. Infatti [Ran(I − V )]⊥ = Ker(I − V ∗ ). Se non fosse Ker(I − V ∗ ) = {0}, ci sarebbe
u ∈ H, non nullo, tale che V ∗ u = u e allora, applicando V ad ambo membri, u = V u. Questo è
impossibile perché I − V è iniettivo per ipotesi.
Per concludere, proviamo che V è la trasformata di Cayley di S. La (5.29) può essere riscritta
nella forma
2iV z = Sx − ix , 2iz = Sx + ix , se z ∈ H.
Allora: V (Sx + ix) = Sx − ix per x ∈ D(S) e H = D(V ) = Ran(S + iI). Ma allora V è la
trasformata di Cayley di S perché vale: V (S + iI) = S − iI e quindi:
V = (S − iI)(S + iI)−1 .
Questo conclude la dimostrazione del teorema. 2
Nota. Dall’enunciato e dalla dimostrazione del teorema risulta che se A è simmetrico allora
Ker(A ± iI) = {0}. In generale però non accade anche che Ker(A∗ ± iI) = {0}! Quest’ultima
è una condizione molto più forte che equivale alla essenziale autoaggiunzione di A (se A è simmetrico) per il teorema 5.3.
Passiamo alle conseguenze del teorema 5.4 nello studio dell’esistenza di estensioni autoaggiunte
di un operatore simmetrico. Il primo dei teoremi a riguardo è il seguente, che introduce i cosiddetti indici di difetto.
Teorema 5.5. Sia A un operatore simmetrico sullo spazio di Hilbert H. Definiti gli indici di
difetto:
d± (A) := dim Ker(A∗ ± iI) ,
vale quanto segue:
(a) A ammette estensioni autoaggiunte se e solo se d+ (A) = d− (A);
(b) Se d+ (A) = d− (A), esiste una corrispondenza biunivoca tra estensioni autoaggiunte di A ed
153
operatori isometrici suriettivi da Ker(A∗ − iI) a Ker(A∗ + iI).
(A ammette tante estensioni autoaggiunte quanti sono gli operatori isometrici suriettivi suddetti
e, in particolare, A ammette più di una estensione autoaggiunta se d+ (A) = d− (A) > 0.)
Nota. Gli indici di difetto possono definirsi equivalentemente come:
d± (A) := dim [Ran(A ∓ iI)]⊥ ,
dato che Ker(A∗ ± iI) = [Ran(A ∓ iI)]⊥ .
Prova del teorema 5.5. Consideriamo la trasformata di Cayley V di A. Supponiamo che A
ammetta un’estensione autoaggiunta B. Sia U : H → H la trasformata di Cayley di B. È
immediato provare che U è un’estensione di V usando (5.24) e tenendo conto che (B + iI)−1
estende (A + iI)−1 e B − iI estende A − iI. Di conseguenza, U trasforma Ran(A + iI) in
Ran(A − iI). Essendo U unitario, si ha che y ⊥ Ran(A + iI) se e solo se U y ⊥ U (Ran(A + iI)).
In altre parole U ([Ran(A + iI)]⊥ ) = [Ran(A − iI)]⊥ . Per (d) di proposizione 3.6, questo
equivale a dire U (Ker(A∗ + iI)) = Ker(A∗ − iI). Dato che U è un’isometria, deve allora essere
dim Ker(A∗ + iI) = dim Ker(A∗ − iI) ossia d+ (A) = d− (A).
Mostriamo che, viceversa, se valed+ = d− , allora A ammette estensioni autoaggiunte e queste non
sono uniche se d+ (A) = d− (A) > 0. Sia V la trasformata di Cayley di A. Dato che V è limitata,
usando gli esercizi svolti in (3) e (4) in esercizi 3.1, possiamo estendere V , in modo unico, ad
un operatore isometrico da U : Ran(A + iI) → Ran(A − iI). Possiamo fare la stessa cosa per
V −1 , estendendola, in modo unico, ad un operatore isometrico da Ran(A − iI) a Ran(A + iI).
È chiaro che, per continuità, tale operatore deve essere U −1 : Ran(A − iI) → Ran(A + iI).
⊥
Ricordiamo che Ran(A ± iI) = [Ran(A ± iI)]⊥ = Ker(A∗ ∓ iI).
Nell’ipotesi di d+ (A) = d− (A), possiamo definire un operatore unitario U0 : Ker(A + iI) →
Ker(A − iI). Valendo le decomposizioni ortogonali di sottospazi chiusi
H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) ,
l’operatore
W : (x, y) := U ⊕ U0 :7→ (U x, U0 y) ,
con x ∈ Ran(A + iI) e y ∈ Ker(A∗ − iI) ,
è un operatore unitario su H. Inoltre I − W è iniettivo. Infatti, Ker(I − W ) consiste nelle coppie
(x, y) 6= (0, 0) con U x = x e U0 y = y: la prima equazione ammette solo la soluzione x = 0 perché
U è un’isometria e la seconda equazione implica che y ∈ Ker(A∗ +iI)∩Ker(A∗ −iI) che produce
subito y = 0. Possiamo allora applicare (d) del teorema 5.4: W è la trasformata di Cayley di
un operatore B simmetrico, che risulta essere autoaggiunto per (c) dello stesso teorema. Dato
che W estende U , B è un’estensione autoaggiunta di A. La scelta dell’operatore unitario U0
può essere fatta in più modi se d+ (A) = d− (A) > 0, tale scelta definisce diverse estensioni
autoaggiunte di A.
Mostriamo ora che la corrispondenza tra le estensioni autoaggiunte di A e gli operatori isometrici
154
suriettivi U0 è biunivoca. I punti (a) e (b) del teorema 5.4 implicano immediatamente che,
due operatori simmetrici sono diversi se e solo se le loro trasformate di Cayley sono diverse.
Consideriamo allora le estensioni autoaggiunte dell’operatore A. Ogni estensione autoaggiunta,
B, individua una trasformata di Cayley W unitaria che estende l’operatore U (definito sopra)
in un operatore unitario su H. Dato che
U : Ran(A + iI) → Ran(A − iI)
è isometrico suriettivo, che valgono le decomposizioni
H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) ,
e che infine W estende U , ciò può accadere solo se W determina un isometria suriettiva
U0 : Ker(A∗ − iI) → Ker(A∗ + iI). Due estensioni autoaggiunte B, B 0 distinte devono individuare due operatori U0 , U00 distinti, altrimenti le trasformate di Cayley W, W 0 dei due operatori
coinciderebbero e quindi gli operatori coinciderebbero a loro volta. Abbiamo ottenuto che l’applicazione che manda l’estensione autoaggiunta di A, B nell’associata isometria suriettiva U0 è
iniettiva. Questa applicazione è anche suriettiva, dato che, come visto sopra, la scelta dell’isometria suriettiva U0 determina un’estensione autoaggiunta di A: l’unica che ha trasformata di
Cayley data da W := U ⊕ U0 . 2
Una prima importante conseguenza del teorema 5.5 è la seguente.
Teorema 5.6. Un operatore simmetrico A sullo spazio di Hilbert H è essenzialmente autoaggiunto se e solo se ammette un’unica estensione autoaggiunta.
Prova. Se A è essenzialmente autoaggiunto allora ammette un’unica estensione autoaggiunta
come noto da (d) di proposizione 5.2. Per il teorema 5.5, se A è simmetrico ammette estensioni autoaggiunte solo se d+ = d− . In particolare, se ammette un’unica estensione autoaggiunta
deve essere d+ = d− = 0. Ma allora, per (b) del teorema 5.3, A è essenzialmente autoaggiunto. 2
5.4.2
Criteri di Von Neumann e di Nelson.
Un secondo teorema che enunceremo e dimostreremo ora è in realtà un corollario del teorema
5.4. Tale teorema è dovuto a von Neumann. Abbiamo bisogno di due definizioni preliminari.
Definizione 5.10. Siano X e X0 spazi vettoriali sul campo complesso dotati di prodotto scalare
hermitiano ( | )V e ( | )V 0 rispettivamente. Una funzione V : X → X è detta operatore antiunitario se soddisfa le seguenti proprietà:
(a) antilinearità : V (αx + βy) = αV x + βV y per ogni x, y ∈ X, α, β ∈ C;
(b) antiisometricità: (V x|V y)X0 = (x|y)X per ogni x, y ∈ X;
155
Nota. Notare la coniugazione complessa a secondo membro in (b). Si osservi che vale ||V z||X0 =
||z||X per ogni z ∈ X.
Definizione 5.11. Se (H, ( | )) è uno spazio di Hilbert, un operatore antiunitario C : H → H
è detto coniugazione oppure equivalentemente operatore di coniugazione se è involutivo,
cioè se soddisfa: CC = I .
Nota. Una coniugazione è definita su uno spazio vettoriale complesso con prodotto scalare hermitiano e, in generale, non è un’involuzione nel senso della definizione 3.8, che è invece definita
su un’algebra.
Teorema 5.7 (von Neumann). Sia A è un operatore simmetrico nello spazio di Hilbert H.
Se esiste una coniugazione C : H → H tale che valga C(D(A)) ⊂ D(A) ed anche
AC = CA .
allora A ammette estensioni autoaggiunte.
Prova. Mostriamo prima di tutto che C(D(A∗ )) ⊂ D(A∗ ) e che vale anche A∗ C = CA∗ . Infatti,
dalla definizione di aggiunto (A∗ f |Cg) = (f |ACg) per ogni f ∈ D(A∗ ) e g ∈ D(A). Usando il
fatto che C è antiunitaria: (CCg|CA∗ f ) = (CACg|Cf ). Dato che C commuta con A e CC = I,
si ha ancora (g|CA∗ f ) = (Ag|Cf )), ossia (CA∗ f |g) = (Cf |Ag) per ogni f ∈ D(A∗ ) e g ∈ D(A).
Dalla definizione di aggiunto, questo significa che Cf ∈ D(A∗ ) se f ∈ D(A∗ ) e CA∗ f = A∗ Cf .
Passiamo a provare l’esistenza delle estensioni autoaggiunte facendo uso del teorema 5.5. In
base a quanto appena provato, se A∗ f = if , applicando C ad ambo membri ed usando il fatto
che C sia anti lineare e commuti con A∗ , troviamo: A∗ Cf = −iCf . Per cui C è un’applicazione (iniettiva perché conserva la norma) da Ker(A∗ − iI) a Ker(A∗ + iI). Tale applicazione
è anche suriettiva in quanto, se vale A∗ g = −ig, definendo f := Cg troviamo che deve essere
A∗ f = +if e, riapplicando C a f (tenendo conto di CC = I), troviamo Cf = g. Quindi C è
un’applicazione biettiva da Ker(A∗ − iI) a Ker(A∗ + iI). Il fatto che sia anche antiisometrica,
e quindi preservi l’ortonormalità di vettori, comporta subito che trasformi biettivamente basi
hilbertiane in basi hilbertiane, in particolare quindi, conservandone la cardinalità. Allora deve
essere d+ (A) = d− (A). Per il teorema 5.4 vale la tesi. 2
Introduciamo ora l’utile criterio di Nelson. Sono necessarie alcune definizioni.
Definizione 5.11. Sia A operatore nello spazio di Hilbert H.
(a) Un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), è detto vettore C ∞
per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A).
(b) ψ ∈ C ∞ (A) è detto vettore analitico per A, se vale:
+∞
X
||An ψ|| n
t < +∞ ,
n!
n=0
156
per qualche t > 0;
(d) ψ ∈ C ∞ (A) è detto vettore di unicità per A, se l’operatore A Dψ è essenzialmente
autoaggiunto come operatore nello spazio di Hilbert Hψ := Dψ , dove Dψ è il sottospazio di H
delle combinazioni lineari (finite) vettori An ψ con n = 0, 1, 2 . . . .
Nota. Se ψ è un vettore analitico per A, la serie
+∞
X
||An ψ|| n
t ,
n!
n=0
converge per qualche t > 0. Allora, per i noti teoremi di convergenza sulle serie di potenze,
convergerà assolutamente ed uniformemente
+∞
X
||An ψ|| n
z ,
n!
n=0
per ogni z ∈ C con |z| < t. Ulteriormente convergeranno, per |z| < t, anche le serie delle derivate
di ogni ordine, cioè le serie:
+∞
X ||An+p ψ||
z n! ,
n!
n=p
per ogni fissato p = 1, 2, 3, . . .. Quest’ultimo fatto ha un’importante conseguenza, di verifica
immediata usando ripetutamente la disuguaglianza triangolare e la proprietà di omogeneità
della norma:
se ψ è un vettore analitico per A operatore nello spazio di Hilbert H, allora tutti vettori in Dψ
sono vettori analitici per A. Più precisamente, se la serie
+∞
X
||An ψ|| n
t ,
n!
n=0
converge per t > 0 e φ ∈ Dψ , allora la serie
+∞
X
||An φ|| n
s ,
n!
n=0
converge per ogni s ∈ C con |s| < t.
Vale la seguente proposizione nota anche come Lemma di Nussbaum.
Proposizione 5.7 (Nussbaum). Sia A operatore simmetrico nello spazio di Hilbert H. Se
D(A) contiene un insieme di vettori di unicità le cui combinazioni lineari formano un insieme
denso in H, allora A è essenzialmente autoaggiunto.
157
Prova. È sufficiente provare che gli spazi Ran(A ± iI) sono densi, per il teorema 5.3. Nelle
ipotesi fatte, dati φ ∈ H e > 0, ci sarà una combinazione lineare finita di vettori di unicità
P
ψi con ||φ − N
i=1 αi ψi || < /2. Dato che ψi ∈ Hψ e A Dψ è essenzialmente autoaggiunto, per
Š−1
€P
N
. Allora, posto
il teorema 5.3, esiste ηi ∈ Hψ con ||(A Dψ +iI)ηi − ψi || ≤ /2
j=1 |αj |
PN
P
α
η
e
ψ
:=
α
ψ
,
vale
η
∈
D(A)
e
η := N
i=1 i i
i=1 i i
||(A + iI)η − φ|| ≤ ||(A Dψ +iI)η − ψ|| + ||φ − ψ|| < .
Dato che > 0 è arbitrario, Ran(A + iI) è denso. La prova per Ran(A − iI) è analoga. 2
La proposizione precedente permette di dimostrare il teorema di Nelson la cui dimostrazione
richiede alcuni risultati di teoria spettrale per operatori autoaggiunti non limitati che vedremo
nel capitolo 8, ma che sono indipendenti dal teorema di Nelson stesso.
Teorema 5.8 (Nelson). Sia A un operatore simmetrico nello spazio di Hilbert H. Se D(A)
contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H,
allora A è essenzialmente autoaggiunto.
Prova. Per la proposizione 5.7 è sufficiente provare che, nelle ipotesi fatte, ogni vettore analitico
ψ0 per A è anche vettore di unicità per A. Notiamo che A Dψ0 è sicuramente un operatore
simmetrico in Hψ0 := Dψ0 , dato che è hermitiano e il suo dominio è denso in Hψ0 . Supponiamo
che A Dψ0 ammetta un’estensione autoaggiunta B in Hψ0 . (Nota: stiamo parlando di estensioni
autoaggiunte di A Dψ0 nello spazio di Hilbert Hψ0 , non in H!) Sia µψ la misura spettrale di
(B)
ψ ∈ Dψ0 rispetto a B (cfr (c) in teorema 8.4, cap 8) definita come µψ (E) := (ψ|PE ψ) per
(B)
ogni insieme di Borel E ⊂ σ(B) ⊂ R, dove PE è la misura a valori di proiezione associata
all’operatore autoaggiunto B. Dato che ψ0 è analitico,
+∞
X
||An ψ0 || n
t0 < +∞ ,
n!
n=0
per qualche t0 > 0. Quindi, per quanto detto nella nota dopo la definizione 5.11.
+∞
X
||An ψ|| n
t < +∞ ,
n!
n=0
per ogni t < t0 con t ≥ 0. Se z ∈ C e 0 < |z| < t0 allora:
n +∞
+∞
X z n Z
X
z n
n
x dµψ (x) =
1·|x
|dµ
(x)
≤
ψ
n! n! σ(B)
n=0 σ(B)
n=0
n=0
+∞
XZ
=
+∞
X tn
0
n!
n=0
n
||ψ|| ||B ψ|| = ||ψ||
158
+∞
X tn
0
n!
n=0
tn0
n!
‚Z
Œ1/2 ‚Z
dµψ (x)
σ(B)
||An ψ|| < +∞ .
Œ1/2
2n
x dµψ (x)
σ(B)
Il teorema di Fubini-Tonelli implica che, se 0 < |z| < t0 , possiamo scambiare il simbolo di serie
con quello di integrale in
Z
+∞
X zn
xn dµψ (x) .
σ(B) n=0 n!
Allora, se 0 ≤ |z| < t0 e se ψ appartiene al dominio di ezB (cfr definizione 9.2)
(ψ|ezB ψ) =
Z
σ(B)
ezx dµψ (x) =
+∞
X
+∞
X zn
zn n
x dµψ (x) =
n!
σ(B) n=0 n!
n=0
Z
Z
σ(B)
xn dµψ (x) =
+∞
X
zn
(ψ|An ψ).
n!
n=0
In particolare ciò accade sicuramente se z = it (con |t| < t0 ) dato che il dominio di eitB etutto
lo spazio di Hilbert:
+∞
X (it)n
(ψ|eitB ψ) =
(ψ|An ψ) .
(5.30)
n!
n=0
(Si osservi che la serie di potenze a secondo membro edi potenze e pertanto essa converge in
un disco aperto di raggio t0 , ciò definisce un prolungamento analitico della funzione a primo
membro per it rimpiazzato da z in tale disco anche se ψ non appartiene al dominio di ezB .)
Consideriamo un’altra estensione autoaggiunta di ADψ0 , B 0 . Ripetendo i ragionamenti di sopra
troviamo che, per |t| < t0 :
+∞
X (it)n
itB 0
(ψ|An ψ) .
(5.31)
(ψ|e ψ) =
n!
n=0
(5.30) e (5.31) implicano che, per ogni |t| < t0 e per ogni ψ ∈ Dψ0 :
0
0
(ψ|(eitB − eitB )ψ) = 0 .
Dato che Dψ0 è uno spazio denso in Hψ0 , concludiamo che (vedi l’esercizio svolto (2) in esercizi
3.2), per ogni |t| < t0 :
0
eitB = eitB .
Calcolando la derivata in senso forte per t = 0, per il teorema di Stone (cfr teorema 8.x cap 8),
risulta che (si tenga conto del fatto che t0 > 0 per ipotesi):
B = B0 .
Concludiamo che tutte le eventuali estensioni autoaggiunte di A Dψ coincidono. Mostriamo che
esiste almeno un’estensione autoaggiunta. Definiamo C : Dψ0 → Hψ0 come:
C:
N
X
an An ψ0 7→
n=0
N
X
an An ψ0 .
n=0
Si prova facilmente che C si estende in modo unico ad una coniugazione su Hψ0 , che indicheremo ancora con C. Inoltre, per costruzione CA Dψ0 = A Dψ0 C, per cui A Dψ0 ha estensioni
159
autoaggiunte per il teorema 5.7.
In conclusione, per ogni vettore analitico ψ0 , A Dψ0 deve essere essenzialmente autoaggiunto in
Hψ0 per il teorema 5.6, perché è simmetrico ed ammette esattamente un’estensione autoaggiunta. Abbiamo in questo modo provato che ogni vettore analitico ψ0 è anche vettore di unicità
per A. Questo conclude la dimostrazione. 2
Esempi 5.1.
(1) Un esempio tipico per applicare il criterio di von Neumann, è il caso dell’operatore di
rilevanza fondamentale in Meccanica Quantistica: H := −∆ + V dove ∆ è il solito operatore
laplaciano su Rn :
n
X
∂2
∆ :=
,
∂x2i
i=1
e V è una funzione localmente integrabile a valor reali.
Se definiamo il dominio di H come D(Rn ), risulta subito che H è un operatore simmetrico su L2 (Rn , dx). Definendo C come l’operatore antiunitario che associa ad ogni funzione
f ∈ L2 (Rn , dx) la funzione che punto per punto assume i valori complessi coniugati di f , è
chiaro che vale CH = HC, per cui H ammette estensioni autoaggiunte.
Precisando meglio la natura di V si riesce a provare che H è essenzialmente autoaggiunto.
∂
(2) L’operatore Ai := −i ∂x
definito su D(Rn ) (vedi proposizione 5.5), come sappiamo è esi
senzialmente autoaggiunto, quindi ammette estensioni autoaggiunte. Esiste una coniugazione
C che commuti con Ai ? (Si noti che potrebbe anche non esistere). La coniugazione usata in
(1) non commuta con Ai malgrado ammetta il suo dominio come spazio invariante. Un’altra
coniugazione è C : L2 (Rn , dx) → L2 (Rn , dx) definita da: (Cf )(x) := f (−x) (quasi ovunque) per
ogni f ∈ L2 (Rn , dx). È facile verificare che C(D(Rn )) ⊂ D(Rn ) e che CAi = Ai C.
(3) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx è la solita misura di Lebesgue,
d
e i consideri A := i dx
con dominio dato dallo spazio delle funzioni C 1 ([0, 1]) (cioè funzioni di
1
classe C ((0, 1)) che ammettono limiti finiti per la derivata prima in 0 e 1), che si annullano in 0
e in 1. Si verifica immediatamente che l’operatore è hermitiano, usando l’integrazione per parti
e tenendo conto che le funzioni si annullano agli estremi di integrazione annullando i termini
dovuti al bordo. Inoltre si può verificare che il dominio di A è effettivamente denso, per cui
l’operatore A è simmetrico. Mostriamo che A non è essenzialmente autoaggiunto. Infatti, la
condizione che g ∈ D(A∗ ) soddisfi A∗ g = ig ovvero A∗ g = −ig si scrive rispettivamente:
Z 1
g(x) f 0 (x) ± if (x) dx = 0
0
per ogni f ∈ D(A). Usando l’integrazione per parti, si verifica immediatamente che, le funzioni
di L2 ([0, 1], dx) definite da g(x) = ex e g(x) := e−x , soddisfano l’identità di sopra per ogni f di
classe C 1 ([0, 1]) che si annulli in 0 e in 1. Queste due ultime condizioni sono fondamentali per
verificare l’identità di sopra integrando per parti, in quanto le due funzioni esponenziali non si
annullano in 0 e 1. In virtù del teorema 5.3, A non è essenzialmente autoaggiunto.
Tuttavia esistono estensioni autoaggiunte a causa del teorema 5.6. Infatti la trasformazione
160
antilineare C : L2 ([0, 1], dx) → L2 ([0, 1], dx) definita da (Cf )(x) := f (1 − x) manda funzioni
C 1 ([0, 1]) che si annullano in 0 e 1 in funzioni C 1 ([0, 1]) che si annullano in 0 e 1 ed inoltre

‹
d
d
d
d
Ci f (x) = −i
f (1 − x) = i f (1 − x) = i (Cf )(x) .
dx
d(1 − x)
dx
dx
per cui CA = AC. Tali estensioni devono essere in numero maggiore di 1, altrimenti A sarebbe
essenzialmente autoaggiunto per il teorema 5.5, cosa che sappiamo essere falsa.
Si osservi che i risultati ottenuti non cambierebbero considerando differenti domini analoghi a
quello usato sopra, in particolare considerando come dominio quello delle funzioni C ∞ ([0, 1]) che
si annullano in 0 e 1, oppure quello delle funzioni C ∞ su [0, 1] a supporto compatto contenuto
in (0, 1).
(4) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx è la solita misura di Lebesgue, e
d
si consideri A := −i dx
con dominio dato dallo spazio delle funzioni C ∞ ([0, 1]) periodiche e con
derivate di ogni ordine periodiche, di periodo [0, 1]. L’integrazione per parti prova immediatamente che A è hermitiano. Le funzioni esponenziali en (x) := ei2πnx , per x ∈ [0, 1], con n ∈ Z
formano una base hilbertiana di H come segue da (1) in esempi 3.2. Queste funzioni sono tutte
contenute in D(A), per cui, essendo lo spazio generato da esse denso in H, D(A) è denso in H e
quindi A è simmetrico.
Ogni f ∈ H è in corrispondenza biunivoca con la successione dei coefficienti {fn }n∈Z ⊂ l2 (Z)
dello sviluppo
X
f=
fn en .
n∈Z
Abbiamo in tal modo definito un operatore unitario U : H → `2 (Z) tale che U : f 7→ {fn }n∈Z
(vedi teorema 3.6). Dalla teoria elementare delle serie di Fourier si verifica facilmente che:
U D(A)U −1 =: D(A0 ) è lo spazio delle successioni {fn } di l2 (Z) tali che, per ogni N ∈ N,
nN |fn | → 0 per n → +∞. Inoltre, se A0 := U AU −1 e {fn }n∈Z ∈ D(A0 ),
A0 : {fn }n∈Z 7→ {2πnfn }n∈Z .
Ragionando come per l’operatore Xi nella prova della proposizione 5.4, si verifica subito che



X

D(A0∗ ) = {gn }n∈Z ⊂ l2 (Z) |2πngn |2 < +∞ .


n∈Z
e, su questo dominio,
A0∗ : {fn } 7→ {2πnfn } .
Procedendo come nella prova della proposizione 5.4, si verifica subito che l’aggiunto di questo
operatore coincide con l’operatore stesso. Quindi A0∗ è autoaggiunto e A0 è essenzialmente
autoaggiunto. Dato che U è unitaria, concludiamo (lo si provi in dettaglio) che anche A è
essenzialmente autoaggiunto e che per la sua unica estensione autoaggiunta A, vale A = U A0 U −1 .
(5) L’ esempio (4) può essere trattato molto più rapidamente con il criterio di Nelson. Il dominio
161
di A contiene le funzioni en le cui combinazioni lineari sono dense in H := L2 ([0, 1], dx). Vale
anche Aen = 2πnen , per cui
+∞
X
X (2πn)k
||Ak en || k +∞
t =
(t)k = e2πnt < +∞ ,
k!
k!
k=0
k=0
per ogni t > 0. Quindi A è essenzialmente autoaggiunto.
Esercizi 5.2.
(1) Si studi l’hermiticità, la simmetria e l’essenziale autoaggiunzione in H = L2 ([0, 1], dx), dell’operatore −d2 /dx2 , con dominio dato dalle funzioni C ∞ ([0, 1]) e (i) periodiche oppure, (ii) che
si annullano agli estremi.
(2) Si dimostri che le estensioni autoaggiunte dell’operatore nell’esempio (3) sono parametrizzabili da un unico parametro reale.
Suggerimento. Si studino le dimensioni di Ker(A∗ ± iI) = Ran(A ∓ iI).
(3) Dimostrare che l’operatore in L2 (R, dx) dato da:
H := −
d2
+ x2 .
dx2
È essenzialmente autoaggiunto se D(H) := S(R).
Suggerimento. Cercare una base hilbertiana di L2 (R, dx) fatta di autovettori di H.
(4) Si consideri l’operatore di Laplace in Rn già considerato in (1) in esempi 5.1:
∆ :=
n
X
∂2
i=1
∂x2i
.
Si dimostri esplicitamente che ∆ è essenzialmente autoaggiunto sullo spazio di Schwarz S(Rn )
nello spazio di Hilbert L2 (Rn , dx) e dunque ammette una sola estensione autoaggiunta ∆.
b : L2 (Rn , dx) → L2 (Rn , dk) è la trasformata di Fourier-Plancherel (vedi
Si provi infine che, se F
sezione 3.6), vale:
€
Š
b F
b −1 f (k) := −k 2 f (k) ,
F∆
dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
Z
§
ª
2
n
4
2
f ∈ L (R , dk) k |f (k)| dk < +∞ .
Rn
Suggerimento. L’operatore ∆ è simmetrico su S(R3 ), pertanto possiamo usare il teorema 5.3
verificando la validità della condizione (b). Notando che lo spazio di Schwarz è invariante sotto
b dato dalla trasformata di Fourier-Plancherel come provato nell’azione dell’operatore unitario F
b F
b −1 .
Ò := F∆
la sezione 3.6, possiamo studiare la condizione (b) del teorema 5.3 per l’operatore ∆
162
Tale operatore è essenzialmente autoaggiunto su S(R3 ) se e solo se lo è ∆ su S(R3 ). L’azione di
Ò sulle funzioni di S(Rn ), si riduce alla semplice moltiplicazione per −k 2 = −(k 2 + k 2 + . . . + k 2 )
∆
n
1
2
che definisce, come si prova subito, un operatore autoaggiunto sul dominio naturale suddetto.
Ò ∗ usando la stessa
La condizione (b) del teorema 5.3 può allora essere verificata facilmente per ∆
n
n
definizione di aggiunto ed il fatto che S(R ) ⊃ D(R ). L’unicità dell’estensione autoaggiunta
per operatori essenzialmente autoaggiunti prova l’ultima parte dell’esercizio tenendo conto del
b è un operatore unitario.
fatto che F
(5) Ricordando che D(Rn ) indica lo spazio delle funzioni complesse infinitamente differenziabili
a supporto compatto su Rn , in riferimento all’esercizio precedente ed indicando con ∆ l’unica
estensione autoaggiunta di ∆ : S(Rn ) → L2 (Rn , dx), mostrare che D(Rn ) è un core per ∆. In
altre parole ∆D(Rn ) è essenzialmente autoaggiunto e ∆D(Rn ) = ∆.
Suggerimento. Per provare quanto richiesto basta dimostrare che (∆ D(Rn ) )∗ = ∆ (per∗
ché da ciò segue che, prendendo l’aggiunto, ∆D(Rn ) = ((∆ D(Rn ) )∗ )∗ = ∆ = ∆). Per provare l’identità detta notiamo che se ψ ∈ D((∆ D(Rn ) )∗ ) allora, per ogni ϕ ∈ D(Rn ), deve valere: (∆ϕ|ψ) = (ϕ|ψ 0 ), dove ψ 0 = (∆ D(Rn ) )∗ ψ ∈ L2 (Rn , dx). Passando in trasforb 0 = −k 2 Fψ,
b
mata di Fourier-Plancherel si vede subito che, nelle ipotesi fatte, Fψ
dato che
n
2
n
0
b
F(D(R )) è denso in L (R , dk). Abbiamo ottenuto che ψ ∈ D(∆) e ψ = ∆ψ e quindi:
(∆ D(Rn ) )∗ ⊂ ∆. Supponiamo viceversa che ψ ∈ D(∆). In questo caso, passando in trab ∈ L2 (Rn , dk) e, per ogni ϕ ∈ D(Rn ) possiamo scrivere:
sformata di Fourier-Plancherel −k 2 Fψ
R
R
2 Fψ
b Fψ
b = − dk(Fϕ)k
b
b = (ϕ|∆ψ). Per definizione di operatore aggiunto
(∆ϕ|ψ) = − dkk 2 (Fϕ)
∗
abbiamo trovato che: ψ ∈ D((∆D(Rn ) ) ) e (∆D(Rn ) )∗ ψ = ∆ψ. Abbiamo con ciò provato che
vale anche l’altra inclusione: (∆D(Rn ) )∗ ⊃ ∆.
(6) Ricordiamo che se A è un operatore su H, allora il commutante {A}0 è l’insieme degli operatori di B(H) tali che BA ⊂ AB.
Sia A : D(A) → H autoaggiunto. Sia T la trasformata di Cayley di A. Provare che ({A}0 )0 generata da A coincide con l’algebra di von Neumann ({T }0 )0 generata da {T } (vedi (3) in esempi
3.3)
163
Parte II
Il formalismo della Meccanica
Quantistica e la Teoria Spettrale
164
Capitolo 6
Brevi cenni di fenomenologia dei
sistemi quantistici e di Meccanica
Ondulatoria.
Nella prossima sezione daremo qualche idea generale di che cosa si intenda per sistema quantistico. Le parti successive di questo capitolo possono essere tralasciati dal lettore più matematico
non interessato alla genesi dei concetti fisici della MQ. In tali paragrafi passeremo rapidamente
ad enunciare in modo piuttosto sommario alcuni dei fatti sperimentali e dei modelli teorici “proto quantistici” che hanno infine condotto alla formulazione prima della meccanica ondulatoria
e poi della MQ vera e propria. Molti dettagli fisici si possono trovare in [CCP82]. Ometteremo completamente ogni discussione su alcune importanti tappe di questo percorso storico:
spettroscopia atomica, modelli atomici (Rutherford,Bohr, Bohr-Sommerfeld), esperimento di
Franck-Hertz, per i quali si rimanda a testi di fisica (es. [CCP82]). Il nostro succinto sommario
metterà solo a giustificare il modello di base per la teoria matematica della MQ che svilupperemo
partire dalla sezione 5.5.
6.1
Generalità sui sistemi quantistici.
Usiamo qui la parola sistema fisico in senso molto generico e discorsivo. È molto difficile definire
dal punto di vista fisico cosa sia un sistema quantistico. Possiamo cominciare a dire che più di
sistema fisico quantistico più opportuno parlare di sistema fisico dal comportamento quantistico
facendo questa distinzione da un punto di vista più fenomenologico-sperimentale che teorico.
All’interno della formulazione teorica della meccanica quantistica non esiste una precisa demarcazione tra sistemi classici e sistemi quantistici, se non una demarcazione imposta del tutto “a
mano” come vedremo più avanti, e tale argomento è oggi, ancora di più che in passato, oggetto
di discussione ed attività di ricerca teorica e sperimentale.
Parlando in modo del tutto generico, possiamo dire che hanno comportamento quantistico i
sistemi della microfisica, cioè molecole, atomi, nuclei e particelle subnucleari quando presi in165
dividualmente. Sistemi fisici costituiti da più copie di tali sottosistemi (per esempio cristalli )
possono avere a loro volta comportamento quantistico. Sistemi macroscopici hanno comportamento tipicamente quantistico solo in determinate condizioni difficili da realizzare (es. condensazione di Bose-Einstein, L.A.S.E.R.). In modo leggermente più preciso della rozza distinzione
tra microsistemi e macrosistemi esposta sopra, possiamo dire che, generalmente parlando, quando un qualsiasi sistema fisico si comporta quantisticamente l’azione caratteristica del sistema,
cioè il numero dalle dimensioni fisiche di Energia × Tempo (equivalentemente Quantità di Moto
× Lunghezza ovvero Momento angolare) ottenuto combinando opportunamente le dimensioni
fisiche caratteristiche del sistema (es. massa, velocita’, dimensioni lineari ecc...) nei processi
considerati è dell’ordine o inferiore al valore della costante di Planck
h = 6.6262 · 10−34 Js.
La costante di Planck e la parola quantum che caratterizza il nome della MQ vennero introdotte
per la prima volta da Planck nel 1900 nel suo lavoro sulla teoria del corpo nero per eliminare
il problema dell’energia totale teoricamente infinita di un sistema fisico costituito da radiazione
elettromagnetica in equilibrio termodinamico con le pareti di una cavità tenuta ad una temperatura fissata. La sua ipotesi teorica, rivelatasi poi esatta, prevedeva che la radiazione in potesse
scambiare energia con le pareti in quantità proporzionali alle frequenza degli oscillatori atomici
nelle pareti la cui costante universale di proporzionalità era la costante di Planck, tali quantità
vennero chiamate in latino quanta o quanti in italiano. Tornando al criterio per discriminare i
sistemi quantistici da quelli classici usando la costante h, consideriamo per esempio un elettrone
legato ad un nucleo di idrogeno. Un’azione caratteristica dell’elettrone si ottiene come, per esempio il prodotto della massa dell’elettrone (∼ 9 · 10−31 Kg), per una stima della velocità intorno
al nucleo (∼ 106 m/s) per il valore del raggio di Bohr dell’atomo di idrogeno (∼ 5 · 10−11 m).
Il calcolo fornisce un’azione caratteristica dell’ordine di 4.5 · 10−35 Js più piccolo dunque della
costante di Planck. Ci si aspetta quindi che l’elettrone nell’atomo abbia comportamento quantistico, come infatti accade. Si può fare un calcolo analogo per sistemi fisici macroscopici come
per esempio un pendolo di massa di qualche grammo e lunghezza dell’ordine del centimetro che
oscilla sottoposto alla forza di gravità. Un’azione caratteristica di questo sistema può essere
definita come il prodotto dell’energia cinetica massima per il periodo di oscillazione. Si trovano, per il sistema in questione valori dell’azione caratteristica di moltissimi ordini di grandezza
superiori ad h.
Osservazione. Una delle proprietà peculiare dei sistemi quantistici è il fatto che lo spettro
dei valori assumibili dalle grandezze fisiche attribuibili ad essi è generalmente diverso (almeno
in alcuni casi importanti) dallo spettro dei valori delle stesse grandezze assumibili da sistemi
macroscopici analoghi. In certi casi, la differenza è sorprendente perché si passa da uno spettro continuo di valori possibili nel caso classico, ad uno spettro discreto, nel caso quantistico.
È importante però precisare la discretezza dello spettro dei valori assumibili da una generica
grandezza fisica quantistica non è una caratteristica necessaria in MQ: esistono grandezze quantistiche con spettro di valori continuo anche in MQ. Questo fraintendimento è all’origine o a volte
conseguenza di una delle interpretazioni più frequenti, ma riduttiva, dell’aggettivo quantistica
166
nella parola Meccanica Quantistica.
6.2
Alcune proprietà particellari delle onde elettromagnetiche.
Le onde elettromagnetiche (e quindi in particolare la luce) in particolari circostanze sperimentali
rivelano comportamenti tipici di quelli di insiemi di particelle. Nella descrizione matematica di
tali comportamenti classicamente anomali è coinvolta la costante di Planck. Possiamo citare
due esempi di comportamento classicamente anomalo che hanno svolto un ruolo fondamentale
nello sviluppo iniziale della MQ per i corrispondenti modelli teorici proto quantistici costruiti
nel tentativo di darne una spiegazione: l’ effetto fotoelettrico e l’effetto Compton.
6.2.1
Effetto Fotoelettrico.
L’effetto fotoelettrico riguarda l’emissione di elettroni (corrente elettrica) da parte di metalli in
seguito ad illuminazione con un’onda elettromagnetica. Tale effetto era noto dalla prima metà
del secolo XIX e alcune sue caratteristiche risultavano del tutto inspiegabili alla luce della teoria
classica dell’interazione onde elettromagentica e materia [CCP82]. In particolare era inspiegabile
la presenza di un valore minimo della frequenza della luce usata per irraggiare il metallo al di
sotto del quale non si ha emissione elettronica. Il valore di tale soglia dipende dal metallo usato.
Una volta raggiunta la soglia, l’istantaneità del processo di emissione era del tutto inspegabile.
La teoria classica implica che l’emissione di elettroni ci deve essere indipendentemente dalla
frequenza usata pur di aspettare un tempo sufficientemente lungo in modo da fare assorbire agli
elettroni del metallo sufficiente energia da superare l’energia di legame con gli atomi.
Nel 1905 A. Einstein propose un modello, per l’epoca molto ardito, che rendeva conto di tutte le
proprietà anomale dell’effetto fotoelettrico1 con una precisione sperimentale notevole. Seguendo
Planck, l’ipotesi centrale di Einstein era che un onda elettromagnetica monocromatica cioé con
frequenza definita, che indicheremo con ν, sarebbe in realtà costituita da particelle materiali,
dette quanti di luce, ciascuna dotata di energia
E = hν .
(6.1)
In tale modello l’energia totale dell’onda sarebbe quindi pari alla somma delle energie dei singoli
quanti di luce.
Tutto ciò era ed è in contrasto totale con la teoria dell’elettromagnetismo classico in cui un’onda elettromagnetica è un sistema continuo la cui energia è legata all’ampiezza dell’onda invece
che alla frequenza. Quello che dunque accadrebbe nell’effetto fotoelettrico secondo il modello
di Einstein è che, illuminando il metallo con un onda monocromatica, ciascuno dei pacchetti
energetici associati all’onda possa essere assorbito da un elettrone esterno di ogni atomo del
metallo. Più precisamente l’ipotesi di Einstein per spiegare la fenomenologia sperimentale, era
1
Einstein ricevette il Premio Nobel proprio per tale lavoro.
167
che il pacchetto possa essere o assorbito completamente oppure non assorbito affatto, senza possibilità di assorbimenti parziali. Se e solo se l’energia del quanto è uguale o superiore all’energia
dell’elettrone di legame con l’atomo E0 (dipendente dal metallo e misurabile indipendentemente dall’effetto fotoelettrico), l’elettrone viene istantaneamente espulso, incamerando in energia
cinetica l’eventuale energia in eccesso del quanto. La frequenza ν0 := E0 /h individuerebbe cosı̀
la soglia sulla frequenza osservata sperimentalmente. Tale ipotesi si rivelò in perfetto accordo
con dati sperimentali
6.2.2
Effetto Compton.
L’effetto Compton risale al 1923. Esso riguarda la diffusione di onde elettromagnetiche di altissima frequenza – raggi X (> 1017 Hz) e raggi γ (> 1018 Hz) – da parte di materia estesa (gas,
liquidi e solidi). Schematizzando al massimo l’effetto sperimentale consiste in questo. Irraggiando la sostanza (che diremo ostacolo) con un’onda elettromagnetica piana propagante nella
direzione z e monocromatica di lunghezza d’onda λ, si osserva un’onda diffusa dall’ostacolo con
diverse componenti. Una componente è diffusa in tutte le direzioni ed ha la stessa lunghezza
d’onda della radiazione incidente, l’altra componente ha una lungezza d’onda leggermente superiore a λ, λ(θ) che dipende dall’angolo di osservazione θ. Se più precisamente, θ è definito come
l’angolo tra la direzione di propagazione dell’onda incidente z e la direzione di propagazione
dell’onda diffusa oltre l’ostacolo con lunghezza d’onda λ(θ), misurando θ a partire dall’asse z,
vale la relazione:
λ(θ) = λ + f (1 − cosθ)
(6.2)
dove2 la costante f ha le dimensioni di una lunghezza e si ottiene dai dati sperimentali. Il suo
valore è f = 0.024(±0.001) Å.
La teoria elettromagnetica classica era ed è assolutamente incapace di spiegare un tale fenomeno.
Tuttavia come Compton dimostrò, esso poteva essere spiegato assumendo le tre ipotesi seguenti
del tutto incompatibili con la teoria classica ma in accordo con l’ipotesi dei quanti di luce di
Einstein.
(a) L’onda elettromagnetica è costituita da particelle che trasportano energia, esattamente come
aveva ipotizzato Einstein, secondo la legge (6.1).
(b) Ogni quanto di luce possiede anche un’impulso
p := ~k ,
(6.3)
dove k è il vettore d’onda dell’onda elettromagnetica associata al quanto (vedi sotto).
(c) I quanti di luce interagiscano, in un processo d’urto (in generale in regime relativistico),
con gli atomi e con gli elettroni più esterni degli atomi dell’ostacolo soddisfacendo le leggi di
conservazione dell’impulso e dell’energia.
2
Ricordiamo che 1 Å= 10−10 m
168
A commento di (c), ricordiamo che il vettore vettore d’onda k associato ad un onda piana
monocromatica ha, per definizione, direzione e verso pari a quello di propagazione dell’onda e
modulo dato da 2π/λ, dove λ è la lunghezza d’onda dell’onda. Equivalentemente, se ν è la
frequenza dell’onda,
|k| = 2π/λ = 2πν/c ,
(6.4)
dove si è usata la ben nota relazione
νλ = c ,
(6.5)
valida per le onde elettromagnetiche ed essendo c = 2.99792 · 108 m/s è la velocità della luce.
Possiamo dare qualche dettaglio in più per il lettore interessato. Le leggi di conservazione dell’energia
e dell’impulso da usarsi in regime relativistico, cioè quando (qualcuna) delle velocità coinvolte sono
dell’ordine di c, si scrivono rispettivamente, nelle ipotesi fatte:
me c2 + hν
=
~k
=
me c2
+ hν(θ) ,
1 − v 2 /c2
m v
p e
+ ~k(θ) .
1 − v 2 /c2
p
(6.6)
(6.7)
A primo membro compaiono le quantità precedenti dell’urto a secondo membro quelle successive all’urto.
me = 9.1096 · 10−31 Kg è la massa dell’elettrone. L’elettrone è pensato in quiete prima dell’urto con il
quanto di luce. In seguito all’urto il quanto di luce viene diffuso nella direzione individuata da θ, mentre
l’elettrone acquista velocità v. Il vettore d’onda precedente all’urto, k, è quindi nella direzione (generica
ma fissata) z mentre il vettore d’onda del quanto di luce dopo l’urto, k(θ), forma un angolo θ con k.
Dalla (6.7), tenendo conto della definizione del vettore d’onda, si ricava subito
m2e c2
h2 ν 2
h2 ν(θ)2
hν hν(θ)
= 2 +
−2
cos θ .
2
2
1 − v /c
c
c2
c
c
Eliminando ν tra la relazione appena ottenuta e la (6.6) si ricava immediatamente
ν(θ) = ν −
hνν(θ)
(1 − cosθ) .
me c2
(6.8)
Tenendo conto della relazione (6.1) e ν = c/λ, si ricava facilemente la (6.2) nella forma
λ(θ) = λ +
h
(1 − cosθ)
me c
(6.9)
da cui si evince che f = h/(me c) il cui valore numerico coincide proprio con quello ottenuto sperimentalmente quando si sostituiscono i valori numerici di h, me e c. Si osservi anche, che nel limite formale
per me → +∞, la (6.9) fornisce λ(θ) → λ. Ciò porta anche a spiegare la componente dell’onda diffusa
isotropicamente senza variazione della lunghezza d’onda (rispetto alla lunghezza d’onda della radiazione
incidente), come dovuta a quanti di luce che interagiscono con particelle di massa molto più grande di
quella elettronica (un atomo del materiale o tutto l’ostacolo nel suo complesso).
169
Osservazione. Il modello di Einstein e quello di Compton spiegano perfettamente l’effetto
fotoelettrico e la formula (6.2) in termini quantitativi e qualitativi. Tuttavia devono considerarsi
come modelli ad hoc slegati ed addirittura in contrasto con il corpus della fisica teorica dell’epoca:
l’idea della costituzione corpuscolare delle onde elettromagnetiche e quindi della luce, come
noto dai tempi di Newton e Huygens, non può spiegare effetti ondulatori notissimi della luce
quali i fenomeni di interferenza e diffrazione. In qualche modo il modello ondulatorio e quello
corpuscolare della luce (onde elettromagnetiche) devono coesistere nella realtà, ma ciò non è
possibile nel paradigma della fisica classica. Ciò invece accade nella formulazione relativistica
completa della MQ introducendo il concetto di fotone.
6.3
Cenni di Meccanica ondulatoria.
In queste dispense non ci occuperemo più delle proprietà quantistiche della luce che richiederebbero uno sviluppo ulteriore del formalismo della MQ che presenteremo. Le idee esposte sopra sui
primi tentativi di descrizione quantistica della luce furono però utili, ribaltando il punto di vista,
per arrivare alla formulazione della meccanica ondulatoria, il primo passo verso la formulazione
della MQ.
La meccanica ondulatoria è una delle due prime versioni un pò rudimentali della MQ per particelle dotate di massa3 . Nel seguito ci occuperemo molto succintamente di esporre alcune idee
portanti della meccanica ondulatoria che mettono in luce alcuni punti fondamentali e generali
che useremo per costruire il formalismo proprio della MQ. In particolare tralasceremo alcuni risultati storicamente connessi quali l’equazione stazionaria di Schrödinger e la spiegazione,
tramite essa, dello spettro energetico dell’atomo di idrogeno. Torneremo più avanti su questi
argomenti dopo avere costruito il formalismo.
6.3.1
Onde di de Broglie.
Un quanto di luce di Einstein e Compton è associato ad un’onda elettromagnetica piana monocromatica di numero d’onda k = p/~ e pulsazione ω = E/~, dove lo ricordiamo, la pulsazione è
semplicemente 2π volte la frequenza. Ogni componente dell’onda piana elettromagnetica (una
componente del campo elettrico o magnetico che vibra perpendicolarmente a k) ha allora la
forma di un’onda scalare:
ψ(t, x) = Aei(k·x−tω) .
(6.10)
In realtà solo la parte reale dell’onda di sopra ha senso fisico. Un onda a valori complessi invece
che reali del tipo di sopra ha comunque interesse fisico perché appare nella decomposizione di
Fourier (vedi sezione 3.6) di una soluzione generale dell equazioni del campo elettromagnetico
(equazioni di Maxwell) e più generalmente dell’equazione di d’Alembert. In termini di impulso
3
L’altra versione sviluppata parallelamente da Heisenberg consisteva nella cosiddetta meccanica delle matrici
[CCP82] della quale non ci occuperemo.
170
e energia del quanto di luce, la stessa onda può riscriversi:
i
ψ(t, x) = Ae ~ (p·x−tE) .
(6.11)
Dove lo si noti compaiono solo l’impulso e l’energia del quanto di luce. Nel 1924 de Broglie fece
un’ipotesi estremamente rivoluzionaria: come alle onde elettromagnetiche si potevano associare,
almeno in certi contesti sperimentali, delle particelle, si doveva poter associare delle onde alle
particelle materiali della stessa forma (6.11) dove ora però, p e E sono rispettivamente l’impulso
e l’energia (cinetica) della particella. Non era affatto chiara la natura di tali fantomatiche onde.
La lunghezza d’onda associata ad una particella di impulso p:
λ = h/|p| ,
(6.12)
viene detta lungezza d’onda di de Broglie della particella.
Nel 1927 si ebbe evidenza sperimentale di onde in qualche modo associate al comportamento di
particelle materiali, più precisamente elettroni, da parete di due distinti esperimenti da parte di
Davisson e Germer e G.P. Thompson.
Senza entrare nei dettagli degli esperimenti diremo solo quanto segue. È noto che quando un’onda (elettromagnetica, sonora ecc...) incontra un ostacolo con una struttura interna di dimensioni
tipiche dell’ordine o superiori alla lunghezza d’onda dell’onda incidente, l’onda diffusa dall’ostacolo produce un fenomeno detto diffrazione: le varie parti interne dell’ostacolo agiscono sull’onda
creando interferenza costruttuva e distruttiva, in modo che l’onda diffusa produca, su uno schermo su cui incide, delle figure costituite da zone d’ombra e zone di maggiore intensità (cioè più
chiare nel caso di onde luminose). Tali figure si dicono figure di diffrazione. Se l’ostacolo è un
cristallo, dalle figure di diffrazione si può risalire alla struttura interna di cristalli.
Osservazione. È importante sottolineare che il fenomeno della diffrazione è strettamente dovuto alla natura ondulatoria dell’onda (al fatto che ci sia qualcosa che oscilli ed al principio di
sovrapposizione). Non è possibile produrre figure di diffrazione sparando delle particelle, che
soddisfino le usuali leggi della meccanica classica, su qualsivoglia ostacolo.
Tornando agli esperimenti di Davisson e Germer e G.P. Thompson, essi ottennero figure di diffrazione prodotte da fasci di elettroni sparati su cristalli. Più precisamente le figure di diffrazione
si produssero su uno schermo dall’accumularsi delle tracce puntiformi degli elettroni diffusi da
un cristallo di passo reticolare dell’ordine di 1 Å. Il fatto ancora più notevole che corroborava
l’ipotesi di de Broglie era il fatto che, negli esperimenti detti, le figure di diffrazione apparivano
solo se la lunghezza di de Broglie degli elettroni era dell’ordine di 1Å o inferiore, esattamente
come nel fenomeno della diffrazione prodotto da onde “usuali” su cristalli con passo reticolare
di 1 Å.
6.3.2
Funzione d’onda di Schrödinger e interpretazione probabilistica di Born.
Nel 1926, in due famosi e geniali articoli, Schrödinger prese sul serio l’ipotesi di de Broglie
e fece un’assunzione più precisa: quella di associare ad una particella materiale non un’onda
171
piana come (6.11), ma un pacchetto d’onde costituito dalla sovrapposizione (nel senso della
trasformata di Fourier, vedi sezione 3.6) di onde piane di de Broglie. Nel caso di particelle libere
cioé la cui energia è data dalla sola energia cinetica, l’onda di Schrödinger si scrive:
Z
ψ(t, x) =
R3
i
e ~ (p·x−tE(p))
ψ̂(p) d3 p ,
(2π~2 )3/2
(6.13)
dove E(p) := p2 /(2m) essendo m la massa della particella. Nei due articoli Schrödinger osservò
che l’ottica geometrica si basa su un’equazione, detta equazione dell’iconale, che ha una struttura formalmente analoga all’equazione di Hamilton-Jacobi per una particella della meccanica
classica. Schrödinger tentò allora di determinare un equazione fondamentale di una meccanica
ondulatoria per la materia rispetto alla quale l’equazione di Hamilton-Jacobi della meccanica
giocasse lo stesso ruolo approssimato che equazione dell’iconale (ottica geometrica) gioca rispetto all’equazione di d’Alembert (ottica ondulatoria) [CCP82]. In questo modo pervenne alla
notissima equazione di Schrödinger che gioca un ruolo centrale nella MQ. Noi ricaveremo tale
equazione più avanti dopo avere costruito il formalismo. Nel caso generale di una particella
soggetta ad una forza dovuta ad un potenziale U , f (t, x) = −∇U (t, x), l’equazione era
–
™
∂ψ(t, x)
~2
i~
= −
∆ + U (t, x) ψ(t, x)
(6.14)
∂t
2m
dove ∆ := ∇ · ∇ è l’operatore di Laplace in R3 .
L’onda di de Broglie-Schroedinger ψ venne chiamata funzione d’onda della particella a cui è
associata.
L’interpretazione oggi accettata della funzione d’onda ψ – almeno nell’interpretazione standard
(“di Copenhagen”) del formalismo della MQ – venne data Born sempre nel 1926:
fissato t ∈ R,
|ψ(t, x)|2
ρ(t, x) := R
2 3
R3 |ψ(t, y)| d y
è la densità di probabilità di trovare la particella nel punto x quando si esegua un esperimento
per determinarne la posizione.
L’interpretazione di Born che si rivelò in accordo con l’esperienza, era già in sostanziale accordo
con i risultati degli esperimenti di Davisson e Germer e G.P. Thompson in cui le tracce delle particelle sullo schermo si addensavano nelle regioni in cui ρ(t, x) > 0 ed erano assenti nelle regioni
in cui ρ(t, x) = 0 dando luogo alle figure di diffrazione. (Il fatto che le onde piane di de Broglie
non abbiano diretto significato fisico alla luce dell’interpretazione di Born avendo integrale del
modulo quadro divergente è fisicamente irrilevante. Le onde piane monocromatiche usate per
interpretare i risultati sperimentali secondo l’ipotesi di de Broglie possono essere approssimate
a piacimento da pacchetti a quadrato sommabile con una distribuzione ψ̂(p) arbitrariamente
stretta attorno ad un valore p0 che determina con approssimazione piccola a piacere la lunghezza d’onda λ0 = |p0 |/h di de Broglie degli elettroni.)
172
Osservazioni.
(1) Dal punto di vista matematico, l’assunzione dell’interpretazione di Born richiede che abbiano senso fisico solo le funzioni d’onda a quadrato sommabile e non quasi ovunque nulle, cioè gli
elementi non nulli di L2 (R3 , d3 x): uno spazio di Hilbert entra in gioco per la prima volta, nella
costruzione della MQ.
(2) Assumendo l’interpretazione di Born si deve concludere che, quando non viene eseguito alcun
esperimento per determinarne la posizione, la particella associata alla funzione d’onda ψ, non
può evolvere temporalmente secondo le leggi della meccanica classica: se seguisse una traiettoria
regolare come prescritto dalla meccanica classica, la funzione |ψ|2 associata dovrebbe essere quasi ovunque nulla fuori dalla traiettoria. Tuttavia avendo ogni traiettoria regolare in R3 misura
nulla, |ψ|2 dovrebbe essere nulla quasi ovunque in R3 portando ad una contraddizione. In altre
parole, quando non si esegue un esperimento per determinare la posizione della particella, la
particella non deve considerarsi un oggetto classico, ma la sua evoluzione temporale è descritta
dall’evoluzione dell’onda ψ (secondo l’equazione di Schrödinger).
(3) Se si ammette, come nell’interpretazione di Copenhagen, che la funzione d’onda ψ sia una
descrizione completa dello stato fisico della particella, si deve concludere che la posizione della particella sia fisicamente indefinita prima di eseguire un esperimento che la determini e che
venga fissata all’atto dell’esperimento in modo probabilistico. Non è corretto pensare che l’uso
di una descrizione probabilistica sia dovuto ad insufficiente conoscenza dello stato del sistema:
“la posizione esiste ma noi non la conosciamo”. Nell’interpretazione di Copenhagen la posizione non esiste fino a quendo non si esegue un esperimento per determinarla e lo stato della
particella (l’informazione massima sulle sue proprietà fisiche variabili nel tempo) è descritto dall’onda ψ. Nella meccanica ondulatoria la particella quantistica ha dunque una duplice natura
di onda-corpuscolo, ma le due nature non vengono mai in contrasto perché non si manifestano
mai contemporaneamente.
6.4
Principio di indeterminazione di Heisenberg.
Quando cerchiamo di valutare sperimentalmente il valore di qualsiasi grandezza definita per un
sistema fisico interagendo con il sistema stesso, possiamo alterare lo stato del sistema. Tuttavia
nella descrizione classica, in linea di principio possiamo rendere piccola a piacere la perturbazione
apportata allo stato. Nel 1927 Heisenberg si rese conto che le ipotesi di Planck, Einstein, Compton, de Broglie avevano una conseguenza (anche epistemologica) notevole in questo contesto. In
termini quantitativi il principio di Heisenberg stabilisce che, considerado sistemi quantistici e
particolari grandezze, non è sempre possibile rendere piccola a piacere la perturbazione apportata allo stato del sistema: la costante di Planck rappresenta un limite invalicabile per il prodotto
delle indeterminazioni di alcune coppie di grandezze.
Più precisamente, esaminando vari esperimenti ideali in cui si assumeva qualcuna delle ipotesi
173
dei modelli di Planck, Einstein, Compton e de Broglie, Heisenberg arrivò alla conclusione che:
cercando di determinare la posizione o l’impulso di una particella lungo un fissato asse x, se ne
altererà l’impulso o rispettivamente la posizione lungo lo stesso asse in modo tale che il prodotto
della minima larghezza possibile delle due incertezze ∆x e ∆p con cui alla fine risultano essere
note le due grandezze soddisfi:
∆x∆p & h ,
(6.15)
senza poter andare sotto tale stima. Se la posizione e l’impulso sono valutiati lungo assi reciprocamente ortogonali il prodotto delle incertezze può essere arbitrariamente piccolo.
(6.15) esprime il principio di indeterminazione di Heisenberg per la posizione e l’impulso.
Una relazione analoga vale per l’incertezza ∆E con cui è determinata l’energia E di una particella
e l’incertezza ∆t con cui si determina il tempo t in cui viene fatta la misura dell’energia4
∆E∆t & h .
(6.16)
A titolo di esempio consideriamo l’esperimento ideale in cui si cerca di determinare la posizione X di
un elettrone di momento inizialmente noto P illuminandolo con un fascetto di luce monocromatica di
lughezza d’onda λ che si propaga nella direzione x. Immaginiamo di voler leggere la posizione su uno
schermo parallelo all’asse X tramite una lente interposta tra l’asse X e lo schermo. Un quanto di luce
che ha interagito con l’elettrone produrrà un’immagine X 0 colpendo schermo dopo avere attraversato la
lente. A causa dell’apertura finita della lente è non possibile conoscere con esattezza la direzione lungo la
quale è stato diffuso il quanto di luce che produce l’immagine X 0 sullo schermo. Dall’ottica ondulatoria
sappiamo che in X 0 si avrà una figura di diffrazione che permetterà di raggiungere nella misura della
coordinata X una accuratezza non più piccola di
∆X &
λ
,
sin α
dove α è il semi angolo sotto il quale da X si vede la lente. Al quanto di luce corrisponde l’impulso h/λ,
per cui l’incertezza della componente Px del quanto di luce diffuso sarà data approssimativamente da
h(sin α)/λ. L’impulso totale del sistema particella, quanto di luce, microscopio, dovrà rimanere costante
per cui l’incertezza nella componente x della quantità di moto della particella dopo la diffusione del
quanto di luce dovrà essere uguale alla corrispondente incertezza per il quanto di luce stesso:
∆Px &
h
sin α .
λ
Il prodotto delle due indeterminazioni della particella lungo l’asse x risulta essere dunque al minimo
∆X∆Px & h .
4
la relazione d’indeterminazione tempo-energia ha uno status ed una interpretazione molto più problematico
delle analoghe relazioni posizione-impulso.
174
Osservazione. Il principio di Heisenberg, a questo livello, ha la stessa (in)consistenza logica dei
modelli proto quantistici usati euristicamente per arrivarne alla formulazione. Deve essere visto
più come una ipotesi di lavoro per costruire una nuova nozione di particella in cui le nozioni di
posizione ed impulso classici abbiano senso solo entro limiti fissati dal principio stesso: gli stati
fisici di una particella quantistica devono essere tali per cui l’impulso o la posizione non siano
definite e definibili contemporaneamente.
Val la pena di ricordare che nella formulazione finale della MQ, come vedremo, il principio di
Heisenberg diventa un teorema.
6.5
Le grandezze compatibili ed incompatibili.
Indipendentemente dal principio di Heisenberg, la fenomenologia quantistica mostra che ci sono
coppie grandezze A e B che risultano essere incompatibili. Questo significa che, se si misura
prima la grandezza A sul sistema ottenendo il risultato a e quindi – immediatamente dopo – si
misura B ottenendo il risultato b, una successiva misura di A – vicina temporalmente a piacere
a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce
un risultato a1 generalmente differente da a. Lo stesso fenomeno appare scambiando il ruolo di
A e B.
Coppie di grandezze incompatibili sono la componente della posizione e dell’impulso lungo un
fissato, tali grandezze soddisfano anche il principio di Heisenberg. Questi due fatti sono connessi,
ma il legame può essere spiegato chiaramente solo dopo avere costruito il formalismo completo.
In generale coppie di grandezze incompatibili non soddisfano il principio di Heisenberg.
Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente.
È importante sottolineare che la fenomenologia quantistica mostra che esistono anche coppie di
grandezze A0 , B 0 compatibili. Questo significa che, se si misura prima la grandezza A sul sistema
ottenendo il risultato a0 e quindi – immediatamente dopo – si misura B 0 ottenendo il risultato
b0 , una successiva misura di A0 – vicina temporalmente a piacere a quella di B 0 (in modo da
non poter imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a0 . Lo
stesso fenomeno appare scambiando il ruolo di A0 e B 0 . In particolare ogni grandezza fisica A
è compatibile con se stessa e con ogni funzione di A (per esempio la posizione di una particella
lungo una retta ed il quadrato del numero che individua tale posizione.)
Un esempio di coppie di grandezze incompatibili che non soddisfano il principio di Heisenberg
sono due componenti diverse dello spin di una particella. Lo spin dell’elettrone (e poi di tutte le
particelle nucleari e subnucleari) fu introdotto da Goudsmit e Uhlembeck nel 1925 per spiegare
alcune proprietà “anomale”, il cosiddetto effetto Zeeman anomalo, degli spettri energetici (righe
spettrali) degli atomi di metalli alcalini. In senso semi classico lo spin rappresenta il momento
angolare intrinseco dell’elettrone che, per certi aspetti, può essere pensato come dovuto ad un
incessante moto rotatorio dell’elettrone attorno al proprio centro di massa. Tuttavia questa
175
interpretazione è molto fuorviante è non deve essere presa alla lettera. Un significato profondo
allo spin può solo essere dato nel contesto della definizione, dovuta a Wigner, di particella elementare quantistica come sistema elementare invariante sotto l’azione del gruppo di Poincaré.
Allo spin è associato un momento magnetico intrinseco che è alla fine il responsabile dell’effetto Zeeman anomalo osservato. Tuttavia lo spin è una grandezza vettoriale con caratteristiche
peculiari quantistiche che lo differenziano completamente da un momento angolare classico e lo
fanno rientrare nella categoria dei momenti angolari quantistici. La prima differenza è nei valori
assumibili
dal modulo dello spin. Nell’unità di misura ~ tali valori sono sempre numeri del tipo
È
s(s + 1) dove s è un intero fissato dipendente dal tipo di particella, s = 1/2 per l’elettrone.
Ciascuna delle tre componenti dello spin rispetto ad una terna di assi destrorsa ortonormale
può assumere ciascuno dei 2s + 1 valori discreti −s, −s + 1, . . . , s − 1, s. Le tre componenti
dello spin risultano essere grandezze fisiche incompatibili nel senso detto sopra: la misurazione alternata e fatta a tempi vicinissimi di due differenti componenti dello spin fornisce valori
sempre differenti per tali componenti dello spin. È importante precisare che la stessa incompatibilità si ha anche per le componenti del momento angolare orbitale e totale di una particella.
Un esempio di coppie di grandezze compatibili per una particella quantistica sono la componente
x dell’impulso e la componente y del vettore posizione. Risulta anche che ogni grandezza fisica
è compatibile con se stessa. Tale fatto non è per nulla banale.
176
Capitolo 7
Il formalismo matematico di base
della MQ: proposizioni, stati
quantistici e osservabili.
La Matematica in Fisica è come il maiale: non si butta mai via niente.
In questo capitolo presenteremo la struttura matematica generale della Meccanica Quantistica.
La procedura, essenzialmente dovuta a von Neumann e qui presentata in veste più moderna
tenendo conto del risulatato di Gleason (vedi sotto), sarà un’estensione della meccanica (hamiltoniana) classica che tenga conto dei risultati sperimentali sulla natura dei sistemi quantistici
discussa nel capitolo precedente.
Nella prima sezione riassumeremo i risultati presentati nel capitolo precedente, rimarcando alcuni punti fondamentali che giocheranno un ruolo fondamentale nel seguito.
Nella sezione successiva riesamineremo alcuni aspetti della formulazione della meccanica di Hamilton da un punto di vista insiemistico e logico-formale insieme, mostrando che esiste un’intepretazione dei fondamenti della teoria in cui le proprosizioni elementari sul sistema fisico sono
descritte da una σ-algebra, mentre gli stati sono descrivibili in termini di misure (eventualmente
di Dirac) su tale σ-algebra.
Nella terza sezione, mostreremo come si possa modificare la struttura delineata nel caso classico
fino ad introdurre una descrizione della fenomenologia quantistica. In questo caso la σ-algebra
è sostituita dal reticolo dei proiettori su un opportuno spazio di Hilbert e gli stati da una nozione
generalizzata di misura σ-additiva sul reticolo dei proiettori.
Nella quarta sezione enetremo nel cuore della struttura mostrando, tramite il teorema di Gleason,
che le misure generalizzate di cui sopra non sono altro che operatori di classe traccia, positivi
con traccia unitaria. In questo modo introdurremo lo spazio convesso degli stati quantistici,
identificando gli stati puri (o raggi ) con gli elementi estremali del corpo convesso. Discuteremo
inoltre la descrizione formale della nozione di proposizioni compatibili, del processo di misura
e l’esistenza di regole di superselezione con la decomposizione dello spazio di Hilbert in settori
177
coerenti. Faremo qualche accenno alle interessanti logiche quantistiche ed alle recenti critiche
sollevate sulla loro utilità in fisica.
Nella quinta ed ultima sezione ci dedicheremo alla costruzione euristica della nozione di osservabile, vista come insieme di proposizioni elementari che costituiscono una misura a valori di
proiezione (PVM) sullo spazio di Hilbert del sistema fisico. Tale costruzione fornirà anche una
motivazione fisica alla dimostrazione del teorema spettrale, che sarà provato successivamente.
Daremo anche qualche accenno ad una generalizzazione della nozione di osservabile in termini
di misure a valori di operatori positivi (POVM), enunciando il teorema di interallacciamento di
Neumark.
7.1
Le idee che stanno alla base dell’interpretazione standard
della fenomenologia quantistica.
Cerchiamo di riassumere alcuni punti cruciali del comportamento dei sistemi quantistici.
QM1. (i) I risultati delle misure di grandezze fisiche su sistemi quantistici, di cui è fissato lo stato, hanno esiti probabilistici. Non è possibile prevedere l’esito della misura, ma solo (per esempio
per quanto riguarda la posizione di una particella nell’interpretazione di Born) la probabilità che
l’esito fornisca un certo risultato.
(ii) Tuttavia se una grandezza è stata misurata ed ha prodotto un certo risultato, ripetendo
la misura della stessa grandezza immediatamente dopo la prima misura (per evitare che nel frattempo lo stato del sistema evolva), il risultato della misura sarà lo stesso già ottenuto.
QM2. (i) Esistono delle grandezze fisiche incompatibili nel senso che segue. Dette A e B due
grandezze incompatibili, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b, una
successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter
imputare il risultato all’evoluzione temporale dello stato) – produce un risultato a1 generalmente
differente da a. Lo stesso fenomeno appare scambiando il ruolo di A e B. Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono
apparati sperimentali di misura in grado di misurarle contemporaneamente.
(ii) Esistono anche grandezze fisiche compatibili nel senso che segue. Dette A0 e B 0 due
grandezze compatibili, se si misura prima la grandezza A0 sul sistema (a stato fissato) ottenendo
il risultato a0 e quindi – immediatamente dopo – si misura B 0 ottenendo il risultato b0 , una
successiva misura di A0 – vicina temporalmente a piacere a quella di B 0 (in modo da non poter
imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a0 già ottenuto. Lo
stesso fenomeno appare scambiando il ruolo di A0 e B 0 . In particolare, per (ii) di QM1, ogni
grandezza fisica è compatibile con se stessa e se due grandezze fisiche sono una funzione dell’altra
(es. l’energia ed il suo quadrato), allora sono compatibili.
178
Osservazioni.
(1) QM1 e QM2 si riferiscono alle grandezze fisiche “non definitorie” di un sistema fisico. Per
grandezze definitorie intendiamo quelle che non dipendono dallo stato del sistema e che quindi
permettono di distinguere un sistema da un altro. Le rimanenti grandezze, quelle a cui si riferiscono QM1 e QM2, sono invece dipendenti dallo stato del sistema.
(2) È chiaro che non è possibile avere la certezza assoluta che i sistemi fisici quantistici soddisfino
(i) di QM1. Si potrebbe infatti sospettare che la stocasticità dell’esito delle misure derivi dal
fatto che, in realtà, gli sperimentatori non conoscano completamente lo stato del sistema e se lo
conoscessero completamente potrebbero prevedere con certezza gli esiti delle misure. In questo
senso la probabilità quantistica sarebbe semplicemente di natura epistemica. Nell’interpretazione standard della MQ, la cosiddetta interpretazione di Copenaghen, la stocasticità degli esiti
delle misure è assunta come un fatto fondamentale della natura dei sistemi quantistici. Esistono
comunque interessanti tentativi di interpretazione della fenomenologia quantistica basati su formalismi alternativi (le cosiddette formulazioni in termini di variabili nascoste) [Bon97]. In tali
approcci la stocasticità è spiegata come dovuta ad una incompleta informazione da parte dello
sperimentatore sul reale stato fisico del sistema che è descritto da più variabili (ed in modo molto
diverso) rispetto a quelle usate nella formulazione standard. Nessuno di tali tentativi (malgrado
alcuni siano veramente notevoli come la teoria di Bohm) è risultato fino ad oggi veramente soddisfacente tanto da essere un vero competitore dell’interpretazione e della formulazione standard
della MQ (quando si considerino anche le teorie quantistiche relativistiche e la teoria dei campi
quantistica relativistica in particolare).
Bisogna anche sottolineare che non è comunque possibile costruire una teoria fisica completamente classica (includendo le teorie relativistiche non quantistiche tra le teorie classiche) che
possa spiegare completamente la fenomenologia quantistica. Le variabili nascoste devono soddisfare un requisito di contestualità piuttosto inusuale nelle teorie classiche. Infine ogni teoria che
spieghi la fenomenologia quantistica, inclusa la stessa MQ, deve essere non locale [Bon97]. In altre parole la fenomenologia sperimentale prova l’esistenza di correlazioni tra esiti di esperimenti
che avvengono in regioni distinte dello spazio ed in periodi di tempo per cui non e possibile che
vi sia trasmissione di informazione tramite qualunque mezzo fisico che si muova ad una velocità
non superiore a quella della luce nel vuoto.
(3) È implicito in QM1 e QM2 che i sistemi fisici interessanti nella fenomenologia e teoria quantistica vengano divisi in due grandi categorie: gli strumenti di misura ed i sistemi quantistici. Nella
formulazione di Copenaghen si assume che gli strumenti di misura siano sistemi che soddisfino
alle leggi della fisica classica. Queste assunzioni che corrispondono a dati di fatto sperimentali e
che sono a dir vero piuttosto rozze dal punto di vista teorico, sono alla base dell’interpretazione
del formalismo e non si riesce a dire molto altro nel corpus della formulazione standard. Per
esempio non è chiaro dove si situi la linea di confine tra sistemi classici e quantistici, nemmeno come questa linea possa essere descritta all’interno del formalismo e nemmeno se il sistema
costituito dall’apparato di misura e dal sistema quantistico possa essere a sua volta considerato
come un sistema quantistico più grande e trattato all’interno del formalismo. Infine, il processo
fisico dell’interazione tra strumento di misura e sistema quantistico che fornisce l’esito della misura non è descritto all’interno del formalismo quantistico standard come un processo dinamico.
179
Vedremo meglio più avanti tale punto. Rimandiamo a [Bon97, Des80] per una discussione su
tali interessanti e difficili argomenti.
7.2
Stati classici come misure di probabilità sulla σ-algebra delle
proposizioni elementari.
È noto che una misura positiva µ sullo spazio X è detta misura di probabilità se µ(X) = 1.
La trattazione formale, dovuta a Kolmogorov, del calcolo delle probabilità si traduce nello studio delle misure di probabilità. Vediamo ora come la nozione di misura di probabilità possa
essere usata per rappresentare gli stati fisici dei sistemi classici. Un’estensione di tale nozione
verrà impiegata nel seguito per dare una descrizione matematica degli stati dei sistemi quantistici. Questo approccio è stato studiato per la prima volta da G. Mackey (“The mathematical
Foundations of Quantum Mechanics”, Benjamin, New York 1963)).
7.2.1
Stati come misure.
Consideriamo un sistema fisico classico arbitrario descritto in formulazione hamiltoniana. Questo significa che lo spazio ambiente, lo spaziotempo delle fasi, Hn+1 sarà dato da una varietà
differenziabile fibrata su R, l’asse del tempo, le cui fibre Ft , lo spazio delle fasi al tempo t, saranno varietà differenziabili (tra di loro diffeomorfe) F di dimensione 2n dotate di una struttura
simplettica che permette di formulare le equazioni di Hamilton. Nell’intorno di ogni punto su
ciascuna sottovarietà Ft0 avremo delle coordinate naturali t, q 1 , . . . , q n , p1 , . . . , pn rispetto alle
P
quali la forma simplettica è ω = ni=1 dq i ∧ dpi e le equazioni di Hamilton prendono la solita
forma per k = 1, 2, . . . , n:
dq k
dt
dpk
dt
∂H(t, q(t), p(t))
,
∂pk
∂H(t, q(t), p(t))
= −
.
∂q k
=
(7.1)
(7.2)
essendo H la funzione hamiltoniana delle coordinate locali considerate ed essendo t la coordinata
sull’asse del tempo. L’evoluzione del sistema sarà descritta quindi dalle curve integrali delle
equazioni scritte sopra. Ad ogni fissato tempo t ∈ R, ogni evoluzione del sistema determina un
punto (t, r(t)) con r(t) ∈ Ft in cui la curva integrale considerata interseca Ft . Nel caso si stia
considerando, non un sistema fisico ma un insieme statistico di sistemi fisici identici, l’evoluzione
del sistema è descritta assegnando una funzione densità positiva localmente rappresentabile come
ρ = ρ(t, q, p) che risolve l’equazione di Liouville:
‹
n 
∂ρ X
∂ρ ∂H
∂H ∂ρ
+
−
=0.
∂t i=1 ∂q i ∂pi
∂q i ∂pi
180
(7.3)
Si richiede ovviamente che, per ogni t
Z
Ft
ρ dµ = 1 ,
(7.4)
dove dµ, localmente rappresentabile come dµt = dq 1 ∧ · · · ∧ dq n ∧ dp1 ∧ · · · ∧ dpn , è la misura
indotta dalla forma simplettica ω su Ft .
È un fatto noto come teorema di Liouville la proprietà dell’integrale in (7.4) di essere invariante
al variare di t, quando ρ soddisfa (7.3) [CCP82].
ρ(t, r) con r ∈ Ft rappresenta la densità probabilità che il sistema fisico si trovi in r al tempo t.
In definitiva, sia nel caso di un unico sistema fisico, che nel caso di una trattazione statistica,
l’evoluzione del sistema è descritta assegnando una classe di misure di Borel di probabilità {νt }t∈R ,
ciascuna definita sul corrispondente spazio delle fasi Ft dove:
(i) se si lavora con un insieme statistico νt = ρdµt ;
(ii) se si lavora con un solo sistema si può definire una misura νt caso limite di (i) come la
misura di Dirac concentrata in r(t).
Ricordiamo che la misura di Dirac δx concentrata in un punto x di uno spazio con misura X
è definita come δx (E) = 0 se x 6∈ E e δx (E) = 1 se x ∈ E, dove E è un qualsiasi elemento della
σ-algebra, Σ, dello spazio X.
Lo stato del sistema al tempo t (eventualmente pensato come stato statistico) sarà quindi individuato dalla misura νt .
Il significato operativo della misura νt nel caso essa sia una misura di Dirac sarà chiarito tra poco.
Nota. Per rappresentare gli stati del sistema al tempo t in modo del tutto generale, tralasciando il problema dell’evoluzione dello stato ed abbandonando la formulazione hamiltoniana
standard, si potrebbe lavorare su varietà topologiche Ft invece che differenziabili. Gli stati (al
tempo t) potrebbero comunque essere rappresentati in termini di misure di probabilità rispetto alla σ-algebra di Borel. La richiesta dell’esistenza di una topologia su Ft è intrinsecamente
connessa con l’esistenza di “intorni” dei punti di tale insieme, dovuti alla presenza di errori di
misura sperimentali, rimpicciolibili a piacere, ma non annullabili. Più precisamente, la richiesta
di poter distinguere i punti di Ft malgrado l’esistenza di errori di misura, viene tradotta matematicamente con la richiesta che la topologia di Ft sia di Hausdorff (come d’altronde accade
nelle varietà differenziabili).
7.2.2
Proposizioni e insiemi.
Se ammettiamo che la descrizione hamiltoniana del nostro sistema fisico contenga tutte le proprietà fisiche del sistema, tutte le proposizioni sul sistema che al tempo t sono vere o false, o sono
vere con una certa probabilità, devono poter essere descritte in Ft in qualche modo. Inoltre, il
loro valore di verità ovvero la probabilità che siano vere deve poter essere ottenuta una volta
noto lo stato νt del sistema.
Mettiamoci inizialmente nel caso in cui si considera un unico sistema e quindi νt è una misura
181
di Dirac. Ogni proposizione P individua un insieme di Ft che contiene tutti e soli i punti di Ft
che la rendono verificata. Indicheremo tale insieme ancora con P .
Noto lo stato νt , la proposizione sarà vera se e solo se il punto r(t) che descrive lo stato al tempo
t appartiene all’insieme P .
Se assegniamo convenzionalmente il valore 0 ad una proposizione falsa e 1 ad una vera, in termini di misure νt , il valore di verità della proposizione P sullo stato νt è dato allora da νt (P )
dove ora P ⊂ Ft è l’insieme associato alla proposizione P .
Questo fatto chiarisce il significato operativo della misura di Dirac νt .
La stessa interpretazione può essere usata nel caso lo stato abbia un’interpretazione statistica:
νt (P ) rappresenta la probabilità che P sia vera al tempo t quando lo stato è νt .
È chiaro che tutto quanto detto ha senso se gli insiemi P appartengono alla σ-algebra su cui
sono definite le misure νt . Tale σ-algebra è quella di Borel ed è pertanto ragionevolmente grande.
Note.
(1) Anche il caso di una misura di Dirac può interpretarsi nel senso delle misure di probabilità
(vedi Appendice A) (e la misura di Dirac è una misura di probabilità) se si attribuisce al valore
di verità 1 la probabilità certa e al valore di verità 0 la probabilità nulla. D’ora in poi adotteremo
tale interpretazione unificante in entrambi i casi.
(2) È chiaro che una stessa proposizione può essere formulata in modi differenti ma equivalenti.
Nell’identificare proposizioni con insiemi di Ft noi stiamo esplicitamente assumendo che:
se due proposizioni individuano lo stesso sottoinsieme di Ft si devono considerare come la stessa
proposizione.
7.2.3
Interpretazione insiemistica dei connettivi logici.
Prese due proposizioni P e Q, possiamo comporle con connettivi logici per costruire altre proposizioni. In particolare possiamo considerare la proposizione costruita con la disgiunzione, P ∨ Q,
e la proposizione costruita con la congiunzione, P ∧ Q. Con una sola proposizione possiamo
costruirne la negazione ¬P .
Possiamo interpretare queste proposizioni in termini di insiemi della σ-algebra di Ft :
(i) la disgiunzione P O Q corrisponde a P ∪ Q;
(ii) la congiunzione P E Q corrisponde a P ∩ Q;
(iii) la negazione aP corrisponde a Ft \ P .
È possibile mettere un ordinamento parziale in ogni classe di sottoinsiemi di Ft usando l’inclusione insiemistica: P ≤ Q se e solo se P ⊂ Q.
L’interpretazione più naturale a livello di proposizioni del fatto che P ⊂ Q è semplicemente che
Q è conseguenza logica di P , ossia P ⇒ Q .
Note.
(1) La probabiltà che siano vere queste proposizioni composte può essere calcolata usando la
misura νt in quanto le operazioni insiemistiche che corrispondono a O, E, a sono operazioni
182
rispetto alle quali ogni σ-algebra è chiusa.
(2) Si verifica facilmente che se νt è una misura di Dirac, il valore di probabilità (che ricordiamo essere solo 0 o 1 in questo caso) assegnato a ciascuna delle espressioni composte di sopra,
coincide con il valore di verità calcolato tramite le tavole di verità del connettivo logico usato.
Per esempio, P OQ è vera (cioè νt (P ∪ Q) = 1) se e solo se almeno una delle due proposizioni
costituenti è vera (cioè se e solo se νt (P ) = 1 oppure, senza esclusione, νt (Q) = 1); infatti il
punto p su cui è concentrata la misura di Dirac δx = νt cade in P ∪ Q se e solo se x cade in
almeno uno dei due insiemi P e Q.
7.2.4
Proposizioni “infinite” e grandezze fisiche.
Solitamente nel calcolo proposizionale non si considerano delle proposizioni composte contenenti infinite proposizioni ed infiniti connettivi logici come P1 O P2 O . . .. L’interpretazione delle
proposizioni e dei connettivi in termini di elementi e operazioni in una σ-algebra permette però
di considerare tali proposizioni.
Possiamo legare almeno alcune di tali proposizioni grandezze fisiche misurabili sul sistema. In
via del tutto generale possiamo considerare le grandezze fisiche definite sul nostro sistema hamiltoniano come qualche classe di funzioni regolari in qualche senso f : Hn+1 → R. Una scelta
molto generale per il requisito di regolarità si ha prendendo tutta la classe delle funzione misurabili limitate. Tali funzioni definiscono densità di qualche grandezza che almeno localmente
possono essere integrate. Si possono fare delle scelte meno radicali prendendo per esempio solo
la classe delle funzioni continue oppure C 1 oppure C ∞ . Dal punto di vista fisico sembrerebbe
naturale richiedere che le grandezze fisiche siano descritte da funzioni almeno continue, per il
fatto che le misure sono sempre affette da errori sperimentali nel determinare il punto di Hn+1
che rappresenta il sistema: se le funzioni non sono continue, piccoli errori di misura possono
provocare grandi variazioni sui valori delle grandezze. Tuttavia bisogna tenere anche conto del
fatto che vi possono essere grandezze che assumono valori discreti, per le quali la critica di
sopra non si applica (i valori si possono distinguere usando strumenti sufficientemente, ma non
infinitamente, precisi).
Ci restringiamo ora a lavorare ad un tempo fissato t, per cui le grandezze fisiche che considereremo saranno funzioni f : Ft → R. Se f : Ft → R è una grandezza fisica valutabile sul sistema
fisico (al tempo t), possiamo costruire con essa delle proposizioni del tipo:
(f )
PE = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel E ⊂ R” ,
Il fatto di considerare insiemi di Borel E e non solo, per esempio, intervalli aperti, consente di
trattare sullo stesso piano grandezze che assumono valori continui e grandezze che assumo valori
discreti. Infatti nella classe degli insiemi di Borel di R ci sono anche gli insiemi chiusi, ci sono
gli stessi punti di R ed insiemi contenenti quantità finite e numerabili di punti.
In termini insiemistici:
183
(f )
PE = f −1 (E) ⊂ Ft .
(f )
Nota. Come al solito, una volta noto lo stato νt , la probabilità che PE sia vera al tempo t
(f )
per il sistema è νt (PE ). Se lo stato non è statistico, il valore suddetto è il valore di verità della
(f )
stessa proposizione PE .
Consideriamo un ’intervallo [a, b) con b ≤ +∞. Possiamo decomporre tale intervallo nell’unione
disgiunta di una infinità di sotto intervalli: [a, b) = ∪∞
i=1 [ai , ai+1 ) dove a1 := a ed inoltre ai < ai+1
ed infine ai → b per i → ∞. È chiaro allora che la proposizione
(f )
P[a,b) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [a, b)” ,
può essere decomposta in una disgiunzione infinita di proposizioni ciascuna della forma
(f )
P[ai ,ai+1 ) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [ai , ai+1 )”.
(f )
(f )
P[a,b) = O+∞
i=1 P[ai ,ai+1 ) ,
(f )
che corrisponde alla decomposizione dell’insieme P[a,b) nell’unione disgiunta
(f )
(f )
P[a,b) = ∪+∞
i=1 P[ai ,ai+1 ) .
Quindi vediamo che ha senso fisico assumere l’esistenza di almeno alcune proposizioni sul sistema costruite con infiniti connettivi logici ed infinite sotto proposizioni.
Per dualità rispetto alla negazione, che trasforma la disgiunzione O in congiunzione E, se assumiamo che l’insieme delle proposizioni ammissibili sia chiuso rispetto alla negazione a, dobbiamo
assumere come fisicamente sensate anche proposizioni infinite costruite con il connettivo E.
Il fatto di poter rappresentare le proposizioni come insiemi di una σ-algebra e quindi poterne
calcolare la probabilità che siano vere su uno stato del sistema tramite la misura corrispondente,
suggerisce di assumere che abbiano senso fisico proposizioni costruite con un’infinità numerabile
connettivi logici di tipo O oppure un’infinità numerabile di connettivi logici di tipo E, perchè gli
insiemi corrispondenti sono ancora elementi della σ-algebra che è chiusa rispetto all’unione ed
all’intersezione numerabile di insiemi.
Per avere una struttura “isomorfa” a quella di σ-algebra costituita da proposizioni insieme ai
connettivi logici O, E, a, dobbiamo includere tra le proposizioni fisiche ancora due proposizioni
che corrispondono agli insiemi ∅ e Ft rispettivamente. Tali proposizioni evidentemente sono
quella sempre falsa (ovvero con probabilità 0 di essere vera per qualsivoglia stato) che indicheremo con 0 e quella sempre vera (ovvero con probabilità 1 di essere vera per qualsivoglia stato)
che indicheremo con 1.
Una volta identificate le proposizioni con insiemi, la struttura di σ-algebra ci permette di assumere che :
184
L’insieme delle proposizioni elementari P relative al sistema fisico considerato, insieme ai connettivi logici O, E, a, costituiscano una struttura “isomorfa” ad una σ-algebra.
Il valore di verità oppure, a seconda del tipo di stato, la probabilità che una proposizione P
sia vera sullo stato del sistema al tempo t si calcola comunque come νt (P ) dove ora P ⊂ Ft è
l’insieme associato alla proposizione. Tutto ciò è indipendente dal fatto che una proposizione
sia “normale” o costituita con infiniti connettivi logici.
Nota. Ci si può chiedere se la σ-algebra associata all’insieme di tutte le proposizioni sul sistema
corrisponda alla σ-algebra di Borel di Ft o sia più piccola. È chiaro che se si assume che ogni
funzione reale misurabile limitata definita su Ft sia una grandezza fisica allora la risposta è
positiva perchè tra queste funzioni ci sono le funzioni caratteristiche di ogni insieme misurabile
(f )
di Ft . Se f è la funzione caratteristica dell’insieme di Borel E, per esempio, la proposizione PE
corrisponde all’insieme E.
7.2.5
Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle
proposizioni elementari.
Nel caso classico possiamo (anzi dobbiamo per dare senso alle proposizioni “infinite”) identificare proposizioni con insiemi e dire che le proposizioni sono insiemi. Tuttavia, per il passaggio
al caso quantistico in cui non esiste lo spazio delle fasi, è importante farsi la domanda che segue. Esistono strutture matematica in qualche senso “isomorfe” ad una σ-algebra che non siano
σ-algebre di insiemi? La risposta è positiva e si ricava dalla teoria dei reticoli.
Definizione 7.1. Un insieme parzialmente ordinato (X, ≥) è detto reticolo quando soddisfa i
due seguenti requisiti:
(a) per ogni coppia x, y ∈ X esiste sup{a, b};
(b) per ogni coppia x, y ∈ X esiste inf{a, b}.
Note.
(1) Nella teoria dei reticoli sup{a, b} si indica con a ∨ b e inf{a, b} si indica con con a ∧ b. È
importante notare che in un reticolo esistono inf{a, b} e sup{a, b} anche se a e b non sono confrontabili, cioè non vale a ≤ b oppure b ≤ a. Si prova facilmente che i seguenti tre fatti sono
equivalenti: a ∧ b = a , a ∨ b = b , a ≤ b.
(2) Si osservi che per ogni reticolo X, dalla definizione di inf e sup, seguono le proprietà
associative: per ogni terna a, b, c ∈ X,
(a ∧ b) ∧ c = a ∧ (b ∧ c) ,
(a ∨ b) ∨ c = a ∨ (b ∨ c) ,
per cui, per esempio, si può scrivere a ∨ b ∨ c ∨ d e a ∧ b ∧ c ∧ d senza ambiguità.
185
(3) Valgono anche le proprietà di simmetria:
a∨b = b∨a,
a∧b = b∧a,
per ogni coppia a, b ∈ X. Di conseguenza, per esempio a ∨ b ∨ c = c ∨ a ∨ b ∨ a.
Esistono diversi tipi di reticoli, la seguente definizione ne classifica alcuni.
Definizione 7.2. Un reticolo (X, ≥) si dice:
(a) reticolo distributivo se valgono le leggi distributive tra ∨ e ∧: per ogni terna a, b, c ∈ X
a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ b) ,
a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ b) ;
(b) reticolo limitato se X ammette minimo, indicato con 0 e massimo, indicato con 1;
(c) reticolo ortocomplementato se è limitato ed è dotato di un’applicazione X 3 a 7→ ¬a,
dove ¬a è detto ortocomplemento di a, che soddisfa:
(i) a ∨ ¬a = 1 per ogni a ∈ X,
(ii) a ∧ ¬a = 0 per ogni a ∈ X,
(iii) ¬(¬a) = a per ogni a ∈ X,
(iv) se a ≥ b allora ¬b ≥ ¬a per ogni coppia a, b ∈ X.
(d) reticolo σ-completo, se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo superiore
che viene denotato con ∨n∈N an .
Un reticolo che soddisfi (a), (b) e (c) è detto algebra di Boole. Un’algebra di Boole che soddisfi (d) è detta algebra di Boole σ-completa ovvero, equivalentemente, σ-algebra di Boole.
Definizione 7.3. Se X e Y sono algebre di Boole, un’applicazione h : X → Y è detta omomorfismo di algebre di Boole se soddisfa:
h(a ∨ b) = h(a) ∨ h(b) ,
h(¬a) = ¬h(a) ,
per ogni coppia a, b ∈ X
per ogni a ∈ X
Se X e Y sono σ-algebre di Boole, un omomorfismo di algebre di Boole h : X → Y è detto
omomorfismo di σ-algebre di Boole se soddisfa
h(∨n∈N an ) = ∨n∈N h(an )
per ogni insieme numerabile {an }n∈N ⊂ X .
Un omomorfismo biettivo di algebre di Boole (σ-algebre di Boole) è detto isomorfismo di algebre di Boole (rispettivamente di σ-algebre di Boole ).
Note.
(1) Si verifica che per ogni algebra di Boole X, se a ∈ X allora ¬a è l’unico elemento a soddisfare
186
(i) e (ii) di (c) nella definizione 7.2. Da questo risultato si prova che valgono le identità di De
Morgan: per ogni a, b ∈ X,
¬(a ∨ b) = ¬a ∧ ¬b ,
¬(a ∧ b) = ¬a ∨ ¬b .
(2) Dalla stessa definizione di inf e sup si verifica che un’algebra di Boole è σ-completa se e
solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. Tale estremo inferiore
viene denotato con ∧n∈N an e vale ∧n∈N an = ¬(∨n∈N ¬an ) da cui anche ∨n∈N an = ¬(∧n∈N ¬an ).
(3) Se h : X → Y è un omomorfismo di algebre di Boole, dalle identità di De Morgan si prova
subito che
h(a ∧ b) = h(a) ∧ h(b) , per ogni coppia a, b ∈ X .
Nello stesso modo si ha subito che h(1) = 1 e h(0) = 0. (Per esempio h(1) = h(a ∨ ¬a) =
h(a) ∨ ¬h(a) = 1.)
(4) Usando il fatto che a ∨ b = b se e solo se a ≤ b, si ha che un omomorfismo di algebre di
Boole h : X → Y preserva l’ordinamento:
se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b) .
(5) Usando il punto (2) si ha facilmente che, se h : X → Y è un omomorfismo di σ-algebre di
Boole, allora
h(∧n∈N an ) = ∧n∈N h(an )
per ogni insieme numerabile {an }n∈N ⊂ X .
(6) Si prova facilmente che, se h : X → Y è un isomorfismo di (σ-)algebre di Boole, allora
h−1 : Y → X è un isomorfismo di (σ-)algebre di Boole.
In base alle definizioni date risulta ovvio che valgono le seguenti proposizioni.
Proposizione 7.1. Ogni σ-algebra su un insieme X è un’algebra di Boole (ossia un reticolo
distributivo, limitato, ortocomplementato), σ-completa in cui:
(i) la relazione d’ordine è l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩),
(ii) il massimo ed il minimo dell’algebra di Boole sono X e ∅,
(iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo
spazio X.
Proposizione 7.2. Siano Σ, Σ0 due σ-algebre su X e X0 rispettivamente e f : X → X0 una
funzione misurabile. Valgono i due seguenti fatti:
(a) Al variare di E ∈ Σ0 , gli insiemi
(f )
PE := f −1 (E)
187
definiscono una σ-algebra di Boole t.c.:
(i) la relazione d’ordine è l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩),
(ii) il massimo ed il minimo dell’algebra di Boole sono X = f −1 (X0 ) e ∅ = f −1 (∅),
(iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo
spazio X.
(f )
(b) L’applicazione Σ0 3 E 7→ PE è un omomorfismo di σ-algebre di Boole.
Dobbiamo concludere le stesse cose per l’insieme delle proposizioni relative ad un sistema fisico:
le proposizioni relative ad un sistema fisico costituiscono un reticolo distributivo, limitato, ortocomplementato e σ-completo, cioè una σ-algebra di Boole, in cui:
(i) la relazione d’ordine corrisponde alla relazione di conseguenza logica,
(ii) il massimo ed il minimo sono la proposizione sempre vera 1 e quella sempre falsa 0,
(iii) l’operazione di ortocomplemento corrisponde alla negazione.
(Si osservi che da (i) e (iii) segue che la congiunzione deve corrispondere all’intersezione e la
disgiunzione all’unione.)
Ulteriormente:
Se f : Ft → R è una grandezza fisica rappresentata da una funzione misurabile (assumendo su
R la σ-algebra di Borel), allora valgono i seguenti fatti.
(a) Al variare di E nella σ-algebra di Borel di R, le proposizioni
(f )
PE = “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” ,
definiscono una σ-algebra di Boole.
(f )
(b) L’applicazione che associa ad ogni boreliano E ⊂ R la proposizione PE definisce un omomorfismo di σ-algebre di Boole.
7.3
Le proposizioni relative a sistemi quantistici come insiemi
di proiettori ortogonali.
Passiamo ora a considerare sistemi quantistici. Cercando di seguire un approccio per quanto
possibile vicino al caso classico, vogliamo prima di tutto cercare di dare un modello matematico
per la classe delle proposizioni relative allo stato quantistico ad un tempo t fissato, di un sistema
quantistico. Non sappiamo ancora come descrivere lo stato quantistico, ma sappiamo qualcosa,
QM1 e QM2, riguardo alle grandezze quantistiche misurabili sul sistema quando ne è assegnato
lo stato.
188
Per il momento ci concentreremo su QM2. Sappiamo che esistono grandezze incompatibili. È immediato concludere che esistono proposizioni incompatibili: se A e B sono grandezze
incompatibili
(A)
= “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel J ⊂ R” ,
(B)
= “Il valore di B valutata sullo stato del sistema cade nell’insieme di Borel K ⊂ R” ,
PJ
PK
sono in generale proposizioni incompatibili: i valori di verità di tali proposizioni si disturbano
a vicenda eseguendo la verifica di esse ripetutamente in successione con intervalli di tempo piccoli a piacere, in modo da non imputare il fenomeno all’evoluzione dello stato del sistema. Le
misure sperimentali di grandezze su un sistema fisico sono associate ad apparati di misura e
non sempre esistono apparati di misura che possano misurare contemporaneamente grandezze
fisiche distinte. Ciò invece accade quando le grandezze sono una funzione dall’altra (es. l’energia
ed il quadrato dell’energia). Risulta che le grandezze quantistiche incompatibili non sono mai
funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente. Non ha quindi alcun senso fisico, in questa situazione, affermare che le due
proposizioni considerate sopra, associate a grandezze fisiche incompatibili, possano assumere
sul sistema un valore di verità contemporaneamente. Le due proposizioni, in questo senso sono
dette incompatibili. Deve essere ben chiaro che quindi incompatibili non significa qui che le due
proposizioni non possono essere vere contemporaneamente, per cui, per esempio, la loro disgiunzione è sempre falsa, ma significa molto più fortemente, che non ha senso (fisico) formarne la
disgiunzione o la congiunzione di tali proposizioni ed attribuire ad esse qualsiasi valore di verità.
Tale valore di verità non può nemmeno essere definito con una procedura di limite misurando
successivamente le due grandezze perchè esse “si disturbano” nel senso precisato.
(A)
(B)
In altre parole, lo ripetiamo, non ha senso dare significato fisico a proposizioni del tipo PJ OPK
(A)
(B)
oppure PJ E PK perché non esiste, alcun modo sperimentale per attribuire valori di verità a
tali proposizioni. Non possiamo allora assumere il modello dell’insieme delle proposizioni dato
da qualche reticolo (o σ-algebra) di insiemi in cui la disgiunzione e la congiunzione sono sempre
possibili. Dovremmo imporre degli ulteriori vincoli su tale modello, vietando certi sottoinsiemi.
Una procedura alternativa, che si è rivelata molto più interessante è quella di modellizzare le
proposizioni elementari tramite i proiettori ortogonali di uno spazio di Hilbert.
7.3.1
Reticoli di proiettori ortogonali su spazi di Hilbert.
L’insieme dei proiettori ortogonali su uno spazio di Hilbert gode di alcune interessantissime proprietà molto vicine a quelle dei reticoli booleani con alcune importanti differenze che consentono
di modellizzare le proposizioni incompatibili di sistemi quantistici. Non esamineremo la questione a fondo, ma discuteremo solo alcune proprietà importanti. Prima di tutto notiamo alcune
proprietà molto interessanti che riguardano coppie di proiettori che commutano tra di loro.
Proposizione 7.3. Sia (H, ( | )) uno spazio di Hilbert e sia P(H) l’insieme dei proiettori ortogonali su H.
189
Valgono le proprietà che seguono per ogni coppia P, Q ∈ P(H).
(a) I seguenti fatti sono equivalenti:
(i) P ≤ Q;
(ii) P (H) è sottospazio di Q(H);
(iii) P Q = P
(iv) QP = P .
(b) I seguenti fatti sono equivalenti:
(i) P Q = 0;
(ii) QP = 0;
(iii) P (H) e Q(H) sono ortogonali.
Se vale (i) oppure (ii) oppure (iii), P + Q è proiettore ortogonale e proietta su P (H) ⊕ Q(H).
(c) Se P Q = QP allora P Q è proiettore ortogonale e proietta su P (H) ∩ Q(H).
(d) Se P Q = QP allora P + Q − P Q è proiettore ortogonale e proietta sul sottospazio chiuso
< P (H), Q(H) >.
Prova. (a) Prima di tutto notiamo che se P è un proiettore che proietta su M , allora P u = 0 se
e solo e u ∈ M ⊥ a causa della decomposizione diretta ortogonale H = M ⊕ M ⊥ ((d) in teorema
3.1) e tenendo conto che il componente di u in M è proprio P u.
(i) ⇒ (ii). Se P ≤ Q allora (u|Qu) ≥ (u|P u) ovvero essendo i proiettori idempotenti ed
autoaggiunti: (Qu|Qu) ≥ (P u|P u) che si può anche scrivere come ||Qu|| ≥ ||P u||. Quindi in
particolare Qu = 0 implica P u = 0 ovvero Q(H)⊥ ⊂ P (H)⊥ . Usando (e) di teorema 3.1 e
notando che Q(H) e P (H) sono chiusi, troviamo infine che P (H) ⊂ Q(H).
(ii) ⇒ (iii). Se S è una base hilbertiana per P (H) la si completi a base per Q(H) aggiungendo
l’insieme S 0 di vettori ortogonali a S. Si tenga ora conto che, per (d) di proposizione 3.9, P = sP
P
0
u∈S u(u| ) e Q = s- u∈S∪S 0 u(u| ). Dall’ortogonalità di S e S , dal fatto che ciascuno di essi è
insieme ortonormale e infine dalla continuità del prodotto scalare segue immediatamente la tesi
per controllo diretto.
(iii) ⇔ (iv). Si ottengono una dall’altra prendendo l’aggiunto ad ambo membri.
(iii) e (iv) ⇒ (i). Se u ∈ H, (u|Qu) = ((P + P ⊥ )u|Q(P + P ⊥ )u) dove P ⊥ = I − P . Notiamo
che P e P ⊥ commutano con Q per (iii) e (iv) inoltre P P ⊥ = P ⊥ P = 0. Sviluppando il secondo
membro di
(u|Qu) = (u|(P + P ⊥ )Q(P + P ⊥ )u) ,
si ha, tenendo conto che alcuni termini sono nulli per quanto appena detto:
(u|Qu) = (u|P QP u) + (u|P ⊥ QP ⊥ u) .
D’altra parte, per (iii) e (iv): (u|P QP u) = (u|P P u) = (u|P u). Concludiamo che:
(u|Qu) = (u|P u) + (u|P ⊥ QP ⊥ u) .
e quindi (u|Qu) ≥ (u|P u).
(b) Supponiamo P Q = 0, prendendo l’aggiunto si ha che QP = 0, quindi si verifica immediatamente che P (H) e Q(H) sono ortogonali essendo P Q = QP = 0. Se P (H) e Q(H) sono ortogonali,
190
prendiamo in ciascuno di tali spazi una base hilbertiana N e N 0 rispettivamente, scrivendo i
P
P
proiettori P e Q come indicato in (d) di proposizione 3.9: P = u∈N (u| )u, Q = u∈N 0 (u| )u,
si ricava immediatamente che P Q = QP = 0. Usando le espressioni di P e Q scritte sopra,
tenendo conto che N ∪ N 0 è una base hilbertiana per P (H) ⊕ Q(H) ed usando ancora (d) di
proposizione 3.9 si ricava che P + Q è il proiettore ortogonale che proietta su P (H) ⊕ Q(H).
(c) Il fatto che P Q sia proiettore ortogonale (cioè autoaggiunto ed idempotente) se P Q = QP
dove P e Q sono proiettori ortogonali è di immediata verifica. Se u ∈ H, P Qu ∈ P (H), ma anche
P Qu = QP u ∈ Q(H) e quindi P Qu ∈ P (H)∩Q(H). Abbiamo provato che P Q(H) ⊂ P (H)∩Q(H),
per concludere basta provare che P (H) ∩ Q(H) ⊂ P Q(H). Se u ∈ P (H) ∩ Q(H) allora P u = u
e Qu = u e quindi vale anche P u = P Qu = u ossia u ∈ P Q(H). Questo significa che se
P (H) ∩ Q(H) ⊂ P Q(H).
(d) Il fatto che R := P +Q−P Q sia proiettore ortogonale è di immediata verifica. Consideriamo
lo spazio < P (H), Q(H) >. Possiamo costruire una base hilbertiana per tale spazio come segue.
Per prima cosa costruiamo una base hilbertiana N per il sottospazio chiuso P (H)∩Q(H). Quindi
aggiungiamo a questa una seconda base hilbertiana per lo spazio che “rimane in P (H) una volta
tolto P (H) ∩ Q(H)”, cioè costruiamo una base hilbertiana N 0 per lo spazio chiuso ortogonale in
P (H) a P (H) ∩ Q(H): P (H) ∩ (P (H) ∩ Q(H))⊥ . Infine costruiamo, con lo stesso criterio, una
terza base hilbertiana N 00 per Q(H) ∩ (P (H) ∩ Q(H))⊥ . È facile convincersi che le tre basi sono
a due a due ortogonali e insieme costituiscono una base per < P (H), Q(H) >. Tutto ciò mostra
che vale la decomposizione diretta ed ortogonale
< P (H), Q(H) > = (P (H) ∩ Q(H)) ⊕ (P (H) ∩ (P (H) ∩ Q(H))⊥ ) ⊕ (Q(H) ∩ (P (H) ∩ Q(H))⊥ ) .
Nelle nostre ipotesi, il proiettore sul primo spazio della decomposizione è P Q per (c). Il proiettore
su (P (H)∩Q(H))⊥ ) è quindi I −P Q. Quindi, applicando nuovamente (c), il proiettore ortogonale
sul secondo addendo della decomposizione è P (I − P Q) = P − P Q. Similmente, il proiettore
sul terzo addendo della decomposizione è Q(I − P Q) = Q − P Q. Applicando (b), il proiettore
sulla somma diretta ortogonale dei tre spazi detti, cioè su < P (H), Q(H) > sarà:
P Q + (P − P Q) + (Q − P Q) = P + Q − P Q .
Questo conclude la dimostrazione. 2
In base a quanto dimostrato, consideriamo due proiettori ortogonali P, Q ∈ P(H) che commutano
e assumiamo di associare a tali proiettori delle proposizioni sul sistema fisico indicate con le stesse
lettere. Se facciamo le associazioni
P E Q ←→ P Q ,
P O Q ←→ P + Q − P Q ,
aP
←→ I − P ,
i secondi membri delle associazioni scritte sopra sono ancora proiettori ortogonali. Inoltre questi
proiettori soddisfano proprietà formalmente identiche a quelle delle proposizioni costruite con
191
connettivi logici. Per esempio, risulta subito che a (P E Q) =aP O aQ. Infatti:
aP O aQ ←→ (I−P )+(I−Q)−(I−P )(I−Q) = 2I−P −Q−I+P Q+P +Q = I−P Q ←→a (P EQ).
ed in tal modo si possono verificare tutte le relazioni che abbiamo scritto precedentemente,
quando si lavora con proiettori commutanti. Si osservi ancora che se P e Q commutano e P ≤ Q
allora P Q = QP = P e P + Q − P Q = Q per cui, se pensiamo P, Q, P Q, P + Q − P Q come
proposizioni sul sistema, quando P ≤ Q, dobbiamo attribuire a P Q e P + Q − P Q gli stessi
valori di verità che assume P . Questo fatto è analogo, tenendo conto delle associazioni di sopra,
a quanto accade a P E Q e P O Q nelle situazioni in cui Q è conseguenza logica di P .
La differenza sostanziale tra i proiettori ortogonali e le proposizioni di un sistema classico è però
la seguente. Se i proiettori P e Q non commutano, P Q e P + Q − P Q non sono nemmeno
proiettori in generale, per cui le associazioni sopra proposte non hanno significato.
Tutto ciò sembra molto interessante per il nostro fine di cercare un modello per le proposizioni
dei sistemi quantistici tenendo conto di QM2. L’idea è che:
le proposizioni dei sistemi quantistici sono in corrispondenza biunivoca con proiettori ortogonali
in uno spazio di Hilbert in modo tale che:
(i) la relazione di conseguenza logica tra proposizioni P e Q (ossia che P ⇒ Q) corrisponda
alla relazione P ≤ Q tra i corrispondenti proiettori;
(ii) due proposizioni sono compatibili se e solo se i rispettivi proiettori commutano.
Nota. Prima di procedere ulteriormente chiariamo un punto sulla natura dei proiettori ortogonali commutanti. Dai punti (a) e (b) della proposizione 7.3 si potrebbe sospettare che gli unici
casi in cui due proiettori ortogonali P e Q commutino siano quando: (a) gli spazi su cui proiettano sono uno incluso nell’altro, oppure, (b) gli spazi su cui proiettano sono reciprocamente
ortogonali.
Mostriamo con un esempio concreto che ci sono altre possibilità. Consideriamo lo spazio
L2 (R2 , dx ⊗ dy) dove dx e dy sono la misura di Lebesgue sulla retta reale. Consideriamo gli insiemi del piano: A = {(x, y) ∈ R2 | a ≤ x ≤ b}, con a < b fissati, e B = {(x, y) ∈ R2 | c ≤ y ≤ d},
con c < d fissati. Se G ⊂ R2 è misurabile, definiamo l’operatore lineare
PG : L2 (R2 , dx ⊗ dy) → L2 (R2 , dx ⊗ dy)
definito da PG f = χG · f per ogni f ∈ L2 (R2 , dx ⊗ dy), dove χG è, al solito, la funzione
caratteristica di G e · indica il prodotto di funzioni punto per punto. L’operatore PG è un
proiettore ortogonale come è facile provare. Inoltre si verifica subito che
PG (L2 (R2 , dx ⊗ dy)) = {f ∈ L2 (R2 , dx ⊗ dy) | ess supp f ⊂ G} ,
dove ess supp f è il supporto essenziale di f , dato, come ben noto, dal complemento dell’unione
degli aperti sui quali f è nulla quasi ovunque. È allora immediato verificare che nessuno dei due
spazi di proiezione PA (L2 (R2 , dx ⊗ dy)) e PB (L2 (R2 , dx ⊗ dy)) è incluso nell’altro e nemmeno i
due spazi di proiezione sono ortogonali. Tuttavia vale
PA PB = PB PA = PA∩B .
192
Se l’idea della corrispondenza tra proposizioni di sistemi quantistici e proiettori ortogonali su un
opportuno spazio di Hilbert è sensata, le similitudini strutturali tra i costrutti con i proiettori
ortogonali e quelli dell’algebra di Boole σ-completa delle proposizioni deve valere anche quando
si considerino più di due proposizioni. In particolare, ci si aspetta di trovare una struttura
di reticolo distributivo, limitato, ortocomplementato (ed eventualmente σ-completo) in qualche
insieme opportunamente scelto di proiettori rappresentante proprietà compatibili a due a due.
Il teorema seguente, oltre ad asserire che lo spazio di tutti i proiettori ortogonali è un reticolo
(non distributivo in generale), mostra che è davvero cosı̀.
] di proiettori ortogonali a due a due commutanti, è facile provare
Se abbiamo un insieme, P(H),
con il Lemma di Zorn (vedi Appendice A) che esiste anche un insieme P0 (H) di proiettori or] e che è massimale rispetto alla condizione di commutatività
togonali che include l’insieme P(H)
(cioè ogni proiettore ortogonale che commuta con gli elementi di P0 (H) è contenuto in P0 (H)).
Teorema 7.1. Sia H spazio di Hilbert.
(a) La classe dei proiettori ortogonali su H, P(H), è un reticolo limitato, ortocomplementato,
σ-completo e, in generale, non distributivo. Più precisamente:
(i) la relazione d’ordine è la relazione d’ordine ≥ tra proiettori,
(ii) il massimo ed il minimo di P(H) sono: I (operatore identità) e 0 (operatore nullo)
rispettivamente,
(iii) l’operazione di ortocomplemento del proiettore ortogonale P corrisponde a
¬P = I − P .
(7.5)
(iv) P(H) non è distributivo se dimH ≥ 2.
(b) In P(H) valgono i seguenti ulteriori fatti:
(i) se P, Q ∈ P(H) commutano, allora:
P ∧ Q = PQ ,
(7.6)
P ∨ Q = P + Q − PQ ,
(7.7)
(ii) se {Qn }n∈N ⊂ P(H) è costituito da elementi a due a due commutanti, allora:
∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn ,
(7.8)
∧n∈N Qn = s- lim Q0 ∧ · · · ∧ Qn ,
(7.9)
n→+∞
n→+∞
indipendentemente dall’ordine con cui si etichettano i Qn .
(c) Sia P0 (H) ⊂ P(H) un insieme di proiettori ortogonali a due a due commutanti e sia P0 (H)
massimale rispetto alla condizione di commutatività, allora vale quanto segue:
(i) P0 (H) è un reticolo limitato, ortocomplementato, σ-completo e distributivo – ossia una
σ-algebra di Boole – rispetto alla relazione d’ordine ≥;
193
(ii) il minimo, il massimo di P0 (H), l’ortocomplemento di elementi di P0 (H), l’estremo inferiore e quello superiore di insiemi al più numerabili di P0 (H), esistono in P0 (H) e coincidono
con i corrispondenti elementi calcolati rispetto P(H).
(d) Più in generale se P0 (H) ⊂ P(H) è un insieme di proiettori ortogonali a due a due commutanti, ma non necessariamente massimale, soddisfacente la proprietà (ii) in (c), allora P0 (H) è
una σ-algebra di Boole rispetto alla relazione d’ordine ≥.
Prova. (a) Ricordiamo che ≥ è una relazione d’ordine parziale in P0 (H) per (f) di proposizione
3.8. Si tenga quindi conto di (a) di proposizione 7.3, per cui:
P ≤ Q se e solo se P (H) ⊂ Q(H)
(7.10)
In tal modo la relazione d’ordine parziale sui proiettori ortogonali corrisponde biunivocamente
a quella dei relativi sottospazi di proiezione. La classe dei sottospazi chiusi di H è un reticolo: se
M, N sono sottospazi chiusi, l’estremo superiore ed inferiore di tale coppia sono rispettivamente
M ∨ N = < M, N > e M ∧ N = M ∩ N. Proviamolo. < M, N > è un sopraspazio chiuso di M ed
N per costruzione, inoltre, se L è un sopraspazio chiuso di M e di N, deve contenerli entrambi
e quindi contiene < M, N >, quindi M ∨ N = < M, N >. M ∩ N è un sottospazio chiuso di M
ed N per costruzione, inoltre, se L è un sottospazio chiuso contenuto in M ed N, deve essere
contenuto in M ∩ N, quindi M ∧ N = M ∩ N. Passando ai proiettori ed usando (7.10), avremo
che se P, Q ∈ P(H), P ∨ Q è il proiettore ortogonale che proietta su < P (H), Q(H) >, mentre
P ∧ Q è il proiettore ortogonale che proietta su P (H) ∩ Q(H). Si osservi che la dimostrazione
con le stesse argomentazioni, può essere estesa immediatamente al caso di una famiglia finita
o numerabile di proiettori ortogonali {Pi }i∈I . In tal caso: ∨i∈I Pi è il proiettore ortogonale che
proietta su < {Pi (H)}i∈I > e ∧i∈I Pi è il proiettore ortogonale che proietta su ∩i∈I Pi (H) per cui il
reticolo dei proiettori ortogonali e quello dei sottospazi chiusi sono entrambi σ-completi. È chiaro
che, nel reticolo dei sottospazi chiusi, il minimo ed il massimo sono, rispettivamente {0} e H.
Passando al reticolo dei proiettori ortogonali tramite (7.10), si ha che il minimo ed il massimo
sono, rispettivamente, il proiettore ortogonale che proietta su {0}, cioè l’operatore nullo, ed
il proiettore su H che coincide con l’operatore identità. L’ortocomplementazione di proiettori
¬P := I − P , corrisponde all’ortocomplementazione di sottospazi chiusi per (b) di proposizione
3.9: ¬P (M) := P (M)⊥ . La verifica delle proprietà dell’operazione di ortocomplementazione
per sottospazi (e quindi per proiettori) è allora immediata tenendo conto di (b), (d) ed (e) nel
teorema 3.1.
Diamo infine un controesempio per provare che il reticolo dei sottospazi chiusi, e quindi anche
quello dei proiettori ortogonali, non è distributivo.
Consideriamo un sottospazio bidimensionale S di uno spazio di Hilbert H con dimensione ≥ 2.
Possiamo identificare con C2 tale sottospazio scegliendo in esso una base ortonormale {e1 , e2 }.
Si considerino quindi i tre sottospazi di S, H1 :=< e1 >, H2 :=< e2 >, H3 :=< e1 + e2 >. Vale
H1 ∧ (H2 ∨ H3 ) = H1 ∧ S = H1 , ma (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) = {0} ∨ {0} = {0}. Per cui:
H1 ∧ (H2 ∨ H3 ) 6= (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) .
194
(b) e (c) Se i proiettori ortogonali P e Q commutano, oppure se i proiettori ortogonali {Qn }n∈N
commutano a due a due, per il Lemma di Zorn, esiste sempre un insieme massimale di proiettori
ortogonali commutanti a due a due P0 (H) che contiene P e Q oppure, rispettivamente, {Qn }n∈N .
Con tale precisazione possiamo provare (b) e (c) contemporaneamente, scegliendo un tale P0 (H)
arbitrariamente nella prova di (b).
È chiaro che 0 e I appartengono a P0 (H) dato che commutano con tutti gli elementi di P0 (H).
La stessa cosa accade per ¬P = I − P se P ∈ P0 (H). Bisogna ora provare che, per ogni
coppia di proiettori P, Q ∈ P0 (H), esistono l’estremo superiore e quello inferiore per l’insieme
{P, Q} nello spazio P0 (H), che questi si calcolano come detto in (b) e che, infine, tali proiettori
coincidono con l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P(H). Le
proprietà di distributività di ∨ e ∧ seguono facilmente dalle formule (7.7) e (7.6), dalle proprietà
di commutatività dei proiettori e dal fatto che i proiettori ortogonali soddisfano la proprietà di
idempotenza P P = P .
Tenendo conto di (c) di proposizione 7.3, il proiettore su M ∩N , che corrisponde a P ∧Q in P(H),
è proprio P Q che appartiene a P0 (H) perché, per costruzione, commuta con tutti i proiettori di
P0 (H) e tale insieme è massimale. Concludiamo che
P ∧ Q := inf {P, Q} = inf {P, Q} = P Q .
P0 (H)
P(H)
Dato che P e Q commutano per ipotesi, il proiettore su < M, N >, che corrisponde a P ∨ Q
calcolato in P(H), è P + Q − P Q per (d) di proposizione 7.2 e tale proiettore appartiene a P0 (H)
perché commuta con tutti i proiettori di P0 (H). Concludiamo, come sopra, che
P ∨ Q := sup {P, Q} = sup {P, Q} = P + Q − P Q :
P0 (H)
P(H)
Quindi P0 (H) è un’algebra di Boole.
Mostriamo per concludere che P0 (H) è σ-completo. Consideriamo una famiglia numerabile di
proiettori {Qn }n∈N ed associamo a ciascuno dei Qn il nuovo proiettore Pn definito induttivamente
come P0 := Q0 e, per n = 1, 2, . . .:
Pn := Qn (I − P1 − . . . − Pn−1 ) .
Si verifica facilmente per induzione che:
(i) Pn Pm = 0 se n 6= m;
(ii) Q1 ∨ · · · ∨ Qn = P1 ∨ · · · ∨ Pn = P1 + · · · + Pn per n = 0, 1, . . .. Si osservi che allora, se
definiamo gli operatori limitati:
An := P1 + · · · + Pn
risulta subito che:
(iii) An = A∗n e An An = An per ogni n = 0, 1, . . ., cioè gli An sono proiettori ortogonali per cui
in particolare An ≤ I, per ogni n = 0, 1, . . . per (e) di proposizione 3.9.
(iv) An ≤ An+1 per ogni n = 0, 1, . . .,
Per la proposizione 3.11 esiste l’operatore limitato autoaggiunto Q dato dal limite forte
A = s- lim Pn = s- lim Q0 ∨ · · · ∨ Qn .
n→+∞
n→+∞
195
È immediato verificare dall’espressione di sopra che AA = A, per cui A è ancora un proiettore
ortogonale che appartiene a P0 (H) in quanto è limite (forte) di operatori che commutano con
tutti gli elementi di P0 (H). Vale, sempre per la proposizione 3.11, An ≤ A e quindi in particolare
Qn ≤ Q1 ∨ · · · ∨ Qn ≤ A per ogni n ∈ N. Mostriamo che A è l’estremo superiore della classe
dei Qn , sia in P(H) che in P0 (H). Supponiamo che il proiettore ortogonale K ∈ P(H) soddisfi
K ≥ Qn per ogni n ∈ N. Questo significa che KQn = Qn per (a) di proposizione 6.3. Allora,
dalla definizione degli operatori Pn , vale anche KPn = Pn e quindi KAn = An , per cui K ≥ An
per ogni naturale n per (a) di proposizione 7.3. La proposizione 3.11 assicura allora che K ≥ A.
In altre parole A ∈ P0 (H) è un maggiorante della classe dei Qn ed ogni altro maggiorante
K ∈ P(H) maggiora A. Per definizione di estremo superiore A = supP(H) {Qn }n∈N =: ∨n∈N Qn .
Dato che A ∈ P0 (H), A sarà anche estremo superiore in P0 (H). È chiaro che nell’identità
provata sopra:
∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn
n→+∞
è irrilevante l’ordine con cui sono stati etichettati i Qn dato che il primo membro, cioè l’estremo
superiore dell’insieme {Qn }n∈N , non dipende dall’ordine con cui si etichettano gli elementi dell’insieme per definizione. La formula (7.9) si dimostra facilmente usando ¬ e formula (7.8) per
l’estremo superiore.
La prova di (d) è immediata tenendo semplicemente conto che la commutatività implica la distributività del reticolo direttamente da (i) e (ii) di (b). 2
Questa proposizione conclude la nostra brevissima introduzione alla teoria dei reticoli ed alle
sue relazioni con la formulazione della Meccanica Quantistica. Essa mostra che ha o può avere
senso pensare di associare proiettori ortogonali a proposizioni relative a sistemi quantistici,
descrivendo l’incompatibilità tra proposizioni in termini di non commutativtà dei proiettori
associati. In questo contesto si ritrova anche la struttura classica restringendosi a lavorare in
insiemi di proiettori commutanti massimali oppure, più generalmente, che soddisfino la richiesta
(ii) in (c) nella tesi del teorema. Ci si può chiedere se sia possibile dare delle motivazioni più
profonde per la scelta di descrivere le proprietà dei sistemi fisici quantistici tramite un reticolo di
proiettori ortogonali che non siano la semplice risposta “perché funziona”. Importanti, sebbene
parziali, risultati in questa direzione sono stati ottenuti da diversi autori (tra cui G. Makey) a
partire dal celebre lavoro di C. Piron “Axiomatique Quantique” Helv. Phys. Acta 37 439-468
(1964).
È importante precisare che quanto visto in questo capitolo è solo un piccolo ed informale passo
verso le diverse formulazione della Logica Quantistica (o logiche quantistiche) della quale non ci
occuperemo. Si vedano a tal proposito [DCGi02, EGL09] oltre che [Bon97]. L’unica cosa che
possiamo dire è che per costruire le logiche quantistiche si preferisce considerare i sottospazi su
cui proiettano i proiettori ortogonali piuttosto che i proiettori stessi. La struttura di reticolo
nell’insieme dei sottospazi chiusi indotta dall’inclusione insiemistica non è altro che quella dei
proiettori di P(H) rispetto alla relazione d’ordine parziale tra operatori limitati ≥, come visto
nella dimostrazione del teorema precedente. Il reticolo che si viene a costruire in questo modo,
come accade per il corrispondente reticolo di proiettori ortogonali, soddisfa tutte le ipotesi che
196
definiscono una σ-algebra di Boole eccetto la proprietà distributiva. Soddisfa invece una proprietà
differente che produce la struttura di reticolo ortomodulare, limitato e σ-completo. Un punto
importante è il seguente.
Per noi R := P ∧ Q indica solo il proiettore che proietta sull’intersezione dei sottospazi associati
a P e Q. R può avere o meno senso fisico come proposizione sul sistema, ma non corrisponde
alla proposizione P E Q quando P e Q sono associati a proposizioni mutuamente incompatibili.
Viceversa, nell’approccio dovuto a von Neumann e Birkhoff, che corrisponde alla cosiddetta logica
quantistica standard, ∨ e ∧ vengono usati come veri e propri connettivi (soddisfacenti un’altra
algebra rispetto ai connettivi usuali), anche quando connettono proiettori che corrispondono a
proposizioni incompatibili per cui non esistono sistemi di misura in grado di assegnare a P e Q
un valore di verità contemporaneamente. Il significato fisico di tali connettivi è pertanto poco
chiaro. Per questa ragione il punto di vista della Logica Quantistica standard è stato criticato
dai fisici (vedi il cap. 5 di [Bon97] per una discussione approfondita). In realtà vi sono almeno
tre questioni che hanno portato allo stallo se non al fallimento del programma di Birkhoff e
von Neumann di trovare l’impostazione fisica più profonda della Meccanica Quantistica in una
Logica Quantistica basata sulla teoria dei reticoli ortomodulari.
(a) La mancanza di distributività della Logica Quantistica rende difficile l’interpretazione del
formalismo in termini di una struttura logica.
(b) A dispetto di grandi sforzi, non sembra possibile una ragionevole generalizzazione dell’operatore implicazione e quindi non c’è un vero sistema deduttivo nella Logica Quantistica.
(c) La Logica Quantistica è rimasta un linguaggio proposizionale, dato che non è stato possibile trovare una estensione alla logica dei predicati.
Negli ultimi anni, diversi autori (in particolare C. Isham, N.P. Landsman e collaboratori) hanno
introdotto nuovi approcci formali, in un certo senso più profondi, della Logica Quantistica à la
Birkhoff e von Neumann, in particolare impiegando la teoria dei topos1 .
7.4
Le proposizioni e gli stati relativi a sistemi quantistici.
In questa sezione daremo i primi due assiomi della formulazione generale della Meccanica Quantistica, precisando come sono descritte matematicamente le proposizioni dei sistemi quantistici e
gli stati dei sistemi quantistici facendo uso di un opportuno spazio di Hilbert. Caratterizzeremo
tali stati attraverso un importante teorema dovuto a Gleason. Infine mostreremo che gli stati
quantistici formano un insieme convesso e possono essere costruiti come combinazioni lineari di
stati estremali detti stati puri che sono in corrispondenza biunivoca con gli elementi (raggi) dello
spazio proiettivo associato allo spazio di Hilbert del sistema fisico.
1
Vedi ad esempio: C. Heunen, N.P. Landsman, B. Spitters, A topos for algebraic quantum theory,
arXiv:0709.4364v2 [quant-ph], April 6, 2008.
197
7.4.1
Proposizioni e stati di sistemi quantistici: il teorema di Gleason.
In base a quanto visto nella sezione precedente, assumeremo il seguente assioma della Meccanica
Quantistica, dove come già fatto precedentemente, indichiamo con la stessa lettera proposizioni
e proiettori corrispondenti.
A1. Le proposizioni riguardanti un sistema quantistico S sono in corrispondenza biunivoca con
(un sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato
ad S. Inoltre:
(1) La compatibilità tra proposizioni corrisponde alla commutatività dei rispettivamente associati proiettori ortogonali;
(2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione
P ≤ Q per i proiettori associati;
(3) I (operatore identità) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione
sempre vera ed a quella sempre falsa;
(4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ;
(5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno
senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q;
(6) se {Qn }n∈N è un insieme numerabile di proposizioni a due a due compatibili, hanno senso
fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn .
Nota. La richiesta che lo spazio HS sia separabile verrà chiarita più avanti quando considereremo
sistemi quantistici concreti e daremo una rappresentazione esplicita di HS .
Malgrado la questione sia alquanto sottile d’ora in poi assumeremo che il sottoinsieme di P(HS )
che descrive le proposizioni del sistema sia effettivamente tutto P(HS ).
Possiamo anche dare un secondo assioma che riguarda gli stati quantistici. L’idea, basata su
QM1 e QM2 (e sulle successive osservazioni) è che uno stato quantistico al tempo t assegni
la “probabilità” che sia vera ogni proposizione del sistema. L’idea è quella di generalizzare il
concetto di misura σ-additiva di probabilità. Invece di definirla su una σ-algebra, la dobbiamo
pensare come definita sull’insieme dei proiettori associati alle proposizioni sul sistema. Sappiamo che ogni insieme massimale di proposizioni compatibili definisce un’algebra di Boole σ-finita,
che è una generalizzazione di una σ-algebra su cui si definiscono le misure. La richiesta naturale
è quindi la seguente.
A2 (forma provvisoria). Uno stato ρ al tempo t su un sistema quantistico S è un’applicazione
ρ : P(HS ) → [0, 1] tale che:
(1) ρ(I) = 1;
(2) se {Pi }i∈N ⊂ P(HS ) soddisfa: Pi Pj = 0 per i 6= j, allora
ρ s-
+∞
X
!
Pi
=
i=0
+∞
X
i=0
198
ρ(Pi ) .
Note.
(1) La richiesta (1) dice semplicemente che la proposizione sempre vera ha probabilità certa di
essere vera su ogni stato.
(2) La richiesta (2) vale evidentemente anche per proposizioni in numero finito: è sufficiente che
definitivamente Pi = 0.
(3) La richiesta (2) può essere riscritta come:
ρ (∨i∈N Pi ) =
+∞
X
ρ(Pi ) ,
i=1
per ogni classe di proposizioni {Pi }i∈N ⊂ P(HS ) compatibili e che si escludono a vicenda a due
P
a due, per cui +∞
i=0 Pi = ∨i∈N Pi esiste sempre per la teorema 7.1. (La prova dell’esistenza di
P+∞
P
è
comunque
la seguente. Nelle ipotesi fatte, le ridotte della serie definiscono operatori
i=0 i
P
autoaggiunti idempotenti e quindi proiettori ortogonali. Quindi N
i=0 Pi ≤ I per (e) della propoPN +1
PN
sizione 3.9. Inoltre i=0 Pi ≥ i=0 Pi come è immediato provare. Quindi per la proposizione
3.11 esiste il limite in senso forte della successione delle ridotte. È immediato provare che tale
limite è ancora idempotente ed autoaggiunto per cui è un proiettore ortogonale.)
(4) È chiaro che ogni stato ρ determina l’equivalente di una misura positiva σ-additiva di probabilità in ogni insieme massimale di proiettori commutanti P0 (Hs ) che, come visto, è una diretta
generalizzazione del concetto di σ-algebra. In questo senso abbiamo definito un’estensione del
concetto di misura di probabilità.
(5) Il lettore deve essere messo in guardia dall’idea di identificare la “misura di probabilità”
ρ con una vera misura di probabilità su una σ-algebra. Il fatto che ora consideriamo anche
proposizioni incompatibili nel senso quantistico cambia completamente le regole della probabilità
condizionata. La probabilità che sia vera P quando è verificata Q segue delle regole diverse da
quelle in teoria della probabilità classica se P e Q sono incompatibili nel senso quantistico.
Commento importante. Quando assegniamo uno stato ci saranno dunque delle proposizioni
con probabilità 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto
a tali proposizioni, e proposizioni con probabilità inferiore a 1 di essere verificate se il sistema
viene sottoposto a processo di misura rispetto a tali proposizioni. Riguardo alle prime proposizioni, possiamo pensare che esse corrispondano a proprietà che il sistema effettivamente abbia
nello stato considerato. Assumendo l’interpretazione standard della Meccanica Quantistica, in
cui la probabilità non ha significato epistemico, dobbiamo concludere che le proprietà relative
alle seconde proposizioni non sono definite nello stato considerato.
Un esempio importante dal punto di vista fisico è il seguente. Consideriamo le proposizioni PE
che corrispondono alla proprietà di un sistema fisico dato da una particella quantistica descritta
sulla retta reale: “la particella ha posizione nel boreliano E ∈ R”. Se lo stato ρ del sistema
assegna ad ogni PE , con E limitato, probabilità inferiore a 1 (ed è facile esibire uno di questi
stati come vedremo più avanti trattando il principio di indeterminazione di Heisenberg che come
vedremo è un teorema) dobbiamo concludere che la posizione della particella, nello stato ρ, non
199
è definita.
Da questo punto di vista risulta chiaro che la descrizione spaziale delle particelle come punti di
una varietà (in questo caso R) che rappresenta “lo spazio”, non gioca più un ruolo centrale come
accadeva in fisica classica. In un certo senso tutte le proprietà (che possono assumere valori
diversi a seconda dello stato) di un sistema fisico sono messe sullo stesso piano e lo “spazio” in
cui descrivere il sistema ed i suoi stati è uno spazio di Hilbert.
Dal punto di vista matematico la domanda che dobbiamo porci immediatamente è se esistano
davvero applicazioni ρ che godano delle proprietà enunciate in A2.
Dato uno spazio di Hilbert separabile H, mostriamo che esistono applicazioni ρ : P(H) → [0, 1]
tale che:
(1) ρ(I) = 1;
(2) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i 6= j, allora
ρ s-
+∞
X
!
Pi
=
i=0
+∞
X
ρ(Pi ) .
i=0
Proposizione 7.5. Sia H spazio di Hilbert separabile e T : H → H un operatore di classe
traccia, positivo (e quindi autoaggiunto) con traccia di valore 1. Se definiamo ρT : P(H) → R
come ρT (P ) := tr(T P ) per ogni P ∈ P(H) allora:
(a) ρT (P ) ∈ [0, 1] per ogni P ∈ P(H),
(b) ρT (I) = 1,
(c) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i 6= j, allora
ρT
s-
+∞
X
!
Pi
=
i=0
+∞
X
ρT (Pi ) .
i=1
Prova. Notiamo che T P è di classe traccia per ogni P ∈ P(H) per (b) del teorema 4.7 essendo
P limitato, per cui ha senso calcolare tr(T P ). La positività di T assicura che gli autovalori di
T sono tutti reali non negativi ((c) in proposizione 3.8). Mostriamo che in realtà gli autovalori
cadono tutti in [0, 1]. T è un operatore compatto autoaggiunto (in quanto positivo). Usando la
decomposizione vista nel teorema 4.4, tenendo conto che |A| = A (perché A ≥ 0), e che quindi,
nella decomposizione polare di A = U |A|, vale U = I, troviamo:
T =
X
mλ
X
λ (uλ,i | ) uλ,i .
λ∈σp (A) i=1
Sopra σp (A) è l’insieme degli autovalori di A e, se λ > 0, {uλ,i }i=1,...,mλ è una base dell’autospazio
associato a λ ∈ σp (A). Infine, la convergenza è nella topologia uniforme. Possiamo riscrivere lo
200
sviluppo di sopra come
T =
X
λj (uj | )uj .
(7.11)
j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli
autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a
base hilbertiana di H l’insieme degli autovettori detti aggiungendo una base per il nucleo di T
(la base complessiva è comunque al più numerabile perché H è separabile).
Calcolando la traccia di T sulla base degli uj , nelle nostre ipotesi abbiamo
1 = tr(T ) =
X
λj ,
j
per cui λj ∈ [0, 1]. Si osservi che l’identità di sopra prova anche (b) essendo T I = I. Sia ora
P ∈ P(H), Calcolando la traccia di T P sulla base detta:
tr(T P ) =
X
λj (uj |P uj ) .
j
Dato che (uj |P uj ) = (P uj |P uj ), abbiamo che 0 ≤ (uj |P uj ) ≤ ||P ||2 ||uj ||2 ≤ 1. dove abbiamo
tenuto conto del fatto che ||uj || = 1 e che ||P || ≤ 1 ((e) in proposizione 3.9). In definitiva:
0≤
X
λj (uj |P uj ) ≤
X
j
λj = 1
j
per cui vale (a).
Proviamo (c). Scegliamo una base hilbertiana {ui,j }j∈Ii in ogni spazio Pi (H). Lasciamo al
lettore la verifica del fatto che, nelle nostre ipotesi, B := {ui,j }j∈Ii ,i∈N è una base hilbertiana
P
per il sottospazio chiuso su cui proietta il proiettore ortogonale P = s- +∞
i=0 Pi . Possiamo quindi
completare B a base hilbertiana di H unendola con una base hilbertiana B 0 di P (H)⊥ . Usando
la continuità di T e (d) di proposizione 3.9:
"
!#
ρT (P ) = tr T
s-
X
!
(u| )u
= tr s-
u∈B
X
(u| )T u
.
u∈B
Ora calcoliamo la traccia usando la base hilbertiana B ∪ B 0
„ Ž
ρT (P ) =
X
v∈B∪B 0
X
v (u|v)T u
u∈B
=
X
(u |T u ) .
(7.12)
u∈B
dove si è tenuto conto del fatto che, se u, v ∈ B ∪ U 0 , (v|u) = δuv ed inoltre gli elementi di B
sono ortogonali a quelli di B 0 . Con una analoga procedura troviamo che
+∞
X
i=1
ρT (Pi ) =
Ii
+∞
XX
(ui,j |T ui,j ) .
i=1 j=1
201
Possiamo sempre ingrandire ogni insieme Ii fino a N definendo ui,j := 0 se j > sup Ii . In tal
caso possiamo scrivere:
+∞
X
+∞
∞
XX
ρT (Pi ) =
i=1
Z
(ui,j |T ui,j ) =
Z
dµ(i)
N
i=1 j=1
(ui,j |T ui,j )dµ(j) .
N
dove µ è la misura che conta i punti in N e si è tenuto conto
di (c) di proposizione 3.2, notando
R
che (ui,j |T ui,j ) ≥ 0 per ogni coppia i, j e quindi anche N (ui,j |T ui,j )dµ(j) ≥ 0 per ogni i. Con
la stessa interpretazione l’ultima somma in (7.12) può essere vista come
X
ρT (P ) =
(u |T u ) =
Z
(ui,j |T ui,j ) dµ(i) ⊗ dµ(j) .
N×N
u∈B
Dato che i numeri (ui,j |T ui,j ) sono non negativi e che l’integrale di sopra è convergente, il
teorema di Fubini-Tonelli, assicura che
+∞
X
Z
ρT (Pi ) =
i=1
Z
dµ(i)
N
(ui,j |T ui,j )dµ(j) =
Z
N
(ui,j |T ui,j ) dµ(i) ⊗ dµ(j) = ρT (P ) ,
N×N
che è l’enunciato nel punto (c). 2
Il seguente notevolissimo teorema dovuto a Gleason (J. of Math. and Mech. 6, 885-893 (1957))
porta ad una caratterizzazione completa delle funzioni che soddisfano l’assioma A2.
Teorema 7.2 (Gleason). Sia H uno spazio di Hilbert di dimensione finita ≥ 3, oppure separabile e di dimensione infinita.
Per ogni funzione µ : P(H) → [0, +∞) con µ(I) < +∞ e tale che soddisfa (2) in A2, esiste un
operatore T : H → H di classe traccia e positivo tale che:
µ(P ) = tr(T P )
per ogni P ∈ P(H).
Traccia della dimostrazione.
Gleason definisce una frame function non negativa su uno spazio di Hilbert sottodimensionale
separabile o di dimensione finita, H, come una funzione f a valori reali non negativi con dominio
dato dalla (superficie della) sfera unitaria di H, tale che, se {xi }i∈I è una base hilbertiana:
X
f (xi ) < +∞ .
i∈I
Quindi dimostra, usando risultati di von Neumann, che ogni frame function non negativa, f , su
uno spazio di Hilbert separabile o di dimensione finita ≥ 3 ammette un operatore limitato ed
autoaggiunto T per cui f (x) = (x|T x) per ogni vettore di norma unitaria x.
202
Consideriamo quindi il proiettore ortogonale Px := (x| ) x associato ad un vettore di norma
unitaria. È immediato verificare che, nelle nostre ipotesi su µ, f (x) := µ(Px ) definisce una
frame function non negativa al variare di x, dato che µ ≥ 0 ed inoltre risulta
!
X
f (xi ) =
X
i
X
µ(Pxi ) = µ
i
P xi
= µ (I) < +∞ .
i
Allora ci deve essere un operatore autoaggiunto T tale che
µ(Px ) = (x|T x)
per ogni vettore unitario x. Dato che (x|T x) ≥√0 per ogni x, T risulta essere un operatore
positivo e quindi T = |T |, essendo T = T ∗ e T 2 = T per l’unicità delle radici quadrate
positive. Se {xi }i∈I è una base hilbertiana per H, nelle nostre ipotesi su µ deve valere:
X
+∞ > µ(I) =
(xi |T xi ) =
X
i
(xi | |T |xi ) .
i
Per definizione di operatore di classe traccia (definizione 4.4), T = |T | è dunque un operatore di
classe traccia. Sia infine P ∈ P(H). Possiamo scegliere una base Hilbertiana di P (H): {xi }i∈J
e completarla a base Hilbertiana di H aggiungendo una base hilbertiana {xi }i∈J 0 di P (H)⊥ .
Abbiamo i seguenti fatti: J è numerabile (o finito) per il teorema 3.7, inoltre
P = s-
X
P xi
i∈J
per (d) di proposizione 3.9, infine
Pxi Pxj = 0
se i 6= j sono elementi di J. Allora, dato che P xi = xi se i ∈ J e P xi = 0 se i ∈ J 0 :
µ(P ) =
X
i∈J
µ(Pxi ) =
X
X
i∈J
i∈J∪J 0
(xi |T xi ) =
(xi |T P xi ) = tr(T P ) .
2
Note.
(1) La dimostrazione di Gleason funziona anche per spazi di Hilbert definiti sul campo reale.
(2) Si può notare che l’operatore T ha traccia 1 se µ(I) = 1, come nel caso considerato nell’assioma A2.
(3) Se il campo dello spazio di Hilbert è complesso, come in tutti i casi considerati in questo trattato e come nell’assioma A2, l’operatore T associato a µ è unico: ogni altro operatore
T 0 di classe traccia che soddisfa µ(P ) = tr(T 0 P ) per ogni P ∈ P(H) deve anche soddisfare:
(x|(T − T 0 )x) = 0 per ogni x ∈ H. Infatti, se x = 0 ciò è ovvio, mentre se x 6= 0 possiamo sempre
completare a base hilbertiana il vettore x/||x|| e, se Px è il proiettore su < x >, la condizione
tr((T − T 0 )Px ) = 0 si scrive, sulla base detta: ||x||−2 (x|(T − T 0 )x) = 0. Per l’esercizio (2) in
203
Esercizi 3.2 ciò implica che T − T 0 = 0. (Nel caso di spazio di Hilbert sul campo reale ciò non è
più vero in generale, come si verifica banalmente in Rn dotato del solito prodotto scalare “righe
per colonne”, prendendo per T una matrice reale antisimmetrica non nulla e per T 0 la matrice
nulla).
(4) La richiesta di spazio di Hilbert di dimensione > 2 è irrinunciabile. Si verifica subito che,
su C2 , i proiettori ortogonali sono 0, I e tutte le matrici della forma
3
X
1
Pn :=
I+
ni σ i
2
i=2
!
,
dove n = (n1 , n2 , n3 ) ∈ R3 ha norma unitaria: ||n|| = 1 e σ1 , σ2 , σ3 sono le note matrici di Pauli
–
™
–
™
–
™
0 1
0 −i
1 0
σ1 =
, σ2 =
, σ3 =
.
(7.13)
1 0
i 0
0 −1
Vi è corrispondenza biunivoca tra i proiettori Pn ed i punti di S2 , la sfera da raggio 1 contenente
quindi i punti identificati dai vettori n. Le funzioni µ che soddisfano le richieste in del teorema
di Gleason possono quindi pensarsi come funzioni definite su S2 ∪{0, I}. Le richieste nel teorema
di Gleason si riducono a: µ(0) = 0, µ(I) = 1 e µ(n) = 1 − µ(−n). Gli operatori positivi di classe
traccia con traccia unitaria, si verificano essere tutti e soli quelli della forma
3
X
1
ui σi
I+
ρu =
2
i=2
!
,
dove ora ||u|| ≤ 1. Di conseguenza, se · indica l’ordinario prodotto scalare in R3 ,
tr(ρu Pn ) =
1
(1 + u · n) .
2
L’applicazione µ definita da µ(0) = 0, µ(I) = 1 ma, per ogni n ∈ S2 e per un fissato v ∈ S2 ,
µ(Pn ) =
Š
1€
1 + (v · n)3 ,
2
soddisfa le richieste nel teorema di Gleason. Tuttavia si verifica facilmente che non ci sono
operatori ρu come sopra (quindi positivi di classe traccia) tali che µ(Pn ) := tr(ρu Pn ) per ogni
proiettore ortogonale Pu .
Il teorema di Gleason insieme alle considerazioni esposte sopra, unitamente al fatto che tutti i
sistemi quantistici noti hanno spazio di Hilbert con dimensione che soddisfa le ipotesi del teorema di Gleason2 , conducono alla riformulazione dell’assioma A2.
2
Le particelle con spin 1/2 ammettono uno spazio di Hilbert, in cui si definisce l’osservabile spin, di dimensione
2. La stessa cosa accade per lo spazio di Hilbert in cui viene descritta la polarizzazione della luce (elicità del
fotone). Tuttavia questi sistemi fisici, quando descritti completamente, per esempio includendo i gradi di libertà
posizionali o legati all’impulso sono rappresentabili in uno spazio di Hilbert infinito dimensionale.
204
A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , è
un operatore positivo di classe traccia con traccia unitaria su HS .
La probabilità che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ).
Possiamo quindi dare la seguente definizione.
Definizione 7.4. Sia H spazio di Hilbert separabile. Un operatore di classe traccia, positivo e
con traccia uguale a 1 si dice stato su H. L’insieme degli stati su H si indica con S(H).
Osservazione importante. Il teorema di Gleason ha una conseguenza fisica fondamentale che
distingue nettamente gli stati dei sistemi classici da quelli dei sistemi quantistici. I sistemi classici ammettono stati completamente deterministici, descritti da misure di Dirac con supporto su
un punto nello spazio delle fasi al tempo considerato. Tali misure assumono solo i valori 0 e 1 e
sono quindi stati in cui alcune proposizioni sono certe e le rimanenti sono false. Analoghi stati
non esistono per sistemi quantistici. La prova è immediata: se x appartiene all’insieme S dei
vettori di norma unitaria e Px è il proiettore ortogonale (x|·)x, ogni stato ρ per il teorema di
Gleason determina una funzione, evidentemente continua, S 3 x 7→ µ(Px ) = (x|ρx). Dato che S
è connesso3 e che le funzioni continue mandano connessi in connessi, µ(Px ) deve essere connesso
al variare di x. Se µ assume solo valori 0 oppure 1, deve essere (x|ρx) = 0 per ogni x e quindi
si averebbe ρ = 0 che violerebbe tr(ρ) = 1, oppure (x|ρx) = 1 per ogni x e quindi si avrebbe
ρ = I che non è di classe traccia nel caso infinito dimensionale e viola tr(ρ) = 1 nel caso finito
dimensionale. Questo risultato negativo ha rilevanza nei tentativi di costruire modelli classici
della meccanica quantistica introducendo “variabili nascoste” perché pone dei severi vincoli.
7.4.2
Stati puri, stati misti, ampiezze di transizione.
Passiamo a studiare l’insieme degli stati S(HS ) se HS è lo spazio di Hilbert associato al sistema
quantistico S. Ricordiamo che in uno spazio vettoriale, un insieme C è detto convesso se, per
ogni coppia x, y ∈ C, λx + (1 − λ)y ∈ C per ogni λ ∈ [0, 1]. Un elemento e di un insieme convesso
C è detto estremale se non esistono x, y ∈ C con x, y 6= e tali che e = λx + (1 − λ)y per qualche
λ ∈ (0, 1).
Ricordiamo che se X è uno spazio vettoriale sul campo K = C o R, lo spazio quoziente X/ ∼,
dove, se u, v ∈ X, u ∼ v se e solo se v = αu per qualche α ∈ K \ {0} è detto spazio proiettivo
associato a X. Gli elementi di X/ ∼ diversi da [0] (classe di equivalenza di 0, contenente solo 0)
3
Tale insieme è infatti connesso per archi continui e dunque connesso. Diamo una traccia della dimostrazione
di tale fatto. Se x, y ∈ S allora ci sono due casi. Nel primo caso x = eiα0 y per qualche α0 > 0 e quindi x è connesso
a y dalla curva, continua rispetto alla topologia dello spazio di Hilbert e tutta inclusa in S, [0, α0 ] 3 α 7→ eiα x.
Nel secondo caso x è combinazione lineare di y e di un vettore y 0 ∈ S perpendicolare a y che si ottiene costruendo
una base ortonormale nel sottospazio generato da y e x, quando tale base ammetta y come primo vettore. Dato
che ||x|| = ||y|| = ||y 0 || = 1 e che y ⊥ y 0 , deve allora essere x = eiα cos βy + eiδ sin βy 0 per una terna di reali α, β, γ.
Allora x è connesso ad y tramite una curva, continua e completamente contenuta in S, che si ottiene variando
questi tre parametri separatemente in tre opportuni intervalli.
205
sono detti raggi di X.
Proposizione 7.6. Sia (H, ( | )) uno spazio di Hilbert separabile.
(a) S(H) è un sottoinsieme convesso di B1 (H) (spazio degli operatori di classe traccia su H).
(b) Gli elementi estremali di S(H) sono tutti e soli quelli della forma:
ρψ := (ψ| )ψ ,
per ogni vettore ψ ∈ H con ||ψ|| = 1.
Pertanto esiste una corrispondenza biunivoca tra l’insieme degli stati estremali e l’insieme dei
raggi di H, che associa allo stato estremale (ψ| )ψ il raggio [ψ].
(c) Ogni stato ρ ∈ S(H) soddisfa
ρ ≥ ρρ
ed è estremale se e solo se soddisfa
ρρ = ρ .
(d) Ogni stato ρ ∈ S(H) è una combinazione lineare di stati estremali, includendo le combinazioni lineari infinite nella convergenza definita dalla topologia uniforme. In particolare esiste
sempre una decomposizione:
X
ρ=
pφ (φ| )φ
φ∈N
dove N è una base hilbertiana di H fatta di autovettori di ρ, pφ ∈ [0, 1] per ogni φ ∈ N e
X
pφ = 1 .
φ∈N
Prova.
(a) Presi due stati ρ, ρ0 è chiaro che λρ+(1−λ)ρ0 è ancora un operatore di classe traccia in quanto
gli operatori di classe traccia formano un sottospazio di B(H) (teorema 4.7). Dalle proprietà di
linearità della traccia (proposizione 4.6):
tr[λρ + (1 − λ)ρ0 ] = λtrρ + (1 − λ)trρ0 = λ1 + (1 − λ)1 = 1 .
Infine, se f ∈ H e λ ∈ [0, 1], tenendo conto che ρ e ρ0 sono positivi:
(f |(λρ + (1 − λ)ρ0 )f ) = λ(f |ρf ) + (1 − λ)(f |ρ0 f ) ≥ 0 .
Quindi λρ + (1 − λ)ρ0 è uno stato se ρ, ρ0 sono stati e λ ∈ [0, 1].
(b) e (d) Consideriamo ρ ∈ S(H). ρ è un operatore compatto autoaggiunto (in quanto positivo).
Usando la decomposizione vista nel teorema 4.4, tenendo conto che |ρ| = ρ (perché ρ ≥ 0), e
che quindi, nella decomposizione polare di ρ = U |ρ|, vale U = I, troviamo:
ρ=
X
mλ
X
λ (uλ,i | ) uλ,i .
λ∈σp (ρ) i=1
206
(7.14)
Sopra σp (ρ) è l’insieme degli autovettori di ρ e, se λ > 0, {uλ,i }i=1,...,mλ è una base dell’autospazio associato a λ ∈ σp (ρ). Infine, la convergenza è nella topologia uniforme. Questo sviluppo da
solo prova (d).
Completando a base hilbertiana ∪λ>0 {uλ,i }i=1,...,mλ aggiungendo una base per Kerρ, dalla
proposizione 4.6 otteniamo che deve anche essere:
X
1 = tr(ρ) =
mλ λ .
(7.15)
λ∈σp (ρ)
Supponiamo ora che ρψ := (ψ| )ψ , con ||ψ|| = 1. È immediato verificare che ρψ ∈ S(H).
Vogliamo provare che ρψ è estremale in S(H). Assumiamo pertanto che esistano ρ, ρ0 ∈ S(H) e
λ ∈ (0, 1) per cui
ρψ = λρ + (1 − λ)ρ0 .
Mostreremo che ρ = ρ0 = ρψ .
Consideriamo il proiettore ortogonale Pψ = (ψ| )ψ. È chiaro che (completando ψ a base
Hilbertiana): tr(ρψ Pψ ) = 1. Ne consegue che:
1 = λtr(ρPψ ) + (1 − λ)tr(ρ0 Pψ ) .
Dato che λ ∈ (0, 1) e 0 ≤ tr(ρPψ ) ≤ 1, 0 ≤ tr(ρ0 Pψ ) ≤ 1, questo è possibile solo se tr(ρPψ ) =
tr(ρ0 Pψ ) = 1. Proviamo allora che tr(ρPψ ) = 1 e tr(ρ0 Pψ ) = 1 implicano che ρ = ρ0 = ρψ .
Decomponendo ρ come in (7.14), tr(ρPψ ) = 1 si riscrive:
X
λj |(uj |ψ)|2 = 1 ,
(7.16)
j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli
autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a
base hilbertiana di H l’insieme degli autovettori detti aggiungendo una base per il nucleo di ρ
(la base complessiva è comunque al più numerabile perché H è separabile). Per ipotesi
X
λj
= 1,
(7.17)
|(uj |ψ)|2 = 1 .
(7.18)
j
X
j
Dato che λj ∈ [0, 1] e |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, avremo che valgono anche:
X
λ2j ≤ 1 ,
(7.19)
|(uj |ψ)|4 ≤ 1 .
(7.20)
j
X
j
207
Per cui la successione dei λj e quella dei |(uj |ψ)|2 sono in l2 (N). L’identità (7.16) insieme alle
(7.19) e (7.20) ed alla disuguaglianza di Cauchy-Schwartz in l2 (N), implicano infine che deve
essere
X
λ2j = 1 ,
(7.21)
|(uj |ψ)|4 = 1 .
(7.22)
j
X
j
Dato che λj ∈ [0, 1] per ogni j ∈ N, (7.17) e (7.21) sono compatibili solo se tutti i λi sono nulli
eccetto uno, λp , che vale esattamente 1. Nello stesso modo, dato che |(uj |ψ)|2 ∈ [0, 1] per ogni
j ∈ N, (7.18) e (7.22) sono compatibili solo se tutti i numeri |(uj |ψ)| sono nulli, eccetto uno,
|(uk |ψ)|, che vale 1. Dato che gli ui formano una base hilbertiana e ||ψ|| = 1, deve dunque essere
che ψ = αuk , dove |α| = 1. È chiaro che deve essere k = p altrimenti tr(ρPψ ) = 0. Essendo
ρ=
X
λj (uj | )uj ,
j
in base a quanto trovato, abbiamo finalmente che:
ρ = λk (uk | )uk = 1 · (uk | )uk = α−1 α−1 (ψ| )ψ = |α|−1 (ψ| )ψ = (ψ| )ψ = ρψ .
Con la stessa procedura si prova che ρ0 = ρψ .
Se uno stato ρ non è del tipo (ψ| )ψ, si potrà comunque decomporre come
ρ=
X
λj (uj | )uj ,
j
in cui almeno due valori p 6= q per cui λp 6= λq sono entrambi non nulli e quindi, in particolare,
λp , 1 − λp ∈ (0, 1). In tal caso potremo riscrivere ρ come
ρ = λp (up | )up + (1 − λp )
λj
(uj | )uj .
(1 − λp )
j6=p
X
(up | )up è uno stato come già detto ed è immediato verificare che anche
ρ0 :=
λj
(uj | )uj ,
(1 − λp )
j6=p
X
è uno stato di S(H) (ovviamente ρ0 6= (up | )up per costruzione essendo uq 6∼ up ). Abbiamo
quindi provato che ρ non è estremale.
L’applicazione f che associa allo stato estremale (ψ| )ψ il raggio [ψ] è ben definita. Infatti,
cominciamo a notare che, per definizione di stato estremale ||ψ|| = 1, per cui ψ 6= 0 e quindi
[ψ] è un raggio. Uno stesso stato estremale può essere scritto in vari modi diversi: vale infatti
(come è immediato provare tenendo conto che deve essere ||φ|| = 1) che (ψ| )ψ = (φ| )φ se e
208
solo se ψ = eiα φ per qualche α ∈ R. Ma allora, per definizione di raggio, [ψ] = [φ]. Mostriamo
che l’applicazione f è iniettiva. Se φ e ψ hanno norma unitaria e [ψ] = [φ] allora ψ = eiα φ per
qualche α ∈ R e quindi (ψ| )ψ = (φ| )φ. Infine l’applicazione f è suriettiva, perché, se [φ] è un
raggio e quindi ||φ|| =
6 0, ci sarà ψ ∈ [φ] con ||ψ|| = 1. In tal caso f ((ψ| )ψ) = [φ] perché ψ = αφ
per qualche α ∈ C non nullo.
(c) Dimostriamo prima la seconda affermazione. Se ρ è estremale, ρρ = ρ come si prova immediatamente usando la forma data in (b) per gli stati estremali. Decomponendo uno stato ρ
come (con il significato spiegato sopra)
ρ=
X
λj (uj | )uj ,
j
si ha subito che:
ρρ =
X
λ2j (uj | )uj .
j
Se è ρρ = ρ, passando alle tracce, dovrà essere
X
j
λ2j =
X
λj = 1
j
con λj ∈ [0, 1]. Si prova facilmente che questo è possibile solo se tutti i λj sono nulli eccetto
uno, λk , il cui valore è 1. Ma allora
ρ=
X
λj (uj | )uj = 1 · (uk | )uk ,
j
che è uno stato estremale per (b).
P
Proviamo la prima affermazione. Sia x = j αj uj un vettore arbitrario di H (si ricordi che gli
uj definiscono una base hilbertiana di H), allora, dato che λj ∈ [0, 1]:
(x|ρρx) =
X
j
λ2j (x|uj )(uj |x) =
X
λ2j |αj |2 ≤
X
j
j
λj |αj |2 =
X
λj (uj |x)(uj |x) = (x|ρx) .
j
Quindi ρρ ≤ ρ. 2
Possiamo dare la seguente definizione.
Definizione 7.5. Sia (H, ( | )) uno spazio di Hilbert separabile.
(a) gli elementi estremali in S(H) sono detti stati puri ed il loro insieme è indicato con Sp (H),
gli stati non estremali sono detti stati misti o miscele.
(b) Se vale
X
ψ=
αi φi ,
i∈I
209
con I finito o numerabile (e la convergenza della serie è nella topologia di H nel secondo caso),
dove i vettori φi ∈ H sono tutti non nulli e 0 6= αi ∈ C, si dice che lo stato (ψ| )ψ è sovrapposizione coerente degli stati (φi | )φi /||φi ||2 .
(c) Se ρ ∈ S(H) soddisfa
X
ρ=
pi ρi
i∈I
con I finito, ρi ∈ S(H) e 0 6= pi ∈ [0, 1] per ogni i ∈ I ed infine i pi = 1, si dice che lo stato ρ
è sovrapposizione incoerente o miscela degli stati (eventualmente puri) ρi .
(d) Se ψ, φ ∈ H soddisfano ||ψ|| = ||φ|| = 1:
(i) il numero complesso (ψ|φ) viene detto ampiezza di transizione o ampiezza di probabilità dello stato (φ| )φ sullo stato (ψ| )ψ;
(ii) il numero reale non negativo |(ψ|φ)|2 viene detto probabilità di transizione dello stato
(φ| )φ sullo stato (ψ| )ψ.
P
Note
(1) I vettori dello spazio di Hilbert di un sistema quantistico associati a stati puri vengono spesso
detti, in letteratura fisica, funzioni d’onda. La motivazione di tale terminologia è dovuta alla
prima formulazione della Meccanica Quantistica in termini di Meccanica Ondulatoria (vedi cap.
6) e sarà ripresa in seguito quando parleremo dell’equazione di Schrödinger.
(2) La possibilità di costruire stati puri con vettori non nulli che sono combinazione lineare di
vettori associati ad altri stati puri è quello che, nel gergo della Meccanica Quantistica, si chiama
principio di sovrapposizione degli stati (puri).
(3) Si osservi che in (c), nel caso in cui ρi = ψi (ψi | ), non è richiesto che (ψi |ψj ) = 0 se i 6= j.
Tuttavia è immediato provare che se I è finito, nel caso di ρi stato misto o puro e pi ∈ [0, 1] per
P
ogni i ∈ I con i pi = 1, allora:
X
ρ=
pi ρi
i∈I
è di classe traccia (è questo è ovvio perché gli operatori di classe traccia formano uno spazio
vettoriale e ogni ρi è di classe traccia), è positivo (perché combinazione lineare con coefficienti
positivi di operatori positivi) ed ha traccia unitaria perché, per le proprietà di linearità della
traccia (proposizione 4.6):
!
trρ = tr
X
i∈I
pi ρi
=
X
pi trρi =
i∈I
X
pi · 1 = 1 .
i∈I
La decomposizione di ρ su una base hilbertiana di suoi autovettori può considerarsi un caso
limite della decomposizione di sopra quando I è infinito numerabile, ρi = ψi (ψi | ), oppure, se I
è finito, ed infine (ψi |ψj ) = δij .
È importante notare che: in generale, un fissato stato misto ammette più di una decomposizione
incoerente in termini di stati puri e misti.
(4) Si consideri lo stato puro ρψ ∈ Sp (H), che quindi si scriverà come ρp si = (ψ| )ψ per qualche
vettore ψ ∈ H con ||ψ|| = 1. Il punto che vogliamo sottolineare qui è che tale stato puro è anche
210
un proiettore ortogonale Pψ := (ψ| )ψ e, di conseguenza, deve corrispondere ad una proposizione
sul sistema.
L’interpretazione naturale ed ingenua4 di tale proposizione è che essa corrisponda all’affermazione: “lo stato del sistema è lo stato puro individuato dal vettore ψ”.
Tale interpretazione è dovuta al fatto che, se ρ ∈ S(H), allora tr(ρPψ ) = 1 se e solo se ρ = (ψ| )ψ.
Infatti, se ρ = (ψ| )ψ, allora completando a base hilbertiana ψ e facendo la traccia su tale base,
risulta immediatamente che tr(ρPψ ) = 1. Supponiamo viceversa che valga tr(ρPψ ) = 1 per lo
stato ρ. Sotto tali ipotesi deve essere ρ = (ψ| )ψ come dimostrato nella prova della proposizione
7.6.
(5) Il punto (4) consente di dare un’interpretazione al modulo quadro dell’ampiezza di transizione (φ|ψ). Se ||φ|| = ||ψ|| = 1, come richiesto nella definizione di ampiezza di transizione,
risulta immediatamente che: tr(ρψ Pφ ) = |(φ|ψ)|2 , dove ρψ := (ψ| )ψ e Pφ = (φ| )φ. Tenendo
allora conto di (4), concludiamo che:
|(φ|ψ)|2 è la probabilità che, essendo lo stato (al tempo t) individuato dal vettore ψ, diventi lo
stato individuato da φ in seguito a processo di misura sul sistema (al tempo t).
Si osservi che |(φ|ψ)|2 = |(ψ|φ)|2 , per cui la probabilità di transizione dello stato individuato
da ψ sullo stato individuato da φ coincide con l’analoga probabilità con i ruoli dei due vettori
scambiati. Questo fatto non è, a priori, per nulla fisicamente evidente.
7.4.3
Stati successivi ai processi di misura e preparazione degli stati.
La formulazione standard della Meccanica quantistica assume il seguente assioma su ciò che succede al sistema fisico S nello stato ρ ∈ S(HS ) al tempo t quando viene sottoposto ad un processo
di misura riguardante la proposizione P ∈ P(HS ) se la proposizione risulta essere verificata (e
quindi in particolare tr(ρP ) > 0 prima della misura).
A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione
P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato
del sistema immediatamente dopo la misura è
ρP :=
P ρP
.
tr(ρP )
In particolare se ρ è puro ed è individuato dal vettore ψ con ||ψ|| = 1, lo stato del sistema
immediatamente dopo la misura è ancora puro ed è individuato dal vettore:
ψP =
Pψ
.
||P ψ||
4
Non possiamo fare a meno di notare una certa confusione di livelli semantico/sintattico in questa interpretazione. Tuttavia, per come l’interpretazione viene usata dai fisici, non crea problemi, ma potrebbe crearne in una
formulazione rigorosa dal punto di vista logico formale.
211
È immediato verificare che, in entrambi i casi, ρP e ψP definiscono stati. Nel primo caso infatti
ρP è positivo, di classe traccia con traccia unitaria, nel secondo caso, vale ||ψP || = 1.
Osservazioni importanti.
(1) Come già sottolineato precedentemente, la misura di una proprietà o di una grandezza
fisica avviene facendo interagire il sistema con un apparato di misura (supposto macroscopico
e soggetto alle leggi della fisica classica). La Meccanica Quantistica nella sua formulazione
standard non stabilisce cosa sia un apparato di misura, ma solo che ne esistano, e nemmeno
è in grado di descrivere l’interazione tra strumento di misura e sistema quantistico al di fuori
della schematizzazione di A3. Esistono vari punti di vista e congetture su come completare
la descrizione fisica del processo di misura, chiamato nel gergo della Meccanica quantistica
collasso o riduzione dello stato o della funzione d’onda. Ma per varie ragioni nessuna delle
proposte attuali è completamente soddisfacente [Des80, Bon97, Ghi97, Alb00]. Una proposta
molto interessante è stata fatta nel 1985 da G.C. Girardi, T. Rimini e A. Weber (Physical
Review D34, 1985 p.470) in cui si descrive in modo dinamico non lineare il processo di misura
della posizione e lo si assume non dovuto ad uno strumento di misura ma ad un processo di
autolocalizzazione. Purtroppo l’idea ha ancora diversi problemi, in particolare non ammette in
modo ovvio una descrizione relativistica.
(2) L’assioma A3 si riferisce a misure non distruttive, anche dette misure indirette [BrKh95],
in cui il sistema fisico misurato (tipicamente una particella) non viene assorbito/distrutto dallo
strumento di misura.
(3) Gli strumenti di misura si usano comunemente per preparare lo stato di un sistema. Dal
punto di vista teorico la preparazione di uno stato puro viene fatta nel modo seguente. Si sceglie
un numero finito di proposizioni compatibili P1 , . . . , Pn , in maniera tale che il sottospazio su cui
proietta P1 ∧ · · · ∧ Pn = P1 · · · Pn sia unidimensionale. Ossia P1 · · · Pn = (ψ| )ψ per qualche
vettore con ||ψ|| = 1. (L’esistenza di tali proposizioni è nota per praticamente tutti i sistemi
fisici quantistici che si usano sperimentalmente.) Quindi si eseguono misure contemporanee delle
proposizioni Pi su vari esemplari identici del sistema fisico considerato (es. elettroni) di cui però
non si conoscono gli stati. Se per uno di essi tutte le misure di tutte le proposizioni hanno dato
esito positivo, immediatamente dopo le misure, lo stato del sistema è quello individuato dal
vettore ψ.
Normalmente ad ogni proiettore Pi è associata una grandezza fisica Ai misurabile sul sistema e Pi
definisce la proposizione “la grandezza Ai cade nell’insieme Ei ”. Quindi di fatto, per preparare
lo stato puro ψ, si misurano contemporaneamente una serie di grandezze fisiche Ai compatibili e
si selezionano i sistemi in cui gli esisti delle misure sono caduti, rispettivamente, in ognuno degli
insiemi Ei . Tali sistemi sono nello stato associato a ψ immediatamente dopo le misure.
(4) Vediamo come si possono preparare stati misti miscelando stati puri. Si considerino una
quantità q1 di copie identiche del sistema S preparate nello stato puro associato a ψ1 , una
analoga quantità q2 di copie identiche dello stesso sistema S preparate nello stato puro associato
a ψ2 e via di seguito fino a ψn . Se si mischiano tali sistemi, dopo la miscela, ciascuno di essi si
212
troverà nello stato misto:
ρ=
n
X
pi (ψi | )ψi ,
i=1
dove pi := qi / ni=1 qi . Si noti che in generale è falso che (ψi |ψj ) = 0 se i 6= j per cui, l’espressione
di sopra per ρ non è la decomposizione su una base hilbertiana di autovettori di ρ stesso. Questa
procedura potrebbe fare pensare che esistano due tipi di probabilità, una intrinseca dovuta alla
natura quantistica degli stati ψi e l’altra epistemica, inglobata nelle probabilità pi . In realtà non
è vero: una volta creato lo stato misto con la procedura detta sopra, non c’è più alcun modo,
all’interno della Meccanica Quantistica, di distinguere gli stati della miscela. Per esempio, si
osservi che la stessa miscela ρ si sarebbe potuta ottenere miscelando stati puri diversi da quelli
individuati dai vettori ψi . In particolare, si sarebbero potuti usare quelli della decomposizione di
ρ in termini di una base hilbertiana di suoi autovettori. Dal punto di vita fisico, facendo misure
di qualsiasi genere (assumendo gli assiomi della Meccanica Quantistica fino ad ora enunciati)
non sarebbe possibile distinguere le due miscele.
P
7.4.4
Regole di superselezione e settori coerenti.
I sistemi quantistici noti sono tali che non tutti i vettori ψ normalizzati a 1 determinano stati
ammissibili fisicamente. Ci sono ragioni teoriche di vario genere, sulle quali non ci soffermiamo,
che implicano l’esistenza di cosiddette regole di superselezione. In base a tali regole, lo spazio
di Hilbert del sistema H risulta essere una somma diretta ortogonale (al più numerabile perché lo
spazio somma è numerabile) di sottospazi chiusi detti settori coerenti:
H = H1 ⊕ H2 ⊕ · · ·
e gli unici stati, individuati da singoli vettori, fisicamente ammissibili sono quelli rappresentati
da vettori in H1 , oppure H2 , oppure H3 ,, ... Ma non sono fisicamente ammessi stati individuati
da combinazioni lineari di vettori appartenenti a spazi coerenti distinti.
Dal punto di vista fisico, i settori coerenti sono i sottospazi di H associati ad una classe di
proposizioni mutuamente esclusive – cioè i proiettori ortogonali che proiettano su tali spazi
P
mutuamente ortogonali P1 , P2 , ... con i Pi = I (la somma è in senso forte se è eseguita su un
insieme infinito di termini) – che affermano che una certa grandezza, quella che determina la
regola di superselezione, ha un valore fissato, dipendente dalla proposizione. Alternativamente
la grandezza non è richiesta assumere un valore preciso ma solo in una precisa classe di valori,
dichiarata dalla proposizione stessa.
A titolo di importante esempio citiamo la regola di superselezione della carica elettrica per
i sistemi quantistici elettricamente carichi. Essa richiede che: ogni vettore ψ che determina
uno stato del sistema, deve verificare una proposizione PQ del tipo: “il valore della carica
del sistema vale Q” dove Q è un valore possibile della carica (e dipende dalla proposizione).
Matematicamente quindi deve essere tr(PQ (ψ| )ψ) = 1 per qualche valore della carica Q, che
equivale a dire PQ ψ = ψ per qualche valore della carica Q. In altre parole: non sono ammessi
stati, individuati da singoli vettori, in cui la carica non ha un valore definito. Questa richiesta
213
è ovvia in fisica classica, ma non lo è in meccanica quantistica, dove un sistema elettricamente
carico, a priori, potrebbe ammettere stati in cui la carica non è definita. Si osservi che la
richiesta che lo spazio di Hilbert del sistema sia separabile richiede che i valori possibili per la
carica elettrica, cioé i settori coerenti a carica definita, siano al più una quantità numerabile e
quindi la carica elettrica non può variare con continuità .
Un’altra regola di superselezione riguarda il momento angolare di ogni sistema fisico. Dalla
meccanica quantistica è noto che il modulo del momento angolare al quadrato J 2 , quando è in
uno stato definito, può assumere solo valori interi oppure semi interi (in unità ~2 = h/2π dove
h é la solita costante di Planck). Esiste allora una decomposizione dello spazio di Hilbert del
sistema fisico in due sottospazi chiusi ortogonali. Uno in cui J 2 ha valori interi ed uno in cui
J 2 ha valori semi interi. La regola di superselezione del momento angolare richiede che i vettori
che rappresentano stati del sistema non siano combinazione lineare di vettori nei due sottospazi.
È importante notare che uno stato puro può quindi essere a momento angolare non definito,
in quanto il vettore associato allo stato è combinazione lineare di vettori corrispondenti a stati
puri con diversi valori del momento angolare, tuttavia, a causa della regola di superselezione,
tali valori devono essere tutti interi oppure tutti semi interi.
Nel caso di presenza di regole di superselezione associate alla decomposizione di H nella
somma diretta in settori coerenti:
M
H=
Hk ,
(7.23)
k∈K
possiamo definire gli spazi degli stati e degli stati puri di ciascun settore: S(Hk ), Sp (Hk ).
Possiamo vedere questi insiemi come sottoinsiemi di S(H) e Sp (H) rispettivamente, in base al
seguente argomento generale.
Se M è un sottospazio chiuso dello spazio di Hilbert H possiamo identificare S(M ) (e quindi
Sp (M )) in modo naturale con un sottoinsieme di S(H) (rispettivamente Sp (H)), pensando
S(M ) (rispettivamente Sp (M )) come il sottoinsieme degli stati ρ (misti e puri rispettivamente)
di S(H), tali che Ran(ρ) ⊂ M . Tale identificazione è equivalente ad estendere ogni ρ ∈ S(M )
ad un operatore definito su tutto H, imponendo che sia l’operatore nullo su M ⊥ .
Nel caso in esame, in cui M è ciascuno dei settori coerenti Hk , possiamo identificare ogni S(Hk ),
Sp (Hk ) con sottoinsiemi di S(H) e Sp (H) rispettivamente. Con tale identificazione abbiamo
subito che S(Hk ) ∩ S(Hj ) = ∅ e Sp (Hk ) ∩ Sp (Hj ) = ∅ se k 6= j. Per quanto riguarda gli stati
puri fisicamente possibili per il sistema fisico descritto su H, questi saranno tutti e soli quelli
dell’insieme:
[
Sp (Hk ) .
k∈K
Gli stati misti fisicamente possibili per il sistema fisico descritto su H saranno quelli che si
riescono a costruire come miscele degli stati puri suddetti. Quindi, gli stati misti saranno tutte
e sole le possibili le combinazioni lineari convesse (anche infinite in riferimento alla topologia
operatoriale forte) degli elementi dell’insieme:
[
S(Hk ) .
k∈K
214
Osservazione. Si prova facilmente che, se i proiettori ortogonali Pk sono quelli associati a
ciascun Hk della decomposizione in settori coerenti (7.23), gli stati ρ ∈ Sp (H) che hanno senso
fisico sono tutti e soli quelli che soddisfano i vincoli:
ρPk = Pk ρ per ogni k ∈ K.
(7.24)
Proviamolo. Nel caso di uno stato (ψ| )ψ, la condizione ρPi = Pi ρ per ogni i ∈ K, implica subito
P
che Pi ψ = (ψ|Pi ψ)ψ per ogni i. Dato che I = i∈K Pi e Pi Pi0 = 0 se i 6= i0 , deve accadere che:
(ψ|ψ) = 1 =
X
||Pi ψ||2 .
(7.25)
i∈K
Valendo Pi ψ = (ψ|Pi ψ)ψ, deve allora anche succedere che: 1 =
(ψ|Pi ψ) = (Pi ψ|Pi ψ) = ||Pi ψ||2 ,
X
1=
||Pi ψ||4 .
i |(ψ|Pi ψ)|
P
2.
Ossia, visto che
(7.26)
i∈K
Essendo 0 ≤ ||Pi ψ|| ≤ 1, (7.25) e (7.26) sono compatibili solo se Pi ψ 6= 0 solo per un valore di
i = iψ , per cui ψ ∈ Hiψ .
Lasciamo per esercizio al lettore la dimostrazione del fatto che il risultato sussiste anche per gli
stati misti di S(H): gli stati misti ρ ∈ S(H) che hanno senso fisico sono tutti e soli quelli che
soddisfano i vincoli (7.24).
7.5
7.5.1
Le osservabili come Misure a Valori di Proiezione (PVM)
su R.
La nozione di osservabile
Notazione 7.1. D’ora in poi, se X è uno spazio topologico, B(X) denoterà la σ-algebra di Borel di X, cioè la più piccola σ-algebra di sottoinsiemi di X che includa tutti gli insiemi aperti di X.
In Meccanica Quantistica, le grandezze fisiche valutabili sui sistemi fisici e che hanno comportamento descritto in QM1 e QM2 sono dette osservabili. Ci occupiamo ora di esse. Dal punto
(A)
di vista fisico è ragionevole supporre che i proiettori ortogonali PE associati all’osservabile A
siano commutanti l’uno con l’altro al variare di E ⊂ R, in quanto ci si aspetta che le proposizioni
del tipo
(A)
PE
:= “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” ,
siano tutte compatibili al variare di E nella σ-algebra di Borel di R. Inoltre ci aspettiamo
(A)
(A)
(A)
che valga PE ∧ PE 0 = PE∩E 0 perché l’esito della misura cade in E ed anche in E 0 se e solo
215
(A)
se cade in E ∩ E 0 . Ci aspettiamo che valga anche PR = I perché l’esito della misura cade
(A)
sicuramente in R per cui PR è la proposizione sempre vera, indipendentemente dallo stato sul
quale si misura. Infine, per motivi fisicamente evidenti e tenendo conto del significato logico di
∨, è ragionevole supporre che, per ogni insieme numerabile di boreliani di R, {En }n∈N , valga:
(A)
(A)
∨n∈N PEn = P∪n∈N En .
Possiamo dare la seguente definizione in cui identifichiamo l’osservabile A con un’applicazione
opportuna:
Definizione 7.6. Se H è uno spazio di Hilbert un’applicazione A che associa ad ogni insieme di
(A)
Borel E ⊂ R un proiettore ortogonale PE ∈ P(H) è detta osservabile se valgono le proprietà
che seguono:
(A) (A)
(A) (A)
(a) PE PE 0 = PE 0 PE per ogni coppia di boreliani E, E 0 ⊂ R;
(A)
(A)
(A)
(b) PE ∧ PE 0 = PE∩E 0 per ogni coppia di boreliani E, E 0 ⊂ R;
(A)
(c) PR = I;
(d) per ogni insieme numerabile di boreliani di R, {En }n∈N , vale:
(A)
(A)
∨n∈N PEn = P∪n∈N En .
Note.
(A)
(1) Si dimostra facilmente che la classe {PE }E∈B(R) definita sopra è una σ-algebra di Boole
definita rispetto alla solita relazione d’ordine parziale ≤ tra proiettori.
(A)
(2) In generale {PE }E∈B(R) non è massimale rispetto alla commutatività dei proiettori.
(3) È chiaro che, con la definizione data sopra, ogni osservabile altro non è che un omomorfismo
di σ-algebre di Boole, dalla σ-algebra di Borel di R, B(R), alla σ-algebra di Boole dei proiettori
{PE }E⊂Σ(R) .
(4) La definizione di osservabile può essere riformulata in modo equivalente, ma matematicamente più semplice da maneggiare. Tale riformulazione è data nella prossima proposizione.
Proposizione 7.7. Sia H spazio di Hilbert. Un’applicazione P : B(R) → B(H) è un’osservabile
se e solo se soddisfa i seguenti requisiti.
(a) P (B) ≥ 0 per ogni B ∈ B(R);
(b) P (B)P (B 0 ) = P (B ∩ B 0 ) per ogni coppia B, B 0 ∈ B(R);
(c) P (R) = I;
(d) per ogni insieme numerabile di boreliani di R, {Bn }n∈N a due a due disgiunti, vale:
s-
+∞
X
P (Bn ) = P (∪n∈N Bn ) .
n=0
216
Prova. Se P : B(R) → B(H) è un’osservabile le proprietà (a), (b), (c), (d) della proposizione 7.7
sono banalmente verificate. Dobbiamo mostrare che se P : B(R) → B(H) soddisfa tali proprietà
allora è un’osservabile.
Includiamo tutti gli operatori P (B) con B ∈ B(R) in un insieme massimale di proiettori commutanti (che esiste per il lemma di Zorn), P0 (H) e d’ora in poi lavoreremo in tale insieme senza
perdere generalità.
(a) implica che ogni P (B) è autoaggiunto per (f) in proposizione 3.8, (b) implica che P (B)P (B) =
P (B ∩ B) = P (B) per cui tutti gli operatori P (E) sono proiettori ortogonali. Inoltre (b) implica anche che P (B)P (B 0 ) = P (B ∩ B 0 ) = P (B 0 ∩ B) = P (B 0 )P (B) per cui tutti i proiettori
commutano tra di loro. Usando la prima identità in (i) di (b) di teorema 7.1 la condizione (b)
di sopra si riscrive P (B) ∧ P (B 0 ) = P (B ∩ B 0 ). Per concludere è sufficiente provare la proprietà
(d) della definizione 7.6. Consideriamo una classe numerabile di insiemi {En }n∈N ⊂ B(R) in
generale non disgiunti a due a due. Vogliamo provare che esiste ∨n∈N P (En ) e vale
∨n∈N P (En ) = P (∪n∈N En ) .
Per fare ciò definiamo la classe di insiemi boreliani a due a due disgiunti: {Bn }n∈N con B0 := E0
e, per n > 0,
Bn = En \ (E1 ∪ · · · ∪ En−1 ) .
Si verifica facilmente che, per ogni p ∈ N ∪ {+∞},
∪pn=0 En = ∪pn=0 Bn .
Da questa identità, usando la proprietà I − P (B) = P (R \ B) ed usando ricorsivamente la
seconda identità in (i) di (b) di teorema 7.1, si ricava facilmente che, per ogni n ∈ N:
∨pn=0 P (En ) = ∨pn=0 P (Bn ) ,
e quindi
∨pn=0 P (En )
p
X
=
P (Bn ) .
(7.27)
n=0
dove abbiamo tenuto conto che la proprietà (d) nella tesi di questa proposizione implica che
∨pn=0 P (Bn )
p
X
=
P (Bn ) ,
n=0
per una classe finita di insiemi disgiunti Bn (la classe finita può sempre essere completata ad
una classe numerabile aggiungendo infinite copie dell’insieme vuoto). Possiamo, per concludere,
prendere il limite forte per p → +∞ in (7.27). Tale limite esiste per (b) in teorema 7.1 e vale
anche, nelle nostre ipotesi:
∨n∈N P (En ) = s- lim
p→+∞
p
X
P (Bn ) = P (∪n∈N Bn ) = P (∪n∈N En ) .
n=0
217
Questo conclude la dimostrazione 2.
Note.
(1) Si osservi che (c) e (d) da sole implicano che I = P (I ∪ ∅) = I + P (∅) per cui
P (∅) = 0 .
(2) Se B ∈ B(R) allora R \ B ∈ B(R) e R = B ∪ (R \ B). Quindi da (d), prendendo B0 = B,
B1 = R \ B e tutti i rimanenti Bk = ∅ abbiamo che: I = P (B) + P (R \ B). In altre parole vale
anche
¬P (B) = P (R \ B) .
La proposizione appena provata consente di identificare in modo biunivoco le osservabili con
enti matematici ben noti in letteratura: le misure a valori di proiezione su R. Tale nozione sarà
generalizzata nel prossimo capitolo.
Definizione 7.7. Un’applicazione P : B(R) → B(H), con H spazio di Hilbert, che soddisfa
le richieste (a), (b), (c) e (d) della proposizione 7.7 è detta misura a valori di proiezione
(PVM) su R oppure equivalentemente misura spettrale su R.
Possiamo enunciare il quarto assioma della formulazione matematica generale della Meccanica
Quantistica.
A4. Ogni osservabile A sul sistema quantistico S è descritta da una misura a valori di proiezione
su R, P (A) , nello spazio di Hilbert del sistema HS , in modo tale che, se E è un boreliano di R, il
proiettore P (A) (E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”.
7.5.2
Operatori autoaggiunti associati ad osservabili: esempi elementari.
Torniamo ora al caso classico. Nel caso classico, le osservabili corrispondono a quelle che abbiamo
chiamato grandezze fisiche, cioè funzioni f : Ft → R. Se si assume che f sia almeno misurabile,
possiamo associarle una classe di proposizioni del tipo
(f )
PE := “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” ,
che corrisponde all’insieme misurabile
(f )
PE := f −1 (E) .
La proposizione 7.2 ed il successivo commento hanno chiarito che, fissata f : Ft → R misura(f )
bile, l’applicazione che associa ad ogni insieme E ∈ B(R) l’insieme PE è un omomorfismo di
σ-algebre di Boole. Tutto ciò è uguale al caso quantistico.
Nel caso classico accadono alcuni ulteriori fatti. Prima di tutto è chiaro che non ci possono essere
218
(f )
(f 0 )
due funzioni misurabili differenti f ed f 0 con PE = PE per ogni E ∈ B(R). Più fortemente,
risulta che dalla σ-algebra di Boole associata a f si può ricostruire f stessa con una procedura
di limite.
La procedura è contenuta nella dimostrazione di una ben nota proposizione di teoria della misura che useremo più avanti (cfr la tesi e la dimostrazione del teorema 1.72 in [Rud82]). Per
enunciare la proposizione, ricordiamo che se X è uno spazio dotato di una σ-algebra di suoi
sottoinsiemi Σ, una funzione f : X → C è detta semplice se è misurabile rispetto a Σ ed assume solo un numero finito di valori. Le funzioni semplici formano uno spazio vettoriale complesso.
Proposizione 7.8. Sia X è uno spazio dotato di una σ-algebra di sottoinsiemi Σ.
(a) Lo spazio delle funzioni semplici (rispetto a Σ) da X in C è denso, in senso puntuale, nello
spazio delle funzioni misurabili (rispetto a Σ) da X a C.
(b) Lo spazio delle funzioni semplici (rispetto a Σ) da X in C è denso, rispetto alla norma
dell’estremo superiore, nello spazio delle funzioni limitate e misurabili (rispetto a Σ) da X a C.
(c) Se f : X → R è misurabile rispetto a Σ ed è non negativa, allora esiste una successione non
decrescente di funzioni semplici non negative che tende a f puntualmente, ovvero uniformemente se f è limitata.
Prova. È sufficiente provare la tesi nel caso di funzioni a valori reali, il caso complesso si ottiene
facilmente da questo, decomponendo le funzioni a valori complessi in parte reale ed immaginaria.
Definiamo le note funzioni f+ (x) := sup{0, f (x)} e f− (x) := inf{0, f (x)} per x ∈ Ft ; allora
f = f+ + f− , dove f+ ≥ 0 e f− ≤ 0 sono misurabili essendo f misurabile.
Ora costruiremo una successione di funzioni semplici che tende a f+ , tale costruzione dimostra,
tra le altre cose, il punto (c) dato che f = f+ se f ≥ 0.
Per 0 < n ∈ N fissato, costruiamo una partizione del semi asse reale [0, +∞) fatta da boreliani
En,i e En con
•
‹
i−1 i
En,i :=
,
, En := [n, +∞) ,
2n 2n
con 1 ≤ i ≤ n2n . Quindi, per ogni n, definiamo la classe degli insiemi misurabili
(f )
Pn,i := f −1 (En,i ) ,
Pn(f ) := f −1 (En ) .
Infine poniamo, per ogni n ∈ N:
s+,n :=
n
n2
X
i=1
i−1
χ (f ) + nχP (f ) .
n
2n Pn,i
(7.28)
Per costruzione 0 ≤ s+,n ≤ s+,n+1 ≤ f per n = 1, 2, . . .. Inoltre, per ogni fissato x risulta
|f+ (x) − s+,n (x)| ≤ 1/2n se n è abbastanza grande. È quindi evidente che s+,n → f+ puntualmente se n → +∞. La stima |f+ (x) − s+,n (x)| ≤ 1/2n è uniforme in x se f+ è limitata (basta
che sia n > sup f+ ), in tal caso la convergenza s+,n → f+ vale anche nel senso uniforme.
Si costruisce similmente, decomponendo il semiasse reale negativo con partizioni analoghe a
219
quella di sopra, una successione di funzioni semplici, s−,n ≤ 0 che converge puntualmente a f− .
La successione delle funzioni semplici s−,n + s+,n converge puntualmente a f e, per costruzione,
la convergenza è uniforme quando f è limitata. 2
La domanda che ci poniamo fin da ora nel caso quantistico è la seguente:
(A)
c’è un ente matematico associato ad ogni osservabile, A : B(R) 3 E 7→ PE , che corrisponde,
nel caso classico, alla funzione misurabile f che genera omomorfismo di σ-algebre di Boole degli
(f )
insiemi PE = f −1 (E)? Se la risposta è positiva, sussiste una procedura di decomposizionericostruzione di tale ente in termini della σ-algebra di Boole di proiettori?
Vedremo nel prossimo capitolo che la riposta ad entrambe le domande è positiva: ad ogni osservabile, definita come sopra, si associa in modo biunivoco un operatore autoaggiunto (generalmente
non limitato) sullo spazio di Hilbert del sistema, in modo tale che il complemento al più grande
(A)
insieme di R per cui PE = 0 (detto supporto di P (A) ), cioè l’insieme dei valori assumibili dall’osservabile A, coincide con lo spettro dell’operatore autoaggiunto associato all’osservabile. La
procedura di decomposizione-ricostruzione dell’operatore autoaggiunto a partire dall’osservabile
è essenzialmente il cosiddetto teorema spettrale.
L’associazione di un operatore ad una osservabile si attua definendo una opportuna procedura di
integrazione che associa ad insiemi di Borel operatori invece di numeri reali. In effetti la procedura di limite per ricostruire f basata sulle funzioni (7.28) può essere vista come una procedura
di integrazione rispetto ad una misura che associa ad insiemi di Borel (nello spazio dei valori
assumibili dalla funzione) E ⊂ C delle funzioni χf −1 (E) : X → C. In termini intuitivi, tenendo
conto che
i−1
2n
(f )
è approssimativamente il valore che f assume in Pn,i ,
f = lim
n
n2
X
n→+∞
i=1
i−1
χ (f ) + nχP (f )
n
2n Pn,i
può essere pensata come
Z
f=
λdχλ .
(7.29)
C
Non ci interessa andare a fondo in questa analogia (si può dare un senso matematicamente
rigoroso all’integrale di sopra), perché siamo interessati al caso quantistico in cui una formula
analoga a (7.29) definisce l’operatore autoaggiunto associato ad un’osservabile. Facciamo ora un
esempio elementare di osservabile e mostriamo come associare a essa un operatore autoaggiunto.
La teoria generale sarà sviluppata nei prossimi capitoli.
Esempi 7.1.
(1) Consideriamo un sistema quantistico descritto su uno spazio di Hilbert H e consideriamo
per esso una grandezza fisica A che, dal punto di vista fisico può assumere solo una quantità
discreta e finita di valori distinti {an }n=1,··· ,N ⊂ R. Ecco come associare a tale grandezza
un’osservabile, che indicheremo ancora con la stessa lettera A, data da una classe di proiettori
(A)
ortogonali PE con E boreliano di R. Postuliamo che esista una classe di proiettori ortogonali
220
non nulli etichettati sugli an , {Pan }n=1,··· ,N tale che Pan Pam = 0 se n 6= m (che equivale, per
aggiunzione, a Pam Pan = 0 se n 6= m) ed inoltre
N
X
Pan = I .
(7.30)
n=1
Il significato di Pan sarà ovviamente:
“il valore della grandezza A in seguito a misura di essa sul sistema risulta essere esattamente
an ” .
È chiaro che la richiesta Pan Pam = Pam Pan = 0, ossia Pan ∧ Pam = 0, se n 6= m corrisponde
alla duplice richiesta fisica che (a) le proposizioni Pan e Pam siano fisicamente compatibili, ma
(b) la misura dell’osservabile non possa produrre contemporaneamente il valore an ed anche il
valore distinto am (infatti la proposizione associata al proiettore nullo è quella impossibile). La
P
richiesta N
n=1 Pan = I, altrimenti scrivibile come Pa1 ∨ · · · ∨ Pan = I, corrisponde alla richiesta
che almeno una delle proposizioni Pan debba risultare verificata in seguito ad una misura dell’
osservabile A. L’osservabile A : T(R) → P(H) è costruita come segue: per ogni boreliano E ⊂ R
(A)
PE
X
:=
(A)
Pan ,
con P∅
:= 0 .
(7.31)
an ∈E
La verifica delle proprietà (a), (b), (c) e (d) della proposizione 7.10 è ora immediata per costruzione.
(2) Riferendoci all’esempio (1), possiamo associare all’osservabile A un operatore, che indicheremo ancora con la stessa lettera A. La definizione è la seguente
A :=
N
X
an Pan
(7.32)
n=0
L’operatore A è limitato ed autoaggiunto per costruzione essendo combinazione lineare a coefficienti reali di operatori autoaggiunti ed ha una ulteriore proprietà interessante:
σp (A) = {an }n=1,··· ,N , cioè, l’insieme degli autovalori di A coincide con i valori assumibili dall’osservabile A.
La prova di ciò è diretta: se 0 6= u ∈ Pan (H) allora Pam u = Pam Pan u = u se n = m oppure 0
se n 6= m. Inserendo questo risultato in (7.32) si ha subito che Au = an u per cui an ∈ σp (A).
Viceversa, se u 6= 0 è autovettore di A con autovalore λ (che deve essere reale dato che A = A∗ ),
deve risultare da (7.32):
λu =
N
X
an Pan u .
n=0
D’altra parte, essendo
risultare
P
an
Pan = I, modificando il primo membro dell’identità di sopra, deve
N
X
n=0
λPan u =
N
X
n=0
221
an Pan u ,
e quindi
N
X
(λ − an )Pan u = 0 .
(7.33)
n=0
Se applichiamo infine Pm ad ambo membri e ricordiamo che Pm Pn = δm,n Pn , otteniamo le N
identità
(λ − am )Pam u = 0 .
Se queste identità fossero tutte risolte da Pm u = 0 per ogni m avremmo un assurdo dovendo
essere
0 6= u = Iu =
N
X
Pan u .
n=0
Quindi ci deve essere qualche n in (7.33) per cui λ = an . Si noti che ciò può accadere per un solo
valore di n essendo per ipotesi gli an distinti. In definitiva l’autovalore λ di A deve coincidere
con uno dei valori an . Abbiamo provato che l’insieme degli autovalori di A coincide con i valori
assumibili dall’osservabile A. L’operatore autoaggiunto A gioca qui un ruolo analogo a quello
(f )
giocato dalla funzione f nel caso di una grandezza classica {PE }E∈T(R) .
Nei prossimi capitoli svilupperemo una procedura che consente di associare in modo univoco
ad ogni osservabile A (cioé ad ogni misura a valori di proiezione su R) un operatore autoaggiunto (generalmente non limitato) che indicheremo con la stessa lettera A, estendendo quanto
trovato negli esempi precedenti. I valori assumibili dall’osservabile saranno dati dagli elementi
dello spettro completo dell’operatore σ(A) che, come vedremo, è un insieme generalmente più
grande dell’insieme degli autovalori. Lo strumento centrale da utilizzare sarà la procedura d’integrazione rispetto ad una misura a valori di proiezione, che corrisponde alla generalizzazione
dell’espressione
Z
X
f (λ) dP (A) (λ) ,
f (λ)Pλ =:
σ(A)
λ∈σp (A)
(cfr (7.30) con f : λ 7→ 1 e (7.32) con f : λ 7→ λ ) al caso in cui i valori λ sono infiniti e possono
variare in modo continuo in tutto lo spettro di A. In particolare dovranno valere le identità, la
cui interpretazione verrà dalla teoria delle misure spettrali:
Z
A=
λ dP
(A)
Z
(λ) ,
σ(A)
7.5.3
I=
1 dP (A) (λ)
σ(A)
Misure di probabilità associate a coppie stato - osservabile.
Un’altra proprietà notevole delle misure a valori di proiezione su R è la seguente.
Ricordiamo che una misura di Borel µ su X, spazio topologico di Hausdorff localmente compatto,
è una misura µ, positiva, σ-additiva, sulla σ-algebra di Borel di X, B(X). La misura è detta di
probabilità se µ(X) = 1.
222
Proposizione 7.9. Sia H uno spazio di Hilbert e {PE }E∈B(R) una misura a valori di proiezione
su R. Se ρ ∈ S(H) è uno stato, l’applicazione µρ : E 7→ tr(ρPE ) è una misura di Borel di
probabilità su R.
Prova. La prova è elementare. Basta provare che µρ è positiva, σ-additiva e µρ (R) = 1. R
è di Hausdorff e localmente compatto, per cui ogni misura positiva σ-additiva sull’algebra di
Borel è una misura di Borel. Decomponiamo ρ come al solito su una base hilbertiana di suoi
autovettori:
X
ρ=
pj (ψj | )ψj ,
j∈N
dove i numeri pj sono non negativi e la loro somma è 1. Vale: µρ (E) = tr(ρPE ) ≥ 0 dato che
i proiettori ortogonali sono operatori positivi, i numeri Pj sono non negativi e che tr(ρPE ) =
P
j∈N pj (ψj |PE ψj ). Inoltre µρ (R) = 1 dato che, valendo PR = I,
X
pj (ψj |Iψj ) = trρ = 1 .
j∈N
Proviamo la σ-additività di µρ . Se {En }n∈N è una classe di boreliani disgiunti a due a due e
E := ∪n∈N En , allora vale, tenendo conto di (d) della proposizione 7.8:
+∞ > tr(ρPE ) =
+∞
X
pj
j=0
! +∞ +∞
+∞
X
XX
ψj PEi ψj =
pj (ψj |PEi ψj ) .
i=0
j=0 i=0
Dato che pj ≥ 0 e (ψj |PEi ψj ) ≥ 0, il teorema di Fubini permette di interscambiare le serie di
sopra, ottenendo:
tr(ρPE ) =
+∞
X +∞
X
pj (ψj |PEi ψj ) =
+∞
X
tr(ρPEi ) .
i=0
i=0 j=0
In altre parole, se {En }n∈N è una classe di boreliani disgiunti a due a due allora:
+∞
X
µρ (∪n∈N En ) =
µρ (En ) .
n=0
Questo conclude la dimostrazione. 2
Esempi 7.2.
(1) Consideriamo l’osservabile A che assume un numero finito N di valori discreti an vista
negli esempi (1) e (2) in Esempi 7.1 usando le stesse notazioni usate ivi. Sia A l’operatore
autoaggiunto associato all’osservabile. Fissiamo uno stato ρ ∈ S(H) e consideriamo la sua
(A)
misura di probabilità relativa all’osservabile {PE }E∈T(R) . Per costruzione, se E ∈ T(R),
(A)
µ(A)
ρ (E) := tr(ρPE ) =
X
an ∈E
223
tr(ρPan ) =
X
an
pn δan (E)
con
pn := tr(ρPan ) .
Quindi
X
µ(A)
=
ρ
pn δan ,
(7.34)
an
dove abbiamo usato le misure di Dirac δan centrate nei punti an : δa (E) = 1 se a ∈ E, oppure
P
δa (E) = 0 se a 6∈ E. Si osservi che 0 ≤ pn ≤ 1 e n pn = 1 per costruzione. Quindi la misura di
probabilità associata allo stato ρ e riferita all’osservabile A è di fatto una combinazione lineare
convessa di misure di Dirac.
(2) Il valore medio dell’osservabile A sullo stato ρ, hAiρ ed il suo scarto quadratico medio ∆A2ρ
sullo stato ρ, possono essere scritti in modo sintetico usando l’operatore A (7.32) associato
all’osservabile nel modo che segue. Per definizione di valore medio
hAiρ =
Z
a dµ(A)
ρ (a) .
R
D’altra parte, tenendo conto dell’espressione (7.34) si ha
Z
a dµ(A)
ρ (a) =
X
R
p n an =
n
X
an tr(ρPan ) .
n
Usando infine (7.32) e le proprietà lineari della traccia, concludiamo che:
hAiρ = tr(ρA) .
(7.35)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.35)
che, se hAiψ indica il valor medio di A sullo stato individuato dal vettore ψ,
hAiψ = (ψ|Aψ)
(7.36)
Per definizione lo scarto quadratico medio è
∆A2ρ
Z
2
a2 dµ(A)
ρ (a) − hAiρ .
=
R
Procedendo come nel caso del valor medio:
Z
a
2
dµ(A)
ρ (a)
=
X
R
pn a2n
=
n
‚
X
a2n tr(ρPan )
= tr ρ
n
Œ
X
a2n Pan
.
n
Si osservi ora che
A2 =
X
n
an Pan
X
m
am Pam =
X
an am Pan Pam =
n,m
dove abbiamo usato Pan Pam = δn,m Pn . In definitiva:
€
Š
∆A2ρ = tr ρA2 − (tr (ρA))2 .
224
X
a2n Pan = A2 ,
n
(7.37)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.37)
che, se ∆A2ψ indica lo scarto quadratico medio di A sullo stato individuato dal vettore ψ,
€
Š
€ €
Š Š
∆A2ψ = ψ|A2 ψ − (ψ|Aψ)2 = ψ| A2 − hAi2ψ ψ .
(7.38)
Le formule che abbiamo scritto negli esempi di sopra concernenti i valori medi e gli scarti quadratici medi di osservabili in fissati stati, sono in realtà valide nel caso generale (con opportune
attenzione ai domini) come sarà provato più avanti, quando avremo definito in maniera del tutto
generale la procedura per associare operatori autoaggointi ad osservabili.
7.5.4
Un accenno alle osservabili generalizzate in termini di “POVM”.
Nella dimostrazione della dimostrazione 7.9 non abbiamo usato la proprietà (a) in proposizione
7.7 che caratterizza le osservabili e, per quanto riguarda la proprietà (d) abbiamo usato solo
la convergenza in senso debole (implicata da quella forte). Abbiamo, in definitiva, provato la
seguente proposizione.
Proposizione 7.10. Sia H uno spazio di Hilbert e {PE }E∈B(R) una classe di operatori in B(H)
che soddisfano:
(a)’ PE ≥ 0 per ogni E ∈ B(R);
(b)’ PE = I;
(c)’ per ogni insieme numerabile di boreliani di R, {En }n∈N a due a due disgiunti, vale:
w-
+∞
X
PEn = P∪n∈N En .
n=0
Se ρ ∈ S(H), l’applicazione µρ : E 7→ tr(ρPE ) è una misura di Borel di probabilità su R.
I numeri µρ (E) sono le probabilità che il risultato di una misura dell’osservabile {PE }E∈B(R)
cadano nei boreliani E. È possibile, e talvolta conveniente, dare una definizione di osservabili
generalizzate, assumendo che esse siano descritte da applicazioni E 7→ PE che soddisfino le
richieste (a)’, (b)’ e (c)’, più deboli rispetto a quelle che possono essere usate per definire le misure
a valori di proiezione su R (cioé le osservabili) tramite la proposizione 7.7. In particolare, gli
operatori PE non sono più proiettori ortogonali, ma semplicemente operatori limitati e positivi.
Un esempio interessante di applicazione di queste osservabili generalizzate è quando si cerca di
definire un’osservabile tempo. Per esempio come l’osservabile associata al tempo di arrivo di
una particella in un detector. Vi sono profonde ragioni fisiche per asserire che tale osservabile
non può essere definita in termini di classi di proiettori5 .
5
Vedi per esempio: R. Giannitrapani Positive-operator-valued time observable in quantum mechanics. Internat.
J. Theoret. Phys. 36, 1575–1584, 1997 e R. Brunetti e K: Fredenhagen Remarks on time-energy uncertainty
realtions Rev. Math. Phys.14, 897-906, 2002.
225
Dal punto di vista matematico si ha la seguente definizione (vedi [BGL95] per una discussione
generale).
Definizione 7.8. Siano H uno spazio di Hilbert. Un’applicazione A : B(R) → B(H) è detta
misura a valori operatoriali positivi (POVM) se soddisfa le seguenti richieste:
(a)’ A(E) ≥ 0 per ogni E ∈ B(R);
(b)’ A(R) = I;
(c)’ per ogni insieme numerabile di boreliani di R, {En }n∈N a due a due disgiunti, vale:
w-
+∞
X
A(En ) = A(∪n∈N En ) .
n=0
Un’ osservabile generalizzata su H è una classe di operatori {AE }E∈B(R) tale che E 7→ AE
sia una misura a valori operatoriali positivi.
Note.
(1) Se A è una POVM su H, essendo B(H) 3 A(E) ≥ 0, ogni A(E) è autoaggiunto per ogni
boreliano E. Le condizioni (a)’ e (c)’ implicano che 0 ≤ A(E) ≤ I e ||A(E)|| ≤ 1 per ogni
boreliano E.
(2) Esiste un importante teorema, dovuto a Neumark che mostra lo stretto legame tra PVM e
POVM:
Teorema di Neumark. se A : B(R) → B(H) è una POVM sullo spazio di Hilbert H allora
esiste Un secondo spazio di Hilbert H0 che include H come sottospazio chiuso ed esiste un’applicazione P : B(R) → B(H0 ) che gode delle proprietà (a), (b), (c), (d) della proposizione 7.8, e
definisce quindi un’osservabile in H0 , tale che
U A(E)U = U P (E) ,
per ogni E ∈ B(H), essendo U : H0 → H il proiettore ortogonale su H.
È importante notare che, tuttavia, P (E) non ha, in generale, un diretto significato fisico, in
quanto H0 non è lo spazio di Hilbert del sistema.
(3) Se consideriamo l’insieme degli operatori limitati e positivi A ∈ B(H), con 0 ≤ A(E) ≤ I,
dove H è uno spazio di Hilbert, tale insieme è parzialmente ordinato rispetto a alla solita relazione
d’ordine ≥, tuttavia non è un reticolo (al contrario dell’insieme dei proiettori ortogonali). Questo
fatto non permette di generalizzare allo spazio degli operatori limitati positivi l’interpretazione
data ai dei proiettori ortogonali in termini di proposizioni sul sistema. Vedi [BGL95] per ulteriori
approfondimenti.
226
Capitolo 8
Teoria Spettrale su spazi di Hilbert
I: generalità ed operatori normali
limitati.
In questo capitolo, di carattere puramente matematico, introduciamo i primi rudimenti di teoria spettrale per operatori (generalmente non limitati) su spazi di Hilbert (complessi), fino ad
arrivare alla nozione di misura spettrale ed al teorema di decomposizione spettrale per operatori
limitati normali. Il caso degli operatori autoaggiunti non limitati sarà trattato nel prossimo
capitolo.
Nella prima parte introdurremo il concetto di risolvente e di spettro di un operatore. Lo spettro
di un operatore è un insieme di numeri complessi (associato ad ogni operatore) che generalizza
il concetto di insieme degli autovalori. Il teorema spettrale prova che ogni operatore (limitato
normale, oppure autoaggiunto non necessariamente limitato) può essere decomposto, in modo
unico, tramite una procedura di integrazione rispetto ad una opportuna misura a “valori di
proiezione”. In definitiva, tale teorema può essere visto come una generalizzazione negli spazi di
Hilbert del teorema di diagonabilizzabilità delle matrici normali a coefficienti in C. Lo spettro di
un operatore risulta essere il supporto della misura a valori di proiezione associata all’operatore
tramite il teorema spettrale. Gli strumenti matematici necessari per formulare il teorema spettrale sono utili anche per altri fini. Vedremo in fatti che, attraverso di essi, è possibile dare una
nozione di “operatore funzione di un secondo operatore”. Tale nozione ha molteplici applicazioni
in fisica matematica.
Il legame della teoria spettrale con la Meccanica Quantistica risiede nel fatto che le misure a
valori di proiezione non sono altro che le osservabili definite nel capitolo precedente. Attraverso
il teorema spettrale, le osservabili risultano essere in corrispondenza biunivoca con operatori
autoaggiunti (generalmente non limitati) e gli spettri di tali operatori costituiscono gli insiemi
degli esiti possibili delle misure quando si misurano le osservabili. La corrispondenza tra osservabili e operatori autoaggiunti permetterà di sviluppare la formulazione della teoria quantistica
in stretto legame con la meccanica classica, nella quale, le osservabili sono le grandezze fisiche
227
rappresentate da funzioni a valori reali.
Esaminiamo con più dettaglio il contenuto del capitolo.
Nella prima sezione definiremo, come detto sopra i concetti di: spettro, risolvente, operatore
risolvente, discutendone le proprietà più importanti ed in particolare la formula del raggio spettrale. Daremo le prorietà degli spettri di operatori autoaggiunti, unitari e normali.
Nella sezione successiva costruiremo degli ∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert che saranno lo strumento fondamentale
per fare il primo passo verso il teorema spettrale.
Nell’ultima sezione, dopo avere definito la nozione di integrale di una funzione limitata rispetto ad una PVM, sarà dimostrato il teorma spettrale sarà per operatori limitati normali (in
particolare autoaggiunti o unitari) in due versioni.
8.1
Spettro, risolvente, operatore risolvente.
In questa sezione ci occuperemo delle nozioni e dei risultati fondamentali della teoria spettrale
in spazi normati, di Banach e di Hilbert.
8.1.1
Nozioni fondamentali.
Definizione 8.1. Sia X spazio normato sul campo C e sia A : D(A) → X un operatore lineare,
dove D(A) ⊂ X è un sottospazio (non necessariamente denso) di X.
(a) Si dice insieme risolvente di A l’insieme ρ(A) dei λ ∈ C tali che siano soddisfatte le
seguenti tre condizioni:
(i) Ran(A − λI) = X;
(ii) (A − λI) : D(A) → X è iniettivo;
(iii) (A − λI)−1 : Ran(A − λI) → X è limitato.
(b) Se λ ∈ ρ(A), si dice (operatore) risolvente di A l’operatore
Rλ (A) := (A − λI)−1 : Ran(A − λI) → D(A) .
(c) Si dice spettro di A l’insieme σ(A) := C \ ρ(A). Lo spettro di A è unione dei seguenti tre
sottoinsiemi disgiunti:
(i) lo spettro puntuale di A, σp (A), costituito dai numeri complessi λ per cui l’operatore
A − λI non è iniettivo;
(ii) lo spettro continuo di A, σc (A), costituito dai numeri complessi λ per cui l’operatore
A − λI è iniettivo e vale l’identità Ran(A − λI) = X, ma (A − λI)−1 non è limitato;
(iii) lo spettro residuo di A, σr (A), costituito dai numeri complessi λ per cui l’operatore
A − λI è iniettivo, ma Ran(A − λI) 6= X.
Note.
(1) È chiaro che σp (A) contiene tutti e soli gli autovalori di A (vedi definizione 3.10). Nel caso
in cui X = H è uno spazio di Hilbert e gli autovettori di A formano una base hilbertiana di H,
228
si dice che A ha spettro puntuale puro. Si osservi che questo non significa, in generale, che
σp (T ) = σ(T ); per esempio gli operatori autoaggiunti compatti hanno tutti spettro puntuale
puro, tuttavia 0 può essere un punto dello spettro continuo.
(2) Nel seguito faremo uso della teoria delle funzioni analitiche (dette equivalentemente olomorfe) definite su sottoinsiemi aperti di C, dati dagli insiemi risolventi di operatori chiusi, a
valori in uno spazio di Banach sul campo complesso [Rud82]. La teoria è essenzialmente quella
delle funzioni analitiche a valori complessi già nota dai corsi elementari, con le uniche differenze
che, sull’immagine delle funzioni: (i) il valore assoluto deve essere sostituito con la norma dello
spazio di Banach e (ii) la coniugazione complessa deve essere rimpiazzata dalla coniugazione
hermitiana. Le definizioni, gli enunciati dei teoremi e le loro dimostrazioni sono gli stessi del
caso elementare, se si tiene conto delle due precisazioni dette sopra.
(3) Esistono altre decomposizioni dello spettro [ReSi80, AbCi97] nel caso in cui X = H sia
spazio di Hilbert e A sia operatore normale di B(H) oppure autoaggiunto in H, di cui diremo
nel capitolo seguente dopo aver dimostrato il teorema spettrale per operatori autoaggiunti non
limitati. Per uno studio dettagliato di tali classificazioni per operatori rilevanti in Meccanica
Quantistica si veda [AbCi97].
Lo spettro degli operatori autoaggiunti in uno spazio di Hilbert gioca un ruolo fondamentale
in Meccanica Quantistica, perché, come vedremo, è costituito dall’insieme dei possibili risultati
delle misure dell’osservabile associata all’operatore.
Rimaniamo per il momento in un contesto generale e proviamo il seguente teorema. Tra le altre
cose, il teorema prova che, se l’operatore T sullo spazio normato X è chiuso – in particolare,
quindi, se T ∈ B(X) oppure, per il teorema 5.1, se T è autoaggiunto o è l’aggiunto di un operatore su uno spazio di Hilbert – allora, per avere che λ ∈ ρ(T ) è necessario e sufficiente che
T − λI sia una biezione da D(T ) a tutto X. Non è quindi necessario controllare che l’inverso sia
continuo e nemmeno controllare che Ran(T − λI) sia denso.
Teorema 8.1. Sia X spazio di Banach sul campo C e sia T un operatore in X con dominio
D(T ). Se T è chiuso, valgono i seguenti fatti.
(a) λ ∈ ρ(T ) se e solo se T − λI è una biezione di D(T ) su X.
(b) ρ(T ) è aperto, σ(T ) è chiuso e ρ(T ) 3 λ 7→ Rλ (T ) è una funzione olomorfa su ρ(T ) a valori
nello spazio di Banach complesso B(X).
(c) Se D(T ) = X, allora ρ(T ) è non vuoto; se inoltre X 6= {0}, allora σ(T ) è un compatto non
vuoto ed in particolare vale:
|λ| ≤ ||T || , per ogni λ ∈ σ(T ).
(d) Per ogni λ, µ ∈ ρ(T ) vale l’equazione risolvente:
Rλ (T ) − Rµ (T ) = (λ − µ)Rλ (T )Rµ (T ) .
Note.
(1) Per il punto (a), se T ∈ B(X) con X spazio di Banach (e quindi T è chiuso per il teorema del
229
grafico chiuso), oppure se T = A∗ (e quindi T è chiuso per (a) del teorema 5.1) con A operatore
nello spazio di Hilbert X = H (in particolare se T = T ∗ ), allora il dominio di Rλ (T ) è tutto X e
quindi Rλ (T ) ∈ B(X) (il tutto se λ ∈ ρ(T )).
(2) Il punto (c) si applica in particolare al caso di operatori T ∈ B(X) per il teorema del grafico
chiuso.
Prova del teorema 8.1. (a) Se λ ∈ ρ(T ), basta provare che Ran(T −λI) = X. Dato che (T −λI)−1
è continuo, esiste K ≥ 0 per cui ||(T − λI)−1 x|| ≤ K||x|| per ogni x = (T − λI)y ∈ Ran(T − λI).
Di conseguenza, per ogni y ∈ D(T ) vale
||y|| ≤ K||(T − λI)y)|| .
(8.1)
Dato che Ran(T − λI) = X, se x ∈ X, esisterà una successione {yn }n∈N ⊂ D(T ) per cui (T −
λI)yn → x per n → +∞. Da (8.1) concludiamo che {yn }n∈N è successione di Cauchy e quindi
ammette limite y ∈ X. Essendo T un operatore chiuso, dovrà essere y ∈ D(T ) e (T − λI)y = x,
per cui x ∈ Ran(T − λI). Abbiamo provato che Ran(T − λI) = X, come volevamo.
Supponiamo ora che T − λI sia una biezione di D(T ) su X; per provare la tesi è sufficiente
mostrare che (T − λI)−1 è continuo. Poiché T è chiuso, allora anche T − λI è chiuso, cioè ha
grafico chiuso. Dato che T − λI è una biezione, segue subito che anche (T − λI)−1 ha grafico
chiuso ed è quindi chiuso. Essendo (T − λI)−1 definito su tutto X per ipotesi, il teorema del
grafico chiuso prova immediatamente che (T − λI)−1 è limitato.
(b) Se µ ∈ ρ(T ), la serie:
S(λ) :=
+∞
X
(λ − µ)n Rµ (T )n+1
n=0
converge assolutamente nella norma operatoriale (e quindi nella topologia uniforme) se
|λ − µ| < 1/||Rµ (T )|| .
(8.2)
Infatti vale:
+∞
X
n=0
|λ − µ|n ||Rµ (T )n+1 || ≤
+∞
X
|λ − µ|n ||Rµ (T )||n+1 = ||Rµ (T )||
n=0
+∞
X
| (λ − µ) ||Rµ (T )|| |n .
n=0
L’ultima serie è una serie geometrica di ragione | (λ − µ) ||Rµ (T )|| |, che converge in quanto
| (λ − µ) ||Rµ (T )|| | < 1 per la (8.2).
Se λ soddisfa la condizione di sopra, applicando T − λI = (T − µI) + (µ − λ)I a sinistra ed a
destra di S(λ), si ottiene immediatamente che (usando anche la definizione Rµ (T )0 := I)
(T − λI)S(λ) = IX
mentre
S(λ)(T − λI) = ID(T ) .
230
Abbiamo provato che se µ ∈ ρ, c’è un intorno aperto di µ tale che, per ogni punto λ di tale
intorno esiste ed è limitato l’inverso di T − λI da X a D(T ). Quindi, per (a), tale intorno è
incluso in ρ(T ) e allora ρ(T ) è aperto e σ(T ) = C \ ρ(T ) è chiuso. Inoltre Rλ (T ) è sviluppabile in
serie di Taylor nell’intorno di ogni punto di ρ(T ) secondo la topologia operatoriale uniforme, per
cui ρ(T ) 3 λ 7→ Rλ (T ) è una funzione olomorfa da ρ(T ) a valori nello spazio di Banach B(X).
(c) Nel caso D(T ) = X, essendo T chiuso e X spazio di Banach, il teorema del grafico chiuso
implica che T è limitato. Se λ ∈ C soddisfa |λ| > ||T ||, allora la serie
S(λ) =
+∞
X
(−λ)−(n+1) T n
n=0
(T 0 := I), converge assolutamente nella norma operatoriale. Per computo diretto si verifica che,
come nel caso precedente, valgono effettivamente le identità:
(T − λI)S(λ) = I
e anche
S(λ)(T − λI) = I ,
e quindi S(λ) = Rλ (T ) per (a). Quindi, per (a), ogni λ ∈ C con |λ| > ||T || appartiene a ρ(T ),
che è dunque non vuoto. Inoltre, se λ ∈ σ(T ), deve valere |λ| ≤ ||T ||, per cui, se σ(T ) è non
vuoto, allora è compatto perché chiuso e limitato. Mostriamo che σ(T ) 6= ∅. Supponiamo per
assurdo che σ(T ) = ∅. In tal caso λ 7→ Rλ (T ) è definita su tutto C. Fissiamo f ∈ X0 (duale
di X) e x ∈ X e consideriamo la funzione a valori complessi: ρ(T ) 3 λ 7→ g(λ) := f (Rλ (T )x).
Questa funzione è sicuramente analitica in ogni componente connessa dell’insieme aperto ρ(T ),
perché, per quanto provato sopra, se µ ∈ ρ(T ), in un intorno di µ tutto contenuto in ρ(T ), si ha
lo sviluppo di Taylor:
f (Rλ (T )x) :=
+∞
X
(λ − µ)n f (Rµ (T )n+1 x) ,
n=0
dove abbiamo sfruttato la continuità di f , ed il fatto che la serie converge nella topologia uniformemente (e quindi anche in quella debole). Dunque, nell’ipotesi in cui σ(T ) = ∅, g è una
funzione analitica su tutto C. Notiamo ancora che per |λ| > ||T || vale anche lo sviluppo:
g(λ) := f (Rλ (T )x) =
+∞
X
(−λ)−(n+1) f (T n x) .
n=0
Dato che tale serie converge assolutamente (per il teorema di Abel sulle serie di potenze),
possiamo scrivere, per |λ| ≥ 1 + ||T ||:
|g(λ)| ≤ |λ|−1
+∞
X
|λ|−n |f (T n x)| ≤
n=0
K
.
|λ|
per qualche K > 0. Quindi la funzione |g|, essendo continua ovunque e maggiorata da K|λ−1 |
per |λ| ≥ Λ per qualche costante Λ, deve essere limitata su tutto il piano complesso. Essendo
231
anche olomorfa su tutto il piano complesso, g deve essere costante per il teorema di Liouville.
Annullandosi |g(λ)| all’infinito, g deve essere la funzione nulla. Allora f (Rλ (T )x) = 0. Dato
che il risultato vale per ogni f ∈ X0 , il secondo corollario al teorema di Hahn-Banach (cap.2
sezione 2.3) implica che deve essere ||Rλ (T )x|| = 0. Dato che anche x ∈ X 6= {0} era arbitrario,
dobbiamo concludere che Rλ (T ) = 0 per ogni λ ∈ ρ(T ). Ma allora è impossibile che Rλ (T ) sia
l’operatore inverso di T − λI. L’assurdo prova che l’ipotesi σ(T ) = ∅ non può verificarsi.
(d) L’equazione risolvente si prova come segue. Valgono le equazioni (T − λI)Rλ (T ) = I e
(T − µI)Rµ (T ) = I. Esplicitando i prodotti: T Rλ (T ) − λRλ (T ) = IX e T Rµ (T ) − µRµ (T ) = IX .
Moltiplicando a sinistra la prima equazione per Rµ (T ) e la seconda per Rλ (T ), sottraendo
i risultati ottenuti membro a membro e tenendo conto che Rµ (T )Rλ (T ) = Rλ (T )Rµ (T ) e
che Rµ (T )T Rλ (T ) = Rλ (T )T Rµ (T ), si ottiene l’equazione risolvente. La prima relazione di
commutazione scritta sopra segue dall’evidente identità
(T − µI)(T − λI) = (T − λI)(T − µI)
che ne implica un’analoga per gli operatori inversi; la seconda relazione di commutazione si prova
come segue:
Rµ (T )T Rλ (T ) = Rµ (T )(T − λI)Rλ (T ) + Rµ (T )λIRλ (T ) = Rµ (T )I + λRµ (T )Rλ (T )
= Rµ (T ) + λRλ (T )Rµ (T ) = (I + λRλ (T ))Rµ (T ) = (Rλ (T )(T − λI) + λRλ (T ))Rµ (T )
= Rλ (T )T Rµ (T ) .
Questo conclude la dimostrazione. 2
8.1.2
Il raggio spettrale e la formula di Gelfand.
Se T è un operatore limitato in uno spazio di Banach con dominio dato da tutto lo spazio, per
il teorema 8.1 il suo spettro è contenuto nel cerchio di raggio ||T || centrato nell’origine di C.
Tuttavia potrebbe esserci un cerchio di raggio più piccolo, con lo stesso centro, che racchiude
σ(T ). A tal fine si fornisce la seguente definizione.
Definizione 8.2. Sia X spazio di Banach sul campo C. Il raggio spettrale di T ∈ B(X) è il
numero reale non negativo:
r(T ) := sup{|λ| | λ ∈ σ(T )} .
Esiste una celebre formula per il calcolo del raggio spettrale, dovuta al matematico Gelfand.
Otterremo la formula di Gelfand usando un risultato sullo spettro di polinomi di operatori limitati che avrà anche un’altra importante conseguenza nella sezione successiva.
Proposizione 8.2. Siano X spazio di Banach sul campo C, T ∈ B(X) e p = p(z) un polinomio
complesso nella variabile z ∈ C. Valgono i seguenti fatti.
232
(a) Se p(T ) indica l’operatore ottenuto sostituendo al numero z l’operatore T in p(z) ed interpretando ogni potenza T n come l’operatore ottenuto dalla composizione di T con se stesso n volte
(T 0 := I), vale:
σ(p(T )) = p(σ(T )) := {p(λ) | λ ∈ σ(T )} .
(8.3)
(b) Se X è uno spazio di Hilbert, lo spettro di T ∗ soddisfa
σ(T ∗ ) = σ(T ) := {λ | λ ∈ σ(T )}
(8.4)
.
Prova. (a) Se α1 , . . . , αn sono le radici di un polinomio q (non necessariamente distinte), vale
Q
Q
q(z) = c ni=1 (z − αi ), per qualche complesso c. Quindi q(T ) = c ni=1 (T − αi I). Sia λ ∈ σ(T ):
allora (T −λI) : X → X non è biettivo per (a) di teorema 8.1; definiamo µ := p(λ). Consideriamo
il polinomio q := p − µ. Dato che q(λ) = 0, uno dei fattori della decomposizione di q scritta
sopra sarà (z − λ). Di conseguenza, scegliendo opportunamente l’ordine delle radici e tenendo
conto che gli operatori T − αi I commutano tra di loro, si ha:
p(T ) − µI = c
"n−1
Y
#
(T − αi I) (T − λI) = c(T − λI)
i=1
n−1
Y
(T − αi I) .
i=1
Come conseguenza, p(T ) − µI non potrà essere biettivo come operatore da X a X, essendo T − λI
non biettivo. Per (a) del teorema 8.1 deve allora essere µ ∈ σ(p(T )). Abbiamo quindi provato
che p(σ(T )) ⊂ σ(p(T )). Per concludere proviamo l’altra inclusione. Sia µ ∈ σ(p(T )): poniamo
Q
q = p − µ e decomponiamo il polinomio q come q(z) = c ni=1 (z − αi ). Avremo l’analoga
decomposizione
p(T ) − µI = c
n
Y
(T − αi I) .
i=1
Se tutte le radici αi appartenessero a ρ(T ), allora ogni (T − αi I) : X → X sarebbe biettivo e
quindi sarebbe biettivo p(T ) − µI, cosa che è esclusa per ipotesi. Di conseguenza ci sarà una
radice αk tale che (T − αk I) : X → X non è biettivo e quindi (sempre per (a) del teorema 8.1)
αk ∈ σ(T ). Ma allora p(αk ) − µ = 0 e dunque µ ∈ p(σ(T )), il che implica p(σ(T )) ⊃ σ(p(T )).
(b) Dalla proposizione 3.6, (T − λI) : X → X è biettivo se e solo se T ∗ − λI lo è; (a) del teorema
8.1 implica allora la tesi. 2
Teorema 8.2. Siano (X, || ||) spazio di Banach e T ∈ B(X).
(a) Il raggio spettrale di T si ottiene tramite la formula di Gelfand
r(T ) = lim ||T n ||1/n ,
n→+∞
dove il limite a secondo membro esiste sempre.
(b) Se X è spazio di Hilbert e T è normale (T ∈ B(X)), allora vale sempre
r(T ) = ||T || .
233
Prova.(a) Per (a) di proposizione 8.2 si ha (σ(T ))n = σ(T n ), per cui r(T )n = r(T n ) ≤ ||T n || e
quindi vale
r(T ) ≤ lim inf ||T n ||1/n .
(8.5)
n
(Si noti che, al contrario del limite inferiore, che esiste sempre, il limite potrebbe non esistere.)
Se |λ| > r(T ), allora vale
Rλ (T ) =
+∞
X
(−λ)−(n+1) T n ,
(8.6)
n=0
perché, per il teorema di Hadamard, il bordo del cerchio di convergenza di una serie di potenze
di Laurent di una funzione analitica è quello che passa nella singolarità più vicina al punto
all’infinito. Nel caso in esame, dato che tutte le singolarità appartengono allo spettro σ(T ), il
bordo del cerchio di convergenza è dato dai punti λ ∈ C con |λ| > r(T ). In definitiva, la serie
di sopra converge per ogni λ ∈ C tale che |λ| > r(T ) e quindi convergerà assolutamente in ogni
cerchio, centrato nel punto all’infinito, che passa per un tale λ. In particolare varrà
|λ|−(n+1) ||T n || → 0 ,
se n → +∞, per ogni λ ∈ C con |λ| > r(T ). Per ogni > 0, deve accadere allora che,
definitivamente:
||T n ||1/n < 1/n |λ|(n+1)/n = (|λ|)1/n |λ| ,
per cui, essendo (|λ|)1/n → 1 per n → +∞, accadrà che lim supn ||T n ||1/n ≤ |λ| per ogni λ ∈ C
con |λ| > r(T ). Dato che possiamo avvicinarci a piacere al valore di r(T ) con |λ|, dovrà accadere
che lim supn ||T n ||1/n ≤ r(T ). Tenendo conto di (8.5), abbiamo infine che:
r(T ) ≤ lim inf ||T n ||1/n ≤ lim sup ||T n ||1/n ≤ r(T ) .
n
n
Questo prova che esiste il limite di ||T n ||1/n per n → +∞ e che esso coincide con r(T ).
(b) Per (a) di proposizione 3.7, tenendo conto che B(X) è una C ∗ -algebra con involuzione ∗ (vedi
nota prima della proposizione 3.7), abbiamo che ||T n || = ||T ||n se T è normale. Applicando la
formula di Gelfand, si ha:
r(T ) = lim ||T n ||1/n = lim (||T ||n )1/n = ||T || .
n→+∞
n→+∞
Questo completa la dimostrazione. 2
Nota. Il punto (b) vale in particolare se T è autoaggiunto oppure se T è unitario.
234
8.1.3
Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert.
Passiamo a considerare il caso specifico di operatori unitari e di operatori autoaggiunti.
Proposizione 8.3. Sia H spazio di Hilbert. Valgono i seguenti fatti.
(a) Se A è operatore autoaggiunto in H (non necessariamente limitato e non definito su tutto H
in generale), allora:
(i) σ(A) ⊂ R,
(ii) σr (A) = ∅,
(iii) autospazi di A con autovalori (cioè punti di σp (A)) distinti sono ortogonali.
(b) Se U ∈ B(H) è operatore unitario, allora:
(i) σ(U ) è un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1},
(ii) σr (U ) = ∅.
(c) Se T ∈ B(H) è operatore normale, allora:
(i) σr (T ) = σr (T ∗ ) = ∅,
(ii) σp (T ∗ ) = σp (T ),
(iii) σc (T ∗ ) = σc (T ).
Prova. (a) Cominciamo con (i). Supponiamo λ = µ + iν con ν 6= 0 e proviamo che λ ∈ ρ(A).
Se x ∈ D(A), vale:
((A − λI)x|(A − λI)x) = ((A − µI)x|(A − µI)x) + ν 2 (x|x) + iν[(Ax|x) − (x|Ax)] .
L’ultimo addendo è nullo perché A è autoaggiunto. Concludiamo che
||(A − λI)x|| ≥ |ν| ||x|| .
Con la stessa procedura si trova anche che
||(A − λI)x|| ≥ |ν| ||x|| .
Gli operatori A − λI e A − λI saranno dunque iniettivi e varrà ||(A − λI)−1 || ≤ |ν|−1 , dove
(A − λI)−1 : Ran(A − λI) → D(A). Notiamo ora che vale
⊥
Ran(A − λI) = [Ran(A − λI)]⊥ = Ker(A∗ − λI) = Ker(A − λI) = {0} ,
dove, nell’ultimo passaggio, si è tenuto conto del fatto che A − λI è iniettivo. Riassumendo, vale
⊥
che: A − λI è iniettivo, (A − λI)−1 è limitato e Ran(A − λI) = {0}, cioè Ran(A − λ) è denso
in H; quindi λ ∈ ρ(A), per definizione di insieme risolvente.
Passiamo a (ii). Supponiamo che λ ∈ σ(A), ma che λ 6∈ σp (A). In tal caso A − λI deve
essere iniettivo e quindi Ker(A − λI) = {0}. Essendo A = A∗ e λ ∈ R per (i), vale allora
Ker(A∗ − λI) = {0}, per cui [Ran(A − λI)]⊥ = Ker(A∗ − λI) = {0} e quindi Ran(A − λI) = H.
Di conseguenza λ ∈ σc (A).
235
La prova di (iii) è immediata: se λ 6= µ e Au = λu, Av = µv, allora, tenendo conto del fatto che
λ, µ ∈ R e che A = A∗ ,
(λ − µ)(u|v) = (Au|v) − (u|Av) = (u|Av) − (u|Av) = 0 ;
essendo λ − µ 6= 0, deve essere (u|v) = 0.
(b) (i) Il fatto che σ(U ) sia chiuso segue subito da (b) del teorema 8.1, dato che ogni operatore
unitario è definito su tutto H, limitato e, quindi, chiuso. Essendo ||U || = 1, da (c) dello stesso
teorema segue anche che σ(U ) è un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| ≤ 1}.
Per concludere, consideriamo la serie
S(λ) =
+∞
X
λn (U ∗ )n+1
n=0
dove |λ| < 1. Tenendo conto che ||U || = ||U ∗ || = 1, si vede immediatamente che la serie converge
assolutamente nella norma operatoriale e quindi definisce un operatore di B(H). Tenendo infine
conto che U ∗ U = U U ∗ = I ed usando la serie scritta sopra, si ha che
(U − λI)S(λ) = S(λ)(U − λI) = I .
Per (a) del teorema 8.1, deve allora essere λ ∈ ρ(U ). In definitiva: σ(U ) è un sottoinsieme
compatto e non vuoto di {λ ∈ C | |λ| = 1}.
(ii) La tesi è conseguenza di (i) di (c), essendo normale ogni operatore unitario. Diamo comunque una dimostrazione indipendente. Se λ ∈ σr (U ), allora Ran(U − λI) non è denso, per
cui esiste f 6= 0 normale a Ran(U − λI). Allora, per ogni g ∈ H: (f |λg) = (f |U g) e quindi
(λf |g) = (U ∗ f |g) per ogni g ∈ H. Di conseguenza: U ∗ f = λf . Facendo agire U membro a
membro, troviamo f = λU f , che implica U f = λf perché, essendo |λ| = 1, vale 1/λ = λ.
Quindi λ ∈ σp (U ) e ciò è assurdo, essendo lo spettro puntuale e lo spettro residuo disgiunti;
pertanto σr (U ) = ∅.
(c) Ricordiamo che, se T ∈ B(H) è normale, allora λ ∈ C è autovalore di T se e solo se λ è
autovalore di T ∗ ((i) di (b) in proposizione 3.8). Questo fatto da solo prova (ii). Essendo le
tre parti dello spettro disgiunte e valendo σ(T ) = σ(T ∗ ) ((b) proposizione 8.2), per provare (iii)
basta dimostrare (i). Supponiamo che λ ∈ σ(T ), ma che λ 6∈ σp (T ). Essendo σ(T ) = σ(T ∗ )
e σp (T ) = σp (T ∗ ), questo equivale a dire che λ ∈ σ(T ∗ ), ma che λ 6∈ σp (T ∗ ). In tal caso
T ∗ − λI deve essere iniettivo e quindi Ker(T ∗ − λI) = {0}. Allora (per (d) di proposizione 3.6)
[Ran(T − λI)]⊥ = Ker(T ∗ − λI) = {0} e quindi Ran(T − λI) = H. Di conseguenza λ ∈ σc (T ).
In altre parole σr (T ) = ∅. La dimostrazione per T ∗ è la stessa, usando il fatto che (T ∗ )∗ = T
((b) di proposizione 3.6). 2
Esercizi 8.1.
(1) Si supponga che valgano le ipotesi del teorema 8.1 con X = H spazio di Hilbert.
Mostrare che se Rλ (T ) è compatto per λ = λ0 ∈ ρ(T ), allora è compatto per ogni λ ∈ ρ(T ).
236
Suggerimento. Si usi l’equazione risolvente e le proprietà dello spazio degli operatori compatti.
(2) Sia H = l2 (N) e si consideri l’operatore:
T : (x0 , x1 , x2 , . . .) 7→ (0, x0 , x1 , . . .) .
Determinare lo spettro di T .
(3) Siano H spazio di Hilbert e T = T ∗ ∈ B(H) compatto. Mostrare che se dim(RanT ) non è
finita, allora σc (T ) 6= ∅ ed è costituito da un punto solo.
Suggerimento. Decomporre T come nel teorema 4.3, tenere conto del teorema 4.2 ed infine
del fatto che σ(T ) è chiuso per il teorema 8.1.
(4) Costruire un operatore autoaggiunto con spettro puntuale denso in [0, 1].
Suggerimento. Si consideri lo spazio di Hilbert H = l2 (N), si numerino i razionali in [0, 1]
secondo un ordine qualsiasi: r0 , r1 , . . . e si definisca l’operatore
T : (x0 , x1 , x2 , . . .) 7→ (r0 x0 , r1 x1 , r2 x2 , . . .)
con dominio D(T ) dato dalle successioni (x0 , x1 , x2 , . . .) ∈ l2 (N) tali che
+∞
X
|rn xn |2 < +∞ .
n=0
(5) Mostrare che se T è autoaggiunto sullo spazio di Hilbert H e λ ∈ ρ(T ), allora Rλ (T ) è un
operatore normale di B(H) che soddisfa:
Rλ (T )∗ = Rλ (T ) .
(6) Mostrare che se U : H → H, con H spazio di Hilbert, è operatore isometrico non suriettivo,
allora σr (U ) 6= ∅.
Suggerimento. Provare che 0 ∈ σ(U ). U − 0I è iniettivo, ma Ran(U − 0I) = RanU non è
denso. Se fosse denso accadrebbe che, per ogni f ∈ H, esisterebbe {fn }n∈N ⊂ H con U fn → f .
Conservando U la norma, {fn } sarebbe di Cauchy perché lo è {U fn }, ma allora, se fn → g,
avremmo U g = f . Dato che f ∈ H è arbitrario, avremmo che U è suriettivo, cosa esclusa a
priori.
(7) Sia A un operatore nello spazio di Hilbert H con dominio D(A) e sia U : H0 → H un’isometria
suriettiva tra spazi di Hilbert. Provare che, se A0 := U −1 AU : D(A0 ) → H0 , con D(A0 ) =
U −1 D(A), allora σp (A) = σp (A0 ), σp (A) = σp (A0 ), σr (A) = σr (A0 ).
(8) Si consideri l’operatore posizione Xi definito in definizione 5.7. Mostrare che σ(Xi ) =
σc (Xi ) = R.
(9) Si consideri l’operatore impulso Xi definito in definizione 5.9. Mostrare che σ(Pi ) = σc (Pi ) =
R.
Suggerimento. Usare la proposizione 5.6.
(10) Se σ(A) = σ(B), per due operatori A e B in uno spazio di Hilbert, allora è vero che
σp (A) = σp (B)?
237
Suggerimento. Considerare l’operatore dell’esercizio (4) e l’operatore moltiplicativo per la
coordinata x in L2 ([0, 1], dx), dove dx è la misura di Lebesgue su R.
11. Si consideri l’operatore di Volterra T : L2 ([0, 1], dx) → L2 ([0, 1], dx) definito in (4.35) e se
ne studi lo spettro.
Suggerimento. σ(T ) = σc (T ) = {0}.
8.2
∗-omomorfismi continui di C ∗ -algebre di funzioni indotti da
operatori limitati autoaggiunti in spazi di Hilbert.
Mostreremo in questa sezione come sia possibile costruire una trasformazione continua, che
conservi la struttura di C ∗ -algebra, da uno spazio di funzioni misurabili limitate e definite su
un compatto, allo spazio degli operatori limitati e definiti su uno spazio di Hilbert H. La
trasformazione suddetta è “generata” da un operatore autoaggiunto T ∈ B(H). Il primo passo
per costruire tali trasformazioni consiste nello studio di funzioni polinomiali di T e T ∗ nel caso
più generale in cui T ∈ B(H) sia un operatore normale. Per ragioni tecniche è conveniente, in
certi casi, esprimere tali polinomi in funzione di due variabili autoaggiunte che ora introduciamo.
Consideriamo un operatore normale T ∈ B(H), dove H è uno spazio di Hilbert. Possiamo sempre
decomporre T e T ∗ in combinazioni lineari di due operatori autoaggiunti, X, Y , commutanti tra
di loro:
T = X + iY , T ∗ = X − iY ,
(8.7)
essendo per definizione
T + T∗
T − T∗
, Y :=
.
(8.8)
2
2i
Gli operatori X e Y sono evidentemente autoaggiunti per costruzione. La prova del fatto che
X e Y commutano è immediata, in virtù della commutatività di T e T ∗ .
La decomposizione (8.7) è analoga a quella dei numeri complessi in parte reale ed immaginaria:
X :=
z = x + iy ,
z = x − iy ,
(8.9)
z−z
.
2i
(8.10)
essendo per definizione
x :=
z+z
,
2
y :=
Nota. È importante precisare che si possono considerare z e z come variabili indipendenti,
biunivocamente legate con le variabili x, y. I polinomi e, più in generale, le funzioni di x e
y sono allora in corrispondenza biunivoca con le funzioni di z e z: alla funzione f = f (z, z)
si può associare la funzione g = g(x, y), definita come g(x, y) := f (x + iy, x − iy) e, viceversa, alla funzione g = g(x, y) si può associare la funzione f1 = f1 (z, z), definita come
f1 (z, z) := g((z + z)/2, (z − z)/2i). È chiaro che vale f1 = f identicamente. Sfrutteremo tale
possibilità in seguito.
238
L’applicazione φT che associa ad un polinomio a coefficienti complessi p = p(x, y), (x, y) ∈ R2 ,
l’operatore normale p(X, Y ) (definito nel modo più ovvio, interpretando i prodotti di numeri x
e y come composizione di operatori X e Y e definendo X 0 := Y 0 := I) ha delle caratteristiche
interessanti, la cui verifica è immediata, tenendo conto del fatto che X e Y (e dunque le loro
potenze) commutano:
(a) è lineare: φT (αp + βp0 ) = αφT (p) + βφT (p0 ) per ogni α, β ∈ C,
(b) manda il prodotto di polinomi nella composizione di operatori: φT (p·p0 ) = φT (p)◦φT (p0 ),
(c) manda il polinomio che vale costantemente 1 nell’operatore identità: φT (1) = I .
Queste proprietà, per definizione (cfr A7 in definizione 2.4), rendono φT un omomorfismo di
algebre con unità, definito sulla ∗ -algebra con unità dei polinomi complessi e a valori nella
C ∗ -algebra B(H). Ci sono ancora tre proprietà interessanti di φT :
(d) manda il polinomio R2 (x, y) 7→ z = x + iy, che indicheremo un po’ impropriamente con
z, nell’operatore T : φT (z) = T ;
(e) se p denota il polinomio complesso coniugato del polinomio p (p(x, y) = p(x, y) per ogni
(x, y) ∈ R2 ), vale φT (p)∗ = φT (p);
(f) se, per A ∈ B(H), valgono AT = T A e AT ∗ = T ∗ A, allora AφT (p) = φT (p)A per ogni
polinomio p.
C’è un’altra interessante proprietà che si riscontra quando si restringe il dominio dei polinomi
considerati ad un compatto di R2 . Consideriamo, per esempio, un polinomio p = p(x, y) definito
sul compatto σ(T ) e tale che si possa scrivere come funzione della variabile z = x + iy. Questo
accade, in particolare, se T = T ∗ , nel qual caso σ(T ) ⊂ R. Possiamo allora scrivere p = p(z),
oppure, nel caso in cui T = T ∗ , p = p(x).
Dato che φT (p) = p(T ) è un operatore normale, deve essere che, in virtù di (b) del teorema 8.2:
||p(T )|| = r(p(T )) = sup{|µ| ∈ C | µ ∈ σ(p(T ))} .
La proposizione 8.2 implica allora che:
||φT (p)|| = sup{|p(z)| | z ∈ σ(T )} .
(8.11)
Questo fatto può essere esteso, con opportune precisazioni, al caso di funzioni non necessariamente polinomiali. Occupiamoci ora, in modo specifico, del caso in cui T sia autoaggiunto.
Proposizione 8.4. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto.
(a) Esiste un unico omomorfismo continuo, ΦT : C(σ(T )) → B(H), dalla C ∗ -algebra commutativa con unità C(σ(T )) (spazio delle funzioni continue a valori complessi f = f (x), per x ∈ σ(T ),
dotato della norma dell’estremo superiore || ||∞ e con involuzione data dalla coniugazione
complessa) alla C ∗ -algebra con unità B(H), che gode della proprietà
ΦT (x) = T ,
dove x è il polinomio σ(T ) 3 x 7→ x.
(b) ΦT gode delle ulteriori seguenti proprietà:
(i) per ogni f ∈ C(σ(T )) vale ||ΦT (f )|| = ||f ||∞ ;
239
(8.12)
(ii) se, per A ∈ B(H), vale AT = T A, allora AΦT (f ) = ΦT (f )A per ogni f ∈ C(σ(T ));
(iii) ΦT è uno ∗ -omomorfismo di C ∗ -algebre, valendo ΦT (f ) = ΦT (f )∗ per ogni f ∈ C(σ(T )).
Prova. (a) Dimostriamo l’esistenza. Lo spettro σ(T ) ⊂ R è compatto per (c) del teorema
8.1 ed è spazio topologico di Hausdorff perché tale è R, quindi possiamo applicare il teorema
di Stone-Weierstrass. Lo spazio P (σ(T )) dei polinomi p = p(x), con x ∈ σ(T ), a coefficienti
complessi, costituisce una sottoalgebra di C(σ(T )) che contiene l’unità, data dalla funzione di
valore costantemente pari a 1, separa i punti di σ(T ) (se x1 , x2 ∈ σ(T ) con x1 6= x2 , il polinomio
p(x) := x − x1 su σ(T ) è tale che p(x1 ) = 0, ma p(x2 ) 6= 0) ed è chiusa rispetto alla coniugazione
complessa. Il teorema di Stone-Weierstrass ((5) in esempi 2.1) assicura che lo spazio dei polinomi
considerati è denso in C(σ(T )). Consideriamo l’applicazione (definita prima della proposizione
8.4)
φT : P (σ(T )) 3 p 7→ p(X, Y ) ∈ B(H) .
Sappiamo che φT è lineare e vale inoltre ||φT (p)|| = ||p||∞ per (8.11), il che implica la continuità
di φT . È noto che un operatore lineare continuo T : D(T ) → Y, dove Y è uno spazio di Banach
e D(T ) un sottospazio denso di uno spazio normato X, ammette un’unica estensione limitata
TÒ : X → Y e vale ||TÒ|| = ||T || (vedi gli esercizi svolti (3) e (4) in esercizi 2.1). Di conseguenza
esisterà un unico operatore lineare ΦT : C(σ(T )) → B(H) limitato che estende φT su C(σ(T )).
Tale operatore è un omomorfismo di algebre con unità in quanto: (a) è lineare, (b) soddisfa
ΦT (f · g) = ΦT (f )ΦT (g) per continuità (dato che, banalmente, ciò è vero sulla sottoalgebra dei
polinomi per definizione di φT ), (c) trasforma la funzione che vale costantemente 1 ∈ P (σ(T ))
nell’operatore identità I ∈ B(H) per definizione di φT . Infine, la (8.12) è banalmente vera in
virtù della proprietà (d) dell’applicazione φT .
Passiamo all’unicità: ogni altro omomorfismo χT di algebre con unità che soddisfa (8.12), deve
coincidere con ΦT sullo spazio dei polinomi. (Infatti, deve essere T = χT (x) = ΦT (x) e quindi,
usando più volte il fatto che il prodotto di polinomi è trasformato nella composizione di operatori, T n = χT (xn ) = ΦT (xn ); inoltre, l’ulteriore identità I = χT (1) = ΦT (1) vale per definizione
di omomorfismo tra algebre con unità. Usando la linearità, si ottiene che, per ogni p ∈ P (σ(T )),
vale p(T ) = χT (p) = ΦT (p).) Se χT è anche continuo, per l’unicità dell’estensione continua
coinciderà con ΦT ovunque.
(b) Le proprietà (i) e (ii) si provano immediatamente se f è un polinomio e quindi si estendono
direttamente per continuità al caso di f ∈ C(σ(T )). Infine l’omomorfismo è uno ∗ -omomorfismo
in quanto, se {pn } è una successione di polinomi che tende, uniformemente su σ(T ), alla funzione
continua f , {pn } tenderà, uniformemente su σ(T ), alla funzione continua f ; d’altra parte, come
visto sopra (cfr proprietà (e) di φT ), ΦT (pn ) = ΦT (pn )∗ e l’operazione di coniugazione hermitiana è continua nella topologia operatoriale uniforme. Per la continuità di ΦT , dovrà quindi
essere: ΦT (f ) = ΦT (f )∗ . 2
Notazione 8.1. Ricordiamo che se X è uno spazio topologico, B(X) indica la σ-algebra di Borel
su X. La C ∗ -algebra delle funzioni f : X → C Borel-misurabili e limitate M (X, B(X)) (vedi (3)
240
in esempi 2.1) sarà nel seguito indicata semplicemente con M (X).
Rimanendo nel caso T = T ∗ , la proposizione appena provata può essere estesa dimostrando l’esistenza e l’unicità di un analogo omomorfismo di algebre con unità tra M (σ(T )) e B(H) (dove
la topologia usata su σ(T ) è quella indotta dalla topologia di R ⊃ σ(T )).
Teorema 8.3. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto.
ÒT : M (σ(T )) → B(H), dalla C ∗ -algebra commuta(a) Esiste un unico omomorfismo continuo, Φ
tiva con unità M (σ(T )) (spazio delle funzioni misurabili limitate a valori complessi definite sul
compatto di Hausdorff σ(T ), dotato della norma dell’estremo superiore || ||∞ e con involuzione
data dalla coniugazione complessa) alla C ∗ -algebra con unità B(H), tale che:
(i) vale l’identità:
ÒT (x) = T ,
Φ
dove x è la funzione σ(T ) 3 x 7→ x ;
(8.13)
(ii) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora
ÒT (f ) = w- lim Φ
ÒT (fn ) .
Φ
n→+∞
ÒT gode delle ulteriori seguenti proprietà:
(b) Φ
ÒT si riduce all’omomorfismo isometrico ΦT su C(σ(T )) di proposizione 8.4;
(i) Φ
ÒT (f )|| ≤ ||f ||∞ ;
(ii) per ogni f ∈ M (σ(T )) vale ||Φ
ÒT (f ) = Φ
ÒT (f )A per ogni f ∈ M (σ(T ));
(iii) se, per A ∈ B(H), vale AT = T A, allora AΦ
∗
∗
Ò
Ò
ÒT (f )∗ per ogni f ∈ M (σ(T ));
(iv) ΦT è uno -omomorfismo di C -algebre, valendo ΦT (f ) = Φ
(v) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora
ÒT (f ) = s- lim Φ
ÒT (fn ) ;
Φ
n→+∞
ÒT (f ) ≥ 0.
(vi) se f ∈ M (σ(T )) assume solo valori reali e f ≥ 0, allora Φ
Nota. A commento di (ii) in (a), notiamo che la convergenza in senso debole di una successione
di operatori in uno spazio di Hilbert H può essere definita in modo equivalente mediante prodotti
scalari, usando il teorema 3.2 (di Riesz), che identifica lo spazio H con il suo duale topologico
H0 . Se {An }n∈N ⊂ L(H) e A ∈ L(H), scrivere che A = w-limn→+∞ An significa che, per ogni
coppia x, y ∈ H, (x|An y) → (x|Ay) per n → +∞.
Prova del teorema 8.3. (a) Fissati x, y ∈ H, l’applicazione:
Lx,y : C(σ(T )) 3 f 7→ (x|ΦT (f )y) ∈ C
è lineare e ||Lx,y || è dato da:
sup{|Lx,y (f )| | f ∈ C(σ(T )) , ||f ||∞ = 1} ≤ ||x|| ||y|| sup{||ΦT (f )|| | f ∈ C(σ(T )) , ||f ||∞ = 1}
241
(dove si è usata la disuguaglianza di Cauchy-Schwartz), da cui, usando il fatto che ΦT è
isometrico, troviamo:
||Lx,y || ≤ ||x|| ||y|| ,
e quindi Lx,y è limitato.
Per il teorema della rappresentazione di Riesz per le misure complesse (cfr. (1) in esempi 2.2),
esiste un’unica misura complessa µx,y sul compatto σ(T ) ⊂ C tale che, per ogni f ∈ C(σ(T )), si
abbia:
Z
Lx,y (f ) = (x|ΦT (f )y) =
f (λ) dµx,y (λ) ;
(8.14)
σ(T )
vale inoltre |µx,y |(σ(T )) = ||Lx,y || ≤ ||x|| ||y||. Notiamo per inciso che se x = y, allora µx,x
è una misura reale, positiva e finita: infatti, se f ∈ C(σ(T )) assume solo valori reali, vale
ΦT (f ) = ΦT (f )∗ per (iii) di (b) nella proposizione 8.4, per cui:
Z
Z
f (λ) h(λ)d|µx,x (λ)| =
σ(T )
f (λ) h(λ)d|µx,x (λ)| = (x|ΦT (f )x) = (ΦT (f )x|x) = (x|ΦT (f )x)
σ(T )
Z
=
f (λ) h(λ)d|µx,x (λ)| ,
σ(T )
dove abbiamo decomposto dµx,x in hd|µx,x |, essendo h una funzione misurabile di modulo unitario individuata quasi ovunque da µx,x e |µx,x | la misura positiva associata a µx,x (vedi [Rud82]).
Per linearità, la relazione
Z
Z
f (λ) h(λ)d|µx,x (λ)| =
f (λ) h(λ)d|µx,x (λ)|
σ(T )
σ(T )
deve valere anche quando f ∈ C(σ(T )) prende valori complessi. Il teorema di Riesz sulle misure
complesse assicura allora che hd|µx,x | = hd|µx,x |, per cui h(λ) = h(λ) quasi ovunque, ma essendo
|h(λ)| = 1, segue che h(λ) = 1 quasi ovunque e quindi µx,x è una misura reale, positiva e finita
(perché tale è |µx,x |).
Usiamo (8.14) per estendere Lx,y (f ) al caso generale in cui f ∈ M (σ(T )), dato che il secondo
membro è comunque ben definito: se g ∈ M (σ(T )),
Z
Lx,y (g) :=
g(λ) dµx,y (λ) .
(8.15)
σ(T )
Dovrà essere, per proprietà generali delle misure complesse (cfr. (1) in esempi 2.2):
|Lx,y (g)| ≤ ||g||∞ |µx,y |(σ(T )) ≤ ||g||∞ ||x|| ||y|| .
(8.16)
Per costruzione, se g ∈ C(σ(T )) è fissata, (x, y) 7→ Lx,y (g) è anti-lineare in x e lineare in y.
Si può dimostrare che ciò continua a valere anche per g ∈ M (σ(T )). Proviamo per esempio la
linearità in y, l’anti-linearità si prova analogamente. Dai teoremi generali delle misure complesse
(vedi [Rud82]) si ha che, per x, y, z ∈ H e g ∈ M (σ(T )) fissati, se α, β ∈ C, allora vale
Z
α
Z
g(λ) dµx,y (λ) + β
σ(T )
Z
g(λ) dµx,z (λ) =
σ(T )
g(λ) dν(λ) ,
σ(T )
242
(8.17)
dove ν è la misura complessa definita da ν(E) := αµx,y (E) + βµx,z (E) per ogni boreliano
E ⊂ σ(T ). Tenendo conto di come abbiamo definito le misure µx,y (cfr. (8.14)) e sfruttando
la linearità del prodotto scalare di H nell’argomento di destra, si ricava subito che, per ogni
f ∈ C(σ(T )) inserita in (8.17) al posto di g, sussiste l’identità
Z
Z
f (λ) dµx,αy+βz (λ) =
σ(T )
f (λ) dν(λ) .
σ(T )
Il teorema di Riesz assicura a questo punto che µx,αy+βz = ν. Pertanto, (8.17) può essere
riscritta, per ogni g ∈ M (σ(T )):
Z
α
Z
g(λ) dµx,y (λ) + β
σ(T )
Z
g(λ) dµx,z (λ) =
σ(T )
g(λ) µx,αy+βz (λ) .
σ(T )
Abbiamo provato che Lx,y (g) è lineare in y per ogni fissato x ∈ H e ogni g ∈ M (σ(T )).
La (8.16) implica la limitatezza dell’operatore lineare y 7→ Lx,y (g) e quindi, per il teorema 3.2
(di Riesz), fissati g ∈ M (σ(T )) e x ∈ H, esiste un unico vettore vx ∈ H tale che Lx,y (g) = (vx |y)
per ogni y ∈ H. Dato che vx è lineare in x (perché Lx,y (g) è antilineare in x e il prodotto scalare
(vx |y) è antilineare in vx ), esisterà anche un unico operatore g(T )0 ∈ L(H) per cui vx = g(T )0 x
per ogni x ∈ H. E quindi Lx,y (g) = (g(T )0 x|y). La condizione (8.16) implica subito che g(T )0 è
limitato: infatti
||g(T )0 x||2 = |(g(T )0 x|g(T )0 x)| = |Lx,g(T )0 x (g)| ≤ ||g||∞ ||x|| ||g(T )0 x|| ,
da cui
||g(T )0 x||
≤ ||g||∞
||x||
e quindi ||g(T )0 || ≤ ||g||∞ .
Posto g(T ) := g(T )0∗ , abbiamo provato che, per g ∈ M (σ(T )), esiste un unico operatore g(T ) ∈
B(H) tale che, per ogni coppia x, y ∈ H:
Lx,y (g) = (x|g(T )y) .
L’applicazione lineare:
ÒT : M (σ(T )) 3 f 7→ f (T ) ∈ B(H) ,
Φ
dove, per ogni x, y ∈ H:
Z
Lx,y (f ) = (x|f (T )y) :=
f (λ) dµx,y (λ) ,
σ(T )
è, per costruzione, un’estensione di ΦT : in particolare vale (8.13). L’estensione è continua in
ÒT (f )|| ≤ ||f ||∞ per ogni f ∈ M (σ(T )): infatti
quanto ||Φ
ÒT (f )|| = ||f (T )|| = ||f (T )0∗ || = ||f (T )0 || ≤ ||f ||∞ .
||Φ
243
ÒT estende l’omomorfismo di algebre con unità ΦT , per provare che Φ
ÒT è un omoDato che Φ
Ò
Ò
Ò
morfismo di algebre con unità è sufficiente mostrare che ΦT (f · g) = ΦT (f )ΦT (g) quando
f, g ∈ M (σ(T )). Se le due funzioni appartengono a C(σ(T )), la tesi è vera per il teorema
precedente. Supponiamo f, g ∈ C(σ(T )); allora:
Z
f · g dµx,y
ÒT (f · g)y) = (x|Φ
ÒT (f )Φ
ÒT (g)y) =
= (x|Φ
Z
σ(T )
σ(T )
f dµx,Φ
bT (g)y .
Il teorema di Riesz citato prima implica che la misura dµx,Φ
bT (g)y coincida con la misura g dµx,y .
Quindi, se f ∈ M (σ(T )), si ha:
Z
f · g dµx,y =
Z
σ(T )
σ(T )
f dµx,Φ
bT (g)y .
Da questo segue che, per ogni coppia x, y ∈ H, per ogni f ∈ M (σ(T )) e g ∈ C(σ(T )):
Z
f · g dµx,y =
σ(T )
Z
σ(T )
∗ Ò
Ò
Ò
Ò
f dµx,Φ
bT (g)y = (x|ΦT (f )ΦT (g)y) = (ΦT (f ) x|ΦT (g)y)
Z
=
σ(T )
g dµΦ
b
∗
T (f ) x,y
.
Ragionando come sopra e usando il teorema di Riesz, si ha che l’uguaglianza
Z
f · g dµx,y =
σ(T )
Z
σ(T )
g dµΦ
b
T (f )
∗ x,y
,
(8.18)
valida per ogni g ∈ C(σ(T )), implica f dµx,y = dµΦ
bT (f )∗ x,y e dunque la (8.18) deve essere vera
per ogni coppia x, y ∈ H e per ogni coppia f, g ∈ M (σ(T )). Quindi, con tali scelte del tutto
generali:
ÒT (f · g)y) =
(x|Φ
Z
σ(T )
da cui
f · g dµx,y =
Z
σ(T )
g dµΦ
b
∗
T (f ) x,y
ÒT (f )∗ x|Φ
ÒT (g)y) = (x|Φ
ÒT (f )Φ
ÒT (g)y) .
= (Φ
Ò
Ò
Ò
x (Φ
T (f · g) − ΦT (f )ΦT (g))y = 0 .
Scegliendo x coincidente con il secondo argomento del prodotto scalare, si trova che
ÒT (f · g)y = Φ
ÒT (f )Φ
ÒT (g)y
Φ
per ogni y ∈ H e per ogni coppia f, g ∈ M (σ(T )), da cui
ÒT (f · g) = Φ
ÒT (f )Φ
ÒT (g) .
Φ
La proprietà (ii) di (a) vale in conseguenza di (v) di (b), che proviamo sotto, indipendentemente
da (ii) di (a).
244
ÒT quando soddisfa le condizioPer concludere la dimostrazione di (a), proviamo l’unicità di Φ
ni dette in (a). Se Ψ : M (σ(T )) → B(H) soddisfa le condizioni in (a), allora coincide con
ÒT sui polinomi, e quindi, per continuità, coincide con Φ
ÒT su C(σ(T )). Per fissati x, y ∈ H,
Φ
l’applicazione:
νx,y : E 7→ (x|Ψ(χE )y) ,
dove E è un qualsiasi boreliano di σ(T ) e χE la sua funzione caratteristica, è una misura
complessa su σ(T ). Infatti νx,y (∅) = (x|Ψ(0)y) = 0; inoltre, se {Sk }k∈N è una famiglia di
boreliani a due a due disgiunti, si ha
νx,y (∪k Sk ) = (x|Ψ(χ∪k Sk )y) = (x| lim Ψ(
n→+∞
n
X
χSk )y) = lim
n→+∞
k=0
n
X
(x|Ψ(χSk )y) =
k=0
+∞
X
νx,y (Sk ) ,
k=0
dove il primo membro è sempre finito e abbiamo tenuto conto della condizione (ii) di (a) e del
fatto che, puntualmente:
χ∪k Sk =
+∞
X
χSk .
(8.19)
k=0
Si osservi che la (8.19) non dipende dall’ordine con cui si etichettano gli insiemi Sk , essendo la
serie di termini positivi. Di conseguenza, la relazione
νx,y (∪k Sk ) =
+∞
X
νx,y (Sk )
k=0
vale indipendentemente dall’ordinamento della serie e quindi, per un noto teorema, la serie
converge assolutamente. Abbiamo provato che νx,y è una misura complessa.
Tenendo conto della linearità di Ψ e del prodotto scalare, nonché della definizione di integrale
di una funzione semplice, si arriva facilmente a dimostrare che
Z
s(x) dνx,y = (x|Ψ(s)y)
σ(T )
per ogni funzione semplice s ∈ S(σ(T )). Se f ∈ M (σ(T )) e {sn } ⊂ S(σ(T )) converge uniformemente a f (tale successione esiste per (b) di proposizione 7.8), allora, in virtù della continuità di
Ψ nella norma || ||∞ e del teorema della convergenza dominata, si ha che, per ogni f ∈ M (σ(T )),
vale:
Z
(x|Ψ(f )y) =
f dνx,y .
(8.20)
σ(T )
ÒT . Di
In particolare, questo fatto deve valere per f ∈ C(σ(T )), sul quale spazio Ψ coincide con Φ
conseguenza, in virtù del teorema di Riesz sulle misure complesse, la misura νx,y coincide con
la misura complessa µx,y introdotta all’inizio della dimostrazione, attraverso la quale abbiamo
ÒT come:
definito Φ
Z
ÒT (f )y) =
(x|Φ
f dµx,y ,
σ(T )
245
ÒT (f )
per x, y ∈ H e f ∈ M (σ(T )). Ma allora, essendo νx,y = µx,y , (8.20) implica che Ψ(f ) = Φ
per ogni f ∈ M (σ(T )).
(b) Bisogna dimostrare solo (iii), (iv), (v) e (iv), dato che gli altri punti sono stati dimostrati
nella prova di (a).
La proprietà (iii) vale nel caso in cui f ∈ C(σ(T )), come noto da (b) della proposizione 8.4.
Allora,
Z
ÒT (f )Ay) = (x|AΦ
ÒT (f )y) = (A∗ x|Φ
ÒT (f )y) =
f dµx,Ay = (x|Φ
σ(T )
Z
f dµA∗ x,y ,
σ(T )
per ogni coppia di vettori x, y ∈ H e per ogni f ∈ C(σ(T )). Il teorema di Riesz sulla
rappresentazione delle misure complesse sui Boreliani assicura allora che µA∗ x,y = µx,Ay , e
quindi
ÒT (f )Ay) =
(x|Φ
Z
Z
ÒT (f )y) = (x|AΦ
ÒT (f )y) ,
f dµA∗ x,y = (A∗ x|Φ
f dµx,Ay =
σ(T )
σ(T )
per ogni coppia di vettori x, y ∈ H e per ogni f ∈ M (σ(T )). Per l’arbitrarietà dei vettori x, y,
ÒT (f )A = AΦ
ÒT (f ) se f ∈ M (σ(T )) e T A = AT .
vale: Φ
Passiamo a provare (iv). Se x ∈ H e g ∈ M (σ(T )), tenendo conto che µx,x è reale, si ha:
Z
ÒT (g)x) =
(x|Φ
Z
ÒT (g)x|x) = (x|Φ
ÒT (g)∗ x) .
g dµx,x = (Φ
g dµx,x =
σ(T )
σ(T )
ÒT (g) − Φ
ÒT (g)∗ )x) = 0 per ogni x ∈ H. Dall’esercizio (2) di esercizi 3.2 segue che
Quindi (x|(Φ
∗
Ò
Ò
ΦT (g) = ΦT (g) .
Dimostriamo (v). Sia {fn }n∈N ⊂ M (σ(T )) una successione, limitata (in valore assoluto) da
K > 0, che converge a f : σ(T ) → C. Quindi ||f ||∞ ≤ K e f è misurabile, dunque f ∈ M (σ(T )).
Fissati x, y ∈ H e usando (iv) di (b),
ÒT (fn ) − Φ
ÒT (f ))x||2 = ((Φ
ÒT (fn ) − Φ
ÒT (f ))x|(Φ
ÒT (fn ) − Φ
ÒT (f ))x)
||(Φ
ÒT (fn − f )∗ Φ
ÒT (fn − f )x) = (x|Φ
ÒT (|f − fn |2 )x) .
= (x|(Φ
L’ultimo termine si può scrivere come
Z
σ(T )
|f − fn |2 dµx,x =
Z
|f − fn |2 hd|µx,x | ,
σ(T )
dove |µx,x | è la misura positiva (detta variazione totale) associata alla misura reale (con segno)
µx,x e h è una funzione misurabile di valore assoluto costante pari a 1 [Rud82]. (In realtà, come
abbiamo provato nel punto (a) di questa dimostrazione, µx,x è una misura reale positiva, per cui
|µx,x | = µx,x e h = 1.) Dato che è |µx,x |(σ(T )) < +∞, per il teorema della convergenza dominata
ÒT (fn ) − Φ
ÒT (f ))x||2 → 0
|h||f − fn |2 converge a 0 in L1 (σ(T ), |µx,x |). Quindi, se n → +∞, ||(Φ
per ogni scelta di x ∈ H.
Per finire dimostriamo (vi). Se M (σ(T )) 3 f ≥ 0, allora f = g 2 con 0 ≤ g ∈ M (σ(T )). Pertanto,
ÒT (f ) = Φ
ÒT (g · g) = Φ
ÒT (g)Φ
ÒT (g). Inoltre Φ
ÒT (g)∗ = Φ
ÒT (g) = Φ
ÒT (g) (per (iv)), per cui:
per (a), Φ
∗
Ò
Ò
Ò
ΦT (g · g) = ΦT (g) ΦT (g). Il secondo membro è evidentemente positivo. 2
246
8.3
Misure a valori di proiezione e teorema spettrale per operatori limitati normali.
Le misure a valori di proiezione (anche dette misure spettrali, per i motivi che vedremo più
avanti) sono lo strumento centrale per enunciare i teoremi spettrali. È chiaro dalla definizione
seguente, che, nel caso in cui lo spazio X coincida con R, la misura a valori di proiezione determina
una misura a valori di proiezione su R come definita nella definizione 7.7 e, di conseguenza,
un’osservabile nel senso stabilito nel capitolo precedente ed in virtù della proposizione 7.8 quando
lo spazio di Hilbert viene interpretato come lo spazio di Hilbert di un sistema quantistico.
8.3.1
Misure a valori di proiezione (PVM) dette anche misure spettrali.
Introdurremo ora la nozione di misura a valori di proiezione (PVM), che ci servirà per enunciare
e provare il teorema spettrale. Nel seguito lavoreremo solo con PVM definite su σ-algebre di
Borel B(X) ricavate da spazi topologici X a base numerabile. Tale requisito non è strettamente
necessario e quasi tutta la teoria si potrebbe sviluppare lavorando con σ-algebre generiche (vedi
per esempio [Rud91]). La nostra scelta è unicamente dettata dalla comodità . In primo luogo,
in questo modo, si può definire l’utile nozione di supporto della PVM, inoltre, in tutti i casi
pratici che considereremo, l’insieme X e la σ-algebra considerata avranno la proprietà detta ed
infine il teorema di decomposizione spettrale viene enunciato su C (o R), che ha topologia a base
numerabile, e rispetto alla σ-algebra di Borel.
Definizione 8.3. Siano H uno spazio di Hilbert e X uno spazio topologico a base numerabile.
Se B(X) denota la σ-algebra di Borel su X, un’applicazione P : B(X) → B(H) è detta misura
a valori di proiezione su X (PVM), oppure equivalentemente misura spettrale su X, se
soddisfa i seguenti requisiti.
(a) P (B) ≥ 0 per ogni B ∈ B(X);
(b) P (B)P (B 0 ) = P (B ∩ B 0 ) per ogni coppia B, B 0 ∈ B(X);
(c) P (X) = I;
(d) per ogni insieme numerabile di boreliani di X, {Bn }n∈N , a due a due disgiunti, vale:
s-
+∞
X
P (Bn ) = P (∪n∈N Bn ) .
n=0
L’insieme chiuso definito come il complemento dell’unione degli insiemi aperti A ⊂ X per cui
P (A) = 0 è detto supporto della misura a valori di proiezione e si indica con supp(P ). Una
misura a valori di proiezione P su X = Rn o Cn è detta limitata se supp(P ) è limitato.
Note.
(1) Si osservi che gli operatori P (B) sono:
(i) idempotenti per (b): infatti P (B)P (B) = P (B ∩ B) = P (B);
(ii) autoaggiunti perché limitati e positivi (per (a)).
247
Pertanto essi risultano essere proiettori ortogonali.
(2) Si osservi che (c) e (d) da sole implicano che I = P (X ∪ ∅) = I + P (∅), per cui
P (∅) = 0 .
La (d) e la (a) implicano anche che, se C ⊂ B con B, C ⊂ X sono Boreliani, allora P (C) ≤ P (B).
Infatti: B = C ∪ (B \ C) e C ∩ (B \ C) = ∅ per cui, da (d): P (B) = P (C) + P (B \ C). Essendo
P (B \ C) ≥ 0, vale P (C) ≤ P (B).
(3) Se B ∈ B(X), allora X \ B ∈ B(X) e X = B ∪ (X \ B). Quindi, da (d), prendendo B0 = B,
B1 = X \ B e tutti i rimanenti Bk = ∅, abbiamo che: I = P (B) + P (X \ B). In altre parole vale
anche
I − P (B) = P (X \ B) .
(4) Vale la proprietà di subadditività : se B = ∪n∈N Bn con Bn boreliani di X, per ogni x ∈ H,
X
(x|P (B)x) ≤
(x|P (Bn )x) .
n∈N
La prova è semplice: si costruisca la successione di boreliani {Cn }n∈N con C0 := B0 , C1 :=
B1 \ B0 , C2 := B2 \ (B0 ∪ B1 ) e via di seguito. Evidentemente Ck ∩ Ch = ∅ se h 6= k e
B = ∪n∈N Cn . Di conseguenza, per (d):
P (B) =
+∞
X
P (Ck )
n=0
e quindi
(x|P (B)x) =
+∞
X
(x|P (Ck )x) .
n=0
Dato che Ck ⊂ Bk per ogni k ∈ N, per (2) varrà anche (x|P (Ck )x) ≤ (x|P (Bk )x) e pertanto:
(x|P (B)x) ≤
+∞
X
(x|P (Bk )x) .
n=0
(5) Vale P (supp(P )) = I. Questo fatto è evidentemente equivalente (per (d) ristretto al caso
finito) a P (A) = 0, dove A := X \ supp(P ). Per provare che P (A) = 0 notiamo che, per
definizione A è unione di aperti con misura spettrale nulla. Dato che X è numerabile di secondo
tipo, possiamo estrarre un sotto ricoprimento numerabile dal ricoprimento detto. In altre parole,
vale A = ∪n∈N An con P (An ) = 0 per ogni n ∈ N. Usando (4), per ogni x ∈ H:
0 ≤ ||P (A)x||2 = (P (A)x|P (A)x) = (x|P (A)x) ≤
X
(x|P (An )x) = 0 .
n∈N
per cui P (A) = 0.
248
Passiamo ora a costruire una procedura d’integrazione di funzioni misurabili limitate f : X → C
rispetto ad una misura a valori di proiezione P : B(X) → B(H).
Ricordiamo che, se X è uno spazio dotato di una σ-algebra Σ, una funzione f : X → C, che sia misurabile rispetto a Σ, è detta funzione semplice quando assume solo un numero finito di valori.
Notazione 8.2. Se X è uno spazio topologico a base numerabile e B(X) la σ-algebra di Borel su
X, S(X) denota lo spazio vettoriale (sul campo C) delle funzioni semplici su X, relative a B(X)
ed a valori in C, dotato della norma dell’estremo superiore.
Consideriamo una funzione s ∈ S(X). Possiamo sempre scriverla come:
s=
X
ci χEi .
i∈I
Poiché, per definizione, una funzione semplice assume solo un numero finito di valori distinti,
questa espressione è univocamente fissata da s se si richiede che gli insiemi Ei siano misurabili
e a due a due disgiunti, e i numeri complessi ci siano tutti distinti (in particolare I è finito).
Definiamo l’integrale di s rispetto a P come l’operatore di B(H):
Z
s(x) dP (x) :=
X
X
ci P (Ei ) .
(8.21)
i∈I
Nota. Se non si richiede che i numeri ci nell’espressione di s scritta sopra siano distinti, ci sono
molte possibilità nello scrivere s come combinazione lineare di funzioni caratteristiche di insiemi
misurabili disgiunti. Tuttavia si prova facilmente, ripetendo la stessa dimostrazione del caso in
cui si lavori con una misura ordinaria, che l’integrale di s non dipende dalla rappresentazione di
s scelta.
L’applicazione
I : S(X) 3 s 7→
Z
s(x) dP (x) ∈ B(X) ,
(8.22)
X
è lineare, ovvero I ∈ L(S(X), B(X)), come è facile dimostrare tenendo conto della nota precedente. Essendo S(X) e B(X) spazi normati, L(S(X), B(X)) è dotato della norma operatoriale. I
risulta essere un operatore limitato rispetto a tale norma. Proviamolo. Se x ∈ H e E := supp(P ),
allora:
„
Ž
2
2
||I(s)x|| = (I(s)x|I(s)x) =
„
=
X
ci P (Ei )x cj P (Ej )x
j∈I
i∈I
X
Ž
X
ci P (Ei ∩ E)x cj P (Ej ∩ E)x .
j∈I
i∈I
X
Sopra abbiamo usato il fatto che, essendo
P (Ei ) = P (Ei ∩ E) + P (Ei ∩ (X \ E)) = P (Ei ∩ E) + 0 = P (Ei ∩ E) ,
249
allora
X
ci P (Ei ) =
i∈I
X
ci P (Ei ∩ E) .
i∈I
Definiamo nel seguito: Ei0 := Ei ∩ E. Usando il fatto che P (Ei0 ) = P (Ei0 )∗ , il fatto che
P (Ei0 )P (Ej0 ) = P (Ei0 ∩ Ej0 ) e tenendo conto che Ei0 ∩ Ej0 è l’insieme vuoto se i 6= j, otteniamo
che:
X
||I(s)x||2 =
ci cj (x|P (Ei0 ∩ Ej0 )x) =
i,j∈I
X
|ci |2 (x|P (Ei0 )x) ≤ sup |ci |2
i∈I 0
i∈I
X
(x|P (Ei0 )x) ,
i∈I 0
dove I 0 ⊂ I è costituito dagli indici per cui Ei0 6= ∅. Valendo Ei0 ⊂ E, segue che
X
P (EI0 ) ≤ P (∪i∈I 0 Ei0 ) ≤ P (E) = I
i∈I 0
e quindi:
X
(x|P (Ei0 )x) ≤ (x|x) = ||x||2 .
i∈I 0
Concludiamo che:
||I(s)x||2 ≤ ||x||2 sup |ci |2 = ||x||2 ||s supp(P ) ||2∞ ,
i∈I 0
da cui, prendendo l’estremo superiore sui vettori x ∈ H con ||x|| = 1:
||I(s)|| ≤ ||s supp(P ) ||∞ .
Tuttavia, dato che ||s supp(P ) ||∞ coincide con uno dei valori finiti assunti da |s|, diciamo |ck |,
se scegliamo x ∈ P (Ek0 )(H) (e quindi x = P (Ek0 )x), avremo che
I(s)x =
X
ci P (Ei0 )x =
i∈I 0
X
ci P (Ei0 )P (Ek0 )x =
i∈I 0
X
ci P (Ei0 ∩ Ek0 )x = ck x ,
i∈I 0
avendo usato P (Ei0 ∩ Ek0 ) = 0 se i 6= k. Pertanto, scegliendo x con ||x|| = 1, si ottiene ||I(s)x|| =
||s supp(P ) ||∞ . Concludiamo che I è sicuramente continua, valendo:
||I(s)|| = ||s supp(P ) ||∞ ≤ ||s||∞
(8.23)
ed è un’isometria se X = supp(P ):
||I(s)|| = ||s||∞ .
(8.24)
||I|| ≤ 1 ;
(8.25)
Dalla (8.23), segue anche che
R
in realtà, osservando che X 1 dP (x) = I (come segue dalla definizione prendendo s data dalla
funzione costante 1 su tutto X), si ottiene che, anche se X 6= supp(P ),
||I|| = 1 .
250
(8.26)
Possiamo passare a definire l’integrale di funzioni Borel-misurabili limitate. È noto che un operatore lineare continuo T : D(T ) → Y, dove Y è uno spazio di Banach e D(T ) un sottospazio denso
di uno spazio normato X, ammette un’unica estensione limitata TÒ : X → Y e vale ||TÒ|| = ||T ||
(vedi gli esercizi svolti (3) e (4) in esercizi 2.1). Mostriamo che ci troviamo proprio in questo
caso. Lo spazio di Banach M (X) delle funzioni f : X → C Borel-misurabili e limitate contiene S(X) come sottospazio denso nella norma || ||∞ , per (b) di proposizione 7.7. L’operatore
I : S(X) → B(X) è continuo. Di conseguenza esiste ed è unico un operatore limitato da M (X) in
B(X) che estende I. Se X = supp(P ), allora I è un’isometria e tale sarà anche la sua estensione
continua, per la continuità della norma.
Definizione 8.4. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e
P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X.
b : M (X) → B(X) dell’operatore I : S(X) → B(X) (vedi (8.21)
(a) L’unica estensione limitata I
e (8.22)) si chiama operatore integrale rispetto alla misura di proiezione P .
(b) Per ogni f ∈ M (X),
Z
b )
f (x) dP (x) := I(f
X
è detto integrale di f rispetto alla misura a valori di proiezione P .
Per ogni E ⊂ B(X) e per ogni f ∈ M (X) oppure g ∈ M (E), gli integrali
Z
Z
f (x) dP (x) :=
E
e
χE (x)f (x) dP (x)
X
Z
Z
g(x) dP (x) :=
g0 (x) dP (x) ,
E
X
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x 6∈ E, sono detti, rispettivamente, integrale
di f su E e integrale di g su E (rispetto alla misura a valori di proiezione P ).
Note.
(1) Sia P una PVM sullo spazio X, dove X è un boreliano dello spazio topologico Y: la topologia
su X è quindi quella indotta su X da Y, per cui B(X) è costituita dalle restrizioni a X degli
insiemi in B(Y). Possiamo estendere P ad una misura spettrale su Y, PY , definendo
PY (E) := P (E ∩ X) ,
per ogni boreliano E in Y. In questo modo risulta che:
Z
Z
f (x) dP (x) =
f (x) dPY (x)
X
e
X
Z
Z
g(x) dP (x) =
X
g(x) dPY (x)
X
251
per tutte le funzioni f ∈ M (X) e g ∈ M (Y), nel senso delle ultime due definizioni in (b) di
definizione 8.4 rispettivamente. La prova di questo fatto è semplice ed è lasciata per esercizio al
lettore.
(2) Se P è una misura spettrale su X e supp(P ) 6= X, possiamo restringere P ad una misura
spettrale Q su supp(P ) (dotato della topologia indotta da X), definendo Q(E) := P (E) per
ogni boreliano E ⊂ supp(P ). Si verifica immediatamente che, nel senso della nota precedente,
QX = P .
(3) Se P è una misura spettrale su X, per ogni f ∈ M (X) vale:
Z
Z
f (x) dP (x) =
f (x) dP (x) .
supp(P )
(8.27)
X
Infatti:
Z
Z
Z
f (x) dP (x) :=
supp(P )
X
χsupp(P ) (x)f (x) dP (x) =
X
Z
χsupp(P ) (x) dP (x)
f (x) dP (x) ,
X
dove, nell’ultima uguaglianza, abbiamo usato la proprietà (iii) di (a) in teorema 8.5, che verrà
dimostrato più avanti, indipendentemente dall’attuale risultato. Ora osserviamo che
Z
X
χsupp(P ) (x) dP (x) = P (supp(P )) = I
per la nota (5) dopo definizione 8.3, per cui vale (8.27).
Esempi 8.1.
(1) Facciamo un esempio concreto affinché la procedura non sembri troppo astratta. In realtà,
il seguente esempio, con un’estensione, esaurisce tutti i casi possibili, come vedremo più avanti.
Consideriamo uno spazio di Hilbert H = L2 (X, µ), dove X è uno spazio topologico a base numerabile e µ è una misura sulla σ-algebra di Borel di X. Una misura spettrale su H si ottiene
definendo, per ogni ψ ∈ L2 (X, µ) e E ∈ B(X):
per quasi ogni x ∈ X .
(P (E)ψ)(x) := χE (x)ψ(x) ,
(8.28)
Si prova facilmente che l’applicazione B(X) 3 E 7→ P (E) definisce effettivamente
una misura
R
spettrale su L2 (X, µ). Vogliamo ora capire come siano fatti gli operatori X f (x) dP (x) per ogni
funzione di M (X).
Notiamo che se ψ ∈ L2 (X, µ) e f ∈ M (X), allora f · ψ ∈ L2 (X, µ), dove · indica la moltiplicazione
delle due funzioni punto per punto: infatti
Z
X
|f (x)ψ(x)|2 dµ(x) ≤ ||f ||2∞
Z
|ψ(x)|2 dµ(x) < +∞ .
X
In particolare, abbiamo anche provato che, se f ∈ M (X) e ψ ∈ L2 (X, µ), allora:
||f · ψ|| ≤ ||f ||∞ ||ψ|| .
252
Abbiamo pertanto provato un utile risultato.
Se {fn }n∈N ⊂ M (X) e fn → f ∈ M (X) nella norma ||||∞ per n → +∞, allora anche fn ·ψ → f ·ψ
nella convergenza di L2 (X, µ).
R
Notiamo inoltre che, se s ∈ S(X), l’operatore X s(x)dP (x) si scrive esplicitamente usando (8.28)
e (8.21): risulta subito che, per ogni ψ ∈ L2 (X), vale
Z
‹
s(y) dP (y)ψ (x) = s(x)ψ(x) .
X
Pertanto, se {sn } ⊂ S(X) converge uniformemente a f ∈ M (X) (in virtù di (b) di proposizione
7.8, una siffatta successione esiste per ogni f ∈ M (X)), si ha:
sn · ψ =
Z
sn (x) dP (x)ψ →
Z
X
f (x) dP (x)ψ
X
b di I. Ma
quando n → +∞, per la definizione di integrale mediante l’estensione continua I
allora, tenuto conto del risultato precedente (con fn := sn ), che implica
sn · ψ → f · ψ
nel senso di L2 (X) per n → +∞, otteniamo immediatamente
Z
‹
f (y) dP (y)ψ (x) = f (x)ψ(x) per quasi ogni x ∈ X,
(8.29)
X
per ogni f ∈ M (X) ed ogni ψ ∈ L2 (X, µ).
(2) Come secondo esempio, consideriamo una base Hilbertiana N in uno spazio di Hilbert H
separabile. Possiamo mettere su N la topologia discreta data dall’insieme delle parti di N . In
tale topologia gli insiemi contenenti singoli punti sono aperti, la σ-algebra di Borel associata a
tale topologia coincide con la stessa topologia e coincide quindi con l’insieme delle parti di N .
Si osservi che N è numerabile di secondo tipo essendo H separabile. Se E ⊂ N è un boreliano,
consideriamo il sottospazio chiuso HE := < {z}z∈E >. Il proiettore ortogonale che proietta su
tale spazio è (cfr. (d) in proposizione 3.9):
PE := s-
X
(z| )z ,
z∈E
essendo E base hilbertiana di HE . Si verifica subito che P : B(N ) 3 E 7→ PE è effettivamente
una misura a valori di proiezione. Infine si può dimostrare che, se f : N → C è una funzione
limitata, vale:
Z
X
f (z) dP (z) = sN
f (z) (z| ) z .
(8.30)
z∈N
La prova di ciò si può ottenere dall’esempio (1), usando il fatto che (teorema 3.6) H è isomorfo
come spazio di Hilbert, sotto l’isometria suriettiva U : H → L2 (N, µ) che associa a x ∈ H la
funzione z 7→ ψx (z) := (z|x), allo spazio L2 (N, µ), dove µ è la misura che conta i punti di N . Si
253
verifica subito che effettivamente QE := U PE U −1 è l’operatore moltiplicativo in L2 (N, µ), che
moltiplica per la funzione caratteristica di E: in tal modo si ottiene (come è possibile verificare)
una misura spettrale Q : B(N ) 3 E 7→ QE del tipo di quelle introdotte nell’esempio (1). Usando
la definizione di integrale di una funzione f ∈ M (X) tramite l’integrale di funzioni semplici, per
le quali vale evidentemente
Z
s(z) dQ(z) =
N
X
ci Q(Ei ) = U
i
si ricava
X
ci P (Ei )U −1 = U
Z
i
Z
s(z) dP (z)U −1 ,
N
Z
f (z) dP (z)U −1 ,
f (z) dQ(z) = U
N
(8.31)
N
per la continuità della composizione di operatori in B(H). La (8.29) implica che
Z
f (z) dQ(z)ψ = f · ψ .
(8.32)
N
Usando (8.31) e (8.32), si ha che:
Z
f (z) dP (z)φ = U −1 f · U φ =
N
X
f (z) (z|φ) z ,
z∈N
dove abbiamo ricordato la definizione di U (cfr. teorema 3.6)
U : H 3 φ 7→ {(z|φ)}z∈N ∈ L2 (N, µ)
e la sua inversa
U −1 : L2 (N, µ) 3 {αz }z∈N 7→
X
αz z ∈ H .
z∈N
In definitiva, abbiamo provato che:
Z
X
f (z) dP (z) = sN
f (z) (z| ) z .
z∈N
(3) Come terzo esempio, presentiamo una generalizzazione dell’esempio (2). Consideriamo un
insieme X sul quale mettiamo una topologia a base numerabile per cui ogni insieme {x}, con
x ∈ X, appartiene alla σ-algebra di Borel B(X) associata alla topologia. Per esempio, ciò accade
se X è numerabile e si dota X della topologia discreta, ma si possono fare altri esempi ovvi: se
è X = R dotato della topologia standard, oppure se è X := {0} ∪ {±1/n | n = 1, 2, . . .} ⊂ R e
si dota X della topologia indotta da quella di R. Definiamo una classe di proiettori ortogonali,
Pλ : H → H, sullo spazio di Hilbert H, per ogni λ ∈ X. Per avere una PVM richiediamo che
valgano i seguenti fatti:
(a) Pλ Pµ = 0 per λ, µ ∈ X con λ 6= µ;
P
(b) λ∈X ||Pλ ψ||2 < +∞ , per ogni ψ ∈ H;
254
(c) λ∈X Pλ ψ = ψ , per ogni ψ ∈ H.
Dalla richiesta (b) segue che solo una quantità al più numerabile (cfr. proposizione 3.2) di
elementi Pλ ψ sono non nulli, anche nel caso in cui X sia non numerabile; allora, tenendo anche
conto del fatto che, per (a), i vettori Pλ ψ e Pµ ψ sono ortogonali se λ 6= µ, per il lemma 3.1 la
somma in (c) è ben definita e può essere riordinata arbitrariamente.
Il fatto che le richieste (a), (b) e (c) sono compatibili si verifica esibendo una classe di proiettori
ortogonali che le soddisfano contemporaneamente. Il caso più semplice è fornito dalla classe dei
proiettori P ({z}), z ∈ N , dell’esempio (2) nel caso in cui X è una base hilbertiana. Un ulteriore
esempio, in cui X non è una base hilbertiana, sarà presentato in (2) di esempi 8.2. Un caso
in cui le condizioni (a), (b) e (c) sono verificate si ha considerando un operatore autoaggiunto
compatto T , definendo X = σp (T ) ed infine definendo Pλ con λ ∈ σp (T ) come il proiettore
ortogonale sull’autospazio con autovalore λ. La topologia su X sarà quella indotta da R. Dai
teoremi 4.2 e 4.3 segue facilmente che le condizioni (a), (b) e (c) sono verificate.
Riscriveremo le due ultime richieste in forma sintetica come:
P
s-
X
Pλ = I .
(8.33)
λ∈X
Con le condizioni poste, si verifica facilmente che P : B(X) → B(H), definita in modo tale che,
per ogni E ⊂ B(X), valga
X
PE = sPλ ,
(8.34)
λ∈E
P
è una misura a valori di proiezione su H. La somma λ∈E Pλ ψ esiste sempre in H, per ogni
ψ ∈ H, e non dipende dall’ordinamento: ciò segue subito dalla condizione (b), tenendo conto di
lemma 3.1. Vogliamo ora dimostrare che, per ogni f ∈ M (X):
Z
f (x) dP (x) = sX
X
f (x)Px .
(8.35)
x∈X
Si osservi che il secondo membro è ben definito e può essere riordinato a piacimento, per il
lemma 3.1, essendo, per ogni ψ ∈ H:
X
||f (x)Px ψ||2 ≤ ||f ||2∞
x∈X
X
||Px ψ||2 = ||f ||2∞
x∈X
=
X
(ψ|Px ψ) =
||f ||2∞
x∈X
(Px ψ|Px ψ) = ||f ||2∞
x∈X
„ ||f ||2∞
X
X
(ψ|Px2 ψ)
x∈X
Ž
X
ψ Px ψ
x∈X
= ||f ||2∞ (ψ|ψ) = ||f ||2∞ ||ψ||2 ,
dove la penultima uguaglianza vale per (8.33). Se s ∈ S(X) è una funzione semplice, applicando
la definizione di integrale di funzione semplice e (8.34), segue subito che, per ogni ψ ∈ H:
Z
s(x) dP (x)ψ =
X
X
ci P (Ei )ψ =
X X
i
i x∈Ei
255
s(x)Px ψ =
X
x∈X
s(x)Px ψ ,
(8.36)
dove, nella seconda uguaglianza, abbiamo sfruttato il fatto che dall’espressione di s(x) =
si ha ci = s(x) per ogni x ∈ Ei .
Se {sn } ⊂ S(X) e sn → f ∈ M (X) uniformememente, allora, per ogni ψ ∈ H:
Z
f (x) dP (x)ψ −
Z
X
P
sn (x) dP (x)ψ → 0 ,
i ci χEi
(8.37)
X
per n → +∞, per la definizione di integrale di funzioni misurabili limitate. D’altra parte, per
(8.36) e usando la (a), si ottiene
2
X
Z
X
=
f
(x)
P
ψ
−
s
(x)
dP
(x)ψ
|f (x) − sn (x)|2 ||Px ψ||2 ≤ ||f − sn ||2∞ ||ψ||2 .
x
n
x∈X
X
x∈X
L’ultimo membro tende a zero se n → +∞. Per (8.37) e per l’unicità del limite in H, deve allora
valere che, per ogni ψ ∈ H:
X
Z
f (x) Px ψ =
x∈X
f (x) dP (x)ψ ,
X
pertanto vale (8.35).
8.3.2
Proprietà degli operatori ottenuti integrando funzioni limitate rispetto
a PVM.
Valgono le seguenti prime proprietà dell’operatore integrale.
Teorema 8.4. Siano X uno spazio topologico a base numerabile, (H, ( | )) uno spazio di Hilbert
e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X.
(a) Per ogni f ∈ M (X),
Z
f (x) dP (x) = ||f supp(P ) ||∞ ≤ ||f ||∞ .
X
(b) L’operatore integrale rispetto alla misura di proiezione P è positivo, nel senso che:
Z
f (x) dP (x) ≥ 0 se vale 0 ≤ f ∈ M (X) .
X
(c) Per ogni coppia ψ, φ ∈ H, si consideri l’applicazione
 Z
‹
µψ,φ : B(X) 3 E 7→ ψ χE dP (x)φ .
X
Valgono le proprietà seguenti di µψ,φ :
(i) µψ,φ è una misura complessa su X,
256
(8.38)
(ii) se ψ = φ, µψ := µψ,ψ è una misura positiva finita su X, detta misura spettrale
associata a ψ,
(iii) µψ,φ (X) = (ψ|φ) (e, in particolare, µψ (X) = ||ψ||2 ),
(iv) per ogni funzione f ∈ M (X) vale:
 Z
‹ Z
ψ f (x) dP (x)φ =
f (x) dµψ,φ (x) ,
(8.39)
X
X
(v) vale supp(µψ,φ ) ⊂ supp(P ).
b soddisfa (8.38) quando ristretto allo spazio denso in M (X)
Prova. (a) L’operatore continuo I
b e delle norme, (8.38) rimarrà
delle funzioni semplici (cfr. (8.22) e (8.23)); per la continuità di I
valida anche su M (X).
(b) Usando (c) della proposizione 7.8, se 0 ≤ f ∈ M (X), esiste una successione di funzioni
semplici {sn }n∈N , con 0 ≤ sn ≤ sn+1 ≤ f per ogni n, che converge uniformemente a f . Di conseguenza, tenendo conto della definizione dell’integrale
rispetto a P e del
fatto che la convergenza
R
R
uniforme implica quella debole, otteniamo
che
(ψ|
s
dP
ψ)
→
(ψ|
f
X n
X dP ψ) perR n → +∞ per
R
ogni ψ ∈ H. Per avere la positività di X f dP è allora sufficiente provare che (ψ| X sn dP ψ) ≥ 0
per ogni n. Direttamente da (8.21) troviamo che:
 Z
‹
X (n) (n)
ψ sn dP ψ =
ci
ψ P (Ei ) ψ ≥ 0 ,
X
i∈In
(n)
dato che ogni proiettore ortogonale è un operatore positivo ed i numeri ci sono non negativi,
essendo sn ≥ 0.
(c) Notiamo che, per (8.21), si ha:
 Z
‹
µψ,φ (E) = ψ χE (x) dP (x)φ = (ψ|1 · P (E)φ) = (ψ|P (E)φ) ,
(8.40)
X
ed è (ψ|P (E)ψ) ≥ 0. Allora, la proprietà definitoria (d) della misura a valori di proiezione
data in definizione 8.3, unitamente alla continuità del prodotto scalare, implicano che µψ,φ è
una misura complessa sulla σ-algebra di Borel B(X); inoltre, la stessa (d) unitamente alla (a)
di definizione 8.3 implicano che, se ψ = φ, µψ è una misura positiva finita sulla σ-algebra di
Borel B(X). Infine la (c) di definizione 8.3 comporta che µψ,φ (X) = (ψ|φ), e in particolare
µψ (X) = (ψ|ψ) = ||ψ||2 . Dato che µψ e |µψ,φ | sono misure finite, l’integrale associato ad esse è
continuo nella norma || ||∞ su M (X). (Infatti, per ogni f ∈ M (X), vale
Z
Z
f (x) dµψ,φ (x) ≤
|f (x)| d|µψ,φ (x)| ≤ ||f ||∞ |µψ,φ |(X) ,
X
X
da cui segue la continuità dell’integrale nella norma dell’estremo superiore.)
Se sn ∈ S(X), usando (8.40) e (8.21) si prova immediatamente che vale
 Z
‹ Z
ψ sn (x) dP (x)φ =
sn (x) dµψ,φ (x) .
X
X
257
Se ora f ∈ M (X) e {sn }n∈N ⊂ S(X) converge a f per n → +∞ in senso uniforme (cfr. (b)
proposizione 7.8), usando la continuità del prodotto scalare e la continuità dell’integrale associato
a µψ,φ rispetto alla convergenza uniforme, si ha subito che:
Z
‹
 Z
 Z
‹
 ‹
ψ f (x) dP (x)φ
=
ψ lim
sn (x) dP (x)φ = lim ψ sn (x) dP (x)φ =
n→+∞ X
ZX
lim
n→+∞ X
n→+∞
X
Z
sn (x) dµψ,φ (x) =
f (x) dµψ,φ (x) .
X
Proviamo la (v). La tesi equivale a dire che X \ supp(µψ,φ ) ⊃ X \ supp(P ). Sia x ∈ X \ supp(P ):
allora esiste un aperto A ⊂ X tale che x ∈ A e P (A) = 0. Di conseguenza:
Z
 Z
‹
µψ,φ (A) =
χA (x) dP (x) = ψ χA (x) dP (x)φ = (ψ|P (A)φ) = 0 ,
X
X
per cui x ∈ X \ supp(µψ,φ ).
Questo completa la dimostrazione del teorema. 2
Osservazione. Bisogna notare che se vogliamo che le misure positive µψ definite sulla σ-algebra
di Borel di X, siano misure di Borel propriamente dette, bisogna anche richiedere che lo spazio
X sia di Hausdorff e localmente compatto, per definizione di misura di Borel ([Rud82] e vedi
l’Appendice). Nei casi concreti, per esempio lavorando con PVM che definiscono lo sviluppo
spettrale di operatori, X è sempre (un sottoinsieme di) R o R2 e pertanto queste ipotesi sono
soddisfatte.
Il seguente teorema stabilisce la più importante proprietà delle misure a valori di proiezione: il
fatto che diano luogo a ∗-omomorfismi di C ∗ -algebre.
Tale ingrediente sarà essenziale nel provare il teorema spettrale che dimostreremo subito dopo.
Teorema 8.5. Siano H uno spazio di Hilbert, X uno spazio topologico a base numerabile e
P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti.
b è uno ∗-omomorfismo, isometrico se vale X = supp(P ), dalla C ∗ (a) L’operatore integrale I
algebra con unità M (X) alla C ∗ -algebra con unità B(H). In altre parole, oltre a valere (8.38),
valgono anche:
(i) se 1 denota la funzione costante con valore unitario su X,
Z
1 dP (x) = I ,
X
(ii) per ogni coppia f, g ∈ M (X) e per ogni α, β ∈ C,
Z
Z
(αf (x) + βg(x)) dP (x) = α
X
Z
f (x)dP (x) + β
X
g(x)dP (x) ,
X
(iii) per ogni coppia f, g ∈ M (X),
Z
Z
f (x) dP (x)
X
Z
g(x) dP (x) =
X
f (x)g(x) dP (x) ,
X
258
(iv) per ogni f ∈ M (X),
Z
Z
‹∗
f (x)dP (x) .
f (x) dP (x) =
X
X
(b) Se ψ ∈ H e f ∈ M (X), allora vale:
Z
2
Z
f (x) dP (x)ψ =
|f (x)|2 dµψ (x) .
X
X
(c) Se {fn }n∈N ⊂ M (X) è limitata e converge puntualmente a f : X → C, allora esiste l’integrale
di f rispetto alla misura spettrale P e vale
Z
Z
f (x) dP (x) = s- lim
n→+∞ X
X
fn (x) dP (x) .
(d) Se X = R2 , dotato della topologia euclidea standard, e se supp(P ) è compatto, allora,
pensando σ(T ) come sottoinsieme di R2 , si ha
supp(P ) = σ(T ) ,
dove
Z
T :=
z dP (x, y) ,
supp(P )
essendo z la funzione R2 3 (x, y) 7→ z := x + iy.
Note.
(1) La proprietà (iii) di (a) implica, in particolare, la seguente proprietà di commutazione di
operatori:
Z
Z
Z
Z
f (x) dP (x)
X
g(x) dP (x) =
X
g(x) dP (x)
X
f (x) dP (x) ,
X
per ogni coppia f, g ∈ M (X).
R
(2) Da (iv) e da (iii) di (a) segue che, per ogni f ∈ M (X), l’operatore X f (x) dP (x) è normale.
Prova del teorema 8.5. (a) Le uniche proprietà non del tutto banali sono (iii) e (iv). Proviamo la
prima. Scegliamo due successioni di funzioni semplici {sn } e {tm } che tendono uniformemente
a f e g rispettivamente. Per computo diretto si verifica che
Z
Z
sn (x) dP (x)
X
Z
tm (x) dP (x) =
X
sn (x)tm (x) dP (x) .
X
Per m fissato, essendo tm limitata, sn · tm tende uniformemente a f · tm per n → +∞. Tenendo
conto della continuità (nel senso di (a) di teorema 8.4) e della linearità dell’integrale come
funzione della funzione integranda e prendendo il limite per n → +∞ nell’identità di sopra, si
ottiene:
Z
Z
Z
f (x) dP (x) tm (x) dP (x) =
f (x)tm (x) dP (x) ,
X
X
X
259
dove si è tenuto conto del fatto che la composizione di operatori limitati è continua nei due
argomenti. Con la stessa procedura, tenendo conto che f · tm tende uniformemente a f · g se
m → +∞, si ottiene (iii). La proprietà (iv) si verifica scegliendo una successione di funzioni
semplici {sn } che tendono uniformemente a f . Per ψ, φ ∈ H, direttamente dalla definizione di
integrale di una funzione semplice (tenendo conto che i proiettori ortogonali sono autoaggiunti),
si verifica che:
‹  Z
Z
‹
sn (x) dP (x)ψ φ = ψ sn (x) dP (x)φ .
X
X
Si osservi che sn → f uniformemente per n → +∞. Quindi, usando la continuità e la linearità
dell’integrale come funzione della funzione integranda (nel senso di (a) di teorema 8.4), tenendo
conto della continuità del prodotto scalare, e prendendo il limite per n → +∞ dell’identità di
sopra, si ottiene:
‹  Z
Z
‹
X
e quindi:
 •Z
f (x) dP (x)ψ φ = ψ f (x) dP (x) −
Z
X
X
f (x) dP (x)φ
X
‹∗ ˜ ‹
f (x) dP (x)
ψ φ = 0 .
Dato che ψ, φ ∈ H sono arbitrari, si conclude che deve valere (iv).
(b) Se ψ ∈ H, usando (iii) e (iv) di (a), si ha subito che vale:
Z
2
‹ Z
 Z
f (x) dP (x)ψ = ψ |f (x)|2 dP (x)ψ =
|f (x)|2 dµψ (x) ,
X
X
X
dove, nell’ultima uguaglianza, abbiamo tenuto conto di (c) in teorema 8.4.
(c) Per prima cosa notiamo che f ∈ M (X), dato che è una funzione misurabile, essendo limite
di funzioni misurabili, ed è limitata dalla stessa costante che limita la successione delle fn . Se
ψ ∈ H, la linearità dell’integrale e (b) implicano immediatamente che:
Z
Z
‹ 2 Z
f
(x)
dP
(x)
ψ =
|f (x) − fn (x)|2 dµψ (x) .
f
(x)
dP
(x)
−
n
X
X
X
La misura µψ è finita, per cui le funzioni costanti sono integrabili. Per ipotesi, |fn | < K < +∞
per ogni n ∈ N, quindi |f | ≤ K e pertanto |fn −f |2 ≤ (|fn |+|f |)2 < 4K 2 . Dato che |fn −f |2 → 0
puntualmente, possiamo applicare il teorema della convergenza dominata, ottenendo che, per
n → +∞,
Z
ÊZ
Z
f (x) dP (x)ψ −
X
X
fn (x) dP (x)ψ =
|f (x) − fn (x)|2 dµψ (x) → 0 .
X
Data l’arbitrarietà di ψ ∈ H, questo risultato prova (c).
(d) Se supp(P
) è compatto, l’applicazione
R2 3 (x, y) 7→ zχsupp(P ) (x, y) ∈ C è limitata, per
R
R
cui T := supp(P ) z dP (x, y) = R2 zχsupp(P ) (x, y) dP (x, y) è un operatore normale (cfr. nota (2)
dopo teorema 8.5) di B(H) e quindi, in particolare, il suo spettro residuo è vuoto per (c) di
260
proposizione 8.3.
Per definizione di insieme risolvente, la tesi è equivalente all’affermazione:
C 3 λ 6∈ supp(P ) se e solo se λ ∈ ρ(T ).
Proviamo che λ 6∈ supp(P ) implica λ ∈ ρ(T ). Tenendo conto che R2 3 (x, y) 7→ z = x + iy è
limitata su supp(P ), supponiamo che λ 6∈ supp(P ). In tal caso c’è un aperto di R2 , A 3 (x0 , y0 )
con x0 + iy0 = λ, tale che P (A) = 0. Segue facilmente che (x, y) 7→ (z − λ)−1 è limitata
sull’insieme chiuso supp(P ). Allora esiste l’operatore di B(H):
Z
supp(P )
1
dP (x, y) .
z−λ
In virtù di (iii) e (i) di (a), vale:
Z
supp(P )
1
dP (x, y)
z−λ
Z
(z − λ) dP (x, y) =
Z
supp(P )
Z
supp(P )
Z
=
(z − λ) dP (x, y)
supp(P )
1
dP (x, y)
z−λ
Z
1 dP (x, y) =
1 dP (x, y) = I ,
R2
supp(P )
che può essere scritto anche come, tenendo conto di (i) e (ii) di (a):
Z
supp(P )
1
dP (x, y)(T − λI) = (T − λI)
z−λ
Z
supp(P )
1
dP (x, y) = I .
z−λ
In altre parole, T − λI è una biezione di H su H. Per (a) del teorema 8.1 (tenendo conto che
T : H → H è chiuso, essendo limitato), si ha che λ ∈ ρ(T ).
Mostriamo ora che λ ∈ ρ(T ) implica che λ 6∈ supp(P ). Per dimostrare questo fatto, proviamo
la proposizione equivalente: λ ∈ supp(P ) implica λ ∈ σ(T ) = σp (T ) ∪ σc (T ).
Se λ ∈ supp(P ), può accadere che T − λI : H → H non sia iniettivo: in tal caso λ ∈ σp (T ) e
la dimostrazione finisce. Supponiamo invece che T − λI : H → H sia iniettivo e mostriamo che
l’operatore inverso (T − λI)−1 : Ran(T − λI) → H non può essere limitato, per cui λ ∈ σc (T ).
Per provare questo fatto, è sufficiente mostrare che, se λ ∈ supp(P ), per ogni n = 1, 2, . . . esiste
ψn ∈ H, con ψn 6= 0, tale che ||(T − λI)ψn ||/||ψn || ≤ 1/n. (Infatti, nelle nostre ipotesi, vale
ψn = (T − λ)−1 φn per ogni n = 1, 2, . . ., con φn 6= 0 per avere ψn 6= 0. Allora si ha:
1/n ≥ ||(T − λI)ψn ||/||ψn || = ||(T − λI)(T − λI)−1 φn ||/||(T − λI)−1 φn || .
In altre parole, per ogni n = 1, 2, . . ., esiste φn ∈ H, con φn 6= 0, tale che:
||(T − λI)−1 φn ||
≥n.
||φn ||
Allora (T − λI)−1 non può essere limitato e quindi λ ∈ σc (T ).)
Se λ ∈ supp(P ), ogni aperto A 3 λ deve soddisfare P (A) 6= 0. Posto x0 + iy0 := λ, consideriamo
261
la classe di dischi aperti Dn ⊂ R2 , centrati in (x0 , y0 ) e di raggio 1/n, con n = 1, 2, . . .. Dato
che P (Dn ) 6= 0, esisterà ψn 6= 0 tale che ψn ∈ P (Dn )(H). In tal caso, si ha:
(T − λI)ψn =
Z
(z − λ) dP (x, y)ψn =
Z
supp(P )
(z − λ) dP (x, y)
Z
supp(P )
supp(P )
χDn (z) dP (x, y)ψn ,
R
dove abbiamo tenuto conto di P (Dn ) = R2 χDn (z) dP (x, y) e di P (Dn )ψn = ψn . Usando (iii)
di (a) del presente teorema, troviamo allora
(T − λI)ψn =
Z
R2
χDn (z)(z − λ)dP (x, y) .
Quindi, dalla proprietà (b), otteniamo:
2
||(T − λI)ψn || =
Z
R2
2
2
|χDn (z)| |z − λ| dµψn (x, y) ≤
= n−2
Z
R2
Z
R2
1 · n−2 dµψn (x, y)
1 dµψn (x, y) = n−2 ||ψn ||2 ,
dove, nell’ultima uguaglianza, abbiamo usato il fatto che µψn (R2 ) = ||ψn ||2 per la (iii) di (c) in
teorema 8.4. Estraendo le radici quadrate ad ambo i membri, si ha infine:
||(T − λI)ψn ||
≤ 1/n .
||ψn ||
Questo conclude la dimostrazione. 2
8.3.3
Teorema di decomposizione spettrale per operatori limitati normali.
Possiamo ora enunciare e provare il teorema di decomposizione spettrale per operatori in B(H)
normali. Il teorema è valido, in particolare, per operatori limitati autoaggiunti e per operatori
unitari, che sono sottocasi di operatori limitati normali.
Teorema 8.6 (Teorema di decomposizione spettrale per operatori in B(H) normali).
Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Valgono i fatti seguenti.
(a) Esiste, è unica e limitata una misura a valori di proiezione P (T ) su R2 (dotato della topologia
standard) tale che:
Z
z dP (T ) (x, y) ,
T =
(8.41)
supp(P (T ) )
dove z è la funzione R2 3 (x, y) 7→ z := x + iy ∈ C.
(a)’ Se T è autoaggiunto oppure unitario, l’enunciato (a) si può precisare
ulteriormente sostip
2
1
2
2
tuendo R , rispettivamente, con R oppure con S := {(x, y) ∈ R | x + y 2 = 1}.
(b) Vale:
supp(P (T ) ) = σ(T ) .
262
In particolare, per λ = x + iy ∈ C (rispettivamente λ = x ∈ R, oppure λ = x + iy ∈ S1 ) valgono
i seguenti fatti:
(i) λ ∈ σp (T ) se e solo se P (T ) ({(x, y)}) 6= 0;
(ii) λ ∈ σc (T ) se e solo se P (T ) ({(x, y)}) = 0 (rispettivamente, P (T ) ({x}) = 0 oppure
(T
P ) ({(x, y)}) = 0) e, per ogni aperto Aλ ⊂ R2 (rispettivamente, R oppure S1 ) con Aλ 3 (x, y),
è P (T ) (Aλ ) 6= 0;
(iii) se λ ∈ σ(T ) è un punto isolato, allora λ ∈ σp (T );
(iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ H con ||φ || = 1 e
0 < ||T φ − λφ || ≤ .
(c) Se f ∈ M (σ(T )), l’operatore supp(P (T ) ) f (x, y) dP (T ) (x, y) commuta con tutti gli operatori
di B(H) che commutano con T e T ∗ .
R
Nota. La proprietà (iv) di (b) afferma in pratica che, se λ ∈ σc (T ), benché non esistano autovettori di T con tale autovalore (dato che lo spettro continuo e quello discreto sono disgiunti),
possiamo costruire dei vettori che risolvono l’equazione degli autovalori con approssimazione
migliorabile a piacimento.
Prova del teorema 8.6. (a), (a)’ e (c). Unicità. Dimostriamo prima di tutto l’unicità della
misura spettrale. Prima di tutto si noti che se una misura spettrale P soddisfa (8.41) deve
avere supporto limitato, dato che la funzione z non è limitata su insiemi non limitati, e noi
abbiamo definito l’integrazione di funzioni misurabili limitate. Siano dunque P e P 0 misure a
valori di proiezione con supporto limitato (e quindi compatto, essendo supp(P ) chiuso in R2 per
definizione) e tali che
Z
T =
Z
z dP 0 (x, y) .
z dP (x, y) =
(8.42)
supp(P 0 )
supp(P )
Da tale relazione, usando (i), (ii), (iii) e (iv) di (a) nel teorema 8.5, segue che, per ogni polinomio
p = p(z, z), vale:
p(T, T ∗ ) =
Z
Z
p(x + iy, x − iy) dP (x, y) =
p(x + iy, x − iy) dP 0 (x, y) ,
supp(P 0 )
supp(P )
dove il polinomio p(T, T ∗ ) è definito nel modo più ovvio, ossia traducendo la moltiplicazione di
numeri complessi z := x + iy e z := x − iy in p(z, z) nella composizione di operatori e ponendo
T 0 := I e (T ∗ )0 := I. Se u, v ∈ H sono arbitrari, per ogni polinomio complesso p = p(z, z) su
R2 , avremo allora che
‚ Z
Œ
Z
p(z, z) dµu,v (x, y) = u p(z, z) dP (x, y)v
supp(P )
supp(µu,v )
=
‚ Z
Œ
u
p(z, z) dP 0 (x, y)v
supp(P 0 )
263
Z
=
supp(µ0u,v )
p(z, z) dµ0u,v (x, y) .
Le due misure complesse µu,v e µ0u,v sono quelle introdotte in (c) del teorema 8.4 (con u e v
sostituiti da ψ e φ.) Dato che i polinomi in z, z a coefficienti complessi individuano biunivocamente i polinomi complessi in x, y (tramite la sostituzione z := x + iy e z := x − iy), la classe dei
polinomi p(x + iy, x − iy), rispettivamente ristretti ai compatti supp(µu,v ) e supp(µ0u,v ) (cfr (v)
di (c) in teorema 8.4), è densa, nella norma dell’estremo superiore, negli spazi C(supp(µu,v )) e
C(supp(µ0u,v )) rispettivamente, per il teorema di Stone-Weierstrass. Dato che gli integrali rispetto a misure complesse sono funzionali continui nella norma dell’estremo superiore, concludiamo
che, per ogni funzione continua f = f (x, y), vale
Z
Z
f (x, y) dµu,v (x, y) =
supp(µ0u,v )
supp(µu,v )
f (x, y) dµ0u,v (x, y) .
Quindi, se K è un compatto che include i supporti di entrambe le misure, possiamo estendere in
modo ovvio le due misure su K senza alterarne il supporto (definendo la misura di un boreliano
E di K come µu,v (E ∩ supp(µu,v )) e la stessa cosa per la misura rispetto a µ0u,v ); allora deve
valere
Z
Z
f (x, y) dµu,v (x, y) =
f (x, y) dµ0u,v (x, y) .
K
K
Il teorema di Riesz per le misure complesse assicura che le due misure estese a K devono
coincidere. Di conseguenza, le misure non ancora estese a K devono avere lo stesso supporto e
coincidere. Quindi, usando (iv) in (c) del teorema 8.4, abbiamo che, per ogni coppia di vettori
u, v ∈ H e per ogni funzione misurabile g limitata su R2 , vale
‚ Z
Œ ‚ Z
Œ
0
u
g(x, y) dP (x, y)v = u g(x, y) dP (x, y)v ,
supp(P 0 )
supp(P )
ossia
 Z
u ‹
g(x, y) dP (x, y)v
R2
 Z
= u g(x, y) dP 0 (x, y)v
‹
,
R2
e quindi
Z
Z
g(x, y) dP (x, y) =
R2
g(x, y) dP 0 (x, y) ,
R2
per l’arbitrarietà di u e v. Se E è un arbitrario boreliano di R2 e si sceglie g = χE , l’identità di
sopra implica infine che
Z
P (E) =
R2
Z
χE (x, y) dP (x, y) =
R2
χE (x, y) dP 0 (x, y) = P 0 (E) .
Questo prova che P = P 0 .
Inoltre osserviamo che, in virtù di (8.42) e di (d) in teorema 8.5, si ha supp(P (T ) ) = σ(T ).
L’unicità per i casi presentati in (a)’ è conseguenza di quanto appena provato, del fatto che
supp(P (T ) ) = σ(T ) e di (a) (i) e (b) (i) in proposizione 8.3.
Esistenza. Passiamo a provare l’esistenza della misura spettrale P (T ) . Divideremo la dimostrazione in due casi: il caso in cui T è autoaggiunto, ed il caso in cui T non lo è.
264
ÒT associato a T come nel teorema 8.3.
Caso di T autoaggiunto. Si consideri lo ∗ -omomorfismo Φ
0
ÒT (χE 0 ). È chiaro
Se E è un boreliano di R, definiamo E := E ∩ σ(T ) e quindi: P (T ) (E) := Φ
(T
)
Ò
che P (E) è idempotente, essendo ΦT un omomorfismo e valendo χE 0 · χE 0 = χE 0 . Inoltre,
la proprietà (vi) di (b) in teorema 8.3 ed il fatto che le funzioni caratteristiche sono positive
implicano che P (T ) (E) ≥ 0 e quindi P (T ) (E) è anche autoaggiunto. In definitiva ogni P (T ) (E)
è un proiettore ortogonale. Si verifica immediatamente che B(R) 3 E 7→ P (T ) (E) è una misura
a valori di proiezione: P (T ) (E) ≥ 0 come provato sopra; (b) di definizione 8.3 segue dal fatto
ÒT è omomorfismo; la proprietà (c) di definizione 8.3
che χE 0 · χF 0 = χE 0 ∩F 0 e dal fatto che Φ
ÒT (χ
segue immediatamente da Φ
σ(T ) ) = I, valida per definizione di omomorfismo di algebre con
unità (cfr. (a) del teorema 8.3); infine, la proprietà (d) della definizione 8.3 segue da (v) di
P
0
0 = χ∪
(b) in teorema 8.3, tenendo conto del fatto che, puntualmente, limN →+∞ N
n=0 χEn
n∈N En
0
(T
)
quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P )
è limitato in quanto supp(P (T ) ) ⊂ σ(T ), il secondo dei quali è compatto per (c) del teorema 8.1.
Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della
ÒT , segue immediatamente
linearità dell’operatore integrale associato a P (T ) e della linearità di Φ
che:
Z
ÒT (s Φ
)
=
s(x) dP (T ) (x) ,
σ(T )
supp(P (T ) )
per ogni funzione semplice s : R → C. Dato che entrambi i funzionali sono continui rispetto alla
topologia dell’estremo superiore ((ii) in (b) di teorema 8.3 e (a) di teorema 8.4), applicando la
proposizione 7.8 si ha che
ÒT (f Φ
σ(T ) ) =
Z
f (x) dP (T ) (x) ,
(8.43)
supp(P (T ) )
per ogni funzione f : R → C misurabile e limitata. In particolare, quindi, per (i) in (a) del
teorema 8.3,
Z
x dP (T ) (x) .
T =
supp(P (T ) )
Riguardo alla prova di (c), si osservi che (8.43) mostra anche che A ∈ B(H) commuta con
(T ) (x, y) se A commuta con T , perché, sotto le ipotesi dette, A commuta
supp(P (T ) ) f (x, y) dP
ÒT (f con Φ
σ(T ) ) come conseguenza di (iii) in (b) di teorema 8.3.
R
Caso di T normale non autoaggiunto. Decomponiamo T come in (8.7) mediante gli operatori
X, Y ∈ B(H) autoaggiunti e commutanti, definiti in (8.8). Siano P := P (X) e Q := P (Y ) le
misure spettrali limitate definite su R, associate rispettivamente a X e Y secondo la prima
parte di questa dimostrazione. Si osservi che risulta P (E)Q(F ) = Q(F )P (E) per ogni coppia
di boreliani E, F ⊂ R. Infatti, per (8.43), vale:
ÒX (χE 0 ) =
P (E) = Φ
Z
χE 0 (x) dP (x) .
R
Il secondo membro commuta con tutti gli operatori di B(H) che commutano con X (per (iii)
di (b) del teorema 8.3), pertanto P (E)Y = Y P (E) per ogni boreliano E ⊂ R. Con lo stesso
265
ragionamento abbiamo allora che i proiettori Q(F ) (F ∈ B(R)) associati a Y , commutando con
tutti gli operatori che commutano con Y , dovranno commutare con P (E). In definitiva, tutti
gli operatori
P (E × F ) := P (E)Q(F ) ,
con E, F boreliani di R, sono a loro volta proiettori ortogonali.
Da (8.8) segue facilmente (ricordando anche che ||T ∗ || = ||T ||) che vale ||X|| ≤ ||T || e ||Y || ≤
||T ||. Dato che supp(P ) = σ(X), supp(Q) = σ(Y ), per (c) del teorema 8.1 i supporti delle
misure P e Q saranno contenuti nel segmento [−||T ||, ||T ||]. Nel seguito K denoterà il compatto
di R2 definito come:
K := [−||T ||, ||T ||] × [−||T ||, ||T ||] .
D’ora in poi, una funzione a gradini su K sarà una funzione g : K → C esprimibile come
g(x, y) :=
X
gij χEi ×Fj ,
(8.44)
(i,j)∈L
dove L è un insieme finito di indici, Ei , Fj sono boreliani in K (dotato della topologia indotta da
R2 ) tali che (Ei ×Fj )∩(Er ×Fs ) = ∅ se (i, j) 6= (r, s) e i numeri gij sono complessi. G(K) indicherà
lo spazio vettoriale su C delle funzioni a gradini. Si osservi che tale spazio vettoriale è in realtà
una ∗ -algebra con unità, in quanto è chiusa per prodotti (punto per punto) di funzioni a gradini,
è chiusa rispetto alla coniugazione complessa e contiene la funzione che vale costantemente 1. È
chiaro che G(K) ⊂ M (K). Definiamo l’operatore lineare Ψ0 : G(K) → B(H) come:
Ψ0 (g) :=
X
gij P (Ei × Fj ) .
(8.45)
(i,j)∈L
Si verifica facilmente che, se la stessa funzione a gradini g ammette due differenti rappresentazioni del tipo (8.44), il valore di Ψ0 (g) è il medesimo quando valutato sulle due differenti
rappresentazioni. Si prova facilmente che Ψ0 : G(K) → B(H) è uno ∗ -omomorfismo di algebre
con unità, in quanto per costruzione è lineare, trasforma i prodotti di funzioni a gradini in prodotti di operatori, trasforma la coniugazione complessa nella coniugazione hermitiana ed associa
alla funzione costante di valore unitario l’operatore identità. Ancora, mediante lo stesso procedimento con cui si dimostra che l’integrale delle funzioni semplici secondo una misura spettrale
è una funzione continua dell’integrando rispetto alla norma || ||∞ (e rispetto alla norma della
topologia uniforme in B(H)), si prova che Ψ0 : G(K) → B(H) è continua nella norma || ||∞ (e
rispetto alla norma della topologia uniforme in B(H)). In particolare vale
||Ψ0 (g)|| ≤ ||g||∞ .
Infine, se A ∈ B(H) commuta con T e T ∗ , allora commuterà con le loro combinazioni lineari
e quindi, in particolare, con X e Y . Ma allora, ripetendo la dimostrazione già fatta sopra per
la commutatività dei proiettori delle misure spettrali di X e Y , si prova che A commuta con
i proiettori ortogonali della misura spettrale di X e con quelli della misura spettrale di Y . Di
conseguenza, se A commuta con T e T ∗ , commuterà anche con Ψ0 (g) per ogni funzione a gradini
266
g.
Passiamo ad estendere Ψ0 alle funzioni continue. Il cosiddetto “teorema dell’oscillazione limitata” dell’analisi elementare assicura che possiamo approssimare arbitrariamente, nella norma
dell’estremo superiore, funzioni reali continue su K con funzioni reali a gradini su K; decomponendo le funzioni complesse in parte reale ed immaginaria, il risultato si generalizza a funzioni
a valori complessi. In altre parole, risulta che G(K) è denso in C(K) nella topologia indotta
dalla norma dell’estremo superiore. Usando (3) e (4) in esercizi 2.1, possiamo estendere in modo
unico Ψ0 : G(K) → B(H) ad uno ∗ -omomorfismo continuo di C ∗ -algebre ΨT : C(K) → B(H)
che soddisfa:
||ΨT (f )|| ≤ ||f ||∞ , per ogni f ∈ C(K) .
(8.46)
e tale che ΨT (f )A = AΨT (f ) per ogni f ∈ C(K) e ogni A ∈ B(H) che commuta con T e T ∗ .
Tale ∗ -omomorfismo gode infine delle proprietà:
ΨT (x) = X ,
(8.47)
ΨT (y) = Y ,
(8.48)
ΨT (x + iy) = T ,
(8.49)
dove x, y, x + iy indicano le funzioni su K definite rispettivamente come (x, y) 7→ x, (x, y) 7→ y,
(x, y) 7→ x + iy. È chiaro che la terza proprietà segue per linearità dalle prime due. La prima
identità si prova come segue. Sia {sn }n∈N una successione di funzioni semplici su [−||T ||, ||T ||]
che converge uniformemente alla funzione x ristretta a tale intervallo (tale successione esiste per
(b) di proposizione 7.8). Possiamo definire la successione di funzioni a gradini su K, {gn }n∈N ,
come gn (x, y) := sn (x) per ogni n ∈ N. Tale successione tende ovviamente alla funzione (x, y) 7→
x su K nella topologia della norma dell’estremo superiore. Si verifica subito che, per costruzione,
vale:
Z
sn dP (X) (x) = Ψ0 (gn ) .
[−||T ||,||T ||]
Prendendo il limite per n → +∞ della relazione precedente, il secondo membro tende a ΨT (x)
e il primo membro tende a (si tenga conto che supp(P (X) ) = σ(X) ⊂ [−||T ||, ||T ||])
Z
x dP
[−||T ||,||T ||]
(X)
Z
(x) =
x dP (X) (x) = X ,
supp(P (X) )
per la continuità dell’operatore integrale e per il punto (a), già dimostrato, di questo teorema.
Abbiamo provato che vale (8.47). Con una dimostrazione analoga si prova (8.48), e quindi
(8.49) segue per linearità. Usando la stessa dimostrazione del teorema 8.3, possiamo infine
Ò T : M (K) →
univocamente estendere ΨT : C(K) → B(H) ad uno ∗ -omomorfismo di C ∗ -algebre Ψ
B(H), che soddisfa (8.49) e gode di tutte le proprietà scritte in (b) del teorema 8.3, rimpiazzando
σ(T ) con K e ΦT con ΨT (che, al contrario del primo, in generale non è isometrico) e rafforzando
l’ipotesi in (iii) richiedendo che A commuti anche con T ∗ , oltre che con T .
A questo punto la dimostrazione procede come nel caso di T autoaggiunto. Definiamo E 0 :=
Ò T (χE 0 ). È chiaro
E ∩ K, dove E ⊂ R2 è un qualsiasi boreliano. Quindi poniamo: P (T ) (E) := Ψ
267
Ò T un omomorfismo e valendo χE 0 · χE 0 = χE 0 . Inoltre, la
che P (T ) (E) è idempotente, essendo Ψ
Ò T , unitamente al fatto
proprietà (vi) di (b) in teorema 8.3, che, come detto sopra, vale anche per Ψ
(T
)
che le funzioni caratteristiche sono positive, implica che P (E) ≥ 0, e quindi P (T ) (E) è anche
autoaggiunto. In definitiva ogni P (T ) (E) è un proiettore ortogonale. Si verifica immediatamente
che B(R2 ) 3 E 7→ P (T ) (E) è una misura a valori di proiezione: P (T ) (E) ≥ 0 come provato sopra;
Ò T è omomorfismo;
(b) di definizione 8.3 segue dal fatto che χE 0 · χF 0 = χE 0 ∩F 0 e dal fatto che Ψ
Ò
la proprietà (c) di definizione 8.3 segue immediatamente da ΨT (χK ) = 1; infine, la proprietà
(d) della definizione 8.3 segue da (v) di (b) in teorema 8.3, che, come detto sopra, vale anche
Ò T , tenendo conto del fatto che, puntualmente, limN →+∞ PN χE 0 = χ∪ E 0 quando gli
per Ψ
n=0
n∈N n
n
insiemi En0 sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T ) ) è limitato,
in quanto supp(P (T ) ) ⊂ K, il secondo dei quali è compatto per costruzione.
Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto
Ò T , segue immediatamente che:
della linearità di Ψ
Ò T (s K ) =
Ψ
Z
s(x, y) dP (T ) (x, y) ,
R2
per ogni funzione semplice s : R2 → C. Dato che entrambi i funzionali sono continui rispetto
Ò T , e (a) di
alla topologia dell’estremo superiore ((ii) in (b) di teorema 8.3, valido anche per Ψ
teorema 8.4), applicando la (b) di proposizione 7.8 si ha che
Ò T (f K ) =
Ψ
Z
f (x, y) dP (T ) (x, y) ,
(8.50)
R2
per ogni funzione f : R2 → C misurabile e limitata. In particolare, quindi, per (8.49) si ha
Z
T =
(x + iy) dP (T ) (x, y) .
supp(P (T ) )
Si osservi che (8.50) mostra anche che A ∈ B(H) commuta con R2 f (x, y) dP (T ) (x, y) se A
Ò T (f K ), come detto
commuta con T e T ∗ , perché, sotto le nostre ipotesi, A commuta con Ψ
sopra. Quindi anche la dimostrazione di (c) è conclusa.
(b) Facciamo la dimostrazione per il caso generico in cui T non sia autoaggiunto e nemmeno
unitario; la dimostrazione si specializza facilmente a tali casi. Il fatto che supp(P (T ) ) = σ(T )
è immediata conseguenza di (d) del teorema 8.5. Proviamo (i). Scriveremo P in luogo di P (T )
per semplicità notazionale. Sia λ := x0 + iy0 un complesso arbitrario. Tenendo conto di (iii) di
(a) in teorema 8.5, vale:
R
Z
Z
T P ({(x0 , y0 )}) =
σ(T )
(x + iy)χ{(x0 ,y0 )} (x, y) dP (x, y) =
σ(T )
(x0 + iy0 )χ{(x0 ,y0 )} (x, y) dP (x, y)
Z
=λ
σ(T )
χ{(x0 ,y0 )} (x, y) dP (x, y) = λP ({(x0 , y0 )}) .
In definitiva,
T P ({(x0 , y0 )}) = λP ({(x0 , y0 )}) .
268
Concludiamo che, se P ({(x0 , y0 )}) 6= 0, allora λ := x0 + iy0 è autovalore per T , dato che un
qualsiasi vettore u 6= 0 appartenente al sottospazio su cui proietta P ({(x0 , y0 )}) è un autovettore
con autovalore λ.
Supponiamo viceversa che T u = λu con u 6= 0 e λ := x0 + iy0 . Allora (cfr. (b) di (i) in
m
proposizione 3.8) T ∗ u = λu, T n (T ∗ )m u = λn λ u e, per linearità,
p(T, T ∗ )u =
Z
p(x + iy, x − iy) dP (x, y)u = p(λ, λ)u
(8.51)
supp(P )
per ogni polinomio p = p(x + iy, x − iy), dove abbiamo usato il fatto che l’integrale definisce
uno ∗ -omomorfismo. Ogni polinomio p = p(x + iy, x − iy) è anche un polinomio complesso
q = q(x, y) nelle variabili reali x e y, definendo punto per punto q(x, y) := p(x + iy, x − iy) e tale
corrispondenza è biunivoca. Dato che con i polinomi q(x, y) possiamo approssimare a piacimento
le funzioni continue f (x, y) nella norma dell’estremo superiore, la seconda uguaglianza in (8.51)
varrà anche se, al posto del polinomio p(x + iy, x − iy) = q(x, y), si considera una funzione
continua f = f (x, y). È facile provare che, se λ = x0 + iy0 , allora χ{(x0 ,y0 )} è il limite puntuale
di una successione limitata di funzioni continue fn . In definitiva, usando (c) di teorema 8.4 ed
il teorema della convergenza dominata (tenendo conto che µu è finita), vale:
‚ Z
ΠZ
(u|P{(x0 ,y0 )} u) = u χ{(x0 ,y0 )} (x, y)dP (x, y) u =
χ{(x0 ,y0 )} (x, y)dµu (x, y)
supp(P )
Z
= lim
n→+∞ supp(P )
supp(P )
‚ Z
fn (x, y)dµu (x, y) = lim
u
n→+∞
Œ
f (x, y)dP (x, y) u
supp(P ) n
= lim (u|fn (x0 , y0 )u) = χ{(x0 ,y0 )} (x0 , y0 )(u|u) .
n→+∞
Pertanto, tenendo conto del fatto che i proiettori ortogonali sono idempotenti ed autoaggiunti e
che χ{(x0 ,y0 )} (x0 , y0 ) = 1 per definizione, si ha:
(P{(x0 ,y0 )} u|P{(x0 ,y0 )} u) = (u|u) 6= 0 .
Questo prova che P{(x0 ,y0 )} 6= 0.
Passiamo a provare (ii). Dato che σc (T ) ∪ σp (T ) = σ(T ) (per (i) di (c) in proposizione 8.3) e
σc (T ) ∩ σp (T ) = ∅ per definizione, deve essere che λ ∈ σc (T ) se e solo se λ ∈ σ(T ) e λ 6∈ σp (T ).
Dato che supp(P (T ) ) = σ(T ), l’affermazione che λ ∈ σ(T ), equivale a dire che, per ogni aperto
A di R2 che contiene (x0 , y0 ) con x0 + iy0 = λ, deve essere P (A) 6= 0. D’altra parte, per (i),
λ 6∈ σp (T ) significa P (T ) ({(x0 , y0 )}) = 0.
Proviamo (iii). Se λ = x0 + iy0 ∈ C è un punto isolato di σ(T ), allora, per definizione, c’è un
aperto A 3 {(x0 , y0 )} che non interseca la parte rimanente di σ(T ). Se fosse P ({(x0 , y0 )}) = 0
non potrebbe essere λ ∈ supp(P (T ) ), valendo in tal caso P (A) = 0. Di conseguenza deve necessariamente essere P (T ) ({(x0 , y0 )}) 6= 0. Per (i) deve allora valere che λ ∈ σp (T ).
La prova di (iv) è stata data nella dimostrazione di (d) del teorema 8.5, in cui abbiamo provato,
tra le altre cose, che se λ ∈ σc (T ), allora, per ogni n > 0 naturale, esiste ψn ∈ H con ||ψn || =
6 0
269
e 0 < ||T ψn − λψn ||/||ψn || ≤ 1/n. Per provare (iv) è allora sufficiente definire φn := ψn /||ψn ||
con n tale che 1 ≤ n per il valore di fissato. 2
Il teorema successivo fornisce una rappresentazione spettrale di ogni operatore normale di B(H),
mostrando che, di fatto, ogni operatore normale limitato può essere visto come un operatore
moltiplicativo quando lo si rappresenta in un opportuno spazio L2 .
Notazione 8.2. Se H è uno spazio di Hilbert e {Hα }α∈A è una famiglia di suoi sottospazi chiusi,
scriveremo H = ⊕α∈A Hα se i sottospazi Hα sono a due a due ortogonali e vale H = < {Hα }α∈A >.
Nota. In riferimento alla decomposizione ortogonale H = ⊕α∈A Hα nel senso appena definito,
lasciamo al lettore la semplice dimostrazione delle seguenti identità. Esse derivano dal fatto che
l’unione di basi hilbertiane, scelte in ogni Hα , è una base hilbertiana per H.
Per ogni vettore ψ ∈ H vale (nel senso della definizione 3.4)
||ψ||2 =
X
||Pα ψ||2
(8.52)
α∈A
dove Pα è il proiettore ortogonale su Hα , per ogni α ∈ A. Vale anche (tenendo conto del lemma
3.1)
X
ψ=
Pα ψ
(8.53)
α∈A
dove la serie può essere riordinata a piacimento. La somma si intende come una serie o una
somma finita dato che solo una quantità al più numerabile di vettori Pα ψ è non nulla ((b) proposizione 3.2).
Teorema 8.7 (Teorema di rappresentazione spettrale per operatori in B(H) normali).
Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Sia P (T ) la misura spettrale associata
a T secondo (a) (o (a)’) del teorema 8.6.
(a) È possibile decomporre H come H = ⊕α∈A Hα (con A al più numerabile se H è separabile),
dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le proprietà seguenti:
(i) per ogni α ∈ A, valgono T Hα ⊂ Hα e T ∗ Hα ⊂ Hα ;
(ii) per ogni α ∈ A esiste una misura di Borel positiva finita µα , su σ(T ) ⊂ R2 ed un
operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f ∈ M (σ(T )),
‚Z
Œ
(T )
Uα
f (x, y)dP (x, y) Hα Uα−1 = f · ,
σ(T )
in particolare valgono:,
Uα T Hα Uα−1 = (x + iy)· ,
Uα T ∗ Hα Uα−1 = (x − iy)·
dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ),
(f · g)(x, y) = f (x, y)g(x, y) quasi ovunque su σ(T ) ;
270
(ii)’ se T è autoaggiunto oppure unitario, per ogni α ∈ A esiste una misura di Borel positiva
finita, sui boreliani di σ(T ) ⊂ R oppure, rispettivamente σ(T ) ⊂ S1 , ed un operatore isometrico
suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f ∈ M (σ(T )),
‚Z
Œ
(T )
Uα
f (x)dP (x) Hα Uα−1 = f · ,
σ(T )
in particolare,
Uα T Hα Uα−1 = x· ,
dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ),
(f · g)(x) = f (x)g(x) quasi ovunque su σ(T ) .
(b) Vale
σ(T ) = supp{µα }α∈A ,
dove supp{µα }α∈A è il complemento dell’insieme dei numeri λ ∈ C (rispettivamente R, S1 ) per
cui esiste un aperto Aλ ⊂ C (rispettivamente R, S1 ) tale che Aλ 3 λ e µα (Aλ ) = 0 per ogni
α ∈ A.
(c) Se H è separabile, esistono uno spazio con misura (MT , µT ), con µT (MT ) < +∞, una funzione limitata FT : MT → C (e rispettivamente R oppure S1 a seconda che T sia autoaggiunto
oppure unitario), un operatore unitario UT : H → L2 (MT , µT ) tale che:
€
Š
€
Š
UT T UT−1 f (m) = FT (m)f (m) , UT T ∗ UT−1 f (m) = FT (m)f (m) per ogni f ∈ H. (8.54)
Prova. (a) Dimostriamo (i), (ii) e (iii). La prova per (ii)’ è analoga a quella per (ii).
Supponiamo inizialmente che esista
un vettore ψ ∈ H tale che il sottospazio vettoriale Hψ
R
contenente i vettori di H del tipo σ(T ) g(x, y) dP (T ) (x, y)ψ, con g ∈ M (σ(T )) sia denso in H. Se
µψ è la misura spettrale associata a ψ, che dunque è una misura finita perché
Z
supp(P (T ) )
dµψ = ||ψ||2 ,
deve risultare supp(µψ ) ⊂ supp(P (T ) ) per (iv) di (c) del teorema 8.4. Consideriamo lo spazio di
Hilbert L2 (σ(T ), µψ ) e l’operatore lineare suriettivo
Vψ : M (σ(T )) 3 g 7→
Z
g(x, y) dP (T ) (x, y)ψ ∈ Hψ .
σ(T )
Dato che µψ è finita, M (σ(T )) ⊂ L2 (σ(T ), µψ ) come sottospazio. Tenuto conto di ciò risulta
che, per ogni coppia f, g ∈ M (σ(T )):
Z
‚Z
Œ
Z
(T )
(T )
g1 (x, y)g2 (x, y) dµψ (x, y) =
g1 (x, y) dP (x, y)ψ g2 (x, y) dP (x, y)ψ ,
σ(T )
σ(T )
σ(T )
(8.55)
271
che equivale a scrivere
Z
g1 (x, y)g2 (x, y) dµψ (x, y) = (Vψ g1 |Vψ g2 ) .
(8.56)
σ(T )
La dimostrazione di (8.55) si ottiene notando che, se E, E 0 ⊂ σ(T ) sono boreliani, usando (iv)
di (c) di teorema 8.4, (iii) di (a) di teorema 8.5 e (iv) di (a) di teorema 8.5, si ha:
‚ Z
Œ
Z
Z
(T )
χE χE 0 dµψ =
χE∩E 0 dµψ = ψ χE∩E 0 dP
ψ =
σ(T )
σ(T )
‚ Z
ψ
Œ
χ χ 0 dP
σ(T ) E E
‚Z
=
(T )
ψ
σ(T )
‚ Z
= ψ
(T )
Z
χ dP
χE 0 dP
σ(T ) E
σ(T )
Z
Œ
(T ) (T )
χE dP ψ χ 0 dP
ψ ;
σ(T ) E
σ(T )
Œ
(T )
ψ
per linearità (ed anti-linearità) del prodotto scalare e dell’integrale, se s e t sono funzioni semplici,
dovrà ancora valere:
Z
‚Z
Œ
Z
(T ) (T )
s dP ψ st dµψ =
t dP
ψ .
σ(T )
σ(T )
σ(T )
Tenendo conto della proposizione 7.8, usando la definizione di integrale di una funzione misurabile limitata secondo una misura spettrale, il teorema della convergenza dominata rispetto alla
misura finita µψ ed infine la continuità del prodotto scalare, l’identità appena provata implica
(8.55). Abbiamo provato che Vψ è un’isometria suriettiva da M (σ(T )) a Hψ . Si osservi che
M (σ(T )) è denso in L2 (σ(T ), µψ ) in quanto, se g ∈ L2 (σ(T ), µψ ), le funzioni gn := χEn · g, con
En := {(x, y) ∈ σ(T ) | |g(x, y)| < n} sono in M (σ(T )) e gn → g nel senso di L2 (σ(T ), µψ ),
per il teorema della convergenza dominata (essendo |gn − g|2 → 0, per n → +∞, puntualmente
e valendo |gn − g|2 ≤ 2|g|2 ∈ L1 (σ(T ), µψ )). Possiamo quindi estendere unicamente Vψ ad un
Òψ : L2 (σ(T ), µψ ) → Hψ , il cui inverso sarà indicato con Uψ .
operatore isometrico suriettivo V
Nelle ipotesi fatte Hψ = H.
Se f ∈ M (σ(T )), direttamente da (8.55) e facendo uso di (iii) in (a) di teorema 8.5, abbiamo
che:
Z
g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y)
σ(T )
‚Z
=
‚Z
=
g1 (x, y) dP
σ(T )
(T )
Z
Œ
(T )
(x, y)ψ f (x, y)g2 (x, y) dP (x, y)ψ
σ(T )
Z
Œ
Z
(T )
(T )
g1 (x, y) dP (x, y)ψ f (x, y) dP (x, y)
g2 (x, y) dP (x, y)ψ
σ(T )
σ(T )
σ(T )
Z
‚
Œ
(T )
= Vψ g1 f (x, y) dP (x, y)Vψ g2 .
σ(T )
(T )
272
Abbiamo quindi provato che, per ogni terna di funzioni g1 , g2 , f ∈ M (σ(T )), vale:
Z
‚
Œ
Z
(T )
g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y) = Vψ g1 f (x, y) dP (x, y)Vψ g2 .
σ(T )
σ(T )
L’operatore f · : L2 (σ(T ), µψ ) → L2 (σ(T ), µψ ), moltiplicativo per la funzione f ∈ M (σ(T )), è limitato come è facile provare; di conseguenza,
tenendo conto che M (σ(T )) è denso in L2 (σ(T ), µψ ),
R
della definizione di Uψ , del fatto che σ(T ) f (x, y) dP (T ) (x, y) è limitato e, infine, della continutà
del prodotto scalare, abbiamo che
Z
‚
Œ
Z
−1
−1
(T )
g1 (x, y)f (x, y)g2 (x, y) dµψ (x, y) = Uψ g1 f (x, y) dP (x, y)Uψ g2 ,
σ(T )
σ(T )
per ogni coppia di funzioni g1 , g2 ∈ L2 (σ(T ), µψ ). In altre parole:
Z
Uψ
σ(T )
f (x, y) dP (T ) (x, y)Uψ−1 = f · .
(8.57)
Passiamo a considerare il caso in cui non esista alcun vettore ψ con Hψ = H.
In
tal caso, sia ψ un vettore arbitrario in H. Denotiamo con Hψ lo spazio vettoriale dei vettori
R
(T ) (x, y)ψ per ogni f ∈ M (σ(T )). Vale T (H ) ⊂ H e T ∗ (H ) ⊂ H , infatti, per
ψ
ψ
ψ
ψ
σ(T ) f (x, y) dP
ogni f ∈ M (σ(T )), si ha ((a) teorema 8.6 e (iii) in (a) di teorema 8.5):
Z
T
f (x, y) dP
(T )
σ(T )
Z
ψ=
(x + iy) dP
(T )
Z
f (x, y) dP
(T )
σ(T )
σ(T )
Z
(x + iy)f (x, y) dP (T ) ψ ,
ψ=
σ(T )
per cui T σ(T ) f (x, y) dP (T ) ψ ∈ Hψ dato che la funzione (x, y) 7→ (x + iy)f (x, y) è un elemento
di M (σ(T ))). La dimostrazione per T ∗ è analoga, usando il fatto che
R
∗
Z
T =
(x − iy) dP (T ) .
σ(T )
Per continuità, vale anche T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ . Definendo Uψ come fatto sopra, vale la
(8.57).
Mostriamo ora come costruire un altro sottospazio chiuso, Hψ0 ortogonale a Hψ , invariante
sotto T e T ∗ e che verifichi la (8.57) per una corrispondente isometria suriettiva Uψ0 : Hψ0 →
L2 (σ(T ), µψ0 ). Se ψ 0 ⊥ Hψ allora
‚ Z
Œ
0
(T )
ψ f (x, y) dP (x, y)ψ = 0 ,
σ(T )
per ogni f ∈ M (σ(T )). Ma allora, per le proprietà dell’integrale rispetto a misure spettrali ((iii)
e (iv) di (a) in teorema 8.5) vale anche, per ogni coppia g, f ∈ M (σ(T ))
Z
Œ ‚ Z
‚Z
Œ
Z
(T ) 0 (T )
0
(T )
(T )
f dP ψ = ψ g dP
g dP ψ f dP ψ
σ(T )
σ(T )
σ(T )
273
σ(T )
= ψ 0 g(x, y)f (x, y) dP (T ) (x, y)ψ = 0 ,
dove si è tenuto conto che g · f ∈ M (σ(T )) nelle ipotesi fatte. In definitiva, se ψ 0 ⊥ Hψ allora
Hψ0 è ortogonale a Hψ e quindi lo stesso fatto vale per le rispettive chiusure per la continuità del
prodotto scalare. Lo spazio Hψ0 è invariante sotto T e T ∗ (la dimostrazione è la stessa che per
Hψ ) ed è verificata (8.57) per una corrispondente isometria suriettiva Uψ0 : Hψ0 → L2 (σ(T ), µψ0 )
(la prova è quella data all’inizio di questa dimostrazione). In questo modo, scegliendo classi di
vettori {ψα } opportunamente, si possono costruire classi di sottospazi chiusi Hα = Hψα , ciascuno
dotato di un’isometria suriettiva Uα : Uα : Hα → L2 (σ(T ), µψ0 ), in modo tale che gli spazi (a)
siano ortogonali a due a due, (b) siano separatamente invarianti sotto T e T ∗ e (c) verifichino
Z
Uα
σ(T )
f (x, y) dP (T ) (x, y) Hα Uα−1 = f · .
(8.58)
per ogni f ∈ M (σ(T )). Indichiamo C l’insieme di tali classi di sottospazi. Possiamo mettere
in C la relazione d’ordine parziale data dall’inclusione insiemistica. Con tale relazione d’ordine
parziale, ogni sottoinsieme ordinato di C è limitato superiormente, per cui, per il Lemma di
Zorn, ci deve essere in C un elemento massimale {Hα }α∈A . Il sottospazio banale H0 := {0} (per
esso µ0 è la misura nulla – per cui L2 (σ(T ), µ0 ) contiene solo il vettore nullo – e U0 trasforma
il vettore nullo di {0} nel vettore nullo di L2 (σ(T ), µ0 )) è contenuto in {Hα }α∈A : se non fosse
contenuto {Hα }α∈A ∪ {H0 } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Se esiste ψ ∈ H
con ψ ⊥ Hα per ogni α ∈ A e ψ 6= 0, potremmo costruire uno spazio Hψ , differente da tutti gli
Hα , ma che gode delle proprietà (a), (b) e (c). Allora {Hα }α∈A ∪ {Hψ } maggiorerebbe {Hα }α∈A
e si avrebbe un assurdo. Concludiamo che, se ψ è ortogonale a tutti gli spazi Hα allora ψ = 0. In
altre parole, < {Hα }α∈A > = H e quindi, essendo gli spazi a due a due ortogonali: H = ⊕α∈A Hα .
Passiamo a provare (b) nel caso generale di T normale, il caso di T autoaggiunto e T unitario si
provano specializzando la dimostrazione in modo ovvio. Proveremo che vale la doppia implicazione equivalente alla tesi: λ 6∈ supp{µα }α∈A ⇔ λ ∈ ρ(T ).
⇒ Se λ 6∈ supp{µα }α∈A , sia DR un disco aperto di raggio R > 0 centrato in λ con µα (DR ) = 0
per ogni α ∈ A, tale disco esiste sempre nelle ipotesi fatte. Si verifica subito che, in ogni spazio
L2 (σ(T ), µα ), l’operatore moltiplicativo per (x + iy − λ)−1 è limitato con norma non superiore a
1/R (indipendentemente da α) ed è l’inverso destro e sinistro dell’operatore moltiplicativo per
(x + iy − λ). Sia Rλ (α) : Hα → Hα l’operatore Uα−1 (x + iy − λ)−1 · Uα . Rλ (α) ha la stessa norma
dell’operatore moltiplicativo (x + iy − λ)−1 ·, dato che Ua è isometrico suriettivo, per cui vale
anche ||Rλ (α)|| ≤ 1/R. Si definisca l’operatore Rλ : H → H tale che:
Rλ :
X
Pα ψ 7→
α∈A
X
Rλ (α)Pα ψ ,
α∈A
per ogni ψ ∈ H. Tenendo conto di quanto detto nella nota precedente e del fatto che gli
spazi Hα sono invarianti per T e per Rλ (che si riduce a Rλ (α) su ciascuno di essi), si verifica
facilmente che, vale ||Rλ || ≤ 1/R ed inoltre Rλ (T − λI) = (T − λI)Rλ = I. Infatti, dato che
RanRλ (α) = Hα , si ha:
||Rλ ψ||2 = ||
X
α∈A
Rλ (α)Pα ψ||2 = ||
X
Pa Rλ (α)Pα ψ||2 =
α∈A
274
X
α∈A
||Pa Rλ (α)Pα ψ||2
=
X
||Rλ (α)Pα ψ||2 ≤ R−2
α∈A
X
||Pα ψ||2 = R−2 ||ψ||2 .
α∈A
Inoltre
(T − λI)Rλ ψ = (T − λI)Rλ
X
Pα ψ
α∈A
X
(T − λI)Rλ Pα ψ =
α∈A
X
(T − λI) Hα Rλ (a)Pα ψ =
α∈A
X
IPα ψ = ψ ,
α∈A
per cui: (T − λI)Rλ = I. Similmente
Rλ (T − λI)ψ = Rλ (T − λI)
X
Pα ψ
α∈A
X
Rλ (T − λI)Pα ψ =
α∈A
X
Rλ (a)(T − λI) Hα Pα ψ =
α∈A
X
IPα ψ = ψ ,
α∈A
per cui: Rλ (T − λI) = I. Per (a) di teorema 8.1, λ ∈ ρ(T ).
⇐ Supponiamo ora che λ ∈ ρ(T ) per cui esiste (T − λI)−1 : H → H inverso destro e sinistro
di T − λI ed operatore limitato. Definiamo > 0 in modo tale che ||(T − λI)−1 || =: 1/.
Sosteniamo che allora µα (D ) = 0 per ogni α ∈ A, dove D è il disco aperto di raggio centrato
in λ. Procediamo per assurdo. Supponiamo sia falso quanto affermato per ultimo, allora esisterà
β ∈ A tale che µβ (D ) > 0. Sia Dδ0 ⊂ D un secondo disco aperto centrato in un punto di D con
raggio δ tale che 0 < δ < e µβ (Dδ ) > 0, se non esistesse un siffatto Dδ sarebbe µβ (D ) = 01 .
Consideriamo un vettore ψ ∈ H \ {0} definito dal fatto che Pα ψ = 0 se α 6= β e Uβ ψ = f tale
che suppf ⊂ Dδ . Possiamo sempre ridefinire ψ per un fattore moltiplicativo, in modo tale che
||ψ|| = 1. Vale allora, essendo |x + iy − λ| < se x + iy ∈ Dδ ,
2
||(T − λI)ψ|| =
Z
2
2
2
|(x + iy) − λ| |f (x, y)| dµβ (x, y) < Z
Dδ
|f (x, y)|2 dµβ (x, y) = 2 .
Dδ
Quindi vale:
||(T − λI)ψ|| < .
D’altra parte, per definizione di norma di un operatore:
||(T − λI)−1 || ≥
||(T − λI)−1 φ||
||φ||
per ogni φ ∈ H \ {0}. Di conseguenza, posto (T − λI)−1 φ = ψ, vale
||(T − λI)−1 || ≥
||ψ||
,
||(T − λI)ψ||
1
Per ogni z ∈ D , possiamo scegliere un disco aperto centrato in z di raggio positivo δ < in modo tale che
Dδ ⊂ D . In tal modo abbiamo un ricoprimento dell’insieme D fatto da suoi sottoiniemi aperti. Per il lemma
(i)
(i)
di Lindelöf, possiamo estrarre un sotto ricoprimento numerabile {Dδi }i∈N . Valendo D = ∪i∈N Dδi dovrà anche
essere: µβ (E ) ≤
P
i∈N
(i)
(i)
µβ (Dδi ). Se fosse µβ (Dδi ) = 0 per ogni i, avremmo che µβ (D ) = 0.
275
e pertanto:
1/ ≥
1
> 1/ ,
||(T − λI)ψ||
che è assurdo.
Concludiamo la dimostrazione provando (c). Nel caso di H separabile, consideriamo la classe di
vettori {ψn }n∈N come detto sopra (ora α è indicato con n) scegliendoli in modo che ||ψn ||2 = 2−n .
Definiamo MT := ∪+∞
n=1 σ(T ), cioè MT è l’unione disgiunta di infinite copie di σ(T ). Infine definiamo µT richiedendo che si restringa a µn sulla copia n-esima di σ(T ). Deve esser chiaro che in
P
2
questo modo µT (MT ) = +∞
n=0 ||ψn || < +∞. La funzione FT è ovviamente quella che si restringe alla funzione (x + iy)· su ogni componente σ(T ). In questo modo FT risulta essere limitata
dato che ogni copia di σ(T ) è limitato. L’operatore UT è costruito in modo ovvio attraverso gli
Un . 2
Esempi 8.2.
(1) Consideriamo l’operatore T su H := L2 ([0, 1] × [0, 1], dx ⊗ dy) definito da (T f )(x, y) =
xf (x, y), quasi ovunque su X := [0, 1] × [0, 1], per ogni f ∈ H Si verifica facilmente che tale
operatore è limitato, autoaggiunto e con spettro σ(T ) = σc (T ) = [0, 1].
Una misura spettrale su R a supporto limitato che riproduce T come integrale, è quella data dai
(T )
proiettori ortogonali PE definiti come operatori moltiplicativi per le funzioni caratteristiche
0
χE 0 con E := (E ∩ [0, 1]) × [0, 1], per ogni boreliano E ⊂ R. Infatti, usando i lemmi A e B
dell’esempio (1) in esempi 8.1, e con una scelta opportuna per i domini delle funzioni usate, si
verifica che, per ogni g ∈ M (X),
Œ
‚Z
g(λ) P (λ)f (x, y) = g(x)f (x, y) , quasi ovunque su X .
[0,1]
Quindi in particolare
‚Z
Œ
λ P (λ)f
(x, y) = xf (x, y) ,
quasi ovunque su X ,
[0,1]
e quindi:
Z
T =
λ dP (λ) ,
[0,1]
come volevamo. Questa misura spettrale è allora l’unica, su R, a soddisfare (a) del teorema
spettrale.
Ci interessiamo ora al punto (c) dell’enunciato del teorema spettrale. Una decomposizione di
H come quella precisata in tale punto si ottiene nel modo seguente. Sia {un }n∈N una base
hilbertiana di L2 ([0, 1], dy). Consideriamo quindi i sottospazi di H := L2 ([0, 1] × [0, 1], dx ⊗ dy)
dati da, per ogni n ∈ N,
Hn := {f · un | f ∈ L2 ([0, 1], dx)} .
È facile verificare che questa classe di sottospazi soddisfa, rispetto a T , tutte le richieste del
punto (c) del teorema. In particolare, per costruzione Hn è isomorfo a L2 ([0, 1], dx) secondo la
276
trasformazione isometrica suriettiva: f · un 7→ f e quindi µn = dx.
(2) Consideriamo un operatore compatto autoaggiunto T ∈ B(H) nello spazio di Hilbert H. Per
il teorema 4.2, σp (T ) è un insieme discreto di punti in R, con eventualmente il punto 0 come
unico punto di accumulazione. Di conseguenza, σ(T ) = σp (T ), eccetto il caso in cui 0 è punto
di accumulazione di σp (T ), ma 0 6∈ σp (T ). In questo caso (essendo σ(T ) chiuso, per il teorema
8.1) σ(T ) = σp (T ) ∪ {0} e 0 è l’unico elemento di σc (T ) (essendo σr (T ) = ∅ per la proposizione
8.3). Seguendo l’esempio (3) in esempi 8.1, possiamo definire una misura a valori di proiezione
su R che è nulla fuori da σ(T ):
X
PE := sPλ
λ∈E
con E ⊂ σ(T ) e con Pλ proiettore ortogonale sull’autospazio con autovalore λ, se λ è autovalore,
Pλ = 0 (proiettore nullo) altrimenti. Quest’ultima possibilità può capitare solo se λ = 0 e 0 non
è autovalore. Seguendo l’esempio (3) in esempi 3.1, troviamo che
Z
X
λP (λ)ψ =
σ(T )
λPλ ψ ,
λ∈σ(T )
per ogni ψ ∈ H. D’altra parte, per il teorema 4.3, vale anche:
X
λPλ = T ,
λ∈σ(T )
dove abbiamo definito P0 = 0 se 0 ∈ σc (T ).
L’enunciato del teorema 4.3 precisa che tale decomposizione vale nella topologia operatoriale uniforme se si segue un ordine opportuno nell’etichettare gli autovalori. Seguendo tale ordinamento,
vale anche che, per ogni ψ ∈ H:
X
λPλ ψ = T ψ .
λ∈σ(T )
Possiamo interpretare la somma a primo membro nel senso degli integrali rispetto alla misura
a valori di proiezione su σ(T ) definita sopra. Ciò prova anche che la serie a primo membro
può essere riordinata a piacimento (quando i proiettori sono applicati su un vettore ψ ∈ H).
Si osservi infine che, per costruzione, supp(P ) = σ(T ). Concludiamo che: la misura su σ(T )
definita sopra è la misura spettrale di T , unicamente associata a T dal teorema spettrale. Inoltre,
la decomposizione spettrale di T coincide con la decomposizione di T nella topologia forte sui
suoi autospazi :
X
T = sλPλ ,
λ∈σp (T )
l’eventuale punto 0 ∈ σc (T ) non fornisce contributo all’integrale.
Esercizi 8.2.
(1) Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([0, 1], dx) che moltiplica le
277
funzioni per x2 :
(T f )(x) := x2 f (x) .
Trovarne la misura spettrale.
Suggerimento. Costruire una trasformazione unitaria da H a L2 ([0, 1], dy) che trasformi
l’operatore moltiplicativo per x2 nell’operatore moltiplicativo per y.
(2) Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([−1, 1], dx) che moltiplica le
funzioni per x2 :
(T f )(x) := x2 f (x) .
Trovarne la misura spettrale.
Suggerimento. Ragionare come nell’esercizio (1), dopo avere decomposto L2 ([−1, 1], dx) =
2
L ([−1, 0], dx) ⊕ L2 ([0, 1], dx).
(3) Se T ∈ B(H), con H spazio di Hilbert, è un operatore normale, dimostrare che, per ogni
α ∈ C,
Z
eαT =
eα(x+iy) dP (T ) (x, y) ,
σ(T )
dove il primo membro è definito come
eαT :=
+∞
X
αn T n
.
n!
n=0
n n
α z
Suggerimento. La serie +∞
n=0 n! converge assolutamente ed uniformemente in ogni cerchio
chiuso di raggio finito centrato nell’origine di C. Inoltre, per ogni polinomio p(z) (dove z =
x + iy), vale
Z
P
p(x + iy) dP (T ) (x, y) .
p(T ) =
σ(T )
(4) Si dimostrare il seguente notevole risultato, noto come:
Teorema di Fuglede. Se A ∈ B(H) è normale e B ∈ B(H) commuta con A, allora B commuta
anche con A∗ .
∗
∗
Traccia. Per z ∈ C, considerare Z(z) = e−zA BezA , dove gli esponenziali sono definiti per via spettrale in modo ovvio. Usando il fatto che tale definizione coincide con quel∗
la data tramite la serie nella topologia uniforme, concludere che €Z(z) commuta
con ezA e
Š∗
∗
∗
∗
∗
quindi Z(z) = e−zA +zA BezA −zA . Essendo U := e−zA +zA = ezA −zA unitario, risulta ||z(z)|| ≤ ||B|| e quindi la funzione olomorfa (perché ?) C 3 z 7→ (ψ|Z(z)φ) è limitata
su tutto il piano complesso ed è di conseguenza costante. Valutandola per z = 0 si trova:
∗
∗
S(z) = e−zA BezA = B costantemente, cioè
∗
∗
BezA = ezA B .
Usando la rappresentazione spettrale degli esponenziali, oppure facendo uso dello sviluppo in
serie di potenze, e calcolando, per z = 0, la derivata nella topologia forte dei due membri dell’identità trovata, si ricava BA∗ = A∗ B.
278
Per concludere il paragrafo enunciamo un ultimo teorema che è un diretto corollario del teorema
di decomposizione spettrale e del teorema 8.5. La dimostrazione è lasciata per esercizio al lettore.
Teorema 8.8. Siano H spazio di Hilbert e T ∈ B(H) operatore normale.
Ò T : M (σ(T )) → B(H), dalla C ∗ -algebra commu(a) Esiste un unico omomorfismo continuo, Ψ
tativa con unità, M (σ(T )) (spazio delle funzioni misurabili limitate a valori complessi definite
sul compatto di Hausdorff σ(T ) ⊂ R2 dotata della norma dell’estremo superiore || ||∞ e con
involuzione data dalla coniugazione complessa) alla C ∗ -algebra con unità B(H), tale che:
(i) vale l’identità:
Ò T (z) = T ,
Ψ
dove z è la funzione σ(T ) 3 (x, y) 7→ z := x + iy ;
(8.59)
(ii) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora
Ò T (f ) = w- lim Ψ
Ò T (fn ) .
Ψ
n→+∞
Ò T gode delle ulteriori seguenti proprietà:
(b) Ψ
Ò T (f )|| = ||f ||∞ ;
(iii) per ogni f ∈ M (σ(T )) vale ||Ψ
Ò T (f ) = Ψ
Ò T (f )A per ogni
(iv) se, per A ∈ B(H), vale AT = T A e AT ∗ = T ∗ A, allora AΨ
f ∈ M (σ(T ));
Ò T è uno ∗ -omomorfismo di C ∗ -algebre, valendo Ψ
Ò T (f ) = Ψ
Ò T (f )∗ per ogni f ∈ M (σ(T ));
(v) Ψ
(vi) se {fn }n∈N ⊂ M (σ(T )) è limitata e converge puntualmente a f : σ(T ) → C, allora
Ò T (f ) = s- lim Ψ
Ò T (fn ) ,
Ψ
n→+∞
Ò T (f ) ≥ 0,
(vii) se f ∈ M (σ(T )) assume solo valori reali e f ≥ 0, allora Ψ
(viii) se f ∈ M (σ(T )), allora
Ò T (f ) =
Ψ
Z
f (x, y) dP (T ) (x, y) .
σ(T )
279
Capitolo 9
Teoria Spettrale su spazi di Hilbert
II: operatori autoaggiunti non
limitati ed applicazioni.
In questo capitolo, che probabilmente è il più tecnico del libro, esamineremo varie questioni matematiche legate più o meno direttamente alla teoria spettrale per operatori autoaggiunti non
limitati.
Nella prima sezione, estenderemo il teorema spettrale provato nel capitolo precedente, al caso
di operatori autoaggiunti non limitati. Per fare ciò , estenderemo la procedura di integrazione
di rispetto a misure spettrali, al caso di funzioni non limitate. Con questa estenzione e facendo
uso della trasformata di Cayley, dimostreremo il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Daremo quindi due esemi fisicamente importanti di operatori
autoaggiunti non limitati e della loro decomposizione spettrale: l’hamiltoniano dell’oscillatore
armonico e gli operatori posizione ed impulso. Enunceremo infine un teorema di rappresentazione spettrale per operatori autoaggiunti non limitati.
Nella sezione successiva ci concentreremo sulla teoria dei gruppi ad un parametro fortemente
continui di operatori unitari. In primo luogo proveremo l’equivalenza delle varie richieste di continuità . Quindi proveremo il teorema di von Neumann sulla continuità delle dei gruppi ad un
parametro misurabili di operatori unitari, e successivamente dimostreremo il teorema di Stone e
qualche importante conseguenza. In particolare daremo un utile criterio, basato sui gruppi unitari ad un parametro generati da operatori autoaggiunti, per stabilire quando le misure spettrali
di due operatori autoaggiunti commutano.
La terza sezione sarà dedicata alla nozione di prodotto tensoriale hilbertiano di spazi di Hilbert
ed a quella di prodotto tensoriale di operatori (in generale non limitati) ed alle relative proprietà spettrali. Come esempio ed applicazione strudieremo gli operatori associati al momento
angolare orbitale di una particella quantistica.
La quarta sezione sarà dedicata alla procedura di esponenziazione di operatori non limitati, in
relazione alla nozione di vettore analitico introdotto precedentemente.
280
La quinta sezione riguarderà l’estensione del teorema di decomposizione polare al caso di operatori non limitati, chiusi e densamente definiti. In tale sede discuteremo anche le proprietà notevoli
degli operatori della forma A∗ A, con A densamente definito e chiuso, e delle radici quadrate di
operatori autoaggiunti positivi non limitati.
L’ultima sezione riguarderà l’enunciato la dimostrazione e qualche diretta applicazione del teorema di Kato-Rellich che stabilisce criteri affinché un operatore autoaggiunto perturbato additivamente tramite un operatore simmetrico dia ancora luogo ad un operatore autoaggiunto.
9.1
Teorema spettrale per operatori autoaggiunti non limitati.
Ci occuperemo ora di generalizzare parte delle definizioni e dei risultati ottenuti nella sezione
precedente. In particolare vogliamo dimostrare il teorema di decomposizione spettrale nel caso
di operatori autoaggiunti non limitati. L’importanza in fisica di tale teorema risiede nel fatto
che, nella Meccanica Quantistica, la maggior parte degli operatori autoaggiunti che rappresentano osservabili di concreto interesse fisico sono operatori non limitati. Il caso tipico è dato
dall’operatore posizione introdotto nel capitolo 5.
9.1.1
Integrazione di funzioni non limitate rispetto a misure spettrali.
L’estensione dei risultati del capitolo precedente al caso di operatori non limitati si basa sulla
definizione di integrazione di funzioni non limitate rispetto a PVM. Se P è una misura spettrale
sullo spazio topologico a base numerabile X nel senso della definizione 8.3 e se f : X → C è
una funzione
misurabile (rispetto all’algebra di Borel di X), ma non necessariamente limitata, la
R
scrittura: X f (x)dP (x) non ha alcun senso fino ad ora. Cerchiamo di dare senso a tale integrale.
Consideriamo un vettore ψ ∈ H, spazio di Hilbert della PVM P , tale che:
Z
|f (x)|2 dµψ (x) < +∞ ,
(9.1)
X
dove la misura spettrale rispetto a ψ, µψ , è quella definita in (c) del teorema 8.4. Possiamo
sempre trovare una successione di funzioni misurabili e limitate, fn , tali che fn → f per n → +∞
nel senso della norma di L2 (X, µψ ). Per esempio, come si prova facilmente dal teorema della
convergenza dominata di Lebesgue, basta considerare la successione di funzioni fn := χFn · f ,
dove χFn è la funzione caratteristica dell’insieme Fn := {x ∈ X | |f (x)| < n}. Usando (iii) di (a)
e (b) del teorema 8.5, si ricava immediatamente che vale l’identità:
Z
2
Z
Z
fn (x)dP (x)ψ −
fm (x)dP (x)ψ =
|fn (x) − fm (x)|2 dµψ (x) .
X
X
(9.2)
X
R
Pertanto
la successione di vettori X fn (x)dP (x)ψ converge a qualche vettore, che indicheremo
R
con X f (x)dP (x)ψ:
Z
Z
f (x)dP (x)ψ := lim
fn (x)dP (x)ψ .
(9.3)
X
n→+∞ X
281
R
È chiaro che X f (x)dP (x)ψ non dipende dalla successione {fn }n∈N . Se infatti {gn }n∈N è un’altra
successione di funzioni misurabiliR limitate che converge
a f nel senso della norma di L2 (X, µψ ),
R
la norma al quadrato del vettore X fn (x)dP (x)ψ − X gn (x)dP (x)ψ risulta essere maggiorata da,
procedendo come sopra,
Z
|fn (x) − gn (x)|2 dµψ (x) → 0 se n → +∞ ,
X
e pertanto:
Z
lim
n→+∞ X
Z
fn (x)dP (x) = lim
n→+∞ X
gn (x)dP (x) .
Possiamo allora enunciare e provare il primo fondamentale teorema, dopo avere enunciato e
provato un lemma.
Lemma 9.1. Sia X spazio topologico a base numerabile, B(X) la sua σ-algebra di Borel di X,
H spazio di Hilbert, P : B(X) → B(H) una PVM e f : X → C una funzione misurabile. Se le
misure µψ e µφ,ψ sono definite come nel teorema 8.4, dove φ, ψ ∈ H e vale:
Z
|f (x)|2 dµψ (x) < +∞ ,
X
allora f è µφ,ψ -integrabile, cioè f ∈ L1 (X, |µφ,ψ |), e vale:
ÊZ
Z
|f (x)|2 dµψ (x) .
|f (x)|d|µφ,ψ (x)| ≤ ||φ||
(9.4)
X
X
Prova. Cominciamo con il supporre che f sia limitata. In tal caso, da (iv) in (c) nel teorema
8.4:
 Z
‹ Z
φ |f (x)|dP (x)ψ =
|f (x)|dµφ,ψ (x)
X
X
Il teorema di Radon-Nikodym (vedi (1) in esempi 2.2), esiste una funzione h : X → C con
|h(x)| = 1 su X, tale che dµφ,ψ = hd|µφ,ψ |, e quindi:
Z
Z
 Z
‹
|f (x)|d|µφ,ψ (x)| =
|f (x)|h−1 (x)dµφ,ψ (x) = φ |f (x)|h−1 (x)dP (x)ψ .
X
X
X
Di conseguenza, usando (b) del teorema 8.5 e notando che ||f (x)|h−1 (x)|2 = |f (x)|2 , abbiamo:
ÊZ
Z
Z
X
|f (x)|d|µφ,ψ (x)| ≤ ||φ|| |f (x)|h−1 (x)dP (x)ψ = ||φ||
X
|f (x)|2 dµψ (x) .
X
Sia ora f non limitata. Definiamo le funzioni limitate fn := χFn · f come detto sopra, in modo
tale che 0 ≤ |fn (x)| ≤ |fn+1 (x)| → |f (x)| per n → +∞. Per il teorema della convergenza
monotona, tenendo conto del fatto che f ∈ L2 (X, dµψ ), troviamo:
ÊZ
Z
Z
|f (x)|d|µφ,ψ (x)| = lim
X
n→+∞ X
|fn (x)|2 dµψ (x)
|fn (x)|d|µφ,ψ (x)| ≤ ||φ|| lim
n→+∞
282
X
ÊZ
|f (x)|2 dµψ (x) < +∞ .
= ||φ||
X
Questo prova la tesi. 2
Passiamo al teorema. Nell’enunciato, se T : D(T ) → H è un operatore nello spazio di Hilbert
P
k
H con dominio (non necessariamente denso) D(T ) ⊂ H e p(x) = m
k=0 ak x è un polinomio
di grado m a coefficienti complessi, l’operatore p(T ) : D(p(T )) → H è definito sostituendo
formalmente alla variabile x del polinomio p l’operatore T , dove T 0 := I e T k = T · · · T (k volte)
è la composizione di k copie di T , per k = 1, 2, 3, . . . , m. Il dominio naturale D(p(T )) di p(T ) in
tal caso è , in conformità con la definizione definizione 5.1:
D(p(T )) :=
m
\
D(ak T k ) ,
(9.5)
k=0
dove il dominio naturale di D(ak T · · · T ) è definito nella definizione 5.1.
Teorema 9.1. Sia X spazio topologico a base numerabile, B(X) la sua σ-algebra di Borel di X,
H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C misurabile si definisca:
Z
§
ª
2
∆f := ψ ∈ H |f (x)| dµψ (x) < +∞ .
(9.6)
X
Valgono allora i seguenti fatti.
(a) ∆f è un sottospazio denso di H.
(b) L’applicazione:
Z
f (x)dP (x) : ∆f 3 ψ 7→
X
Z
f (x)dP (x)ψ ,
(9.7)
X
dove il secondo membro è definito in (9.3) per una qualsiasi successione di funzioni misurabili
limitate
{fn }n∈N convergente a f in L2 (X, µψ ), definisce un operatore lineare.
R
(c) X f (x)dP (x) coincide con l’operatore in definizione 8.4 se ||f supp(P ) ||∞ < +∞.
ValgonoR inoltre le seguenti proprietà nel caso generale.
(i) X f (x)dP (x) : ∆f → H è un operatore chiuso.
(ii) Vale l’identità:
Z
‹∗ Z
f (x)dP (x) =
f (x)dP (x) e risulta ∆f = ∆f ,
(9.8)
X
X
R
quindi, in particolare, X f (x)dP (x) è autoaggiunto se f è reale.
(iii) Se f : R → C e g : R → C sono misurabili allora, dove · denota il prodotto di funzioni
punto per punto e D il dominio naturale:
Z
Z
Z
Z
Z
‹
f (x)dP (x)+ g(x)dP (x)⊂ (f +g)(x)dP (x) con D f (x)dP (x)+ g(x)dP (x) = ∆f ∩∆g (9.9)
X
X
X
X
283
X
e quindi = si sostituisce a ⊂ se e solo se ∆f +g = ∆f ∩ ∆g , mentre:
Z
Z
Z
Z
Z
‹
f (x)dP (x) g(x)dP (x)⊂ (f · g)(x)dP (x) con D f (x)dP (x) g(x)dP (x) = ∆f ·g ∩ ∆g
X
X
X
X
X
(9.10)
e quindi = si sostituisce a ⊂ se e solo se ∆f ·g ⊂ ∆g . In particolare:
Z
Z
Z
Z
Z
‹
f (x)dP (x) f (x)dP (x)= |f (x)|2 dP (x) e quindi D f (x)dP (x) f (x)dP (x) = ∆|f |2
X
X
Z
X
Z
f (x)dP (x)
X
X
X
X
(9.11)
Z
Z
‹
‹
g(x)dP (x) f (x)dP (x) ∆f ∩∆g ∩∆f ·g , (9.12)
g(x)dP (x) ∆f ∩∆g ∩∆f ·g =
X
X
infine, se f è limitata sul boreliano E ⊂ X, allora ∆χE ·f = H e:
Z
Z
Z
χE (x)dP (x) f (x)dP (x) ⊂
X
X
Z
Z
f (x)dP (x) χE (x)dP (x) = (χE · f )(x)dP (x) ∈ B(H) , (9.13)
X
X
X
(iv) Se X = R e p : R → C è un polinomio (di grado finito m ∈ N) e T :=
Z
p(T ) =
p(x)dP (x)
dove
R
X xdP (x),
D(p(T )) = D(T m ) = ∆p .
vale:
(9.14)
R
R
(v) Definita µφ,ψ come in (c) del teorema 8.4, X f (x)dP (x) è l’unico operatore in H con
dominio ∆f tale che, per ogni ψ ∈ ∆f e φ ∈ H:
 Z
‹ Z
φ f (x)dP (x)ψ =
f (x)dµφ,ψ (x) .
(9.15)
X
X
(vi) Per ogni ψ ∈ ∆f si ha
Z
2
Z
f (x)dP (x)ψ =
|f (x)|2 dµψ (x) .
X
(9.16)
X
R
(vii) L’operatore X f (x)dP (x) è positivo per f positiva, cioè:
 Z
‹
ψ f (x)dP (x)ψ ≥ 0 per ogni ψ ∈ ∆f se f (x) ≥ 0 per x ∈ X
(9.17)
X
(d) Sia X0 un secondo spazio topologico a base numerabile con σ-algebra di Borel B(X0 ). Se
φ : X → X0 è misurabile (cioè φ−1 (E 0 ) ∈ B(X) se E 0 ∈ B(X0 )), allora
B(X0 ) 3 E 0 7→ PE0 0 := Pφ−1 (E 0 )
è una PVM su X0 e, per ogni funzione misurabile f : X0 → C:
Z
X0
f (x0 )dP 0 (x0 ) =
Z
(f ◦ φ)(x)dP (x)
X
284
e quindi
∆0f = ∆f ◦φ ,
(9.18)
avendo indicando con ∆0f il dominio dell’operatore di sinistra.
Prova.
(a) e (b) Dobbiamo per prima cosa provare che, per ogni fissata f : X → C misurabile, se
φ, ψ ∈ ∆f allora φ + ψ ∈ ∆f e cφ ∈ ∆f per c ∈ C arbitrario. Si osservi che ∆f contiene almeno
il vettore nullo di H per cui è non vuoto.
Se φ, ψ ∈ ∆f e E ∈ B(X) si ha:
µφ+ψ (E) = (PE (φ + ψ)|φ + ψ) = µφ (E) + µψ (E) + 2Re(PE φ|ψ) .
Quindi:
µφ+ψ (E) ≤ µφ (E) + µψ (E) + 2|(PE φ|ψ)| .
Vale inoltre:
2|(PE φ|ψ)| ≤
È
(PE φ|φ)(PE ψ|ψ) ≤ (PE φ|φ) + (PE ψ|ψ) = µφ (E) + µψ (E) .
Concludendo:
µφ+ψ (E) ≤ 2(µφ (E) + µψ (E)) .
Questa identità implica che, se L2 (X, µφ ) 3 f e L2 (X, µψ ) 3 f , allora L2 (X, µφ+ψ ) 3 f . Cioè,
se φ, ψ ∈ ∆f allora φ + ψ ∈ ∆f . D’altra parte, essendo µφ (E) = (PE φ|φ), è chiaro che
f ∈ L2 (X, µcφ ) se f ∈ L2 (X,Rµφ ) e c ∈ C. Cioè, se φ ∈ ∆fR allora cφ ∈ ∆f .
Il fatto che l’applicazione X f (x)dP (x) : ∆f 3 ψ 7→ X f (x)dP (x)ψ sia infine lineare segue
immediatamente dal fatto che l’integrale di una funzione limitata rispetto ad una PVM è un
operatore lineare.
Passiamo a provare che il sottospazio ∆f ⊂ H è denso in H. Fissata f come nelle ipotesi, si
definiscano gli insiemi:
En := {x ∈ X | n − 1 ≤ |f (x)| < n} ,
per ogni naturale n ≥ 1. Si osservi che En ∩ Em = ∅ se n 6= m e ∪n En = X. Della definizione 8.3
segue immediatamente che i sottospazi chiusi Hn := P (En )H sono a due a due ortogonali e, per
la proprietà (d) della suddetta definizione, le combinazioni lineari finite di elementi di tutti gli
spazi Hn definiscono un sottospazio denso in H. Mostriamo che ∆f contiene tali combinazioni
lineari. Dal teorema della convergenza monotona, se ψ ∈ H:
Z
|f (x)|2 dµψ (x) = lim
k→+∞
X
k Z
X
n=1 X
|χEn (x)f (x)|2 dµψ (x) ≤ +∞ .
(9.19)
L’integrale dopo il simbolo di sommatoria può essere trascritto, usando (b) in teorema 8.5:
Z
‹
Z
χEn (x)f (x)dP (x)ψ χEn (x)f (x)dP (x)ψ .
X
X
285
D’altra parte, visto che x 7→ χEn (x)f (x) è limitata per costruzione e che χEn = χEn · χEn ,
usando (iii) in (a) di teorema 8.5 si ha
Z
Z
X
χEn (x)f (x)dP (x)ψ =
X
Z
χEn (x)f (x)dP (x)
X
Z
χEn (x)dP (x)ψ =
X
χEn (x)f (x)dP (x)◦P (En )ψ.
Se quindi ψ ∈ Hn per un certo n, essendo i proiettori P (En ) ortogonali a due a due, varrà:
Z
X
se k 6= n .
χEk (x)f (x)dP (x)ψ = 0,
Di conseguenza, nelle ipotesi dette per ψ, la serie in (9.19) si riduce a:
Z
|f (x)|2 dµψ (x) =
X
Z
X
|χEn (x)f (x)|2 dµψ (x) ≤
Z
n2 dµψ (x) = n2 ||ψ||2 < +∞ .
X
Concludiamo che Hn ⊂ ∆f , per ogni n = 1, 2, . . .. Dato che ∆f è sottospazio conterrà anche il
sottospazio denso delle combinazioni lineari finite di elementi di tutti gli spazi Hn . Pertanto ∆f
è denso.
(c) In tutta questa dimostrazione, per f : X → C, definiremo: Fk := {x ∈ X | |f (x)| < k}.
Definiamo fn := χsupp(P ) · f + gn dove gn = χFn · χX\supp(P ) · f e le χn sono le funzioni. In tal
caso fn → f puntualmente, se n → +∞, ed inoltre, per ogni ψ ∈ H
Z
2
|fn (x) − f (x)| dµψ (x) =
X
Z
|fn (x) − f (x)|2 dµψ (x) = 0 .
supp(P )
Di conseguenza, banalmente, fn → f nel senso di L2 (X, µψ ) per ogni ψ ∈ H e quindi, per
definizione,
Z
Z
f (x)dP (x)ψ = lim
X
n→+∞ X
Z
Z
fn (x)dP (x)ψ = lim
n→+∞ supp(P )
f (x)dP (x)ψ =
f (x)dP (x)ψ ,
supp(P )
R
dove l’ultimo integrale è definito nel senso della definizione 8.4 e pertanto supp(P ) f (x)dP (x)
è un operatore limitato.
Prima di tutto notiamo che (vi) segue immediatamente per continuità dalla analoga proprietà ,
valida per funzioni limitate, stabilita in (b) del teorema 8.5, usando la nostra definizione di
integrale di funzioni non limitate. Nello stesso modo (b) del teorema 8.4 implica (vii). Infatti
se f ≥ 0, ψ ∈ ∆f , la successione di funzioni χFn · fn ≥ 0 converge a f in L2 (X, µψ ) per cui:
 Z
‹
 Z
‹
0 ≤ ψ (χFn · f (x))dP (x)ψ → ψ f (x)dP (x)ψ , se n → +∞,
X
X
R
e quindi ψ X f (x)dP (x)ψ ≥ 0.
R
Passiamo agli altri punti. (i) Mostriamo che T := X f (x)dP (x) definito su ∆f è un operatore
chiuso. Per dimostrare questo cominciamo con il notare che, se definiamo gli operatori limitati:
Z
Tk :=
X
χFk (x)f (x)dP (x) ,
286
allora, per ogni ψ ∈ ∆f , vale: (1) T PFk ψ = PFk T ψ = Tk ψ e (2) Tk ψ → T ψ per k → +∞.
La dimostrazione di (1) si ottiene similmente a quella fatta sopra per parte iniziale di (c),
mentre quella di (2) segue dalla discussione che precede l’enunciato del teorema 9.1. Sia quindi
{ψn }n∈N ⊂ ∆f tale che ψn → ψ ∈ H e T ψn → φ, per n → +∞. Mostriamo che φ ∈ ∆f e
T ψ = φ dimostrando, in tal modo, la chiusura di T . Vale, per (1) e per il fatto che PFk → I in
senso forte se k → +∞:
Tk ψ = lim Tk ψn = lim PFk T ψn = PFk φ → φ
n→+∞
n→+∞
in H se k → +∞.
Se definiamo φk := Tk ψ e teniamo conto di abbiamo appena trovato che:
Z
χFk (x)f (x)dP (x)ψ = φk → φ
X
in H se k → +∞.
(9.20)
Quindi, da (b) del teorema 8.5:
Z
X
χFk (x)|f (x)|2 dµψ (x) = ||φk ||2 → ||φ||2 < +∞ se n → +∞.
Il teorema della convergenza monotona assicura allora che f ∈ L2 (X, µψ ), cioè che ψ ∈ ∆f .
Riscrivendo l’identità in (9.20) come Tk ψ = φk e calcolando il limite per k → +∞ usando (2),
abbiamo infine che: T ψ = φ, che è quanto volevamo provare.
(ii) Il fatto che ∆f = ∆f è una ovvia conseguenza della definizione di ∆f e del fatto che |f | = |f |.
Mostriamo ora che X f (x)dP (x) ⊂ X f (x)dP (x) ∗ . Infatti, se ψ ∈ ∆f , φ ∈ ∆f e fn → f in
L2 (X, µφ ) e quindi fn → f in L2 (X, µψ ), dove le fn sono limitate, vale:
‹
 Z
‹
 Z
‹
Z
ψ f (x)dP (x)φ = lim ψ fn (x)dP (x)φ = lim
fn (x)dP (x)ψ φ =
R
R
n→+∞
X
X
Z
=
X
n→+∞
‹
f (x)dP (x)ψ φ
X
(iv) in (a) del
dove abbiamo usato la definizione dell’integrale di f e f rispetto a P e la proprietà
R
teorema 8.5 degli integrali di funzioni limitate fn . Quanto trovato significa che X f (x)dP (x) ⊂
R
R
R
∗
∗
X f (x)dP (x) . Mostriamo ora che vale anche l’inclusione: X f (x)dP (x) ⊃
X f (x)dP (x) .
Per Rquanto ottenuto
sopra, l’inclusione che vogliamo dimostrare segue immediatamente da
∗ D X f (x)dP (x)
⊂ ∆f . Pertanto ci limitiamo a dimostriamo questa seconda inclusione
R
dei soli domini. Definiamo T := X f (x)dP (x) e gli operatori limitati Tk come nella dimostrazione parte iniziale di (c). Fissiamo ψ ∈ D(T ∗ ). Allora esiste h ∈ H tale che, per ogni φ ∈ ∆f :
(ψ|T φ) = (h|φ). Scegliendo φ = Tk∗ ψ otteniamo (ψ|Tk Tk∗ ψ) = (h|Tk∗ ψ), dove abbiamo usato
T Tk∗ = Tk Tk∗ che si prova da Tk∗ = PFk Tk∗ (che segue subito da (iv) e (iii) in (a) del teorema
8.5), ed ulteriormente la proprietà T PFk = Tk , che si prova come nella parte iniziale di (c).
Abbiamo trovato che: ||Tk∗ ψ||2 = (h|Tk∗ ψ). Allora ||Tk∗ ψ||2 ≤ ||Tk∗ ψ|| ||h||, cioè ||Tk∗ ψ|| ≤ ||h||. Di
conseguenza, usando (b) del teorema 8.5:
Z
X
χFk (x)|f (x)|2 dµψ (x) ≤ ||h||2
287
per ogni k ∈ N,
che implica che ψ ∈ ∆f , per il teorema della convergenza monotona. Abbiamo provato che
D(T ∗ ) ⊂ ∆f che era quanto volevamo provare.
(iii) La formula (9.9) ed il commento sotto di essa seguono banalmente dalle definizioni date e
dalla definizione di dominio naturale. Passiamo a dimostrare (9.10). Assumiamo inizialmente
che f sia limitata in modo tale che ∆f ·g ⊂ ∆g , e ψ ∈ ∆g . Sia {gn }n∈N una successione di
funzioni misurabili limitate che converge a g in L2 (X, dµg ). Allora f · gn → f · g in L2 (X, dµg ) e
quindi, tenendo conto che gli integrali di f , gn , f · gn sono tutti nel senso della definizione 8.4 e
che vale (iii) di (a) del teorema 8.5, abbiamo subito che:
Z
Z
Z
f (x)dP (x)
X
X
Dato che
R
X f dP
(f · gn )(x)dP (x)ψ →
gn (x)dP (x)ψ =
X
Z
Z
f (x)dP (x)
g(x)dP (x)ψ =
X
Se ora φ :=
R
X gdP ψ,
Z
(f · g)(x)dP (x)ψ
per n → +∞.
X
è continua, abbiamo provato che:
Z
X
Z
(f · g)(x)dP (x)ψ
se f è limitata e ψ ∈ ∆g .
(9.21)
X
tenendo conto di (vi), l’identità trovata mostra che:
2
|f (x)| dµφ (x) =
X
Z
|(f · g)(x)|2 dµψ (x)
se f è limitata e ψ ∈ ∆g .
(9.22)
X
Sia ora f misurabile arbitraria e quindi, eventualmente, illimitata. Dato
che (9.22)R vale per ogni
R
funzione limitata, varrà anche per quelle illimitate. Dato che D X f (x)dP (x) X g(x)dP (x)
contiene tutti i vettori ψ ∈ ∆g tali che φ ∈ ∆f e che questo succede, per (9.22), se e solo se
ψ ∈ ∆f ·g , noi concludiamo che:
Z
Z
‹
D
f (x)dP (x) gdP (x) = ∆g ∩ ∆f ·g .
X
X
R
Se ora φ ∈ ∆g ∩ ∆f ·g , se ψ = X g(x)dP (x)φ, e se fn := χFn · f (con gli insiemi Fn definiti come
fatto precedentemente), allora fn → f in L2 (X, µψ ), fn · g → f · g in L2 (X, µφ ) e ora (9.21) e (vi)
(con fn al posto di f ) implicano che:
Z
Z
Z
f (x) dP (x)
X
g(x) dP (x)φ =
X
Z
f (x) dP (x)ψ = lim
n→+∞ X
X
Z
= lim
n→+∞ X
(fn · g)(x) dP (x)φ =
Z
fn (x) dP (x)ψ =
(f · g)(x) dP (x)φ .
X
Questo conclude la dimostrazione di (9.10).
L’inclusione (9.10) unitamente al fatto che in essa = si sostituisce a ⊂ se e solo se ∆g ⊃ ∆f ·g ,
implica facilmente (9.12) e (9.13). Riguardo a (9.12), vale ∆f ⊃ ∆f ·f = ∆|f |2 dal momento che,
essendo µψ finita, se ψ ∈ ∆|f (x)|2
Z
X
2
|f (x)| dµψ (x) =
Z
2
|f (x)| · 1dµψ (x) ≤
ÊZ
X
X
288
|f (x)|4 dµψ (x)
ÊZ
X
12 dµψ (x) < +∞ .
(iv) Cominciamo a notare che, in base a (9.10) e (9.9), vale:
p(T ) ⊂
Z
p(x) dP (x) .
X
Di conseguenza, la tesi è vera quando D(p(T )) = ∆p . Dimostriamo questa identità cominciando
a provare che vale:
D(T n ) = ∆xn per n ∈ N.
(9.23)
La prova si ottiene per induzione come segue. Per n = 0, 1, l’identità è vera: D(T 0 ) = ∆1 = H,
D(T ) = ∆x . Assumiamo che sia vera per n e proviamo che lo è per n + 1: D(T n+1 ) = ∆xn+1 .
Dobbiamo cioè provare che D(T T n ) = ∆x◦xn . Usando il commento dopo (9.10), sappiamo che
questo è vero se e solo se ∆x◦xn ⊂ ∆xn . Questa inclusione è verificata dal momento che µψ
è sempre una misura positiva finita e |xn+1 | > |xn | fuori da un compatto J ⊂ R per cui, se
ψ ∈ ∆xn+1 , allora:
Z
2n
|x| dµψ (x) =
Z
Z
2n
|x| dµψ (x) +
J
R
2n
2n
|x| dµψ (x) ≤ sup |x|
≤ sup |x|
Z
Z
1dµψ (x) +
J
R
Z
1dµψ (x) +
J
J
R\J
2n
Z
|x|2n+2 dµψ (x)
R\J
|x|2n+2 dµψ (x) < +∞ .
R
Si osservi che, dato che sarà utile tra poco, abbiamo in particolare verificato che:
D(T n+1 ) = ∆xn+1 ⊂ ∆xn = D(T n+1 ) .
Per concludere la dimostrazione di D(p(T )) = ∆p , calcoliamo separatamente i due membri e
proviamo che coincidono. Sia am 6= 0 il coefficiente di grado massimo del polinomio p. Dato che
D(T n+1 ) ⊂ D(T n ) e che, nel caso generale, D(A+B) = D(A)∩D(B), abbiamo immediatamente
che:
D(p(T )) = D(T m ) .
(9.24)
Passiamo a calcolare ∆p . Dato che ∆xn+1 ⊂ ∆xn si ha subito che ∆xm ⊂ ∆p . Dimostriamo
l’inclusione opposta. Dato che |p(x)|/|x|m → |am | se |x| → +∞, risulta che: |p(x)|/|x|m ≤
|am | + > 0, per ogni > 0, se x è fuori da un certo compatto sufficientemente grande J ⊂ R.
Pertanto, se ψ ∈ ∆p , allora:
Z
R
|x|2m+2 dµψ ≤
Z
|x|2m+2 dµψ +
Z
J J
R\J
≤
1
(|am | + )2
sup |x|2m+2 dµψ ≤
Z
Z
R\J
|p(x)|2 dµψ + sup |x|2m+2
J
R
|p(x)|2
dµψ +sup |x|2m+2 dµψ
(|am | + )2
R
J
Z
Z
dµψ < +∞ ,
R
e quindi ψ ∈ ∆xm . Concludiamo che ∆p ⊂ ∆xm e quindi ∆p = ∆xm . Da (9.23) e (9.24) abbiamo
infine che ∆p = ∆xm = D(T m ) = D(p(T )) e questo conclude la dimostrazione.
(v) Definiamo le solite funzioni limitate fn := χFn · f che tendono a f nel senso di L2 (X, µψ ).
289
Abbiamo allora che, tenendo conto della definizione di integrale di f , ma anche di d (iv) in (c)
nel teorema 8.4:
Z
 Z
‹
 Z
‹
φ f (x)dP (x) ψ = lim φ fn (x)dP (x) ψ = lim
fn (x)dµφ,ψ (x) .
n→+∞
X
n→+∞ X
X
Per concludere, proviamo, usando il lemma 9.1, che:
Z
lim
n→+∞ X
(fn (x) − f (x))dµφ,ψ (x) = 0
Infatti, dal teorema di Radon-Nikodym e dal lemma 9.1:
Z
Z
Z
(fn (x) − f (x))dµφ,ψ (x) = (fn (x) − f (x))h(x)d|µφ,ψ (x)| ≤
|fn (x) − f (x)|d|µφ,ψ (x)|
X
X
X
ÊZ
|fn (x) − f (x)|2 dµψ (x) → 0
≤ ||φ||
X
R
per n → +∞, dalla definizione di X f (x)dP (x)ψ. La proprietàR di unicità segue ora immediatamente.
Se T : ∆f → H soddisfa la stessa prioprietà di X f (x)dP (x), allora T 0 :=
R
T − X f (x)dP (x) verifica (φ|T 0 ψ) = 0 per ogni φ R∈ H, qualunque sia ψ ∈ ∆f . Pertanto,
scegliendo φ = T 0 ψ, risulta ||T 0 ψ|| = 0 e dunque T = X f (x)dP (x).
(d) Diamo solo una traccia della dimostrazione, dal momento che è elementare anche se lunga. Il
fatto che P 0 sia un PVM si verifica subito, controllando che tutte le richieste siano soddisfatte Se
f è una funzione semplice, l’asserto (9.18) vale banalmente. Usando la definizione 8.4, si generalizza facilmente (9.18) alle funzioni misurabili limitate e quindi, facendo uso della definizione
di integrale che abbiamo dato sopra nel caso di f misurabile non limitata, (9.18) si estende al
caso generale. 2
Possiamo quindi dare la seguente definizione basata sulla (9.7), che estende la nozione di integrale di una funzione rispetto ad una PVM. Possiamo anche sfruttare la proprietà (v) in (c) per
dare una definizione equivalente più elegante.
Definizione 9.1. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e
P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X.
(a) Se f : X → C una funzione misurabile con ∆f definito come in (9.6), l’operatore
Z
f (x)dP (x) : ∆f → H
X
dato in (9.7) è detto
integrale di f rispetto alla misura a valori di proiezione P .
R
Equivalentemente, X f (x)dP (x) è definibile come l’unico operatore S : ∆f → H che soddisfa:
(φ |Sψ ) =
Z
f (x)dµφ,ψ (x) ,
per ogni φ ∈ H e ogni ψ ∈ ∆f ,
X
290
dove la misura complessa spettrale µφ,ψ è data in (c) del teorema 8.4.
(b) Per ogni E ⊂ B(X) e per ogni f : X → C misurabile oppure g : E → C misurabile, gli
integrali
Z
Z
f (x) dP (x) :=
E
e
χE (x)f (x) dP (x)
X
Z
Z
g(x) dP (x) :=
g0 (x) dP (x) ,
E
X
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x 6∈ E, sono detti, rispettivamente, integrale
di f su E e integrale di g su E (rispetto alla misura a valori di proiezione P ).
Note.
(1) Per (c) del teorema 9.1, questa definizione estende quella già data in definizione 8.4 per il
caso di funzioni limitate.
(2) Con la definizione data, per ogni f : X → C misurabile, vale:
Z
Z
Z
f (x)dP (x) =
X
f (x)dP (x)
e quindi
f (x)dP (x) = 0 .
supp(P )
(9.25)
X\supp(P )
La prova è quasi immediata notando che, dal momento che supp(µψ ) ⊂ supp(P ) per definizione
di µψ , abbiamo che ∆f = ∆χsupp(P )·f e questo prova che i due operatori nei due membri della
prima identità in (9.25) hanno lo stesso dominio. Siano ora fn delle funzioni limitate che convergono a f in L2 (X, µψ ). Allora χsupp(P ) · fnR → χsupp(P ) · f e quindi,
tenendo conto del fatto
R
che (vedi (3) in note dopo la definizione 8.4) X χsupp(P ) · fn dP = X fn dP , abbiamo:
Z
Z
f (x)dP (x)ψ :=
supp(P )
X
(χsupp(P ) · f )(x)dP (x)ψ = lim
Z
n→+∞ X
Z
= lim
n→+∞ X
(χsupp(P ) · fn )(x)dP (x)ψ
Z
fn (x)dP (x)ψ =
f (x)dP (x)ψ .
X
Esempi 9.1.
(1) Consideriamo la misura spettrale:
P : B(N ) 3 E 7→ PE =
X
z(z| )
z∈E
introdotta in (2) di esempi 8.1 su una base hilbertiana N di uno spazio di Hilbert separabile H,
dotando N di struttura topologico a base numerabile con la topologia banale dell’insieme delle
parti. Ci interessa arrivare a scrivere una formula esplicita per l’integrale di funzioni f : N → C
non
limitate, facendo uso della definizione (9.3). Nel caso che stiamo studiando, la condizione
R
P
|f
(z)|2 dµψ (z) < +∞ si specializza nella richiesta z∈N |f (z)|2 |(z|ψ)|2 < +∞. Vogliamo
N
mostrare che, anche nel caso di funzioni f illimitate, si ottiene ancora la formula:
Z
X
f (z)dP (z) = sN
z∈N
291
f (z)z(z| ) ,
provata in (2) di esempi 8.1 per funzioni f limitate. Infatti, se {Nn }n∈N è una classe di sottoinsiemi finiti di N con Nn+1 ⊃ Nn e ∪n∈N Nn = N , la successione di funzioni limitate fn := χNn · f
P
converge nel senso della norma L2 (N, µψ ), per ogni ψ ∈ H tale che z |f (z)|2 |(z|ψ)|2 < +∞,
come semplice applicazione del teorema della convergenza dominata di Lebesgue. Pertanto, in
base alla definizione (9.3) adottata per l’integrale di una funzione non limitata rispetto ad una
P
PVM, abbiamo che, se z∈N |f (z)|2 |(z|ψ)|2 < +∞, allora:
Z
Z
f (z)dP (z)ψ := lim
n→+∞ N
N
fn (z)dP (z)ψ
(9.26)
D’altra parte, dato che fn è limitata, per quanto provato in (2) di esempi 8.1:
Z
fn (z)dP (z)ψ = sN
X
fn (z)(z|ψ) =
z∈N
X
f (z)z(z|ψ) ,
z∈Nn
dove, nella seconda identità la somma è finita, dato che Nn contiene un numero finito di punti.
La definizione (9.26) si riduce allora a:
Z
f (z)dP (z)ψ = lim
n→+∞
N
cioè :
Z
f (z)z(z|ψ) ,
z∈N
X
f (z)dP (z) = sN
X
f (z)z(z| ) .
(9.27)
z∈N
Nella prossima sezione vedremo un esempio concreto di operatore autoaggiunto non limitato
costruito con questo tipo di misura spettrale.
(2) In riferimento a (1) in esempi 8.1, consideriamo la stessa misura spettrale definita in quell’esempio. Consideriamo quindi uno spazio di Hilbert H = L2 (X, µ), dove X è uno spazio topologico
a base numerabile e µ è una misura sulla σ-algebra di Borel di X. La misura spettrale su H che
vogliamo prendere in considerazione si ottiene definendo, per ogni ψ ∈ L2 (X, µ) e E ∈ B(X):
(P (E)ψ)(x) := χE (x)ψ(x) ,
per quasi ogni x ∈ X .
(9.28)
Si osservi che in questo caso, se ψ ∈ H, la misura µψ risulta:
Z
µψ (E) = (ψ|P (E)ψ) =
|ψ(x)|2 dµ(x) ,
E
per ogni E ∈ B(X) .
Di conseguenza, se g : X → C è misurabile, risulta che:
Z
Z
g(x)dµψ (x) =
X
g(x)|ψ(x)|2 dµ(x) .
X
Abbiamo provato in (1) in esempi 8.1, che se f : X → C è misurabile e limitata, allora:
Z
‹
f (y) dP (y)ψ (x) = f (x)ψ(x) per ogni ψ ∈ L2 (X, µ), per quasi ogni x ∈ X .
X
292
(9.29)
Mostriamo che il risultato si generalizza a funzioni misurabili non limitate, purché ψ ∈ ∆f . Se
f : X → C è misurabile non limitata, consideriamo una successione di funzioni misurabili limitate
fn tali che fn → f per n → +∞ nel senso di L2 (X, µψ ), quando ψ ∈ ∆f . In altre parole, in base
all’espressione esplicita della misura µψ ottenuta sopra, deve essere:
Z
|fn (x) − f (x)|2 |ψ(x)|2 dµ(x) → 0
per n → +∞.
X
Tenendo conto di (9.29) risulta allora immediatamente che:
||f · ψ − fn · ψ||2H =
Z
|f (x) − fn (x)|2 |ψ(x)|2 dµ(x) → 0
per n → +∞.
X
Conseguentemente, in base alla definizione di integrale di f rispetto a P , concludiamo che: per
ogni ψ ∈ ∆f , dove f : X → C è misurabile anche non limitata, vale sempre:
Z
‹
f (x)dP (x)ψ (y) = f (x)ψ(y) per quasi ogni y ∈ X.
(9.30)
X
9.1.2
Teorema di decomposizione spettrale per operatori autoaggiunti non
limitati.
Siamo ora in grado di enunciare e provare il teorema di decomposizione spettrale per operatori
autoaggiunti non limitati. Ci limiteremo ad enunciare e provare tale teorema per il caso di
operatori non limitati autoaggiunti. Tuttavia è possibile estendere il risultato agli operatori non
limitati normali [Rud91].
Teorema 9.2. Sia T operatore autoaggiunto (non necessariamente limitato) sullo spazio di
Hilbert H. Valgono i seguenti fatti.
(a) Esiste ed è unica una misura a valori di proiezione P (T ) su R (dotato della topologia
standard) tale che:
Z
λ dP (T ) (λ) .
(9.31)
supp(P (T ) ) = σ(T )
(9.32)
T =
R
(b) Vale l’identità:
e valgono in particolare i seguenti fatti
(i) λ ∈ σp (T ) se e solo se P (T ) ({x}) 6= 0;
(ii) λ ∈ σc (T ) se e solo se P (T ) ({x}) = 0 e, per ogni aperto Ax ⊂ R con Ax 3 x, è
(T
P ) (Ax ) 6= 0;
(iii) se λ ∈ σ(T ) è un punto isolato, allora λ ∈ σp (T );
(iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ D(T ) con ||φ || = 1 e
0 < ||T φ − λφ || ≤ .
293
Prova. (a) Sia V la trasformata di Cayley di T . V è un operatore unitario per il teorema 5.4,
dato che T è autoaggiunto. Se S1 := {(x, y) ∈ R2 | x2 + y 2 = 1}, definiamo X := S1 \ {(1, 0)}
e nel seguito z = x + iy. Dotiamo X della topologia indotta da R2 . Sia infine P (V ) la misura
spettrale di V in R2 ≡ C, che esiste per il teorema 8.6. Se z = x + iy, vale:
Z
zdP (V ) (x, y) .
V =
(9.33)
R2
Dal teorema 8.6 sappiamo anche che σ(V ) = supp(P (V ) ) ⊂ S1 . Inoltre I − T è iniettiva per (ii)
in (b) del teorema 5.4 e di conseguenza 1 = 1 + i0 6∈ σp (V ). A sua volta questo implica che
P (V ) ({(0,
1)}) = 0 per (ii) in (b) di teorema 8.6. Di conseguenza, la decomposizione spettrale
R
V = S1 zdP (V ) (x, y) data nel teorema 8.6, può scriversi equivalentemente come:
Z
zdP (V ) (x, y) .
V =
(9.34)
X
Si osservi che possiamo direttamente pensare P (V ) come una PVM su X rispetto alla sua σalgebra di Borel B(X), e la formula di decomposizione scritta sopra continua ad avere senso.
(Più precisamente, l’applicazione B(X) 3 E 7→ P (V ) (E) è ancora una PVM e, per computo
diretto, si vede facilmente che l’integrale di ogni f limitata definita su X rispetto a tale PVM
coincide con quello di f , estesa come la funzione nulla sulla parte rimanente di R2 , calcolato
rispetto alla PVM iniziale P (V ) . Applicando la definizione di integrale di funzioni misurabili
non limitate, il risultato si estende anche a tale classe di funzioni). Definiamo ora la funzione a
valori in C, misurabile non limitata su X:
f (z) := i
1+z
1−z
z ∈X,
(9.35)
e quindi integriamola rispetto alla misura spettrale P (V ) su X, ottenendo l’operatore (non
limitato in generale):
Z
T 0 :=
f (z)dP (V ) (x, y) .
(9.36)
X
Dato che f assume valori reali (quando (x, y) ∈ X), l’operatore T 0 è necessariamente autoaggiunto. L’identità f (z)(1 − z) = i(1 + z), in virtù di (iii) in (c) del teorema 9.1, implica:
T 0 (I − V ) = i(I + V ) .
(9.37)
In particolare (9.37) implica che Ran(I − V ) ⊂ ∆f =: D(T 0 ). Dal teorema teorema 5.4 abbiamo
che
T (I − V ) = i(I + V ) e D(T ) = Ran(I − V ) ⊂ ∆f .
Per confronto con (9.37), concludiamo che T 0 deve essere un estensione autoaggiunta di T . Dato
che T = T ∗ e quindi non ammette altre estensioni autoaggiunte, deve essere T = T 0 . Abbiamo
ottenuto che:
Z
T =
f (z)dP (V ) (x, y) .
(9.38)
X
294
La funzione f : X → R è in realtà biettiva e pertanto ricopre tutto R. Applicando allora (d) del
teorema 9.1, abbiamo finalmente che: B(R) 3 E 7→ P (T ) (E) := P (V ) (f −1 (E)) è una PVM su R
ed inoltre (9.38) può essere riscritta come la (9.31):
Z
λdP (T ) (λ) .
T =
R
Questo è lo sviluppo spettrale che volevamo provare esistere. Passiamo all’unicità della misura
spettrale che soddisfa (9.31). Sia P 0 una PVM su R con:
Z
λdP 0 (λ) .
T =
R
La trasformata di Cayley si può allora scrivere, in base a (c) del teorema 9.1:
V = (T − iI)(T + iI)
−1
Z
=
R
λ−i
dP (T ) (λ) .
λ+i
Usando (d) dello stesso teorema e dove f : X → R è la stessa funzione biettiva definita sopra:
Z
V =
zdP (T ) (f −1 (x, y)) ,
S1
dove B(S1 ) 3 E 7→ Q(E) := P 0 (f −1 (E)) risulta essere una PVM su X = S1 \ {1}. Possiamo
estendere in modo ovvio tale PVM su R2 richiedendo che, se F ∈ B(R2 ), Q(F ) = Q(F ∩ X).
Abbiamo allora che:
Z
V =
zdQ(x, y) .
R2
Dato che vale anche (9.33), per l’unicità della misura spettrale associata ad un operatore normale
limitato per il teorema 8.6, deve accadere che: Q(F ) = P (V ) (F ) per ogni boreliano di R2 .
Riducendosi ad insiemi in X = S1 \ {1}, dovrà anche valere: P 0 (f −1 (E)) = P (T ) (f −1 (E)) e
quindi, dato che f −1 è biettiva da R a X, deve essere: P 0 (G) = P (T ) (G) per ogni sottoinsieme
boreliano G di R.
(b) Passiamo a dimostrare che σ(T ) = supp(P (T ) ). Dimostreremo equivalentemente che λ0 ∈
ρ(T ) se e solo se λ0 6∈ supp(P (T ) ). Per prima cosa proviamo che λ0 6∈ supp(P (T ) ) implica
λ0 ∈ ρ(T ). Infatti, nell’ipotesi fatta su λ0 , esiste un intervallo aperto (a, b) ⊂ R \ supp(P (T ) )
con λ0 ∈ (a, b). Di conseguenza:
Z
R
1
dP (T ) (λ) =
λ − λ0
Z
R
χR\(a,b) (λ)
1
dP (T ) (λ) .
λ − λ0
Applicando (c) del teorema 9.1, dato che, nel secondo integrale, la funzione integranda è limitata
concludiamo che l’operatore:
Z
Rλ0 (T ) :=
R
1
dP (T ) (λ)
λ − λ0
295
è limitato ed ha dominio pari a tutto H. Inoltre, sempre per (iii) in (c) dello lo stesso teorema,
prestando attenzione ai domini su cui ha senso definire il prodotto di operatori, otteniamo:
Rλ0 (T )(T − λ0 I) = ID(T ) ,
(T − λ0 I)Rλ0 (T ) = I .
Si osservi che la seconda identità vale su tutto H e pertanto abbiamo da essa che deve anche
valere: Ran(T − λ0 I) = H. L’operatore Rλ0 (T ) è quindi, come la notazione suggerisce, il
risolvente di T associato a λ0 e quindi, per definizione λ0 ∈ ρ(T ). Passiamo ora a provare che
λ0 ∈ ρ(T ) implica λ0 6∈ supp(P (T ) ). Nelle ipotesi dette per λ0 , P (T ) ({λ0 }) = 0, altrimenti
(T )
esisterebbe ψ ∈ P{λ0 } (H) \ {0} che implicherebbe (per (iii) in (c) del teorema 9.1):
Z
Tψ =
R
(T )
λdP (T ) (λ)P{λ0 } ψ =
Z
Z
λdP (T ) (λ)
R
Z
χ{λ0 } (λ)dP (T ) (λ)ψ =
Z
R
λχ{λ0 } (λ)dP (T ) (λ)ψ
R
(T )
=
R
λ0 χ{λ0 } (λ)dP (T ) (λ)ψ = λ0 P{λ0 } ψ = λ0 ψ
e dunque ψ ∈ σp (T ) che è impossibile, dato che λ0 ∈ ρ(T ). Ulteriormente, nelle stesse ipotesi su
λ0 esiste l’operatore risolvente Rλ0 (T ), cioè l’operatore limitato con dominio:
D(Rλ0 (T )) = Ran(T − λ0 I) = H ,
per (a) in teorema 8.1, essendo T = T ∗ e quindi T è chiuso, che soddisfa (T − λ0 I)Rλ0 (T ) = I e
anche Rλ0 (T )(T − λ0 I) = ID(T ) . D’altra parte, da (iii) in (c) del teorema 9.1 e tenendo conto
che, P (T ) ({λ0 }) = 0, si trova subito (facendo attenzione ai domini sui quali valgono le identità ):
Z
‹
Z
1
1
(T )
dP (λ) (T − λ0 I) = ID(T ) , (T − λ0 I)
dP (T ) (λ) = I .
R λ − λ0
R λ − λ0
1
Si osservi che dalla prima identità si evince anche che il dominio di R λ−λ
dP (T ) (λ) è D(T −λ0 I),
0
cioè con tutto lo spazio H, per quanto detto sopra. Non è importante come abbiamo definito la
1
funzione λ 7→ λ−λ
esattamente per λ = λ0 , dato che P (T ) ({λ0 }) = 0. Per l’unicità dell’operatore
0
inverso deve allora essere:
Z
1
dP (T ) (λ) = Rλ0 (T ) ,
R λ − λ0
dunque l’operatore a primo membro deve essere limitato. Supponiamo allora, per assurdo, che
sia λ0 ∈ supp(P (T ) ), allora ogni aperto che contiene λ0 e quindi, in particolare, ogni intervallo
(T )
In := (λ0 − 1/n, λ0 + 1/n), deve soddisfare P (T ) (In ) 6= 0. Sia allora ψn ∈ PIn (H) \ {0} per ogni
n = 1, 2, . . .. Senza perdere generalità supponiamo anche che: ||ψn || = 1. Con questa scelta ed
usando (vi) in (c) del teorema 9.1, si ottiene che:
R
Z
||Rλ0 (T )ψn ||2 = ≥ inf
In
1
|λ − λ0 |2
Z
In
R
2
1
dP (T ) (λ)ψn =
λ − λ0
dµψn (λ) ≥ inf
In
Z
In
1
dµψn (λ)
|λ − λ0 |2
1
= n2 → +∞
|λ − λ0 |2
296
se n → +∞.
Pertanto abbiamo raggiunto l’assurdo che Rλ0 (T ) non può essere limitato. Quindi deve valere
λ0 6∈ supp(P (T ) ).
Dimostriamo ora che vale (i). Come visto nella dimostrazione appena conclusa, se P (T ) ({x}) 6= 0,
allora x ∈ σp (T ). Supponiamo ora che x ∈ σp (T ). Dalla definizione di trasformata di Cayley
V di T , segue facilmente che ((x − i)/(x + i)) ∈ σp (V ). Possiamo allora applicare (i) in (b)del
teorema 8.6 per l’operatore normale V (dato che è unitario) sostituito a T nell’enunciato di quel
x−i
teorema. Concludendo che P (V ) ( x+i
) 6= 0. Per come abbiamo ricavato la PVM associata a T
x−i
da quella associata a V , segue immediatamente che P (T ) (x) = P (V ) ( x+i
) 6= 0.
Passiamo a dimostrare (ii). Per (a) in proposizione 8.3, x ∈ σc (T ) significa che (a) x ∈ σ(T ),
ma (b) x 6∈ σp (T ). L’affermazione (a) equivale a x ∈ supp(P (T ) ) e quindi ogni aperto Ax che
include x deve verificare P (T ) (Ax ) 6= 0, la (b) equivale quindi a dire P (T ) ({x}) = 0 (altrimenti,
per (i) avremmo un assurdo).
La prova di (iii) è immediata, se x ∈ supp(P (T ) ) ed è un punto isolato, deve essere P (T ) ({x}) 6= 0,
altrimenti x non potrebbe appartenere a supp(P (T ) ), applicando (i) segue la tesi.
Per concludere dimostriamo (iv). Se x ∈ σc (T ), allora applicando (iv) per la classe di intervalli
In := (x − 1/n, x + 1/n), con n = 1, 2, . . ., deve risultare P (T ) (In ) 6= 0. Scegliamo pertanto
(T )
ψn ∈ PIn (H), per ogni n e tale che ||ψn || = 1. Avremo allora che:
Z
Z
‹
2
(T )
(T )
||T ψn − xψn || =
(λ − x)dP (λ)ψn ψ (λ − x)dP (λ)ψ =
Z
R
R
R
Z
‹
(T )
(λ − x)dP (T ) (λ)PIn ψn (λ − x)dP (T ) (λ)ψn
R
Applicando (iii) in (c) in teorema 9.1, l’ultimo prodotto scalare si scrive
Z
Z
χIn (x)(λ − x)2 dµψn (λ) ≤
=n
−2
Z
In
dµψn (λ) = n
−2
sup(λ − x)2 dµψn (λ) =
In In
R
Z
dµψn (λ) = n−2 ||ψn ||2 .
R
Abbiamo trovato che, per ogni n = 1, 2, . . ., esiste ψn 6= 0, con ||ψn || = 1 e tale che:
||T ψn − xψn || ≤ 1/n .
Questo implica immediatamente la tesi dato che deve anche essere 0 < ||T ψn − xψn || perchè altrimenti sarebbe x ∈ σp (T ) cosa che abbiamo escluso, essendo x ∈ σc (T ) per ipotesi. 2
Dopo il teorema spettrale, possiamo dare una utile definizione per le applicazioni in meccanica
quantistica.
Definizione 9.2. Sia T operatore autoaggiunto sullo spazio di Hilbert H. Se f : R → C,
l’operatore
Z
f (x)dP (T ) (x) ,
f (T ) :=
R
297
(9.39)
§
D(f (T )) = ∆f := ψ ∈ H
con dominio
Z
ª
|f (x)|2 dµψ (x) < +∞
R
è detto funzione f dell’operatore T .
Osservazioni.
(1) Il teorema spettrale consente una differente decomposizione dello spettro di un operatore
autoaggiunto T : D(T ) → H. Un decomposizione è quella in spettro discreto, σd (T ), e spettro
essenziale, σess (T ) := σ(T ) \ σd (T ), dove:
n
(T )
σd (T ) := λ ∈ σ(T ) dim P(λ−,λ+) (H)
è al più numerabile per qualche > 0
o
.
Si dimostra facilmente che λ ∈ σd (T ) se e solo se λ è un punto isolato di σ(T ). Di conseguenza,
per il teorema 9.2, σd (T ) ⊂ σp (T ). Tuttavia, in generale, non è vera l’inclusione opposta,
perchè possono esserci punti di σp (T ) non isolati (si pensi al caso in cui 0 è un autovalore ed
anche punto di accumulazione dello spettro di alcuni operatori compatti autoaggiunti).
(2) Una terza decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H, si
ottiene decomponendo lo spazio di Hilbert nel sottospazio chiuso Hp generato dagli autovettori
⊥
e nel suo ortogonale: H = Hp ⊕ H⊥
p . Si vede facilmente che Hp , Hp ⊂ D(T ) e tali spazi sono
invarianti sotto l’azione di T . Con ovvie notazioni:
T = T Hp ⊕T H⊥
.
p
Vale ovviamente σp (T ) := σ(T Hp ), mentre si definisce lo spettro puramente continuo
σpc (T ) := σ(T H⊥
). Risulta σ(T ) = σp (T ) ∪ σpc (T ). Si noti che questa decomposizione non
p
è necessariamente in due insieme disgiunti e nel caso generale σpc (T ) 6= σc (T ).
(3) Una quarta decomposizione dello spettro, per un operatore, T : D(T ) → H sullo spazio di
Hilbert H (ma la definizione si può dare per un generico spazio normato), è quella in spettro
puntuale approssimato, σpa (T ) e spettro residuo puro σrp (T ) := σ(T ) \ σps (T ), dove:
σpa (T ) := λ ∈ σ(T ) | (T − λI)−1 : Ran(T − λI) → D(T ) non esiste oppure non è limitato.
Osservando che la non limitatezza di (T − λI)−1 è equivalente al fatto che esiste δ > 0 con
||(T − λI)ψ|| ≥ δ||ψ|| per ogni ψ ∈ D(T ), si dimostra immediatamente il seguente risultato che
giustifica la terminologia. λ ∈ σpa (T ) se e solo se, per ogni > 0, esiste ψ ∈ D(T ) con ||ψ|| = 1
tale che:
||T ψ − λψ|| ≤ .
Dato che, per gli operatori autoaggiunti, la proprietà di sopra vale per ogni λ ∈ σc (T ) per (b) del
teorema 8.6, ma anche per λ ∈ σp (T ) banalmente, e tenendo conto che σ(T ) = σp (T ) ∪ σc (T ) nel
caso in esame, concludiamo che σpa (T ) = σ(T ) e σrp (T ) = ∅ per tutti gli operatori autoaggiunti.
(4) Dato che supp(P (T ) ) = σ(T ), la definizione (9.39) può equivalentemente essere scritta:
Z
f (x)dP (T ) (x) .
f (T ) :=
σ(T )
298
(9.40)
Nello stesso modo, dato che supp(µφ,ψ ) ⊂ supp(P (T ) ), possiamo equivalentemente scrivere per
il dominio di f (T ):
Z
¨
«
2
D(f (T )) = ψ ∈ H |f (x)| dµψ (x) < +∞ .
σ(T )
(5) Da (iv) in (c) del teorema 9.1 risulta che, per ogni operatore autoaggiunto T , il dominio
naturale di un polinomio p(T ) ed il dominio dello stesso operatore pensato come funzione di T
coincidono. Dalla definizione di dominio naturale si ha anche che:
D(T m ) ⊂ D(T n )
per ogni operatore autoaggiunto T e per 0 ≤ n ≤ m, con n, m ∈ N. (9.41)
Le funzioni di un operatore godono allora delle notevoli proprietà che seguono immediatamente
dal teorema 9.1. La seguente proposizione specifica ulteriori proprietà in relazione allo lo spettro
dell’operatore autoaggiunto T . Ricordiamo che f : X → Y, con X, Y spazi normati, è detta essere
localmente lipschitziana se, per ogni x ∈ X, esistono un intorno aperto Ix e una costante
LIx ≥ 0 (che diremo di Lipschitz) tali che ||f (z) − f (z 0 )||Y ≤ LIx ||z − z 0 ||X per ogni z, z 0 ∈ X.
Proposizione 9.1. Sia T operatore autoaggiunto sullo spazio di Hilbert H e f : R → C una
funzione misurabile. L’operatore f (T ) gode delle seguenti proprietà.
(a) σ(f (T )) ⊂ f (σ(T )) dove la barra indica la chiusura topologica. Vale σ(f (T )) = f (σ(T )) se
f è derivabile su R oppure, più debolmente, se è localmente lipschitziana.
(b) Vale f (σp (T )) ⊂ σp (f (T )).
Prova.
to
che
R
(a) Sia x0 6∈ f (σ(T )).
Allora la funzione σ(T ) 3 x 7→
1
f (x)−x0
è limitata.
Da-
supp(P (T ) )
= σ(T ) per il teorema 9.2, dobbiamo allora concludere che l’operatore
sia limitato e con dominio dato da tutto H. Vale inoltre, applicando (iii)
in (c) del teorema 9.1 e tenendo conto dei domini degli operatori:
1
(T ) (x)
R f (x)−x0 dP
Z
R
e anche che:
1
dP (T ) (x)
f (x) − x0
Z
R
Z
(f (x) − x0 )dP
(f (x) − x0 )dP (T ) (x) = ID(f (T )−x0 I) ,
R
(T )
Z
(x)
R
1
dP (T ) (x) = I .
f (x) − x0
Dalla seconda siRevince che Ran(f (T ) − x0 I) = H. Tenendo conto della prima identità e del fatto
1
che l’operatore R f (x)−x
dP (T ) (x) è limitato, abbiamo ottenuto che quest’ultimo operatore è il
0
risolvente di f (T ) associato a x0 ; di conseguenza x0 ∈ ρ(f (T )), cioè x0 6∈ σ(f (T )). Abbiamo
provato che, se x0 ∈ σ(f (T )), allora x0 ∈ f (σ(T )). In altre parole: σ(f (T )) ⊂ f (σ(T )).
Mostriamo ora che l’inclusione è un identità se f è derivabile o localmente lipschitziana sull’asse
reale. In realtà proveremo che f (σ(T )) ⊂ σ(f (T )). Questo concluderà la dimostrazione, in
299
quanto essendo ogni spettro chiuso, si ha di conseguenza f (σ(T )) ⊂ σ(f (T )).
Supponiamo dunque che x0 = f (λ0 ) ∈ f (σ(T )), dove λ0 ∈ σ(T ) può non essere unico, e proviamo
che x0 ∈ σ(f (T )). Nelle ipotesi su x0 , se qualche λ0 ∈ σp (T ), la dimostrazione si conclude per
l’asserto (b) di questa proposizione (la cui dimostrazione non dipende da quella che stiamo
facendo), valendo x0 = f (λ0 ) ∈ σp (f (T )) ⊂ σ(f (T )). Se per ogni λ0 che individua il fissato x0
tramite f vale λ0 6∈ σp (T ), allora per ciascuno di tali λ0 deve essere P (T ) ({λ0 }) = 0 per (ii) in
(b) del teorema 9.2. Assumiamo di essere in questo caso e, per assurdo, che x0 6∈ σ(f (T )). Di
conseguenza x0 ∈ ρ(f (T )) e questo significa che l’operatore chiuso f (T ) − x0 I è una biezione
da D(f (T )) a tutto H, per (a) del teorema 8.1. Consideriamo infine l’identità , che sussiste su
D(f (T )) in virtù di (iii) in (c) del teorema 9.1:
Z
R
1
dP (T ) (λ)(f (T ) − x0 I) =
f (λ) − x0
Z
R
f (λ) − x0 (T )
dP (λ)D(f (T )) = ID(f (T )) .
f (λ) − x0
Si osservi che la definizione della funzione 1/(f (λ)−x0 ) in (ogni) λ0 è del tutto irrilevante
dato che
R
1
(T ) (λ)
dP
P (T ) ({λ0 }) = 0. L’identità operatoriale trovata dice anche che il dominio di R f (λ)−x
0
deve essere tutto H, dato che Ran(f (T ) − x0 I) = H nelle nostre ipotesi:
‚Z
Œ
1
(T )
D
dP (λ) = H .
(9.42)
R f (λ) − x0
Dimostriamo che (9.42) è falsa se f è derivabile
su R, arrivando ad un assurdo. Fissiamo uno
R
1
dei valori λ0 . Dato che λ0 ∈ σ(T ), l’operatore R λ−λ
dP (T ) (λ) non può essere definito su tutto
0
H, altrimenti, ragionando come sopra, T − λ0 I sarebbe una biezione da D(T ) a tutto H ed
avremmo un assurdo. Dato che, per ogni intervallo aperto limitato I che include λ0 , la funzione
(T )
1/(λ − λ€0 ) è limitata su RŠ \ I, deve accadere che, per ogni detto I, esista ψI ∈ PI (H) tale che
R
1
dP (T ) (λ) .
ψI 6∈ D R λ−λ
0
(T )
(T )
(Altrimenti potremmo decomporre ogni ψ ∈ H come ψ = PI ψ + PR\I ψ ed avremmo, spezR
1
zando l’integrale nei due contributi su I e su R \ I, che R |λ−λ
2 dµψ (λ) < +∞ e quindi
0|
€R
Š
1
(T
)
D R λ−λ0 dP (λ) = H.)
Se L :=
df dλ λ0 ,
2
df vale dλ
< |L|2 + e quindi, in un intervallo aperto I che include λ0 e per
λ0
qualche > 0:
|f (λ) − f (λ0 )|2 ≤ (|L|2 + )|λ − λ0 |2 .
Si arriva allo stesso risultato se f è localmente lipschitziana e L è una costante di Lipschitz in I.
Pertanto:
Z
R
1
dµψI (λ) ≥
|f (λ) − f (λ0 )|2
Z
I
R
Abbiamo provato che ψI 6∈ D
do conclude la dimostrazione.
1
1
dµψI (λ) ≥
2
2
|f (λ) − f (λ0 )|
|L| + 1
(T ) (λ)
R f (λ)−x0 dP
300
Z
I
1
dµψI (λ) = +∞ .
|λ − λ0 |2
, in contraddizione con (9.42). Questo assur-
(b)
Se λ0 ∈ σp (T ), allora P (T ) ({λ0 }) =
6 0 per (i) di (b) del teorema 9.2. Valendo P (T ) ({λ0 }) =
R
(T ) (x), applicando (iii) in (c) del teorema 9.1, prestando attenzione ai domini di
R χ{λ0 } (x)dP
validità delle identità , si trova che:
f (T )P (T ) ({x0 }) =
Z
R
Z
=
f (x)dP (T ) (x)
Z
χ{x0 } (x)dP (T ) (x) =
R
Š
f · χ{x0 } (x)dP (T ) (x)
R
f (x0 )χ{x0 } (x)dP (T ) (x) = f (λ0 )
R
Z €
Z
χ{x0 } (x)dP (T ) (x) = f (x0 )P (T ) ({x0 })
R
che è la tesi. 2
Esercizi 9.1.
(1) Si consideri una PVM P : B(X) 3 E 7→ P (E) ∈ B(H) e un operatore unitario (cioé )
isometrico suriettivo V : H → H0 , dove H è un secondo spazio di Hilbert complesso. Si dimostri
che:
P 0 : B(X) 3 E 7→ P 0 (E) := V P (E)V −1 ∈ B(H0 )
è ancora una PVM.
(2) In riferimento all’esercizio (1), si provino i seguenti fatti.
(i) Se f : X → C è misurabile allora ψ ∈ ∆f se e solo se V ψ ∈ ∆0f , dove ∆0f è il dominio
dell’integrale
di f secondo P 0 . R
R
(ii) V X f (x)dP (x)V −1 = X f (x)dP (x).
(3) Dimostrare che (iv) in (b) del teorema 9.2 può essere rinforzata in: Sia T : D(T ) → H
operatore autoaggiunto nello spazio di Hilbert H. λ ∈ σc (T ) se e solo se, per ogni > 0, esiste
φ ∈ D(T ) con ||φ || = 1 e
0 < ||T φ − λφ || ≤ .
Suggerimento. Se vale quanto detto, λ non può appartenere a σp (T ), quindi esiste sicuramente (T −λI)−1 : Ran(T −λI) → D(T ) e quindi λ ∈ σ(T ) = σp (T )∪σc (T ). Può essere limitato
(T − λI)−1 ?
(4) Si consideri uno spazio L2 (X, µ) con µ positiva e finita sulla sigma algebra di Borel di X
spazio topologico. Se f : X → R è una qualunque funzione reale misurabile localmente L2
(cioé f · g ∈ L2 (X, µ) per ogni g ∈ Cc (X)) si consideri l’operatore su L2 (X, µ)
Tf : h 7→ f · h
dove D(Tf ) := {h ∈ L2 (X, µ) | f · h ∈ L2 (X, µ)}. Dopo aver provato che Tf è autoaggiunto, si
dimostri che
σ(Tf ) = ess ran(f ) .
Se f : X → R, ess ran(f ) è il rango essenziale della funzione misurabile f definito come:
C 3 v ∈ ran ess(f ) se e solo se µ f −1 (v − , v + ) > 0 per ogni > 0.
Suggerimento. Il dominio di Tf è denso perché f è localmente L2 , il fatto che Tf sia autoaggiunto si prova calcolando direttamente Tf∗ e notando che coincide con Tf . La seconda parte
301
si dimostra osservando che λ ∈ ρ(Tf ) se solo se esiste il risolvente Rλ (Tf ) su tutto L2 (X, µ) ed
è limitato, cioè , esiste M > 0 tale che: ||Rλ (Tf )h|| ≤ M per ogni h ∈ L2 (X, µ) con ||h|| = 1. In
altre parole λ ∈ ρ(Tf ) se e solo se:
Z
X
|h(x)|2
dµ(x) < M
|f (x) − λ|2
per ogni h ∈ L2 (X, µ) con ||h|| = 1 .
Se λ 6∈ ess ran(f ), si vede immediatamente dalla definzione di rango essenziale e usando µ(X) <
+∞, che la condizione scritta sopra è soddisfatta, per cui: λ 6∈ ess ran(f ) implica λ 6∈ σ(Tf ). Se
λ ∈ ess ran(f ), applicando ancora la definizione di rango essenziale, si costruisce una successione
R
2
di hn , con ||hn || = 1 tale che: X |f|h(x)|
dµ(x) > 1/n2 per ogni n = 1, 2, . . .. Quindi λ ∈
(x)−λ|2
ess ran(f ) implica λ ∈ σ(Tf ).
9.1.3
Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico
Consideriamo l’operatore, nello spazio di Hilbert complesso L2 (R, dx) (dove dx indica la misura
di Lebesgue su R),
Š2 mω 2 €
Š2
1 €
P S(R) +
XS(R) ,
H0 := −
2m
2
dove X e P sono l’operatore posizione ed impulso per la particella sulla retta reale introdotti
nella sezione 5.3.2. In altre parole:
H0 := −
~2 d2
mω 2 2
+
x ,
2m dx2
2
dove il termine x2 si deve intendere come l’operatore moltiplicativo per la funzione R 3 x 7→ x2
e ~, ω, ω sono costanti strettamente positive; infine D(H0 ) := S(R), dove S(R) è lo spazio di
Schwartz su R delle funzioni complesse infinitamente differenziabili che si annullano all’infinito,
con tutte le derivate, più velocemente di ogni potenza negativa di x (vedi sezione 3.6).
Le costanti ~, ω, ω non hanno alcun interesse matematico e possono essere poste tutte uguali
ad 1 nel seguito, tuttavia hanno un significato fisico importante. L’operatore H0 si dice hamiltoniano dell’oscillatore armonico unidimensionale e pulsazione caratteristica ω, per
una particella di di massa m; h := 2π~ è la costante di Planck. Dal punto di vista fisico, H0
rappresenta l’osservabile energia per il sistema considerato, tuttavia, in questa sezione, non ci
occuperemo delle motivazioni fisiche per introdurre tale operatore che studieremo esclusivamente da un punto di vista matematico, rimandando ogni commento di carattere fisico ai capitoli
11 e 12.
H0 è evidentemente simmetrico dato che è hermitiano e S(R) è denso in L2 (R, dx). H0 ammette
estensioni autoaggiunte per il criterio di von Neumann (teorema 5.7), dato che commuta con
l’operatore antinunitario dato dalla coniugazione complessa delle funzioni di L2 (R, dx). Mostreremo che H0 è essenzialmente autoaggiunto, daremo la sua espressione esplicita in termini dello
sviluppo spettrale della sua unica estensione autoaggiunta H0 e, contestualmente, preciseremo
302
la forma del suo spettro.
Introduciamo tre operatori, detti rispettivamente operatore di creazione, operatore di
distruzione e operatore numero di occupazione:
É
É

‹

‹
mω
mω
~ d
~ d
?
A :=
x+
, A :=
x−
, N := A? A .
2~
mω dx
2~
mω dx
Anche in questo caso assumiamo che gli operatori siano densamente definiti con dominio D(A) =
D(A? ) = D(N) := S(R). Deve essere chiaro che A? ⊂ A∗ , e questo giustifica la notazione, inoltre
N è simmetrico. Si osservi anche che S(R) è uno spazio denso e invariante per H0 , A e A? . Usando
A e A? costruiremo un insieme di autovettori per N e H0 che formano una base hilbertiana di
L2 (R, dx). Dato che gli autovettori sono ovviamente vettori analitici, questo fatto prova, in base
al criterio di Nelson (teorema 5.8), che H0 e N sono essenzialmente autoaggiunti sul loro dominio
S(R).
Cominciamo con il notare che, in base alle definizioni date per A e A? , valgono le relazioni di
commutazione:
[A, A? ] = I ,
(9.43)
dove i due membri sono valutati sugli elementi dello spazio denso invariante S(R). La verifica
delle relazioni di sopra è immediata dalle definizioni date. Ulteriormente, dalla definizione di A
e A? , con qualche calcolo risulta che:

‹ 
‹
1
1
H0 = ~ω A? A + I = N + I .
(9.44)
2
2
Consideriamo l’equazione in S(R):
Aψ0 = 0 ,
(9.45)
Una soluzione si ottiene facilmente essere:
2
1
− x
√ e (2k)2 ,
ψ0 (x) =
π 1/4 k
Ê
k :=
~
,
mω
dove abbiamo scelto il fattore davanti alla funzione in modo tale che ||ψ0 || = 1. Notiamo che
questa funzione altro non è che la prima funzione di Hermite introdotta
√ in (4) di Esempi 3.2,
0
quando si passa alla variabile x = x/k e si tiene conto del fattore 1/ k per non alterare la
normalizzazione. Se ora definiamo i nuovi vettori, per n = 1, 2, . . .:
(A? )n
ψn := √ ψ0 ,
n!
si prova facilmente per induzione, usando solamente (9.45), (9.43) che, per n, m ∈ N:
√
√
Aψn = nψn−1 , A? ψn = n + 1ψn+1 , (ψn |ψm ) = δnm .
303
(9.46)
(9.47)
Infatti, la seconda identità segue immediatamente dalla definizione dei vettori ψn , la prima si
prova come segue:
1
1
1
1
Aψn = √ A(A? )n ψ0 = √ [A, (A? )n ]ψ0 + √ (A? )n Aψ0 = √ [A, (A? )n ]ψ0 + 0 ;
n!
n!
n!
n!
d’altra parte, da (9.43) segue subito che: [A, (A? )n ] = n(A? )n−1 , che inserita sopra produce la
prima identità in (9.47). La terza identità si dimostra come segue:
1
1
n
(ψm−1 |A(A? )n ψ0 ) = √
(ψm−1 |[A, (A? )n ]ψ0 ) = √
(ψm−1 |(A? )n−1 ψ0 ) =
n!m
n!m
n!m
É
n
=
(ψm−1 |ψn−1 ) .
m!
È
Iterando la procedura, si ottiene il valore 0 se m 6= n, oppure n/n = 1 se m = n.
La seconda identità in (9.47) (passando alla variabile
x0 = x/k che non altera la normalizzazione
√
delle funzioni a causa dell’ulteriore fattore 1/ k) altro non è che la relazione di ricorrenza tra le
funzioni di Hermite citata in (4) di Esempi 3.2. Concludiamo che le funzioni ψn sono (a parte un
fattore ed un cambio di variabile) le funzioni di Hermite e quindi formano una base hilbertiana di
L2 (R, dx). Dall’ultima relazione risulta che {ψn }n∈N è , come deve essere, un insieme di vettori
ortonormali di L2 (R, dx), mentre usando le prime due si ottiene subito che:
(ψm |ψn ) = √
Nψn = nψn ,
(9.48)
e quindi, da (9.44), abbiamo che i vettori ψn formano una base hilbertiana di autovettori di H0 ,
dato che vale:

‹
1
H0 ψn = ~ω n +
ψn .
(9.49)
2
Per inciso questo mostra che H0 (ma anche N) è un operatore illimitato, dato che l’insieme
{||H0 ψ|| | ψ ∈ D(H0 ) , ||ψ|| = 1} include tutti i numeri ~ω(n + 1/2) con n ∈ N. Concludiamo
anche che, per il criterio di Nelson (teorema 5.8), gli operatori simmetrici N e H0 sono entrambi essenzialmente autoaggiunti, dato che nel loro dominio c’è un insieme di vettori analitici,
{ψn }n∈N , le cui combinazioni lineari finite sono dense in L2 (R, dx).
Per ottenere la decomposizione spettrale di H0 consideriamo spazio topologico dato dalla base
hilbertiana N = {ψn }n∈N dotata dalla topologia dell’insieme delle parti, e costruiamo la misura
spettrale:
X
P : B(N ) 3 E 7→ PE =
ψn (ψn | )
ψn ∈E
comein (1) in esempi 9.1. Costruiamo un’analoga misura spettrale su R che abbia supporto
sull’insieme degli autovalori associati agli autovettori ψn di H0 :
PF0 := s-
X
ψn (ψn |
~ω(n+1/2)∈F
)
304
per F ∈ B(R).
€
Š
Quindi consideriamo la funzione misurabile φ : N 3 ψn 7→ ~ω n + 12 . Applicando (c) del
teorema 9.1, abbiamo che, per ogni funzione f : R → C misurabile:
Z
Z
‹‹
X  
1
0
f ~ω n +
f (x)dP (x) =
f (φ(z))dP (z) = sψn (ψn | )
2
R
N
n∈N
dove l’ultima identità non è altro che la (9.27). Specializzando la funzione f a R 3 x 7→ x,
abbiamo l’espressione esplicita dell’operatore autoaggiunto (per il teorema 9.1):
Z
‹

X
1
ψn (ψn | ) .
(9.50)
H00 :=
xdP 0 (x) = s~ω n +
2
R
n∈N
Mostriamo ora che H00 = H0 . Sia < N > lo spazio denso delle combinazioni lineari finite dei
vettori ψn . H0 <N > è ancora essenzialmente autoaggiunto per il criterio di Nelson. Questo
significa che H0 = H0 <N > , cioè H0 e H0 <N > hanno la stessa (unica) estensione autoaggiunta
(pari alla loro chiusura). D’altra parte H00 è sicuramente un’estensione autoaggiunta di H0 <N > ,
dato che, come si prova immediatamente da (9.50),

‹
1
H00 ψn = ω n +
ψn = H0 ψn
2
per ogni n, e quindi H00 <N > = H0 <N > . Concludiamo che l’operatore autoaggiunto H00 deve
essere l’unica estensione autoaggiunta di H0 <N > e quindi anche di H0 . Concludiamo anche che
la misura spettrale, associata a H0 dal teorema 9.2 di decomposizione spettrale è :
PF0 := s-
X
ψn (ψn |
~ω(n+1/2)∈F
)
per F ∈ B(R).
ma anche che la decomposizione spettrale di H0 è :

‹
X
1
H0 = s~ω n +
ψn (ψn | )
2
n∈N
Infine, usando (b) nel teorema 9.2, dalla misura spettrale trovata per H0 si evince facilmente
che:
§

‹
ª
1 σ(H0 ) = σp (H0 ) = ~ω n +
n
∈
N
.
2 Si deve notare che lo spettro di H0 è completamente puntuale e gli autospazi sono tutti finitodimensionali, anche se l’operatore in questione non è compatto, dato che è illimitato. Tuttavia
le prime due potenze intere inverse di H0 sono compatte, essendo rispettivamente un operatore
di Hilbert-Schmidt e uno di classe traccia (lo si provi per esercizio).
I numeri in σp (H0 ) sono, dal punto di vista fisico, gli unici valori dell’energia meccanica totale
che un oscillatore quantistico, con dati valori di ω ed m, può assumere, al contrario del caso
classico in cui i valori dell’energia sono continui.
305
9.1.4
Un esempio a spettro continuo: gli operatori posizione ed impulso.
Torniamo sugli operatori posizione Xi (5.9)-(5.10) ed impulso Pi (5.14)-(5.15), per i = 1, 2, 3,
sullo spazio di Hilbert H = L2 (R3 , dx), dove dx è la misura di Lebesgue su R3 . Nel seguito x =
(x1 , x2 , x3 ). Abbiamo visto che gli operatori suddetti sono autoaggiunti. Ora ne determineremo
lo sviluppo spettrale e lo spettro.
Cominciamo con l’operatore posizione X1 . Quanto diremo per esso vale anche per X2 e X3 , dato
che la loro definizione è completamente simmetrica scambiando i nomi degli operatori. Una PVM
su R a valori in B(H) = B(L2 (R3 , dx)) si ottiene definendo:
per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx). (9.51)
(P (E)ψ)(x1 , x2 , x3 ) = χE (x1 )ψ(x1 , x2 , x3 )
In questo modo si vede facilmente che, se ψ ∈ L2 (R3 , dx), la misura µψ su B(R) è definita come:
Z
µψ (E) =
E×R2
|ψ(x1 , x2 , x3 )|2 dx
per ogni E ∈ B(R),
conseguentemente, se g : R → C è misurabile:
Z
Z
g(y)dµψ (y) =
R
E×R2
f (x1 )ψ(x1 , x2 , x3 )dx .
(9.52)
Procedendo similmente a quanto
fatto in (2) in esempi 9.1, si verifica facilmente che, se f : R → C
R
è misurabile e ψ ∈ ∆f (cioè R |f (x1 )ψ(x1 , x2 , x3 )|2 dx < +∞), allora
Z
‹
f (y)dP (y)ψ (x1 , x2 , x3 ) = f (x1 )ψ(x1 , x2 , x3 ) quasi ovunque per (x1 , x2 , x3 ) ∈ R3 .
R
(9.53)
Possiamo allora definire l’operatore autoaggiunto X10 come l’operatore associato, nello sviluppo
(9.53), alla funzione f := f1 con f1 : R 3 y 7→ y. Tale operatore è autoaggiunto per (ii) in (c)
del teorema 9.1, dato che questa funzione è reale. Inoltre, per confronto con la (5.10) abbiamo
immediatamente che ∆f1 = D(X1 ) e, da (9.53) troviamo subito che
X10 ψ = X1 ψ
per ogni ψ ∈ D(X1 ).
Concludiamo, dall’unicità della misura spettrale sancita nel teorema di decomposizione spettrale
(9.2), che (9.51) è la misura spettrale associata all’operatore posizione X1 . Lo sviluppo spettrale
di Xi , per i = 1, 2, 3, deve dunque essere:
Z
‹
ydP (Xi ) (y)ψ (x1 , x2 , x3 ) = (Xi ψ)(x1 , x2 , x3 ) quasi ovunque per (x1 , x2 , x3 ) ∈ R3 , (9.54)
R
dove:
(P (Xi ) (E)ψ)(x1 , x2 , x3 ) = χE (xi )ψ(x1 , x2 , x3 )
306
per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx).
(9.55)
Questa misura spettrale consente di individuare lo spettro di Xi , per i = 1, 2, 3. Applicando (ii)
in (b) del teorema 9.1, si trova immediatamente che
σ(Xi ) = σc (Xi ) = R .
(9.56)
Passiamo agli operatori impulso. La discussione è abbastanza diretta in virtù della proposizione
5.6, tenendo conto del fatto che la trasformata di Fourier-Plancherel è una trasformazione unitaria. Prima di tutto, dato che le trasformazioni unitarie, conservano gli spettri degli operatori
(vedi (7) in esercizi 8.1), abbiamo immediatamente che (indicando gli operatori posizione con
Ki come nella proposizione 5.6):
σ(Pi ) = σ(~F̂−1 Ki F̂) = ~R = R ,
cioè :
σ(Pi ) = σc (Pi ) = R .
(9.57)
La misura spettrale di Pi deve dunque avere supporto su tutto R. Il lettore può facilmente
dimostrare che, in base alla proposizione 5.6, e tenendo conto degli esercizi 9.1, la PVM associata
all’operatore impulso Pi è semplicemente definita come
P (Pi ) (E) = F̂−1 P (Ki ) F̂
per ogni E ∈ B(R).
(9.58)
dove P (Ki ) è la misura spettrale dell’operatore posizione, ora indicato con Ki .
9.1.5
Teorema di rappresentazione spettrale per operatori autoaggiunti non
limitati.
Per concludere citiamo, dando solo traccia di dimostrazione, il seguente teorema di rappresentazione spettrale che generalizza il teorema 8.7 al caso di un operatore autoaggiunto non limitatato.
I dettagli della dimostrazione sono lasciati per esercizio.
Teorema 9.3 (Teorema di rappresentazione spettrale per operatori autoaggiunti non
limitati).
Siano H spazio di Hilbert e T : D(T ) → H operatore autoaggiunto. Sia P (T ) la misura spettrale
associata a T secondo il teorema 9.2.
(a) È possibile decomporre H come H = ⊕α∈A Hα (con A al più numerabile se H è separabile),
dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le proprietà seguenti:
(i) per ogni α ∈ A, vale T Hα ⊂ Hα ;
(ii) per ogni α ∈ A esiste una misura di Borel positiva finita µα , su σ(T ) ⊂ R2 ed un
operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), µα ), tali che, se f : σ(T ) → C,
‚Z
Œ
(T )
Uα
f (x)dP (x) Hα Uα−1 = f · ,
σ(T )
in particolare vale:
Uα T Hα Uα−1 = x· ,
307
dove f · è l’operatore moltiplicativo per f su L2 (σ(T ), µα ): per ogni g ∈ L2 (σ(T ), µα ),
(f · g)(x) = f (x)g(x) quasi ovunque su σ(T ) .
(b) Vale:
σ(T ) = supp{µα }α∈A ,
dove supp{µα }α∈A è il complemento dell’insieme dei numeri λ ∈ R per cui esiste un aperto
Aλ ⊂ R tale che Aλ 3 λ e µα (Aλ ) = 0 per ogni α ∈ A.
(c) Se H è separabile, esistono uno spazio con misura (MT , µT ), con µT (MT ) < +∞, una
funzione FT : MT → R, un operatore unitario UT : H → L2 (MT , µT ) tale che:
€
Š
UT T UT−1 f (m) = FT (m)f (m) , per ogni f ∈ H.
(9.59)
Prova. La dimostrazione si ottiene come segue, guardando la prova del teorema teorema 8.7 per
T autoaggiunto ed in riferimento ad ogni spazio Hψ . Essenzialmente, a parte semplici riadattamenti, è sufficiente rimpiazzare sistematicamente lo spazio M (σ(T )), delle funzioni misurabili
limitate su σ(T ), con lo spazio L2 (σ(T ), µψ ). 2
9.2
Gruppi unitari ad un parametro fortemente continui.
Il fine di questa sezione è la dimostrazione del teorema di Stone, che è uno dei teoremi più
importanti per le applicazioni in meccanica quantistica (e non solo). Per enunciarlo abbiamo
bisogno di qualche definizione e qualche risultato preliminare sui gruppi ad un parametro di
operatori unitari ed in particolare, l’importante teorema di von Neumann. Discuteremo anche
qualche utile proprietà dei gruppi unitari ad un paramentro in relazione alla continutà .
9.2.1
Gruppi unitari ad un parametro fortemente continui, teorema di von
Neumann.
Definizione 9.3. Sia H è spazio di Hilbert. Una classe {Ut }t∈R ⊂ B(H) è detta gruppo ad
un parametro se vale
U0 = I
e
Ut Us = Ut+s per ogni coppia t, s ∈ R
(9.60)
Un gruppo ad un parametro costituito da operatori unitari è detto gruppo unitario ad un
parametro.
Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) è detto debolmente continuo in t0 ∈ R oppure
fortemente continuo in t0 ∈ R se l’applicazione t 7→ Ut è continua in t0 , rispettivamente,
nella topologia operatoriale debole ovvero in quella operatoriale forte dotando R della topologia
standard.
308
Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) è detto debolmente continuo oppure fortemente continuo se è rispettivamente tale in ogni punto di R.
Si osservi che dalla condizione (9.60), tenendo conto che gli operatori Ut sono unitari, segue
immediatamente che
(Ut )∗ = Ut−1 = U−t , per ogni t ∈ R .
(9.61)
La prova è ovvia: da Ut−1 Ut = I, applicando U−t al lato destro dei due membri ed usando la
seconda di (9.60), si ha Ut−1 Ut−t = U−t ossia, dalla prima identità in (9.60), Ut−1 = U−t . Infine
Ut−1 = (Ut )∗ dato che Ut è unitario.
I gruppi unitari ad un parametro godono di diverse notevoli proprietà.
Proposizione 9.2. Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un gruppo unitario
ad un parametro. I seguenti fatti sono equivalenti.
(a) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H.
(b) {Ut }t∈R è debolmente continuo in t = 0.
(c) {Ut }t∈R è debolmente continuo.
(d) {Ut }t∈R è fortemente continuo in t = 0.
(e) {Ut }t∈R è fortemente continuo.
Prova. Prima di tutto rietichettiamo come segue le proposizioni precedenti.
(1) {Ut }t∈R è debolmente continuo in t = 0. (2) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H.
(3) {Ut }t∈R è fortemente continuo in t = 0. (4) {Ut }t∈R è fortemente continuo. (5) {Ut }t∈R è
debolmente continuo. Infine mostriamo che (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (5) ⇒ (1).
(1) ⇒ (2) e (2) ⇒ (3). La continuità per t = 0 nella topologia debole implica in particolare
che, se t → 0, allora (ψ|Ut ψ) → (ψ|U0 ψ) = (ψ|ψ) ed anche, prendendo il complesso coniugato,
(Ut ψ|ψ) → (U0 ψ|ψ) = (ψ|ψ). Viceversa, la continuità forte in t = 0 equivale a dire che, per ogni
ψ ∈ H, se t → 0,
||Ut ψ − U0 ψ|| → 0 .
Ricordando che U0 = I, prendendo il quadrato ed esprimento la norma in termine del prodotto
scalare, tale identità equivale a
(Ut ψ|Ut ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ|ψ) → 0 .
La condizione di unitarietà per Ut implica che (Ut ψ|Ut ψ) = (ψ, ψ), da cui, l’identità di sopra si
può ancora riscrivere come
(ψ|ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ, ψ) → 0 ,
se t → 0 .
Come precisato all’inizio della dimostrazione, questa identità è banalmente verificata nelle nostre
ipotesi.
(3) ⇒ (4). Se ψ ∈ H, vale
Ut ψ − Ut0 ψ = Ut (ψ − Ut−1 Ut0 ψ) = Ut (ψ − Ut0 −t ψ) ,
309
dove abbiamo sfruttato l’identità (9.61). In definitiva, usando il fatto che Ut è unitario, per ogni
ψ ∈ H troviamo:
||Us ψ − Ut0 ψ|| = ||Us (ψ − Ut0 −s ψ)|| = ||ψ − Ut0 −s ψ||
Nelle ipotesi di forte continutà in t = 0, tenendo conto che t0 − s → 0 per s → t0 si ha che
||Us ψ − Ut0 ψ|| → 0. Quindi la continuità forte per t = 0 implica la continuità forte per ogni
t0 ∈ R.
(4) ⇒ (5). È ovvia dal fatto che la convergenza nella topologia forte implica quella nella
topologia debole.
(5) ⇒ (1). È banalmente vera per definizione. 2
Un’altra notevole proprietà dei gruppi unitari ad un parametro è la seguente.
Proposizione 9.3. Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un gruppo unitario
ad un parametro su di esso. Sia H ⊂ H un sottoinsieme tale che:
(a) lo spazio hHi finitamente generato da H è denso in H,
(b) {Ut }t∈R soddisfa (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H,
allora {Ut }t∈R è un gruppo unitario ad un parametro fortemente continuo.
Prova. Usando la stessa dimostrazione fatta per la proposizione 9.2, si ha subito che (φ0 |Ut φ0 ) →
(φ0 |φ0 ) per t → 0 con φ0 ∈ H, implica che ||Ut φ0 − φ0 || → 0 per t → 0. Se più in generale
P
φ ∈ hHi allora φ = i∈I ci φ0i dove I è finito e φ0i ∈ H. Di conseguenza, se t → 0,
||Ut φ − φ|| = Ut
!
X
i
ci φ0i −
X
i
X
X
ci φ0i = ci (Ut φ0i − φ0i ) ≤
|ci |||Ut φ0i − φ0i || → 0 .
i
i
Per la proposizione 9.2, per dimostrare la tesi è allora sufficiente estendere il risultato a tutto H.
Dobbiamo cioé provare che ||Ut φ − φ|| → 0 per t → 0 per ogni φ ∈ hHi implica ||Ut ψ − ψ|| → 0
se t → 0 per ogni ψ ∈ H. Dato che hHi è denso, per ogni ψ ∈ H fissato esisterà una successione
{ψn }n∈N ⊂ hHi con ψn → φ se n → +∞. Se {tm }m∈N è una successione di reali che tende a 0,
vale allora, dalla disuguaglianza triangolare e per n ∈ N fissato:
||Utm ψ − ψ|| ≤ ||Utm ψ − Utm φn || + ||Utm φn − φn || + ||φn − ψ|| .
Ossia, tenendo conto che gli Utm sono unitari e che la norma è non negativa:
0 ≤ ||Utm ψ − ψ|| ≤ ||Utm φn − φn || + 2||φn − ψ|| .
(9.62)
Per n fisso, il limite della successione di elementi am := ||Utm φn − φn || è nullo per ipotesi, per
cui
lim sup ||Utm φn − φn || = lim inf ||Utm φn − φn || = lim ||Utm φn − φn || = 0 .
m
m
m→+∞
Di conseguenza, dalla disuguaglianza (9.62) abbiamo che, per ogni n ∈ N
0 ≤ lim sup ||Utm ψ − ψ|| ≤ 2||φn − ψ|| ,
m
310
0 ≤ lim inf ||Utm ψ − ψ|| ≤ 2||φn − ψ|| .
m
D’altra parte, prendendo n sufficientemente grande, possiamo rendere piccolo a piacere ||φn −ψ||.
Concludiamo che:
lim sup ||Utm ψ − ψ|| = lim inf ||Utm ψ − ψ|| = 0 ,
m
m
per cui esiste
lim ||Utm ψ − ψ|| = 0 .
m→+∞
Dato che ψ ∈ H e la successione {tm }m∈N con tm → 0 erano arbitrari, concludiamo che, per ogni
ψ ∈ H:
lim ||Ut ψ − ψ|| = 0 .
t→0
La dimostrazione è terminata 2.
La teoria fino ad ora dimostrata consente di provate un importante risultato dovuto a von Neumann che mostra come la continuità forte dei gruppi unitari ad un parametro sia effettivamente
molto debole negli spazi di Hilbert separabili.
Teorema 9.4 (von Neumann). Sia (H, (·|·)) uno spazio di Hilbert complesso e {Ut }t∈R un
gruppo unitario ad un parametro. Se H è separabile, {Ut }t∈R è fortemente continuo se e solo se
la funzione R 3 t 7→ (Ut ψ|φ) è misurabile per ogni scelta di ψ, φ ∈ H.
Prova. Ovviamente se il gruppo è fortemente continuo allora ogni funzione R 3 t 7→ (Ut ψ|φ)
è misurabile essendo continua. Mostriamo che vale il viceversa. Assumiamo che ognuna delle
funzioni suddette sia misurabile. Dalla disuguaglianza di Schwartz e da ||Ut || = 1 concludiamo
che tali funzioni sono anche limitate. Pertanto, per ogni fissato a ∈ R e ψ ∈ H:
H 3 φ 7→
Z a
(Ut ψ|φ)dt
0
è un funzionale lineare limitato con norma non superiore a a||ψ||. Per il teorema di Riesz esiste
ψa ∈ H tale che:
Z a
(Ut ψ|φ)dt , per ogni φ ∈ H.
(ψa |φ) =
0
Possiamo allora scrivere che:
(Ub ψa |φ) = (ψa |U−b φ) =
Z a
Z a
0
Z a+b
(Ut ψ|φ)dt .
(Ut+b ψ|φ)dt =
(Ut ψ|U−b φ)dt =
0
b
Quindi:
Z
Z
0
a+b
(Ut ψ|φ)dt ≤ 2b||φ|| ||ψ||.
|(Ub ψa |φ) − (ψa |φ)| = (Ut ψ|φ)dt + b
a
Di conseguenza: (Ub ψa |φ) → (ψa |φ) se b → 0 e pertanto, prendendo il complesso coniugato di
ambo membri:
lim(φ | Ub ψa ) → (φ | ψa ) .
t→0
311
Se riusciamo a provare che l’insieme dei vettori {ψa | ψ ∈ H, a ∈ R} genera finitamente un
sottospazio denso in H, in base alla proposizione precedente e scegliendo φ = ψa , possiamo
concludere che il gruppo unitario è fortemente continuo. Sia φ ∈ {ψa | ψ ∈ H, a ∈ R}⊥ e sia
{ψ (n) }n∈N una base hilbertiana numerabile per H, che esiste in quanto H è separabile. Allora,
per ogni n ∈ N, vale:
0 = (ψa(n) |φ) =
Z a
(Ut ψ (n) |φ)dt
0
per ogni a ∈ R ,
che implica che R 3 t 7→ (Ut ψ (n) |φ) sia nulla quasi ovunque. Sia Sn ⊂ R l’insieme su cui la
S
S
funzione non si annulla e si fissi t0 ∈ R \ n∈N Sn . Si osservi che t0 esiste dato che n∈N Sn non
può coincidere con R avendo misura nulla essendo unione numerabile di insiemi di misura nulla
(in questo punto si usa la richiesta che la base hilbertiana sia numerabile e cioé H sia separabile).
Deve allora essere (Ut0 ψ (n) |φ) = 0 per ogni n che implica che φ = 0, dato che Ut0 è unitario e
quindi {Ut0 ψ (n) }n∈N è ancora base hilbertiana. Essendo {ψa | ψ ∈ H, a ∈ R}⊥ = {0}, lo spazio
generato da {ψa | ψ ∈ H, a ∈ R} è denso come richiesto e ciò conclude la dimostrazione. 2
9.2.2
Gruppi unitari ad un parametro generati da operatori autoaggiunti e
Teorema di Stone.
In questa sezione enunceremo e proveremo il celebre teorema di Stone che caratterizza i gruppi
unitari ad un parametro fortemente continui provando che si possono sempre ottenere esponenziando operatori autoaggiunti. Useremo successivamente tali tipi di gruppi per dare una
condizione necessaria e sufficiente per la commutatività delle misure spettrali di operatori autoaggiunti.
Abbiamo bisogno di un risultato tecnico preliminare che enunciamo separatamente visto che si
tratta di una costruzione utile in vari contesti. Nell’enunciato, come al solito, χ[a,b] indica la
funzione caratteristica di [a, b].
Proposizione 9.4. Sia H spazio di Hilbert complesso e {Vt }t∈R ⊂ B(H) una classe di operatori
che soddisfi le due seguenti condizioni:
(i) sia fortemente continua nel parametro t per ogni t ∈ R,
(ii) esista C ≥ 0 tale che ||Vt || ≤ C per ogni t ∈ R.
R
Per ogni f ∈ L1 (R, dx) esiste un unico operatore in B(H), indicato con R f (t)Vt dt, tale che
 Z
‹ Z
φ f (t)Vt dt ψ =
f (t) (φ|Vt ψ) dt per ogni φ, ψ ∈ H.
(9.63)
R
R
Se f ∈ L1 (R, dx)
ha supporto (essenziale) compatto, la validità della sola condizione (i) assicura
R
l’esistenza di R f (t)Vt dt. Tale operatore soddisfa in ogni caso le proprietà seguenti.
(a) per ogni ψ ∈ H:
Z
Z
R
f (t)Vt dtψ ≤
|f (t)| ||Vt ψ|| dt .
R
312
(9.64)
(b) Se A ∈ B(H):
Z
Z
A
f (f )Vt dt =
R
(c) Posto
(i)
(ii)
Rt
s
Z
f (τ )Vτ dτ :=
R2 3 (s, t) 7→
f (t)AVt dt
e
R
Z
f (t)Vt dtA =
R
R
R g(τ )f (τ )Vτ dτ
f (t)Vt Adt .
(9.65)
R
con g = χ[s,t] se s ≥ t e g = −χ[t,s] se t ≤ s allora:
Z t
f (τ )Vτ dτ
è continua nella topologia uniforme;
s
se f è continua, allora
s-
d
dt
Z t
f (τ )Vτ dτ = f (t)Vt
s
per ogni s, t ∈ R.
(9.66)
Prova. Siano ψ, φ ∈ H e f : R → C una funzione in L1 (R, dx). Consideriamo l’integrale:
Z
I(φ, ψ) :=
f (t) (φ|Vt ψ) dt .
R
Tale integrale è ben definito, dato che R 3 t 7→ (φ|Vt ψ) è continua essendo {Vt }t∈R debolmente
continuo ed è limitata per (ii) dalla disuguaglianza di Schwartz. Da ciò segue banalmente che:
|I(φ, ψ)| ≤ ||f ||1 C||ψ||||φ|| .
Dato che H 3 ψ 7→ I(φ, ψ) è lineare e vale disuguaglianza scritta sopra, l’applicazione diretta del
teorema di Riesz prova che, per ogni φ ∈ H esiste un unico vettore Φφ ∈ H che soddisfa:
I(φ, ψ) = (Φφ |ψ) ,
per ogni ψ ∈ H.
Si verifica subito che l’applicazione H 3 φ 7→ T φ := Φφ è lineare, inoltre, per costruzione vale:
|(ψ|T φ)| = |(T φ|ψ)| = |(Φφ |ψ)| = |I(φ, ψ)| ≤ ||f ||1 C||ψ||||φ|| ,
per ogni coppia φ, ψ ∈ H.
Scegliendo
ψ = T φ si ha subito che T è limitato e quindi lo è il suo aggiunto che indichiamo con
R
f
(t)V
dt.
Per costruzione vale allora (9.63). Da tale identità si ha anche:
t
R
 Z
Z
‹ Z
φ f (t)Vt dt ψ ≤
|f (t)| |(φ|Vt ψ)| dt ≤
|f (t)| ||Vt ψ|| dt ||φ||
R
R
R
R
e quindi, scegliendo φ = R f (t)Vt dtψ si arriva alla (9.64). L’identità (9.65) segue facilmente
dalla (9.63). Nel caso in cui il supporto essenziale di f sia incluso in un intervallo limitato
[a, b], si può , equivalentemente, definire I(ψ, φ) integrando su tale intervallo e procedere con il
resto della dimostrazione come fatto sopra. In tal caso, l’esistenza della costante C in (ii) (con
t ∈ [a, b]) è automaticamente garantita. Infatti, per continuità , comunque scegliamo ψ ∈ H,
esiste Cψ ≥ 0 tale che ||Vt ψ|| ≤ Cψ se t ∈ [a, b]. Per il teorema di Banach-Steinhaus questo
implica che esiste C ≥ 0 tale che ||Vt || ≤ C se t ∈ [a, b]. Passimo a provare (c). Sia [a, b] è grande
313
a sufficienza in modo che [a, b] × [a, b] includa un intorno aperto di (t, s) e (t0 , s0 ) appartengono
a tale intorno, da (a) segue facilmente che:
Z
Z s0
s
f (τ )V (τ )dτ ψ −
f (τ )V (τ )dτ ψ ≤ (|t − t0 | + |s − s0 |) sup |f (τ )| sup ||Vτ ψ|| .
t
0
t
τ ∈[a,b]
τ ∈[a,b]
Prendendo anche l’estremo superiore su ||ψ|| ≤ 1 e tenendo conto che ||Vτ || ≤ C < +∞ se
τ ∈ [a, b] come osservato sopra, abbiamo:
Z
Z s0
s
f (τ )V (τ )dτ −
f (τ )V (τ )dτ ≤ (|t − t0 | + |s − s0 |) sup |f (τ )|C ,
t
0
t
τ ∈[a,b]
da cui la continuità nella topologia uniforme. Riguardo alla seconda proprietà , notiamo che,
dalla continuità in senso forte della funzione t 7→ f (t)Vt , nel caso in cui h → 0 vale:
Z
–Z
™ 1 τ +h
1
τ +h
f (t)Vt dt ψ − f (τ )Vτ ψ = (f (t)Vt − f (τ )Vτ )dt ψ h τ
h τ
≤
R
τ +h dt
τ
|h|
sup ||f (t0 )Vt0 ψ − f (τ )Vτ ψ|| =
|t0 −τ |≤h
sup ||f (t0 )Vt0 ψ − f (τ )Vτ ψ|| → 0 .
|t0 −τ |≤h
2
Ecco il teorema di Stone. In realtà il risultato dovuto a Stone nel teorema seguente è la parte
(b), che è la meno banale dell’enunciato.
Teorema 9.5 (Teorema di Stone). Sia H uno spazio di Hilbert. Vale quanto segue.
(a) Se A : D(A) → H, con D(A) denso in H, è un operatore autoaggiunto su H e P (A) è la sua
misura spettrale, gli operatori
itA
Ut = e
Z
eiλt dP (A) (λ) ,
:=
σ(A)
con t ∈ R, costituiscono un gruppo unitario ad un parametro fortemente continuo che soddisfa:
Ut f (A)ψ = f (A)Ut ψ ,
∀t ∈ R ∀ψ ∈ D(f (A)), ∀f : σ(A) → C misurabile.
(9.67)
Ulteriormente:
(i) esiste in H
lim
t→0
Ut ψ − ψ
t
(9.68)
se e solo se ψ ∈ D(A);
(ii) se ψ ∈ D(A) vale
dUt Ut ψ − ψ
ψ := lim
= −iAψ
st→0
dt t=0
t
314
(9.69)
(b) Se {Ut }t∈R è un gruppo unitario ad un parametro fortemente continuo su H esiste, ed è
unico, un operatore autoaggiunto A : D(A) → H (con D(A) denso in H) tale che
eitA = Ut ,
per ogni t ∈ R.
(9.70)
Prova. (a) Per la proposizione 9.2, per provare che il gruppo è fortemente continuo è sufficiente
verificare che (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. Questo fatto è vero dato che, per
(vi) in (c) del teorema 9.1, tenendo conto che il dominio di eitA è tutto H dato che la funzione
esponenziale con esponente immaginario puro è limitata:
Z
(ψ|Ut ψ) =
itλ
e
σ(A)
dµψ (λ) →
Z
1dµψ (λ) = (ψ|ψ)
per t → 0 .
σ(A)
Sopra abbiamo tenuto conto del fatto che eitλ → 1 e quindi possiamo applicare il teorema della
convergenza dominata di Lebesgue dato che |eitλ | = 1 per ogni t e la funzione che vale costantemente 1 è integrabile perché µψ è finita.
Passiamo
all’identità (9.67). Per dimostrare tale identità si osservi che ψ ∈ D(f (A)) se e solo
R
se R |f (λ)|2 dµψ (λ) < +∞. D’altra parte, la misura µψ e la misura µUt ψ coincidono, in quanto
(Ut ψ|P (A) (E)Ut ψ) = (ψ|Ut∗ P (A) (E)Ut ψ), ma Ut∗ P (A) (E)Ut = P (A) (E) come segue immediatamente da (iii) in (c) del teorema 9.1, tenendo conto che nel caso in esame tutti gli integrali sono
riferiti a funzioni limitate e pertanto gli operatori coinvolti hanno tutti dominio dato da tutto
lo spazio di Hilbert. Concludiamo che ψ ∈ D(f (A)) se e solo se Ut ψ ∈ D(f (A)). Viceversa vale
banalmente f (A)ψ ∈ D(Ut ) = H essendo Ut unitario. In queste ipotesi, usando la seconda parte
di (iii) in (c) del teorema 9.1, si ha che Ut f (A)ψ = f (A)Ut ψ per ogni ψ ∈ D(f (A)) e cioé vale
(9.67). Passiamo ora a provare le proprietà (i) e (ii). Se ψ ∈ H, usando (c) del teorema 9.1, si
trova
Ut ψ − ψ
Ut0 ψ − ψ 2
−
=
t
t0
Z
+
σ(A)
0
0
2 − eiλt − e−iλt 2
2 − eiλt − e−iλt 2
λ dµψ (λ) +
λ dµψ (λ)
2
2
λ t
λ2 t0 2
σ(A)
σ(A)
€
Š
€
Š
0
0
0
0
Z
eiλ(t −t) − e−iλt + eiλt + 1 2
eiλ(t−t ) − e−iλt + eiλt + 1 2
λ dµψ (λ) +
λ dµψ (λ) .
λ2 tt0
λ2 tt0
σ(A)
Z
Z
Ci riferiremo ora alla misura λ2 dµψ (λ). Tutte e tre le funzioni integrande (rispetto alla detta
misura) sono limitate da costanti dato che si annullano per t e t0 piccoli, con la stessa velocità dei
numeratori (per verificarlo è sufficiente sviluppare in serie di potenze centrata nell’origine tutti
gli esponenziali) e per grandi valori di t e t0 tendono a zero. I primi due integrandi, tendono
a zero se t e t0 rispettivamente tendono a zero, gli ultimi due tendono a zero quando t → t0 .
Se ψ ∈ D(A), la misura λ2 dµψ (λ) è finita per definizione di dominio
di A. Di conseguenza,
Ut ψ−ψ
U ψ−ψ 0
scegliendo t vicino a t ed entrambi vicini a 0, possiamo rendere t − t0 t0 piccolo a
315
piacere. Data la completezza di H, questo significa che esiste il limite per t → 0 di Ut ψ−ψ
. Con
t
la stessa procedura si ha immediatamente che, se ψ ∈ D(A):
Œ
‚
2
Z
iλt − e−iλt
iλt − e−iλt
Ut ψ − ψ
e
2
−
e
− iAψ =
+1+i
λ2 dµψ (λ) .
t
λ2 t2
λt
σ(A)
La funzione integranda (rispetto alla misura λ2 dµψ (λ)) è limitata e tende a zero puntualmente
in λ per t → 0, la misura λ2 dµψ (λ) è finita nell’ipotesi che ψ ∈ D(A). Applicando il teorema
2
della convergenza dominata abbiamo che Ut ψ−ψ
− iAψ → 0 se t → 0, quando ψ ∈ D(A). Per
t
concludere la prova di (i) e (ii), mostriamo che se Ut ψ−ψ
→ φψ ∈ H, per t → 0, allora ψ ∈ D(A).
t
Si verifica subito che l’insieme dei vettori ψ ∈ H per cui esiste il limite suddetto formano
un sottospazio D(B) di H che contiene, ovviamente, D(A) ed è quindi denso. L’applicazione
ψ 7→ iBψ := φψ definisce un operatore con dominio D(B) denso. Se ψ, ψ 0 ∈ D(B) vale, usando
il fatto che Ut∗ = U−t :
‚ Œ
‚ Œ
‹

0
0
Ut ψ 0 − ψ 0
U−t ψ − ψ 0
Ut ψ − ψ
0
ψ|Bψ = ψ −i lim
= −i lim ψ = −i lim
ψ
t→0
t→0
t→0
t
t
t
‹

U−t ψ − ψ 0
= −i lim
ψ = Bψ|ψ 0 .
t→0
−t
Concludiamo che B è un’estensione simmetrica di A. Tuttavia, dato che A è autoaggiunto deve
essere B = A per (d) di proposizione 5.2 e quindi ogni vettore ψ per cui esiste il limite di Ut ψ−ψ
t
per t → 0 deve appartenere a D(A). Questo conclude la dimostrazione di (a).
(b) Cominciamo a notare che la prova dell’unicità di A è immediata. Se ci sono due operatori
0
autoaggiunti A e A0 con eitA = Ut = eitA per ogni t ∈ R, in base a (i) e (ii) di (a), deve
risultare A = A0 . Costruiamo ora un operatore autoaggiunto A che soddisfi Ut = eitA per
un fissato gruppo unitario ad un parametro fortemente continuo. Specializziamo la situazione
discussa nella proposizione 9.4 al caso Vt = Ut gruppo unitario ad un parametro fortemente
continuo.
Indichiamo con D, detto spazio di Gårding, lo spazio vettoriale dei vettori della forma
R
f
(t)U
dtφ
con φ ∈ H con f ∈ D(R) arbitraria. Dalla (9.63) segue facilmente la proprietà di
t
R
invarianza Us D ⊂ D per ogni s ∈ R, più precisamente vale:
Z
Us
Z
f (t)Ut dtψ =
R
f (t)Ut+s dtψ
per ogni ψ ∈ H.
(9.71)
R
Mostriamo che, se ψ ∈ D allora Ut ψ−ψ
→ ψ0 ∈ H se t → 0.R Supponiamo che ψ = R f (t)Ut dtφ.
t
Con qualche passaggio, usando (9.71) e la definizione di R f (t)Ut dtφ, si vede che il secondo
membro di:
2
Z
Z
Z

‹
Ut ψ − ψ
Ut ψ − ψ
Ut ψ − ψ
0
0
0
− f (t)Ut dtφ =
− f (s)Us dsφ − f (r)Ur drφ
t
t
t
R
R
R
R
si può scrivere:
Z
Z
ds
R
drht (s)ht (r) (ψ|Ur−s ψ) ,
R
316
dove
f (s − t) − f (s)
− f 0 (s) .
t
Si osservi che, per ogni t ∈ R, la funzione s 7→ ht (s) ha supporto in un compatto ed è C ∞ (ed
è quindi limitata). Dato che (r, s) 7→ (ψ|Ur−s ψ) è anch’essa una funzione limitata, concludiamo
che possiamo interpretare l’integrale di sopra nella misura di Lebesgue prodotto:
ht (s) :=
2
Z
Z
Ut ψ − ψ
0
− f (t)Ut dtφ =
t
R
dsdrht (s)ht (r) (ψ|Ur−s ψ)
R×R
Dato che l’integrando tende a 0 puntualmente se t → 0 e che le funzioni
(s, r) 7→ ht (s)ht (r) (ψ|Ur−s ψ)
hanno supporto contenuto in un unico compatto abbastanza grande quando t varia in un intervallo limitato attorno a 0 e che ivi sono uniformemente limitate da qualche costante indipendente
da t (questo segue dal fatto che la funzione (t, s, r) 7→ ht (s)ht (r) (ψ|Ur−s ψ) è continua congiuntamente in tutte le variabili), possiamo applicare il teorema della convergenza dominata,
ottenendo che entrambi i membri svaniscono per t → 0. Abbiamo ottenuto che, se ψ ∈ D, allora
Ut ψ−ψ
→ ψ0 ∈ H per t → 0. L’applicazione ψ 7→ iSψ := ψ0 è lineare come si dimostra facilt
mente. Procedendo come nella dimostrazione di (a) si verifica facilmente che S è hermitiano.
In realtà S è simmetrico
dato che D è denso come ora verifichiamo. Se φ ∈ H si consideri la
R
∞
successione di vettori
R fn (t)Ut dtφ, dove le funzioni fn ∈ Cc (R) soddisfano: fn ≥ 0, supp fn
R
⊂ [−1/n, 1/n] e R fn (s)ds = 1. Abbiamo che
Z
Z
Z
Z
Z
fn Ut dtψ − ψ = fn Ut dtψ −
≤ |fn (t)| ||(Ut − I)ψ|| dt
f
dtψ
=
f
(U
−
I)dtψ
n
n t
R
R
R
R
R
dove abbiamo usato (9.64) per la classe di operatori Vt = Ut − I. Dato che:
Z
|fn (t)| ||(Ut − I)ψ|| dt ≤
R
Z 1/n
−1/n
|fn (t)| dt
sup
t∈[−1/n,1/n]
||(Ut − I)ψ|| =
sup
||(Ut − I)ψ||
t∈[−1/n,1/n]
e supt∈[−1/n,1/n] ||(Ut − I)ψ|| → 0 per n → ∞ essendo la classe degli Ut fortemente continua,
concludiamo che
Z
D3
fn (t)Ut dtφ → φ ∈ H , per n → ∞
R
e quindi D è denso in H. Di conseguenza S è simmetrico. Mostriamo ora che S è essenzialmente
autoaggiunto su D. Se ψ± ∈ Ran(S ± iI)⊥ , allora, per ogni χ ∈ D vale:

‹
Uh Ut χ − Ut χ
d
(ψ± |Ut χ) = lim ψ± = (ψ± |iSUt χ) = i (ψ± |(S ± iI)Ut χ) ± (ψ± |Ut χ)
h→0
dt
h
= ± (ψ± |Ut χ)
317
e quindi la funzione F± (t) := (ψ± |Ut χ) ha la forma F± (0)e±t . Dovendo essere limitata (dato che ||Ut || = 1 per ogni t ∈ R), questo è possibile solo se F± (0) = 0 e quindi ψ± = 0,
che implica a sua volta che Ran(S ± iI) = H. Per il teorema 5.3, questo significa che S :
D → H è essenzialmente autoaggiunto. Sia dunque S l’unica estensione autoaggiunta di S. Per
concludere la dimostrazione si osservi che se Vt := eitS allora, per ogni coppia ψ, φ ∈ D vale:
d
d
(ψ |(Vt )∗ Ut φ) =
(Vt ψ|Ut φ) = (iSVt ψ|Ut φ)+(Vt ψ|iSUt φ) = − (Vt ψ|iSUt φ)+(Vt ψ|iSUt φ) = 0.
dt
dt
Pertanto (ψ|(Vt )∗ Ut φ) = (ψ|Iφ) e quindi, essendo D denso: (Vt )∗ Ut = I cioé Ut = eitS per ogni
t ∈ R. 2
Definizione 9.4. Sia H è spazio di Hilbert e {Ut }t∈R ⊂ B(H) un gruppo unitario ad un parametro fortemente continuo. L’unico operatore autoaggiunto su A tale da soddisfare (9.70) è
detto generatore (autoaggiunto) di {Ut }t∈R ⊂ B(H).
Il teorema di Stone ha un semplice ma utile corollario. L’utilità di questo corollario appare evidente quando l’operatore autoaggiunto A non è limitato, in caso contrario la tesi del corollario
segue facilmente dal teorema spettrale per operatori autoaggiunti limitati, notando che se un
operatore limitato commuta con A allora deve commutare con la sua misura spettrale.
Corollario 9.1. Se A : D(A) → H, con D(A) denso in H, è un operatore autoaggiunto (in
generale non limitato) sullo spazio di Hilbert H e se U : H → H1 è un isomorfismo di spazi di
Hilbert (operatore isometrico suriettivo), allora:
U eisA U −1 = eisU AU
−1
,
per ogni s ∈ R .
In particolare la tesi è vera se H = H1 e U è unitario.
Prova. L’operatore U AU −1 è evidentemente autoaggiunto sul dominio U D(A) come è facile
provare applicando la definizione. Pertanto il gruppo unitario ad un parametro fortemente
−1
continuo {eisU AU }s∈R è ben definito. Essendo U un isomorfismo di spazi di Hilbert, si verifica
immediatamente che {U eisA U −1 }s∈R è un secondo gruppo unitario ad un parametro fortemente
continuo definito sullo stesso spazio di Hilbert H1 . Ulteriormente, se ψ = U −1 φ ∈ U −1 D(A)
allora:
U eisA U −1 ψ − ψ
U eisA φ − U φ
eisA φ − φ
= lim
= U lim
= iU Aφ = U AU −1 ψ .
s→0
s→0
s→0
s
s
s
lim
In base al teorema di Stone il generatore del gruppo {U eisA U −1 }s∈R è quindi un’estensione
autoaggiunta di U AU −1 che, essendo autoaggiunto, non ha estesioni autoaggiunte proprie. Di
conseguenza il generatore del gruppo {U eisA U −1 }s∈R coincide con U AU −1 stesso e quindi:
U eisA U −1 = eisU AU
−1
,
318
per ogni s ∈ R .
2.
Nota. Per certi aspetti, il teorema di Stone può vedersi come sottocaso di un teorema più generale
che deriva dal Teorema di Hille-Yoshida [Rud91] che ha avuto importanti conseguenze in fisica
matematica nelle applicazioni della teoria dei semigruppi. Ricordiamo che sullo spazio di Banach
X, un semigruppo fortemente continuo di operatori, {Qt }t∈[0,+∞) , è una classe di operatori Qt ∈ B(X) tali che (a) Q(0) = I, (b) Qt+s = Qt Qs se s, t ∈ [0, +∞) e (c) ||Qt ψ − ψ|| → 0 se
t → 0, per ogni ψ ∈ X. Si dimostra [Rud91] che ogni semigruppo fortmente continuo ammette
un unico generatore, cioè un operatore A in X, completamente individuato dalla richiesta che,
dove la derivata è calcolata rispetto alla norma di X:
d
Qt ψ = −AQt ψ = −Qt Aψ
dt
per ogni ψ ∈ D(A).
Risulta che D(A) ⊂ X è un sottospazio denso.
Specializzandoci al caso di un semigruppo fortemente continuo {Qt }t∈[0,+∞) , su X = H spazio di
Hilbert e con operatori Qt normali (limitati), risulta [Rud91] che (1) esiste sempre un generatore
A del semigruppo, (2) tale generatore è un operatore normale (non limitato in generale), (3) vale:
Qt = e−tA ,
dove il secondo membro viene definito come integrale della funzione σ(A) 3 λ 7→ eλ rispetto
alla PVM della decomposizione spettrale di A (estendendo il teorema spettrale 9.2 al caso di
operatori normali non limitati [Rud91]). Infine, (4) lo spettro di A è limitato inferiormente nei
reali, cioé : esiste γ ∈ R tale che γ < Re(λ) per ogni λ ∈ σ(A).
9.2.3
Condizioni per la commutatività di misure spettrali.
Come ultimo risultato possiamo enunciare e provare un teorema riguardante la commutatività
delle misure spettrali di due operatori autoaggiunti usando i gruppi ad un paramtro da essi
generati. Nel caso di operatori autoaggiunti limitati le misure spettrali commutano se e solo se
gli stessi operatori commutano come segue facilmente dal teorema spettrale (vedi anche (1) nelle
osservazioni dopo la prova del teorema seguente). Nel caso di operatori non limitati vi sono in
generale problemi di dominio e la condizione basata sulla commutatività degli operatori non è
utilizzabile. L’uso dei gruppi unitari è un modo semplice per ovviare il problema dei domini. Il
seguente teorema ha larghe applicazioni in Meccanica Quantistica
Teorema 9.6. Siano A e B due operatori (in generale non limitati) sullo spazio di Hilbert H e
sia A autoaggiunto. Valgono i fatti seguenti.
(i) Assumendo B autoaggiunto e denotando con P (A) e P (B) le misure spettrali di A e B
rispettivamente, le seguenti quattro richieste sono equivalenti.
(a) Per ogni coppia di boreliani E, E 0 ⊂ R:
P (A) (E)P (B) (E 0 ) = P (B) (E 0 )P (A) (E) .
319
(b) Per ogni boreliano E ⊂ R e ogni s ∈ R:
P (A) (E)e−isB = e−isB P (A) (E) .
(c) Per ogni coppia di numeri reali t, s ∈ R:
e−itA e−isB = e−isB e−itA .
(d) Per ogni numero reale t ∈ R:
e−itA Bψ = Be−itA ψ ,
e−itA D(B) ⊂ D(B) e
se ψ ∈ D(B).
(ii) Se, nelle ipotesi di (i), vale una delle quattro condizioni precedenti allora vale anche:
se ψ ∈ D(AB) ∩ D(BA)
ABψ = BAψ
(Aϕ|Bψ) − (Bϕ|Aψ) = 0
se ψ, ϕ ∈ D(A) ∩ D(B).
(iii) Se B ∈ B(H) (non necessariamente autoaggiunto), le due seguenti condizioni sono equivalenti.
(e) BAϕ = ABϕ per ogni ϕ ∈ D(A).
(f ) Bf (A)ψ = f (A)Bψ per ogni ψ ∈ D(f (A)) e ogni f : σ(A) → R misurabile.
Prova. (i) Facendo uso della definizione 9.2, l’identità in (b) può essere trascritta equivalentemente:
Z
(A)
e−itλ dPλ
Z
e−isµ dPµ(B) =
R
R
Z
e−isµ dPµ(B)
Z
R
(A)
e−itλ dPλ
per ogni t, s ∈ R,
(9.72)
R
dove abbiamo usato la definizione standard di integrale di funzioni misurabili limitate rispetto
ad una misura spettrale facendo uso di (i) in (c) del teorema 9.1. Il fatto che (a) implichi (c)
è immediato dalla definizione stessa di integrale di una funzione limitata rispetto ad una misura
spettrale introdotta nel capitolo 8, lavorando con la topologia operatoriale forte. Proviamo che
(c) implica (b) e che (b) implica (a). Per dimostrare
Rche (c) implica (b),
notiamo
Rche da (9.72), se
(A)
(A)
−isB
−itλ
∗
Us := e
, ψ, φ ∈ H, s ∈ R sono fissati, si ha: ψ R e
dPλ Us φ = Us ψ R e−itλ dPλ φ
per ogni t ∈ R , ossia
Z
Z
(A)
R
e−itλ dµψ,Us φ (λ) =
(A)
R
e−itλ dµUs∗ ψ,φ (λ) ,
(9.73)
dove abbiamo introdotto le misure complesse come in (c) del teorema 8.4. Possiamo trasformare
gli integrali suddetti in integrali rispetto a misure positive finite usando il teorema RadonNykodim (vedere (1) in Esempi 2.2.). Successivamente, facendo uso del teorema di Fubini-Tonelli
in (9.73), concludiamo che, se f è la trasformata di Fourier di una qualsiasi funzione dello spazio
di Schwarz S(R) (vedi cap.3), deve risultare:
Z Z
Z Z
‹
‹
(A)
(A)
−itλ
−itλ
f (t) e
dt dµψ,Us φ (λ) =
f (t) e
dt dµUs∗ ψ,φ (λ) .
R
R
R
320
R
Dato che la trasformata di Fourier trasforma lo spazi S(R) nello stesso spazio S(R) biettivamente,
concludiamo che l’identità di sopra può essere riscritta come:
Z
g(λ)
R
(A)
dµψ,Us φ (λ)
Z
(A)
=
R
g(λ) dµUs∗ ψ,φ (λ)
per ogni g ∈ S(R).
(9.74)
Se h ∈ Cc (R) (spazio delle funzioni continue a supporto compatto) la successione di funzioni
É
Z
n
2
gn (x) :=
e−n(x−y) /4 h(y)dy
4π R
soddisfa gn ∈ D(R) e converge uniformemente ad h per n → +∞. Dato che gn ∈ D(R) ⊂ S(R)
e gn → h ∈ Cc (R) nella norma dell’estremo superiore e le misure sono finite, (9.74) implica che:
Z
h(λ)
R
(A)
dµψ,Us φ (λ)
Z
=
R
(A)
h(λ) dµUs∗ ψ,φ (λ)
per ogni h ∈ Cc (R).
(9.75)
Il teorema di Riesz per misure complesse (vedere (1) in Esempi 2.2.) implica che le due misure
che definiscono i due integrali nei due membri dell’identià di sopra sono in realtà la stessa misura.
In altre parole, tenendo conto dell’espressione esplicita di tali misure complesse come in (c) del
teorema 8.4.:
ψ P (A) (E)Ut φ = Us∗ ψ P (A) (E)φ
per ogni boreliano E ⊂ R e ogni s ∈ R.
(9.76)
Con ovvi passaggi, data l’arbitrarietà di ψ e φ, si ricava che vale (b):
P (A) (E)e−isB = e−isB P (A) (E)
per ogni boreliano E ⊂ R e ogni s ∈ R.
(9.77)
Per concludere proviamo che (b) implica (a). Iterando un’altra volta il procedimanto per dimostrare che (c) implica (b), dove ora l’operatore e−isB rimpiazza il precedente e−itA e l’operatore
unitario Us è sostituito dal proiettore ortogonale P (A) (E), si ottiene alla fine che (9.77) implica
(A) (B)
(B) (A)
che vale (a): PE PE 0 = PE 0 PE per ogni coppia di boreliani E, E 0 ⊂ R. Per concludere notiamo che, se vale (c), dal teorema di Stone e dalla continuità di e−itA segue subito (d). D’altra
parte (d) implica (c) per il seguente motivo. Prima di tutto (d) equivale a e−itA BeitA = B da cui,
−itA BeitA )
esponenziando gli operatori autoaggiunto ad ambo membri, troviamo: e−is(e
= e−isB .
Dato che, per ogni fissato numero s ∈ R, i gruppi unitari ad un parametro fortemente continui
−itA BeitA )
t 7→ e−is(e
e t 7→ e−itA e−isB eitA ammettono lo stesso generatore, essi devono coincidere
per il teorema di Stone. Conseguentemente dobbaimo avere e−itA e−isB eitA = e−isB , cioé (c).
Proviamo (ii). Per provare la prima affermazione partiamo da (c) assumendo ψ ∈ D(AB) ∩
D(BA) per cui: e−itA e−isB ψ) = e−isB e−itA ψ. Derivando nell’origine in t, dal teorema di Stone:
Ae−isB ψ = e−isB Aψ. A questo punto possiamo ancora derivare in s nell’origine. Il secondo
membro fornisce immediatamente −iBAψ per il teorema di Stone. Nel primo membro possiamo passare la derivata oltre A, usando il fatto che A = A∗ è chiuso e tenendo conto del fatto
che sappiamo che il limite esiste. In questo modo troviamo, come richiesto −iABψ = −iBAψ.
Dimostriamo infine la seconda affermazione assumendo vera la proprietà (c). Da essa si trova
321
subito, se ψ ∈ D(A) e ϕ ∈ D(B) allora (eitA ψ|e−isB ϕ) = (eisB ψ|e−itA ϕ). Calcolando le derivate
in t e s per t = s = 0, dal teorema di Stone abbiamo la tesi.
L’affermazione (iii) si prova come segue. Prima di tutto è ovvio che (f) implica (e). Proviamo
che (e) implica (f). Mostriamo per prima cosa che (e) implica che B commuti con e−itA per ogni
t ∈ R. A tal fine usiamo (d) ed (f) in proposizione 9.8, la cui dimostrazione non dipende dal
teorema che stiamo provando. (Il lettore può saltare questa parte e tornare sulla dimostrazione
una volta provata la proposizione 9.8.) Sia ψ è un vettore analitico per A e per tutte le sue
potenze nell’insieme denso che è provato esistere in (f) in proposizione 9.8, allora, dato che B
è limitato ed usando (d) di proposizione 9.8:
Be−itA ψ =
+∞
X
+∞
X (−it)n
(−it)n
BAn ψ =
An Bψ = e−itA Bψ .
n!
n!
n=0
n=0
Nei due ultimi passaggi abbiamo usato l’ipotesi che BAψ = ABψ ricorsivamente ed il fatto che
||An Bψ|| = ||BAn ψ|| ≤ ||B||||An ψ|| per cui Bψ è ancora analitico per A. Dato che ψ varia in un
insieme denso e gli operatori B e e−itA sono continui, abbiamo ottenuto che Be−itA = e−itA B.
Ora usiamo il fatto che, se B è limitato e commuta con ogni e−itA , allora B commuta con la
misura spettrale di A. La prova è analoga a quella fatta sopra per dimostrare che (c) implica
(b): in questo caso bisogna sostituire Us con B e seguire la stessa dimostrazione. Quindi,
usando la definizione di g(A), segue facilmente che se g è limitata (e quindi lo è g(A)) allora
Bg(A) = g(A)B. A questo punto si osserva che
(A)
(A)
µBψ (E) = (Bψ|P (A) (E)Bψ) = (P (A) Bψ|P (A) (E)Bψ) ≤ ||B||2 (ψ|P (A) (E)ψ) = ||B||2 µψ (E)
e pertanto ψ ∈ D(f (A)) implica Bψ ∈ D(f (A)). Applicando infine la definizione di f (A),
prendendo una successione di funzioni misurabili limitate fn che convergono a f nel senso di
L2 (σ(A), µψ ) si ha immediatamente la tesi prendendo il limite per n → +∞ dell’uguaglianza
(vera perché tutte le fn sono limitate) Bfn (A)ψ = fn (A)Bψ, per ogni n ∈ N, dato che B è
continuo. 2
Osservazioni.
(1) Il teorema provato ha come immediata conseguenza che due operatori autoaggiunti limitati
A, B ∈ B(H) commutano se e solo se commutano le loro misure spettrali. Infatti, un’im(A)
(A)
plicazione è ovvia, mentre da (iii) segue subito che, se AB = BA allora BPE = PE B
(A)
dato che PE = χE (A), essendo χE la funzione caratteristica del boreliano E. Dato che
(A)
(B) (A)
(A) (B)
PE ∈ B(H), possiamo applicare nuovamente (iii) ed ottenere PE 0 PE = PE PE 0 per ogni
boreliano E 0 ⊂ R.
(2) Esiste un interessante risultato che assicura condizioni sufficienti per la commutatività di
misure spettrali di operatori autoaggiunti non limitati. Dato che è interessante, citiamo il risultato senza dimostrazione (che sia basa sul fondamentale lavoro di E. Nelson1 sui vettori analitici
e l’esistenza delle rappresentazioni unitarie di gruppi di Lie).
1
E. Nelson, Analytic vectors, Ann. Math. 70, 572- 615, (1959)
322
Siano A : D(A) → H e B : D(B) → H due operatori simmetrici. Se esiste un sottospazio denso
D ⊂ D(A2 + B 2 ) ∩ D(AB) ∩ D(BA) su cui A e B commutano e su cui A2 + B 2 è essenzialmente
autoaggiunto, allora A e B sono essenzialmente autoaggiunti su D e le misure spettrali di A e
B commutano.
9.3
Prodotto tensoriale hilbertiano.
Come vedremo tra nel prossimo capitolo, i sistemi quantistici composti vengono descritti in
spazi di Hilbert ottenuti prendendo il prodotto tensoriale Hilbertiano degli spazi di Hilbert dei
sottosistemi componenti. Chiariamo nel seguito cosa intendiamo qui per prodotto tensoriale
Hilbertiano, assumendo, per le motivazioni generali e le notazioni, che il lettore conosca la definizione di prodotto tensoriale nel caso di spazi vettoriali a dimensione finita.
9.3.1
Prodotto tensoriale di spazi di Hilbert.
Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n e scegliamo un vettore
vi per ogni spazio Hi . In analogia al caso finito dimensionale, potremmo definire l’applicazione
v1 ⊗ · · · ⊗ vn come un’applicazione multilineare dal prodotto cartesiano degli n spazi duali
topologici H0i degli spazi Hi a valori in C, usando la definizione che si usa per il caso finito
dimensionale:
v1 ⊗ · · · ⊗ vn : H01 × · · · × H0n 3 (f1 , · · · , fn ) 7→ f1 (v1 ) · · · fn (vn ) .
Del tutto equivalentemente, tenendo conto del teorema di Riesz, possiamo definire l’azione di
v1 ⊗ · · · ⊗ vn sulle n-ple di vettori di H1 × · · · × Hn invece che su quelle di H01 × · · · × H0n . In
questo modo teniamo conto dell’identificazione del duale di uno spazio di Hilbert con lo spazio
di Hilbert stesso, ottenuta tramite un anti isomorfismo costruito con il prodotto scalare. Con
questo approccio v1 ⊗ · · · ⊗ vn agisce su n-ple di vettori (u1 , · · · , un ) ∈ H1 × · · · × Hn per mezzo
dei prodotti scalari e definisce un funzionale anti multi-lineare. Sceglieremo questa seconda via
per motivi di praticità.
Definizione 9.5. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n
e scegliamo un vettore vi per ogni spazio Hi . Il prodotto tensoriale dei vettori v1 , . . . , vn ,
v1 ⊗ · · · ⊗ vn è l’applicazione multi anti-lineare:
v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn 3 (u1 , · · · , un ) 7→ (u1 |v1 )1 · · · (un |vn ) .
n H indichiamo l’insieme di applicazioni {v ⊗ · · · ⊗ v | v ∈ H , i = 1, 2, · · · , n} mentre
Con Ti=1
i
1
n
i
i
N
n
]
i=1 Hi denota lo spazio vettoriale su C delle applicazioni multi anti-lineari date da combinan H .
zioni lineari finite di elementi v1 ⊗ · · · ⊗ vn ∈ Ti=1
i
323
Osservazione. Con questa definizione, la funzione che associa (v1 , . . . vn ) a v1 ⊗ · · · ⊗ vn è
comunque multi-lineare.
Nn
Possiamo definire un prodotto scalare (·|·) su ]
i=1 Hi come segue. Consideriamo l’applicazione
n H × T n H → C con
da S : Ti=1
i
i
i=1
S(v1 ⊗ · · · ⊗ vn , v10 ⊗ · · · ⊗ vn0 ) := (v1 |v10 ) · · · (vn |vn0 ) .
Vale il seguente risultato.
n H × T n H → C si estende in maniera univoca, per
Proposizione 9.5. L’applicazione S : Ti=1
i
i=1 i
antilinearità nell’argomento di sinistra e per linearità in quello di destra, ad un prodotto scalare
Nn
hermitiano sullo spazio vettoriale complesso ]
i=1 Hi definito da:
(Ψ|Φ) :=
XX
i
se Ψ =
P
i αi v1i
αi βj S(v1i ⊗ · · · ⊗ vni , u1j ⊗ · · · ⊗ unj )
j
⊗ · · · ⊗ vni e Φ =
P
j
βj u1j ⊗ · · · ⊗ unj (essendo entrambe le somme finite).
Prova. Per semplicità di scrittura eseguiamo la prova nel caso n = 2. Per n > 2 la dimostrazione
Ü H2 e valgono le decomposizioni
è identica. Dobbiamo prima di tutto mostrare che se Ψ, Φ ∈ H1 ⊗
P
P
P
P
Ψ = j αj vj ⊗ vj0 = h βh uh ⊗ u0h e Φ = k γk wk ⊗ wk0 = s δs zs ⊗ zs0 , allora risulta
XX
j
αj γk S(vj ⊗ vj0 , wk ⊗ wk0 ) =
j
k
αj δs S(vj ⊗ vj0 , zs ⊗ zs0 )
(9.78)
βh δs S(uh ⊗ u0h , zs ⊗ zs0 ) .
(9.79)
XX
s
e anche
XX
h
βh γk S(uh ⊗ u0h , wk ⊗ wk0 ) =
XX
h
k
s
Ü H2 è ben definita non dipendendo
Questo proverebbe che l’estensione (anti-) lineare di S a H1 ⊗
dalla decomposizione usata per rappresentare gli argomenti di S. Dimostriamo l’indipendenza
per l’argomento di sinistra (9.78), per l’argomento di destra (9.79) si procede analogamente. Il
primo membro di (9.78) si può riscrivere
!
XX
j
αj γk S(vj ⊗
vj0 , wk
⊗
wk0 )
=
X X
j
k
γ k wk ⊗
wk0
(αj vj , vj0 ) =
X
Φ(αj vj , vj0 )
j
k
e, con la stessa procedura, lavorando sul secondo membro di (9.78), si ha ugualmente
‚
Œ
XX
X X
X
0
0
0
αj δs S(vj ⊗ vj , zs ⊗ zs ) =
δs zs ⊗ zs (αj vj , vj0 ) =
Φ(αj vj , vj0 ) ,
j
s
j
s
j
dove abbiamo usato l’ipotesi Φ = k γk wk ⊗wk0 = s δs zs ⊗zs0 . Quindi S si estende univocamente
Ü H2 → C. Direttamente
ad una applicazione lineare a destra ed antilineare a sinistra (·|·) : H1 ⊗
dalla definizione di S si ha che vale
P
P
(Ψ|Φ) = (Φ|Ψ) .
324
Per mostrare che in effetti (·|·) definisce un prodotto scalare hermitiano è ora sufficiente provare
P
che (·|·) è positivo. La prova è semplice. Se Ψ = nj=1 αj vj ⊗ vj0 , dove, per ipotesi n < +∞,
possiamo considerare una base Hilbertiana (finita!) u1 , · · · , um (m ≤ n) per il sottospazio
generato da v1 , · · · , vn ed una base analoga u01 , · · · , u0l , (l ≤ n) per il sottospazio generato da
Pl
P
0
v10 , · · · , vn0 . Sfruttando la bi-linearità di ⊗, potremo alla fine scrivere Ψ = m
j=1
k=1 bjk uj ⊗ uk
dove i coefficienti bjk sono opportuni. Usando direttamente la definizione di S ed il fatto che le
basi considerate sono ortonormali:
„
Ž
(Ψ|Ψ) =
m X
l
X
bjk uj ⊗
j=1 k=1
u0k
X
l
m X
bis ui ⊗ u0s
i=1 s=1
=
n X
l
X
|bjk |2 .
j=1 k=1
La positività di (·|·) è ora evidente. 2
Definizione 9.6. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n.
N
Il prodotto tensoriale hilbertiano degli spazi Hi , ni=1 Hi , indicato equivalentemente con
H1 ⊗ · · · ⊗ Hn , è lo spazio di Hilbert ottenuto prendendo il completamento hilbertiano (cfr sezione
Nn
3.1) dello spazio ]
i=1 Hi rispetto al prodotto scalare (·|·) della proposizione 10.4.
È immediato verificare che la definizione si riduce a quella elementare nel caso in cui gli spazi
Hi siano finito dimensionali. Inoltre sussiste il seguente utile risultato.
Proposizione 9.6. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i ) con i = 1, 2, · · · , n e
corrispondenti basi hilbertiane Ni ⊂ Hi con i = 1, 2, · · · , n. L’insieme
N := {z1 ⊗ · · · ⊗ zn | zi ∈ Ni , i = 1, 2, · · · , n}
è una base hilbertiana per H1 ⊗ · · · ⊗ Hn .
Prova. Per costruzione N è un sistema ortonormale (la verifica è immediata usando la definizione
del prodotto scalare sullo spazio prodotto tensoriale). Bisogna solo provare che N è denso in
H1 ⊗ · · · ⊗ Hn . Dato che le combinazioni lineari di elementi del tipo v1 ⊗ · · · ⊗ vn sono dense in
H1 ⊗ · · · ⊗ Hn è sufficiente provare che ogni elemento v1 ⊗ · · · ⊗ vn può essere approssimato a
piacimento da combinazioni lineari di elementi z1 ⊗ · · · ⊗ zn di N . Per semplicità notazionale
lavoriamo nel caso n = 2, dato che il caso n > 2 si dimostra nello stesso modo. Nelle nostre
ipotesi, per una opportuna scelta di coefficienti γz e βz 0 , valgono gli sviluppi:
v1 =
X
γz z ,
v2 =
X
βz 0 z 0
z 0 ∈N2
z∈N1
che equivale a dire (teorema 3.4 e definizione 3.4)

X


||v1 ||2 = sup
|γz |2 F1 sottoinsieme finito di N1


z∈F1
325
(9.80)
e

 X


||v2 ||2 = sup
|βz 0 |2 F2 sottoinsieme finito di N2 .
 0

z ∈F2
(9.81)
Il calcolo diretto, basato sull’ortonormalità dei vettori z ⊗ z 0 e sulla definizione di prodotto
scalare in H1 ⊗ H2 , prova immediatamente che, se F ⊂ N1 × N2 è finito
2
X
X
0 v1 ⊗ v2 −
γz βz 0 z ⊗ z = ||v1 ||2 ||v2 ||2 −
|γz |2 |βz 0 |2 .
(z,z 0 )∈F
(z,z 0 )∈F
Valendo (9.80) e (9.81), possiamo rendere piccolo a piacere il secondo membro dell’identità scegliendo F sempre più grande. Questo conclude la prova. 2
Esempi 9.2.
(1) Esemplificheremo la nozione di spazio prodotto tensoriale, mostrando che lavorando con
spazi L2 separabili (spazi delle funzioni d’onda in meccanica quantistica), il prodotto tensoriale
può essere visto in un altro modo equivalente passando alle misure prodotto.
Consideriamo una coppia di spazi di Hilbert separabili, L2 (Xi , µi ) con i = 1, 2, e supponiamo che
le misure siano entrambe σ-finite in modo tale che sia ben definita la misura prodotto µ1 ⊗ µ2
su X1 × X2 . Vogliamo mostrare che nelle ipotesi fatte:
L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) e L2 (X1 × X2 , µ1 ⊗ µ2 ) sono isomorfi in modo naturale come spazi di
Hilbert.
La trasformazione unitaria che identifica tali spazi è l’unica estensione lineare limitata dell’applicazione U0 che associa ogni prodotto tensoriale elementare ψ ⊗ φ ∈ L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 )
alla corrispondente funzione ψ · φ ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ), dove (ψ · φ)(x, y) := ψ(x)φ(y) per
x ∈ X1 e y ∈ X2 .
La prova è la seguente. Prima di tutto notiamo che, se N1 := {ψn }n∈N e N2 := {φn }n∈N sono basi
hilbertiane in L2 (X1 , µ1 ) e L2 (X1 , µ1 ) rispettivamente, allora l’insieme N := {ψn · φm }(n,m)∈N×N
è base hilbertiana in L2 (X1 × X2 , µ1 ⊗ µ2 ). Infatti N è banalmente un insieme ortonormale per
proprietà elementari della misura prodotto, inoltre, se f ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ) è tale che, per
ogni ψn · φn ,
Z
f (x, y)ψn (x)φm (y)dµ1 (x) ⊗ dµ2 (y) = 0 ,
X×X2
dal teorema di Fubini-Tonelli segue che
Œ
Z ‚Z
f (x, y)ψn (x)dµ1 (x) φm (y)dµ2 (y) = 0 .
X2
X1
Dato che le φm sono una base hilbertiana, questo implica che
Z
f (x, y)ψn (x)dµ1 (x) = 0 ,
X1
326
eccetto che per un insieme Sm ⊂ X2 di misura nulla rispetto a µ2 . Allora, per y 6∈ S := Um∈N Sm
(che è di misura nulla essendo unione numerabile di insiemi di misura nulla) vale
Z
f (x, y)ψn (x)dµ1 (x) = 0
X1
per ogni ψn ∈ N1 , che implica che f (x, y) = 0, eccetto che per x ∈ B, essendo B di misura nulla
rispetto a µ1 . In definitiva vale f (x, y) = 0, escludendo i punti dell’insieme S × B che, per le
proprietà elementari di misura prodotto, è un insieme di misura nulla rispetto a µ1 ⊗ µ2 . In
definitiva vale f = 0, dove f è pensato come elemento di L2 (X1 × X2 , µ1 ⊗ µ2 ). Allora N è una
base hilbertiana essendo insieme ortonormale con ortogonale dato dal vettore nullo.
Consideriamo infine l’unica applicazione lineare limitata U che associa l’elemento ψn ⊗ φm della
base hilbertiana dello spazio di L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) con l’elemento ψn · φm della base hilbertiana dello spazio di L2 (X1 × X2 , µ1 ⊗ µ2 ). Per costruzione U è unitaria. È inoltre immediato
verificare che U associa ogni elemento ψ ⊗ φ ∈ L2 (X1 , µ1 ) ⊗ L2 (X1 , µ1 ) con il corrispondente
elemento ψ · φ ∈ L2 (X1 × X2 , µ1 ⊗ µ2 ) (basta notare che ψ ⊗ φ e ψ · φ hanno le stesse componenti
nelle rispettive basi) per cui U è un’estensione lineare unitaria di U0 . Ogni altra estensione
lineare limitata U 0 di U0 , dovendo estendere U0 , deve ridursi a U quando valutata sulle basi
ψn ⊗ φm ψn · φm e pertanto deve coincidere con U stessa per linearità e per continuità.
(2) Se (Hk , (·|·)) sono n < ∞ spazi di Hilbert, in generale distinti, la somma diretta HilberL
tiana di tali spazi, nk=1 Hk , è definita come lo spazio di Hilbert i cui elementi sono le n-ple
(ψ1 , . . . , ψn ) ∈ H1 × · · · × Hn , le operazioni di spazio vettoriale sono quelle standard di n-ple ed
il prodotto scalare è
((ψ1 , . . . , ψn )|(φ1 , . . . , φn )) :=
n
X
(ψi |φi )i
k=1
Un altro risultato importante riguardante il prodotto tensoriale hilbertiano è il seguente e riguarda il caso in cui tutti gli Hk di una somma hilbertiana coincidono.
Se H è uno spazio di Hilbert e 0 < n ∈ N è fissato, lo spazio di Hilbert H ⊗ Cn è naturalmente
L
isomorfo a nk=1 H.
La trasformazione unitaria che identifica i due spazi è l’unica estensione lineare limitata dell’applicazione V0 che associa il prodotto tensoriale elementare ψ ⊗ (v1 , . . . , vn ) a (v1 ψ, . . . , vn ψ)
per ogni ψ ∈ H e (v1 , . . . , vn ) ∈ Cn .
La dimostrazione si esegue come nell’analogo enunciato nell’esempio (1). Si fissa una base hilbertiana N ⊂ H. Per costruzione i vettori (ψ, 0, . . . , 0), (0, ψ, 0, . . . , 0), · · · (0, . . . , 0, ψ) definiscono
L
una base Hilbertiana di nk=1 H se ψ variano in N . Si considera l’unica trasformazione lineare limitata che associa ψ ⊗ ei a (0, . . . , ψ, . . . , 0) dove: ψ ∈ N , ei è l’i-esimo vettore di base
della base canonica di Cn e nella n-pla l’unico posto non nullo, occupato da ψ, è proprio l’iesimo posto. È immediato verificare che tale applicazione è unitaria e si riduce a V0 lavorando su
elementi ψ⊗(v1 , . . . , vn ). L’unicità dell’estensione lineare limitata si prova come nell’esempio (1).
327
9.3.2
Prodotto tensoriale di operatori (generalmente non limitati) e loro
proprietà spettrali.
Come ultimo argomento matematico introduciamo il prodotto tensoriale di operatori. Se A e B
sono operatori con dominio, rispettivamente D(A) e D(B) nei rispettivi spazi di Hilbert H1 e
H2 , indicheremo con D(A) ⊗ D(B) ⊂ H1 ⊗ H2 il sottospazio delle combinazioni lineari finite di
elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B). Possiamo provare a definire un operatore
A⊗B : D(A) ⊗ D(B) → H1 ⊗ H2
come estensione lineare di ψ ⊗ φ 7→ (Aψ) ⊗ (Bφ). Il punto da verificare è se una tale estensione
lineare sia effettivamente ben definita. Supponiamo pertanto che, per Ψ ∈ D(A)⊗D(B), valgano
P
P
le due decomposizioni (finite!) Ψ = k ck ψk ⊗ φk = j c0k ψj0 ⊗ φ0j . Dobbiamo verificare che
X
ck (Aψk ) ⊗ (Bφk ) =
X
c0j (Aψj0 ) ⊗ (Bφ0j ) .
j
k
Per verificare ciò consideriamo una base hilbertiana (finita!) di vettori fr per lo spazio generato
da tutti i vettori ψk unitamente ai vettori ψj0 , ed una analoga base di vettori gs per lo spazio
generato da tutti i vettori φk unitamente ai vettori φ0j . In particolare avremo che
ψk ⊗ φk =
X
ψj0 ⊗ φ0j =
(i)
αrs
fr ⊗ gs ,
r,s
X
(j)
βrs
fr ⊗ gs .
r,s
Inoltre, dato che siamo partiti dallo stesso vettore Ψ decomposto in due modi diversi, deve valere
anche
X
X
(k)
(j)
ck αrs
=
c0j βrs
.
j
k
Usando queste tre identità si trova immediatamente che:
Ü B)
(A⊗
X
ck ψk ⊗ φk =
k
=
X X
(
rs
X X
(
rs
(k)
ck αrs
)((Afr ) ⊗ (Bgs ))
k
(j)
c0j βrs
)((Afr ) ⊗ (Bgs )) = (A ⊗ B)
j
X
c0k ψj0 ⊗ φ0j .
j
Quindi A ⊗ B è in effetti ben definito.
Definizione 9.7. Siano A e B operatori con domini, rispettivamente D(A) e D(B) nei rispettivi
spazi di Hilbert H1 e H2 , e D(A) ⊗ D(B) ⊂ H1 ⊗ H2 denoti il sottospazio delle combinazioni
lineari finite di elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B).
Il prodotto tensoriale di A e B è l’operatore lineare A⊗B : D(A)⊗D(B) → H1 ⊗H2 ottenuto
estendendo per linearià:
ψ ⊗ φ 7→ (Aψ) ⊗ (Bφ) ,
per ψ ∈ D(A) e φ ∈ D(B).
328
La definizione si estende in modo ovvio al caso di N operatori Ak : D(Ak ) → Hk , con dominio
D(Ak ) ⊂ Hk (Hk spazio di Hilbert), definendo l’operatore prodotto tensoriale degli Ak :
A1 ⊗ · · · ⊗ AN : D(Ak ) ⊗ · · · ⊗ D(AN ) → H1 ⊗ · · · ⊗ HN .
Per le applicazioni è utile il seguente primo elementare risultato.
Proposizione 9.7. Se k = 1, . . . , N , siano Ak : D(Ak ) → Hk operatori sugli spazi di Hilbert
Hk . Vale quanto segue.
(a) Se D(Ak ) = Hk e Ak è chiudibile per k = 1, . . . , N , allora gli operatori definiti sul dominio
D(Ak ) ⊗ · · · ⊗ D(AN ):
I,
A1 ⊗ I ⊗ · · · ⊗ I ,
. . . , I ⊗ · · · ⊗ Ak ⊗ · · · ⊗ Ah ⊗ · · · ⊗ I ,
. . . , A1 ⊗ · · · ⊗ An
e, sullo stesso dominio, le combinazioni lineari finite di tali operatori, sono tutti operatori chiudibili.
(b) Se D(Ak ) = Hk e Ak ∈ B(Hk ) per k = 1, . . . , N e allora A1 ⊗ · · · ⊗ AN ∈ B(H1 ⊗ · · · ⊗ HN )
e ||A1 ⊗ · · · ⊗ AN || = ||A1 || · · · ||AN ||
Prova. (a) Limitiamoci al caso n = 2, il caso generale è del tutto anaolgo. Si osservi che
D(A1 ) ⊗ D(A2 ) è denso per costruzione, per cui gli operatori menzionati in (a) ammettono
aggiunto. Si consideri il vettore generico Ψ ∈ D(A∗1 ) ⊗ D(A∗2 ). Per definizione: (Ψ|A1 ⊗ A2 Φ) =
(A∗1 ⊗ A∗2 Ψ|Φ) per ogni Φ ∈ D(A1 ) ⊗ D(A2 ). Ma allora, dalla definizione di aggiunto:
D(A∗1 ) ⊗ D(A∗2 ) ⊂ D((A1 ⊗ A2 )∗ ) .
Per (b) di teorema 5.1, essendo A1 e A2 con domini densi e chiudibili, il dominio dei rispettivi
aggiunti dovrà essere denso e di conseguenza D((A1 ⊗ A2 )∗ ) è anch’esso densamente definito per
cui A1 ⊗ A2 è chiudibile. La prova per combinazioni lineari è la stessa. La prova di (b) è data
negli esercizi 9.2. 2
Vogliamo ora studiarne alcune proprietà di polinomi di operatori A1 ⊗ · · · ⊗ AN , quando gli Ak
siano autoaggiunti.
Nell’enunciato del teorema, gli argomenti Ak del polinomio Q andrebbero più propriamente intesi come I ⊗ · · · ⊗ I ⊗ Ak ⊗ I ⊗ · · · ⊗ I, ma noi scriveremo semplicemente Ak per non sovraccaricare
la notazione.
Teorema 9.7. Siano Ak : D(Ak ) → Hk , con D(Ak ) ⊂ Hk , per k = 1, 2, . . . , N operatori autoaggiunti e sia Q(a1 , . . . , an ) un polinomio a coefficienti reali di grado nk nella k-esima variabile.
Sia Dk ⊂ D(Ak ) un dominio di essenziale autoaggiunzione per Ank k . Vale quanto segue.
NN
N
nk
(a) Q (A1 , . . . , A1 ) è essenzialmente autoaggiunto su N
k=1 D(Ak ) e su
k=1 Dk ;
329
(b) Se ogni Hk è separabile, lo spettro di Q (A1 , . . . , A1 ) è la chiusura dell’immagine di Q sul
prodotto degli spettri di Ak :
€
Š
σ Q (A1 , . . . A1 ) = Q (σ(A1 ), . . . , σ(AN )) .
Osservazioni.
(1) Usando il teorema 9.7 si può rispondere positivamente alla domanda naturale: se Ak è autoaggiunto, allora l’operatore chiuso I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I è autoaggiunto?
Basta scegliere Dk = D(Ak ) e Di = Hi per i 6= k e notare che un operatore chiuso essenzialmente
autoaggiunto è autoaggiunto (l’unica estensione autoaggiunta è infatti la sua chiusura).
(2) La seconda parte del teorema 9.8 implica per esempio che, se Ak è un proiettore ortogonale, allora lo è anche I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I. Infatti, se A è proiettore ortogonale, il suo
spettro è uguale o contenuto in {0, 1} (ed è chiuso). Per il teorema 9.9, usando il polinomio
banale a 7→ a, l’operatore autoaggiunto I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I risulta avere lo stesso spettro. Per il teorema spettrale, un operatore autoaggiunto è un proiettore ortogonale se e solo se
ha spettro uguale o incluso in {0, 1}. Quindi I ⊗ · · · I ⊗ Ak ⊗ I ⊗ · · · ⊗ I è proiettore ortogonale.
Prova del teorema 9.7. (a) Per prima cosa notiamo che l’operatore Q(A1 , . . . , An ) è ben defink
nito su D := ⊗N
k=1 D(Ak ) (in particolare per (iv) in (c) del teorema 9.1) ed è simmetrico su
tale dominio, come si prova per computo diretto, applicando la definizione di prodotto tensoriale di operatori, tenendo conto che i coefficienti di Q sono reali e che ogni Am
k con m ≤ nk
nk
è simmetrico su D(Ak ). Possiamo dire di più : Q(A1 , . . . , An ) è essenzialmente autoaggiunto su
D, la prova segue facilmente dal teorema 5.8 di Nelson, esibendo un insieme di vettori analitici
per Q(A1 , . . . , An ) il cui spazio generato sia denso nello spazio di Hilbert globale. Tenendo conto
di (1) in esempi 9.2, una tale classe di vettori analitici si definisce come quella dei prodotti ten(L,k)
(L,N )
(L,1)
soriali ψαL ⊗ · · · ⊗ ψαL , con L = 1, 2, . . ., dove {ψαL }αL ∈GL ⊂ D è una base hilbertiana del
sottospazio chiuso P (Ak ) ([−L, L) ∩ σ(Ak )), essendo P (Ak ) la misura spettrale di Ak ed avendo
cura, ad ogni incremento di L: passando da [−L, L] a [−L − 1, L) ∪ [−L, L) ∪ [L, L + 1), di
conservare gli stessi elementi di base relativi al sottospazio associato all’intervallo [−L, L). Il
fatto che questi vettori siano analitici per Q(A1 , . . . , An ) si prova facilmente seguendo la stessa strada usata per dimostrare (f) nella proposizione 9.8 (la cui dimostrazione è indipendente
dal presente teorema). Per provare che Q(A1 , . . . , An ) è anche essenzialmente autoaggiunto su
D(e) := ⊗N
k=1 Dk è ora sufficiente provare che vale l’inclusione operatoriale Q(A1 , . . . , An )D(e) ⊃
Q(A1 , . . . , An ) D (infatti, per costruzione Q(A1 , . . . , An ) D(e) ⊂ Q(A1 , . . . , An ) D e quindi
Q(A1 , . . . , An )D(e) ⊂ Q(A1 , . . . , An )D ; se ancora Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D , allora deve essere Q(A1 , . . . , An )D(e) = Q(A1 , . . . , An )D ed il secondo membro è autoaggiunto
per cui l’operatore Q(A1 , . . . , An ) D(e) è essenzialmente autoaggiunto essendo simmetrico con
chiusura autoaggiunta.)
Per provare che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D si supponga che ⊗N
k=1 φk ∈ D, allora φk ∈ D(Ank k ), ed essendo Dk dominio di essenziale autoaggiunzione di Ank k , deve esistere una successione {φlk }l∈N con φlk → φk e Ank k φl → Ank k φk se l → +∞. Una facile stima
330
implica allora che Ank k φl → Ank k φk se l → +∞ quando 1 ≤ m ≤ nk . Concludiamo che
l
N
N
l
N
⊗N
k=1 φk → ⊗k=1 φk e Q(A1 , . . . , AN )(⊗k=1 φk ) → Q(A1 , . . . , AN )(⊗k=1 φk ) quando l → +∞.
Il risultato si estende alle combinazioni lineari finite di vettori della forma ⊗N
k=1 φk . Questo
implica che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An )D .
Passiamo a provare (b). Per prima cosa, sfruttando (c) del teorema 9.3 ed tenendo conto della separabiltà di ciascuno spazio H, rappresentiamo ogni operatore autoaggiunto Ak in termini di un
operatore moltiplicativo per la funzione Fk nello spazio di Hilbert L2 (Mk , µk ) che è identificato
2
2
N
N
con Hk . Ricordiamo che ⊗N
k L (Mk , µk ) è isomorfo a L (×k=1 Mk , µ) con µ = ⊗k=1 µk , come
discusso in (1) di esempi 9.2. Sotto tale isomorfismo, l’operatore Q(A1 , . . . , AN ) su D corrisponde alla moltiplicazione per la funzione Q(F1 , . . . , FN ) e D corrisponde allo spazio generato in
nk
2
L2 (×N
k=1 Mk , µ) da prodotti finiti φ1 (m1 ) · · · φN (mN ) tali che Fk · φk ∈ L (Mk , µk ).
Supponiamo che λ ∈ Q(σ(A1 ), . . . , σ(AN )). Se I 3 λ è un intervallo aperto, allora Q−1 (I) ⊃
×N
k=1 Ik per qualche intervallo aperto Ik ⊂ R, in modo tale che Ik ∩ σ(Ak ) 6= ∅ per ogni
k = 1, 2, . . . , N . Si osservi ora che σ(Ak ) = ess ran(Fk ), dove si è tenuto conto di (4) in
esercizi 9.1. Conseguentemente µk (Fk−1 (Ik )) 6= 0 e quindi µ[Q(F1 , . . . , FN )−1 (I)] 6= 0. Questo significa che λ ∈ ess ranQ(F1 , . . . , FN ) = σ(Q(A1 , . . . , PN )) per (4) in esercizi 9.1. Viceversa,
se λ 6∈ Q(σ(A1 ), . . . , σ(AN )) allora (λ − Q(F1 , . . . , FN )) : ×N
k=1 Mk → R è limitata e dunque
λ ∈ ρ(Q(A1 , . . . , AN )), cioé λ 6∈ σ(Q(A1 , . . . , AN )). 2
9.3.3
Un esempio: il momento angolare orbitale.
In meccanica quantistica le osservabili che corrispondono alle 3 componenti cartesiane del momento angolare orbitale di una particella sono le uniche estensioni autoaggiunte dei tre operatori
sullo spazio di Hilbert L2 (R3 , dx) (dove dx è la misura di lebesgue su R3 ):
L1 := X2 S(R3 ) P3 S(R3 ) −X3 S(R3 ) P2 S(R3 ) ,
L2 := X3 S(R3 ) P1 S(R3 ) −X1 S(R3 ) P3 S(R3 )
L3 := X1 S(R3 ) P2 S(R3 ) −X2 S(R3 ) P1 S(R3 ) ,
(9.82)
dove Xi e Pi sono gli operatori posizione ed impulso introdotti nella sezione 5.3, e S(R3 ) è lo
spazio di Schwartz delle funzioni a valori complessi, infinitamente È
differenziabili, che si annullano all’infinito più rapidamente di ogni potenza negativa di r := x21 + x22 + x23 . Nel seguito
sceglieremo dominio come D(L1 ) = D(L2 ) = D(L3 ) = S(R3 ), dato che S(R3 ) è un sottospazio
invariante per gli operatori Xi e Pi (e quindi anche per ogni Li ). Mostreremo nel seguito che
gli operatori momento angolare orbitale Li , sul dominio detto, sono essenzialmente autoaggiunti e ne espliciteremo uno sviluppo spettrale e lo spettro. In questa sede ci occuperemo solo
delle proprietà matematiche degli operatori in questione, lasciando ogno commento di carattere
fisico ai capitoli 10 e 11.
Nel seguito ci concentreremo unicamente sull’operatore L3 , dato che, cambiando i nomi delle
coordinate, quanto diremo per esso si può estendere agli altri due analoghi operatori. Esplicitamente si può scrivere:

‹
∂
∂
L3 = −i~ x1
− x2
,
∂x2
∂x1
331
dove x1 e x2 si devono intendere come operatori moltiplicativi per le corrispondenti funzioni.
Un quarto operatore che useremo nel seguito è l’operatore momento angolare totale (elevato
al quadrato):
L2 := L21 + L22 + L23 ;
definito su S(R3 ). Anche tale operatore è essenzialmente autoaggiunto su S(R3 ). Calcoleremo
lo spettro e daremo la forma esplicita dello sviluppo spettrale di L2 := L2 .
Per determinare gli sviluppi spettrali e gli spettri detti, conviene esplicitare gli operatori considerati in coordinate polari sferiche r, θ, φ dove x1 = r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ e
quindi r ∈ (0 + ∞), θ ∈ (−π/2, π/2), φ ∈ (−π, π). In questo modo si trova, con qualche banale
calcolo, che:
–

‹™
∂
1 ∂
1 ∂2
∂
L3 = −i~
+
, L2 = −~2
sin
θ
,
(9.83)
∂φ
∂θ
sin2 θ ∂φ2 sin θ ∂θ
dove gli operatori agiscono sulle funzioni dello spazio di Schwartz S(R3 ) il cui argomento è sottoposto
al cambio di coordinate indicato sopra. Dalla (9.83) risulta evidente che i due operatori non
dipendono dalla coordinata radiale r. Questo fatto si rivelerà di cruciale importanza. Tenendo
conto di ciò , notiamo che R3 = S2 × [0, +∞), dove (a meno di insiemi di misura nulla) la superficie sferica di raggio unitario S2 è lo spazio su cui variano le coordinate θ, φ, mentre [0, +∞) è lo
spazio su cui varia la coordinata radiale r; ulteriormente la misura di Lebesgue di R3 può essere
vista come il prodotto delle misure:
dx = dω(θ, φ) ⊗ r2 dr ,
dove:
dω(θ, φ) = sin θdθdφ
è la misura standard su S2 identificata con il rettangolo (−π/2, π/2) × (−π, π) in coordinate
(θ, φ) (l’insieme S2 \ ((−π/2, π/2) × (−π, π)) ha dω-misura nulla e pertanto non crea problemi).
In questo modo abbiamo anche la decomposizione:
L2 (R3 , dx) = L2 (S2 × [0, +∞), dω(θ, φ) ⊗ r2 dr) .
In base a (1) in esempi 9.2, abbiamo infine che:
L2 (R, dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r2 dr) .
A questo punto definiamo gli operatori nello spazio di Hilbert L2 (S2 , dω):
–

‹™
∂
1 ∂
1 ∂2
∂
2
2
, S2 L = −~
+
sin θ
,
S2 L3 = −i~
∂φ
∂θ
sin2 θ ∂φ2 sin θ ∂θ
(9.84)
(9.85)
con dominio C ∞ ((−π/2, π/2) × (−π, π)), riferito alle coordinate (θ, φ), che si può provare essere
denso in L2 (S2 , dω) (lo si provi per esercizio). Tali operatori risultano essere hermitiani e quindi
simmetrici come è facile verificare per computo diretto. Prima della formulazione della meccanica
332
quantistica, dallo studio dell’equazione di Laplace (e dall’elettrodinamica classica) era già noto
che esiste una base hilbertiana di L2 (S2 , dω) costituito dalle cosiddette armoniche sferiche
[NiOu82]:
Ylm (θ, φ)
(−1)l
:= l
2 l!
s
(2l + 1) (l + m)! imφ 1
dl−m
e
(1 − cos2 θ)l ,
m
4π (l − m)!
sin φ d(cos θ)l−m
(9.86)
m ∈ N , |m| ≤ 2l + 1 .
(9.87)
dove:
l = 0, 1, 2, . . .
Le funzioni Yml ∈ C ∞ ((−π/2, π/2) × (−π, π)) sono note autofunzioni degli operatori differenziali
S2 L3 e S2 Lz dati in (9.83), valendo:
l
S2 L3 Ym
S2 L
= ~ mYml ,
2
Yml = ~2 l(l + 1)Yml .
(9.88)
Si osservi che la prima identità è ovvia per definizione delle funzioni Yml . In particolare i vettori Yml sono un insieme di vettori analitici degli operatori simmetrici S2 L2 e S2 L3 , definiti su
C ∞ ((−π/2, π/2)×(−π, π)). Dato che le Yml formano una base hilbertiana dello spazio L2 (S2 , dω),
esse garantiscono, per il criterio di Nelson (teorema 5.8), che gli operatori S2 L2 e S2 L3 definiti
su C ∞ ((−π/2, π/2) × (−π, π)) siano essenzialmente autoaggiunti. Seguendo la stessa procedura
usata nella sezione 9.1.3 per l’operatore hamiltoniano dell’oscillatore armonico unidimensionale,
concludiamo che le decomposizioni spettrali di L2 := L2 e L3 := Lz sono:
2
~2 l(l
S2 L = sl∈N, m∈Z ,|m|≤2l+1
X
+ 1)Yml (Yml | )
e
X
~ mYml (Yml |
S2 L3 = sl∈N, m∈Z ,|m|≤2l+1
)
(9.89)
e, contestualmente, gli spettri sono:
n
σ(S2 L2 ) = σp (S2 L2 ) = ~2 l(l + 1) l = 0, 1, 2 . . .
o
,
(9.90)
e
σ(S2 L3 ) = σp (S2 L3 ) = { ~ m | |m| ≤ 2l + 1 , m ∈ Z, l = 0, 1, 2 . . . } .
(9.91)
Torniamo ora allo spazio
Dato che lo spazio D(0, +∞) delle funzioni
a supporto
2
2
compatto in (0, +∞) è denso nello spazio di Hilbert separabile L ((0 + ∞), r dr), per (b) in
proposizione 3.4, esisterà una base hilbertiana {ψn }n∈N costituita da funzioni in D(0, +∞). Si
verifica per computo diretto, passando in coordinate cartesiane, che le funzioni:
C∞
L2 (R3 , dx).
fl,m,n (x) = Yml (θ, φ)ψn (r) ,
(9.92)
sono funzioni di classe C ∞ (R3 ) (le uniche singolarità apparirebbero per x = 0, ma in un intorno di tale punto le funzioni dette si annullano per costruzione). Per costruzione, le funzioni
fl,m,n hanno anche supporto compatto e pertanto appartengono a S(R3 ). Notando che, con le
definizioni date e tenendo conto dei domini degli operatori considerati:
S2 L3
⊗ ID(0,+∞) ⊂ L3
e
333
S2 L
2
⊗ ID(0,+∞) ⊂ L2 ,
concludiamo che {Yml ⊗ ψn | n, l ∈ N, |m| ≤ 2l + 1 , m ∈ Z} ⊂ S(R3 ), è una base hilbertiana di
L2 (R3 , dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r2 dr) per quanto visto in (2) in esempi 9.2. Dato che,
evidentemente, pensando L3 e L2 come operatori su S(R3 ),
L3 Yml ⊗ ψn = ~ mYml ⊗ ψn ,
L2 Yml ⊗ ψn = ~2 l(l + 1)Yml ⊗ ψn .
(9.93)
possiamo concludere nuovamente che L2 e L3 sono essenzialmente autoaggiunti su tale dominio
e valgono sviluppi spettrali per le loro uniche estensioni autoaggiunte L2 := L2 e Lz := Lz del
tipo:
L2 = s-
X
~2 l(l+1)Yml ⊗ψn (Yml ⊗ψn | )
e
Lz = s-
X
~mYml ⊗ψn (Yml ⊗ψn | ), (9.94)
l,n∈N, m∈Z ,|m|≤2l+1
l,n∈N, m∈Z ,|m|≤2l+1
Mentre gli spettri di L2 := e L3 sono ancora dati da (9.90) e (9.91). Si noti che le misure
spettrali di L2 e di L3 commutano.
Si può arrivare agli stessi risultati applicando in modo opportuno il teorema 9.7.
Esercizi 9.2.
(1) Si supponga che V : R3 → R sia tale che l’operatore simmetrico H1 individuato dall’operaP
∂2
tore differenziale −∆x + V (x) sia essenzialmente autoaggiunto su S(R3 ), dove ∆x := 3k=1 ∂x
2
i
è l’operatore di Laplace. Si provi che l’operatore simmetrico H su L2 (R3 × R3 , dx ⊗ dy) dato
dall’operatore differenziale −∆x + V (x) − ∆y + V (y) è essenzialmente autoaggiunto sullo spazio
generato dai prodotti finiti di funzioni in S(R3 ), una nella variabile x e l’altra nella variabile y.
Si provi infine che:
σ(H) = σ(H1 ) + σ(H1 ) .
(2) Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N , allora A1 ⊗ · · · ⊗ Ak ∈ B(H1 ⊗ · · · ⊗ HN ).
Soluzione. Consideriamo il caso N = 2, il caso generale è analogo. Se ψ = {fi }i∈I e {gj }j∈J
P
sono basi hilbertiane di H1 e H2 , si consideri la somma finita ψ :=
ij cij fi ⊗ gj . Allora
P
P
P
P
||(A1 ⊗ I)ψ||2 = j || i cij A1 fi ||2 ≤ j ||A1 ||2 i |cij |2 = ||A1 ||2 ||ψ||2 . Per densità si conclude
che ||A1 ⊗ I|| ≤ A. Quindi ||A1 ⊗ A2 || ≤ ||A1 ⊗ I|| ||I ⊗ A2 || ≤ ||A1 || ||A2 ||.
(3) Mostrare che, nelle ipotesi in (2), vale anche:
||A1 ⊗ · · · ⊗ Ak || = ||A1 || · · · ||AN || .
Soluzione. Consideriamo ancora il caso n = 2, il caso generale ssendo analogo. Se A1 = 0
o A2 = 0 la tesi è ovvia, per cui assumiamo ||A1 ||, ||A2 || > 0. Nella soluzione di (2) abbiamo
trovato che ||A1 ⊗ A2 || ≤ ||A1 || ||A2 ||, per cui è sufficiente mostrare la disuguaglianza opposta.
()
()
Dalla definizione di ||A1 || e ||A2 ||, segue che per ogni > 0 esistono ψ1 ∈ H1 e ψ2 ∈ H2 ,
()
()
()
()
||ψ1 ||, ||ψ2 || = 1, tali che | ||Ai ψi || − ||Ai || | < e quindi, in particolare, ||ψi || ≥ ||Ai || − .
Con queste scelte:
()
()
()
()
||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )|| = ||A1 ψ1 || ||A2 ψ2 || ≥ ||A1 || ||A2 || − (||A1 || + ||A2 ||) + 2 .
334
()
()
e quindi, notando che ||ψ1 ⊗ ψ2 || = 1, ed essendo ||A1 ⊗ A2 || = sup||ψ||=1 ||A1 ⊗ A2 ψ|| ≥
()
()
||(A1 ⊗ A2 )(ψ1 ⊗ ψ2 )||, abbiamo, che per ogni > 0:
||A1 ⊗ A2 || ≥ ||A1 || ||A2 || − (||A1 || + ||A2 ||) + 2 .
Per > 0 in un intorno di 0, si ha −(||A1 || + ||A2 ||) + 2 < 0, e tale valore tende a 0 se → 0+ .
Concludiamo che deve essere ||A1 ⊗ A2 || ≥ ||A1 || ||A2 || come richiesto.
(4) Provare che se Ak ∈ B(Hk ) per k = 1, . . . , N allora (A1 ⊗ · · · ⊗ Ak )∗ = A∗1 ⊗ · · · ⊗ A∗N .
Suggerimento. Tenendo conto di (2) e verificare che A∗1 ⊗· · ·⊗A∗N soddisfa le proprietà dell’operatore
aggiunto per operatori limitati definiti su tutto lo spazio di Hilbert (proposizione 3.5).
(5) Mostrare che se Pk ∈ B(Hk ) per k = 1, . . . , N sono proiettori oprtogonali allora P1 ⊗ · · · ⊗ Pk
è un proiettore ortogonale.
9.4
Esponenziale di operatori non limitati: vettori analitici.
In questa sezione tecnica sviluppiamo alcune proprietà dei vettoria analitici introdotti alla fine
del capitolo 5.
Ricordiamo che (definizione 5.11), se A è un operatore sullo spazio di Hilbert H con dominio
D(A), un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), è detto vettore C ∞
per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). ψ ∈ C ∞ (A)
è detto vettore analitico per A, se vale:
+∞
X
||An ψ|| n
t < +∞ ,
n!
n=0
per qualche t > 0.
(9.95)
Vale infine il teorema di Nelson (dimostrato come teorema 5.8) che afferma che:
Teorema di Nelson. Un operatore A simmetrico nello spazio di Hilbert H è essenzialmente
autoaggiunto se il suo dominio D(A) contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H.
Osservazioni.
(1) Se A : D(A) → H è autoaggiunto allora D(A) contiene un insieme denso di vettori analitici:
si tratta di tutti i vettori ψ per i quali P (A) (E)ψ = ψ per qualche borelliano limitato E ⊂ σ(A),
dove P (A) (E) è il generico proiettore della misura spettrale di A. Per ognuno di tali vettori il
valore di t > 0 in (9.95) può essere scelto arbitrariamente grande. Lasciamo la semplice prova
di tale fatto per esercizio.
(2) Segue immediatamente dalla disuguaglianza triangolare che se ψ, φ ∈ C ∞ (A) soddisfano la
(9.95) allora ogni loro combinazione lineare soddisfa la stessa disuguaglianza. Pertanto l’inseme
dei vettori analitici di un operatore A per un fissato valore t è un sottospazio dello spazio di
Hilbert.
335
Notazione. Se A è un operatore sullo spazio di Hilbert H con dominio D(A), nel seguito
A (A, t) indicherà il sottospazio di C ∞ (A) che soddisfano (9.95) per il valore t > 0 indicato,
T
inoltre A (A, +∞) := t>0 A (A, t).
Un risultato elementare che della nozione di vettore analitico è la seguente utile proposizione
(essenzialmente dovuta a Nelson) che riguarada, in particolare, l’esponenziale di operatori non
limitati.
Proposizione 9.8. Sia A : D(A) → H operatore sullo spazio di Hilbert H con dominio dato dal
sottospazio D(A) ⊂ H. Valgono i seguenti fatti.
(a) A (A, t) è uno spazio vettoriale.
(b) Se A è chiudibile allora:
A (A, t) ⊂ A (A, t) .
(c) Per ogni c ∈ C, definendo A + cI sul suo dominuo naturale, vale:
A (A + cI, t) = A (A, t) ,
se inoltre A è hermitiano, definendo A2 sul suo dominuio naturale, vale anche:
A (A2 , t) ⊂ A (A, t) .
(d) Se A è autoaggiunto e ψ ∈ A (A, t) ∩ D(ezA ), allora:
ezA ψ =
+∞
X
zn n
A ψ
n!
n=0
per ogni z ∈ C con |z| ≤ t .
(9.96)
se Rez = 0 con |z| ≤ t la (9.96) vale per ogni ψ ∈ A (A, t).
(e) Se A è autoaggiunto allora:
eisA (A (A, t)) ⊂ A (A, t)
per ogni s ∈ R.
(f ) Se A è autoaggiunto allora D(A) contiene un sottoinsieme denso i cui elementi sono in
A (PN (A), t) per ogni t > 0 e per ogni polinomio PN (A) dell’operatore A di ordine finito
N = 0, 1, . . ..
Prova. (a) La tesi affermazione segue immediatamente dalla definizione di vettore analitico e
dalla maggiorazione:
||An (aψ + bφ)|| ≤ |a| ||An ψ|| + |b| ||An φ|| .
(b) Segue immediatamente dalle definizioni tenendo conto che A è un’estensione di A e pertanto
n
A è un estensione di An .
(c) Cominciamo con la prima proprietà . Si osservi prima di tutto che, per costruzione C ∞ (A) =
√
C ∞ (A2 ). Inoltre, essendo A hermitiano e valendo x ≤ 1 + x per x ≥ 0, deve essere su C ∞ (A):
È
È
È
È
||An ψ|| = (ψ|A2n ψ) ≤ ||ψ|| ||A2n ψ|| ≤ ||ψ||(1 + ||(A2 )n ψ||) .
336
Vale allora, per t > 0,
+∞
+∞
+∞
È
È
È
X tn
X tn
X tn
2 n
||A ψ|| ≤ ||ψ||
||(A ) ψ|| + ||ψ||
= ||ψ||
||(A2 )n ψ|| + et
n!
n!
n!
n!
n=0
n=0
n=0
n=0
+∞
X tn
!
n
,
da cui segue immediatamente la tesi.
Per la seconda proprietà notiamo che:
k
n
+∞
+∞
n
X 1 X
XX
n!
1
|c|n−k A ψ n
n−k k ||(A + cI) ψ|| =
|c|
A ψ ≤
n!
n! k=0 k!(n − k)!)
n=0 k=0 (n − k)! k!
n=0
n=0
+∞
X
k
+∞
X Ak ψ |c|p A ψ =
= e|c|
.
p!
k!
k!
p=0 k=0
k=0
+∞
X +∞
X
Quanto ottenuto dimostra che A (A + cI, t) ⊂ A (A, t). Definiamo ora A0 := A + cI, per cui
A = A0 + c0 I con c0 = −c. In base a quanto provato: A (A0 + c0 I, t) ⊂ A (A0 , t): Ma questo
equivale a A (A, t) ⊂ A (A + cI, t) e quindi A (A, t) = A (A + cI, t).
€
Š
(d) Per un fissato φ ∈ H indichiamo con µφ,ψ la misura di Borel complessa µφ,ψ (E) := φ|P (A) (E)ψ
€
Š
e, per ogni fissato χ ∈ H, µχ indichi la misura positiva finita µχ (E) := χ|P (A) (E)χ . Usando
la decomposizione di Radon-Nykodym (vedi Esempi 2.2) dµφ,ψ = hd|µφ,ψ | con |h| = 1 ovunque,
si ha subito che, se ψ appartiene al dominio di f (A), allora
ÊZ
Z
Z
 Z
Z
‹
R
f d|µφ,ψ | = R
f h dP (A) ψ ≤ ||φ|| f h dµφ,ψ = φ R
f h dP (A) ψ = ||φ||
R
|f |2 dµψ .
R
Se z ∈ C e |z| ≤ t allora:
+∞
XZ
n=0 σ(A)
n +∞
X z n Z
z n
x d|µφ,ψ (x)| =
n! n! +∞
X
n=0
||φ||
|x |d|µφ,ψ (x)| ≤
σ(A)
n=0
=
n
+∞
X tn
n=0
n!
||φ||
‚Z
Œ1/2
2n
x dµψ (x)
σ(A)
+∞
X tn
tn
||An ψ|| = ||φ||
||An ψ|| < +∞ ,
n!
n!
n=0
dove abbiamo usato nell’ultimo passaggio:
+∞
X
||An ψ|| n
t < +∞ .
n!
n=0
(9.97)
Il teorema di Fubini-Tonelli implica che, se |z| ≤ t, possiamo scambiare il simbolo di serie con
quello di integrale in
Z
+∞
X zn
xn dµφ,ψ (x) .
n!
σ(A) n=0
337
Allora, se |z| ≤ t e se ψ appartiene al dominio di ezA (cfr definizione 9.2) e valendo (v) in (c)
nel teorema 9.1, si ha subito:
(φ|e
zA
Z
ψ) =
zx
e dµφ,ψ
σ(A)
+∞
X
+∞
X zn
zn n
=
x dµφ,ψ =
n!
σ(A) n=0 n!
n=0
Z
Z
xn dµφ,ψ =
σ(A)
+∞
X
zn
(φ|An ψ) .
n!
n=0
Dato che in virtù di (9.97) la serie:
+∞
X
zn n
A ψ
n!
n=0
converge in H ed il prodotto scalare è continuo, l’identità ottenuta sopra può essere trascritta
come:
!
+∞
X zn
n
zA
A ψ .
(φ|e ψ) = φ n!
n=0
Per l’arbitrarietà di φ questa equivale a (9.96). Nel caso in cui Rez = 0, la funzione R 3 x 7→ ezx
è banalmente limitata e pertanto il dominio di ezA è tutto lo spazio di Hilbert per il teorema
9.1 tenendo conto che ogni misura positiva µψ è finita.
(e) Usando (iii) in (c) del teorema 9.1, segue immediatamente che se ψ ∈ C ∞ (A) ⊂ C ∞ (A) e
An eisA ψ = eisA An ψ, ma, dato che eisA è unitario ||eisA An ψ|| = ||An ψ|| da cui segue immediatamente la tesi.
R
(f) Consideriamo la decomposizione spettrale A = R xdP (A) (x), quindi decomponiamo la retta reale R = ∪n∈Z (n, n + 1] ed infine consideriamo i sottospazi chiusi,
aR due a due ortogonali,
R
Hn = Pn (H), dove abbiamo definito i proiettori ortogonali: Pn := (n,n+1] R 1dP (A) (x). Sceglien(n)
do una base hilbertiana {ψk }k∈Kn ⊂ Hn per ogni n, l’unione di tali base forma ovviamente
R
(n)
una base hilbertiana di H. Ogni vettore ψk appartiene a D(A) essendo R |x|2 dµψ(n) (x) =
R
2
(n,n+1] |x| dµψ (n) (x)
k
k
≤ |n + 1|2 ed è banalmente un vettore analitico, dato che AHn è limitato
con ||AHn || ≤ |n + 1|. Le combinazioni lineari finite di tali vettori sono, per costruzione, un
sottospazio vettoriale denso in H, e sono anche vettori analitici per A in virtù di (a).
Consideraimo ora un polinomio di ordine N a coefficienti generalmente complessi, PN (x) =
PN
n
N
k=0 x , e definiamo PN (A) sul dominio D(PN (A)) = D(A ). Vogliamo verificare che ciascuno
(n)
dei vettori ψk determinati sopra è un vettore analitico per l’opertaore chiuso (autoaggiunto se
PN è reale) PN (A). Scegliamo uno dei vettori suddetti che indicheremo con ψ, e supponiamo che
la sua misura spettrale µψ abbia supporto
in qualche intervallo finito (−L, L]. Abbiamo allora
R
k
k
k
2
che ||A ψ|| ≤ L dato che: ||A ψ|| = (−L,L] x2k dµψ (x) ≤ L2k . Conseguentemente:
X
N
N
X
X
N
|ak |||Ak ψ|| =
|ak |Lk .
||P (A)ψ|| = ak Ak ψ ≤
k=0
k=0
k=0
Con la stessa procedura troviamo:
X
N
N
X
||P (A)n ψ|| = ak1 · · · akn Ak1 +···+kn ψ ≤
|ak1 | · · · |akn |||Ak1 +···+kn ψ||
k1 ,...,kn =0
k1 ,...,kn =0
338
≤
N
X
|ak1 | · · · |akn |Lk1 +···+kn .
k1 ,...,kn =0
Concludiamo che, se ML :=
PN
k
k=0 |ak |L ,
allora deve essere:
||P (A)n ψ|| ≤ MLn
e pertanto ψ è un vettore analitico per P (A) per ogni valore di t > 0. 2
9.5
Teorema di decomposizione polare per operatori non limitati.
Consideriamo un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H.
Usando il fatto che, come vedremo, A∗ A è autoaggiunto positivo e sfruttando il teorema spettrale
√
per operatori non limitati, è possibile definire l’operatore positivo autoaggiunto |A| := A∗ A.
Se definiamo, almeno su Ran(|A|), l’operatore U = A|A|−1 , estendendolo all’operatore nullo
sull’ortogonale di Ran(|A|), abbiamo immediatamente che vale la decomposizione:
A = U |A| .
Formalmente, e senza prestare troppa attenzione ai domini, si verifica che U Ran(|A|) è un’isometria. In questo modo si ottiene, a livello euristico, una generalizzazione del teorema 3.9 di
decomposizione polare, che abbiamo provato per operatori limitati definiti su tutto lo spazio
di Hilbert. Questo approccio diretto ha tuttavia il difetto che non è evidente su quale dominio
valga la decomposizione di sopra (a priori i domini di A e di |A| possono essere differenti) ed il
tentativo di rendere rigoroso il ragionamento si rivela piuttosto pesante. Pertanto noi seguiremo
un approccio più indiretto basato su un teorema più generale.
L’estensione del teorema di decomposizione polare che troveremo alla fine gioca un ruolo fondamentale nella teoria quantistica dei campi rigorosa, in riferimento alla teoria modulare di
Tomita-Takesaki ed alla definizione degli stati termici KMS [BrRo02].
9.5.1
Proprietà degli operatori A∗ A, radici quadrate di operatori autoaggiunti
positivi non limitati.
Procediamo in alcuni passi, dimostrando qui che A∗ A è autoaggiunto e che D(A∗ A) è un core
per A, e quindi un teorema che, in un certo senso, generalizza in teorema di decomposizione
polare avendo cura di specificare in modo chiaro i domini degli operatori ed una proposizione
riguardate l’esistenza e l’unicità delle radici quadrate autoaggiunte positive di operatori autoaggiunti non limitati.
Teorema 9.8. Si consideri un operatore chiuso e con dominio denso, A : D(A) → H, nello
spazio di Hilbert H. Valgono i seguenti fatti:
339
(a) A∗ A, definito sul dominio naturale D(A∗ A) (definizione 5.1), è autoaggiunto;
(b) il sottospazio denso D(A∗ A) è un core per A:
AD(A∗ A) = A
(9.98)
Prova. Per dimostrare (a), indicato con I : H → H l’operatore identità , si introduce l’operatore
I + A∗ A, definito sul suo dominio naturale (che coincide ancora con D(A∗ A), come si dimostra
immediatamente dalla definizione 5.1). Si prova poi che esiste un operatore positivo P ∈ B(H)
tale che Ran(P ) = D(I + A∗ A), e che soddisfa:
(I + A∗ A)P = I ,
P (I + A∗ A) = ID(I+A∗ A) .
(9.99)
Per (f) in proposizione 3.8, l’operatore P ∈ B(H) deve essere autoaggiunto in quanto positivo.
Per l’unicità della funzione inversa, l’operatore I + A∗ A deve allora coincidere con l’inverso di P
ottenuto tramite la sua decomposizione spettrale:
P −1 =
Z
λ−1 dP (P ) (λ) .
σ(P )
Tale operatore è autoaggiunto in virtù del teorema 9.1. L’operatore A∗ A = (I + A∗ A) − I
sarà allora autoaggiunto sul dominio D(I + A∗ A) = D(A∗ A), che dovrà essere denso di conseguenza. Per concludere la dimostrazione proviamo che esiste B ∈ B(H) positivo, con Ran(P ) =
D(I + A∗ A) e che vale (9.99). Se f ∈ D(I + A∗ A) = D(A∗ A) allora Af ∈ D(A∗ ) per definizione
di D(A∗ A). Di conseguenza:
(f |f ) + (Af |Af ) = (f |f ) + (f |A∗ Af ) = (f |(I + A∗ A)f ) .
Abbiamo in tal modo ottenuto che (I + A∗ A) ≥ 0, ma anche, dalla disuguaglianza di CauchySchwartz, che deve essere ||f ||2 ≤ ||f || ||(I + A∗ A)f || e dunque I + A∗ A : D(A∗ A) → H è
iniettivo. Consideriamo ora l’operatore A che è chiuso e densamente definito. L’identità provata
in (d) del teorema 5.1, implica che che, per ogni h ∈ H esiste un unico P h ∈ D(A), ed un unico
Qh ∈ D(A∗ ) tali che in H ⊕ H:
(0, h) = (−AP h, P h) + (Qh, A∗ Qh) .
(9.100)
Per costruzione P, Q sono definiti su tutto H ed inoltre i due vettori a secondo membro, pensati come vettori di H ⊕ H, sono artogonali. Per definizione della norma usata su H ⊕ H,
l’dentità ottenuta ci dice anche che, per ogni h ∈ H:
||h||2 ≥ ||P h||2 + ||Qh||2
e quindi P, Q ∈ B(H) valendo ||P ||, ||Q|| ≤ 1. Considerando le singole componenti in (9.100), si
ha anche che:
Q = AP
e
h = P h + A∗ Qh = P h + A∗ AP h = (I + A∗ A)P h ,
340
per ogni h ∈ H. Quindi (I + A∗ A)P = I e pertanto P : H → D(I + A∗ A) deve essere iniettiva,
ma anche suriettiva dato che (I + A∗ A) è iniettiva, come provato sopra. Per l’unicità dell’inversa
di funzioni biettive, deve anche essere
P (I + A∗ A) = ID(I+A∗ A) .
Fino ad ora abbiamo provato che P ∈ B(H) ha immagine che ricopre D(I + A∗ A) e che vale
(9.99). Il fatto che P ≥ 0 si prova come segue. Se h ∈ H, allora h = (I + A∗ A)f per qualche
f ∈ D(A∗ A) e quindi:
(P h|h) = (P (I + A∗ A)f |(I + A∗ A)f ) = (f |(I + A∗ A)f ) ≥ 0 .
Per concludere, dimostriamo (b). Dato che A è chiuso, il suo grafico è un sottospazio chiuso di
H ⊕ H ed è di conseguenza uno spazio di Hilbert. Supponiamo allora che (f, Af ) ∈ G(A) sia
ortogonale a G(AD(A∗ A) ), allora, per ogni x ∈ D(A∗ A) deve essere:
0 = ((f, Af )|(x, Ax)) = (f |x) + (Af |Ax) = (f |x) + (f |A∗ Ax) = (f |(I + A∗ A)x)) .
Dato che Ran(I + A∗ A) = H, deve essere f = 0 e quindi l’ortogonale di G(AD(A∗ A) ) rispetto
allo spazio di Hilbert G(A) è banale e dunque: G(AD(A∗ A) ) = G(A), che è la tesi. 2
Passiamo ora ad enunciare e provare un notevole teorema che, unitamente ad un teorema di
unicità delle radici quadrate positive di operatori autoaggiunti positivi (non limitati) implica,
come sottocaso, il teorema di decomposizione polare per operatori chiusi e densamente definiti. Ricordiamo che, per una coppia di oparatori con lo stesso dominio D, P ≤ Q significa
(f |P f ) ≤ (f |Qf ) per ogni f ∈ D.
Teorema 9.9. Si consideri una coppia di operatori chiusi e con dominio denso, A : D(A) → H,
B : D(B) → H nello spazio di Hilbert H.
(a) Se vale:
D(A∗ A) ⊃ D(B ∗ B) unitamente a A∗ AD(B ∗ B) ≤ B ∗ B ,
(9.101)
allora D(A) ⊃ D(B) ed esiste un operatore limitato C : H → H unicamente individuato dalle
richieste:
AD(B) = CB , Ker(C) ⊃ Ker(B ∗ ) .
(9.102)
Ulteriormente risulta ||C|| ≤ 1 e C(Ran(B))⊥ = 0.
(b) Se vale:
D(A∗ A) ⊃ D(B ∗ B) unitamente a
A∗ AD(B ∗ B) = B ∗ B ,
allora CRan(B) è un isometria e Ker(C) = Ker(B ∗ ).
(c) Se vale:
D(A∗ A) = D(B ∗ B) unitamente a
allora D(A) = D(B).
341
A∗ A = B ∗ B ,
(9.103)
(9.104)
Prova. (a) Per prima cosa proviamo l’unicità di C. Se C e C 0 sono limitati e soddisfano A = CB
e A = C 0 B, allora C − C 0 è l’operatore nullo su Ran(A). Per continuità , abbiamo anche che
C Ran(B) = C 0 Ran(B) . Dato che vale la deocmposizione ortogonale H = Ran(B) ⊕ (Ran(B))⊥
e (Ran(B))⊥ = Ker(B ∗ ), il fatto che KerC ⊃ Ker(B ∗ ), KerC 0 ⊃ Ker(B ∗ ) implica che
C(Ran(B))⊥ = C 0 (Ran(B))⊥ . Di conseguenza C = C 0 .
Passiamo a provare che esiste un operatore C ∈ B(H) che soddisfa A = CB su D(B) (e quindi
questo implica che D(B) ⊂ D(A)), Ker(C) ⊃ Ker(B ∗ ) e che sono vere le proprietà ||C|| ≤ 1 e
C(Ran(B))⊥ = 0.
Siano A0 e B 0 le restrizioni di A e B a, rispettivamente, D(A∗ A) e D(B ∗ B). Dato che (per il
teorema precedente) questi spazi sono core per A e B rispettivamente, abbiamo che: Ran(A0 ) =
Ran(A) e Ran(B 0 ) = Ran(B). Notiamo infine che: Ker(A) = Ker(A0 ) e Ker(B) = Ker(B 0 ),
dato che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B).
Cominciamo con il produrre un operatore che soddisfi: A0 = CB 0 . Questa richiesta individua
completamente un operatore lineare C su Ran(B 0 ), definito come:
A0 f = CB 0 f ,
per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A) .
Perché questa sia una definizione ben posta, bisogna che B 0 f = B 0 g implichi A0 f = A0 g cioè,
detto in termini equivalenti: B 0 h = 0 implichi A0 h = 0 per h ∈ D(B ∗ B) ⊂ D(A∗ A). Questo fatto
è vero. Infatti: B 0 h = 0 implica che (B 0 h|B 0 h) = 0 e quindi, essendo h ∈ D(B ∗ B) ⊂ D(A∗ A),
deve valere 0 = (B 0 h|B 0 h) = (h|B ∗ Bh) ≥ (h|A∗ Ah) = (A0 h|A0 h) = ||A0 h||2 ≥ 0, che implica
A0 h = 0. L’operatore C risulta essere limitato su Ran(B 0 ) con ||C|| ≤ 1. Infatti, essendo:
A∗ A ≤ B ∗ B ed usando il fatto che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B), si ha subito che, se
f ∈ D(B ∗ B) ⊂ D(A∗ A):
||C(B 0 f )||2 = (CB 0 f |CB 0 f ) = (A0 f |A0 f ) = (f |A∗ Af ) ≤ (f |B ∗ Bf ) = (B 0 f |B 0 f ) = ||B 0 f ||2 ,
(9.105)
Pertanto C si estende in modo unico su tutto Ran(B 0 ) = Ran(B), conservando la richiesta
||C|| ≤ 1. Per completare la definizione di C : H → H, è sufficiente definire C sull’ortogonale
(Ran(B))⊥ = Ker(B ∗ ). Definiamo C come l’operatore nullo su questo spazio. In questo modo
C : H → H risulta ancora essere limitato con ||C|| ≤ 1 e la condizione Ker(C) ⊃ Ker(B ∗ )
risulta essere soddisfatta. Per costruzione, per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A), vale:
Af = CBf .
Dato che D(B ∗ B) è un core per B, se g ∈ D(B) esisterà una successione {fn }n∈N ⊂ D(B ∗ B) ⊂
D(A∗ A), tale che fn → g e Bfn → Bg. Avremo allora che, dalla continuità di C,
lim Afn = lim CBfn = C lim Bfn = Bg .
n→+∞
n→+∞
n→+∞
Dato che A è chiuso, questo risultato implica che g ∈ D(A) e che limn→+∞ Afn = Ag. Pertanto
A0 = CB 0 si estende, in realtà , a A = CB valida su D(B) ⊂ D(A).
342
(b) Nell’ipotesi A∗ A = B ∗ B su D(B ∗ B) ⊂ D(A∗ A), la (9.105) risulta essere rimpiazzata da, se
f ∈ D(B ∗ B) ⊂ D(A∗ A):
||C(B 0 f )||2 = (CB 0 f |CB 0 f ) = (A0 f |A0 f ) = (f |A∗ Af ) = (f |B ∗ Bf ) = (B 0 f |B 0 f ) = ||B 0 f ||2
Da tale identità si ricava che C è un isometria su Ran(B) e, per continuità , su Ran(B). Rimane
da dimostrare che Ker(C) ⊂ Ker(B ∗ ), dato che l’altra inclusione è valida nel caso generale (a).
Se s ∈ Ker(C), dato che si ha la decomposizione ortogonale H = Ran(B)⊕Ker(B ∗ ), deve essere
s = r + n con r ∈ Ran(B) e n ∈ Ker(B ∗ ). Pertanto, dal momento che Ker(B ∗ ) ⊂ Ker(C),
0 = Cs = C(r + n) = Cr + Cn = Cr + 0 = Cr. D’altra parte, dato che C è un isometria su
Ran(B), 0 = ||Cr|| = ||r|| e quindi Cr = 0. In definitiva, se s ∈ Ker(C), allora s = n ∈ Ker(B ∗ )
e questo conclude la dimostrazione di Ker(C) ⊂ Ker(B ∗ ).
(c) Dobbiamo provare che D(A) = D(B) se D(A∗ A) = D(B ∗ B) e A∗ A = B ∗ B. Dalla dimostrazione del caso più generale (a), sappiamo che D(B) ⊂ D(A). Nelle ipotesi in (c), possiamo
scambiare il ruolo di A e B, trovando che D(A) ⊂ D(B) e pertanto D(A) = D(B). 2
Ecco l’ultimo ingrediente che generalizza parte del teorema 3.8.
Teorema 9.10. Sia A : D(A) → H un operatore autoaggiunto nello spazio di Hilbert H. Valgono
i fatti seguenti.
(a) A ≥ 0 (che significa (f |Af ) ≥ 0 per ogni f ∈ D(A)) se e solo se σ(A) ⊂ [0 + ∞)
(b) Se A ≥ 0, esiste ed è unico un operatore autoaggiunto B ≥ 0 tale che B 2 = A, dove il primo
membro è √
definito sul suo dominio naturale D(B 2 ) che coincide con D(A).
Vale B = A definito usando l’integrale rispetto alla misura spettrale di A.
Prova (a) Se σ(A) ⊂ [0 + ∞), (vii) in (c) nel teorema 9.1, riferito alla PVM P (A) di A, implica
immediatamente che A ≥ 0. Viceversa, supponiamo che A ≥ 0 e, per assurdo, che esista λ tale
che 0 > λ ∈ σ(A). Se λ ∈ σp (A) allora esistrebbe un autovettore ψ ∈ H \ {0} con autovalore
λ e si avrebbe un assurdo: 0 ≤ (ψ|Aψ) = ||ψ||2 λ < 0. Se invece λ ∈ σc (A), dal teorema 9.2
(A)
sappiamo che, per ogni intervallo aperto (a, b) 3 λ, vale P(a,b) 6= 0. Potremmo allora scegliere
(A)
(a, b) = (2λ, λ/2) ottenendo, se 0 6= ψ ∈ P(a,b) (H), usando le proprietà delle misure spettrali del
teorema 9.1 ed il fatto che µψ si annulla fuori da (a, b):
0 ≤ (ψ|Aψ) =
Z
Z
xdµψ (x) ≤
xdµψ (x) =
(2λ,λ/2)
R
Z
(2λ,λ/2)
λ
λ
dµψ (x) = ||ψ||2 < 0
2
2
che è ancora un assurdo.
(b) Una radice quadrata autoaggiunta positiva di A è semplicemente:
√
B=
√
Z
A :=
xdP (A) (x) .
σ(A)
Tale operatore è ben definito, dato che σ(A) ⊂ [0, +∞), è autoaggiunto per (ii) in (c) nel teorema
9.1 e vale B 2 = A, dove il primo membro è definito sul suo dominio naturale D(B 2 ) che coincide
343
con D(A) in virtù di (iii) e (iv) in (c) nel teorema 9.1. Infine B ≥ 0 per (vii) in (d) nel teorema
9.1. Passiamo alla dimostrazione di unicità . Supponiamo che B ≥ 0 sia autoaggiunto, B ≥ 0 e
B 2 = A. In tal caso, per le prime due ipotesi:
Z
xdP (B) (x) .
B=
[0,+∞)
Possiamo applicare (c) del teorema 9.1 con P = P (B) , X = [0, +∞), φ(x) = x2 , f (x0 ) = x0 e:
(B)
0
Pφ(E)
= PE
se E ⊂ [0, +∞) ,
(9.106)
ottenendo che vale:
2
Z
2
A=B =
x dP
(B)
Z
(x) =
[0,+∞)
x0 dP 0 (x0 ) .
[0,+∞)
Per l’unicità della misura aspettrale associata ad A (teorema 9.2), dobbiamo concludere che
P 0 = P (A) . Ma allora da (9.106), la PVM P (B) è completamente individuata da P (A) valendo:
(B)
PE
(A)
= Pφ(E)
se E ⊂ [0, +∞) ,
e quindi A determina completamente B, che è quindi unico. 2
9.5.2
Teorema di decomposizione polare per operatori chiusi e densamente
definiti.
Possiamo finalmente enunciare e dimostrare il teorema di decomposizione polare per operatori
chiusi densamente definiti. L’idea euristica della dimostrazione è quella di partire, non da A,
ma da A∗ A.√Se il teorema di decomposizione polare vale, allora ci si aspetta che A∗ A = |A| |A|,
dove |A| := A∗ A è definito per via spettrale, ricordando che A∗ A è autoaggiunto come provato
precedentemente. A questo punto, il teorema 9.9, nel caso (c), produce la decomposizione polare
di A voluta. La potenza dell’approccio si vede nel fatto che le proprietà dei domini degli operatori coinvolti, difficili da studiare con un approccio più diretto, risultano essere automaticamente
fissate dal teorema 9.9.
Teorema 9.11. Sia A : D(A) → H un operatore chiuso con dominio denso nello spazio di
Hilbert H. Valgono i fatti seguenti.
(a) Esiste una sola coppia di operatori P, U in H tali che valgano insieme le condizioni elencate
di seguito:
(1) vale la decomposizione
A = UP ,
(9.107)
(2) P è positivo, autoaggiunto e D(P ) = D(A),
(3) U ∈ B(H) è isometrico su Ran(P ),
344
(4) Ker(U ) ⊃ Ker(P ).
√
(b) Risulta essere P = |A| := A∗ A e Ker(U ) = Ker(P ) = Ker(A) = (Ran(P ))⊥ .
(c) Se A è biettivo, U coincide con l’operatore unitario A|A|−1 .
Prova. (a) e (b). Dimostriamo inizialmente l’unicità di P determinandolo esplicitamente, assumendo valida (9.107) insieme a (2), (3) e (4). Cominciamo con il provare che D(A∗ A) =
D(P P ). Dalla definizione di operatore aggiunto, tenendo conto che U ∈ B(H), (9.107) implica
A∗ = P ∗ U ∗ = P U ∗ . Di conseguenza f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ). Si osservi ora che,
decomponendo H come Ran(P ) ⊕ Ker(P ∗ ) = Ran(P ) ⊕ Ker(P ), tenendo conto del fatto che U
è isometrico su Ran(P ) e si annulla su Ker(P ), segue facilmente che (U ∗ U )Ran(P ) = IRan(P ) .
Pertanto l’asserzione f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ) risulta essere equivalente a
f ∈ D(A∗ A) se e solo se f ∈ D(P P ). Abbiamo ottenuto che D(A∗ A) = D(P P ). Usiamo ora
tale fatto per ottenere l’unicità di P determinandolo esplicitamente. Se g ∈ D(A∗ A) ⊂ D(A)
(che equivale a g ∈ D(P P ) ⊂ D(P )) e tenendo ancora conto del fatto U è isometrico su Ran(P ),
si ha subito:
(f |A∗ Ag) = (Af |Ag) = (U P f |U P g) = (P f |P g) = (f |P P g)
per ogni f ∈ D(A) = D(P ).
Essendo D(A) = D(P ) un insieme denso, si conclude che A∗ A = P P . Quindi P è una radice
∗
quadrata
√ positiva autoaggiunta di A A, ed è dunque l’unica per il teorema 9.10. Vale pertanto
∗
P = A A =: |A|. A questo punto possiamo applicare il caso (c) del teorema 9.9 con B = P (che
è chiuso e densamente definito essendo autoaggiunto), trovando che l’operatore U che verifica
tutte le richieste coincide con l’operatore C. Il fatto che Ker(U ) = Ker(P ) = (Ran(P ))⊥ segue
da (b) del teorema citato, tenendo conto che B = P = P ∗ = B ∗ nel caso in esame e del fatto
che (Ran(P ∗ ))⊥ = Ker(P ). L’asserto Ker(A) = Ker(P ) si prova come segue:
0 = ||Af ||2 = (Af |Af ) = (f |A∗ Af ) = (f |P P f ) = (P f |P f ) = ||P f ||2 ,
dove abbiamo tenuto conto che se Af = 0 allora f ∈ D(A∗ A) per definizione di tale dominio
naturale.
(c) Se A è iniettivo, usando (b), si trova che Ker(A) = Ker(U ) è banale e quindi U è iniettivo.
D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A)
e pertanto, se A è suriettivo, deve esserlo U . Concludiamo che, se A è biettivo, U deve essere tale.
In tal caso, per (b), U è un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H
ed è quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| è biettivo e
quindi possiamo scrivere: U = A|A|−1 . 2
Esercizi 9.3.
(1) Considerare gli operatori A e A? definiti in (2) di esempi 9.1. Provare che si tratta di
operatori chiudibili e dimostrare che:
∗
A? A = A∗ A = A A .
345
(2) Per l’operatore A definito in (2) di esempi 9.1, studiare la decomposizione polare A = U P
e dimostrare che l’operatore U soddisfa
U ψn = ψn−1
se n ≥ 1 e {ψn }n∈N è la base hilbertiana di L2 (R, dx) definita in (2) di esempi 9.1.
(3) Considerare gli operatori A e A? definiti in (2) di esempi 9.1 e sia {ψn }n∈N la base hilbertiana
?
di L2 (R, dx) definita in quell’esempio. Calcolare eαA+αA ψn , con α ∈ C fissato.
9.6
I teoremi di Kato-Rellich e di Kato.
Gli ultimi teoremi che enunceremo e dimostreremo ora sono quello di Kato-Rellich e quello di
Kato. Tali teoremi risultano essere utilissimi nello studio delle proprietà di autoaggiunzione
e limitatezza inferiore degli operatori della Meccanica Quantistica (specialmente i cosiddetti
operatori hamiltoniani), nell’ambito della teoria delle perturbazioni. In effetti, il primo dei due
teoremi fissa delle condizioni generali sufficienti affinchè un operatore T + V , perturbazione di
T , sia autoaggiunto e con spettro limitato dal basso quando lo è T . Il secondo considera casi
specifici in cui T è l’operatore di Laplace in R3 o Rn .
9.6.1
Il teorema di Kato-Rellich.
Abbiamo bisogno di una definizione preliminare.
Definizione 9.8. Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti sullo
spazio di Hilbert H che verificano D(T ) ⊂ D(V ). Se esistono a, b ∈ [0, +∞) tali che
||V ϕ|| ≤ a||T ϕ|| + b||ϕ||
per ogni ϕ ∈ D(T ) ,
(9.108)
si dice che V è T -limitato. L’estremo inferiore dei valori a che verificano (9.108) per qualche
b è detto il limite relativo di V rispetto a T e, se esso risulta essere nullo, si dice che V
è infinitesimo rispetto a T .
Osservazioni.
(1) Se T è chiudibile, come segue immediatamente dalla definizione di core (definizione 5.6), per
provare che vale (9.108) è sufficiente mostrare che tale condizione è soddisfatta su un core di T .
(2) La condizione (9.108) è equivalente alla condizione:
||V ϕ||2 ≤ a21 ||T ϕ||2 + b21 ||ϕ||2
per ogni ϕ ∈ D(T ) ,
(9.109)
Infatti, se vale la (9.109) allora vale la (9.108) con a = a1 e b = b1 . Viceversa, se vale la (9.108)
allora vale la (9.109) con a21 = (1 + δ)a2 , b21 = (1 − δ −1 )b2 per ogni δ > 0.
Possiamo passare ad enunciare e provare il Teorema di Kato-Rellich. Ricordiamo che, per un
operatore autoaggiunto A : D(A) → H, vale σ(A) ⊂ [M, +∞) se e solo se (ψ|Aψ) ≥ M (ψ|ψ)
346
per ogni ψ ∈ D(A) per (a) in teorema 9.10. Conseguentemente l’enunciato (c) del teorema
può essere equivalentemente scritto in termini di limiti inferiori di forme quadratiche.
Teorema 9.12 (Kato-Relich). Siano T : D(T ) → H e V : D(V ) → H operatori densamente
definiti sullo spazio di Hilbert H che verificano:
(i) T è autoaggiunto,
(ii) V è simmetrico,
(iii) V è T -limitato con limite relativo a < 1.
Sotto tali ipotesi vale quanto segue.
(a) T + V è autoaggiunto su D(T ).
(b) T + V è essenzialmente autoaggiunto su ogni core di T .
(c) Se σ(T ) ⊂ [M, +∞) allora σ(T + V ) ⊂ [M 0 , +∞) con:
¨
«
b
0
M = M − max
, a|M | + b
con a e b che soddisfano (9.108).
(1 − a)
Prova. Per provare (a) cerchiamo di applicare il teorema 5.2, mostrando che, scegliendo D(T ) come dominio per l’operatore simmentrico T +V , risulta Ran(T +V ±iI) = H. In realtà proveremo
che esiste ν > 0 per cui Ran(T + V ± iνI) = H, che implica immediatamente l’affermazione
precedente per linearità . Se ϕ ∈ D(T ), nelle nostre ipotesi di T autoaggiunto deve valere
Ran(T + iµI) = H e anche:
||(T + iµI)ϕ||2 = ||T ϕ||2 + µ2 ||ϕ||2 .
Ponendo ϕ = (T + iµI)−1 ψ, si conclude che: ||T (T + iµI)−1 || ≤ 1 e ||(T + iµI)−1 || ≤ µ−1 .
Applicando (9.108) con ϕ = (T + iµI)−1 ψ concludiamo che:
‹

b
||ψ|| .
||V (T + iµI)−1 ψ|| ≤ a||T (T + iµI)−1 ψ|| + b||(T + iµI)−1 ψ|| ≤ a +
µ
Prendendo µ = ν abbastanza grande, l’operatore limitato definito su tutto H,
U := V (T + iνI)−1 ,
deve soddisfare ||U || < 1, dato che a < 1. Questo risultato implica che −1 6∈ σ(U ) per la teoria
del raggio spettrale. Tenendo conto di (a) teorema 8.1 (notando che U è chiuso essendo limitato)
avremo di conseguenza che Ran(I + U ) = H. D’altra parte, dato che T è autoaggiunto, deve
anche essere Ran(T + iνI) = H per il teorema 5.2. Conseguentemente, l’equazione:
(I + U )(T + iνI)ϕ = (T + V + iνI)ϕ con ϕ ∈ D(T )
implica che, come volevamo, Ran(T + V + iνI) = H. La prova per Ran(T + V − iνI) = H si
esegue del tutto similmente. La prova di (a) è conclusa.
Passiamo a provare (b). Da (9.108) segue che, se D ⊂ D(T ) è un core per T , allora:
Š
€
Š
€
D(T ) = D T D ⊂ D (T + V )D .
347
D’altra parte, per costruzione e tenendo conto che T +V è autoaggiunto su D(T ) per cui è chiuso:
€
Š
Š
€
D (T + V )D ⊂ D (T + V ) = D (T + V ) = D(T ) .
€
Š
Mettendo insieme le catene di inclusioni, si conclude che deve essere: D (T + V )D = D (T + V )
e quindi (T + V )D = T + V dato che T + V è chiuso. (T + V )D è allora essenzialmente autoaggiunto per la proposizione 5.3.
Per concludere, passiamo alla prova di (c). Per ipotesi, dal teorema spettrale σ(T ) ≥ M . Si
scelga s > −M (con s ∈ R). Di conseguenza σ(T + sI) > 0 e quindi 0 6∈ σ(T + sI). Dato che
T + sI è autoaggiunto è anche chiuso e allora, per (a) in teorema 8.1: Ran(T + sI) = H e le
stesse stime usate precedentemente mostrano che ||V (T + sI)−1 || < 1 se
¨
«
b
0
−s < M := M − max
, a|M | + b .
(1 − a)
Di conseguenza, per tali valori di s, Ran(T +V +sI) = H e (T +V +sI)−1 = (T +sI)−1 (I +U )−1
che implica −s ∈ ρ(T + V ), e quindi −s 6∈ σ(T + V ). Dato che T + V è autoaggiunto ed ha
quindi spettro reale, questo significa che σ(T + V ) ≥ M 0 . 2
9.6.2
Un esempio: l’operatore −∆ + V ed il teorema di Kato.
La condizione (9.108) nasce naturalmente in certi contesti e risulta essere di grande utilità nelle
applicazioni, in fisica, allo studio dell’equazione di Schrödinger in cui appare l’operatore di Laplace ∆ perturbato tramite un potenziale V . Per discutere tale esempio di applicazione del
teorema di Kato-Relich, premettiamo la seguente proposizione ed un successivo lemma.
Proposizione 9.9. Sia
∆ :=
n
X
∂2
i=1
∂x2i
(9.110)
l’operatore di Laplace su Rn pensato come operatore su L2 (Rn , dx), valgono i fatti seguenti.
b : L2 (Rn , dx) → L2 (Rn , dk) indica l’operatore unitario di Fourier-Plancherel (vedi
(a) Se F
n )) ed ammette
b
sezione 3.6), ∆ è essenzialmente autoaggiunto su S(Rn ), su D(Rn ) e su F(D(R
la stessa (unica) estensione autoaggiunta ∆.
(b) Vale:
€
Š
b F
b −1 f (k) := −k 2 f (k) ,
F∆
(9.111)
dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
Z
§
ª
4
2
b −1 ) = f ∈ L2 (Rn , dk) b F
D(F∆
k
|f
(k)|
dk
<
+∞
.
Rn
(c) Vale il limite dal basso per −∆ = −∆:
σ(−∆) ⊂ [0, +∞)
che equivale a (ψ|−∆ψ) ≥ (ψ|ψ) per ogni ψ ∈ D(−∆).
348
(9.112)
Prova. (a) e (b) sono stati provati in (4) e (5) in esercizi 5.2, eccetto il fatto che ∆ sia essenzialn )) e determini la stessa estensione autoaggiunta ottenuta partenb
mente autoaggiunto su F(D(R
n )), D(Rn ) ⊂ S(Rn ) e quindi le
b
do da D(Rn ) e S(Rn ). A tal fine si noti prima di tutto che F(D(R
tre estensioni autoaggiunte devono coincidere per l’unicità dell’estensione autoaggiunta di operan )),
b
tori essenzialmente autoaggiunti. Il fatto che che ∆ sia esenzialmente autoaggiunto su F(D(R
b e la (9.111), è equivalente all’essenziale autoaggiunzione di dell’operatore
vista l’unitarietà di F
simmetrico moltiplicativo per −k 2 su D(Rn ). La validità di tale proprietà segue subito dall’osservazione che tutti gli elementi ϕ = ϕ(k) di D(Rn ) sono vettori analitici dell’operatore moltiplicativo per −k 2 come si verifica direttamente, valendo || − (k 2 )n ϕ|| ≤ ||ϕ||(supk∈suppϕ |k|2 )n , e
quindi tenendo conto del teorema 5.8 di Nelson. (c) segue immediatamente da (b) e da (a) in
teorema 9.10. 2
Passiamo al seguente fondamentale classico lemma.
Lemma 9.2. Se n = 1, 2, 3 è fissato, si consideri f ∈ L2 (Rn , dx) ∩ D(∆). In tal caso f coincide,
a meno di insiemi di misura nulla, con una funzione continua e limitata e, per ogni a > 0, esiste
b > 0 indipendente da f tale che:
||f ||∞ ≤ a||∆f || + b||f || .
(9.113)
b . Da (a) in proposizione 3.12 e dal teorema di Plancherel (teorema
Prova. Nel seguito fˆ := Ff
3.10), la tesi è provata se si riesce a dimostrare che fˆ ∈ L1 (R3 , dk) e che, per ogni fissato a > 0,
esiste b ∈ R con:
||fˆ||1 ≤ a||k 2 fˆ||2 + b||fˆ||2 .
(9.114)
Eseguiamo la dimostrazione di (9.114) nel caso n = 3, gli altri due casi sono analoghi. Se f ∈
b F
b −1 ) e quindi (1 + k 2 )fˆ ∈ L2 (R3 , dk). Dato
D(∆) allora, in base alla proposizione 5.8, fˆ ∈ D(F∆
2
che (k1 , k2 , k3 ) 7→ 1/(1 + k ) appartiene allo stesso spazio di Hilbert, segue che fˆ ∈ L1 (R3 , dk)
per la disuguaglianza di Cauchy-Schwarz e ancora:
||fˆ||1 ≤ c||(1 + k 2 )fˆ||2 ≤ c(||k 2 fˆ||2 + ||fˆ||2 )
(9.115)
dove: c := (1 + k 2 )−1 dk. Se r > 0, definiamo fˆr (k) := r3 fˆ(rk). Con tale definizione risulta:
||fˆr ||1 = ||fˆ||1 , ||fˆr ||2 = r3/2 ||fˆ||2 e ||k 2 fˆr ||2 = r−1/2 ||k 2 fˆ||2 . Usando (9.115) per fˆr e tenendo
conto delle tre identità trovate, si ottiene:
R
||fˆ||1 ≤ cr−1/2 ||k 2 fˆ||2 + cr3/2 ||fˆ||2
per ogni r > 0.
Scegliendo r opportunamente si trova cr−1/2 = a e quindi (9.114) risulta essere verificata. 2
Osservazione. Il lemma precedente si può generalizzare (vedi il vol. II di [ReSi80]) con la
seguente proposizione basata sulla disuguaglianza di Young.
349
Sia f ∈ L2 (Rn , dx) con f ∈ D(∆). Se n ≥ 4 e 2 ≤ q < 2n/(n − 4), allora f ∈ Lq (Rn , dk)
e, per ogni a > 0, esiste b ∈ R indipendente da f (ma dipendente da q, n e a) tale che
||f ||q ≤ a||∆f || + b||f ||.
Possiamo ora applicare il teorema di Kato-Rellich ad un caso particolare di grande interesse in
Meccanica Quantistica, provando un primo teorema dovuto a Kato. Successivamente vedremo
un teorema più generale, sempre dovuto a Kato, che include il seguente teorema come caso particolare.
Teorema 9.13 (Essenziale autoaggiunzione di −∆ + V ). Sia n = 1, 2, 3 fissato. Si supponga che V = V2 + V∞ con V0 ∈ L2 (Rn , dx) e V∞ ∈ L∞ (Rn , dx) funzioni a valori reali. Vale
quanto segue.
(a) −∆ + V è essenzialmente autoaggiunto su D(Rn ) e su S(Rn ).
(b) L’unica estensione autoaggiunta −∆ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −∆ + V definito su D(∆).
(c) σ(−∆ + V ) è limitato dal basso.
Prova. Dato che V è reale, esso individua un operatore moltiplicativo autoaggiunto sul dominio
D(V ) := {ϕ ∈ L2 (Rn , dx) | V ϕ ∈ L2 (Rn , dx)} .
Per costruzione si ha anche, se ϕ ∈ D(Rn ) oppure ϕ ∈ S(Rn ):
||V ϕ||2 ≤ ||V2 ||2 ||ϕ||∞ + ||V∞ ||∞ ||ϕ||2 < +∞
(9.116)
quindi D(Rn ) ⊂ S(Rn ) ⊂ D(V ). Ulterioremente, dato che S(Rn ) ⊂ D(∆) (per la proposizione
9.9), usando (9.113) in nel lemma 9.2 (essendo n ≤ 3), troviamo allora che, per ogni a > 0, esiste
un corrispondente b > 0 tale che:
||V ϕ||2 ≤ a||V2 ||2 || − ∆ϕ||2 + (b + ||V∞ ||∞ )||ϕ||2
per ogni ϕ ∈ S(Rn ) .
In altre parole, se a0 > 0, esiste un corrispondente b0 > 0 tale che:
||V ϕ||2 ≤ a0 || − ∆ϕ||2 + b0 ||ϕ||2
per ogni ϕ ∈ S(Rn )
(9.117)
e quindi, in particolare, anche per ogni ϕ ∈ D(Rn ). Di conseguenza vale anche:
||V ϕ − V ϕ0 ||2 ≤ a0 ||(−∆ϕ) − (−∆ϕ0 )||2 + b0 ||ϕ − ϕ0 ||2
per ϕ e ϕ0 in S(Rn ). Usando il fatto che V è chiuso perchè autoaggiunto e che S(Rn ) è un core
per l’operatore autoaggiunto (e quindi chiuso) −∆ (per la proposizione 9.9), la disuguaglianza
appena scritta mostra che D(V ) ⊃ D(−∆). Usando ancora la chiusura degli operatori, si
conclude infine che la (9.117) vale su tutto il dominio di −∆:
||V ϕ||2 ≤ a0 ||−∆ϕ||2 + b0 ||ϕ||2
350
per ogni ϕ ∈ D(−∆).
Se scegliamo a0 < 1 abbiamo che tutte le ipotesi del teorema 9.12 di Kato-Rellich sono soddisfatte per T := −∆ con V come nelle ipotesi di questo teorema. La tesi segue immediatamente
dalla tesi del teorema di Kato-Rellich usando anche il fatto che S(Rn ) e D(Rn ) sono core per
−∆ per la proposizione 9.9. 2
Osservazione. Tenendo conto dell’osservazione precedente, il teorema si generalizza al casi n > 3, con un’analoga dimostrazione, modificando la richiesta su V in V = Vp + V∞ con
Vp ∈ Lp (Rn , dx) e V∞ ∈ L∞ (Rn , dx) dove p > 2 se n = 4 e p = n/2 se n ≥ 5.
Passiamo al classico Teorema di Kato. Nel seguito f ∈ Lp (Rn , dx)+Lq (Rn , dx) si deve intepretare
nel senso che la funzione f è la somma di un elemento in Lp (Rn , dx) e un elemento in Lq (Rn , dx).
Teorema 9.14 (Teorema di Kato). Sia n = 1, 2, 3 fissato. Si indichino con (y1 , . . . , yN ) gli
elementi di RnN , dove yk ∈ Rn per ogni k = 1, . . . , N . Se ∆ denota il laplaciano (9.110) su
RnN , si consideri l’operatore differenziale −∆+V , dove V è l’operatore moltiplicativo individuato
dalla funzione:
V (y1 , . . . , yN ) :=
N
X
Vk (yk ) +
N
X
Vij (yi − yj ) .
(9.118)
i,j=1 i<j
k=1
dove
{Vk }k=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx) , {Vij }i<j i,j=1,...,N ⊂ L2 (Rn , dx) + L∞ (Rn , dx)
sono due classi di funzioni a valori reali. Vale quanto segue.
(a) −∆ + V è essenzialmente autoaggiunto su D(RnN ) e su S(RnN ).
(b) L’unica estensione autoaggiunta −∆ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −∆ + V definito su D(−∆).
(c) σ(−∆ + V ) è limitato dal basso.
Prova. Eseguiamo la prova per n = 3, negli altri casi la dimostrazione è identica. Consideriamo il
potenziale V12 (y1 −y2 ) e indichiamo con ∆1 il laplaciano corrispondente alle sole tre coordinate di
y1 . Sia ϕ ∈ S(R3N ). Fissiamo y2 , . . . yN ∈ R3(N −1) e definiamo la funzione: R3 3 y1 7→ ϕ0 (y1 ) :=
ϕ(y1 , y2 , . . . , yN ). ϕ0 è in D(R3N ) oppure in S(R3N ) a seconda che, rispettivamente, ϕ ∈ D(R3N )
0 (y ) := V (y − y ). Procedendo
oppure ϕ ∈ S(R3N ). Definiamo analogamente: R3 3 y1 7→ V12
1
12 1
2
esattamente come nella prova del teorema precedente, decomponendo V12 = (V12 )2 + (V12 )∞ , si
arriva a scrivere, per ogni scelta di a > 0, la stima valida per ogni y2 , . . . , yN :
0 0
||V12
ϕ ||L2 (R3 ) ≤ a||(V12 )2 ||L2 (R3 ) || − ∆1 ϕ0 ||L2 (R3 ) + (b + ||(V12 )∞ ||L∞ (R3 ) )||ϕ0 ||2
dove b > 0 dipende da a, ma non dipende dai valori y2 , . . . yN ∈ R3(N −1) . Le norme sono riferite
agli spazi sul primo fattore R3 di R3N ed è fondamentale notare che, a causa dell’invarianza per
traslazioni di (y1 , y2 ) 7→ V12 (y1 − y2 ), le norme ||(V12 )k ||Lk (R3 ) non dipendono dalla variabile y2 .
Per quanto osservato nelle osservazioni sotto la definizione 9.8, questa disuguaglianza equivale a
0 0 2
||V12
ϕ ||L2 (R3 ) ≤ a0 || − ∆1 ϕ0 ||2L2 (R3 ) + b0 ||ϕ0 ||2L2 (R3 )
351
per opportuni numeri, a0 , b0 > 0 con a0 che può essere reso arbitrarimente piccolo dato che
ciò è possibile per a||V12 ||2 . Se integriamo la disuguaglianza trovata nelle variabili y2 , . . . yN ∈
R3(N −1) otteniamo che, per ogni a0 > 0 esiste un corrispondente b0 > 0 tale che:
||V12 ϕ||2L2 (R3N ) ≤ a0 || − ∆1 ϕ||2L2 (R3N ) + b0 ||ϕ||2L2 (R3N ) .
(9.119)
Si osservi ora che, passando in trasformata di Fourier-Plancherel su R3N
|| − ∆1 ϕ||2L2 (R3N ) =
≤
Z
R3N
Z
R3N
2
X
3 2
2
b
k
r |(Fϕ)(k1 , . . . , k3N )| dk1 · · · dkL2 (R3 N )
r=1 2
X
3N 2 2
2
b
k
r |(Fϕ)(k1 , . . . , k3N )| dk1 · · · dk3N = || − ∆ϕ||L2 (R3N ) .
r=1 Sostituendo in (9.119), concludiamo che, se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni a > 0, esiste
un corrispondente b12 > 0 tale che:
||V12 ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + b12 ||ϕ||2L2 (R3N ) .
La stesso risultato si ottiene per gli altri termini Vij e per i potenziali Vk per i quali la dimostrazione si esegue nello stesso modo, ma risulta essere ancora più semplice. Se ϕ ∈ D(R3N ) oppure
S(R3N ), per ogni scelta di a > 0, esiste un corrispondente scelta di numeri bi > 0, bij > 0 con
i, j = 1, . . . , N , j > i tale che:
||Vi ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + bi ||ϕ||2L2 (R3N )
i = 1, . . . , N .
||Vij ϕ||2L2 (R3N ) ≤ a || − ∆ϕ||2L2 (R3N ) + bij ||ϕ||2L2 (R3N )
i, j = 1, . . . , N , j > i.
(9.120)
(9.121)
In ogni spazio vettoriale con prodotto scalare hermitiano, la disuguaglianza di Cauchy-Schwartz
implica:
X
2
M
ψr ≤
r=1 M
X
!2
||ψr ||
.
r=1
Tenendo conto che i potenziali Vk e Vij sono in tutto N + N (N − 1)/2 = N (N + 1)/2, la
disuguaglianza menzionata e le (9.120)-(9.121) implicano che:
Ž 2
„
Œ2
‚
Œ2
‚
X
N
X
N
N (N + 1)
N (N + 1)
2
a||−∆ϕ||L2 (R3N ) +
b||ϕ||2L2 (R3N )
Vk +
Vij ϕ
≤
2
2
k=1
i,j=1 i<j
L2 (R3N )
dove b è il massimo nell’insieme di tutti i bk e bij . Per quanto osservato nelle osservazioni sotto
la definizione 9.8, il risultato trovato può essere equivalentemente enunciato come segue. Per
ogni a0 > 0 esiste un b0 > 0 tale che:
||V ϕ|| ≤ a0 || − ∆ϕ|| + b0 ||ϕ|| per ogni ϕ ∈ S(R3N ).
352
Da questo punto in poi la dimostrazione procede esattamente come quella del teorema 9.13 a
partire dall’equazione (9.117) rimpiazzando ovunque Rn con R3N . 2
Per concludere citiamo senza dimostrazione completa un ulteriore importante teorema dovuto
a Kato che richiede ipotesi differenti (e più deboli nel caso n = 3 rispetto a quelle nel teorema 9.13) sulle funzioni V affinché −∆ + V risulti essere essenzialmente autoaggiunto su D(Rn ).
Ricordiamo che f : Rn → C è detta essere localmente a quadrato integrabile se f · g è in
L2 (Rn , dx) per ogni g ∈ D(Rn ).
Teorema 9.15. L’operatore −∆ + V∆ + VC in L2 (Rn , dx) è essenzialmente autoaggiunto sul
dominio D(Rn ) e la sua unica estensione autoaggiunta −∆ + V∆ + VC è limitata dal basso, se
valgono le seguenti ipotesi.
(i) V∆ : Rn → R è una funzione misurabile che individua un operatore moltiplicativo (−∆)limitato con limite relativo a < 1 (nel senso del definizione 9.8).
(ii) VC : Rn → R è una funzione localmente a quadrato integrabile con VC ≥ C quasi ovunque
per qualche C ∈ R.
Le ipotesi (i) sulla funzione misurabile V∆ sono soddisfatte se V∆ ∈ Lp (Rn , dx) + L∞ (Rn , dx)
con p = 2 se n ≤ 3, p > 2 se n = 4 e p = n/2 se n ≥ 5.
Traccia di dimostrazione. L’ultima affermazione della tesi è dimostrata nella prova del teorema
9.13 nel caso n ≤ 3. La dimostrazione è analoga per n > 4 in virtù dell’osservazione sotto il
lemma 9.2. Se vale (i), −∆ + V∆ è essenzialmente autoaggiunto su D(Rn ) e −∆ + V∆ è limitato
dal basso per il teorema di Kato-Rellich. Se vale anche (ii), −∆+V∆ +(VC −C) è essenzialmente
autoaggiunto su D(Rn ) per il teorema X.29 in vol.II di [ReSi80], essendo Vc − C ≥ 0. Conseguentemente anche −∆ + V∆ + VC = (−∆ + V∆ + (VC − C)) + CI è essenzialmente autoaggiunto su D(Rn ). Dato che −∆ + V∆ e VC sono entrambi limitati dal basso su tale dominio, lo
è −∆ + V∆ + VC e lo è anche la sua unica estensione autoaggiunta −∆ + V∆ + VC . 2
Esempi 9.3.
(1) Un caso fisicamente interessante su R3 è quello in cui la perturbazione è il potenziale coulombiano attrattivo:
eQ
V (x) =
,
|x|
È
dove e < 0 e Q > 0 sono costanti e e |x| := x21 + x22 + x23 . In questo caso le ipotesi del teorema
9.14 (o 9.13) di Kato sono verificate come si prova subito (m, ~ > 0 sono costanti che non creano
alcun problema nell’applicare il teorema precedente, dato che si può moltiplicare l’operatore per
2m/~2 prima di applicare il teorema senza perdere generalità ). Dunque l’operatore
H0 := −
~2
∆ + V (x)
2m
risulta essere essenzialmente autoaggiunto se, indifferentemente, è definito su D(R3 ) oppure
S(R3 ). L’unica estensione autoaggiunta H0 , se Q = −e, corrisponde all’hamiltoniano di un
353
elettrone nel campo elettrico di un protone (trascurando gli effetti dovuti allo spin e considerando il protone come un oggetto classico). Abbiamo in questo modo la più semplice descrizione
quantistica dell’operatore hamiltoniano dell’atomo di idrogeno. In questo caso −e è il valore
assoluto comune della carica dell’elettrone e del protone. m è la massa dell’elettrone. Infine
~ > 0 è la costante di Planck divisa per 2π. Lo spettro dell’unica estensione autoaggiunta di
tale operatore individua, dal punto di vista fisico, i valori dell’energia totale ammessi per tale sistema. Un risultato importante è che, malgrado V non sia limitato dal basso, lo spettro
dell’operatore considerato lo è in ogni caso e, conseguentemente, lo sono i valori dell’energia fisicamente permessi. Nei capitoli 10, 11 e 12 eseminaremo meglio il significato fisico degli operatori
qui rapidamente descritti.
(2) Un secondo caso fisicamente interessante, sempre in R3 , è quello individuato dal potenziale
di Yukawa:
−e−µ|x|
V (x) =
,
|x|
2
~
dove µ > 0 è ancora una costante positiva. Anche in questo caso l’operatore H0 = − 2m
∆ + V (x)
3
risulta essere essenzialmente autoaggiunto se, indifferentemente, definito su D(R ) oppure S(R3 ),
come segue dal teorema 9.14 (o 9.13) di Kato. Il potenziale di Yukawa descrive, in prima approssimazione, processi d’interazione tra un pione ed una sorgente di forza forte pensata, in questa
approssimazione, come dovuta ad una sorgente macroscopica.
(3) Il terzo caso fisicamente importante è dato dall’hamiltoniano di un sistema di N particelle
di vettori posizione xi ∈ R3 , masse mi > 0 e cariche ei ∈ R \ {0} (i = 1, . . . , N ), che interagiscono con un potenziale coulombiano esterno e con potenziali coulombiani di coppia (non
necessariamente attrattivi). In questo caso l’operatore completo è :
H0 :=
N
X
i=1
−
N
N
X
~2
ei ej
Qi ei X
+
,
∆i +
2mi
|xi |
|xi − xj |
i<j
i=1
dove ∆i è l’operatore di Laplace riferito alle sole 3 coordinate di xi . Per applicare il teorema
~2
davanti agli operatori ∆i . Si ottiene questo
di Kato è necessario eliminare tutti i fattori 2m
i
√
i
risultato semplicemente cambiando coordinate ed usando le nuove coordinate yi := 2m
~ xi . In
tal modo la prima delle tre somme di sopra produce il laplaciano su R3N riferito alle 3N componenti di tutti gli N vettori yi . Si vede facilmente che la perturbazione V (y1 , . . . , yN ) soddisfa
le ipotesi del teorema 9.14 di Kato e quindi l’operatore H0 sopra definito è essenzialmente autoaggiunto su D(R3N ) e la sua unica estensione autoaggiunta è limitata dal basso.
(4) Il teorema 9.15 permette di affermare che, aggiungendo una qualsiasi funzione V 0 reale
localmente integrabile e limitata dal basso agli operatori hamiltoniani H0 visti negli esempi precedenti, si ottiene ancora un operatore essenzialmente autoaggiunto sul corrispondente
D(Rn ). Un esempio importante è il potenziale armonico (generalmente non isotropo) V 0 (x) =
kx21 + k2 x2 + k3 x23 con k1 , k2 , k3 ≥ 0.
354
Capitolo 10
La formulazione matematica della
Meccanica Quantistica non
relativistica.
In questo capitolo daremo gli assiomi della Meccanica Quantistica per il sistema elementare
costituito da un particella non relativistica senza spin e discuteremo alcuni importanti risultati
connessi alle relazione di commutazione canonica.
Dopo avere riassunto, qui di seguito, i primi 4 assiomi generali formulati nel capitolo 7, nella prima sezione aggiungeremo un assioma relativo alla formalizzazione della teoria quantistica della
particella senza spin. In particolare introdurremo le relazioni di commutazione canonica (CCR)
e proveremo che non sono implementabili per mezzo di operatori limitati. Mostreremo infine
come il principio di Indeterminazione di Heisenberg risulti essere una teorema nella formulazione
presentata.
La sezione successiva è dedicata al celebre teorema di Stone-von Neumann, completato da Mackey, e relativo alla caratterizzazione delle rappresentazioni unitarie continue delle CCR. Per
enunciare e provare il teorema introdurremo la nozione di ∗-algebra di Weyl, discutendone le
più importanti proprietà . Riformuleremo infine i teoremi detti in termini di gruppo di Heisenberg. Nell’ultima sezione discuteremo, molto brevemente il principio di corrispondenza di
Dirac.
Nel capitolo 7 abbiamo dato gli assiomi generali della Meccanica Quantistica. Riepiloghiamo
parte del contenuto di quel capitolo alla luce della teoria spettrale sviluppata successivamente.
Le proposizioni valide su un sistema quantistico sono formalizzate tramite proiettori ortogonali
su uno spazio di Hilbert.
A1. Le proposizioni riguardanti un sistema quantistico S in corrispondenza biunivoca con (un
sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali
di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato ad
S. Inoltre:
355
(1) La compatibilità tra proposizioni corrisponde alla commutativià dei rispettivamente associati
proiettori ortogonali;
(2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione
P ≤ Q per i proiettori associati;
(3) I (operatore identità) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione
sempre vera ed a quella sempre falsa;
(4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ;
(5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno
senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q;
(6) se {Qn }n∈N è un insieme numerabile di proposizioni a due a due compatibili, hanno senso
fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn .
Gli stati su un sistema quantistico sono quindi rappresentati come operatori positivi di classe
traccia con traccia unitaria.
A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , è
un operatore positivo di classe traccia con traccia unitaria su HS .
La probabilità che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ).
Abbiamo visto che gli stati ρ sono combinazioni lineari convesse anche infinite (in tal caso la
convergenza è nella topologia operatoriale uniforme) di stati estremali dell’insieme convesso
S(HS ) di tutti gli stati. Gli stati estremali sono stati denominati stati puri e sono tutti del
tipo ρ = ψ(ψ|·) con ψ ∈ HS tale che ||ψ|| = 1. Lo spazio degli stati puri è in corrispondenza
biunivoca con lo spazio dei raggi di HS , cioé l’insieme HS / ∼ da cui si elimina la classe [0], dove
la relazione di equivalenza ∼ è definita da φ ∼ φ0 s.se φ = aφ0 per qualche a ∈ C \ {0}. Gli
stati non puri sono anche chiamati stati misti o miscele e gli operatori di classe traccia ad
essi associati sono spesso chiamati in letteratura operatori statistici o anche matrici densità.
Il processo di cambiamento di stato è descritto con una opportuna procedura di proiezione.
A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione
P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato
del sistema immediatamente dopo la misura è
ρP :=
P ρP
.
tr(ρP )
In particolare se ρ è puro ed è individuato dal vettore ψ ∈ HS con ||ψ|| = 1, lo stato del sistema
immediatamente dopo la misura è ancora puro ed è individuato dal vettore:
ψP =
Pψ
.
||P ψ||
356
Una nozione fisicamente importante anche dal punto di vista storico è quella di ampiezza di
transizione o di probabilità dello stato puro individuato dal vettore unitario φ sullo stato
puro individuato dal vettore unitario ψ: (ψ|φ). Il modulo quadrato di essa rappresenta la probabilità che, essendo il sistema nello stato φ, passi allo stato ψ in seguito a processo di misura.
Si osservi che possiamo scambiare il ruolo dei due stati per le proprietà del prodotto scalare
hermitiano.
Successivamente abbiamo definito le osservabili come misure a valori di proiezione (dette anche
misure spettrali) su R.
A4. Ogni osservabile A sul sistema quantistico S è descritta da una misura a valori di proiezione
su R, P (A) , nello spazio di Hilbert del sistema HS , in modo tale che, se E è un boreliano di R, il
proiettore P (A) (E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”.
Il teorema spettrale per operatori autoaggiunti generalmente non limitati, enunciato e provato
nella versione più generale nel capitolo 9, consente associare univocamente ad ogni osservabile
un operatore autoaggiunto definito sullo spazio di Hilbert del sistema fisico. In questo senso, se
HS è lo spazio di Hilbert di un sistema fisico, lo spettro σ(A) ⊂ R di un’osservabile A, cioé un
operatore autoaggiunto A : D(A) → HS , contiene tutti i valori possibili che si possono ottenere
misurando l’osservabile A. Dal punto di vista matematico, σ(A) coincide con il supporto della
misura a valori di proiezione P (A) associata all’osservabile.
Una nozione fisicamente importante è quella di osservabili compatibili:
Definizione 10.1. Sia S un sistema quantistico descritto sullo spazio di Hilbert HS . Due
osservabili A e B per S si dicono compatibili se le misure spettrali P (A) e P (B) degli operatori
autoaggiunti rispettivamente associati a A e B commutano, ossia
P (A) (E)P (B) (E) = P (B) (E)P (A) (E) ,
per ogni boreliano E ⊂ R.
Due osservabili non compatibili sono dette incompatibili.
Si osservi che, dal punto di vista fisico, la compatibilità tra osservabili equivale al fatto che
possono essere misurate contemporaneamente (in armonia con l’assioma A1 e con il significato
delle misure spettrali associate ad osservabili).
Osservazione. In taluni testi di fisica si trova scritto che due osservabili sono compatibili (nel
senso scritto sopra) se gli operatori autoaggiunti associati commutano. Questo è erroneo, perché
è facile trovare controesempi lavorando con operatori autoaggiunti non limitati, che sono i più
frequenti in meccanica quantistica. Una condizione per controllare se due osservabili A e B sono
compatibili è data dal teorema 9.6. Per la compatibilità è necessario e sufficiente che, per ogni
t ∈ R valga l’identità:
eitA eisB = eisB eitA .
La proposizione 7.9 permette di associare ad ogni coppia osservabile - stato A, ρ una misura di
(A) (E)) (che coincide con (ψ|P (A) (E)ψ) nel caso di stato puro
probabilità su R, µA
ρ : E 7→ tr(ρP
357
individuato dal vettore ψ ∈ H con norma unitaria) dove E ⊂ R è un boreliano arbitrario di R.
Per costruzione il supporto di tale misura è incluso nello spettro di A. Dato che per definizione
µA
ρ (E) coincide con la probabilità che il valore della misura di A cada in E (cioé la probabilità
che P (A) (E) sia una proposizione vera quando la valuto sullo stato ρ), ha quindi senso definire
il valore medio e lo scarto quadratico medio dell’osservabile A nello stato ρ come segue.
Definizione 10.2. Sia A un’osservabile per il sistema fisico S descritto nello spazio di Hilbert
(A)
HS , sia ρ ∈ S(HS ) uno stato del sistema S e sia µρ la misura di probabilità associata a ρ e
A come precisato sopra. Il valore medio e lo scarto quadratico medio dell’osservabile A
nello stato ρ sono definiti, rispettivamente da:
hAiρ :=
ÊZ
Z
λ dµ(A)
ρ (λ) ,
(A)
λ2 dµρ (λ) − hAi2ρ ,
∆Aρ :=
(10.1)
R
(10.2)
R
e tali definizioni hanno senso nei casi in cui, rispettivamente, la funzione R 3 λ 7→ λ e le fun(A)
zioni R 3 λ 7→ λk con k = 1, 2 sono in L1 (R, µρ ).
Si noti che ∆Aρ è reale (non negativa) in virtù della disuguaglianza di Cauchy-Schwartz. Se le
richieste finali nella definizione 10.1 non sono soddisfatte, semplicemente, il valor medio di A
e/o il suo scarto quadratico medio non sono definibili sullo stato ρ.
Vale il seguente risultato di dimostrazione immediata da (v) di teorema 9.1, dalla (9.41), e tenendo conto del fatto che tr(ρP (A) (E)) = (ψ|P (A) (E)ψ) se ρ = ψ(ψ|·) con ||ψ|| = 1 e delle
proprietà di linearità della traccia.
Proposizione 10.1. Sia A è un’osservabile per il sistema fisico S descritto nello spazio di
Hilbert HS .
(a) Sia ψ ∈ HS normalizzato a 1 in modo da individuare uno stato puro che indichiamo ancora con ψ. Se ψ ∈ D(A) e, rispettivamente ψ ∈ D(A2 ), allora esistono hAiψ e ∆Aψ e vale
rispettivamente:
hAiψ = (ψ|Aψ) ,
∆A2ψ
(10.3)
= (ψ|A ψ) − hAiψ = ψ (A − hAiψ I)2 ψ .
2
2
(10.4)
(b) Sia ρ ∈ S(HS ) con rango di dimensione finita generato da vettori φi che soddisfano φi ∈
D(A) e, rispettivamente φi ∈ D(A2 ), allora valgono rispettivamente:
hAiρ = tr(ρA) ,
∆A2ρ
2
(10.5)
2
= tr(ρA ) − hAiρ .
(10.6)
(10.5) e (10.6) valgono entrambe anche se non si fanno ipotesi sul rango di ρ, ma l’osservabile
A ha rango di dimensione finita.
358
Bisogna specificare che le ipotesi in (b) non sono le uniche nelle quali valgono (10.5) e (10.6).
In ogni caso queste ultime non sono le definizioni di media e scarto quadratico medio, che invece sono date, in tutta generalità dalle (10.1) e (10.2), indipendentemente dalla proposizione 10.1.
Per proseguire ulteriormente nella formulazione matematica della Meccanica Quantistica dobbiamo fornire ulteriori assiomi che riguardano sistemi elementari particolari. Tali sistemi corrispondono alle particelle della teoria non relativistica. In altre parole il gruppo di trasformazioni
sotto il quale la teoria è invariante è il gruppo di Galilei e non quello di Poincaré. Torneremo più
avanti su questo punto. Dal punto di vista fisico, questa descrizione è una descrizione adeguata
fino a quando le velocità in gioco non sono dell’ordine della velocità della luce (circa 300.000
km/sec). È importante sottolineare che, comunque, alcune nozioni matematiche (algebra di
Weyl) introdotte in questa descrizione non relativistica hanno validità molto più generale, anche
in regime relativistico, nella formulazione della teoria quantistica dei campi della quale non ci
occuperemo.
Con i sistemi elementari si costituiscono quelli complessi tramite una composizione basata sulla
nozione di prodotto tensoriale di spazi di Hilbert, come vedremo più avanti studiando i sistemi
composti.
10.1
Sistemi elementari non relativistici: particella a spin 0.
Il più semplice sistema elementare in Meccanica Quantistica non relativistica è una particella
quantistica di massa m > 0 con spin 0. Per essa vale il seguente assioma.
A5. Considerando un riferimento inerziale I relativo a coordinate cartesiane ortonormali x1 , x2 , x3 ,
lo spazio di Hilbert di una particella non relativistica con spin 0 e massa m > 0 è individuato
da:
(a) lo spazio di Hilbert del sistema H = L2 (R3 , dx) essendo R3 identificato con lo spazio di quiete
di I con coordinate canoniche identificate con x1 , x2 , x3 e dx l’ordinaria misura di Lebesgue su
R3 ;
(b) le osservabili associate alle coordinate x1 , x2 , x3 della particella sono rispettivamente date
dagli operatori autoaggiunti, detti operatori posizione,
(Xi ψ)(x1 , x2 , x3 ) = xi ψ(x1 , x2 , x3 ) ,
(10.7)
per i = 1, 2, 3 con domini
§
D(Xi ) := ψ ∈ L2 (R3 , d3 x)
Z
R3
|xi ψ(x1 , x2 , x3 )|2 dx < +∞
ª
;
(c) le osservabili associate alle componenti dell’impulso della particella rispetto a I, p1 , p2 , p3 ,
sono rispettivamente date dagli operatori autoaggiunti detti operatori impulso,
Pk = −i~
359
∂
,
∂xk
(10.8)
per k = 1, 2, 3, dove l’operatore a secondo membro è la chiusura dell’operatore differenziale
essenzialmente autoaggiunto:
−i~
∂
: S(R3 ) → L2 (R3 , dx)
∂xi
e S(R3 )spazio di Schwartz su Rn è lo spazio di Schwartz su R3 (cfr sezione 3.6).
Ricordiamo che in letteratura fisica i vettori (normalizzati a 1) di L2 (R3 , dx) associato ad una
particella sono detti funzioni d’onda della particella. Le funzioni d’onda determinano (non in
modo biunivoco a causa dell’arbitrarietà nello scegliere un fattore numerico) gli stati puri della
particella.
Osservazioni.
(1) La discussione fatta nella sezione 5.3 prova che si arriva alle stesse definizioni di sopra definendo gli operatori Xi sostituendo la condizione ψ ∈ L2 (R3 , dx) con ψ ∈ D(R3 ) (cfr sezione
3.6). Lo stesso risultato si ottiene con la condizione ψ ∈ S(R3 ) nella definizione del dominio
di tali operatori. In entrambi i casi si deve prendere, alla fine, l’unica estensione autoaggiunta
dell’operatore definito su D(R3 ) oppure S(R3 ).
(2) La definizione di Pi può essere equivalentemente data come (vedi definizione 5.9, la proposizione 5.5 e la discussione successiva)
(Pi f )(x) = −i~wcon dominio:
n
∂
f (x) ,
∂xi
∂
D(Pi ) := f ∈ L2 (R3 , dx) esiste w- ∂x
f ∈ L2 (R3 , dx)
i
o
.
∂
dove w- ∂x
indica la derivata in senso debole. La discussione fatta nella sezione 5.3 prova anche
i
che la definizione di Pi (vedi proposizione 5.5) può essere data equivalentemente sostituendo lo
spazio di Schwartz con D(R3 ) e prendendo l’unica estensione autoaggiunta dell’operatore cosı̀
definito che risulta ancora essere essenzialmente autoaggiunto.
(3) Ricordiamo infine che, per la proposizione 5.6, se Ki denota l’operatore posizione rispetto
alla coordinata i-esima nello spazio di arrivo della trasformata di Fourier-Plancherel (cfr sezione
b : L2 (R3 , dx) → L2 (R3 , dk), vale:
3.6) F
b −1 K F̂ .
Pi = ~ F
i
Questa proprietà può essere usata come un’ulteriore definizione alternativa, ma equivalente,
dell’operatore impulso.
(4) Dalla discussione nella sezione 9.14, sappiamo che:
σ(Xi ) = σc (Xi ) = R ,
σ(Pi ) = σc (Pi ) = R
360
per i = 1, 2, 3.
(10.9)
10.1.1
le Relazioni di Commutazione Canonica (CCR) e non implementabilità con operatori limitati.
La definizione degli operatori posizione ed impulso è tale che, malgrado i domini delle 6 osservabili siano differenti, esistono comunque sottospazi H0 ⊂ L2 (R3 , dx) invarianti per tutte queste
osservabili, cioé Xi (H0 ) ⊂ H0 e Pi (H0 ) ⊂ H0 per ogni i = 1, 2, 3. Per esempio si può prendere lo
spazio di Schwartz H0 = S(R3 ). La verifica di ciò è immediata dalla stessa definizione di spazio
di Schwartz. Su S(R3 ), per computo diretto usando (10.7) e (10.8), si verifica subito che valgono
le relazioni di commutazione di Heisenberg o CCR (canonical commutation relations):
[Xi , Pj ] = i~δij I ,
dove δij = 0 se i 6= j mentre δij = 1 se i = j . Più precisamente abbiamo che vale il seguente
lemma.
Lemma 10.1. Gli operatori posizione ed impulso Xi e Pj con i, j = 1, 2, 3, definiti in A5,
soddisfano le relazioni relazioni di commutazione di Heisenberg:
[Xi , Pj ]ψ = i~δij ψ
per ogni ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), i, j = 1, 2, 3 .
(10.10)
La (10.10) continua ad essere verificata quando si sostituiscono a primo membro Xi con Xi0 :=
Xi + ai I e Pj con Pj0 := Pj + bj I, dove ai , bj ∈ R sono costanti arbitrarie.
Le relazioni (10.10) valgono in particolare se ψ appartiene al sottospazio invariante (per tutti
gli operatori Xi e Pj ) S(R3 ).
Prova. Lavoriamo con ai e bj costanti generiche, la tesi principale si ottiene nel caso ai =
bj = 0. Si osservi prima di tutto che, come si verifica immediatamente: D(Xi0 Pj0 ) ∩ D(Pj0 Xi0 ) =
D(Xi Pj )∩D(Pj Xi ). Sulle funzioni ϕ ∈ D(R3 ), per costruzione l’operatore Pj0 si riduce all’azione
di −i~∂/∂xj + bj I e pertanto, tenendo conto che Xi0 coincide con la semplice moltiplicazione per
la coordinata traslata xi + ai , abbiamo l’identità : Pj0 Xi0 ϕ = −i~ϕδij ϕ + Xi0 Pj0 ϕ. Da essa segue
immediatamente che, per ogni fissato ψ ∈ L2 (R3 , dx):
Pj0 Xi0 ϕ − Xi0 Pj0 ϕ + i~δij ϕ ψ = 0 ,
per ogni ϕ ∈ D(R3 ). A sua volta, se ψ ∈ D(Xi0 Pj0 ) ∩ D(Pj0 Xi0 ) = D(Xi Pj ) ∩ D(Pj Xi ) e tenendo
conto del fatto che Pj e Xi sono autoaggiunti, l’identità trovata si riscrive:
ϕ Xi0 Pj0 ψ − Pj0 Xi0 ψ − i~δij ψ = 0 .
Dato che D(R3 ) è denso in L2 (R3 , dx), quanto appena ottenuto prova che, se ψ ∈ D(Xi Pj ) ∩
D(Pj Xi ):
Xi0 Pj0 ψ − Pj0 Xi0 ψ − i~δij ψ = 0 .
361
Questa è la tesi che volevamo provare che, in particolare, vale per ψ ∈ S(R3 ) ⊂ D(Xi Pj ) ∩
D(Pj Xi ). 2
Osservazione. In (1) in esercizi 10.1 si mostra come sia possibile lasciare cadere l’ipotesi
ψ ∈ D(Xi Pj ) ∩ D(Pj Xi ), sostituendola con la più debole ψ ∈ D(Xi ) ∩ D(Pj ) e dimostrando
ancora valide le relazioni (10.10), interpretate in un senso più debole (nel senso delle forme quadratiche).
Coppie di osservabili che soddisfano le relazioni di Heisenberg (10.10) su un qualche dominio
invariante come S(R3 ) sono spesso dette in letteratura osservabili coniugate. Le relazioni
di Heisenberg sono il caso elementare di più generali CCR valide anche in teoria dei campi
quantistici, per campi bosonici con la definizione appropriata per gli operatori corrispondenti
all’operatore posizione ed all’operatore impulso. Dal punto di vista fisico si è constatato più
volte, nella storia della Meccanica Quantistica e sue evoluzioni, che queste relazioni sono più
importanti delle definizioni di Xi e Pi stessi.
Come è evidente dalle definizioni date, gli operatori posizione ed impulso non sono limitati e
non sono definiti su tutto lo spazio di Hilbert. Questo fatto è piuttosto fastidioso dal punto
di vista tecnico perché costringe ad usare la teoria spettrale per operatori non limitati che è
più complessa di quella per operatori limitati. Ci si può chiedere se non sia possibile definire
in modo alternativo Xi e Pi in modo tale che le relazioni di Heisenberg siano mantenute, ma
tali operatori siano limitati. La risposta è negativa e questa situazione è nella natura delle cose
dato che discende direttamente dalle relazioni di commutazione di Heisenberg. Vale infatti la
seguente proposizione.
Proposizione 10.2. Non esistono 6 operatori autoaggiunti Xi e Pj , con i, j = 1, 2, 3 che soddisfino [Xi , Pj ] = i~δij I su un sottospazio invariante e che siano limitati su tale sottospazio.
Prova. Supponiamo che Xi e Pi soddisfino [Xi , Pj ] = i~δij I su un sottospazio invariante D e
siano limitati su di esso. Restringiamoci allora a lavorare su tale spazio (o sulla chiusura di esso
se non è chiuso, estendendo gli operatori in modo unico ad operatori autoaggiunti definiti su
tale chiusura), considerandolo come tutto lo spazio di Hilbert. Le restrizioni di tali operatori
saranno ancora operatori autoaggiunti oltre che limitati. Da [Xi , Pj ] = i~δij I si ricava subito
che
Pi (Xi )n − (Xi )n Pi = −in(Xi )n−1 ,
da cui, se n è dispari, usando ricorrentemente (a) di proposizione 3.6 (tenendo conto che (Xi )p =
((Xi )p )∗ per ogni intero positivo p) e le proprietà elementari della norma:
n||Xi ||n−1 = n||(Xi )n−1 || ≤ 2||Pi ||||(Xi )n || ≤ 2||Pi ||||Xi ||||(Xi )n−1 || = 2||Pi ||||Xi ||||Xi ||n−1 .
Dato che ||Xi || =
6 0 (altrimenti (10.10) sarebbe falsa), concludiamo che, per ogni n = 1, 3, 5, . . .
n ≤ 2||Pi ||||Xi || < +∞
362
che è impossibile. 2
10.1.2
Il Principio di Indeterminazione di Heisenberg come teorema.
Una conseguenza positiva immediata delle relazioni di Heisenberg e di tutto il formalismo introdotto è che il Principio di Indeterminazione di Heisenberg per le variabili posizione ed impulso
(cfr sezione 6.4) diventa un teorema.
Teorema 10.1 (Principio di indeterminazione di Heisenberg). Per ogni stato puro di un
particella classica con spin 0, descritto da un vettore ψ ∈ D(Xi Pi ) ∩ D(Pi Xi ) ∩ D(Xi2 ) ∩ D(Pi2 )
(in particolare ψ ∈ S(R3 )) con ||ψ|| = 1, valgono le relazioni
(∆Xi )ψ (∆Pi )ψ ≥
~
2
i=1,2,3 .
(10.11)
Prova. Prima di tutto notiamo che, nelle ipotesi fatte si ha in particolare che ψ ∈ D(Xi2 )∩D(Pi2 )
per cui gli scarti quadratici hanno senso.
Usando (10.4) si vede immediatamente che (∆Xi )ψ = (∆Xi0 )ψ e (∆Pi )ψ = (∆Pi0 )ψ se Xi0 :=
Xi + ai I e Pi0 := Pi + bi I dove ai , bi sono costanti in R, per cui la validità di (10.11) con Xi
e Pi rimpiazzati con Xi0 e Pi0 rispettivamente è equivalente alla validità di (10.11). Scegliamo
pertanto ai = −hXi iψ e bi = −hPi iψ e dimostriamo (10.11) per i nuovi operatori Xi0 e Pi0 . Dalla
(10.4) risulta immediatamente che, con le scelte fatte, (∆Xi0 )ψ = ||Xi0 ψ|| e (∆Pi0 )ψ = ||Pi0 ψ||.
Quindi dobbiamo provare che
||Xi0 ψ||||Pi0 ψ|| ≥ ~/2 .
(10.12)
Xi0 e Pi0 soddisfano ancora (10.10), per cui, dalla disuguaglianza di Schwarz ed usando il fatto
che gli operatori sono autoaggiunti e le proprietà elementari del prodotto scalare, si ha:
1 (ψ, Xi0 Pi0 ψ) − (ψ, Xi0 Pi0 ψ)
2
1
~
~
≥ (ψ, (Xi0 Pi0 − Pi0 Xi0 )ψ) = (ψ|ψ) = .
2
2
2
Nel penultimo passaggio abbiamo usato il lemma 10.1. Abbiamo quindi provato (10.12) che era
quanto si doveva fare. 2
||Xi0 ψ||||Pi0 ψ|| ≥ |(Xi0 ψ, Pi0 ψ)| ≥ |Im(Xi0 ψ, Pi0 ψ)| =
Osservazioni.
(1) La dimostrazione rimane invariata lavorando su Rn invece che su R3 con operatori definiti
estendendo nel modo più ovvio la definizione di operatori posizione ed impulso.
(2) In (2) in esercizi 10.1 si mostra come sia possibile lasciare cadere l’ipotesi ψ ∈ D(Xi Pj ) ∩
D(Pj Xi ), sostituendola con la più debole ψ ∈ D(Xi ) ∩ D(Pj ) e dimostrando ancora le relazioni
(10.11), interpretando le varianze in un senso più debole (nel senso delle forme quadratiche)1 .
1
L’idea può essere usata anche nel caso della relazione di indeterminazione tempo-energia come discusso in: R.
Brunetti, K. Fredenhagen, Remarks on time energy uncertainty relations, Rev. Math. Phys. 14, 897-906, 2002.
363
10.2
Le relazioni di Weyl, il teorema di Stone-von Neumann ed
il teorema di Mackey.
Von Neumann e Stone sono riusciti a provare un fatto piuttosto importante: non è necessario
dare l’assioma A5 precisando il fatto che lo spazio di Hilbert sia un L2 (e nemmeno che sia
separabile) e che gli operatori posizione ed impulso siano della forma data. In qualche modo
queste informazioni sono tutte contenute nelle relazioni di commutazione di Heisenberg purché, detto un poco impropriamente, la rappresentazione degli operatori posizione ed impulso
sia irriducibile. Questo è il contenuto essenziale del famoso teorema di Stone-von Neumann che
dimostreremo in questa sezione. Se cade la condizione di irriducibilità, Mackey ha provato (come
conseguenza di teoremi molto più generali legati alla teoria dell’imprimitività) che lo spazio di
Hilbert è comunque una somma diretta ortogonale di rappresentazioni irriducibili (il numero di
tali rappresentazioni è numerabile se lo spazio di Hilbert è separabile). Dimostreremo anche il
teorema di Mackey.
10.2.1
Famiglie irriducibili di operatori e lemma di Schur.
Prima di procedere sono necessarie alcune nozioni generali riguardanti il concetto di famiglia
irriducibile di operatori. Strettamente legato a tale nozione è il cosiddetto Lemma di Schur,
che ha grande utilità nella teoria generale delle rappresentazioni unitarie di gruppi, che avremo
occasione di incontrare nel prossimo capitolo.
Definizione 10.4. H è uno spazio di Hilbert e A := {Ai }i∈J è una famiglia di operatori
Ai : H → H, diremo che H è irriducibile rispetto a A, ovvero equivalentemente che A è irriducibile rispetto a H, se non esiste alcun sottospazio chiuso di H, diverso da {0} e da H stesso,
che sia invariante per tutti gli elementi di A contemporaneamente.
In altre parole, non deve esistere alcun sottospazio chiuso H0 ⊂ H, diverso da {0} e da H stesso,
per cui Ai (H0 ) ⊂ H0 per ogni i ∈ I.
Proviamo ora un utile risultato generale sull’irriducibilità di classi di operatori, noto come Lemma di Schur.
Proposizione 10.3 (Lemma di Schur). Sia A := {Ai }i∈J ⊂ B(H) una famiglia di operatori
sullo spazio di Hilbert, chiusa rispetto alla coniugazione hermitiana (cioè A∗i ∈ A se Ai ∈ A).
Valgono i seguenti fatti.
(a) La famiglia A è irriducibile se e solo se ogni operatore V ∈ B(H) che soddisfa:
V A i = Ai V
per ogni i ∈ J,
è della forma V = χI per qualche numero complesso χ ∈ C.
(b) Sia A0 := {A0i }i∈J ⊂ B(H0 ) un’altra famiglia di operatori sullo spazio di Hilbert H0 , etichettata sullo stesso insieme di indici J, che sia chiusa rispetto alla coniugazione hermitiana. Si
364
supponga infine che:
se A∗i = Aji allora A0 ∗i = A0ji per ogni i ∈ J ed un corrispondente ji ∈ J.
(10.13)
Se A e A0 sono irriducibili, allora ogni operatore lineare limitato S : H → H0 che verifica:
SAi = A0i S
per ogni i ∈ J,
deve essere della forma S = rU dove U : H → H0 è una trasformazione unitaria e r ∈ R (in
particolare S è l’operatore nullo quando r = 0).
Prova. Partiamo dalla dimostrazione di (b) che é più complessa e che viene in parte utilizzata
per provare (a).
(b) Prendendo l’aggiunto di SAi = A0i S abbiamo A∗i S ∗ = S ∗ A0 ∗i per ogni i ∈ J. In altre parole
Aji S ∗ = S ∗ A0ji per ogni i ∈ J. Si osservi che ji varia in tutto J quando i varia in J, essendo
A∗ji ∈ A e (A∗ji )∗ = Aji , pertanto possiamo riscrivere l’identità trovata come Ai S ∗ = S ∗ A0i per
ogni i ∈ J. Per confronto con SAi = A0i S, abbiamo che Ai S ∗ S = S ∗ SAi e A0i SS ∗ = SS ∗ A0i .
Dalla prima identità trovata abbiamo che l’operatore autoaggiunto limitato V := S ∗ S commuta
con ogni Ai e pertanto, per (c) del teorema 8.6, la misura spettrale P (V ) di V su R commuta con
(V )
ogni Ai . Ma allora ogni sottospazio chiuso PE (H) è invariante per ogni Ai . Essendo la famiglia
(V )
(V )
(V )
degli Ai irriducibile, questo significa che PE (H) = H, cioè PE = I, oppure PE (H) = {0},
(V )
cioè PE = 0, per ogni boreliano E ⊂ R. Supponiamo che lo spettro di V contenga almeno
due punti r 6= r0 ed usiamo i risultati in (b) del teorema 9.2. Consideriamo due intervalli aperti
(V )
(V )
di R, I 3 r e I 0 3 r0 con I ∩ I 0 = ∅ Deve essere PI 6= 0 e PI 0 6= 0 perché i due intervalli
(V )
(V )
contengono punti dello spettro, e quindi deve valere il caso PI = PI 0 = I. D’altra parte si
(V ) (V )
deve anche avere PI PI 0 = 0 perché I ∩ I 0 = ∅. Abbiamo raggiunto un assurdo e pertanto lo
spettro di V (che non può mai essere vuoto) deve contiene un unico punto che, essendo isolato,
è parte dello spettro puntuale. Concludiamo che S ∗ S = V = λI per qualche λ ∈ [0, +∞). Con
la stessa procedura si trova che vale anche SS ∗ = λ0 I per qualche λ0 ∈ [0, +∞). Ma allora deve
essere:
λS ∗ = S ∗ SS ∗ = λ0 S ∗ .
Ne consegue che λ = λ0 oppure S ∗ = 0 e quindi S = (S ∗ )∗ = 0. Nel secondo caso la dimostrazione è conclusa. Nel primo caso, definendo U := λ−1/2 S, si trova subito U U ∗ = I 0 e U ∗ U = I
dove I e I 0 sono gli operatoti identità su H e H0 rispettivamente. Ne consegue (vedi definizione
3.9) che U è un operatore unitario. La tesi è provata con λ := r.
(a) Supponiamo che A sia irriducibile. Se V Ai = Ai V , allora A∗i V ∗ = V ∗ A∗i che, nell’ipotesi di
A chiuso rispetto alla coniugazione hermitiana, significa Ai V ∗ = V ∗ Ai per ogni i ∈ J. Allora
1
gli operatori limitati autoaggiunti V+ := 21 (V + V ∗ ) e V− := 2i
(V − iV ∗ ) commutano con gli
elementi di A e questo implica che le loro misure spettrali commutano con gli elementi di A.
Ragionando come nella dimostrazione di (b), si conclude subito che V± = λ± I per qualche coppia di reali λ± . Di conseguenza V = V+ + iV− = (λ+ + iλ− )I = χI con χ ∈ C. Supponiamo,
365
viceversa che gli unici operatori che commutano con A siano del tipo χI. Se H0 è un sottospazio
invariante per A e P è il proiettore ortogonale su H0 allora deve essere P Ai P = Ai P per ogni
i ∈ J. Prendendo l’aggiunto si ha subito che: P A∗i P = P A∗i per ogni i ∈ J. Dato che la
classe A è chiusa rispetto alla coniugazione hermitiana ed i ∈ J è generico, l’identità trovata
si può riscrivere P Ai P = P Ai . Per confronto con l’identità iniziale, troviamo: P Ai = Ai P per
ogni i ∈ J. Nelle ipotesi fatte, deve allora essere P = χI per qualche χ ∈ C. P ∗ = P implica
che χ ∈ R, e P P = P implica che χ2 = χ. Ci sono pertanto solo due possibilità : P = 0 e quindi
H0 = {0} oppure P = I e quindi H0 = H. Abbiamo verificato che A è irriducibile.2
Osservazione. Il lemma di Schur è particolarmente utile quando le due famiglie A e A0 sono
rappresentazioni unitarie di uno stesso gruppo G. In tal caso, le ipotesi di chiusura rispetto alla
coniugazione hermitiana e la (10.13) sono automaticamente soddisfatte usando G come insieme
degli indici I.
10.2.2
Le relazioni di Weyl dalle CCR.
Per illustrare il teorema di Stone-von Neumann procediamo a piccoli passi. Un punto tecnicamente rilevante è che le relazioni di commutazione di Heisenberg sono troppo difficili da usare
rigorosamente perché coinvolgono sottigliezze sui domini. Per liberaci dei problemi di dominio
possiamo passare dagli operatori Xi e Pi ai gruppi unitari ad un parametro da essi generati. Si
P
può fare di meglio e considerare gli operatori ni=1 tk Xk + uk Pk , con tk , uk ∈ R, che risultano
essere essenzialmente autoaggiunti su S(R3 ) e considerare gli esponenziali delle loro uniche estenP
sioni autoaggiunte ni=1 tk Xk + uk Pk . Un calcolo diretto e “brutale” basato sulle sole relazioni
di Heisenberg (10.10) e sullo sviluppo formale dell’esponenziale con la sua formula di Taylor
(tale sviluppo non è giustificato fino ad ora), produce la seguente relazione2 :
( n
X
exp i
( n
X
)
tk Xk + uk Pk exp i
k=1
(
i~
= exp −
2
n
X
t0k Xk + u0k Pk
k=1
!)
tk u0k
)
−
t0k uk
( n
X
exp i
k=1
)
(tk + t0k )Xk + (uk + u0k )Pk
.
k=1
Queste relazioni dette relazioni di Weyl, sono conseguenze formali dirette delle relazioni di commutazione di Heisenberg.
Possiamo allora enunciare la proposizione annunciata, che dimostra tra le altre cose ed indipendentemente da quanto già fatto con altre tecniche, che gli operatori Xi e Pi sono essenzialmente
autoaggiunti se ristretti a S(R3 ), anche lavorando in dimensione maggiore di 3. Nel seguito
2
Se gli operatori negli esponenti fossero matrici n × n di C il risultato seguirebbe immediatamente dalla famosa
formula di Campbell-Hausdorff-Baker: eA eB = e[A,B]/2 eA+B , valida quando la matrice [A, B] commuta sia con la
matrice a A che con la matrice B.
366
assumeremo, per comodità notazionale ~ = 1.
Proposizione 10.4. Si consideri lo spazio L2 (Rn , dx) con n = 1, 2, · · · fissato e dx l’ordinaria
misura di Lebesgue su Rn . Per k = 1, 2, · · · , n si definiscano gli operatori simmetrici:
Xk : S(Rn ) → L2 (Rn , dx)
e
Pk : S(Rn ) → L2 (Rn , dx)
come:
(Xk ψ) (x) = xk ψ(x) ,
∂ψ
(Pk ψ) (x) = −i
(x) .
∂xk
(10.14)
(10.15)
Valgono i seguenti fatti.
P
(a) Gli operatori simmetrici definiti su S(Rn ), nk=1 tk Xk + uk Pk ammettono S(Rn ) come spazio
invariante e sono essenzialmente autoaggiunti per ogni scelta di (t, u) ∈ R2n .
(b) Lo spazio L2 (Rn , dx) è irriducibile rispetto all’insieme di tutti gli operatori limitati:
( n
X
W ((t, u)) := exp i
)
tk Xk + uk Pi
,
con (t, u) ∈ R2n .
(10.16)
k=1
(c) Gli operatori suddetti soddisfano le relazioni, dette relazioni di Weyl:
i
0
0
W ((t, u))W ((t0 , u0 )) = e− 2 (t·u −t ·u) W ((t + t0 , u + u0 )) ,
W ((t, u))∗ = W (−(t, u)) .
(10.17)
(d) Per (t, u) ∈ R2n fissato, ogni applicazione R 3 s 7→ W (s(t, u)) soddisfa:
s- lim W (s(t, u)) = W (0) .
s→0
(10.18)
Prova. Lavoriamo per iniziare nel caso n = 1, la generalizzazione al caso n > 1 finito sarà ovvia.
In questo caso abbiamo solo l’operatore X e l’operatore P. Entrambi gli operatori sono ben definiti quando ristretti allo spazio di Schwartz S(R) ed ammettono un’unica estensione autoaggiunta
partendo da tale spazio come precedentemente discusso che coincide con X e P rispettivamente.
Vogliamo costruire un sottospazio denso di vettori analitici per tutti gli operatori simmetrici
aX + bP : S(R) → L2 (R, dx), per ogni scelta di a, b ∈ R. Definiamo sul dominio denso S(R)
gli operatori detti, rispettivamente, operatore di distruzione, operatore di creazione e
operatore numero di occupazione:

‹

‹
1
d
1
d
A := √ X +
, A? := √ X −
, N := A? A .
(10.19)
dx
dx
2
2
Per costruzione A∗ ⊃ A? , (A? )∗ ⊃ A e N è simmetrico. Si verifica per computo diretto che le
CCR (ovvero la stessa definizione data sopra) implicano che valgano le relazioni di commutazione
su S(R):
[A, A? ] = I .
(10.20)
367
È un fatto noto della teoria dei polinomi ortogonali che il sistema ortonormale completo su
L2 (Rn , dx) delle funzioni di Hermite (cfr (4) in Esempi 3.2) {ψn }n=0,1,... ⊂ S(R) soddisfa ψ0 =
2
d
π −1/4 e−x /2 e la relazione di ricorrenza ψn+1 = (2(n + 1))−1/2 (x − dx
)ψn . Questo è equivalente
a dire che, come si prova facilmente dalla definizione di A? , assegnato ψ0 le altre funzioni di
Hermite si ottengono come:
Ê
1 ? n
ψn =
(A ) ψ0 .
(10.21)
n!
D’altra parte, per computo diretto si verifica immediatamente che:
Aψ0 = 0
(10.22)
Usando (10.21), (10.22) e (10.20) si ha facilmente per induzione la seconda delle due equazioni
seguenti:
√
√
(10.23)
A? ψn = n + 1ψn+1 , Aψn = nψn−1 , Nψn = nψn ,
dove, nella seconda formula il secondo membro è assunto nullo per definizione se n = 0 e,
come si riconosce facilmente, la prima identità non è altro che la relazione di ricorrenza ψn+1 =
d
(2(n + 1))−1/2 (x − dx
)ψn precedentemente introdotta; la terza è invece immediata conseguenza
delle due precedenti.
Tenendo conto che gli ψn sono normalizzati a 1, le prime 2 in (10.23) producono la seguente
stima:
È
√
√
√
||A1 A2 · · · Ak ψn || ≤ n + 1 n + 2 · · · n + k ≤ (n + k)! .
(10.24)
dove gli operatori Ai sono indifferentemente ed indipendentemente A oppure A? . Consideriamo
ora un operatore simmetrico su S(R) dato da una qualsiasi combinazione lineare reale T :=
aX + bP con a, b ∈ R. Si ha immediatamente da (10.19) che, se z := a + ib allora
T =
zA + zA?
√
.
2
(10.25)
Da questa identità e da (10.24) segue subito che, per ogni funzione di Hermite ψn :
È
È
||T k ψn || = 2−k/2 ||(zA + zA? )k ψn || ≤ 2−k/2 2k |z|k (n + k)! = |z|k 2k (n + k)! .
Pertanto, se t ≥ 0:
È
È
√
√
+∞
k (n + k)!
X ( 2|z|t)k (n + k)n
(
2|z|t)
√
< +∞ .
||T k ψn || ≤
≤
k!
k!
k!
k=0
k=0
k=0
+∞
X tk
+∞
X
Il fatto che l’ultima serie converga si ha calcolando direttamente il raggio di convergenza r con
la formula
Ê
!1/k
n ln(k+n)
ln k!
ln k!
(n + k)n
1/r = lim
= lim e 2k − 2k = lim e− 2k = 0 .
k→+∞
k→+∞
k→+∞
k!
368
Concludiamo che combinazioni lineari finite delle funzioni di Hermite sono un insieme di vettori
analitici (più precisamente vettori di A (T, +∞) con la notazione introdotta nel capitolo 9) per
tutti gli operatori T := aX + bP definiti su S(R). Dato che tali operatori sono simmetrici,
concludiamo che devono anche essere essenzialmente autoaggiunti su S(R) per il teorema di
Nelson (teorema 5.8). Questo conclude la prova di (a) per n = 1, per n > 1 la dimostrazione è
la stessa, con semplici riadattamenti, tenendo conto che i polinomi di Hermite generalizzati:
ψm1 ,...,mn (x1 , . . . , xn ) := ψm1 (x1 ) · · · ψmn (xm )
definiscono un sistema ortonormale completo per L2 (Rn , dx) (vedi (1) in Esempi 9.1). Quanto
appena visto prova evidentemente (a) ma anche (d) e la seconda identità in (c). Infatti, per
costruzione:
(
W (s(t, u)) = exp is
n
X
)
tk Xk + uk Pk
(
= exp is
n
X
)
tk Xk + uk Pk
,
k=1
k=1
dove abbiamo usato il risultato di verifica immediata, applicando la definizione di chiusura di
P
un operatore chiudibile a, sA = sA per ogni s ∈ C. A questo punto, dato che ni=1 tk Xk + uk Pk
è autoaggiunto, il punto (a) del teorema 9.6 (di Stone), prova la continuità nella topologia forte
del gruppo
¦ P unitario ad un© parametro R 3 s 7→ W (s(t, u)), tenendo conto del fatto che W (0) =
exp i0 ni=1 tk Xk + uk Pk = I. La seconda identità in (c) è ovvia dato che R 3 s 7→ W (s(t, u))
è un gruppo unitario ad un parametro come appena verificato.
Per dimostrare (b) faremo uso del Lemma 10.2 enunciato e provato dopo questa dimostrazione,
che si basa unicamente sulla dimostrazione del punto (a) appena data. Supponiamo che esista
un sottospazio chiuso H0 ⊆ L2 (Rn ) invariante per la classe degli operatori W ((t, u)) e che
sia non banale, cioé contenga almeno un vettore ψ 6= 0. Sia φ ∈ H⊥
0 , mostreremo che deve
2
n
necessariamente essere φ = 0 e pertanto H0 = L (R ). Per ipotesi deve essere, dato che sia H0
che il suo ortogonale sono invarianti sotto l’azione degli operatori suddetti:
(φ|W ((t, 0)W ((0, u))ψ) = 0 ,
In altre parole:
 P
‹
P
φ ei k tk Xk ei k uk Pk ψ = 0 ,
per ogni (t, u) ∈ R2n .
per ogni (t, u) ∈ R2n .
Il primo membro può essere calcolato esplicitamente usando (10.32) e (10.33) del Lemma 10.2
trovando:
Z
eit·x φ(x)ψ(x + u) dx = 0 , per ogni t, u ∈ Rn .
Rn
Dato che la funzione x 7→ hu (x) := φ(x)ψ(x + u) è in L1 (Rn , dx) essendo le due funzioni a
prodotto in L2 (Rn , dx), e data l’arbitrarietà di t ∈ Rn , l’identità di sopra dice semplicemente
che la trasformata di Fourier di hu ∈ L1 (Rn , dx) è nulla. In base a (f) in proposizione 3.12, la
funzione hu deve essere nulla quasi ovunque. In altre parole:
φ(x)ψ(x + u) = 0 quasi ovunque per ogni u ∈ Rn .
369
(10.26)
Sia E ⊂ Rn l’insieme su cui ψ non si annulla e F l’insieme su cui non si annulla mai φ. (Notare che entrambi gli insiemi sono misurabili perché controimmagini dell’aperto C \ {0} secondo
funzioni misurabili.) Indicando con m la misura di Lebesgue di Rn , vale m(E) > 0 per ipotesi.
Affinché sia valida la richiesta (10.26) deve accadere che:
m(F ∩ (E − u)) = 0
per ogni u ∈
Rn ,
Z
cioé
χF (x)χE (x + u)dx = 0
per ogni u ∈ Rn .
R
Integrando in u abbiamo che deve anche valere:
Z
Z
dy
R
χF (x)χE (x + u)dx = 0 .
R
Dato che le funzioni integrande sono non negative e che l’integrale iterato è finito, possiamo
usare il teorema di Fubini-Tonelli per scambiare le integrazioni, sfruttare ancora l’invarianza per
traslazioni della misura di Lebesgue ottenendo:
Z
0=
Z
χE (x+u)du =
dxχF (x)
R
Z
R
Z
Z
dxχF (x)
1du =
E−x
R
Z
dxχF (x)
R
χE (u)dy = m(F )m(E).
R
Dato che m(E) > 0 deve essere m(F ) = 0. Dunque φ è nulla quasi ovunque: è il vettore nullo
di L2 (Rn , dx). Quindi H0 = L2 (Rn , dx) e questo prova l’irriducibilità enunciata in (b).
Non resta che dimostrare le identità :
i
0
0
W ((t, u))W ((t0 , u0 )) = e− 2 (t·u −t ·u) W ((t + t0 , u + u0 )) .
(10.27)
Per provare tali identità suddette procediamo come segue in due passaggi, introducendo gli
operatori:
i
U ((t, u)) := e− 2 (t·u) W ((t, 0))W ((0, u)) .
Per prima cosa dimostreremo che tali operatori soddisfano le identità :
i
0
0
U ((t, u))U ((t0 , u0 )) = e− 2 (t·u −t ·u) U ((t + t0 , u + u0 )) .
(10.28)
Come secondo punto dimostreremo che
U ((t, u)) = W ((t, u)) ,
(10.29)
e ciò concluderà la dimostrazione.
Esattamente come nella dimostrazione di (b), usando il lemma 10.2 segue immediatamente che:
i
(U ((t, u))ψ) (x) = e 2 t·u eit·x ψ(x + u) .
(10.30)
Da questa identità reiterata segue, con qualche banale calcolo che, per ogni fissata ψ ∈ L2 (Rn , dx):
i
0
0
U ((t, u))U ((t0 , u0 ))ψ = e− 2 (t·u −t ·u) U ((t + t0 , u + u0 ))ψ .
370
Per l’arbitrarietà di ψ questo è equivalente alla (10.28) che risulta in tal modo provata. Passiamo
a dimostrare (10.29). Consideriamo, per t, u fissati, la classe di operatori unitari Us := U (s(t, u))
per s ∈ R. Direttamente da (10.30) si verifica per computo diretto che Us+s0 = Us Us0 e U0 = I.
Dato che gli operatori sono tutti unitari abbiamo ottenuto che {Us }s∈R è un gruppo ad un
parametro di operatori unitari. La nostra strategia sarà ora quella di dimostrare che tale gruppo
è fortemente continuo, calcolarne il generatore e dimostrare che esso coincide con quello di
{W (s(t, u))}s∈R ; provate queste cose il teorema di Stone (teorema 9.5) dimostra che i due
gruppi ad un parametro devono coincidere provando in tal modo (10.29). Per quanto concerne
la continuità in senso forte, si osservi che, per ogni fissata coppia ψ, φ ∈ L2 (R2 , dx):
‹
 P
P
is2
t·u
is k tk Xk is k uk Pk
2
(φ|Us ψ) = e
e
ψ
φ e
=e
is2
t·u
2
P
‹
 P
is k tk Xk is k uk Pk
φ e
ψ → (φ|ψ)
e
per s → 0 ,
in virtù della continuità del prodotto scalare e della continuità in senso forte dei gruppi unitari
P
P
ad un parametro generati dagli operatori autoaggiunti k uk Pk e k tk Xk . La proposizione 9.2
assicura allora che {Us }s∈R è fortemente continuo. Consideriamo ora ψ ∈ S(Rn ) e verifichiamo
che:
! 2
X
Us ψ − ψ
lim −i
tk Xk + uk Pk ψ = 0 .
(10.31)
s→0 s
k
Con qualche passaggio si trova esplicitamente
! 2
X
Us ψ − ψ
−i
tk Xk + uk Pk ψ s
k
2
2
eis t·u/2 eistx ψ(x + su) − ψ(x)
− it · xψ(x) − u · ∇x ψ dx .
=
n
s
R
Z
Pertanto
! 2
2
Z X
Us ψ − ψ
2 t·u/2 istx ψ(x + su) − ψ(x)
is
−i
tk Xk + uk Pk ψ ≤
− u · ∇x ψ dx
e
e
n
s
s
R
k
2
2
eis t·u/2 eistx − 1
is t·u/2 istx ψ(x + su) − ψ(x)
+2
e
− u · ∇x ψ − i |t · xψ(x)|dx
e
n
s
st
·
x
R
Z
2
2
eis t·u/2 eistx − 1
+
− i |t · xψ(x)|2 dx .
n
st
·
x
R
Z
Consideriamo i tre integrali a secondo membro. L’integrale intermedio, a causa della disuguaglianza di Schwartz, deve tende a zero quando tendono a zero i rimanenti due, dato che il suo
371
quadrato è maggiorato dal prodotto degli altri due integrali. Per il teorema della convergenza
dominata, l’ultimo integrale tende a 0 per s → 0 dato che l’integrando tende puntualmente a
0 ed è uniformemente maggiorato dalla funzione L1 data da C|t · xψ(x)|2 per qualche costante
C > 0. L’integrando del primo integrale tende anch’esso puntualmente a 0 quando s → 0. Per
applicare il teorema di Lebesgue bisogna trovare una maggiorazione dell’integrando, uniforme
in s in un intorno di 0, data da una funzione L1 (quindi indipendente da s). Si osservi che,
spezzando l’integrale e ricordando che ψ ∈ S(Rn ), si vede subito che è sufficiente trovare una
maggiorazione uniforme in s ∈ [−, ], da parte di funzioni L1 per:
ψ(x + su) − ψ(x) s
ψ(x + su) − ψ(x) 2
,
s
e
per avere una maggiorazione di tutto l’integrando. Assumendo ψ reale (e ci si può sempre
ricondurre a tale caso decomponendo ψ in parte reale ed immaginaria), possiamo stimare con il
teorema di Lagrange:
ψ(x + su) − ψ(x) = |u · ∇ψ|x+s0 u | ,
s
dove s0 ∈ [−, ]. Dato che ψ ∈ S(Rn ), per ogni fissato p = 1, 2, . . . esiste Kp ≥ 0 con
|u · ∇ψ|x | ≤
Kp
.
1 + ||x||p
È facile vedere che se > 0, u ∈ Rn e p = 2, 3, . . . sono fissati, esiste Cp, > 0 tale che
Cp,
1
≤
p
1 + ||x + s0 u||
1 + ||x||p−1
per ogni x ∈ Rn e s0 ∈ [−, ].
In definitiva possiamo concludere che per qualche costante C ≥ 0
ψ(x + su) − ψ(x) C
≤
s
1 + ||x||n+1
per ogni x ∈ Rn e s ∈ [−, ].
La funzione a secondo membro ed il suo quadrato sono funzioni L1 (Rn , dx) e ciò è quanto volevamo per poter applicare il teorema di Lebesgue. La (10.31) risulta essere provata.
Abbiamo ottenuto che il generatore autoaggiunto del gruppo unitario ad un parametro fortemente continuo {U (s(t, u))}s∈R coincide con quello dell’analogo gruppo {W (s(t, u))}s∈R sullo spazio
S(Rn ). Dato che il secondo generatore è essenzialmente autoaggiunto su tale spazio, e quindi
ammette un’unica estensione autoaggiunta, i due generatori devono coincidere ovunque. Come
conseguenza abbiamo allora che i due gruppi devono coincidere dato che si possono entrambi
scrivere esponenziando lo stesso generatore autoaggiunto. Questo conclude la dimostrazione. 2
Enunciamo e proviamo un Lemma usato nella precedente dimostrazione per provare (b) e (c)
una volta provato (a). Enunciamo tale lemma separatamente in quanto è interessante come
372
risultato tecnico.
Lemma 10.2. In riferimento alle ipotesi della proposizione 10.4, se ψ ∈ L2 (Rn , dx) e t, u ∈ Rn ,
valgono le seguenti identità :
 P
‹
i k tk Xk
e
ψ (x) = eit·x ψ(x) ,
(10.32)
‹
 P
i k uk Pk
ψ (x) = ψ(x + u) .
e
e
(10.33)
Prova. Per computo diretto si ha che il gruppo unitario ad un parametro {Us }s∈R con:
(Us ψ) (x) := eist·x ψ(x) ,
∀ψ ∈ L2 (Rn , dx)
è fortemente continuo e soddisfa su S(Rn ):
1
−i lim (Us ψ − ψ) =
s→0 s
Infatti:
!
X
tk Xk ψ .
k
! 2
2
Z ist·x
X
1
−1
e
(Us ψ − ψ) − i
t
X
−
it
·
x
ψ
=
|ψ(x)|2 dx
k k
s
3 s
R
k
2
eist·x − 1
=
− i |t · x|2 |ψ(x)|2 dx → 0
3
st
·
x
R
Z
per s → 0 ,
dove abbiamo usato il fatto che x 7→ |t · x|2 |ψ(x)|2 è L1 dato che ψ ∈ S(Rn ), che la funzione
2
eist·x − 1
R × R 3 (s, x) 7→ − i ≤ 2
st · x
3
e tende puntualmente in x a 0 per s → 0, ed abbiamo infine applicato il teorema della convergenza dominata di Lebesgue.
Per il teorema di Stone, il generatore del gruppo degli Us è un’estensione autoaggiunta di
P
P
k tk Xk . D’altra parte, dato che
k tk Xk è essenzialmente autoaggiunto per (a) del teorema precedente, e pertanto non ammette altre estensioni autoaggiunte eccetto la sua chiusura,
P
concludiamo che {Us }s∈R è il gruppo ad un parametro generato da k tk Xk . In questo modo
abbiamo provato la (10.32).
Passiamo alla seconda identità . In virtù di (3.58)-(3.61), del fatto che la trasformata di FourierPlancherel F̂ si riduce a quella di Fourier F su S(Rn ) e che quest’ultimo è uno spazio invariante
sotto F:
X
X
uk Pk = F̂−1
uk Kk F̂ ,
k
k
373
dove Kk è l’operatore Xk al quale abbiamo cambiato nome dato che la variabile della funzione
trasformata secondo Fourier è k e non x. Dato che la trasformata di Fourier è un isomorfismo
di spazi di Hilbert abbiamo anche che:
X
uk Pk = F̂−1
X
k
uk Kk F̂ .
k
Infine per il corollario 9.1 deve anche valere:
ei
P
k
uk Pk
= F̂−1 ei
P
k
uk Kk
F̂ .
(10.34)
Riducendosi al caso di ψ ∈ S(Rn ), dove la trasformata di Fourier-Plancherel F̂ e la sua inversa si calcolano con l’integrale di Fourier e si riducono alla trasformata di Fourier F e alla
corrispondente inversa (cfr definizione 3.14 in sezione 3.6), (10.34) implica che:
‹

‹
 P
P
(10.35)
ei k uk Pk ψ (x) = F−1 ei k uk Kk ψ̂ (x) = ψ(x + u) , per ogni ψ ∈ S(Rn ).
Tenendo conto che S(Rn ) è denso in L2 (Rn , dx), che se S(Rn ) 3 ψn → ψ nel senso di L2 allora
vale anche ψn (· +u) → ψ(· +u) in L2 dato che la misura di Lebesgue è invariante per traslazione,
P
la continuità dell’operatore unitario ei k uk Pk implica (10.33) dalla (10.35). 2
Esercizi 10.1.
(1) Si provi che se ψ, φ ∈ D(Xi ) ∩ D(Pj ) allora valgono le relazioni di commutazione canonica
nel senso delle forme quadratiche:
(Xi ψ|Pj ϕ) − (Pj ψ|Xi ϕ) = i~δij (ψ|ϕ) .
Suggerimento. Si considerino le relazioni (10.17) ottenendo in particolare:
(W ((−t, 0))ψ |W ((0, u))ϕ )−(W ((0, −u))ψ |W ((t, 0))ϕ ) = (1−e−i(t·u)/2 ) (W ((−t, 0))ψ |W ((0, u))ϕ ) .
Usando il teorema di Stone si ottiene facilmente l’identità richiesta.
(2) Si provi che se ψ ∈ D(Xi ) ∩ D(Pj ) e ||ψ|| = 1, allora vale il principio di Heisenberg nel senso
delle forme quadratiche:
(δXi )ψ (δPj )ψ ≥ ~/2 ,
È
dove, per ogni operatore autoaggiunto A : D(A) → H abbiamo definito (δA)ψ := (Aψ|Aψ) − (ψ|Aψ)2
per ψ ∈ D(A).
Suggerimento. Per prima cosa si provi che il risultato dell’esercizio precedente vale anche
sostituendo gli operatori Xi e Pj con Xi + ai I e Pj + bj I con ai e bj numeri reali (a tal fine non
si deve ripetere tutta la dimostrazione, ma è sufficiente lavorare nel risultato finale). A questo
punto si può procedere analogamente a quanto fatto nella dimostrazione del teorema 10.1.
374
10.2.3
Il teorema di Stone-von Neumann ed il teorema di Mackey.
Mostriamo ora come le relazioni di Weyl valide per operatori limitati W ((t, u)) con (t, u) ∈ R2n
che formino un insieme irriducibile di operatori su uno spazio di Hilbert complesso H e tali che
s 7→ W (s(t, u)) siano continui per s = 0 nella topologia operatoriale forte, implichino che H sia
connesso a L2 (Rn , dx) tramite un isomorfismo di spazi di Hilbert che identifica ogni W ((t, u))
P
con ei k tk Xk +uk Pk . Si osservi che, in particolare, lo spazio di Hilbert H risulta essere separabile.
Enunceremo il teorema in forma leggermente più generale introducendo alcune nozioni di teoria
degli spazi vettoriali simplettici.
Ricordiamo alcune nozioni elementari di teoria degli spazi simplettici. che una coppia (X, σ)
è detta spazio simplettico quando X è spazio vettoriale reale e σ : X × X → R, detta forma
simplettica, è un’applicazione è bilineare, antisimmetrica e non degenere (cioè vale che σ(u, v) =
0 per ogni u ∈ X implica v = 0). Per un noto teorema di Darboux [FaMa94], se (X, σ) è uno
spazio simplettico di dimensione finita 2n, allora esiste una base (in realtà un’infinità di esse),
detta base canonica {e1 , · · · , en , f1 , · · · , fn } ⊂ X rispetto alla quale σ è scritta nella seguente
forma detta forma canonica:
0
σ(z, z ) :=
n
X
!
ti u0i
−
t0i ui
per ogni coppia z, z0 ∈ X ,
(10.36)
i=1
dove z = ni=1 ti ei + ni=1 ui fi e z0 = ni=1 t0i ei + ni=1 u0i fi . Un isomorfismo tra spazi vettoriali
reali dotati di forma simplettica è detto simplettoisomorfismo se preserva le forme simplettiche. Si prova facilmente che un isomorfismo da uno spazio simplettico nello stesso spazio è un
simplettoisomorfismo se e solo se trasforma basi canoniche in basi canoniche.
P
P
P
P
Possiamo ora enunciare il teorema di Stone-von Neumann che proveremo più avanti dopo avere
introdotto la nozione di ∗-algebra di Weyl. Alcuni commenti, sia di carattere matematico che
fisico, sul teorema di Stone-von Neumann sono riportati in una sezione dopo la dimostrazione
del teorema.
Teorema 10.2. (Teorema di Stone-von Neumann). Si consideri uno spazio di Hilbert
complesso H e uno spazio vettoriale simplettico (X, σ) di dimensione finita 2n. Si supponga che
H sia dotato di una classe di operatori {W (z)}z∈X ⊂ B(H) che goda delle seguenti proprietà .
(a) H sia irriducibile rispetto all’insieme dei generatori W (z).
(b) Valgano le relazioni di Weyl:
i
0
W (z)W (z0 ) = e− 2 σ(z,z ) W ((z + z0 )) ,
W (z)∗ = W (−z) .
(10.37)
(c) Per z ∈ X fissato, ogni applicazione R 3 s 7→ W (sz) soddisfa:
s- lim W (sz) = W (0) .
s→0
375
(10.38)
Scelta una qualunque base canonica di X sulla quale z ∈ X è individuato da (t(z) , u(z) ) ∈ Rn ×Rn ,
esiste un isomorfismo di spazi di Hilbert S : H → L2 (Rn , dx) tale che:
S W (z) S
−1
( n
X (z)
)
tk Xk +
:= exp i
(z)
uk Pk
per ogni z ∈ X.
,
(10.39)
k=1
dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.4.
A completamento del teorema di Stone-von Neumann enunciamo il teorema di Mackey.
Teorema 10.3. (Teorema di Mackey). Nelle stesse ipotesi del teorema Teorema 10.2.
(Teorema di Stone-von Neumann) si assuma che, a parità delle altre ipotesi, l’ipotesi (a) sia
sostituita da una delle seguenti ipotesi equivalenti.
(a1) Ogni generatore W (z) ha nucleo banale per z ∈ X.
(a2) Ogni generatore W (z) è un operatore unitario per z ∈ X.
(a3) W (0) è l’operatore identità su H.
In tal caso lo spazio di Hilbert H si decompone in una somma diretta ortogonale (numerabile se
H è separabile) di sottospazi chiusi invarianti ed irriducibili rispetto all’insieme dei generatori
W (z). In ciascuno di tali spazi è quindi valido il teorema di Stone-von Neumann per la classe
di operatori W (z) ristretti al sottospazio considerato.
Osservazione importante. Tenendo conto del teorema di Darboux citato sopra, un modo
alternativo di formulare il teorema Teorema di Stone-von Neumann, che si trova più spesso in
letteratura, è il seguente. Vale un’analoga riformulazione del teorema di Mackey che il lettore
può facilmente ricavare e che omettiamo.
Teorema 10.2b. (Teorema di Stone-von Neumann in formulazione alternativa). Sia
H spazio di Hilbert complesso e {U (t)}t∈Rn , {V (u)}u∈Rn ⊂ B(H) tali che valgano le seguenti
proprietà .
(a) H sia irriducibile rispetto a {U (t)}t∈Rn , {V (u)}u∈Rn .
(b) Siano soddisfatte le relazioni (anch’esse dette di Weyl):
U (t)V (u) = V (u)U (t)eit·u
U (t)U (t0 ) = U (t + t0 )
per ogni t, u ∈ Rn ,
V (u)V (u) = V (u + u0 )
per ogni t, u, t0 u0 ∈ Rn .
(c) Per ogni coppia t ∈ Rn e u ∈ Rn
s- lim U (st) = U (0)
e
s→0
s- lim V (su) = V (0) .
s→0
Allora esiste un isomorfismo di spazi di Hilbert S1 : H → L2 (Rn , dx) che soddisfa:
S1 U (t)
S1−1
( n
X
:= exp i
)
tk Xk
e
k=1
S1 V (u)
S1−1
( n
X
:= exp i
k=1
376
)
uk Pk
.
dove gli operatori simmetrici sono Xi e Pi definiti come in proposizione 10.4.
Mostriamo che le due formulazioni sono equivalenti. Assumiamo che gli spazi di Hilbert H dei due
teoremi siano lo stesso spazio di Hilbert. Proviamo subito che il teorema 10.2 implica il teorema
10.2b. Partendo dalle ipotesi del Teorema 10.2b ed usando le relazioni di Weyl presentate in tale
teorema, si verifica immediatamente che gli operatori W ((t, u)) := eit·u/2 U (t)V (u) soddisfano
le ipotesi del teorema 10.2 sullo spazio simplettico (Rn × Rn , σc ), dove σc è la forma simplettica
già espressa in forma canonica
0
0
σc ((t, u), (t , u )) =
n
X
!
ti u0i
−
t0i ui
i=1
sulla base naturale di Rn × Rn . Scegliendo la base canonica come quella naturale di Rn × Rn , la
validità della tesi del teorema 10.2 implica la validità dalla tesi del teorema 10.2b con S1 = S.
Proviamo ora che il teorema 10.2b implica il teorema 10.2. Scegliamo una base canonica in X
e identifichiamo gli elementi di X con le coppie (t, u) di Rn × Rn . Partendo dalla classe di operatori W ((t, u)) soddisfacenti le ipotesi del teorema 10.2, si verifica subito che i nuovi operatori
V (t) := W ((t, 0)) e U (u) := W ((0, u)) soddisfano le ipotesi del teorema 10.2b. Per verifica
diretta si ha subito che la validità della tesi del teorema 10.2b implica la validità dalla tesi del
teorema 10.2 con S = S1 .
10.2.4
La ∗-algebra di Weyl.
L’enunciato del teorema di Stone von Neumann contiene una nozione molto importante, non
solo per la dimostrazione del teorema stesso, ma anche per i successivi sviluppi della MQ verso
la teoria quantistica dei campi. Si tratta della nozione di ∗-algebra di Weyl. Ricordiamo che
(definizioni 2.4 e 3.7) che un isomorfismo di ∗-algebre α : A → B è un’applicazione lineare,
biettiva, che conserva i prodotti e le involuzioni passando dalla ∗-algebra A alla ∗-algebra B. Se
tali ∗-algebre ammettono unità è anche richiesto che, per definizione, l’isomorfismo α trasformi
l’unità di A nell’unità di B (di conseguenza α trasforma l’inverso di un elemento nella prima
algebra nell’inverso del corrispondente elemento nella seconda). Nel caso in cui B è una sotto
∗-algebra della C ∗ -algebra B(H) degli operatori limitati sullo spazio di Hilbert complesso H,
α : A → B è detta rappresentazione di A su H.
Definizione 10.5. (Algebra di Weyl). Sia X uno spazio vettoriale (non banale) di dimensione
arbitraria (anche non finita) sul campo reale e σ : X × X → R una forma simplettica su X. Una
∗-algebra (definizione 3.8) W (X, σ) è detta Algebra di Weyl associata a (X, σ) se esiste in
W (X, σ) una classe {W (u)}u∈X di elementi non nulli, detti generatori (di W (X, σ)), tale che:
(i) valgano le relazioni (di commutazione) di Weyl:
i
W (u)W (v) = e− 2 σ(u,v) W (u + v) ,
W (u)∗ = W (−u) ,
377
per ogni u, v ∈ V ;
(10.40)
(ii) W (X, σ) sia generata da {W (u)}u∈V , cioé W (X, σ) coincida con lo spazio lineare delle
combinazioni lineari finite di prodotti finiti degli elementi in W (X, σ).
Mostriamo ora, tra le altre cose, che uno spazio simplettico (X, σ) determina in modo univoco,
cioé a meno di ∗-isomorfismi, una ∗-algebra di Weyl.
Teorema 10.4. Sia X uno spazio vettoriale (non banale) di dimensione arbitraria (anche non
finita) sul campo reale e σ : X × X → R una forma simplettica su X.
(a) Esiste sempre una ∗-algebra di Weyl, W (X, σ), associata a (X, σ).
(b) Ogni ∗-algebra di Weyl W (X, σ) ammette unità I e vale:
W (0) = I ,
W (u)∗ = W (−u) = W (u)−1 , per ogni u ∈ X .
(10.41)
i generatori {W (u)}u∈X sono linearmente indipendenti, in particolare W (u) 6= W (v) se u 6= v.
(c) Se W (X, σ), generata da {W (u)}u∈X , e W 0 (X, σ), generata da {W 0 (u)}u∈X , sono algebre di Weyl associate a (X, σ), esiste un unico di ∗-isomorfismo α : W (X, σ) → W 0 (X, σ)
completamente determinato dalla richiesta
α(W (u)) = W 0 (u) ,
per ogni u ∈ X.
(d) Ogni rappresentazione di W (X, σ) su uno spazio di Hilbert H, π : W (X, σ) → B(H) è fedele
(cioé iniettiva) oppure è la rappresentazione nulla.
Prova. (a) Si consideri lo spazio di Hilbert complesso H := L2 (X, µ) dove µ è la misura
che conta i punti dell’insieme X. Se u ∈ X, si consideri W (u) ∈ B(L2 (X, µ)) definito da
(W (u)ψ)(v) := eiσ(u,v) ψ(u + v) per ogni ψ ∈ L2 (X, µ) e v ∈ X. Si verifica immediatamente
che tali operatori sono non nulli e soddisfano le relazioni di commutazione di Weyl (10.41) usando come involuzione la coniugazione hermitiana.
(b) Dalla prima equazione in (10.40) segue che W (u)W (0) = W (0) = W (0)W (u) e anche
W (u)W (−u) = W (0) = W (−u)W (u), dato che i W (u) sono non nulli e generano tutta la ∗algebra, segue che deve essere W (0) = I e W (−u) = W (u)−1 . Quest’ultima, tenendo conto della
seconda in (10.40), implica che W (u)∗ = W (u)−1 . Passiamo a provare che i generatori W (u) sono
linearmente indipendenti. Supponiamo di avere un sottoinsieme di n generatori {W (uj )}j=1,...,n ,
con u1 , . . . , un tutti distinti, e dimostriamo che i generatori W (uj ) sono linearmente indipendenti. Dato che il sottoinsieme è arbitrario (e le combinazioni lineari da usare sono supposte
P
sempre finite) ciò prova la tesi. Consideriamo la combinazione lineare nulla nj=1 aj W (uj ) = 0
e dimostriamo, per induzione, che aj = 0 per j = 1, . . . , n. Per n = 1 la tesi è vera dato che
per definizione ogni W (u) non è nullo. Assumiamo che la tesi sia vera per n − 1 generatori,
non importa come scelti, e mostriamo che è vera anche per n generatori. Senza perdere generalità possiamo pensare, per assurdo, che an 6= 0, eventualmente rietichettando i generatori.
Pn
j=1 aj W (uj ) = 0 implica che:
W (un ) =
n−1
X
j=1
−aj
W (uj ) .
an
378
Di conseguenza:
∗
I = W (un ) W (un ) =
n−1
X
j=1
n−1
n−1
X −aj
X
−aj
∗
−iσ(−un ,uj )/2
W (un ) W (uj ) =
e
W (uj −un ) =
bj W (uj −un ),
an
an
j=1
j=1
−a
dove bj := anj e−iσ(−un ,uj )/2 . Per provare l’enunciato è evidentemente sufficiente dimostrare che
ogni bj = 0 per j = 1, 2, . . . , n − 1. Andiamo a dimostrare questo fatto. Fissiamo u ∈ X
arbitrariamente ed, usando l’identità trovata, abbiamo che:
I = W (u)IW (−u) =
n−1
X
bj W (u)W (uj − un )W (−u) =
j=1
n−1
X
bj e−iσ(u,uj −un )/2 W (uj − un ) .
j=1
Confrontando le due espressioni ottenute per I abbiamo che deve essere:
n−1
X
bj W (uj − un ) =
j=1
n−1
X
bj e−iσ(u,uj −un )/2 W (uj − un ) .
j=1
Moltiplicando ambo membri per W (un ) ed eseguendo un’ovvia semplificazione, si trova alla fine:
n−1
X
j=1
bj W (uj ) =
n−1
X
bj e−iσ(u,uj −un )/2 W (uj ) .
j=1
Dato che i generatori W (uj ) con j = 1, 2, . . . , n − 1 sono linearmente indipendenti, deve accadere
che:
bj (1 − e−iσ(u,uj −un )/2 ) = 0 .
Se fosse bj 6= 0 per qualche j avremmo che 1 = e−iσ(u,uj −un )/2 e quindi:
σ(u, uj − un )
= k(u) ∈ Z .
2π
Dato però che il primo membro dell’identità scritta è lineare in u ∈ X, la funzione X 3 u 7→ k(u)
deve essere lineare. Dovendo essa assumere solo valori in Z, deve essere la funzione nulla. Di
conseguenza:
σ(u, uj − un ) = 0 per ogni u ∈ X.
La non degeneratezza di σ implica che uj − un = 0 che è impossibile per ipotesi.
(c) Si consideri l’unica applicazione lineare α : W (X, σ) → W 0 (X, σ) individuata dalla richiesta
α(W (u)) = W 0 (u) per ogni u ∈ X. Dato che {W (u)}u∈X e {W 0 (u)}u∈X sono basi delle relative ∗algebre, α è un isomorfismo di spazi vettoriali. Dato che i prodotti di elementi delle due ∗-algebre
si scrivono come combinazioni lineari dei generatori a causa del primo set delle relazioni di Weyl,
che sono le stesse per le due ∗-algebre, si verifica facilmente che α trasforma prodotti in prodotti.
α(W (0)) = W 0 (0) implica che α trasformi l’elemento neutro moltiplicativo della prima algebra
nell’elemento neutro moltiplicativo della seconda. Infine la richiesta α(W (−u)) = W 0 (−u) e il
379
secondo set delle relazioni di Weyl implicano che α trasformi l’involuzione nella prima algebra
nell’involuzione nella seconda. La procedura seguita mostra anche che α è univocamente determinato dalla richiesta α(W (u)) = W 0 (u) per ogni u ∈ X.
(d) Si consideri una rappresentazione π : W (X, σ) → B(H). Per costruzione gli operatori
{π(W (u))}u∈X soddisfano le relazioni di Weyl. Se ognuno dei π(W (u)) è non nullo, essi definiscono una ∗-algebra di Weyl associata a (X, σ). In base a (c) la rappresentazione π, quando si restringe il codominio a π(W (X, σ)), è uno ∗-isomorfismo e quindi π è iniettiva. Se al contrario, per
qualche u ∈ X vale π(W (u)) = 0 allora π è la rappresentazione nulla. Infatti, in base alle relazioi
i
ni di Weyl, se z ∈ X, posto z − u =: v si trova: W (z) = e 2 σ(u,v) W (u)W (v) = e 2 σ(u,v) 0W (v) = 0.
Quindi π si riduce alla rappresentazione nulla dato che i W (v) sono una base per W (X, σ). 2
Osservazioni.
(1) Nel senso precisato dal punti (a) e (c) del teorema di sopra, la coppia (X, σ) e le relazioni
(10.40) determinano in modo universale (cioè a meno di isomorfismi) l’algebra di Weyl associata
a (X, σ). Ogni concreta ∗-algebra di Weyl associata alla coppia (X, σ) è detta spesso realizzazione
della ∗-algebra di Weyl associata alla coppia (X, σ).
(2) Se W (X, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata
a (X, σ), è in generale falso che I = I, dove I : H → H è l’operatore identità. Infatti, supponiamo che W (X, σ) sia una rappresentazione sullo spazio di Hilbert (H, (·|·)) dell’algebra di
Weyl associata a (X, σ) dove W (0) = I = I. Consideriamo lo spazio di Hilbert H0 := H ⊕ C
con prodotto scalare h(ψ, z)|(ψ 0 , z 0 )i = (ψ|ψ 0 ) + zz. Una rappresentazione su H0 dell’algebra
di Wayl associata a (X, σ) è immediatamente costruita come quella generata dagli operatori
W (u)0 : (ψ, z) 7→ (W (u)ψ, 0), dove gli operatori W (u) generano l’algebra di Weyl su H. Nel caso
in esame
I = W (0)0 : (ψ, z) 7→ (ψ, 0)
per cui W (0)0 non è l’operatore identità su H0 , ma solo il proiettore ortogonale su H. Tuttavia vi
sono delle rappresentazioni dell’algebra di Weyl in spazi di Hilbert che risultano sempre essere
tali che i generatori sono operatori unitari, siffatte rappresentazioni sono, per esempio, le cosiddette rappresentazioni GNS3 che sono fondamentali nella formulazione della teoria dei campi
quantistici. Valgono inoltre le seguente proposizioni generali.
(3) Se W (V, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata
a (V, σ) e l’insieme dei generatori {W (u)}u∈V è irriducibile rispetto ad H, allora I = I (e di
conseguenza gli operatori W (u) sono tutti unitari).
Per provare ciò è sufficiente provare che I = I nelle ipotesi fatte. Se non valesse I = I, l’operatore
W (0) = I sarebbe un proiettore, diverso dall’operatore nullo e dall’operatore identità su H, che
commuta con ogni operatore W (u) valendo W (u)W (0) = W (0) = W (0)W (u). Sarebbe allora
immediato verificare che il sottospazio chiuso su cui proietta W (0) (che per ipotesi non coincide
con {0} e nemmeno con H) è invariante sotto l’azione di ogni W (u) e quindi sotto l’azione di
ogni elemento di W (V, σ), contraddicendo le ipotesi.
3
In tal caso l’unitarietà degli operatori W (u) segue dall’esistenza del vettore ciclico e da come si costruisce
materialmente la rappresentazione.
380
(4) Se W (V, σ) è una rappresentazione sullo spazio di Hilbert H dell’algebra di Weyl associata a
(V, σ), vale I = I (e di conseguenza gli operatori W (u) sono tutti unitari) se e solo se ciascuno
dei generatori {W (u)}u∈V ha nucleo banale.
La dimostrazione è immediata. Se ciascuno dei generatori W (u) ha nucleo non banale, il proiettore ortogonale W (0) = I ha nucleo non banale e quindi può solo essere il proiettore I. Se
viceversa W (0) = I allora i W (u) sono unitari e quindi hanno tutti nucleo banale.
10.2.5
Dimostrazione dei teoremi di Stone-von Neumann e di Mackey.
In questa sezione dimostriamo per primo il teorema di Stone von Neumann nella formulazione
data nel teorema 10.2. Successivamente dimostreremo il teorema di Mackey 10.3. Infine faremo
alcuni commenti sia di carattere matematico che fisico sull’importanza di tali risultati e sulla
loro validità in ambito più generale.
Dimostrazione del Teorema 10.2 di Stone von Neumann. Prima di tutto notiamo che ogni
operatore W (z) ∈ B(H) deve essere non nullo: se fosse W (z0 ) = 0, avremmo che per ogni z ∈ X
e posto z − z0 =: v:
i
i
W (z) = e 2 σ(z0 ,v) W (z0 )W (v) = e 2 σ(z0 ,v) 0W (v) = 0 .
In questo caso lo spazio H non potrebbe essere irriducibile per la classe di tutti operatori
W (z) ∈ B(H). Concludiamo, applicando la definizione 10.5, che l’insieme dei W (z) ∈ B(H)
è un sistema di generatori per una realizzazione della ∗-algebra di Weyl A associata allo spazio
simplettico (X, σ). Tale realizzazione è data dalle combinazioni lineari finite dei prodotti finiti
degli operatori W (z) ed è l’immagine di una rappresentazione fedele π : A → B(H) di A .
Dopo avere scelto una base canonica in X, in modo tale da associare biettivamente ad ogni z ∈ X il
n , consideriamo lo spazio di Hilbert L2 (Rn , dx).
vettore delle sue componenti (t(z) , u(z) ) ∈ Rn ×R§
§
ªª
La classe di operatori non nulli (perché unitari) exp i
(z)
k=1 tk Xk
Pn
(z)
+ uk Pk
, per la proz∈X
posizione 10.4 definisce un’altra realizzazione della stessa ∗-algebra A ed una corrispondente
rappresentazione fedele π1 : A → B(L2 (Rn , dx)). Indicheremo con az§∈ A i generatori di Aª,
in modo tale che π(az ) = W (z) e contemporaneamente π1 (az ) = exp i
(z)
k=1 tk Xk
Pn
(z)
+ uk Pk
per ogni z ∈ X.
Supponiamo che esistano due vettori non nulli Φ0 ∈ H e Ψ0 ∈ L2 (Rn , dx) per cui D := π(A )Φ0
è un sottospazio denso in H, D1 := π1 (A )Ψ0 è denso in L2 (Rn , dx) e vale
(Φ0 |π(a)Φ0 ) = (Ψ0 |π1 (a)Ψ0 ) ,
per ogni a ∈ A .
(10.42)
Mostriamo che c’è di conseguenza un’applicazione lineare Se : D → D1 definita completamente
dalla richiesta:
e
Sπ(a)Φ
(10.43)
0 = π1 (a)Ψ0 per ogni a ∈ A ,
che si estende per continuità ad un isomorfismo di spazi di Hilbert da H a L2 (Rn , dx) soddisfacendo (10.39) e quindi provando il teorema di Stone- von Neumann. Prima di tutto verifichiamo
381
che l’applicazione sia ben definita: supponiamo che π(a)Φ0 = π(b)Φ0 , perché l’applicazione in
(10.43) sia ben definita deve accadere che π1 (a)Ψ0 = π1 (b)Ψ0 . Da π(a)Φ0 = π(b)Φ0 abbiamo
che, per ogni c ∈ A :
(π(c)Φ0 |π(a)Φ0 ) = (π(c)Φ0 |π(b)Φ0 )
Usando il fatto che π è una rappresentazione di ∗-algebre e pertanto: π(c∗ ) = π(c)∗ e π(f )π(d) =
π(f d), questa identità equivale a:
(Φ0 |π(c∗ a)Φ0 ) = (Φ0 |π(c∗ b)Φ0 )
e quindi, valendo (10.42):
(Ψ0 |π1 (c∗ a)Ψ0 ) = (Ψ0 |π1 (c∗ b)Ψ0 ) .
Procedendo in senso inverso troviamo infine che deve valere, per ogni c ∈ A :
(π(c)Φ0 |π(a)Φ0 ) = (π(c)Φ0 |π(b)Φ0 ) .
Dato che π(c)Φ0 spazia in tutto lo spazio denso D1 , concludiamo che deve essere, proprio come
volevamo provare, π1 (a)Ψ0 = π1 (b)Ψ0 . Pertanto Se in (10.43) è ben definita. Si verifica immediatamente, usando il fatto che π e π1 sono rappresentazioni, che Se è lineare. Per costruzione Se
preserva il prodotto scalare ed è quindi isometrica:
€
Š
∗
∗
e
e
Sπ(a)Φ
0 |Sπ(b)Φ0 = (π1 (a)Ψ0 |π1 (b)Ψ0 ) = (Ψ0 |π1 (a) π1 (b)Ψ0 ) = (Ψ0 |π1 (a )π1 (b)Ψ0 )
= (Ψ0 |π1 (a∗ b)Ψ0 ) = (Φ0 |π(a∗ b)Φ0 ) = (Φ0 |π(a∗ )π(b)Φ0 ) = (Φ0 |π(a)∗ π(b)Φ0 ) = (π(a)Φ0 |π(b)Φ0 ) .
Possiamo allora estendere, unicamente, per continuità la trasformazione Se dal dominio denso D
ad tutto lo spazio di Hilbert ottenendo un’applicazione lineare S : H → L2 (Rn , dx). L’estensione
S sarà ancora un operatore isometrico per continuità del prodotto scalare. In modo analogo
possiamo costruire sullo spazio denso D1 prima e poi su tutto lo spazio di Hilbert L2 (Rn , dx)
una trasformazione lineare isometrica S 0 : L2 (Rn , dx) → H che si ottiene estendendo unicamente
per continuità :
Se0 π1 (a)Ψ0 = π(a)Φ0 per ogni a ∈ A ,
(10.44)
Dato che sugli spazi densi D1 e D vale rispettivamente SeSe0 = ID1 e Se0 Se = ID , queste identità continueranno ad essere verificate per le estensioni continue sui domini estesi: SS 0 =
IL2 (Rn ,dx) e SS 0 = IH . In definitiva S : H → L2 (Rn , dx) è un isomorfismo di spazi di Hilbert che
soddisfa:
Sπ(a)Φ0 = π1 (a)Ψ0 per ogni a ∈ A .
(10.45)
Invertendo questa identità troviamo, per b ∈ A : π(b)Φ0 = S −1 π1 (b)Ψ0 . Sostituendo questo
risultato in (10.45), dopo avere rimpiazzato π(a) da π(ab) = π(a)π(b), si trova:
Sπ(a)S −1 π1 (b)Ψ0 = π1 (a) π1 (b)Ψ0 .
Dato che i vettori π1 (b)Ψ0 definiscono uno spazio denso in L2 (Rn , dx), abbiamo ottenuto:
Sπ(a)S −1 = π1 (a)
382
per ogni a ∈ A .
Scegliendo az ∈ A §
che corrisponde ad un generico
generatore, in modo tale che π(a) = W (z) e
ª
Pn
(z)
(z)
quindi π1 (a) = exp i k=1 tk Xk + uk Pk , l’identità ottenuta si riduce alla (10.39).
Per concludere la dimostrazione è ora sufficiente esibire i vettori Φ0 e Ψ0 che soddisfano (10.42)
e che generino, sotto l’azione delle rispettive rappresentazioni, sottospazi densi. Se Φ0 è un
qualsiasi vettore non nullo, il sottospazio chiuso π(A )Φ0 è invariante sotto l’azione di ogni π(a) e,
in particolare, di ogni π(W (z)) per costruzione. Dato che H è irriducibile rispetto a tali operatori,
deve accadere che D := π(A )Φ0 è un sottospazio denso in H. Con lo stesso ragionamento si ha
che D1 := π1 (A )Ψ0 è denso in L2 (Rn , dx) per ogni vettore non nullo Ψ0 ∈ L2 (Rn , dx).
Consideriamo, nello spazio L2 (Rn , dx) il vettore Ψ0 dato da, se ψ0 è la prima funzione di Hermite:
Ψ0 (x1) = ψ0 (x1 ) · · · ψ(xn ) = π −n/4 e−|x|
Il calcolo diretto basato sul lemma 10.1 fornisce:
„ Ž
( n
)
Ψ0 exp i
e quindi
„ X
tk Xk + uk Pk
Ψ0
= π −n/2
eit·x e−|x+u|
.
2 /2
dx = e−|t|
2 /4−|u|2 /4
Rn
k=1
( n
)
X
Ψ0 exp i
tk Xk + uk Pk Ψ0
k=1
Z
2 /2
Ž
= e−(|t|
2 +|u|2 )/4
,
per ogni (t, u) ∈ Rn × Rn .
(10.46)
Se riusciamo a determinare un vettore Φ0 ∈ H che soddisfi:
(Φ0 |W (z) Φ0 ) = e−(|t
(z) |2 +|u(z) |2 )/4
,
per ogni z ∈ X,
(10.47)
allora l’identità (10.42) risulta essere soddisfatta per linearità , tenendo conto che ogni elemento
π1 (a) è una combinazione lineare di elementi π1 (az ) ed il corrispondente π(a) è una combinazione
lineare (con gli stessi coefficienti) di elementi π(az ). L’esistenza di Φ0 è garantita dalla seguente
proposizione.
Proposizione 10.5. Nelle ipotesi del teorema 10.2, se è stata scelta una base canonica in
X, in modo tale da associare biettivamente ad ogni z ∈ X il vettore delle sue componenti
(t(z) , u(z) ) ∈ Rn × Rn , esiste Φ0 ∈ H che soddisfa la (10.47).
Prova. Per prima cosa osserviamo che gli operatori W (z) sono unitari con W (0) = I in conseguenza dell’osservazione (3) dopo il teorema 10.4 e tenuto conto del fatto che H è irriducibile
rispetto alla classe degli operatori W (z). Nel seguito W ((t(z) , u(z) )) := W (z).
Mostriamo ora che le funzioni a valori operatoriali unitari Rn 3 t 7→ W ((t, 0)) e Rn 3 u 7→
W ((0, t)) sono continue nella topologia operatoriale forte (si osservi che l’ipotesi di regolarità s-lims→0 W (sz) = W (0) = I è più debole della forte continuità in z = 0, dato che il limite potrebbe non essere uniforme nelle varie direzioni verso l’origine). Dimostriamo ciò per
383
Rn 3 t 7→ W ((t, 0)) essendo identica la dimostrazione per l’altra funzione. Le relazioni di
Weyl implicano che valga la regola di additività : W ((t, 0))W ((t0 , 0)) = W ((t + t0 , 0)). In
conseguenza di ciò la continuità in senso forte in t = 0 implica quella in qualsiasi altro punto
e ci riduciamo pertanto a provare la continuità in senso forte in z = 0. In base alla stessa
regola di additività , se e1 , . . . , en indica la parte di base canonica su cui si decompongono
P
i vettori come t = nk=1 tk ek , possiamo scrivere: W ((t, 0)) = W ((t1 e1 , 0)) · · · W ((tn en , 0)).
Ognuna delle funzioni R 3 tk 7→ W ((tk ek , 0)) è fortemente continua a causa dell’ipotesi di
regolarità s-lims→0 W (sz) = W (0) = I nel teorema 10.2. Sia ora ψ ∈ H, mostriamo che
||W ((t, 0))ψ − ψ|| → 0
se t → 0 .
Vale infatti:
Y
n
||W ((t, 0))ψ − ψ|| = W ((tk ek , 0))ψ − ψ k=1
Y
n−1
n−1
n−2
Y
Y
n
Y
≤ W ((tk ek , 0))ψ −
W ((tk ek , 0))ψ + W ((tk ek , 0))ψ −
W ((tk ek , 0))ψ + · · ·
k=1
k=1
k=1
k=1
+ ||W ((t1 e1 , 0))ψ − ψ||
= ||W ((tn en , 0))ψ − ψ|| + ||W ((tn−1 en−1 , 0))ψ − ψ|| + · · · + ||W ((t1 e1 , 0))ψ − ψ|| ,
dove nell’ultimo passaggio abbiamo tenuto conto del fatto che gli operatori W ((tk ek , 0)) sono
unitari e pertanto conservano la norma e quindi, per esempio:
Y
n−1
n−1
Y
n
Y
W ((tk ek , 0))ψ −
W ((tk ek , 0))ψ = W ((tk ek , 0)) (W ((tn en , 0))ψ − ψ)
k=1
k=1
k=1
= ||W ((tn en , 0))ψ − ψ|| .
La disuguaglianza:
||W ((t, 0))ψ − ψ|| ≤
n
X
||W ((tk ek , 0))ψ − ψ||
k=1
e la continuità per tk → 0 delle funzioni W ((tk ek , 0))ψ implicano che valga W ((t, 0))ψ → ψ per
t → 0 lavorando con intorni di z = 0 costruiti come prodotti di intervalli lungo gli assi cartesiani.
In virtù di quanto appena provato, per ogni scelta di vettori φ1 , φ2 , la funzione
X 3 z 7→ (φ1 |W (z) φ2 ) = W ((t(z) , 0))∗ φ1 W ((0, u(z) )) φ2
è continua. Di conseguenza è ben definito l’integrale (la misura dz è la misura di Lebesgue su
Rn × Rn rispetto alle coordinate (t(z) , u(z) )):
I(φ1 , φ2 ) = (2π)−n
Z
e−|z|
R2n
384
2 /4
(φ1 |W (z) φ2 ) dz .
Dato che (φ1 , φ2 ) 7→ I(φ1 , φ2 ) è lineare a destra ed antilineare a sinistra e vale la stima |I(φ1 , φ2 )| ≤
||φ1 || ||φ2 ||, il teorema di Riesz implica facilmente che esiste un unico operatore P ∈ B(H) che
soddisfa ||P || ≤ 1 e (φ1 |P φ2 ) = I(φ1 , φ2 ) per ogni φ1 , φ2 ∈ H. Abbiamo l’ulteriore risultato che
P ∗ = P che segue dall’identità :
∗
−n
(φ1 |P φ2 ) = (φ2 |P φ1 ) = (2π)
Z
e−|z|
2 /4
R2n
(φ2 |W (z) φ1 ) dz ,
tenendo conto del fatto che la misura dz ed il fattore exp −|z2 /4| sono invarianti per riflessione
z → −z e che vale:
(φ2 |W (z) φ1 ) = (W (z)φ1 | φ2 ) = (φ1 | W (z)∗ φ2 ) = (φ1 | W (−z)φ2 ) .
L’operatore P non può essere nullo: se fosse P = 0 avremmo:
0 = φ1 |W (z0 )P W (z0 )φ2 = (2π)−n
Z
e−|z|
2 /4
R2n
φ1 W (z0 )W (z)W (z0 ) φ2 dz
e cioé , usando le relazioni di Weyl:
0 = (2π)−n
Z
e−|z|
2 /4
eit
(z0 ) ·t(z) −iu(z0 ) ·u(z)
R2n
(φ1 |W (z) φ2 ) dz
2
Questo equivale a dire che la trasformata di Fourier della funzione L1 z 7→ e−|z| /4 (φ1 |W (z) φ2 )
è nulla e quindi, per (f) di proposizione 3.12: z 7→ (φ1 |W (z) φ2 ) = 0 quasi ovunque. Dato che
la funzione è continua questo significa che essa è nulla ovunque e quindi W (z) = 0, ma questo
è impossibile come detto precedentemente. Mostriamo infine che vale l’ulteriore identità :
P W (z)P = e−|z|
2 /4
P.
(10.48)
Sappiamo che:
(φ1 |P W (z)P φ2 ) = (W (−z)P φ1 |P φ2 ) = (2π)
= (2π)−n
Z
dz 0 e−z
02 /4
R2n
−n
Z
dz 0 e−z
Rn
0
02 /4
φ1 |P W (z)W (z0 )φ2
e−iσ(z,z )/2 φ1 |P W (z + z0 )φ2 .
Ripetendo la procedura con il prodotto scalare rimasto abbiamo alla fine che:
(φ1 |P W (z)P φ2 )
=
1
(2π)2n
Z
Z
dz 0
dz 00 e−(z
02 +z002 )/4
0
e−iσ(z,z )/2 e−iσ(z
00 ,z+z0 )/2
φ1 |W (z + z0 + z00 )φ2 .
(10.49)
L’ordine d’integrazione può essere scambiato per il teorema di Fubini-Tonelli dato che, nelle variabili della misura prodotto, l’integrando converge assolutamente ed esponenzialmente a zero all’infinito, a causa delle funzioni esponenziali e della stima | (φ1 |W (z + z0 + z00 )φ2 ) | ≤ ||φ1 || ||φ2 ||.
385
Cambiando variabili e passando alle nuove variabili d’integrazione ζ := z0 + z00 + z e Z := z0 − z00 ,
con qualche passaggio, in particolare integrando in dZ, l’identità (10.49) si trasforma in:
(φ1 |P W (z)P φ2 ) = e−|z|
2 /4
(2π)−n
Z
e−|ζ|
R2n
2 /4
(φ1 |W (ζ) φ2 ) dζ
che equivale alla (10.48). Dalla (10.48), scegliendo z = 0 si ricava: P P = P e quindi si conclude
che P è un proiettore ortogonale non nullo. Se Φ0 ∈ P (H) \ {0} con ||Φ0 || = 1, dovendo essere
P Φ0 = Φ0 , la stessa (10.48) implica che, per ogni z ∈ X:
(Φ0 |W (z)Φ0 ) = e−|z|
2 /4
= e−(|t
(z) |2 +|u(z) |2 )/4
.
Abbiamo pertanto trovato un vettore che soddisfa l’identità (10.47) e la dimostrazione della proposizione è conclusa. 2
La prova della precedente proposizione conclude la dimostrazione del teorema di 10.2 (di Stonevon Neumann). 2
Dimostrazione del Teorema 10.3 di Mackey. Il fatto che le ipotesi (a1), (a2) e (a3) siano equivalenti è conseguenza immediata del commento (4) dopo il Teorema 10.4. Notiamo che in virtù di
tali ipotesi gli operatori W (z) sono tutti unitari con W (0) = I. Usando tale fatto possiamo seguire nuovamente la dimostrazione del teorema 10.4, che usava solo il fatto che gli operatori W (z)
sono tutti unitari con W (0) = I, ma non direttamente l’irriducibilità della rappresentazione, e
costruire il proiettore ortogonale P , individuato completamente dalla richiesta che
(φ1 |P φ2 ) = (2π)−n
Z
e−|z|
2 /4
R2n
(φ1 |W (z) φ2 ) dz ,
per ogni z ∈ R2n e φ1 , φ2 ∈ H .
in modo tale che ogni vettore Φ0 ∈ P (H) verifichi.
(Φ0 |W (z)Φ0 ) = e−|z|
2 /4
= e−(|t
(z) |2 +|u(z) |2 )/4
.
Mostriamo ora che lo spazio H0 dato dalla chiusura dello spazio generato da tutti gli W (z)P (H),
coincide con H stesso. Sia H1 l’ortogonale di tale spazio. Per costruzione H1 è invariante sotto
l’azione di tutti gli operatori W (z) come è facile provare. Possiamo allora lavorare nello spazio
di Hilbert H1 e, se H1 6= {0}, costruire l’unico proiettore ortogonale P1 tale che
(φ01 |P1 φ02 ) = (2π)−n
Z
R2n
e−|z|
2 /4
φ01 |W (z) φ02 dz ,
per ogni z ∈ R2n e φ1 , φ2 ∈ H1 .
Ma il secondo membro vale (φ01 |P φ02 ), che a sua volta vale zero, visto che φ02 ∈ H1 ⊥ P (H). In
definitiva P1 = 0. Questo è impossibile H1 6= {0} dato che deve anche valere, se Φ1 ∈ P1 (H),
(Φ1 |W (z)Φ1 ) = e−|z|
2 /4
= e−(|t
386
(z) |2 +|u(z) |2 )/4
6= 0 .
Concludiamo che H1 = {0} e quindi H0 = H. Sia {Φk }k∈I una base hilbertiana di P (H) e siano
Hk i sottospazi chiusi ottenuti prendendo, rispettivamente per ogni fissato k ∈ I, la chiusura
dello spazio generato da tutti i vettori W (z)Φk quando z ∈ R2n . Dato che vale la (10.48), se
i 6= k
2
(Φj |W (z)Φk ) = (Φj |P W (z)P Φk ) = e−|z| /4 (Φj |P Φk ) = 0 .
Abbiamo trovato che gli spazi Hj sono mutuamente ortogonali (quindi in particolare, j varia in
un insieme j numerabile se H è separabile). Per costruzione si ha anche che lo spazio vettoriale
generato dall’azione di tutti gli operatori W (z) su tutti i vettori Φk è denso in H. In altre parole,
lo spazio delle combinazioni lineari finite di vettori negli spazi mutuamente ortogonali Hk è denso
in H, cioè H è somma diretta ortogonale (o hilbertiana) dei sottospazi chiusi Hk con k ∈ I.
Per concludere notiamo per ogni spazio di Hilbert Hk possiamo utilizzare nuovamente la dimostrazione già fatta per il teorema di Stone-von Neumann, con le stesse notazioni usate nella
dimostrazione del teorema di Stone-von Neumann dove ora H è rimpiazzato da Hk e la rappresentazione π : A → B(H) è rimpiazzata da πk : A → B(Hk ), ottenuta restringendo le immagini di
ciascun operatore di π(A ) al sottospazio invariante Hk . L’unica differenza con la dimostrazione
citata è che, in questo caso, la richiesta che πk (A )Φk sia denso in Hk è verificata per ipotesi
invece che come conseguenza del fatto che πk (A ) sia irriducibile. Si ottiene in questo modo che
la restrizione πk (A ) di π(A ) ad ogni sottospazio invariante Hk è unitariamente equivalente alla
rappresentazione standard π1 (A ) su L2 (Rn , dx). Dato che quest’ultima è irriducibile lo deve
anche essere ogni πk . Questo completa la dimostrazione. 2.
10.2.6
Commenti finali sul teorema di Stone-von Neumann: il gruppo di
Heisenberg.
Il teorema di Stone-von Neumann si esprime nel gergo della fisica teorica, con l’affermazione:
“tutte le rappresentazioni irriducibili dell’algebra di Weyl con un numero finito e fissato di gradi
di libertà sono unitariamente equivalenti,”
o anche
“tutte le rappresentazioni irriducibili delle CCR con un numero finito e fissato di gradi di libertà
sono unitariamente equivalenti,”.
Sopra unitariamente equivalenti si riferisce all’esistenza dell’isomorfismo di spazi di Hilbert S e
il numero finito di gradi di libertà è riferito alla dimensione finita dello spazio simplettico X sul
quale è costruita l’algebra di Weyl.
Cosa accade nel caso infinito dimensionale? Assumendo comunque l’irriducibilità e passando,
da X finito dimensionale – descrivente per es. le coordinate del punto materiale nello spazio
delle fasi – a X infinito dimensionale – descrivente per es. un appropriato spazio di soluzioni di
equazioni di campo bosoniche libere–, il teorema di Stone - von Neumann cessa di valere. Nel
linguaggio dei fisici teorici si dice che:
“Esistono rappresentazioni delle CCR con un numero infinito di gradi di libertà che non sono
unitariamente equivalenti,”.
In pratica, in questo caso, si trovano rappresentazioni irriducibili fortemente continue π1 e π2 ,
387
su rispettivi spazi di Hilbert (separabili) H1 , H2 , della ∗-algebra di Weyl A := W (V, σ) (in
questo contesto pensata come C ∗ -algebra senza modificare i risultati) associata al sistema fisico
in considerazione (tipicamente un campo bosonico quantizzato) per le quali non esiste alcun
isomorfismo di spazi di Hilbert S : H1 → H2 tale che:
Sπ1 (a) S −1 = π2 (a) ,
per ogni a ∈ A .
Coppie di rappresentazioni siffatte sono dette inequivalenti o anche unitariamente inequivalenti.
Il passaggio da X finito dimensionale a X infinito dimensionale corrisponde al passaggio dalla
meccanica quantistica alla teoria dei campi quantistica (anche relativistica e su spaziotempo curvo). In tali contesti (ma non solo), l’esistenza di rappresentazioni inequivalenti è spesso legata a
quella che si chiama rottura spontanea della simmetria. L’esistenza di rappresentazioni inequivalenti per uno stesso sistema fisico (individuato dalla coppia (X, σ)), mostra che la formulazione
della teoria in un fissato spazio di Hilbert è inadeguata e bisogna emanciparsi dalla struttura di
spazio di Hilbert per fondare le teorie quantistiche con maggiore generalità. Questo programma
è stato largamente sviluppato, a partire da lavori pionieristici dello stesso von Neumann, e si
chiama oggi formulazione algebrica delle teorie di campo quantistiche. In questo ambito, per
esempio, si è potuta dare una veste rigorosa alla teoria dei campi in spaziotempo curvo anche
in relazione ai fenomeni quantistici connessi alla termodinamica dei buchi neri.
Un altro punto da sottolineare è che la particella elementare con spin 0 è descritta da una
rappresentazione irriducibile di un’algebra (quella di Weyl). Si vede che la stessa cosa accade
prendendo particelle con spin, carica ecc... allargando opportunamente l’algebra (o il gruppo) di
riferimento. I sistemi elementari sono in tal modo descritti da rappresentazioni irriducibili di una
certa algebra, in genere associata ad un gruppo di simmetria del sistema. Questo punto di vista
si è rivelato fecondissimo nello sviluppo delle teorie quantistiche relativistiche – in particolare
ad opera di Wigner – dove l’algebra usata per definire le particelle elementari non è più quella di Weyl, ma la condizione di irriducibilità rimane come caratterizzante un sistema elementare.
Facciamo ora qualche commento di carattere matematico sul teorema di Stone-von Neumann.
Useremo qui alcune nozioni che discuteremo più approfonditamente nel cap.11.
Il nostro approccio si è basato sulla struttura di ∗-algebra (di Weyl) Tuttavia esiste un altro
punto di vista, dovuto a Weyl e basata sul gruppo di Heisenberg, detto per tale motivo
anche gruppo di Weyl-Heisenberg. Il gruppo di Heisenberg su R2n+1 , H (n), è il gruppo di Lie
semplicemente connesso dotato della struttura differenziabile indotta da R2n+1 e con legge di
composizione (al solito t ∈ Rn e u ∈ Rn , mentre η ∈ R)
0
0
0
(η, t, u) ◦ (η , t , u ) =
n
1X
η+η +
ui t0 − u0i ti , t + t0 , u + u0
2 i=1 i
0
!
.
Un calcolo diretto dell’algebra di Lie di questo gruppo mostra che esiste una base dell’algebra
composta da 2n + 1 generatori: xi , pi , e con i = 1, 2, . . . , n e tali generatori soddisfano le
relazioni di commutazione:
[xi , pj ] = δij e ,
[xi , e] = [pi , e] = 0 ,
388
i, j = 1, 2, . . . , n .
Di conseguenza, se definiamo l’algebra di Lie delle combinazioni lineari reali finite degli operatori
anti-autoaggiunti −iI, −iXk , −iPk ristretti al dominio comune denso ed invariante S(Rn ) e con
commutatore [·, ·], l’applicazione lineare individuata da e 7→ −iI, xk 7→ −iXk e pk 7→ −iPk è un
isomorfismo di algebre di Lie. Questo isomorfismo si estende a tutto il gruppo di Heisenberg.
Infatti, se gli operatori W ((t, u)) sono definiti come in proposizione 10.4, la funzione:
R2n+1 3 (η, t, u) 7→ eiη W ((t, u)) =: H((η, t, u))
(10.50)
definisce una rappresentazione unitaria irriducibile e fedele (cioè iniettiva) del gruppo di Heisenberg 2n + 1 dimensionale su L2 (Rn , dx) come si prova facilmente per ispezione diretta.
Ulteriormente vale:
s- lim H(s(η, t, u)) = I
s→0
per ogni fissato (η, t, u) ∈ R2n+1 .
(10.51)
Viceversa, abbiamo che:
Proposizione 10.7. Se:
R2n+1 3 (η, t, u) 7→ H((η, t, u))
è una rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) sullo spazio di Hilbert
H, che soddisfa la (10.51), allora deve essere necessariamente della forma:
H((η, t, u)) = eiη W ((t, u)) ,
dove gli operatori W ((t, u)) soddisfano le ipotesi del teorema 10.2 di Stone-von Neumann.
Prova. Il fatto che valga la (10.50) segue dal fatto che il sottogruppo abeliano R del gruppo di
Heisenberg deve essere rappresentato da un sottogruppo abeliano unitario. Ora, il fatto che gli
elementi di R commutino con tutti gli elementi del gruppo di Weyl implica che ogni elemento
H((η, 0, 0)) commuti con tutta la rappresentazione. Dato che la rappresentazione è irriducibile,
questo implica, per il lemma di Schur, che H((η, 0, 0)) = χ(η)I con χ(η) ∈ C e deve valere
|χ(η)| = 1 dato che H((η, 0, 0)) è unitario. Infine, dato che η → H((η, 0, 0)) è fortemente continuo, il teorema di Stone implica che χ(η) = eicη per ogni η ∈ R e qualche costante c. Le relazioni
di commutazione del gruppo richiedono infine che c = 1. Le stesse relazioni di commutazione
implicano la validità delle relazioni di Weyl per gli operatori W ((t, u)). 2
In questo contesto una formulazione alternativa (la prima volta dimostrata da Weyl) del teorema
di Stone – von Neumann si enuncia dicendo che:
Teorema 10.5. Ogni rappresentazione unitaria irriducibile del gruppo di Heisenberg H (n) che
soddisfa la (10.51), è equivalente, tramite una trasformazione unitaria, alla rappresentazione su
L2 (Rn , dx):
R2n+1 3 (η, t, u) 7→ eiη W ((t, u)) .
389
dove gli operatori W ((t, u)) sono definiti in proposizione 10.4.
Prova. Con il nostro approccio, la dimostrazione segue immediatamente dal teorema 3.10 e dalla
proposizione 10.7. 2
Esistono infine formulazioni più o meno rigorose del teorema di Stone - von Neumann basate
sulle sole relazioni di commutazione di Heisenberg (10.10) senza passare agli esponenziali (vedi
[CCP82] per alcune discussioni euristiche non completamente rigorose). In tal caso però le ipotesi
tecniche sui domini (spazi di vettori analitici) e sull’esistenza di estensioni autoaggiunte, sono
non ovvie e non hanno un diretto significato fisico. Un risultato rigoroso importante è quello
di J. Dixmier4 ed anche il fondamentale lavoro di E. Nelson5 , su cui torneremo nel prossimo
capitolo, in cui si prova, generalizzandolo ad un numero finito ma arbitrario di dimensioni, che
se P e Q sono simmetrici su un sottospazio denso invariante su cui soddisfano le relazioni di
Heisenberg e P 2 + Q2 è essenzialmente autoaggiunto su tale spazio, allora P e Q generano una
rappresentazione fortemente continua dell’algebra di Weyl sullo spazio di Hilbert e quindi, a
meno di isomorfismi di spazi di Hilbert hanno la solita forma su L2 (R, dx).
10.3
Il principio di corrispondenza di Dirac.
Rimane fino ad ora aperto il problema di come sia possibile individuare gli operatori in H corrispondenti alle osservabili di interesse fisico differenti da posizione ed impulso. È stato scritto
moltissimo da parte di numerosi ed importanti autori su procedure che permettano di passare da
osservabili classiche importanti ad osservabili quantistiche importanti. Bisogna dire comunque
che, in un certo senso, si tratta di una “battaglia persa in partenza”: dal punto di vista fisico,
la Meccanica Quantistica è più fondamentale di quella classica e pertanto la Meccanica Classica
dovrebbe essere vista come caso limite della Meccanica Quantistica, anche se non è per nulla
facile dimostrare ciò a parte pochi risultati generali noti tra cui il teorema di Eherenfest la cui
formulazione rigorosa è stata data solo di recente6 . Ci si aspetta di conseguenza che ci siano enti
fisici quantistici, in particolare osservabili, che non hanno corrispondente classico. Un esempio
è sicuramente lo spin delle particelle.
Fatta questa premessa, possiamo dire che, in linea di principio, per la particella senza spin, alcune osservabili quantistiche rilevanti saranno “funzioni” delle osservabili Xi e Pi . Ci si aspetta
che, se F (x, p) è una grandezza classica, la corrispondente grandezza quantistica sia qualcosa
del tipo F (X, P ). Tuttavia questa strada è molto più ardua da percorrere di quanto si creda per
motivi di carattere matematico. Infatti: (1) non è affatto ovvio come dare significato ad una
funzione di X e P quando questi operatori hanno misure spettrali che non commutano (nel caso
di operatori con misure spettrali commutanti si possono usare procedure basate su cosiddette
4
J. Dixmier, “Sur la Relation i(P Q − QP ) = I” Compos. Math. 13, (1956), 263-269.
E. Nelson,“Analytic Vectors” Ann. Math. 70, (1959), 572-614.
6
G.Friesecke, M.Koppen, On the Ehrenfest theorem of quantum mechanics, J. Math. Phys.50, 082102-082102-6
(2009).
5
390
joint measures che, in pratica, corrispondono ad una misura prodotto), (2) le ricette ingenue
che cercano di percorrere questa via in genere non producono operatori autoaggiunti e nemmeno
simmetrici quando sono coinvolti operatori non commutati.
A titolo di esempio, si consideri la grandezza classica x · p. A quale osservabile – cioé operatore
autoaggiunto – dovrebbe corrispondere? Non conviene passare per le misure spettrali degli operatori perché queste non commutano. Allora proviamo ad usare gli stessi operatori ristretti ad
uno spazio invariante e denso su cui sono entrambi definiti. La speranza è di produrre un operatore essenzialmente autoaggiunto o almeno simmetrico e poi selezionarne, con qualche criterio,
le estensioni autoaggiunte (se ce ne sono nel secondo caso). In quest’ottica, la risposta:
P
“x · p corrisponde a X · P (= ni=1 Xi Pi )”
sarebbe del tutto inadeguata, anche interpretando gli operatori come definiti nello spazio invariante e denso S(R3 ). Questo perché X · P non è un operatore simmetrico su tale spazio, non
commutando Xi e Pi (lo si verifichi per esercizio). Pertanto non ha nemmeno senso cercare
estensioni autoaggiunte di X · P .
Un’altra possibilità è quella di associare a x · p l’operatore simmetrico (X · P + P · X)/2 definito
su S(R3 ) e quindi studiarne le estensioni autoaggiunte. Tuttavia se si prendono in considerazione
casi più complessi, come x2k pk , si vede che questa ricetta è fortemente ambigua, perché ci sono
più possibilità ammissibili a priori: (Xk2 Pk + Pk Xk2 )/2 è simmetrico sul dominio S(R3 ), ma lo è
anche Xk (Xk Pk + Pk Xk )/4 + (Xk Pk + Pk Xk )Xk /4 e ci sarebbero ancora altre possibilità.
Un criterio per aiutare nella scelta, ma che non risolve in generale i problemi sollevati, è dovuto
allo stesso Dirac e si chiama solitamente “principio di corrispondenza di Dirac”. Per discuterlo,
Ricordiamo che un’algebra di Lie è una coppia (V, [·, ·]), dove V è uno spazio vettoriale reale
e [·, ·] : V × V → V, detto commutatore dell’algebra di Lie, è un’applicazione bilineare,
antisimmetrica, che soddisfa l’identità di Jacobi:
[u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0 ,
per ogni u, v, w ∈ V.
Dirac notò che, per lo spazio delle fasi della particella classica F (in realtà ciò a validità del
tutto generale), la coppia (G(F), {·, ·}), dove G(F) è lo spazio vettoriale reale delle funzioni
sufficientemente regolari a valori reali definite sullo spazio delle fasi, e {·, ·} è la parentesi di
Poisson:
X ∂f ∂g
∂g ∂f
{f, g} :
−
, f, g ∈ G(F) ,
∂xi ∂pi ∂xi ∂pi
i
è un’algebra di Lie. Si noti in particolare che valgono le relazioni di commutazione canoniche
{xi , pj } = δij .
Queste relazioni sono le relazioni di Heisenberg quando si sostituiscono xi → Xi , pi → Pi e
{·, ·} → −i~−1 [·, ·]. L’idea di Dirac è allora la seguente “Principio di Corrispondenza di Dirac”.
Se fˆ denota il corrispondente quantistico (operatore almeno simmetrico definito su un dominio
denso invariante indipendente dalla grandezza particolare considerata) della generica grandezza
391
classica f ∈ G(F), la corrispondenza deve essere tale che, se vale classicamente
h = {f, g} ,
allora deve valere quantisticamente:
ĥ = −i~−1 [fˆ, ĝ]
per ogni terna di grandezze classiche f, g, h ∈ G(F) e corrispondenti quantistiche fˆ, ĝ, ĥ.
A titolo di esempio, se si considera la solita particella classica, le componenti del momento
angolare classico:
li =
3
X
ijk xj pk ,
j,k=1
corrispondono agli operatori, che risultano essere essenzialmente autoaggiunti su S(R3 ),
Li =
3
X
ijk Xj Pk ,
j,k=1
e le relazioni di commutazione classiche
{li , lj } =
3
X
ijk lk ,
k=1
corrispondono alle analoghe relazioni quantistiche su S(R3 ):
[Li , Lj ] = i~
3
X
ijk Lk .
k=1
Una giustificazione possibile del principio di Dirac si può dare per le osservabili che corrispondono
ad i generatori di trasformazioni unitarie che rappresentano l’azione di un gruppo di simmetria
sul sistema fisico. In tal caso è naturale richiedere che (a) l’algebra di Lie del gruppo, (b)
quella della rappresentazione unitaria che rappresenta le trasformazioni sul sistema quantistico
e (c) l’algebra di Lie dei generatori del gruppo delle trasformazioni canoniche classiche che
corrispondono alle trasformazioni di simmetria sul sistema classico, siano tutte e tre isomorfe.
Non ci addentreremo ulteriormente in questa direzione, diciamo solo che, in un certo senso, le
idee di Dirac hanno trovato sviluppo rigoroso in certe procedure di quantizzazione che cadono
sotto il nome di Quantizzazione à la Weyl7 nella quale non ci addentreremo.
7
Vedi per esempio: C. Zachos, D. Fairlie, and T. Curtright, Quantum Mechanics in Phase Space, World
Scientific, Singapore, 2005.
392
Capitolo 11
Introduzione alle Simmetrie
Quantistiche.
In questo capitolo continueremo la presentazione della struttura matematica della Meccanica
Quantistica, introducendo alcune nozioni fondamentali e strumenti matematici di grande rilievo.
La prima sezione è dedicata alla nozione e caratterizzazione di simmetra quantistica. Dopo avere
dato qualche esempio, ed avere discusso quallo che accade in presenza di regole di superselezione,
daremo la definizione di simmetria nel senso di Kadison e poi di simmetria nel senso di Wigner.
Dimostreremo poi i teoremi di Wigner e Kadison che provano che le due nozioni coincidono e
sono implementate da operatori unitari oppure anti unitari.
Nella seconda sezione, passeremo quindi al problema della rappresentazione di gruppi di simmetria, introducendo le nozioni di rappresentazioni proiettive, unitarie proiettive e di estensione
centrale di un gruppo (di simmetria) tramite U (1).
La terza sezione sarà inizialmente dedicata alla nozione di gruppo di simmetria topologico ed allo
studio delle rappresentazioni unitarie proiettive fortemente continue. Esamineremo, in particolare il caso notevole del gruppo topologico abeliano R, che ha importanti applicazioni in Meccanica
Quantistica. Successivamente, dopo avere richiamato alcune definizioni e risultati generali della
teoria dei gruppi ed algebre di Lie, presenteremo alcuni importanti risultati dovuti a Bargmann,
Gårding e Nelson (ed alcune generalizzazioni di tali risultati), riguardanti le rappresentazioni
unitarie proiettive ed unitarie di gruppi di Lie. A titolo di esempio di grande importanza fisica
studieremo le rappresentazioni unitarie del gruppo di simmetria SO(3) in realzione allo spin.
Per concludere, applicheremo tutta la teoria presentata al gruppo di Galileo fino ad enunciare e
provare la regola di Bargmann di superselezione della massa.
11.1
Nozione e caratterizzazione di simmetrie quantistiche.
Una nozione estremamente importante in meccanica quantistica, anche per gli sviluppi successivi
nelle teorie quantistiche dei campi, è la nozione di simmetria di un sistema quantistico. In
393
realtà esistono due nozioni di simmetria, una dinamica ed una più elementare, che non coinvolge
l’evoluzione temporale. In questa sezione ci occuperemo del caso più elementare.
Consideriamo un sistema fisico S, descritto nello spazio di Hilbert HS e con spazio degli stati
S(HS ) e sottoinsieme degli stati puri Sp (HS ). Quando agiamo con una trasformazione fisica g
sul sistema S, ne alteriamo lo stato quantistico. Alla trasformazione fisica g corrisponderà quindi
un’applicazione γg : S(HS ) → S(HS ) nello spazio degli stati oppure, volendoci restringere agli
stati puri: γg : Sp (HS ) → Sp (HS ). Il legame tra g e γg per il momento non ci interessa ed
ammetteremo solo che sia noto; in ogni caso dipenderà dalla descrizione matematica di S. Se
γg soddisfa certi requisiti che preciseremo in seguito, γg viene detta simmetria del sistema. Con
abuso di linguaggio diremo a volte che g stessa è una simmetria del sistema quando lo è γg . I
requisiti affinché γg sia una simmetria sono due:
(a) che γg sia biettiva,
(b) che conservi qualche struttura matematica, per il momento non ancora specificata, dello
spazio degli stati S(HS ) o in quello degli stati puri Sp (HS ), che abbia qualche significato fisico
preciso.
Da un punto di vista fisico, il requisito (a) può essere in realtà imposto sulla trasformazione
fisica g che agisce sul sistema, e corrisponde alla richiesta che g sia reversibile, cioè che (i) esista
una trasformazione fisica inversa g −1 , associata all’applicazione γg−1 : S(HS ) → S(HS ), che
ritrasformi il sistema, rispettivamente, lo stato quantistico, nella situazione iniziale, e (ii) si deve
poter raggiungere qualsiasi configurazione del sistema, rispettivamente, qualsiasi stato quantistico, attraverso l’azione di g, rispettivamente di γg , scegliendo opportunamente la situazione di
partenza.
Le differenze tra le varie nozioni note di simmetria dipendono dalla precisazione del requisito
(b), cioè dal tipo di struttura che rimane invariata sotto l’azione di γg . La struttura più semplice
che tale applicazione può conservare è quella convessa dello spazio degli stati, che corrisponde
fisicamente al fatto che uno stato si possa costruire miscelando altri stati con certi pesi statistici.
Le operazioni di simmetria, in questo caso, alterano lo stato, ma non alterano i pesi statistici
usati nella miscela. Questo genere di simmetrie quantistiche sono quelle definite da Kadison1 .
Un seconda classe di simmetrie è quella dovuta a Wigner2 e si riferisce alle funzioni che agiscono
da Sp (HS ) in Sp (HS ) e richiede che le simmetrie preservino la struttura di spazio metrico che
ha lo spazio dei raggi. Tradotto nel linguaggio fisico, le trasformazioni modificano gli stati puri,
ma lasciano invariate le probabilità di transizione tra coppie di stati puri. Una terza classe, della
quale non ci occuperemo, è quella individuata da Segal3 che concerne la struttura di algebra di
Jordan delle osservabili. Nel seguito studieremo i primi due tipi di simmetrie e proveremo che, a
livello matematico, sono in realtà la stessa cosa, ma anche che sono sempre descritte dall’azione
1
Vedi R. Kadison, Isometries of Operator Algebras, Annals of Mathematics, 54 325-338, 1951.
E. Wigner, Group Theory and its Applications to the Quantum Theory of Atomic Spectra, Academic Press,
1959.
3
I. Segal, Ann. Math. 48, 930-940 (1947)
2
394
di operatori unitari oppure anti unitari (quindi le simmetrie di Wigner si possono estendere a
simmetrie di Kadison su tutto lo spazio degli stati). Questo risultato di caratterizzazione delle
simmetrie in termini di operatori unitari o antiunitari è di enorme importanza in fisica ed è stato
formulato in due teoremi che portano il nome di Teorema di Kadison e Teorema di Wigner
rispettivamente. Il secondo è molto più noto del primo tra i fisici, anche se il primo è almeno
altrettanto importante.
11.1.1
Qualche esempio.
Prima di entrare nei dettagli matematici, facciamo qualche esempio di operazioni fisiche che
risultano essere simmetrie di sistemi quantistici (sia di Wigner che di Kadison).
Descrivendo un sistema fisico isolato S in un certo sistema di sistema di riferimento inerziale I,
una trasformazione che, come ben noto, produce una simmetria di S, è ogni traslazione rigida di
S secondo un fissato vettore, oppure la rotazione di un qualsiasi angolo attorno ad ogni fissato
asse asse. In altre parole le isometrie continue dello spazio di quiete dei riferimenti inerziali
producono simmetrie quantistiche. Un’altra trasformazione è il cambiamento di sistema di riferimento inerziale (anche nelle teorie relativistiche) nel senso che segue. Trasformiamo il sistema
isolato S nel riferimento inerziale I, in modo tale che il sistema fisico trasformato appaia, in un
altro sistema di riferimento inerziale I0 6= I, come appariva all’inizio in I. Infine, un altro tipo
di trasformazione, per sistemi fisici isolati descritti in riferimenti inerziali, che produce simmetrie è la traslazione temporale (da non confondersi con l’evoluzione temporale) che discuteremo
più avanti.
Si deve notare che questo genere di trasformazioni sono tutte attive, nel senso che cambiano il
sistema S (il suo stato quantistico).
Bisogna anche avere ben chiaro che le trasformazioni di cui parliamo non avvengono in seguito
ad evoluzione dello stato del sistema: sono trasformazioni ideali, cioè puramente matematiche.
Tra l’altro, alcune di esse non potrebbero mai avvenire nella realtà in seguito all’evoluzione temporale del sistema secondo la propria legge dinamica, o potrebbero avvenire molto difficilmente.
Un tipico esempio è l’inversione di parità . Con questa trasformazione fisica, il sistema S viene
sostituito da un nuovo sistema che corrisponde all’immagine del sistema riflessa in uno specchio.
In certi casi l’unico modo di ottenere in pratica l’inversione di parità è quello, idealmente, di distruggere il sistema e ricostruirne uno che corrisponde all’immagine speculare di quello iniziale.
In taluni casi anche questa operazione astratta non è fisicamente sensata a causa della natura
delle stesse leggi fisiche. Le particelle che interagiscono tramite l’interazione debole costituiscono, sorprendentemente, sistemi i cui stati non ammettono l’inversione di parità come simmetria
in un senso molto drastico: nello spazio degli stati non vi è alcuna trasformazione γ che rappresenti la trasformazione fisica ideale d’inversione di parità . Questo significa, semplicemente, che
la presunta simmetria non è , in realtà , una simmetria del sistema.
Un altro genere di trasformazione che ha alcune particolarità in comune con l’inversione di parità e che, talvolta, è associata a simmetrie, è l’inversione del tempo. Le simmetrie illustrate fino
ad ora sono relative da isometrie spaziotemporali. Benché siano sempre trasformazioni attive
sugli stati, sono legate a trasformazioni passive di cambiamento di sistema di riferimento (o
395
semplicemente di coordinate) per mezzo di isometrie passive dello spaziotempo. In questo caso
ci si aspetta (ma come visto non è sempre vero) che le trasformazioni attive sugli stati siano
simmetrie, proprio in conseguenza del fatto che, i diversi sistemi di riferimento o coordinate
connessi dalle corrispondenti trasformazioni passive (trasformazioni di Galileo o trasformazioni
di Poincaré ) che usiamo per descrivere la realtà (almeno a livello macroscopica), sono equivalenti. In altre parole, se agisco sul sistema fisico S con una di queste trasformazioni attive, posso
comunque annullare l’effetto della trasformazione cambiando riferimento (o semplicemente coordinate) e con la garanzia che il nuovo riferimento sia fisicamente equivalente al precedente.
Ci sono trasformazioni associabili a simmetrie che, a differenza di tutte quelle menzionate fino
ad ora, non sono associate ad isometrie dello spaziotempo e non sono annullabili cambiando
riferimento. Un tipico esempio è la coniugazione di carica, attraverso la quale si cambia segno a
tutte le cariche (del genere considerato) presenti in S e si cambia quindi settore di superselezione della carica. Esistono infine trasformazioni ancora più astratte legate a simmetrie interne e
simmetrie di gauge, sulle quali non ci soffermiamo.
Per concludere vogliamo sottolineare un fatto molto importante dal punto di vista fisico. La
lezione che si impara dal caso delle interazioni deboli è che la questione se una trasformazione
agente, idealmente, su un sistema rappresenti o meno una simmetria quantistica è , in ultima
analisi e dopo che il requisito (b) è stato specificato, un fatto da decidere a livello sperimentale.
Dopo avere enunciato e provato i teoremi di Kadison e Wigner, ci occuperemo della descrizione delle simmetrie, in termini di operatori unitari o antiunitari, nella situazione in cui le trasformazioni fisiche abbiano la struttura di un gruppo algebrico, topologico o di Lie [War75, NaSt84].
Nel prossimo capitolo ci occuperemo delle simmetrie dinamiche, che vengono introdotte nel
momento in cui viene definita la nozione di evoluzione temporale dello stato quantistico di un
sistema S. In questo contesto, si ritroverà lo stretto legame tra esistenza di simmetrie dinamiche
ed esistenza di associate leggi di conservazione (come ben noto, a livello classico, codificato dalle
varie formulazioni del celebre teorema di Nöther).
11.1.2
Simmetrie in presenza di regole di superselezione.
Se M è un sottospazio chiuso dello spazio di Hilbert H possiamo identificare in modo naturale
S(M ) (Sp (M )) con un sottoinsieme di S(H) (rispettivamente di Sp (H)), pensando S(M ) (risp.
Sp (M )) come il sottoinsieme che contiene gli stati ρ ∈ S(H) (risp. Sp (H)), tali che Ran(ρ) ⊂ M .
Tale identificazione è equivalente ad estendere ogni ρ ∈ S(M ) ad un operatore definito su tutto
H, imponendo che sia l’operatore nullo su M ⊥ . In tutto il resto del capitolo assumeremo tacitamente tale identificazione. L’esistenza di tale identificazione risulta essere utile nella situazione
che andiamo a considerare ora.
Ricordiamo che, in talune situazioni, gli stati possibili per un sistema fisico non sono tutti gli
elementi di S(HS ) (o Sp (HS ) nel caso di stati puri), ma sono in numero ridotto perché alcune
combinazioni convesse di stati sono vietate. Questo accade in presenza di regole di superselezione (vedi cap.7). Senza ripetere quanto abbiamo spiegato precedentemente, diciamo solo che nel
caso di presenza di regole di superselezione si ha una decomposizione di HS nella somma diretta
396
in sottospazi chiusi ortogonali detti settori coerenti:
HS =
M
HSk .
k∈K
Possiamo allora definire gli spazi degli stati e degli stati puri di ciascun settore S(HSk ), Sp (HSk ).
Si noti che S(HSk ) ∩ S(HSj ) = ∅ e Sp (HSk ) ∩ Sp (HSj ) = ∅ se k 6= j. Per quanto riguarda gli
stati puri fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto
su H, questi saranno tutti e soli quelli dell’insieme:
[
Sp (HSk ) .
k∈K
Gli stati misti fisicamente ammissibili dalla regola di superselezione per il sistema fisico S descritto su H saranno invece tutte e sole le possibili le combinazioni lineari convesse (anche infinite
in riferimento alla topologia operatoriale forte) degli elementi dell’insieme:
[
S(HSk ) .
k∈K
Quanto appena scritto è equivalente alla richiesta che gli stati fisicamente ammissibili siano gli
elementi ρ di S(HS ) (o Sp (HS )) che ammettano ogni sottospazio HSk come spazio invariante.
In questa situazione le simmetrie devono rispettare la struttura della decomposizione in stati
coerenti e quello che si assume è che si possano avere simmetrie tra settori anche distinti, quindi
funzioni: γkk0 : S(HSk ) → S(HSk0 ), k, k 0 ∈ K. Eventualmente può essere k 0 = k, ma ci si
aspetta che le simmetrie, in generale, possano mischiare i vari settori. Ogni applicazione γkk0 :
S(HSk ) → S(HSk0 ) deve essere biettiva e soddisfare il requisito d’invarianza di Wigner o di
Kadison.
11.1.3
Simmetrie nel senso di Kadison.
Consideriamo un sistema fisico quantistico S descritto sullo spazio di Hilbert HS e con spazio
degli stati γ(HS ). Una richiesta (fisicamente molto debole) per definire una simmetria è quella
che si riferisce alla procedura di miscela degli stati quantistici. Un’operazione sul sistema definisce una simmetria del sistema se la costruzione di miscele è invariante rispetto ad essa. In
termini precisi:
se uno stato si può ottenere come una miscela di altri stati, con certi pesi statistici, allora, trasformando il sistema secondo un’operazione fisica che individua una simmetria del sistema, lo
stato trasformato si deve poter ottenere come miscela degli stati trasformati della miscela iniziale, con gli stessi pesi statistici.
In altre parole un’applicazione biettiva γ : S(HS ) → S(HS ) rappresenta una simmetria del
sistema quando conserva la struttura di insieme convesso di S(HS ): se ρi ∈ S(HS ), 0 ≤ pi ≤ 1
P
e i∈J pi = 1, allora:
!
γ
X
pi ρi
=
i∈J
X
i∈J
397
pi γ(ρi ) .
Nel seguito assumeremo che J sia finito. In tal caso è ovvio che, senza perdere generalità , possiamo ridurci ad imporre il vincolo di sopra con J composto da due soli elementi. Possiamo dare
la seguente definizione, che non è proprio quella dovuta a Kadison – la si ottiene comunque con
una procedura di dualità – ma è più conforme con il nostro approccio.
Diamo la definizione formalmente, tenendo conto della possibile presenza di settori coerenti di
superselezione.
Definizione 11.1 (Simmetria di Kadison). Si consideri un sistema fisico quantistico S
descritto sullo spazio di Hilbert HS . Si supponga che HS sia decomposto in settori coerenti
HS = ⊕k∈K HSk .
Una simmetria (di Kadison) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, è un’applicazione
γ : S(HSk ) → S(HSk0 )
che goda delle due seguenti proprietà :
(a) γ è biettiva;
(b) γ conserva la struttura convessa di S(HSk ) e S(HSk0 ). In altre parole:
γ (p1 ρ1 + p2 ρ2 ) = p1 γ(ρ1 ) + p2 γ(ρ2 )
se ρ1 , ρ2 ∈ S(HS ), p1 + p2 = 1 e p1 , p2 ∈ [0, 1].
(11.1)
Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni γ : S(H) → S(H), che
sia biettiva e conservi la struttura di insieme convesso, è detta automorfismo di Kadison su H.
Un esempio di simmetria nel senso della definizione 11.1 è quella indotta da un operatore U :
HSk → HSk0 che sia unitario o antiunitario (definizione 5.10), definendo
γ (U ) (ρ) := U ρU −1
per ogni ρ ∈ S(HSk ) .
(11.2)
Dimostriamolo. Abbiamo bisogno di un lemma elementare.
Lemma 11.1 Sia U : H → H0 un operatore antiunitario dallo spazio di Hilbert H allo spazio
di Hilbert H0 e N ⊂ H una base hilbertiana. Allora U = V C, dove V : H → H0 è un operatore
unitario e C : H → H è un operatore di coniugazione (definizione 5.11) naturale associata a N
definita da:
X
Cψ :=
(z|ψ)z .
z∈N
P
Prova. Definendo V ψ := z∈N (z|ψ)U z, la dimostrazione segue immediatamente dalla proprietà di antiisometricità e continuità di ogni operatore antiunitario e dalle proprietà elementari
delle basi hilbertiane, in particolare si osservi che {U z}z∈N è ancora una base hilbertiana. 2
Possiamo allora enunciare e provare la annunciata.
398
Proposizione 11.1. Sia U : HSk → HSk0 un operatore unitario (cioè isometrico e suriettivo)
oppure antiunitario, sullo spazio di Hilbert HS , associato al sistema quantistico S con spazio
degli stati S(H) e dove HSk e HSk0 sono due settori coerenti. γ (U ) : S(HSk ) → B(H) definita in
(11.2) è una simmetria di Kadison per S dal settore HSk al settore HSk0 .
Prova. La proprietà (11.1) è banalmente vera in ciascuna delle due ipotesi per U (si osservi
che non lo sarebbe se permettessimo ai coefficienti pi di essere complessi). Dimostriamo che
γ (U ) (ρ) ∈ S(HSk0 ) se ρ ∈ S(HSk ). Assumiamo inizialmente che U sia unitario. Se ρ è di classe
traccia in HS lo deve essere anche U ρU −1 , dato che lo spazio degli operatori di classe traccia è un
ideale bilatero in B(HS ) per (b) in teorema 4.7 interpretando U ρU −1 come una composizione
di operatori di B(HS ). Per fare ciò è sufficiente, pensare ρ come operatore in S(HS ) che è nullo
sull’ortogonale di
sHSk e ρ(HSk ) ⊂ HSk quindi estendere U e U −1 come operatori nulli sull’ortogonale di HSk
e HSk0 rispettivamente, estendendoli in tal modo ad operatori in B(HS ). Se ρ ≥ 0 allora
(ψ|U ρU −1 ψ) = (U ∗ ψ|ρU ∗ ψ) ≥ 0 e pertanto γ (U ) (ρ) ≥ 0. Infine, usando una base€hilbertiana
Š
data dall’unione di una base hilbertiana in HSk e una in (HSk )⊥ si ha subito che tr γ (U ) (ρ) =
tr U ρU −1 = tr(U −1 U ρ) = tr(ρ) = 1. Nell’ultimo passaggio, calcolando la traccia sulla base
prima menzionata, abbiamo usato l’identità U −1 U HSk = I HSk ed abbiamo tenuto conto del
fatto che ρ = 0 su (HSk )⊥ . Pertanto γ (U ) (ρ) ∈ S(HSk0 ) se ρ ∈ S(HSk ). Passiamo al caso
di U antiunitario. Decomponiamo U come detto nel lemma 5.1: U = V C, in riferimento alla
base hilbertiana N ⊂ HS che preciseremo più avanti. Mostriamo che U ρU −1 è positivo, di
classe traccia e con traccia unitaria. Dato che V è unitario (nel qual caso la tesi vale per la
dimostrazione appena fatta) e che U ρU −1 = V (CρC −1 )V −1 , è sufficiente dimostrare la tesi per
U = C. Specializziamo N , e quindi C, ad una base Hilbertiana N costituita di autovettori ψ
dell’operatore ρ (che esiste per il teorema 4.3 di Hilbert) e pertanto, se φ ∈ H:
ρφ =
X
pψ (ψ|φ)ψ .
ψ∈N
Di conseguenza, usando il fatto che C è continuo ed antilineare, che vale CC = I e (f |g) =
(Cf |Cg) per definizione di coniugazione, che ogni autovettore di ρ, pψ è reale (e positivo) e,
infine, che Cψ = ψ, otteniamo:
CρC −1 φ =
X
pψ (ψ|Cφ)Cψ =
ψ∈N
=
X
ψ∈N
X
pψ (CCψ|Cφ)Cψ =
ψ∈N
pψ (Cψ|φ)Cψ =
X
pψ (ψ|Cφ)ψ = ρφ .
ψ∈N
Abbiamo provato che CρC −1 = ρ e quindi CρC −1 è di classe traccia, positivo e con traccia pari
a 1 se ρ ∈ S(HSk ). 2
Esempi 11.1. Nel caso in cui la regola di superselezione sia quella della carica elettrica di un
sistema fisico, ci saranno (in generale infiniti) settori Hq uno per ogni valore fissato della carica
399
q. La coniugazione di carica può essere costruita come una classe di simmetrie tra settori di tipo
γ (Uq ) e vale che Uq : Hq → H−q per ogni valore di q.
Mostreremo più avanti che, in realtà , tutte le simmetrie di Kadison hanno la struttura (11.2) per
qualche operatore unitario o antiunitario U dipendente dalla simmetria. Questo è l’enunciato
del famoso teorema di Kadison.
11.1.4
Simmetrie nel senso di Wigner.
Passiamo ora alla nozione di simmetria quantistica nel senso proposto da Wigner. Consideriamo il solito sistema quantistico S descritto sullo spazio di Hilbert HS e con spazio degli stati
S(HS ). Concentriamo l’attenzione sull’insieme degli stati puri Sp (HS ) (cioè sui raggi di HS ).
Restringiamoci a trasformazioni δ : Sp (HS ) → Sp (HS ). Dal punto di vista sperimentale possiamo controllare le probabilità di transizione |(ψ|ψ 0 )|2 = tr(ρρ0 ) tra due stati puri ρ = ψ(ψ| ) e
ρ0 = ψ 0 (ψ 0 | ). La richiesta di Wigner perché una funzione biettiva δ : Sp (HS ) → Sp (HS ) sia una
simmetria è che preservi le probabilità di transizione. Se due stati puri hanno una certa probabilità di transizione, allora, trasformando il sistema secondo un’operazione fisica che individua
una simmetria del sistema, gli stati trasformati devono avere la stessa probabilità di transizione
di quelli iniziali.
Possiamo dare la definizione seguente che tiene anche conto della possibile presenza di settori
coerenti.
Definizione 11.2 (Simmetria di Wigner). Si consideri un sistema fisico quantistico S
descritto sullo spazio di Hilbert HS e con spazio degli stati S(HS ). Si supponga che HS sia
decomposto in settori coerenti HS = ⊕k∈K HSk .
Una simmetria (di Wigner) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, è un’applicazione
δ : Sp (HSk ) → Sp (HSk0 )
che goda delle due seguenti proprietà :
(a) δ è biettiva;
(b) δ conserva le probabilità di transizione. In altre parole:
T r (ρ1 ρ2 ) = tr (δ(ρ1 )δ(ρ2 ))
se ρ1 , ρ2 ∈ Sp (HSk ) .
(11.3)
Nel caso in cui lo spazio di Hilbert H non contenga settori coerenti, ogni δ : S(H) → S(H), che
sia biettiva e che conservi le probabilità di transizione, è detta automorfismo di Wigner su H.
Un esempio di simmetria nel senso della definizione 10.2, come nel caso delle simmetrie di
Kadison, è quella indotta da un operatore U : HSk → HSk0 che sia unitario o antiunitario
(definizione 5.10), definendo:
δ (U ) (ρ) := U ρU −1
per ogni ρ ∈ Sp (HSk ) .
400
(11.4)
A differenza del caso delle simmetrie di Kadison, qui la verifica è veramente immediata.
Osservazioni.
(1) Dato che gli stati puri sono tutti del tipo ψ(ψ| ) con ||ψ|| = 1, l’azione di δ (U ) sugli stati
puri è equivalentemente descrivibile, con una certa improprietà di linguaggio, dicendo che δ (U )
trasforma lo stato puro ψ nello stato puro U ψ. Questo è la maniera in cui, molto spesso, si descrivono le simmetrie indotte dagli operatori (anti)unitari nei manuali di Meccanica Quantistica.
(2) Ogni simmetria di Kadison mappa stati puri in stati puri e pertanto definisce un’applicazione
biettiva sullo spazio degli stati puri. Tuttavia non è detto, a priori, che definisca una simmetria
di Wigner, perchè non è affatto evidente che conservi le probabilità di transizione.
Una simmetria nel senso di Wigner non si estende in modo ovvio dalla classe degli stati puri
a quella degli stati misti. Pertanto non è ovvio che le due nozioni di simmetria siano la stessa.
Tuttavia ogni operatore unitario oppure anti unitario individua contemporaneamente una simmetria di Wigner ed una di Kadison tramite la mappa ρ 7→ U ρU −1 . Questa sarà l’osservazione
per provare che le due simmetrie sono in realtà la stessa cosa.
Mostreremo nella prossima sezione che tutte le simmetrie di Wigner tra coppie di settori hanno
la struttura (11.4) per qualche operatore unitario o antiunitario U dipendente dalla simmetria.
Questo è l’enunciato del famoso teorema di Wigner.
Per concludere, possiamo dare una nozione di simmetria di Wigner in senso generale, senza
precisare i settori.
Definizione 11.3 (Simmetria di Wigner generale). Si consideri lo spazio di Hilbert HS
del sistema S e si assuma che sia decomposto in settori coerenti, in modo che gli stati puri
fisicamente ammissibili siano solo gli elementi dell’insieme:
[
Sp (HS )ammiss :=
Sp (HSk ) .
k∈K
Una simmetria di Wigner δ (senza specificare i settori) è un’applicazione da Sp (HS )ammiss
in Sp (HS )ammiss biettiva che conserva le probabilità di transizione.
In realtà questa definizione si può ricondurre alla definizione di simmetria di Wigner tra coppie
settori nel modo che segue.
Proposizione 11.2. Sia δ una simmetria di Wigner del sistema S e si assuma che lo spazio
di Hilbert HS di S sia decomposto in settori coerenti, in modo che gli stati puri fisicamente
ammissibili siano solo gli elementi dell’insieme:
[
Sp (HS )ammiss =
k∈K
401
Sp (HSk ) .
Allora esiste una funzione biettiva f : K → K e una classe di simmetrie di Wigner, con settori
fissati,
δf,f (k) : Sp (HSk ) → Sp (HSf (k) ) con k ∈ K,
tali che δSp (HSk ) = δf,f (k) per ogni k. In questo senso δ non è altro che una classe di simmetrie
di Wigner che scambiano i settori senza sovrapporsi.
Prova. Si definisca su Sp (HS ) la distanza d(ρ, ρ0 ) := ||ρ − ρ0 ||1 := tr(|ρ − ρ0 |), dove || ||1 è la
norma naturale nello spazio degli operatori di classe traccia. Con questa definizione risulta
che gli insiemi Sp (HSk ) sono le componenti connesse di Sp (HS )ammiss (vedi esercizi 11.1). La
funzione δ : Sp (HS )ammiss → Sp (HS )ammiss è un isometria biettiva in riferimento alla distanza
d, in particolare è un omeomorfismo. Pertanto trasforma insiemi connessi massimali in insiemi
connessi massimali e di conseguenza si deve decomporre in isometrie biettive che operano tra
coppie di settori differenti, cioè simmetrie di Wigner tra coppie di settori differenti. 2
11.1.5
Teoremi di Wigner, di Kadison.
Cominciamo ad enunciare e provare il teorema di Wigner. Successivamente, usando tale risultato, proveremo il teorema di Kadison. L’enunciato dei due teoremi permette di definire in
modo elementare un’azione duale delle simmetrie sulle osservabili del sistema quantistico, come
vedremo dopo avere dimostrato il teorema di Kadison.
La dimostrazione del teorema di Wigner che daremo ora è molto diretta. Ne esistono di più eleganti,
ma indirette, come quella dovuta Bargmann4 . Quella che presenteremo ha il merito di mostrare
esplicitamente come si costruisce U su una base hilbertiana.
Teorema 11.1 (Teorema di Wigner) Si consideri un sistema fisico quantistico S descritto
sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori
coerenti HS = ⊕k∈K HSk (dove eventualmente K = ∅ ed in tal caso quanto segue vale sostituendo
ovunque HSk e HSk0 con HS ). Se la funzione:
δ : Sp (HSk ) → Sp (HSk0 )
è una simmetria (di Wigner) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, allora valgono
i fatti seguenti.
(a) Esiste un operatore U : HSk → HSk0 , unitario oppure antiunitario (e la scelta è fissata da δ
stessa), tale che:
δ(ρ) = U ρU −1 per ogni stato puro ρ ∈ Sp (HSk ).
(11.5)
(b) U è determinato a meno di una fase, cioè U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.5) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1
dove χ ∈ C con |χ| = 1.
4
J. Bargamann, J. math. Phys. 5, 862-868, (1964).
402
(c) Se {ψn }n∈N è una base hilbertiana di HSk e scegliamo i vettori ψn0 ∈ HSk0 in modo tale che
ψn0 (ψn0 | ) = δ (ψn0 (ψn0 | )), allora {ψn0 }n∈N è base hilbertiana di HSk0 , inoltre un operatore U che
soddisfa (11.5) risulta essere:
U :ψ=
X
X
an ψn 7→
n∈N
an ψn0
nel caso unitario,
n∈N
oppure:
U :ψ=
X
n∈N
an ψn 7→
X
an ψn0
nel caso antiunitario.
n∈N
Prova. (b) Prima di tutto mostriamo che U , se esiste, è unico a meno di una fase. Ovviamente,
se U1 soddisfa la tesi rispetto a δ, allora U2 := χU1 la soddisferà ancora se χ ∈ C con |χ| = 1.
Mostriamo che questo è l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi
unitari oppure anti unitari) che soddisfino la tesi in riferimento a δ. Deve accadere che, se
ρ = ψ(ψ| ), allora, posto L := U1−1 U2 , vale Lψ(ψ|L−1 φ) = ψ(ψ|φ) per ogni coppia di vettori
normalizzati a 1, ψ, φ. Di conseguenza varrà Lψ(Lψ|φ) = ψ(ψ|φ), dato che L è unitario. In
definitiva, essendo Lψ(Lψ| ) = ψ(ψ| ), Lψ e ψ determinano lo stesso stato puro, per cui deve
essere Lψ = χψ ψ e cioé U1 ψ = χψ U2 ψ, oppure U1 ψ = χψ U2 ψ (se gli operatori sono antiunitari)
per ogni ψ ∈ HSk , e per qualche χψ ∈ C con |χψ | = 1. Moltiplicando i due membri per un
numero c ∈ C, segue che l’identità vale per ogni ψ ∈ HSk . Mostriamo χψ non dipende da ψ.
Scegliendo ψ 6= ψ 0 e a, b ∈ C \ {0}, la linearità di L implica che:
χaψ+bψ0 (aψ + bψ 0 ) = L(aψ + bψ 0 ) = aLψ + bLψ 0 = aχψ ψ + bχψ0 ψ 0 .
Di conseguenza:
a(χaψ+bψ0 − χψ )ψ = b(χψ0 − χaψ+bψ0 )ψ 0 .
Dato che ψ 6= ψ 0 , a, b 6= 0, deve essere (χaψ+bψ0 − χψ ) = 0 e (χψ0 − χaψ+bψ0 ) = 0 e quindi
χψ = χψ0 . Abbiamo ottenuto che, per qualche χ ∈ C con |χ| = 1, vale:
U2 ψ = χU1 ψ
per ogni ψ ∈ HSk .
(a) e (c) Passiamo ora a costruire un operatore U che rappresenti δ. Sia {ψn }n∈N una base hilbertiana di HSk . Ad ognuno dei vettori ψn associamo il corrispondente stato puro ρn := ψn (ψn | ).
Quindi facciamo agire δ su tali stati, ottenendo la classe di stati puri δ(ρn ) = ψn0 (ψn0 |) ∈ Sp (HSk0 ),
dove i vettori unitari ψn0 ∈ HSk0 sono individuati a meno di una fase. Supponiamo di fissare una
volta per tutte tale fase in modo arbitrario. Per prima cosa notiamo che {ψn0 }n∈N è una base
0 )|2 = tr(δ(ρ )δ(ρ )) =
hilbertiana di HSk0 . Infatti, i vettori sono ortonormali valendo: |(ψn0 |ψm
n
m
2
0
0
0
tr(ρn ρm ) = |(ψn |ψm )| = δnm , inoltre ψ ⊥ ψn implica ψ = 0 come ora dimostriamo. Sia
ψ 0 ⊥ ψn0 per ogni n ∈ N. Se ψ 0 6= 0, senza perdere generalità possiamo assumere che ||ψ 0 || = 1 e
definire ρ0 := ψ 0 (ψ 0 | ) ∈ Sp (HSk0 ). Dato che δ è suriettiva, deve essere ρ0 = δ(ρ) con ρ = ψ(ψ| ),
per qualche ψ ∈ HSk con ||ψ|| = 1. Di conseguenza:
|(ψ 0 |ψn0 )|2 = tr(δ(ρ0 )δ(ρ0n )) = tr(ρρn ) = |(ψ|ψn )|2 = 0
403
e quindi deve essere ψ = 0, dato che {ψn }n∈N è base hilbertiana, ma questo è impossibile dato
che ||ψ|| = 1. Deve dunque essere ψ 0 = 0, e quindi {ψn0 }n∈N è base hilbertiana.
Ora, usando le due basi {ψn }n∈N e {ψn0 }n∈N definiremo l’operatore U in varie tappe. Per prima
cosa definiamo i vettori unitari ausiliari:
Ψk := 2−1/2 (ψ0 + ψk )
per k ∈ N \ {0}
ed i corrispondenti stati puri: (Ψk | ) Ψk , per k ∈ N\{0}. Il trasformato δ(Ψk (Ψk | )) = Ψ0k (Ψ0k | )
deve soddisfare, in particolare:
|(Ψ0k |ψn0 )|2 = tr Ψ0k (Ψ0k | )δ(ρn ) = tr (δ(Ψk (Ψk | ))δ(ρn )) = |(Ψk |ψn )|2 =
e deve anche essere ||Ψ0k || = 1. Decomponendo Ψ0k =
0
n an ψn ,
P
δ0n + δkn
,
2
si vede che l’unica possibilità è :
Ψ0k = χ0k 2−1/2 (ψk0 + χk ψk0 )
con |χ0k | = |χk | = 1. Le fasi χk sono individuate da δ mentre le fasi χ0k si possono fissare
arbitrariamente. Le fasi χk portano l’informazione di √
δ e ne faremo uso tra poco.
Cominciamo a definire U sui vettori ψn , (ψ0 + ψk )/ 2 stabilendo che, per definizione, dove
k ∈ N \ {0}:
U ψ0 := ψ00 ,
U ψk := χk ψk0 ,
U (2−1/2 (ψ0 + ψk )) := 2−1/2 (ψ00 + χk ψk0 ) .
(11.6)
Con questa scelta siamo sicuri che, se φ è uno dei vettori nell’argomento di U scritti sopra e ρφ
è lo stato puro associato ad esso, allora δ(ρφ ) è associato a U φ.
Ora estenderemo U su ogni vettore:
ψ=
X
an ψn ∈ HSk ,
n∈N
in modo che U continui a rappresentare δ. Assumiamo sopra che ||ψ|| = 1 e che a0 ∈ R \ {0}.
Sia poi ψ 0 ∈ HSk0 con ||ψ 0 || = 1, tale che ψ 0 (ψ 0 | ) = δ(ρψ ). Avremo uno sviluppo:
ψ0 =
X
a0n ψn0 .
(11.7)
n∈N
i coefficienti a0k sono individuati, a meno di una fase globale, dai coefficienti an e da δ. Nelle
nostre ipotesi su δ vale comunque:
|(ψ 0 |ψn0 )|2 = tr(δ(ρψ )δ(ρn )) = tr(ρψ ρn ) = |(ψ|ψn )|2 .
Il risultato si può riscrivere come |a0n | = |an |. Usando questo risultato insieme alle prime due
identità in (11.6) nel secondo membro di (11.7), arriviamo a:
„
Ž
ψ0 = χ
a0 U ψ0 +
X
n∈N\{0}
404
0
χ−1
n an U ψn
,
dove χ, con |χ| = 1, è arbitrario. Possiamo allora definire:
U ψ := a0 U ψ0 +
X
0
χ−1
n an U ψn .
(11.8)
n∈N\{0}
In questo modo siamo sicuri che, per costruzione, U ψ(U ψ| ) = δ(ρψ ) e si verifica che la
definizione appena data di U estende quella già data in (11.6). Tuttavia non abbiamo ancora
completamente definito U ψ, perché non conosciamo quanto valgono i coefficienti a0n in funzione
delle componenti an di ψ. Siamo ora in grado di determinare tale legame. Per costruzione di U
e nelle nostre ipotesi su δ, deve risultare |(Ψk |ψ)| = |(U Ψk |U ψ)|, che significa, facendo uso di
(11.8):
0
|a0 + ak |2 = |a0 + χ−1
k ak | .
Questa identità , tenendo conto che |ak | = |a0k |, implica che:
0
Re(a0 ak ) = Re(a0 χ−1
k ak ) .
Tenendo infine conto del fatto che a0 ∈ R \ {0}, le identità di sopra sono possibili solo in uno dei
seguenti casi:
a0k = χk ak oppure a0k = χk ak .
Di conseguenza, per ogni ψ =
P
n an ψn
con a0 ∈ R \ {0} vale:
ψ0 = U ψ =
X
an ψn0 +
n∈Aψ
X
an ψn0 .
n∈Bψ
Si osservi che, per il fissato vettore ψ, si può sempre sempre scegliere uno dei due insiemi Aψ e
Bψ come vuoto5 . Supponiamo infatti che ciò non sia possibile. Allora per le componenti di ψ
e del corrispondente ψ 0 deve succedere che a0p = χp ap mentre a0q = χq aq , per qualche coppia di
indici p 6= q, dove Imap , Imaq 6= 0. Se φ = 3−1/2 (ψ0 +ψp +ψq ) deve allora essere per costruzione:
|(φ0 |ψ 0 )|2 = |(φ|ψ)|2 ,
dove φ0 := U φ = 3−1/2 (ψ00 + ψp0 + ψq0 ). L’identità tra i moduli quadri si esplicita in:
|a0 + ap + aq |2 = |a0 + ap + aq |2 ,
cioè , con qualche calcolo:
Re(ap aq ) = Re(ap aq )
che è impossibile nelle nostre ipotesi, perché implica che Imaq = −Imaq .
P
Se ψ = n an ψn ∈ HSk con ||ψ|| = 1 e se a0 ∈ R \ {0}, abbiamo pertanto le due alternative per
definire U ψ:
X
X
an ψn .
(11.9)
Uψ =
an ψn oppure U ψ =
n∈N
n∈N
5
Si osservi che c’è una certa ambiguità nel definire gli insiemi Aψ e Bψ dato che gli indici n degli eventuali
coefficienti an reali possono essere scelti come membri di An oppure Bn indifferentemente.
405
Mostriamo ora che la scelta tra i due casi non dipende da ψ e quindi deve dipendere dalla natura
P
di δ. Consideriamo un generico vettore ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0}. Quindi
definiamo il vettore ψ (nc) associato a c ∈ C con Imc 6= 0, per ogni n = 1, 2, . . ., dato da:
1
ψ (nc) := È
(ψ0 + cψn ) .
1 + |c|2
Dovendo essere valido il vincolo: |(ψ|ψ (nc) )| = |(U ψ|U ψ (nc) )|, si vede immediatamente che questo
è possibile solo se ψ (nc) e ψ sono dello stesso tipo tra le due possibilità in (11.9). Di conseguenza
P
tutti i vettori ψ = n an ψn ∈ HSk con ||ψ|| = 1 e a0 ∈ R \ {0} sono dello stesso tipo.
Definiamo ora l’operatore U : HSk → HSk0 dato da:
U :ψ=
X
an ψn 7→
n∈N
X
an ψn0
nel caso lineare,
n∈N
oppure:
U :ψ=
X
n∈N
an ψn 7→
an ψn0
X
nel caso antilineare.
n∈N
Si osservi che, per costruzione, il primo operatore è isometrico surgettivo cioè unitario, il secondo
è antisometrico surgettivo, cioè antiunitario. Si deve osservare che la scelta tra il caso unitario
e quello antiunitario deve dipendere dalla natura di δ e non è possibile rappresentare lo stesso δ
si con un operatore unitario che con uno anti unitario. Questo segue dal fatto che è impossibile
P
P
P
P
che ψ 0 := n∈N an ψn 7→ n∈N an ψn0 e ψ̃ 0 = n∈N an ψn 7→ n∈N an ψn0 differiscano per una
sola fase per ogni scelta dei coefficienti an , cioè del vettore ψ, come dovrebbe essere se ψ 0 e ψ̃ 0
individuassero lo stesso stato puro δ(ψ(ψ| )).
Per costruzione, questo operatore soddisfa U ρU −1 = δ(ρ) purché si possa esprimere ρ ∈ Sp (HSk )
P
come ψ(ψ| ) dove, nello sviluppo ψ = n∈N an ψn , a0 6= 0. Infatti, in tal caso è possibile ridefinire
ψ cambiando una sola fase totale: ψ̃ = χψ, senza alterare ρ = ψ(ψ| ) = ψ̃(ψ̃| ), in modo tale
che, nello sviluppo di ψ̃, ã0 ∈ R \ {0}; a questo punto la costruzione che abbiamo fatto per U
implica che:
U ρU −1 = U ψ(ψ| )U −1 = U ψ̃(ψ̃| )U −1 = U ψ̃(U ψ̃| ) = δ(ρ) .
Rimane da provare che questo risultato vale anche per gli stati puri associati a vettori ψ =
P
n∈N an ψn con a0 = 0. A tal fine notiamo che tutta la costruzione può essere rifatta rimpiazzando ψ0 con un qualsiasi altro vettore di base ψk . In tal caso si trova banalmente che, se
si definisce U esattamente come detto sopra, vale U ρU −1 = δ(ρ) per gli stati puri associati a
P
vettori ψ = n∈N an ψn con ak 6= 0. (Non può accadere che, usando come vettore di riferimento
ψk invece di ψ0 , il nuovo operatore U sia di tipo diverso (lineare o antilineare) di quello definito
P
prendendo come riferimento ψ0 . Infatti, sui vettori ψ = n∈N an ψn con ak 6= 0 e a0 6= 0 insieme,
i due operatori si devono comportare nello stesso modo e questo ne determina il tipo come provato sopra.) L’osservazione fatta conclude la dimostrazione, perché se consideriamo ρ ∈ Sp (HSk )
P
e ρ = ψ(ψ| ), con ψ = n∈N an ψn , e a0 = 0, ci deve essere comunque almeno un coefficiente
ak 6= 0 essendo ||ψ|| = 1. Pertanto possiamo rifare la dimostrazione di sopra rimpiazzando ψ0
406
con quel ψk . 2
Passiamo ora al teorema di Kadison con una procedura di riduzione al teorema di Wigner dovuta
a Roberts e Roepstorff6 . Per prima cosa dimostriamo parte del teorema nel caso bidimensionale.
Proposizione 11.3. Se H è uno spazio di Hilbert bidimensionale e se γ : S(H) → S(H) è un
automorfismo di Kadison, allora esiste U : H → H unitario oppure anti unitario tale che:
γ(ρ) = U ρU −1
per ogni ρ ∈ S(H).
Prova. Per prima cosa caratterizziamo geometricamente gli stati e gli stati puri su H attraverso la
cosiddetta sfera di Poincarè . Uno stato ρ ∈ S(H) è , nel caso in esame, una matrice hermitiana
positiva con traccia pari a 1. Lo spazio vettoriale reale delle matrici hermitiane possiede una
base costituita dall’identità I e dalle 3 matrici di Pauli:
™
–
™
–
™
–
0 −i
1 0
0 1
, σ2 =
, σ3 =
.
(11.10)
σ1 =
i 0
0 −1
1 0
Quindi, dovrà essere per a, bn ∈ R:
ρ = aI +
3
X
bn σn .
n=1
La condizione tr(ρ) = 1 fissa a = 1/2, dato che le tre matrici σn hanno traccia nulla. La richiesta
di positività , cioè
È la richiesta che gli autovalori di ρ siano entrambi positivi, risulta allora essere
equivalente a b11 + b22 + b23 ≤ 1/2. La verifica è immediata per computo diretto. In definitiva
gli elementi ρ di S(H) risultano essere in corrispondenza biunivoca con i vettori n ∈ R3 con
||n|| ≤ 1 attraverso la relazione, con ovvie notazioni:
ρ=
1
(I + n · σ) .
2
(11.11)
Infine, la richiesta che ρ sia puro, e cioè che si abbia un unico autovalore pari a 1, è equivalente
al fatto che ||n|| = 1, come si prova per verifica diretta. In definitiva, gli elementi di S(H) sono
in corrispondenza biunivoca con la palla chiusa B in R3 di raggio 1 e centrata nell’origine, e gli
elementi del sottoinsieme degli stati puri, Sp (H), sono in corrispondenza biunivoca con i punti
sulla superficie della palla ∂B. La corrispondenza biunivoca appena definita:
B 3 n 7→ ρn ∈ S(H)
è in realtà un vero isomorfismo, dato che conserva le strutture convesse dei rispettivi spazi,
risultando da (11.11):
ρpn+qm = pρn + qρm
6
per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1 .
J. Roberts and G. Roepstorff, Commun. Math. Phys. 11, 321-338, (1969).
407
Una proprietà importante nel seguito dell’isomorfismo trovato è la seguente formula che segue
immediatamente dalle relazioni (che si provano per verifica diretta): tr(σj ) = 0, tr(σi σj ) = 2δij .
tr (ρm ρn ) =
1
(1 + m · n) .
2
(11.12)
Possiamo ora caratterizzare gli automorfismi di Kadison. Assegnare un automorfismo di Kadison
γ : S(H) → S(H) è evidentemente equivalente ad assegnare una corrispondente funzione biettiva
γ 0 : B → B che soddisfi:
γ 0 (pn + qm) = pγ 0 (n) + qγ 0 (m)
per ogni coppia n, m ∈ B se p, q ≥ 0 e p + q = 1 .
Se l’automorfismo di Kadison γ : S(H) → S(H) individua la funzione γ 0 : B → B come detto
sopra, la funzione Γ : R3 → R3 definita da:
‚
Œ
v
0
Γ(0) := 0 , Γ(v) := ||v||γ
, se v ∈ R3 \ {0}
||v||
risulta allora essere un’estensione di γ 0 e risulta anche essere lineare e biettiva. La prova di
ciò è diretta. (Bisogna tuttavia osservare che non tutte le funzioni lineari biettive L : R3 → R3
si restringono ad automorfismi di Kadison quando ristrette a B: deve essere soddisfatta la
condizione che L(B) = B.) Si osservi che gli automorfismi di Kadison, essendo isomorfismi,
devono trasformare elementi estremali in elementi estremali e pertanto deve anche risultare:
Γ(n) = γ 0 (n) = 1 se ||n|| = 1 e ancora, per la linearità di Γ:
||Γ(v)|| = ||v|| per ogni v ∈ R3 .
Concludiamo che la funzione lineare Γ : R3 → R3 associata all’automorfismo di Kadison γ deve
essere un’isometria di R3 che ammette l’origine come punto fisso. Questo è possibile se e solo se
Γ ∈ O(3), il gruppo delle matrici ortogonali reali di dimensione 3. (Viceversa, se Γ ∈ O(3), allora
la sua restrizione a B individua un automorfismo di Kadison come si prova immediatamente.)
Questo risultato, tenendo conto del teorema di Wigner, conclude la prova del teorema di Kadison
nel caso in esame. In effetti, il fatto che Γ ∈ O(3) implica che γ Sp (H) sia un automorfismo di
Wigner per la proprietà (11.12). Se infatti ρn e ρm sono stati puri, la probabilità di transizione
ad essi associata è :
1
tr (ρn ρm ) = (1 + n · m) .
2
D’altra parte, usando il fatto che Γ è una matrice ortogonale, si ha anche:
tr (γ(ρn )γ(ρm )) =
1
1
(1 + Γ(n) · Γ(m)) = (1 + n · m) ,
2
2
e quindi:
tr (γ(ρn )γ(ρm )) = tr (ρn ρm ) .
Tenendo conto del fatto che γ 0 ∂B = Γ∂B : ∂B → ∂B è banalmente una biezione (ciò accade per
tutte le metrici ortogonali), abbiamo che γSp (H) : Sp (H) → Sp (H) è una biezione. Concludiamo
408
che γSp (H) : Sp (H) → Sp (H) è un automorfismo di Wigner. Il teorema di Wigner implica allora
che esiste un operatore unitario o anti unitario U : H → H tale che
γ(ρ) = U ρU −1
per ogni ρ ∈ Sp (H) .
Se ρ ∈ S(H) si potrà comunque decomporre come combinazione convessa di due stati puri
associati agli autovettori di ρ. Se ρ1 , ρ2 ∈ Sp (H) sono questi stati, per qualche p ∈ [0, 1]
dovrà essere:
ρ = pρ1 + (1 − p)ρ2 .
Quindi
γ(ρ) = pγ(ρ1 ) + (1 − p)γ(ρ2 ) = pU ρ1 U −1 + (1 − p)U ρ2 U −1 = U (pρ1 + (1 − p)ρ2 ) U −1 = U ρU −1 .
Concludiamo che l’operatore unitario o antiunitario U verifica la tesi della proposizione e la
dimostrazione si conclude. 2
Osserviamo che, nella dimostrazione appena conclusa, l’esistenza dell’operatore U si può dimostrare
usando la teoria delle rappresentazioni del gruppo SU (2), delle matrici unitarie 2 × 2 a determinante unitario, e del fatto che esso sia il rivestimento universale di SO(3), senza invocare il
teorema di Wigner. Non abbiamo seguito questa strada per non dover introdurre nuove nozioni.
Passiamo ad enunciare e provare il teorema di Kadison nel caso generale. (Il contenuto originale
del teorema provato realmente da Kadison si riferisce solo ai punti (a) e (b)).
Teorema 11.2 (Teorema di Kadison) Si consideri un sistema fisico quantistico S descritto
sullo spazio di Hilbert (complesso separabile) HS . Si supponga che HS sia decomposto in settori
coerenti HS = ⊕k∈K HSk (dove eventualmente K = ∅ ed in tal caso quanto segue vale sostituendo
ovunque HSk e HSk0 con HS ). Se la funzione:
γ : S(HSk ) → S(HSk0 )
è una simmetria (di Kadison) di S dal settore HSk al settore HSk0 , con k, k 0 ∈ K, allora valgono
i fatti seguenti.
(a) Esiste un operatore U : HSk → HSk0 , unitario oppure antiunitario, tale che:
γ(ρ) = U ρU −1
per ogni stato puro ρ ∈ S(HSk ).
(11.13)
(b) U è determinato a meno di una fase, cioè U1 e U2 (entrambi unitari oppure entrambi antiunitari) soddisfano (11.13) (sostituendo separatamente ciascuno di essi a U ) se e solo se U2 = χU1
dove χ ∈ C con |χ| = 1.
(c) La restrizione di γ allo spazio degli stati puri è una simmetria di Wigner (e la scelta del
carattere unitario o anti unitario di U in (a) è fissata da γSp (HSk ) ).
(d) Ogni simmetria di Wigner δ : Sp (HSk ) → Sp (HSk0 ) si estende, in modo unico, ad una
simmetria di Kadison γ (δ) : S(HSk ) → S(HSk0 ).
409
Prova. (b) Prima di tutto mostriamo che U , se esiste ed è unitario oppure è anti unitario, è unico
a meno di una fase nella corrispondente classe di operatori. Ovviamente, se U1 soddisfa la tesi
rispetto a γ, allora U2 := χU1 la soddisferà ancora se χ ∈ C con |χ| = 1. Mostriamo che questo
è l’unico caso possibile. Supponiamo che esistano U1 e U2 (entrambi unitari oppure anti unitari)
che soddisfino la tesi in riferimento a γ. Deve accadere in particolare che, se ρ ∈ S(HSk ), allora
U1 ρU1−1 = U2 ρU2−1 e quindi: LρL−1 = ρ dove L := U1−1 U2 è lineare ed unitario. Scegliendo uno
stato puro ρ = ψ(ψ| ), l’identità trovata si riscrive:
Lψ(Lψ| ) = ψ(ψ| )
e quindi Lψ deve appartenere allo stesso raggio di ψ e pertanto Lψ = χψ ψ per qualche numero
χψ ∈ C con |χ| = 1. Esattamente come nella dimostrazione del punto (b) del teorema di Wigner,
si trova allora che χψ non dipende da ψ e questo conclude la dimostrazione di (b).
Passiamo a dimostrare (a). Dividiamo la dimostrazione in alcuni passi. Per prima cosa notiamo
che γ è biettiva e conserva la struttura convessa. Conseguentemente, trasforma elementi estremali in elementi estremali ed elementi non estremali in elementi non estremali, cioè stati puri in
stati puri e stati misti in stati misti. Di conseguenza, se M ⊂ HSk è un sottospazio bidimensionale allora esisterà un analogo sottospazio bidimensionale M0 ⊂ HSk0 tale che γ (S(M)) ⊂ S(M0 ).
(Se ψ1 , ψ2 è una base di M, il generico elemento di S(M) è ρ = pψ1 (ψ1 | )+qψ2 (ψ2 | ) con p+q = 1
e p, q ≥ 0. Quindi
γ(ρ) = pγ(ψ1 (ψ1 | )) + qγ(ψ2 (ψ2 | )) = pψ10 (ψ10 | ) + q(ψ20 (ψ20 | ) ,
dove, i vettori unitari ψ10 e ψ20 si ottengono (a meno di fasi) richiedendo che individuino gli stati
puri γ(ψ1 (ψ1 | )) e γ(ψ1 (ψ1 | )) rispettivamente. Questi due stati puri devono essere differenti
tra di loro, altrimenti la biezione γ −1 : S(HSk0 ) → S(HSk ) che conserva la struttura conforme,
mapperebbe uno stato puro in uno stato misto. Pertanto i vettori ψ10 e ψ20 , che devono essere di
norma unitaria, soddisfano necessariamente: ψ10 6= aψ20 per ogni a ∈ C e pertanto sono linearmente indipendenti. Lo spazio M 0 è allora quello generato da ψ10 e ψ20 .)
Abbiamo ora due lemmi.
Lemma 1. Nelle nostre ipotesi su γ, esiste una simmetria di Wigner δ : Sp (HSk ) → Sp (HSk0 )
che soddisfa γ(ρ) = δ(ρ) per ogni ρ ∈ Sp (HSk ).
Prova del lemma 1. Dato che γ e γ −1 trasformano elementi estremali in elementi estremali ed
elementi non estremali in elementi non estremali, γ Sp (HSk ) : Sp (HSk ) → Sp (HSk0 ) è biettiva,
dato che la sua inversa destra e sinistra non è altro che γ −1 Sp (HSk0 ) : Sp (HSk0 ) → Sp (HSk ). La
dimostrazione si conclude provando che γ Sp (HSk ) conserva le probabilità di transizione. Dato
φ, ψ ∈ HSk supposti essere unitari e diversi, sia M lo spazio vettoriale generato da essi e sia
M 0 ⊂ HSk0 lo spazio bidimensionale che soddisfa γ (S(M )) ⊂ S(M 0 ) menzionato sopra. Sia
infine U : M 0 → M un qualsiasi operatore unitario. Definiamo:
γ 0 (ρ) := U γ(ρ)U −1
per ogni ρ ∈ S(M ).
410
Si verifica immediatamente che γ 0 è una simmetria di Kadison se ci si restringe a lavorare nello
spazio di Hilbert 2-dimensionale H = M . Come provato nella proposizione 11.3, in questo caso
il teorema di Kadison è vero e quindi esiste un operatore unitario o anti unitario V : M → M
tale che γ 0 (ρ) = U γ(ρ)U −1 = V ρV −1 . In altre parole:
γ(ρ) = U V ρ(U V )−1
per ogni ρ ∈ S(M ).
In particolare, scegliendo ρ = ψ(ψ| ) e poi ρ = φ(φ| ) abbiamo che
€
Š
tr (γ(ψ(ψ| ))γ(φ(φ| ))) = tr U V ψ(ψ| )(U V )−1 U V φ(φ| )(U V )−1 =
€
Š
= tr U V ψ(ψ| )φ(φ| )(U V )−1 = tr (ψ(ψ| )φ(φ| )) .
Nel caso ψ(ψ| ) = φ(φ| ) si ottiene banalmente lo stesso risultato come è immediato verificare.
Abbiamo provato che γSp (HSk ) conserva le probabilità di transizione ed è quindi una simmetria
di Wigner. 2
Per il lemma precedente ed applicando il teorema 11.1 di Wigner, esiste un operatore unitario
oppure anti unitario U : HSk → HSk0 tale che:
γ(ρ) = U ρU −1
per ogni ρ ∈ Sp (HSk ).
(11.14)
La dimostrazione si conclude dimostrando che l’identà trovata vale anche nel caso di ρ ∈ S(HSk ).
A tal fine, notiamo che (11.14) è equivalente a:
U −1 γ(ρ)U = ρ per ogni ρ ∈ Sp (HSk ),
e quindi Γ : S(HSk ) → Sp (HSk ) è ancora una simmetria di Kadison (anzi un automorfismo di
Kadison) che si riduce all’identità sugli stati puri. La dimostrazione del teorema di Kadison si
conclude immediatamente provando il seguente lemma.
Lemma 2. Sia H uno spazio di Hilbert. Se Γ : S(H) → S(H) è un automorfismo di Kadison
che si riduce all’identità sugli stati puri, allora è l’identità .
Prova del lemma 2. Se ρ =
puri, allora:
Γ(ρ) = Γ
PN
N
X
k=0
k=0 pk ψk (ψk |
) è una combinazione lineare (convessa) finita di stati
!
pk ψk (ψk | )
=
N
X
pk Γ (ψk (ψk | )) =
k=0
N
X
!
pk I = I .
k=0
Di conseguenza, la tesi varrà per ogni ρ ∈ S(H), se le combinazioni lineari (convesse) finite di
stati puri sono dense in S(H) in una topologia rispetto alla quale Γ è continuo. Mostriamo che
ciò accade rispetto alla topologia degli operatori di classe traccia indotta dalla norma ||T ||1 :=
411
tr(|T |) (vedi cap.4).
Se ρ ∈ S(H), possiamo decomporre l’operatore nel suo sviluppo spettrale:
ρ=
X
pk ψk (ψk | ) .
k∈N
P
dove pk > 0 e k∈N pk = 1. La convergenza è nella topologia operatoriale forte e anche nella topologia di || ||1 . Mostriamo che possiamo approssimare ρ con elementi ρN ∈ S(H), combinazioni
lineari (convesse) finite di stati puri, in modo tale che:
||ρN − ρ||1 → 0
per N → +∞.
A tal fine definiamo:
ρN :=
N
X
(N )
qk ψk (ψk | ) ,
k=0
(N )
qk
pk
:= PN
j=0 pj
,
N=0,1,2,. . . .
(N )
Evidentemente ρN ∈ S(H) per ogni N ∈ N ed inoltre, tenendo conto che qk < pk e che i
vettori unitari ψk (aggiungendo una base hilbertiana di ker(ρ) ⊃ ker(ρN )) formano una base
hilbertiana di H, fatta di autovettori di ρ e di ρN , si trova facilmente che, per N → +∞
||ρ − ρN ||1 = tr (|ρ − ρN |) =
N
X
+∞
X
(N )
−
(pk − qk ) +
pk
k=0
k=N +1
=
1−
PN
j=0 pj
PN
j=0 pj
N
X
k=0
pk +
+∞
X
pk → 0 ,
k=N +1
in virthù dei soli fatti che pn > 0 e +∞
n=1 pn = 1.
Mostriamo ora che Γ è continua nella topologia di || ||1 e questo completa la dimostrazione.
Per prima cosa estendiamo Γ da S(H) alla classe degli operatori di classe traccia positivi su H
definendo, se A ∈ B1 (H) con A ≥ 0 (e quindi tr(A) > 0 se A 6= 0):

‹
1
A , Γ1 (0) := 0 .
Γ1 (A) := tr(A)Γ
trA
P
Con questa definizione, segue immediatamente che Γ1 (A) ∈ B1 (H) e Γ1 (A) ≥ 0, inoltre:
Γ1 (αA) = αΓ1 (A)
se α ≥ 0,
e
tr (Γ1 (A)) = tr(A) .
Tenendo conto che Γ conserva la struttura convessa, si prova immediatamente che
Γ1 (A + B) = Γ1 (A) + Γ1 (B) .
Per concludere estendiamo Γ1 sulla classe degli operatori autoaggiunti di classe traccia, definendo:
Γ2 (A) := Γ1 (A+ ) − Γ1 (A− ) ,
412
dove A− := − (−∞,0) xdP (A) (x) e A+ := (0,+∞) xdP (A) (x). Si osservi che A+ − A− = A e
|A| = A+ + A− , per definizione, essendo P (A) la PVM di A.
Con questa definizione, se A ∈ B1 (H) è autoaggiunto, allora Γ2 (A) ∈ B1 (H) ed è autoaggiunto,
inoltre:
||Γ2 (A)||1 ≤ ||Γ1 (A+ )||1 + ||Γ1 (A− )||1 = tr (A+ ) + tr (A− ) = ||A||1 .
R
R
Segue che Γ2 è continua nella topologia di || ||1 e di conseguenza lo è Γ : S(H) → S(H) che ne
è una restrizione. 2
Abbiamo quindi provato l’esistenza di U unitario o anti unitario che soddisfa la richiesta γ(ρ) =
U ρU −1 per ogni ρ ∈ S(HSk ). Questo conclude la prova di (a).
(c) Si osservi che, valendo: γSp (HSk ) (ρ) = U ρU −1 , si conclude che γSp (HSk ) è una simmetria di
Wigner come si prova immediatamente. In particolare, l’operatore U che verifica (a) (di questo
teorema) soddisfa anche la tesi in (a) del teorema di Wigner per γSp (HSk ) . In base al teorema
di Wigner il carattere unitario o antiunitario di U che soddisfa (a) è quindi fissato da γSp (HSk ) .
(d) Se δ è una simmetria di Wigner, per il teorema di Wigner esiste U , unitario o antiunitario
per cui δ(ρ) = U ρU −1 per ogni stato puro. U definisce la simmetria di Kadison γ (δ) (ρ) =
U ρU −1 che estende δ su tutto lo spazio degli stati. Dimostriamo l’unicità . Se due simmetrie di
Kadison, γ, γ 0 , associate agli operatori (unitari o antiunitari) U , U 0 rispettivamente, coincidono
0
su Sp (HSk ), allora le simmetrie di Wigner δ (U ) = U · U −1 e δ (U ) = U 0 · U 0−1 coincidono. Per il
teorema di Wigner U e U 0 devono essere entrambi unitari o entrambi antiunitari e U = χU 0 con
|χ| = 1. Conseguentemente, per le simmetrie di Kadison iniziali vale
γ(ρ) = U ρU −1 = χU 0 ρU 0−1 χ−1 = χχ−1 U 0 ρU 0−1 = U 0 ρU 0−1 = γ 0 (ρ)
per ogni ρ ∈ S(HSk ) e quindi γ = γ 0 . Questo conclude la dimostrazione del teorema di Kadison.
2
Dall’ultima parte della dimostrazione estraiamo una proposizione che è interessante per sua natura.
Proposizione 11.4. Sia γ un automorfismo di Wigner, oppure di Kadison, sullo spazio di
Hilbert H, e B1 (H)R ⊂ B1 (H) indichi il sottospazio reale di B1 (H) contenente gli operatori autoaggiunti di classe traccia sullo spazio di Hilbert complesso H.
Esiste, ed è unico, un operatore lineare γ2 : B1 (H)R → B1 (H)R , continuo nella norma naturale || ||1 di B1 (H), tale che si restringa a γ su Sp (H) oppure, rispettivamente, su S(H).
Più precisamente vale:
||γ2 (A)||1 ≤ ||A||1 per ogni A ∈ B1 (H)R
Prova. La dimostrazione di esistenza, nel caso di automorfismi di Kadison è stata data nella dimostrazione, del lemma 2, dimostrando l’esistenza di Γ2 (ora indicato con γ2 ), quando
è assegnato Γ (ora indicato con γ). L’unicità segue direttamente dalla costruzione fatta, nella
413
dimostrazione del lemma 2, per ottenere Γ2 (ora indicato con γ2 ) da Γ (ora indicato con γ). Per
gli automorfismi di Wigner, la dimostrazione segue immediatamente da quella per gli automorfismi di Kadison, applicando (d) del teorema di Kadison.
11.1.6
Azione duale delle simmetrie sulle osservabili.
I teoremi di Wigner e Kadison consentono di definire in modo molto elementare la nozione di
azione (duale) di una simmetria sulle osservabili del sistema fisico. Consideriamo un sistema
fisico S descritto sullo spazio di Hilbert (complesso separabile) HS . Per semplicità ci occuperemo
della situazione in cui si abbia un unico settore, dato che la generalizzazione al caso di presenza di
più settori coerenti è immediata. Sia P(HS ) l’insieme delle osservabili elementari su S, descritte,
come sappiamo dai proiettori ortogonali su H. Le osservabili su S sono PVM costruite con tali
proiettori, ovvero sono gli operatori autoaggiunti (non limitati in generale) associati a tali PVM.
Supponiamo che γ : S(HS ) → S(HS ) sia una simmetria. Definiamo l’azione duale di γ sul
reticolo dei proiettori, γ ∗ : P(HS ) → P(HS ) come:
γ ∗ (P ) := U −1 P U
per ogni P ∈ P(HS ).
(11.15)
Con questa scelta vale l’identità di dualità :
tr (ργ ∗ (P )) = tr (γ(ρ)P ) ,
(11.16)
come si verifica immediatamente, tenendo conto che γ(ρ) = U ρU −1 per il teorema di Kadison
e tenendo conto, nel calcolo della traccia e nel caso in cui U sia antinunitario, che gli operatori
antiunitari trasformano basi hilbertiane in basi hilbertiane.
L’applicazione γ ∗ : P(HS ) → P(HS ) non solo trasforma proiettori ortogonali in proiettori ortogonali, ma preserva la struttura di reticolo limitato, ortocomplementato e σ-completo. Per
esempio i proiettori ortogonali P e Q di P(HS ) commutano se e solo se γ ∗ (P ) e γ ∗ (Q) commutano. In tal caso γ ∗ (P ∨ Q) = γ ∗ (P ) ∨ γ ∗ (Q) e via di seguito.
Se A : D(A) → H è un operatore autoaggiunto su H con misura spettrale P (A) ⊂ P(HS ), risulta
facilmente (vedi (1) in esercizi 9.1 per il caso unitario, e (6) in esercizi 11.1 per il caso
€ antiunitario)
Š
che U −1 AU : U −1 D(A) → HS è ancora autoaggiunto ed ha misura spettrale γ ∗ P (A) . Questa
osservazione consente di estendere l’azione di γ ∗ a tutte le osservabili in modo coerente con l’idea
della decomposizione spettrale, definendo, se A : D(A) → HS è un operatore autoaggiunto che
rappresenta qualche osservabile di S:
γ ∗ (A) := U −1 AU .
(11.17)
Il significato fisico di γ ∗ (A) è il seguente. Nel momento in cui definiamo una simmetria di
Kadison γ, assegniamo una serie di prescrizioni sperimentali con cui trasformare il sistema
S. Matematicamente parlando, l’azione sugli stati è descritta proprio da γ : S(HS ) → S(HS ).
L’azione γ ∗ sulle osservabili rappresenta invece una serie di prescrizioni operative sugli strumenti
di misura che, in termini intuitivi, corrisponde e generalizza la nozione di trasformazione passiva
414
di coordinate. Più precisamente, tale prescrizione è tale che se attuiamo γ sul sistema oppure γ ∗
sull’apparato di misura, otteniamo lo stesso risultato (valori di aspettazione, varianze, frequenze
di esiti) quando guardiamo gli esiti delle misure.
Per esempio, il valore di aspettazione hγ ∗ (A)iρ risulta essere lo stesso di hAiγ(ρ) :
€
Š
€
Š
hγ ∗ (A)iρ = tr (γ ∗ (A)ρ) = tr U −1 AU ρ = tr AU ρU −1 = tr(Aγ(ρ)) = hAiγ(ρ) .
Questo è , in definitiva, il risultato espresso nell’equazione di dualità (11.16). Il risultato è equivalente
a dire che l’azione di γ sul sistema può essere annullata, ai fini dell’osservazione degli esiti delle
misure sul sistema, dall’azione contemporanea di (γ ∗ )−1 sugli strumenti. Si noti che, dal punto
di vista sperimentale non è affatto ovvio che una trasformazione agente sul sistema possa essere
annullata da un’azione contemporanea sull’apparto di misura. Le simmetrie, nel senso di Kadison e di Wigner, hanno la proprietà che questo deve essere possibile possibile.
Esempi 11.2.
(1) Consideriamo una particella quantistica senza spin descritta su R3 , pensato come spazio di
quiete di un sistema di riferimento inerziale descritto da fissate coordinate ortonormali destrorse.
Sappiamo, dal cap 10, che in tal caso lo spazio di Hilbert della particella è L2 (R3 , dx). Gli stati
puri sono dunque individuati,
a meno di fasi arbitrarie, dalle funzioni d’onda, cioè dai vettori
R
2
3
ψ ∈ L (R , dx) tali che R3 |ψ(x)|2 dx = 1.
Le isometrie di R3 individuano simmetrie di Wigner (e quindi di Kadison) nel modo che segue,
a causa dell’invarianza della misura di Lebesgue dx sotto di esse.
Alcune nozioni di teoria dei gruppi che useremo di seguito saranno richiamate più avanti (la
teoria elementare è brevemente richiamata nell’Appendice A). Indichiamo con IO(3) il gruppo
(di Lie) delle isometrie di R3 che risulta essere il prodotto semidiretto (vedi Appendice A) di
O(3) e del gruppo abeliano delle traslazioni R3 . In pratica, ogni elemento del gruppo Γ ∈ IO(3)
è una coppia Γ = (R, t) che agisce sui punti di R3 come segue: Γ(x) := t + Rx. La legge di
composizione gruppale di IO(3) si ottiene di conseguenza come:
(t0 , R0 ) ◦ (t, R) = (t0 + R0 t, R0 R)
e quindi
(t, R)−1 = (−R−1 t, R−1 ) .
Sia Γ : R3 → R3 un elemento di IO(3), quindi in particolare Γ potrebbe essere una traslazione
lungo un asse t, Γ : R3 3 x 7→ x + t oppure una rotazione di O(3) attorno all’origine R3 3
x 7→ Rx (includendo le rotazioni improprie descritte dagli elementi di O(3) con determinante
negativo) oppure una combinazione di questi due tipi di trasformazioni. Possiamo allora definire
la trasformazione delle funzioni a quadrato integrabile:
€
Š
(UΓ ψ) (x) := ψ Γ−1 x
per ogni ψ ∈ L2 (R3 , dx).
(11.18)
L’operatore U è evidentemente lineare, suriettivo (dato che ogni isometria Γ di R3 è biettiva) ed
è un operatore isometrico, dato che la matrice jacobiana J di ogni isometria ha determinante
che vale ±1:
Z
Z €
Z
Š2
2
−1
0 2
0
ψ x0 2 dx0 = ||ψ||2 .
ψ x
|detJ|dx =
||UΓ ψ|| =
ψ Γ x dx =
R3
R3
R3
415
La trasformazione γΓ indotta dall’operatore unitario UΓ sugli stati (puri e non) è una simmetria
(di Wigner o Kadison rispettivamente), che ha come significato naturale l’azione dell’isometria
Γ sul sistema S dato dalla particella in esame.
Si osservi che l’applicazione IO(3) 3 Γ 7→ UΓ soddisfa, in virtù di (11.18) e dove id è l’identità di
IO(3):
Uid = I , UΓ UΓ0 = UΓ◦Γ0 per ogni Γ, Γ0 ∈ IO(3).
Abbiamo quindi che IO(3) 3 Γ 7→ UΓ conserva la struttura di gruppo (in particolare UΓ−1 =
(UΓ )−1 ) ed è pertanto una rappresentazione del gruppo IO(3) in termini di operatori unitari.
Discuteremo tali rappresentazioni nella prossima sezione.
Consideriamo ora una PVM su R3 , che indicheremo con P (X) , e che è detta misura spettrale
congiunta dei tre operatori posizione ed è definita da:
(X)
(PE ψ)(x) = χE (x)ψ(x)
per ogni ψ ∈ L2 (R3 , dx).
Si dimostra facilmente che i tre operatori posizione si ottengono integrando le corrispondenti
funzioni rispetto a tale PVM:
Z
Xi =
R3
xi dP (X) (x)
per i = 1, 2, 3.
Direttamente dalla definizione (11.18) si verifica che vale la condizione di imprimitività :
(X)
(X)
= UΓ PE UΓ−1 = PΓ(E) .
(11.19)
Infatti, per una generica funzione ψ ∈ L2 (R3 , dx):
€
Š € €
Š Š
(X)
(X)
UΓ PE UΓ−1 ψ (x) = χE Γ−1 (x) ψ( Γ Γ−1 (x) ) = χΓ(E) (x)ψ(x) = PΓ(E) ψ (x) .
Per l’arbitrarietà di ψ segue la (11.19). Si osservi che la condizione di imprimitività si può equivalentemente
scrivere in termini dell’azione duale della simmetria di Kadison:
(X)
γΓ∗ PE
(X)
= PΓ−1 (E) .
In generale, se abbiamo (i) una misura spettrale P sull’algebra di Borel dello spazio topologico
a base numerabile e localmente compatto X, (ii) un gruppo topologico G di trasformazioni di X
ed (iii) una rappresentazione unitaria G 3 g 7→ Vg che sia continua nella topologia operatoriale
forte, se vale la condizione:
Vg PE Vg−1 = Pg(E) ,
si dice che si ha un sistema di imprimitività su X. Abbiamo verificato (a parte le questioni
topologiche che in ogni caso valgono dotando IO(3) della sua naturale struttura di gruppo di Lie
matriciale sottogruppo di GL(4)), che P (X) , IO(3), U , formano un sistema di imprimitività su
R3 .
L’azione di γΓ∗ sugli operatori posizione si può ottenere per computo diretto, analogamente a
416
come abbiamo ricavato la condizione di imprimitività , oppure tenendo conto di quest’ultima
ed integrando la misura spettrale. Se X = (X1 , X2 , X3 ) indica il vettore colonna di operatori
X1 , X2 , X3 ristretti al dominio comune invariante dato dalla spazio di Schwartz S(R3 ) su cui
sono essenzialmente autoaggiunti:
γΓ∗ (X) = UΓ−1 XUΓ = RX + tI ,
(11.20)
in particolare, per traslazioni pure:
−1
∗
γ(t,I)
(X) = U(t,I)
XU(t,I) = X + tI ,
(11.21)
−1
∗
γ(0,R)
(X) = U(0,R)
XU(0,R) = RX .
(11.22)
e per rotazioni pure:
L’elemento (0, −I) ∈ IO(3) definisce la riflessione rispetto all’origine. La rappresentazione unitaria P := U(0,−I) , ed anche la simmetria di Wigner o Kadison γP ad essa associata, si dice
inversione di parità . Un po’ impropriamente, la stessa (0, −I) è spesso detta inversione di
parità . Si verifica facilmente che P∗ = P (e quindi PP = I, dato che vale anche P−1 = P∗ ).
Pertanto l’inversione di parità ammette un’osservabile ad essa associata che si chiama parità
ed ha i due possibili autovalori ±1. Bisogna però precisare che, in realtà , l’operatore unitario
che rappresenta (0, −I) è al solito definita a meno di una fase e quindi l’osservabile P, associata
alla simmetria di inversione di parità , corrisponde ad una precisa scelta di tale fase. Sono in
realtà possibili due scelta, dato che −P è ancora un’osservabile e rappresenta l’inversione di parità .
(2) Consideriamo ora il sistema trattato nell’esempio precedente, ma studiamo il sistema nella rappresentazione impulso. In altre parole, sfruttando la trasformata di Fourier-Plancherel,
identifichiamo H con L2 (R3 , dk), in modo tale che le tre osservabili impulso (le tra componenti
dell’impulso riferite al sistema di coordinate cartesiane ortonormali solidali con un riferimento
inerziale) siano rappresentati dagli operatori moltiplicativi
€
Š
e
Pi ψb (k) = ~ki ψ(k)
,
b
come discusso nel cap. 10. Abbiamo indicato con ψe = F(ψ)
la trasformata di Fourier-Plancherel
2
3
di ψ ∈ L (R , dx). Una simmetria di grande interesse fisico è l’inversione del tempo, γT ,
che è descritta da operatori antiunitari (vedremo più avanti perché ). Dal punto di vista fisico
corrisponde all’operazione che cambia segno al tempo, ma anche alle velocità delle particelle
quindi al loro impulso. Una scelta (l’unica a meno di fasi) per l’operatore anti unitario Tf che
descrive l’inversione del tempo è :
€
Š
e
Tfψe (k) := ψ(−k)
per ogni ψe ∈ L2 (R3 , dk).
(11.23)
Si osservi che, a differenza di P nell’esempio precedente, con ogni scelta per la fase arbitraria
dell’operatore Tf, vale sempre TfTf = I a causa dell’antiunitarietà di Tf. Tuttavia Tf non
417
è un’osservabile perchè l’operatore non è lineare. Si può facilmente dimostrare che, tornando in
rappresentazione posizione e con la scelta fatta per la fase, la simmetria γT è associata ad un
b è la trasformata di Fourier-Plancherel usata come nel cap. 10):
operatore antiunitario (dove F
b −1 T
b −1
fF
T := F
tale che:
(T ψ) (x) := ψ(x)
per ogni ψ ∈ L2 (R3 , dx).
(11.24)
(3) Consideriamo una particella con carica elettrica rappresentata dall’osservabile Q con spettro
discreto di autovalori ±1. Fissando un riferimento inerziale I, dotato di un sistema di coordinate
solidali cartesiane ortonormali che identificano lo spazio di quiete del riferimento con R3 , lo spazio
di Hilbert del sistema è dato, in questo caso, da
H = C2 ⊗ L2 (R3 , dx) ≡ L2 (R3 , dx) ⊕ (R3 , dx) ,
dove ⊕ si deve intendere come una somma diretta ortogonale. L’isomorfismo canonico tra i due
spazi scritti sopra, segue dal fatto che ogni vettore Ψ ∈ C2 ⊗ L2 (R3 , dx) è scrivibile come
Ψ = |+i ⊗ ψ+ + |−i ⊗ ψ− ,
dove {|+i, |−i} è la base canonica di C2 , costituita da due autovettori della matrice di Pauli
σ3 (vedi (11.10)) rispettivamente con autovalore +1 e autovalore −1. L’isomorfismo canonico
è dato dunque da:
L2 (R3 , dx) ⊕ (R3 , dx) 3 (ψ+ , ψ− ) 7→ |+i ⊗ ψ+ + |−i ⊗ ψ− ∈ C2 ⊗ L2 (R3 , dx) .
Si verifica subito che l’isomorfismo conserva la struttura di spazio di Hilbert (cioè il prodotto
scalare), quando si pensa L2 (R3 , dx)⊕(R3 , dx) come una somma diretta ortogonale. L’osservabile
di carica può pensarsi come la matrice di Pauli σ3 in C2 e quindi, sullo spazio completo:
Q = σ3 ⊗ I
dove I è l’operatore identità su L2 (R3 , dx). La regola di superselezione della carica, in questo
caso elementare, richiede che lo spazio si decomponga in due settori coerenti H = H+ ⊕ H− ,
dove H± sono, rispettivamente, i due autospazi di Q con autovalore ±. Per costruzione, la
decomposizione in settori coerenti coincide proprio con la decomposizione naturale:
H = L2 (R3 , dx) ⊕ (R3 , dx) .
In riferimento a tale decomposizione, gli stati puri fisicamente ammissibili sono allora solamente
quelli individuati dai vettori (ψ, 0) oppure dai vettori (0, ψ) con ψ ∈ L2 (R3 , dx). Abbiamo
418
allora che la simmetria γC+ detta coniugazione di carica dal settore H+ al settore H−
erappresentata dall’operatore unitario C : H+ → H− :
C+ : (ψ, 0) 7→ (0, ψ)
per ogni ψ ∈ L2 (R3 , dx).
(11.25)
La simmetria γC− detta coniugazione di carica dal settore H− al settore H+ si definisce
analogamente
C− : (0, φ) 7→ (φ, 0) per ogni φ ∈ L2 (R3 , dx).
(11.26)
Si noti che C− risulta essere l’inverso di C+ . Possiamo infine definire la simmetria di Wigner di
coniugazione di carica, che opera su tutto lo spazio di Hilbert (tenendo conto della presenza
dei settori), e che si riduce alle due simmetrie tra settori definite sopra su ogni spazio coerente.
C := C+ ⊕ C− .
Si osservi che, per costruzione, CC = I e pertanto C = C∗ , per cui I è autoaggiunto. Inoltre si
ha che:
C∗ QC = −Q .
(11.27)
Esercizi 11.1.
(1) In riferimento all’esempio (1), e con IO(3) 3 Γ = (t, R), dimostrare che
γΓ∗ (P) = UΓ−1 PUΓ = RP ,
(11.28)
dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identità di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori
impulso.
(2) In riferimento agli esempi (1) e (2), e con le convenzioni dell’esercizio (1) per le notazioni e
riguardanti i domini degli operatori, dimostrare che:
γP∗ (X) = P−1 XP = −X ,
γP∗ (P) = P−1 PP = −P
(11.29)
γT∗ (P) = T −1 PT = −P
(11.30)
mentre:
γT∗ (X) = T −1 XT = X ,
dove P indica la terna dei tre operatori corrispondenti alle tre componenti dell’impulso e l’identità di sopra vale restringendosi allo spazio di Schwartz S(R) come dominio per gli operatori
impulso.
(3) Considerare i tre operatori autoaggiunti L1 , L2 , L3 che rappresentano le tre componenti
dell’operatore momento angolare orbitale (vedi cap 9). Se L indica il vettore colonna contenente
i tre operatori menzionati, vale:
LS(R3 ) = XS(R3 ) ∧PS(R3 ) .
419
Dimostrare i seguenti fatti, dove i domini sono ristretti a S(R3 ): In riferimento all’esempio (1),
e con SO(3) 3 Γ = (0, R), dimostrare che vale quanto segue.
γΓ∗ (L) = UΓ−1 LUΓ = RL ,
(11.31)
γP∗ (L) = P−1 LP = L ,
(11.32)
γT∗ (L) = T −1 LT = −L .
(11.33)
SO(3) è il sottogruppo di O(3) contenente le matrici con determinante positivo (quindi pari a
+1) ed il prodotto vettoriale è definito sopra con la regola del determinante formale in riferimento ad una base destrorsa.
(4) Si consideri lo spazio di Hilbert HS del sistema S e si assuma che sia decomposto in settori
coerenti, in modo che lo spazio degli stati puri fisicamente ammissibili sia decomposto come:
[
Sp (HS )ammiss =
Sp (HSk ) .
k∈K
Si definisca su Sp (HS ) la distanza d(ρ, ρ0 ) := ||ρ − ρ0 ||1 := tr(|ρ − ρ0 |), dove || ||1 è la norma
naturale nello spazio degli operatori di classe traccia. Si provi che gli insiemi Sp (HSk ) sono le
componenti connesse di Sp (HS )ammiss . Può essere utile sapere che,È
come proveremo in seguito,
0
0
0
0
se ρ = ψ(ψ| ) e ρ = ψ (ψ | ) sono in Sp (HSk ), allora ||ρ − ρ ||1 = 2 1 − |(ψ|ψ 0 )|2 .
Traccia di soluzione. Per la prima domanda si considerino due stati puri ρ, ρ0 ∈ Sp (HSk )
con ρ = ψ(ψ| ) e ρ0 = ψ 0 (ψ 0 | ) e ψ non parallelo a ψ 0 (altrimenti individuano lo stesso stato),
si definisca ψt = tψ + (1 − t)ψ 0 ed infine la curva [0, 1] 3 t 7→ ||ψψtt||2 (ψt | ). Si provi che tale
curva è continua ed è tutta contenuta in Sp (HSk ). Per la seconda domanda è sufficiente calcolare
||ρ − ρ0 ||1 quando ρ ∈ Sp (HSk ) e ρ0 ∈ Sp (HSk0 ) con k 6= k 0 . Notare che in tal caso i vettori
che individuano ρ e ρ0 sono sempre perpendicolari e pertanto ρ − ρ0 è già la decomposizione in
parte positiva e parte negativa di ρ − ρ0 e quindi |ρ − ρ0 | = ρ + ρ0 , per cui ||ρ − ρ0 ||1 = 2.
Consideriamo allora un aperto Ak ⊃ Sp (HSk ), unione di palle aperte di raggio 1/2 centrate sugli
elementi di Sp (HSk ), ed un aperto Ak0 ⊃ Sp (HSk0 ), unione di palle aperte di raggio 1/2 centrate
sugli elementi di Sp (HSk0 ). I due aperti non possono intersecarsi a causa della disuguaglianza
triangolare e quindi Sp (HSk ) e Sp (HSk0 ) sono sconnessi.
(5) Si dimostri che la distanza d(ρ, ρ0 ) tra stati puri introdotta nell’esercizio 4 soddisfa:
d ψ(ψ| ), ψ 0 (ψ| ) = ψ(ψ| ) − ψ 0 (ψ 0 | )B(H)
per ogni coppia di vettori ψ, ψ 0 ∈ H con ||ψ|| = ||ψ 0 || = 1 e dove la norma || ||B(H) indica la
norma operatoriale standard.
(6) Sia U : H → H un operatore anti unitario sullo spazio di Hilbert H e sia A : D(A) → H un
operatore autoaggiunto su H. Si dimostri che valgono i seguenti fatti:
420
(a) U −1 AU : U −1 (D(A)) → H è autoaggiunto,
(b) σ(U −1 AU ) = σ(A),
(A)
(c) B(R) 3 E 7→ U −1 PE U è la misura spettrale associata a U −1 AU dal teorema spettrale,
cioé
Z
Z
−1
(A)
U
λdP (λ)U =
λd(U −1 P (A) U )(λ) ,
R
R
itU −1 AU
(d) U −1 eitA U = e
.
Suggerimenti. (a) e (b) seguono dalla definizione di operatore autoaggiunto. (c) si ottiene
provando che per funzioni f : R → C limitate, direttamente
dalla definizione
di integrale di funR
R
−1
(A)
zioni limitate rispetto a una PVM (cap 8), vale U
(x)U = R fR (x)d(U −1 P (A) U )(x);
R f (x)dP
quindi osservando che per ogni operatore autoaggiunto vale T = s-limn→+∞ R χ[−n,n] (x)dP (T ) (x).
(d) si ottiene da (d) oppure, direttamente, sviluppando in serie l’esponenziale sull’insieme denso
(A)
di vettori analitici di U −1 AU della forma ψ ∈ U −1 P[−n,n] (H) con n ∈ N.
11.2
Introduzione ai gruppi di simmetria.
In questa sezione introdurremo alcuni argomenti elementari della teoria delle rappresentazioni
proiettive applicata ai gruppi di simmetria quantistica. Vista la vastità e l’importanza dell’argomento, rimandiamo all’esaustivo trattato [BaRa86] per approfondimenti.
11.2.1
Rappresentazioni proiettive, unitarie proiettive, estensioni centrali.
Consideriamo la situazione in cui esista un gruppo G (con prodotto gruppale indicato con · ed
elemento neutro e) che possa essere interpretato come gruppo di trasformazioni che possano
agire su un sistema fisico S, descritto nello spazio di Hilbert HS . Per semplicità supponiamo
che HS non ammetta settori coerenti (quindi HS stesso è l’unico settore). Supponiamo infine
che, a ciascuna di queste trasformazioni g ∈ G, sia associata una simmetria γg , che quindi
possiamo pensare come automorfismo di Kadison (o di Wigner). Abbiamo incontrato questa
situazione in (1) in esempi 11.1. In tal caso G era il gruppo delle isometrie dello spazio di
quiete tridimensionale di un riferimento inerziale e S era la particella senza carica e senza spin.
Gli automorfismi di Kadison da S(HS ) in S(HS ) formano naturalmente un gruppo rispetto
alla composizione di applicazioni. Arriviamo naturalmente in questo modo all’idea che esista
una rappresentazione di G in termini di automorfismi di Kadison che rappresentino l’azione
del gruppo di trasformazioni G sugli stati quantistici del sistema S. In altre parole, possiamo
supporre che l’applicazione G 3 g 7→ γg sia un omomorfismo gruppale, cioè conservi la struttura
di gruppo:
γg·g0 = γg ◦ γg0 , γe = id , γg−1 = γg−1 per ogni g, g 0 ∈ G,
dove abbiamo indicato con id l’automorfismo identità . In realtà non è necessario imporre la terza condizione, dato che essa segue dalle precedenti due in virtù dell’unicità dell’elemento inverso
in un gruppo. Ci si aspetta anche che, come accade nella maggior parte dei casi concreti in
fisica, la rappresentazione G 3 g 7→ γg sia fedele, cioè che l’omomorfismo gruppale G 3 g 7→ γg
421
sia iniettivo. La situazione descritta è molto frequente in fisica.
Definizione 11.4. Si consideri un sistema quantistico S descritto sullo spazio di Hilbert HS .
Sia G un gruppo che ammette un omomorfismo gruppale iniettivo (cioè una rappresentazione
fedele) G 3 g 7→ γg , in termini di automorfismi di Wigner γg ∈ Sp (HS ) → Sp (HS ). In tal
caso diremo che G è un gruppo di simmetria di S e G 3 g 7→ γg è la sua rappresentazione
proiettiva su Sp (HS ).
Osservazioni.
(1) Nella definizione ci siamo riferiti solo a simmetrie di Wigner, questo non è riduttivo dato
che, per il teorema di Kadison (nella formulazione che abbiamo dato noi), ogni automorfismo di
Wigner γg si estende, in modo unico, ad un automorfismo di Kadison γg0 : S(HS ) → S(HS ). Si
prova immediatamente che G 3 g 7→ γg0 è un omomorfismo gruppale iniettivo, cioè una rappresentazione fedele di G in termini di automorfismi di Kadison. Viceversa, ogni rappresentazione
fedele di G in termini di automorfismi di Kadison individua univocamente una rappresentazione
fedele di G in termini di automorfismi di Wigner, restringendo ogni automorfismo di Kadison a
Sp (HS ).
Nel seguito, anche se scriveremo prevalentemente simmetria di Wigner, penseremo indifferentemente la rappresentazione G 3 g 7→ γg come costituita da automorfismi di Wigner o di Kadison
a seconda di quello che è conveniente.
(2) Il termine rappresentazione proiettiva, è appropriato perché Sp (Hs ) è uno spazio proiettivo
come menzionato nel capitolo 7 e l’applicazione γg Sp (HS ) : Sp (HS ) → Sp (HS ) è ben definita.
(3) Dato che l’omomorfismo G 3 g 7→ γg è esplicitamente supposto essere iniettivo, possiamo
equivalentemente considerare come gruppo di simmetria, o più precisamente il gruppo di simmetrie, l’insieme degli automorfismi γg , con g ∈ G, dotato della struttura naturale di gruppo
rispetto alla legge di composizione dei funzioni. Tale gruppo è infatti isomorfo a G per costruzione.
Una questione interessante è la seguente. Supponiamo ancora di avere un gruppo di simmetria,
con rappresentazione proiettiva G 3 g 7→ γg . L’applicazione G 7→ γg è certamente una rappresentazione, ma non è una rappresentazione lineare, dato che le funzioni γg : Sp (HS ) → Sp (HS )
non sono funzioni lineari. Notando però che ad ogni automorfismo γg corrisponde un operatore unitario (lineare) o antiunitario Ug : HS → HS , che soddisfa γg (ρ) = Ug ρUg−1 per ogni
ρ ∈ Sp (HS ), sorge spontanea la questione se possa accadere che l’applicazione G 3 g 7→ Ug
sia una rappresentazione (anti)lineare di G cioè in termini di operatori (anti)lineari (unitari e/o
antiunitari) di B(H). In altre parole ci chiediamo se sia possibile che l’applicazione G 3 g 7→ Ug
sia un omomorfismo gruppale, cioè conservi la struttura di gruppo:
Ug·g0 = Ug Ug0 ,
Ue = I ,
Ug−1 = Ug−1
per ogni g, g 0 ∈ G,
(11.34)
dove I : HS → HS è l’operatore identità . La questione è importante anche dal punto di vista tecnico, in quanto esistono moltissimi risultati della teoria delle rappresentazioni lineari dei gruppi
422
su spazi vettoriali (di Hilbert), che possono essere usati nello studio dei gruppi di simmetria dei
sistemi quantistici. La risposta, in generale è negativa, dato che la condizione Ug·g0 = Ug Ug0 non
è in generale verificata. Infatti, dato che γg ◦ γg0 = γgg0 , deve essere:
−1
Ug Ug0 ρ(Ug Ug0 )−1 = Ug·g0 ρUg·g
0
per ogni ρ ∈ S(HS ).
Conseguentemente:
(Ug·g0 )−1 Ug Ug0 ρ(Ug Ug0 )−1 Ug·g0 = ρ per ogni ρ ∈ Sp (HS ).
Questi significa che, se ρ = ψ(ψ| ), allora (Ug·g0 )−1 Ug Ug0 ψ e ψ devono differire al più per una fase.
Tale fase non può dipendere da ψ (la dimostrazione è la stessa che abbiamo fatto nell’enunciato
relativo all’unicità nel teorema di Wigner), tuttavia tale fase può dipendere da g e g 0 . Deve essere
chiaro che è impossibile ottenere un risultato più preciso, proprio perchè gli stessi operatori U
sono definiti a meno di una fase. In definitiva, se gli Ug sono gli operatori (unitari o antiunitari)
associati ad una rappresentazione proiettiva di un certo gruppo di simmetria, la condizione
Ug·g0 = Ug Ug0 , nel caso generale si indebolisce in:
Ug Ug0 = ω(g, g 0 )Ug·g0
per ogni g, g 0 ∈ G,
dove ω(g, g 0 ) ∈ C con |ω(g, g 0 )| = 1 sono numeri complessi che dipendono dalla scelta che abbiamo fatto nell’associare gli operatori Ug agli automorfismo γg in rispetto della libertà permessa
dai teoremi di Wigner e Kadison. Quindi se U (1) indica il gruppo dei numeri complessi di modulo unitario, deve accadere che ω(g, g 0 ) ∈ U (1).
Non è affatto ovvio che sia possibile riassegnare le fasi degli operatori Ug , in modo tale che risulti
ω(g, g 0 ) = 1 per ogni g, g 0 ∈ G.
Nota. D’ora in poi ci restringeremo a lavorare con operatori esplicitamente unitari tralasciando
il caso antiunitario. Daremo qualche motivazione alla fine di questa sezione.
Le funzioni G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) non sono completamente arbitrarie, dato che deve
valere la proprietà associativa:
(Ug Ug0 )Ug00 = Ug (Ug0 Ug00 ) .
Il calcolo prova immediatamente che la proprietà associativa è valida se e solo se è soddisfatta
l’identità :
ω(g, g 0 )ω(g · g 0 , g 00 ) = ω(g, g 0 · g 00 )ω(g 0 , g 00 )
(11.35)
Da questa identità seguono immediatamente le importanti proprietà (dove e è l’elemento neutro
di G):
ω(g, e) = ω(e, g) ,
ω(g, e) = ω(g1 , e) ,
ω(g, g −1 ) = ω(g −1 , g) ,
423
per ogni g, g1 ∈ G. (11.36)
Possiamo dare la seguente definizione che prescinde dal significato fisico degli oggetti matematici
coinvolti.
Definizione 11.5. Se G è un gruppo e H uno spazio di Hilbert (complesso), una rappresentazione unitaria proiettiva di G su H è applicazione:
G 3 g 7→ Ug ∈ B(H) ,
(11.37)
in cui Ug sono operatori unitari e, definiti i moltiplicatori della rappresentazione:
−1
ω(g, g 0 ) := Ug·g
0 Ug Ug 0
per ogni g, g 0 ∈ G,
(11.38)
risulti ω(g, g 0 ) ∈ U (1) (e di conseguenza vale la (11.35)) per ogni g, g 0 ∈ G.
La rappresentazione proiettiva su Sp (H) individuata da (con ovvie notazioni):
G 3 g 7→ Ug · Ug∗
si dice essere indotta dalla rappresentazione unitaria proiettiva (11.37).
La rappresentazione unitaria proiettiva (11.37) è detta rappresentazione (propriamente)
unitaria di G su H se tutti i suoi moltiplicatori sono 1.
La rappresentazione unitaria proiettiva (11.37) è detta irriducibilerappresentazione unitaria
proiettiva irriducibile, se non esiste alcun sottospazio chiuso H0 ⊂ H diverso da H e da {0} tale
che Ug (H0 ) ⊂ H0 per ogni g ∈ G.
Due rappresentazioni unitarie proiettive G 3 g 7→ Ug ∈ B(H) e G 3 g 7→ Ug0 ∈ B(H0 ), con H e
H0 spazi di Hilbert (eventualmente coincidenti), si dicono equivalentirappresentazioni unitarie
proiettive equivalenti se esiste un operatore unitario S : H → H0 ed una funzione χ : G 3 g 7→
χ(g) ∈ U (1) tali che:
χ(g)SUg S −1 = Ug0 per ogni g ∈ G.
(11.39)
Nota. Il lettore deve avere ben chiara la differenza tra rappresentazioni proiettive e rappresentazioni unitarie proiettive e rappresentazioni unitarie. Le prime agiscono su Sp (HS ) o S(HS )
rappresentando gruppi di simmetria e non contengono scelte arbitrarie senza significato fisico.
Quelle di secondo e terzo tipo agiscono su HS , inducono rappresentazioni proiettive, ma sono
affette da scelte arbitrarie nella definizione delle fasi degli operatori unitari che le costituiscono.
Osservazioni.
(1) La nozione data di rappresentazioni unitarie proiettive equivalenti è : transitiva, simmetrica e riflessiva. Pertanto individua una relazione di equivalenza tra le rappresentazioni unitarie
proiettive di un fissato gruppo su un fissato spazio di Hilbert. Se G è un gruppo di simmetria
per il sistema fisico S, descritto sullo spazio di Hilbert HS , le rappresentazioni proiettive di G
su Sp (HS ) sono evidentemente in corrispondenza biunivoca con le classi di equivalenza di rappresentazioni unitarie proiettive di G.
(2) La proprietà che una data rappresentazione unitaria proiettiva G 3 g 7→ Ug sia equivalente
424
ad una rappresentazione unitaria, è in realtà una proprietà riguardante classe di equivalenza di
tale rappresentazione unitaria proiettiva: corrisponde al fatto che la classe di equivalenza contenga una rappresentazione unitaria. Nel caso in cui ci riferiamo ad un gruppo di simmetrie di
un sistema quantistico, è dunque una proprietà della rappresentazione proiettiva su S(HS ) alla
quale corrisponde tale classe di equivalenza.
(3) La proprietà che una data rappresentazione unitaria proiettiva G 3 g 7→ Ug sia irriducibile
è in realtà una proprietà riguardante tutti gli elementi della classe di equivalenza di tale rappresentazione unitaria proiettiva: se un elemento è irriducibile, allora lo sono tutti gli altri, come si
verifica immediatamente dalle definizioni date. L’importanza delle rappresentazioni irriducibili
è dovuta al fatto che con tali rappresentazioni si costruiscono tutte le rimanenti rappresentazioni
come somma diretta o come integrale diretto di rappresentazioni irriducibili [BaRa86].
La questione se un data rappresentazione proiettiva G 3 g 7→ γg di un gruppo di simmetria
G ammetta una descrizione, sullo spazio HS , in termini di una rappresentazione unitaria di
g può porsi come segue, in termini concreti. Nella classe di equivalenza di rappresentazioni
proiettive unitarie associate a G 3 g 7→ γg , se ne fissa una arbitrariamente (quanto segue non
dipende dal particolare elemento della classe di equivalenza per l’osservazione (2) di sopra) e si
considerano i suoi moltiplicatori.
La questione si riduce ora allo stabilire se esista o meno una funzione χ : G 3 g 7→ χ(g) ∈ C con
|χ(g)| = 1 che verifichi la condizione:
ω(g, g 0 ) =
χ(g · g 0 )
χ(g)χ(g 0 )
per ogni g, g 0 ∈ G .
(11.40)
Infatti se la suddetta funzione χ esiste, inserendo essa a primo membro in (11.39), i moltiplicatori di G 3 g 7→ Ug0 risultano essere banali per le identità (11.40). Se, viceversa i moltiplicatori
di G 3 g 7→ Ug0 sono banali, la funzione χ, che appare a primo membro in (11.39), soddisfa la
(11.40).
Esistono vari approcci per affrontare e risolvere il problema dell’esistenza di χ suddetta [BaRa86],
e si vede che ci sono gruppi, in particolare i gruppi di Lorentz e Poincaré , le cui rappresentazioni proiettive sono descrivibili da rappresentazioni unitarie sullo spazio di Hilbert associato al
sistema fisico. Altri, come il gruppo di Galileo, le cui rappresentazioni proiettive (non banali)
non ammettono descrizioni in termini di rappresentazioni unitarie, ma solo unitarie proiettive e
non si possono sopprimere i moltiplicatori.
Esiste una vasta letteratura in proposito e le rappresentazioni unitarie proiettive irriducibili dei
gruppi di interesse fisico (specialmente gruppi di Lie) sono state studiate e catalogate.
Come ultima osservazione vogliamo precisare che se, per un certo gruppo di simmetria G, esistono rappresentazioni unitarie proiettive differenti associate a classi di equivalenza disgiunte,
allora si possono avere conseguenti regole di superselezione come spiegato nell’esempio 11.3 sotto.
Torniamo ora ad esaminare la questione dell’unitarietà o antiunitarietà degli operatori Ug . Supponiamo di avere un gruppo di simmetria, con rappresentazione proiettiva G 3 g 7→ γg . Ad
ogni automorfismo γg corrisponde un operatore unitario oppure antiunitario, Ug : HS → HS ,
425
che soddisfa γg (ρ) = Ug ρUg−1 per ogni ρ ∈ Sp (HS ), in base al teorema di Wigner. Ci sono
criteri per decidere se gli operatori Ug sono tutti unitari, tutti anti unitari oppure di tipo differente a seconda del particolare g ∈ G? Se Ug e Ug0 fossero entrambi antiunitari, il vincolo
Ug Ug0 = χ(g, g 0 )Ug·g0 imporrebbe che Ug·g0 sia, al contrario, unitario. Di conseguenza rappresentazioni con più di due elementi costituite da soli operatori antiunitari (a parte l’identità che
è sempre unitaria) non possono esistere e la situazione in cui appaiono alcuni (più di uno) operatori antiunitari è comunque non banale per l’esistenza di vincoli come quello trovato. Sussiste la
seguente elementare proposizione a riguardo, che mostra che la natura stessa di G può imporre
che gli operatori siano tutti unitari.
Proposizione 11.5. Sia H uno spazio di Hilbert complesso e G un gruppo. Si supponga che
ogni g ∈ G sia il prodotto di elementi g1 , g2 , . . . , gn ∈ G (dipendenti da g) che ammettono una
radice quadrata (cioè esiste rk ∈ G tale che gk = rk · rk per ogni k = 1, . . . , n). Allora per ogni
rappresentazione proiettiva G 3 g 7→ γg gli elementi γg possono essere associati solo ad operatori
unitari in base al teorema di Wigner (o Kadison).
Prova. La prova è ovvia, essendo Urk Urk lineare anche quando Urk è antilineare e valendo
Ugk = χ(rk , rk )Urk Urk , segue che Ugk deve essere lineare ed, infine, anche Ug deve essere lineare. 2
Abbiamo il seguente importante caso per le applicazioni, specialmente per n = 1.
Proposizione 11.6. In riferimento alla proposizione 11.5, le rappresentazioni proiettive del
gruppo additivo G = Rn possono solo essere associate ad operatori unitari.
Prova. Se t ∈ Rn allora t = t/2 + t/2. La tesi allora segue dalla proposizione 11.5. 2.
Come vedremo più avanti, l’ipotesi della proposizione 11.5 è automaticamente soddisfatta nel
momento in cui si assume che G sia un gruppo di Lie connesso, e la presenza di operatori antiunitari si ha solo in presenza di gruppi discreti o discontinuità (cambiando componente connessa
del gruppo di Lie). Pertanto nel seguito ci riferiremo al caso in cui tutti gli operatori Ug siano
sempre unitari.
Esiste un approccio [BaRa86] che permette di studiare tutte le possibili rappresentazioni proiettive unitarie di un gruppo, vedendole come restrizioni di rappresentazioni unitarie di un gruppo
più grande detto estensione centrale del gruppo iniziale. Questa procedura, apparentemente
macchinosa, risulta invece tecnicamente utile (anche per determinare l’esistenza di eventuali
rappresentazioni unitarie del gruppo iniziale G) perché permette di utilizzare tecniche proprie
della teoria delle rappresentazioni unitarie (dell’estensione centrale), che è molto più semplice di
quella delle rappresentazioni proiettive. Spieghiamo brevemente l’idea fondamentale di questa
procedura. Bisogna precisare che essa è davvero utile nel caso in cui G sia un gruppo di Lie
(semplicemente connesso) come vedremo più avanti; tuttavia questa caratterizzazione non entra
426
in gioco nell’idea fondamentale che stiamo per spiegare, in cui la sola struttura algebrica di
gruppo è sufficiente.
Se G è un gruppo arbitrario, e G 3 g 7→ Ug è una rappresentazione proiettiva sullo spazio di
b ω che ha come elementi le coppie
Hilbert H con moltiplicatori ω, definiamo il nuovo gruppo G
b
(χ, g) ∈ U (1) × G e definiamo il prodotto gruppale in Gω come:
(χ, g) ◦ (χ0 , g) = χχ0 ω(g, g 0 ) , g · g 0
per ogni (χ, g), (χ0 , g 0 ) ∈ U (1) × G.
Lasciamo al lettore la verifica che la definizione data sia ben posta, come sola conseguenza del
fatto che la funzione ω soddisfi (11.35), e che individui effettivamente una struttura di gruppo
con elemento neutro (χ(e, e)−1 , e), essendo e l’elemento neutro di G (si tenga conto delle (11.36)).
Possiamo dare la seguente definizione che prescinde da come abbiamo ottenuto la funzione ω,
purché essa soddisfi (11.35).
Definizione 11.6. si consideri un gruppo G ed una funzione ω : G × G → U (1) che soddisfa
b ω costruito sull’insieme U (1) × G con prodotto gruppale
(11.35). Il gruppo G
(χ, g) ◦ (χ0 , g) = χχ0 ω(g, g 0 ) , g · g 0
per ogni (χ, g), (χ0 , g 0 ) ∈ U (1) × G,
lo diremo estensione centrale del gruppo G tramite U (1) con funzione dei moltiplicatori ω.
b ω e l’omomorfismo surgettivo G
b ω 3 (χ, g) 7→ g ∈
L’omomorfismo iniettivo U (1) 3 χ 7→ (χ, e) ∈ G
G sono detti, rispettivamente, l’iniezione canonica e la proiezione canonica dell’estensione
centrale.
A giustificazione della terminologia (vedi Appendice A), notiamo che la proiezione canonica
b ω 3 (χ, g) 7→ g ∈ G è un omomorfismo surgettivo, il cui nucleo è dato dal sottogruppo normale
G
N (immagine dell’iniezione canonica e isomorfo a U (1)) di elementi (χ, e) con χ ∈ U (1). N
b dato che i suoi elementi commutano con tutti gli elementi di
è incluso nel centro del gruppo G,
b
Gω (visto che ω(e, g) = ω(g, e)). In pratica, il gruppo G è stato esteso fino ad ottenere il gruppo
b ω , la cui parte che differisce da G (il nucleo dell’applicazione surgettiva G
b ω 3 (χ, g) 7→ g ∈ G)
G
è nel centro dell’estensione. Si osservi anche che G si identifica naturalmente con il gruppo
b ω /N.
quoziente G
Ci sono ora tre importanti osservazioni che portano ad individuare una procedura per ottenere
tutte le rappresentazioni unitarie proiettive di G.
(1) Il primo punto importante è che, ora, l’applicazione:
b ω 3 (χ, g) 7→ V
G
(χ,g) := χUg ,
b ω su H, infatti, gli operatori V
è sempre una vera rappresentazione unitaria di G
(χ,g) : H → H
sono tutti unitari, risulta subito che V(1,e) = I ed infine:
V(χ,g) V(χ0 ,g0 ) = χUg χ0 Ug0 = χχ0 ω(g, g 0 )Ug·g0 = V(χ,g)◦(χ0 ,g0 ) .
(2) Il secondo punto importante è che la rappresentazione unitaria proiettiva di partenza, si
b ω 3 (χ, g) 7→ V
ottiene dalla rappresentazione unitaria G
(χ,g) per restrizione: restringendo cioè il
427
dominio di V all’insieme di elementi (1, g) con g ∈ G cioè , con un piccolo abuso di linguaggio,
restringendo la rappresentazione unitaria V a G .
(3) Il terzo punto importante è che, data una qualsiasi rappresentazione unitaria
b ω 3 (χ, g) 7→ V
G
(χ,g)
di un’estensione centrale che soddisfi la condizione (notare che Ue = χ(e, e)I nelle rappresentazioni unitarie proiettive):
V(χ,e) = χω(e, e)I
per ogni χ ∈ U (1),
(11.41)
la sua restrizione all’insieme di elementi (1, g) con g ∈ G produce sempre una rappresentazione
unitaria proiettiva.
Concludiamo che vale la seguente proposizione.
Proposizione 11.7. Ogni rappresentazione unitaria proiettiva di un gruppo G si ottiene restringendo a G una opportuna rappresentazione unitaria di una opportuna estensione centrale
b ω la cui funzione dei moltiplicatori soddisfa (11.41).
G
In definitiva, considerando prima tutte le possibili estensioni centrali di G, ottenute tramite tutte
le funzioni dei moltiplicatori G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) (che soddisfino (11.35)), e poi
studiando tutte le possibili rappresentazioni unitarie di tali estensioni che soddisfino (11.41), si
ottengono anche, per restrizione a G, tutte le rappresentazioni unitarie proiettive di G.
Questa procedura in certi casi, in particolare considerando gruppi G che abbiano struttura di
gruppi di Lie, è estremamente potente e, applicando metodi di coomologia gruppale consente di
catalogare le rappresentazioni unitarie proiettive continue in un certa topologia (e le eventuali
rappresentazioni unitarie) di un gruppo di Lie semplicemente connesso, partendo dalla sola conoscenza dell’algebra di Lie di G [BaRa86]. Torneremo su ciò più avanti.
Nella procedura proposta sopra per ottenere tutte le rappresentazioni unitarie proiettive di Gω
b ω , non è necessario conoscere
restringendo le rappresentazioni unitarie delle estensioni centrali G
tutte le estensioni centrali di G. In effetti, è sufficiente conoscere le estensioni centrali i cui
moltiplicatori non sono equivalenti nel senso che segue. Date due funzioni dei moltiplicatori
sullo stesso gruppo, G × G 3 (g, g 0 ) 7→ ω(g, g 0 ) ∈ U (1) e G × G 3 (g, g 0 ) 7→ ω 0 (g, g 0 ) ∈ U (1),
diremo che esse sono equivalenti, se esiste una funzione χ : G → U (1) tale che:
ω(g, g 0 ) =
χ(g · g 0 ) 0
ω (g, g 0 )
χ(g)χ(g 0 )
per ogni g, g 0 ∈ G.
Se due rappresentazioni unitarie proiettive U e U 0 di G sono equivalenti, allora si possono cobω e G
b 0 che hanno
struire restringendo a G due rappresentazioni unitarie di estensioni centrali G
ω
0
funzioni dei moltiplicatori ω e ω equivalenti. Quindi, se conosciamo tutte le estensioni centrali
di G i cui moltiplicatori non sono equivalenti e le rappresentazioni unitarie di esse, conosciamo
428
tutte le classi di equivalenza di rappresentazioni unitarie proiettive di G e di conseguenza tutte
le rappresentazioni unitarie proiettive di G.
Si noti ancora che, se ω(e, e) 6= 1 per una certa scelta della funzione ω, attraverso una trasformazione di equivalenza con una funzione χ costante, possiamo sempre ridurci ad avere soddisfatta
la condizione χ(e, e) = 1. In questo caso, l’estensione centrale ha come elemento neutro (1, e) e
la condizione (11.41) si riduce a:
V(χ,e) = χI
per ogni χ ∈ U (1) .
(11.42)
Di conseguenza, senza perdere generalità , possiamo sempre lavorare con rappresentazioni unitarie proiettive (che si ottengono restringendo a G le rappresentazioni unitarie dell’estensione centrale) che soddisfano Ue (:= V(1,e) ) = I. Moltiplicatori tali che ω(e, e) = 1 (e quindi
ω(e, g) = ω(g, e) = ω(e, e) = 1) vengono detti normalizzati.
b nel caso in cui non
Per concludere, facciamo qualche considerazione fisica sul significato di G,
esistano rappresentazioni unitarie di G, ma solo rappresentazioni unitarie proiettive. Supponiamo quindi di avere un gruppo di simmetria G 3 g 7→ γg per il sistema fisico S, e quindi una
sua rappresentazione proiettiva su S(HS ), che non sia descrivibile tramite una rappresentazione
unitaria. Possiamo comunque fare una scelta delle fasi arbitrarie ed estendere il gruppo da G
b ω usando i moltiplicatori trovati e pensare G
b ω come il vero gruppo di simmetria di S. Tale
aG
gruppo esteso ammette dunque due rappresentazioni: una data dal gruppo G stesso:
b ω 3 (χ, g) 7→ g ∈ G ,
G
che rappresenta l’azione classica del gruppo. L’altra quantistica ed unitaria:
b ω 3 (χ, g) 7→ χUg ,
G
che rappresenta l’azione del gruppo sugli stati del sistema (in realtà sui vettori dello spazio di
Hilbert del sistema e, di conseguenza, sugli stati).
b ω è a volte detto il gruppo quantistico associato a quello classico G.
In quest’ottica, il gruppo G
b ω non può essere fatta con
Si osservi che tuttavia la scelta di una precisa estensione centrale G
la costruzione che abbiamo presentato fino ad ora, in cui solo le rappresentazioni proiettive in
termini di automorfismi di Wigner o di Kadison hanno un significato fisico. Per poter scegliere
tra le varie estensioni centrali è necessario dare un significato fisico alle singole rappresentazioni unitarie proiettive di G oppure alle singole rappresentazioni unitarie delle possibili estensioni
b Questo può essere fatto arricchendo la struttura di G fino a farlo diventare un gruppo
centrali G.
di Lie, come vedremo più avanti. Nel caso delle rappresentazioni unitarie proiettive del gruppo
di Galileo, i moltiplicatori hanno un diretto significato fisico perché sono legati alla massa del
sistema fisico come chiariremo meglio più avanti, dopo avere introdotto i gruppi di Lie come
gruppi di simmetria.
429
11.2.2
Gruppi di simmetria topologici.
Ci occupiamo ora di introdurre la nozione di gruppo di simmetria topologico, dando alcuni semplici risultati generali per lo più dovuti a Wigner. Studieremo in particolare il caso del gruppo
topologico additivo R che riveste un particolare significato fisico oltre ad essere tecnicamente
importante.
La maggior parte dei gruppi di simmetria quantistici, escluse in particolare le simmetrie discrete (inversione di parità ed inversione del tempo) sono date da gruppi di Lie, di cui diremo nel
prossimo paragrafo. I gruppi di Lie sono un sottocaso dei gruppi topologici.
Un gruppo topologico, per definizione, è un gruppo G che è anche spazio topologico e le cui
operazioni di composizione, G×G 3 (f, g) 7→ f ·g ∈ G, e di calcolo dell’inverso G 3 g 7→ g −1 , sono
funzioni continue rispetto alla topologia prodotto di G ed alla topologia di G, rispettivamente.
La teoria dei gruppi topologici e delle loro rappresentazioni è un capitolo molto vasto della matematica [NaSt84], noi ci limiteremo a presentare alcuni risultati elementarissimi e strettamente
legati ai nostri modelli fisici.
Esempi 11.3.
(1) Il gruppo GL(n, R), ovvero GL(n, C), delle matrici n×n non singolari reali, rispettivamente,
complesse, è (evidentemente) un gruppo topologico, quando lo si pensa dotato della topologia
2
2
indotta da Rn , rispettivamente Cn .
(2) Sono quindi gruppi topologici tutti i sottogruppi di GL(n, R) e GL(n, C) che si incontrano
in fisica, come il gruppo unitario U (n) = {U ∈ GL(n, C) | U U ∗ = I}, il gruppo unitario speciale
SU (n) := {U ∈ SU (n) | detU = 1}7 , il gruppo ortogonale O(n) := {R ∈ GL(n, R) | RRt = I}
ed il suo sottogruppo speciale SO(n) := {R ∈ O(n) | detR = 1}, il sottogruppo lineare speciale
SL(n, R) := SGL(n, R) := {A ∈ GL(n) | detA = 1}, i gruppi simplettici Sp(n, R) ecc...
(3) Vi sono gruppi topologici che, apparentemente, non sono gruppi matriciali, come il gruppo
additivo R. In realtà anche tale gruppo topologico, come il gruppo additivo Rn (delle traslazioni di Rn ) o il gruppo IO(n) delle isometrie proprie di Rn , si possono realizzare come gruppi
matriciali. Nel caso di Rn , la sua realizzazione matriciale è data dal gruppo – sottogruppo di
2
GL(n + 1, R) e dotato della topologia indotta da R(n+1) – delle matrici reali (n + 1) × (n + 1)
della forma:
–
™
1 0t
M (t) :=
per ogni t ∈ Rn .
(11.43)
t I
Sopra I indica la matrice identità n × n. La funzione R 3 t 7→ M (t) è un isomorfismo gruppale,
ma anche un omeomorfismo, dotando il gruppo di matrici suddette della topologia indotta da
2
R(n+1) .
(4) Il gruppo di Galileo e quello di Poincaré , oltre che quello di Lorentz, sono gruppi topologici,
che si possono costruire come gruppi matriciali. Esistono comunque gruppi topologici (che sono
7
Ricordiamo che speciale, nella teoria dei gruppi matriciali, significa con determinante 1 e si indica con la
lettera S davanti al (o all’interno del) nome del gruppo di cui il gruppo speciale è sottogruppo.
430
comunque gruppi di Lie), che non ammettono nessuna realizzazione matriciale, come il rivestimento universale del gruppo conforme (matriciale) SL(2, R).
Vogliamo ora specializzare la nozione di gruppo di simmetria al caso in cui il gruppo sia topologico, imponendo requisiti topologici anche sulla rappresentazione proiettiva associata.
Supponiamo dunque di avere una gruppo di simmetria quantistico G 3 g 7→ γg per il sistema
fisico S descritto sullo spazio di Hilbert HS . Se G è un gruppo topologico, ci aspettiamo che
l’omomorfismo gruppale g 7→ γg sia continuo in qualche senso. Dobbiamo in particolare scegliere una topologia per lo spazio delle funzioni γg , che possiamo pensare, indifferentemente come
automorfismi di Kadison oppure di Wigner. Nel seguito adotteremo il punto di vista di Wigner.
Diamo la nostra definizione che poi giustificheremo sia matematicamente che fisicamente.
Definizione 11.7. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert
HS . Sia G un gruppo topologico che ammette una rappresentazione proiettiva su H, G 3 g 7→ γg
che soddisfa:
lim tr (ρ1 γg (ρ2 )) = tr (ρ1 γg0 (ρ2 ))
g→g0
per ogni g0 ∈ G e ogni ρ1 , ρ2 ∈ Sp (HS ).
In tal caso G è detto gruppo topologico di simmetria per S e G 3 g 7→ γg , è detta rappresentazione proiettiva continua su Sp (HS ).
Dal punto di vista fisico, la definizione è ragionevole e afferma che le probabilità di transizione
tra due stati puri, di cui uno trasformato dall’azione del gruppo di simmetria, sono funzioni
continue sotto l’azione del gruppo. Nell’ottica dell’analisi di Wigner della nozione di simmetria
quantistica, questa definizione di continuità è accettabile.
Tuttavia la definizione data ha anche una sua naturalezza in termini matematici come andiamo a dimostrare. Nel seguito B1 (HS )R è spazio vettoriale reale degli operatori autoaggiunti di
classe traccia dotato della norma || ||1 degli operatori di classe traccia. Come sappiamo, dalla proposizione 11.4, ogni automorfismo di Wigner γg è individuato restringendo, sullo spazio
Sp (HS ), un unico operatore lineare (γ2 )g : B1 (HS )R → B1 (HS )R continuo nella norma naturale
di tale spazio || ||1 . Consideriamo allora l’applicazione Γ : G 3 g 7→ (γ2 )g . Usando la topologia
operatoriale forte in B1 (HS )R e quella di G nel dominio, possiamo dire che Γ è continua quando,
per ogni ρ ∈ B1 (HS ) e g0 ∈ G vale:
lim ||(γ2 )g (ρ) − (γ2 )g0 (ρ)||1 = 0 .
g→g0
Restringendoci a lavorare su Sp (HS ) e tornando a alla nostra rappresentazione iniziale G 3
g 7→ γg in termini di automorfismi di Wigner, diremo che G 3 g 7→ γg è continua, se per ogni
ρ ∈ Sp (HS ) e g0 ∈ G vale:
lim ||γg (ρ) − γg0 (ρ)||1 = 0 .
g→g0
Apparentemente, questa nozione di continuità è differente da quella usata nella definizione 11.7.
In realtà è esattamente la stessa, come ora proveremo. Vale a tal fine il seguente semplice risultato. Nella prossima proposizione l’ultima affermazione è interessante perché Sp (H) non è uno
431
spazio normato, non essendo uno spazio vettoriale. Tuttavia risulta essere uno spazio metrico e
la funzione distanza ha un significato fisico, essendo legata all’ampiezza di probabilità .
Proposizione 11.8. Sia H spazio di Hilbert complesso. Se ||ρ||1 = tr(|ρ|) indica norma dello
spazio S(HS ) degli operatori di classe traccia, allora, riducendosi a lavorare con stati puri, vale:
È
||ρ − ρ0 ||1 = 2 1 − (tr(ρρ0 ))2 se ρ, ρ0 ∈ Sp (H).
(11.44)
Equivalentemente:
È
||ψ(ψ| ) − ψ 0 (ψ 0 | )||1 = 2 1 − |(ψ|ψ 0 )|2
se ψ, ψ 0 ∈ H e ||ψ|| = ||ψ 0 || = 1.
(11.45)
Pertanto Sp (H) è uno spazio metrico se dotato della funzione distanza:
È
d(ρ, ρ0 ) := 2 1 − (tr(ρρ0 ))2 per ogni ρ, ρ0 ∈ Sp (H).
Prova. Possiamo dimostrare la seconda affermazione dato che la prima è , banalmente, una
trascrizione della seconda e la terza è ovvia, se valgono le prime due, dalle proprietà generali
delle norme. Per dimostrare la seconda è sufficiente costruire una base ortonormale ψ1 , ψ2 dello
spazio generato da ψ e ψ 0 , assumendo ψ1 = ψ e decomponendo ψ 0 sulla stessa base. Si vede
allora che, se b := (ψ 0 |ψ2 ), vale:
ψ(ψ| ) − ψ 0 (ψ 0 | ) = −|b|ψ1 (ψ1 | ) + |b|ψ2 (ψ2 | ) .
Dato che quella ottenuta è la decomposizione spettrale di ρ − ρ0 , deve essere:
|ρ0 − ρ| = |b|ψ1 (ψ1 | ) + |b|ψ2 (ψ2 | ) = |b|I ,
e quindi, dato che 1 = ||ψ 0 ||2 = |(ψ 0 |ψ1 )|2 + |(ψ 0 |ψ2 )|2 , vale:
È
È
||ψ(ψ| ) − ψ 0 (ψ 0 | )||1 = tr(|b|I) = 2|b| = 2 1 − |(ψ 0 |ψ1 )|2 = 2 1 − |(ψ 0 |ψ)|2 .
Questo completa la dimostrazione. 2
Possiamo allora concludere che vale il seguente risultato che riappacifica fisica e matematica.
Proposizione 11.9. Si consideri un sistema fisico quantistico S descritto sullo spazio di Hilbert
HS . Sia G un gruppo topologico. Una rappresentazione proiettiva su H, G 3 g 7→ γg è continua
nel senso della definizione 11.7, e quindi G è un gruppo di simmetria topologico per S, se e solo
se è continua adottando:
(i) la topologia di G nel dominio,
432
(ii) la topologia operatoriale forte, ristretta a Sp (HS ), nel codominio,
cioè :
lim ||γg (ρ) − γg0 (ρ)||1 = 0 per ogni ρ ∈ Sp (HS ) e g0 ∈ G.
g→g0
(11.46)
Prova. La (11.44) implica che:
È
||γg (ρ) − γg0 (ρ)||1 = 2 1 − tr (γg (ρ)γg0 (ρ)) .
Se G 3 g 7→ γg è continua nel senso della definizione 11.7 allora limg→g0 tr (γg (ρ)γg0 (ρ)) =
tr (γg0 (ρ)γg0 (ρ)) = 1. Sostituendo nell’identità di sopra si ha che vale (11.46):
lim ||γg (ρ) − γg0 (ρ)||1 = 0 .
g→g0
Viceversa, dalla (11.44) si ha anche che usando la proprietà ciclica della traccia:
1
tr (γg0 (ρ)γg (ρ)) = 1 − ||γg (ρ) − γg0 (ρ)||21 ,
4
ponendo poi ρ1 := γg0 (ρ) (senza perdere generalità dato che γg0 è suriettiva), e ρ2 := ρ, abbiamo:
lim tr (ρ1 γg (ρ2 )) = 1 −
g→g0
1
1
lim ||γg0 (ρ) − γg (ρ)||21 = 1 − ||γg0 (ρ) − γg0 (ρ)||21 = tr (ρ1 γg0 (ρ2 )) .
g→g
0
4
4
Quindi (11.46) implica la continuità della rappresentazione nel senso della definizione 11.7. 2
11.2.3
Rappresentazioni unitarie proiettive fortemente continue.
Consideriamo un sistema fisico S, descritto sullo spazio di Hilbert HS , ed un suo gruppo di
simmetria topologico, G, con rappresentazione proiettiva continua G 3 g 7→ γg . Associamo
al gruppo di simmetria topologico una rappresentazione unitaria proiettiva G 3 g 7→ Ug , nel
senso che γg (ρ) = Ug ρUg−1 per ogni stato puro ρ ∈ Sp (HS ) del sistema e per ogni elemento
del gruppo g ∈ G. Un problema interessante, che si pone immediatamente, è allora quello di
stabilire se sia possibile fissare le fasi arbitrarie per gli operatori unitari Ug in modo da ottener
una rappresentazione unitaria proiettiva che sia fortemente continua. Cioè :
Ug ψ → Ug0 ψ
se g → g0 e per ogni ψ ∈ H.
Il problema è molto difficile nel caso generale, benchè esista un risultato generale locale dovuto
a Wigner. Mostreremo infatti che, se G è un gruppo di simmetria topologico e G 3 g 7→ γg la
sua rappresentazione proiettiva continua, allora è possibile fissare i moltiplicatori ω di una sua
rappresentazione unitaria proiettiva G 3 g 7→ Ug in modo tale che essa risulti fortemente continua
in un intorno dell’elemento neutro del gruppo G ed i moltiplicatori stessi risultano continui in
433
tale intorno. Tale risultato, in generale, non si estende a tutto il gruppo. Successivamente
useremo questo risultato, restringendoci al caso di G = R, per provare che in quel caso, non solo
il risultato detto si estende a tutto il gruppo, ma è possibile porre tutti i moltiplicatori uguali a
1 ed ottenere una rappresentazione che è , contemporaneamente, unitaria e fortemente continua.
Le conseguenze fisiche di tale